Python 實(shí)現(xiàn)批量分類匯總并保存xlsx文件

上一篇文件用VBA介紹了如何實(shí)現(xiàn)一鍵按列分類匯總并保存單獨(dú)文件,代碼有幾十行,而且一旦數(shù)據(jù)量多了,效果可能不盡如人意。

文章可以參見這里:

vba實(shí)例(27)-一鍵按列分類匯總并保存單獨(dú)文件

今天就來給大家說說如何用python來實(shí)現(xiàn)這個(gè)效果,先給大家看看效果:

代碼只有十幾行,效果要提升好多倍,這也是使用python的優(yōu)勢(shì)所在。

思路與代碼詳解

核心思路基本和VBA的一致:讀取excel數(shù)據(jù) - 獲取“歸屬事業(yè)部”列中事業(yè)部種類數(shù) - 按每個(gè)事業(yè)部進(jìn)行整行提取 - 保存xlsx文件。

1、這里使用的是python中的pandas數(shù)據(jù)處理庫,這個(gè)是在數(shù)據(jù)處理界非常牛逼的一個(gè)工具庫,使用之前需要導(dǎo)入庫。

import?pandas?as?pd?

2、讀取excel的數(shù)據(jù)。讀取"拆分實(shí)例.xlsx"這個(gè)excel中,sheet名字為"全國客戶明細(xì)"的數(shù)據(jù),將讀取的內(nèi)容賦值給df。

df?=?pd.read_excel("拆分實(shí)例.xlsx",sheet_name="全國客戶明細(xì)")

3、獲取“歸屬事業(yè)部”列的種類數(shù),使用pandas庫的unique方法,將所有事業(yè)部的名字賦值給變量group_names。

group_names=df["歸屬事業(yè)部"].unique()

4、將某個(gè)事業(yè)部的數(shù)據(jù)整行提取出來保存成xlsx文件,并按事業(yè)部的名字進(jìn)行命名。

df_group=df.groupby(by=['歸屬事業(yè)部']).get_group(group_name).reset_index(drop=True)
df_group.to_excel(".\拆分結(jié)果\\"+group_name+".xlsx")

5、遍歷每一個(gè)事業(yè)部,進(jìn)行同樣的操作。

for?group_name?in?group_names:

完整代碼如下:

import?pandas?as?pd
import?time

start?=?time.time()

df?=?pd.read_excel("拆分實(shí)例.xlsx",sheet_name="全國客戶明細(xì)")
group_names=df["歸屬事業(yè)部"].unique()
for?group_name?in?group_names:
????df_group=df.groupby(by=['歸屬事業(yè)部']).get_group(group_name).reset_index(drop=True)
????df_group.to_excel(".\拆分結(jié)果\\"+group_name+".xlsx")

elapsed?=?(time.time()?-?start)

print("完成,共花費(fèi)時(shí)間為:",elapsed)

優(yōu)化

上面這個(gè)代碼生成的excel,數(shù)據(jù)是沒有任何問題,但是單元格格式比較簡陋,甚至可以說“丑”。

如果需要如下圖像生成VBA的比較美觀的樣式,要怎么弄呢?需要做一些格式上的處理。

可以新建一個(gè)“模板”文件,

然后調(diào)用openpyxl庫將分類的數(shù)據(jù)dataframe寫入到模板文件中,設(shè)置邊框等格式,另存為xlsx文件即可。

效果如下:



如果你對(duì)上面的內(nèi)容感興趣,可以在公號(hào)內(nèi)回復(fù)「python處理」自取試用,盡快吧!


歡迎交流!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容