相信有不少朋友日常工作會用到 Excel 處理各式表格文件,更有甚者可能要花大把時間來做繁瑣耗時的表格整理工作。最近有朋友問可否編程來減輕表格整理工作量,今兒我們就通過實(shí)例來實(shí)現(xiàn) Python 對表格的自動化整理。
首先我們有這么一份數(shù)據(jù)表 source.csv:
我們要做的是從上表中提取數(shù)據(jù),來生成一份符合以下要求的表格:
按照以下分組名單 group.xls 來整理數(shù)據(jù)表中的數(shù)據(jù):
最終要展現(xiàn)的數(shù)據(jù)項:
其中“K數(shù)據(jù)/60”為數(shù)據(jù)表中的“數(shù)據(jù)K”/60后保留的2位小數(shù)
我們先看手工 Excel 如何處理以上需求:要在 source.csv 數(shù)據(jù)表中讀取讀取每條數(shù)據(jù),放入 group.xls 匹配的分組成員中,最后篩選需要的數(shù)據(jù)項,再對特定的 “數(shù)據(jù)K”進(jìn)行運(yùn)算處理。
那么 Python 又將如何操作呢?這里我們要用到功能強(qiáng)大的 pandas 庫。
pandas 是基于NumPy 的一種工具,該工具是為了解決數(shù)據(jù)分析任務(wù)而創(chuàng)建的。Pandas 納入了大量庫和一些標(biāo)準(zhǔn)的數(shù)據(jù)模型,提供了高效地操作大型數(shù)據(jù)集所需的工具。pandas提供了大量能使我們快速便捷地處理數(shù)據(jù)的函數(shù)和方法。你很快就會發(fā)現(xiàn),它是使Python成為強(qiáng)大而高效的數(shù)據(jù)分析環(huán)境的重要因素之一。
pandas 百度百科
首先導(dǎo)入 pandas 庫,通過相關(guān)的函數(shù)讀取 csv 和 xls 表格內(nèi)容:

我們可以首先對 source.csv 中的數(shù)據(jù)項進(jìn)行篩選,需要的數(shù)據(jù)項有“角色”、“編號”、“數(shù)據(jù)B”、“數(shù)據(jù)C”、“數(shù)據(jù)D”和“數(shù)據(jù)K”:

接下來是根據(jù)分組角色來匹配角色數(shù)據(jù),注意到 group.xls 和 source.csv 共有“角色”一項,我們可以通過此項將兩個表格融合從而形成匹配填充的效果。
combine = pd.merge(group,filter_merge,on="角色")
接下來我們在第二列插入運(yùn)算后的“數(shù)據(jù)K/60”:
combine.insert(1,"數(shù)據(jù)K/60",round(filter_merge["數(shù)據(jù)K"]/60,2))
最終,我們將生成的數(shù)據(jù)格式寫入新的 xlsx 表格中:
combine.to_excel(excel_writer="result.xlsx",index=False)
最終自動生成的表格如下:
以上便是 Excel 表格整理的 Python 代碼簡單實(shí)現(xiàn),在操作過程中也遇到幾個問題貼在這里供大家參考:
導(dǎo)入 pandas 時可能會報錯:
解決:根據(jù)報錯信息安裝需要的相關(guān)模塊
要進(jìn)行表格整理的電腦為公司電腦、無法連接外網(wǎng)下載 Python
解決:
https://blog.csdn.net/sundan93/article/details/62888068
參照以上鏈接,先在外網(wǎng)電腦下載 Python 安裝文件以及相關(guān)的模塊安裝文件,拷貝到無網(wǎng)絡(luò)電腦進(jìn)行安裝
以上表格整理的實(shí)例在現(xiàn)實(shí)工作有參考意義么:
回答:文中表格的原型是一份員工工作記錄,根據(jù)人員分組進(jìn)行相關(guān)的數(shù)據(jù)統(tǒng)計。類似的分組統(tǒng)計成員數(shù)據(jù)都可以根據(jù)此簡單 Python 模版來實(shí)現(xiàn)。
源代碼:https://pan.baidu.com/s/1ro4lUaRtRb86Lf49LSjRBA?(權(quán)當(dāng)一個參考和提示,自行搜索嘗試實(shí)現(xiàn)才能真正掌握哈,有問題歡迎留言反饋~)