一同事工作之一是:從數(shù)據(jù)庫(kù)拉出來(lái)一堆具有相同格式的excel表,然后新建一個(gè)excel表,將那堆excel表中的每個(gè)表里的固定的四個(gè)值復(fù)制出來(lái),粘貼到新建的表中,完成數(shù)據(jù)的錄入。有次忙不過(guò)來(lái)了,讓我?guī)兔?,一?0個(gè)excel表,然后就在那:打開(kāi)excel、復(fù)制、粘貼、關(guān)閉excel、再打來(lái)下一個(gè)excel。這樣重復(fù)50次,這還要注意別復(fù)制錯(cuò)了,操作過(guò)程中我在想要不回頭我用python寫(xiě)個(gè)代碼試試吧,不然老是這么搞太惡心了。
我對(duì)python的認(rèn)知也就停留在看看別人的博客、看看機(jī)器學(xué)習(xí)、看看numpy、pandas、sklearn;注意我指的是“看看”,實(shí)際動(dòng)手寫(xiě)代碼很少、也沒(méi)有完整的用代碼去解決一個(gè)問(wèn)題。像利用python進(jìn)行數(shù)據(jù)分析這樣的經(jīng)典的書(shū)在我硬盤(pán)里都放一年多了,也都沒(méi)有認(rèn)真的看過(guò)幾眼。
所以從本篇開(kāi)始,記錄的是一個(gè)小白的數(shù)據(jù)分析扯淡的經(jīng)歷,所以大家多去看大牛,甭來(lái)看我瞎扯淡,我就小白、啥都不懂。
那一堆EXCEL表是這個(gè)樣子的:

人家要統(tǒng)計(jì)成這個(gè)樣子的表:日期、Q1、Q2、Q3,為每個(gè)excel中需要提取出來(lái)的元素

一、從那堆excel表中選一個(gè)表,導(dǎo)入到python中,看看要復(fù)制的那四個(gè)元素在哪里,怎么提出來(lái)。
打開(kāi)jupyter notebook,讀入一個(gè)excel文件,如下(其他數(shù)據(jù)隱去,更改后如下):

二、提取并整理
一個(gè)excel表格會(huì)處理了,然后就想如何讀取這堆excel表,然后咱再來(lái)個(gè)循環(huán),應(yīng)該就差不多了。




預(yù)期結(jié)果出現(xiàn)了:
