在日常數(shù)據(jù)分析時(shí),經(jīng)常會(huì)遇到需要按列分組 (groupby) 的任務(wù),如計(jì)算某公司各部門的人數(shù),計(jì)算各部門男女平均工資,計(jì)算不同年代的員工的平均工資等等。在進(jìn)行這類運(yùn)算時(shí),P...
在日常數(shù)據(jù)分析時(shí),經(jīng)常會(huì)遇到需要按列分組 (groupby) 的任務(wù),如計(jì)算某公司各部門的人數(shù),計(jì)算各部門男女平均工資,計(jì)算不同年代的員工的平均工資等等。在進(jìn)行這類運(yùn)算時(shí),P...
Excel文件是常見的數(shù)據(jù)文件,數(shù)據(jù)分析過程中經(jīng)常會(huì)用到。有時(shí)我們需要用程序代碼對(duì) Excel 文件進(jìn)行一些自動(dòng)化處理,這需要程序語(yǔ)言能夠方便地解析 Excel 數(shù)據(jù)。 可以...
幾乎所有的程序語(yǔ)言都能處理數(shù)據(jù),但有些過于通用,缺乏專業(yè)的結(jié)構(gòu)化計(jì)算函數(shù),用于數(shù)據(jù)處理時(shí)代碼比較繁瑣,比如C++、JAVA,這些語(yǔ)言更適合去實(shí)現(xiàn)大型專業(yè)的項(xiàng)目。還有專業(yè)的數(shù)學(xué)...
Python作為一門程序設(shè)計(jì)語(yǔ)言,在易讀、易維護(hù)方面有獨(dú)特優(yōu)勢(shì),越來越多的人使用 Python 進(jìn)行數(shù)據(jù)分析和處理,而 Pandas 正是為了解決數(shù)據(jù)分析任務(wù)而創(chuàng)建的,其包含...
什么是大文件?大文件是指大到計(jì)算機(jī)內(nèi)存不足以一次性讀入的文件。這種情況,直接使用桌面數(shù)據(jù)工具(比如 Excel)都無能為力了,常常需要編寫程序來處理。而即使是寫程序,也必須是...
無論程序員,還是數(shù)據(jù)分析師或科研工作者,有很多人都會(huì)編寫SQL。無論單機(jī)上的access,還是局域網(wǎng)中的mysql或云環(huán)境中的Hadoop,也有很多平臺(tái)都支持SQL。經(jīng)過半個(gè)...
一句“人生苦短,我用 Python”,讓多少職場(chǎng)人為之瘋狂,培訓(xùn)機(jī)構(gòu)甚至豪言小到黃口小兒,大到七旬老漢都學(xué)得會(huì) Python。如果你在職場(chǎng)中經(jīng)常跟數(shù)據(jù)打交道,曾經(jīng)可能 Exc...
在企業(yè)財(cái)務(wù)工作中,每個(gè)財(cái)務(wù)周期都要制作資產(chǎn)負(fù)債表,周期分為月度、季度、年度。季度報(bào)表可由月度報(bào)表合并得來,年度報(bào)表可由季度報(bào)表合并而來。有些大企業(yè)有許多部門,各部門也有資產(chǎn)負(fù)...
遇到Excel難以實(shí)現(xiàn)的復(fù)雜或特殊運(yùn)算時(shí),可先用剪貼板將數(shù)據(jù)復(fù)制到esProc,利用esProc強(qiáng)大的計(jì)算能力完成,再用剪貼板返回Excel。剪貼板方式比傳統(tǒng)的add-ins...
職場(chǎng)人員使用 Excel 進(jìn)行數(shù)據(jù)處理已經(jīng)成為家常便飯。不過相信大家一定有過很無助的情況,比如復(fù)雜計(jì)算、重復(fù)計(jì)算、自動(dòng)處理等,再遇上個(gè)死機(jī)沒保存,整個(gè)人崩潰掉也不是完全不可能...
資產(chǎn)負(fù)債表是財(cái)務(wù)人員每個(gè)財(cái)務(wù)周期都必須制做的報(bào)表,周期可能為月份、季度、年度,表樣為: 如果每月都給我們一份這樣的最新財(cái)務(wù)數(shù)據(jù) Excel,讓我們做出如下的資產(chǎn)負(fù)載表,我們來...
目前每個(gè)月都有產(chǎn)品銷售明細(xì)數(shù)據(jù),要求根據(jù)“地區(qū)”及“銷售員”兩個(gè)分組匯總統(tǒng)計(jì)各產(chǎn)品類別的銷售情況編寫一張統(tǒng)計(jì)報(bào)表。 如表樣所示,左側(cè)分別有“地區(qū)”和“銷售員”兩個(gè)分組,均按照...
轉(zhuǎn)置即旋轉(zhuǎn)數(shù)據(jù)表的橫縱方向,常用來改變數(shù)據(jù)布局,以便用新的角度觀察。有些轉(zhuǎn)置算法比較簡(jiǎn)單,比如行轉(zhuǎn)列、列轉(zhuǎn)行、雙向轉(zhuǎn)置;有些算法變化較多,比如動(dòng)態(tài)轉(zhuǎn)置、轉(zhuǎn)置時(shí)跨行計(jì)算、關(guān)聯(lián)轉(zhuǎn)...
在數(shù)據(jù)處理業(yè)務(wù)中,經(jīng)常要把文件結(jié)構(gòu)相同或近似相同的數(shù)據(jù)文件合并成一個(gè)文件,或者將一個(gè)比較大的數(shù)據(jù)文件拆分成小的數(shù)據(jù)文件。本文將介紹文本文件和 Excel 文件合并及拆分會(huì)遇到...
用 Excel 處理數(shù)據(jù)時(shí),經(jīng)常會(huì)涉及到多頁(yè) sheet 數(shù)據(jù)之間的關(guān)聯(lián)運(yùn)算需求,用 vlookup 可以完成部分簡(jiǎn)單關(guān)聯(lián),但較復(fù)雜的情況時(shí)仍然不太方便,常常需要多次操作才能...
用 Excel 處理數(shù)據(jù)時(shí),有時(shí)需要對(duì)字符串進(jìn)行拆分。對(duì)于比較簡(jiǎn)單的拆分,使用 Excel 函數(shù)可以順利完成,但碰到一些特殊需求,或者拆分的規(guī)則比較復(fù)雜時(shí),則很難用 Exce...
在 Excel 中分析數(shù)據(jù)時(shí),往往會(huì)用到數(shù)據(jù)透視表。通過透視表,可以對(duì)數(shù)據(jù)從不同維度、不同類別來匯總和分析。但是透視表功能很簡(jiǎn)單,分組依據(jù)也很固化。需要將部分?jǐn)?shù)據(jù)合并、分區(qū)間...
1. 最大值 / 最小值 最大值 / 最小值可以理解為 TopN 查詢中,N 等于 1 時(shí)的情況,因?yàn)楹艹S盟詥为?dú)拿出來講一下。取最大值 / 最小值是很常見的需求,例如一班...
Excel 可以對(duì)數(shù)據(jù)進(jìn)行分組匯總,也可以用透視表對(duì)數(shù)據(jù)進(jìn)行多層次分析,但提供的匯總及相關(guān)運(yùn)算都很簡(jiǎn)單,稍復(fù)雜一些的運(yùn)算沒法實(shí)現(xiàn)或者很難實(shí)現(xiàn)了。比如我們希望計(jì)算分組內(nèi)的排名,...
現(xiàn)在市場(chǎng)上開源 BI 產(chǎn)品比較多,各個(gè)產(chǎn)品的側(cè)重點(diǎn)不同,有的以報(bào)表為主、有的以可視化為主、有的以查詢分析為主。這里我們選取了一些主流的開源 BI 產(chǎn)品,從產(chǎn)品功能、可視化能力...