1.數(shù)據(jù)處理
1.1 數(shù)據(jù)清洗
- 重復(fù)數(shù)據(jù)的處理:COUNTIF法,刪除重復(fù)數(shù)據(jù)法,透視表法等
- 缺失數(shù)據(jù)的處理:
- 方法一:用樣本統(tǒng)計(jì)量的值代替,通常用樣本平均值代替
- 方法二: 用統(tǒng)計(jì)模型計(jì)算出來的值代替,常見的模型有回歸模型\判別模型
- 方法三: 將有后發(fā)制人值的記錄刪除,這會導(dǎo)致樣本量減少
- 方法四: 將有缺失的記錄保留,僅在缺失值 不大的情況下做分析時(shí)排除
- 方法五:查找替換
技巧:CTRL+G 定位,Ctrl+Enter同時(shí)輸入一個(gè)值
- 檢查數(shù)據(jù)數(shù)據(jù)
- 用IF函數(shù)
- 用條件格式
1.2 數(shù)據(jù)加工
- 數(shù)據(jù)抽取:取出字段時(shí)需要的信息
- 字段分列法
- 函數(shù) LEFT,MID,RIGHT截取法
- 字段合并:
&連接字符,concatenate合并函數(shù),text限定顯示格式等 - 字段匹配:vlookup,lookup,hlookup等
- 數(shù)據(jù)計(jì)算
日期函數(shù)date,year,month,day,today,datedif的組合運(yùn)用 - 數(shù)據(jù)分組
用vlookup,lookup等函數(shù)將數(shù)據(jù)分組,比如將43寸以下的電視定義為"小板",將43寸(含)-55寸的電視定義為"中板",將55寸(含)以上的尺寸定義為"大板" - 數(shù)據(jù)轉(zhuǎn)換
- EXCEL的轉(zhuǎn)置功能
- 二分法:用if,isnumber等將調(diào)查轉(zhuǎn)為1或0的兩種結(jié)果
1.3 數(shù)據(jù)抽樣
rand,randbetween隨機(jī)函數(shù)的運(yùn)用