誰說菜鳥不會數(shù)據(jù)分析-入門篇(第4章 三心二意--數(shù)據(jù)處理)

1.數(shù)據(jù)處理

1.1 數(shù)據(jù)清洗

  • 重復(fù)數(shù)據(jù)的處理:COUNTIF法,刪除重復(fù)數(shù)據(jù)法,透視表法等
  • 缺失數(shù)據(jù)的處理:
    • 方法一:用樣本統(tǒng)計(jì)量的值代替,通常用樣本平均值代替
    • 方法二: 用統(tǒng)計(jì)模型計(jì)算出來的值代替,常見的模型有回歸模型\判別模型
    • 方法三: 將有后發(fā)制人值的記錄刪除,這會導(dǎo)致樣本量減少
    • 方法四: 將有缺失的記錄保留,僅在缺失值 不大的情況下做分析時(shí)排除
    • 方法五:查找替換
      技巧:CTRL+G 定位,Ctrl+Enter同時(shí)輸入一個(gè)值
  • 檢查數(shù)據(jù)數(shù)據(jù)
    • 用IF函數(shù)
    • 用條件格式

1.2 數(shù)據(jù)加工

  • 數(shù)據(jù)抽取:取出字段時(shí)需要的信息
    • 字段分列法
    • 函數(shù) LEFT,MID,RIGHT截取法
    • 字段合并: &連接字符,concatenate合并函數(shù),text限定顯示格式等
    • 字段匹配:vlookup,lookup,hlookup等
  • 數(shù)據(jù)計(jì)算
    日期函數(shù)date,year,month,day,today,datedif的組合運(yùn)用
  • 數(shù)據(jù)分組
    用vlookup,lookup等函數(shù)將數(shù)據(jù)分組,比如將43寸以下的電視定義為"小板",將43寸(含)-55寸的電視定義為"中板",將55寸(含)以上的尺寸定義為"大板"
  • 數(shù)據(jù)轉(zhuǎn)換
    • EXCEL的轉(zhuǎn)置功能
    • 二分法:用if,isnumber等將調(diào)查轉(zhuǎn)為1或0的兩種結(jié)果

1.3 數(shù)據(jù)抽樣

rand,randbetween隨機(jī)函數(shù)的運(yùn)用

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容