招聘網(wǎng)站數(shù)據(jù)分析師職位分析
(一) 提出問題
1. 在那些城市找到數(shù)據(jù)分析師的機(jī)會比較大?
2. 數(shù)據(jù)分析師的薪水如何?
3. 根據(jù)工作經(jīng)驗(yàn)的不同,薪酬具有怎樣的變化
(二)? 理解數(shù)據(jù)
數(shù)據(jù)源計(jì)有14列,6875行

在14個(gè)列字段中:
城市:用來比較不同城市對數(shù)據(jù)分析師的需求如何
職位所屬:分析工作的方向
職位ID: 每一行數(shù)據(jù)的唯一標(biāo)識,用于去掉重復(fù)值
薪水:比較不同城市、和所屬領(lǐng)域的薪水區(qū)別
工作年限:從時(shí)間軸上對比薪資漲幅
(三)? 數(shù)據(jù)清洗
這一步的目的是去掉無效、重復(fù)值,填充缺失值,使其符合數(shù)據(jù)要求
1.? 選擇有效字段列,
對數(shù)據(jù)分析無意義的字段選擇隱藏,這里隱藏[公司全名]和[公司ID]

2.? 列名重命名
將列名更改為更符合自己要求的形式(如有需要)
3. 刪除重復(fù)值
這里對字段[職位ID]進(jìn)行刪除重復(fù)值助理

4.? 缺失值處理
使用COUNTA函數(shù)進(jìn)行對有效數(shù)據(jù)列進(jìn)行缺失值統(tǒng)計(jì)
結(jié)果發(fā)現(xiàn),[城市]這一列缺失2條數(shù)據(jù)
一般對缺失值的處理有4種方式:
1)? ? 通過人工手動(dòng)補(bǔ)全(只針對缺失值非常少,且能夠完全確定該值)
2)? ? 刪除缺失數(shù)據(jù)(刪除該數(shù)據(jù)對之后的分析影響不大)
]3)? ?用平均值代替缺失值
4)? ? 用統(tǒng)計(jì)模型計(jì)算出的值去替代

這里符合第一種情況,定位空值進(jìn)行手動(dòng)填充即可
5.? ? 一致化處理,
1)? 對數(shù)據(jù)進(jìn)行統(tǒng)一的命名和處理,如字段[公司所屬領(lǐng)域]是“企業(yè)服務(wù),數(shù)據(jù)服務(wù)”,對該列進(jìn)行拆分,使用數(shù)據(jù)- -分列功能

2)? ? ? 將薪水字段處理為最低薪水、最高薪水、平均薪水三個(gè)字段,用于存放清洗后的薪水?dāng)?shù)據(jù),這一步通過幾個(gè)函數(shù)組合FIND-MID-LEFT-LEN來實(shí)現(xiàn)


在此過程中,最高薪水列出現(xiàn)錯(cuò)誤值,使用篩選功能查找錯(cuò)誤值:
其一,部分?jǐn)?shù)據(jù)夾雜著K,使用替換功能該K為k
其二,出現(xiàn)薪資范圍為xxk以上,將其修改等于最低薪水
6.數(shù)據(jù)排序
對平均薪水列進(jìn)行降序排列
7.對異常值進(jìn)行處理
插入數(shù)據(jù)透視表,調(diào)整設(shè)置


通過數(shù)據(jù)透視表,發(fā)現(xiàn)有以下職位不屬于數(shù)據(jù)分析崗位

重新插入一列,命名為數(shù)據(jù)分析職位

使用函數(shù)再通過篩選,過濾掉所有非數(shù)據(jù)分析崗位的異常值
(四)構(gòu)建模型及數(shù)據(jù)可視化
1. 在那些城市找到數(shù)據(jù)分析師的機(jī)會比較大?
以城市為行標(biāo)簽,工作年限為列標(biāo)簽,數(shù)據(jù)透視分析不同城市對工作年限數(shù)據(jù)分析師的需求概況,按城市計(jì)數(shù)項(xiàng)降序排列:

將數(shù)據(jù)按列匯總百分比顯示:

將數(shù)據(jù)按行匯總百分比顯示:


? ? ? ?從圖表可以看出:在北京數(shù)據(jù)分析的崗位最多,之后是上海,深圳,表現(xiàn)出極為明顯地域性,即主要集中在一線城市,對工作年限的要求為3-5年最多,其次為1-3年,這可以說明該崗位對年輕人需求更多
2.數(shù)據(jù)數(shù)據(jù)分析師的薪水如何?
對平均薪水進(jìn)行描述統(tǒng)計(jì)分析


以城市為行標(biāo)簽,平均薪水為列標(biāo)簽,數(shù)據(jù)透視表分析城市宇平均薪水的關(guān)系

從圖表中可以看出,北京的數(shù)據(jù)分析師平均薪水最高,其次是深圳和上海
3.根據(jù)工作經(jīng)驗(yàn)的不同,薪酬具有怎樣的變化?
以工作年限為行標(biāo)簽,平均薪水為列標(biāo)簽,數(shù)據(jù)透視分析工作年限與平均薪水的關(guān)系

從圖表中可以看出,工作年限與平均薪水基本呈現(xiàn)正相關(guān),即隨著工作經(jīng)驗(yàn)的增長,數(shù)據(jù)分析師的薪水也在不斷增加
(五)分析結(jié)論
1.數(shù)據(jù)分析這一崗位,有大量崗位集中在一線城市,去這些城市找工作,可以提高求職率,
2.從平均薪水來看,北京是一個(gè)非常好的選擇,其次是深圳和上海
3.數(shù)據(jù)分析招聘比較年輕化,有接近70%的工作經(jīng)驗(yàn)要求在5年以下,對于數(shù)據(jù)分析師來說,5年是一個(gè)瓶頸期,如果5年內(nèi)沒有較好的發(fā)展,之后可能會面臨較大的壓力
4. 工作年限與平均薪水基本呈現(xiàn)正相關(guān),即隨著工作經(jīng)驗(yàn)的增長,數(shù)據(jù)分析師的薪水也在不斷增加,工作10年以上的人,能獲得相當(dāng)豐厚的匯報(bào)