忘掉平均數(shù)、看看直方圖:專業(yè)化起步

如何證明自己的專業(yè)性?特別是對于我們初入HR數(shù)據(jù)分析的寶寶們,這種凹造型的裝逼還是有的!

圖片來自網(wǎng)絡,如侵刪

我們?yōu)槭裁匆雌骄鶖?shù)

平均數(shù)可能是我們接觸得最早的一個統(tǒng)計量了,小學生都知道如何算平均數(shù)??墒谴蠹疫€記得我們看平均數(shù)是為了看什么嗎?

想不起來的小伙伴不要慌張,我們一起來復習一下:平均數(shù)是數(shù)據(jù)的集中趨勢的一種度量方法,用來表明資料中各觀測值相對集中較多的中心位置。

此處畫重點了,相對集中較多,我們平時計算平均數(shù)的公式真的能代表相對集中較多的位置嗎?顯然不能。平均收入就是一個很好的例子。

2018年我國人均國民總收入達到9732美元,高于中等收入國家平均水平,計算發(fā)現(xiàn),這約合人均年收入近67000元人民幣,相當于月入5600元左右。拖后腿了?被平均了?別著急下結(jié)論,首先人均國民總收入和人均可支配收入不是一個概念,其次,收入這種問題單看平均數(shù)一個指標是不夠全面的。

為了解釋這個問題,我們需要了解一個概念——頻率分布。

正態(tài)分布?那是啥玩意

我們先看一下頻率分布的概念:

頻率分布,是指在統(tǒng)計分組的基礎上,將總體中各單位按組歸類整理,按一定順序排列,形成的總體中各單位在各組間的分布。其實質(zhì)是,在各組按順序排列的基礎上,列出每個組的總體單位數(shù),形成一個數(shù)列,稱次數(shù)分布數(shù)列,簡稱分配數(shù)列,各組的總體單位數(shù)叫次數(shù)或頻數(shù)。一般用次數(shù)分布表和次數(shù)分布圖來表示。

——百度百科

官方的概念定義固然嚴謹,但是不容易理解,我們可以簡答的理解為在每個區(qū)間內(nèi)都有幾個數(shù)字,比如有1000個數(shù)字在0-500元內(nèi),20000個數(shù)字在1000-3000內(nèi)這樣的。如果我們按照相等的區(qū)間長度進行分段(如每一段的長度都是100)統(tǒng)計在這個區(qū)間內(nèi)的數(shù)據(jù)的個數(shù)進行繪圖,我們就可以得到一個頻數(shù)分布直方圖(頻率分布直方圖)。

通過頻數(shù)分布直方圖,我們可以更加清楚的看出數(shù)據(jù)的分布和形態(tài)——伯努利分布、正態(tài)分布、二項分布、指數(shù)分布等等。

比如最常見的分布——正態(tài)分布。

正態(tài)曲線呈鐘型,兩頭低,中間高,左右對稱因其曲線呈鐘形,因此人們又經(jīng)常稱之為鐘形曲線。是一個在數(shù)學、物理及工程等領域都非常重要的概率分布,在統(tǒng)計學的許多方面有著重大的影響力。

在實際的應用中,我們要分析的數(shù)據(jù)的分布很可能是奇奇怪怪的,比如這樣:

圖片來自網(wǎng)絡,如侵刪

對于這樣分布的數(shù)據(jù),我們其實很難去衡量一個所謂的觀測值相對集中的中心位置,也就是在這種情況下,使用平均數(shù)很可能讓我們遺漏很多信息。

平均數(shù)和分布有啥關系

不是說平均數(shù)么?咋又扯了半天的概率分布?哈哈,當然是因為平均數(shù)有沒有用很大程度上取決于數(shù)據(jù)的分布形態(tài)是什么樣的呀!

先說結(jié)論,當數(shù)據(jù)分布是正態(tài)分布的時候看平均數(shù)顯然是沒有問題的,但是當數(shù)據(jù)明顯右偏或左偏(有一側(cè)明顯高)的時候看平均數(shù)就沒有那么理想了。

在人力資源領域,一個比較常見的問題就是人才測評的時候。舉一個極端一點的例子用于理解:

假設某一道題的得分范圍在0-5分之間,現(xiàn)在有一個來面試的新員工,得了3.5分,我們應該錄用他嗎?

我們的招聘需求是要招聘一個至少可以勝過一半人的優(yōu)秀的人才(不然的話我們也不會啟用測評工具對吧),那么一個比較常見的思路就是看這個人的得分是否在均分之上,如果是的話就進行錄用。

假設我們現(xiàn)在有十個人的成績,分別是:

5,5,5,4.5,4,3.2,3,1,0.9,0.8

很容易可以計算出,這是十個人的平均數(shù)是3.24,新人的成績?yōu)?.5分,高于平均值了,應該錄用。但如果我們把這個人的成績加入進行排名的話,會發(fā)現(xiàn)這個人是6/11,勉強排上前一半吧,真的是很優(yōu)秀的人才嗎?

不用畫圖我們也知道,這十個人的成績絕對不可能是一個中間多兩頭少的正態(tài)分布,在這種情況下,我們?nèi)タ雌骄鶖?shù)就會有一些問題了。

凹造型大法

小白:平均數(shù)是XXX
大佬:分布正態(tài)嗎?平均數(shù)是用什么公式算的?

本文系原創(chuàng),首次發(fā)布于微信公眾號:HR大數(shù)據(jù)

?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

  • 最近在做薪酬績效分析報告,借助Power pivot處理數(shù)據(jù),便找了些數(shù)據(jù)分析的理論知識。真正做分析的時候,發(fā)現(xiàn)已...
    豌豆射手Dany閱讀 6,671評論 0 2
  • 統(tǒng)計學:數(shù)據(jù)的集中趨勢(圖片上傳不了,請見諒,粗略匯總,如有想法,請下方留言) [if !supportLists...
    陸利閱讀 3,977評論 2 1
  • 作為前數(shù)學專業(yè)畢業(yè)生,學過的概率統(tǒng)計知識已經(jīng)忘記得差不多了,對于統(tǒng)計學的概念能清楚記得的也只有方差,標準差和均值了...
    Endzzz閱讀 19,609評論 2 140
  • 這個世界有這樣一種情誼,談不上多深厚,更多的是淡如水的那種。往往一個在南,另一個在北,也許終生不會相見,更多的是在...
    郭清平閱讀 294評論 0 1
  • 不得已,搭乘凌晨4點多的火車出發(fā)去一個地方,那個地方每年陽歷3月份,都會開“兩會”,經(jīng)歷簡單的特殊安檢后,我登上了...
    在人間_混日子閱讀 2,671評論 3 0

友情鏈接更多精彩內(nèi)容