如何證明自己的專業(yè)性?特別是對于我們初入HR數(shù)據(jù)分析的寶寶們,這種凹造型的裝逼還是有的!
我們?yōu)槭裁匆雌骄鶖?shù)
平均數(shù)可能是我們接觸得最早的一個統(tǒng)計量了,小學生都知道如何算平均數(shù)??墒谴蠹疫€記得我們看平均數(shù)是為了看什么嗎?
想不起來的小伙伴不要慌張,我們一起來復習一下:平均數(shù)是數(shù)據(jù)的集中趨勢的一種度量方法,用來表明資料中各觀測值相對集中較多的中心位置。
此處畫重點了,相對集中較多,我們平時計算平均數(shù)的公式真的能代表相對集中較多的位置嗎?顯然不能。平均收入就是一個很好的例子。
2018年我國人均國民總收入達到9732美元,高于中等收入國家平均水平,計算發(fā)現(xiàn),這約合人均年收入近67000元人民幣,相當于月入5600元左右。拖后腿了?被平均了?別著急下結(jié)論,首先人均國民總收入和人均可支配收入不是一個概念,其次,收入這種問題單看平均數(shù)一個指標是不夠全面的。
為了解釋這個問題,我們需要了解一個概念——頻率分布。
正態(tài)分布?那是啥玩意
我們先看一下頻率分布的概念:
頻率分布,是指在統(tǒng)計分組的基礎上,將總體中各單位按組歸類整理,按一定順序排列,形成的總體中各單位在各組間的分布。其實質(zhì)是,在各組按順序排列的基礎上,列出每個組的總體單位數(shù),形成一個數(shù)列,稱次數(shù)分布數(shù)列,簡稱分配數(shù)列,各組的總體單位數(shù)叫次數(shù)或頻數(shù)。一般用次數(shù)分布表和次數(shù)分布圖來表示。
——百度百科
官方的概念定義固然嚴謹,但是不容易理解,我們可以簡答的理解為在每個區(qū)間內(nèi)都有幾個數(shù)字,比如有1000個數(shù)字在0-500元內(nèi),20000個數(shù)字在1000-3000內(nèi)這樣的。如果我們按照相等的區(qū)間長度進行分段(如每一段的長度都是100)統(tǒng)計在這個區(qū)間內(nèi)的數(shù)據(jù)的個數(shù)進行繪圖,我們就可以得到一個頻數(shù)分布直方圖(頻率分布直方圖)。
通過頻數(shù)分布直方圖,我們可以更加清楚的看出數(shù)據(jù)的分布和形態(tài)——伯努利分布、正態(tài)分布、二項分布、指數(shù)分布等等。
比如最常見的分布——正態(tài)分布。
正態(tài)曲線呈鐘型,兩頭低,中間高,左右對稱因其曲線呈鐘形,因此人們又經(jīng)常稱之為鐘形曲線。是一個在數(shù)學、物理及工程等領域都非常重要的概率分布,在統(tǒng)計學的許多方面有著重大的影響力。
在實際的應用中,我們要分析的數(shù)據(jù)的分布很可能是奇奇怪怪的,比如這樣:
對于這樣分布的數(shù)據(jù),我們其實很難去衡量一個所謂的觀測值相對集中的中心位置,也就是在這種情況下,使用平均數(shù)很可能讓我們遺漏很多信息。
平均數(shù)和分布有啥關系
不是說平均數(shù)么?咋又扯了半天的概率分布?哈哈,當然是因為平均數(shù)有沒有用很大程度上取決于數(shù)據(jù)的分布形態(tài)是什么樣的呀!
先說結(jié)論,當數(shù)據(jù)分布是正態(tài)分布的時候看平均數(shù)顯然是沒有問題的,但是當數(shù)據(jù)明顯右偏或左偏(有一側(cè)明顯高)的時候看平均數(shù)就沒有那么理想了。
在人力資源領域,一個比較常見的問題就是人才測評的時候。舉一個極端一點的例子用于理解:
假設某一道題的得分范圍在0-5分之間,現(xiàn)在有一個來面試的新員工,得了3.5分,我們應該錄用他嗎?
我們的招聘需求是要招聘一個至少可以勝過一半人的優(yōu)秀的人才(不然的話我們也不會啟用測評工具對吧),那么一個比較常見的思路就是看這個人的得分是否在均分之上,如果是的話就進行錄用。
假設我們現(xiàn)在有十個人的成績,分別是:
5,5,5,4.5,4,3.2,3,1,0.9,0.8
很容易可以計算出,這是十個人的平均數(shù)是3.24,新人的成績?yōu)?.5分,高于平均值了,應該錄用。但如果我們把這個人的成績加入進行排名的話,會發(fā)現(xiàn)這個人是6/11,勉強排上前一半吧,真的是很優(yōu)秀的人才嗎?
不用畫圖我們也知道,這十個人的成績絕對不可能是一個中間多兩頭少的正態(tài)分布,在這種情況下,我們?nèi)タ雌骄鶖?shù)就會有一些問題了。
凹造型大法
小白:平均數(shù)是XXX
大佬:分布正態(tài)嗎?平均數(shù)是用什么公式算的?
本文系原創(chuàng),首次發(fā)布于微信公眾號:HR大數(shù)據(jù)