1. 當我們在談統(tǒng)計學(xué)

每個人談到統(tǒng)計學(xué),都會有著不同的理解。

在剛接觸統(tǒng)計學(xué)時,我也思考過對統(tǒng)計學(xué)中的概念進行定義是否有必要,后來隨著統(tǒng)計學(xué)學(xué)習(xí)的深入,單純把概念用幾句話講清楚實在是太浪費時間。如果在一開始就明確定義達成共識,這將會在后期的學(xué)習(xí)中極大地提高效率。


1. 到底什么是統(tǒng)計學(xué)?

統(tǒng)計學(xué):收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)。

統(tǒng)計學(xué)又分描述統(tǒng)計推斷統(tǒng)計。描述統(tǒng)計是指數(shù)據(jù)收集、處理、匯總、圖表描述、概括與分析等統(tǒng)計方法。比如從供應(yīng)商、渠道等角度統(tǒng)計比較某段時間的銷售量。推斷統(tǒng)計指如何利用樣本數(shù)據(jù)來推斷總體特征等統(tǒng)計方法。像根據(jù)近五年的數(shù)據(jù)預(yù)測明年的銷售量等。

在我接觸到的數(shù)據(jù)分析小伙伴中,大多數(shù)分析師的工作集中在描述統(tǒng)計,這其中還衍生出了數(shù)據(jù)可視化工程師,專門負責(zé)數(shù)據(jù)的可視化展現(xiàn)。而在推斷分析中,分析師的水平參差不齊,所用的方法也五花八門,在后面的學(xué)習(xí)中會有具體的涉及,不做展開。


2. 統(tǒng)計數(shù)據(jù)的類型

(1)按計量尺度分:分類數(shù)據(jù)、順序數(shù)據(jù)、數(shù)值型數(shù)據(jù)。分類數(shù)據(jù)和順序數(shù)據(jù)主要以文字的形式,也稱定性數(shù)據(jù)或品質(zhì)數(shù)據(jù)。數(shù)值型數(shù)據(jù)也成為定量數(shù)據(jù)或數(shù)量數(shù)據(jù)。定性數(shù)據(jù)與定量數(shù)據(jù)在用戶研究和數(shù)據(jù)分析中均起到了重要的作用,在業(yè)務(wù)的需求上也能相互補充和論證。

(2)按收集方法分:觀測數(shù)據(jù)和實驗數(shù)據(jù)。觀測數(shù)據(jù)主要是調(diào)查或觀測得來的數(shù)據(jù),沒有人為控制。實驗數(shù)據(jù)是在實驗中控制實驗對象收集的。

(3)按與時間的關(guān)系分:截面數(shù)據(jù)和時間序列數(shù)據(jù)。截面數(shù)據(jù)是在相同時間點上的靜態(tài)數(shù)據(jù),時間序列數(shù)據(jù)是在不同時間上收集的數(shù)據(jù),描述了對象隨時間變化的情況。


3. 幾個基本概念

(1)總體:包含研究個體的集合,一般統(tǒng)計學(xué)上的總體是針對無限總體的,因此也把總體看做隨機變量。

(2)樣本:總體中抽取一部分元素的集合。元素的數(shù)量稱為樣本量。

(3)參數(shù):描述總體特征的概括性數(shù)字度量。如總體平均數(shù)、總體標準差、總體比例等。

(4)統(tǒng)計量:描述樣本特征的概括性數(shù)字度量。如樣本平均數(shù)、樣本標準差、樣本比例等。

(5)變量:說明現(xiàn)象的某種特征,具體的取值稱為變量值。例如:銷售額20萬元。銷售額為變量,20萬元為變量值。變量的分類分成分類變量、順序變量和數(shù)值型變量,其中數(shù)值型變量又分為離散型和連續(xù)性。這與按計量單位分類的統(tǒng)計數(shù)據(jù)是統(tǒng)一的。

了解了統(tǒng)計學(xué)是什么,接下來就可以更清楚地理解描述統(tǒng)計與推斷統(tǒng)計了:)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容