2018-10-15

第一節(jié) 分布 統(tǒng)計(jì)表 統(tǒng)計(jì)圖

一、分布

分布(頻次分布)概念:一個(gè)概念或變量,它的各個(gè)情況出現(xiàn)的次數(shù)或頻次。

變量取值要注意的問題:完備、互斥

多選題怎樣滿足互斥?

多選項(xiàng)二分法(對(duì)每一個(gè)選項(xiàng)都判斷是否選中)

多選項(xiàng)分類法(挑選有限的幾個(gè)——計(jì)算頻次)

加權(quán)平均法(被調(diào)查者對(duì)選項(xiàng)排序,打分)

統(tǒng)計(jì)圖和統(tǒng)計(jì)表都是為了表達(dá)變量的分布的【分布】

二、統(tǒng)計(jì)表

統(tǒng)計(jì)表概念:用表格形式來表示變量的分布

注意:百分比統(tǒng)計(jì)表要注明統(tǒng)計(jì)總數(shù)

對(duì)于定距變量:要區(qū)分它是連續(xù)型還是離散型

離散型:與定序變量的制表方法相同——變量按照取值的大小排列

連續(xù)型:由于一一列舉會(huì)分類多并且每一類的頻次少,所以采用組距式統(tǒng)計(jì)表

分組要注意的問題?

組數(shù):組數(shù)太多會(huì)增加偶然因素(p30)

等距分組域非等距分組

低收入的月薪差一千生活水平會(huì)差很多,高收入的月薪差一千,生活水平不會(huì)差很多,所以低收入組距小一些

分組的精度(將標(biāo)明組界轉(zhuǎn)化為真實(shí)組界,+-0.5)

三、統(tǒng)計(jì)圖

比統(tǒng)計(jì)表直觀

不及統(tǒng)計(jì)表精確

圓瓣圖****************************定類************************************

表示變量取值在總體中占的比例

無法體現(xiàn)出變量取值的排列

條形圖**************************定類、定序********************************

用長條的高度來表示資料類別的頻次或百分比【高度】

長條的寬度沒有意義,畫成等寬

對(duì)于定類變量,條形是離散的;對(duì)于定序變量,條形可以是離散的,也可以是緊挨著的

直方圖****************************定距*************************************

直方圖是由緊挨著的長條組成的

直方圖的寬度是有意義的

長條的面積表示頻次或相對(duì)頻次【面積】

長條的高度為頻次密度或相對(duì)頻次密度

這是因?yàn)檫B續(xù)型定距變量可采用非等距分組【非等距分組】

例子:26-27歲結(jié)婚的頻次密度比40-50歲結(jié)婚的頻次密度大(通過條形高度可以直觀看出)

折線圖*****************************定距************************************

用直線連接直方圖中條形頂端的中點(diǎn)即可得到

離散型用離散的那個(gè)值就可以了;連續(xù)型應(yīng)該用組中心值

四、累計(jì)圖和累計(jì)表

了解小于某一變量值或大于某一變量值總共的頻次是多少

比較個(gè)體在總體中的位置

例子:考80分,超過了95%的人還是50%的人

五、分布圖分析

峰點(diǎn)研究

雙峰的話,說明數(shù)據(jù)的實(shí)體不屬于同一類型

幼兒園既有阿姨,又有幼兒,比較身高是沒有意義的

對(duì)稱研究

正態(tài)分布:單峰、對(duì)稱

左偏態(tài)(負(fù)向偏態(tài))——左邊尾巴拖得比較長

右偏態(tài)(正向偏態(tài))——右邊尾巴拖得比較長

除此之外,還有U形曲線和J形曲線

U:人口死亡率和年齡 J:婚姻次數(shù)與人數(shù)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容