一、中心極限定理
1、定義
(1)樣本的平均值約等于總體的平均值。
(2)不管總體是什么分布,任意一個總體的樣本平均值都會圍繞在總體的整體平均值周圍,并且呈正態(tài)分布。
(3)樣本大小必須達到30,中心極限定理才能保證成立。
2、結(jié)論:
(1)用樣本來估計總體
任何一個樣本的平均值將會約等于其所在總體的平均值。
(2)樣本平均值呈正態(tài)分布
取樣次數(shù)越多,結(jié)果就越接近正態(tài)分布;而且樣本大小越大,分布就越接近正態(tài)分布。
3、作用
(1)在沒有辦法得到總體全部數(shù)據(jù)的情況下,我們可以用樣本來估計總體。
(2)根據(jù)總體的平均值和標準差,判斷某個樣本是否屬于總體。
4、示例
假設(shè)有一個群體,如我們之前提到的清華畢業(yè)的人,我們對這類人群的收入感興趣。怎么知道這群人的收入呢?我會做這樣4步:
(1)隨機抽取1個樣本,求該樣本的平均值。例如我們抽取了100名畢業(yè)于清華的人,然后對這些人的收入求平均值。
該樣里的100名清華的人,這里的100就是該樣本的大小。
有一個經(jīng)驗是,樣本大小必須達到30,中心極限定理才能保證成立。
(2)我將第1步樣本抽取的工作重復(fù)再三,不斷地從畢業(yè)的人中隨機抽取100個人,例如我抽取了5個樣本,并計算出每個樣本的平均值,那么5個樣本,就會有5個平均值。
這里的5個樣本,就是指樣本數(shù)量是5。
(3)根據(jù)中心極限定理,這些樣本平均值中的絕大部分都極為接近總體的平均收入。有一些會稍高一點,有一些會稍低一點,只有極少數(shù)的樣本平均值大大高于或低于群體平均值。
(4)中心極限定理告訴我們,不論所研究的群體是怎樣分布的,這些樣本平均值會在總體平均值周圍呈現(xiàn)一個正態(tài)分布。
二、大數(shù)定理
是一種描述當試驗次數(shù)很大時所呈現(xiàn)的概率性質(zhì)的定律。在隨機事件的大量重復(fù)出現(xiàn)中,往往呈現(xiàn)幾乎必然的規(guī)律,這個規(guī)律就是大數(shù)定律。
通俗地說,這個定理就是,在試驗不變的條件下,重復(fù)試驗多次,隨機事件的頻率近似于它的概率。偶然中包含著某種必然。
三、兩者之間的區(qū)別
大數(shù)定律是說,n只要越來越大,我把這n個獨立同分布的數(shù)加起來去除以n得到的這個樣本均值(也是一個隨機變量)會依概率收斂到真值u,但是樣本均值的分布是怎樣的我們不知道。
中心極限定理是說,n只要越來越大,這n個數(shù)的樣本均值會趨近于正態(tài)分布,并且這個正態(tài)分布以u為均值,sigma^2/n為方差。
綜上所述,這兩個定律都是在說樣本均值性質(zhì)。隨著n增大,大數(shù)定律說樣本均值幾乎必然等于均值。中心極限定律說,他越來越趨近于正態(tài)分布。并且這個正態(tài)分布的方差越來越小。
直觀上來講,想到大數(shù)定律的時候,你腦海里浮現(xiàn)的應(yīng)該是一個樣本,而想到中心極限定理的時候腦海里應(yīng)該浮現(xiàn)出很多個樣本。