Remark:對(duì)心理學(xué)感興趣,源自自我心理探索,決定學(xué)習(xí)中科院的兒童發(fā)展與教育心理學(xué),倍感忐忑和壓力,專業(yè)領(lǐng)域跨度較大,也很久不曾認(rèn)真學(xué)習(xí)過(guò)某項(xiàng)課程。既然已經(jīng)開(kāi)始,就全力以赴吧。
? 授課老師:禤宇明? ??腦與認(rèn)知科學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室??中國(guó)科學(xué)院心理研究所
? ? ? ? ? ? ? ???第一章? ? 緒論?
一、什么是統(tǒng)計(jì)學(xué)
二、 為什么需要統(tǒng)計(jì)學(xué)
三、統(tǒng)計(jì)學(xué)的分類:描述統(tǒng)計(jì)和推論統(tǒng)計(jì)
四、現(xiàn)代統(tǒng)計(jì)理論的發(fā)展
五、預(yù)備知識(shí):變量、連續(xù)變量和離散變量、符號(hào)
注意事項(xiàng)
? 統(tǒng)計(jì)是一門不易理解的“數(shù)學(xué)”
? ?~ 人為的規(guī)定
? ~? 抽象的術(shù)語(yǔ)
? ~? 繁多的公式
??如何學(xué)習(xí)
? ~ 聽(tīng)課、看書(shū)、做題、多思考
? ~?上課帶紙、筆、計(jì)算器(機(jī))
? ~?盡可能地在工作中應(yīng)用學(xué)到的知識(shí)
一、 什么是統(tǒng)計(jì)
1.?統(tǒng)計(jì)是任何方面的專家們用以支持其論點(diǎn)的一大堆數(shù)據(jù)
2. 統(tǒng)計(jì)師計(jì)算用以代表和解釋一堆數(shù)據(jù)的量數(shù)(如平均數(shù)與標(biāo)準(zhǔn)差)的方法
3. 統(tǒng)計(jì)是依少量數(shù)據(jù)(樣本)所提供的資料來(lái)估計(jì)預(yù)測(cè)某研究對(duì)象(總體)的方法
4. 統(tǒng)計(jì)為不確定狀況下制定決策提供方法的科學(xué)
統(tǒng)計(jì)學(xué)分類:大致分為理論統(tǒng)計(jì)學(xué)(theoretical statistics)和應(yīng)用統(tǒng)計(jì)學(xué)(applied statistics)兩部分。
理論統(tǒng)計(jì)學(xué):側(cè)重統(tǒng)計(jì)理論與方法的數(shù)理證明。
應(yīng)用統(tǒng)計(jì)學(xué):側(cè)重統(tǒng)計(jì)理論與方法在各個(gè)實(shí)踐領(lǐng)域中國(guó)的應(yīng)用。
心理與教育統(tǒng)計(jì)學(xué)屬于應(yīng)用統(tǒng)計(jì)學(xué)科。
二、為什么需要統(tǒng)計(jì)學(xué)
?2.1??數(shù)據(jù)不能說(shuō)明一切,但是是某種事實(shí)(數(shù)據(jù)可以作為證據(jù)或論點(diǎn))
? ? ?In God we trust。 Others bring data.?
? ? ?例如: 績(jī)效評(píng)定、升級(jí)留級(jí)
?2.2 我們需要概率來(lái)理解抽獎(jiǎng)、保險(xiǎn)、醫(yī)學(xué)試驗(yàn)、工業(yè)質(zhì)量控制、天氣預(yù)報(bào)、運(yùn)動(dòng)創(chuàng)傷、基因和現(xiàn)代物理
?2.3? 在面對(duì)不確定情況下,統(tǒng)計(jì)是一種能夠幫助我們做出聰明決策的科學(xué)方法
?? 趣味統(tǒng)計(jì)問(wèn)題
? ??①?父親高兒子一定高
? ??②?賭徒的謬論:
甲:我準(zhǔn)備買車了! 乙:哦,你升職了嗎?
甲:沒(méi)有,但你知道這些年我一直在買彩票。乙:是的,每次你都買。
甲:但我每次都沒(méi)有中獎(jiǎng)。 乙:那你為什么覺(jué)得你這次會(huì)中獎(jiǎng)呢?
甲:以前都沒(méi)中過(guò),這次該輪到我了!
? ?③?倉(cāng)促的結(jié)論:英格蘭的Smith到美國(guó)的俄亥俄州某大學(xué)讀研究生。他從來(lái)沒(méi)有到過(guò)美洲,很多東西對(duì)他來(lái)說(shuō)都很新奇。 有一天,他從學(xué)校禮堂回宿舍時(shí)看到了兩只松鼠,令人驚奇的是兩只松鼠都是白色的。晚上email的時(shí)候,他把這個(gè)發(fā)現(xiàn)告訴了他的父母,他興奮地寫(xiě)道:“…美國(guó)的松鼠都是白色的…
? ?④?出租車問(wèn)題:國(guó)外某地的出租車較少,一位統(tǒng)計(jì)學(xué)者在該地的某街角等候出租車,眼看來(lái)了幾部出租車都載客而過(guò),這位統(tǒng)計(jì)學(xué)者開(kāi)始懷疑這個(gè)城市到底有幾部出租車,以致于不夠用。于是他開(kāi)始記下載客而過(guò)的出租車車號(hào),依次如下:405, 280, 73, 440, 179。接著來(lái)了一部空車,載走了統(tǒng)計(jì)學(xué)者。 假如該城市出租車的編號(hào)是從1號(hào)開(kāi)始連續(xù)編排下來(lái),而且空的出租車走在城里做隨機(jī)性的環(huán)繞,那么,你若是這位統(tǒng)計(jì)學(xué)者,你將如何 從上述記錄的資料來(lái)推測(cè)該城市共有幾部出租車?
? ?⑤?估計(jì)野生動(dòng)物的存量:在報(bào)紙雜志上,我們經(jīng)??吹侥撤N動(dòng)物已瀕臨滅絕邊緣的報(bào)導(dǎo)??茖W(xué)家如何知道那些野生動(dòng)物的數(shù)量呢?例如:鯨漫游在占全球表面積約?2/3強(qiáng)的海洋內(nèi),而且大部分的時(shí)間又都潛伏在水底,我們?nèi)绾蝸?lái)估計(jì)各類鯨的存量呢?
?? 常見(jiàn)統(tǒng)計(jì)問(wèn)題
? ①. 本批產(chǎn)品是否是合格品?
? ② 吸煙與得癌癥有關(guān)嗎?
? ?③ 張三會(huì)于下屆選舉中獲勝嗎?
三、統(tǒng)計(jì)的分類:描述統(tǒng)計(jì)和推論統(tǒng)計(jì)
3.1? 描述統(tǒng)計(jì):我們的興趣只限于手頭現(xiàn)有的數(shù)據(jù),而不準(zhǔn)備把結(jié)果用來(lái)推論總體,稱為描述統(tǒng)計(jì)。
例:每年來(lái)京旅游的人數(shù),平均每人在京停留的日 數(shù),平均每人每天在京的花費(fèi),十年內(nèi)那一年創(chuàng)最高記錄
3.2 推論統(tǒng)計(jì):?任何對(duì)數(shù)據(jù)(即樣本)的處理導(dǎo)致預(yù)測(cè)或推論總體的統(tǒng)計(jì)稱為推論統(tǒng)計(jì)
?例:根據(jù)歷年數(shù)據(jù)預(yù)測(cè)來(lái)年可能來(lái)京旅游的人數(shù)
四、現(xiàn)代統(tǒng)計(jì)理論發(fā)展的四個(gè)階段
4.1. 高爾頓和皮爾遜
? ? ①??1899年,高爾頓(Sir Francis Galton, 1822~1911)出版《Nature Inheritance》一書(shū)
? ? ? ? ?●?所有知識(shí)都基于統(tǒng)計(jì)基礎(chǔ)
? ? ? ??●??引入中數(shù)、創(chuàng)立相關(guān)概念、把成績(jī)?cè)u(píng)分和正態(tài)分布聯(lián)系起來(lái)
? ②?卡爾.皮爾遜(Karl Pearson, 1857~1936)
? ? ? ●??眾數(shù)、標(biāo)準(zhǔn)差、相關(guān)系數(shù)
4.2. 費(fèi)雪?
1915年,費(fèi)雪(Ronald Aylmer Fisher, 1890~1962)發(fā)表關(guān)于樣本相關(guān)系數(shù)統(tǒng)計(jì)量的精確分布的論文
? ? ? ●??小樣本統(tǒng)計(jì)、估計(jì)量的判定準(zhǔn)則、最大似然估計(jì)
? ? ? ●??抽樣技巧和隨機(jī)程序
? ? ? ●??《Statistical Methodsfor Research Workers》和《Design of Experiments》分別于1925年和1935年出版,對(duì)于統(tǒng)計(jì)有重大的影響
? ? ? ??費(fèi)氏提到有一位女士聲稱她能分辨出她的茶中牛奶是在泡茶之前或之后加入的,而后他描述一種實(shí)驗(yàn)計(jì)劃來(lái)證明或否定該女士的聲稱
(據(jù)說(shuō)費(fèi)雪是個(gè)早熟的孩子,在很小的時(shí)候就精通如球面三角之類的艱深學(xué)問(wèn)。他曾對(duì)物理科學(xué)感興趣,1912年自劍橋大學(xué)得到天文學(xué)的學(xué)士學(xué)位。)
4.3?聶曼和伊根·皮爾遜
??第三個(gè)時(shí)期以1928年聶曼(Jerzy Neyman)和伊根·皮爾遜(Egon Pearson, 卡爾·皮爾遜之子)的共同論文 多篇的發(fā)表為開(kāi)端
? ? ? ●??介紹和強(qiáng)調(diào)諸如假設(shè)檢驗(yàn)中的第二種錯(cuò)誤,檢驗(yàn)的power和置信區(qū)間之類的觀念
4.3 華德
??1939年,華德(Abraham Wald, 1902~ 1950) 發(fā)表關(guān)于順序抽樣 (sequential sampling) 的論文
? ? ? ●??最大的貢獻(xiàn)之一是他介紹一種對(duì)統(tǒng)計(jì)問(wèn)題的新看法(1945),那就是以對(duì)局的觀點(diǎn)去處統(tǒng)計(jì)方面的問(wèn)題,這就是今日所稱的統(tǒng)計(jì)決策理論 (statistical decision theory)
? ? ? ●??統(tǒng)計(jì)被視為以自然為對(duì)手的對(duì)局的藝術(shù)
五、預(yù)備知識(shí)
5.1 幾個(gè)概念和術(shù)語(yǔ)
(1)? 隨機(jī)變量:在一定的條件下觀測(cè)結(jié)果不確定
隨機(jī)變量的分類:?①稱名變量、順序變量、等距變量、比率變量;
? ? ? ?② 因變量和自變量:Y =f (X)
? ? ? ?③ 連續(xù)變量和離散變量:?連續(xù)變量在任何兩個(gè)取值之間都還可以細(xì)分;離散變量在任何兩個(gè)取值之間只有有限個(gè)可能的取值
(2)? 總體、個(gè)體和樣本
總體(population):指具有某種特征的一類事物的全體,又稱母體
個(gè)體(unit、individual):構(gòu)成總體的每個(gè)基本單元
樣本(sample):從總體中抽取的一部分個(gè)體,即總體的一個(gè)子集
(3)? 參數(shù)和統(tǒng)計(jì)量:
參數(shù)(parameter),又稱總體參數(shù),是描述一個(gè)總體情況的統(tǒng)計(jì)指標(biāo)。
統(tǒng)計(jì)量(statistics),也叫樣本統(tǒng)計(jì)量、特征值:樣本的特征值
5.2? 符號(hào)
變量:大寫(xiě)英文字母,如X、Y等
變量variable的取值(即觀測(cè)值observation):小寫(xiě)英文字母,如x、y等
例如:18周歲中國(guó)人的身高:X
170,180,172,168,…
x1,????? x2,????? x3,????? x4,...