這是優(yōu)達(dá)學(xué)城Udacity“數(shù)據(jù)分析師”課程的“統(tǒng)計(jì)學(xué)”部分的實(shí)踐項(xiàng)目,在這跟大家分享,讓大家了解統(tǒng)計(jì)學(xué)知識(shí)在實(shí)驗(yàn)中的應(yīng)用。
項(xiàng)目概述
在該項(xiàng)目中,將對(duì)實(shí)驗(yàn)心理學(xué)中的典型現(xiàn)象——斯特魯普效應(yīng)展開(kāi)調(diào)查。
將獲得對(duì)實(shí)驗(yàn)的初步認(rèn)識(shí),根據(jù)結(jié)果作出假設(shè),并親自體驗(yàn)該實(shí)驗(yàn)任務(wù)。
然后,要查看其他執(zhí)行了相同任務(wù)的人的數(shù)據(jù),并計(jì)算出描述這些結(jié)果的一些統(tǒng)計(jì)數(shù)據(jù)。
最后,要根據(jù)你的假設(shè)解讀結(jié)果。

為什么要做這個(gè)項(xiàng)目?
統(tǒng)計(jì)學(xué)是數(shù)據(jù)分析的主要組成部分,它可以幫助你調(diào)查數(shù)據(jù),并根據(jù)觀察到的情況作出推論。
統(tǒng)計(jì)學(xué)基礎(chǔ)還可以幫助你利用他人的分析成果,并獲取他人的調(diào)查結(jié)論。
用到的技能
學(xué)會(huì)利用統(tǒng)計(jì)學(xué)知識(shí)從數(shù)據(jù)中得出有效的結(jié)論,包括:
- 如何確定實(shí)驗(yàn)的組成部分
- 如何利用描述統(tǒng)計(jì)學(xué)描述樣本質(zhì)量
- 如何安排假設(shè)檢驗(yàn),對(duì)樣本作出推論并根據(jù)結(jié)果得出結(jié)論
背景信息
在一個(gè) Stroop (斯特魯普)任務(wù)中,參與者得到了一列文字,每個(gè)文字都用一種油墨顏色展示。參與者的任務(wù)是將文字的打印顏色大聲說(shuō)出來(lái)。
這項(xiàng)任務(wù)有兩個(gè)條件:一致文字條件,和不一致文字條件。
在一致文字條件中,顯示的文字是與它們的打印顏色匹配的顏色詞,如“紅色”、“藍(lán)色”。

在不一致文字條件中,顯示的文字是與它們的打印顏色不匹配的顏色詞,如“紫色”、“橙色”。

在每個(gè)情況中,我們將計(jì)量說(shuō)出同等大小的列表中的墨色名稱的時(shí)間。
每位參與者必須全部完成并記錄每種條件下使用的時(shí)間。
調(diào)查問(wèn)題
1. 我們的自變量是什么?因變量是什么?
自變量:顯示文字與打印顏色是否匹配;
因變量:說(shuō)出同等大小列表中墨色名稱的時(shí)間;
2. 此任務(wù)的適當(dāng)假設(shè)集是什么?你想執(zhí)行什么類型的統(tǒng)計(jì)測(cè)試?為你的選擇提供正當(dāng)理由。
(1) 零假設(shè):H0:μc=μic 顯示文字與打印顏色是否匹配,不會(huì)影響說(shuō)出列表中墨色名稱的時(shí)間;
(2) 對(duì)立假設(shè):Ha:μc ≠μic 顯示文字與打印顏色是否匹配,會(huì)影響說(shuō)出列表中墨色名稱的時(shí)間;
符號(hào)解釋:μc:Congruent總體的均值;μic :Incongruent總體的均值
(3) 執(zhí)行的是統(tǒng)計(jì)測(cè)試類型:
Dependent samples (Repeated measure)即相依樣本(重復(fù)測(cè)試),具體是:two conditions(兩種處理類型);
T檢驗(yàn);
雙尾檢驗(yàn);
(4) 理由:
此統(tǒng)計(jì)類型 控制了個(gè)性化差異,而且樣本更少,性價(jià)比高,耗時(shí)更少,花費(fèi)少;
不知道總體的標(biāo)準(zhǔn)差,只知道樣本的標(biāo)準(zhǔn)差,所以用t檢驗(yàn),而不是z檢驗(yàn);
因?yàn)閷?duì)立假設(shè)沒(méi)有方向性,只要證明 不相等 即可,所以采用雙尾檢驗(yàn);
現(xiàn)在輪到你自行嘗試 Stroop 任務(wù)了。前往此鏈接,其中包含一個(gè)基于 Java 的小程序,專門用于執(zhí)行 Stroop 任務(wù)。記錄你收到的任務(wù)時(shí)間(你無(wú)需將時(shí)間提交到網(wǎng)站)。
現(xiàn)在下載此數(shù)據(jù)集,其中包含一些任務(wù)參與者的結(jié)果。數(shù)據(jù)集的每行包含一名參與者的表現(xiàn),第一個(gè)數(shù)字代表他們的一致任務(wù)結(jié)果,第二個(gè)數(shù)字代表不一致任務(wù)結(jié)果。
3. 報(bào)告關(guān)于此數(shù)據(jù)集的一些描述性統(tǒng)計(jì)。包含至少一個(gè)集中趨勢(shì)測(cè)量和至少一個(gè)變異測(cè)量。
(1) 集中趨勢(shì)測(cè)量

(2) 變異測(cè)量

4. 提供顯示樣本數(shù)據(jù)分布的一個(gè)或兩個(gè)可視化。用一兩句話說(shuō)明你從圖中觀察到的結(jié)果。


結(jié)論:總體來(lái)看,Incongruent 比 Congruent 用的時(shí)間要多;
5. 現(xiàn)在,執(zhí)行統(tǒng)計(jì)測(cè)試并報(bào)告你的結(jié)果。你的置信水平和關(guān)鍵統(tǒng)計(jì)值是多少?你是否成功拒絕零假設(shè)?對(duì)試驗(yàn)任務(wù)得出一個(gè)結(jié)論。結(jié)果是否與你的期望一致?
置信水平α=0.05,雙尾檢驗(yàn);
自由度df=23, t-critical=±2.069;
S=4.86;μc=14.05; μic=22.02; t= -8.02;
成功拒絕零假設(shè) Reject H0;
結(jié)論:顯示文字與打印顏色是否匹配,會(huì)影響說(shuō)出列表中墨色的時(shí)間;
與我期望的一致,直方圖觀察到的就是“文字與打印顏色不一致”條件下用時(shí)會(huì)更多;