
繼續(xù)學(xué)習(xí)統(tǒng)計學(xué),哲學(xué)老師教的條理清楚、通俗易懂。好像一位老師在身邊手把手的教授,你想到?jīng)]想到的疑惑,他就知道,你還沒想到什么地方不對,他就預(yù)先知道了,早早的給你埋好了路標(biāo)。
SPSS:(Statistical Package for the Social Sciences)為社會科學(xué)量身定做的軟件包。另外常用軟件還有:stata;R。
通常通過四步驟:數(shù)據(jù)錄入、數(shù)據(jù)轉(zhuǎn)化、數(shù)據(jù)分析、制作圖表。
起始最重要是變項名稱,一次輸入不要拖延,會忘記。
數(shù)據(jù)清洗(data cleaning):數(shù)據(jù)錄入很容易出錯,最簡單是看頻次表,看異常值。
轉(zhuǎn)換數(shù)據(jù):重新編碼;取對數(shù);算平方。注意:“重新編碼為不同變項”及時變更后臺信息。
制圖(graphs):圖構(gòu)建程序(chart builder)
分析(analyze):描述統(tǒng)計(descriptive statistics):頻次、描述、交叉表;推理統(tǒng)計(inferential statistics):回歸(最小二乘回歸、對數(shù)回歸)、降維(因子分析、量表)。
變項視圖(variable view):后臺信息,告訴我們數(shù)據(jù)庫數(shù)字的意思。
實質(zhì)相干的變項:互相影響的變項,可以當(dāng)因變項,如:年薪高低、是否經(jīng)理、教育程度。
理論相關(guān)的變項:影響因變項的自變項,如:年薪為因變項,自變項可能是性別、教育程度、是否經(jīng)理、族裔。
數(shù)據(jù):數(shù)據(jù)不是數(shù)字,是通過對我們感興趣的某些個體屬性進(jìn)行量化得到的信息?!皵?shù)”是符號,“據(jù)”是事實、信息,數(shù)據(jù)是以“數(shù)”標(biāo)“據(jù)”。
數(shù)據(jù)庫(data bank):數(shù)字組成的集合,每個數(shù)字都攜帶信息。
數(shù)據(jù)點、線、面、體:點是個體單個屬性;線是每個變項的全部情況,測量層級越高,曲線越接近正態(tài)分布;面是兩個變項分別形成的數(shù)據(jù)線可能(不一定形成)的數(shù)據(jù)面;體是三個或以上變項分別形成的數(shù)據(jù)線可能(不一定形成)的數(shù)據(jù)體,有多個面。
數(shù)據(jù)挖掘:分析數(shù)據(jù)關(guān)鍵是發(fā)現(xiàn)數(shù)據(jù)結(jié)構(gòu)。
數(shù)據(jù)行:代表個體的若干屬性。行數(shù)就是個體數(shù)。
數(shù)據(jù)列:代表變項(具體狀態(tài)由操作定義和測量層級共同界定)+抽樣信息+調(diào)研過程信息+權(quán)重
自己的數(shù)據(jù)庫:1、自己調(diào)查得到;2、對現(xiàn)有別人數(shù)據(jù)庫有“獨到的理解”。注意:現(xiàn)有數(shù)據(jù)庫,有可能關(guān)鍵變項被分享時保留。