T2.4-SPSS 數據預處理



Data->Sort Cases

按特定變量值排列Case

“把班上所有同學按成績排名”

Data->Transpose

轉置:行列互換

可選擇其中的一列作為變量名(SPSS的一列表示一個變量,一行表示一個Case)

Data->Split Files

按照變量值對數據進行分組(不會真的拆分文件,只是將數據進行分組)

“把男生女生的成績拆分開來”

Data->Merge Files

Add Cases 縱向合并:2個文件的變量完全一致,增加Case而已

把B班同學的語數英成績導入到A班同學的語數英成績表格里

Add Variables 橫向合并:2個文件的Case完全一致(由同一批人完成),增加新的變量

把班上同學的地理成績導到語數英成績的文件中

Data->Aggregate

匯總:先按特定變量把數據分類,再求分類各組的統(tǒng)計值

生成新的數據文件 AGGR.sav

求男生女生的數學和英文成績的Mean,SD,Max, Min

(選擇性別為分類變量,數學成績、英文成績?yōu)閰R總變量)

Data->Weight Cases

如果在一個樣本中女性比例過高,可能需要給予女性數據較低的權重值,以抵消它們比例過高引起的影響

在進行頻數分布分析時(列聯(lián)表、交叉表),已知單元格頻數,要進行卡方檢驗,也需要以加權方式處理數據

在當前數據文件中如果存在一個表明相同變量值出現頻數的變量,應該把它定義為加權變量

1. 加權變量中含有0、負數、缺失值的Case將被排除在分析外

2. 分數值有效

3. 一旦對數據進行了加權處理,接下來所有的分析過程中加權都有效,直到頁面關閉或重新加權


Transform->Rank Cases

求某個變量值的秩(保存為新變量,不改變Case順序)

“求班上所有同學的排名”

可以分別輸出男生、女生的排名

Transform->Count

“求20門課中每個同學一共選了幾門課”

每門課選中則數值為1,讓20門課對應的20個變量參與計數,生成新變量 mathcrs

可設置條件 if(這個學生還沒畢業(yè),就統(tǒng)計一下它選修了幾門課)

Transform->Recode

多用于將“定距變量”重新編碼為“定序變量”

“把所有同學按照成績高低分成優(yōu)、良、差3個層級”

Transform->Automatic Recode

將數值型(含非連續(xù)整數)變量轉換為連續(xù)整數(EX 表示因子水平、人數)

將字符型變量轉換為連續(xù)整數(EX 非連續(xù)數值無法處理)

Transform->Compute

根據現有若干個變量生成一個新的變量

平均進步成績=(期末語文成績-期中語文成績)+(...)/N


Utilities->Define Sets

變量太多時,可以將不常用的變量遮蔽,將常用的變量定義為一個變量集

Utilities->Use Sets

調用已定義的變量集




圖片發(fā)自簡書App


圖片發(fā)自簡書App
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容