表型數(shù)據(jù):描述性統(tǒng)計(jì) —— R 'psych'

表型數(shù)據(jù)的描述性統(tǒng)計(jì),是對(duì)表型數(shù)據(jù)進(jìn)行的基礎(chǔ)分析,包括最大值、最小是、均值、方差、極差等。通過SPSS、Excel或者R都可以完成,R與其他兩種方法對(duì)比,只需要簡(jiǎn)單的命令就可以完成全部分析,這里主要介紹R包'psych'。


1.準(zhǔn)備工作:

1.1 R包安裝

> install.packages('psych')

1.2 數(shù)據(jù)格式

這里的數(shù)據(jù)格式為常用的長(zhǎng)數(shù)據(jù),即第一行為表頭,每一列為性狀觀測(cè)值的名稱,如株高、莖粗、分枝數(shù)、千粒重等。

我這里的數(shù)據(jù)分別為:株系,時(shí)間,重復(fù),年份,之后為每個(gè)性狀的測(cè)量值。


2.統(tǒng)計(jì):

調(diào)用R包:

> library('psych')

讀取寬數(shù)據(jù):

> raw_data <- read.table("phe.txt", header = T, check.names = F, sep = "\t")

我需要每個(gè)時(shí)間點(diǎn)單獨(dú)統(tǒng)計(jì),提取時(shí)間:

> T1 <- subset(raw_data, Time == 'T1')

統(tǒng)計(jì),這里第五列開始為我需要的表型性狀:

> T1_data_desc <- describe(T1[,5:ncol(T1)])

查看結(jié)果:

> head(T1_data_desc)
   vars   n  mean    sd median trimmed   mad min    max  range skew kurtosis   se
TL    1 728 21.24 13.59  19.30   20.00 13.43   0 100.17 100.17 1.04     1.97 0.50
PA    2 728  1.80  1.11   1.63    1.69  1.02   0   7.17   7.17 0.98     1.27 0.04
SA    3 728  5.65  3.48   5.11    5.32  3.22   0  22.52  22.52 0.98     1.27 0.13

結(jié)果中包含每個(gè)性狀在T1時(shí)間點(diǎn)的平均值,標(biāo)準(zhǔn)差,最小值,最大值,偏度,峰度等我們需要的所有描述性統(tǒng)計(jì)結(jié)果。

3.結(jié)果輸出:

將上一步的描述性統(tǒng)計(jì)結(jié)果輸出:

> write.csv(T1_data_desc, file = "T1_data_desc.csv", quote = F)

引用轉(zhuǎn)載請(qǐng)注明出處,如有錯(cuò)誤敬請(qǐng)指出。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容