R語言-因子

1.因子的創(chuàng)建
因子利用函數(shù)factor()來創(chuàng)建。其格式為

factor(x = character(), levels, labels = levels,
       exclude = NA, ordered = is.ordered(x), nmax = NA)

x為字符型和數(shù)值型向量;levels為指定的因子水平;labels為指定的因子水平的名稱;exclude表示要剔除的水平;ordered 表示因子的水平是否有次序;nmax表示因子數(shù)目的上界。

> x<-c(4, 6 ,4 ,6 ,6 ,6 ,6 ,3 ,1 ,4 ,5, 3 ,1 ,2 ,6, 4 ,5 ,3 ,6, 2)
> x
 [1] 4 6 4 6 6 6 6 3 1 4 5 3 1 2 6 4 5 3 6 2
> fact<-factor(x)
> fact#有六個(gè)水平:1 2 3 4 5 6
 [1] 4 6 4 6 6 6 6 3 1 4 5 3 1 2 6 4 5 3 6 2
Levels: 1 2 3 4 5 6

指定因子水平的名稱

> x<-c(4, 6 ,4 ,6 ,6 ,6 ,6 ,3 ,1 ,4 ,5, 3 ,1 ,2 ,6, 4 ,5 ,3 ,6, 2)
> fact<-factor(x,label=c("A","B","C","D","E","F"))
> fact
 [1] D F D F F F F C A D E C A B F D E C F B
Levels: A B C D E F

定義有次序水平的因子

> x<-c(4, 6 ,4 ,6 ,6 ,6 ,6 ,3 ,1 ,4 ,5, 3 ,1 ,2 ,6, 4 ,5 ,3 ,6, 2)
> fact<-factor(x,label=c("A","B","C","D","E","F"),order=T)
> fact
 [1] D F D F F F F C A D E C A B F D E C F B
Levels: A < B < C < D < E < F

用函數(shù)gl創(chuàng)建因子向量

gl(n, k, length = n*k, labels = seq_len(n), ordered = FALSE)

n表示給定的水平個(gè)數(shù);k表示每個(gè)水平的重復(fù)數(shù)。

> fa<-gl(2,5)
> fa
 [1] 1 1 1 1 1 2 2 2 2 2
Levels: 1 2
> fa<-gl(2,5,lable=c("F","M"))
> fa<-gl(2,5,label=c("F","M"))
> fa
 [1] F F F F F M M M M M
Levels: F M
> fa<-gl(2,5,label=c("F","M"),ordered=T)
> fa
 [1] F F F F F M M M M M
Levels: F < M

2.tapply函數(shù)

tapply(X, INDEX, FUN = NULL, ..., simplify = TRUE)

x表示向量;INDEX表示因子或者因子列表;FUN為函數(shù);simply為邏輯參數(shù),如果為FALSE,tapply返回的是列表,如果為TRUE,返回的是向量。

> x<-sample(1:4,20,replace=T)
> x
 [1] 3 2 4 3 3 4 3 4 3 3 3 4 1 1 2 3 2 1 3 4
> y<-factor(x,labels=c("A","B","C","D"))
> y
 [1] C B D C C D C D C C C D A A B C B A C D
Levels: A B C D
> tapply(x,y,mean)
A B C D 
1 2 3 4 
> tapply(x,y,sum)#返回向量
 A  B  C  D 
 3  6 27 20 
> tapply(x,y,sum,simplify=F)#返回列表
$A
[1] 3
$B
[1] 6
$C
[1] 27
$D
[1] 20
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 因子是用于對(duì)數(shù)據(jù)進(jìn)行分類并將其存儲(chǔ)為級(jí)別的數(shù)據(jù)對(duì)象。 它們可以存儲(chǔ)字符串和整數(shù)。 它們?cè)诰哂杏邢迶?shù)量的唯一值的列中...
    yuanyb閱讀 629評(píng)論 0 0
  • 1、變量分類: (1)連續(xù)型變量(2)名義型變量(3)有序型變量在 R 中,名義型變量和有序型變量稱為因子(fac...
    Zhigang_Han閱讀 681評(píng)論 0 1
  • 感謝Robert I.Kabacoff 著作了這本書,同時(shí)感謝高濤、肖楠、陳鋼編譯此書。 最近在學(xué)習(xí)《R語言實(shí)戰(zhàn)...
    數(shù)據(jù)斯基閱讀 5,299評(píng)論 0 21
  • 永遠(yuǎn)記得“功夫不負(fù)有心人” 手機(jī)或電腦里無論有多少書,其內(nèi)容內(nèi)容都不會(huì)被保存在腦子里。其內(nèi)容既不能融入你的身心,也...
    高海洋1319艾尚閱讀 281評(píng)論 0 0
  • 0610周六復(fù)盤的主要流程: 1.目的和任務(wù)目標(biāo)(期待的結(jié)果) 目的:陪朋友逛街 目標(biāo):去Dfcoco看下新款,不...
    墨紫七閱讀 237評(píng)論 0 0

友情鏈接更多精彩內(nèi)容