R基礎(chǔ)四(因子)

因子

因子最大的作用就是用來分類,計(jì)算頻數(shù)和頻率。

變量分類

  1. 名義型變量(例如廣東,深圳等,彼此獨(dú)立,沒有順序)
  2. 有序型變量 (例如病情狀況good,better,best)
  3. 連續(xù)型變量(例如1,5,7,8等數(shù)值為連續(xù)的數(shù)量變化)

名義型變量和連續(xù)型變量在R中為因子(factor),這些分類變量的可能值稱為一個(gè)水平(level),例如good,better,best都稱為一個(gè)level。
由這些水平值構(gòu)成的向量稱為因子。

  • 因子作用
計(jì)算頻數(shù)
獨(dú)立性檢驗(yàn)
相關(guān)性檢驗(yàn)
方差分析
主成分分析
因子分析

在許多繪圖函數(shù)中,輸入的數(shù)據(jù)也必須是因子。
table()統(tǒng)計(jì)頻數(shù)
例如mtcars

> mtcars
> mtcars$cyl    ##去除cyl這一列作為因子數(shù)據(jù)
 [1] 6 6 4 6 8 6 8 4 4 6 6 8 8 8 8 8 8 4 4 4 4 8 8 8 8 4 4 4 8 6 8 4
> table(mtcars$cyl)  ##統(tǒng)計(jì)頻數(shù)
 4  6  8 
11  7 14   ##cyl這一列可以作為因子類型,其中4,6,8為因子的level。
  • 可以利用factor()函數(shù)將向量轉(zhuǎn)換為因子,或者說用factor()函數(shù)來定義因子。
> f <- factor(c('red','blue','yellow','grey','red'))
> f
[1] red    blue   yellow grey   red   
Levels: blue grey red yellow

這樣的level是沒有順序的,可以自己手動(dòng)添加順序。

> f <- factor(c('mon','sat','fri','mon','thu','sun'), ordered = T, levels= c('mon','tue','wen','thu','fri','sat','sun'))
> f
[1] mon sat fri mon thu sun
Levels: mon < tue < wen < thu < fri < sat < sun  ##次數(shù)levels就有順序了

> fcyl <- factor(mtcars$cyl)  ##將向量轉(zhuǎn)換為因子
> fcyl
 [1] 6 6 4 6 8 6 8 4 4 6 6 8 8 8 8 8 8 4 4 4 4 8 8 8 8 4 4 4 8 6 8 4
Levels: 4 6 8

此時(shí)可以分別對(duì)mtcarscyl和factor(mtcarscyl)繪圖。

> mtcars$cyl
 [1] 6 6 4 6 8 6 8 4 4 6 6 8 8 8 8 8 8 4 4 4 4 8 8 8 8 4 4 4 8 6 8 4
> fcyl <- factor(mtcars$cyl)
> fcyl
 [1] 6 6 4 6 8 6 8 4 4 6 6 8 8 8 8 8 8 4 4 4 4 8 8 8 8 4 4 4 8 6 8 4
Levels: 4 6 8
plot(mtcars$cyl)
plot(factor(mtcars$cyl))
mtcars$cyl
factor(mtcars$cyl)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 《R語(yǔ)言入門》的讀書筆記 本書的重點(diǎn)內(nèi)容及感悟: 第一章 導(dǎo)言 1、R是一個(gè)有著統(tǒng)計(jì)分析功能及強(qiáng)大作圖功能的軟件系...
    格式化_001閱讀 12,691評(píng)論 0 9
  • R語(yǔ)言基礎(chǔ)--數(shù)據(jù)類型之因子 參考:R語(yǔ)言筆記之?dāng)?shù)據(jù)類型2因子|RVDSD的個(gè)人筆記本 1.1 因子 因子(fac...
    天涯清水閱讀 3,552評(píng)論 0 4
  • 一、基礎(chǔ) R是一種語(yǔ)法非常簡(jiǎn)單的表達(dá)式語(yǔ)言(expression language),大小寫敏感。 可以在R環(huán)境下...
    多了去的YangXuLei閱讀 2,354評(píng)論 1 3
  • 小助理已經(jīng)進(jìn)公司快一年了。 最近常常發(fā)現(xiàn)她在工作中愛說謊、狡辯。 這周一次發(fā)現(xiàn)她上班時(shí)間在工位上追劇,一次發(fā)現(xiàn)她趴...
    團(tuán)六六閱讀 190評(píng)論 0 2
  • 今天早上把昨天沒做玩的活做完了由于接車的時(shí)候沒有認(rèn)真檢查導(dǎo)致檢車的時(shí)候發(fā)現(xiàn)了個(gè)煙頭下次在干活時(shí)一定要認(rèn)真檢查這樣才...
    偶然_9101閱讀 109評(píng)論 0 0

友情鏈接更多精彩內(nèi)容