- 向量
R中向量是指一維的對(duì)象,格式需要統(tǒng)一,只能是數(shù)值型或字符型或邏輯型
創(chuàng)建向量用c
案例:
x <- c(1,2,3,4,5,6)
y <- c('p','y','t','h','o','n')
z <- c(True,False,True,True)
向量引用:可以用位置進(jìn)行引用,案例:x[2] 結(jié)果是2;支持多個(gè)位置引用 x[c(1,3)] 結(jié)果是1,3,或者y[1:2] 結(jié)果是‘p’,‘y’ - 矩陣
矩陣是二維的,格式需要統(tǒng)一,即每個(gè)模式都需要有相同模式,要么是數(shù)值型,要么是字符型,要么是邏輯型
創(chuàng)建矩陣:
mymatrix <- matrix(vector,nrow=num of row,ncol = num of col,byrow = logical_value,dimnames=list(rowname,colname))
案例:
c1 <- c(1:20)
mymatrix <- matrix(1:200,20,5,true,dimnames=list(1:20,1:5)))
引用:
用中括號(hào)按下標(biāo)引用,:表示引用全部,如mymatrix[:1]就是引用第一列的所有行
還可以引用多個(gè),
如:mymatrix[1,c(1,5)]
結(jié)果顯示:1,5
- 數(shù)組array
數(shù)組是多維的矩陣,維度可以大于2
創(chuàng)建:
myarray =myarray = array(1:27, c(3,3,3),dimnames = list(1:3,1:3,1:3))
引用:
按下標(biāo)引用,與矩陣相似
- 數(shù)據(jù)框dataframe
是最有用的數(shù)據(jù)結(jié)構(gòu)。同一個(gè)數(shù)據(jù)框可以存儲(chǔ)不同的數(shù)據(jù)類型。比如想要存儲(chǔ)房?jī)r(jià)信息的dataframe,里面要存儲(chǔ)購(gòu)房人姓名(字符型),性別(字符型,分類型數(shù)據(jù)),房子類型(等級(jí)1,等級(jí)2……等,字符型,有序型數(shù)據(jù)),這些可以存儲(chǔ)到同一個(gè)數(shù)據(jù)框里,存儲(chǔ)后的外觀和通常所說(shuō)的表格相似。例如:
有一點(diǎn)需要注意的是,數(shù)據(jù)框各列必須是同類型
創(chuàng)建:
df <- data.frame(col1,col2,col3,col4)
案例:
name <-c('張三','李四','二麻子')
age <- c(28,31,29)
sex <- c('男','女','男')
type <- c('level1','level1','level2')
df <- data.frame(name,age,sex,type)
引用:
數(shù)據(jù)框引用可以用下標(biāo)df[2],可以選列名df(c(name,type)),還可以用df$name
其中$引用,要每次都添加數(shù)據(jù)框名字,那么在引用很多次的時(shí)候就會(huì)很麻煩,所以為了引用方便,用attach(df)/detach(df)函數(shù),達(dá)到可以在兩句中間引用列名就可定位到該數(shù)據(jù)框的列名的目標(biāo),原理是把數(shù)據(jù)框名放入搜索路徑中,因而省略df(數(shù)據(jù)框名)也能定位到該數(shù)據(jù)框。
上述函數(shù)在全局內(nèi)有重復(fù)變量的時(shí)候,就會(huì)混淆;同樣的功能我們更常用with函數(shù),with(df,{具體應(yīng)用}),賦值僅在小括號(hào)中才能使用
實(shí)例標(biāo)識(shí)符,我現(xiàn)在用不到,先不看,反正是定義數(shù)據(jù)框的時(shí)候多寫一個(gè):rowname = ***
5.因子
變量分為名義型,有序型,連續(xù)型變量。其中名義型變量是沒(méi)有順序的,比如男女,沒(méi)有先后的順序。有序型變量是有一定順序,比如滿意,比較滿意,非常滿意,可以有一定的順序給他們定義。這兩類變量在R里稱為因子,可以對(duì)他們賦值
創(chuàng)建:
diabetes <- c("type1","type2","type2","type1")
diabetes <- factor(diabetes,ordered=TRUE,levels = c(1,2))
不太懂。。。。不想看了