學(xué)習(xí)目標(biāo):數(shù)據(jù)結(jié)構(gòu)
- 在Console控制臺輸入命令,相當(dāng)于Linux命令行
- R語言中的數(shù)據(jù)框相當(dāng)于列表
1. 向量
- 向量是排列有序的一組元素,如:c(1,2,3,4,5)
2. 從向量中提取元素
數(shù)字代表索引
-
x[4]取出索引為4的元素 -
x[-4]取出除索引4**以外的其他元素 -
x[1:3]取出索引1到3的元素 -
x[-(1:3)]取出除索引1到3以外的其他元素 -
x[c(1,5)]取出索引1和5的元素
數(shù)字代表值 -
x[x==10]取出值為10的元素 x[x<0]-
x[x %in% c(1,2,5)]取出存在于向量c(1,2,5)的元素
3. 數(shù)據(jù)框
- 讀取本地文件
read.table(file = huahua.txt,sep = "\t", header = T)讀取文件,需設(shè)置file,sep和header參數(shù)。
read.table() function reads a file into data frame in table format. The file can be comma delimited or tab or any other delimiter specified by parameter "sep=". If the parameter "header=" is "TRUE", then the first row will be treated as the row names.(from Bing)
- 設(shè)置行名列名
dd = read.csv('doudou.txt') #dd讀取為數(shù)據(jù)框
colnames(dd) #查看列名
rownames(dd) #查看行名
colnames(dd)[1] = 'bioplanet'
#有的公司返回數(shù)據(jù),左上角第一格為空,R會自動補為,可用該命令修改
- 數(shù)據(jù)框的導(dǎo)出
write.table(dd, file = "sl.txt", sep = "." ,quote = F)
# 分隔符改為逗號,字符串不加雙引號(默認(rèn)字符串加雙引號)
- 變量的保存與重加載
# 這次沒有處理完的文件留著下次繼續(xù)處理的方法,格式為Rdata
save.image(file = "biosl.Rdata") # 保存當(dāng)前所有變量
save(dd, file = "test.Rdata") # 保存dd這一個變量
load("test.Rdata") #再次使用時進(jìn)行加載
- 提取數(shù)據(jù)框中的元素
dd[,y] # 提取第y列
dd$colnames # 提取第y列
- 直接使用數(shù)據(jù)框中變量
- attach方法
- with方法
備注
-
seq(1,10,by = 2)從1到10,每隔2取一個數(shù)。 -
rep(1:3,times = 2)把1,2,3重復(fù)2遍。 - 確保需要讀取的數(shù)據(jù)放在工作目錄下。
- R語言區(qū)分大小寫字母。
- R語言中腳本文件的后綴為R,可用Rstudio直接打開。
- read_csv和read_table的區(qū)別在于separator分隔符。csv是逗號分隔值(Comma-Separated Values),僅能正確讀入以 “,” 分割的數(shù)據(jù)。read_table的分隔符是tab。