學(xué)習(xí)小組day5筆記--思亮

學(xué)習(xí)目標(biāo):數(shù)據(jù)結(jié)構(gòu)

  • 在Console控制臺輸入命令,相當(dāng)于Linux命令行
  • R語言中的數(shù)據(jù)框相當(dāng)于列表

1. 向量

  • 向量是排列有序的一組元素,如:c(1,2,3,4,5)

2. 從向量中提取元素

數(shù)字代表索引

  1. x[4]取出索引為4的元素
  2. x[-4]取出索引4**以外的其他元素
  3. x[1:3]取出索引13的元素
  4. x[-(1:3)]取出索引1到3以外的其他元素
  5. x[c(1,5)]取出索引15的元素
    數(shù)字代表值
  6. x[x==10]取出值為10的元素
  7. x[x<0]
  8. x[x %in% c(1,2,5)] 取出存在于向量c(1,2,5)的元素

3. 數(shù)據(jù)框

  1. 讀取本地文件
    read.table(file = huahua.txt,sep = "\t", header = T)讀取文件,需設(shè)置file,sep和header參數(shù)。

read.table() function reads a file into data frame in table format. The file can be comma delimited or tab or any other delimiter specified by parameter "sep=". If the parameter "header=" is "TRUE", then the first row will be treated as the row names.(from Bing)

  1. 設(shè)置行名列名
dd = read.csv('doudou.txt') #dd讀取為數(shù)據(jù)框
colnames(dd)  #查看列名
rownames(dd)  #查看行名
colnames(dd)[1] = 'bioplanet' 
#有的公司返回數(shù)據(jù),左上角第一格為空,R會自動補為,可用該命令修改
  1. 數(shù)據(jù)框的導(dǎo)出
write.table(dd, file = "sl.txt", sep = "." ,quote = F)
# 分隔符改為逗號,字符串不加雙引號(默認(rèn)字符串加雙引號)
  1. 變量的保存與重加載
# 這次沒有處理完的文件留著下次繼續(xù)處理的方法,格式為Rdata
save.image(file = "biosl.Rdata")  # 保存當(dāng)前所有變量
save(dd, file = "test.Rdata") # 保存dd這一個變量
load("test.Rdata") #再次使用時進(jìn)行加載
  1. 提取數(shù)據(jù)框中的元素
dd[,y] # 提取第y列
dd$colnames # 提取第y列
  1. 直接使用數(shù)據(jù)框中變量
  • attach方法
  • with方法

備注

  1. seq(1,10,by = 2) 從1到10,每隔2取一個數(shù)。
  2. rep(1:3,times = 2) 把1,2,3重復(fù)2遍。
  3. 確保需要讀取的數(shù)據(jù)放在工作目錄下。
  4. R語言區(qū)分大小寫字母。
  5. R語言中腳本文件的后綴為R,可用Rstudio直接打開。
  6. read_csv和read_table的區(qū)別在于separator分隔符。csv是逗號分隔值(Comma-Separated Values),僅能正確讀入以 “,” 分割的數(shù)據(jù)。read_table的分隔符是tab。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容