DAY5 R——兩大數(shù)據(jù)類型:向量和數(shù)據(jù)框

一. 向量

  • 向量,元素,標(biāo)量區(qū)別
    圖引自生信星球
    image.png
  • 賦值
    給變量定義就是賦值, 注意以最后一次為準(zhǔn)!注意以下常用表達(dá)
    x<-c(1,2,3) #常用的向量定義寫法,意為將x定義為由元素1,2,3組成的向量。
    x<-(1:10) #從1-10之間所有的整數(shù)
    x<-seq(1,10,by = 0.5)#1-10之間每隔0.5取一個(gè)數(shù)(注意這里是逗號不是分號)
    x<-rep(1:3,times=2) #1-3 重復(fù)2次
  • 從向量中提取元素
    1.根據(jù)元素位置
    這里的x是你剛才賦值的變量名,根據(jù)自己的情況來修改
    x[4] #x第4個(gè)元素
    x[-4]#排除法,除了第4個(gè)元素之外剩余的元素
    x[2:4]#第2到4個(gè)元素
    x[-(2:4)]#除了……
    x[c(1,5)]#第1個(gè)和第5個(gè)元素
    2.根據(jù)值的大小
    x[x==10]#等于10的元素
    x[x<0]
    x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素

二. 數(shù)據(jù)框

  • 練習(xí)時(shí)先將doudou.txt和huahua.txt數(shù)據(jù)放在RData文件夾下
  • 讀取本地?cái)?shù)據(jù)
    read.table(file = "huahua.txt",sep = "\t",header =T) #讀取文件,分隔符為Tab(點(diǎn)tab鍵可以出來seq),有表頭
    a<-read.table(file = "huahua.txt",sep = "\t",header =T)#把這個(gè)數(shù)據(jù)框賦給一個(gè)變量a
  • 設(shè)置行名和列名
    X<-read.csv('doudou.txt') #在示例數(shù)據(jù)里有doudou.txt 注意這里的變量X是一個(gè)數(shù)據(jù)框
    colnames(X) #查看列名
    rownames(X)#查看行名,默認(rèn)值的行名就是行號,1.2.3.4...
    colnames(X)[1]<-"bioplanet"#有的公司返回?cái)?shù)據(jù),左上角第一格為空,R會(huì)自動(dòng)補(bǔ)為x,用這個(gè)命令來修改
    X<-read.csv(file = "huahua.txt",sep = "\t",header =T,row.names=1)#最后row.names的意思是修改第一列為行名
    撤銷嗎: 用剛才的read.table命令重新賦值一遍就可以覆蓋了."變"量看最后一次!)
  • 數(shù)據(jù)框的導(dǎo)出
    write.table(X,file = "yu.txt",sep = ",",quote=F)#其中sep = ","是分隔符改為逗號,quote=F表示字符串不加雙引號(默認(rèn)格式帶有雙引號) ,而quote函數(shù)如果為TRUE的話則表示要帶雙引號,如果是FALSE,就像這里的quote=F表示不加雙引
  • 變量的保存與重新加載
    保存的格式是RData。
    save.image(file="bioinfoplanet.RData")#保存當(dāng)前所有變量
    save(frame1,file="frame1.RData")#保存其中一個(gè)變量
    load("frame1.RData")#再次使用RData時(shí)的加載命令
  • 提取元素
    這里的X是指的我用過的一個(gè)變量名,實(shí)際應(yīng)用要懂得替換。剛才讓師姐測試我教程的時(shí)候很擔(dān)憂你們粗暴地復(fù)制我的代碼,最后啥也沒看懂。
    X[x,y]#第x行第y列
    X[x,]#第x行
    X[,y]#第y列(橫著寫)
    X[y] #第y列(豎著寫)
    image.png

    X[a:b]#第a列到第b列
    X[c(a,b)]#第a列和第b列
    X$列名#也可以提取列(并且支持Tab自動(dòng)補(bǔ)全,不過只能提取一列,優(yōu)秀寫法)
  • 直接使用數(shù)據(jù)框中的變量
    比如要取提取列名case和values的為某兩列作散點(diǎn)圖:
    1. 方法1
    c <-data.frame(case=paste("S",c(1:50)),values=runif(50)) 這里的paste是拼接字符串的函數(shù)
    plot(c$case,c$values)
    但這里說這里這種方法有個(gè)缺點(diǎn):數(shù)據(jù)框名a在代碼中重復(fù)出現(xiàn)(此處試驗(yàn)了下沒有)
    2. 方法2(這種方法數(shù)據(jù)框名a在代碼中就不重復(fù)出現(xiàn)了)
    with(c,{
    + plot(case,values)
    x<<-summary(values) #求和并賦值給x,<<的意思是作為全局變量,也就是出了with循環(huán)仍有效。
    })
    什么是with循環(huán)? 如下百度感覺很形象
    image.png

    全局變量含義?
    函數(shù)內(nèi)部的變量通常為局部變量,可以通過 <<- 賦值,成為全局變量,這樣就可以在其他函數(shù)中被調(diào)用。

三.其他注意TIP

  • 腳本窗口使用
    新建腳本,并在里面打代碼/粘貼大神代碼。然后保存到RDATA工作目錄下,打開,注意腳本文件的后綴就是R

    image.png

  • 在哪看變量
    引自生信星球

    image.png

  • 其他潛意識小tip
    來自生信星球的大神總結(jié)
    (1)R的賦值符號不是等號,而是<-
    (2)在Console 控制臺輸入命令,相當(dāng)于Linux的命令行
    (3)R的代碼都是帶括號的,括號必須是英文的。
    (4)顯示工作路徑 getwd()
      設(shè)置工作路徑setwd("C:/Users/kingjie/Desktop/Rdata")
    (5)向量是由元素組成的,元素可以是數(shù)字或者字符串。
    (6)表格在R語言中改名叫數(shù)據(jù)框_
    (7)別只復(fù)制代碼,要理解其中的命令、函數(shù)的意思。函數(shù)或者命令不會(huì)用時(shí),除了百度/谷歌搜索以外,用這個(gè)命令查看幫助:?read.table,調(diào)出對應(yīng)的幫助文檔,翻到example部分研究一下。
    (8)數(shù)據(jù)類型(兩重點(diǎn))
    向量(vector),矩陣(Matrix),數(shù)組(Array),數(shù)據(jù)框(Data frame),List

image.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容