Day5-郭妞-數(shù)據(jù)結(jié)構(gòu)

資料來源于生信星球

給新手小白的一些重要信息
(1)R的賦值符號不是等號,而是<-
(2)在Console 控制臺(tái)輸入命令,相當(dāng)于Linux的命令行
(3)R的代碼都是帶括號的,括號必須是英文的。
(4)顯示工作路徑 getwd()
(5)向量是由元素組成的,元素可以是數(shù)字或者字符串。
(6)表格在R語言中改名叫數(shù)據(jù)框_
(7)別只復(fù)制代碼,要理解其中的命令、函數(shù)的意思。函數(shù)或者命令不會(huì)用時(shí),除了百度/谷歌搜索以外,用這個(gè)命令查看幫助:`?read.table·,調(diào)出對應(yīng)的幫助文檔,翻到example部分研究一下。
(8)數(shù)據(jù)類型(重點(diǎn)只有兩個(gè),剩下的不看)

- 向量(vector)??重要
- 矩陣(Matrix)
- 數(shù)組(Array)
- 數(shù)據(jù)框(Data frame)??重要
- List

第一部分:向量

1、標(biāo)量和向量的區(qū)分

首先明確“元素”的意思,元素用chr表示,指的是數(shù)字或者字符串等,根據(jù)它可以區(qū)分兩個(gè)詞:
標(biāo)量:一個(gè)元素組成的變量
向量:多個(gè)元素組成的變量
(補(bǔ)充:一個(gè)向量是一排有序排列的元素,以后會(huì)用到把一個(gè)向量作為數(shù)據(jù)框中的一列的情況。)



使用的時(shí)候,直接給變量定義就是“賦值”,字面意思是賦予這個(gè)變量一個(gè)數(shù)值(其實(shí)也不一定是數(shù)值,還可以是字符串/數(shù)據(jù)框等等)。
例子:

x<- c(1,2,3) #常用的向量寫法,意為將x定義為由元素1,2,3組成的向量。
x
x<- 1:10 #從1-10之間所有的整數(shù)
x
x<- seq(1,10,by = 0.5) #1-10之間每隔0.5取一個(gè)數(shù)(注意是逗號不是分號)
x
x<- rep(1:3,times=2) #1-3 重復(fù)2次
x

tips:
1.如果你把這幾行代碼都打過了,那么x就被你賦值了4次,結(jié)果就是,第一次賦值被第二次的覆蓋了,第二次的賦值又被第三次的覆蓋了,以此類推,以最后一次為準(zhǔn)哦。

2、從向量中提取元素

  • 根據(jù)元素位置
#這里的x是你剛才賦值的變量名,根據(jù)自己的情況來修改
x[4] #x第4個(gè)元素
x[-4]#排除法,除了第4個(gè)元素之外剩余的元素
x[2:4]#第2到4個(gè)元素
x[-(2:4)]#除了第2-4個(gè)元素
x[c(1,5)] #第1個(gè)和第5個(gè)元素
  • 根據(jù)值
x[x==10]#等于10的元素
x[x<0]
x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素

R語言運(yùn)算符
鏈接:R語言教程

第二部分:數(shù)據(jù)框

讀取的文件一定要放在對應(yīng)的工作目錄下

1、讀取本地?cái)?shù)據(jù)

read.table(file = "huahua.txt",sep = "\t",header = T)
a <- read.table(file = "huahua.txt",sep = "\t",header = T)

2、設(shè)置行名和列名

-read.csv('doudou.txt') #在示例數(shù)據(jù)里有doudou.txt 注意這里的變量X是一個(gè)數(shù)據(jù)框
colnames(X) #查看列名
rownames(X) #查看行名,默認(rèn)值的行名就是行號,1.2.3.4...
colnames(X)[1]<-"bioplanet"#有的公司返回?cái)?shù)據(jù),左上角第一格為空,R會(huì)自動(dòng)補(bǔ)為x,用這個(gè)命令來修改
X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)#最后row.names的意思是修改第一列為行名

3、數(shù)據(jù)框的導(dǎo)出

write.table(X,file = "yu.txt",sep = ",",quote=F)#分隔符改為逗號,字符串不加雙引號(默認(rèn)格式帶由雙引號) 

4、變量的保存與重新加載

這次沒有處理完的數(shù)據(jù)下次想接著用怎么辦?--學(xué)會(huì)保存和重新加載。保存的格式是RData。
save.image(file="bioinfoplanet.RData")#保存當(dāng)前所有變量
save(X,file="test.RData")#保存其中一個(gè)變量
load("test.RData")#再次使用RData時(shí)的加載命令

5、提取元素

- X[x,y]#第x行第y列
- X[x,]#第x行
- X[,y]#第y列
- X[y] #也是第y列
- X[a:b]#第a列到第b列
- X[c(a,b)]#第a列和第b列
- X$列名#也可以提取列(優(yōu)秀寫法,而且這個(gè)命令還優(yōu)秀到不用寫括號的地步,并且支持Tab自動(dòng)補(bǔ)全哦,不過只能提取一列)

注:這里的變量X,在實(shí)際應(yīng)用中,要根據(jù)自己的變量名進(jìn)行替換。

問題:可能是變量名大小寫不對,也可能是這個(gè)變量不存在。
總結(jié):非常艱難的練完了課程中涉及到的東西,還要多練習(xí)幾遍,才能熟悉,總之加油吧。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容