數(shù)據(jù)結(jié)構(gòu)
Part 1 向量 Vector
1.向量賦值
1.1 使用c函數(shù) x <- c(1,2,3)
1.2 使用:取區(qū)間x <- 1:3
1.3 使用seq函數(shù)在1到10之間以步長為1取用數(shù)字
x <- seq(1,10,by=1)
1.4 使用rep函數(shù)將1-3重復(fù)三次
x <- rep(1:3,3)
2.取用向量的元素
2.1 根據(jù)下標(biāo)取用
x[4]
x[-4]#獲取除了第四個元素外的元素
x[-(2:4)]#獲取除了第2至第4之外的元素,要加括號
x[c(1,4)]#獲取第一個和第四個元素
2.2 根據(jù)元素值取用
x[x==10]#等于10的元素
x[x < 0]#小于0的元素
x[x %in% c(1,2,5)]#存在于向量(1,2,5)中的元素
- “=”是賦值,而“==” 是等于
Part 2 數(shù)據(jù)框 Data frame
1 讀取本地?cái)?shù)據(jù)
1.1 使用a <- read.table(file= "huahua.txt",sep ="\t",header= T)

read.csv

read.table
.csv是非常好的數(shù)據(jù)文件格式,跨平臺支持非常好,在Excel或者SPSS中創(chuàng)建的數(shù)據(jù),只要存為csv格式,就可以使用幾乎任何數(shù)據(jù)處理軟件對這些數(shù)據(jù)進(jìn)行處理了。
read.csv和read.table不同的是的默認(rèn)參數(shù)有別,table默認(rèn)不接受缺失值。
- \t :橫向制表(HT) (跳到下一個TAB位置)
- sep: 指定分隔符,默認(rèn)是空格
- header: 判斷數(shù)據(jù)文件中第一行是不是標(biāo)題
2 設(shè)置行名和列名
X <- read.csv('doudou.txt')
colnames(X)#查看列名
rownames(X)#查看行名
colnames(X)[1] <- "MOU" #修改左上角第一格為某
X<- read.csv(file="huahua.txt",sep=" ",header=T,row.names=1)
3 導(dǎo)出數(shù)據(jù)框
write.table(變量,file="文件名",sep=",",quote=F)#改分割符號為逗號,字符去除雙引號

4 變量保存與重新加載
- 保存格式為RData
4.1 保存所有變量
save.image("文件名")
4.2 保存一個變量
save(變量名,file="文件名")
4.3 加載變量
load("文件名")
5 提取數(shù)據(jù)框的元素
- 數(shù)據(jù)框以列為大單位
5.1 提取1行2列
a[1,2]
5.2 提取第1行
a[1,]
5.3 提取第2列
a[2]
a[,2]
a[1:3] #提取1到3列
a[c(1,3)] #提取1,3列
a$name #根據(jù)列名提取該列
6 使用數(shù)據(jù)框中的變量做散點(diǎn)圖
6.1 使用賦值和plot函數(shù)
a <-data.frame(case=paste("S",1:50),values=runif(50))
plot(a$case,a$values)

paste函數(shù)將參數(shù)轉(zhuǎn)換為字符串并連接,字符串之間用seq間隔分開。
6.1 使用attach函數(shù)
- attach()是對數(shù)據(jù)框/列表添加路徑索引,避免重復(fù)輸入名稱。
- detach()是撤銷attach()建立的路徑索引,往往二者配套使用。
attach(a)
plot(case,values)

attach
6.2 使用with函數(shù)
with(a,{
plot(case,values)
x<<-sum(values) #求和并賦值給x
})
x #運(yùn)行完后打印x
- <<的意思是作為全局變量,也就是出了大括號仍有效。
-
小括號()定義函數(shù)的參數(shù),在運(yùn)算中作為優(yōu)先級
中括號 [] 用做對象的元素索引
大括號{} 作為代碼段落的起止
with - with函數(shù)可以將所有操作(expr)局限于(data)中,避免多次輸入變量名。
7 保存腳本
-
通過快捷鍵Ctrl+Shift+N新建腳本并將with函數(shù)敲進(jìn)去后保存。
with
問題
-
save(X,file="test.RData")遇到X報(bào)錯說明變量X不存在,通過load()函數(shù)載入變量。


