一、入門級(jí)函數(shù)
c, nchar, data, str, dim, names, row.names, head, tail, $, mean
create變量:dataName <- c("","")
字符數(shù)量:nchar()
導(dǎo)入數(shù)據(jù):data(dataName)
print數(shù)據(jù):dataName
數(shù)據(jù)結(jié)構(gòu):str(dataName)
數(shù)據(jù)維度:dim(dataName)
列名稱:names(dataName)
行名稱:row.names(dataName)
查看頭6行:head(dataName)
查看尾6行:tail(dataName)
選擇列:dataName$colName
查看均值:mean(dataName$colName)
二、載入數(shù)據(jù)
read.csv()
dataName <- read.csv('filepath or url')
與pandas類似,需要隨時(shí)檢查驗(yàn)證數(shù)據(jù)。用str、dim、head、tail、sample。
再高級(jí)點(diǎn)的用summary、table。summary類似pd的describe,table有些類似value_counts。
三、數(shù)據(jù)子集化
常用:subset()
dataSubset() <- subset(data, yourcondition)
補(bǔ)充使用:[ ]
dataSubset() <- dataName[ROWs_conditon, COLs_condition] //行或列的選擇條件為空時(shí),表明選擇所有數(shù)據(jù)
四、保存數(shù)據(jù)
write.table()
write.table(income_total, "data/income-totals.csv", row.names=FALSE, sep=",")
注意:別忘了設(shè)置參數(shù)sep,同時(shí)row.names推薦設(shè)置為FALSE(默認(rèn)為TRUE)。
R技能高級(jí)水平資料:
使用R進(jìn)行數(shù)據(jù)轉(zhuǎn)化實(shí)例
R高級(jí)入門指南 ]
參考:
Loading Data and Basic Formatting in R | FlowingData
Quick-R: Subsetting Data