R第十天

一/數(shù)據(jù)集的合并

(一)、Merge函數(shù)

merge(a,b,by = '列名',by.x,by.y,all=True) ——a,b是合并的數(shù)據(jù)框,by按什么合并,all是否保留所有行,all.x=True是a中所有行,b中匹配的行 all.y=True是b中所有的行,a中匹配的行?

(二)、cbind函數(shù)

cbind(a,b)——縱向鏈接兩個數(shù)據(jù)框,行相同

(三)、rbind函數(shù)

rbind(a,b)——橫向鏈接兩個數(shù)據(jù)框,列相同

(四)、duplicated(h)——返回邏輯值,看是否前面有相同的行 h[!duplicated(h),]返回沒重復(fù)的行

(五)、排序函數(shù)

sort(age)——對age數(shù)列,從小到大排序

sort(age,decreasing=T)——從大到小排序

order(age)——從小到大排序返回每個的索引

rank(age)——返回序列每個值排第幾

怎么按某列從小到大排序呢?數(shù)據(jù)集[order,]

sort(x,na.last=T)——讓缺失值排最后 若F則排最前 若NA則直接刪掉

t(a)——對a轉(zhuǎn)置

(六)、aggregate函數(shù)

aggregate(處理的列,by = list(),算法)——按list分類對列求均值

(七)、抽樣函數(shù)

sample(1:100,10)——在1到100抽10個數(shù)

sample(letters[1:20],10,replace=T)——有放回抽樣,replace默認(rèn)F

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • pyspark.sql模塊 模塊上下文 Spark SQL和DataFrames的重要類: pyspark.sql...
    mpro閱讀 9,932評論 0 13
  • rljs by sennchi Timeline of History Part One The Cognitiv...
    sennchi閱讀 7,872評論 0 10
  • Spark SQL, DataFrames and Datasets Guide Overview SQL Dat...
    草里有只羊閱讀 18,562評論 0 85
  • 看到一篇公眾號文章《你95%的勤奮,都在浪費時間》,頗為感觸。 比如學(xué)生時代: “上課專心聽講記筆記,生怕錯過任何...
    夢之郎閱讀 417評論 1 1
  • 說起麻五,大家千萬別以為人長得難看,其實麻五是很英俊的型男,只因家中兄弟多,排行老五而取名麻五。 ...
    泌園寒香閱讀 2,527評論 0 1

友情鏈接更多精彩內(nèi)容