如何比較并快速找出兩個數(shù)據(jù)集的異同?

當(dāng)兩個數(shù)據(jù)集的信息存在差異時,你會如何去找到他們的差異?其實這是一件很費時和費力的事情。在這里推薦R的daff包,daff包可以進行行和列的比較,并能找出具體哪些值變化了,添加了哪些新行(列)或刪除了哪些行(列),最主要是它能把比較的結(jié)果可視化并保存下來,我覺得這是一個非常方便和非常實用的包。

####安裝并加載包

install.packages("daff")
library(daff)

####生成模擬數(shù)據(jù)

mydata1<-data.frame(Name=c("P1","P2","P3","P4","P5"),col1=c(1,2,3,4,5),col2=c(11,13,14,15,17))
mydata2<-data.frame(Name=c("P1","P2","P6","P4","P5"),col1=c(1,3,3,6,9))

####mydata2和mydata1相比,有哪些異同

d=diff_data(mydata1, mydata2)
d

---:表示從數(shù)據(jù)集中刪除的行,如果該符號出現(xiàn)在列上方,則表示該列已從數(shù)據(jù)集移除

+++:表示新增的行

####如果覺得看的不是很清楚,則可以將比較的結(jié)果輸出

render_diff(d)

####你可以將比較的結(jié)果輸出

out<-diff_data(mydata1,mydata2,id="Name")
write_diff(out,"F:\\compare.csv")

####不用代碼保存也是可以的,如下圖所示,可以直接點擊處于兩個表中間的csv, excel, 或PDF保存。另外你可以點擊下左上方的按鈕保存為html格式

參考資料:R幫助文件

如果大家覺得今天的內(nèi)容對大家有幫助, 歡迎關(guān)注我們的公眾號哦:R語言與SPSS學(xué)習(xí)筆記


R語言與SPSS學(xué)習(xí)筆記
分享實用的SPSS及R處理數(shù)據(jù)、分析數(shù)據(jù)及做圖的使用技巧

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容