當(dāng)兩個數(shù)據(jù)集的信息存在差異時,你會如何去找到他們的差異?其實這是一件很費時和費力的事情。在這里推薦R的daff包,daff包可以進行行和列的比較,并能找出具體哪些值變化了,添加了哪些新行(列)或刪除了哪些行(列),最主要是它能把比較的結(jié)果可視化并保存下來,我覺得這是一個非常方便和非常實用的包。
####安裝并加載包
install.packages("daff")library(daff)####生成模擬數(shù)據(jù)
mydata1<-data.frame(Name=c("P1","P2","P3","P4","P5"),col1=c(1,2,3,4,5),col2=c(11,13,14,15,17))
mydata2<-data.frame(Name=c("P1","P2","P6","P4","P5"),col1=c(1,3,3,6,9))####mydata2和mydata1相比,有哪些異同
d=diff_data(mydata1, mydata2)
d
---:表示從數(shù)據(jù)集中刪除的行,如果該符號出現(xiàn)在列上方,則表示該列已從數(shù)據(jù)集移除
+++:表示新增的行
####如果覺得看的不是很清楚,則可以將比較的結(jié)果輸出
render_diff(d)
####你可以將比較的結(jié)果輸出
out<-diff_data(mydata1,mydata2,id="Name")
write_diff(out,"F:\\compare.csv")####不用代碼保存也是可以的,如下圖所示,可以直接點擊處于兩個表中間的csv, excel, 或PDF保存。另外你可以點擊下左上方的按鈕保存為html格式

參考資料:R幫助文件
如果大家覺得今天的內(nèi)容對大家有幫助, 歡迎關(guān)注我們的公眾號哦:R語言與SPSS學(xué)習(xí)筆記

R語言與SPSS學(xué)習(xí)筆記
分享實用的SPSS及R處理數(shù)據(jù)、分析數(shù)據(jù)及做圖的使用技巧