在進(jìn)行數(shù)據(jù)分析的過程中,我們常常會(huì)根據(jù)不同變量做去重處理,有單一變量和多變量處理兩種情況
單一變量去重
result <-rawdata[!duplicated(rawdata$Topic),]
result <-rawdata[unique(rawdata$Topic),]
使用這兩種方法,獲得的結(jié)果是一樣的,其中rawdata[XXXXX,]的作用是提取選中的行數(shù)據(jù),同理,rawdata[,XXXXX]則是提取選中的列數(shù)據(jù)
unique() 和 !duplicated() 是提取去重后的所在行的相關(guān)變量
多變量去重
按照Topic以及Sentiment進(jìn)行去重,方法如下,該方法適用于>=2以上的參數(shù)進(jìn)行去重
result<-rawdata[!duplicated(rawdata[,c('Topic','Sentiment')]),]