做過一段時間的垃圾信息處理,覺得處理機制也是一件蠻有意思的事情,在此寫下自己的一些思路。 ? 持續(xù)更新中=-=
如何界定為垃圾內(nèi)容?
關鍵詞計分規(guī)則—建立關鍵詞數(shù)據(jù)庫,用戶發(fā)言時自動過濾,觸碰關鍵詞報警或刪除。
步驟1:設置不同關鍵詞分數(shù),設立自動刪除分數(shù)
步驟2:用戶發(fā)言,后臺過濾,段落中超過刪除分數(shù)警戒線則用戶可見or刪除,不超過則進入運營人員管理后臺,等二次處理。
其他:舉報
如何界定垃圾用戶
1.發(fā)言記錄累計關鍵詞總分
2.用戶注冊時間,資料信息完成度,有助判定此項條件。
對垃圾內(nèi)容/用戶的處理?
不是垃圾內(nèi)容,正常顯示
刪除發(fā)言內(nèi)容,
刪除發(fā)言者所有可疑發(fā)言內(nèi)容(防止遺漏)
拉黑發(fā)言者
拉黑發(fā)言者imei,禁止注冊
垃圾內(nèi)容&垃圾用戶
如何界定圖片中的垃圾信息?
如何處理故意用符號或錯別字避開關鍵字行為?
如何界定軟文用戶?