挖掘顧客評論(摘要型,非主題)
關鍵字:文本挖掘,情感分類,摘要,評論
電商的發(fā)展積累了成千上萬的用戶評論和意見,但依然
海量的評論使得潛在客戶很難捕獲到關鍵決策購買信息
對于商家或商戶也很難跟蹤用戶反饋和想法
本篇論文只關注挖掘顧客已表達的意見內容以及其情感極性(并不是以子集,子句的方式來重寫表述) 實現(xiàn)步驟(pipeline)
1. 挖掘顧客提到的產品特征
2. 特征的情感極性判斷
3. 整合上述內容,形如下圖

該論文目標
按我的理解,其實這也是電商平臺(阿里天池比賽中出現(xiàn)過很多次)商品情感分類的通用三元組
商品-特征-好壞(或情感詞) ?,但是論文中的結構化表示形式不僅對顧客,對廠商都更友好
1. 句子情感分類-但這種方式存在很大局限:相較于評論,句子包含的信息要少得多
? ? 所以論文作者在這篇文章的主要工作區(qū)別于此是:a. 不是將評論看作一個整體做情感分類,一條 ? ? ? ? ? ? ? 評論一般來說,即會包含某個特征的正向情感,也會包含某個特征的負向情感 b. ?情感分類并沒有挖掘出商品的特征 c. 該工作不需要大量預料支持
2. 主題風格分類
與本文目的更為相近的是 句子主題分類并分析出客戶的某個表示是客觀的還是主觀的,但依然,這些工作依然沒有找到哪些特征上的哪些客觀觀點
3. 情感分類
通過外部搜索以及標注來對文章進行情感分類
4. 文本摘要
大致介紹了下文本摘要的兩種分類:生成式和抽取式。但是文本摘要的主要目的還是抽取文章間的相似與不同點

PIPELINE
1. part-of-Speech Tagging
? ? 利用NLProcessor 對句子進行分詞及詞性標注