Mining and Summarizing Customer Reviews

挖掘顧客評論(摘要型,非主題)

關鍵字:文本挖掘,情感分類,摘要,評論


background

電商的發(fā)展積累了成千上萬的用戶評論和意見,但依然

海量的評論使得潛在客戶很難捕獲到關鍵決策購買信息

對于商家或商戶也很難跟蹤用戶反饋和想法

本篇論文只關注挖掘顧客已表達的意見內容以及其情感極性(并不是以子集,子句的方式來重寫表述) 實現(xiàn)步驟(pipeline)

1. 挖掘顧客提到的產品特征

2. 特征的情感極性判斷

3. 整合上述內容,形如下圖

其中individual-review-sentences會指向一個最鮮明的或者全部評論

該論文目標

按我的理解,其實這也是電商平臺(阿里天池比賽中出現(xiàn)過很多次)商品情感分類的通用三元組

商品-特征-好壞(或情感詞) ?,但是論文中的結構化表示形式不僅對顧客,對廠商都更友好


Ralated-work

1. 句子情感分類-但這種方式存在很大局限:相較于評論,句子包含的信息要少得多

? ? 所以論文作者在這篇文章的主要工作區(qū)別于此是:a. 不是將評論看作一個整體做情感分類,一條 ? ? ? ? ? ? ? 評論一般來說,即會包含某個特征的正向情感,也會包含某個特征的負向情感 b. ?情感分類并沒有挖掘出商品的特征 c. 該工作不需要大量預料支持

2. 主題風格分類

與本文目的更為相近的是 句子主題分類并分析出客戶的某個表示是客觀的還是主觀的,但依然,這些工作依然沒有找到哪些特征上的哪些客觀觀點

3. 情感分類

通過外部搜索以及標注來對文章進行情感分類

4. 文本摘要

大致介紹了下文本摘要的兩種分類:生成式和抽取式。但是文本摘要的主要目的還是抽取文章間的相似與不同點


pipeline


PIPELINE

1. part-of-Speech Tagging

? ? 利用NLProcessor 對句子進行分詞及詞性標注

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

  • 論文介紹 這是一篇發(fā)表于2004年的論文,據(jù)說該論文開創(chuàng)了用戶評論情感分析的先河,作為電子商務網站的后臺功能的一部...
    0_oHuanyu閱讀 574評論 0 0
  • 轉載請聲明出處。到這里才發(fā)現(xiàn)簡書不支持Mathjax,真蛋疼,要看公式的話還是到我的博客上看,留言就在這里留吧,我...
    TonLP閱讀 2,810評論 0 6
  • 據(jù)師父所說,每個人,生活在各自的因緣中,緣來緣去,構成了現(xiàn)在的“我”。我把這句話理解為:每個人,都...
    柒悠然閱讀 398評論 0 2
  • 今天在學校里我寫了一大部分作業(yè),回到家只剩下最后一個作業(yè)了,那就是抄寫歇后語一遍,我抄完之后又和我弟弟玩了一會兒我...
    旭庭閱讀 152評論 0 1
  • 四三班 曹仕軒 從前,有一個小石匠,他常常被老板責罵。所以他準備出去闖世界,碰碰運氣。 他走到了一...
    艾娜li閱讀 564評論 0 2

友情鏈接更多精彩內容