用大數(shù)據(jù)分析大眾的情緒,靠譜嗎?--讀吳軍博士從硅谷的來信

用大數(shù)據(jù)分析大眾的情緒,靠譜嗎?

首先我們說一下它的意義:如果這項技術得以應用,我們將可以用它來干些什么?

1 用于民意調查。例如國家不要頒布一項法令,想要了解民眾對此的看法,例如發(fā)生了一件社會性的群體事件,國家想要了解民眾的情緒好做出對應的安撫措施。過去,我們都是直接發(fā)放調查,要知道在直接調查時,數(shù)據(jù)有時也會欺騙你的。例如:問題一:如果有人做了一件什么事,你是否會殺了他?95%的人都會回答不會。問題二:如果有人做了一件什么事,你認為他應該被殺死嗎?可能90%的人回答會。

2 了解民眾的業(yè)余時間都關心些什么。例如前段時間某寶寶的離婚事件,估計全世界都關注了2次以上,但是大眾對這件事的態(tài)度如何呢?我們可以通過大數(shù)據(jù)對民眾的情緒進行分析。

3可以了解用戶對我們產(chǎn)品的情緒。例如蘋果公司新產(chǎn)品發(fā)布了,蘋果公司會通過各大媒體網(wǎng)絡和社交平臺上民眾對于蘋果新品及其功能的評論進行收集,進而分析民眾對其產(chǎn)品的情緒。

然后,我們談論一下如何利用大數(shù)據(jù)分析民眾的情緒?簡單的講就是分類。把人的情緒分為若干類,再把互聯(lián)網(wǎng)上的數(shù)據(jù)根據(jù)內容定義為其中一類(或幾類)。具體方法有兩種:

一是監(jiān)督的機器學習:

1 手工從網(wǎng)上選取一些樣本數(shù)據(jù),手工打上情緒標簽進行分類(如高興、生氣、焦慮等),再把它們歸屬到各自的分類中。

2 再將每一類標簽的數(shù)據(jù),提煉出一些特征因子,可能是一句話、一個關鍵詞、一個表情符號或者標點符號等。也可以是表述時的句式或語法結構,每一種情緒對應的特征因子是不同的。

3 把大量從網(wǎng)絡上收集來的數(shù)據(jù),抽取特征,和情緒對應的特征因子比對,進而分析出民眾的情緒偏好。

二是非監(jiān)督的機器人:如現(xiàn)在流行的人工神經(jīng)網(wǎng)絡(Google正在做這方面的深度研究),貝耶斯網(wǎng)絡或最大熵模型都可以解決這個問題。

通過大數(shù)據(jù)分析民眾情緒的好處是,民眾在網(wǎng)絡上發(fā)表言論通常不會隱藏自己的觀點,這樣獲得信息會更準確。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容