Modeling the Spread of Information on Twitter
本文利用SEIZ謠言傳播模型分析推特上的一些熱點(diǎn)事件的傳播過(guò)程,將數(shù)據(jù)與模型之間的差距進(jìn)行了最小化,并分析了正常新聞與謠言傳播的區(qū)別。
SEIZ Model
Transition Rates of SEIZ Model
(S)表示尚未聽(tīng)說(shuō)新聞的用戶(hù);(I)表示已經(jīng)在Twitter上發(fā)布消息的用戶(hù);(Z)指的是已經(jīng)聽(tīng)說(shuō)新聞但選擇不發(fā)推特的用戶(hù);(E)指的是通過(guò)推特收到消息但在發(fā)布之前花了一段時(shí)間——曝光延遲的用戶(hù)。文章定義了一個(gè)名為曝光率的參數(shù),它是進(jìn)入E狀態(tài)的概率與離開(kāi)E狀態(tài)的概率之比:
在模型被提出的文章中,改參數(shù)值對(duì)于正常新聞來(lái)說(shuō),>1,而對(duì)于謠言
<1.
新聞與謠言實(shí)例分析
SNAP以如下格式提供了所需的所有推特,使用時(shí)只需根據(jù)話題從其中提取相對(duì)應(yīng)的。
數(shù)據(jù)最終被處理為<時(shí)間,推特?cái)?shù)>的數(shù)據(jù)對(duì),時(shí)間可以是等間隔的,例如一分鐘、十五分鐘、一小時(shí)。然后通過(guò)最小化實(shí)際數(shù)據(jù)與數(shù)值預(yù)測(cè)( I 狀態(tài)節(jié)點(diǎn)數(shù))之間的誤差,來(lái)確定模型的參數(shù)。
實(shí)驗(yàn)及結(jié)果
- I(t)的準(zhǔn)確度
- 謠言檢測(cè)
- 曝光度
在SEIZ原文中,被認(rèn)為可以可以用來(lái)區(qū)分正常新聞與謠言,然而在本文中對(duì)于不同性質(zhì)的事件,我們并沒(méi)有觀測(cè)到
有任何區(qū)別,看起來(lái)它甚至是隨機(jī)的。
- 其他參數(shù)
本節(jié)試圖從最優(yōu)化后的參數(shù)中觀察得到正常新聞與謠言在傳播時(shí)表現(xiàn)出的具有一般性的差別,無(wú)果。- 估計(jì)未來(lái)推特
對(duì)于這6個(gè)事件,該模型能夠以不超過(guò)6%的錯(cuò)誤率估計(jì)未來(lái)12小時(shí)內(nèi)的tweet數(shù)量。




