主講人:王成軍,來(lái)自南京大學(xué)新聞傳播學(xué)院計(jì)算傳播學(xué)實(shí)驗(yàn)中心,Ogilvy數(shù)據(jù)實(shí)驗(yàn)室主任,以及計(jì)算傳播、Web挖掘聯(lián)合研究體成員。多篇計(jì)算傳播學(xué)文章發(fā)表在SCI以及SSCI雜志上,包括Scientific Reports、PLoS ONE、PhysicaA、Cyberpsychology等。
課程鏈接:《計(jì)算傳播學(xué)簡(jiǎn)介》,來(lái)自集智學(xué)園,課時(shí)60分鐘。
課程背景:
AI時(shí)代,每一秒鐘,整個(gè)互聯(lián)網(wǎng)上就有 60 萬(wàn)條信息在 Facebook 上分享,2 億個(gè) Email、10 萬(wàn)條 推文被發(fā)送,571 個(gè)新網(wǎng)站被建立,1.9E(1018)字節(jié)數(shù)據(jù)被交換[1]。海量的信息不斷涌現(xiàn), 但是全球的互聯(lián)網(wǎng)用戶總數(shù)卻僅有 30 多億(截止到 2014 年底)。每個(gè)人的注意力是有限的,我們應(yīng)該如何巧妙地穿透注意力的壁壘,讓信息精準(zhǔn)地傳遞到我們的目標(biāo)受眾?計(jì)算傳播學(xué)會(huì)給你答案。計(jì)算傳播是指數(shù)據(jù)驅(qū)動(dòng)的、借助于人工智能,及其可計(jì)算方法所進(jìn)行的傳播過(guò)程,而分析計(jì)算傳播現(xiàn)象的研究領(lǐng)域就是計(jì)算傳播學(xué)。本課程嘗試介紹計(jì)算傳播的起源、概念和應(yīng)用,然后從計(jì)算社會(huì)科學(xué)的角度對(duì)計(jì)算傳播學(xué)的理論脈絡(luò)進(jìn)行了介紹,同時(shí)介紹了一些計(jì)算傳播學(xué)研究的例子,總結(jié)計(jì)算傳播學(xué)研究中存在的從數(shù)據(jù)到模式,再?gòu)哪J降綑C(jī)制的研究思路,最后討論一下可能的發(fā)展方向。
1. 計(jì)算傳播學(xué)簡(jiǎn)介
計(jì)算傳播是數(shù)據(jù)驅(qū)動(dòng)的,借助于計(jì)算方法所進(jìn)行的傳播過(guò)程,而分析計(jì)算傳播現(xiàn)象的研究領(lǐng)域的即計(jì)算傳播學(xué),應(yīng)用上比如數(shù)據(jù)新聞、計(jì)算廣告、媒體推薦系統(tǒng)等。作為一個(gè)嶄新的研究領(lǐng)域,計(jì)算傳播學(xué)是先有業(yè)界的實(shí)踐,而后學(xué)界經(jīng)思考誕生,它的提出和發(fā)展,是計(jì)算傳播產(chǎn)業(yè)應(yīng)用推動(dòng)的。以互聯(lián)網(wǎng)為例,互聯(lián)網(wǎng)之所以能為大家提供各種免費(fèi)的服務(wù),核心的原因就是計(jì)算廣告為企業(yè)創(chuàng)造了收入,計(jì)算傳播在背后扮演著金主的作用。
先了解一下計(jì)算傳播學(xué)在業(yè)界的應(yīng)用。Netflix最初以郵寄電影光盤(pán)作為商業(yè)模式,這種郵寄光盤(pán)模式的影視傳播本身就是一個(gè)數(shù)據(jù)驅(qū)動(dòng)的過(guò)程。比如用戶的持續(xù)使用行為與郵寄時(shí)間的長(zhǎng)短強(qiáng)相關(guān),如果用戶對(duì)郵寄時(shí)間并不敏感,則倉(cāng)庫(kù)可建在郊區(qū),因此倉(cāng)庫(kù)的地理位置必須通過(guò)對(duì)真實(shí)用戶數(shù)據(jù)的計(jì)算才能決定。而后Netflix從郵寄光盤(pán)轉(zhuǎn)型為流媒體,收集了豐富的用戶觀影數(shù)據(jù)并基于此建立推薦系統(tǒng)。
還比如谷歌的搜索引擎,最根本的技術(shù)在于PageRank算法,而這一算法的基本優(yōu)化目標(biāo)是通過(guò)計(jì)算評(píng)估每一個(gè)網(wǎng)頁(yè)的傳播價(jià)值,最終搜素結(jié)果的效果和質(zhì)量更高了,使得谷歌超過(guò)了早期基于信息檢索系統(tǒng)的搜索引擎。這個(gè)過(guò)程便利了用戶的注意力流動(dòng),影響了媒介接觸,傳播效果更好。
算法的背后,最重要的驅(qū)動(dòng)因素就是數(shù)據(jù),數(shù)據(jù)主要來(lái)自于人類(lèi)使用數(shù)字媒體時(shí)記錄下來(lái)的數(shù)字痕跡。用戶打電話、發(fā)短信、瀏覽網(wǎng)頁(yè)、觀看數(shù)字電視、微信朋友圈……所有的這些行為都可以被詳細(xì)記載,形成用戶屬性數(shù)據(jù)和行為數(shù)據(jù),進(jìn)而做進(jìn)一步的分析和研究。
有了數(shù)據(jù)之后,需要有合適的計(jì)算方法對(duì)數(shù)據(jù)進(jìn)行分析,計(jì)算方法使得沉睡的數(shù)據(jù)寶藏覺(jué)醒。傳統(tǒng)的有社會(huì)統(tǒng)計(jì)方法,而針對(duì)大規(guī)模的互聯(lián)網(wǎng)數(shù)據(jù),又發(fā)展了一些新的計(jì)算方法,比如機(jī)器學(xué)習(xí)(深度學(xué)習(xí))、自然語(yǔ)言處理;數(shù)學(xué)方法如數(shù)學(xué)建模、數(shù)值模擬;物理方法如建立物理模型;計(jì)算機(jī)仿真方法如多主體建?!麄€(gè)計(jì)算機(jī)方法變得更為豐富和多樣。
同時(shí),計(jì)算方法需要深入到模型的高度,才能發(fā)揮更好的作用。以谷歌為例,谷歌放棄了將一個(gè)個(gè)網(wǎng)頁(yè)看作是孤島的思維方式,將網(wǎng)頁(yè)當(dāng)作節(jié)點(diǎn),節(jié)點(diǎn)之間通過(guò)超鏈接(hyperlink)連接起來(lái),一個(gè)網(wǎng)頁(yè)指向另一個(gè)網(wǎng)頁(yè)其實(shí)就是在投票,節(jié)點(diǎn)的重要性來(lái)自于網(wǎng)頁(yè)之間的投票,PageRank算法本質(zhì)是一個(gè)嶄新的網(wǎng)絡(luò)模型。
2. 引入計(jì)算社會(huì)科學(xué)的視角
2009年,發(fā)表在science上面的一篇論文:Lazer et al(2009)Computation social science,提出一個(gè)嶄新的領(lǐng)域:計(jì)算社會(huì)科學(xué)——它以網(wǎng)絡(luò)科學(xué)作為研究視角,收集大規(guī)模的數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行分析,好處是能夠揭示個(gè)體和群體行為的模式。
早在2007年,計(jì)算社會(huì)科學(xué)的領(lǐng)軍人物、網(wǎng)絡(luò)科學(xué)的研究者D. Watts在Nautre上發(fā)表論文:二十一世紀(jì)的科學(xué),它所指的二十一世紀(jì)科學(xué)就是計(jì)算社會(huì)科學(xué)。D. Watts認(rèn)為社會(huì)現(xiàn)象之所以是最難解決的科學(xué)問(wèn)題之一,在于社會(huì)現(xiàn)象中卷入了海量的異質(zhì)性個(gè)體以及個(gè)體之間復(fù)雜的互動(dòng)。而現(xiàn)在能夠更好地對(duì)社會(huì)現(xiàn)象進(jìn)行研究,是因?yàn)榛ヂ?lián)網(wǎng)讓我們有了針對(duì)人類(lèi)行為的海量數(shù)據(jù)記錄、基于互聯(lián)網(wǎng)的實(shí)驗(yàn)以及互聯(lián)網(wǎng)公司與研究。
If handled appropriately, data about Internet-based communication and interactivity could revolutionize our understanding of collective human behavior.
采用計(jì)算社會(huì)科學(xué)的研究視角,有很多有趣的應(yīng)用。
比如根據(jù)Facebook數(shù)據(jù)研究選舉行為是否可以通過(guò)社交網(wǎng)絡(luò)傳染,即朋友投給誰(shuí)是否會(huì)影響你;通過(guò)研究電信網(wǎng)絡(luò),計(jì)算網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)傳播的多樣性,再跟當(dāng)?shù)亟?jīng)濟(jì)社會(huì)地位做關(guān)聯(lián),可以發(fā)現(xiàn)傳播的多樣性會(huì)制約當(dāng)?shù)厣鐣?huì)經(jīng)濟(jì)的發(fā)展;對(duì)人類(lèi)語(yǔ)言、文本進(jìn)行研究,采用自然語(yǔ)言處理的方法做分析,比如做情感分析,會(huì)發(fā)現(xiàn)在感恩節(jié)、情人節(jié)等節(jié)日人們都比較快樂(lè),而明星去世、911慶典等人們會(huì)比較悲傷。進(jìn)一步,人的情感狀態(tài)又會(huì)對(duì)股票市場(chǎng)的漲落有影響,就可以用來(lái)預(yù)測(cè)股票市場(chǎng)的漲跌;對(duì)Google相關(guān)搜索詞累積并建立時(shí)間序列,抽取相關(guān)詞語(yǔ)建立機(jī)器學(xué)習(xí)模型進(jìn)行預(yù)測(cè),如根據(jù)感冒相關(guān)的搜索詞進(jìn)行流感的預(yù)測(cè)Google Flu Trend。
以上這些應(yīng)用引發(fā)了對(duì)計(jì)算傳播學(xué)的另一種定義:計(jì)算傳播學(xué)是計(jì)算社會(huì)科學(xué)的一個(gè)分支,采用計(jì)算社會(huì)科學(xué)的研究視角、方法、理論、框架來(lái)思考和研究問(wèn)題,致力于采用計(jì)算方法和大規(guī)模的數(shù)據(jù)分析人類(lèi)傳播行為中的重要問(wèn)題。
3. 計(jì)算傳播學(xué)關(guān)注的問(wèn)題
對(duì)于計(jì)算傳播學(xué),備受關(guān)注的有四個(gè)焦點(diǎn)問(wèn)題。①計(jì)算傳播本身是否真的有比較好的預(yù)測(cè)效果;②計(jì)算傳播如何推動(dòng)大問(wèn)題、大理論、大數(shù)據(jù)的融合,能否幫助理解復(fù)雜的人類(lèi)群體行為;③計(jì)算方法在傳播學(xué)研究中是如何應(yīng)用的;④如何將計(jì)算傳播應(yīng)用于實(shí)踐或者說(shuō)如何發(fā)揮其商業(yè)價(jià)值。
a. 傳播學(xué)可計(jì)算性和可預(yù)測(cè)性
看回傳播效果測(cè)量的例子,對(duì)于傳播效果的測(cè)量更多的是短期效果,因?yàn)閷?duì)于長(zhǎng)期效果難以測(cè)量。以新聞擴(kuò)散研究為例,所研究的議題往往是總統(tǒng)遇刺等突發(fā)的重大新聞事件,如Miller(1945)《一個(gè)大眾傳播研究筆記:我們的社區(qū)怎樣指導(dǎo)羅斯福總統(tǒng)的死訊》,研究者采用問(wèn)卷調(diào)查的方式請(qǐng)采訪者回憶并填寫(xiě)相應(yīng)情況。這種研究存在很多問(wèn)題:調(diào)查的范圍有限、突發(fā)事件不能事先做準(zhǔn)備、人們會(huì)遺忘很多東西,因此傳統(tǒng)的研究方式受到很多局限,而數(shù)字媒體時(shí)代給了我們更多的視角和可能,在新聞擴(kuò)散、虛假消息擴(kuò)散等方面可以有更多的研究。
可計(jì)算性是一個(gè)計(jì)算機(jī)領(lǐng)域的概念,它關(guān)注事物本身可以被計(jì)算的程度,試圖找到算法&計(jì)算函數(shù)來(lái)描述問(wèn)題,如果比較容易找到這個(gè)函數(shù)就是可計(jì)算性比較高的,反之就是可計(jì)算性較低的。計(jì)算思維在這個(gè)過(guò)程中做三件事:從概念的角度對(duì)任務(wù)進(jìn)行抽象、分解與自動(dòng)化實(shí)現(xiàn)。下圖展示了各個(gè)學(xué)科的可計(jì)算性,橫軸是學(xué)科發(fā)展時(shí)間、縱軸是可計(jì)算性的程度。

第一集團(tuán):自然科學(xué),包括物理學(xué)、化學(xué)、生物學(xué)等。產(chǎn)生時(shí)間比較久遠(yuǎn),可以被計(jì)算的程度很高。
第二集團(tuán):社會(huì)科學(xué),包括心理學(xué)、經(jīng)濟(jì)學(xué)等。產(chǎn)生的時(shí)間很短只有兩百多年,社會(huì)現(xiàn)象本身比較復(fù)雜,必須做很多粗略化的處理。比如經(jīng)濟(jì)學(xué),把各種復(fù)雜的經(jīng)濟(jì)現(xiàn)象抽象為貨幣,采用貨幣來(lái)衡量所有行為(經(jīng)濟(jì)現(xiàn)象、社會(huì)福利、家庭關(guān)系),這可以被很好地計(jì)量,使經(jīng)濟(jì)學(xué)得到了很好的發(fā)展,但同時(shí)也存在很多問(wèn)題。
第三集團(tuán):計(jì)算機(jī)科學(xué),包括自然語(yǔ)言學(xué)、統(tǒng)計(jì)語(yǔ)言學(xué)、網(wǎng)絡(luò)科學(xué)等。產(chǎn)生的時(shí)間非常短,但因抽象程度非常高,如計(jì)算機(jī)將世界抽象成0-1,因此發(fā)展非常快。
傳播學(xué)作為各個(gè)領(lǐng)域交匯的十字路口,借鑒了很多領(lǐng)域不同的研究方法,嘗試將各種復(fù)雜的問(wèn)題變成可計(jì)算可衡量的問(wèn)題。
此外,還有一個(gè)可預(yù)測(cè)性的問(wèn)題。人類(lèi)社會(huì)的很多問(wèn)題是不可預(yù)測(cè)的,我們發(fā)展了大量理論來(lái)解釋很多東西,但卻難以去做預(yù)測(cè)。以下分享幾個(gè)嘗試做預(yù)測(cè)的研究項(xiàng)目:
音樂(lè)市場(chǎng)研究:音樂(lè)流行除了跟質(zhì)量相關(guān)之外,還與哪些因素相關(guān)。考察的一個(gè)重要的維度是社交影響,即朋友之間的相互推薦會(huì)不會(huì)影響音樂(lè)本身的流行程度。研究只要加入social influence的維度,對(duì)于音樂(lè)的排名會(huì)變得更難預(yù)測(cè),對(duì)應(yīng)到現(xiàn)實(shí)生活中是完全一致的。
信息擴(kuò)散規(guī)模的預(yù)測(cè):根據(jù)社交網(wǎng)絡(luò)上信息內(nèi)容、發(fā)信人、朋友有哪些,進(jìn)行信息傳播擴(kuò)散的預(yù)測(cè),經(jīng)過(guò)哪些人,擴(kuò)散數(shù)多少。擴(kuò)散規(guī)模的分布是冪律分布:擴(kuò)散規(guī)模小的數(shù)量非常非常多,絕大多數(shù)信息都無(wú)法擴(kuò)散出去。D. Watts研究發(fā)現(xiàn)預(yù)測(cè)準(zhǔn)確度不超過(guò)45%,另一種研究方法是偷看部分答案,比如一條信息擴(kuò)散會(huì)有10000步,我們先看前10步的擴(kuò)散情況。如下圖中,如果提前看在前25個(gè)人的傳播情況,預(yù)測(cè)準(zhǔn)確性就可以達(dá)到80%,前100個(gè)人就可以達(dá)到超過(guò)85%的預(yù)測(cè)準(zhǔn)確性。因此信息擴(kuò)散的規(guī)模雖然很難預(yù)測(cè),但偷看一下前部數(shù)據(jù)的擴(kuò)散情況會(huì)使模型的預(yù)測(cè)效果大大提升。

b. 計(jì)算傳播如何推動(dòng)大問(wèn)題、大理論、大數(shù)據(jù)的融合,能否幫助理解復(fù)雜的人類(lèi)群體行為
費(fèi)曼對(duì)社會(huì)科學(xué)有一個(gè)評(píng)價(jià),認(rèn)為社會(huì)科學(xué)是偽科學(xué),有科學(xué)的形式,但不遵循人類(lèi)行為背后的法則和規(guī)律。
“It puzzles me that geophysicists show little interest in underlying principles of their science. Perhaps they take it for granted that the earth is so complicated and messy that no general principles apply."——Per Bak
這是物理學(xué)的研究模式,不僅滿足于數(shù)據(jù),要從數(shù)據(jù)出發(fā)往上走,走到模式、機(jī)制,最后到一般性的法則。這種模式對(duì)世界的認(rèn)識(shí)是非常理想化的、完美的,所以最完美的世界都存在于理論世界的,現(xiàn)實(shí)世界是對(duì)理論世界不完美的模仿。以引力研究為例,一共有五重境界:拖累米、哥白尼理論研究——到第谷數(shù)據(jù)研究方式——再到開(kāi)普勒數(shù)據(jù)建?!俚脚nD從機(jī)制上研究——最后到伽利略、愛(ài)因斯坦拓展到普適法則。

再看網(wǎng)絡(luò)科學(xué),從歐拉創(chuàng)立圖論理論開(kāi)始,接下來(lái)學(xué)者就建立各種理論:先是認(rèn)為世界是隨機(jī)網(wǎng)絡(luò),人和人相識(shí)是緣分,是隨機(jī)的;后來(lái)又有了小世界模型,認(rèn)為人和人之間有長(zhǎng)城鏈接有很多共同的朋友,如六度分隔理論;另外還有冪律分布BA模型相關(guān)的理論,對(duì)人類(lèi)社會(huì)的長(zhǎng)尾現(xiàn)象進(jìn)行解釋。雖然得出了一些理論、模型和機(jī)制,但卻無(wú)法繼續(xù)往前研究,得到普適性的法則。
社會(huì)科學(xué)雖然不能遵循物理學(xué)的那一套研究路線,但仍然有一些比較重要的定律存在。比如異速增長(zhǎng)定律,觀察生物生長(zhǎng)過(guò)程,比如招潮蟹,兩個(gè)眼睛之間的寬度和鉗子之間的寬度隨著長(zhǎng)大的過(guò)程能夠看到是高度相關(guān)。拓展到生物體積和新陳代謝、城市生長(zhǎng)的過(guò)程中人口和GDP關(guān)系、互聯(lián)網(wǎng)社區(qū)活躍人數(shù)和網(wǎng)站內(nèi)容生產(chǎn)量,都滿足異速增長(zhǎng)定律,并且這種關(guān)系跨越時(shí)間、跨域空間、跨越物種。
c. 計(jì)算傳播學(xué)研究的應(yīng)用
理論只是一棵樹(shù),樹(shù)有各種各樣的形態(tài),理論不是萬(wàn)能的,理論只是思考世界的一種方式。應(yīng)用過(guò)程可以看成是瓶子與酒的關(guān)系:有舊瓶裝舊酒、舊瓶裝新酒、新瓶裝舊酒、新瓶裝新酒。
統(tǒng)計(jì)發(fā)現(xiàn),80%的研究都沒(méi)有產(chǎn)生新知識(shí),只有20%的研究可以;80%計(jì)算傳播的研究是由其他學(xué)科的研究者做的,只有20%是由計(jì)算傳播領(lǐng)域的學(xué)者做的。
d. 計(jì)算傳播的實(shí)踐和商業(yè)價(jià)值
實(shí)踐層面已經(jīng)有比較多了,比如數(shù)據(jù)新聞、計(jì)算廣告、媒體推薦系統(tǒng)。
數(shù)據(jù)新聞或數(shù)據(jù)驅(qū)動(dòng)新聞是計(jì)算傳播學(xué)在新聞生產(chǎn)過(guò)程的應(yīng)用,用于數(shù)據(jù)敘事的工具、技巧和方法,涵蓋了計(jì)算機(jī)輔助報(bào)道、數(shù)據(jù)可視化、新聞應(yīng)用等一切敘事形式,具體包括運(yùn)用各種技術(shù)軟件來(lái)抓取、清洗、分析、呈現(xiàn)數(shù)據(jù)并分析其傳播效果。它是數(shù)據(jù)驅(qū)動(dòng)的,以開(kāi)放數(shù)據(jù)為基礎(chǔ),為公眾提供更重要、更有參考價(jià)值的報(bào)告,更深刻地理解世界。

計(jì)算廣告是通過(guò)拍賣(mài)的方式實(shí)現(xiàn)最大匹配,即”社會(huì)最優(yōu)“。常見(jiàn)的拍賣(mài)機(jī)制有廣義次價(jià)拍賣(mài)機(jī)制、VCG拍賣(mài)機(jī)制、機(jī)器計(jì)算驅(qū)動(dòng)的社會(huì)計(jì)算。
"Find the best match between a given user in a given context and a suitable advertisement."—— Andrei Broder.
媒體推薦系統(tǒng)有社會(huì)化推薦——即朋友推薦物品;基于內(nèi)容的推薦——基于用戶已經(jīng)消費(fèi)的物品內(nèi)容推薦新的物品;協(xié)同過(guò)濾——基于人的相似性和物的相似性做新聞推薦、電影、音樂(lè)和商品推薦等;隱語(yǔ)義模型;基于圖的隨機(jī)游走算法;深度學(xué)習(xí)等。
4. 計(jì)算傳播學(xué)的發(fā)展前景
現(xiàn)在面臨的一個(gè)情況是社會(huì)科學(xué)進(jìn)入?yún)擦郑碚摼褪且豢脴?shù),太多太密了,形成了一個(gè)叢林。而且魚(yú)龍混雜,很難判斷哪些是好的,哪些是劣質(zhì)的。社會(huì)學(xué)需要從依賴(lài)常識(shí)的現(xiàn)狀中走出來(lái),去做預(yù)測(cè)。

因此計(jì)算傳播學(xué)研究就需要有一套新的學(xué)科研究方式,從社會(huì)問(wèn)題出發(fā),收集大規(guī)模數(shù)據(jù),采用計(jì)算機(jī)算法物理學(xué)模型來(lái)研究,進(jìn)而從大問(wèn)題向大理論發(fā)展,分析背后的機(jī)制、模式和嘗試探索普適性法則。
最后總結(jié)一下,計(jì)算傳播學(xué)是計(jì)算社會(huì)科學(xué)的重要分支,主要關(guān)注人類(lèi)傳播行為的可計(jì)算基礎(chǔ)。以傳播網(wǎng)絡(luò)分析、傳播文本挖掘、數(shù)學(xué)建模等為主要分析工具,大規(guī)模收集并分析人類(lèi)傳播行為數(shù)據(jù),挖掘人類(lèi)傳播行為背后的模式和法則,分析模式背后的生成機(jī)制與基本原理,最終達(dá)到預(yù)測(cè)人類(lèi)行為的目的。
書(shū)籍推薦:
- 《Bit By Bit》
- 《Networks Crowds And Markets》
- 《社交網(wǎng)絡(luò)上的計(jì)算傳播學(xué)》
相關(guān)研究和參考文獻(xiàn):
- 《大數(shù)據(jù)會(huì)暴露你的社會(huì)階層嗎——社會(huì)階層對(duì)線上和線下空間移動(dòng)軌跡的影響》
- 《貧窮限制了你的想象力——移動(dòng)閱讀內(nèi)容與社會(huì)階層的關(guān)系》
- Lazer et al(2009) Computation social science. Science
- D. Watts, A twenty-first century science. Nature 445, 489(2007)
- Robert M. Bond et al. A 61-million-people experiment in social influence and political mobilization. Naure. 2012
- Nathan Eagle, Michael Macy and Rob Claxton: Network Diversity and Economic Development, Science 328, 1029-1031, 2010.
- Miller(2010) Social scientists wade into the tweet stream. Science
- Bollen (2011) Twitter mood predicts the stock market. JOCS
- Ginsberg et al. (2009) Detecting influenza epidemics using search engine query data. Nature 457, 1012-1014
- Blumenstock, Joshua E., Gabriel Cadamuro, and Robert On. (2015) Predicting Poverty and Wealth from Mobile Phone Metadata. Science 350(6264): 1073-6.
- Jean, n., Burke, M., Davis, W. M., Lobell, D. B., & Ermon, S. (2016) Combining satellite imagery and machine learning to predict poverty. Science, 353(6301), 790.
- Salganik, M. J., Dodds, P. S., &Watts, D. J.(2016) Experiment study of inequality and unpredictability in an artificial cultural market.