
首先,問大家?guī)讉€問題。一個人的成名是偶然的嗎?歷史上哪些作家被納粹審查得最徹底?The United States是從什么時候從復(fù)數(shù)名詞變成單數(shù)名詞的?如果我們想了解現(xiàn)代人類社會,你會去哪里尋求有力的幫助呢?是頂級的圖書館,一流的大學(xué),還是我們每天都在用的在線社交平臺呢?人類歷史的演變和未來趨勢可以被數(shù)字量化嗎?
今天和大家分享一本我最近正在讀的書——《可視化未來:數(shù)據(jù)透視下的人文大趨勢》。這本書之所以吸引我,首先是因為我從事的是人文學(xué)科的工作,數(shù)字看似離我很遙遠(yuǎn),但在這樣一個用大數(shù)據(jù)說話的社會背景下,人文學(xué)科的工作者如何才能緊跟趨勢、把大數(shù)據(jù)為己所用,是我最近比較關(guān)注的話題;其次,我們每天都在談?wù)摯髷?shù)據(jù),那么大數(shù)據(jù)到底如何影響我們的生活,它可以為我們帶來哪些啟示和應(yīng)用的趨勢,也是值得我們思考的一個問題。簡單來說,這本書的作者利用Google Books掃描的3000萬本書籍做了一個叫做NGram viewer(N元詞組詞頻查看器)的工具,通過統(tǒng)計圖書中文字的詞頻,揭示了英語如何演變、詞典如何犯錯、人們?nèi)绾纬擅?、政府如何壓制思想、集體如何記憶和遺忘,以及文化如何以一種確定性方式運轉(zhuǎn)等問題,并且探討了如何預(yù)測人類未來的可能性。
這本書的內(nèi)容可能離大家比較遠(yuǎn),感興趣的同學(xué)可以看一下,因為這本書舉了很多有意思的例子,可以幫助我們從不同的視角來看待一些普遍問題。但今天我主要想和大家分享一下這本書帶給我的三點啟示:
1. 轉(zhuǎn)變視角,改變方式,世界大不同。大數(shù)據(jù)給我們提供了一個全新的看待世界的方式,通過這種數(shù)據(jù)視角,我們能夠研究很多有意思的話題。比如,回到我前面的一個問題,一個人的成名是偶然的嗎?名望其實是一個很難界定的詞語。這本書中的大數(shù)據(jù)分析(即書中每100萬個詞中的出現(xiàn)頻次)發(fā)現(xiàn),名望的發(fā)展是有整體規(guī)律的,包括四個階段:嶄露頭角、指數(shù)級上升、到達(dá)名望頂峰、緩慢衰減,但不同時代的人名望發(fā)展稍有區(qū)別:隨著時間的推移,人們嶄露頭角的年齡逐漸變小,上升的速度在加快,衰減的速度也在加快,唯一沒有太大變化的是到達(dá)名望頂峰的年齡一般在75歲左右。作者還研究了5類職業(yè):演員、作家、政治家、科學(xué)家和藝術(shù)家的成名軌跡,為年輕人的職業(yè)選擇提供了一些參考數(shù)據(jù):
?。?)演員一般會在30歲左右成名,擁有一輩子時間享受自己的名氣;
?。?)作家一般在接近40歲成名,但撰寫傳世佳作的頂級作家最終獲得的名望要比演員高得多;
(3)政治家一般在40歲之后、50歲之后甚至60歲之后才達(dá)到他們名望的頂峰;
?。?)科學(xué)家一般在60多歲成名,獲得的名望和演員差不多;
?。?)藝術(shù)家和科學(xué)家等待的時間一樣長,獲得的名望卻只有其一半。
當(dāng)然,這些數(shù)據(jù)有其時代性和研究范圍的局限性,但為我們提供了一個用數(shù)字研究社會問題的新視角和新方向。方向大于方法,無論是一個好的研究還是好的提案,都需要問出好問題,然后用合適的方法,得出一個有效的結(jié)論。
2. 記錄,可知過去,可見未來。易效能人喜歡說的一句話是,沒有記錄就沒有發(fā)生。我們現(xiàn)在每天寫的晨間日記、日反思、周檢視、月度檢視、年度檢視不僅僅是記錄過去發(fā)生了什么,也不僅僅是為了搜索信息,更重要的是,大數(shù)據(jù)可以為我們打開一扇密切觀察自己個人生活的窗戶,能夠幫助我們實現(xiàn)自我。舉個簡單的例子,如果我們對某個人十年來發(fā)的朋友圈進(jìn)行簡單的n元詞組分析,那么我們便可以了解到關(guān)于他日常生活的許多信息以及變化。比如,他以前的朋友圈會經(jīng)常提到“聚會”、“酒吧”、“喝酒”這類詞,而后來,這些詞的頻次逐漸下降,而像“健康”、“早睡早起”、“運動”這類詞的頻次逐漸提高,那么我們就可以知道,這十年里他的生活方式發(fā)生了改變,而且也會根據(jù)可視化圖表得知這些變化是從何時開始的。再比如,如果他以前的朋友圈經(jīng)常出現(xiàn)不同的女生名字,而后來漸漸地只出現(xiàn)一個人的名字,那么我們也可以知道,從某時起他的情感生活日趨穩(wěn)定。再比如,如果他以前的朋友圈經(jīng)常出現(xiàn)消極的詞,而現(xiàn)在積極的詞匯逐漸增多,那么可以看出,他對生活的態(tài)度也發(fā)生了改變……我們的人生是悄無聲息地不斷地在改變的,也許我們意識不到某個階段的改變,但如果我們多年后用這種方式對我們的生活記錄進(jìn)行檢索,我們就會不斷地發(fā)現(xiàn)自己的變化,重新發(fā)現(xiàn)那些曾經(jīng)對我們很重要的,卻慢慢被遺忘、被改變了的東西。這種分析能幫助我們更好地認(rèn)識自己,發(fā)現(xiàn)自己的優(yōu)勢,判斷自己的發(fā)展方向,慢慢地靠近夢想。
3. 突破思維界限,科學(xué)與人文走向融合,抓住小趨勢,預(yù)見未知。我從小數(shù)學(xué)就不好,考大學(xué)選專業(yè)時也毫無懸念地選擇了文科。當(dāng)時我覺得太慶幸了——這輩子終于告別數(shù)學(xué)了。但沒有想到的是,讀研究生的時候我“上了賊船”,讀個語言學(xué)專業(yè)也要設(shè)計實驗,啃統(tǒng)計,分析數(shù)據(jù)。好在我也survive了,以為就此可以和數(shù)學(xué)分手快樂了。又沒想到的是,現(xiàn)在語料庫大數(shù)據(jù)發(fā)展迅速,如果不繼續(xù)啃,就會跟不上趨勢。怎么辦?只能繼續(xù)啃。好不容易學(xué)了個基礎(chǔ),AI、Python編程又開始大行其道,讓英語專業(yè)的孩子們感到岌岌可危,江湖地位不保。作為一名“科研工作者”,如果不會編個實驗程序,做個數(shù)據(jù)分析,都會有點心虛,甚至?xí)绮诫y行。就這樣,我從一個數(shù)學(xué)考28分的文科生,活生生地被逼得會編點小程序,會做點小統(tǒng)計,還會給人講講小題。目前,數(shù)據(jù)分析在各個學(xué)科領(lǐng)域都開始展示出它強(qiáng)大的力量,讓人想不到的是,人文學(xué)科和社會科學(xué)居然首當(dāng)其沖。
最后,回到一開始的一個問題。在未來,大數(shù)據(jù)或許能對人類發(fā)展的趨勢進(jìn)行預(yù)測。人類一切的思想和行為最終都會記錄在語言和文字中,只要有一個合適的計算方法,我們就能從語言數(shù)據(jù)中觀察出人類文化的變遷。同理,數(shù)據(jù)已經(jīng)不再屬于數(shù)據(jù)科學(xué)家了,來自各行業(yè)、各領(lǐng)域的從業(yè)者以及政府都應(yīng)該盡力挖掘數(shù)據(jù)的力量。在這個時代,人文和科學(xué)的邊界將逐漸模糊,業(yè)界和學(xué)界的邊界也將被重新定義。我們準(zhǔn)備好了嗎?