
嗯,川普要上臺了,在奧黑farewell address明里暗里黑完川普之后,火箭君對新一任美國總統(tǒng)的就職演說風格充滿了好奇——這不,有人的好奇勁比火箭君更足,竟然定量分析了歷年美國總統(tǒng)的就職演說稿,想要了解演說風格的影響因素——火箭君今天決定把這篇論文翻出來和大家一起看一看~!
論文說了點啥?
整篇論文分析了過去200多年來總計57篇美國總統(tǒng)的就職演說
從喬治華盛頓到巴拉克奧巴馬,所有的就職演說詞都被用文體測定索引(stylometry indices)的方法進行分析。整個分析希望能夠發(fā)現(xiàn)政治和歷史特點(比如戰(zhàn)爭、金融危機、意識形態(tài)等特點)是不是會影響美國總統(tǒng)就職演說的風格。
為了定量分析出就職演說的特征,學者Miroslav Kubát提出了3個重要指標:
演說中使用詞匯的豐富程度(人話:是不是詞匯貧乏)
演說主題的集中程度(人話:是不是亂開無軌電車)
描述性用詞的多少(人話:是不是干貨夠多)
#火箭君結(jié)論先行,但是看到最后總是有彩蛋的#
學霸通過追溯兩個多世紀一來的總統(tǒng)演說,發(fā)現(xiàn):
總統(tǒng)的就職演說沒有明顯受到任何政治和歷史的特點影響,反倒是非常取決于每個總統(tǒng)自身的性格
戰(zhàn)爭也好、經(jīng)濟蕭條也罷可能會在某些方面影響演說的用詞,但是,總統(tǒng)就職的時候要怎么說話,主要還得看總統(tǒng)的喜好~
分析維度說明
A. 演說中使用詞匯的豐富程度(是不是用詞貧乏)
為了知道一篇演說的用詞豐富程度,我們使用MATTR(Moving Average Type-Token Ratio)的辦法分析演說的用詞豐富程度。這種辦法通過滑動平均的方法測算一篇文章的詞匯豐富度
例如:
如果有一篇7個短語(N=7)組成的文章:a,b,c,a,a,d,f。設(shè)定觀察窗口為3個詞(L=3)
首先找出文章中的詞匯窗口,分別是a,b,c | b,c,a | c,a,a | a,a,d | a,d,f,一共5個
這篇文章的詞匯豐富度?= (每個窗口中不重復的詞匯之和) / L(N-L+1)
在這個例子中,這篇文章的用詞豐富度就等于0.87
B.測算演說主題的集中程度(是不是無軌電車亂開)
文章用Secondary thematic concentration (STC)這個指標來表達演說主題集中程度。STC指標可以表現(xiàn)出演說者的演說有多關(guān)注于一個(或者多個)特定主題
譬如有些領(lǐng)導的風格是一說起話來就無軌電車亂開,這個指標就會很低……
具體算法太復雜了,火箭君懶得看更懶得寫了……
C. 測算描述性用詞的多少
這個計算火箭君舉個例子大家就明白了:
林肯的就職演說(1865年)中,一共使用了102個動詞,36個形容詞
行動力指標(Q)= 102/(102+36) = 0.74
代表這是一篇對行動力要求非常高的就職演說
歷年總統(tǒng)的就職演說
嗯,所以,歷年美國總統(tǒng)的就職演說的各項指標就這么可以列出來啦!?。?!
奧黑成為了100年來最能開無軌電車的總統(tǒng)
最后彩蛋,歷年總統(tǒng)就職演說KPI~可以打開收藏哦~