計算社會科學基本概念
2009年,包括哈佛大學教授拉澤爾(lazer et al.,2009)在內的15名頂級學者在《科學》(Science)上共同署名發(fā)表論文,正式提出“計算社會科學”(Computational socialscience)這一概念。計算社會科學是一門基于社會學原理,使用自然科學和信息科學工具,揭示社會發(fā)展規(guī)律,從而解決社會問題的學科(孟小峰等,2019)
大數(shù)據(jù)時代,計算社會科學的核心任務是:通過對接近全樣本的數(shù)據(jù)量進行深度挖掘、機器學習、變量搭橋、模式探索等, 實現(xiàn)個體特征畫像、行為模式預測、社會系統(tǒng)剖析與宏觀政策預演。在個體畫像、行為預測、系統(tǒng)剖析與政策預演等方面,社會科學仿真模擬方法發(fā)揮著重要作用。
社會科學仿真方法的優(yōu)勢
- 清晰地因果機制:
社會科學仿真方法的本質是用清晰預設的因果機制進行動態(tài)持續(xù)試驗并獲得動態(tài)數(shù)據(jù)。 - 動態(tài)多種可能:
仿真模擬通過遍歷各種變量參數(shù)的可能取值范圍即參數(shù)譜系來擬合研究現(xiàn)象,故其核心任務是窮盡所有可能,尋找最佳參數(shù)組合即看何種組合之下因果機制更容易被理解和被確定,對參數(shù)的可能范圍進行全域化設置,對自然、社會現(xiàn)象的動態(tài)演化與過程機制進行全域化考察。 - 基于動態(tài)有限信息的持續(xù)優(yōu)化:
通過對手頭信息不斷進行學習與優(yōu)化,得到臨時或局部最優(yōu)解。當信息出現(xiàn)動態(tài)變化,“持續(xù)挖掘”的保守主義精神使得人類知識得以不斷產生、改造自然得以不斷推進、認識社會得以不斷深化。
社會網絡簡介
網絡的結構在許多學科中都有研究。 例如,計算機科學研究計算機網絡,生物學家致力了解基因和蛋白質之間復雜的相互作用網絡如何導致機體正常的生理行為或疾病,神經學科將大腦作為神經元網絡進行研究,社會科學對社交互動的網絡結構和演化特征感興趣。
網絡數(shù)據(jù)集可以表示實體(或節(jié)點)的屬性,但最重要的是,它們描述了節(jié)點之間的鏈接關系(或邊)。社交網絡研究人員分析了不同實體之間可能存在的各種關系:
溝通關系(例如,與誰交談)
工具性關系(例如,誰向誰咨詢專家意見)
邊界滲透關系(例如,誰在誰的董事會中)
情感關系(例如,高中時期的友誼集團)
權力關系(例如,誰跟隨誰)
親屬關系(例如,誰與誰有關系)
交易關系(例如,誰贈予誰)
研究人員感興趣的地方:穩(wěn)定性(多長時間保持聯(lián)系)
互惠性(雙方的關系是否相同)
強度(關系是“弱”還是“強”)
密度(網絡中實際存在多少潛在聯(lián)系)
可達性(從網絡的一個“端”到相對的“端”需要多少束縛)
中心性(網絡是否具有“中心”點)
-
質量(關系的可靠性或確定性)
在社會科學中,以對社會行動者之間的互動研究為基礎的結構性方法被稱作社會網絡分析(弗里曼,2008)
這些行動者可能是個體的人,也可能是群體、組織或者國家等。
社會網絡分析關注行動者之間的關系,認為這些關系的模式會影響它們的行動。
因此,揭示不同類別的關系模式,并確定這些模式在何種條件下會出現(xiàn)以及會導致什么樣的后果就成為社會網絡分析的核心目標之一。
集團間的社會網絡示意圖
1967年哈佛大學心理學教授斯坦利·米爾格拉姆(Stanley Milgram)通過連鎖信實驗驗證了六度分離理論(Six Degrees of Separation)
六度分離理論(又稱小世界現(xiàn)象)的出現(xiàn)使得人們對于人際關系網絡的威力有了新的認識。然而,在這個理論中,沒有對人和人之間的關系進行強弱的區(qū)分。直到1974年,斯坦福大學社會系的馬克·格拉諾維特(Mark Granovetter)提出了弱連接理論,才對這一問題進行了補充。
1998年,康奈爾大學的鄧肯·瓦特(Duncan Watts)和斯蒂文·斯特羅加茨(Steven Strogatz)在《Nature》雜志上發(fā)表了一篇名為“小世界網絡的集體動力學”(Collective dynamics of the 'Small World' networks)的論文。指出之所以會出現(xiàn)小世界現(xiàn)象,是由于某一類復雜網絡的特性。他們注意到復雜網絡可以按兩個獨立的結構特性分類,即集聚系數(shù)和節(jié)點間的平均路徑長度。
1999年,Barabási和Albert在《Science》雜志上發(fā)表的《隨機網絡中標度的涌現(xiàn)》一文中證明復雜網絡的連接度普遍符合冪律分布。隨后,很多研究者,尤其是物理學家開始關注各種復雜網絡。
社會網絡的拓撲性概念: 度(degree)和度分布:
度是單個節(jié)點的重要概念,節(jié)點的度是指與該節(jié)點鄰接的邊的數(shù)目,是節(jié)點靜態(tài)結構的屬性里最重要的度量之一。有向網絡中一個節(jié)點的度分為出度和入度。一般用表示網絡中的平均度,即所有節(jié)點的度的平均數(shù),用以衡量網絡連接的疏密程度。平均路徑長度(average path length):
平均路徑長度表示網絡中任意兩個節(jié)點間最短路徑長度的平均值,是衡量節(jié)點間關系緊密程度的常用指標。聚類系數(shù)(Clustering coefficient):
聚類系數(shù)是指網絡中某個節(jié)點的鄰居節(jié)點也互為鄰居的平均概率,它反映了一個人社會網絡關系中,熟人之間相互聯(lián)系的緊密程度。
網絡建模的四種方法
-
規(guī)則圖:創(chuàng)建n個節(jié)點,每個節(jié)點選擇任意m個其它節(jié)點進行連接。
規(guī)則圖建模Netlogo界面 -
ER隨機圖:以概率p連接N個節(jié)點中的每一對節(jié)點。
image.png -
WS小世界網絡:生成一個含有n個節(jié)點、每個節(jié)點有k個鄰居、以概率p隨機化重連邊的WS小世界網絡。
小世界網絡 -
BA無標度網絡:生成一個含有n個節(jié)點、每次加入m條邊的BA無標度網絡。
無標度
社會仿真工具:Netlogo介紹

Netlogo 官網:https://ccl.northwestern.edu/netlogo/
社會仿真研究舉例:《虛擬社會仿真中的人際關系網絡模型研究》
張明智,余永陽,胡曉峰,司光亞(2009).虛擬社會仿真中的人際關系網絡模型研究.計算機仿真,2009,26(02),14-17.
人際關系網絡主要特征
人際關系網絡具有無標度性
人際網絡模型構造算法
建模所用到的算法
實驗結果









