在科研工作中,我們常常需要面對(duì)海量的文獻(xiàn),如何在這些文獻(xiàn)當(dāng)中找出值得精讀、細(xì)讀的關(guān)鍵文獻(xiàn),挖掘?qū)W科前沿,找到研究熱點(diǎn)就成為了開展研究之前首先需要解決的問題。CiteSpace作為一款優(yōu)秀的文獻(xiàn)計(jì)量學(xué)軟件,能夠?qū)⑽墨I(xiàn)之間的關(guān)系以科學(xué)知識(shí)圖譜的方式可視化的展現(xiàn)在操作者面前,既能幫助我們梳理過去的研究軌跡,也能使得我們對(duì)未來的研究前景有一個(gè)大概的認(rèn)識(shí)。
CiteSpace 又翻譯為“引文空間”,是一款著眼于分析科學(xué)分析中蘊(yùn)含的潛在知識(shí),是在科學(xué)計(jì)量學(xué)、數(shù)據(jù)可視化背景下逐漸發(fā)展起來的引文可視化分析軟件。由于是通過可視化的手段來呈現(xiàn)科學(xué)知識(shí)的結(jié)構(gòu)、規(guī)律和分布情況,因此也將通過此類方法分析得到的可視化圖形稱為“科學(xué)知識(shí)圖譜”。摘自 李杰.CiteSpace中文版指南
正如科學(xué)計(jì)量學(xué)界的權(quán)威專家劉則淵教授對(duì)CiteSpace知識(shí)圖譜形態(tài)的概括一樣,“一圖展春秋,一覽無余;一圖勝萬言,一目了然”。近年來,使用CiteSpace開展的研究、發(fā)表的論文呈現(xiàn)不斷上升的趨勢(shì)。根據(jù)中國知網(wǎng)的統(tǒng)計(jì),2017年相關(guān)論文已經(jīng)達(dá)到388篇;到2018年預(yù)測(cè)將達(dá)到423篇。

在如此多同質(zhì)化的文章面前,我們應(yīng)當(dāng)如何做好自己的研究才能夠不落入俗套,進(jìn)而脫穎而出呢?我認(rèn)為,在深入的把握CiteSpace的原理的基礎(chǔ)上,熟稔相關(guān)操作背后的含義,對(duì)CiteSpace軟件的應(yīng)用達(dá)到游刃有余,這樣才能知道自己的研究需要什么,做到“知己”。同時(shí)了解相關(guān)文章的研究套路,清晰他們的研究內(nèi)容和研究思路,取其精華,規(guī)避其錯(cuò)誤,做到“知彼”。下面根據(jù)我個(gè)人的一些學(xué)習(xí)的體會(huì)和實(shí)際使用的情況對(duì)CiteSpace使用過程來跟大家做一個(gè)基礎(chǔ)性的介紹。
一、CiteSpace的下載與界面介紹
訪問http://cluster.ischool.drexel.edu/~cchen/citespace/download/下載CiteSpace,一般下載最新版。當(dāng)前(2018年10月14日)最新版為5.3.R4,新版本在原來版本的基礎(chǔ)上增加了引文級(jí)聯(lián)引用功能。
使用CiteSpace需要先安裝JAVA 8,安裝教程參考jdk 8下載和安裝步驟

下載完成后解壓,打開StartCiteSpace_Windows.bat。一般選擇英文。

進(jìn)入下一個(gè)界面,提醒使用者在使用這個(gè)軟件開展研究的發(fā)表論文的時(shí)候,別忘了把軟件開發(fā)者的論文引用上,不同意就用不了,那我們當(dāng)然選擇同意。

CiteSpace的功能區(qū)域很質(zhì)樸,分為執(zhí)行操作區(qū)、時(shí)間選擇區(qū)、文本處理功能區(qū)和網(wǎng)絡(luò)配置功能區(qū)等。在隨后的論述中,再對(duì)這些功能區(qū)進(jìn)行逐一展開。

二、CiteSpace的數(shù)據(jù)來源與下載:分析的原料在哪里
使用CiteSpace分析某一主題的研究歷史與研究前沿,第一步就是要從文獻(xiàn)數(shù)據(jù)庫上下載到一定數(shù)量的文獻(xiàn)信息。外文文獻(xiàn)信息一般在web of science(WoS)上下載得到,中文文獻(xiàn)信息一般在中國知網(wǎng)(CNKI)上下載。CiteSpace是基于WoS的數(shù)據(jù)格式進(jìn)行開發(fā)的,可以根據(jù)下載得到的數(shù)據(jù)進(jìn)行合作網(wǎng)絡(luò)分析、共現(xiàn)分析和共被引分析,在非WoS數(shù)據(jù)庫下載得到的數(shù)據(jù)都需要先轉(zhuǎn)化為WoS的數(shù)據(jù)格式,根據(jù)相應(yīng)數(shù)據(jù)庫的數(shù)據(jù)維度各有其相對(duì)應(yīng)的適用范圍。就數(shù)據(jù)庫的深度看,外文數(shù)據(jù)庫我們一般使用WoS,中文數(shù)據(jù)庫一般使用CNKI。
另外,中文的文獻(xiàn)數(shù)據(jù)庫還有CSSCI數(shù)據(jù)庫、CSCD數(shù)據(jù)庫等,外文的文獻(xiàn)數(shù)據(jù)庫還包括Scopus數(shù)據(jù)庫、Derwent專利數(shù)據(jù)和其他專業(yè)領(lǐng)域的數(shù)據(jù)庫等,下載方法參考《CiteSpace:科技文本挖掘及可視化》第2講。

在數(shù)據(jù)檢索時(shí),一般有兩種檢索策略,分別是:
- 按照關(guān)鍵詞檢索
- 按照期刊檢索
我們以按照關(guān)鍵詞檢索為例,說明如何從文獻(xiàn)數(shù)據(jù)庫中,下載得到我們所需要的文獻(xiàn)數(shù)據(jù)。
1、在WoS上下載數(shù)據(jù)
在WoS上下載數(shù)據(jù),訪問WoS的官網(wǎng)http://apps.webofknowledge.com。操作的第一步是登錄,假如沒有賬號(hào),需要先行注冊(cè)一個(gè)。沒有登錄的話,是無法下載數(shù)據(jù)的。

以關(guān)鍵詞“學(xué)習(xí)成果評(píng)價(jià)”為例,鍵入其英文“l(fā)earning outcome assessment”,數(shù)據(jù)庫選擇“Web of Science核心合集”,檢索類型選擇“主題”,時(shí)間跨度選擇“所有年份”。我所在的學(xué)校購買到的數(shù)據(jù)庫是從1985年開始的,時(shí)間跨度可能對(duì)有些朋友而言不夠長。當(dāng)前國內(nèi)購買WoS數(shù)據(jù)庫跨度最長的地方是中科院文獻(xiàn)情報(bào)中心,是從20世紀(jì)初期就開始的,有需要的朋友可以到那里進(jìn)行數(shù)據(jù)下載。

得到如下頁面。從頁面中可以看出,該主題詞下的索引結(jié)果有10054條。下一步,需要對(duì)檢索結(jié)果進(jìn)行精煉。

文獻(xiàn)類型選擇“文章”,點(diǎn)擊精煉。得到的最終檢索結(jié)果為7050條,這些文獻(xiàn)數(shù)據(jù)使我們最終想要的。

隨后,滑到底部,將記錄改成每頁顯示50條。

回到頂部,按照下圖步驟,分別點(diǎn)擊“選擇頁面”,“添加到標(biāo)記結(jié)果列表”,就完成了這一頁面的數(shù)據(jù)添加。最后點(diǎn)擊“下一頁”,循環(huán)這個(gè)過程。WoS最多支持500條數(shù)據(jù)保存一次。

在標(biāo)記完500條數(shù)據(jù)后,選擇“保存為其他文件格式”。

隨后,記錄內(nèi)容選擇“全紀(jì)錄與引用的參考文獻(xiàn)”,文件格式選擇“純文本”,點(diǎn)擊“發(fā)送”,就可以得到剛才我們標(biāo)記過的500條文獻(xiàn)信息了。

下載得到的內(nèi)容包括論文標(biāo)題、作者、資助基金、關(guān)鍵詞、來源期刊、所屬領(lǐng)域、論文摘要、參考文獻(xiàn)等等。對(duì)余下文獻(xiàn)信息做相同的操作,即可以得到所需要的數(shù)據(jù)全集。

Tips:
- 關(guān)鍵詞的翻譯,例如“學(xué)習(xí)成果評(píng)價(jià)”,找出幾篇以“學(xué)習(xí)成果評(píng)價(jià)”為關(guān)鍵詞的引用率較高的文獻(xiàn),中外比較類(例如比較教育學(xué))的研究最好。參考其下的英文對(duì)照翻譯,綜合選擇即可以得到我們需要的英文關(guān)鍵詞。
- 查看相關(guān)數(shù)據(jù)時(shí),最好時(shí)候Notepad++、sublimetext等編輯器。格式更加醒目、清晰。
2、在CNKI上下載數(shù)據(jù)
在CNKI上,同理,訪問www.cnki.net,鍵入檢索詞“學(xué)習(xí)成果評(píng)價(jià)”,每頁顯示選擇“50”,勾選“全部選中”按鈕,點(diǎn)擊到下一頁,同樣以500條數(shù)據(jù)為一次下載。

在選擇完畢后,點(diǎn)擊“導(dǎo)出/參考文獻(xiàn)”。

選擇Refworks,點(diǎn)擊“導(dǎo)出”,就完成了本次下載。

得到的數(shù)據(jù)維度比WoS得到的數(shù)據(jù)維度要少一下,僅包括作者、標(biāo)題、來源期刊、關(guān)鍵詞、摘要等。對(duì)余下數(shù)據(jù)做同樣的操作,就可以得到中文的數(shù)據(jù)集。

在得到數(shù)據(jù)集后,需要將這些數(shù)據(jù)集轉(zhuǎn)化為CiteSpace可以識(shí)別、讀取的數(shù)據(jù)格式。參考如下tips即可完成轉(zhuǎn)換。
Tips:
- CiteSpace自帶有數(shù)據(jù)轉(zhuǎn)換的功能,但不太好用,容易出現(xiàn)一些問題。推薦下載使用格式轉(zhuǎn)換器。轉(zhuǎn)換器下載鏈接
- 轉(zhuǎn)換后會(huì)將原本集合在一個(gè)txt文件中的數(shù)據(jù)打散,生成一條數(shù)據(jù)一個(gè)txt的形式,txt文件過多會(huì)極大的降低了CiteSpace的運(yùn)算速度。為了解決這個(gè)問題,打開命令行工具(cmd),輸入下面的代碼,將這些TXT合并成一個(gè)。 引自:將多個(gè)txt文件合并成一個(gè)
cd F:\study\citespace\data(改成自己的數(shù)據(jù)存儲(chǔ)路徑)
type *.txt > allData.txt
二、CiteSpace的分析原理:我們?nèi)绾瓮诰颥F(xiàn)有數(shù)據(jù)
在獲取特定主題的數(shù)據(jù)后,自然而言我們會(huì)冒出一個(gè)問題:“我們拿這些數(shù)據(jù)用來做什么?”CiteSpace的最大的作用,就是能夠在這些枯燥乏味、機(jī)械重復(fù)的數(shù)據(jù)中挖掘出我們想要的東西。那么,這是依靠什么原理實(shí)現(xiàn)的呢?
1、共被引分析
在了解共被引分析前我們需要對(duì)引文分析有個(gè)概念,引文就是論文后面的參考文獻(xiàn)。有學(xué)者認(rèn)為,引文分析就是對(duì)科學(xué)期刊、論文、作者等分析對(duì)象的引用和被引用現(xiàn)象進(jìn)行分析,以揭示其數(shù)量特征和內(nèi)在規(guī)律的一種信息計(jì)量研究方法。在了解引文分析法之前我們首先要知道,學(xué)者為什么要在其論文中印證前人的研究成果。
為什么要引證:
- 為了對(duì)先驅(qū)者表示崇敬。
- 為了對(duì)相關(guān)工作表示贊賞,同時(shí)表示對(duì)同行的尊敬。
- 為了對(duì)方法或儀器設(shè)備表示認(rèn)同。
- 為了向讀者提供閱讀背景。
- 為了糾正自己的工作。
- 為了糾正別人的工作。
- 為了批評(píng)前人的工作。
- 為了支持某種論斷。
- 為了提醒人們注意即將發(fā)表的工作。
- 為了找到那些傳播不廣、索引很差又未被引證的文獻(xiàn)而提供線索。
- 為了驗(yàn)證科學(xué)事實(shí)和數(shù)據(jù),例如援引物理常數(shù)等。
- 為了鑒別曾討論過某個(gè)思想或概念的原始文獻(xiàn)。
- 為了鑒別某個(gè)時(shí)代的某個(gè)概念或術(shù)語的原始文獻(xiàn)或其他著作。
- 為了對(duì)別人的工作或思想提出反證-否定性論斷。
- 為了與別人論爭某個(gè)觀點(diǎn)的優(yōu)先權(quán)。
引自:引證論文的理由
從上面這么多引用原因我們不難看出,被引文獻(xiàn)與當(dāng)前文獻(xiàn)在內(nèi)容上是相關(guān)的。論文引用其他論文的行為可以看做是知識(shí)從不同的研究主題流動(dòng)到當(dāng)前所進(jìn)行的研究,是知識(shí)單元從游離狀態(tài)到重組產(chǎn)生新知識(shí)的過程。發(fā)表的論文被其他論文引用是這個(gè)過程的持續(xù)。由于這種引證行為的客觀存在,隨著科學(xué)研究的不斷推進(jìn),引文網(wǎng)絡(luò)也就自然而然的形成了。一篇特定的論文,引用的文獻(xiàn)稱為引用文獻(xiàn)(即后向引證關(guān)系),這篇論文發(fā)表后,引用這篇文章的論文稱為施引文獻(xiàn)(前向引證關(guān)系)。在引證網(wǎng)絡(luò)的基礎(chǔ)上,延伸出兩個(gè)重要的概念,一個(gè)是共被引分析,另一個(gè)是耦合分析。共被引分析挖掘參考文獻(xiàn)之間的關(guān)系,耦合分析挖掘施引文獻(xiàn)之間的關(guān)系,這里著重講共被引分析。
共被引分析(Co-Citation analysis)是指兩篇文獻(xiàn)共同出現(xiàn)在第三篇施引文獻(xiàn)的參考文獻(xiàn)目錄中,則這兩篇文獻(xiàn)形成共被引關(guān)系。通過對(duì)一個(gè)引文網(wǎng)絡(luò)進(jìn)行文獻(xiàn)共被引關(guān)系挖掘的過程,就可以認(rèn)為是文獻(xiàn)共被引分析的過程。例如下圖文獻(xiàn)pb1和文獻(xiàn)pb4在三篇論文中共同引用,那么他們的共被引次數(shù)為3次,通過一定的計(jì)算方式可以得到他們的關(guān)聯(lián)強(qiáng)度。共被引次數(shù)越多,這說明這兩篇文獻(xiàn)相似之處越大,關(guān)聯(lián)強(qiáng)度也越大。分析的步驟為:先從文獻(xiàn)信息中歸納得到引證矩陣,在引證矩陣的基礎(chǔ)上生成共被引矩陣。使用可視化技術(shù),將共被引矩陣可視化為網(wǎng)絡(luò)。

2、共詞分析
在進(jìn)行共詞分析之前,首先需要先了解詞頻分析。詞頻是指所分析的文檔中詞語出現(xiàn)的次數(shù)。詞頻分析就是在文獻(xiàn)信息中提取能夠表達(dá)文獻(xiàn)核心內(nèi)容的關(guān)鍵詞和主題詞頻次高地分布,來研究該領(lǐng)域發(fā)展動(dòng)向和研究熱點(diǎn)的方法。
在詞頻分析的基礎(chǔ)上,對(duì)詞頻網(wǎng)絡(luò)進(jìn)行的更高層次的分析稱為共詞分析。共詞分析的基本原理是對(duì)一組詞兩兩統(tǒng)計(jì)它們?cè)谕唤M文獻(xiàn)中出現(xiàn)的次數(shù),通過這種共現(xiàn)次數(shù)來測(cè)度他們之間的親疏關(guān)系。它需要滿足以下幾個(gè)方面的假設(shè)。
共詞分析的假設(shè)前提:
- 作者都是很認(rèn)真的選擇他們的技術(shù)術(shù)語的;
- 當(dāng)在同一篇文章中使用不同的術(shù)語時(shí),就意味著這些不同的術(shù)語之間的關(guān)系并不是微不足道,它們一定是被作者認(rèn)可和認(rèn)同的;
- 如果有足夠多的作者對(duì)同一種關(guān)系認(rèn)可,那么可以認(rèn)為這種關(guān)系在他們所關(guān)注的科學(xué)領(lǐng)域中具有一定意義;
- 當(dāng)針對(duì)關(guān)鍵詞時(shí),經(jīng)過專業(yè)學(xué)習(xí)的學(xué)者,在其論文中標(biāo)引出來的關(guān)鍵詞時(shí)能夠反映文章的內(nèi)容的,是值得信賴的指標(biāo)。在作者標(biāo)引關(guān)鍵詞時(shí),通常也會(huì)受到其他學(xué)者成果的影響而在論文中使用相同或類似的關(guān)鍵詞標(biāo)引自己的論文。
分析的步驟與共被引分析相近:先從文獻(xiàn)信息中歸納得到關(guān)鍵詞矩陣,在關(guān)鍵矩陣的基礎(chǔ)上生成共詞矩陣。使用可視化技術(shù),將共詞矩陣可視化為網(wǎng)絡(luò)。

3、突現(xiàn)分析
CiteSpace提供Burst detection的功能來探測(cè)在某一時(shí)段引用量有較大變化的情況。用以發(fā)現(xiàn)某一個(gè)主題詞、關(guān)鍵詞衰落或者興起的情況。
4、聚類分析
聚類分析指將物理或抽象對(duì)象的集合分組為由類似的對(duì)象組成的多個(gè)類的分析過程,以分析對(duì)象的相似性為基礎(chǔ)。聚類分析有許多不同的算法,CiteSpace提供的算法有3個(gè),3個(gè)算法的名稱分別是:LSI淺語義索引、LLR對(duì)數(shù)極大似然率、互信息。對(duì)不同的數(shù)據(jù),3種算法表現(xiàn)一樣,可在實(shí)踐中多做實(shí)踐。
關(guān)于這3種算法,可以參考如下文章做進(jìn)一步了解:
- LSI淺語義索引 文本主題模型之潛在語義索引(LSI)
- LLR對(duì)數(shù)極大似然率 Likelihood ratio test
- 互信息 互信息(Mutual Information
5、CiteSpace其他功能區(qū)
對(duì)于共被引分析,CiteSpace提供了引文共被引、作者共被引和期刊共被引3種不同類型的分析方法。對(duì)于共現(xiàn)分析,CiteSpace提供了術(shù)語、關(guān)鍵詞、來源、領(lǐng)域4種不同的共現(xiàn)分析。

無論是共被引分析還是共現(xiàn)分析,在生成網(wǎng)絡(luò)時(shí)都需要根據(jù)共被引次數(shù)或共現(xiàn)次數(shù)計(jì)算網(wǎng)絡(luò)節(jié)點(diǎn)之間的連接強(qiáng)度。CiteSpace提供了4種網(wǎng)絡(luò)節(jié)點(diǎn)強(qiáng)度計(jì)算的方法,一般不做改動(dòng),選擇默認(rèn)方法。

三、CiteSpace挖掘的三個(gè)方面:知識(shí)基礎(chǔ)、學(xué)科結(jié)構(gòu)、研究前沿
CiteSpace能夠在海量的文獻(xiàn)數(shù)據(jù)中,能夠以較為簡單的操作步驟挖掘出我們所需要的特定主題的三個(gè)方面的信息,包括該研究主題的知識(shí)基礎(chǔ)、相應(yīng)的學(xué)科結(jié)構(gòu)和最新的研究前沿。在進(jìn)行進(jìn)一步的論述之前,我們先來簡單介紹CiteSpace這個(gè)軟件的操作步驟。
1、知識(shí)基礎(chǔ)的獲取
任何一個(gè)研究主題,背后都會(huì)有一個(gè)較為完整的知識(shí)體系作為支撐。這個(gè)研究主題越成熟,這個(gè)知識(shí)體系越完整,越豐富。我們知道共被引網(wǎng)絡(luò)是由參考文獻(xiàn)組成的網(wǎng)絡(luò)。我們獲取的這一主題的論文,其知識(shí)構(gòu)成在很大程度上是由其參考文獻(xiàn)的知識(shí)流動(dòng)匯集得來的。那么由參考文獻(xiàn)組成的共被引網(wǎng)絡(luò)則能夠很好的揭示某一個(gè)研究主題的“先驗(yàn)知識(shí)”,即我們可以通過獲取參考文獻(xiàn)的共被引網(wǎng)絡(luò)的方式,得到某一研究主題的知識(shí)基礎(chǔ)。
以關(guān)鍵詞“高等教育”為檢索對(duì)象,得到2.5萬余條數(shù)據(jù),得到的共被引網(wǎng)絡(luò)如下:

顏色的冷暖代表了時(shí)間的遠(yuǎn)近,顏色越暖,時(shí)間越近;顏色越冷,時(shí)代越久遠(yuǎn)。那么通過對(duì)網(wǎng)絡(luò)進(jìn)行分析,對(duì)其中關(guān)鍵節(jié)點(diǎn)(即關(guān)鍵文獻(xiàn))進(jìn)行研究,就可以知道,支撐支撐高等教育發(fā)展的知識(shí)基礎(chǔ)在時(shí)間上的發(fā)展演進(jìn)情況。那么我們需要研究哪一個(gè)階段的高等教育歷史,就得找到相應(yīng)時(shí)段高等教育知識(shí)基礎(chǔ)的書籍進(jìn)行研讀、瀏覽和整理。
對(duì)這個(gè)結(jié)果網(wǎng)絡(luò)進(jìn)行聚類分析,可以看到各個(gè)階段知識(shí)基礎(chǔ)的主題的變化情況,方便我們進(jìn)行主題聚焦??梢钥吹?,在最近的研究中,知識(shí)基礎(chǔ)為“反饋”類的文獻(xiàn),此時(shí)研究也許會(huì)以這個(gè)為出發(fā)點(diǎn)展開研究。

在了解整體的知識(shí)基礎(chǔ)的框架和演進(jìn)趨勢(shì)后,我們?nèi)绾螌?duì)關(guān)鍵文獻(xiàn)進(jìn)行定位?我們主要關(guān)注2個(gè)方面:
- 高頻節(jié)點(diǎn):代表高被引的文獻(xiàn),是某個(gè)領(lǐng)域或多個(gè)領(lǐng)域的重要知識(shí)基礎(chǔ)。
- 高中介中心性節(jié)點(diǎn):代表與多篇文獻(xiàn)形成共被引關(guān)系的文獻(xiàn),與多篇文獻(xiàn)均有關(guān)系,起到“交通樞紐”的作用。相對(duì)而言,是本領(lǐng)域內(nèi)的關(guān)鍵文獻(xiàn);同時(shí),也是這段時(shí)期內(nèi)的關(guān)鍵文獻(xiàn),在一定程度上代表著這段時(shí)期的研究熱點(diǎn)主題。
中介中心性是指:一個(gè)結(jié)點(diǎn)擔(dān)任其它兩個(gè)結(jié)點(diǎn)之間最短路的橋梁的次數(shù)。一個(gè)結(jié)點(diǎn)充當(dāng)“中介”的次數(shù)越高,它的中介中心度就越大。引自:度中心性(degree)、接近中心性(closeness)和中介中心性(betweenness)的理解
那么我們可以知道,同時(shí)具備高中介中心性和高頻特性的節(jié)點(diǎn),就是本領(lǐng)域內(nèi)的關(guān)鍵文獻(xiàn),也是這段時(shí)期內(nèi)的關(guān)鍵文獻(xiàn),代表著這段時(shí)期的研究熱點(diǎn)主題。

如何根據(jù)文獻(xiàn)簡略信息得到文獻(xiàn)完整信息?
- 參考博文CiteSpace的介紹與使用的“根據(jù)報(bào)告分析出的文獻(xiàn)”部分。
2、學(xué)科結(jié)構(gòu)的獲取
一篇論文的關(guān)鍵詞代表著這篇論文的論述重點(diǎn),在一定程度上反映了這篇論文的學(xué)科結(jié)構(gòu)。使用關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò),能夠?qū)?shù)據(jù)全集中的學(xué)科結(jié)構(gòu)清晰的展示出來。每一個(gè)節(jié)點(diǎn)代表一篇文獻(xiàn),節(jié)點(diǎn)越大,說明該關(guān)鍵詞詞頻越大,與主題的相關(guān)性越大。同樣,節(jié)點(diǎn)的顏色代表時(shí)間:顏色越暖,時(shí)間越近;顏色越冷,時(shí)代越久遠(yuǎn)。

3、研究前沿的獲取
使用前面提到的burst detection,可以獲取到相關(guān)研究主題的研究前沿。在獲取研究前沿前,需要先點(diǎn)擊Noun Phrases,選擇Create POS Tags。

然后把Burst Terms選中,點(diǎn)擊detect Bursts。

在彈出框中選擇noun phrases。

在知識(shí)圖譜的界面,旁邊有個(gè)Control Panel,點(diǎn)擊Burstness,點(diǎn)擊Refresh,就可以生成我們所需要的關(guān)鍵詞圖片圖。


作者:興富同學(xué)
鏈接:http://www.itdecent.cn/p/c3139ee1cf1f
來源:簡書
著作權(quán)歸作者所有。商業(yè)轉(zhuǎn)載請(qǐng)聯(lián)系作者獲得授權(quán),非商業(yè)轉(zhuǎn)載請(qǐng)注明出處。
nshu.io/upload_images/12875160-97ce693ef42d3099.png?imageMogr2/auto-orient/strip|imageView2/2/w/784/format/webp)
在科研工作中,我們常常需要面對(duì)海量的文獻(xiàn),如何在這些文獻(xiàn)當(dāng)中找出值得精讀、細(xì)讀的關(guān)鍵文獻(xiàn),挖掘?qū)W科前沿,找到研究熱點(diǎn)就成為了開展研究之前首先需要解決的問題。CiteSpace作為一款優(yōu)秀的文獻(xiàn)計(jì)量學(xué)軟件,能夠?qū)⑽墨I(xiàn)之間的關(guān)系以科學(xué)知識(shí)圖譜的方式可視化的展現(xiàn)在操作者面前,既能幫助我們梳理過去的研究軌跡,也能使得我們對(duì)未來的研究前景有一個(gè)大概的認(rèn)識(shí)。
CiteSpace 又翻譯為“引文空間”,是一款著眼于分析科學(xué)分析中蘊(yùn)含的潛在知識(shí),是在科學(xué)計(jì)量學(xué)、數(shù)據(jù)可視化背景下逐漸發(fā)展起來的引文可視化分析軟件。由于是通過可視化的手段來呈現(xiàn)科學(xué)知識(shí)的結(jié)構(gòu)、規(guī)律和分布情況,因此也將通過此類方法分析得到的可視化圖形稱為“科學(xué)知識(shí)圖譜”。摘自 李杰.CiteSpace中文版指南
正如科學(xué)計(jì)量學(xué)界的權(quán)威專家劉則淵教授對(duì)CiteSpace知識(shí)圖譜形態(tài)的概括一樣,“一圖展春秋,一覽無余;一圖勝萬言,一目了然”。近年來,使用CiteSpace開展的研究、發(fā)表的論文呈現(xiàn)不斷上升的趨勢(shì)。根據(jù)中國知網(wǎng)的統(tǒng)計(jì),2017年相關(guān)論文已經(jīng)達(dá)到388篇;到2018年預(yù)測(cè)將達(dá)到423篇。

在如此多同質(zhì)化的文章面前,我們應(yīng)當(dāng)如何做好自己的研究才能夠不落入俗套,進(jìn)而脫穎而出呢?我認(rèn)為,在深入的把握CiteSpace的原理的基礎(chǔ)上,熟稔相關(guān)操作背后的含義,對(duì)CiteSpace軟件的應(yīng)用達(dá)到游刃有余,這樣才能知道自己的研究需要什么,做到“知己”。同時(shí)了解相關(guān)文章的研究套路,清晰他們的研究內(nèi)容和研究思路,取其精華,規(guī)避其錯(cuò)誤,做到“知彼”。下面根據(jù)我個(gè)人的一些學(xué)習(xí)的體會(huì)和實(shí)際使用的情況對(duì)CiteSpace使用過程來跟大家做一個(gè)基礎(chǔ)性的介紹。
一、CiteSpace的下載與界面介紹
訪問http://cluster.ischool.drexel.edu/~cchen/citespace/download/下載CiteSpace,一般下載最新版。當(dāng)前(2018年10月14日)最新版為5.3.R4,新版本在原來版本的基礎(chǔ)上增加了引文級(jí)聯(lián)引用功能。
使用CiteSpace需要先安裝JAVA 8,安裝教程參考jdk 8下載和安裝步驟

下載完成后解壓,打開StartCiteSpace_Windows.bat。一般選擇英文。

進(jìn)入下一個(gè)界面,提醒使用者在使用這個(gè)軟件開展研究的發(fā)表論文的時(shí)候,別忘了把軟件開發(fā)者的論文引用上,不同意就用不了,那我們當(dāng)然選擇同意。

CiteSpace的功能區(qū)域很質(zhì)樸,分為執(zhí)行操作區(qū)、時(shí)間選擇區(qū)、文本處理功能區(qū)和網(wǎng)絡(luò)配置功能區(qū)等。在隨后的論述中,再對(duì)這些功能區(qū)進(jìn)行逐一展開。

二、CiteSpace的數(shù)據(jù)來源與下載:分析的原料在哪里
使用CiteSpace分析某一主題的研究歷史與研究前沿,第一步就是要從文獻(xiàn)數(shù)據(jù)庫上下載到一定數(shù)量的文獻(xiàn)信息。外文文獻(xiàn)信息一般在web of science(WoS)上下載得到,中文文獻(xiàn)信息一般在中國知網(wǎng)(CNKI)上下載。CiteSpace是基于WoS的數(shù)據(jù)格式進(jìn)行開發(fā)的,可以根據(jù)下載得到的數(shù)據(jù)進(jìn)行合作網(wǎng)絡(luò)分析、共現(xiàn)分析和共被引分析,在非WoS數(shù)據(jù)庫下載得到的數(shù)據(jù)都需要先轉(zhuǎn)化為WoS的數(shù)據(jù)格式,根據(jù)相應(yīng)數(shù)據(jù)庫的數(shù)據(jù)維度各有其相對(duì)應(yīng)的適用范圍。就數(shù)據(jù)庫的深度看,外文數(shù)據(jù)庫我們一般使用WoS,中文數(shù)據(jù)庫一般使用CNKI。
另外,中文的文獻(xiàn)數(shù)據(jù)庫還有CSSCI數(shù)據(jù)庫、CSCD數(shù)據(jù)庫等,外文的文獻(xiàn)數(shù)據(jù)庫還包括Scopus數(shù)據(jù)庫、Derwent專利數(shù)據(jù)和其他專業(yè)領(lǐng)域的數(shù)據(jù)庫等,下載方法參考《CiteSpace:科技文本挖掘及可視化》第2講。

在數(shù)據(jù)檢索時(shí),一般有兩種檢索策略,分別是:
- 按照關(guān)鍵詞檢索
- 按照期刊檢索
我們以按照關(guān)鍵詞檢索為例,說明如何從文獻(xiàn)數(shù)據(jù)庫中,下載得到我們所需要的文獻(xiàn)數(shù)據(jù)。
1、在WoS上下載數(shù)據(jù)
在WoS上下載數(shù)據(jù),訪問WoS的官網(wǎng)http://apps.webofknowledge.com。操作的第一步是登錄,假如沒有賬號(hào),需要先行注冊(cè)一個(gè)。沒有登錄的話,是無法下載數(shù)據(jù)的。

以關(guān)鍵詞“學(xué)習(xí)成果評(píng)價(jià)”為例,鍵入其英文“l(fā)earning outcome assessment”,數(shù)據(jù)庫選擇“Web of Science核心合集”,檢索類型選擇“主題”,時(shí)間跨度選擇“所有年份”。我所在的學(xué)校購買到的數(shù)據(jù)庫是從1985年開始的,時(shí)間跨度可能對(duì)有些朋友而言不夠長。當(dāng)前國內(nèi)購買WoS數(shù)據(jù)庫跨度最長的地方是中科院文獻(xiàn)情報(bào)中心,是從20世紀(jì)初期就開始的,有需要的朋友可以到那里進(jìn)行數(shù)據(jù)下載。

得到如下頁面。從頁面中可以看出,該主題詞下的索引結(jié)果有10054條。下一步,需要對(duì)檢索結(jié)果進(jìn)行精煉。

文獻(xiàn)類型選擇“文章”,點(diǎn)擊精煉。得到的最終檢索結(jié)果為7050條,這些文獻(xiàn)數(shù)據(jù)使我們最終想要的。

隨后,滑到底部,將記錄改成每頁顯示50條。

回到頂部,按照下圖步驟,分別點(diǎn)擊“選擇頁面”,“添加到標(biāo)記結(jié)果列表”,就完成了這一頁面的數(shù)據(jù)添加。最后點(diǎn)擊“下一頁”,循環(huán)這個(gè)過程。WoS最多支持500條數(shù)據(jù)保存一次。

在標(biāo)記完500條數(shù)據(jù)后,選擇“保存為其他文件格式”。

隨后,記錄內(nèi)容選擇“全紀(jì)錄與引用的參考文獻(xiàn)”,文件格式選擇“純文本”,點(diǎn)擊“發(fā)送”,就可以得到剛才我們標(biāo)記過的500條文獻(xiàn)信息了。

下載得到的內(nèi)容包括論文標(biāo)題、作者、資助基金、關(guān)鍵詞、來源期刊、所屬領(lǐng)域、論文摘要、參考文獻(xiàn)等等。對(duì)余下文獻(xiàn)信息做相同的操作,即可以得到所需要的數(shù)據(jù)全集。

Tips:
- 關(guān)鍵詞的翻譯,例如“學(xué)習(xí)成果評(píng)價(jià)”,找出幾篇以“學(xué)習(xí)成果評(píng)價(jià)”為關(guān)鍵詞的引用率較高的文獻(xiàn),中外比較類(例如比較教育學(xué))的研究最好。參考其下的英文對(duì)照翻譯,綜合選擇即可以得到我們需要的英文關(guān)鍵詞。
- 查看相關(guān)數(shù)據(jù)時(shí),最好時(shí)候Notepad++、sublimetext等編輯器。格式更加醒目、清晰。
2、在CNKI上下載數(shù)據(jù)
在CNKI上,同理,訪問www.cnki.net,鍵入檢索詞“學(xué)習(xí)成果評(píng)價(jià)”,每頁顯示選擇“50”,勾選“全部選中”按鈕,點(diǎn)擊到下一頁,同樣以500條數(shù)據(jù)為一次下載。

在選擇完畢后,點(diǎn)擊“導(dǎo)出/參考文獻(xiàn)”。

選擇Refworks,點(diǎn)擊“導(dǎo)出”,就完成了本次下載。

得到的數(shù)據(jù)維度比WoS得到的數(shù)據(jù)維度要少一下,僅包括作者、標(biāo)題、來源期刊、關(guān)鍵詞、摘要等。對(duì)余下數(shù)據(jù)做同樣的操作,就可以得到中文的數(shù)據(jù)集。

在得到數(shù)據(jù)集后,需要將這些數(shù)據(jù)集轉(zhuǎn)化為CiteSpace可以識(shí)別、讀取的數(shù)據(jù)格式。參考如下tips即可完成轉(zhuǎn)換。
Tips:
- CiteSpace自帶有數(shù)據(jù)轉(zhuǎn)換的功能,但不太好用,容易出現(xiàn)一些問題。推薦下載使用格式轉(zhuǎn)換器。轉(zhuǎn)換器下載鏈接
- 轉(zhuǎn)換后會(huì)將原本集合在一個(gè)txt文件中的數(shù)據(jù)打散,生成一條數(shù)據(jù)一個(gè)txt的形式,txt文件過多會(huì)極大的降低了CiteSpace的運(yùn)算速度。為了解決這個(gè)問題,打開命令行工具(cmd),輸入下面的代碼,將這些TXT合并成一個(gè)。 引自:將多個(gè)txt文件合并成一個(gè)
cd F:\study\citespace\data(改成自己的數(shù)據(jù)存儲(chǔ)路徑)
type *.txt > allData.txt
二、CiteSpace的分析原理:我們?nèi)绾瓮诰颥F(xiàn)有數(shù)據(jù)
在獲取特定主題的數(shù)據(jù)后,自然而言我們會(huì)冒出一個(gè)問題:“我們拿這些數(shù)據(jù)用來做什么?”CiteSpace的最大的作用,就是能夠在這些枯燥乏味、機(jī)械重復(fù)的數(shù)據(jù)中挖掘出我們想要的東西。那么,這是依靠什么原理實(shí)現(xiàn)的呢?
1、共被引分析
在了解共被引分析前我們需要對(duì)引文分析有個(gè)概念,引文就是論文后面的參考文獻(xiàn)。有學(xué)者認(rèn)為,引文分析就是對(duì)科學(xué)期刊、論文、作者等分析對(duì)象的引用和被引用現(xiàn)象進(jìn)行分析,以揭示其數(shù)量特征和內(nèi)在規(guī)律的一種信息計(jì)量研究方法。在了解引文分析法之前我們首先要知道,學(xué)者為什么要在其論文中印證前人的研究成果。
為什么要引證:
- 為了對(duì)先驅(qū)者表示崇敬。
- 為了對(duì)相關(guān)工作表示贊賞,同時(shí)表示對(duì)同行的尊敬。
- 為了對(duì)方法或儀器設(shè)備表示認(rèn)同。
- 為了向讀者提供閱讀背景。
- 為了糾正自己的工作。
- 為了糾正別人的工作。
- 為了批評(píng)前人的工作。
- 為了支持某種論斷。
- 為了提醒人們注意即將發(fā)表的工作。
- 為了找到那些傳播不廣、索引很差又未被引證的文獻(xiàn)而提供線索。
- 為了驗(yàn)證科學(xué)事實(shí)和數(shù)據(jù),例如援引物理常數(shù)等。
- 為了鑒別曾討論過某個(gè)思想或概念的原始文獻(xiàn)。
- 為了鑒別某個(gè)時(shí)代的某個(gè)概念或術(shù)語的原始文獻(xiàn)或其他著作。
- 為了對(duì)別人的工作或思想提出反證-否定性論斷。
- 為了與別人論爭某個(gè)觀點(diǎn)的優(yōu)先權(quán)。
引自:引證論文的理由
從上面這么多引用原因我們不難看出,被引文獻(xiàn)與當(dāng)前文獻(xiàn)在內(nèi)容上是相關(guān)的。論文引用其他論文的行為可以看做是知識(shí)從不同的研究主題流動(dòng)到當(dāng)前所進(jìn)行的研究,是知識(shí)單元從游離狀態(tài)到重組產(chǎn)生新知識(shí)的過程。發(fā)表的論文被其他論文引用是這個(gè)過程的持續(xù)。由于這種引證行為的客觀存在,隨著科學(xué)研究的不斷推進(jìn),引文網(wǎng)絡(luò)也就自然而然的形成了。一篇特定的論文,引用的文獻(xiàn)稱為引用文獻(xiàn)(即后向引證關(guān)系),這篇論文發(fā)表后,引用這篇文章的論文稱為施引文獻(xiàn)(前向引證關(guān)系)。在引證網(wǎng)絡(luò)的基礎(chǔ)上,延伸出兩個(gè)重要的概念,一個(gè)是共被引分析,另一個(gè)是耦合分析。共被引分析挖掘參考文獻(xiàn)之間的關(guān)系,耦合分析挖掘施引文獻(xiàn)之間的關(guān)系,這里著重講共被引分析。
共被引分析(Co-Citation analysis)是指兩篇文獻(xiàn)共同出現(xiàn)在第三篇施引文獻(xiàn)的參考文獻(xiàn)目錄中,則這兩篇文獻(xiàn)形成共被引關(guān)系。通過對(duì)一個(gè)引文網(wǎng)絡(luò)進(jìn)行文獻(xiàn)共被引關(guān)系挖掘的過程,就可以認(rèn)為是文獻(xiàn)共被引分析的過程。例如下圖文獻(xiàn)pb1和文獻(xiàn)pb4在三篇論文中共同引用,那么他們的共被引次數(shù)為3次,通過一定的計(jì)算方式可以得到他們的關(guān)聯(lián)強(qiáng)度。共被引次數(shù)越多,這說明這兩篇文獻(xiàn)相似之處越大,關(guān)聯(lián)強(qiáng)度也越大。分析的步驟為:先從文獻(xiàn)信息中歸納得到引證矩陣,在引證矩陣的基礎(chǔ)上生成共被引矩陣。使用可視化技術(shù),將共被引矩陣可視化為網(wǎng)絡(luò)。

2、共詞分析
在進(jìn)行共詞分析之前,首先需要先了解詞頻分析。詞頻是指所分析的文檔中詞語出現(xiàn)的次數(shù)。詞頻分析就是在文獻(xiàn)信息中提取能夠表達(dá)文獻(xiàn)核心內(nèi)容的關(guān)鍵詞和主題詞頻次高地分布,來研究該領(lǐng)域發(fā)展動(dòng)向和研究熱點(diǎn)的方法。
在詞頻分析的基礎(chǔ)上,對(duì)詞頻網(wǎng)絡(luò)進(jìn)行的更高層次的分析稱為共詞分析。共詞分析的基本原理是對(duì)一組詞兩兩統(tǒng)計(jì)它們?cè)谕唤M文獻(xiàn)中出現(xiàn)的次數(shù),通過這種共現(xiàn)次數(shù)來測(cè)度他們之間的親疏關(guān)系。它需要滿足以下幾個(gè)方面的假設(shè)。
共詞分析的假設(shè)前提:
- 作者都是很認(rèn)真的選擇他們的技術(shù)術(shù)語的;
- 當(dāng)在同一篇文章中使用不同的術(shù)語時(shí),就意味著這些不同的術(shù)語之間的關(guān)系并不是微不足道,它們一定是被作者認(rèn)可和認(rèn)同的;
- 如果有足夠多的作者對(duì)同一種關(guān)系認(rèn)可,那么可以認(rèn)為這種關(guān)系在他們所關(guān)注的科學(xué)領(lǐng)域中具有一定意義;
- 當(dāng)針對(duì)關(guān)鍵詞時(shí),經(jīng)過專業(yè)學(xué)習(xí)的學(xué)者,在其論文中標(biāo)引出來的關(guān)鍵詞時(shí)能夠反映文章的內(nèi)容的,是值得信賴的指標(biāo)。在作者標(biāo)引關(guān)鍵詞時(shí),通常也會(huì)受到其他學(xué)者成果的影響而在論文中使用相同或類似的關(guān)鍵詞標(biāo)引自己的論文。
分析的步驟與共被引分析相近:先從文獻(xiàn)信息中歸納得到關(guān)鍵詞矩陣,在關(guān)鍵矩陣的基礎(chǔ)上生成共詞矩陣。使用可視化技術(shù),將共詞矩陣可視化為網(wǎng)絡(luò)。

3、突現(xiàn)分析
CiteSpace提供Burst detection的功能來探測(cè)在某一時(shí)段引用量有較大變化的情況。用以發(fā)現(xiàn)某一個(gè)主題詞、關(guān)鍵詞衰落或者興起的情況。
4、聚類分析
聚類分析指將物理或抽象對(duì)象的集合分組為由類似的對(duì)象組成的多個(gè)類的分析過程,以分析對(duì)象的相似性為基礎(chǔ)。聚類分析有許多不同的算法,CiteSpace提供的算法有3個(gè),3個(gè)算法的名稱分別是:LSI淺語義索引、LLR對(duì)數(shù)極大似然率、互信息。對(duì)不同的數(shù)據(jù),3種算法表現(xiàn)一樣,可在實(shí)踐中多做實(shí)踐。
關(guān)于這3種算法,可以參考如下文章做進(jìn)一步了解:
- LSI淺語義索引 文本主題模型之潛在語義索引(LSI)
- LLR對(duì)數(shù)極大似然率 Likelihood ratio test
- 互信息 互信息(Mutual Information
5、CiteSpace其他功能區(qū)
對(duì)于共被引分析,CiteSpace提供了引文共被引、作者共被引和期刊共被引3種不同類型的分析方法。對(duì)于共現(xiàn)分析,CiteSpace提供了術(shù)語、關(guān)鍵詞、來源、領(lǐng)域4種不同的共現(xiàn)分析。

無論是共被引分析還是共現(xiàn)分析,在生成網(wǎng)絡(luò)時(shí)都需要根據(jù)共被引次數(shù)或共現(xiàn)次數(shù)計(jì)算網(wǎng)絡(luò)節(jié)點(diǎn)之間的連接強(qiáng)度。CiteSpace提供了4種網(wǎng)絡(luò)節(jié)點(diǎn)強(qiáng)度計(jì)算的方法,一般不做改動(dòng),選擇默認(rèn)方法。

三、CiteSpace挖掘的三個(gè)方面:知識(shí)基礎(chǔ)、學(xué)科結(jié)構(gòu)、研究前沿
CiteSpace能夠在海量的文獻(xiàn)數(shù)據(jù)中,能夠以較為簡單的操作步驟挖掘出我們所需要的特定主題的三個(gè)方面的信息,包括該研究主題的知識(shí)基礎(chǔ)、相應(yīng)的學(xué)科結(jié)構(gòu)和最新的研究前沿。在進(jìn)行進(jìn)一步的論述之前,我們先來簡單介紹CiteSpace這個(gè)軟件的操作步驟。
1、知識(shí)基礎(chǔ)的獲取
任何一個(gè)研究主題,背后都會(huì)有一個(gè)較為完整的知識(shí)體系作為支撐。這個(gè)研究主題越成熟,這個(gè)知識(shí)體系越完整,越豐富。我們知道共被引網(wǎng)絡(luò)是由參考文獻(xiàn)組成的網(wǎng)絡(luò)。我們獲取的這一主題的論文,其知識(shí)構(gòu)成在很大程度上是由其參考文獻(xiàn)的知識(shí)流動(dòng)匯集得來的。那么由參考文獻(xiàn)組成的共被引網(wǎng)絡(luò)則能夠很好的揭示某一個(gè)研究主題的“先驗(yàn)知識(shí)”,即我們可以通過獲取參考文獻(xiàn)的共被引網(wǎng)絡(luò)的方式,得到某一研究主題的知識(shí)基礎(chǔ)。
以關(guān)鍵詞“高等教育”為檢索對(duì)象,得到2.5萬余條數(shù)據(jù),得到的共被引網(wǎng)絡(luò)如下:

顏色的冷暖代表了時(shí)間的遠(yuǎn)近,顏色越暖,時(shí)間越近;顏色越冷,時(shí)代越久遠(yuǎn)。那么通過對(duì)網(wǎng)絡(luò)進(jìn)行分析,對(duì)其中關(guān)鍵節(jié)點(diǎn)(即關(guān)鍵文獻(xiàn))進(jìn)行研究,就可以知道,支撐支撐高等教育發(fā)展的知識(shí)基礎(chǔ)在時(shí)間上的發(fā)展演進(jìn)情況。那么我們需要研究哪一個(gè)階段的高等教育歷史,就得找到相應(yīng)時(shí)段高等教育知識(shí)基礎(chǔ)的書籍進(jìn)行研讀、瀏覽和整理。
對(duì)這個(gè)結(jié)果網(wǎng)絡(luò)進(jìn)行聚類分析,可以看到各個(gè)階段知識(shí)基礎(chǔ)的主題的變化情況,方便我們進(jìn)行主題聚焦??梢钥吹剑谧罱难芯恐?,知識(shí)基礎(chǔ)為“反饋”類的文獻(xiàn),此時(shí)研究也許會(huì)以這個(gè)為出發(fā)點(diǎn)展開研究。

在了解整體的知識(shí)基礎(chǔ)的框架和演進(jìn)趨勢(shì)后,我們?nèi)绾螌?duì)關(guān)鍵文獻(xiàn)進(jìn)行定位?我們主要關(guān)注2個(gè)方面:
- 高頻節(jié)點(diǎn):代表高被引的文獻(xiàn),是某個(gè)領(lǐng)域或多個(gè)領(lǐng)域的重要知識(shí)基礎(chǔ)。
- 高中介中心性節(jié)點(diǎn):代表與多篇文獻(xiàn)形成共被引關(guān)系的文獻(xiàn),與多篇文獻(xiàn)均有關(guān)系,起到“交通樞紐”的作用。相對(duì)而言,是本領(lǐng)域內(nèi)的關(guān)鍵文獻(xiàn);同時(shí),也是這段時(shí)期內(nèi)的關(guān)鍵文獻(xiàn),在一定程度上代表著這段時(shí)期的研究熱點(diǎn)主題。
中介中心性是指:一個(gè)結(jié)點(diǎn)擔(dān)任其它兩個(gè)結(jié)點(diǎn)之間最短路的橋梁的次數(shù)。一個(gè)結(jié)點(diǎn)充當(dāng)“中介”的次數(shù)越高,它的中介中心度就越大。引自:度中心性(degree)、接近中心性(closeness)和中介中心性(betweenness)的理解
那么我們可以知道,同時(shí)具備高中介中心性和高頻特性的節(jié)點(diǎn),就是本領(lǐng)域內(nèi)的關(guān)鍵文獻(xiàn),也是這段時(shí)期內(nèi)的關(guān)鍵文獻(xiàn),代表著這段時(shí)期的研究熱點(diǎn)主題。

如何根據(jù)文獻(xiàn)簡略信息得到文獻(xiàn)完整信息?
- 參考博文CiteSpace的介紹與使用的“根據(jù)報(bào)告分析出的文獻(xiàn)”部分。
2、學(xué)科結(jié)構(gòu)的獲取
一篇論文的關(guān)鍵詞代表著這篇論文的論述重點(diǎn),在一定程度上反映了這篇論文的學(xué)科結(jié)構(gòu)。使用關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò),能夠?qū)?shù)據(jù)全集中的學(xué)科結(jié)構(gòu)清晰的展示出來。每一個(gè)節(jié)點(diǎn)代表一篇文獻(xiàn),節(jié)點(diǎn)越大,說明該關(guān)鍵詞詞頻越大,與主題的相關(guān)性越大。同樣,節(jié)點(diǎn)的顏色代表時(shí)間:顏色越暖,時(shí)間越近;顏色越冷,時(shí)代越久遠(yuǎn)。

3、研究前沿的獲取
使用前面提到的burst detection,可以獲取到相關(guān)研究主題的研究前沿。在獲取研究前沿前,需要先點(diǎn)擊Noun Phrases,選擇Create POS Tags。

然后把Burst Terms選中,點(diǎn)擊detect Bursts。

在彈出框中選擇noun phrases。

在知識(shí)圖譜的界面,旁邊有個(gè)Control Panel,點(diǎn)擊Burstness,點(diǎn)擊Refresh,就可以生成我們所需要的關(guān)鍵詞圖片圖。


作者:興富同學(xué)
鏈接:http://www.itdecent.cn/p/c3139ee1cf1f
來源:簡書
著作權(quán)歸作者所有。商業(yè)轉(zhuǎn)載請(qǐng)聯(lián)系作者獲得授權(quán),非商業(yè)轉(zhuǎn)載請(qǐng)注明出處。