2018-11-30

這是第一階段的復(fù)盤。

課程第一階段已經(jīng)結(jié)束,現(xiàn)在我們來(lái)復(fù)盤一下。

首先,這是一門什么課程?這是一門幫助同學(xué)們提高學(xué)習(xí)力的課程,不是僅僅教會(huì)大家一些檢索技巧、方法、立竿見(jiàn)影的課程(當(dāng)然,這也是課程的重要一部分),而是培養(yǎng)大家終身學(xué)習(xí)能力的課程,這種能力是信息生態(tài)環(huán)境下人們所應(yīng)必須具備的基本能力。它不能立竿見(jiàn)影,它要改變你的學(xué)習(xí)理念、學(xué)習(xí)情感、學(xué)習(xí)方法,一旦你的理念改變了,那么你將擁有超人的學(xué)習(xí)力!

網(wǎng)絡(luò)的發(fā)達(dá),已經(jīng)讓人們身處信息海洋而無(wú)法自拔,同學(xué)們每天有大量的學(xué)習(xí)任務(wù)、還要見(jiàn)縫插針地刷微信、聊QQ,看干貨文章……那么,你是如何學(xué)習(xí)數(shù)學(xué)、運(yùn)籌學(xué)、博弈論等課程的?還是靠老師投喂嗎?你所學(xué)習(xí)的東西,在未來(lái)的工作中是如何應(yīng)用的?它們的應(yīng)用場(chǎng)景是什么?你了解你所學(xué)的這個(gè)專業(yè)嗎?一年前看過(guò)的干貨文章現(xiàn)在還記得多少?是不是遇到問(wèn)題時(shí),依然是從頭開(kāi)始到處找資料?

從心理學(xué)角度和對(duì)人類學(xué)習(xí)機(jī)制的研究發(fā)現(xiàn),學(xué)習(xí)是一個(gè)閉環(huán)流程,從信息的輸入、大腦的處理到知識(shí)的輸出,流程中的每一環(huán)都缺一不可,以前我們學(xué)習(xí)只輸入,沒(méi)有輸出(解決實(shí)際問(wèn)題),那么環(huán)就斷了。

輸入環(huán)節(jié),我們要克制,杜絕暴飲暴食,只吃對(duì)解決問(wèn)題有關(guān)的信息,因此,我們要梳理一下自己的信息來(lái)源,做到斷舍離。

處理環(huán)節(jié)是對(duì)信息進(jìn)行批判性接收、組織、整合和創(chuàng)造的過(guò)程,這個(gè)過(guò)程,我提出來(lái)的最基本要求是對(duì)你收集到的文章進(jìn)行費(fèi)曼,并將新的知識(shí)迭代到你的知識(shí)體系中(可以用xMind思維導(dǎo)圖幫助自己梳理)。

學(xué)習(xí)的輸出就是知識(shí)利用環(huán)節(jié),將所學(xué)去解決實(shí)際問(wèn)題,就是有效的輸出,這樣的所學(xué)才會(huì)真正成為你自己的知識(shí),而不是躺在某個(gè)文件夾或書(shū)架旮旯里睡覺(jué)的信息。


就以我自己的學(xué)習(xí)為例吧!(真慚愧,我自己也是在學(xué)習(xí)的路上,跟大家在這里分享,我們教學(xué)相長(zhǎng)吧!)


2015年,我申請(qǐng)成功一項(xiàng)課題,是一個(gè)將研究生的學(xué)習(xí)、科研及管理三者信息打通,以本體庫(kù)形式保存,以實(shí)現(xiàn)研究生信息智能檢索的知識(shí)庫(kù)。

申請(qǐng)這個(gè)課題是因?yàn)槲野l(fā)現(xiàn)目前我校的研究生管理在學(xué)習(xí)、科研和在學(xué)期間的各種管理事務(wù)被人為的分開(kāi)了,信息散落在各個(gè)科室和人員手中,卻無(wú)法實(shí)現(xiàn)信息的集成,導(dǎo)致各種工作的信息流不暢,需要一個(gè)智能檢索系統(tǒng),能在合適的時(shí)間向合適的人推送信息,在對(duì)某個(gè)主題進(jìn)行檢索時(shí)推送與之相關(guān)的其他信息,從而實(shí)現(xiàn)檢索的智能化和信息的完備,而我意識(shí)到本體庫(kù)是一個(gè)非常好的解決方案。


好吧,問(wèn)題來(lái)了,真是不知天高地厚啊,我只是知道構(gòu)建本體庫(kù)是一個(gè)很好的解決方案,卻對(duì)本體庫(kù)所知甚少。兩年,我必須在兩年時(shí)間完成這個(gè)課題,怎么辦?


借鑒前人經(jīng)驗(yàn)是最快捷的方式,于是,我提出了一系列問(wèn)題:

誰(shuí)研究本體?

誰(shuí)做本體知識(shí)庫(kù)?

他們是怎么做的?


帶著這個(gè)問(wèn)題,我先在中國(guó)知網(wǎng)數(shù)據(jù)庫(kù)中進(jìn)行檢索(先看看國(guó)內(nèi)的研究情況)。

用主題=(本體 or Ontology)檢索,不查不知道,一查嚇一跳,從1992年到2015年,共檢索出6000多篇文章,手工剔除一些不相關(guān)文獻(xiàn)(諸如約稿等信息),還剩近6000篇,這么大量的文獻(xiàn),超出了我的大腦處理范圍,于是,我選擇了一個(gè)工具CiteSpace[1],幫我分析,于是,得到了圖1,也知道了我應(yīng)該重點(diǎn)關(guān)注的機(jī)構(gòu)和學(xué)者群體,當(dāng)然,現(xiàn)在知網(wǎng)把這個(gè)功能做出來(lái)了。

圖1? ?機(jī)構(gòu)與研究者聚類圖

接下來(lái),我想知道他們都在具體研究什么?所以,我將排名前十的機(jī)構(gòu)發(fā)表的文章全部檢索出來(lái),用CiteSpace又做了個(gè)主題聚類,如圖2所示(當(dāng)然,這個(gè)功能目前知網(wǎng)也給大家提供了)。

圖2? 主題詞聚類圖

額~~~,本體構(gòu)建與這么多或陌生或熟悉的詞相關(guān)?。-@ 本體映射、元數(shù)據(jù)、概念相似度、知識(shí)表示、描述邏輯、OWL、Protege……。從哪下手好呢?我的目標(biāo)是構(gòu)建本體知識(shí)庫(kù),那么就直奔主題,主題詞=(本體 or 本體庫(kù)) and (構(gòu)建 or 系統(tǒng) or 應(yīng)用),檢索出來(lái)的結(jié)果還是不錯(cuò),我發(fā)現(xiàn)了很多我需要的文章,將這些文章下載到我的文獻(xiàn)管理工具里保存好,并對(duì)它們進(jìn)行了分類:

[1]綜述類:幫助我快速了解當(dāng)前本體系統(tǒng)構(gòu)建的研究情況;

[2]方法類:沒(méi)有好的方法一切都是瞎忙,先搞明白構(gòu)建方法;

[3]工具類:系統(tǒng)設(shè)計(jì)肯定需要工具幫助實(shí)現(xiàn),他們都用什么工具?

[4]實(shí)現(xiàn)類:看看他們是用什么方法、什么工具、怎么實(shí)現(xiàn)的。

[5]理論研究類:里面一些年代很新的文章,有的是目前的研究熱點(diǎn),有些是在未來(lái)可能會(huì)成為熱點(diǎn)的研究前沿,但是目前還在理論研究階段,還未實(shí)現(xiàn)或不成熟,要掌握熱點(diǎn)和前沿,這些文章可是必須要看的,但是對(duì)于我來(lái)說(shuō),首先要搭建起一個(gè)本體庫(kù)雛形,所以,得先借鑒已有的本體庫(kù)系統(tǒng),架子搭起來(lái)之后,要提升本體庫(kù)的功能,就必須看這些文章了,所以可以先把它們下載保存,如圖3所示。

圖3? ?文獻(xiàn)的分類管理

接下來(lái)的工作就是先讀綜述,用最快的速度全面了解本體庫(kù)構(gòu)建方面的情況,因?yàn)檎业降木C述文章比較老,所以,我必須自己去大量閱讀“實(shí)現(xiàn)”類(部分文獻(xiàn)如圖4所示),以了解目前在本體庫(kù)建設(shè)方面的實(shí)現(xiàn)案例。

圖4? ?閱讀的本體構(gòu)建方面的文獻(xiàn)

通過(guò)閱讀發(fā)現(xiàn),由于本體的應(yīng)用領(lǐng)域、表達(dá)知識(shí)的范圍、抽象程度、應(yīng)用范圍等存在不同,本體也分為若干類別,而我要建立的是一種應(yīng)用本體,而且,本體的表達(dá)重心直接決定了本體結(jié)構(gòu),那些文獻(xiàn)中所構(gòu)建的本體結(jié)構(gòu)從三元組到七元組不等,我把它們都捋了一遍,如下圖5所示。

圖5? ?本體結(jié)構(gòu)與表達(dá)

到底我要用幾元組去表達(dá)呢?再回頭去看那些文章,專門找那些實(shí)現(xiàn)功能與自己要做的一致或接近的文章,看不懂的概念重點(diǎn)標(biāo)注,集中查。由于成熟的概念一般不會(huì)在期刊文章中詳細(xì)闡述,那些寫期刊文章的作者會(huì)理所當(dāng)然地把它當(dāng)做別人應(yīng)該懂的東西直接拿來(lái)用,所以,你不要再到期刊里去找答案了,這時(shí)候要去找圖書(shū)、找百科,我優(yōu)先找了wikipedia,wikipedia的起步比百度百科早多了,所以,那上面的詞條解釋比百度百科強(qiáng)的多。

搞明白上面的元組,根據(jù)我的功能要求,我選擇了五元組結(jié)構(gòu),接下來(lái)的問(wèn)題就是用什么構(gòu)建方法。當(dāng)時(shí)我們研究團(tuán)隊(duì)里的一個(gè)隊(duì)員正好負(fù)責(zé)這一塊,她開(kāi)始快速閱讀歸到“方法”類里的文章,又捋了一遍,這次是很詳細(xì)地捋了一遍,每種方法是怎么樣的,有什么優(yōu)點(diǎn)、缺點(diǎn)等,看看我們做出來(lái)的目錄(如圖6所示)就知道了。

圖6? ?本體構(gòu)建方法梳理輸出

捋完后,我們確定了本體構(gòu)建方法,又邁出了一步!緊跟著,問(wèn)題又來(lái)了:用什么工具建?通過(guò)前邊文章的閱讀以及對(duì)歸到“工具”類里文章的快速閱讀,比較了各種工具的優(yōu)缺點(diǎn),特別是對(duì)中文的支持情況,我們很快鎖定Protege[2]這個(gè)工具。

一座大山壓下來(lái)——Protege,以前從來(lái)沒(méi)有用過(guò),我需要快速掌握這個(gè)軟件的使用!于是我首先檢索到它的下載地址,安裝,然后,找到Protege的官網(wǎng),找到Protege的Wikipedia,在那里,我找到了快速上手的模板文件,斯坦福大學(xué)的設(shè)計(jì)者真是很貼心,為了幫助我們快速上手,做好了一個(gè)pizza的本體文件供大家下載,然后按照他們提供的“說(shuō)明書(shū)”學(xué)習(xí)。

學(xué)會(huì)了工具的基本使用后,我開(kāi)始進(jìn)入本體庫(kù)的設(shè)計(jì)階段,期間的工作我在此省略萬(wàn)字,部分工作可以看我的目錄(如圖7所示)。

圖7 省略萬(wàn)字的知識(shí)輸出目錄

這期間的辛酸一言難盡,首先是中文支持問(wèn)題,當(dāng)初選擇Protege時(shí)就是沖著它的中文支持度好,但是我安裝上之后,在屬性顯示上總是出現(xiàn)亂碼,其他地方的漢字顯示正常,為了解決這個(gè)問(wèn)題,我利用搜索引擎,與或非邏輯運(yùn)算、限定詞等十八般武器全用上了,最后終于在一個(gè)Protege網(wǎng)站上的用戶發(fā)帖中找到了解決辦法,狂汗……。然后就是原來(lái)學(xué)的入門級(jí)Protege不夠用了,于是我發(fā)現(xiàn)了CSDN上的一個(gè)博主,大神啊,他做了個(gè)Protege的入門、進(jìn)階1、進(jìn)階2,正是我需要的!

在這期間,為了方便解決本體構(gòu)建方面的疑難雜癥,我最先想到的是咱學(xué)校的計(jì)算機(jī)學(xué)院,因?yàn)椋以跈z索文獻(xiàn)時(shí)發(fā)現(xiàn),咱們學(xué)校就有一個(gè)學(xué)生寫過(guò)這方面的學(xué)位論文,那么他的導(dǎo)師當(dāng)然是我要請(qǐng)教的重點(diǎn)!另外,我也在QQ上發(fā)現(xiàn)了一個(gè)本體學(xué)習(xí)群,加入后立刻感覺(jué)找到了組織,因?yàn)椋诖酥?,我周圍的同事、學(xué)生沒(méi)有一個(gè)用Protege的!

開(kāi)始,我在群里是個(gè)問(wèn)問(wèn)題的活躍分子,很幸運(yùn),這個(gè)群里的伙伴都很熱心,問(wèn)的問(wèn)題都能得到很好的解答,逐漸的,我也成了回答別人問(wèn)題的人,我想這應(yīng)該就是分享的要義——人人為我,我為人人。

從簡(jiǎn)單關(guān)系圖到復(fù)雜關(guān)系圖,我一步步的做下來(lái),遇上問(wèn)題先檢索,自己解決,解決不了的,問(wèn)小伙伴(低級(jí)的、自己能解決的問(wèn)題盡量不麻煩他人),漸漸有了雛形,省略若干圖……。


架子搭起來(lái)后,要對(duì)本體進(jìn)行驗(yàn)證,看看能不能實(shí)現(xiàn)邏輯推理,是否信息揭示全面,一致性如何?但是要驗(yàn)證,必須先有一定量的基礎(chǔ)實(shí)體數(shù)據(jù),數(shù)據(jù)量太少不行,多了呢,手工輸入?太多了,批量導(dǎo)入才行,但是問(wèn)題又來(lái)了,散落在網(wǎng)站上的大量要手工收集?怎么辦?搜索引擎發(fā)動(dòng),搜索比較了幾款網(wǎng)絡(luò)自動(dòng)抓取工具,我決定用——八爪魚(yú)。哎~~~,八爪魚(yú)[3]也沒(méi)用過(guò),于是又搜索八爪魚(yú)的使用方法,文字版、視頻版倒是豐富,很快我建好了自己的抓取規(guī)則,把研究生院網(wǎng)站上的相關(guān)信息抓了個(gè)干凈!

好了,所有要批量導(dǎo)入的信息我都收集起來(lái)整理好了,但是,但是——Protege的導(dǎo)入居然需要安裝插件,居然還要編寫導(dǎo)入規(guī)則!沒(méi)有一篇文獻(xiàn)曾經(jīng)告訴我說(shuō)用Protege構(gòu)建本體需要做這些工作!??!實(shí)踐出真知?。∮谑俏以僖淮螜z索Protege實(shí)體批量導(dǎo)入問(wèn)題的解決方案,學(xué)習(xí)了MappingMaster[4]語(yǔ)言,編寫了導(dǎo)入規(guī)則,把excel導(dǎo)入文件的格式按要求做好,最后用Cellfile功能終于把實(shí)體導(dǎo)入了。驗(yàn)證的結(jié)果還是比較讓人滿意的(如圖8、圖9所示)。

圖8? ?驗(yàn)證過(guò)程
圖9 驗(yàn)證過(guò)程

當(dāng)然,做到這里還沒(méi)有結(jié)束,當(dāng)實(shí)體量達(dá)到一定量時(shí),Protege的推理已經(jīng)慢的無(wú)法讓人忍受了,所以,Protege只是用來(lái)構(gòu)建本體的工具,真正實(shí)現(xiàn)基于本體的檢索功能,得用數(shù)據(jù)庫(kù),這是我在前期閱讀文獻(xiàn)時(shí)就知道了的,因此,根據(jù)前人的經(jīng)驗(yàn),我選擇了mysql數(shù)據(jù)庫(kù),術(shù)業(yè)有專攻,數(shù)據(jù)庫(kù)我是搞不定的,在QQ群和計(jì)算機(jī)學(xué)院,我分別拉來(lái)一個(gè)伙伴,計(jì)算機(jī)學(xué)院的是一個(gè)即將畢業(yè)的學(xué)生(畢業(yè)后他去了工作節(jié)奏非??斓纳虾#瑓s依然幫助我完成后續(xù)的工作,在此我再次表示感謝!)QQ群里的應(yīng)該也是一個(gè)學(xué)校的學(xué)生,對(duì)我?guī)椭采醵?!總之,都是令我崇拜的大神,因?yàn)椋麄兛偰軐⑽倚枰獙?shí)現(xiàn)的意圖很快編程搞定,在我搭建檢索系統(tǒng)、建立與Protege的會(huì)話過(guò)程中,遇上的各種問(wèn)題,他們都能輕松幫我搞定。

好了,說(shuō)到這里,我來(lái)個(gè)總結(jié)吧。

[1]永遠(yuǎn)永遠(yuǎn)不要等到“萬(wàn)事俱備”時(shí)再去解決問(wèn)題。

永遠(yuǎn)不要對(duì)自己說(shuō),我**還沒(méi)有學(xué)好呢,哪還能解決這個(gè)問(wèn)題,等我學(xué)好了**再去解決吧!要知道,那個(gè)問(wèn)題不會(huì)等你學(xué)好了讓你去解決,它會(huì)被其他人早早解決,而在你面前的永遠(yuǎn)是你當(dāng)時(shí)認(rèn)為還不能解決的問(wèn)題。所以,未來(lái)學(xué)習(xí)的常態(tài)是——做中學(xué),學(xué)中做!

[2]高效的學(xué)習(xí)過(guò)程是一個(gè)完整的閉環(huán),從提出信息需求開(kāi)始,對(duì)信息源、信息類型進(jìn)行基本定位,進(jìn)行策略性檢索,對(duì)檢索到的信息內(nèi)容進(jìn)行基本判斷和辨識(shí),對(duì)信息進(jìn)行組織管理,費(fèi)曼信息,最后解決你的問(wèn)題。你一定一定要完整走一圈,再走一圈,不要在某一段路上來(lái)回走,那么你會(huì)永遠(yuǎn)呆在原地。

[3]三個(gè)臭皮匠頂個(gè)諸葛亮,永遠(yuǎn)不要忽視團(tuán)隊(duì)的力量。信息的共享共建、團(tuán)隊(duì)合作、交流、互動(dòng),這是幫助你快速成長(zhǎng)的快捷車道。

[4]文獻(xiàn)的檢索不是一蹴而就,這個(gè)工作會(huì)隨著研究的深入而不斷的進(jìn)行,關(guān)于該主題的知識(shí),在你面前就如一顆小型炸彈,不,更形象地說(shuō),就如一顆種子,發(fā)芽,然后隨著你檢索的深入,學(xué)習(xí)的深入,亭亭如蓋!而獲取文獻(xiàn)線索的方法多種多樣,有時(shí)是通過(guò)搜索引擎發(fā)現(xiàn),有時(shí)需要通過(guò)文獻(xiàn)的引證關(guān)系得到線索,有時(shí)是在文獻(xiàn)正文中得到線索……你的檢索詞的選取、檢索工具的選擇都會(huì)隨之不同。然后,非常重要的一點(diǎn):學(xué)習(xí)是一個(gè)不斷迭代的過(guò)程,你需要在學(xué)習(xí)的過(guò)程中管理好自己的知識(shí)庫(kù)(那些你費(fèi)曼過(guò)的文獻(xiàn)一定要好好保存下來(lái),放進(jìn)你的個(gè)人知識(shí)庫(kù)中,養(yǎng)成這個(gè)好習(xí)慣,你以后會(huì)偷著樂(lè)的!課上我給大家講了如何構(gòu)建一輩子夠用的個(gè)人知識(shí)庫(kù)體系)。

下一階段,大家就要行動(dòng)起來(lái)了!你要為自己設(shè)定一個(gè)小小的研究目標(biāo),并為了這個(gè)目標(biāo)而開(kāi)啟檢索、學(xué)習(xí)、實(shí)踐、達(dá)成目標(biāo)的攀登之旅了!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 關(guān)于Mongodb的全面總結(jié) MongoDB的內(nèi)部構(gòu)造《MongoDB The Definitive Guide》...
    中v中閱讀 32,306評(píng)論 2 89
  • Android 自定義View的各種姿勢(shì)1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 179,063評(píng)論 25 709
  • 用兩張圖告訴你,為什么你的 App 會(huì)卡頓? - Android - 掘金 Cover 有什么料? 從這篇文章中你...
    hw1212閱讀 14,009評(píng)論 2 59
  • 讓博客Docker化,輕松上手Docker Docker是一個(gè)有趣的技術(shù),在過(guò)去的兩年已經(jīng)從一個(gè)想法變成了全世界的...
    喵喵唔的老巢閱讀 401評(píng)論 0 0
  • 心儀的鞋子斷碼了,就去旁邊店買一件漂亮的大衣。常去的面館停業(yè)了,就去別家吃一碗好吃的粉。喜歡的人離開(kāi)了,就好好上課...
    真心熊閱讀 184評(píng)論 0 1

友情鏈接更多精彩內(nèi)容