在信息爆炸的時代,每天都有大量的信息數(shù)據(jù)產(chǎn)出,作者在文中的主題是信息的秩序和組織方式,我認為正是從信息管理的角度入手思考的,這也能給我們信管專業(yè)的發(fā)展和思維方式提供更多的引導。
一、關(guān)于比特秩序的思考
作者在文中提到了“三階秩序”,第一階是實體秩序,也就是按照物理位置存儲和查找信息,就像數(shù)據(jù)結(jié)構(gòu)中的線性結(jié)構(gòu);第二階是索引秩序,也是我們之前很通用的信息組織方式,就是為信息制造索引表,對信息的物理位置順序沒有多少要求,就像數(shù)據(jù)結(jié)構(gòu)中的哈希表;而作者反復提到的第三階秩序,是一種大眾化分類,按我粗淺的理解,也就是信息時代的每個人都能為信息添加自己想要的各種標簽。
在我們原本接受的要保持東西井然有序的思維教育下,跟前兩個相比,它表面上看起來是“無序”的,甚至是雜亂的。但是在信息世界中,信息本身就是十分龐大且混亂的,而且每時每刻都在迅速更新,在這樣的環(huán)境下,原本的分類體系就會帶來巨大的工作量,而且它的準確率也會下降。書中有一個例子,美國國會圖書館擁有的藏書有大約2900萬,而藏書的數(shù)量每天還在快速增長,有三四百名的編目員對每本書進行查看并在圖書館的28.5萬個主題標目中選出合適的主題。面對大量的書籍,國會圖書館做出的改變是每年編目員們可以根據(jù)自己的經(jīng)驗提出新的類目標簽,再進行投票表決,圖書館每年都會創(chuàng)建8萬個新的主題標目。由此可見無論是確保圖書不會混亂無序,還是對主題標目的建設(shè)和維護,都是很大的工作量。
在前兩階秩序的分類體系中,大多數(shù)的目錄都屬于上下級或者平行關(guān)系,而在標簽制的大眾化分類中,卻互無同屬,交叉現(xiàn)象極其普遍。對于傳統(tǒng)的分類方式來說,這種方式實在是太混亂了。但是在網(wǎng)民大規(guī)模的參與后,這種看起來十分混亂的隨意分類能形成信息的高效率定位。擺脫了大量信息的分類方法由少數(shù)人來決定的局面后,標簽式的分類方法或許能更加體現(xiàn)群眾的興趣和觀點,能幫助他們更加容易地搜索到想要的內(nèi)容。正如溫伯格在書中所言,“我們組織世界的方式不但反映了世界,也反映了我們的興趣、我們的激情、我們的需求和我們的夢想”。本書的標題說“萬物皆無序”,在混亂無序的表面下,隱藏著對大眾來說更加方便生動的數(shù)據(jù)分類方式。在三階秩序中,數(shù)位做主,混亂無序也做主。
二、ICT環(huán)境下的信息組織的任務(wù)與挑戰(zhàn)
ICT是信息、通信和技術(shù)三個英文單詞的詞頭組合(Information and Communications Technology,簡稱ICT) 。它是信息技術(shù)與通信技術(shù)相融合而形成的一個新的概念和新的技術(shù)領(lǐng)域。在數(shù)字化時代,通信技術(shù)為我們帶來了巨大的信息量。作為一種技術(shù),它不僅僅提供多種業(yè)務(wù),也不僅是信息的傳遞和共享,而且還是一種通用的智能工具。這種工具的產(chǎn)生也為信息組織方式帶來了沖擊。
第一個挑戰(zhàn)是信息的存儲模式。數(shù)據(jù)庫技術(shù)是現(xiàn)代信息的主要存儲模式,它主要是對大量的規(guī)范化的信息進行存儲管理,面向結(jié)構(gòu)化的數(shù)據(jù)處理。在傳統(tǒng)的文獻管理的環(huán)境下,它主要是記錄在關(guān)系型數(shù)據(jù)庫中,但是關(guān)系型數(shù)據(jù)庫處理網(wǎng)絡(luò)環(huán)境中許多無序的、非結(jié)構(gòu)化的數(shù)據(jù)會有很多局限性。非結(jié)構(gòu)化數(shù)據(jù)庫彌補了關(guān)系型數(shù)據(jù)庫的不足,但是要完成龐大的網(wǎng)絡(luò)信息的所有組織功能,依然需要多種數(shù)據(jù)庫技術(shù)的結(jié)合。信息組織的所對應(yīng)的任務(wù)就是合理利用多種數(shù)據(jù)庫技術(shù),尋找合適的信息存儲模式,以適應(yīng)ICT環(huán)境下信息的快速增長。
第二個挑戰(zhàn)是信息的管理模式,特別是分類模式。首先,信息原本的分類方法大多都十分嚴謹,一經(jīng)建立很難改動,而缺少動態(tài)性;其次,信息的分類方式很容易出現(xiàn)邊界模糊的問題,書中美國國會圖書館的周會上關(guān)于“斯里蘭卡人”類目標簽的爭議就反應(yīng)了這個問題。而在ICT環(huán)境下的數(shù)據(jù)更新速度很快,具有較強的動態(tài)性,標簽法能為信息分類帶來新的組織方式,但是由于它龐大的數(shù)據(jù)量和雜亂性,也會為信息的管理在標簽管理和分析方面帶來困難。
第三個挑戰(zhàn)是信息檢索方式,特別是在查全率和查準率方面的矛盾。雖然搜索引擎提供提高查準率的高級檢索方式,但是熟練使用的人占少部分。大多數(shù)人的檢索方式都是基于主題法的關(guān)鍵字檢索,這樣的查全率很高,但是查準率會比較低。另外在用戶一部分的搜索行為中,用戶輸入的關(guān)鍵字并不是信息本身帶有的詞組,而是用戶的主觀記憶,在這種情況下檢索效率會大大降低。標簽化的秩比特序或許能解決這種問題,另外提供標簽的復合檢索方式能在提高查全率和查準率方面發(fā)揮作用。
三、總結(jié)
在ICT環(huán)境下,信息迅速發(fā)展,信息組織技術(shù)必須在思維和方式兩方面都做出相應(yīng)的改變,以適應(yīng)快速變化的信息環(huán)境,推動ICT行業(yè)的良好發(fā)展。