隨著我們創(chuàng)造在不受實體限制的只是世界中行得通的新原則,信息不僅僅只想要自由——它還想要無序。 ——戴維·溫伯格
進入21世紀之后,計算機技術(shù)的發(fā)展日新月異,信息的載體也從在現(xiàn)實生活中存在的紙張等由原子構(gòu)成的事物變成了存在虛擬空間里的各種流。而隨著信息不再受實體的限制,我們對信息的組織方法也產(chǎn)生了巨大的改變。以前,我們的物質(zhì)世界組織信息的方式都會有一個唯一“合適”的標準,也就是說,某一樣事物該待在哪里是有規(guī)定的,都能找到屬于它自己的位置。現(xiàn)在,比起制定一個唯一的標準,我們更傾向于根據(jù)我們自身的興趣愛好來為事物進行排序,也就是讓每一樣?xùn)|西待在對于我們來說最便于使用的地方——并不限定于一處。
戴維·溫伯格在他的《萬物皆無序:新數(shù)字秩序的革命》中說明了信息組織的發(fā)展過程,并將整個世界的秩序分為一階、二階和三階。一階秩序指的是我們現(xiàn)實生活里的事物,即我們對事物本身的整理;二階秩序時我們有了元數(shù)據(jù)——即描述事物的信息,但這些元數(shù)據(jù)還是需要記載在卡片上,仍然受到現(xiàn)實生活原子物體的限制;進入三階秩序后,我們開始有了數(shù)位,信息不再需要記載在一個特定的實體上,而是儲存在虛擬空間中,這時我們的元數(shù)據(jù)可以比事物本身所包含的內(nèi)容還要多得多。從這時開始,信息開始從我們曾經(jīng)給它列出的條條框框中掙脫出來, “樹葉”不再安分地待在本來的地方,而是通過無數(shù)的鏈接建立聯(lián)系,從“樹”變成了“網(wǎng)”。
從字母表出現(xiàn)之后,有很多東西都采用字母排序法,比如百科全書、音樂播放列表等等。這種排序方法或許能滿足那些明確地知道自己想要什么的人,但并不是所有人在搜索的時候都會明確的知道自己想要什么。這也表明——
“發(fā)現(xiàn)”你想要什么,與“找到”你知道自己要的東西,至少也是同等重要的?!骶S·溫伯格
也就是說,嚴格地遵循某一種組織標準來對信息進行組織并不能適用在每一個用戶身上。而且,在這個技術(shù)飛速發(fā)展的社會下,信息量的大小呈爆炸式增長,固定的組織標準根本沒有辦法適應(yīng)整個社會的變化——比如杜威的十進制。誠然,現(xiàn)在大多數(shù)圖書館使用的都是這種組織方式,但是戴維指出,這個方法在現(xiàn)在顯得十分過時,而且也出現(xiàn)了很多錯誤。那為什么不改過來呢?戴維在他的書里給出了答案——并不是不想改,實際上,這個規(guī)則一直在進行小幅度的調(diào)整,但是如果要進行一次改頭換面的大改的話,涉及的面會非常的廣,世界各地的管理員們都有要重新給書籍貼上新的標簽,而且說不定在他們把新標簽都貼上之前又出現(xiàn)了新的變化。
綜上所述,在數(shù)字化的時代,我們已經(jīng)不像以前那樣需要專家來為我們制定一個權(quán)威的標準。我們組織信息的方式,取決于我們打算如何使用它們,或者說,我們?nèi)绾卫斫馑鼈?。但是理解和知識本身是基于個體的,個體間的不同會讓組織的方式呈現(xiàn)出千變?nèi)f化的態(tài)勢——我認為《明朝那些事兒》是屬于歷史類的書籍,而你覺得它應(yīng)該待在小說架子上——這些不同的認知直接呈現(xiàn)出來就是我們在給事物分類(完全按照個人意愿)時會出現(xiàn)各種各樣的類別,也就是我所理解的無序。即在我看來,三階秩序下的混亂無序指的是標簽的混亂、信息組織方式的混亂。而現(xiàn)在我們的數(shù)字化世界,正充斥著這種混亂——當然,這也沒什么不好。
那么,基于上面對三階秩序混亂無序的理解,對于ICT環(huán)境下信息組織的任務(wù)和挑戰(zhàn),我覺得有以下三點——在開始討論這個之前,先來看看百度百科對ICT環(huán)境的定義:
ICT是信息、通信和技術(shù)三個英文單詞的詞頭組合(Information Communications Technology,簡稱ICT) 。它是信息技術(shù)與通信技術(shù)相融合而形成的一個新的概念和新的技術(shù)領(lǐng)域。
第一個挑戰(zhàn):數(shù)據(jù)的整理和歸類。信息經(jīng)過提煉數(shù)據(jù)獲得,這也意味著,對數(shù)據(jù)的整理和歸類對于信息的組織來說有著很大的影響。我們?nèi)绾螌Λ@得的數(shù)據(jù)進行整理決定了我們最后能獲得什么樣的信息。而我們需要獲得的信息又與我們需要做的事情息息相關(guān),也就是說,由于個人需求的不同,數(shù)據(jù)的整理歸類方式也會多種多樣,而如何從這一堆堆混亂的數(shù)據(jù)中選取可以滿足不同用戶的信息需求的那一堆數(shù)據(jù),就需要我們在最開始的整理和分類時進行考慮。比如說,在面對像圖片網(wǎng)站Flickr上的那些海量的圖片文件時,我們應(yīng)該怎么才能更好地完成對這些圖片的處理,是像Flickr那樣完全由用戶提供標簽?或者由網(wǎng)站管理者根據(jù)自己的知識和經(jīng)驗來對這些圖片進行分類?還是通過其他的什么方法?這些都是我們在提供信息之前所要考慮的。
第二個挑戰(zhàn):信息的描述。我們決定信息的描述的方法也就決定了我們需不需要元數(shù)據(jù),需要哪些元數(shù)據(jù)。前面說過,不同用戶對于同一事物也會由于其本身的差異而產(chǎn)生不同的理解。很顯然,當我們試圖了解某一樣事物時,我們都會先嘗試給它下一個定義,正如戴維所說
知識的第一要務(wù)就是識別定義標準。
但是如何去定義事物是一個具有很大爭議的過程,你很難說清楚為什么這個東西要這么定義。而且在三階秩序里,信息需要無序,而無序的信息就代表著它是沒有疆界的。在這種情況下,如何去向用戶準確的描述出這個信息,就更難了。而若是不為信息添加用來描述它的元數(shù)據(jù),就會使得信息陷入一種比現(xiàn)在的混亂更混亂的狀態(tài)——完全任由個人發(fā)揮會使這些信息沒有統(tǒng)一性。尤其是在法學(xué)、化學(xué)等較為嚴謹、非此即彼的學(xué)科,混亂的信息將會帶來很大的問題。所以,如何去描述我們提供的信息,把握混亂和有序之間的平衡點也是我們在進行信息組織的過程中遇到的挑戰(zhàn)。
第三個挑戰(zhàn):信息與信息之間的聯(lián)系。亞馬遜商城通過各種各樣的超鏈接將你從這本書帶到另一本書,這種關(guān)聯(lián)功能不僅讓你了解到這兩本書之間可能存在的關(guān)系,也能讓你探索到與之相關(guān)的其他信息。也就是說,它帶來了一種拓展搜索的方法,可以更好地幫助我們發(fā)現(xiàn)我們“想要什么”。另一方面,在我們平時生活中談話時總是會自行加入一些“隱式信息”來幫助我們理解對方話語中的一些信息,這體現(xiàn)在數(shù)字化世界中,就表明我們需要通過某些關(guān)聯(lián)的信息來告訴我們某個事物的含義。也就是說,我們需要通過信息之間的聯(lián)系來深入了解某一樣事物。但是,信息之間的關(guān)聯(lián)越多,整個信息網(wǎng)的結(jié)構(gòu)就會越復(fù)雜,如何在信息組織的過程中處理好這種“混亂的聯(lián)系”,就是我認為的ICT環(huán)境下信息組織的第三個挑戰(zhàn)。
我們處于一個三階秩序的數(shù)字時代,處處都充滿了信息,但這也意味著有很多信息對我們來說其實是冗余的,而解決信息冗余的方法,就是使用更多的信息來對其管理,這就導(dǎo)致了混亂的產(chǎn)生。但是由于數(shù)字世界的獨特性,我們往往看不到這些混亂。用戴維的話來說
我們所唯一能見到的三階混雜無序,就是混雜無序的各種各樣的排序。
在這種情況下,我認為我們要做的信息組織其實就是從這些混雜無序的排序中選取一些符合接受我們服務(wù)的用戶的需求的方案,或者說,為用戶提供一種在我們控制得了的情況下讓他們自行對內(nèi)容進行排序的方法。而在這個過程中,上述的三個挑戰(zhàn)會貫穿始終。最后引用一段戴維的話來對信息組織企業(yè)所提供的服務(wù)進行總結(jié)——
在真正混雜無序的世界中,成功的企業(yè)除了它們試圖銷售給我們的東西之外,什么都不擁有;所有其他的,都是我們的。