兩周前有幸在上海的 TED Meetup 做了一場關(guān)于「開放數(shù)據(jù)」的活動,拖拖拉拉到今天總算有時間寫一下這場活動中一些精彩的討論。
開放數(shù)據(jù)是否會造就終極「老大哥」?
活動一開始先是播放了萬維網(wǎng)之父 Sir Tim 在2009年做的一場 Ted 演講,其實這場演講本身并不單單是說「開放數(shù)據(jù)」,而是涉及了他本身對下一代萬維網(wǎng)——語義網(wǎng)的設(shè)想。語義網(wǎng)的設(shè)想核心之一是鏈接數(shù)據(jù)(Linked Data),即能夠互相超鏈接的數(shù)據(jù),而其發(fā)展過程中的重要一環(huán)就是去將數(shù)據(jù)開放,使得更多數(shù)據(jù)得以被鏈接。
而基于此理念,現(xiàn)場的討論也就集中在了開放數(shù)據(jù),不單單政府開放而且各級機(jī)構(gòu)、單位、甚至個人都開放數(shù)據(jù),最終是否會最后使得政府擁有更大的能量來監(jiān)控一切。特別是考慮到像美國NSA計劃的曝光,是否開放數(shù)據(jù)會為政府機(jī)構(gòu)提供免費NSA?誰來監(jiān)管對這些數(shù)據(jù)的搜集和使用?
對于這一點,小伙伴們主要討論了未來個人隱私數(shù)據(jù)的控制。有人提到,對于個人數(shù)據(jù),首先要想辦法從服務(wù)提供商處取回自己的數(shù)據(jù),以進(jìn)行監(jiān)管。這一點在近幾年來都有一定的初步計劃,比如美國政府的 Green Button 和 Blue Button 就將個人的能源使用數(shù)據(jù)和健康數(shù)據(jù)返還給個人自由下載利用,Google 也有相應(yīng)的計劃將用戶使用數(shù)據(jù)返回給個人。
但這也僅是第一步,更長遠(yuǎn)的來看,我們需要改變的是目前用戶與服務(wù)提供商之間的關(guān)系?,F(xiàn)在的模式是我們自愿將數(shù)據(jù)完全交給服務(wù)提供商來換取服務(wù),而未來,我們需要完全掌控自己的個人數(shù)據(jù),服務(wù)提供商如果想要利用我們的數(shù)據(jù),那么就需要至少取得我們的許可,甚至需要付費訪問。而這種模式也將會有利于個人去開放一些自己的隱私數(shù)據(jù)(比如基因數(shù)據(jù)等等)供研究機(jī)構(gòu)使用,甚至供商業(yè)公司使用。
當(dāng)我們對自己數(shù)據(jù)有著更好的掌控之時,至少老大哥對個人隱私的窺探可能會受到一定的阻礙,但還有更多是需要我們?nèi)ヅΩ淖儚亩_保萬維網(wǎng)的更鏈接、開放不會導(dǎo)致數(shù)據(jù)寡頭出現(xiàn),從而威脅到我們對萬維網(wǎng)的自由使用。
開放數(shù)據(jù)在中國,開放有何難?
活動的第二部分是由我介紹了中國開放數(shù)據(jù)運動現(xiàn)狀,整個的演講圍繞著「中國大陸開放數(shù)據(jù)運動時間線」開展,介紹了國內(nèi)對開放數(shù)據(jù)理念的認(rèn)知情況,政府相關(guān)工作情況以及民間社區(qū)發(fā)展情況。
在演講后的討論中,有人提問,數(shù)據(jù)開放對于政府部門而言不是很簡單嗎?他們本身就有那么多數(shù)據(jù)在網(wǎng)上公開可以找到,現(xiàn)在只是要他們拿出開放格式的,為什么進(jìn)程那么慢? 這里實際而言有兩個問題,一是對于開放數(shù)據(jù),不是簡單將數(shù)據(jù)拿出來就結(jié)束了。這涉及到開放數(shù)據(jù)的法律體系和文檔完善的問題。所謂法律體系,這里指的便是開放數(shù)據(jù)所應(yīng)有的開放授權(quán)協(xié)議,即一個授予所有人無限制使用與分發(fā)該數(shù)據(jù)的權(quán)利的協(xié)議。這一協(xié)議的建立決定了開放數(shù)據(jù)運動的成敗,需要各政府部門認(rèn)同相關(guān)理念并有良好的法律、政策框架來確保開放授權(quán)協(xié)議的運作。其次,對于開放數(shù)據(jù)而言,為了使用者能理解和正確使用數(shù)據(jù),必要的文檔是非常需要的。這里說的文檔需要闡述數(shù)據(jù)的收集方式 ,數(shù)據(jù)的編碼方式,數(shù)據(jù)涉及的年度范圍等等。缺失這些元信息,數(shù)據(jù)即使開放,也無法真正被使用。
另一個非常有意思的問題涉及了政府不開放數(shù)據(jù)的常用理由(其他常見理由,可參見這里,這里,這里和這里):我們害怕人們誤讀數(shù)據(jù)而造成負(fù)面影響, 所以我們要等人們有足夠能力和素質(zhì)來正確理解數(shù)據(jù)才開放我們的數(shù)據(jù)。針對這一問題,其實很久之前加拿大的開放數(shù)據(jù)專家 David Eaves 就曾經(jīng)撰文指出,類似于過去是否要造圖書館讓人們獲取知識一樣,現(xiàn)在開放數(shù)據(jù)是為了更好地讓人們具備處理和理解數(shù)據(jù)的能力。所以應(yīng)當(dāng)在人們具備數(shù)據(jù)解讀和運用能力之前,就大規(guī)模開放數(shù)據(jù)。然而,在中國,我們獲取要考慮另一個問題,那就是人們往往對于政府的作為都是情緒化的。比如,對于空氣質(zhì)量數(shù)據(jù),就曾經(jīng)被指責(zé)和美使館數(shù)據(jù)相差太多,而被人們懷疑造假。但實際上,之前已經(jīng)有人做過相關(guān)的研究,發(fā)現(xiàn)國內(nèi)空氣質(zhì)量數(shù)據(jù)其實比美使館的數(shù)據(jù)來得更靠譜,因為國內(nèi)的數(shù)據(jù)是從多個監(jiān)控點搜集回來再綜合得到的結(jié)果。因此,這里如何讓人們更為理性地去使用數(shù)據(jù),以及政府應(yīng)當(dāng)如何更好地和人們溝通數(shù)據(jù)背后的故事(采集方法等),則成為一個需要好好研究的問題。
雖說國內(nèi)開放數(shù)據(jù)運動的路還很長,尚有很多工作要做,但隨著國內(nèi)開放數(shù)據(jù)的呼聲日益高漲,國內(nèi)無論是政府還是民間社區(qū)目前都應(yīng)當(dāng)開始準(zhǔn)備好迎接開放數(shù)據(jù)的時代。