論文關(guān)鍵詞:: 科學(xué)大數(shù)據(jù); 數(shù)據(jù)開放; 數(shù)據(jù)共享; 模式; 共享機(jī)制
論文來源:《情報(bào)理論與實(shí)踐》
研究意義與背景:科學(xué)數(shù)據(jù)是進(jìn)行科研活動(dòng)的重要成果,對(duì)科技創(chuàng)新、濟(jì)和社會(huì)發(fā)展具有重要意義。隨著云計(jì)算、物聯(lián)網(wǎng)、大科學(xué)裝置等的蓬勃發(fā)展,科學(xué)數(shù)據(jù)正以前所未有的速度增長(zhǎng),人類已經(jīng)步入大數(shù)據(jù)時(shí)代。已經(jīng)成為科研活動(dòng)的核心,以及科技創(chuàng)新發(fā)展的核心驅(qū)動(dòng)要素。作為數(shù)字化革命的引擎,“大數(shù)據(jù)” 為眾多科學(xué)研究帶來新的機(jī)遇。科學(xué)范式開始從模型驅(qū)動(dòng)向數(shù)據(jù)驅(qū)動(dòng)轉(zhuǎn)變。
研究目的
歸納科學(xué)大數(shù)據(jù)開放共享的典型模式、相關(guān)利益者、關(guān)鍵影響要素和關(guān)鍵機(jī)制,推動(dòng)科學(xué)數(shù)據(jù)在國(guó)際間的開放共享。
研究?jī)?nèi)容
科學(xué)裝置的單元數(shù)據(jù)共享模式
模式產(chǎn)生原因:研究目標(biāo)宏大、問題復(fù)雜、成本高
類別:大科學(xué)裝置、跨機(jī)構(gòu)合作的大規(guī)模研究項(xiàng)目
共享路徑:根據(jù)有關(guān)研究任務(wù)的數(shù)據(jù)采集計(jì)劃產(chǎn)生原始數(shù)據(jù),原始數(shù)據(jù)和處理后數(shù)據(jù)存儲(chǔ)到服務(wù)于該大科學(xué)裝置的數(shù)據(jù)中心或服務(wù)系統(tǒng)中,并優(yōu)先在參與相應(yīng)研究任務(wù)的合作者范圍內(nèi)共享,一定時(shí)間
后將部分或全部數(shù)據(jù) (時(shí)間周期及數(shù)據(jù)范圍視該大科學(xué)裝置所確定的數(shù)據(jù)開放政策或條例而定) 通過數(shù)據(jù)中心或服務(wù)系統(tǒng)集中發(fā)布、開放給公眾。

廣域合作驅(qū)動(dòng)的分布式注冊(cè)模式
方式:通過構(gòu)建物理上分布、邏輯上統(tǒng)一的一站式數(shù)據(jù)共享服務(wù)平臺(tái)在聯(lián)盟間或全球范圍內(nèi)進(jìn)行科研數(shù)據(jù)的開放、共享和交換
案例:GEOSS、GBIF
共享路徑:各成員首先按照統(tǒng)一的標(biāo)準(zhǔn)和規(guī)范將松散分布的數(shù)據(jù)、元數(shù)據(jù)、產(chǎn)品和服務(wù)進(jìn)行集中注冊(cè),由統(tǒng)一的數(shù)據(jù)門戶負(fù)責(zé)連接各注冊(cè)數(shù)據(jù)資源,為用戶提供一站式數(shù)據(jù)檢索和定位服務(wù),最終由分布式的數(shù)據(jù)服務(wù)系統(tǒng)提供數(shù)據(jù)獲取服務(wù)。國(guó)際合作組織制定數(shù)據(jù)開放原則要求各成員在不違背政策法規(guī)基礎(chǔ)上,盡可能保障全面、開放、及時(shí)、免費(fèi) (低成本)、非歧視和不受限制地獲取元數(shù)據(jù)、數(shù)據(jù)、產(chǎn)品和服務(wù)。同時(shí),要求數(shù)據(jù)提供者確保數(shù)據(jù)經(jīng)過權(quán)威認(rèn)證,并保證數(shù)據(jù)服務(wù)的穩(wěn)定性和可靠性。國(guó)際合作組織通過定期召開全體會(huì)議、制定計(jì)劃、簽署協(xié)定、組織活動(dòng)等方式推動(dòng)國(guó)際合作大科學(xué)研究的持續(xù)發(fā)展。

基于數(shù)據(jù)存儲(chǔ)庫的集中存繳模式
在學(xué)科開放共享文化、開放共享原則及各類期刊數(shù)據(jù)歸檔政策的驅(qū)動(dòng)下,科研人員、論文作者、科研機(jī)構(gòu)通過數(shù)據(jù)存儲(chǔ)庫進(jìn)行數(shù)據(jù)的集中存繳,并利用數(shù)據(jù)存儲(chǔ)庫提供的在線發(fā)布功能進(jìn)行科學(xué)數(shù)據(jù)資源的發(fā)布、共享和重用。

科學(xué)數(shù)據(jù)出版
數(shù)據(jù)出版主要分為廣義的數(shù)據(jù)發(fā)布、期刊附屬物類型的數(shù)據(jù)出版以及數(shù)據(jù)集與數(shù)據(jù)描述共同出版三大類,狹義的數(shù)據(jù)出版主要指最后一種。

數(shù)據(jù)集市
按照數(shù)據(jù)提供者組織形式可以將數(shù)據(jù)集市分為兩種典型模式: 在以數(shù)據(jù)堂 (www.
datatang. com) 為代表的數(shù)據(jù)集市交易中,分散的數(shù)據(jù)擁有者借助數(shù)據(jù)堂的交易平臺(tái)實(shí)現(xiàn)面向最終用戶的交互分享。在以遙感集市為代表的數(shù)據(jù)集市交易中,數(shù)據(jù)源由集成化、規(guī)?;膯我恢黧w提供。

參考:
Radiomics: the process and the challenges文獻(xiàn)全文 - 學(xué)術(shù)范 (xueshufan.com)