這一部分就不準(zhǔn)備用英語(yǔ)了,因?yàn)樵谶@段時(shí)間的學(xué)習(xí)和查找過(guò)程中,發(fā)現(xiàn)關(guān)于RDF(Resource Description Framework)的中文資料較少,并且質(zhì)量也不是特別高。希望我的思考能給這相關(guān)方面的初學(xué)者帶來(lái)幫助。由于自己也是初學(xué),水平有限,歡迎交流。
這里有最基本的語(yǔ)法常識(shí),也有很多詳細(xì)介紹,后面我會(huì)從中提煉出一些重要的來(lái)。
W3C教程之RDF
W3C給它的定義
RDF 是一個(gè)框架,用來(lái)描述網(wǎng)絡(luò)資源,諸如網(wǎng)頁(yè)的標(biāo)題、作者、修改日期、內(nèi)容以及版權(quán)信息等。
在我看來(lái),簡(jiǎn)單的說(shuō),RDF數(shù)據(jù)庫(kù)就是關(guān)系型數(shù)據(jù)庫(kù)的最大競(jìng)爭(zhēng)對(duì)手。
共同點(diǎn):他們都是為了存儲(chǔ)數(shù)據(jù)而活
不同點(diǎn):RDF,相較于關(guān)系型,它是另一種建立和表示數(shù)據(jù)關(guān)系的一種方式。
眾所周知,關(guān)系型數(shù)據(jù)庫(kù)是用表 來(lái)維系數(shù)據(jù)的整體性。如一個(gè)成績(jī)單,一份財(cái)務(wù)報(bào)表。通過(guò)key來(lái)提取所需要的數(shù)據(jù)。
然而,RDF則是通過(guò)URI(Uniform Resource Identifier)來(lái)聯(lián)系所有的數(shù)據(jù)元組,元組就是數(shù)據(jù)的基本單位。通過(guò) URI 來(lái)提取數(shù)據(jù),當(dāng)然還可以添加一些賓語(yǔ)或者主語(yǔ)來(lái)限定(取決于我們要提取的東西)。
Web上可用的每種資源 - HTML文檔、圖像、視頻片段、程序等 - 由一個(gè)通用資源標(biāo)志符(Uniform Resource Identifier, 簡(jiǎn)稱(chēng)"URI")進(jìn)行定位---搜狗百科
RDF主要有5種表示方式;
1.RDF/XML
例如要表示一列數(shù)據(jù):Empire Burlesque(title) Bob Dylan(artist) USA(country) Columbia(company) 10.90(price) 1985(year)---取自W3C
<rdf:Description
rdf:about="http://www.recshop.fake/cd/Empire Burlesque">
<cd:artist>Bob Dylan</cd:artist>
<cd:country>USA</cd:country>
<cd:company>Columbia</cd:company>
<cd:price>10.90</cd:price>
<cd:year>1985</cd:year>
</rdf:Description>
主體:rdf:about="http://www.recshop.fake/cd/Empire Burlesque
謂體:artist,country。。。(一般是URI形式)
賓語(yǔ):USA,Columbia。。。
之前提到的元組就是由這三部分組成。
通常,主體和謂體是資源形式(URI),賓語(yǔ)可以是資源,也可以如上面所示,為屬性值。

2.三元組(Turtle)
例如要表示之前的信息:
<http://www.recshop.fake/cd/Empire Burlesque> <cd/artist> “Bob Dylan”
這種形式更加容易理解,也是很多時(shí)候我們提取數(shù)據(jù)時(shí)的理想格式,適用于Sparql查詢(xún)。
3.N-3元組(N-Triples)
N-Triples 的定義
格式舉例 取自wiki
<http://www.w3.org/2001/sw/RDFCore/ntriples/> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> ?
<http://xmlns.com/foaf/0.1/Document> .
<http://www.w3.org/2001/sw/RDFCore/ntriples/> <http://purl.org/dc/terms/title> "N-Triples"@en-US .
<http://www.w3.org/2001/sw/RDFCore/ntriples/> <http://xmlns.com/foaf/0.1/maker> _:art .
<http://www.w3.org/2001/sw/RDFCore/ntriples/> <http://xmlns.com/foaf/0.1/maker> _:dave .
_:art <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://xmlns.com/foaf/0.1/Person> .
_:art <http://xmlns.com/foaf/0.1/name> "Art Barstow".
_:dave <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://xmlns.com/foaf/0.1/Person> .
_:dave <http://xmlns.com/foaf/0.1/name> "Dave Beckett".
對(duì)它確實(shí)沒(méi)有太多研究。
4.N-Quads
定義
簡(jiǎn)單的說(shuō),是上一個(gè)類(lèi)型的子集,主要用于RDF圖的表達(dá)
5.JSON-LD
定義
基于json的一種格式
優(yōu)點(diǎn)
1.XML是用來(lái)傳輸數(shù)據(jù)的語(yǔ)言,用JavaScript就可以將其添加進(jìn)HTML。所以利用XML可以很好地將RDF和web端連接在一起。
2.RDF利用URI來(lái)鏈接數(shù)據(jù),它的所有資源形式的主體和謂體都可以作為一個(gè)新的主體或者是謂體。并且,視頻,圖片程序等資源都可以被檢索到。對(duì)于一個(gè)query,RDF數(shù)據(jù)庫(kù)將能提供所有的相關(guān)數(shù)據(jù)而不受表單的限制。
實(shí)例
在澳大利亞昆士蘭大學(xué)的一群教授,開(kāi)發(fā)了一個(gè)RDF數(shù)據(jù)庫(kù),叫做Ontology-driven Data repository,針對(duì)表型組學(xué)的研究(phenomics)。全稱(chēng)叫做PODD。
因?yàn)榭茖W(xué)家對(duì)data分析需求的特殊性,他們對(duì)數(shù)據(jù)的提取不能受限于表單的數(shù)量,所以一個(gè)全新的數(shù)據(jù)庫(kù)就這樣誕生了。(本體論簡(jiǎn)介)