一、資源描述框架(Resource Description Framework, 簡(jiǎn)稱 RDF)
是一個(gè)用于表達(dá)關(guān)于萬(wàn)維網(wǎng)(World Wide Web)上的資源的信息的語(yǔ)言· 它專門(mén)用于表達(dá)關(guān)于Web資源的元數(shù)據(jù), 比如Web頁(yè)面的標(biāo)題、作者和修改時(shí)間,Web文檔的版權(quán)和許可信息,某個(gè)被共享資源的可用計(jì)劃表等。然而,將“Web資源(Web resource)”這一概念一般化后,RDF可被用于表達(dá)關(guān)于任何可在Web上被標(biāo)識(shí)的事物的信息,即使有時(shí)它們不能被直接從Web上獲取。比如關(guān)于一個(gè)在線購(gòu)物機(jī)構(gòu)的某項(xiàng)產(chǎn)品的信息(例如關(guān)于規(guī)格、價(jià)格和可用性信息),或者是關(guān)于一個(gè)Web用戶在信息遞送方面的偏好的描述。
二、關(guān)聯(lián)數(shù)據(jù)(Linked Data )
Linked data 最早是在 2007 年 5 月,由 Chris Bizer and Richard Cyganiak 向 W3C SWEO 提交的一個(gè)項(xiàng)目申請(qǐng) Linked Open Data Project 中提出來(lái)的。Linked data 提出的目的是構(gòu)建一張計(jì)算機(jī)能理解的語(yǔ)義數(shù)據(jù)網(wǎng)絡(luò),而不僅僅是人能讀懂的文檔網(wǎng)絡(luò),以便于在此之上構(gòu)建更智能的應(yīng)用。例如:Amazon 上圖書(shū)可能與 MySpace 上的人之間可能存在關(guān)聯(lián),因?yàn)閳D書(shū)的作者有可能在 Myspace 上注冊(cè)賬號(hào)??傊?,Linked data 最大的特點(diǎn)便是將不同的數(shù)據(jù)關(guān)聯(lián)起來(lái)。
Linked data 包含一些基本原則:
(1)資源。在發(fā)布一個(gè)領(lǐng)域的數(shù)據(jù)之前,我們需要確定要發(fā)布的資源是什么。任何事物,只要你認(rèn)為是有意義的,有被引用必要的,都可以稱之為資源。
(2)資源標(biāo)識(shí)。任何一個(gè)資源都用一個(gè) HTTP URI(Uniform Resource Identifiers)來(lái)標(biāo)識(shí)。之所有要用 HTTP URI 來(lái)標(biāo)識(shí),是希望數(shù)據(jù)能夠通過(guò) HTTP 協(xié)議訪問(wèn),真正實(shí)現(xiàn)基于 Web 的訪問(wèn)與互聯(lián)。
(3)資源描述。資源可以有多種描述,例如 HTML,XML,RDF 以及 JPEG文檔。?Web 的文檔主要通過(guò) HTML 格式來(lái)表示,數(shù)據(jù) Web 的數(shù)據(jù)主要通過(guò) RDF格式(Resource Description Framework)來(lái)表示。RDF 將一個(gè)資源描述成一組三元組(主語(yǔ),謂語(yǔ),賓語(yǔ))。
例如:
王老師 教授 英語(yǔ)課
(主語(yǔ)) (謂語(yǔ)) (賓語(yǔ))
主語(yǔ)用來(lái)表示需要描述的資源,謂語(yǔ)用來(lái)表示主語(yǔ)的某個(gè)屬性(例如:姓名,出生日期)或者某個(gè)關(guān)系(例如,雇傭,認(rèn)識(shí),教授等),賓語(yǔ)表示了屬性的值或者關(guān)系的值。主語(yǔ),謂語(yǔ)都需要要用 HTTP URI 來(lái)表示。賓語(yǔ)可以用 HTTP URI 標(biāo)識(shí)另一個(gè)資源,也可以是字符串表示的文本。我們可以把主語(yǔ)看作是類資源,而將謂語(yǔ)看作是類資源的屬性資源,賓語(yǔ)或者是類資源或者是文字型資源。根據(jù)賓語(yǔ)的種類,可以將三元組分為兩類:文字型三元組以及非文字型三元組,第二種可以看作是類資源之間的關(guān)聯(lián)。
三、語(yǔ)義網(wǎng)(Semantic Web)
語(yǔ)義網(wǎng)的概念是由萬(wàn)維網(wǎng)聯(lián)盟的蒂姆·伯納斯-李(Tim Berners-Lee)在1998年提出的一個(gè)概念,實(shí)際上是基于很多現(xiàn)有技術(shù)的,也依賴于后來(lái)和text-and-markup與知識(shí)表現(xiàn)的綜合。蒂姆·伯納斯-李在2006年普林斯頓大學(xué)演講和后期接受媒體采訪時(shí)公開(kāi)表示,他最初將這種智能網(wǎng)絡(luò)命名為語(yǔ)義網(wǎng)或許不夠貼切,也許更準(zhǔn)確的名稱應(yīng)該是數(shù)據(jù)網(wǎng)(外語(yǔ):Data Web)。
語(yǔ)義網(wǎng)就是能夠根據(jù)語(yǔ)義進(jìn)行判斷的智能網(wǎng)絡(luò),實(shí)現(xiàn)人與電腦之間的無(wú)障礙溝通。它好比一個(gè)巨型的大腦,智能化程度極高,協(xié)調(diào)能力非常強(qiáng)大。在語(yǔ)義網(wǎng)上連接的每一部電腦不但能夠理解詞語(yǔ)和概念,而且還能夠理解它們之間的邏輯關(guān)系,可以干人所從事的工作。它將使人類從搜索相關(guān)網(wǎng)頁(yè)的繁重勞動(dòng)中解放出來(lái),把用戶變成全能的上帝。語(yǔ)義網(wǎng)中的計(jì)算機(jī)能利用自己的智能軟件,在萬(wàn)維網(wǎng)上的海量資源中找到你所需要的信息,從而將一個(gè)個(gè)現(xiàn)存的信息孤島發(fā)展成一個(gè)巨大的數(shù)據(jù)庫(kù)。
例如,某天早上你突然想去可可西里旅游,于是你打開(kāi)電腦,連通語(yǔ)義網(wǎng),輸入“預(yù)訂今天下午兩點(diǎn)到六點(diǎn)之間任意時(shí)刻的到可可西里的飛機(jī)票”,此刻你的計(jì)算機(jī)代理將先與你所住地點(diǎn)航空公司的代理進(jìn)行聯(lián)系,獲得符合你要求的飛機(jī)票信息,然后聯(lián)系航空公司的訂票代理,完成訂購(gòu)。你不必像現(xiàn)在這樣上網(wǎng)查看時(shí)間表,并進(jìn)行拷貝和粘貼,然后打電話或在線預(yù)訂機(jī)票和賓館等,安裝在你計(jì)算機(jī)上的軟件會(huì)自動(dòng)替你完成上述步驟,你所做的僅僅是用鼠標(biāo)按幾個(gè)按鈕,然后等著送飛機(jī)票的人上門(mén)甚至直接去機(jī)場(chǎng)登機(jī)就可以了。
在瀏覽新聞時(shí),語(yǔ)義網(wǎng)將給每一篇新聞報(bào)道貼上標(biāo)簽,分門(mén)別類的詳細(xì)描述哪句是作者、哪句是導(dǎo)語(yǔ)、哪句是標(biāo)題。這樣,如果你在搜索引擎里輸入“老舍的作品”,你就可以輕松找到老舍的作品,而不是關(guān)于他的文章。