早期知識表示簡介:
知識是智能的基礎(chǔ),提供推理能力。
相對正確性、不確定性、可表示性、可利用性。
常識性知識、領(lǐng)域性知識;
事實(shí)性知識、過程性知識、控制知識;
確定性知識、不確定性知識。
早期知識表示方法:
1、First-Order Logic
Horn邏輯:
原子:has_child(Helen,Jack)
Rules:has_child(X,Y):-has_son(X,Y)
Tbox:內(nèi)涵知識、Abox:斷言
2、Production Rule:
IF...THEN...
CF為知識的強(qiáng)度
3、Framework:
<框架名>
槽名:側(cè)面名? 值1,值2,...,值p1
........................
約束:約束條件1
? ? ? ? ? ? ?.........
?? ?? ? ? 約束條件n
4、Semantic Network:
節(jié)點(diǎn)-弧-節(jié)點(diǎn)
用謂詞邏輯表示
基于語義網(wǎng)Semantic Web得知識表示框架:
W3C推薦的語義網(wǎng)標(biāo)準(zhǔn)棧:
表示-查詢-推理-置信
最主要的方面A web of link data:SPARQL、RDF
use RDF as data format
use URLs as names for things
use HTTP URLs so that people can look up those names
RDF:資源描述框架
Resource:頁面、圖片、視頻等任何具有URL標(biāo)識符
Description:屬性、特征和資源之間的關(guān)系
Framework:模型、語言和這些描述的語法
在RDF中知識總是以三元組triple形式出現(xiàn)
(subject、predicate、object)
RDF本身也是一個(gè)圖模型(vertex,edge,vertex)
in RDF resources and properties are identified by URLs
通過namespace減少前綴冗余進(jìn)行URLs的縮寫
in RDF values of properties can also be literals i.e. strings of characters:(CCF ADL,theme,"KG"),此時(shí)"KG"稱之為字面值literal,其他為resource
in RDF literals values of properties can also be typed with XML datatypes
字符串+類型約束
在CCF ADL上演講了三小時(shí):
ex:ccf_adl——ex-schema:nbHours——"3"^^xsd:interger
RDF空白節(jié)點(diǎn)blank nodes:
匿名的資源,作為鏈接某一個(gè)非匿名的資源的橋梁
A是某一次知識圖譜講座的講者:
ex:A——ex-schema:speaker——_:x——ex-schema:theme——ex:KG
二跳,可以表示更復(fù)雜的多元關(guān)系
RDF是數(shù)據(jù)模型,不是序列化格式。
可以用XML、Turtle、N-Triples等方式表示。
開放世界假設(shè):沒有定義的內(nèi)容只代表不知道,而不是不存在。
分布式定義的知識可以自動合并。
帶標(biāo)注的RDF(變種)annotated RDF:
(s,p,o):標(biāo)志
(特朗普,就職,總統(tǒng)):2017年1月
RDFS(schema):
在RDF的基礎(chǔ)上提供了一個(gè)術(shù)語、概念等的定義方式,以及哪些屬性可以應(yīng)用到哪些對象上。
規(guī)范了概念層schema的內(nèi)容。
為RDF定義了如下詞匯:
class,subclassof,type,property,subpropertyof,domain,range
OWL和OWL2
Web Ontology Language
三個(gè)子語言:lite/DL/Full
exp是命名空間http://www.example.org的別稱。
等價(jià)性聲明:
exp:運(yùn)動員 owl:equivalentCalss exp:體育選手
傳遞關(guān)系:
exp:ancestor rdf:type owl:TransitiveProperty
互反關(guān)系:
exp:ancestor? owl:inverseOf exp:descendant
函數(shù)性屬性(唯一性):
exp:hasMother rdf:type owl:FunctionalProperty
OWL2:OWL的新版本
SPARQL:
RDF的查詢語言:基于RDF數(shù)據(jù)模型。
PREFIX:? ? #聲明
FROM? ? #dataset(graph)
SELECT
WHERE{ ...... }
ORDER BY
RDF中的資源以?或者$表示變量
查詢所有選秀CS328的學(xué)生:
PREFIX exp:http://www.example.org/
SELECT ?student
WHERE{
? ? ?student exp:studies exp:CS328.
}
查詢所有的收購關(guān)系:
SELECT ?P ?X
WHERE{
? ? ?P finance:control ?c.
? ? ?c finance:acquire ?X.
}
ontology可以填充知識與查詢之間的語義間隙。
把member和relative的語義間隙給填充了。
SELECT * WHERE{
? ? ?x member ?y.
? ? ?z founder ?y.
? ? ?z relative ?x.
}
寫成規(guī)則的形式:
hold_share(X,Y):-control(X,Y)
conn_trans(Y,Z):-hold_share(X,Y),hold_share(X,Z)
JSON-LD:
JavaScript Object Notation for Linked Data
基于JSON表示和傳輸互聯(lián)數(shù)據(jù)Linked Data的方法。
JSON-LD通過引入規(guī)范的術(shù)語表示,使得數(shù)據(jù)交換和機(jī)器理解成為基礎(chǔ)
JSON中的:
{
? ? "name":"tai_park"
}
變成JSON-LD中的:
{
? ? "http://schema.org/name":"tai_park"
}
圍繞某類知識提供共享的術(shù)語。
RDFa:
網(wǎng)頁標(biāo)記語言,擴(kuò)展了XHTML的幾個(gè)屬性。
Wikinomics
HTML5 Microdata:
Andy
RDF+SPARQL 對比 ER+SQL:
RDF:關(guān)系顯示定義(語義存在于數(shù)據(jù)中)——數(shù)據(jù)變更較為方便(圖增加邊更為方便)
ER:關(guān)系隱式聲明(語義存在于人腦中)
ER+SQL:Dumb Data->Smart Application Code
RDF+SPARQL:Smart Data->Uniform Inference Engine
典型知識庫項(xiàng)目的知識表示:
DBpedia:
dbo:有約束的定義
dbr:資源
dbp:沒有約束而僅有數(shù)據(jù)層的定義
TAGO2:
上層->維基百科內(nèi)容->lable用以實(shí)體消歧
Freebase:
data/schema/Queries
復(fù)合值類型CVT:處理多元關(guān)系。一個(gè)CVT就是一個(gè)有唯一MID的Object,也可以有多個(gè)Types。
Wikidata:
有頂層的對象:Entity
時(shí)空約束:qualifiers/reference
NELL:
文本抽取并用圖整合
基于Protege本體工具的知識建模實(shí)踐:
模式層/實(shí)例層