1.背景介紹
微格式:建立在已有的、被廣泛采用的標(biāo)準(zhǔn)基礎(chǔ)之上的一組簡單的、開放的數(shù)據(jù)格式
(microformats.org官方定義)。是把語義嵌入到HTML以便有助于分離式開發(fā)而
制定的一些簡單約定,是兼顧人機(jī)可讀性設(shè)計(jì)的數(shù)據(jù)表達(dá)方式,對Web網(wǎng)頁進(jìn)行語義注解的方法。
這種方法依托于標(biāo)準(zhǔn)的Web頁面寫作技術(shù),例如,XHTML,這樣引入語義信息對瀏覽器等所有現(xiàn)存
的Web技術(shù)沖擊最小。采用Microformat的 Web頁面,在XHTML文檔中給一些標(biāo)簽(Tag)增加一些屬性
(attribute),這些屬性對信息的語義結(jié)構(gòu)進(jìn)行注解,處理XHTML文檔的軟件,例如,瀏覽器等,
如果不認(rèn)識這些屬性可以跳過,并不造成任何不良影響(ITPUB)簡單點(diǎn)說:通過語意相關(guān)讓內(nèi)容人機(jī)可讀
2.知識剖析
網(wǎng)頁上的允許的微格式數(shù)據(jù)包括事件、人物、地點(diǎn)等,它可以被其他的軟件檢測到,并提取出相應(yīng)的信息,以及對信息進(jìn)行索引、搜索、跨平臺的參考,把這些信息以其他形式重復(fù)使用或組合。目前已具備完整規(guī)范的微格式還包括:hCard、hCalendar、XOXO、XFN、VoteLinks和3個“rel-”微格式:rel- license、rel-nofollow和rel-tag。
3.編碼實(shí)戰(zhàn)
北京:39.90556;116.39139
簡單的微格式
我們從上面的描述知道,微格式實(shí)際就是為現(xiàn)有的(X)HTML元素添加元數(shù)據(jù)
和其他屬性,增強(qiáng)語義。那么我們就來看一個簡單的微格式應(yīng)用吧。
而現(xiàn)在我們要為這個代碼元素a加上rel屬性。
上面的鏈接標(biāo)記的a標(biāo)簽包括rel=”home”屬性,該屬性顯示鏈接的目標(biāo)頁面是該網(wǎng)站的首頁。
通過為已有的鏈接元素添加語義化屬性,就為這個鏈接添加了具體的結(jié)構(gòu)和意義。
4.擴(kuò)展思考
微格式在實(shí)際應(yīng)用中的意義和作用又是什么呢?
在爬取Web內(nèi)容時,能夠更為準(zhǔn)確地識別內(nèi)容塊的語義;
對內(nèi)容進(jìn)行操作,包括提供訪問、校對,還可以將其轉(zhuǎn)化成其他的相關(guān)格式,提供給外部程序和Web服務(wù)使用。
5..參考文獻(xiàn)
參考一:博客
6.更多討論
Microformat有效地在Web文檔中增加語義信息,然而,現(xiàn)有Web上的海量信息
全部改造成符合該標(biāo)準(zhǔn)的內(nèi)容顯然是不現(xiàn)實(shí)的,一種替代方法就是給現(xiàn)有的互聯(lián)網(wǎng)內(nèi)容增加一個
語義描述層,這一層可以獨(dú)立于原信息頁面進(jìn)行建設(shè),MetaSeeker工具包是這類解決方案的佼佼者。
ppt:ptteng.github.io/PPT/PPT/css-12-Microformat.html#/
視頻: