設(shè)計(jì)網(wǎng)站信息架構(gòu)必須了解的敘詞表、受控詞表以及元數(shù)據(jù)(上)

敘詞表、受控詞表、以及元數(shù)據(jù)

元數(shù)據(jù)和受控詞表是一組迷人的鏡頭,可以讓你看見(jiàn)系統(tǒng)間的關(guān)系。
在很多采用元數(shù)據(jù)的大型網(wǎng)站中,受控詞表是把系統(tǒng)粘在一起的黏膠。后端的敘詞表則能讓前端的用戶感受到更無(wú)暇且令人滿意的體驗(yàn)。

元數(shù)據(jù)

“關(guān)于數(shù)據(jù)的數(shù)據(jù)”
對(duì)數(shù)據(jù)處理而言,元數(shù)據(jù)是一種用于定義的數(shù)據(jù),能夠提供其他被某種應(yīng)用軟件或環(huán)境所管理的數(shù)據(jù)的相關(guān)信息或者說(shuō)明。

元數(shù)據(jù)可以為數(shù)據(jù)說(shuō)明其元素或?qū)傩裕Q、大小、數(shù)據(jù)類(lèi)型,等)
或者其記錄或結(jié)構(gòu)(長(zhǎng)度、字段、數(shù)據(jù)列,等)
或者其相關(guān)數(shù)據(jù)(位于何處、如何聯(lián)系、擁有者,等)

元數(shù)據(jù)可能包含描述性信息,說(shuō)明數(shù)據(jù)的情境、質(zhì)量或狀態(tài),或者特征。

善用內(nèi)容管理軟件受控詞表,就能夠建立動(dòng)態(tài)的、由元數(shù)據(jù)驅(qū)動(dòng)的網(wǎng)站,而且支持分布式內(nèi)容創(chuàng)作方式,以及有力的導(dǎo)航方式。這種元數(shù)據(jù)驅(qū)動(dòng)的模式,完全改變了網(wǎng)站構(gòu)建和管理的方式。
我們不再問(wèn)“我要把文件歸類(lèi)在何處?”
我們現(xiàn)在可以問(wèn)“我要怎么樣描述這份文件?”

受控詞表

最模糊的說(shuō)法:受控詞表是任何一組自然語(yǔ)言的子集;
最簡(jiǎn)單的說(shuō)法
受控詞表是一份等價(jià)術(shù)語(yǔ)清單,按同義詞環(huán)圈的形式排列;
或者是一份優(yōu)選術(shù)語(yǔ)清單,存儲(chǔ)在規(guī)范文檔中。

定義術(shù)語(yǔ)之間的等級(jí)關(guān)系(如上位類(lèi)、下位類(lèi)),就有了分類(lèi)體系;
建立概念之間關(guān)聯(lián)的模型,就是在做敘詞表

幾種不同受控詞表及其關(guān)系


2017-12-11-22-22-08.jpg

同義詞環(huán)圈

同義詞環(huán)圈把一組定義為等價(jià)關(guān)系的詞匯鏈接起來(lái),以供搜索之用。
事實(shí)上,這些詞通常不是真正的同義詞。
很多情況下,通過(guò)檢查搜索日志,或者和用戶交流,你會(huì)發(fā)現(xiàn)不同的人在尋找同樣的東西時(shí),會(huì)使用不同的術(shù)語(yǔ)。比如描述“筆記本”,也可能會(huì)說(shuō)“本子”、“筆記”、“記事本”、“notebook”等等。這種情況下,如果沒(méi)有優(yōu)選術(shù)語(yǔ),那么就應(yīng)該善用搜索引擎建立同義詞環(huán)圈,把這組等價(jià)術(shù)語(yǔ)放到文本文件中,當(dāng)用戶輸入其中一個(gè)詞匯給搜索引擎時(shí),就拿這個(gè)詞匯和文本文件進(jìn)行比較。如果找到該詞匯,則查詢就會(huì)“擴(kuò)展”,將同義詞環(huán)圈中的其他術(shù)語(yǔ)也包含進(jìn)來(lái)。

比較直觀的例子就是電商平臺(tái),如在某寶上搜索“詞匯一”,同時(shí)系統(tǒng)也會(huì)問(wèn)你,是不是再找“詞匯二”、“詞匯三”……即可以實(shí)現(xiàn)我們常說(shuō)的“模糊搜索”。

善用同義詞環(huán)圈能夠給用戶帶來(lái)驚喜般的搜索體驗(yàn),但同樣也會(huì)帶來(lái)問(wèn)題:如果查詢屬于的拓展是在幕后進(jìn)行,用戶看見(jiàn)一些結(jié)果并沒(méi)有包含其關(guān)鍵詞時(shí),就會(huì)感到困惑。這里會(huì)涉及到兩個(gè)概念:
查準(zhǔn)率:結(jié)果集內(nèi)文件的相關(guān)性;
查全率:結(jié)果集內(nèi)相關(guān)文件和系統(tǒng)中所有相關(guān)文件的比值;
同時(shí)具備較高的查準(zhǔn)率和查全率,是最理想的,但對(duì)于信息檢索領(lǐng)域而言,二者很難兼得。同義詞環(huán)圈可以大幅改善檢索,在小型數(shù)據(jù)庫(kù)中,可以增加20%-80%的查全率,但會(huì)降低查準(zhǔn)率。
良好的界面設(shè)計(jì)以及對(duì)用戶的目標(biāo)有了解時(shí),可以幫助我們達(dá)到最佳平衡。例如:你可能要默認(rèn)要使用同義詞環(huán)圈,但是,規(guī)定精準(zhǔn)匹配的關(guān)鍵詞結(jié)果要放在搜索結(jié)果清單的頂端?;蛘?,最初的搜索可以忽略同義詞環(huán)圈,但是提供選項(xiàng),在結(jié)果稀少或者無(wú)結(jié)果時(shí),可以“拓展搜索包含相關(guān)術(shù)語(yǔ)”。

規(guī)范文檔

精準(zhǔn)地講,規(guī)范文檔放的就是一份優(yōu)選術(shù)語(yǔ)或可接受的清單,不含有詞形變化或同義詞。
事實(shí)上,規(guī)范文檔通常包含優(yōu)選術(shù)語(yǔ)和異形術(shù)語(yǔ)。換句話說(shuō),規(guī)范文檔也是同義詞環(huán)圈,其中是將術(shù)語(yǔ)定義成優(yōu)選術(shù)語(yǔ)或可接受的值。
如以下一條記錄,選自美國(guó)郵政服務(wù)公司為美國(guó)各州定義的名稱使用規(guī)范文檔:
CT Connecticut, Conn, Conneticut, Constitution State
其中,首個(gè)詞“CT”為優(yōu)選術(shù)語(yǔ),其后的詞為異形術(shù)語(yǔ)

規(guī)范文檔對(duì)內(nèi)容作者和索引者而言都是有用的工具,可以讓他們有效且一致地使用眾所認(rèn)可的屬于。此外,從受控詞表管理的角度來(lái)看,優(yōu)選術(shù)語(yǔ)可以視為每一組等價(jià)術(shù)語(yǔ)中的唯一標(biāo)識(shí),這樣對(duì)異形術(shù)語(yǔ)進(jìn)行新增、刪除和修改時(shí)會(huì)更有效率。

當(dāng)時(shí)當(dāng)用戶從搜索換成瀏覽模式時(shí),如果展示所有的同義詞、縮寫(xiě)、簡(jiǎn)寫(xiě),以及每個(gè)術(shù)語(yǔ)常見(jiàn)的錯(cuò)誤拼法,則會(huì)讓整個(gè)畫(huà)面變亂而影響用戶體驗(yàn),此時(shí)可以通過(guò)建立等價(jià)術(shù)語(yǔ)之間的指針來(lái)解決,及A“見(jiàn)”B的方式,這種指針的應(yīng)用也稱為“術(shù)語(yǔ)輪排”。

敘詞表

這里所謂的敘詞表是整合在網(wǎng)站或企業(yè)網(wǎng)絡(luò)內(nèi),用以改善導(dǎo)航和搜索效果。
敘詞表是一種概念的語(yǔ)義網(wǎng)絡(luò),把詞匯和同義詞、同音異義詞、反義詞、上位類(lèi)術(shù)語(yǔ)和下位類(lèi)術(shù)語(yǔ),以及相關(guān)關(guān)系術(shù)語(yǔ)連接起來(lái)。
傳統(tǒng)的敘詞表可以幫助我們從一個(gè)詞找到好多個(gè)詞。但這里的敘詞表要做的事恰好相反,其最終要的目標(biāo)是同義詞管理,把許多同義詞或異形術(shù)語(yǔ)對(duì)應(yīng)到某個(gè)優(yōu)選術(shù)語(yǔ)或概念上,使得語(yǔ)言的模糊性不會(huì)妨礙用戶找到他們所需要的東西。

敘詞表構(gòu)建在較簡(jiǎn)單的受控詞表之上,建立這三種基本類(lèi)型的語(yǔ)義關(guān)系模型。
每一個(gè)優(yōu)選術(shù)語(yǔ)都是其自身語(yǔ)義網(wǎng)絡(luò)的中心。


2017-12-11-23-16-58.jpg

等價(jià)關(guān)系是同義詞管理的焦點(diǎn);
等級(jí)關(guān)系是把優(yōu)選術(shù)語(yǔ)分類(lèi)成類(lèi)別和子類(lèi)別;
相關(guān)關(guān)系是提供有意義的連接,而這有意義的連接,并非由等級(jí)關(guān)系或等價(jià)關(guān)系處理。
這三種關(guān)系對(duì)信息搜索和導(dǎo)航而言,在很多方面都很有意義。

未完待續(xù)……

技術(shù)行話

敘詞表實(shí)例

敘詞表的種類(lèi)

敘詞表標(biāo)準(zhǔn)

語(yǔ)義關(guān)系

優(yōu)選術(shù)語(yǔ)

復(fù)合式等級(jí)體系

分面分類(lèi)法

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 本文主要為《WEB信息架構(gòu) :構(gòu)建大型網(wǎng)站》讀書(shū)筆記。書(shū)本內(nèi)容有點(diǎn)晦澀,但對(duì)系統(tǒng)性理解信息架構(gòu)很有幫助,我盡量找了...
    Minus閱讀 5,471評(píng)論 0 14
  • 信息架構(gòu)的意義 提供可尋性可用性,將雜亂無(wú)章的信息歸納分類(lèi)、排序,方便他人瀏覽。 信息架構(gòu)師工作流程簡(jiǎn)介 設(shè)計(jì)結(jié)構(gòu)...
    怪蜀黍機(jī)器人閱讀 1,803評(píng)論 0 1
  • 第一章 1.1 信息組織的環(huán)境與背景 信息檢索工具的變化 手工檢索時(shí)代:目錄、題錄、索引等。 計(jì)算機(jī)檢索時(shí)代:各種...
    傾啟君閱讀 2,438評(píng)論 0 9
  • 一、什么是信息架構(gòu)設(shè)計(jì)? 從信息流的角度來(lái)看產(chǎn)品,產(chǎn)品設(shè)計(jì)是完成“數(shù)據(jù)—>信息—>知識(shí)—>智慧”的這個(gè)傳遞鏈。信息...
    Andy_DDD閱讀 6,106評(píng)論 1 12
  • 【青豆魚(yú)骨】話說(shuō)一根魚(yú)骨含鈣3毫克選用上等魚(yú)骨精致而成含鈣高是小孩孕婦老人補(bǔ)鈣佳品,開(kāi)罐即食,搭配香酥的青豆,香脆...
    羅蘭sign閱讀 441評(píng)論 0 0

友情鏈接更多精彩內(nèi)容