00 : 搜索引擎及其技術(shù)架構(gòu)

前言

  • 互聯(lián)網(wǎng)產(chǎn)品形形色色,有產(chǎn)品導(dǎo)向的,有營(yíng)銷導(dǎo)向的,也有技術(shù)導(dǎo)向的,但是以技術(shù)見長(zhǎng)的互聯(lián)網(wǎng)產(chǎn)品比例相對(duì)小些。
  • 好記得域名不再重要,因?yàn)槿藗儠?huì)通過搜索進(jìn)入網(wǎng)站。

所以,搜索排名很重要!

搜索引擎及其技術(shù)架構(gòu)

史前時(shí)代:分類目錄的一代

早期的Yahoo 和 hao123 通過人工收集整理,把屬于各個(gè)分類的高質(zhì)量網(wǎng)站或網(wǎng)頁(yè)分門別類羅列,用戶通過分級(jí)目錄查找高質(zhì)量的網(wǎng)站。導(dǎo)致絕大多數(shù)網(wǎng)站不能被收錄。

第一代:文本檢索的一代

  • 采用經(jīng)典的信息檢索模型,比如布爾模型,向量空間模型或者概率模型,來計(jì)算用戶查詢關(guān)鍵詞和網(wǎng)頁(yè)文本內(nèi)容的相關(guān)程度。
  • 網(wǎng)頁(yè)之間有豐富的鏈接關(guān)系,這一代搜索引擎并未使用這些信息。

第二代:鏈接分析的一代

  • 這一代的搜索引擎充分利用了網(wǎng)頁(yè)之間的鏈接關(guān)系,并充分挖掘和利用了網(wǎng)頁(yè)鏈接所代表的含義。

網(wǎng)頁(yè)鏈接代表一種推薦關(guān)系,所以通過鏈接分析可以在海量?jī)?nèi)容中找到最重要的網(wǎng)頁(yè)。被推薦次數(shù)多的網(wǎng)頁(yè)代表了其具有流行性。搜索引擎結(jié)合網(wǎng)頁(yè)流行性和內(nèi)容相似性來改善搜索質(zhì)量。
但這種搜索引擎并未考慮用戶的個(gè)性化需求,只要輸入的查詢請(qǐng)求相同,都會(huì)獲得相同的搜索結(jié)果。

第三代:用戶中心的一代

目前的搜索引擎大都可以歸為第三代,以理解用戶需求為核心。

不同用戶,不同時(shí)間,即使是同一個(gè)用戶,輸入相同的查詢?cè)~,也會(huì)因?yàn)樗诘臅r(shí)間和場(chǎng)合的不同,需求有所變化。

搜索引擎的三個(gè)目標(biāo):更全,更快,更準(zhǔn)。

3個(gè)核心問題
1.用戶真正的需求是什么
2.哪些信息是和用戶需求真正相關(guān)的(搜索引擎本質(zhì)是一個(gè)匹配的過程,即從海量數(shù)據(jù)里面找到能夠匹配用戶需求的內(nèi)容。)
3.哪些信息是用戶可以信賴的

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容