前言
- 互聯(lián)網(wǎng)產(chǎn)品形形色色,有產(chǎn)品導(dǎo)向的,有營(yíng)銷導(dǎo)向的,也有技術(shù)導(dǎo)向的,但是以技術(shù)見長(zhǎng)的互聯(lián)網(wǎng)產(chǎn)品比例相對(duì)小些。
- 好記得域名不再重要,因?yàn)槿藗儠?huì)通過搜索進(jìn)入網(wǎng)站。
所以,搜索排名很重要!
搜索引擎及其技術(shù)架構(gòu)
史前時(shí)代:分類目錄的一代
早期的Yahoo 和 hao123 通過人工收集整理,把屬于各個(gè)分類的高質(zhì)量網(wǎng)站或網(wǎng)頁(yè)分門別類羅列,用戶通過分級(jí)目錄查找高質(zhì)量的網(wǎng)站。導(dǎo)致絕大多數(shù)網(wǎng)站不能被收錄。
第一代:文本檢索的一代
- 采用經(jīng)典的信息檢索模型,比如布爾模型,向量空間模型或者概率模型,來計(jì)算用戶查詢關(guān)鍵詞和網(wǎng)頁(yè)文本內(nèi)容的相關(guān)程度。
- 網(wǎng)頁(yè)之間有豐富的鏈接關(guān)系,這一代搜索引擎并未使用這些信息。
第二代:鏈接分析的一代
- 這一代的搜索引擎充分利用了網(wǎng)頁(yè)之間的鏈接關(guān)系,并充分挖掘和利用了網(wǎng)頁(yè)鏈接所代表的含義。
網(wǎng)頁(yè)鏈接代表一種推薦關(guān)系,所以通過鏈接分析可以在海量?jī)?nèi)容中找到最重要的網(wǎng)頁(yè)。被推薦次數(shù)多的網(wǎng)頁(yè)代表了其具有流行性。搜索引擎結(jié)合網(wǎng)頁(yè)流行性和內(nèi)容相似性來改善搜索質(zhì)量。
但這種搜索引擎并未考慮用戶的個(gè)性化需求,只要輸入的查詢請(qǐng)求相同,都會(huì)獲得相同的搜索結(jié)果。
第三代:用戶中心的一代
目前的搜索引擎大都可以歸為第三代,以理解用戶需求為核心。
不同用戶,不同時(shí)間,即使是同一個(gè)用戶,輸入相同的查詢?cè)~,也會(huì)因?yàn)樗诘臅r(shí)間和場(chǎng)合的不同,需求有所變化。
搜索引擎的三個(gè)目標(biāo):更全,更快,更準(zhǔn)。
3個(gè)核心問題:
1.用戶真正的需求是什么
2.哪些信息是和用戶需求真正相關(guān)的(搜索引擎本質(zhì)是一個(gè)匹配的過程,即從海量數(shù)據(jù)里面找到能夠匹配用戶需求的內(nèi)容。)
3.哪些信息是用戶可以信賴的