搜索引擎:谷歌搜索引擎特點(diǎn)及獨(dú)有搜索方法
- 變動(dòng)較快,機(jī)動(dòng)性較高
- Google 漫游器會(huì)定期抓取 Web,將大量網(wǎng)頁(yè)列入索引。稍后完成的下一次抓取會(huì)注意到新網(wǎng)站、對(duì)現(xiàn)有網(wǎng)站的更改以及失效的鏈接,并對(duì)內(nèi)容的變化在搜索結(jié)果中加以調(diào)整。
- 敏感度較高,反應(yīng)較快
- Google對(duì)新建的網(wǎng)站具有較高的查知性,當(dāng)然,新建的網(wǎng)站必須要有外部鏈接或者向Google遞交過(guò)網(wǎng)站登錄信息。否則,即使Google的搜索技術(shù)再厲害,一個(gè)只有站長(zhǎng)一個(gè)人看得見(jiàn)的網(wǎng)站是很難被Google發(fā)現(xiàn)的。Google收錄新建網(wǎng)站的兩個(gè)途徑是:第一,通過(guò)網(wǎng)站的外部鏈接;第二,通過(guò)向Google提交網(wǎng)站登錄數(shù)據(jù)。一般而言,后者的收錄速度相對(duì)較快,而前者則要視Google對(duì)新建網(wǎng)站的外部鏈接網(wǎng)站的收錄頻率而定。如果Google對(duì)外部鏈接網(wǎng)站的評(píng)價(jià)高、收錄頻率高那么其發(fā)現(xiàn)新站的速度也相應(yīng)地高,新建網(wǎng)站被收錄的日期就會(huì)被提前。
- 較重視鏈接的文字描述
- Google會(huì)將鏈接的文字描述作為關(guān)鍵詞加以索引
- 相關(guān)性和重要性并重
- Google 使用 PageRank 技術(shù)檢查整個(gè)網(wǎng)絡(luò)鏈接結(jié)構(gòu),并確定哪些網(wǎng)頁(yè)重要性最高。然后進(jìn)行超文本匹配分析,以確定哪些網(wǎng)頁(yè)與正在執(zhí)行的特定搜索相關(guān)。在綜合考慮整體重要性以及與特定查詢(xún)的相關(guān)性之后,Google 才將最相關(guān)最可靠的搜索結(jié)果放在首位。這也是Google收錄網(wǎng)頁(yè)的特點(diǎn)之一。
- 較重視網(wǎng)頁(yè)Meta標(biāo)記的描述
- 大多數(shù)時(shí)候Google顯示搜索結(jié)果時(shí)會(huì)把網(wǎng)頁(yè)的Description顯示出來(lái),并占有較重的篇幅。
- 谷歌獨(dú)有的搜索方法
| 關(guān)鍵詞 | 用法 |
|---|---|
| 星號(hào)* | 常用的通配符 |
| link | 搜索url的反向鏈接,既包括內(nèi)部鏈接,也包括外部鏈接 |
| Inanchor | 指令查詢(xún)的結(jié)果是導(dǎo)入鏈接錨文本中包含搜索詞的頁(yè)面 |
| related | 返回的結(jié)果是某個(gè)網(wǎng)站有關(guān)聯(lián)的頁(yè)面 |
| info | 顯示與鏈接相關(guān)的一系列搜索 |
| cache | 用來(lái)搜索在谷歌服務(wù)器上的某頁(yè)面的緩存 |
協(xié)同過(guò)濾的國(guó)外案例
亞馬遜的推薦:從商品到商品的協(xié)同過(guò)濾
推薦算法
- 大多數(shù)推薦算法,都始于先找出一個(gè)顧客集合,他們買(mǎi)過(guò)和評(píng)級(jí)過(guò)的商品,與當(dāng)前用戶(hù)買(mǎi)過(guò)和評(píng)級(jí)過(guò)的商品有重疊2。算法把來(lái)自這些相似顧客的商品聚集起來(lái),排除該用戶(hù)已經(jīng)購(gòu)買(mǎi)過(guò)或評(píng)級(jí)過(guò)的商品,并向該用戶(hù)推薦其余的商品。這些算法有兩個(gè)最常見(jiàn)的版本:協(xié)同過(guò)濾和聚類(lèi)模型。其他算法——包括基于搜索的方法以及我們自己的商品到商品協(xié)同過(guò)濾——都集中于尋找相似的商品,而不是相似的顧客。針對(duì)用戶(hù)所購(gòu)買(mǎi)和評(píng)級(jí)的每一件商品,算法試圖找到相似的產(chǎn)品,然后聚集這些相似的商品,并給予推薦。
為何值得知道?
- 亞馬遜作為推薦算法的先驅(qū),具有意義和代表性,且受眾面較廣,較為常見(jiàn)。
為何符合定義?
- 與把當(dāng)前用戶(hù)匹配到相似顧客的做法不同,商品到商品的協(xié)同過(guò)濾,把該用戶(hù)所購(gòu)買(mǎi)和評(píng)級(jí)的商品,匹配到相似的商品,然后組合這些相似的商品進(jìn)入推薦列表。