周圍那么多人都不再看好SEO了,但是不知道怎么的,我就開始走到了SEO這條路上,權(quán)當(dāng)是一個(gè)學(xué)習(xí)筆記吧。把這些basic的知識(shí)掌握了,至少不容易被形形色色的代理公司忽悠到吧。

這是第一篇基礎(chǔ)知識(shí)—搜索引擎的運(yùn)作原理
講到SEO(Search Engine Optimization)搜索引擎優(yōu)化,必定是基于自身網(wǎng)站針對(duì)搜索引擎的優(yōu)化過程,因而首先需要搞清楚搜索引擎是怎么運(yùn)作的。所謂知己知彼,方能做到有的放矢,知其所以然吧。
搜索引擎主要做兩個(gè)工作:爬行各個(gè)網(wǎng)頁并建立索引,當(dāng)用戶搜索某個(gè)關(guān)鍵詞時(shí)以排名的方式將相關(guān)網(wǎng)頁呈現(xiàn)給用戶。簡言之就兩部分:一是爬行和索引,二提供答案。
一爬行和索引
你可以把世界上千千萬萬的網(wǎng)頁想象成一個(gè)用鏈接連接的巨型蜘蛛網(wǎng)(這可能正是萬維網(wǎng)這個(gè)中文名字的意義所在),搜索引擎的爬蟲(蜘蛛)就在這些網(wǎng)頁間以鏈接為路徑進(jìn)行爬行。當(dāng)然這個(gè)爬蟲不是一直在某個(gè)網(wǎng)頁上爬行,每次的爬行會(huì)有一定的時(shí)間間隔,即爬行頻率。各個(gè)搜索引擎的爬行頻率是不同的,這也會(huì)解釋為什么有的網(wǎng)頁被搜索引擎A收錄了,但是搜索引擎B卻沒有收錄,只是因?yàn)檫€沒有到爬蟲來的時(shí)間點(diǎn)而已,這是后話,此處還不展開。
一旦爬蟲爬行完某個(gè)頁面后搜索引擎會(huì)建立一個(gè)索引,將選中的某些數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫中,以備將來提供答案時(shí)使用。想想看那么多的頁面信息要存儲(chǔ),搜索引擎必定是需要有非常大的數(shù)據(jù)庫需求了,尤其是如果想短時(shí)間之內(nèi)(或許是<0.000000001秒之內(nèi))將結(jié)果呈現(xiàn)給搜索引擎的用戶,那必定是同時(shí)要求在世界各地的部署相關(guān)的服務(wù)器的。
二提供答案
搜索引擎在提供答案時(shí)會(huì)做兩件事:一是將與搜索詞相關(guān)的網(wǎng)頁呈現(xiàn)到結(jié)果頁面,二是對(duì)這些相關(guān)網(wǎng)頁進(jìn)行排序,主要依據(jù)就是網(wǎng)頁與搜索詞的相關(guān)性與網(wǎng)頁的受歡迎程度。這兩個(gè)步驟就是一般在做SEO時(shí)需要盡力去影響的步驟。
所以很自然就會(huì)有個(gè)問題出來:搜索引擎決定網(wǎng)頁與搜索詞相關(guān)性和受歡迎程度的依據(jù)是什么?
很早之前,搜索引擎主要依據(jù)網(wǎng)頁中包含眾多相關(guān)搜索詞。如今,相比形形色色的SEO作弊技術(shù),搜索引擎也逐步發(fā)展出幾百個(gè)決定相關(guān)性的因素。搜索引擎一般會(huì)把網(wǎng)頁受歡迎程度作為衡量相關(guān)度的一個(gè)重要指標(biāo)。從一定程度上來說,這也是非常科學(xué)的衡量標(biāo)準(zhǔn),如果不受歡迎的話自然相關(guān)度也是低的。
說到這里就會(huì)引入我們聽了很久的算法了(Algorithms)。搜索引擎當(dāng)然不會(huì)簡單的手動(dòng)決定網(wǎng)頁的相關(guān)性和受歡迎程度,所謂技術(shù)公司當(dāng)然是需要用復(fù)雜的算法來解決這個(gè)問題,既彰顯高水平,又在一定程度上避免了主觀判斷帶來的影響(甚至被訴訟,可以參見《傲骨賢妻》第4季第3集)。這個(gè)算法真的是相當(dāng)復(fù)雜,而且我們無從得知具體公式,有一件事請(qǐng)肯定的是,搜索引擎用網(wǎng)頁相關(guān)性決定頁面是否出現(xiàn)在搜索結(jié)果中,用受歡迎程度決定具體網(wǎng)頁在搜索結(jié)果中的排名。
接下來希望有機(jī)會(huì)了解一下主要的索引與排名的影響因素。