文章要點:
- 搜索引擎的反作弊策略
- google匿名爬蟲
- 作弊的取舍
先講一個作弊方法。以下的一個作弊方法,至今還能行得通的。
代碼如下:
<TABLE>
<TR>
<TD HEIGHT=”1000″ BGCOLOR=”#000000″ BACKGROUND=”White.jpg”> <FONT COLOR=”#FFFFFF”>隱藏文字 隱藏文字</FONT> </TD>
</TR>
</TABLE>
這段代碼,搜索引擎看到的是一個黑色背景下有一些白色的文字,這是不算作弊 的。但是用戶看到的就是一片白色,不會看到里面的文字。原因就是用一張白色 的圖片作為了背景。在以 table 布局的網(wǎng)頁里,如果同時定義了一個 table 的背 景顏色和背景圖片,它是優(yōu)先顯示圖片顏色的。這樣,用戶看到的是一片白色背 景下的白色文字,當(dāng)然就看不到這些文字了。這種作弊方法利用了一點:就是搜 索引擎至今不能識別一張圖片的顏色。
當(dāng)然搜索引擎還有很多其他弱點。邁克·摩爾曾經(jīng)說過:確實有辦法愚弄搜索引 擎,但是只有少數(shù)人能真正辦到。其實他就是其中的一個,因為他自己做了 20
年的搜索引擎技術(shù)研究,在搜索引擎領(lǐng)域有很多專利,能從頭到尾建立一個搜索 引擎。 但是他那樣的專家,是不會用一些作弊的方法來做 SEO 的,原因就是這樣做太蠢 了。
這要從搜索引擎反作弊策略說起。一個搜索引擎成功的反作弊策略一定是這樣 的:
1,允許算法被探測出來,而且即使算法被公布,搜索結(jié)果的公正性都不會受太 大影響。要這么做的原因就是不希望和作弊的人陷入到一種貓捉老鼠的死循環(huán)當(dāng) 中。如果老是以堵漏洞的做法來修正算法,那永遠都沒有盡頭。出于這樣的考慮, 搜索引擎會把那些無法被作弊的的因素在排序算法里放到比較重要的程度。
2,盡可能用一切技術(shù)手段自動檢測,當(dāng)技術(shù)手段不能解決問題,就用人工來解 決。然后把人工發(fā)現(xiàn)的問題又反饋給自動檢測機制,使自動檢測越來越完善。
現(xiàn)在的 google 基本上就是這樣來做的。在現(xiàn)有的排序規(guī)則中,那些無法作弊的 和能精確反應(yīng)內(nèi)容的因素,都是很重要的排序因素。
當(dāng)然 Google 也不排斥頻繁的調(diào)整算法,這也有出于給用戶一個好的搜索體驗 考慮的。
至于技術(shù)檢測和人工審查,google 也一直在做。
google 很早就有匿名蜘蛛來檢測一個網(wǎng)站是不是在作弊的。如果去分析網(wǎng)站的 服務(wù)器 LOG 日志,就會發(fā)現(xiàn)它們。
你會發(fā)現(xiàn),有的爬蟲,通過 IP 查詢是來自 google,但是它沒有自己的聲明 (user-agent),這就是 google 的匿名爬蟲。它會判斷你有沒有對 google 爬蟲 特別對待,做一些隱藏頁面,還會解析 Javascript 文件和 CSS 文件等等。有人 用 CCS 文件來隱藏內(nèi)容,這種事情現(xiàn)在是不用去做的,google 都能查出來。
Google也有人工審核機制,從webmaster tool 里提交的問題,都是有人工跟進 審核的。以下就是號稱google內(nèi)部流傳出來審核規(guī)則,可以點此下載。
既然 google 反作弊那么優(yōu)秀,那文章一開始提到的那個作弊方法怎么解決呢?
那個方法 google 確實檢測不出來,但是用這個方法的人,到后還是會被 google 發(fā)現(xiàn)作弊。
google 的反作弊是“善意原則”優(yōu)先,是假設(shè)你這個網(wǎng)站是沒有作弊的,但是 用其他所有作弊的特征來檢查。 用了我提到的這個方法,在用顏色隱藏內(nèi)容這 一塊是沒事了,但是會在堆砌關(guān)鍵詞,反向鏈接,以及其他很多方面路出馬腳來。 google 就是相信,一個在頁面上隱藏內(nèi)容的人,也一定會去做垃圾鏈接群發(fā)等
等其他作弊的事情。就像現(xiàn)實生活中一個吸毒的人,當(dāng)然也是愛打架的,或者愛 偷東西的,總有一件事情讓你進局子里。
而你假設(shè)其他什么都不做,就是用那個方法隱藏一點內(nèi)容,其實你也不能得到什 么。因為你僅僅是隱藏內(nèi)容的話也不會有排名的。
google 就是這樣捍衛(wèi)了自己排名的公正性。
對這些了解得越多,就越發(fā)現(xiàn)作弊實在是費力不討好了。(作弊源于不了解,通 過正常途徑提升 SEO 流量的方法有的是,為什么放棄那么多好的方法而選擇差的 方法呢?在現(xiàn)在的 SEO 界,你會發(fā)現(xiàn)一個現(xiàn)象,越是 SEO 剛?cè)腴T的人越喜歡搞一 些作弊的事情,而 SEO 從業(yè)越久的人,就越不會參與這些。)
想做一個優(yōu)秀 SEOer 的人,對所有這些因素都要有一定程度的了解的。這樣做即 可以避開無意中犯下的錯,又可以避免不必要的恐慌。
比如沙盒效應(yīng),很多人總覺得很神秘,其實從搜索引擎的角度出發(fā)沒什么好神秘 的。你要是站在搜索引擎的角度考慮問題,就覺得這是一個很有必要的措施了。 你也會知道如何發(fā)展自己的外部鏈接。避免 google 的反作弊手段落到你網(wǎng)站上。
還有,關(guān)于重復(fù)內(nèi)容,google 一定是“善意原則”優(yōu)先的,它甚至?xí)湍闾幚?掉因為網(wǎng)站大量采用模板帶來的重復(fù)問題。
要做到了解這些,就是不斷的實踐,學(xué)習(xí)和實驗。
最近的美劇《Lie to me》非常好看,有一個印象我很深刻,就是他們會定期做 一些實驗,來了解人類各種復(fù)雜微妙的表情后面隱藏著怎樣的心理活動,會定期 形成報告。這是一種非常好的研究程序。
面對 google,我們就像那些心理學(xué)家面對人類的心理一樣,很多東西是你不了解 的。你去測試,就能得到獨家的資料和信息。這也是我博客很多東西的來源。
上篇博客中提到的那個GSA,就是一個絕佳的測試工具,具體的做法還是以后再 講。