本章主要介紹SEO優(yōu)化工作中,在百度收錄原理方面需要了解的工作。
本文版權(quán)由“ 北朔潛龍 ”所有,僅供學(xué)習(xí)使用,請勿轉(zhuǎn)載或用于商業(yè)用途。
七、百度原理(收錄)
? ? ? ? 搜索引擎為用戶表現(xiàn)的每一條搜索結(jié)果,都對應(yīng)著互聯(lián)網(wǎng)上的一個(gè)頁面,每一條搜索結(jié)果從產(chǎn)生到通過搜索引擎展現(xiàn)給用戶,都需要經(jīng)過四個(gè)過程,抓取過濾,建立索引和輸出結(jié)果。
? 1、抓取
? ? ? ?Baiduspider或稱百度蜘蛛,會(huì)通過搜索引擎系統(tǒng)計(jì)算來決定對哪些網(wǎng)站進(jìn)行抓取,以及抓取內(nèi)容和頻率值,搜索引擎的計(jì)算過程會(huì)參考該網(wǎng)站在歷史中的表現(xiàn),比如內(nèi)容是否優(yōu)質(zhì),是否存在對用戶不友好的設(shè)置,是否存在過度搜索引擎優(yōu)化等行為。
? ? ? ?當(dāng)網(wǎng)站產(chǎn)生新內(nèi)容時(shí),Baiduspider通過互聯(lián)網(wǎng)中某個(gè)指向該頁面的鏈接進(jìn)行訪問和抓取,如果網(wǎng)站設(shè)置任何外部鏈接指向網(wǎng)站中的新增內(nèi)容,則Baiduspider是無法對其進(jìn)行抓取的,對于已抓取的內(nèi)容,搜索引擎會(huì)對抓取的頁面進(jìn)行記錄,并根據(jù)這些用戶的重要程度安排不同頻次的抓取和更新工作。
? ? ? ?需注意的是有一些抓取軟件,為了各種目的會(huì)偽裝成Baiduspider對您的網(wǎng)站進(jìn)行抓取,這可能是不受控制的抓取行為,嚴(yán)重時(shí)會(huì)影響到網(wǎng)站的正常運(yùn)作。
? 2、頻率值
? ? ? ? A)搜索引擎的硬件是有限的,不可能有太多的資源對每一個(gè)網(wǎng)站頻繁光顧,簡單的來說就是不同的網(wǎng)站,搜索引擎光顧的頻率也是不一樣的。
? ? ? ?B)影響頻率值
? ? ? ? ? ? ?雖然蜘蛛針對不同的網(wǎng)站有不同的頻率值,但是我們可以通過做一些事情影響他的頻率值。
? ? ? C)提升頻率值的方法
? ? ? ? ? ? ?經(jīng)常更新網(wǎng)站,往往頻率值會(huì)比較高,所以盡可能的持續(xù)更新,搜索引擎會(huì)形成習(xí)慣,為了提高工作效率,它會(huì)特別關(guān)注那些經(jīng)常更新的網(wǎng)站。
? ? ? D)歷史記錄
? ? ? ? ? ? 1.我們網(wǎng)站所有的歷史記錄會(huì)被搜索引擎記錄下來,搜索引擎的計(jì)算過程會(huì)參考網(wǎng)站在歷史中的表現(xiàn)。
? ? ? ? ? ?2.這里提醒我們:網(wǎng)站前期不要犯錯(cuò)誤,必須在進(jìn)行網(wǎng)站建設(shè)的時(shí)候參與到前期的工作中。
? ? ? ? ? ?3.三歲看到老,道理都是一樣的,搜索引擎的執(zhí)行是人的意志,你在“小時(shí)候”的行為搜索引擎都會(huì)記錄在案。
? 3、過度優(yōu)化
? ? ? ?A)網(wǎng)站中加入隱藏的文字,隱藏的鏈接
? ? ? ?B)與網(wǎng)頁不相干的關(guān)鍵詞
? ? ? ?C)具有欺騙性的跳轉(zhuǎn)或者欺騙性的重定向
? ? ? ?D)專門針對搜索引擎的橋頁,既所謂的過度頁
? ? ? ?E)針對程序生成的內(nèi)容,制造大量內(nèi)容命中搜索結(jié)果
? ? ? ?F)大量重復(fù)無價(jià)值的內(nèi)容
? ? ? G)充斥著大量惡意廣告,惡意代碼的頁面
? ? ? H)群發(fā)鏈接等等
? 4、過濾
? ? ? A)不要欺騙用戶
? ? ? B)對內(nèi)容的把握上很多人是沒什么概念的,比如采集,很多人樂此不疲,其實(shí)對收錄有很壞的影響
? ? ? C)誤區(qū)
? ? ? ? ? ? ?所謂搜索引擎抓取就是被搜索引擎收錄了,實(shí)際上搜索引擎抓取一個(gè)頁面和收錄一個(gè)頁面是不同的,他們之間還有一個(gè)環(huán)節(jié)就是過濾,搜索引擎的算法調(diào)整更多是對過濾環(huán)節(jié)的調(diào)整,
? ? ? D)收錄的問題往往集中在能否通過“過濾”,蜘蛛來抓取我們的頁面就想來不是問題,
? ? ? ? ? ? 我們沒有收錄的頁面不能因?yàn)橹┲霙]有來過,往往是因?yàn)樵谒阉饕婵磥?,頁面對用戶沒有價(jià)值,被過濾掉就進(jìn)不去搜索引擎的一個(gè)數(shù)據(jù)庫,也就是沒有收錄。
? 5、輸出結(jié)果
? ? ? ?A)按道理到這里搜索引擎的工作就結(jié)束了,事實(shí)上才剛剛開始,它會(huì)對搜索結(jié)果進(jìn)行持續(xù)的關(guān)注。
? ? ? B)比如同一個(gè)詞的搜索結(jié)果,排名第一的網(wǎng)站,用戶跳出率極高,而排名第三的頁面用戶體驗(yàn)非常好的話,那么排名就要調(diào)整了。
? 6、索引庫
? ? ? ? 搜索引擎的資料庫
? ? ? ?A)我們在查詢?nèi)魏我粋€(gè)關(guān)鍵詞的時(shí)候,搜索引擎不是在當(dāng)前查找,而是提前準(zhǔn)備了一個(gè)數(shù)據(jù)庫,就等著我們?nèi)ゲ樵儯唵蝸碇v就是搜索引擎提前把將它認(rèn)為重要的頁面信息盡可能的下載好,放在它的數(shù)據(jù)庫中,這個(gè)供用戶查詢相關(guān)結(jié)果的,已經(jīng)下載好了的數(shù)據(jù)庫就是搜索引擎的資料庫。
? ? ? B)不同的搜索引擎他們的數(shù)據(jù)庫也是不一樣的,一般是在幾十到一百億個(gè)網(wǎng)站左右,我們就當(dāng)100億來計(jì)算。
? 7、索引庫
? ? ? A)搜索引擎的本職工作,我們在搜索一個(gè)關(guān)鍵詞的時(shí)候,搜索引擎要在浩瀚的網(wǎng)頁世界里找到我們需要的網(wǎng)頁。
? ? ? B)搜索引擎為什么那么快
? ? ? ? ? ? ?搜索引擎已經(jīng)對這些網(wǎng)頁進(jìn)行了分類,就像在圖書館看書一樣,按照分類就可以節(jié)省很多時(shí)間。
? ? ? C)這個(gè)經(jīng)過分類的頁面信息資料庫就是我們講的索引庫。
? 8、索引庫的建立和分類
? ? ? ?A)不管中文還是引文,網(wǎng)頁的總是是不斷激增的,因?yàn)橄嚓P(guān)的新產(chǎn)品、新話題也是不斷增加的,但是詞語的總數(shù)是不變的,比如所有的中文詞加起來也就不到10萬,英文也就上百萬個(gè)單詞。
? ? ? B)我們來算下,100萬個(gè)英文單詞,我們按照詞來分類,一個(gè)單詞就是一個(gè)類,100億/100萬=1萬。中文我們就按照10萬個(gè)詞來算,也按照詞來分類,一個(gè)詞一個(gè)類,100億/10萬=10萬,這種級別的數(shù)據(jù)對于搜索引擎的計(jì)算機(jī)來講還是很容易處理的。
? ? ? C)除了計(jì)算的方便,還有另外一個(gè)有效處理方式就是直接命中用戶的搜索習(xí)慣,因?yàn)橛脩舻牧?xí)慣也是根據(jù)詞來搜索的,通俗來理解,搜索引擎的索引庫就是這樣來工作的,當(dāng)用戶輸入關(guān)鍵詞“汽車輪胎”搜索時(shí),搜索引擎就從“汽車”那行和“輪胎”那行里拿出同時(shí)都有的,交集的url即可,當(dāng)然這是理想狀態(tài),實(shí)際上搜索引擎的工作遠(yuǎn)比這些來的復(fù)雜,但原理是類似的。
? 9、分詞技術(shù)
? ? ? A)概念
? ? ? ? ? ? ?通過以上內(nèi)容我們知道,想要建立索引庫,有一件事必須要做,就是把頁面上的內(nèi)容進(jìn)行拆分,分毫一個(gè)一個(gè)詞之后放進(jìn)索引庫當(dāng)中去,這就叫做分詞,搜索引擎的這項(xiàng)技術(shù)就叫做分詞技術(shù)。
? ? ?B)理解
? ? ? ? ? ? ?分詞技術(shù)就是把詞分開的意思,看起來很簡單,這是搜索引擎的意向技能,這項(xiàng)技術(shù)對SEO的意義很大。
? ? C)分詞技術(shù)對于SEO的意義
? ? ? ? ? ?1.比如我們的頁面把“私人導(dǎo)游高端定制旅行”這個(gè)詞優(yōu)化到百度第一,那么與此同時(shí),在“私人導(dǎo)游”“高端定制旅行”這些詞上我們也有了很好的權(quán)重,知識我們沒看到,后期我們加強(qiáng)一下,那么很容易排名就上來了。
? ? ? ? ? ?2.根據(jù)分詞技術(shù),加入我們把“你”“我”這些字優(yōu)化上去的話,搜索引擎是設(shè)法在其他詞上給我們權(quán)重的。
? ? ? ? ? ?3.所以我們在寫頁面內(nèi)容,尤其是寫網(wǎng)頁title的時(shí)候要注意利用搜索引擎的這項(xiàng)技術(shù),合理布局我們的關(guān)鍵詞,使我們的網(wǎng)頁能夠命中更多的關(guān)鍵詞,從而獲得更多的關(guān)聯(lián)關(guān)鍵詞排名。