關(guān)于‘詞庫應(yīng)用’的很多細(xì)節(jié)都有些模糊,google下也沒找出靠譜的資料,全是各種挖詞的......索性不如定期總結(jié)完善下,最終形成自己的方法論。
根據(jù)以往實(shí)際數(shù)據(jù)總結(jié),大部分網(wǎng)站產(chǎn)生流量的關(guān)鍵詞60%-70%都是有規(guī)律可循的?;径际怯伞甆個(gè)同屬性關(guān)鍵詞的集合’和‘N個(gè)詞綴’組成。對(duì)于內(nèi)容偏垂直的站來說,把這種詞生成一個(gè)個(gè)頁面相對(duì)容易些。
如果網(wǎng)站有相關(guān)的內(nèi)容,并且數(shù)據(jù)表的字段跟詞庫中關(guān)鍵詞的屬性能夠直接關(guān)聯(lián)上,直接調(diào)用就行,若是這些屬性在多個(gè)數(shù)據(jù)表中id還都一樣,那生成頁面的內(nèi)容就更加豐富,但畢竟是理想狀態(tài),大部分都要靠搜索結(jié)果生成頁面。
以下是剛整理出來的8萬多職位詞庫,挑出一部分瞅一下:

如上所說,50%-70%的流量詞都是有規(guī)律可循,以職位詞為例,可以看出是由‘{工作}+{職稱}’組成。
一個(gè)'工作'能匹配多個(gè)‘職稱',反之一個(gè)‘職稱’也能匹配多個(gè)'工作':

要保險(xiǎn)點(diǎn)的話應(yīng)該有個(gè)關(guān)鍵詞標(biāo)準(zhǔn)化的過程,因?yàn)橥瑢傩酝兞康亩鄠€(gè)詞挑出幾個(gè)搜索量高的導(dǎo)入詞庫,因?yàn)楹芏嘣~說的都是一碼事,如:“10086熱線客服”、“10086接線客服”、“10086在線客服”,反正我感覺都一樣,都是接電話被人罵的。
為了能夠最大化的命中用戶查詢,原則上說,只要頁面大部分內(nèi)容不一樣,并且有一定內(nèi)容數(shù)量,就可以生成頁面,這就得遍歷每個(gè)詞的搜索結(jié)果數(shù)量。
但有不少站站內(nèi)搜索做的并不算理想,很多情況下數(shù)量不少但搜出來的內(nèi)容與查詢?cè)~本身沒多大關(guān)聯(lián),所以需要對(duì)關(guān)鍵詞在站內(nèi)搜出來的結(jié)果設(shè)定一個(gè)指標(biāo),滿足指標(biāo)的才導(dǎo)入詞庫。
對(duì)招聘行業(yè),職位詞中的‘工作’變量權(quán)值比‘職稱’高得多,搜‘seo專員’出來‘seo經(jīng)理’的內(nèi)容沒多大影響,但出來‘sem專員’那就很坑爹了
所以需要把‘職稱’提取出來,’職位詞‘刪除提取出來的’職稱‘后做’工作詞‘,假設(shè)一個(gè)頁面能夠展現(xiàn)10條搜索結(jié)果,當(dāng)搜索結(jié)果中’工作詞‘出現(xiàn)5次以上且包含相同’工作詞‘的多個(gè)’職位詞‘的重復(fù)搜索結(jié)果少于5條的,則可以導(dǎo)入詞庫。

