之前講到了 SEO 頻道,其中極其重要的一步,就是詞庫(kù)的建立了。 詞庫(kù)的整理和收集,一方面可以根據(jù)關(guān)鍵詞獲取到精準(zhǔn)的、大量的流量,另一方面也可以了解用戶的需求,方便第二步的模板設(shè)置。
關(guān)鍵步驟
SEO 詞庫(kù)一般有以下幾個(gè)關(guān)鍵步驟:
抓取
擴(kuò)展
過濾
補(bǔ)充字段 & 入庫(kù)
清理 & 優(yōu)化
第一步 關(guān)鍵詞抓取
關(guān)鍵詞抓取一般有以下幾個(gè)來源:
競(jìng)爭(zhēng)對(duì)手詞庫(kù)
第三方工具,如 5118
PPC 或者其他流量渠道的關(guān)鍵詞
抓取的工具也有很多,比如:
火車頭
Python - scrapy
開發(fā)支持
不過需要注意的是,抓取工具一定要支持往下一層抓?。ㄒ步猩疃茸ト。荒軆H限于源頁(yè)面的抓取。
第二步 關(guān)鍵詞擴(kuò)展
抓取一批數(shù)據(jù)之后不要急著過濾和使用,要先擴(kuò)展一批。 這里可以借用搜索引擎的能力和工具進(jìn)行擴(kuò)展,有以下幾個(gè)方式:
搜索引擎的搜索框提示詞
搜索引擎的相關(guān)搜索詞
PPC 的擴(kuò)詞工具,如百度推廣助手的關(guān)鍵詞工具,Google Keyword Planner Tool.
擴(kuò)展一大堆關(guān)鍵詞之后還有非常重要的一步,就是關(guān)鍵詞分析,整理關(guān)鍵詞組合。 首先,通過分詞和整理,可以拿到關(guān)鍵詞的詞根,以及對(duì)應(yīng)的搜索量。 其次,手工把每個(gè)詞根對(duì)應(yīng)的關(guān)鍵詞組合整理出來,并加上搜索量和出現(xiàn)次數(shù) 最后,就是考慮這些關(guān)鍵詞怎么應(yīng)用。如果關(guān)鍵詞組合的搜索量特別大,而且主題明確且獨(dú)特,是建議單獨(dú)開設(shè)一個(gè)頻道,比如 「城市」+ 天氣。而對(duì)一些比較零散,無明確規(guī)則的關(guān)鍵詞,則是需要添加到 SEO 頻道,比如 “杭州八景”。 借用一張 GoGo闖 博文中的一張圖:
注:GoGo闖 有一篇講關(guān)鍵詞分析的文章,這里推薦一下《【如何搭建SEO詞庫(kù)?】SEO關(guān)鍵詞分析》。
第三步 關(guān)鍵詞過濾
SEO 入庫(kù)前還需要進(jìn)行過濾。以下關(guān)鍵詞過濾的具體規(guī)則(應(yīng)該是中文最全的規(guī)則了):
單復(fù)數(shù)過濾,比如 led light 和 led lights
前后順序調(diào)整過濾,比如 led light 和 light led
空格處理,其中包含首尾空格去除、多個(gè)合并為一個(gè)
特殊字符處理。除了字母和數(shù)字外的其他符號(hào),都是特殊字符
大小寫處理。一般是全部轉(zhuǎn)換為小寫
年份替換,比如 2016 替換為 2018
去停止詞后去重。一定要注意,先去停止詞之后再去重,比如 “南京天氣” 和 “南京的天氣”,這樣就可以過濾掉
黑名單過濾。這里可以過濾掉包含黑名單里的關(guān)鍵詞,而黑名單可人工維護(hù),比如最近的一些敏感詞
違禁詞過濾,比如政治類敏感詞、侵權(quán)品牌類關(guān)鍵詞
結(jié)果數(shù)和相關(guān)性檔位過濾。根據(jù)搜索結(jié)果進(jìn)行過濾,比如相關(guān)性檔位為 3 的產(chǎn)品少于 20 個(gè),頁(yè)面就不會(huì)創(chuàng)建(或自動(dòng)添加 noindex)
純數(shù)字, 字母過濾。對(duì)中文站來講,純字母的關(guān)鍵詞比較偏向垃圾詞,對(duì)英文站則不然
語(yǔ)種過濾。中文站需要排除掉其他語(yǔ)向的關(guān)鍵詞
長(zhǎng)度過濾??梢赃^濾掉過長(zhǎng)或過短的關(guān)鍵詞
單詞數(shù)過濾,可以過濾掉一個(gè)單詞,或者超過3個(gè)單詞的關(guān)鍵詞
注:上述很多規(guī)則來自阿里內(nèi)部的關(guān)鍵詞過濾工具中的功能。
第四步 補(bǔ)充字段 & 入庫(kù)
入庫(kù)時(shí)除了關(guān)鍵詞以外,還需要補(bǔ)充相關(guān)的字段(對(duì)應(yīng)每個(gè)數(shù)據(jù)庫(kù)字段) 一般有以下數(shù)據(jù):
關(guān)鍵詞
行業(yè)分類,比如屬于 3C 行業(yè)
關(guān)鍵詞類型,比如是 price 類
添加時(shí)間
修改時(shí)間
添加人
搜索量
百度 / Google 結(jié)果數(shù)
分詞結(jié)果,比如 “南京|旅游|攻略”
第五步 清理 & 優(yōu)化
清理是為了剔除掉低效的頁(yè)面,保證頻道的效率。比如近一年內(nèi)沒有任何流量的頁(yè)面。
優(yōu)化是精細(xì)化的運(yùn)營(yíng),比如有一批頁(yè)面一直未抓取,則添加一批內(nèi)鏈促進(jìn)其抓??;或者排名在第二頁(yè)但仍有流量,則需要稍微給一點(diǎn)內(nèi)鏈幫助其上升到第一頁(yè)
其他高級(jí)功能
隨著詞庫(kù)規(guī)模的擴(kuò)大,會(huì)遇到更多問題。這些都是考慮和解決的。
聚類??梢越鉀Q頁(yè)面重復(fù)的問題,提高頻道效率。
分類??梢愿鶕?jù)不同的關(guān)鍵詞類型,使用不同的模板,以更好的滿足用戶需求。
傾斜。根據(jù)搜索量或者轉(zhuǎn)化率,資源向部分頁(yè)面傾斜。
站群的詞庫(kù)
最后多說一點(diǎn),我也做過站群的詞庫(kù)。 在站群項(xiàng)目中,內(nèi)容、抓取量、鏈接資源都是極其有限的。這個(gè)時(shí)候,詞庫(kù)就顯得極其重要。 一個(gè)好的詞庫(kù),比一般詞庫(kù)的效果要好上幾十倍。 而好的詞庫(kù),甚至不惜人肉整理。幾萬(wàn)個(gè)關(guān)鍵詞人工篩選。