History SEO Problem

你維護的網站的網頁數是否有上千頁或上萬頁?如果答案是YES的話,一定會存在History SEO這個問題。

什麼是History SEO?

History SEO並不是一個官方正式的名詞,你可以想成網站長久維護下來產生的過時內容、重覆內容、錯誤資訊、已經沒有在經營的事物……等等所產生的SEO負面問題。

為何要重視這個問題?根據Google的常見問題之中,有一段話寫得很明確:

移除不實用的內容,是否能提升我其他內容的排名?

我們的系統主要是在網頁層級運作,以便盡可能顯示最實用的內容,即使該內容所在網站同樣代管不實用的內容也不例外。話雖如此,要是網站中有特別多不實用的內容,可能會讓網站的其他內容在 Google 搜尋中的成效降低,但影響程度不一。移除不實用的內容,可能有助於提升其他網頁的成效。

常見的例子就是官方新聞稿或是blog文章,這些網頁可能代表著整個企業的歷史軌跡,刪除是不被高層主管允許的,所以不得不留下來。以下列出一些可以改善的做法:

更新內容

我認為這是最有效的方法,如果主管同意的話。

網頁合併

相似內容且意圖相同的網頁可以考慮合併,但此種方法的困難點除了轉址之外就是主管同意的可能性很低,畢竟合併也代表有網頁會被刪除。

canonical

將相似或相同意圖的網頁用canonical指向同一個網頁,可以解決許多問題。

但相對的,非常耗費時間,你必須決定哪些網頁需要canonical到別的頁面,而那個目標頁面又是哪一頁。而且,有一些人認為(未必正確),太多canonical指向的那個目標頁面,會讓爬蟲覺得好像沒有那麼重要,或是刻意操作。

noindex

不讓這些網頁出現在搜尋結果中。

unavailable_after

設定日期,讓爬蟲知道這個頁面在設定的日期之後就已經不重要了,這個設定也不會在日期之後出現在搜尋結果中。使用方法可以參考Google的說明文件

robots.txt

有些人認為(未必正確),爬蟲的效能有限,所以會想在robots.txt之中使用Disallow指令拒絕爬蟲抓取這些網頁,讓它有時間抓取更重要的網頁內容。

留言

這個網誌中的熱門文章

用CSS的 min() max() 與vw,設計有極限值的RWD響應式文字

10 steps、「ライブ会場を沸らせる、フロアを沸かす」ミーム動画の作り方 (Viggle AI)

運用資料層 dataLayer.push 建立 GTM 自訂事件