Sitemap(網站地圖)

Sitemap(網站地圖) 是一個列出網站內所有重要的頁面,幫助搜尋引擎更有效地有效率地發現與索引你的內容。網站地圖就好像一份「目錄表」,特別適合頁面多、更新頻繁或有孤立頁面的網站。

Google 並不保證 sitemap 中的所有網址都會被索引,但它能顯著提升搜尋引擎對網站的「發現效率」。

網站地圖常見類型

網站地圖常見格式為 XML,也可以是 HTML、RSS 或 TXT。

1. XML Sitemap

XML Sitemap 是最常見的網站地圖格式,專門給搜尋引擎使用。它會列出網站的所有重要網址,並提供額外資訊,例如:

  • 每個頁面的最後更新時間(<lastmod>)
  • 建議的抓取頻率(<changefreq>)
  • 網頁的重要性權重(<priority>)

這有助搜尋引擎判斷哪些頁面需要優先抓取,對大型網站或內容變動頻繁的網站非常有幫助。

2. 文字 Sitemap(TXT 格式網站地圖)

文字 sitemap 是最簡單的網站地圖形式。它只需在純文字檔案中,每行列出一個完整的頁面網址,無需任何額外標籤或結構。雖然功能單一,但非常容易建立,適合內容少或開發階段中的小型網站。

不過,文字 sitemap 無法提供像 XML sitemap 那樣的更新時間或頁面結構資訊,因此在功能上較有限。若你只是想快速提交幾個網址給搜尋引擎,這會是一個實用的臨時方案。

要注意的是,使用 TXT 格式的網站地圖,只能列出網址,不能放置任何其他內容。

3. RSS、mRSS、Atom Sitemap(內容更新導向)

RSS、mRSS 和 Atom 是一類為內容發佈而設計的 feed 格式,但 Google 也支援它們作為 sitemap 使用,特別適合部落格、新聞、Podcast 等持續更新的網站。這些格式能即時通知搜尋引擎有新內容,提升新頁面被索引的速度。

這種網站地圖的好處是能自動同步內容更新,無需手動維護。舉例來說,當你發佈新文章,RSS feed 就會自動更新,Google 也會更快抓到該內容。若你經營的是資訊內容導向網站,RSS 類 sitemap 是個值得搭配使用的利器。

4. HTML Sitemap(HTML 網站地圖)

HTML Sitemap 是提供給使用者瀏覽的網站地圖頁面,通常放在網站底部,以列表形式展示所有或主要網頁的連結。

HTML 網站地圖有助搜尋引擎發現更多內部頁面(尤其是有良好內部連結架構的 sitemap 頁面),亦能幫助使用者在主選單以外找到所需內容。

Google 並不支援 HTML 網站地圖,因此你無法在 Google Search Console 提供 HTML 網站地圖。

網站地圖技術建議

  • Sitemap 檔案建議放在網站根目錄,例如:https://www.example.com/sitemap.xml
  • 每個 sitemap 最多可包含 50,000 個 URL 或 50MB。如果超過限制,應使用 sitemap index 拆分多份 sitemap。
  • Sitemap 中的網址內容應能被搜尋引擎正常抓取(避免301、404、封鎖等問題)。
  • 透過 Google Search Console 提交 sitemap
  • 可在 Google Search Console 提交 sitemap,也可在 robots.txt 中加入以下語法自動通知搜尋引擎:
    Sitemap: https://www.example.com/sitemap.xml