首頁 > SEO 易開罐 > Sitemap 是什麼?網站地圖建立、格式教學與 Google 提交完整指南!

Sitemap 是什麼?網站地圖建立、格式教學與 Google 提交完整指南!

by 張家偉 Albert Chang

對於網站經營者及 SEO 工作者而言,確保搜尋引擎能夠有效且全面地探索(Crawl)與索引(Index)網站內容,是提升線上能見度的基石。而在眾多 SEO 工具與策略中,Sitemap(網站地圖)扮演著一個關鍵性的角色。

本文將深入解析 Sitemap 的定義、作用,以及如何建立、提交與優化,幫助您充分利用這個工具,讓您的網站內容更容易被搜尋引擎發現。

一、什麼是 Sitemap(網站地圖)?SEO 必懂的網站藍圖全解析!

Sitemap,直譯為網站地圖,可以更精確地理解為一份提供給搜尋引擎的「網站結構藍圖」或「目錄清單」。這份文件列出了網站上所有您希望搜尋引擎認識並建立索引的重要網頁、圖片、影片或其他檔案的網址。

Sitemap 的核心目的在於協助搜尋引擎的爬蟲更有效率地在您的網站上進行探索,找到那些可能透過一般內部連結較難發現的內容。

Sitemap 在 SEO 中的角色

搜尋引擎(如 Google)主要透過追蹤網頁上的連結來探索網站。然而,對於以下類型的網站或頁面,僅僅依靠連結可能不夠:

  • 大型網站: 頁面數量龐大,爬蟲可能需要很長時間才能遍歷所有內容。
  • 新網站: 外部或內部連結尚不豐富,爬蟲可能不容易找到所有頁面。
  • 包含大量孤立頁面(Orphan pages) 的網站: 這些頁面存在,但網站內部沒有其他頁面連結指向它們。
  • 包含豐富媒體內容或新聞的網站: 需要特定的 Sitemap 來幫助搜尋引擎理解這些內容類型。

在這些情況下,提供一份 Sitemap 可以作為一個明確的指引,告訴搜尋引擎哪些頁面是重要的,加速其發現與索引的過程。這有助於提升頁面的「可發現性」(Discoverability)和「索引速度」(Faster Indexation)。

Sitemap 的作用是促進頁面的發現與索引,它不能保證頁面一定會被索引,也與頁面在搜尋結果中的排名沒有直接關聯。排名是基於索引完成後,搜尋引擎根據多種演算法因素進行的評估。

Sitemap 更多是讓您的網頁有機會進入搜尋引擎的資料庫,參與後續的排名競爭。同時,Sitemap 也能作為標準化(Canonicalization)的一個輔助訊號,幫助搜尋引擎確認頁面的首選版本。

二、5 種 Sitemap 格式一次搞懂!從 XML 到 HTML 網站地圖範例全收錄!

為了滿足不同內容類型和用途的需求,Sitemap 存在多種格式:

(一)主要 Sitemap 種類

  1. XML Sitemap: 這是最常見、也是搜尋引擎最主要使用的 Sitemap 格式。它採用 XML 語言,專為機器閱讀設計。
  2. Video Sitemap: 專用於列出網站上的影片內容,包含影片標題、描述、縮圖等資訊,有助於影片在搜尋結果中的呈現。
  3. News Sitemap: 專為新聞網站設計,幫助 Google News 快速發現並索引符合其規範的新聞報導。
  4. Image Sitemap: 用於列出網站上的圖片,有助於圖片在 Google 圖片搜尋等結果中被發現。
  5. HTML Sitemap: 設計給人類使用者使用的地圖,通常以網頁形式呈現網站結構,方便使用者瀏覽和導覽。它與提供給搜尋引擎的 XML Sitemap 用途不同。

(二)Google 支援的 Sitemap 格式

Google 支援以下幾種 Sitemap 格式用於搜尋引擎探索:

  • 文字 TXT: 最簡單的格式,每行一個完整的網頁網址。檔案編碼必須是 UTF-8。適用於只有少量網址的 Sitemap。
  • XML: 最推薦且功能最完整的格式,是為搜尋引擎優化的標準 Sitemap 格式。
  • RSS、mRSS 和 Atom 1.0: 適用於包含部落格文章或其他動態內容的網站。這些格式會提供近期更新的網址資訊。

(三)XML Sitemap 範例與結構解析

以下是一個基本的 XML Sitemap 結構範例:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.90">
   <url>
      <loc>https://albertfnm.com/</loc>
      <lastmod>2024-10-27T10:00:00+00:00</lastmod>
      <priority>1.0</priority>
      <changefreq>daily</changefreq>
   </url>
   <url>
      <loc>https://albertfnm.com/about-us</loc>
      <lastmod>2024-10-26</lastmod>
      <priority>0.8</priority>
      <changefreq>weekly</changefreq>
   </url>
   </urlset>

各標籤的說明:

  • <?xml version=”1.0″ encoding=”UTF-8″?>:XML 宣告,指定 XML 版本及必須使用的 UTF-8 編碼。
  • <urlset>:Sitemap 文件的根標籤,包含所有網址。xmlns 屬性指定了 Sitemap 協議的標準版本。
  • <url>:用於包裹每一個獨立網址的資訊。
  • <loc>:這是 <url> 標籤中唯一必需的子標籤。 它指定了網頁的完整絕對路徑網址,且必須是正規網址(Canonical URL),例如 https://albertfnm.com/about-us。
  • 可選標籤:
    • <lastmod>(最後修改日期):指定檔案最後修改的日期。建議遵循 W3C Datetime 格式。Google 曾表示此標籤在大多數情況下不會被作為重要的爬取依據,因其準確性難以保證。
    • <priority>(優先級):指定該 URL 相對於網站上其他 URL 的優先級(0.0 到 1.0,預設為 0.5)。此數值僅表達網站管理員的主觀判斷,Google 表示會忽略此標籤作為排名依據。
    • <changefreq>(更改頻率):指定網頁內容預期更改的頻率(例如 hourly、daily、weekly)。Google 認為此標籤對於爬取頻率的影響有限。

三、Sitemap 建立方法:WordPress 外掛、線上產生器、工具應用

建立 Sitemap 的方式多種多樣,取決於您的網站類型和技術能力:

(一)使用 CMS 內建功能

許多主流的內容管理系統(CMS),如 Wix、Squarespace、Shopify 等,都提供自動生成及更新 Sitemap 的功能。這些 CMS 通常會在 您的網域/sitemap.xml 提供 Sitemap 檔案,並在您新增、修改或刪除頁面時自動進行更新。這種方式對於使用者而言最為便捷。

缺點可能是對哪些頁面應被包含或排除的細部控制較少。

(二)使用 WordPress 外掛

WordPress 本身不提供內建的 Sitemap 功能。但可以透過安裝第三方外掛來實現。其中最受歡迎且功能完善的是 Yoast SEO 外掛。

  • 安裝並啟用 Yoast SEO 外掛。
  • 在 WordPress 後台,導航至「Yoast SEO」>「設定」>「網站功能」。
  • 找到「XML sitemaps」選項並確認其已啟用(Enabled)。
  • 啟用後,您的 Sitemap 通常可以在 您的網域/sitemap.xml 或 您的網域/sitemap_index.xml 找到。

Yoast SEO 會自動維護和更新您的 Sitemap。您也可以在 Yoast 的設定中,針對不同的內容類型或特定頁面進行包含或排除的設定。

(三)使用 Sitemap 生成器工具

對於非 CMS 網站或需要更多自訂選項的情況,可以使用 Sitemap 生成工具:

  • 針對頁面數較少(例如 < 300 頁) 的網站
    • 可以利用 Screaming Frog SEO Spider 的免費版本。設定為 Spider 模式,輸入網站首頁 URL 進行爬取。完成後,如果在免費版限制內,可以匯出 XML Sitemap 檔案。匯出時可選擇排除 Google 不太重視的可選標籤。
  • 針對頁面數較多(> 300 頁) 或需要進階分析的網站
    • 專業的付費 SEO 工具,如 Ahrefs Site AuditSemrush Site Audit,提供更強大的爬取和分析功能。這些工具可以爬取整個網站,並允許您根據特定的條件(如可索引性、正規化狀態)篩選 URL 列表,然後匯出此列表用於生成 Sitemap。
  • 免費線上 Sitemap 生成器
    • 網路上有許多免費的 Sitemap 生成服務,例如 xml-sitemaps.com。這些工具操作簡單,輸入網址即可自動生成 Sitemap。然而,使用這類工具需謹慎,生成的 Sitemap 可能會包含非正規、已重新導向或不應被索引的網址。 建議手動檢查並清理生成的 Sitemap 檔案。

無論採用哪種方式,確保生成的 Sitemap 檔案符合 XML 格式規範且包含正確的網址是首要任務。

四、如何提交 Sitemap 給 Google?Google Search Console 操作指南!

建立好 Sitemap 後,最重要的一步就是將其提交給 Google Search Console(GSC),正式告知 Google 您的網站地圖所在位置。

(一)提交前的準備

  1. 確定您的 Sitemap 檔案位置: 通常是您網站根目錄下的 sitemap.xml 或 sitemap_index.xml。如果是手動建立的檔案,請確保已將其上傳到網站根目錄。
  2. 確認您的網站已在 Google Search Console 中完成驗證,且您擁有該網站的 GSC 管理權限。

(二)提交步驟(Google Search Console)

  1. 登入您的 Google Search Console 帳戶。
  2. 在左側導覽選單中,展開「索引」(Indexing),點擊「Sitemaps」。
  3. 在「新增 Sitemap」區塊,您會看到您的網站網址已經顯示。在網址後方的空白欄位中,輸入您的 Sitemap 檔案名稱,例如 sitemap.xml 或 sitemap_index.xml。
  4. 點擊右側的「提交」(Submit) 按鈕。

(三)提交後的檢查

提交後,Google Search Console 會開始處理您的 Sitemap。在同一頁面下方,您可以查看所有已提交的 Sitemap 列表及其狀態:

  • 狀態: 觀察狀態顯示為「成功」(Success)、「無法擷取」(Couldn’t fetch) 或「有錯誤」(Has errors)。
  • 如果狀態為「成功」,表示 Google 已成功接收並讀取您的 Sitemap。報告中也會顯示 Google 從該 Sitemap 中發現了多少個網址(請注意,這不代表所有網址都已被索引)。
  • 如果狀態為「無法擷取」或「有錯誤」,請點擊對應的 Sitemap,查看詳細的錯誤報告,根據錯誤訊息進行排查和修正(例如檔案不存在、格式錯誤等)。

(四)將 Sitemap 網址加入 robots.txt

雖然透過 GSC 提交 Sitemap 已經足夠,但在網站根目錄下的 robots.txt 檔案中加入 Sitemap 網址,是個額外的推薦做法。這可以幫助 Google 和其他搜尋引擎更快地找到您的 Sitemap。

編輯您的 robots.txt 檔案,在其中加入以下一行:

Sitemap:[您的Sitemap完整網址]

例如:Sitemap:https://yourdomain.com/sitemap_index.xml

五、如何檢查與優化 Sitemap?避免常見錯誤,提升 SEO 成效!

Sitemap 並非一勞永逸。定期檢查與優化 Sitemap,確保其準確性與有效性,對於維持良好的 SEO 狀態至關重要。

(一)檢查 Sitemap 的方法

  • Google Search Console 的 Sitemap 報告: 這是最直接的檢查工具,可以查看提交狀態及 Google 發現的網址數量。錯誤訊息也會在這裡顯示。
  • SEO 專業工具: 使用 Semrush Site Audit 或 Ahrefs Site Audit 等工具進行全面的網站審計。這些工具會將您的網站爬取結果與 Sitemap 進行比對,找出 Sitemap 中包含不應有網址、存在孤立頁面等問題。

(二)常見的 Sitemap 相關問題與排除

  1. Sitemap 檔案格式或編碼錯誤。
  2. Sitemap 中包含狀態碼非 200 的網址:例如 3xx(重新導向)、4xx(遺失)、5xx(伺服器錯誤) 的頁面。這些頁面不應包含在 Sitemap 中。
  3. Sitemap 中包含應排除的頁面:例如已設定 noindex 標籤的頁面、在 robots.txt 中被阻止爬取的頁面。將這些頁面包含在 Sitemap 中會傳遞矛盾的訊號。
  4. Sitemap 中包含非正規網址:例如網站使用 HTTPS,但 Sitemap 中卻有 HTTP 網址;或同一個內容有多個 URL 可達,Sitemap 中包含了非正規版本。Sitemap 應只包含每個內容的正規網址。
  5. Sitemap 檔案過大:單一檔案超過 50MB 或 50,000 個 URL。
  6. Sitemap 檔案位置錯誤或網址有誤,導致 Google 無法擷取(404 錯誤)。
  7. Sitemap 中包含低品質或無價值的頁面:例如重複內容頁、過於簡短無實質內容的頁面、大量的封存頁面、站內搜尋結果頁等,這些頁面可能會分散爬取預算。
  8. Sitemap 中包含「孤立頁面」(Orphaned pages):雖然 Sitemap 本身提供這些頁面的位置,但如果網站內部沒有任何連結指向它們,使用者和爬蟲除了 Sitemap 之外很難發現這些頁面。這可能是網站內部連結結構有問題的訊號。

(三)哪些頁面不應包含在 Sitemap 中?

為了確保 Sitemap 高效且向搜尋引擎提供清晰的訊號,應將以下類型的頁面排除:

  • 所有狀態碼非 200 的網址(3xx、4xx、5xx)。
  • 已設定 noindex meta 標籤的頁面。
  • 在 robots.txt 中被 Disallow 的網址。
  • 重複內容頁面(Duplicate content)。
  • 非正規版本頁面(Non-canonical versions)。
  • 低品質或對搜尋引擎價值低的頁面(例如大量的過時封存頁、無實質內容的分類/標籤頁)。
  • 站內搜尋結果頁面。
  • 留言的獨立 URL。

(四)Sitemap 檔案大小限制與處理

正如前面提及,單一 Sitemap 檔案不得超過 50MB 或包含 50,000 個 URL

如果您的網站規模龐大,導致 Sitemap 超過這些限制,您需要將 Sitemap 文件分割成多個較小的檔案。然後,建立一個「Sitemap 索引檔」(通常命名為 sitemap_index.xml),這個索引檔中包含所有分割後子 Sitemap 檔案的網址。最後,只需將這個 sitemap_index.xml 檔案提交到 Google Search Console 即可。Google 會讀取索引檔,進而去處理所有子 Sitemap。

(五)Sitemap 索引檔範例

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.90">
   <sitemap>
      <loc>https://yourdomain.com/sitemap1.xml</loc>
      <lastmod>2024-10-27T10:00:00+00:00</lastmod>
   </sitemap>
   <sitemap>
      <loc>https://yourdomain.com/sitemap2.xml</loc>
      <lastmod>2024-10-27T10:00:00+00:00</lastmod>
   </sitemap>
   </sitemapindex>

(六)更新 Sitemap 的頻率

Sitemap 的更新頻率應與您網站內容的更新頻率同步。

  • 如果您的網站經常發布新內容(例如每天多篇文章),建議每週甚至每天生成或更新 Sitemap。
  • 對於內容更新不頻繁的網站,每月檢查並更新一次 Sitemap 通常足夠。

使用 CMS 內建功能或如 Yoast SEO 等外掛,通常可以實現 Sitemap 的自動更新,大大減輕維護負擔。

六、Sitemap 常見問題

以下整理了一些關於 Sitemap 的常見問題及其解答:

Q1:網站是否一定需要 Sitemap?

Google 表示,對於結構良好且內部連結完善的小型網站(通常指頁面數少於 500),Sitemap 可能不是絕對必要的。然而,提供 Sitemap 總是能幫助搜尋引擎更快地發現您的頁面,因此強烈建議為所有網站建立 Sitemap,對於大型或新網站尤其重要。

Q2:Sitemap 會直接影響 SEO 排名嗎?

Sitemap 本身不直接影響頁面的搜尋排名。它的主要作用是幫助搜尋引擎發現和索引您的頁面。只有被索引的頁面才有資格參與排名。

Q3:Sitemap 檔案大小有限制嗎?

是的。單一 Sitemap 檔案不能超過 50MB 或包含超過 50,000 個 URL。如果超過限制,需要將其分割成多個子 Sitemap,並使用一個 Sitemap 索引檔。

Q4:哪些頁面不應該放在 Sitemap 中?

應排除不應被索引、狀態不正確或價值較低的頁面,例如:重新導向頁、錯誤頁面(404、5xx)、設定 noindex 的頁面、非正規網址、重複內容頁、在 robots.txt 中被阻止爬取的頁面、低品質或無價值的頁面等。

Q5:需要為 AMP 頁面建立單獨的 Sitemap 嗎?

Google 官方建議不需要為 AMP 頁面單獨建立 Sitemap。Google 可以透過頁面的正規版本上的 rel=”amphtml” 連結來發現 AMP 版本。

Q6:如何為電商網站建立 Sitemap?

電商網站建立 Sitemap 的基本原則與其他網站相同。但由於商品、分類、篩選等可能產生大量 URL,應特別注意過濾,確保 Sitemap 只包含重要的、可索引的、正規的頁面(如商品頁、分類頁、品牌頁等),並排除因篩選或分頁產生的重複或無價值的 URL。利用專業工具輔助檢查尤為重要。

Q7:如何在 WordPress 中找到網站的根目錄?

網站根目錄通常是指主機上存放網站核心檔案的最頂層目錄。常見的名稱包括 /public_html、/www 或 /html。您可以透過 FTP/SFTP 客戶端或主機控制面板提供的檔案管理器來訪問這個目錄。Sitemap 檔案通常需要放置在此。

Q8:需要 Video Sitemap 或 Image Sitemap 嗎?

這些是特定類型的 Sitemap,並非所有網站必需。如果您的網站包含大量影片或圖片,且希望這些媒體內容能在 Google 搜尋結果(特別是圖片或影片搜尋)中有更好的表現,建立相應的 Video 或 Image Sitemap 會非常有幫助。不過,透過結構化資料(Schema Markup) 標記影片或圖片內容也能達到類似的效果。

Q9:需要 HTML Sitemap 嗎?

HTML Sitemap 主要目的是提升使用者導覽體驗,而非直接用於搜尋引擎的爬取與索引。對於使用者而言,良好的網站架構和內部連結設計比 HTML Sitemap 更為重要。HTML Sitemap 不能取代有效的網站架構。對於 SEO 而言,XML Sitemap 才是關鍵。

Q10:Google Sites 支援 Sitemap 嗎?

目前 Google Sites 不提供自訂 Sitemap 功能。Google 會自動處理 Google Sites 網站的索引事宜。

你可能也會喜歡

Leave a Comment