XML Sitemap是XML(可擴(kuò)展標(biāo)記語言)格式的站點(diǎn)地圖,,包含了網(wǎng)站所有重要頁面的目錄檔案,,可以幫助Google蜘蛛發(fā)現(xiàn)網(wǎng)站重要頁面以及頁面的更新頻率,。以下是摘自谷歌官方的解釋:
“站點(diǎn)地圖會(huì)告訴 Google 您認(rèn)為網(wǎng)站中的哪些網(wǎng)頁和文件比較重要,還會(huì)提供與這些文件有關(guān)的重要信息:以網(wǎng)頁為例,,這些信息包括網(wǎng)頁上次更新的時(shí)間,、網(wǎng)頁更改的頻率,以及網(wǎng)頁是否有其他語言版本,?!?/span>
Google的網(wǎng)站分析師Gary Illyes曾說過,XML Sitemap是谷歌蜘蛛發(fā)現(xiàn)頁面的第二重要的途徑(第一是已抓取頁面上的鏈接),。由于Sitemap可以包含大量URL,,因此其重要性不應(yīng)被小覷!

那么是不是所有的網(wǎng)站都必須創(chuàng)建XML Sitemap呢,?由于Sitemap最基本的作用是展現(xiàn)網(wǎng)站上URL的信息供爬蟲爬取,,主要受益的是新頁面或是內(nèi)容剛更新的頁面,因此如果您的網(wǎng)站頁面數(shù)量非常少(少于500個(gè)頁面),,內(nèi)鏈結(jié)構(gòu)清晰,,圖片視頻等多媒體資源少,那么XML Sitemap的必要性就顯得不是那么大,;但是XML Sitemap對(duì)任何類型網(wǎng)站來說仍然有以下好處:
一,、管理爬取預(yù)算
Google爬蟲的抓取能力雖然強(qiáng)大,但每次的抓取頁面份額依然是有限的,,如果您的網(wǎng)站每次只有少量頁面更新,為了讓爬蟲集中抓取這部分頁面,,而不是分配爬取份額到其他頁面上,,您可以通過sitemap.xml的lastmod屬性向Google發(fā)出信號(hào),通知它應(yīng)該在此集中精力,。
二,、網(wǎng)站整改后觸發(fā)爬蟲重新爬取
如果您在網(wǎng)站整改的過程中更改了站內(nèi)大量的URL,但新版的Google Search Console僅索引您提交的單個(gè)URL,,這時(shí)可以通過Sitemap向谷歌發(fā)出重新爬取整站的請(qǐng)求,。
三、快速抓取
有一些經(jīng)驗(yàn)和證據(jù)表明,,提交站點(diǎn)地圖會(huì)使Google抓取速度更快,,促進(jìn)頁面更快獲得排名。
因此,,建議每個(gè)網(wǎng)站都創(chuàng)建XML Sitemap,,尤其是對(duì)以下類型網(wǎng)站來說:
● 大型網(wǎng)站
● 新聞?wù)?/span>
● 使用了大量圖片和視頻的網(wǎng)站
XML Sitemap VS. HTML Sitemap
事實(shí)上,,Sitemap可簡(jiǎn)單分為兩種,按照文件格式來區(qū)分的話分別是XML Sitemap和HTML Sitemap,。在我們說提交Sitemap的時(shí)候,,指的是提交XML Sitemap文件的線上URL到谷歌(或者其他平臺(tái)如Bing)站長(zhǎng)后臺(tái),而我們?cè)诘撞繉?dǎo)航欄??吹降摹癝itemap”錨文本鏈向的就是HTML版本的Sitemap,,兩者的本質(zhì)和作用方式都是不一樣的。
這里首先跟大家介紹一下較為簡(jiǎn)單的HTML Sitemap,,顧名思義,,HTML Sitemap實(shí)際上是一個(gè)網(wǎng)頁,供網(wǎng)站用戶概覽網(wǎng)站頻道分類使用,,通常大家會(huì)將這個(gè)頁面設(shè)計(jì)得較為美觀,,下圖是HTML Sitemap的一個(gè)示例:

HTML Sitemap上一般放置網(wǎng)站重要(一級(jí),二級(jí)導(dǎo)航頁面等)內(nèi)部鏈接的列表,,簡(jiǎn)單明了地展示權(quán)重從首頁傳遞到其他重要頁面的流向,。早年SEO業(yè)界普遍認(rèn)為HTML Sitemap可以促進(jìn)排名,但是來自Google的專家John Mueller表示,,HTML 對(duì)于SEO來說用處并不大,,反之,如果用戶需要靠HTML Sitemap來進(jìn)行站內(nèi)導(dǎo)航的話, 這說明您的導(dǎo)航設(shè)計(jì)和站內(nèi)搜索功能還差強(qiáng)人意,。因此,,如果您的網(wǎng)站還沒有HTML Sitemap,無需擔(dān)心,,將精力放在優(yōu)化站內(nèi)導(dǎo)航和搜索功能上,,收益會(huì)更大。
XML Sitemap應(yīng)用實(shí)踐
如上文所述,,XML Sitemap對(duì)于SEO工作有著非常重要的作用,,隨著SEO技術(shù)的發(fā)展,XML Sitemap的功能也在不斷被擴(kuò)展,。針對(duì)不同類型的網(wǎng)站或者需求,,我們現(xiàn)已可以使用對(duì)應(yīng)的XML Sitemap的擴(kuò)展或者Sitemap管理和創(chuàng)建方式來進(jìn)行優(yōu)化。
XML Sitemap基本規(guī)范
在介紹一些重點(diǎn)類型網(wǎng)站的XML Sitemap實(shí)踐方法之前,,建議大家先要對(duì)XML Sitemap的規(guī)范有所了解,,以保證XML Sitemap能正常發(fā)揮作用。
● 僅包含狀態(tài)碼為200的Canonical規(guī)范URL,;
● 每個(gè)sitemap最多包含20萬個(gè)URL,,每個(gè)index sitemap最多包括5萬個(gè)sitemap;
● 被添加到robots.txt,;
● BUTF-8編碼,;
● 以.gz格式壓縮,;
● 大小不能超過50Mb;
● 無需為AMP URL添加XML網(wǎng)站地圖,。
我們可以將XML Sitemap理解城市地圖,,那么您的網(wǎng)站就是城市,Google就是游客,。您只需確保地圖中包含重要建筑物的位置即可,,而不是必須包含所有的地址。這就是為什么非重要頁面如隱私權(quán)政策頁面或關(guān)于我們頁面等不應(yīng)該被包含在XML Sitemap中的原因,,這些頁面雖然應(yīng)編入索引,,但對(duì)于SEO來說重要性不高,不需要被經(jīng)常抓取,。
大型網(wǎng)站的XML Sitemap建議
根據(jù)Google的Sitemap官方指南,,每個(gè)Sitemap包含的網(wǎng)址最大數(shù)量是50,000 個(gè)。因此當(dāng)網(wǎng)站規(guī)模大于這個(gè)大小時(shí),,例如大型新聞網(wǎng)站,,可以考慮在制作Sitemap時(shí)用創(chuàng)建目錄文件(sitemap_index)的方式,如此一來可以對(duì)各個(gè)Sitemap檔案進(jìn)行管理,。
您可以按照頁面類型或內(nèi)容主題來組織和劃分sitemap,。在實(shí)際過程中,為各個(gè)子目錄或頁面模板創(chuàng)建專用的XML Sitemap,,有利于發(fā)現(xiàn)了解網(wǎng)站的技術(shù)和索引問題,。根據(jù)Google的Sitemap官方指南,每個(gè)Sitemap包含的網(wǎng)址最大數(shù)量是50,000 個(gè),。因此當(dāng)網(wǎng)站規(guī)模大于這個(gè)大小時(shí),,例如大型新聞網(wǎng)站,可以考慮在制作Sitemap時(shí)用創(chuàng)建目錄文件(sitemap_index)的方式,,如此一來可以對(duì)各個(gè)Sitemap檔案進(jìn)行管理,。
您可以按照頁面類型或內(nèi)容主題來組織和劃分sitemap。在實(shí)際過程中,,為各個(gè)子目錄或頁面模板創(chuàng)建專用的XML Sitemap,有利于發(fā)現(xiàn)了解網(wǎng)站的技術(shù)和索引問題,。

圖片和視頻Sitemap建議
像Pinterest和YouTube這樣主要運(yùn)營(yíng)多媒體資源內(nèi)容的網(wǎng)站將從圖像或視頻Sitemap中受益良多,。圖片Sitemap可增加網(wǎng)站在Google圖片搜索中被發(fā)現(xiàn)的機(jī)會(huì)。也可以在常規(guī)站點(diǎn)地圖中使用圖片標(biāo)簽,,無需額外創(chuàng)建圖片Sitemap,。
以下是圖片標(biāo)簽示例(XML規(guī)范):

視頻Sitemap遵循相同的原則:創(chuàng)建單獨(dú)的視頻Sitemap或?yàn)槌R?guī)站點(diǎn)地圖添加標(biāo)簽:

新聞Sitemap建議
新聞內(nèi)容則需要專門創(chuàng)建一個(gè)單獨(dú)的新聞XML Sitemap,不能在常規(guī)Sitemap添加新聞標(biāo)簽,。對(duì)于每天都發(fā)布大量?jī)?nèi)容的新聞出版業(yè)來說,,獲得新文章的排名是一件十分具有挑戰(zhàn)性的事情,,而新聞Sitemap可幫助Google發(fā)現(xiàn)新文章從而促進(jìn)排名。即便Google已聲明并不會(huì)對(duì)使用新聞Sitemap的網(wǎng)站給予優(yōu)待,,但它確有助于更快地在Google新聞中獲得熱門新聞排名,。
新聞?wù)军c(diǎn)地圖有一些特殊的要求:
● 僅添加發(fā)布不超過2天的文章。
● 一次添加到現(xiàn)有站點(diǎn)地圖的新URL不要超過1000個(gè),。
● 有文章更新時(shí)更新現(xiàn)有站點(diǎn)地圖,。
Sitemap中添加其他標(biāo)簽的建議
您還可以使用XML Sitemap來定義和指示Google的某些元標(biāo)記。例如常用的hreflang多語言為例,,您可以將這部分信息拓展添加到站點(diǎn)地圖:

XML Sitemap工具和生成器
介紹完了Sitemap的定義和用法之后,,本部分將會(huì)介紹一批廣受歡迎的XML Sitemap生成工具。雖然大多數(shù)內(nèi)容管理系統(tǒng)都會(huì)自帶自動(dòng)創(chuàng)建XML網(wǎng)站地圖功能,,但有系統(tǒng)則沒有這樣做,,在這種情況下,您需要使用第三方工具,。
最佳Sitemap生成器
以下是幾款優(yōu)秀的XML網(wǎng)站地圖生成器:

適用于WordPress的最佳Sitemap插件
大多數(shù)CMS如Shopify具有當(dāng)新URL被創(chuàng)建或現(xiàn)有頁面內(nèi)容有更新時(shí)自動(dòng)刷新XML Sitemap的功能,,。但WordPress在默認(rèn)情況下并不會(huì)創(chuàng)建Sitemap,以下是適用于WordPress平臺(tái)的一些優(yōu)秀Sitemap插件推薦,,詳細(xì)信息請(qǐng)查看表格,。

如何提交Sitemap?
大多數(shù)搜索引擎(例如Google或Bing)都會(huì)通過網(wǎng)站的robots.txt文件中查找“ Sitemap:<sitemap_location>”條目來搜尋XML Sitemap存放地址。
當(dāng)然,,我們也可以在將Sitemap.xml上傳到服務(wù)器根目錄后自行提交到各個(gè)站長(zhǎng)平臺(tái),。在提交之前,檢查網(wǎng)站是否已經(jīng)具備站點(diǎn)地圖的最簡(jiǎn)單方法是在Google Search Console或Bing網(wǎng)站管理員工具中的“站點(diǎn)地圖”下查看,,如果發(fā)現(xiàn)沒有,,您可以按照下圖所示在站長(zhǎng)工具中提交Sitemap。

Google Search Console中的XML Sitemaps功能:
1.點(diǎn)擊站點(diǎn)地圖報(bào)告,。
2.添加新的站點(diǎn)地圖路徑并提交,。
3.Google已發(fā)現(xiàn)剛添加的站點(diǎn)地圖。

Bing網(wǎng)站管理員工具中的XML Sitemaps功能:
1.點(diǎn)擊站點(diǎn)地圖報(bào)告,。
2.添加新的站點(diǎn)地圖路徑并提交.
3.Bing已發(fā)現(xiàn)剛提交的站點(diǎn)地圖,。
另外,您也可以直接將站點(diǎn)地圖ping到Google,,百度,,Bing和Yandex。
備注:
本文主要內(nèi)容來自Cross Border Digital合作伙伴SEMrush的博客文章:
https://www.semrush.com/blog/10-awesome-visual-proven-sitemap-generator-tools/
發(fā)布已獲得授權(quán),,內(nèi)容非完全直譯,,也加入了一些作者實(shí)戰(zhàn)經(jīng)驗(yàn)補(bǔ)充及內(nèi)容調(diào)整。另Cross Border Digital是SEMrush在中國(guó)獨(dú)家金牌代理,如有采購需求,,歡迎聯(lián)系我們,。
文章為作者獨(dú)立觀點(diǎn),不代表DLZ123立場(chǎng),。如有侵權(quán),請(qǐng)聯(lián)系我們,。( 版權(quán)為作者所有,如需轉(zhuǎn)載,,請(qǐng)聯(lián)系作者 )