1. 谷歌推薦的URL結(jié)構(gòu):
推薦:URL中使用簡單的描述性詞語:
https://en.wikipedia.org/wiki/Aviation?
推薦:URL中的本地化單詞(如果適用)
https://www.example.com/lebensmittel/pfefferminz?
推薦:根據(jù)需要使用UTF-8 編碼。例如,以下示例對 URL 中的阿拉伯字符使用 UTF-8 編碼:
https://www.example.com/%D9%86%D8%B9%D9%86%D8%A7%D8%B9/%D8%A8%D9%82%D8%A7%D9%84%D8%A9?
以下示例對URL中的中文字符使用 UTF-8 編碼:
https://example.com/%E6%9D%82%E8%B4%A7/%E8%96%84%E8%8D%B7?
以下示例對URL 中的元音變音使用 UTF-8 編碼:
https://www.example.com/gem%C3%BCse?
以下示例對URL 中的表情符號(hào)使用 UTF-8 編碼:
https://example.com/%F0%9F%A6%99%E2%9C%A8
如果可能,盡量在URL 中使用可讀的單詞而不是長 ID 號(hào)。
推薦:國家特定域名:
https://example.de?
推薦:具有通用頂級(jí)域名(gTLD)?的國家/地區(qū)特定子目錄:
https://example.com/de/?
考慮使用連字符來分隔URL 中的單詞,因?yàn)樗梢詭椭脩艉退阉饕娓p松地識(shí)別 URL 中的概念。我們建議您在 URL 中?使用連字符?(?-)?而不是下劃線?(?)。_
推薦:連字符(?-):
https://www.example.com/summer-clothing/filter?color-profile=dark-grey
2. 谷歌不推薦的URL結(jié)構(gòu):
不推薦:在URL 中使用非 ASCII 字符:
https://www.example.com/??????
https://www.example.com/雜貨/薄荷?
https://www.example.com/gemüse?
https://www.example.com/?????
不推薦:URL中不可讀、長 ID 號(hào):
https://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1
不推薦:下劃線?(?_):
https://www.example.com/summer_clothing/filter?color_profile=dark_grey?
不推薦:URL中的單詞連接在一起:
https://www.example.com/greendress
3. 與?URL?相關(guān)的常見問題
過于復(fù)雜的URL,尤其是包含多個(gè)參數(shù)的 URL,可能會(huì)創(chuàng)建不必要的大量指向網(wǎng)站上相同或相似內(nèi)容的 URL,從而給爬網(wǎng)程序帶來問題。因此,Googlebot 可能會(huì)消耗比所需更多的帶寬,或者可能無法完全索引您網(wǎng)站上的所有內(nèi)容。
許多問題可能會(huì)導(dǎo)致不必要的大量URL。這些包括:
一組項(xiàng)目的附加過濾。許多網(wǎng)站提供同一組項(xiàng)目或搜索結(jié)果的不同視圖,通常允許用戶使用定義的條件過濾此組(例如:顯示海灘上的酒店)。當(dāng)過濾器可以以附加方式組合時(shí)(例如:海灘上的酒店和帶有健身中心的酒店),站點(diǎn)中的URL(數(shù)據(jù)視圖)數(shù)量會(huì)激增。創(chuàng)建大量略有不同的酒店列表是多余的,因?yàn)?Googlebot 只需要查看少量列表即可到達(dá)每個(gè)酒店的頁面。例如:
“超值價(jià)格”的酒店住宿:
https://www.example.com/hotel-search-results.jsp?Ne=292&N=461?
海灘上“超值價(jià)格”的酒店住宿:
https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240?
海灘上“超值”且設(shè)有健身中心的酒店住宿:
https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270?
動(dòng)態(tài)生成文檔。由于計(jì)數(shù)器、時(shí)間戳或廣告,這可能會(huì)導(dǎo)致微小的變化。
URL中的參數(shù)有問題。例如,會(huì)話 ID 可能會(huì)產(chǎn)生大量重復(fù)和更多 URL。
排序參數(shù)。
一些大型購物網(wǎng)站提供多種方式對相同商品進(jìn)行排序,從而導(dǎo)致URL 數(shù)量大幅增加。例如:
https://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25?
URL中不相關(guān)的參數(shù),例如引用參數(shù)。例如:
https://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79?
https://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913?
https://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
日歷問題。
動(dòng)態(tài)生成的日歷可能會(huì)生成指向未來和先前日期的鏈接,且對開始或結(jié)束日期沒有限制。例如:
https://www.example.com/calendar.php?d=13&m=8&y=2011?
相關(guān)鏈接已損壞。
斷開的相對鏈接通常會(huì)導(dǎo)致無限的空間。通常,由于重復(fù)的路徑元素而出現(xiàn)此問題。例如:
https://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm
4. 解決與 URL 相關(guān)的問題 :
為了避免URL 結(jié)構(gòu)的潛在問題,我們建議如下:
創(chuàng)建一個(gè)簡單的 URL 結(jié)構(gòu)。考慮組織您的內(nèi)容,以便以人類最容易理解的方式邏輯地構(gòu)建 URL。
考慮使用 robots.txt 文件來阻止 Googlebot 訪問有問題的網(wǎng)址。通常,請考慮阻止動(dòng)態(tài) URL,例如生成搜索結(jié)果的 URL,或可以創(chuàng)建無限空間的 URL(例如日歷)。在 robots.txt 文件中使用正則表達(dá)式可以讓您輕松阻止大量 URL。
盡可能避免在 URL 中使用會(huì)話 ID。考慮使用 cookie 來代替。
如果 Web 服務(wù)器對 URL 中的大寫和小寫文本進(jìn)行相同的處理,請將所有文本轉(zhuǎn)換為相同的大小寫,以便 Google 更容易確定 URL 引用同一頁面。
只要有可能,通過修剪不必要的參數(shù)來縮短 URL。
如果您的站點(diǎn)有無限日歷,請?zhí)砑右粋€(gè) nofollow 屬性來鏈接到動(dòng)態(tài)創(chuàng)建的未來日歷頁面。
檢查您的網(wǎng)站是否有損壞的相關(guān)鏈接。
來源:https://developers.google.com/search/docs/crawling-indexing/url-structure
文章為作者獨(dú)立觀點(diǎn),不代表DLZ123立場。如有侵權(quán),請聯(lián)系我們。( 版權(quán)為作者所有,如需轉(zhuǎn)載,請聯(lián)系作者 )

網(wǎng)站運(yùn)營至今,離不開小伙伴們的支持。 為了給小伙伴們提供一個(gè)互相交流的平臺(tái)和資源的對接,特地開通了獨(dú)立站交流群。
群里有不少運(yùn)營大神,不時(shí)會(huì)分享一些運(yùn)營技巧,更有一些資源收藏愛好者不時(shí)分享一些優(yōu)質(zhì)的學(xué)習(xí)資料。
現(xiàn)在可以掃碼進(jìn)群,備注【加群】。 ( 群完全免費(fèi),不廣告不賣課!)