URL 參數(shù)或查詢字符串是 URL 的一部分,通常位于問號 (?) 之后,用于與 URL 一起傳遞數(shù)據(jù)。它們可以是修改頁面內(nèi)容的主動參數(shù),也可以是主要用于跟蹤且不更改內(nèi)容的被動參數(shù)。
它們由鍵值對組成,其中鍵告訴您正在傳遞什么數(shù)據(jù),而值是您正在傳遞的數(shù)據(jù),例如標識符。它們看起來像 ?key=value 但如果有一對以上,則可以用與號 (&) 分隔,例如 ?key=value&key2=value2。
URL參數(shù)部分的解釋。
在本指南中,我們將介紹您需要了解的有關 URL 參數(shù)的內(nèi)容。
如何使用參數(shù)
正如我在介紹中提到的,參數(shù)可以是活動的的或被動的。讓我們看一些例子。
活動參數(shù)
活動參數(shù)以某種方式修改頁面的內(nèi)容。
過濾器。刪除一些內(nèi)容,在用戶想要查看的頁面上留下更具體的內(nèi)容。例如電子商務中的分面導航。
?color=yellow
排序。以某種方式重新排序內(nèi)容,例如按價格或評級。
?sort=highest_rated
分頁。將內(nèi)容劃分為一系列相關頁面。
?p=2
翻譯。更改內(nèi)容的語言。
?lang=de
搜索。查詢網(wǎng)站以獲取用戶正在尋找的信息。
在搜索引擎yep.com 上,我們使用鍵“q”進行查詢,該值包含有關用戶查詢的信息。
?q=ahrefs
被動參數(shù)
被動參數(shù)不改變內(nèi)容。它們通常用于跟蹤。讓我們看一些例子。
附屬 ID。傳遞用于跟蹤銷售和注冊來源的標識符。
?id=ahrefs
廣告標簽。跟蹤廣告活動。
?utm_source=newsletter
會話 ID。標識特定用戶。在現(xiàn)代網(wǎng)站上使用會話 ID 來跟蹤用戶并不常見。
?sessionid=12345
視頻時間戳。跳轉(zhuǎn)到視頻中的指定時間戳。
?t=135
搜索引擎優(yōu)化的影響
當涉及到 SEO 時,URL 參數(shù)可能會導致許多不同的問題,尤其是在使用多個參數(shù)的情況下。以下是您可能會遇到的一些問題。
被動參數(shù)可能會導致重復內(nèi)容的問題。通常,您希望它們被抓取,并且每個頁面都應該有一個規(guī)范設置為主版本。
有時您可能希望使用robots.txt完全阻止這些參數(shù)被抓取- 但僅在您可能遇到抓取預算問題的情況下。稍后我們將對此進行更多介紹。
Google 將在稱為規(guī)范化的過程中選擇要索引的頁面版本,并且鏈接等信號將合并到該索引版本。
活動參數(shù)可能會創(chuàng)建具有近乎重復的內(nèi)容或與其他內(nèi)容非常相似的內(nèi)容的頁面。它們也可能是完全不同的內(nèi)容。您需要檢查參數(shù)的實際用途。
內(nèi)部鏈接
您應該避免使用被動參數(shù),例如用于跟蹤內(nèi)部鏈接(從您網(wǎng)站上的一個頁面到另一個頁面的鏈接)。
這在大型網(wǎng)站上仍然是一種非常普遍的做法,但我想強調(diào)的是,這是一種陳舊過時的做法。
大多數(shù)分析系統(tǒng)都有事件跟蹤,您可以使用它來記錄數(shù)據(jù),而無需向您的 URL 添加參數(shù)。
在大多數(shù)情況下,可以在內(nèi)部鏈接上使用活動參數(shù)。
抓取
帶有參數(shù)或大量不同組合的無限 URL 路徑可能會導致抓取問題。保持一致的順序,并且沒有允許添加其他參數(shù)的路徑。
您可以使用Site Audit中Structure Explorer工具下的Depth報告輕松找到潛在的無限路徑。網(wǎng)站有 9 個以上的級別并不常見,因此這是一個強有力的指標,表明實際上可能存在無限路徑或其他問題。
Structure Explorer中的深度報告。
谷歌會在抓取時進行調(diào)整,因為它識別出無限的路徑或某些模式。它將嘗試限制對它認為無用或重復的 URL 的抓取。
國際化
URL 參數(shù)有時用于國際網(wǎng)站。這些被列為特定于語言環(huán)境的 URL的一個選項。但即使是谷歌也表示不推薦。它增加了復雜性,更可能會出錯。您也無法在 Google Search Console 中對這些 URL 進行地理定位。
電子商務
參數(shù)通常用于電子商務中的所有內(nèi)容——從跟蹤到分頁,再到分面導航。這些主題可能非常復雜。
JavaScript
人們使用 # 而不是 ? 作為片段標識符,特別是對于那些用于跟蹤的被動參數(shù)。這通常不是一個好主意。但在特定情況下,可以這樣做來替換不必要的參數(shù)。
問題是服務器忽略 # 之后的任何內(nèi)容,并且許多系統(tǒng)根本不會或無法識別使用 # 的參數(shù)。
另外,# 已經(jīng)有一個指定的用例,就是滾動到頁面的一部分。這是在客戶端完成的,JavaScript 開發(fā)人員也可以使用它來轉(zhuǎn)到具有不同內(nèi)容的頁面。
檢查
檢查您的站點上使用了哪些參數(shù)。在Site Audit 的 Page Explorer工具中,您可以搜索包含問號 (?) 的 URL。
在Page Explorer中搜索參數(shù)
您可以使用高級過濾器查找具有多個參數(shù)的頁面或開始排除參數(shù)以幫助您識別網(wǎng)站上使用的所有各種參數(shù)。
一旦您知道使用了哪些參數(shù),我建議您查看一些頁面以了解這些參數(shù)的實際作用。
您還可以檢查重復報告中的準確或近似重復。視覺效果使您可以輕松查看您是否有許多相同或相似頁面的版本,以及它們是否具有匹配的規(guī)范標簽來選擇首選版本。您可以單擊每個集群以獲取更多信息。
復制內(nèi)容樹圖視圖以顯示集群。
“批量導出”下還有一個選項,可讓您一次導出所有重復的內(nèi)容。我發(fā)現(xiàn)這個選項更容易用于更大的數(shù)據(jù)集。
控制參數(shù)
過去,Google 在 Google Search Console 中有一個 URL 參數(shù)工具,您可以在其中根據(jù)是否更改頁面內(nèi)容來選擇如何處理不同的參數(shù)。該工具已于 2022 年初棄用。以下是 Google 對此的評價:
2009 年,當 Search Console 的前身網(wǎng)站管理員工具中推出 URL 參數(shù)工具時,互聯(lián)網(wǎng)是一個比今天更加狂野的地方。SessionID 參數(shù)非常常見,CMS 難以組織參數(shù),瀏覽器經(jīng)常斷開鏈接。使用 URL 參數(shù)工具,網(wǎng)站所有者可以通過指定某些參數(shù)如何影響其網(wǎng)站上的內(nèi)容來精細控制 Google 如何抓取他們的網(wǎng)站。
多年來,谷歌在猜測網(wǎng)站上哪些參數(shù)有用,哪些參數(shù)——簡單地說——無用方面變得更好了。事實上,目前在 URL Parameters 工具中指定的參數(shù)配置中只有大約 1% 對爬取有用。由于該工具對 Google 和 Search Console 用戶的價值較低,我們將在 1 個月內(nèi)棄用 URL 參數(shù)工具。
雖然沒有提到,但我懷疑某些用戶可能一直在使用該工具傷害自己。我過去遇到過這種情況,有人設置了錯誤的設置,說內(nèi)容沒有改變,但確實發(fā)生了。這從該網(wǎng)站的索引中刪除了幾十萬頁。哎呀!
您可以讓 Google 抓取并弄清楚如何為您處理參數(shù),但您也可以利用一些控件。
規(guī)范標簽
規(guī)范標簽可以幫助將信號整合到選定的 URL,但需要抓取頁面的每個附加版本。正如我之前提到的,Google 可能會在識別模式時進行調(diào)整,并且隨著時間的推移,這些規(guī)范化的 URL 可能會被抓取的次數(shù)減少。
這是我默認選擇的。但是,如果一個站點有很多問題并且參數(shù)失控,我可能會考慮其他一些選項。
無索引
noindex 元機器人標記從索引中刪除頁面。這需要抓取一個頁面。但同樣,它可能會隨著時間的推移而減少。如果您需要將信號整合到其他頁面,我將避免使用 noindex。
在 robots.txt 中阻止
robots.txt 中的屏蔽參數(shù)意味著這些頁面可能仍會被編入索引。它們不太可能出現(xiàn)在正常搜索中。
問題是這些頁面不會被抓取,也不會整合信號。如果要合并信號,請避免阻止參數(shù)。
站點審核
在站點審核中設置項目時,抓取設置中有一個名為“刪除 URL 參數(shù)”的切換,您可以使用它來忽略任何帶有參數(shù)的 URL。
您還可以使用模式匹配在爬網(wǎng)設置中排除參數(shù)化 URL。
阻止站點審查中的參數(shù)。
邊注。有趣的事實:我們只將頁面的規(guī)范化版本計入您的抓取積分。
最后的想法
總結(jié)一下,URL 參數(shù)有很多不同的用例,它們可能會也可能不會給您的網(wǎng)站帶來問題。一切都是看實際情況。
翻譯作品,原作者:Patrick Stox
相關文章:
文章為作者獨立觀點,不代表DLZ123立場。如有侵權,請聯(lián)系我們。( 版權為作者所有,如需轉(zhuǎn)載,請聯(lián)系作者 )

網(wǎng)站運營至今,離不開小伙伴們的支持。 為了給小伙伴們提供一個互相交流的平臺和資源的對接,特地開通了獨立站交流群。
群里有不少運營大神,不時會分享一些運營技巧,更有一些資源收藏愛好者不時分享一些優(yōu)質(zhì)的學習資料。
現(xiàn)在可以掃碼進群,備注【加群】。 ( 群完全免費,不廣告不賣課!)