?
什么是重復內(nèi)容?
重復內(nèi)容是在網(wǎng)絡上的多個 URL 上的相同內(nèi)容。因為不止一個 URL顯示相同的內(nèi)容,搜索引擎不知道哪個URL 在搜索結果中列出得更高。因此,他們可能會將這兩個 URL 排名較低,并優(yōu)先考慮其他網(wǎng)頁。
?
為什么要防止網(wǎng)站上的重復內(nèi)容?
重復內(nèi)容意味著類似的內(nèi)容出現(xiàn)在網(wǎng)絡上的多個位置 (URL),因此搜索引擎不知道在搜索結果中顯示哪個 URL。這會損害網(wǎng)頁的排名,而且當人們開始鏈接到相同內(nèi)容的不同版本時,問題只會變得更糟。
另外,如果您的內(nèi)容非常稀薄,并且結合了逐字復制的內(nèi)容,甚至可能會因試圖欺騙用戶而面臨 Google 的手動操作懲罰。
導致出現(xiàn)重復內(nèi)容的原因有哪些?
1.技術人員對URL的誤解導致的重復內(nèi)容
由于開發(fā)人員不像瀏覽器甚至用戶那樣思考,更不用說搜索引擎蜘蛛了。以http://www.example.com/keyword-x/和http://www.example.com/article-category/keyword-x/為例,如果你問開發(fā)者,他們會說它只存在一次。在開發(fā)者看來,該文章的唯一標識符是該文章在數(shù)據(jù)庫中的 ID,而不是 URL。但是對于搜索引擎來說,URL 是一段內(nèi)容的唯一標識符。 所以需要你像開發(fā)人員解釋清楚這一點,甚至可以為他們提供解決方案。
2.會話ID導致的URL重復
會話是訪問者在您的網(wǎng)站上所做操作的簡要歷史記錄,包含諸如購物車中的物品之類的內(nèi)容。為了使訪問者從一個頁面點擊到另一個頁面時保持該會話,該會話的唯一標識符(稱為會話 ID)需要存儲在某處。最常見的解決方案是使用 cookie 來實現(xiàn)。但是,搜索引擎通常不存儲 cookie。
此時,某些系統(tǒng)會退回到在 URL 中使用會話 ID。這意味著網(wǎng)站上的每個內(nèi)部鏈接都會將該會話 ID 添加到其 URL,并且由于該會話 ID 對于該會話是唯一的,因此它會創(chuàng)建一個新 URL,因此會重復內(nèi)容。
3.用于跟蹤和排序的 URL 參數(shù)
重復內(nèi)容的另一個原因是使用不會更改頁面內(nèi)容的 URL 參數(shù),例如在跟蹤鏈接中。你看,對一個搜索引擎來說,http://www.example.com/keyword-x/和http://www.example.com/keyword-x/?source=rssURL 是不一樣的。后者可能使您可以跟蹤人們的來源,但也可能使您更難獲得良好的排名-這是非常不希望的副作用!
當然,這不僅僅適用于跟蹤參數(shù)。它適用于您可以添加到不會更改重要內(nèi)容的 URL 的每個參數(shù),無論該參數(shù)是用于“更改一組產(chǎn)品的排序”還是“顯示另一個側邊欄”:所有這些都會導致重復內(nèi)容。
4.抓取工具和內(nèi)容聯(lián)合
其他網(wǎng)站使用抓取工具抓取使用或手動復制您的內(nèi)容,不論你是否同意。 當它們不鏈接到您的原始文章時,搜索引擎必須處理同一篇文章的另一個版本。此時您的網(wǎng)站越受歡迎,您將獲得越多的抓取工具,從而使這個問題變得越來越大。
5.參數(shù)順序
另一個常見的原因是 CMS 不使用干凈整潔的 URL,而是使用類似 的 URL /?id=1&cat=2,其中 ID 指的是文章,cat 指的是類別。URL/?cat=2&id=1將在大多數(shù)網(wǎng)站系統(tǒng)中呈現(xiàn)相同的結果,但對于搜索引擎來說它們是完全不同的。
6.評論分頁
在WordPress 以及其他一些系統(tǒng)中,可以選擇對您的評論進行分頁。這導致內(nèi)容在文章 URL 中重復,文章 URL + /comment-page-1/、/comment-page-2/ 等。
7.適合打印的頁面
如果您的內(nèi)容管理系統(tǒng)創(chuàng)建了適合打印的頁面,并且您從文章頁面鏈接到這些頁面,那么 Google 通常會找到它們,除非您特別阻止它們。您希望 Google 顯示哪個版本?帶有您的廣告和周邊內(nèi)容的那個,還是只顯示您的文章的那個?
8.WWW 與非 WWW
使用 Google 運算符來發(fā)現(xiàn)您的網(wǎng)站或內(nèi)容是否存在重復內(nèi)容問題
1.example.com intitle:“關鍵字 X”
此運算符可以用來識別你網(wǎng)站上包含關鍵字 X 文章的所有 URL
站點:example.com intitle:“關鍵字 X”
Google 將向您顯示 example.com 上包含該關鍵字的所有頁面。您對查詢的該部分進行的越具體,就越intitle容易清除重復的內(nèi)容。
2.intitle:"關鍵字 X - 為什么它很棒"
此運算符可以來識別網(wǎng)絡上的重復內(nèi)容。
Google 會為您提供與該標題匹配的所有網(wǎng)站。有時甚至值得從你的文章中搜索一兩個完整的句子,因為一些爬蟲可能會改變標題。
避免上述重復內(nèi)容的簡單修復方法有哪些?
重復內(nèi)容的實用解決方案有哪些?
需要確認內(nèi)容的規(guī)范 URL,告知谷歌哪個是規(guī)范化的URL, 有四種解決重復內(nèi)容問題的方法,按優(yōu)先順序排列:
關于重復內(nèi)容的解決方案,也可參考:解決網(wǎng)站重復性內(nèi)容頁面的6種方法
(6種方法包括:301重定向,rel規(guī)范,元索引,添加內(nèi)容,URL變體,HTTP與HTTPS或WWW與非WWW頁面。)
相關文章:
文章為作者獨立觀點,不代表DLZ123立場。如有侵權,請聯(lián)系我們。( 版權為作者所有,如需轉載,請聯(lián)系作者 )

網(wǎng)站運營至今,離不開小伙伴們的支持。 為了給小伙伴們提供一個互相交流的平臺和資源的對接,特地開通了獨立站交流群。
群里有不少運營大神,不時會分享一些運營技巧,更有一些資源收藏愛好者不時分享一些優(yōu)質的學習資料。
現(xiàn)在可以掃碼進群,備注【加群】。 ( 群完全免費,不廣告不賣課!)