網(wǎng)頁索引增加的10種辦法（上）

1620 閱讀 0 評論 1 點(diǎn)贊

網(wǎng)頁索引增加的10種辦法

一般來說正常的網(wǎng)站內(nèi)容都能夠被谷歌搜索引擎收錄并添加到其索引數(shù)據(jù)庫中，只不過每個(gè)網(wǎng)站頁面可能因?yàn)轫撁尜|(zhì)量、搜索用戶體驗(yàn)、網(wǎng)站域名權(quán)重等因素的影響會導(dǎo)致被索引的時(shí)間存在一定的差異。但實(shí)際情況下，很多同學(xué)還是在為自己的網(wǎng)站頁面遲遲不能被谷歌索引而感到頭疼。那么，今天Jack老師就和大家一起來學(xué)習(xí)一下網(wǎng)頁索引增加的10種方法。

方法一：刪除 robots.txt 文件中禁止爬取代碼

robots.txt是一種存放于網(wǎng)站根目錄下的ASCII編碼的文本文件，它通常告訴網(wǎng)絡(luò)搜索引擎的漫游器（又稱網(wǎng)絡(luò)蜘蛛），此網(wǎng)站中的哪些內(nèi)容是不應(yīng)被搜索引擎的漫游器獲取的，哪些是可以被漫游器獲取的。因?yàn)橐恍┫到y(tǒng)中的URL是大小寫敏感的，所以robots.txt的文件名應(yīng)統(tǒng)一為小寫。那么這個(gè)文件怎么設(shè)置或者改寫呢？通過ftp軟件遠(yuǎn)程連接或者直接登錄直接網(wǎng)站的后臺服務(wù)器，找到根目錄下的該文件，然后進(jìn)行改寫。

我們再來看一下robots.txt文件的寫法：

User-agent: * 這里的*代表的所有的搜索引擎種類，*是一個(gè)通配符
Disallow: /admin/ 這里定義是禁止爬尋admin目錄下面的目錄
Disallow: /require/ 這里定義是禁止爬尋require目錄下面的目錄
Disallow: /ABC/ 這里定義是禁止爬尋ABC目錄下面的目錄
Disallow: /cgi-bin/*.htm 禁止訪問/cgi-bin/目錄下的所有以”.htm”為后綴的URL(包含子目錄)。
Disallow: /*?* 禁止訪問網(wǎng)站中所有包含問號 (?) 的網(wǎng)址
Disallow: /.jpg$ 禁止抓取網(wǎng)頁所有的.jpg格式的圖片
Disallow:/ab/adc.html 禁止爬取ab文件夾下面的adc.html文件。
Allow: /cgi-bin/　這里定義是允許爬尋cgi-bin目錄下面的目錄
Allow: /tmp 這里定義是允許爬尋tmp的整個(gè)目錄
Allow: .htm$ 僅允許訪問以”.htm”為后綴的URL。
Allow: .gif$ 允許抓取網(wǎng)頁和gif格式圖片
Sitemap: 網(wǎng)站地圖告訴爬蟲這個(gè)頁面是網(wǎng)站地圖

比方說我們要禁止百度的蜘蛛來爬取我們網(wǎng)站的頁面內(nèi)容，那robots.txt文件應(yīng)該怎么寫呢？如下所示。

User-agent: Baiduspider

Disallow: /

如果我們又突然改變主意，想允許它爬取我們的內(nèi)容，又該怎么寫呢？如下所示。

User-agent: Baiduspider

Allow: /

方法二：移除noindex代碼

但我們在做wordpress網(wǎng)站的時(shí)候，一般會在設(shè)置中的閱讀功能下設(shè)置“暫不對搜索引擎可見”，這時(shí)候如果你去查看網(wǎng)站任何一個(gè)頁面的源代碼（用ctrl+u快捷鍵，或者鼠標(biāo)右鍵點(diǎn)擊查看網(wǎng)頁源代碼），你會在源代碼中看到noindex的存在。

這個(gè)代碼告訴了搜索引擎不要將該頁面內(nèi)容添加到谷歌的索引數(shù)據(jù)庫中。在做完網(wǎng)站之后，我們很可能忘記了最初的這個(gè)網(wǎng)站功能設(shè)置，導(dǎo)致自己的網(wǎng)站頁面遲遲的不能被索引。所以在網(wǎng)站內(nèi)容檢查無誤準(zhǔn)備放開收錄的時(shí)候，這里的功能一定要取消,如下圖所示。

還有一種noindex的情況比較特殊，那就是X?Robots-Tag標(biāo)頭。X-Robots-Tag?可用作指定網(wǎng)址的 HTTP 標(biāo)頭響應(yīng)中的一個(gè)元素?？稍诼纹髟獦?biāo)記中使用的任何指令均可被指定為?X-Robots-Tag。下面是一個(gè) HTTP 響應(yīng)示例，它含有一個(gè)指示抓取工具不要將某一網(wǎng)頁編入索引的?X-Robots-Tag：

這一點(diǎn)可能對同學(xué)們比較陌生，我們可以使用Ahrefs工具的“站點(diǎn)審核工具”來進(jìn)行操作，如下圖所示。

如果對這個(gè)項(xiàng)目不是很明白的同學(xué)，建議先點(diǎn)擊查看一下這方面的知識，鏈接如下

漫游器元標(biāo)記知識拓展入口

方法三：在站點(diǎn)地圖中包含該頁面

站點(diǎn)地圖告訴 Google 你網(wǎng)站上的哪些頁面重要，哪些不重要。它還可能會就應(yīng)重新抓取它們的頻率提供一些指導(dǎo)。Google 應(yīng)該能夠在你的網(wǎng)站上找到頁面，無論它們是否在你的站點(diǎn)地圖中，但將它們包含在內(nèi)仍然是一種很好的做法。

畢竟，讓谷歌的抓取工作變得困難是沒有意義的。要檢查某個(gè)頁面是否在你的站點(diǎn)地圖中，請使用Search Console 中的網(wǎng)址檢查工具。如果你看到“網(wǎng)址不在 Google 上”錯(cuò)誤和“站點(diǎn)地圖：不適用”這些報(bào)錯(cuò)情況，那么說明某個(gè)網(wǎng)站頁面不在你的站點(diǎn)地圖中或尚未編入索引。

一般來說，如果你安裝了yoast seo或者math rank等谷歌SEO優(yōu)化插件，它們都會為你主動生成網(wǎng)站的sitemap，你只需要將這些sitemap主動提交到網(wǎng)站的google search console中即可。提交完成之后，你可以順手做一個(gè)ping提交指令，如下所示：

https://www.google.com/ping?sitemap=http://www.domain.com/sitemap_url.xml

方法四：刪除流氓規(guī)范標(biāo)簽

規(guī)范標(biāo)簽告訴 Google 哪個(gè)是頁面的首選版本。它看起來像這樣：

<link rel="canonical” href="/page.html/">

大多數(shù)頁面要么沒有規(guī)范標(biāo)簽，要么沒有所謂的自引用規(guī)范標(biāo)簽。這告訴 Google 頁面本身是首選的，也可能是唯一的版本。換句話說，你希望谷歌搜索引擎將此頁面編入索引。但是，如果你的頁面有一個(gè)流氓規(guī)范標(biāo)簽，那么它可能會告訴 Google 該頁面的首選版本不存在。

在這種情況下，你的頁面不會被編入索引。如果你想要檢查URL網(wǎng)址規(guī)范，那么請使用 Google 的URL檢查工具。如果規(guī)范指向另一個(gè)頁面，那么你將會看到“帶有規(guī)范標(biāo)記的備用頁面”警告，如下所示。

需要注意的是：規(guī)范標(biāo)簽并不總是壞的。大多數(shù)帶有這些標(biāo)簽的頁面都會有它們。如果看到你的頁面具有規(guī)范集，請檢查規(guī)范頁面。如果這確實(shí)是頁面的首選版本，并且不需要為相關(guān)頁面建立索引，那么規(guī)范標(biāo)簽應(yīng)該保留。

方法五：檢查孤立頁面

孤立頁面是那些沒有內(nèi)部鏈接指向它們的頁面?；蛘哒f當(dāng)前的某個(gè)頁面沒有任何的鏈接方式通往自己網(wǎng)站的其他頁面。常見于一些landing page頁面，甚至都沒有菜單導(dǎo)航欄的存在。

由于 Google 通過抓取網(wǎng)絡(luò)來發(fā)現(xiàn)新內(nèi)容，因此他們無法通過該過程發(fā)現(xiàn)孤立頁面。網(wǎng)站訪問者也無法找到它們。要檢查孤立頁面，可以使用Ahrefs 的站點(diǎn)審核來抓取網(wǎng)站頁面。然后檢查?“孤立頁面（沒有傳入的內(nèi)部鏈接）”錯(cuò)誤的鏈接報(bào)告，如下圖所示。

當(dāng)然了，市面上還是有很多其他的url檢測工具也有非常強(qiáng)大的功能，比方說尖叫青蛙，Check box等等。利用這些工具也能夠?yàn)樽约旱木W(wǎng)站檢測出沒有做任何鏈接指向其他頁面的“孤立頁面”。

好了，以上就是網(wǎng)頁索引增加的10種辦法上半部分的內(nèi)容，下半部分內(nèi)容將在下一章節(jié)中進(jìn)行講解，敬請期待。

如果對本章內(nèi)容還有不理解的地方，沒關(guān)系，解決方案如下：

百度或者谷歌瀏覽器搜索???“JACK外貿(mào)建站”，排名首頁首位的就是我的網(wǎng)站。網(wǎng)站上有更多免費(fèi)的外貿(mào)建站、谷歌SEO優(yōu)化、外貿(mào)客戶開發(fā)等實(shí)操干貨知識等著你哦！

（各位看官老爺，都看到這里了，就麻煩動動金手點(diǎn)擊轉(zhuǎn)發(fā)一下本文到自己的微信朋友圈吧，轉(zhuǎn)發(fā)過程如下）

QQ:3233269705

QQ群：645296397

微信公眾號：JACK?SEO

文章為作者獨(dú)立觀點(diǎn)，不代表DLZ123立場。如有侵權(quán),請聯(lián)系我們。( 版權(quán)為作者所有，如需轉(zhuǎn)載，請聯(lián)系作者 )

網(wǎng)站運(yùn)營至今，離不開小伙伴們的支持。為了給小伙伴們提供一個(gè)互相交流的平臺和資源的對接，特地開通了獨(dú)立站交流群。群里有不少運(yùn)營大神，不時(shí)會分享一些運(yùn)營技巧，更有一些資源收藏愛好者不時(shí)分享一些優(yōu)質(zhì)的學(xué)習(xí)資料。

現(xiàn)在可以掃碼進(jìn)群，備注【加群】。 ( 群完全免費(fèi)，不廣告不賣課！)

點(diǎn)贊(1) 打賞

本文分類：谷歌分析
本文標(biāo)簽：Google 實(shí)戰(zhàn)分享
瀏覽次數(shù)：1620 次瀏覽
發(fā)布日期：2021-10-23 11:39:00
原文鏈接：https://mp.weixin.qq.com/s/3Fksa_KC26UmlYtdFue4gg

上一篇 > 到底要不要聽谷歌推薦調(diào)整預(yù)算受限？
下一篇 > 網(wǎng)頁索引增加的10種辦法（下）

精品国产三级a在线观看网站,亚洲综合色成在线观看,亚洲熟妇一区二区三区,,中文字幕成人精品久久不卡 ,永久免费av无码网站国产

網(wǎng)頁索引增加的10種辦法（上）

方法一：刪除 robots.txt 文件中禁止爬取代碼

方法二：移除noindex代碼

方法三：在站點(diǎn)地圖中包含該頁面

方法四：刪除流氓規(guī)范標(biāo)簽

方法五：檢查孤立頁面

評論列表共有 0 條評論

發(fā)表評論取消回復(fù)

精品国产三级a在线观看网站,亚洲综合色成在线观看,亚洲熟妇一区二区三区,,中文字幕成人精品久久不卡 ,永久免费av无码网站国产

網(wǎng)頁索引增加的10種辦法（上）

方法一：刪除 robots.txt 文件中禁止爬取代碼

方法二：移除noindex代碼

方法三：在站點(diǎn)地圖中包含該頁面

方法四：刪除流氓規(guī)范標(biāo)簽

方法五：檢查孤立頁面

媒體資訊|7月Meta、谷歌、TikTok產(chǎn)品更新匯總

【盛會回顧】多元并進(jìn)，穩(wěn)步共盈，Google 助力開發(fā)者出海遠(yuǎn)航

2023谷歌再次提高Google Voice保號門檻，“保號黨”怎么辦？

2023 BrandZ 中國全球化品牌榜單重磅發(fā)布，上榜品牌有何秘訣

評論列表 共有 0 條評論

發(fā)表評論 取消回復(fù)

媒體資訊|7月Meta、谷歌、TikTok產(chǎn)品更新匯總

【盛會回顧】多元并進(jìn)，穩(wěn)步共盈，Google 助力開發(fā)者出海遠(yuǎn)航

2023谷歌再次提高Google Voice保號門檻，“保號黨”怎么辦？

2023 BrandZ 中國全球化品牌榜單重磅發(fā)布，上榜品牌有何秘訣

評論列表共有 0 條評論

發(fā)表評論取消回復(fù)