網(wǎng)頁索引增加的10種辦法
?
一般來說正常的網(wǎng)站內(nèi)容都能夠被谷歌搜索引擎收錄并添加到其索引數(shù)據(jù)庫中,只不過每個(gè)網(wǎng)站頁面可能因?yàn)轫撁尜|(zhì)量、搜索用戶體驗(yàn)、網(wǎng)站域名權(quán)重等因素的影響會導(dǎo)致被索引的時(shí)間存在一定的差異。但實(shí)際情況下,很多同學(xué)還是在為自己的網(wǎng)站頁面遲遲不能被谷歌索引而感到頭疼。那么,今天Jack老師就和大家一起來學(xué)習(xí)一下 網(wǎng)頁索引增加的10種方法 。
方法一:刪除 robots.txt 文件中禁止爬取代碼
robots.txt是一種存放于網(wǎng)站根目錄下的ASCII編碼的文本文件,它通常告訴網(wǎng)絡(luò)搜索引擎的漫游器(又稱網(wǎng)絡(luò)蜘蛛),此網(wǎng)站中的哪些內(nèi)容是不應(yīng)被搜索引擎的漫游器獲取的,哪些是可以被漫游器獲取的。因?yàn)橐恍┫到y(tǒng)中的URL是大小寫敏感的,所以robots.txt的文件名應(yīng)統(tǒng)一為小寫。那么這個(gè)文件怎么設(shè)置或者改寫呢?通過ftp軟件遠(yuǎn)程連接或者直接登錄直接網(wǎng)站的后臺服務(wù)器,找到根目錄下的該文件,然后進(jìn)行改寫。
我們再來看一下robots.txt文件的寫法:
User-agent: * 這里的*代表的所有的搜索引擎種類,*是一個(gè)通配符
Disallow: /admin/ 這里定義是禁止爬尋admin目錄下面的目錄
Disallow: /require/ 這里定義是禁止爬尋require目錄下面的目錄
Disallow: /ABC/ 這里定義是禁止爬尋ABC目錄下面的目錄
Disallow: /cgi-bin/*.htm 禁止訪問/cgi-bin/目錄下的所有以”.htm”為后綴的URL(包含子目錄)。
Disallow: /*?* 禁止訪問網(wǎng)站中所有包含問號 (?) 的網(wǎng)址
Disallow: /.jpg$ 禁止抓取網(wǎng)頁所有的.jpg格式的圖片
Disallow:/ab/adc.html 禁止爬取ab文件夾下面的adc.html文件。
Allow: /cgi-bin/ 這里定義是允許爬尋cgi-bin目錄下面的目錄
Allow: /tmp 這里定義是允許爬尋tmp的整個(gè)目錄
Allow: .htm$ 僅允許訪問以”.htm”為后綴的URL。
Allow: .gif$ 允許抓取網(wǎng)頁和gif格式圖片
Sitemap: 網(wǎng)站地圖 告訴爬蟲這個(gè)頁面是網(wǎng)站地圖
比方說我們要禁止百度的蜘蛛來爬取我們網(wǎng)站的頁面內(nèi)容,那robots.txt文件應(yīng)該怎么寫呢?如下所示。
User-agent: Baiduspider
Disallow: /
如果我們又突然改變主意,想允許它爬取我們的內(nèi)容,又該怎么寫呢?如下所示。
User-agent: Baiduspider
Allow: /
方法二:移除noindex代碼
但我們在做wordpress網(wǎng)站的時(shí)候,一般會在設(shè)置中的閱讀功能下設(shè)置“暫不對搜索引擎可見”,這時(shí)候如果你去查看網(wǎng)站任何一個(gè)頁面的源代碼(用ctrl+u快捷鍵,或者鼠標(biāo)右鍵點(diǎn)擊查看網(wǎng)頁源代碼),你會在源代碼中看到noindex的存在。
這個(gè)代碼告訴了搜索引擎不要將該頁面內(nèi)容添加到谷歌的索引數(shù)據(jù)庫中。在做完網(wǎng)站之后,我們很可能忘記了最初的這個(gè)網(wǎng)站功能設(shè)置,導(dǎo)致自己的網(wǎng)站頁面遲遲的不能被索引。所以在網(wǎng)站內(nèi)容檢查無誤準(zhǔn)備放開收錄的時(shí)候,這里的功能一定要取消,如下圖所示。
?
還有一種noindex的情況比較特殊,那就是X?Robots-Tag標(biāo)頭。X-Robots-Tag
?可用作指定網(wǎng)址的 HTTP 標(biāo)頭響應(yīng)中的一個(gè)元素??稍诼纹髟獦?biāo)記中使用的任何指令均可被指定為?X-Robots-Tag
。下面是一個(gè) HTTP 響應(yīng)示例,它含有一個(gè)指示抓取工具不要將某一網(wǎng)頁編入索引的?X-Robots-Tag
:
這一點(diǎn)可能對同學(xué)們比較陌生,我們可以使用Ahrefs工具的“站點(diǎn)審核工具”來進(jìn)行操作,如下圖所示。
如果對這個(gè)項(xiàng)目不是很明白的同學(xué),建議先點(diǎn)擊查看一下這方面的知識,鏈接如下
漫游器元標(biāo)記知識拓展入口
方法三:在站點(diǎn)地圖中包含該頁面
站點(diǎn)地圖告訴 Google 你網(wǎng)站上的哪些頁面重要,哪些不重要。它還可能會就應(yīng)重新抓取它們的頻率提供一些指導(dǎo)。Google 應(yīng)該能夠在你的網(wǎng)站上找到頁面,無論它們是否在你的站點(diǎn)地圖中,但將它們包含在內(nèi)仍然是一種很好的做法。
畢竟,讓谷歌的抓取工作變得困難是沒有意義的。要檢查某個(gè)頁面是否在你的站點(diǎn)地圖中,請使用Search Console 中的網(wǎng)址檢查工具。如果你看到“網(wǎng)址不在 Google 上”錯(cuò)誤和“站點(diǎn)地圖:不適用”這些報(bào)錯(cuò)情況,那么說明某個(gè)網(wǎng)站頁面不在你的站點(diǎn)地圖中或尚未編入索引。
一般來說,如果你安裝了yoast seo或者math rank等谷歌SEO優(yōu)化插件,它們都會為你主動生成網(wǎng)站的sitemap,你只需要將這些sitemap主動提交到網(wǎng)站的google search console中即可。提交完成之后,你可以順手做一個(gè)ping提交指令,如下所示:
https://www.google.com/ping?sitemap=http://www.domain.com/sitemap_url.xml
方法四:刪除流氓規(guī)范標(biāo)簽
規(guī)范標(biāo)簽告訴 Google 哪個(gè)是頁面的首選版本。它看起來像這樣:
<link rel="canonical” href="/page.html/">
大多數(shù)頁面要么沒有規(guī)范標(biāo)簽,要么沒有所謂的自引用規(guī)范標(biāo)簽。這告訴 Google 頁面本身是首選的,也可能是唯一的版本。換句話說,你希望谷歌搜索引擎將此頁面編入索引。但是,如果你的頁面有一個(gè)流氓規(guī)范標(biāo)簽,那么它可能會告訴 Google 該頁面的首選版本不存在。
在這種情況下,你的頁面不會被編入索引。如果你想要檢查URL網(wǎng)址規(guī)范,那么請使用 Google 的URL檢查工具。如果規(guī)范指向另一個(gè)頁面,那么你將會看到“帶有規(guī)范標(biāo)記的備用頁面”警告,如下所示。
需要注意的是:規(guī)范標(biāo)簽并不總是壞的。大多數(shù)帶有這些標(biāo)簽的頁面都會有它們。如果看到你的頁面具有規(guī)范集,請檢查規(guī)范頁面。如果這確實(shí)是頁面的首選版本,并且不需要為相關(guān)頁面建立索引,那么規(guī)范標(biāo)簽應(yīng)該保留。
方法五:檢查孤立頁面
孤立頁面是那些沒有內(nèi)部鏈接指向它們的頁面?;蛘哒f當(dāng)前的某個(gè)頁面沒有任何的鏈接方式通往自己網(wǎng)站的其他頁面。常見于一些landing page頁面,甚至都沒有菜單導(dǎo)航欄的存在。
由于 Google 通過抓取網(wǎng)絡(luò)來發(fā)現(xiàn)新內(nèi)容,因此他們無法通過該過程發(fā)現(xiàn)孤立頁面。網(wǎng)站訪問者也無法找到它們。要檢查孤立頁面,可以使用Ahrefs 的站點(diǎn)審核來抓取網(wǎng)站頁面。然后檢查?“孤立頁面(沒有傳入的內(nèi)部鏈接)”錯(cuò)誤的鏈接報(bào)告,如下圖所示。
當(dāng)然了,市面上還是有很多其他的url檢測工具也有非常強(qiáng)大的功能,比方說尖叫青蛙,Check box等等。利用這些工具也能夠?yàn)樽约旱木W(wǎng)站檢測出沒有做任何鏈接指向其他頁面的“孤立頁面”。
好了,以上就是 網(wǎng)頁索引增加的10種辦法 上半部分的內(nèi)容,下半部分內(nèi)容將在下一章節(jié)中進(jìn)行講解,敬請期待。
如果對本章內(nèi)容還有不理解的地方,沒關(guān)系,解決方案如下:
百度或者谷歌瀏覽器搜索???“JACK外貿(mào)建站”,排名首頁首位的就是我的網(wǎng)站。網(wǎng)站上有更多免費(fèi)的外貿(mào)建站、谷歌SEO優(yōu)化、外貿(mào)客戶開發(fā)等實(shí)操干貨知識等著你哦!
(各位看官老爺,都看到這里了,就麻煩動動金手點(diǎn)擊轉(zhuǎn)發(fā)一下本文到自己的微信朋友圈吧,轉(zhuǎn)發(fā)過程如下)
QQ:3233269705
QQ群:645296397
微信公眾號:JACK?SEO
文章為作者獨(dú)立觀點(diǎn),不代表DLZ123立場。如有侵權(quán),請聯(lián)系我們。( 版權(quán)為作者所有,如需轉(zhuǎn)載,請聯(lián)系作者 )

網(wǎng)站運(yùn)營至今,離不開小伙伴們的支持。 為了給小伙伴們提供一個(gè)互相交流的平臺和資源的對接,特地開通了獨(dú)立站交流群。
群里有不少運(yùn)營大神,不時(shí)會分享一些運(yùn)營技巧,更有一些資源收藏愛好者不時(shí)分享一些優(yōu)質(zhì)的學(xué)習(xí)資料。
現(xiàn)在可以掃碼進(jìn)群,備注【加群】。 ( 群完全免費(fèi),不廣告不賣課!)