我的郵箱偶爾會收到下圖這樣的郵件,提醒我某個站點的頁面因為“noindex”標(biāo)簽存在的緣故,導(dǎo)致沒辦法被收錄。
剛開始收到這類郵件時,我是會直接將其刪除的。畢竟我自己很清楚,我的站點已經(jīng)開放爬取,無論是 robots 文件還是具體的頁面上,都不存在 noindex 標(biāo)簽的。

但是類似這樣的郵件,收到的次數(shù)多了之后,我就比較好奇到底是什么原因,會老是導(dǎo)致搜索引擎認(rèn)為我的頁面拒絕索引。
加上前幾天看到 Google Search Central 官方頻道上發(fā)布了這樣一條視頻,于是想搞清楚問題原因的興趣更濃了。

那首先第一個問題,noindex 標(biāo)簽來自哪里?
基本四種主流的渠道,我們所用的 CMS 系統(tǒng)的源代碼、主題或插件使用的 JS 代碼,主題或者插件所跨域引用的 JS 代碼,以及網(wǎng)站的緩存(插件緩存與 CDN 緩存)。
逐一簡單說明下。
其實 CMS 系統(tǒng)源碼層面的問題很好解決,類似我們平時經(jīng)常使用使用的 WordPress 這種系統(tǒng),其 noindex 標(biāo)簽的開關(guān)就在網(wǎng)站的“設(shè)置”區(qū)域。
只需要簡單檢查下網(wǎng)站的 robots 文件,看看里面是怎么顯示的便知道問題所在了。甚至更簡單一點,直接將網(wǎng)頁源代碼打開,在里面搜索“noindex”關(guān)鍵詞,當(dāng)沒有出現(xiàn)匹配結(jié)果便表示一切正常了。
至于網(wǎng)站所引用的 JS 代碼,不管是本地文件引用還是跨域文件引用,我覺得問題都好定位。
方法同上,直接在加載完成的網(wǎng)頁上搜索“noindex”關(guān)鍵詞。如果出現(xiàn)了結(jié)果匹配,就表示肯定是哪個插件有點小毛病。找到這個文件,再從文件定位到插件,去看看具體什么問題。
上面幾種渠道排查完,就基本只剩下緩存這個需要排查的點了。
兩個方面,一是 CDN 緩存,二是本地插件生成的緩存。
對于 CND 緩存的網(wǎng)頁內(nèi)容是不是存在問題,判斷方式也簡單,直接用幾個國家的 IP 地址分別訪問一下,看看源代碼里有沒有問題 。
如果確實有問題的話,那直接在 CDN 服務(wù)商處請求重新緩存。甚至最簡單的辦法,關(guān)閉 CDN 服務(wù),問題自然而然就解決了。
而網(wǎng)站插件所生成的頁面緩存,定位的邏輯與上面一樣。
但是要注意一個問題,就是我們?nèi)ナ崂韱栴}點的時候,最好用無痕瀏覽器(或者換個瀏覽器),不登錄管理員賬戶,再去逐一排查。
緩存插件這塊的坑真的太多了,尤其是當(dāng)插件版本更新、主題版本更新導(dǎo)致彼此不兼容時,你都不知道問題出在哪。
而且一旦涉及到前端輸出代碼壓縮,JS 代碼壓縮成一個統(tǒng)一文件時,問題就基本纏繞在一塊了。

文章為作者獨立觀點,不代表DLZ123立場。如有侵權(quán),請聯(lián)系我們。( 版權(quán)為作者所有,如需轉(zhuǎn)載,請聯(lián)系作者 )

網(wǎng)站運營至今,離不開小伙伴們的支持。 為了給小伙伴們提供一個互相交流的平臺和資源的對接,特地開通了獨立站交流群。
群里有不少運營大神,不時會分享一些運營技巧,更有一些資源收藏愛好者不時分享一些優(yōu)質(zhì)的學(xué)習(xí)資料。
現(xiàn)在可以掃碼進(jìn)群,備注【加群】。 ( 群完全免費,不廣告不賣課!)