我前段時(shí)間有說過,自己的網(wǎng)站時(shí)不時(shí)會(huì)收到來自 AI 搜索引擎的詢盤信息,但是不清楚具體的 AI 搜索引擎收錄了我網(wǎng)站的哪些內(nèi)容。那今天的這篇文章簡單聊聊怎么確定,以及怎么做。
先談第一點(diǎn),怎么確定網(wǎng)站的內(nèi)容是不是出現(xiàn)在 AI 搜索引擎中了。
一般針對(duì)這種問題,我基本會(huì)使用兩種方式去核實(shí)。
方法一其實(shí)很簡單,那就是直接到具體的 AI 搜索引擎中去搜索自己的產(chǎn)品,看看是否存在相應(yīng)的產(chǎn)品信息。如果有看到信息,則表明 AI 搜索引擎之前有抓取過我們的產(chǎn)品信息,且已經(jīng)在用戶搜索交互中使用了我們的內(nèi)容。
像最常使用的 ChatGPT Search 或者 Perplexity,直接在用戶搜索界面輸入自己的品牌信息,便可以直觀看到相應(yīng)的搜索結(jié)果?;蛘咴谒阉鞯倪^程中使用一些精準(zhǔn)長尾詞,也可以核實(shí)自己的內(nèi)容是不是被 AI 搜索引擎收錄索引。
方法二使用起來稍微復(fù)雜一點(diǎn),主要是去網(wǎng)站的主機(jī)訪問日志里看相應(yīng)的爬蟲抓取記錄。
這個(gè)過程中,我們需要確保自己的網(wǎng)站是對(duì)所有網(wǎng)絡(luò)爬蟲公開的(不能屏蔽),這點(diǎn)在網(wǎng)站的 robots.txt 文件中便能看到。
然后再去網(wǎng)站服務(wù)器的用戶訪問日志里看,自己的網(wǎng)站信息有沒有被相應(yīng)的 AI 搜索引擎爬蟲抓取過。
我這里拿 SiteGround 主機(jī)搭建的網(wǎng)站為例,可以在網(wǎng)站后臺(tái)的“Activity Log”里面看到所有的用戶訪問信息。
比如下圖是我某個(gè)網(wǎng)站的具體訪問信息,可以看到有谷歌搜索引擎爬蟲的訪問記錄,也有 Yandex 搜索引擎的爬蟲記錄。大家有興趣的話,可以在這份日志里好好找找有沒有 AI 搜索引擎的爬蟲記錄。
一般 Perplexity 的爬蟲名是 PerplexityBot,ChatGPT 的爬蟲名是 GPTBot。當(dāng)看到這兩個(gè)爬蟲的信息抓取記錄時(shí),即表明 AI 搜索引擎的爬蟲有來過,也有抓取過我們的內(nèi)容(至于有沒有索引則需要進(jìn)一步核實(shí)了)。
基本經(jīng)過上面兩個(gè)步驟的操作,便能大致了解網(wǎng)站內(nèi)容在 AI 搜索引擎上的收錄情況。
如果發(fā)現(xiàn)自己網(wǎng)站的內(nèi)容,根本就不曾出現(xiàn)在 AI 搜索引擎中,我這里推薦嘗試著做一下主動(dòng)搜索。
比如將自己網(wǎng)站的長尾關(guān)鍵詞拿到 AI 搜索引擎中去搜索,并嘗試著給一個(gè)具體的網(wǎng)站鏈接讓 AI 消化,看看相應(yīng)的輸出結(jié)果。
如果內(nèi)容與我們網(wǎng)站的基本情況相符,那便一定程度表明自己的內(nèi)容是能被 AI 搜索引擎消化的。如此多嘗試幾次,再來看看后續(xù)的搜索表現(xiàn)。
但是這種方法不具有普遍性,我也只是在自己的某一個(gè)站點(diǎn)上使用過,僅供參考。
文章為作者獨(dú)立觀點(diǎn),不代表DLZ123立場(chǎng)。如有侵權(quán),請(qǐng)聯(lián)系我們。( 版權(quán)為作者所有,如需轉(zhuǎn)載,請(qǐng)聯(lián)系作者 )

網(wǎng)站運(yùn)營至今,離不開小伙伴們的支持。 為了給小伙伴們提供一個(gè)互相交流的平臺(tái)和資源的對(duì)接,特地開通了獨(dú)立站交流群。
群里有不少運(yùn)營大神,不時(shí)會(huì)分享一些運(yùn)營技巧,更有一些資源收藏愛好者不時(shí)分享一些優(yōu)質(zhì)的學(xué)習(xí)資料。
現(xiàn)在可以掃碼進(jìn)群,備注【加群】。 ( 群完全免費(fèi),不廣告不賣課!)