怎么確定內(nèi)容是否出現(xiàn)在 AI 搜索引擎中

703 閱讀 0 評(píng)論 3 點(diǎn)贊

我前段時(shí)間有說過，自己的網(wǎng)站時(shí)不時(shí)會(huì)收到來自 AI 搜索引擎的詢盤信息，但是不清楚具體的 AI 搜索引擎收錄了我網(wǎng)站的哪些內(nèi)容。那今天的這篇文章簡單聊聊怎么確定，以及怎么做。

先談第一點(diǎn)，怎么確定網(wǎng)站的內(nèi)容是不是出現(xiàn)在 AI 搜索引擎中了。

一般針對(duì)這種問題，我基本會(huì)使用兩種方式去核實(shí)。

方法一其實(shí)很簡單，那就是直接到具體的 AI 搜索引擎中去搜索自己的產(chǎn)品，看看是否存在相應(yīng)的產(chǎn)品信息。如果有看到信息，則表明 AI 搜索引擎之前有抓取過我們的產(chǎn)品信息，且已經(jīng)在用戶搜索交互中使用了我們的內(nèi)容。

像最常使用的 ChatGPT Search 或者 Perplexity，直接在用戶搜索界面輸入自己的品牌信息，便可以直觀看到相應(yīng)的搜索結(jié)果?；蛘咴谒阉鞯倪^程中使用一些精準(zhǔn)長尾詞，也可以核實(shí)自己的內(nèi)容是不是被 AI 搜索引擎收錄索引。

方法二使用起來稍微復(fù)雜一點(diǎn)，主要是去網(wǎng)站的主機(jī)訪問日志里看相應(yīng)的爬蟲抓取記錄。

這個(gè)過程中，我們需要確保自己的網(wǎng)站是對(duì)所有網(wǎng)絡(luò)爬蟲公開的（不能屏蔽），這點(diǎn)在網(wǎng)站的 robots.txt 文件中便能看到。

然后再去網(wǎng)站服務(wù)器的用戶訪問日志里看，自己的網(wǎng)站信息有沒有被相應(yīng)的 AI 搜索引擎爬蟲抓取過。

我這里拿 SiteGround 主機(jī)搭建的網(wǎng)站為例，可以在網(wǎng)站后臺(tái)的“Activity Log”里面看到所有的用戶訪問信息。

比如下圖是我某個(gè)網(wǎng)站的具體訪問信息，可以看到有谷歌搜索引擎爬蟲的訪問記錄，也有 Yandex 搜索引擎的爬蟲記錄。大家有興趣的話，可以在這份日志里好好找找有沒有 AI 搜索引擎的爬蟲記錄。

一般 Perplexity 的爬蟲名是 PerplexityBot，ChatGPT 的爬蟲名是 GPTBot。當(dāng)看到這兩個(gè)爬蟲的信息抓取記錄時(shí)，即表明 AI 搜索引擎的爬蟲有來過，也有抓取過我們的內(nèi)容（至于有沒有索引則需要進(jìn)一步核實(shí)了）。

基本經(jīng)過上面兩個(gè)步驟的操作，便能大致了解網(wǎng)站內(nèi)容在 AI 搜索引擎上的收錄情況。

如果發(fā)現(xiàn)自己網(wǎng)站的內(nèi)容，根本就不曾出現(xiàn)在 AI 搜索引擎中，我這里推薦嘗試著做一下主動(dòng)搜索。

比如將自己網(wǎng)站的長尾關(guān)鍵詞拿到 AI 搜索引擎中去搜索，并嘗試著給一個(gè)具體的網(wǎng)站鏈接讓 AI 消化，看看相應(yīng)的輸出結(jié)果。

如果內(nèi)容與我們網(wǎng)站的基本情況相符，那便一定程度表明自己的內(nèi)容是能被 AI 搜索引擎消化的。如此多嘗試幾次，再來看看后續(xù)的搜索表現(xiàn)。

但是這種方法不具有普遍性，我也只是在自己的某一個(gè)站點(diǎn)上使用過，僅供參考。

文章為作者獨(dú)立觀點(diǎn)，不代表DLZ123立場(chǎng)。如有侵權(quán),請(qǐng)聯(lián)系我們。( 版權(quán)為作者所有，如需轉(zhuǎn)載，請(qǐng)聯(lián)系作者 )

網(wǎng)站運(yùn)營至今，離不開小伙伴們的支持。為了給小伙伴們提供一個(gè)互相交流的平臺(tái)和資源的對(duì)接，特地開通了獨(dú)立站交流群。群里有不少運(yùn)營大神，不時(shí)會(huì)分享一些運(yùn)營技巧，更有一些資源收藏愛好者不時(shí)分享一些優(yōu)質(zhì)的學(xué)習(xí)資料。

現(xiàn)在可以掃碼進(jìn)群，備注【加群】。 ( 群完全免費(fèi)，不廣告不賣課！)

點(diǎn)贊(3) 打賞