? 這是一篇2011年的原創(chuàng)文章,作者當(dāng)然不是我,而是老爺子比爾.斯勞斯基。雖然這是一篇十年前的文章,當(dāng)對(duì)于當(dāng)下我們投身于研究和提高谷歌SEO優(yōu)化技能水平的同學(xué)們來(lái)說(shuō),還是有著非常重要的學(xué)習(xí)意義。
? 老爺子寫(xiě)這篇文章的初衷是因?yàn)楣雀韪铝诵茇埶惴ǎ≒anda),隨著 Panda 算法的更新,我Google 引入了一種對(duì)大規(guī)模數(shù)據(jù)集(如 Web)中的信息進(jìn)行建模的方法,以嘗試識(shí)別和預(yù)測(cè)網(wǎng)頁(yè)的特征,這些特征不僅可以根據(jù)相關(guān)性和流行度(基于指向這些頁(yè)面的鏈接),但也基于一系列其他特征,例如可信度、信任值、原創(chuàng)性、主題的覆蓋范圍、可用性等多重因素。
很顯然,谷歌不可能將這些辨識(shí)特征雜亂無(wú)序的散布,否則就無(wú)法根據(jù)搜索用戶的搜索需求來(lái)匹配較為精準(zhǔn)的搜索內(nèi)容結(jié)果,這樣的結(jié)果顯然是谷歌不愿意看到的。所以谷歌啟用了三元組專利技術(shù),該技術(shù)最初在03年提交,在07年獲得授權(quán),在此后的日子里,一直被谷歌所沿用和改造,并逐漸成為了如今谷歌千人前面的重要內(nèi)容構(gòu)成算法專利之一。
那么,什么是三元組專利?它的公式是這樣的Z=(u,q,d),這其中
u代表的是搜索用戶本身的數(shù)據(jù)
q代表的是搜索用戶的查詢數(shù)據(jù)
d代表的是查詢數(shù)據(jù)返回的頁(yè)面相關(guān)的文檔信息
這樣子說(shuō)可能有點(diǎn)不是特別清楚,我在下面列舉一些實(shí)例項(xiàng)目:
用戶所在的國(guó)家/地區(qū),這屬于u的數(shù)據(jù)范疇
用戶提供查詢 q 的時(shí)間,這屬于u的數(shù)據(jù)范疇
用戶所在國(guó)家的語(yǔ)言,這屬于u的數(shù)據(jù)范疇
查詢語(yǔ)言 q,這屬于q的數(shù)據(jù)范疇
查詢 q 的確切字符串,這屬于q的數(shù)據(jù)范疇
查詢 q 中的單詞,這屬于q的數(shù)據(jù)范疇
查詢 q 中的單詞數(shù),這屬于q的數(shù)據(jù)范疇
文檔 中的每個(gè)單詞,這屬于d的數(shù)據(jù)范疇
文檔 的統(tǒng)一資源定位符 (URL) 中的每個(gè)詞,這屬于d的數(shù)據(jù)范疇
文檔 的 URL 中的頂級(jí)域,這屬于d的數(shù)據(jù)范疇
文檔? 的 URL 的每個(gè)前綴,這屬于d的數(shù)據(jù)范疇
文件 標(biāo)題中的每個(gè)詞,這屬于d的數(shù)據(jù)范疇
鏈接中指向文檔 的每個(gè)單詞,這屬于d的數(shù)據(jù)范疇
查詢 q 中的單詞與文檔 d 中的單詞匹配的次數(shù),
用戶 u 先前訪問(wèn)文檔 d 的次數(shù),
很明顯,上面所列舉的三元組內(nèi)容實(shí)例和實(shí)際的搜索引擎工作機(jī)制還相差個(gè)十萬(wàn)八千里,光頭佬Brian Dean曾經(jīng)寫(xiě)過(guò)一篇文章,羅列了影響谷歌SEO優(yōu)化排名的200多個(gè)因素,但實(shí)際上可能還遠(yuǎn)遠(yuǎn)不止。這個(gè)龐大的三元組數(shù)據(jù)庫(kù)可能會(huì)收集超過(guò)500萬(wàn)個(gè)不同的特征。這句話體現(xiàn)在了三元組特征的專利說(shuō)明文檔中。你要是不信,沒(méi)關(guān)系,點(diǎn)擊下面的專利鏈接進(jìn)行查詢
《基于大型數(shù)據(jù)集的排名文檔》
既然這個(gè)模型是為了更好的為搜索引擎用戶提供精準(zhǔn)的搜索結(jié)果,那么它的功能顯然不僅僅局限在搜集上述三元組的相關(guān)特征上。因?yàn)樘卣鲾?shù)據(jù)收集的再多,不進(jìn)行利用還是等于無(wú)效數(shù)據(jù)。因此,收集的查詢數(shù)據(jù)可能包括用戶先前提供的用于查找特定頁(yè)面的搜索詞,用戶數(shù)據(jù)可能包括互聯(lián)網(wǎng)協(xié)議地址、cookie 信息、查詢語(yǔ)言和/或與用戶相關(guān)的地理信息,文檔信息可能包括有關(guān)在搜索結(jié)果中呈現(xiàn)給用戶的特定頁(yè)面的數(shù)據(jù),以及這些文檔在被選擇或經(jīng)過(guò)時(shí)所處的位置。
當(dāng)該模型經(jīng)過(guò)運(yùn)算之后自然的就給出了相關(guān)的自然搜索排名結(jié)果內(nèi)容,注意,這時(shí)候整個(gè)運(yùn)算機(jī)制還沒(méi)有結(jié)束,因?yàn)樗阉饔脩魧?duì)當(dāng)前內(nèi)容的選擇和點(diǎn)擊查看與否,也會(huì)直接關(guān)聯(lián)到下一次的內(nèi)容推薦模型中。也就是說(shuō)該大數(shù)據(jù)模型從來(lái)不會(huì)孤立存在,只要你從使用谷歌瀏覽器那一刻開(kāi)始,你的所有細(xì)微操作都會(huì)對(duì)后續(xù)結(jié)果產(chǎn)生影響,哪怕你使用的是無(wú)痕瀏覽模式也不例外。
那么這篇文章對(duì)我們的谷歌SEO優(yōu)化有什么意義呢?
第一點(diǎn):擺脫關(guān)鍵詞的迷信思想
關(guān)鍵詞對(duì)網(wǎng)站頁(yè)面排名固然重要,但絕不可能在三元組模型產(chǎn)生極其重要的本質(zhì)性影響。相關(guān)搜索用戶的特征數(shù)據(jù)收集,以及用戶對(duì)谷歌搜索引擎給出的自然排名結(jié)果操作(點(diǎn)擊、查看和瀏覽時(shí)間)都直接影響后續(xù)SERP的排名結(jié)果。舉個(gè)很簡(jiǎn)單的例子,當(dāng)我們使用中文搜索關(guān)鍵詞“面包”,基本上不太可能出現(xiàn)以阿拉伯文“ ????? . ”的對(duì)應(yīng)結(jié)果。
這就是三元組中u系列因素的效果。而當(dāng)我們使用“bread”搜索英語(yǔ)的結(jié)果,該模型也不會(huì)緊盯著這一個(gè)變量因素,它會(huì)去搜集統(tǒng)計(jì)數(shù)據(jù)庫(kù)中的其他參數(shù),可能是關(guān)鍵詞Bread baking,可能是名為Delicious bread的一張面包圖片,甚至是搜索相關(guān)文檔中的地理信息,
因?yàn)樗阉饕媾袛嗄闼阉鳌癰read”這個(gè)關(guān)鍵詞的時(shí)候,可能是肚子餓了,想找個(gè)就近的面包店買(mǎi)點(diǎn)面包充饑,那么在搜索結(jié)果中就可能出現(xiàn)一個(gè)谷歌地圖,上面標(biāo)注著離你最近的面包店。所以在以后的谷歌SEO優(yōu)化過(guò)程中,盡量將關(guān)鍵詞從神壇上拉下來(lái)吧,它并沒(méi)有我們想象的那么神秘。
第二點(diǎn):考慮更多的搜索用戶相關(guān)因素
在三元組模型中,最重要的不是q和d,而是u,也就是說(shuō)搜索用戶本身的相關(guān)因素在某種程度上更加能夠影響搜索結(jié)果的呈現(xiàn)。很多時(shí)候我們?cè)趫?zhí)行具體的谷歌優(yōu)化過(guò)程中,過(guò)于將精力集中在內(nèi)容輸出上,而忘記了文章的本身是為了面向用戶群體。
你覺(jué)得一篇文章很優(yōu)秀,那是因?yàn)槟阌X(jué)得它優(yōu)秀,但似乎很多時(shí)候你的潛在用戶群體并不這么認(rèn)為。這也是為什么很多人覺(jué)得自己文章寫(xiě)的質(zhì)量很好,但是網(wǎng)站卻沒(méi)有流量和排名的根本原因。
從而就放棄了輸出原創(chuàng)內(nèi)容,轉(zhuǎn)而去做外鏈或者其他一些黑帽手法的工作。比方說(shuō)阿拉伯文的閱讀方式是從右到左,但我們絕大部分人的書(shū)寫(xiě)習(xí)慣是從左到右,如果你的客戶是阿拉伯地區(qū)的,那么這種閱讀習(xí)慣上的差異,就很可能導(dǎo)致他們的頁(yè)面體驗(yàn)度極差,你的網(wǎng)站頁(yè)面排名也就很難起來(lái)了。
好了,以上就是本章關(guān)于?谷歌搜索與大數(shù)據(jù)模型?的全部?jī)?nèi)容,
如果對(duì)本章內(nèi)容還有不理解的地方,沒(méi)關(guān)系,解決方案如下:
百度或者谷歌瀏覽器搜索???“JACK外貿(mào)建站”,排名首頁(yè)首位的就是我的網(wǎng)站。網(wǎng)站上有更多免費(fèi)的外貿(mào)建站、谷歌SEO優(yōu)化、外貿(mào)客戶開(kāi)發(fā)等實(shí)操干貨知識(shí)等著你哦!
(各位看官老爺,都看到這里了,就麻煩動(dòng)動(dòng)金手點(diǎn)擊轉(zhuǎn)發(fā)一下本文到自己的微信朋友圈吧,轉(zhuǎn)發(fā)過(guò)程如下)
QQ:3233269705
QQ群:645296397
微信公眾號(hào):JACK?SEO
文章為作者獨(dú)立觀點(diǎn),不代表DLZ123立場(chǎng)。如有侵權(quán),請(qǐng)聯(lián)系我們。( 版權(quán)為作者所有,如需轉(zhuǎn)載,請(qǐng)聯(lián)系作者 )

網(wǎng)站運(yùn)營(yíng)至今,離不開(kāi)小伙伴們的支持。 為了給小伙伴們提供一個(gè)互相交流的平臺(tái)和資源的對(duì)接,特地開(kāi)通了獨(dú)立站交流群。
群里有不少運(yùn)營(yíng)大神,不時(shí)會(huì)分享一些運(yùn)營(yíng)技巧,更有一些資源收藏愛(ài)好者不時(shí)分享一些優(yōu)質(zhì)的學(xué)習(xí)資料。
現(xiàn)在可以掃碼進(jìn)群,備注【加群】。 ( 群完全免費(fèi),不廣告不賣(mài)課!)