在開始閱讀這篇文章之前,您需要知道的是,任何針對(duì)英文Google 的算法調(diào)整最終會(huì)遷移至中文Google,類似的算法調(diào)整在不久的時(shí)間內(nèi)百度也會(huì)跟進(jìn),所有提升搜索引擎用戶體驗(yàn)的工作不管哪個(gè)搜索引擎都會(huì)去做。
在開始講Google Panda 之前,我們先來(lái)了解下Google Panda 的來(lái)歷。09年的時(shí)候Google進(jìn)行了咖啡因(Google Caffeine)的更新,主要解決了谷歌的抓取和索引速度。讓谷歌可以獲取的更加新鮮的內(nèi)容(比如我的博客,一般會(huì)在3分鐘內(nèi)被谷歌抓取和索引)。但是快速的抓取和索引使網(wǎng)頁(yè)質(zhì)量判斷明顯下降,很多無(wú)用或者重復(fù)性質(zhì)的內(nèi)容被索引進(jìn)去。也就是Google所稱的shallow-content site 膚淺內(nèi)容的網(wǎng)站,在這些內(nèi)容里面大多是偽原創(chuàng)的文章,也可能是一些沒有參考價(jià)值的原創(chuàng)的內(nèi)容。
針對(duì)搜索結(jié)果頁(yè)的頁(yè)面質(zhì)量,谷歌先前推出的Google +1 也是為了解決這方面的問(wèn)題。但是這對(duì)于判斷一個(gè)網(wǎng)頁(yè)的內(nèi)容質(zhì)量肯定不是一個(gè)完整的解決方案,于是Google Panda出現(xiàn)了,并且它將不斷的進(jìn)行算法更新。Google panda的主要目的就是剔除那些低質(zhì)量的頁(yè)面。即一個(gè)有效的頁(yè)面過(guò)濾機(jī)制(類似百度的頁(yè)面價(jià)值判斷)。需要說(shuō)明的是Google Panda不是針對(duì)站點(diǎn)的懲罰,而是通過(guò)算法進(jìn)行排名的調(diào)整。與此同時(shí),原創(chuàng)內(nèi)容和信息將獲得更好的排名,如研究、深度報(bào)道和周到詳見的分析等。
Google Panda的設(shè)計(jì)原理會(huì)是哪些?
進(jìn)行定性研究(這是講的個(gè)人,而不是一個(gè)很大的問(wèn)卷),找出它們認(rèn)為質(zhì)量差得原因。通過(guò)算法將此部分頁(yè)面排除掉。
使用結(jié)果來(lái)定義因素,將谷歌測(cè)量出來(lái)的低質(zhì)量的頁(yè)面進(jìn)行分析建模。來(lái)匹配哪些質(zhì)量差的頁(yè)面。
從大量的Google Panda的討論文章來(lái)看,Google Panda主要的判斷依據(jù)是點(diǎn)擊流(Clickstream)、頁(yè)面內(nèi)容(page content)和鏈接概況(link profiles),只要在這三者當(dāng)中表現(xiàn)優(yōu)異,就不會(huì)被列為膚淺的網(wǎng)站。從大量的分析看,目前Google Panda的適用級(jí)別為網(wǎng)頁(yè)級(jí)別,并沒有細(xì)化到關(guān)鍵詞級(jí)別。同時(shí)大量低質(zhì)量頁(yè)面也會(huì)在無(wú)形中給整個(gè)站點(diǎn)帶來(lái)影響。
點(diǎn)擊流
準(zhǔn)確的說(shuō)應(yīng)該是考察的是用戶參與度,或者是用戶針對(duì)頁(yè)面的反饋信息。主要考察指標(biāo)可能是:
1、頁(yè)面跳出率與頁(yè)面停留時(shí)間或者回訪率
數(shù)據(jù)來(lái)源:Google Analytics,Google Toolbar和搜索結(jié)果頁(yè)不同鏈接的點(diǎn)擊時(shí)間間隔。
單純的跳出率不能反映頁(yè)面的質(zhì)量,比如說(shuō)我的博客文章,用戶可能看了一篇文章就達(dá)到了預(yù)期的效果,如果停留時(shí)間可可以作為參考依據(jù)。只有當(dāng)兩個(gè)條件(跳出率高且停留時(shí)間短)同時(shí)滿足時(shí),Google才會(huì)判定這個(gè)是個(gè)膚淺的網(wǎng)站。
2、被大量用戶屏蔽的網(wǎng)站
數(shù)據(jù)來(lái)源:Google Chrome插件:Personal Blocklist (by Google)
Personal Blocklist官方介紹:Personal Blocklist 擴(kuò)展會(huì)將您希望阻止顯示的網(wǎng)址樣式提交給Google。當(dāng)您阻止或者允許一個(gè)網(wǎng)址樣式顯示時(shí),該擴(kuò)展同時(shí)也會(huì)將展示此被阻止或者被允許的網(wǎng)址的搜索結(jié)果網(wǎng)頁(yè)提交給Google。您同意Google可以自由使用此信息來(lái)改進(jìn)我們的產(chǎn)品和服務(wù)。
3、社會(huì)化網(wǎng)絡(luò)當(dāng)中的鏈接流行度
數(shù)據(jù)來(lái)源:Google自己抓取主流的社會(huì)化網(wǎng)絡(luò)中的鏈接,如Twitter、Facebook、delicious等。
頁(yè)面內(nèi)容
Google肯定會(huì)針對(duì)頁(yè)面進(jìn)行分析,主要考察的是頁(yè)面中信息量。可能考察的信息為:
1、網(wǎng)站或頁(yè)面是否存在大量的重復(fù)內(nèi)容
2、網(wǎng)站或網(wǎng)頁(yè)內(nèi)包含的原創(chuàng)內(nèi)容的占比
3、是否有大量的實(shí)質(zhì)內(nèi)容很少的頁(yè)面存在
4、頁(yè)面是否充斥大量無(wú)關(guān)廣告,影響信息的接收
5、頁(yè)面內(nèi)是否有明顯的SEO痕跡,有填充內(nèi)容存在
6、如果是模板頁(yè)面,模板頁(yè)面的共有部分的數(shù)據(jù)量
鏈接情況
1、社會(huì)化網(wǎng)絡(luò)中鏈接的流行度(前面已經(jīng)提及)
2、是否存在大量的SPAM鏈接
如何應(yīng)對(duì)Google Panda的更新?
1、查找網(wǎng)站內(nèi)流量質(zhì)量最差的頁(yè)面,并將這些頁(yè)面區(qū)隔開來(lái)。設(shè)法修改你的低質(zhì)量頁(yè)面,但是不要太過(guò),如果太過(guò)了容易招來(lái)懲罰。
2、給你網(wǎng)站的頁(yè)面分類,按類別去查看數(shù)據(jù),比如說(shuō)廣告數(shù)量、低質(zhì)量?jī)?nèi)容百分比。按照情況進(jìn)行修改會(huì)對(duì)搜索引擎屏蔽。(對(duì)于Wordpress的站點(diǎn),可以參考下我的網(wǎng)站的Robots.txt文件哈 http://www.biaodianfu.com/robots.txt)
3、如果您的站點(diǎn)是采集過(guò)來(lái)的內(nèi)容,嘗試移除他們或使用robots.txt來(lái)禁止Google 爬取,并停止采集,手動(dòng)添加原創(chuàng)內(nèi)容。
4、修改網(wǎng)站內(nèi)的鏈接,保證每個(gè)頁(yè)面只有一個(gè)唯一的鏈接。保證鏈接的唯一型。
5、修改那些過(guò)度優(yōu)化的頁(yè)面。去除重復(fù)堆積的文字等。
6、做一些提高用戶體驗(yàn)的修改, 讓頁(yè)面具有更好的可讀性,如修改字體大小,字體樣式,字體顏色等
7、在頁(yè)面上添加用戶可能感興趣的內(nèi)容,提供提供相關(guān)內(nèi)容的鏈接。
8、到社交網(wǎng)站上推廣你的站點(diǎn),或在網(wǎng)頁(yè)內(nèi)添加社會(huì)化按鈕便于用戶分享。
9、檢查網(wǎng)站廣告的覆蓋率,減少頁(yè)面中廣告的數(shù)量,去除彈出廣告。
10、停止SPAM行為吧,SPAM傷身!