網(wǎng)站建設(shè)公司尚品中國(guó):同樣的一本搜索引擎原理書籍,不同的人可能有不同的理解程度,而且一些以前的seo理論雖然已經(jīng)根深蒂固了,但是在目前的
SEO網(wǎng)站優(yōu)化情況下已經(jīng)不太實(shí)用了,比如一個(gè)收錄問(wèn)題。其實(shí)想準(zhǔn)確了解索引、收錄、site這些之間的關(guān)系,我們可以從基本的原理出發(fā)去考慮一些問(wèn)題。
從搜索原理上講,蜘蛛先抓取到一個(gè)網(wǎng)頁(yè)的URL,然后對(duì)這個(gè)URL對(duì)應(yīng)網(wǎng)頁(yè)的內(nèi)容進(jìn)行下載、分析,對(duì)于符合其質(zhì)量標(biāo)準(zhǔn)或有一定用途的網(wǎng)頁(yè)進(jìn)行索引,把索引后的網(wǎng)頁(yè)放入索引數(shù)據(jù)庫(kù)中。這時(shí)候索引庫(kù)內(nèi)的營(yíng)銷型網(wǎng)站建設(shè)有些具有用戶檢索價(jià)值的,有些是具有搜索引擎自身的檢索價(jià)值的,對(duì)于對(duì)用戶有檢索價(jià)值的被索引的網(wǎng)頁(yè),會(huì)進(jìn)行輸出,也即是我們說(shuō)的收錄。而對(duì)僅僅有搜索引擎自身檢索價(jià)值的網(wǎng)頁(yè)可能并不輸出,僅僅有一定的索引量而沒有輸出結(jié)果數(shù),因此我們可以看到很多時(shí)候收錄量會(huì)比索引量低很多。
站在搜索的角度而言,一個(gè)網(wǎng)站的網(wǎng)頁(yè)數(shù)量有時(shí)候是大于目前所擁有的網(wǎng)頁(yè)數(shù)量的。舉例來(lái)講,比如一個(gè)站有100個(gè)網(wǎng)頁(yè),對(duì)于用戶或者站長(zhǎng)而言,是100個(gè)網(wǎng)頁(yè),但是這100個(gè)網(wǎng)頁(yè)可能進(jìn)行了數(shù)據(jù)更新,網(wǎng)頁(yè)改變等多個(gè)操作,不同版本或許能滿足不同的需求,(因此我們也可以看到很多時(shí)候一個(gè)網(wǎng)頁(yè)有不同的快照。)從這個(gè)角度而言,在搜索的眼中一個(gè)網(wǎng)站的網(wǎng)頁(yè)數(shù)量是可以大于網(wǎng)站目前所擁有的輸出網(wǎng)頁(yè)數(shù)量的,特別對(duì)于頻繁修改的網(wǎng)站或者URL不規(guī)范的站點(diǎn)。同時(shí),站在搜索引擎的數(shù)據(jù)角度而言,其數(shù)據(jù)量可能由歷史數(shù)據(jù)和更新數(shù)據(jù)等組成的,因此site相關(guān)結(jié)果值也大于site結(jié)果數(shù)。
依據(jù)上面的說(shuō)法,我們把四者的關(guān)系重新梳理下:
索引量和收錄量:索引量是所有對(duì)搜素有價(jià)值頁(yè)面的集合,這些頁(yè)面有些對(duì)用戶有價(jià)值,把這些頁(yè)面輸出出來(lái)就是收錄量(不同的人可能定義不一樣),有些頁(yè)面僅僅對(duì)搜索引擎自身有價(jià)值,這些頁(yè)面數(shù)量就造成了索引量高于收錄量的數(shù)值。
site結(jié)果數(shù)與相關(guān)結(jié)果值:我們很多時(shí)候會(huì)看到site結(jié)果一般如下圖:
我們看到一個(gè)問(wèn)題,相關(guān)結(jié)果數(shù)為2790,而site結(jié)果僅僅為100左右,兩者差距甚大。造成期差距的原因可能是有多個(gè)因素造成的,比如有些網(wǎng)頁(yè)可能被重復(fù)計(jì)算了,有些網(wǎng)頁(yè)雖然被收錄了(檢索價(jià)值是有的)但是頁(yè)面質(zhì)量不高(網(wǎng)頁(yè)價(jià)值和檢索價(jià)值不是一碼事,網(wǎng)頁(yè)檢索價(jià)值僅僅是網(wǎng)頁(yè)價(jià)值的一個(gè)基礎(chǔ)而已,而網(wǎng)頁(yè)價(jià)值是多個(gè)因素組成的。)
同時(shí)我們也要知道,蜘蛛畢竟是機(jī)器,而且互聯(lián)網(wǎng)上很多網(wǎng)站的網(wǎng)頁(yè)數(shù)量在不同地進(jìn)行著變化,一直有新的網(wǎng)頁(yè)產(chǎn)生和老網(wǎng)頁(yè)的刪除,我們某個(gè)時(shí)候看到的值是一個(gè)大體準(zhǔn)確的值,而并不是100%準(zhǔn)確的。
從包含關(guān)系而言,這四者的關(guān)系大體如下:
索引量大于收錄量,收錄量大于site結(jié)果數(shù),而相關(guān)結(jié)果數(shù)是大于site結(jié)果數(shù)。不過(guò)在一般情況下,我們個(gè)人建議采用下面的方法簡(jiǎn)化這些關(guān)系:
1,site直接結(jié)果數(shù)對(duì)seo意義和價(jià)值較大,除了可以用site結(jié)果數(shù)來(lái)判斷一些頁(yè)面價(jià)值外,在收錄上我們建議提高site結(jié)果數(shù)和百度索引量的比值、百度索引量與整個(gè)網(wǎng)站網(wǎng)頁(yè)數(shù)量的比值,從這2個(gè)比值入手進(jìn)行seo優(yōu)化和操作。至于其中糾糾結(jié)結(jié)的概念這類的,直接無(wú)視就好了。
2,百度索引量=百度收錄量,因?yàn)槭珍浟科鋵?shí)是無(wú)法看到的,site結(jié)果數(shù)和相關(guān)結(jié)果值也無(wú)法代表收錄量。