通常搜索引擎從抓取到給予頁面排名的一個大致流程是:搜索引擎蜘蛛從已知頁面爬行的過程中會將新發現的url存放到待抓地址庫中,之后蜘蛛按照一定的順序對待抓地址庫中的url進行抓取,在抓取的過程中對信息進行初步篩選,把讀取的HTML代碼存入數據庫中,最后對信息進行整理存放入索引庫中。當用戶搜索時,搜索引擎會從索引庫中提取URL信息并排序展現出來。
至于收錄和索引的區別,個人認為兩者之間沒有太大區別。只不過收錄是從搜索用戶角度看的,搜索時能找到這個URL,就是這個URL被收錄了。而從搜索引擎角度看,URL被收錄了,也就是這個URL的信息在索引庫中存在。
但不論是收錄還是索引,對于網站優化都是有一定的影響的。
對收錄來說:
通過快照可以判斷頁面是否被收錄,而快照的查看方式:在pc端搜索關鍵詞時,在自然搜索結果的右下角會有百度快照字樣(以百度搜索引擎為例),我們點擊【百度快照】就可以看到頁面的快照信息——快照時間以及當初蜘蛛爬行時的頁面展現效果,因此快照對于網站優化有一定影響的。
如果大家發現自己網站頁面的快照沒有及時更新,或者快照的頁面內容與實際的頁面內容有一定的出入,可以點擊【投訴快照】進行投訴,或者直接通過官方的【快照申訴通道】進行投訴刪除。
快照除了有利于優化外,還可以讓人快速瀏覽頁面內容,也能在頁面出現異常無法瀏覽的情況下讓人依舊可以獲取頁面內容。
但是我們通常都忽略了搜索結果標題處的鏈接,此處的鏈接即為頁面的索引地址。
對索引來說
我們通過搜索引擎搜索關鍵詞時,每一個自然搜索結果的標題地址即為你的索引地址,大家可以通過在標題位置右鍵,【復制鏈接地址】來獲取索引地址,此時代表頁面已經建立了索引。
索引對于優化的意義在于,只有建立了索引網站才會有排名展現,沒有被索引的URL用戶在搜索結果中是看不到的。