西安網(wǎng)站SEO優(yōu)化公司-什么是搜索引擎爬蟲(chóng)?
2019-08-04 來(lái)自: 陜西印象信息技術(shù)有限公司 瀏覽次數:4720
搜索引擎的工作原理,講求提高網(wǎng)站與其友好性,因此,在網(wǎng)站優(yōu)化中,SEO的每一步操作,都與搜索引擎機制有著(zhù)必然的聯(lián)系。對新手來(lái)說(shuō),先要對其原理進(jìn)行滲透,我們可以通過(guò)逆向推理獲取我們先要知道的答案,至少我們要從原理出發(fā),那么才知道我們所做的什么操作有什么樣的意義。
一、什么是搜索引擎爬蟲(chóng)?
索引擎蜘蛛也稱(chēng)之為:頁(yè)面爬蟲(chóng),其目的:抓取各類(lèi)網(wǎng)站的高質(zhì)量?jì)热葸M(jìn)行展現,那么每個(gè)搜索引擎都有自己的爬蟲(chóng),我們來(lái)進(jìn)行相關(guān)的了解!
1. Baiduspider(百度蜘蛛)百度公司還有其它幾個(gè)蜘蛛:Baiduspider-news(新聞)、Baiduspider-mobile(wap)、Baiduspider-image(圖片)、Baiduspider-video(視頻),站長(cháng)經(jīng)常見(jiàn)到的是Baiduspider和Baiduspider-image。
2. Googlebot(谷歌蜘蛛)還發(fā)現一個(gè)Googlebot-Mobile,看名字應該是抓取wap內容的。
3. 360Spider(360蜘蛛)它是一個(gè)很“勤奮抓爬”的蜘蛛。
4. Sogou News Spider(搜狗蜘蛛)
二、搜索引擎工作原理
SEO可以把其原理分為三個(gè)階段:
1、爬行和抓取
2、預處理(建立索引)
3、輸出結果
這里也就是說(shuō),當搜索引擎蜘蛛在抓取我們網(wǎng)站之后,是否給予展現,就需要進(jìn)行預處理,決定頁(yè)面是否進(jìn)行展現,那么其中的影響因素有:
(1)文章質(zhì)量度
(2)關(guān)鍵詞布局
(3)蜘蛛抓取深度
(4)網(wǎng)站質(zhì)量
(5)搜索引擎信任度
(6)網(wǎng)站層級
(7)URL設置是否規范
這里,并沒(méi)有按照順序為大家進(jìn)行排列,但是也足以說(shuō)明,影響頁(yè)面是否被收錄給予良好的展現,主要還是取決于站長(cháng)自身對網(wǎng)站的整體感,以及對網(wǎng)站基礎的設置等因素有***的關(guān)聯(lián)。
三、蜘蛛爬行和抓取原理
還是要為大家對于蜘蛛抓取這個(gè)重要環(huán)節,進(jìn)行一個(gè)詳細的說(shuō)明,畢竟這是站長(cháng)做SEO優(yōu)化,比較核心的部分,畢竟網(wǎng)站需要有***的展現量才能獲取***的排名。
當搜索引擎通過(guò)蜘蛛發(fā)現鏈接時(shí),根據網(wǎng)站的質(zhì)量度決定蜘蛛抓取頻次以及次數,然后蜘蛛便會(huì )去訪(fǎng)問(wèn)我們的網(wǎng)站,從而獲取我們的HTML代碼存入數據庫之中。
1、那么Spider(蜘蛛)抓取網(wǎng)頁(yè)的具體流程有哪些?
答:發(fā)現某一個(gè)鏈接 → 下載這一個(gè)網(wǎng)頁(yè) → 加入到臨時(shí)庫 → 提取網(wǎng)頁(yè)中的鏈接 → 在下載網(wǎng)頁(yè) → 循環(huán)。
1)預處理(建立索引)
蜘蛛(***術(shù)語(yǔ):索引程序)對抓取來(lái)的網(wǎng)頁(yè)內容要進(jìn)行關(guān)鍵詞提取、生成倒排索引、頁(yè)面PageRank值及TrustRank值計算、頁(yè)面關(guān)鍵詞相關(guān)性等處理,以備排名程序調用,這也是搜索引擎能在極短時(shí)間內返回搜索結果的關(guān)鍵,其中我們***關(guān)心的是PR值和相關(guān)性。
2)輸出結果
用戶(hù)輸入關(guān)鍵詞后,排名程序調用索引庫數據,程序自動(dòng)匹配關(guān)鍵詞,然后按***規則生成搜索結果展示頁(yè)面,這是因為前面的預處理,搜索引擎才能夠在很短的時(shí)間內返回輸出結果,這里特別要提醒一下,自然搜索排名和競價(jià)推廣排名是有區別的。