觸屏版
全國(guó)服務(wù)熱線:0571-87205688
登錄
注冊(cè)
客戶中心
關(guān)注云客
SEOer們要想更好的理解SEO,做好SEO的工作,學(xué)習(xí)和理解搜索引擎的基本架構(gòu)和原理,是非常有必要的,下面我來(lái)講一下搜索引擎的一些組成部分。通用的搜索引擎,一般包含了以下一些功能模塊:
1,蜘蛛,即Spider,類似瀏覽器的程序,專門用來(lái)下載web頁(yè)面
2,爬蟲,即Crawler,用來(lái)自動(dòng)跟蹤所有頁(yè)面中的鏈接
3,索引,即Indexer,專門用來(lái)分析蜘蛛和爬蟲下載下來(lái)的web頁(yè)面
4,數(shù)據(jù)庫(kù),存儲(chǔ)下載的頁(yè)面信息和處理過(guò)的頁(yè)面信息
5,結(jié)果引擎,從數(shù)據(jù)庫(kù)中抽取出搜索結(jié)果
6,Web服務(wù)器,用來(lái)處理用戶的搜索交互請(qǐng)求的web服務(wù)器
不同的搜索引擎實(shí)現(xiàn),某些地方可能有一定的差別,比如,蜘蛛+爬出+索引的組合功能就是通過(guò)一個(gè)單一的程序來(lái)實(shí)現(xiàn)的,它一邊下載頁(yè)面,一邊分析出結(jié)果,并利用已有的鏈接來(lái)發(fā)現(xiàn)新的資源。當(dāng)然,這些功能都是所有搜索引擎所固有的,所體現(xiàn)的SEO原則都是類似的。
下面對(duì)搜索引擎的功能模塊進(jìn)行分別闡述。
蜘蛛。這個(gè)功能模塊專門用來(lái)下載頁(yè)面,類似瀏覽器的功能。它們之間的區(qū)別在于,瀏覽器展現(xiàn)給用戶的是各種形式的信息,包括文本的信息,圖像的信息,視頻的信息,等等;而對(duì)于蜘蛛來(lái)說(shuō),并沒(méi)有一些可視化的組件,而是直接跟基本的html源代碼打交道。大家可能都知道,一個(gè)標(biāo)準(zhǔn)的web瀏覽器都是帶有html源文件查看的功能的。
爬蟲。該功能模塊專門用戶發(fā)現(xiàn)每個(gè)頁(yè)面中的所有鏈接。它的任務(wù)是,通過(guò)評(píng)估找到的鏈接,或者已定義的地址,來(lái)決定蜘蛛去哪里。爬蟲跟蹤這些已經(jīng)找到的鏈接,并且嘗試去發(fā)現(xiàn)對(duì)于搜索引擎來(lái)說(shuō)不知道的一些文檔。
索引。此功能組件負(fù)責(zé)解析每個(gè)頁(yè)面,然后分析各種頁(yè)面的元素,例如,文本內(nèi)容,頭部?jī)?nèi)容,結(jié)構(gòu)化或者自定義過(guò)的特色部分,特殊的html標(biāo)簽,等等。
數(shù)據(jù)庫(kù)。搜索引擎下載和分析的一些數(shù)據(jù),都要進(jìn)行存儲(chǔ)。有些時(shí)候,它也叫做搜索引擎的索引。
結(jié)果引擎。結(jié)果引擎來(lái)進(jìn)行頁(yè)面的排名工作。它決定著哪些頁(yè)面是最匹配用戶的搜索請(qǐng)求的,并且按照何種有效而合理的次序來(lái)顯示這些結(jié)果。這是根據(jù)搜索引擎的排名算法而決定的。它追尋的是這樣一種理念,頁(yè)面排名是有價(jià)值的,基于用戶興趣驅(qū)動(dòng)的,所以對(duì)于SEO工作者來(lái)說(shuō)這個(gè)是最感興趣的,SEOer們的目標(biāo)就是如何有效提高所關(guān)心的網(wǎng)站的頁(yè)面排名。
Web服務(wù)器。搜索引擎web服務(wù)器包含了這樣的一個(gè)基本的web頁(yè)面,有一個(gè)用于用戶輸入感興趣的關(guān)鍵詞的文本框,并且當(dāng)用戶提交搜索動(dòng)作時(shí),將搜索出的結(jié)果合理的展示給用戶。
評(píng)論(0人參與,0條評(píng)論)
發(fā)布評(píng)論
最新評(píng)論