狠狠网/色综合久久久久综合体桃花网/日本护士三aaaaaa/久久久久久综合一区中文字幕

或者

SEO掃盲:Baiduspider,Robot是什么?

作者:川藏線。 瀏覽:242 發(fā)布時(shí)間:2018-02-06
分享 評(píng)論 0

編者按,如果你是一位新手站長(zhǎng),不明白什么是Robot,不知道如何查看網(wǎng)站日志?不用怕,這篇SEO掃盲文章教你如何查看網(wǎng)站日志。


Robot英文直譯是機(jī)器人,在搜索引擎優(yōu)化SEO中,我們經(jīng)常翻譯為:探測(cè)器。


有時(shí),你會(huì)碰到crawler(爬行器),spider(蜘蛛),都是探測(cè)器之一,只是叫法不同。


SEO中常說(shuō)的這個(gè)探測(cè)器(Robot)是什么?


搜索引擎用來(lái)抓取網(wǎng)頁(yè)的工具。它是一個(gè)軟件或者說(shuō)一系列自動(dòng)程序(顯然,不是一部機(jī)器)。


不同的搜索引擎給他們自己的探測(cè)器(Robot)起不同的名字。


谷歌:googlebot 百度:baiduspider MSN:MSNbot Yahoo:Slurp (yahoo家的這位比較特殊,沒(méi)有帶“姓”,并且用的是一個(gè)擬聲詞。Slurp,中文理解是機(jī)器人吃東西時(shí)發(fā)出的嘖嘖的聲音)


關(guān)于Robot,需要關(guān)心的主要是Robots.txt,以及網(wǎng)站日志中包含的以上幾個(gè)名字。


百度用于抓取網(wǎng)頁(yè)的程序叫做Baiduspider – 百度蜘蛛,我們查看網(wǎng)站被百度抓取的情況主要是分析,網(wǎng)站日志里百度蜘蛛Baiduspider的活躍性:抓取頻率,返回的HTTP狀態(tài)碼。


查看日志的方式:


通過(guò)FTP,在網(wǎng)站根目錄找到一個(gè)日志文件,文件名一般包含log,下載解壓里面的記事本,這即是網(wǎng)站的日志,記錄了網(wǎng)站被訪問(wèn)和操作的情況。



因?yàn)楦鱾€(gè)服務(wù)器和主機(jī)的情況不同,不同的主機(jī)日志功能記錄的內(nèi)容不同,有的甚至沒(méi)有日志功能。


日志內(nèi)容如下:


61.135.168.22 – - [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1″ 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”


分析:


GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 這個(gè)頁(yè)面。


200 代表成功抓取。


8450 代表抓取了8450個(gè)字節(jié)。


如果你的日志里格式不是如此,則代表日志格式設(shè)置不同。


很多日志里可以看到 200 0 0和200 0 64 則都代表正常抓取。


抓取頻率是通過(guò)查看每日的日志里百度蜘蛛抓取次數(shù)來(lái)獲知。抓取頻率并沒(méi)有一個(gè)規(guī)范的時(shí)間表或頻率數(shù)字,我們一般通過(guò)多日的日志對(duì)比來(lái)判斷。當(dāng)然,我們希望百度蜘蛛每日抓取的次數(shù)越多越好。