狠狠网/色综合久久久久综合体桃花网/日本护士三aaaaaa/久久久久久综合一区中文字幕

或者

【官方說法】百度蜘蛛抓取流量暴增的原因

作者:董凱悅 瀏覽:9861 發布時間:2016-10-14
編輯 分享 評論 8

Spider對網站抓取數量突增往往給站點帶來很大煩惱,紛紛找平臺想要Baiduspider IP白名單,但實際上BaiduSpider IP會隨時變化,所以并不敢公布出來,擔心站長設置不及時影響抓取效果。百度是怎么計算分配抓取流量的呢?站點抓取流量暴增的原因有哪些呢?

總體來說,Baiduspider會根據站點規模、歷史上網站每天新產出的鏈接數量、已抓取網頁的綜合質量打分等等,來綜合計算抓取流量,同時兼顧站長在抓取頻次工具里設置的、網站可承受的最大抓取值。

從目前追查過的抓取流量突增的case中,原因可以分為以下幾種:

1,  Baiduspider發現站內JS代碼較多,調用大量資源針對JS代碼進行解析抓取

2,  百度其他部門(如商業、圖片等)的spider在抓取,但流量沒有控制好,sorry

3,  已抓取的鏈接,打分不夠好,垃圾過多,導致spider重新抓取

4,  站點被攻擊,有人仿冒百度爬蟲

如果站長排除了自身問題、仿冒問題,確認BaiduSpider抓取流量過大的話,可以通過反饋中心來反饋,切記一定要提供詳細的抓取日志截圖。


詞條統計

  • 瀏覽次數:9861
  • 編輯次數:0次歷史版本
  • 最近更新:2016-10-14
  • 創建者:董凱悅
  • 相關詞條

    相關問答

    相關百科

    相關資訊