狠狠网/色综合久久久久综合体桃花网/日本护士三aaaaaa/久久久久久综合一区中文字幕

或者

頁面無用時間信息導致網頁不被抓取

作者:淺色記憶 瀏覽:159 發布時間:2017-09-13
分享 評論 0

在第一期【院長幫幫忙】欄目露面的站點是編織匯(www.bianzhihui.com),該站點通過反饋中心反饋頁面內容遲遲不被抓取,經百度工程師追查,原來是因為頁面上的無用時間信息——沒有想到是不是?同學們快來看看這個案例吧。也想讓院長幫助追查嗎?快來看看這里!

  站點求助:現象

  編織匯網站內容發布后幾個禮拜都未曾收錄。案例如下:

  http://www.bianzhihui.com/t/6717(教程詳細頁面舉例)

  http://www.bianzhihui.com/u/12306 (用戶頁面舉例)

  http://www.bianzhihui.com/h/154 (編織花樣頁面舉例)

  我們已將這些url放入sitemap,并使用了百度統計的集成的JS推薦,但是未曾有改善。

  站點求助:自查

  根據反饋中心的回復,使用抓取異常工具診斷:未發現異常

  院長出手,內部追查

  工程師結論: spider抓取很及時,但因為該網站沒有設置內容產出時間,網站底部卻有個老舊時間日期,導致spider誤以為網頁內容老舊(具體策略較復雜,在此不做贅述)。建議增加頁面內容產生時間,去掉沒有必要的時間信息

  

  *以上為舊頁面截圖,“2014年9月9日”對時間識別造成干擾。

  站點總結:

  1,網頁上切忌勿亂加時間,如我們網站的(始于2014年9月9日)這種時間是一個大忌

  2,網頁內容盡可能加上產出時間,也就是發布時間

  3,百度site的結果時間和權重并無太多關系

  4,跟百度溝通的時候,一定要條例清晰,證據確鑿。自身的問題一定要先排查準確。