主頁 > 知識庫 > 百度蜘蛛抓取時返回304狀態(tài)碼的問題分析

百度蜘蛛抓取時返回304狀態(tài)碼的問題分析

熱門標簽:溫州電話電銷機器人供應商 沈陽防封電銷機器人供應商 電銷機器人感受 代理高德地圖標注 烏魯木齊語音外呼系統(tǒng)平臺 東莞400電話怎么辦理 天津河東企業(yè)400電話到哪申請 上海電話400辦理 電話機器人說明什么
最近遇到一個網站被百度蜘蛛抓取首頁后大量返回304狀態(tài)碼的問題,以前遇到過301和302,就是沒了解過304,剛好可以對這個情況進行一下分析和觀察,以便比較深入的了解該問題的出現以及應對之策。
百度百科對304狀態(tài)碼是這么解釋的:如果客戶端發(fā)送了一個帶條件的 GET 請求且該請求已被允許,而文檔的內容(自上次訪問以來或者根據請求的條件)并沒有改變,則服務器應當返回這個304狀態(tài)碼。簡單的表達就是:客戶端已經執(zhí) 行了GET,但文件未變化,也就是我們所理解的頁面沒更新。
GET /index.html - 80 - 220.181.135.120 Sosospider+(+http://help.soso.com/webspider.htm) 304 0 0
GET /index.html - 80 - 123.129.209.113 Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html) 304 0 0
但網站每天都有較多內容的更新,怎么會返回未更新的狀態(tài)碼呢,查看了網站進幾天的網站IIS日志,發(fā)現這幾天對首頁的抓取都是返回的304狀態(tài)碼,一般情況下大概會是一下幾種可能:
1、服務器緩存緣故
設置緩存的作用一般都是為了加速網站的提前加載,就像我們在瀏覽器上訪問網站的時候也比較容易出現緩存問題,當你打開一個網站之后,如果該網站有更新或者有 變化,直接點擊首頁會發(fā)現還是之前訪問的頁面,而ctrl+F5重新加載后才會顯示新的頁面,這其實就是緩存的緣故。另外,有的時候和一些較大的網站換友情鏈接也會遇到,對方加了友鏈之后首頁不會馬上顯示,會因為緩存而需要過一段時間才能顯示。
2、網站結構問題
如果網站結構不能有效的讓蜘蛛順利爬行,也就是說雖然蜘蛛有抓取,但由于網站結構問題導致蜘蛛前后兩次抓取內容相同,或者說蜘蛛每次抓取首頁都只抓了那塊固定的內容,那么就勢必導致蜘蛛對首頁的抓取返回304狀態(tài)碼。
3、網站速度問題
谷歌就針對網站的加載時間更 新過算法,把網站加載時間納入了排名因素,就算搜索引擎排名不重視這點,對于用戶體驗也是有很大影響,誰也不會愿意多花時間在一個需要加載幾十秒甚至幾分 鐘的網站上面。而對于搜索蜘蛛也是如此,網站的加載速度也會影響蜘蛛的正常抓取,一般情況下網站都是從上往下的加載,而有的時候由于速度因素導致網站只加載了頭部,后面部分而沒有及時顯示出來,也可能導致蜘蛛只抓取了頭部部分內容,而由于一般網站的頭部都是相同的,也就容易出現了抓取返回沒更新的狀態(tài)碼。
另外,網絡線路的互通也是一個因素。
4、網站內容問題
網上查找了下關于304狀態(tài)碼的一些內容,不少人都認為是網站內容長期采集或是偽原創(chuàng)也能導致蜘蛛返回該狀態(tài)碼,因為網站內容采集或偽原創(chuàng)的確會降低網站質量,導致百度不收錄等情況,搜索蜘蛛也會認為網站內容不具備收錄的意義,那么也就不會抓取新的內容而返回沒有更新的狀態(tài)。
5、重視該狀態(tài)碼
既然304狀態(tài)碼是表示未更新的情況,那么經常出現就需要引起重視,同時也需要觀察出現該狀態(tài)碼的同時網站各方面數據的變化和趨勢,以便對該狀態(tài)碼的影響有較好的了解。
暫時網站出現304狀態(tài)碼之后經過百度更新收錄有所減少,前幾天有過斷斷續(xù)續(xù)的網站無法訪問的情況,第二天網站首頁就被K掉,在更換服務器之后恢復網站正常訪問,次日首頁再次恢復,目前仍需要觀察和分析,才能更好掌握該狀態(tài)碼。

標簽:克拉瑪依 莆田 大興安嶺 揚州 玉林 鹽城 黔南 濟源

巨人網絡通訊聲明:本文標題《百度蜘蛛抓取時返回304狀態(tài)碼的問題分析》,本文關鍵詞  百度,蜘蛛,抓取,時,返回,;如發(fā)現本文內容存在版權問題,煩請?zhí)峁┫嚓P信息告之我們,我們將及時溝通與處理。本站內容系統(tǒng)采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《百度蜘蛛抓取時返回304狀態(tài)碼的問題分析》相關的同類信息!
  • 本頁收集關于百度蜘蛛抓取時返回304狀態(tài)碼的問題分析的相關信息資訊供網民參考!
  • 推薦文章