小問(wèn)題也需要大智慧,處理網(wǎng)站錯(cuò)誤頁(yè)面是百度在網(wǎng)頁(yè)優(yōu)化白皮書(shū)提出的重點(diǎn)項(xiàng)目,作為站長(zhǎng)的我們應(yīng)該去發(fā)現(xiàn)這些重點(diǎn),然后根據(jù)網(wǎng)站自身的問(wèn)題去改進(jìn)問(wèn)題,提高網(wǎng)頁(yè)在百度收錄時(shí)遇到錯(cuò)誤頁(yè)面而給與負(fù)面影響,同時(shí)也給用戶留下好的印象,提升網(wǎng)頁(yè)的用戶體驗(yàn)。作為菜鳥(niǎo)的我給大家總結(jié)了從那些方面來(lái)找出收錄頁(yè)面在百度中的錯(cuò)誤。
1、服務(wù)器錯(cuò)誤
服務(wù)器錯(cuò)誤最主要的問(wèn)題就是百度蜘蛛發(fā)起抓取網(wǎng)頁(yè)的時(shí)候,httpcode返回的都是5XX狀態(tài)碼,這樣會(huì)造成百度抓取不到規(guī)范的網(wǎng)頁(yè)。
造成服務(wù)器錯(cuò)誤的原因有多種:網(wǎng)站處于正在進(jìn)行維護(hù);該網(wǎng)站有程序出現(xiàn)批量錯(cuò)誤。
最好的解決辦法就是找出程序的錯(cuò)誤并做出適當(dāng)?shù)男薷?,如果是網(wǎng)站正在進(jìn)行維護(hù),請(qǐng)采用百度站長(zhǎng)平臺(tái)的閉站保護(hù)進(jìn)行規(guī)范后然后再進(jìn)行操作。
2、訪問(wèn)被拒絕
訪問(wèn)被拒絕最主要的問(wèn)題就是百度蜘蛛發(fā)起抓取網(wǎng)頁(yè)的時(shí)候,httpcode返回的都是403狀態(tài)碼,這樣同樣會(huì)造成百度蜘蛛抓取不到規(guī)范的網(wǎng)頁(yè)。
造成訪問(wèn)被拒絕的原因也有多種:網(wǎng)站權(quán)限受限制;IP地址被拒絕;服務(wù)器流量超負(fù)荷。
這幾種錯(cuò)誤原因解決辦法也很容易,找出網(wǎng)頁(yè)所在目錄給與百度蜘蛛足夠的權(quán)限去抓取頁(yè)面,查看百度蜘蛛的IP地址是否被封禁,服務(wù)器流量過(guò)大的話那就升級(jí)服務(wù)器。
3、找不到頁(yè)面
找不到頁(yè)面最主要的問(wèn)題就是百度蜘蛛發(fā)起抓取網(wǎng)頁(yè)的時(shí)候,httpcode返回的都是404狀態(tài)碼,這種錯(cuò)誤是網(wǎng)頁(yè)最主要的,幾乎所有的網(wǎng)站都有這種頁(yè)面存在。
造成找不到頁(yè)面的原因可以列舉一大把:過(guò)期的團(tuán)購(gòu)網(wǎng)頁(yè);誤刪數(shù)據(jù)庫(kù);論壇垃圾帖子刪除。
其實(shí)這些問(wèn)題能夠輕而易舉的就解決了,建立合適的404頁(yè)面,遇到404狀態(tài)碼就返回404頁(yè)面。
4、其他錯(cuò)誤
其他錯(cuò)誤包括的項(xiàng)目就比較多了,但問(wèn)題大概還是差不多的,就是百度蜘蛛抓起網(wǎng)頁(yè)的時(shí)候httpcode返回的4XX狀態(tài)碼,除了403和404之外的其他狀態(tài)碼。
這種問(wèn)題的來(lái)源也是蠻多的:請(qǐng)求的URL太長(zhǎng)【參數(shù)太多】;要求驗(yàn)證身份;不支持的媒體類(lèi)型;瀏覽器不接收所請(qǐng)求的頁(yè)面。
解決這些問(wèn)題比較復(fù)雜,URL過(guò)長(zhǎng)的話需要解決參數(shù)的排序位置,身份驗(yàn)證的就要從部分網(wǎng)站權(quán)限控制和其他程序問(wèn)題來(lái)控制了,媒體類(lèi)型盡量做到每個(gè)類(lèi)型就覆蓋到自己的網(wǎng)站。
總之,運(yùn)用好百度站長(zhǎng)平臺(tái)的抓取異常這個(gè)欄目選項(xiàng),你就能找到百度蜘蛛在抓取網(wǎng)頁(yè)的時(shí)候遇到的瓶頸,解決掉這些對(duì)蜘蛛爬取的有阻攔的問(wèn)題,你就能把所有在百度已經(jīng)收錄的頁(yè)面統(tǒng)計(jì)出來(lái),然后根據(jù)不同的問(wèn)題解決掉就可以了。網(wǎng)站抓取問(wèn)題解決了,百度收錄量就會(huì)duang,duang,duang的瘋漲了。
以上就是對(duì)用百度排查已收錄頁(yè)面網(wǎng)址的異常的四個(gè)方面全部?jī)?nèi)容的介紹,更多內(nèi)容請(qǐng)繼續(xù)關(guān)注腳本之家!