對(duì)于一個(gè)網(wǎng)站站長(zhǎng)而言,最關(guān)鍵的莫過于搜索引擎能夠正常收錄,一旦網(wǎng)站不能正常收錄一切都是癡人說夢(mèng)。
對(duì)于一個(gè)網(wǎng)站站長(zhǎng)而言,最關(guān)鍵的莫過于搜索引擎能夠正常收錄,一旦網(wǎng)站不能正常收錄一切都是癡人說夢(mèng)。為什么會(huì)出現(xiàn)收錄困難?這是因?yàn)樗阉饕鏅C(jī)器人是一個(gè)很簡(jiǎn)單的軟件程序,它本身對(duì)站點(diǎn)并沒有任何的理解能力,只是通過一些固有的標(biāo)準(zhǔn)來評(píng)判站點(diǎn)的好壞,一旦站點(diǎn)在寫法上出現(xiàn)了錯(cuò)誤,搜索引擎將無法對(duì)站點(diǎn)進(jìn)行采集。
原因一:網(wǎng)站在沒有建設(shè)好的情況下就上線了(如死鏈很多)
這個(gè)很容易被忽視的,在您的網(wǎng)站上線之前,哪怕去掉那些沒用的死鏈,也不能因?yàn)?ldquo;好看”而保留著。
原因二:站點(diǎn)的robots.txt文件已損壞或者在書寫的時(shí)候出現(xiàn)錯(cuò)誤(例如出現(xiàn)錯(cuò)別字)
如果搜索引擎機(jī)器人錯(cuò)誤的理解了您的robots.txt文件,它們可能會(huì)完全無視你的網(wǎng)頁(yè)。對(duì)于這個(gè)問題,解決的辦法是仔細(xì)檢查您的robots.txt文件,并確保您網(wǎng)頁(yè)上的的參數(shù)是正確的。
原因三:網(wǎng)址中包含太多的變數(shù)網(wǎng)址
中包含太多的變數(shù)可能會(huì)造成搜索引擎機(jī)器人搜索困難。如果您的URL 包含變數(shù)太多,搜索引擎漫游器可能會(huì)忽視您的網(wǎng)頁(yè)。對(duì)于這個(gè)問題一些比較熟悉網(wǎng)站建設(shè)的人可能會(huì)想到動(dòng)態(tài)網(wǎng)頁(yè),的確就是這個(gè)問題,動(dòng)態(tài)生成的網(wǎng)頁(yè)(括ASP、PHP)可能導(dǎo)致抓取工具無法收錄,解決辦法,使用靜態(tài)頁(yè)面。
原因四:在您的網(wǎng)址中使用了會(huì)話ID
許多搜索引擎不去收錄那些包含會(huì)話ID的網(wǎng)頁(yè),因?yàn)樗鼈兛蓪?dǎo)致內(nèi)容的重復(fù)。如果可能的話,避免會(huì)話ID出現(xiàn)在您的網(wǎng)址,而使用Session存儲(chǔ)會(huì)話ID.
原因五:您的網(wǎng)頁(yè)中包含太多的代碼
網(wǎng)頁(yè)中包含了Java代碼、CSS的代碼以及其他腳本代碼。這些代碼與內(nèi)容沒有直接的聯(lián)系,訪問您網(wǎng)頁(yè)并選擇“查看源文件”或“查看HTML 源”,如果您很難對(duì)網(wǎng)站上的實(shí)際內(nèi)容進(jìn)行更改,那么通常情況下搜索引擎收錄起來也很困難。
原因六 :網(wǎng)站導(dǎo)航
大多數(shù)搜索引擎的機(jī)器人不能解析Java 或DHTML 菜單,當(dāng)然Flash以及Ajax 菜單效果更差。
如上文所述,搜索引擎機(jī)器人是很簡(jiǎn)單的程序,它們遵循的HTML鏈接,一旦鏈接出現(xiàn)錯(cuò)誤對(duì)收錄也會(huì)帶來困難。