主頁 > 知識庫 > Linux/Nginx如何查看搜索引擎蜘蛛爬蟲的行為

Linux/Nginx如何查看搜索引擎蜘蛛爬蟲的行為

熱門標簽:外呼電話系統(tǒng)怎么操作 智能電銷機器人有用嗎 天津電話外呼系統(tǒng)排名 怎么在百度地圖標注公司的位置 測繪地圖標注名稱 商機地圖標注 百度地圖標注直線距離 鶴崗400電話申請 德陽400電話申請

摘要

做好網(wǎng)站SEO優(yōu)化的第一步就是首先讓蜘蛛爬蟲經(jīng)常來你的網(wǎng)站進行光顧,下面的Linux命令可以讓你清楚的知道蜘蛛的爬行情況。下面我們針對nginx服務器進行分析,日志文件所在目錄:/usr/local/nginx/logs/access.log,access.log這個文件記錄的應該是最近一天的日志情況,首先請看看日志大小,如果很大(超過50MB)建議別用這些命令分析,因為這些命令很消耗CPU,或者更新下來放到分析機上執(zhí)行,以免影響網(wǎng)站的速度。

Linux shell命令

1. 百度蜘蛛爬行的次數(shù)

cat access.log | grep Baiduspider | wc

最左面的數(shù)值顯示的就是爬行次數(shù)。

2. 百度蜘蛛的詳細記錄(Ctrl C可以終止)

cat access.log | grep Baiduspider

也可以用下面的命令:

cat access.log | grep Baiduspider | tail -n 10
cat access.log | grep Baiduspider | head -n 10

只看最后10條或最前10條,這用就能知道這個日志文件的開始記錄的時間和日期。

3. 百度蜘蛛抓取首頁的詳細記錄

cat access.log | grep Baiduspider | grep “GET / HTTP”

百度蜘蛛好像對首頁非常熱愛每個鐘頭都來光顧,而谷歌和雅虎蜘蛛更喜歡內(nèi)頁。

4. 百度蜘蛛派性記錄時間點分布

cat access.log | grep “Baiduspider ” | awk ‘{print $4}'

5. 百度蜘蛛爬行頁面按次數(shù)降序列表

cat access.log | grep “Baiduspider ” | awk ‘{print $7}' | sort | uniq -c | sort -r

文中的Baiduspider 改成Googlebot都可以查看谷歌的數(shù)據(jù),鑒于大陸的特殊性,大家應該對百度的log更為關(guān)注。

附:(Mediapartners-Google)Google adsense蜘蛛的詳細爬行記錄

cat access.log | grep Mediapartners

Mediapartners-Google是什么呢?Google adsense廣告之所以能與內(nèi)容相關(guān),因為每個包含著adsense的廣告被訪問后,很快就有個Mediapartners-Google蜘蛛來到這個頁面,所以幾分鐘后再刷新就能顯示相關(guān)性廣告了,真厲害??!

ps:linux下nginx如何啟用網(wǎng)站日志,查看蜘蛛爬蟲

默認的路徑是你安裝時候指定的

如果用的LNMP之類的安裝包

你可以在SHELL下

whereisnginx

找到相應的路徑之后

在NGINX下的CONF文件夾里看配置文件,日志文件如果記錄了話

在配置文件里有路徑的~

您可能感興趣的文章:
  • Nginx服務器屏蔽與禁止屏蔽網(wǎng)絡爬蟲的方法
  • nginx修改配置限制惡意爬蟲頻率
  • Nginx中配置過濾爬蟲的User-Agent的簡單方法
  • Nginx限制搜索引擎爬蟲頻率、禁止屏蔽網(wǎng)絡爬蟲配置示例
  • Nginx反爬蟲策略,防止UA抓取網(wǎng)站

標簽:優(yōu)質(zhì)小號 六盤水 武漢 鎮(zhèn)江 滁州 百色 丹東 自貢

巨人網(wǎng)絡通訊聲明:本文標題《Linux/Nginx如何查看搜索引擎蜘蛛爬蟲的行為》,本文關(guān)鍵詞  Linux,Nginx,如何,查看,搜索引擎,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡,涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《Linux/Nginx如何查看搜索引擎蜘蛛爬蟲的行為》相關(guān)的同類信息!
  • 本頁收集關(guān)于Linux/Nginx如何查看搜索引擎蜘蛛爬蟲的行為的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章