主頁 > 知識庫 > .net 解決spider多次和重復(fù)抓取的方案

.net 解決spider多次和重復(fù)抓取的方案

熱門標(biāo)簽:t3出行地圖標(biāo)注怎么做 外呼電銷機器人軟件 河南語音外呼系統(tǒng)公司 關(guān)于宗地圖標(biāo)注技術(shù)規(guī)范 河北網(wǎng)絡(luò)回?fù)芡夂粝到y(tǒng) 400電話辦理最優(yōu)質(zhì) 寧夏機器人電銷 400免費電話怎么辦理 威海電銷

原因:

早期由于搜索引擎蜘蛛的不完善,蜘蛛在爬行動態(tài)的url的時候很容易由于網(wǎng)站程序的不合理等原因造成蜘蛛迷路死循環(huán)。

所以蜘蛛為了避免之前現(xiàn)象就不讀取動態(tài)的url,特別是帶?的url

解決方案:

1):配置路由

復(fù)制代碼 代碼如下:

routes.MapRoute("RentofficeList",
               "rentofficelist/{AredId}-{PriceId}-{AcreageId}-{SortId}-{SortNum}.html",
               new { controller = "Home", action = "RentOfficeList" },
               new[] { "Mobile.Controllers" });

第一個參數(shù)是路由名稱
第二個參數(shù)是路由的Url模式,參數(shù)之間用{}-{}方式分隔
第三個參數(shù)是一個包含默認(rèn)路由的對象
第四個參數(shù)是應(yīng)用程序的一組命名空間

2):設(shè)置連接

a href="@Url.Action("RentofficeList",new RouteValueDictionary { { "AredId",0},{"PriceId",0},{"AcreageId",0},{"SortId",0},{"SortNum",0}})">默認(rèn)排序/a>

對照上面的Url模式,依次寫入?yún)?shù)賦值
3):獲取參數(shù)

復(fù)制代碼 代碼如下:

int areaId = GetRouteInt("AredId");//獲取參數(shù)
/// summary>
/// 獲得路由中的值
/// /summary>
/// param name="key">鍵/param>
/// param name="defaultValue">默認(rèn)值/param>
/// returns>/returns>
protected int GetRouteInt(string key, int defaultValue)
{
return Convert.ToInt32(RouteData.Values[key], defaultValue);
}
/// summary>
/// 獲得路由中的值
/// /summary>
/// param name="key">鍵/param>
/// returns>/returns>
protected int GetRouteInt(string key)
{
return GetRouteInt(key, 0);
}

根據(jù)上面3個步驟操作,顯示的url地址為:

http://localhost:3841/rentofficelist/3-0-0-0-0.html
這樣就可以避免靜態(tài)頁面上使用動態(tài)參數(shù),顯示的頁面都為靜態(tài)頁面

您可能感興趣的文章:
  • javascript SpiderMonkey中的函數(shù)序列化如何進(jìn)行

標(biāo)簽:賀州 樂山 池州 廣元 吉林 固原 咸寧 淮北

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《.net 解決spider多次和重復(fù)抓取的方案》,本文關(guān)鍵詞  .net,解決,spider,多次,和,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《.net 解決spider多次和重復(fù)抓取的方案》相關(guān)的同類信息!
  • 本頁收集關(guān)于.net 解決spider多次和重復(fù)抓取的方案的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章