關(guān)鍵字描述:
今天弄個圖文并茂的給大家說下,其實(shí)dede采集還是很好用的,我發(fā)的這個是5.1版的采集教程:
首先看下圖:
節(jié)點(diǎn)名稱隨便寫自己記住就行了,編碼按照采集網(wǎng)頁自己定制,然后其他沒特殊要求默認(rèn)就好了,然后是分頁列表頁面。
采集列表獲取規(guī)則:
來源網(wǎng)址獲取方式:自己選擇這里我選的第一個
分頁變量起始值:分頁的變量這個應(yīng)該明白吧大家。
來源網(wǎng)址:根據(jù)頁面的分頁列表url形式就好了,截圖里有大家可以看看!
文章網(wǎng)址需包含:這個就是說列表頁每個鏈接文章的url里面都包含的那字符串
網(wǎng)址不能包含:一般不用寫
其他留空就好了,好了下面介紹采集內(nèi)容頁面的填寫。
文章標(biāo)題:
里面的標(biāo)題代碼是
”<div id="content" class="common">
<h1>漂亮的色彩溶解漸變插畫圖片</h1>
<p id="meta">上傳時間:2009-01-07 作者:網(wǎng)絡(luò) 來源:網(wǎng)絡(luò)</p><iframe marginwidth="0" marginheight="0" "
大家截取標(biāo)題的話就是截取
開始無重復(fù)HTML:
<div id="content" class="common">
<h1>
結(jié)尾無重復(fù)HTML:
</h1>
<p id="meta">
就是開始和結(jié)尾別重復(fù)了就行了,然后符合每個頁面的代碼規(guī)則就好了。(截圖是比較早的采集頁面,原網(wǎng)站如果有改動請自己改動,圖作為參考而已)
然后下面的都按照采集標(biāo)題的規(guī)則去設(shè)置就好了,好了大家可以試試祝大家成功有問題可以交流!