亚洲区欧美区偷拍区中文字幕,黄页网站视频在线观看

主頁 > 網(wǎng)站建設(shè) > 建站知識 > DeDeCMS織夢的采集教程

DeDeCMS織夢的采集教程

POST TIME:2020-04-13 22:49

藍色安防器材公司類整站模板

html5響應(yīng)式網(wǎng)站織夢模板源碼IT網(wǎng)絡(luò)工作室織夢網(wǎng)

工業(yè)環(huán)保工程類企業(yè)網(wǎng)站織夢模板(帶手機端)

軟件APP類網(wǎng)站源碼織夢通用型企業(yè)網(wǎng)站源碼html

看到很多網(wǎng)友都為織夢（DEDECMS）的采集教程頭疼，的確，官方出的教程太籠統(tǒng)了，什么都沒說，換個網(wǎng)站你什么都做不了，這個教程是最詳盡的教程，讓你一看即會！
步驟/方法
第一步、我們打開織夢后臺點擊采集——采集節(jié)點管理——增加新節(jié)點
第二步、這里我們以采集普通文章為例，我們選擇普通文章，然后確定
第三步、進入了采集的設(shè)置頁面，填寫節(jié)點名稱，就是給這個新節(jié)點取個名字，這里你可以任意填寫。
第四步、打開你想要采集的文章列表頁。（這里我們以這個網(wǎng)站為例http://www.nanmafan.com/xunyicao/打開這個頁面，右鍵——查看源文件找到目標(biāo)頁面編碼，就在charset后面）
第五步、填寫頁面的基本信息，填完后如圖
第六步、填寫列表網(wǎng)址獲取規(guī)則看看文章列表第一頁的地址。
http://www.nanmafan.com/xunyicao/list_49_1.html
對比第二頁的地址http://www.nanmafan.com/xunyicao/list_49_2.html
我們發(fā)現(xiàn)了他們除了49_后面的數(shù)字不一樣，其他的都一樣，所以我們可以這樣寫
http://www.nanmafan.com/xunyicao/list_49_(*).html
就是把1換成了(*)因為這里只有2頁，所以我們就填從1到2每頁遞增當(dāng)然是1了，2-1...是等于1吧
這里我們就填寫完了
可能大家采集的有些列表沒有規(guī)則，那就只有手工指定列表網(wǎng)址了，如圖
每行寫一個頁面地址
第七步、填寫文章網(wǎng)址匹配規(guī)則了,回到文章列表頁
右鍵查看源文件找到區(qū)域開始的HTML，就是找文章列表開始的標(biāo)志。
我們很容易的找到了如圖中的“新聞列表”。從這里開始，后面就是文章列表里
我們再找文章列表結(jié)束的HTML
就是這個了，一個很容易找到的標(biāo)志
如果鏈接中含有圖片：
不處理采集為縮略圖這里根據(jù)自己的需要選擇
第八步、對區(qū)域網(wǎng)址進行再次篩選：
(使用正則表達式)必須包含：(優(yōu)先級高于后者)
不能包含：打開源文件，我們可以很清楚的看到，文章鏈接都是以.html結(jié)束的所以，我們在必須包含后面填.html如果遇到有些列表很麻煩，還可以填寫后面的不能包含
點擊保存設(shè)置進入下一步，可以看到我們獲得的文章網(wǎng)址
看到這些就是對的了，我們保存信息進入下一步設(shè)置內(nèi)容字段獲取規(guī)則
我們看看文章有沒有分頁，隨便進入一篇文章看看。。我們看到這里的文章沒有分頁
所以這里的我們就默認了
我們現(xiàn)在來找文章標(biāo)題等等隨便進入一篇文章，右鍵查看源文件
看看這些
依照源碼填寫
第九步、填寫文章內(nèi)容的開始，結(jié)束和上面的一樣，找到開始和結(jié)束標(biāo)志.
第十步、你想過濾文章中的什么內(nèi)容就到過濾規(guī)則里寫吧，比如要過濾文章中的圖片，
選擇常用規(guī)則，如圖
再勾選IMG，如圖
然后確定
這樣我們就把正文中的圖片過濾了
第十一步、設(shè)置完畢后點保存設(shè)置并預(yù)覽，如圖
這樣一個采集規(guī)則就寫好了，很簡單吧有些網(wǎng)站很難寫，可要多下點功夫了哦
我們點保存并開始采集——開始采集網(wǎng)頁一會的功夫就采集完了
看看我們采集到的文章
最后、導(dǎo)出數(shù)據(jù)
首先選擇要導(dǎo)入到的欄目，按“請選擇”那里即可在彈出的窗口中選擇你需要導(dǎo)入的欄目發(fā)布選項這里一般默認即可，除非你不想馬上發(fā)布。每批導(dǎo)入默認是30條，這里修改與否都無所謂，附帶選項一般選“排除重復(fù)標(biāo)題”，至于自動生成HTML那個選項建議先別生成，因為我們還要去批量提取摘要和關(guān)鍵字。
文章標(biāo)題
匹配規(guī)則：<title>[內(nèi)容]</title>
過濾規(guī)則：{dede:trimreplace=""}_XXX網(wǎng)站{/dede:trim}