主頁 > 網(wǎng)站建設(shè) > 建站知識 > 織夢cms如何防采集

織夢cms如何防采集

POST TIME:2019-09-30 15:00

織夢cms防采集妙招可用以下幾點(diǎn):
1、調(diào)整模板數(shù)據(jù)調(diào)用規(guī)則與新內(nèi)容塊布置
新內(nèi)容塊產(chǎn)生將頁面主題關(guān)鍵詞更分散一些,同時(shí)調(diào)整數(shù)據(jù)調(diào)用規(guī)則,讓仿制站點(diǎn)的數(shù)據(jù)與自身頁面數(shù)據(jù)產(chǎn)生差異性,降低復(fù)制網(wǎng)站SEO問題的負(fù)面影響。
2、找到防止內(nèi)容采集的辦法
DeDeCMS自身有防采集混淆字符串的功能,但這種防采集的辦法對SEO很不利,你總不想讓搜索蜘蛛看到網(wǎng)頁中有不少隱藏文本吧,而且這些文本會影響蜘蛛對信息塊主題的判斷,影響關(guān)鍵詞排名,其實(shí),DeDeCMS沒有根本性的防采集的方法,道高一尺魔高一丈啊,只要你的信息通過頁面的方式發(fā)布出來,總能找到采集的方法;綜合網(wǎng)上收集的信息,我采納了兩種辦法,只能放置最初級的采集:
(1)辦法一:復(fù)制網(wǎng)頁正文內(nèi)容時(shí)自動(dòng)添加版權(quán)信息
JavaScript代碼

<script language="javascript" type="text/javascript">
<!--
document.body.oncopy = function () {
setTimeout( function () {
var text = clipboardData.getData("text");
if (text) {
texttext = text + "
(這里是你的文章版權(quán)信息,去掉括號):"+location.href;
clipboardData.setData("text", text);
}
}, 100 )
}
-->
</script>


將以上代碼放置在文章頁模板中正文結(jié)束后面即可。我測試了下該方法,只針對IE瀏覽器有效,而Firefox、遨游、Google Chrome均無效。
(2)辦法二:使頁面代碼具有唯一性
一般別人采集的時(shí)候都是要獲取內(nèi)容開始的代碼和結(jié)束的代碼,而且要唯一性的,所以填的開始代碼大多是:<divclass="title">。這樣,我們在這個(gè)class后面加上文章的ID值,改成這樣<div class="title"id="{dede:field.id/}">,這里{dede:field.id/}在dedecms中是獲取當(dāng)前文章的ID值,那么生成的每一篇文章的ID值都不一樣,這里的開始代碼也就都不一樣了,這樣別人就采集不到了,采一次只能采一篇。
我們制作模板的時(shí)候在在body標(biāo)記附近的<div class="abc">修改成<divclass="{dede:field.id/}abc">,注意是空格+{dede:field.id/},這樣div的class還是沒有變,但產(chǎn)生了<div class="abc文檔ID">,這段代碼在每篇文章的內(nèi)文頁均是唯一性的,或者在html標(biāo)記里插入id={dede:field.id/},比如:<divid={dede:field.id/}>與<bodyid={dede:field.id/}>,這里{dede:field.id/}在dedecms中是獲取當(dāng)前文章的ID值,這樣別人就采集不到了,采一次只能采一篇。當(dāng)然,別人可以使用過濾規(guī)則來去掉,但是假如我在所有的class里插入文檔ID,或者插入id=文檔ID這樣的。那他就只能采集整個(gè)頁面,然后再過濾,使采集變得更加復(fù)雜。
缺點(diǎn):如果插入{dede:field.id/}不夠多的話別人可以用過濾規(guī)則過濾掉。但是對于一些站群采集軟件來說,這一招足以防止他們采集了!



收縮
  • 微信客服
  • 微信二維碼
  • 電話咨詢

  • 400-1100-266