防止网站被采集的几种方式
来源: admin|点击:次|2011-03-24 08:29
做正规站的同学们是不是都相信每个好的站长都有过被采集的惨痛教训,防止采集并不仅仅是保护网站的内容,更是保护站长的劳动成果,保持站长工作的积极性。如何防止自己的网站被采集,我也看过别的站长介绍的经验,很多方法对搜索引擎并不友好,下面简单的介绍一下我个人认为比较实用的方法。 1,屏蔽IP是我用的第一个方法,通过数据分析,筛选出可疑的IP然后屏蔽掉,这样做当然不够保险,如果采集打游击根本没有那么多精力应对。 2,简单的变换模板,采集一般只是采集具体的内容,它就要从代码里面找到内容开始和结束的关键代码,如果自己的网站带有随机模板就好办多了,但是一般站长没有随机的模板,怎么做呢。我建议可以小小的改变一下内容开始或结束处的代码,我觉得改结束部分的代码比较稳妥,因为搜索引擎(百度或者GG)读代码是从前到后读的,这样小的改动并不会让搜索引擎觉得网站改版了。 3,在内容里面随机插入自己网站的名称和网址,但是这种方法虽然增加了采集的复杂度,采集者发现后会马上把这些替换成自己的。 4,在图片上打上自己的水印,这个可行性不错,缺点在于大部分网站都是纯文字性的文章,图片比较不算多。 5,面对一些比较无耻的采集站时,仅仅靠防范和感召是没有用的,可以在自己的内容里面加入网站版权说明,且文字之间随机的插入符号,这个方式虽然比较浪费一些时间,但是效果明显。我就用这个方式成功击退了一个采集站,效果图如下(关键字为:无耻下流的网学网总是抄六维论文网): 6,一些文章站,特别是专业文章站,完全可以不在网站上公布完整的文章,这样就算别人采集过去也基本上没用。