教你在互联网上采集原创内容
来源: admin|点击:次|2011-03-09 08:47
原创,外链,内链被称为SEO的三大法宝,缺一不可。因为人的思维方式和知识的广度都是有限的,针对同一知识点进行反复的写作,原创性必然越来越差。所以三大法宝中,原创又被认为是最难的一个方面,而且成为越来越多的企业SEOer们关注的热点。利用采集进行伪原创是很多站长采用的方法,显然被采集的内容质量,是否被百度收录,直接关系着你的伪原创内容的质量。本文笔者总结了如何在互联网上直接进行采集原创的内容。
百度中原创的概念就是没有被百度索引或收录的文字。百度不收录内容的原因无非有二。第一,内容实在太垃圾,不值得收录;第二,百度不去的地方。垃圾当然不是我们要采集的,所以如何寻找百度不去的地方是我们采集原创的出发点。
1、淘宝网的论坛
很多站长都知道百度对淘宝的论坛是不收录的,所以这是一个原创内容的重要来源。但是淘宝的门槛太低,谁都能去,谁都能进行采集,所以对于那些低权重的网站这招是越来越不灵了。
2、海外的华人论坛
这也是百度常常不去的地方,尤其是繁体字的论坛。但是由于互联网的限制,国内站长并不容易进入到这些论坛,很多时候要通过优秀的国外代理服务器进行翻墙。当然也正是因为门槛提高了,所以这些论坛的原创性较淘宝论坛更强大了。
3、学术期刊的中文数据库
一般中文学术期刊的数据库是百度进不去的。常用的著名的数据库有CNKI, 万方等数据库。如何进入这些数据库,方法很多,这里就不讨论了。当然并不是数据库的每篇内容都是百度没有收录的,通常你应该选择核心期刊的内容。如果你有下载硕士博士论文的权限,那么这些论文的原创性更是独一无二。从学术期刊数据库中下载下来的内容基本都是PDF格式,利用粘贴复制PDF的文字复制到word上,然后通过替换将PDF的段落取消,形成正常内容的排版。
4、QQ的聊天记录
原创来自与人民大众,企业网站的客服QQ,企业的产品群中的聊天记录都是很好的原创内容。
以上我们仅仅简单的介绍了四种采集原创内容的思路,当然原创其实要求我们站长在做站的时候要更好的融入网站的主题中去,去了解主题,思考主题,感受主题,只有这样我们才有原创的源泉。我们的网站也才能真正做到SEO的最高境界:用户体验第一。