当前位置: 首页 > 帮助 > 采集内容 >

  • [采集内容]采集内容介绍之内容匹配方式

    2011-06-30 12:53:36 |点击:412|好评:0

    内容匹配方式,是我们采集内容的核心部分。如果这里没有写好,那你整个采集规则就不会采集到任何内容。这项很重要。亚普为你们提供三项不同的方式来采集不同的样式的网站。 第一项:普通匹配 这个匹配方式就是通过,我们采集内容前的 html 代码来实现的,他...

  • [采集内容]采集内容介绍之标签循环模式

    2011-06-30 12:51:43 |点击:170|好评:0

    标签循环模式,是提供给你所采集内容规则相同。使用标签循环模式,可以让你在以后的采集相同内容里可以减少工作量。亚普伪原创采集器提供二个不同的模式给大家。 对于百度搜索内容列表(标题,连接,简介 ... )和论坛内容页(会员名,发布回复时间,帖子内...

  • [采集内容]采集内容介绍之标签最小长度和内容分页

    2011-06-26 19:52:26 |点击:289|好评:0

    标签最小长度:这项是限制你所采集的标签内容长度,一般我们默认的是 0 ,就是列限制。如果我这里填上大于 0 的数,在采集内容里就会采集小于等于你所填入的数。 内容分页:此项,我们可以采集到有分页的内容。通过软件的设置内容分页,就可以启动内容分页。...

  • [采集内容]采集内容介绍之下载配置

    2011-06-24 23:48:15 |点击:265|好评:0

    下载配置,这几项可以让大家把采集网站的图片和 FLASH 都可下载下来,并且可以通过同步 FTP ,可以上传到您的网站目录里。下面我们就看下载配置的一些界面: 内容标签:就是现在这个标签,你所采集的是什么,比如是内容,标题或者关键字等等。这里要注意,如...

  • [采集内容]内容采集中分页的设置

    2011-03-20 21:46:06 |点击:233|好评:0

    一般的数据采集软件可以这么理解,定义头和尾,除了在截取链接不需要检测,在其它地方你定义的头和尾,在同一个html表里不能有相同的,为什么不能有相同的呢?是因为采集的每一步(除了截取链接外)都是根据你所定义的头和尾来截取页面内容的。所以你在定义...

  • [采集内容]如何设置下载图片或者文件的随机保存目录

    2011-03-01 08:45:47 |点击:573|好评:0

    采集器下载图片 或者其它文件时,如果你想随机保存到不同文件夹,可以如下设置 可用设置的变量如下: YYYY 年 MM 月 DD 天 HH 小时 mm 分 ss 秒 [自增ID] 每次加1的变量 [随机文件名] 随机产生5位字符串...

  • 16条记录