简单采集模块使用

黑马CMS跟大多数CMS一样,所以具体如何使用不多做介绍,只介绍局部。
使用黑马CMS的人群基础不同,但后台对所有人来讲,只要能看懂中文,应该都没问题。
如果有疑问,也请先把后台所有功能先看一遍,亲自尝试。
  • 采集模块

  • 本人从来不采集网站,也不推荐大家使用采集,我推荐大家的网站原创或伪原创,所以黑马CMS中的采集模块也并没有做的很强大,只是做了简单的采集功能。

    项目名称:随意填写
    采集页面编码:查看采集页面源代码可看到,要保持一致
    列表规则:可变化的页数网址用通配符代替
    这个是为了识别到开始和结束区域内的内容页链接,要求HTML具有页面唯一性,这样才能正确识别到。
    网址中包含:因为规则中没有具体指明以什么标记识别网址,所以这个区域内所有的超链接都会被识别到,可能会有我们不需要的网址。比如示例中会识别到作者链接 https://www.hmask.com/member/myhome/init/userid/1.html
    而我们需要的内容页链接为 https://www.hmask.com/show/190.html,所以查看区别后,我们需要网址中包含/id/,这样才是我们要的网址
    网址中不包含:道理一样

    标题规则:包含在h1中,且唯一
    时间规则:在“发布日期:”和“分类”之间。
    内容规则:包含在<div class="黑马_content">和<div class="黑马_operation">中(如果内容里没有其他DIV标签,我们也可以以</div>为结束标签,即使它不唯一。)