织梦如何实现文章自动更新?

99ANYc3cd6
预计阅读时长 12 分钟
位置: 首页 织梦建站 正文
  1. 定时发布:提前写好文章,设置一个未来的时间点,让系统在指定时间自动将文章发布到网站上。
  2. 内容采集与发布:从其他网站(如新闻源、博客)自动抓取内容,并整理后发布到自己的网站上。

这两种方法都可以实现“自动更新”的效果,下面我将为你详细介绍这两种方法的实现步骤。

织梦怎么自动更新文章
(图片来源网络,侵删)

定时发布(官方自带功能,最简单安全)

这是织梦CMS内置的核心功能之一,非常适合那些有规律内容发布的场景,比如每天早上8点自动发布一篇新闻。

操作步骤:

  1. 登录后台:使用管理员账号登录您的织梦CMS后台。
  2. 撰写文章:进入“[核心]” -> “[内容发布管理]” -> “[添加文档]”。
  3. 填写文章信息
    • 输入您的文章标题。
    • 栏目:选择您要将文章发布到的栏目。
    • 作者:填写作者名。
    • 来源:填写文章来源。
    • 摘要:填写文章摘要。
    • 在编辑器中输入或粘贴您的文章正文。
  4. 设置发布时间(关键步骤)
    • 在文章编辑页面的下方,找到 “发布时间” 这个选项。
    • 默认显示的是当前时间。请修改为您希望文章自动发布的未来时间点
    • 您可以直接点击输入框修改,也可以通过日历和时间选择器来精确设置,设置为明天的上午9:00。
  5. 提交文档
    • 完成所有内容填写后,点击页面底部的 “提交”“保持” 按钮。
    • 文章并不会立即出现在网站上,而是被保存在数据库中,状态为“待发布”。

工作原理:

织梦CMS有一个“计划任务”机制,系统会按照一定的时间间隔(通常是几分钟)检查一遍数据库中所有待发布的文章,一旦发现某篇文章的“发布时间”已经到达或早于当前时间,系统就会自动将其状态更改为“已发布”,并将其显示在对应的栏目列表中。

织梦怎么自动更新文章
(图片来源网络,侵删)

优点:

  • 官方功能:稳定、安全,无需安装任何插件。
  • 操作简单:只需在发布时修改一个时间参数即可。
  • 可靠性高:只要网站服务器正常运行,就能准确执行。

注意事项:

  • 请确保您的服务器时间与北京时间一致,否则定时可能会有偏差。
  • 如果您的网站流量极低,计划任务检查的间隔可能会稍长,发布时间可能会有几分钟的延迟,这在正常范围内。

内容采集与发布(功能强大,适合批量更新)

这种方法需要使用织梦强大的采集功能,您需要先设置好采集规则,然后系统就可以根据规则自动去其他网站抓取内容并发布到您的网站上。

操作步骤:

织梦怎么自动更新文章
(图片来源网络,侵删)
  1. 准备阶段:分析目标网站

    • 找到您想要采集内容的网站(新闻源、博客等)。
    • 确定您要采集哪个或哪些栏目下的文章。
    • 分析目标网站的列表页和内容页URL的规律。
    • 页的HTML结构,确定标题、内容、发布时间、作者等信息在HTML代码中的位置(通过浏览器开发者工具查看)。
  2. 创建远程的“网站栏目”

    • 在后台进入“[采集]” -> “[采集管理]” -> “[网站栏目管理]”。
    • 点击“增加网站”,填写目标网站的基本信息,如“网站名称”、“网站首页地址”等。
    • 保存后,再为这个网站增加“栏目”,这里的“栏目”对应的是目标网站上您要采集内容的具体分类页面,填写“栏目名称”、“栏目列表网址”(即目标网站的分类页URL)。
    • 保存后,系统会尝试自动获取这个栏目的分页规则。
  3. 设置采集规则

    • 进入“[采集]” -> “[采集管理]” -> “[采集节点管理]”。
    • 点击“增加节点”,选择您刚才创建的网站和对应的栏目。
    • 填写列表规则
      • 起始网址:通常是目标栏目的第一页URL。
      • 列表链接:设置如何从列表页中提取出每篇文章的链接,通常需要使用“选择范围”和“链接包含”等功能来精确定位。
      • 分页:如果列表有多页,需要设置分页规则,让织梦知道如何跳转到下一页继续采集。
    • 规则:这是最关键的一步,告诉织梦如何从文章页面中提取内容。
      • 使用“选择范围”功能,在浏览器中预览目标文章页,用鼠标点击或框选标题,织梦会自动填充对应的XPath或正则表达式。
      • 同样方法,选择文章正文区域(建议只选择正文,避免采集到广告、导航等无用信息)。
      • 发布时间:选择文章的发布时间。
      • 作者:选择文章作者。
      • 图片:可以设置是否下载文章中的图片到本地服务器,并替换链接。
      • 下载远程附件:设置是否下载文章中的附件(如PDF、doc等)。
    • 保存节点
  4. 测试采集规则

    • 在节点列表中找到您刚创建的节点,点击“测试采集”。
    • 系统会根据您设置的规则,尝试抓取一篇文章并显示预览。
    • 仔细检查预览效果、内容等都抓取正确,如果不正确,返回上一步修改“内容规则”,直到测试完全正确为止。
  5. 执行采集任务

    • 规则测试无误后,回到节点列表,点击“开始采集”。
    • 系统会自动遍历您设置的列表页,找到所有文章链接,然后逐个打开并根据内容规则抓取信息。
    • 采集到的内容会暂时保存在一个“待审核”的列表中。
  6. 审核并发布

    • 采集完成后,进入“[采集]” -> “[采集管理]” -> “[采集记录]”。
    • 在“待审核”列表中,您可以查看所有采集到的文章。
    • 务必仔细检查每一篇文章质量、版权问题等。
    • 检查无误后,可以勾选多篇文章,点击“审核通过”。
    • 审核通过后,文章就会被正式发布到您在织梦后台设置的对应栏目中。

如何实现“自动”采集?

织梦的采集功能本身是手动触发的,但可以结合计划任务来实现自动化。

  1. 在后台“[采集]” -> “[采集管理]” -> “[采集节点管理]”中,为您的节点设置一个执行周期(每天执行一次)。
  2. 进入“[系统]” -> “[计划任务管理]”。
  3. 点击“增加任务”,创建一个新的计划任务。
    • 任务名称:每日自动采集新闻”。
    • 执行文件:选择 /dede/doall.php
    • 运行时间:设置为您希望每天执行采集的时间,02:00”(凌晨2点)。
    • 循环周期:选择“每天”。
    • 任务类型:选择“执行任意任务”,并在下面的参数中填写您要执行的采集节点的ID(可以在采集节点管理页面看到每个节点的ID)。
  4. 保存任务并启用它。

织梦系统会在每天凌晨2点自动调用 /dede/doall.php 文件,并传入您设置的采集节点ID,从而实现全自动的内容采集和发布。


总结与建议

特性 定时发布 内容采集
核心用途 发布自己原创或整理的内容,实现定时展示。 从其他网站抓取内容,快速填充网站。
操作难度 非常简单,后台直接操作。 较复杂,需要分析网站结构和设置规则。
自动化程度 设置一次,永久有效(只要服务器在)。 需要配置规则,可通过计划任务实现全自动。
适用场景 博客、新闻站每日新闻、定时活动发布等。 资讯站、行业门户、论坛帖子抓取等。

给您的建议:

  • 如果您只是想定时发布自己写好的文章,请直接使用方法一,这是最直接、最安全的方式。
  • 如果您想从其他网站获取内容来丰富您的网站,请使用方法二,虽然前期配置麻烦一些,但一旦规则设置好,配合计划任务就能实现“一劳永逸”的自动更新。

重要提醒: 无论使用哪种方法,都请遵守相关法律法规和版权规定,特别是使用采集功能时,务必尊重原创作者的知识产权,通常建议只用于个人学习研究或获得授权后使用,并在转载时注明来源和作者。

-- 展开阅读全文 --
头像
dede如何获取当前栏目id?
« 上一篇 今天
C语言struct指针如何高效使用与内存管理?
下一篇 » 今天

相关文章

取消
微信二维码
支付宝二维码

目录[+]