dede 采集 关键字

99ANYc3cd6
预计阅读时长 10 分钟
位置: 首页 DEDE建站 正文

手动添加(最直接,但效率低)

这是最基础的方法,适用于少量文章或者对关键字有非常精准要求的场景。

dede 采集 关键字
(图片来源网络,侵删)

操作步骤:

  1. 采集文章并保存到DedeCMS的“待审核”或“已审核”栏目中。
  2. 管理” -> “所有文档管理”,找到你刚刚采集的文章。
  3. 点击文章标题进入编辑页面。
  4. 在编辑页面中,找到 “关键字” 输入框。
  5. 手动输入与文章内容相关的关键字,多个关键字之间用英文逗号 隔开。
  6. 点击“保存”即可。

优点:

  • 精准可控,完全由人工判断,质量最高。
  • 可以随时修改和调整。

缺点:

  • 效率极低,不适合批量采集。
  • 容易遗漏,对于大量文章不现实。

自动提取(最常用,推荐使用)

这是最主流、最高效的方法,DedeCMS内置了强大的“自动提取关键字”功能,可以从文章内容中智能地提取出最相关的词语作为关键字。

dede 采集 关键字
(图片来源网络,侵删)

操作步骤:

  1. 开启自动提取功能:

    • 进入“系统” -> “系统基本参数” -> “核心设置”。
    • 找到 “文档关键字替换次数” 这个选项,这个选项是控制自动提取的关键字数量的,数值越大,提取的关键字越多,通常设置为 5-10 比较合适。
    • 找到 “自动提取关键字” 这个选项,确保它被 “是”
    • 保存设置。
  2. 在采集规则中设置关键字字段:

    • 在你创建的DedeCMS采集规则中,你需要设置一个字段来保存关键字。
    • 在“自定义采集字段”部分,添加一个新字段。
    • 字段名称可以填写 keyword(小写)或者你自定义的名称。
    • 在“字段处理”中,选择 “自动提取”
    • 这样,在采集过程中,DedeCMS会自动从你指定的内容源字段(比如文章正文)中提取关键字,并填充到这个字段里。

优点:

dede 采集 关键字
(图片来源网络,侵删)
  • 自动化程度高,无需人工干预,效率极高。
  • 提取的关键字基于文章内容,相关性好
  • 适合批量采集。

缺点:

  • 提取的关键字可能不够精准,有时会提取出一些无意义的词。
  • 无法进行人工干预和微调。

利用正则表达式进行精确匹配(最灵活,需要技术基础)

当自动提取的效果不理想,或者你需要从固定的、有规律的位置(例如文章末尾的标签)提取关键字时,可以使用正则表达式。

适用场景:

  • 你要采集的网站,文章末尾都有一个固定的标签格式,<span class="tags">标签:科技,互联网,AI</span>
  • 你想从文章标题中提取核心词作为关键字。

操作步骤:

  1. 在采集规则中,添加一个自定义字段,keyword
  2. 在“字段处理”中,选择 “使用正则表达式”
  3. 在下方的输入框中,编写你的正则表达式。

示例: 假设你想从上面的HTML标签中提取“科技,互联网,AI”:

  • 你的正则表达式可以是:<span class="tags">标签:(.+?)</span>
  • 解释:
    • <span class="tags">:匹配固定的开头。
    • 这是一个捕获组,它会匹配并捕获 和 </span> 之间的所有内容( 表示非贪婪匹配,匹配到第一个 </span> 就停止)。
    • </span>:匹配固定的结尾。

优点:

  • 精确度极高,可以完全按照你的意图来提取。
  • 灵活性最强,可以应对各种复杂的源码结构。

缺点:

  • 需要掌握正则表达式,对新手有一定门槛。
  • 如果目标网站的HTML结构发生变化,采集规则就会失效,需要重新修改正则。

利用DedeCMS的“自动分词”功能(高级用法)

DedeCMS有一个“自动分词”功能,它不仅能提取关键字,还能为文章自动生成摘要,这个功能通常和“自动提取关键字”配合使用,效果更好。

操作步骤:

  1. 开启自动分词:

    • 进入“系统” -> “系统基本参数” -> “核心设置”。
    • 找到 “启用 arctitle 自动摘要”,设置为“是”。
    • 找到 “自动摘要长度”,设置一个合适的数值(200)。
    • 找到 “自动提取关键字”,设置为“是”。
  2. 在采集规则中设置:

    • 在采集规则中,除了设置关键字字段为“自动提取”外,还可以设置一个摘要字段。
    • 添加一个自定义字段,description
    • 在“字段处理”中,选择 “自动摘要”
    • 这样,系统会自动从文章内容中提取关键字和摘要。

优点:

  • 一键完成关键字和摘要的提取,功能更全面。
  • 生成的摘要质量通常不错,可以直接使用。

缺点:

  • 和自动提取关键字类似,可能存在不够精准的问题。

总结与最佳实践

方法 优点 缺点 适用场景
手动添加 精准可控 效率低,易遗漏 少量、高质量要求文章
自动提取 高效,相关性好 可能不够精准 绝大多数批量采集场景,首选
正则表达式 高度灵活,精确 需要技术,维护成本高 源码有固定规律,需要精确匹配
自动分词 功能全面,一键搞定 可能不够精准 需要同时自动生成摘要和关键字

推荐的工作流程:

  1. 首选方案: 在“系统设置”中开启 “自动提取关键字”,并在采集规则中将关键字字段设置为“自动提取”,这是效率和质量平衡的最佳选择。
  2. 优化方案: 对于特别重要的栏目或文章,可以在采集完成后,通过“所有文档管理”进行批量筛选,然后人工检查并修正关键字。
  3. 特殊方案: 如果目标网站的结构非常规,且自动提取效果不佳,再考虑使用 正则表达式 进行精确匹配。
  4. 懒人方案: 同时开启 “自动分词” 功能,让系统帮你同时搞定关键字和摘要,虽然质量可能不是顶尖,但胜在省事。

通过合理组合使用这些方法,你可以高效地为采集到的内容添加高质量的关键字,从而有效提升网站的SEO效果。

-- 展开阅读全文 --
头像
织梦头条修改修改密码
« 上一篇 今天
浙大城市学院C语言上机,怎么高效备考拿高分?
下一篇 » 今天

相关文章

取消
微信二维码
支付宝二维码

目录[+]