- 在织梦后台生成XML文件。
- 将生成的文件提交给百度新闻。
第一步:在织梦后台生成百度新闻XML文件
织梦CMS本身带有生成百度新闻Sitemap的功能,非常方便。

确保网站符合百度新闻源规范(非常重要!)
在生成文件之前,请务必确保你的网站已经基本符合百度新闻源的收录要求,否则,生成了文件也没用,主要规范包括:
- 内容原创性必须是原创的,有深度、有价值的新闻资讯。
- 信息时效性:发布的内容应具有新闻时效性。
- 网站主体:网站应有清晰的主体定位,内容垂直度高。
- 文章要素:每篇文章都应有、、来源/作者、发布时间,织梦默认的文章模型都支持这些。
- 页面规范:
- 页应有独立的、规范的URL。
- 避免使用大量弹窗、Flash等影响用户体验的元素。
- 网站结构清晰,导航明确。
- 技术要求:
- 网站能够被百度蜘蛛正常抓取(
robots.txt文件未禁止)。 - 网站服务器稳定,打开速度快。
- 网站能够被百度蜘蛛正常抓取(
生成百度新闻XML文件
完成上述准备后,我们开始生成文件。
-
登录织梦后台:使用你的管理员账号登录网站的后台管理界面。
-
进入“更新主页HTML”:在左侧菜单栏中找到 “生成” -> “更新主页HTML”。
(图片来源网络,侵删) -
找到“更新新闻Sitemap”选项:在打开的页面中,向下滚动,你会看到一个名为 “更新新闻Sitemap” 的区域,这里通常有两个选项:
- 更新Sitemap:用于生成普通的网站地图(sitemap.xml)。
- 更新新闻Sitemap:这是我们需要的,用于生成
sitemap_news.xml。
-
生成文件:直接点击 “更新新闻Sitemap” 按钮,系统会自动扫描你网站中符合条件的文章,并生成一个名为
sitemap_news.xml的文件。 -
确认文件位置:这个文件默认会生成在你的网站根目录下,你可以通过 “文件式管理” -> “主页HTML维护” 来确认,路径通常是:
/sitemap_news.xml。你也可以直接在浏览器中访问
https://你的域名.com/sitemap_news.xml来查看文件内容,它看起来会是这样:
(图片来源网络,侵删)<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://你的域名.com/123/456.html</loc> <news:news> <news:publication> <news:name>你的网站名称</news:name> <news:language>zh-cn</news:language> </news:publication> <news:publication_date>2025-10-27T10:00:00+08:00</news:publication_date> <news:title>这是文章的标题</news:title> </news:news> </url> <!-- 更多文章... --> </urlset>
重要提示:
- 时间格式:织梦生成的时间格式通常是
YYYY-MM-DD HH:MM:SS,百度新闻XML要求的时间格式是YYYY-MM-DDThh:mm:ss+08:00,如果你的织梦版本较旧,生成的文件格式可能不正确,导致百度无法识别。请务必检查生成的XML文件中的时间格式是否符合要求。 如果不正确,需要修改织梦的核心文件或使用第三方工具进行转换。 - 更新频率:每次你发布新的新闻文章后,都需要回到这个页面,再次点击 “更新新闻Sitemap” 按钮,以确保XML文件包含最新的文章链接。
第二步:将XML文件提交给百度新闻
生成了文件只是第一步,关键在于让百度知道它的存在。
通过百度新闻源平台提交(推荐)
这是最直接、最有效的方法。
-
登录百度新闻源平台:访问 百度新闻源平台,使用你的百度账号登录,如果你的网站之前已经申请过新闻源,会直接进入管理后台。
-
进入“新闻源站点信息”:在后台找到 “新闻源站点信息” 或类似的管理入口。
-
找到“Sitemap提交”:在站点信息页面,寻找 “Sitemap提交” 或 “自动推送/手动提交” 相关的选项。
-
提交XML地址:在输入框中,填入你生成的XML文件的完整URL,
https://你的域名.com/sitemap_news.xml -
提交:点击提交按钮。
提交后,百度蜘蛛会在下次抓取时读取这个文件,并将里面的文章链接加入新闻源候选库,这个过程不是实时的,可能需要一些时间。
通过百度搜索资源平台提交
如果你的网站还未加入新闻源,但希望被收录,也可以通过搜索资源平台提交。
-
登录百度搜索资源平台:访问 百度搜索资源平台,并验证你的网站。
-
进入“普通收录”:在左侧菜单选择 “普通收录” -> “Sitemap”。
-
添加Sitemap:在输入框中,同样填入你的
sitemap_news.xml文件的完整URL,然后点击 “添加”。注意:普通收录主要针对的是普通网页,虽然提交
sitemap_news.xml也能让百度蜘蛛发现你的新闻内容,但被百度新闻收录的最佳途径仍然是方法一,即通过新闻源平台提交。
常见问题与注意事项
-
为什么生成了文件,百度还是不收录?
- 内容问题质量不够,不符合新闻标准。
- 时间格式问题:XML文件中的
<publication_date>格式错误,百度无法解析。 - 提交问题:没有在百度新闻源平台正确提交文件地址。
- 网站问题:网站存在大量低质内容、有违规行为,或不符合新闻源的其他规范。
- 等待时间:百度处理需要时间,刚提交不要急于求成。
-
如何检查时间格式是否正确?
- 用浏览器打开你的
sitemap_news.xml文件,查看源代码。 - 找到类似
<news:publication_date>2025-10-27 10:00:00</news:publication_date>的标签。 - 正确的格式应该是:
<news:publication_date>2025-10-27T10:00:00+08:00</news:publication_date>。 - 修改方法:如果格式错误,需要修改织梦的核心文件
/include/arc.newslistview.class.php或/include/arc.archives.class.php中生成时间戳的部分,对于不熟悉代码的用户,建议寻找织梦的二次开发人员或使用支持此功能的模板。
- 用浏览器打开你的
-
除了手动提交,还有其他方法吗?
- API推送(实时推送):对于新闻网站,时效性非常重要,你可以使用百度提供的API推送接口,在文章发布后立即将URL推送给百度,实现秒收,这比等待Sitemap更新要快得多,你可以在织梦发布文章成功后,调用一个PHP脚本来实现API推送。
织梦百度新闻XML使用流程:
- 准备:确保网站内容、结构、技术规范符合百度新闻源要求。
- 生成:后台 -> 生成 -> 更新主页HTML -> 点击 “更新新闻Sitemap”。
- 验证:检查网站根目录下的
sitemap_news.xml文件是否存在,并核对时间格式是否正确。 - 提交:登录 百度新闻源平台,找到Sitemap提交入口,填入
sitemap_news.xml的URL。 - 维护:每次发布新文章后,返回后台重复第2步,更新XML文件。
遵循以上步骤,你就可以正确地使用织梦CMS生成并提交百度新闻XML文件了。
