自动抓取网站新闻+实时更新快讯

简数采集器能实时监控多个网站的最新资讯,抓取信息后自动使用AI概括生成一句话快讯,并发布到开源CMS网站系统(如Wordpress、Zblog和帝国CMS等)。

简数采集器无需下载安装,在浏览器即开即用,还支持云端24小时自动化运行,无需本地挂机值守,既有效解放用户的时间和精力,又能保障快讯的即时更新!


简数配置自动更新快讯,主要包括以下3步:

    1、创建和启动采集任务:配置每个目标网站的采集规则,并启动定时采集(实现监控更新),自动采集最新资讯;

    2、使用AI接口生成摘要:添加AI接口和AI处理规则,对采集到的数据使用AI接口自动概括为一句话新闻快讯;

    3、自动发布快讯:配置各个采集任务自动发布快讯到指定的CMS网站系统。


比如要制作金融经济领域的新闻快讯,详细操作如下:

1. 创建和启动采集任务

在简数采集器配置每个目标网站的采集规则,并启动定时采集(实时监控更新),使任务自动采集最新资讯内容;

1)创建采集任务

采集任务即网站的数据采集规则,通常一个采集任务对应一个网站。

使用智能向导模式创建采集任务,只需简单三步即可完成:

(1)输入网站网址(要采集的栏目网址),点击下一步。

示例为人民银行新闻栏目:http://www.pbc.gov.cn/goutongjiaoliu/113456/113469/11040/index1.html



(2)系统将智能提取列表页中的多个详情页链接,继续下一步。

如需手动指定链接,可打开【列表提取器】可视化界面上用鼠标点选。



(3)系统将智能提取详情页中关键信息(标题、正文、作者、时间等),下一步完成,启动采集。

如需手动指定采集内容,可打开【详情提取器】可视化界面上点选设置。



以下是银行新闻采集结果,包含文章来源、标题、正文及发布时间等内容。


假设需同时采集人民银行、证监会、财政部等不同网站,则需分别创建对应的采集任务。


2)定时监控更新

创建采集任务后,可配置定时采集策略,支持按每天、每周或自定义间隔(如每N小时/分钟)自动抓取目标网站的更新内容,实现24小时全自动化监控采集。


设置方法:点击【启动采集 | 定时采集】-> 勾选上 “启用定时采集”-> 设置定时方式和时间 ->【开始采集 | 定时采集】。


2. 使用AI接口生成摘要

添加AI接口和AI处理规则,对采集到的更新资讯使用AI接口自动概括生成一句话快讯。

1)开通并填写AI接口

开通所需的AI大模型API服务(如DeepSeek AI),将其API Key填写到简数第三方API接口配置中。


在第三方API接入配置管理,添加对应的AI接口配置,如DeepSeek。


简数采集器支持多款主流AI接口:DeepSeek百度文心一言阿里通义千问Kimi字节豆包讯飞星火智谱混元等,均有免费版或赠送试用。


2)配置AI处理规则

在简数API处理规则,配置基于内容概括生成摘要的AI指令(AI Prompt),支持完全自定义AI指令,灵活满足各类定制化需求。

API处理规则配置步骤:

(1)添加API规则

【第三方API接入】 -> 切换到【API处理规则管理界面】->【添加API处理规则】



(2)自定义API规则

字段名填写内容字段content -> 添加AI处理指令 -> 选择要调用的AI接口。(如前文配置的DeepSeek 接口)


下面为示例图中的AI概括摘要指令,可供参考。
角色:新闻编辑
任务:将新闻资讯总结概括为不超过50字的摘要,用作新闻快讯。
具体要求:
1. 语气风格:正式专业;
2. 客观中立:摘要应完全基于新闻内容,避免添加任何个人观点或情感色彩;
3. 语言精准简洁:语句需通顺连贯,用词精准且尽可能简洁;
以下是新闻资讯内容:


3)配置AI生成摘要自动执行


设置方法:在每个采集任务 【自动化配置】-> 勾选【采集后,自动执行API】-> 选择已配置的API处理规则,保存。


API规则执行成功后,在采集结果会新增AI字段,可查看由AI概括生成的摘要内容。



3. 自动发布快讯

配置各个采集任务(不同网站)的自动发送功能,将快讯发布到指定的CMS网站系统(如Wordpress、Zblog和帝国CMS等)。

1)创建发送目标

【发送目标管理】-> 创建对应CMS系统的发送目标 -> 填写发送插件或接口的信息,映射发送的数据字段。

注意:CMS系统端需安装免登录的发送插件或接口,用于接收数据。(插件可在CMS系统的插件中心或者第三方网站搜索获取)



发送配置映射生成的AI字段。



2)配置自动发送

配置任务自动执行发送,当定时采集和AI概括完成后,简数将快讯自动发送到指定的CMS系统网站。