1 场景描述
集简云浏览器插件新增的“云端执行”功能,可以将我们的浏览器插件流程发布到集简云的服务器端自动运行,我们再也不用在电脑前等待流程运行了。
我们以“定时云端执行浏览器插件,自动抓取百度知道上的问题,ChatGPT回答后自动录入到维格表中“流程为例进行演示。
适用场景:
● 进行市场调研或竞争分析,了解消费者或行业的问题热点和需求
● 进行专业领域的知识收集和整理,了解该领域的问题和解决方法
● 进行产品设计和开发时,需要考虑用户可能遇到的问题,以便改进产品
● 进行SEO优化时,需要收集相关问题,以便优化网站内容,提升搜索排名
2 最终实现效果
通过集简云,即可将下面整个流程轻松实现自动化运转:
1. 在指定时间点,定时云端执行浏览器插件。
2. 浏览器插件自动打开百度知道网站,抓取需要回答的问题。
3. 自动发送问题给ChatGPT进行回答。
4. ChatGPT返回答案后,自动录入到维格表中相应的单元格中。
这样,我们第二天只需打开维格表就可以看到数据,无需人工再一一手动收集、汇总、紧盯流程运行,减少人工操作的时间和错误,提高数据处理效率。
3 操作步骤
整体共需要3个步骤可以实现
步骤1:Chrome端下载并配置集简云浏览器插件
步骤2:集简云端搭建流程1:Webhook-ChatGPT-维格表
步骤3:集简云端搭建流程2:定时启动-循环执行-浏览器插件
步骤1:配置集简云浏览器插件
- 打开Chrome浏览器,右上角打开浏览器插件按钮,点击集简云,登录账号,选择企业。(如何下载安装浏览器插件,请点击查看:https://www.jijyun.cn/help/detail/284)
2. 点击“流程后台”
点击"新建工作流"
设置好工作流的名称和描述,点击添加
点击刚创建的第一条工作流
开始配置机器人:将右面的组件拖拽到核心区域:配置成【触发器-新建标签页-获取文本-HTTP请求】,然后将每个组件的2个点进行连接
如图
接下来我们一一配置这4个组件
● 触发器:无需配置
● 新建标签页:双击编辑,需要配置【新建标签页URL】1项信息
配置【新建标签页URL】:复制目标页的URL,比如百度知道的标签页URLhttps://zhidao.baidu.com/browse,粘贴到浏览器插件中
● 获取文本:双击编辑,需要配置【CSS选择器】和【分配变量】2项信息
配置【CSS选择器】:在目标页面(百度知道)打开集简云浏览器插件,点击”元素选择器“
打开右上角的小眼睛,选择CSS Selector,将鼠标移动到目标元素(我们想抓取数据的部分),点击,目标元素就会变成红色框,出现相应的链接,我们复制,粘贴到浏览器插件CSS选择器下面
配置【分配给变量】:勾选后,可自定义填写内容(目前不设置填写规则,数字、文本均可),目的是为了与HTTP请求的Body项信息进行对应,比如我们这里先填写”百度知道问答“,那么后面的Body中的变量就需要填写“百度知道回答”
● HTTP请求:双击编辑,需要配置【请求方法】和【Body】2项信息
配置【请求方法】:打开集简云端选择触发动作Webhook,在配置Webhook里面,复制链接,粘贴到插件中
配置【Body】:点击黑色框
将下面这个object粘贴进去
{
"key":"{{variables.xxx}}"
}
注:variables为定量,不可更改;key和xxx为变量,可自定义;
key可以替换为任意您规定需要的字段名称,例如"name";"corp_token",xxx部分与我们刚才在获取文本的“分配给变量”输入的文本保持一致,即“百度知道问答
本文以corp_token作为字段名称key的替换值进行演示
完成后,点击保存,点击运行流程
即会自动跳转页面,抓取数据
然后我们在集简云端的数据流程中进行样本数据的获取
步骤2:集简云端搭建流程【Webhook-ChatGPT-维格表】
点击获取样本数据
即可获取到一条样本数据
选择执行应用-执行动作:OpenAI(ChatGPT)内置-提问ChatGPT
设置字段匹配
我们即可得到ChatGPT回答的一条样本数据
3. 选择执行应用-选择执行动作:维格表添加数据
字段匹配:选择相应的表单,插入问题和答案的变量,注意这里的答案需要插入content的纯文本格式
点击发送数据后,完成并保存流程。
这时,我们在维格表就会收到一条记录
步骤3:集简云端搭建流程【定时启动-循环执行-浏览器机器人】
1. 选择触发动作-触发应用:定时启动任务,当每天指定时间启动时
字段设置:根据个人需求进行设置即可,比如我们想每天晚上12点云端执行机器人,设置如下
点击发送样本数据,即可得到一条样本数据
2. 选择执行应用-执行动作,循环执行,通过数字拆分并执行流程
字段匹配,根据个人所需进行填写,我们这里设置100次
发送数据,即可得到一个样本数据
3. 选择执行应用-执行动作,浏览器插件-云端执行浏览器机器人流程
选择相应的机器人流程
点击发送数据,显示发送成功
这样我们两个流程就已经搭建成功了
通常来说,集简云的数据流程是以一个指定应用的触发动作来触发,比如当微信公众号有新用户关注,或者CRM系统里有新增销售线索等。但是,有时我们需要流程在指定时间执行,而不是由某个应用触发,例如:每天晚上12点查询广告推广数据,每小时查询一次实时要闻等,这些在指定时间执行,而非某个应用触发的场景,可以通过集简云的内置应用:”定时启动”来实现。
循环执行可以将步骤中的多条数据逐条推送到后续步骤中进行处理,一般常用于对查询搜索动作中获取的多个记录进行处理。
Chrome浏览器插件是集简云的一个内置应用,主要用于触发动作启动流程;可以快速获取当前页面的URL并支持在编辑流程时设置自定义字段;如,当用户在论坛进行相关资料查阅找到目标页面时可以通过该插件快速将当前页面的URL 标题等数据记录到自己的笔记产品比如notion中去。
维格表将过去复杂的IT数据库技术,做得像表格一样简单 ,可以将复杂的可视化数据库、电子表格、实时网络协同、低代码开发技术四合为一,1个维格表,满足团队协作、项目管理、数据协作等1000+场景,让所有工作连接和整合。
集简云提供的ChatGPT应用(限时免费),无需注册ChatGPT账户即可使用。