集简云教学 数据表教学 应用教学 开放平台 用户社区 语聚AI
打开导航
首页 > 应用教学 > 第三方应用 > 如何训练ChatGPT?
如何训练ChatGPT?
ChatGPT模型训练是OpenAI官方推出的自定义API使用方式,支持对官方基础模型进行“微调”训练、使用,以满足用户在特定业务情境下的智能问答应用需要。

 

一、ChatGPT模型训练是什么?

 

ChatGPT模型训练是OpenAI官方推出的自定义API使用方式,支持对官方基础模型进行“微调”训练、使用,以满足用户在特定业务情境下的智能问答应用需要。

 

相较ChatGPT原生模型,训练后的模型有以下几点优势

 

1、  训练后的模型能够“更懂”您的业务;

2、  提供更高质量的回复结果;

3、  延迟更低、响应更快;

4、  更省成本,无需在提问中重复多次示例,减少token用量。

 

集简云平台(jijyun.cn)已支持ChatGPT模型训练,让您无需开发,就可以基于4种官方提供的原始模型davinci, curie, babbage和ada,来完成你的自定义模型训练。

 

● 节省成本,无需API开发、研发投入,即可一键训练;

● 功能强大,训练后的ChatGPT可直接与你的办公系统快速对接;

● 自定义您的使用场景,并实现自动化,让ChatGPT真正融入你的工作中。

 

 

二、如何训练一个自定义模型

 

前置准备:

 

ChatGPT账号

API接口Key:https://platform.openai.com/account/api-keys

 

开始训练前,您需要准备好已注册的ChatGPT账号,并创建获取API接口Key。

 

如果您没有ChatGPT账号,您可以使用集简云OpenAI(ChatGPT)付费版:OpenAI(ChatGPT)付费版如何使用?

 

在集简云使用ChatGPT模型训练,大致分为以下几步:

 

1、收集训练问答,整理训练文件

2、上传训练文件并训练自己的模型

3、使用训练完成的自建模型

 

1、  准备训练文件

 

训练文件是模型训练成功与完成质量好坏的关键,我们通过训练文件的数据列表将信息传递给API接口,进行模型训练。

 

训练文件的每一行都是一个训练示例,由”prompt“和”completion“两列构成。

● 在”prompt“字段中,您需要输入一条”提示文本“。

● 在”completion“字段中,您需要输入对应的”理想回答文本“。

 

例如:假设您想确保您网站上的广告文本提到的是正确的产品和公司,又不希望投入大量的人力审核成本,您可能需要训练出一个分类器,来过滤掉不正确的广告。这时,您就需要准备好一些训练示例,用于教会模型识别和区分广告。

 

你的训练示例可能会是下面这样:

prompt : 阿邦保险公司为您提供全方位保险,满足您所有的保险需求的一站式服务!

completion : 正确

prompt :张师傅五金店,让您几周内就能拥有整齐的牙齿!

completion : 错误

 

示例训练文件下载地址下载示例文件

 

以下是对训练文件的必须要求:

● 训练文件由”prompt“和”completion“两列构成

● 每次训练任务的问答数需要≥100个

● 文件格式为jsonl

 

以下是对训练文件的建议:

● 模型训练的“prompt"提示字段,与使用ChatGPT基础模型的提问不同,训练示例中无需给出详细的说明或在同一个“prompt"中包含多个示例。

● 训练示例越多,训练结果会越好。数据量每翻一倍,模型质量就会线性增加。我们建议尽可能多地准备训练示例。

● 您需要提前准备好jsonl训练文件的url链接,您可以使用集简云内置应用【文本处理】将csv文件转换为jsonl格式的url:如何将CSV文件转换成JSONL格式文档URL链接?

 

 

 

2、训练新的自建模型

 

2.1 登录集简云平台:集简云让连接更简单

 

2.2 创建一个流程

 

● 创建一个新流程:集简云让连接更简单

● 或使用流程模板搭建:https://apps.jijyun.cn/data-pipeline/create-from-template?id=2414

 

2.3 添加执行动作,选择 ”ChatGPT“应用, 选择动作为“上传训练文件”,点击“保存,进入下一步”

 

 

2.4 输入“APIkey”,点击“下一步”完成ChaGPT账户授权。

 

 

2.5 输入训练文件url地址,点击“保存,进入下一步”。

 

 

点击“发送数据”。

 

 

2.6 继续添加步骤,选择“ChatGPT”-“开始训练任务”,选择账户,进入字段匹配。

 

● “训练文件id”填入上传步骤生成的“训练文件id”数据;

● 基础模型可按需选择,这里我们选择ada作为示例。参考文章:如何选择模型

● 填入自定义模型名称后缀,点击“保存,进入下一步”

 

 

2.7 点击“发送数据”,此时模型训练任务就会开始启动。

 

 

 

通常等待几分钟,模型训练就可以完成。

 

但如果队列中有许多任务或者您的数据量很大,可能会需要几个小时的时间。

 

训练任务开始后,退出当前页面不会影响已经开始的任务。

 

2.8 如果您想要查询训练任务进度和状态,可以在 ”ChatGPT“应用的执行动作中,对应选择“查询训练进度”,并按页面提示完成操作。

 

 

 

 

在样本数据底部会显示任务状态,"pending"表示任务正在队列中等待,"processed"表示任务正在进程中,"succeeded"表示训练任务已完成。

 

 

2.9 如果您想暂停训练任务,可以在 ”ChatGPT“应用的执行动作中,对应选择“暂停训练任务”,并按页面提示完成操作。

 

 

 

状态显示“cancelled”,即表示取消成功。

 

 

如需增加更多训练示例,您可以按照上述步骤继续添加一个训练任务。

 

3、使用训练完成的自建模型

 

当训练完成后,您就可以在“ChatGPT”的执行动作“按照自定义设置提问ChatGPT”的字段匹配中,找到刚刚训练好的模型了。如下图所示:

 

 

这时,您就可以将已训练的自建模型,应用到您的流程中,开始服务于业务了。

 

四、如何使用已训练的模型在自己的办公系统中?

 

1、使用步骤

 

使用自定义训练过/或官方训练的ChatGPT,在集简云系统中的操作步骤基本一致,具体如下:

 

(1)登录集简云平台:集简云让连接更简单

 

(2)创建一个流程:

 

创建一个新流程:https://apps.jijyun.cn/data-pipeline/create

或使用流程模板创建 https://www.jijyun.cn/apps/templates?app1=1000853

 

(3)选择触发应用与动作。

 

 

(4)执行应用选择“ChatGPT”,动作选择“按照自定义设置提问ChatGPT”,“模型”字段选择列表中的已训练模型。

 

 

 

(5)完成其他字段配置,保存流程,就设置好了。

 

 

2、使用示例

 

● 微信公众号+ChatGPT+微信公众号:当用户在微信公众号中发送文本消息时,自动使用ChatGPT回答,并将回答回传至微信公众号发送给指定用户。点击使用此模板

● 飞书即时消息+ChatGPT+飞书即时消息:当飞书即时消息机器人接收到消息时,ChatGPT自动回答,并将回答数据传回至飞书即时消息。点击使用此模板

● 邮件触发+ChatGPT+SMTP邮件发送:用户发送邮件咨询问题时,自动使用ChatGPT回复,在自动使用邮件将回复内容发送给指定用户。

● 抖音+ChatGPT+抖音:抖音收到新评论时,ChatGPT自动回答,并经回答内容自动回传至都应发送给指定用户。点击使用此模板

● 定时启动任务+抖音+ChatGPT+百度百家号:定时查询抖音热词通过ChatGPT生成文章,并且百家号自动发布。

● 抖音 + ChatGPT + 抖音:当抖音用户收到私信消息时,我们可以设置自动提问ChatGPT,并自动发送私信消息给用户。点击使用此模板

● 企业微信(代开发) + ChatGPT + 企业微信(代开发):当企业微信(代开发)当接收到客服消息时,ChatGPT自动回答。

 

五、常见问题

 

ChatGPT常见问题与解决方案 | 集简云连接数百款软件无需API接口开发

ChatGPT“提问”(prompt)字段插入规则 | 集简云连接数百款软件无需API接口开发

ChatGPT训练文件id如何获取? | 集简云连接数百款软件无需API接口开发

 

相关应用 查看更多
应用类型:AI人工智能
OpenAI(ChatGPT)

ChatGPT是由OpenAI开发的一种认知语言模型。主要目的是帮助用户自然地与AI进行对话,回答问题并执行各种任务,例如提供信息、解决问题、生成文本等。它可以与各种应用程序集成,以提供高效且可靠的人机对话体验。

本篇目录
  • 一、ChatGPT模型训练是什么?
  • 二、如何训练一个自定义模型
  • 前置准备:
  • 在集简云使用ChatGPT模型训练,大致分为以下几步:
  • 1、  准备训练文件
  • 2、训练新的自建模型
  • 3、使用训练完成的自建模型
  • 四、如何使用已训练的模型在自己的办公系统中?
  • 1、使用步骤
  • 2、使用示例
  • 五、常见问题
  • 相关文章