- 发布于
ChatGPT类系统的工作原理是怎样的?
- 作者

- 姓名
- AbnAsia.org
- @steven_n_t
这是一个不断发展的话题,工程师们不断地寻找新的方法使其工作得更好。

- 训练。训练一个 ChatGPT 模型,共有两个阶段:
预训练:在这个阶段,我们在大量的互联网数据上训练一个 GPT 模型(解码器-仅转换器)。目标是训练一个可以预测给定句子后续单词的模型,使其在语法和语义上与互联网数据相似。在预训练阶段之后,模型可以完成给定的句子,但它不能回答问题。
微调:这个阶段是一个 3 步过程,将预训练模型转换为一个问答 ChatGPT 模型:
1- 收集训练数据(问题和答案),并在此数据上微调预训练模型。模型以问题为输入,并学习生成一个类似于训练数据的答案。 2- 收集更多数据(问题、多个答案),并训练一个奖励模型来对这些答案进行排名,从最相关到最不相关。 3- 使用强化学习(PPO 优化)来微调模型,使模型的答案更加准确。
- 回答提示
Step 1:用户输入完整的问题,解释分类算法如何工作。
Step 2:问题被发送到内容审核组件。这一组件确保问题不违反安全指南,并过滤不适当的问题。
Step 3-4:如果输入通过内容审核,则被发送到 chatGPT 模型。如果输入未通过内容审核,则直接进入模板响应生成。
Step 5-6:一旦模型生成响应,它被发送到内容审核组件。这确保生成的响应是安全、无害、无偏见等。
Step 7:如果输入通过内容审核,则显示给用户。如果输入未通过内容审核,则进入模板响应生成,并显示模板答案给用户。
请注意,中文版本是由 AI 辅助翻译的,因此可能存在细微错误。
作者
Ai Base Network (ABN), ABN ASIA由具有深厚学术背景的人员创立,他们在美国、荷兰、匈牙利、日本、韩国、新加坡和越南等国家有工作经验。ABN Asia是学术界和技术相遇的地方。凭借我们领先的解决方案和优秀的软件开发服务,我们帮助企业提升水平,走向全球舞台。我们的承诺:更快。更好。更可靠。在大多数情况下:也更便宜。
无论您需要IT服务、数字咨询、现成软件解决方案,还是想向我们发送招标要求(RFPs),都请随时与我们联系。您可以通过[email protected]与我们联系。我们随时准备为您提供所有技术需求的帮助。

© ABN ASIA