ChatGPT类系统的工作原理是怎样的？

这是一个不断发展的话题，工程师们不断地寻找新的方法使其工作得更好。

训练。训练一个 ChatGPT 模型，共有两个阶段：

预训练：在这个阶段，我们在大量的互联网数据上训练一个 GPT 模型（解码器-仅转换器）。目标是训练一个可以预测给定句子后续单词的模型，使其在语法和语义上与互联网数据相似。在预训练阶段之后，模型可以完成给定的句子，但它不能回答问题。
微调：这个阶段是一个 3 步过程，将预训练模型转换为一个问答 ChatGPT 模型：

1- 收集训练数据（问题和答案），并在此数据上微调预训练模型。模型以问题为输入，并学习生成一个类似于训练数据的答案。 2- 收集更多数据（问题、多个答案），并训练一个奖励模型来对这些答案进行排名，从最相关到最不相关。 3- 使用强化学习（PPO 优化）来微调模型，使模型的答案更加准确。

回答提示

Step 1：用户输入完整的问题，解释分类算法如何工作。

Step 2：问题被发送到内容审核组件。这一组件确保问题不违反安全指南，并过滤不适当的问题。

Step 3-4：如果输入通过内容审核，则被发送到 chatGPT 模型。如果输入未通过内容审核，则直接进入模板响应生成。

Step 5-6：一旦模型生成响应，它被发送到内容审核组件。这确保生成的响应是安全、无害、无偏见等。

Step 7：如果输入通过内容审核，则显示给用户。如果输入未通过内容审核，则进入模板响应生成，并显示模板答案给用户。

请注意，中文版本是由 AI 辅助翻译的，因此可能存在细微错误。

作者

Ai Base Network (ABN), ABN ASIA由具有深厚学术背景的人员创立，他们在美国、荷兰、匈牙利、日本、韩国、新加坡和越南等国家有工作经验。ABN Asia是学术界和技术相遇的地方。凭借我们领先的解决方案和优秀的软件开发服务，我们帮助企业提升水平，走向全球舞台。我们的承诺：更快。更好。更可靠。在大多数情况下：也更便宜。

无论您需要IT服务、数字咨询、现成软件解决方案，还是想向我们发送招标要求（RFPs），都请随时与我们联系。您可以通过[email protected]与我们联系。我们随时准备为您提供所有技术需求的帮助。