发布于

你曾经问过自己:ChatGPT 是如何工作的?

作者

Image

大多数人都使用ChatGPT!但你有没有问过自己——它实际上是如何“工作”的?

这里有一个简单的概述,介绍了大型语言模型(LLM)内部的工作原理——不需要博士学位。让我们用简单的方式来解释:⬇️

那么,什么是深度学习模型? 在其核心,它只是数学。深度学习模型接受输入——如文本或图像——并通过神经网络层将其转化为输出。每一层都添加了一些抽象,塑造原始数据成为见解。它就像一个工厂——原始数据输入,智能输出。

输入和输出到底是什么意思? 在底层,它们都是数字。 → 输入:单词、图像、音频——转化为向量。 → 输出:标签、评分、句子——也是数字。 模型学习如何将一个映射到另一个,就像你学习将声音与意义关联起来一样。

但是这种映射是如何发生的? 每个节点接受前一层的输出,将其乘以权重,添加偏差,然后传递下去。在各层中重复这个过程,你就会得到一个复杂的数学运算链——逐步将输入转化为有意义的东西。 它是结构、逻辑和大量计算的结合。

等等,模型如何“理解”一个单词? 这就是嵌入模型的作用。 它们将单词转化为向量——多维的意义表示。 所以“king”和“queen”在向量空间中会相邻。 这就是AI理解上下文,而不仅仅是拼写的方式。

好吧,但是AI模型如何学习? 通过训练。它从随机猜测开始。然后它将自己的输出与正确答案进行比较,看到自己离正确答案有多远,并调整内部权重。 这种反馈循环称为反向传播。 当你重复这个过程数百万次时——模型开始变得非常好。

那么,生成式AI呢? 那就是像ChatGPT这样的工具背后的魔力。 它们不进行分类——它们生成。 一次一个单词(或标记),根据之前的所有内容预测下一个单词应该是什么。它就像自动完成——但拥有远更多的智能、细微差别和训练。 这个图表是新手或需要简单解释AI的专业人士的宝藏💎。

请注意,中文版本是由 AI 辅助翻译的,因此可能存在细微错误。

作者

Ai Base Network (ABN), ABN ASIA由具有深厚学术背景的人员创立,他们在美国、荷兰、匈牙利、日本、韩国、新加坡和越南等国家有工作经验。ABN Asia是学术界和技术相遇的地方。凭借我们领先的解决方案和优秀的软件开发服务,我们帮助企业提升水平,走向全球舞台。我们的承诺:更快。更好。更可靠。在大多数情况下:也更便宜。

无论您需要IT服务、数字咨询、现成软件解决方案,还是想向我们发送招标要求(RFPs),都请随时与我们联系。您可以通过[email protected]与我们联系。我们随时准备为您提供所有技术需求的帮助。

ABNAsia.org

© ABN ASIA