火爆朋友圈的ChatGPT，你了解它是如何在工作的吗？（单词厨师）

有没有小伙伴已经接触了ChatGPT了呢，都说是变革时代的产物，是不是有些夸大其词，就让我们来了解一下吧。ChatGPT于2022年11月30日发布，它在短短两个月的时间内就达到了1亿月活跃用户。了解Instagram的伙伴们可能会有人知道，国际上爆火的Instagram软件是用了两年半的时间才达到这样的里程碑。这是目前科技软件史上用户注册量增长最快的应用程序。

社交软件用户活跃度排行

了解它的增速可怕性之后我们来说一下号称变革时代的ChatGPT是怎么样工作的。ChatGPT的核心就是LLM，即大型语言模型。ChatGPT当前的LLM是GPT-3.5，当然也可以使用最新的GPT-4模型，OpenAI最近发布其人工智能聊天机器人ChatGPT的最新版本GPT-4,并称它在许多专业测试中达到“人类水平”。但目前还没有太多关于GPT-4的技术细节可供我们讨论。

LLM语言模型

什么是大型语言模型呢？大型语然模型是一种基于神经网络的模型，它在大量文本数据上进行训练，以理解和生成人类语言。该模型使用训练数据来学习，据了解， GPT-4比往期版本“更大”，并通过微软Azure超级计算机接受了更多数据训练。LLM技术学习语言词句之间的统计模式和关系，然后利用这些储备知识来预测后续单词，一次一个单词，这也是我们用ChatGPT的时候，它在回复你的问题时有种“拼凑”的感觉。LLM通常以其大小和包含的参数数量为特征，最大的GPT-3.5模型有1750亿个参数分布在神经网络的96个层中，使其成为有史以来最大的深度学习模型之一。模型的输入和输出由标记组成，标记就是语言单词的一部分，数字也用于标记，因为它们可以更有效地处理复杂的场景。

GPT-3.5在大量互联网数据上进行训练，从另一个角度来看，该模型就是数千亿个单词融汇而成的。模型经过训练，可以在给定一系列输入标记的情况下预测下一个标记。它能够生成结构化的文本，其结构在语法上是通顺的，并且在语义上类似于它所训练的互联网数据。但如果没有适当的指导，该模型也会产生不切实际的输出，更有甚者会反映有害情绪的输出。

即使有如此严重的缺点，该模型也是以非常结构化的方式在优化升级。当然我们可以精心设计的文本提示来引导它执行自然语言任务，这也就是现代化“计时工程”。为了使模型更加安全并能够以聊天机器人的方式来正常对答，该模型被进一步微调成为ChatGPT中使用的版本，也更加符合人类价值观的模型。此过程就是我们熟悉的人类反馈强化训练（RHLF），如国内市场的小爱同学、天猫精灵也是一直在进行这方面的训练，以更加适合我们的日常生活。

RLHF模型

OpenAI解释了他们如何在模型上运行RLHF，但是对于非IT技术人员来说也并不容易理解，我简单举个例子来说明一下。我们将GPT想象成一位技艺高超的厨师，可以准备各种各样的菜肴，用RLHF训练就像锻炼这位厨师的技能，使其做出来的饭菜更加美味。最初，厨师接受了大量食谱和烹饪技术的培训，但是有时厨师不知道要为特定的客户制作哪道菜。为帮助解决这个问题，我们要求厨师根据给定的要求准备多道菜肴，也就是GPT会根据你的问题后台多给出几个选择，然后让客户根据口味和对菜肴进行排名。这有助于厨师了解顾客更偏爱于哪种口味。这个过程会重复多次，GPT会根据最新反馈来改进他们的技能。

配图1

从另一个角度来看，GPT通过收集人们的反馈，然后迭代改进模型的性能，从而达到符合人们正常使用。这也使GPT能够更好的响应特定用户的请求。现在我们已经了解模型是如何学习变得更加智能的，让我们看一下在GPT中如何使用该模型来回答提示吧。

GPT操作图

从概念上讲，他就是像提示输入指令，GPT模型处理并返回输出这样简单。其实它完成整个流程并不轻松，首先，ChatGPT知道聊天对话的上下文，这是通过我们每次输入新提示时向它提供的多个信息，也就是会话提示注入。其次GPT包括初级提示工程，这些是我们提示之前和之后注入的各种指令，以引导模型形成对话语气。第三，将提示传递给审核系统，以警告或阻止某些不安全内容。

这就是我们进入迷人的ChatGPT世界的旅程，创建GPT使用的模型需要海量的算力工程，他背后的技术在不断发展，为新的可能性打开了大门，未来可能会重塑我们的沟通方式，以及嵌入到AI机器人当中，让我们好好享受未知带来惊喜吧！