火爆朋友圈的ChatGPT,你了解它是如何在工作的吗?

火爆朋友圈的ChatGPT,你了解它是如何在工作的吗?

首页模拟经营单词厨师更新时间:2024-07-29

有没有小伙伴已经接触了ChatGPT了呢,都说是变革时代的产物,是不是有些夸大其词,就让我们来了解一下吧。ChatGPT于2022年11月30日发布,它在短短两个月的时间内就达到了1亿月活跃用户。了解Instagram的伙伴们可能会有人知道,国际上爆火的Instagram软件是用了两年半的时间才达到这样的里程碑。这是目前科技软件史上用户注册量增长最快的应用程序。

社交软件用户活跃度排行

了解它的增速可怕性之后我们来说一下号称变革时代的ChatGPT是怎么样工作的。ChatGPT的核心就是LLM,即大型语言模型。ChatGPT当前的LLM是GPT-3.5,当然也可以使用最新的GPT-4模型,OpenAI最近发布其人工智能聊天机器人ChatGPT的最新版本GPT-4,并称它在许多专业测试中达到“人类水平”。但目前还没有太多关于GPT-4的技术细节可供我们讨论。

LLM语言模型

什么是大型语言模型呢?大型语然模型是一种基于神经网络的模型,它在大量文本数据上进行训练,以理解和生成人类语言。该模型使用训练数据来学习,据了解, GPT-4比往期版本“更大”,并通过微软Azure超级计算机接受了更多数据训练。LLM技术学习语言词句之间的统计模式和关系,然后利用这些储备知识来预测后续单词,一次一个单词,这也是我们用ChatGPT的时候,它在回复你的问题时有种“拼凑”的感觉。LLM通常以其大小和包含的参数数量为特征,最大的GPT-3.5模型有1750亿个参数分布在神经网络的96个层中,使其成为有史以来最大的深度学习模型之一。模型的输入和输出由标记组成,标记就是语言单词的一部分,数字也用于标记,因为它们可以更有效地处理复杂的场景。

GPT-3.5在大量互联网数据上进行训练,从另一个角度来看,该模型就是数千亿个单词融汇而成的。模型经过训练,可以在给定一系列输入标记的情况下预测下一个标记。它能够生成结构化的文本,其结构在语法上是通顺的,并且在语义上类似于它所训练的互联网数据。但如果没有适当的指导,该模型也会产生不切实际的输出,更有甚者会反映有害情绪的输出。

即使有如此严重的缺点,该模型也是以非常结构化的方式在优化升级。当然我们可以精心设计的文本提示来引导它执行自然语言任务,这也就是现代化“计时工程”。为了使模型更加安全并能够以聊天机器人的方式来正常对答,该模型被进一步微调成为ChatGPT中使用的版本,也更加符合人类价值观的模型。此过程就是我们熟悉的人类反馈强化训练(RHLF),如国内市场的小爱同学、天猫精灵也是一直在进行这方面的训练,以更加适合我们的日常生活。

RLHF模型

OpenAI解释了他们如何在模型上运行RLHF,但是对于非IT技术人员来说也并不容易理解,我简单举个例子来说明一下。我们将GPT想象成一位技艺高超的厨师,可以准备各种各样的菜肴,用RLHF训练就像锻炼这位厨师的技能,使其做出来的饭菜更加美味。最初,厨师接受了大量食谱和烹饪技术的培训,但是有时厨师不知道要为特定的客户制作哪道菜。为帮助解决这个问题,我们要求厨师根据给定的要求准备多道菜肴,也就是GPT会根据你的问题后台多给出几个选择,然后让客户根据口味和对菜肴进行排名。这有助于厨师了解顾客更偏爱于哪种口味。这个过程会重复多次,GPT会根据最新反馈来改进他们的技能。

配图1

从另一个角度来看,GPT通过收集人们的反馈,然后迭代改进模型的性能,从而达到符合人们正常使用。这也使GPT能够更好的响应特定用户的请求。现在我们已经了解模型是如何学习变得更加智能的,让我们看一下在GPT中如何使用该模型来回答提示吧。

GPT操作图

从概念上讲,他就是像提示输入指令,GPT模型处理并返回输出这样简单。其实它完成整个流程并不轻松,首先,ChatGPT知道聊天对话的上下文,这是通过我们每次输入新提示时向它提供的多个信息,也就是会话提示注入。其次GPT包括初级提示工程,这些是我们提示之前和之后注入的各种指令,以引导模型形成对话语气。第三,将提示传递给审核系统,以警告或阻止某些不安全内容。

这就是我们进入迷人的ChatGPT世界的旅程,创建GPT使用的模型需要海量的算力工程,他背后的技术在不断发展,为新的可能性打开了大门,未来可能会重塑我们的沟通方式,以及嵌入到AI机器人当中,让我们好好享受未知带来惊喜吧!

查看全文
大家还看了
也许喜欢
更多游戏

Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved