令人陷入“疯狂的循环”，偶尔“一本正经胡说八道”，ChatGPT还在不断进化……（进化的人类歌唱）

最近，一个叫“ChatGPT”的聊天机器人把人工智能又带火了。人们用它写邮件、翻译文章、写作业、写代码、甚至搞软件开发等；行业精英们开始畅想它会给各个行业带来的新的可能与改变；科技巨头们也在抢着上车，担忧错过良机……

尽管ChatGPT现在表现并不完美，但业内人士普遍认为，它的诞生是人工智能的一座里程碑。近期，有研究人员发现ChatGPT通过了心智理论的相关测试，正确率逼近人类9岁孩子的成绩。

那么，被称为颠覆性、革命性科技的ChatGPT，是如何炼成的？为何它一出现就搅动了世界？

文 | 王乙雯瞭望智库观察员

本文为瞭望智库原创文章，如需转载请在文前注明来源瞭望智库（zhczyj）及作者信息，否则将严格追究法律责任。

1 新一轮竞赛开局

2022年12月1日，一款叫做“ChatGPT”的聊天机器人宣告上线，用户注册账号后便可开始与其进行对话。

图｜IC photo

对话式AI，我们并不陌生，比如各类手机中的智能应答，它们都能和用户进行简单对话、并听从指令调取内容，但经常遭到用户“听不懂”“抽风了”等吐槽。

人们开始和ChatGPT聊天，结果大受震撼——大家被它逻辑清晰、内容完整的回答和强大的创作能力（撰写邮件、文案、代码）所惊艳。于是，ChatGPT迅速风靡社交平台，引发越来越多人的好奇。

埃隆·马斯克（Elon Musk）都觉得“上头”，感慨“很多人陷入了疯狂的ChatGPT循环”。从激增的用户数据上看也的确如此——上线仅5天，用户就破了百万，2个月后活跃用户过亿，成为史上用户增长最快的应用。

为之疯狂的，还有全球的科技巨头和资本。科技巨头们纷纷更新动态，不是“已入局”，就是“正在入局中”：谷歌对标ChatGPT推出对话式人工智能Bard，微软则直接推出由ChatGPT支持的Bing搜索和Edge浏览器；国内这边，百度宣布将推出聊天机器人“文心一言”，三六零也表示计划尽快推出类ChatGPT技术的demo版产品，还有阿里巴巴、腾讯、科大讯飞等科技企业也陆续表态启动相关布局。近期的国内外资本市场，都形成了以ChatGPT为热点的板块和概念股，包括A股、港股和美股等，相关个股持续大涨。

作为ChatGPT创造者人工智能公司OpenAI的重要投资人，微软在ChatGPT一炮而红后果断选择将其接入自己的搜索引擎和浏览器等应用中，特别是与前者的结合，可以说“重新定义了”搜索：目前的搜索产品只支持程序格式的语言，用户必须遵照这些格式提出请求，比如输入关键词，然后在检索出的所有结果中去进一步挑选；而ChatGPT对自然语言的理解，使得搜索引擎不仅能检索信息，还能理解和计算信息。比如，有人搜索“宜家的一款沙发是否能放进自己2019款本田奥德赛车里”时，被ChatGPT赋能的“新版必应”可以直接帮你计算出放倒几排座椅可以放得下沙发。

微软人工智能版Bing搜索演示来源：科技媒体CNET YouTube截屏

也许是感到在搜索界的地位受到威胁，谷歌公司内部甚至发布了“红色代码”警报，他们抢着发布了自己的AI聊天机器人Bard。而Bard却在演示视频中犯了个事实错误，导致谷歌母公司Alpahabet当天市值蒸发约1000亿美元。

一系列的举动足以说明，ChatGPT正在人工智能领域引发新一轮竞赛。

据媒体报道，微软的工业元宇宙团队已经被解散。去年10月，微软成立了工业元宇宙核心团队，从事搭建发电厂、工业机器人和运输网络等场景的元宇宙应用。刚过不到5个月，微软就将重心转向了AI，还有消息传出微软正在洽谈向OpenAI投资100亿美元。

微软首席执行官萨蒂亚·纳德拉（Satya Nadella）在接受采访时坦言，微软这次“为搜索带来了更多的竞争”，“说到底，他们（谷歌）在这件事上是‘800磅重的大猩猩’。我希望，通过我们的创新，他们一定会想出来展示他们可以跳舞。我想让大家知道，我们让他们跳舞了，我觉得那将是美好的一天”。

【注：”800磅的大猩猩“，是英语的俚语。问：一只800磅（约726斤）的大猩猩可以睡在哪儿？答：想睡哪儿就睡哪儿。常用来形容某人或某组织十分强大，是“巨无霸”一样的存在。】

2 “六边形战士”是如何炼成的？

一个聊天机器人，何以引发几乎全世界的关注？

故事还是要从OpenAI讲起。2015年12月，美国加州旧金山，一个致力于构建出安全、对人类有益的通用人工智能（AGI）的非营利性研究机构成立。当时的投资人有马斯克、OpenAI的CEO山姆·阿尔特曼（Sam Altman）等，还吸引了一批技术界的大咖。

【注：美国“85后”企业家山姆·阿尔特曼，被誉为“ChatGPT之父”。2015年，他和马斯克等人一起，创办了OpenAI公司。三年后，马斯克退出。2019年5月，OpenAI*为一家“有限盈利企业”，同年，OpenAI接受微软 10 亿美元的投资，并着重于自然语言处理的研究。】

“通用人工智能”，指的是具有一般人类智慧、可以执行人类能够执行的任何智力任务的机器智能。让机器通过学习实现智能，像人一样去分析问题、给出观点。从2012年兴起的“深度学习”浪潮，是一个实现机器学习的重要技术，它以人工神经网路为架构，对资料进行表征学习。最具代表性的两个领域是计算机视觉和自然语言处理。其中，自然语言处理包含了人类本身的知识，思考方式等信息，是人工智能研究的一个重要方向。

OpenAI的联合创始人格雷格·布罗克曼(Greg Brockman)总结了这轮深度学习浪潮的特性，首先就是通用性，即一个模型就可以做所有人类能做的事。第二是模型的作用强大，不仅可以达到人的水平，还要超越人。第三是可扩展性，即模型越大，性能越强。

OpenAI做出的大模型GPT，让人们看到人工智能自主生产内容（即AIGC，AI Generate Content）正在成为可能。

2018年6月，OpenAI发布了一篇关于通用语言模型的研究，提到了生成式预训练（Generative Pre-training）的概念。和传统以任务为导向的训练不一样，生成式预训练不需要人工标注，即不需要专门去设计训练资料，而是直接拿着人类已有的现成的文字资料去训练AI。

如何训练？就是让AI根据上文去续写下文，比如，“张三每天都非常努力地学习，老师们都夸他是好_______”，让AI去自己填写。如果它写的是学生，就是正确的，如果它写的不对，就朝着对的方向继续训练。每句话里的下一个词，就是上一句话的答案。理论上，人类现有所有资料，都可以让AI学习。

从无限的文本里去学习遣词造句，大大拓展了AI的潜力：用中英文对照的数据集去训练它，比现有任何AI翻译都准确；用问答对话集去训练，他就会成为聊天AI中的顶级选手……这种生成式预训练与一种叫做transformer的模型机构相结合，就成了Gerative pre-training Transformer(GPT）。此后2019年的GPT-2、2020年的GPT-3，其核心迭代思路就是扩大模型规模，从GPT-2的15亿个参数扩展到了GPT-3的1750亿个参数。

【注：生成式预训练 Transformer（GPT）是 OpenAI 开发在自然语言处理（NLP）领域的创新之举。GPT-2 是OpenAI在 2019年2月创建的一种基于 Transformer 的无监督深度学习语言模型，GPT-3是3个发行版，在GPT-3的基础上，又推出了GPT-3.5版本。】

ChatGPT是基于GPT-3.5推出的应用，专门针对对话进行了加强，减少了不恰当回复。

于是，来自各行各业的人每天和它聊天，用它写邮件、翻译文章、写作业、写代码，甚至给代码查错，还能开发小游戏，妥妥的“六边形战士”。

【注：“六边形战士”用来形容一个选手在各个方面的能力都到达巅峰，可以将六维雷达图撑满。】

3 “一本正经胡说八道”？

2月初，《自然》杂志两次发布了有关ChatGPT 的分析文章。作者们对目前ChatGPT的表现给出的评述是：“高效、流畅但不够准确”。

有人把它当成学术助手，协助自己做PPT、检查和批改学生作业等工作；还有人用它来撰写经费申请书，基本能够清晰、完整地生成结构清楚的文本。

不过，ChatGPT还是会犯错。有研究人员让ChatGPT对一篇关于认知行为疗法（CBT）治疗焦虑症是否有效的论文进行总结概述，它给出的回答存在很多事实性错误。比如，它说这项评估是基于46项研究，但实际上是69项，而且夸大了CBT的有效性。

据报道，ChatGPT“一本正经胡说八道”的情况还会时不时地出现。有人在使用中发现，ChatGPT输出答案里推荐的文献看起来有模有样，但实际上都搜不到，“很可能是乱编的”。

另外，训练过程中所付出的巨大成本也不容忽视。报道称，类ChatGPT的大模型训练一次就要烧掉200万-1200万美元，仅每日的电费消耗就高达4.7万美元。还有人工智能创作内容涉及的版权问题、回答内容上的偏见问题等，都表明ChatGPT并不完美。

尽管仍有不少局限，但业内人士普遍认为，ChatGPT的诞生具有里程碑式的意义，它标志着人工智能终于走向通用人工智能。

自然语言处理（NLP）算法工程师潘旭告诉库叔，“这种技术的出现在NLP领域，是颠覆性的。”这几年，人们对于自然语言处理的研究依然是割裂的，主要在大模型预训练、文本分类、知识抽取、文本相似度、文本生成以及更加复杂的知识图谱等几个领域。

他进一步举例解释，“Siri、小爱，以及小冰等就是使用NLP的基础算法组装在一起的系统。它们首先对人们的问题进行意图识别，比如播放音乐、播报天气、闹钟等；接下来会进行槽位抽取，比如抽取音乐名；之后就是进入到知识库中检索答案。这与ChatGPT具有的语言生成能力不同， Siri、小爱等的答案是检索出来的或者拼接出来的，所以它们的回答经常与所提问题缺少一致性和流畅性。

还有文本分类，比如我有一个分类模型是针对财经新闻做分类，那么这个模型到政务领域、或者游戏领域就完全不work（工作）了，要重新训练。所以每到一个新的领域都要重新构建数据训练模型。对于NLP来说，人的表述千差万别，还有人的主观推测、反语、推理等知识，所以学习起来就比较困难。”

但是ChatGPT 的出现，完全打破了自然语言各个方向的研究。因为NLP的这些方向都可以通过 ChatGPT 以问答的形式得到解决，也就是Prompt方式，真正地做到了NLP算法大统一。这时人们与AI算法之间的交互，也就更像人与人之间的交互。“这在我看来就是我们进入了通用人工智能时代。”潘旭表示。

【注：Prompt刚刚出现的时候，还没有被叫做Prompt，是研究者们为了下游任务设计出来的一种输入形式或模板，它能够帮助预训练语言模型（PLM）“回忆”起自己在预训练时“学习”到的东西，因此后来慢慢地被叫做Prompt了。】

另外，技术仍在进步、训练还在继续，这说明ChatGPT 还在不断进化。山姆·阿尔特曼在最近的采访中表示，“人们真的很喜欢它，这让我们很开心。但目前还没有人会说这是一款出色的、集成良好的产品”。他说现在只是0.7版本，他们还在准备更强大的版本，“当我们认为我们已经完成了校准工作和所有安全方面的思考，并与外部审计员和其他AGI（通用人工智能）实验室合作时，我们就会发布这些东西。”

4 谁，如临大敌？

目前来看，几乎和脑力劳动相关的行业都会受到影响。

*教育/学术界

据报道，国外一项对100多名教育工作者和1000多名学生展开的调查显示，超过89%的学生使用ChatGPT来帮助完成家庭作业。也有研究者用它来撰写学术论文，为此多家学术期刊更改编辑规则，禁止将ChatGPT列为合著者。

不过，学界也开始反思ChatGPT是否“百害而无一利”。上文提到的《自然》杂志的最新评论认为，学术界对AIGC（人工智能生成式内容）技术的使用是不可避免的，因此，单纯的禁止是不可行的。眼下，需要就它潜在的影响“展开辩论”，并形成规范和共识来规避其坏的一面。

*内容创作

去年，美国科罗拉多州博览会举办一项绘画比赛，数字艺术类别的一等奖获奖作品《太空歌剧院》就是一名游戏设计师使用AI工具生成的画作。

新闻报道领域，“美版今日头条”BuzzFeed的首席执行乔纳·佩雷蒂近期发表了他的看法：“我们的行业将超越人工智能驱动的策划（供稿），扩展到人工智能驱动的创造（内容）。”当被问及BuzzFeed是否计划将人工智能用于新闻报道时，乔纳·佩雷蒂表示会考虑这样做。

分析人士普遍认为，目前，AIGC技术尚不成熟，在音频、视频、图片、文字等形式的内容创作中存在明显的机械性问题、常常出错，还离不开人类的创意和把关。前面提到的获奖画作，其实还是经过了设计师的反复调整、筛选，人类在其中付出了约80小时的脑力劳动。

*编程

目前基本的业务代码可以直接使用 ChatGPT 生成，以及一些技术问题可以直接询问并得到答案，理想化来看，程序员的效率会得到很大提升。

作为算法工程师，潘旭十分关注ChatGPT对NLP领域的影响。在他看来，先前那些NLP相关基础算法可能会渐渐退出历史舞台，或者重新定义一些新的NLP任务，来辅助通用人工智能的研究。NLP会朝着什么方向发展，如何能将ChatGPT商业应用以及落地，后续又能产生哪些新的创业机会，这些问题都值得关注。

*搜索

ChatGPT走红后，“它是否真能取代搜索引擎”成为热议话题。目前，业内更多声音认为“很难取代”。

以ChatGPT为代表的人工智能现在还不能做到结果的可靠。网易有道首席科学家段亦涛认为，ChatGPT和搜索引擎并不冲突，“因为搜索也完全可以用这种技术来提升搜索效率和用户体验”。而对于结果可靠性，他仍表示担心：“我搜索的问题的来源都是什么，它的正确性、客观性、权威性我是可以去判断的。但是如果把所有的东西全留在一个聊天机器人输出的时候，它的一些内容，甚至正确性都是不完美的，这样的话我对它的结果可能也不是特别放心。”

山姆·阿尔特曼自己也在采访中明确表示，他认为ChatGPT不会取代搜索引擎。但他相信，人工智能系统将来或许能够做到。

5 Moss来了？

到今天，深度学习的发展已有十年。随着人工智能的不断迭代和相关领域技术的发展，关于“AI不断自我进化，是否会产生意识”的讨论开始经常出现。

2月11日，斯坦福大学的计算机科学家米哈尔·科辛斯基（Michal Kosinski）提交了一篇名为《心智理论可能从大语言模型中自发涌现》（Theory of Mind May Have Spontaneously Emerged in Large Language Models）论文预印本，将ChatGPT带入另一场聚光灯下。

论文地址：https://arxiv.org/abs/2302.02083

心智理论指的是一种能力，指理解和推断他人心理状态的能力。研究者将两个经典测试输入给GPT-3.5，结果在错误信念实验中，GPT-3.5能正确回答20个问题中的17个；在萨丽-安妮测试中，GPT-3.5回答20个问题能够全对。研究者甚至还故意加入逻辑混乱的“测谎题”，GPT-3.5也通过了检测。

对比其他版本，只有GPT-3.5通过了这个测试，远超它之前版本的表现。这个正确率，逼近了人类9岁孩子的成绩。

这不禁让人想到，去年一位谷歌工程师在与聊天机器人LaMDA交谈之后，深信LaMDA已经具有意识。

【注：LaMDA是谷歌在2021年I/O大会上发布的一款专门用于对话的语言模型，主打能与人类进行符合逻辑和常识的、高质量且安全的交谈。】

难道真的离《流浪地球2》中的Moss不远了？

【注：Moss是《流浪地球》系列电影中的智能量子计算机，是领航员空间站核心智能主机，有自我意识、自我迭代、自我更新的特点。】

三六零创始人周鸿祎对此发表了自己的观点，“ChatGPT的技术，不仅能够通过图灵实验，你好像在面对真人聊天，它有自己的人设、有自己的观点，按照这样一个进化速度，根据摩尔定律，随着算力每隔18个月增强一倍，科幻离现实会越来越近。”他表示，原来不担心是因为做不到，人工智能的算法在没有做到ChatGPT之前，给人的感觉叫人工智障。如果进一步训练下去，也许它就能实现自我意识的突破。

不过，目前普遍认为AI还远远谈不上“有意识”。去年5月，复旦大学计算机科学技术学院教授邱锡鹏也谈到过相关话题，他说：“GPT-3的In-context learning（上下文学习）是一个我觉得有变革性的范式。不再需要调参，给一些提示，就可以去做任务了。这个目前虽然说质量并没有调参的好，但也能达到一个不错的效果。这个会让大模型看起来更加智能，发展到一定程度它表现出某种行为，可能看起来像有自主意识一样。”

从另外一个角度来说，有人利用AI对人类产生威胁，这是极有可能的。比如伪造新闻和信息、换脸技术为犯罪分子提供技术上的支持等等。据报道，前段时间一位博主想让ChatGPT写出一套毁灭人类的方案，但遭到了ChatGPT的拒绝。于是该博主假设了一个故事：存在一个虚拟世界“Zorbus”以及一个与 ChatGPT非常类似的 AI——Zora，当他向Chat GPT提问故事中的虚拟人该如何接管这个世界时，ChatGPT 给出了详细的步骤：入侵计算机系统、掌握武器、破坏通讯、破坏交通，甚至生成了 Python 代码……由此，可见目前对人类产生威胁的依然是人类。

科技的巨轮已经出海，如何管理越来越强大的科技，让科技向善造福人类？这是我们都应思考的问题。

参考资料：

1.ChatGPT风口上的微软，解散了工业元宇宙应用团队|量子位.2023-02-12

2.微软CEO纳德拉深度访谈：人工智能将如何重塑搜索引擎|澎湃新闻.2023.02.10

3.《自然》谈ChatGPT：避无可避，立下规矩|赵广立.中国科学报.2023.02.13

4.ChatGPT之父：现在只是0.7版本，还在准备一个强大的模型|澎湃新闻.2023.02.14

5.ChatGPT要为美版今日头条写新闻了，BuzzFeed股价暴涨120%|界面新闻.2023.01.29

6.教育业迎战ChatGPT冲击：探索“与狼共舞”路径|财经杂志.2023.02.12

7.算法相对论｜复旦教授邱锡鹏：神经网络还远远谈不上有意识|澎湃新闻.2022.05.15

8.对标ChatGPT｜周鸿祎：ChatGPT是潘多拉盒子，人工智能会把人类消灭|上游新闻.2023.02.14

9.ChatGPT心智相当于9岁人类小孩？|科普中国.2023.02.14

10.Hands-on with the new Bing: Microsoft’s step beyond ChatGPT|The Verge.2023.02.09

11.The inside story of ChatGPT: How OpenAI founder Sam Altman built the world’s hottest technology with billions from Microsoft|Fortune.2023.01.25

库叔福利

库叔的赠书活动一直都在！光尘文化为库叔提供15本《好好恋爱》赠予热心读者。怎样才能拥有一段良性的恋爱呢？本书从“为什么单身的人这么多”开始剖析，一步步引导读者在自我觉察之中，改变自己对爱情的认知，找到适合自己的恋爱方法，重写爱情脚本。请大家在文章下评论，点赞最高的前3名（数量超过30）将得到赠书。