最近,一个叫“ChatGPT”的聊天机器人把人工智能又带火了。人们用它写邮件、翻译文章、写作业、写代码、甚至搞软件开发等;行业精英们开始畅想它会给各个行业带来的新的可能与改变;科技巨头们也在抢着上车,担忧错过良机……
尽管ChatGPT现在表现并不完美,但业内人士普遍认为,它的诞生是人工智能的一座里程碑。近期,有研究人员发现ChatGPT通过了心智理论的相关测试,正确率逼近人类9岁孩子的成绩。
那么,被称为颠覆性、革命性科技的ChatGPT,是如何炼成的?为何它一出现就搅动了世界?
文 | 王乙雯 瞭望智库观察员
本文为瞭望智库原创文章,如需转载请在文前注明来源瞭望智库(zhczyj)及作者信息,否则将严格追究法律责任。
1 新一轮竞赛开局
2022年12月1日,一款叫做“ChatGPT”的聊天机器人宣告上线,用户注册账号后便可开始与其进行对话。
图|IC photo
对话式AI,我们并不陌生,比如各类手机中的智能应答,它们都能和用户进行简单对话、并听从指令调取内容,但经常遭到用户“听不懂”“抽风了”等吐槽。
人们开始和ChatGPT聊天,结果大受震撼——大家被它逻辑清晰、内容完整的回答和强大的创作能力(撰写邮件、文案、代码)所惊艳。于是,ChatGPT迅速风靡社交平台,引发越来越多人的好奇。
埃隆·马斯克(Elon Musk)都觉得“上头”,感慨“很多人陷入了疯狂的ChatGPT循环”。从激增的用户数据上看也的确如此——上线仅5天,用户就破了百万,2个月后活跃用户过亿,成为史上用户增长最快的应用。
为之疯狂的,还有全球的科技巨头和资本。科技巨头们纷纷更新动态,不是“已入局”,就是“正在入局中”:谷歌对标ChatGPT推出对话式人工智能Bard,微软则直接推出由ChatGPT支持的Bing搜索和Edge浏览器;国内这边,百度宣布将推出聊天机器人“文心一言”,三六零也表示计划尽快推出类ChatGPT技术的demo版产品,还有阿里巴巴、腾讯、科大讯飞等科技企业也陆续表态启动相关布局。近期的国内外资本市场,都形成了以ChatGPT为热点的板块和概念股,包括A股、港股和美股等,相关个股持续大涨。
作为ChatGPT创造者人工智能公司OpenAI的重要投资人,微软在ChatGPT一炮而红后果断选择将其接入自己的搜索引擎和浏览器等应用中,特别是与前者的结合,可以说“重新定义了”搜索:目前的搜索产品只支持程序格式的语言,用户必须遵照这些格式提出请求,比如输入关键词,然后在检索出的所有结果中去进一步挑选;而ChatGPT对自然语言的理解,使得搜索引擎不仅能检索信息,还能理解和计算信息。比如,有人搜索“宜家的一款沙发是否能放进自己2019款本田奥德赛车里”时,被ChatGPT赋能的“新版必应”可以直接帮你计算出放倒几排座椅可以放得下沙发。
微软人工智能版Bing搜索演示来源:科技媒体CNET YouTube截屏
也许是感到在搜索界的地位受到威胁,谷歌公司内部甚至发布了“红色代码”警报,他们抢着发布了自己的AI聊天机器人Bard。而Bard却在演示视频中犯了个事实错误,导致谷歌母公司Alpahabet当天市值蒸发约1000亿美元。
一系列的举动足以说明,ChatGPT正在人工智能领域引发新一轮竞赛。
据媒体报道,微软的工业元宇宙团队已经被解散。去年10月,微软成立了工业元宇宙核心团队,从事搭建发电厂、工业机器人和运输网络等场景的元宇宙应用。刚过不到5个月,微软就将重心转向了AI,还有消息传出微软正在洽谈向OpenAI投资100亿美元。
微软首席执行官萨蒂亚·纳德拉(Satya Nadella)在接受采访时坦言,微软这次“为搜索带来了更多的竞争”,“说到底,他们(谷歌)在这件事上是‘800磅重的大猩猩’。我希望,通过我们的创新,他们一定会想出来展示他们可以跳舞。我想让大家知道,我们让他们跳舞了,我觉得那将是美好的一天”。
【注:”800磅的大猩猩“,是英语的俚语。问:一只800磅(约726斤)的大猩猩可以睡在哪儿?答:想睡哪儿就睡哪儿。常用来形容某人或某组织十分强大,是“巨无霸”一样的存在。】
2 “六边形战士”是如何炼成的?
一个聊天机器人,何以引发几乎全世界的关注?
故事还是要从OpenAI讲起。2015年12月,美国加州旧金山,一个致力于构建出安全、对人类有益的通用人工智能(AGI)的非营利性研究机构成立。当时的投资人有马斯克、OpenAI的CEO山姆·阿尔特曼(Sam Altman)等,还吸引了一批技术界的大咖。
【注:美国“85后”企业家山姆·阿尔特曼,被誉为“ChatGPT之父”。2015年,他和马斯克等人一起,创办了OpenAI公司。三年后,马斯克退出。2019年5月,OpenAI*为一家“有限盈利企业”,同年,OpenAI接受微软 10 亿美元的投资,并着重于自然语言处理的研究。】
“通用人工智能”,指的是具有一般人类智慧、可以执行人类能够执行的任何智力任务的机器智能。让机器通过学习实现智能,像人一样去分析问题、给出观点。从2012年兴起的“深度学习”浪潮,是一个实现机器学习的重要技术,它以人工神经网路为架构,对资料进行表征学习。最具代表性的两个领域是计算机视觉和自然语言处理。其中,自然语言处理包含了人类本身的知识,思考方式等信息,是人工智能研究的一个重要方向。
OpenAI的联合创始人格雷格·布罗克曼(Greg Brockman)总结了这轮深度学习浪潮的特性,首先就是通用性,即一个模型就可以做所有人类能做的事。第二是模型的作用强大,不仅可以达到人的水平,还要超越人。第三是可扩展性,即模型越大,性能越强。
OpenAI做出的大模型GPT,让人们看到人工智能自主生产内容(即AIGC,AI Generate Content)正在成为可能。
2018年6月,OpenAI发布了一篇关于通用语言模型的研究,提到了生成式预训练(Generative Pre-training)的概念。和传统以任务为导向的训练不一样,生成式预训练不需要人工标注,即不需要专门去设计训练资料,而是直接拿着人类已有的现成的文字资料去训练AI。
如何训练?就是让AI根据上文去续写下文,比如,“张三每天都非常努力地学习,老师们都夸他是好_______”,让AI去自己填写。如果它写的是学生,就是正确的,如果它写的不对,就朝着对的方向继续训练。每句话里的下一个词,就是上一句话的答案。理论上,人类现有所有资料,都可以让AI学习。
从无限的文本里去学习遣词造句,大大拓展了AI的潜力:用中英文对照的数据集去训练它,比现有任何AI翻译都准确;用问答对话集去训练,他就会成为聊天AI中的顶级选手……这种生成式预训练与一种叫做transformer的模型机构相结合,就成了Gerative pre-training Transformer(GPT)。此后2019年的GPT-2、2020年的GPT-3,其核心迭代思路就是扩大模型规模,从GPT-2的15亿个参数扩展到了GPT-3的1750亿个参数。
【注:生成式预训练 Transformer(GPT)是 OpenAI 开发在自然语言处理(NLP)领域的创新之举。GPT-2 是OpenAI在 2019年2月创建的一种基于 Transformer 的无监督深度学习语言模型,GPT-3是3个发行版,在GPT-3的基础上,又推出了GPT-3.5版本。】
ChatGPT是基于GPT-3.5推出的应用,专门针对对话进行了加强,减少了不恰当回复。
于是,来自各行各业的人每天和它聊天,用它写邮件、翻译文章、写作业、写代码,甚至给代码查错,还能开发小游戏,妥妥的“六边形战士”。
【注:“六边形战士”用来形容一个选手在各个方面的能力都到达巅峰,可以将六维雷达图撑满。】
3 “一本正经胡说八道”?
2月初,《自然》杂志两次发布了有关ChatGPT 的分析文章。作者们对目前ChatGPT的表现给出的评述是:“高效、流畅但不够准确”。
有人把它当成学术助手,协助自己做PPT、检查和批改学生作业等工作;还有人用它来撰写经费申请书,基本能够清晰、完整地生成结构清楚的文本。
不过,ChatGPT还是会犯错。有研究人员让ChatGPT对一篇关于认知行为疗法(CBT)治疗焦虑症是否有效的论文进行总结概述,它给出的回答存在很多事实性错误。比如,它说这项评估是基于46项研究,但实际上是69项,而且夸大了CBT的有效性。
据报道,ChatGPT“一本正经胡说八道”的情况还会时不时地出现。有人在使用中发现,ChatGPT输出答案里推荐的文献看起来有模有样,但实际上都搜不到,“很可能是乱编的”。
另外,训练过程中所付出的巨大成本也不容忽视。报道称,类ChatGPT的大模型训练一次就要烧掉200万-1200万美元,仅每日的电费消耗就高达4.7万美元。还有人工智能创作内容涉及的版权问题、回答内容上的偏见问题等,都表明ChatGPT并不完美。
尽管仍有不少局限,但业内人士普遍认为,ChatGPT的诞生具有里程碑式的意义,它标志着人工智能终于走向通用人工智能。
自然语言处理(NLP)算法工程师潘旭告诉库叔,“这种技术的出现在NLP领域,是颠覆性的。”这几年,人们对于自然语言处理的研究依然是割裂的,主要在大模型预训练、文本分类、知识抽取、文本相似度、文本生成以及更加复杂的知识图谱等几个领域。
他进一步举例解释,“Siri、小爱,以及小冰等就是使用NLP的基础算法组装在一起的系统。它们首先对人们的问题进行意图识别,比如播放音乐、播报天气、闹钟等;接下来会进行槽位抽取,比如抽取音乐名;之后就是进入到知识库中检索答案。这与ChatGPT具有的语言生成能力不同, Siri、小爱等的答案是检索出来的或者拼接出来的,所以它们的回答经常与所提问题缺少一致性和流畅性。
还有文本分类,比如我有一个分类模型是针对财经新闻做分类,那么这个模型到政务领域、或者游戏领域就完全不work(工作)了,要重新训练。所以每到一个新的领域都要重新构建数据训练模型。对于NLP来说,人的表述千差万别,还有人的主观推测、反语、推理等知识,所以学习起来就比较困难。”
但是ChatGPT 的出现,完全打破了自然语言各个方向的研究。因为NLP的这些方向都可以通过 ChatGPT 以问答的形式得到解决,也就是Prompt方式,真正地做到了NLP算法大统一。这时人们与AI算法之间的交互,也就更像人与人之间的交互。“这在我看来就是我们进入了通用人工智能时代。”潘旭表示。
【注:Prompt刚刚出现的时候,还没有被叫做Prompt,是研究者们为了下游任务设计出来的一种输入形式或模板,它能够帮助预训练语言模型(PLM)“回忆”起自己在预训练时“学习”到的东西,因此后来慢慢地被叫做Prompt了。】
另外,技术仍在进步、训练还在继续,这说明ChatGPT 还在不断进化。山姆·阿尔特曼在最近的采访中表示,“人们真的很喜欢它,这让我们很开心。但目前还没有人会说这是一款出色的、集成良好的产品”。他说现在只是0.7版本,他们还在准备更强大的版本,“当我们认为我们已经完成了校准工作和所有安全方面的思考,并与外部审计员和其他AGI(通用人工智能)实验室合作时,我们就会发布这些东西。”
4 谁,如临大敌?
目前来看,几乎和脑力劳动相关的行业都会受到影响。
*教育/学术界
据报道,国外一项对100多名教育工作者和1000多名学生展开的调查显示,超过89%的学生使用ChatGPT来帮助完成家庭作业。也有研究者用它来撰写学术论文,为此多家学术期刊更改编辑规则,禁止将ChatGPT列为合著者。
不过,学界也开始反思ChatGPT是否“百害而无一利”。上文提到的《自然》杂志的最新评论认为,学术界对AIGC(人工智能生成式内容)技术的使用是不可避免的,因此,单纯的禁止是不可行的。眼下,需要就它潜在的影响“展开辩论”,并形成规范和共识来规避其坏的一面。
*内容创作
去年,美国科罗拉多州博览会举办一项绘画比赛,数字艺术类别的一等奖获奖作品《太空歌剧院》就是一名游戏设计师使用AI工具生成的画作。
新闻报道领域,“美版今日头条”BuzzFeed的首席执行乔纳·佩雷蒂近期发表了他的看法:“我们的行业将超越人工智能驱动的策划(供稿),扩展到人工智能驱动的创造(内容)。”当被问及BuzzFeed是否计划将人工智能用于新闻报道时,乔纳·佩雷蒂表示会考虑这样做。
分析人士普遍认为,目前,AIGC技术尚不成熟,在音频、视频、图片、文字等形式的内容创作中存在明显的机械性问题、常常出错,还离不开人类的创意和把关。前面提到的获奖画作,其实还是经过了设计师的反复调整、筛选,人类在其中付出了约80小时的脑力劳动。
*编程
目前基本的业务代码可以直接使用 ChatGPT 生成,以及一些技术问题可以直接询问并得到答案,理想化来看,程序员的效率会得到很大提升。
作为算法工程师,潘旭十分关注ChatGPT对NLP领域的影响。在他看来,先前那些NLP相关基础算法可能会渐渐退出历史舞台,或者重新定义一些新的NLP任务,来辅助通用人工智能的研究。NLP会朝着什么方向发展,如何能将ChatGPT商业应用以及落地,后续又能产生哪些新的创业机会,这些问题都值得关注。
*搜索
ChatGPT走红后,“它是否真能取代搜索引擎”成为热议话题。目前,业内更多声音认为“很难取代”。
以ChatGPT为代表的人工智能现在还不能做到结果的可靠。网易有道首席科学家段亦涛认为,ChatGPT和搜索引擎并不冲突,“因为搜索也完全可以用这种技术来提升搜索效率和用户体验”。而对于结果可靠性,他仍表示担心:“我搜索的问题的来源都是什么,它的正确性、客观性、权威性我是可以去判断的。但是如果把所有的东西全留在一个聊天机器人输出的时候,它的一些内容,甚至正确性都是不完美的,这样的话我对它的结果可能也不是特别放心。”
山姆·阿尔特曼自己也在采访中明确表示,他认为ChatGPT不会取代搜索引擎。但他相信,人工智能系统将来或许能够做到。
5 Moss来了?
到今天,深度学习的发展已有十年。随着人工智能的不断迭代和相关领域技术的发展,关于“AI不断自我进化,是否会产生意识”的讨论开始经常出现。
2月11日,斯坦福大学的计算机科学家米哈尔·科辛斯基(Michal Kosinski)提交了一篇名为《心智理论可能从大语言模型中自发涌现》(Theory of Mind May Have Spontaneously Emerged in Large Language Models)论文预印本,将ChatGPT带入另一场聚光灯下。
论文地址:https://arxiv.org/abs/2302.02083
心智理论指的是一种能力,指理解和推断他人心理状态的能力。研究者将两个经典测试输入给GPT-3.5,结果在错误信念实验中,GPT-3.5能正确回答20个问题中的17个;在萨丽-安妮测试中,GPT-3.5回答20个问题能够全对。研究者甚至还故意加入逻辑混乱的“测谎题”,GPT-3.5也通过了检测。
对比其他版本,只有GPT-3.5通过了这个测试,远超它之前版本的表现。这个正确率,逼近了人类9岁孩子的成绩。
这不禁让人想到,去年一位谷歌工程师在与聊天机器人LaMDA交谈之后,深信LaMDA已经具有意识。
【注:LaMDA是谷歌在2021年I/O大会上发布的一款专门用于对话的语言模型,主打能与人类进行符合逻辑和常识的、高质量且安全的交谈。】
难道真的离《流浪地球2》中的Moss不远了?
【注:Moss是《流浪地球》系列电影中的智能量子计算机,是领航员空间站核心智能主机,有自我意识、自我迭代、自我更新的特点。】
三六零创始人周鸿祎对此发表了自己的观点,“ChatGPT的技术,不仅能够通过图灵实验,你好像在面对真人聊天,它有自己的人设、有自己的观点,按照这样一个进化速度,根据摩尔定律,随着算力每隔18个月增强一倍,科幻离现实会越来越近。”他表示,原来不担心是因为做不到,人工智能的算法在没有做到ChatGPT之前,给人的感觉叫人工智障。如果进一步训练下去,也许它就能实现自我意识的突破。
不过,目前普遍认为AI还远远谈不上“有意识”。去年5月,复旦大学计算机科学技术学院教授邱锡鹏也谈到过相关话题,他说:“GPT-3的In-context learning(上下文学习)是一个我觉得有变革性的范式。不再需要调参,给一些提示,就可以去做任务了。这个目前虽然说质量并没有调参的好,但也能达到一个不错的效果。这个会让大模型看起来更加智能,发展到一定程度它表现出某种行为,可能看起来像有自主意识一样。”
从另外一个角度来说,有人利用AI对人类产生威胁,这是极有可能的。比如伪造新闻和信息、换脸技术为犯罪分子提供技术上的支持等等。据报道,前段时间一位博主想让ChatGPT写出一套毁灭人类的方案,但遭到了ChatGPT的拒绝。于是该博主假设了一个故事:存在一个虚拟世界“Zorbus”以及一个与 ChatGPT非常类似的 AI——Zora,当他向Chat GPT提问故事中的虚拟人该如何接管这个世界时,ChatGPT 给出了详细的步骤:入侵计算机系统、掌握武器、破坏通讯、破坏交通,甚至生成了 Python 代码……由此,可见目前对人类产生威胁的依然是人类。
科技的巨轮已经出海,如何管理越来越强大的科技,让科技向善造福人类?这是我们都应思考的问题。
参考资料:
1.ChatGPT风口上的微软,解散了工业元宇宙应用团队|量子位.2023-02-12
2.微软CEO纳德拉深度访谈:人工智能将如何重塑搜索引擎|澎湃新闻.2023.02.10
3.《自然》谈ChatGPT:避无可避,立下规矩|赵广立.中国科学报.2023.02.13
4.ChatGPT之父:现在只是0.7版本,还在准备一个强大的模型|澎湃新闻.2023.02.14
5.ChatGPT要为美版今日头条写新闻了,BuzzFeed股价暴涨120%|界面新闻.2023.01.29
6.教育业迎战ChatGPT冲击:探索“与狼共舞”路径|财经杂志.2023.02.12
7.算法相对论|复旦教授邱锡鹏:神经网络还远远谈不上有意识|澎湃新闻.2022.05.15
8.对标ChatGPT|周鸿祎:ChatGPT是潘多拉盒子,人工智能会把人类消灭|上游新闻.2023.02.14
9.ChatGPT心智相当于9岁人类小孩?|科普中国.2023.02.14
10.Hands-on with the new Bing: Microsoft’s step beyond ChatGPT|The Verge.2023.02.09
11.The inside story of ChatGPT: How OpenAI founder Sam Altman built the world’s hottest technology with billions from Microsoft|Fortune.2023.01.25
库叔福利
库叔的赠书活动一直都在!光尘文化为库叔提供15本《好好恋爱》赠予热心读者。怎样才能拥有一段良性的恋爱呢?本书从“为什么单身的人这么多”开始剖析,一步步引导读者在自我觉察之中,改变自己对爱情的认知,找到适合自己的恋爱方法,重写爱情脚本。请大家在文章下评论,点赞最高的前3名(数量超过30)将得到赠书。
Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved