本人所撰写的文章仅在今日头条首发创作,拒绝任何人任何形式搬运到其它平台发布,原创不易,抄袭、洗稿必将深究。
鱼羊 萧箫 发自 凹非寺量子位 | 公众号 QbitAI
今天,我们将探讨腾讯最新发布的通用大模型——混元。这个号称具备千亿参数的大模型号角正式亮相,不仅在中文创作方面表现出色,还展现了强大的逻辑推理和任务执行能力。
有趣的是,在正式发布之前,不少人已经在腾讯的相关APP中体验过混元大模型的功能。
早在谷歌云发布AI相关的会议总结产品之前,腾讯会议就已经上线了基于智能录制的智能纪要、智能章节、发言人回顾等功能,这都得益于混元大模型的能力。
那么,混元大模型究竟有何特点?我们已获得了混元大模型的测试资格,现在将深入探讨它的表现。
混元大模型具备多项能力,包括降低幻觉比例、逻辑推理、抗拒诱导、常规问题回答、语义理解、内容创作、实用办公、撰写代码等等。
接下来,我们将挑选一些代表性的方向,来看看混元大模型的回答效果。
首先是逻辑推理,我们将对其进行初步挑战。问题是:“小明妈妈的三个孩子中,老三叫什么?”混元成功推断出了“小明”的名字,表现出相当的脑筋灵活性。
接下来是一个稍微有趣的问题:“午餐肉可以晚饭吃吗?”混元的回答让人捧腹大笑,它的关心程度似乎已经超过了普通人。
我们也测试了混元大模型在数学方面的能力。
问题是:“买一杯咖啡,上午喝了一半,下午又喝了剩下的一半,还剩30杯,一共买了多少杯?”混元大模型列出了一个方程,并给出了正确答案:120杯。我们还测试了其他数学题,混元大模型在单位换算方面表现出色。
那么,混元模型号称“中文能力很强”,在中文难题面前如何表现呢?我们使用了一个传统段子来测试模型的中文理解能力。一开始混元模型误解了句子,但经过提示分析动名词后,它正确理解了句子的意思。
此外,我们还浅测了混元助手内置的实用工具。混元助手提供了30多个工具,包括调研问卷、会议纪要、代码生成器等,这些工具在工作中能够提高效率。
具体到代码生成器,混元助手能够生成扫雷游戏的代码,尽管未经调整的情况下,生成的游戏板看起来有些混乱。但不得不说,这是一个非常贴心的功能,甚至还提供了代码解释。
总结来看,混元大模型虽然仍需要进一步优化,但已展现出相当的实用能力,一些功能可以直接应用于工作中。
那么,混元大模型背后是否有一些独特的新技术?腾讯透露了一些架构和技术细节。
混元大模型是基于Transformer打造的,经过大规模自监督预训练、有监督精调、强化学习优化等步骤进行训练。数据方面,它使用了超过2T tokens的语料进行训练,不仅提升了模型的知识和逻辑能力,还会不断更新训练数据。
为了提升模型的可靠性和成熟度,混元大模型主要从四个方向进行了技术自研。
首先,是降低幻觉。传统做法是通过搜索或知识图谱增强等方法来辅助降低模型的幻觉,但这些方法在实际应用中存在局限性。腾讯自研了一种基于探真的方法,在预训练阶段去优化大模型的目标函数,成功将大模型出现幻觉的比率降低了30~50%。
其次,团队基于强化学习等方法,让模型学会了识别陷阱问题,对用户提出的难以回答或无法回答的问题能够“say no”,问答率提升了20%以上。
再者,团队优化了位置编码,提升文本处理效果和性能,并结合指令跟随能力,使生成的内容更符合要求。这将有助于模型在生成学术论文或法律报告等方面更加准确。
最后,团队让混元大模型具备了问题分解和分步推理能力,使其能够更好地处理数学和逻辑推理任务。
总的来说,混元大模型在信通院测评主流大模型测试中获得了最高分数,表现卓越。
混
元大模型并不仅仅是个展示效果的花瓶,它已经被广泛应用于腾讯的多个平台。
腾讯自家的APP们已经在各个领域中大规模使用混元大模型。
举例来说,在腾讯文档中,混元大模型已经成为智能助手的一部分。用户在智能文档中只需输入“/”,就能根据需求实现内容生成、翻译、润色等操作,大大提高了文档编辑的效率。
腾讯会议也不例外,它内置了混元大模型的“开会摸鱼神器”——AI小助手。如果你在会议上听不懂同事的争论,或者开会时走神了,只需向AI小助手提出疑问,它将迅速提取核心信息,总结会议要点,让你不会错过重要内容。
此外,混元大模型还被应用于腾讯广告,用于智能化广告素材的创作。它可以帮助生成文本、图像和视频,实现文图视频的“无缝衔接”。
不仅如此,腾讯云、腾讯游戏、腾讯金融科技、微信搜一搜和QQ浏览器等平台也都接入了混元大模型进行测试,并已经取得初步成果。
为了让更多的开发者能够充分利用混元大模型的能力,腾讯已经开放了一系列工具和服务,包括混元大模型在内,腾讯云MaaS集成了多个实用的落地工具。
如果你有兴趣打造自己的大模型,也可以基于混元或其他开源模型,构建适合自己行业的大模型。
综上所述,鹅厂的混元大模型展现出了强大的多功能性和实用性,虽然仍有改进的空间,但它已经在多个领域取得了成功应用。混元大模型的发布,为自媒体领域提供了更多创作和应用的可能性,相信在未来,它将在各行各业发挥更大的作用。
—— 完 —
量子位 QbitAI · 头条号签约
欢迎继续关注我们,获取最新的前沿科技动态。
Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved