让谷歌再次伟大?Gemini超越GPT-4问鼎最强大模型,Pro版今日可用

让谷歌再次伟大?Gemini超越GPT-4问鼎最强大模型,Pro版今日可用

首页休闲益智最强大脑袋更新时间:2024-09-22

文丨Congerry

这是谷歌人工智能新时代的开始:the Gemini era。(双子座时代)

昨夜,还未完全准备好的谷歌放出了自己蓄力已久的大招——原生多模态大模型 Gemini 大模型。

原生多模态模型意味着Gemini 从一开始就针对不同的模态(如文本、音频、图像等)进行预训练,然后用额外的多模态数据进行微调。这使得 Gemini 能够无缝地理解和推理各种输入,远优于现有的多模态模型。

之所以说谷歌还未准备好,是因为这次谷歌一共带来了 Gemini 1.0(Gemini 第一个版本)三个量级的大模型。

但是对标、甚至超越 GPT-4 的最强大的 Gemini Ultra 版本仍在完善当中,明年才会正式推出。

不巧的是,在谷歌《Introducing Gemini: our largest and most capable AI model》这篇博客中, Gemini Ultra 正是主角。

虽然暂时无法体验到最强的Gemini模型,但是不妨先过过眼瘾。

Gemini Ultra 一雪前耻,基准测试全方位超越GPT-4

谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)说“这是谷歌人工智能新时代的开始”,最大的底气可能就来源于 Gemini Ultra 。

Gemini Ultra 展示了在众多任务中的卓越性能,包括自然图像、音频和视频理解,以及数学推理等领域。

在大型语言模型(LLM)研究和开发的 32 个广泛使用的学术基准中,Gemini Ultra 在 30 个基准上都超越了当前最先进的水平 GPT-4。

(上图中)除了HellaSwag,这个数据集是为了检验人工智能模型是否能够理解和推断物理世界中的常识知识和逻辑。这意味 GPT-4 在理解和生成与日常任务相关的常识性推理方面的能力比 Gemini Ultra 更强。

在 MMLU(大规模多任务语言理解)基准测试中,Gemini Ultra 取得了 90.0% 的分数,成为首个在此测试中超越人类专家的模型。

注:MMLU 使用了 57 个不同学科(例如数学、物理、历史、法律、医学和伦理学等)的组合,以评估模型的世界知识和问题解决能力。

在新的 MMMU(多模态多任务理解)基准测试中表现出色,Gemini Ultra 获得了 59.4% 的先进分数。MMMU 基准测试涵盖了多个领域的多模态任务,要求模型具备深入推理的能力。

在图像基准测试方面,Gemini Ultra 在未借助对象字符识别(OCR)系统(用于从图像中提取文本以进行进一步处理)的情况下,超越了先前的先进模型GPT-4V。

这些基准测试凸显了 Gemini Ultra 的原生多模态特性,并展示了其在更复杂推理能力方面的早期潜力。

Gemini 1.0 上手实操案例

Gemini Ultra秀完肌肉以后,来看看Gemini的实测表现。

卓越的多模态推理能力

Gemini 1.0 的复杂多模态推理功能使其能够理解和解析复杂的书面和视觉信息。这赋予了它在海量数据中挖掘难以察觉的知识的独特优势。

Gemini 1.0 通过阅读、过滤和理解信息,从数十万份文档中提取有价值的见解,这将有助于在众多领域(如科学、金融等)实现数字速度的突破性进展。

以一个实例为证,Google Deep Mind 的一些科学家向 Gemini 提供了一个提示,要求它查找相关科学论文并提取关键数据。

此外,Gemini 不仅能处理文本信息,还能处理图表等多模态数据,使其能够更新原始研究中的图表以反映最新数据。

理解文本、图像、音频等

Gemini 1.0 经过训练,能够同时识别和理解文本、图像、音频等多种信息形式。

这使得它能够更准确地捕捉微妙的信息,并回答与复杂主题相关的问题。特别地,Gemini 1.0 在解释数学、物理等复杂学科的推理方面表现出色。

例如,用户可以上传一张手写答案的练习题照片,Gemini 不仅可以解答这些问题,还能识别正确和错误的答案,并解释需要澄清的概念。

高级编码(程序员福音)

Gemini 能够理解和生成多种流行的编程语言(如 Python、Java、C 和 Go)的高质量代码。

通过使用 Gemini 的专用版本,谷歌开发出了更先进的AI代码生成系统 AlphaCode 2,它在解决涉及复杂数学和理论计算机科学的编程问题方面具有更高的能力。

当在与原始 AlphaCode 相同的平台上进行评估时,AlphaCode 2 显示出巨大的改进,解决的问题数量几乎是原来的两倍,谷歌估计它的表现优于 85% 的竞赛参与者,而 AlphaCode 的这一比例只有 50%。

最强的 Gemini Ultra ,正接受信任和安全检查

Gemini Ultra虽然强大,但是仍需等待。

好消息是,从今天起Gemini Pro将被整合到Google产品中,如Bard。这将使Gemini能够为数十亿用户提供更先进的推理、规划和理解等功能。

这是 Bard 自推出以来最大的升级。不过目前仅在170多个国家及地区提供英语版本,谷歌计划在不久的将来扩展至更多模式、语言和地区。

开发者和企业客户可自12月13日起通过Google AI Studio或Google Cloud Vertex AI访问Gemini Pro API

另外,谷歌还将 Gemini Nano引入 Pixel。Pixel 8 Pro 是第一款运行 Gemini Nano 的智能手机。

其中,Gemini Nano还包含两个规模,分别是参数18亿的Nano-1和参数32.5亿的Nano-2,针对低内存和高内存设备。

Android 14的Pixel 8 Pro设备将支持Android开发者利用AICore系统能力构建与Gemini Nano相关的应用。

在接下来的几个月中,Gemini 将出现在谷歌更多的产品和服务中,例如搜索、广告、Chrome 和 Duet AI。

谷歌已经开始在搜索中试验 Gemini,它使用户的搜索生成体验(SGE) 更快,美国英语的延迟减少了 40%,同时质量也得到了提高。

至于最强的 Gemini Ultra ,正接受信任和安全检查,包括由受信任的外部方进行红队检查,并在广泛使用之前使用微调和基于人类反馈的强化学习 (RLHF) 进一步完善模型。

Gemini Ultra 计划在明年初向开发者和企业客户推出。在此期间,部分客户、开发者、合作伙伴和安全专家将有机会进行早期实验和提供反馈。

明年早些时候,Bard还将迎来二次升级,Google将推出Bard Advanced,提供尖端AI体验,包括访问Gemini Ultra等顶级模型和功能。

如果您有什么想说的,欢迎屏幕前你们在评论区留言讨论!我们将为点赞、评论、关注的同学们送上红包不限量哟~

查看全文
大家还看了
也许喜欢
更多游戏

Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved