月之暗面大模型指数升级,10分钟学会开飞机、打德扑

月之暗面大模型指数升级,10分钟学会开飞机、打德扑

首页休闲益智飞跃自我更新时间:2024-06-18

作者 | 香草
编辑 | 李水青

智东西3月18日报道,今天,国内大模型明星创企月之暗面(Moonshot AI)宣布智能助手Kimi上下文窗口提升至10倍,即日起支持200万字超长无损上下文。

▲Kimi升级至200万字上下文

200万字是什么概念呢?为了更直观地向我们展示,月之暗面工程副总裁许欣然在今日举办的沟通会上,接连掏出一摞摞厚重的打印纸,包括《甄嬛传》剧本、英伟达年度财报、《倚天屠龙记》、《中医内科学》等。这其中,最长的也不过百万字左右。

▲许欣然展示百万字书籍的打印厚度

Kimi智能助手于去年10月面世,当时支持20万汉字无损上下文输入,创造了消费级AI产品所支持的上下文输入长度纪录。而如今,在短短5个月时间里,其上下文长度就提升了一个数量级。

与此次升级同步,月之暗面团队还发布了一则“低调”的更名通知:Kimi Chat、Moonshot大模型分别改名为Kimi智能助手、Kimi大模型,以后只要记住Kimi就够了。

▲Kimi更名通知

即日起,Kimi的200万字升级开启内测,用户可登陆网页版首页申请体验。

体验地址:kimi.ai

一、10分钟速成开飞机、打德扑,挖出长篇小说深层次细节

许欣然谈道,相比20万字长度,更长的文本输入首先能带来的变化就是解锁更多超长任务、复杂任务。过去只能整理50份简历,现在可以线性增长至500份。

月之暗面团队提出“10分钟速成定律”,指的是Kimi快速学习一个新领域的能力。人类要10000小时才能成为专家的领域,AI只需要10分钟,就能接近任何一个新领域的初级专家水平。

例如,上传几十万字的德州扑克的教程文档,再提出一个比赛开局,Kimi就可以分析比赛场上的局面,并提供出牌策略的指导。

▲Kimi速成打德扑

输入近百万字中医诊疗手册,同时描述病人的病症和提出分析步骤,Kimi立刻化身中医,给出了病因判断、治疗方法、药材配比等。

▲Kimi速成中医

丢给Kimi一本260M的开飞机手册,再向它提出多个飞机驾驶方面的疑问,它都能一一解答。

▲Kimi速成开飞机

除了中英文,Kimi还能直接阅读代码库文件,然后用中文写出详细清晰的代码库设计文档,即便是毫无注释的陈年老代码也能快速梳理出结构。

▲Kimi读代码

值得一提的是,虽然对于长文本大模型,大家都比较期待其“大海捞针”压力测试的表现,但许欣然指出,一个指标一旦开始被观测,研发团队自然就会专门针对测评基准进行优化。这样一来,指标就失去了参考价值,变成了无尽的“刷榜”游戏。

另一方面,“大海捞针”测试本身其实就相当于Ctrl F检索,对模型能力本身的要求并不高。比起定向检索,用户更需要的应该是对复杂文本的理解能力,看大模型能从长文本中学到什么。

在这方面,升级后的Kimi也进化了不少。

以经典电视剧《甄嬛传》为例,只要输入剧本,Kimi就能在不同时间段、各个场景的故事情节中,深入挖掘甄嬛、果郡王的情感线以及和他们孩子的真相,堪比一个看了好几十遍电视剧的“甄”学家。

▲Kimi读《甄嬛传》剧本

二、用户量月增100%,复杂需求倒逼硅基生命“自卷”

当然,除了基础的文本阅读、记忆、理解等场景外,升级至200万字的Kimi必然会开辟新的应用和场景。这需要极大的想象力。

许欣然谈道,就好比内存容量的迭代,基础要素的每次提升都会带来突破想象力的新应用。

在月之暗面团队看来,无损的长文本能力也是一种基础要素,随着长度的提升,大模型的能力从简单问答、常识背诵等基础任务逐渐升级至角色扮演、长文检索、领域知识理解等。未来,必然有无限可能性还在等待着Kimi去探索。

▲无损长文本能力增长带来的任务复杂度提升

而这条AGI探索之路,也离不开用户的共创。月之暗面联合创始人周昕宇谈道,出于用户共创的考虑,Kimi的定位比起“聊天机器人”更像一个“智能助手”,因为普通对话对大模型自身迭代的帮助有限。

Kimi自发布以来,有许多应用场景都是用户自己开拓的。如通过一定的提示词,让Kimi变身专业翻译工具、跑团主持人等。

▲Kimi变身专业翻译工具

还有用户直接将Kimi的读论文能力封装成了工具,并开发了专门的论文网站。用户只需点击网页上的Kimi按键,就能得到论文的基本信息,包括解决了什么问题、相关研究、如何解决等。

▲Kimi读论文工具

许欣然称,根据网站分析工具SimilarWeb数据,Kimi用户量在春节后飞速增长。此外据非官方统计数据,其用户量每个月增长率超100%。

▲SimilarWeb数据显示Kimi用户量在春节后飞速增长

正是因为用户对Kimi发出的指令越来越复杂,因此团队也一直致力于提升Kimi能遵循的指令的复杂度、信息检索能力。同时由于用户的使用场景从工作逐渐扩展到生活的方方面面,团队在网页端之外补齐了微信小程序、iOS端以及安卓端等。

许欣然透露,Kimi充分发挥其作为“硅基生命”的优势,夜间也没在歇着,持续不断地自我进化中。

三、相同硬件条件下响应速度提3倍,年内将发多模态大模型

在沟通会上,许欣然和周昕宇向智东西等少数媒体透露了目前在做的需求池以及未来的发布计划。

如用户呼声很高的提示词教程,目前已经在准备当中,预计一个月左右发布。此外团队也一直在进行多模态能力的研发,今年内将会推出多模态大模型。音频处理能力、海外版同样在需求池内。

目前,Kimi智能助手仍完全免费。但随着用户群体的扩大和使用量的增长,难免会出现算力不足的情况。许欣然透露,今年上半年预计开启商业化模式。

与此同时,月之暗面的Infra(基础设施)团队也在持续提升能效比,据称比起刚发布时,Kimi在完全相同的硬件条件下响应速度提升了3倍。

由于没有采用常规的渐进式提升路线,月之暗面团队遇到的技术难度也是指数级增加的。为了达到更好的长窗口无损压缩性能,月之暗面的研发和技术团队从模型预训练到对齐、推理环节均进行了原生的重新设计和开发,不走“滑动窗口”、“降采样”等技术捷径,攻克了很多底层技术难点,才取得了新的突破。

结语:长文本为AI带来更多可能性

随着Kimi智能助手上下文窗口提升至200万字,我们见证了AI领域的又一次飞跃。在数字指数级增长的背后,体现了大模型对复杂任务处理能力的显著提升。

无论是速成开飞机、打德扑,还是深入分析长篇小说的深层次细节,Kimi都能够迅速适应并提供专业级的指导和分析。这得益于月之暗面团队对长文本大模型的深入研究和不懈追求,也离不开用户对其需求产生的驱动。

查看全文
大家还看了
也许喜欢
更多游戏

Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved