从年初ChatGPT引发的大模型浪潮,到诸多企业前赴后继上线自家大模型产品,百“模”大战不断升级。
作为人工智能得以跃迁式发展的全新底座,大模型不仅率先成为角逐焦点,目前更是在多个行业加速赋能和应用步伐。智能座舱、自动驾驶无疑是大模型产业化应用最受关注的领域之一。
百“模”大战对智能座舱的发展到底有何影响?11月11日下午,2023中国汽车供应链峰会上,就“百模大战对智能座舱发展意义与实践”的主题,在上海交通大学智能网联电动汽车领域首席研究员殷承良的主持下,商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚,长城汽车智能平台开发中心产品总监王继明,科大讯飞智能汽车副总经理李卫兵,出门问问大模型团队工程副总李维,腾讯智慧出行解决方案总经理姚振和奇瑞雄狮汽车科技智能座舱首席专家何雷进行了深入的探讨。
王晓刚直言,当大模型出现,它不但可以去控制AI提供的单点功能,还有包括车内的各种APP、各种软硬件的这些设施,最终大模型在成为座舱的大脑也好,操作系统也好,亦或是能够给我们带来智能座舱的整体的智能化体验也好,这都是大家对智能座舱非常期待的点。
李卫兵认为,现在的座舱交互太过于繁、杂,给人非常繁杂的感觉就特别差。人的交互也是这样,是多模态的,视觉、声音、听觉、触觉它都是同时参与其中的。语音当然是人跟机器之间、人跟人之间最直接的交互方式。过往为什么要采取这么多多模态的交互方式?是因为语音搞不定。以前说语义理解是大问题,跨场景、多任务,上下文的对话,它就懵了,但是随着大模型出来以后,在语义理解方面得到了彻底的解放以后,他认为我们汽车座舱类的交互会逐渐收缩,甚至是多模态它也会收敛,它不会像现在是割裂的。
李维强调,数据的重要性怎么强调也不过分,整个大模型的趋势叫AGI,从OpenAI推动,最后就是边界越来越大,慢慢渗透到不同的领域,如果在车载领域当中,把车窗的交互和其他的人工智能的体验做上去,最后的护城河就是你的数据,因为你在别的方面没有办法跟真正的通用的大模型的滚滚的往前走的车轮比。所以你必须要把自己场景的数据,特别是体验优化到极致,积累到一定程度,这个时候大模型的浪冲过来的时候,不会把你冲走。
姚振认为,做事情要从场景出发,比如说大出行也好,座舱之外也好,跟手机连接也好,甚至用户的旅程也好,车辆的研产供销服也好,涉及到智能驾驶、智能座舱都提到比较多的其他的场景。比如说销售,车辆作为消费品是决策链特别长,复购率特别低的东西,我们都提到千人千面,但是千人千面怎么跟数据结合,怎么能提供给销售顾问一个比较好的智能化的销售助手,这个时候大模型就开始起作用了。
何雷认为,现在大模型对我们整个行业已经造成了反噬,现在很多人张嘴都是大模型,但是未必所有人都理解大模型,看到代码能够自动生成,老板就想是不是可以把人员优化了。真正大模型能干什么事情,没有搞明白,闭着眼睛就是投资也好,做方案也好,就把大模型都拉上。但是,未必所有的东西都通过认知的方式解决,模型只是基于世界已有的知识联想和创造,没有办法真正的代替人做新的架构,新的理论。
王继明提出了自己的疑问,长城近两年开始,几乎所有的车都是联网的,所以数据的底座,在合法、合规的前提下,他们已经积累了大量的跟长城车主相关的数据,有很多数据他们是花钱存起来了,但是数据的价值没有挖掘的很好,这个事情不止是长城一家的困惑和难点,别的友商也有这样的问题,大家都会收很多的数据,但是数据本身的价值他们还利用得不够好。
殷承良认为,百模大战,300多个大模型,把理论建模的框架弄出来,可能不那么费劲,但是要把它训练成非常有用的模型就不太容易。为什么我们的车号称可以直线行、小弯道行,但是一复杂就不行?就是因为算力远不如人家,数据积累远不如人家,所以真真正正到最后,总会去伪存真,总会合、合、合,最后整合到比较头部的企业,他们拥有强大的算力,又有大量的数据,把模型训练的比较好,这个时候就脱颖而出了。
殷程良(上海交通大学智能网联电动汽车领域首席研究员):首先感谢贾可博士,刚才马钧教授做了很多铺垫,也谈到了一些关于大模型的内容。从去年到今年短短一年时间,我前面查了一些文献大概冒出来了一两百家大模型。自打ChatGPT3出来以后,一时间大模型火爆全球。按照马钧教授所说,现在已经有300多家,这个数字就更新鲜了,那么多(玩家)都介入到大模型里,今天在汽车领域也是把大模型应用不断地推起来了,所以今天我们大家一起共同探讨一下这个问题。我们每一位嘉宾还是简单做一个自我介绍,先从王总开始。
王晓刚(商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁):我是王晓刚,来自商汤科技。说咱们行业对于大模型的认知,从去年年底ChatGPT开始,但是我们在这方面的布局在2018年就开始了。我们到上海的时候投了50个亿去建人工智能的数据中心,当时很多人就不理解为什么一个做算法的公司有这样的重投入,就是因为我们当时要去做大模型,先有的这些基础设施是没有办法去支持我们的软硬件系统的。
2019年,我们开始推出第一个视觉的模型,我们说2023年ChatGPT大模型比较热的时候,3月我们是开源了一个30亿参数的多模态的模型,那时候ChatGPT4还没有出来,其实ChatGPT4是多模态的模型,今天的ChatGPT4刚刚把它的多模态API释放给大家。
6月,我们也是第一次通过语言模型去利用它的决策、判断还有常态的规划推出智能体,在我的世界里我们同时解锁了所有262个任务。因为在之前OpenAI和diplomat花了几年的时间用强化学习,这里总共解锁了78个任务。在这里我们也有一系列大模型的落地和应用,但是我想说的是在这里面我们比较早的会有这方面的布局,也希望我们在这里面始终能够做出不一样的创新性的大模型。谢谢!
殷程良:谢谢王总,其实已经把商汤科技做大模型有关的情况给大家做了一个系统性的介绍。下面有请长城的王总。
王继明(长城汽车智能平台开发中心产品总监):大家好,我是王继明,来自于长城汽车智能座舱。希望借助大模型能力赋能于汽车,通过汽车赋能我们的车主和乘员,让我们的车可以变成智能生活大的入口,谢谢!
李卫兵(科大讯飞智能汽车副总经理):大家好,我现在的身份是科大讯飞智能汽车事业部的副总经理。科大讯飞这么多年一直以云技术闻名于世,我们在中文语音市场,现在在多语种语音市场方面做得非常出色,依托语音技术,我们向人工智能方向拓展。
人工智能技术的应用,我们在教育医疗、智慧城市,汽车等等各个领域都有比较高的落地和应用。这也是我们在整个技术研发和产品落地的数据闭环阶段,我觉得还是做的不错的。
今年年初,汽车ChatGPT这样一个新的趋势出来以后,我们公司也是及时启动了这样一个大模型的研发。5月6日,我们发布了讯飞星火1.0,8月15日,我们发布了2.0,当时商业评论有一个测评,星火大模型各项指标应该说都表现比较出色,被评为中国最聪明的大模型之一。
在刚刚过去的10.24我们全面对标了ChatGPT3.5,我们在中文上面已经全面超越了ChatGPT3.5,英文上基本相当。同时我们也发布了下一步的研发计划,明年上半年,我们会构建万亿级参数的对标ChatGPT4大模型的研发。
在大模型技术不断拓展的同时,我们也在积极探索落地。在汽车方面,我们也做了很多探索的应用。在刚刚过去的10.24讯飞智能汽车产品发布上,我们也发布了把星火大模型用在座舱交互里面的三个产品。主要是讯飞星火的OS,这里面主要包括语音助理的升级,就是车内交互的这个问题已经很好解决。以星火大模型为底座的星火座舱的OS是我们的一个产品。
第二个我们发布了一个APP,就是星火APP。在我们不依赖硬件条件下,我们可以把我们星火大模型的很多生成式内容的小应用可以做到APP上,这样我们APP不论在什么样的载体上可以很快的应用,让我们的用户可以快速的体验到大模型带来的在交互方面的,在内容生成方面的巨大提升。
第三个就是我们的软硬一体,结合我们的硬件,结合我们星火大模型的能力和我们的软件交互来做智能座舱的系统解决方案。
殷程良:下面请李维李总,刚才您的介绍给大家也留了深刻的印象,你看看还有什么补充?
李维(出门问问大模型团队工程副总):出门问问是初创公司,当然也不是特别初创了,我们也算是一个独角兽,也是有相当一段时间的积累。我们的老板叫李志飞,他是从谷歌总部出来的,在上一拨AI热潮的时候回国创业,主打的是智能语音包括落地到车载里面的语音交互。中间也做了一段硬件智能手表,现在我们的智能手表在海外还卖得很好。
在大模型之前,在ChatGPT3的时候我们就开始做大模型,从业内人来看,这个趋势很明显就等待一个爆发期,但我们不知道爆发点在哪里,ChatGPT正好是一个爆发点。ChatGPT爆发以后,我们在技术模型上做了相当的投入。我想强调的是我们公司更大的基因是在产品落地方面,特别是在AIGC生成方面,AIGC用人工智能生成内容的赛道上,我们公司是全亚洲营收最高的一家。很多比我们大的,有的大得多得多或者是类似的这种公司,大家实际上都存在一个落地赚钱的问题,我们还算闯出了一条道路,至少我们现在是亚洲AIGC这个赛道营收最好的一家公司。
姚振(腾讯智慧出行解决方案总经理):大家好,我是腾讯智慧出行负责解决方案的姚振。腾讯是互联网公司,在汽车行业我们已经投入了6年。最近6年我们都在做汽车数字化,像智能座舱、智能驾驶、数字化营销、汽车大数据包括底层的汽车云等,这些我们都在做。但这里因为涉及到今天的议题是涉及到智能座舱,我们智能座舱的产品线也是很多年了,但是涉及到大模型的结合,这一块整个行业都在探索。因为腾讯前段时间发布了混元AI大模型,我们自己有大量的语料,包括参数量也是千亿级别的,但是应用在汽车行业说实话我们应该多探讨,整个行业应该看看怎么把座舱包括智能驾驶共同地推进。
像在汽车行业的智能客服领域,我们认为做得还不错,这块应用比较成熟,不管应用在汽车行业还是别的行业,涉及到座舱,涉及到智能驾驶这一块,确实我们都还在摸索阶段,这些点如何能做得更好,如何能真正解决用户的痛点,体验更好?我们是希望多交流、多学习,谢谢大家!
何雷(奇瑞雄狮汽车科技智能座舱首席专家):现场的各位嘉宾,大家下午好!技术奇瑞,品质和安全遥遥领先,我是来自奇瑞雄狮汽车科技的何雷,负责奇瑞汽车智能座舱软件的研发工作。在10月16日刚刚过去的奇瑞汽车day上面,我们通过奇瑞星途星纪元已经展示了大模型的能力,跟讯飞一起,借助讯飞后台。
今天到这里来一方面跟同行一起来探讨一下大模型如何上车,诸位主机厂我们在这个环境当中能够发挥什么样的作用?就是利用车厂自身的那些优势。第二是希望我们在奇瑞科技日上面刚刚发布了雄狮智舱里面的OS,我是如何跟像商汤科技和讯飞的基座,能够把他们的能力引入到我们操作系统当中去,能够给奇瑞汽车未来基于模型做一些下一个阶段智能化基座上面打造亮点和差异化的东西。
大模型,智能化的拐点?殷程良:下面我们想针对今天最重要的主题,这个大模型如何和智能座舱包括智能智驾、舱泊一体这些都是可以的,商汤的大模型应该是用途非常广泛的模型,但是用在车上就具体到某一个方面了。现在你们的绝影系统应该就是相当于是在车的领域的重要板块。你能不能从商汤的角度,是如何定义或者是把这个大模型用在你们的绝影,又如何是服务于整车的?这个你们是怎么思考的?这个定位是怎么做?
王晓刚:我们认为接下来一到两年有两个非常重要的技术方向的突破。一个是在自动驾驶里面我们基于大模型的端到端的自动驾驶,我们自动驾驶是从高速到城区面对更复杂的这些路况情况下。因为之前的自动驾驶系统里面只有感知这一部分是基于模型的,后面的融合、定位等大量都是基于规则的,当你变得更加复杂的时候,是很难通过手动去解决这么复杂的问题。
今天我们看到的是端到端的大模型已经成为自动驾驶里未来发展的重要的趋势。2022年底,我们就发布自己的UniAD端到端自动驾驶的模型,今天可以看到像特斯拉9月的时候也发布它的端到端自动驾驶将来进行量产。我们也在往这个方向进行推进,我觉得这是很重要且快速发展的方向。
第二个是在座舱里面,以大模型为基础的座舱的大脑。过去我们在做智能座舱,我们和其他的这些供应商提供的都是一些单点的AI的这些功能,在上面通过Tier1或者主机厂也好,通过一些规则把这些功能组织起来形成舱内的这些产品,但它的体验就是比较差的。比如说我们做驾驶员或者乘客的监控,你看到我一个表情,每次给我的反应都是一样的,没有办法把更长的这些上下文、周围的环境,包括我自身的这些爱好各方面的信息结合起来给出综合的反映,所以大家就觉得这是假AI。
当大模型的出现,它不但可以去控制AI提供的单点功能,还有包括车内的各种APP、各种软硬件的这些设施,最终大模型在成为座舱的大脑也好,我们说操作系统也好,能够给我们带来智能座舱的整体的智能化的体验也好。所以说这个是大家对智能座舱非常期待的点。
我们说智能化能够树立起汽车的高端品牌,能够有这样议价能力的出现,今天大模型的出现就意味着这样的机会,这样的拐点。这块我们也是全力在做。在这里我们语言模型、多模态的模型,包括文生图的模型,都是在座舱里面开始有这方面比较广泛的应用,期待着“座舱大脑”早一天的到来。
殷程良:谢谢王总。长城这边,王总你是负责整个智能平台的开发,我想智能座舱也好、智能驾驶也好、泊车也好,都应该是你们这个平台来开发的,对吧?
王继明:对。
殷程良:咱们大模型种类很多,比如大语言模型可能天生是不是适合座舱的交互之类的,但是智能驾驶的这块,你们是怎么去用这个大模型的?它和智能座舱的大模型种类是一样还是不一样?智能驾驶对于安全这些要求又那么高,如何去考虑?在大模型不确定性这些问题方面是怎么去做探索?
王继明:我本身聚焦在智能座舱,对自动驾驶稍微了解一点,行业里来讲,我们甚至拿智驾部分进行训练、仿真,去进行生成我们corner case,这都是我们在做的事情。针对大模型本身它会有一些不确定性、随机性或者幻觉之类的,前面出门问问的老师也讲了一些我们的方法。我觉得从方法论上讲的话,这个事情都不是那么的不清楚,大家都这么做,但是也有可能这些东西在眼前大家目前有共识,但是随着大模型往后的发展,可能会有新的观点出现。
大模型,如何赋能智能化?殷程良:现在长城汽车的策略是怎样的?
王继明:我认为大模型本身来说以后还是会有几个基础的大模型服务商出现,也有可能像商汤科技这样的或者是两边倒,一边是商汤科技,一边是讯飞。上周我们跟讯飞有签订战略协议。所以我们会希望由大的底座服务商提供底座的能力,再往上基于我们本身的业务,不管是前面讲到的智驾训练还是本身我们在以后生产效率的提升,还是去针对用户需求的探索,再回到我们在座舱里面一些功能的探索,我们都希望能在面向用户这一端,面向我们汽车业务这一端去发展。我们在中间可能会基于大模型会去做相关的,像向量模型、小模型需求,或者我们自己做一些或者我们请合作伙伴帮我们去做一些优化、提升,整体来讲我们本身会面向于最终端的不管是C端的车主还是我们内部一些各个兄弟单位的B端用户,但是底座还是由很多行业来提供。大概是这样。
殷程良:卫兵你在整车厂呆了那么多年,对车的智能化很熟悉,这会儿又到科大讯飞做智能的这部分,尤其是大模型相关、语音相关。我的问题是你是否觉得咱们现在这个智能座舱里的各种功能是不是太多了?我今年测了35台车。智能化我几乎都看了,让人眼花缭乱,是不是你们拿语音就可以把它统一起来?你们心目中最佳的智能座舱交互式应该是什么样子?和大模型又怎么关联起来?
李卫兵:殷老师给我出难题,虽然是跨界,但是都不敢说每一边都做得很透。上一场马钧教授也提了一个观点,我也表示认可。现在的座舱交互确实太过于繁、杂,你给人非常繁杂的感觉就特别差。人的交互也是这样,也是多模态的,视觉、声音、听觉、触觉它都是同时参与其中的。语音当然是人跟机器之间、人跟人之间最直接的交互方式。过往为什么要采取这么多多模态的交互方式?是因为语音搞不定。以前说语义理解是大问题,跨场景、多任务,上下文的对话,它就懵了,但是随着大模型出来以后,在语义理解方面得到了彻底的解放以后,我觉得我们汽车座舱类的交互会逐渐收缩,甚至是多模态它也会收敛,它不会像现在是割裂的。
语义理解之后座舱会发生大的变化,多任务贯穿已经解决了,长上下文的联系也已经解决了,多风格的交互也解决了。刚才一汽的领导讲,我不同的心情下面希望有不同的人设跟我交互,现在也能做到。还有内容生成,还有助理,我们现在用大模型可以做很多类的助理,一种是英语口语的陪练助理,你可以跟他一起练口语,你在车上的时候他给你陪练,他能够跟你的问题不停的聊下去,用英文跟你聊下去。他可以把你蓝牙电话的通话过程中记录下来,把里面核心要点抽出来,把你要安排的日程自动生成。这就是助理,你以前做这些事情的很烦,打蓝牙电话后内容存不下来,你可以保存然后要自己生成纪要和日程,这些不连贯,现在只要跟他聊天,他自己就帮你办了。比如去旅行要定房间,在哪个地方加油,看哪个景点,现在大模型上车以后都可以通过聊天就把这些事情办了。所以我觉得大模型出来以后,车内智舱交互当然也是多模态的,它会是非常润物细无声的给你做掉,让你感觉它在但你又不嫌它烦,这是我的见解。
殷程良:非常好,我认真听了你讲的情况,其中有一个感触挺多,就是后面没怎么细说。我就想了解一下,我们这个大模型可能说它是大专家,这个专家知识非常的薄,现在很多用在很多地方都行。不过今天我们是用在车上,会不会出现知识很薄但它不深,知识很薄但它很杂,知识很薄但它不精。这样的情况对车,从你们角度上,深入到这个里头,该如何去解决这个问题?
李维:大模型跟车的结合,这是一个大的趋势,这个问题是一个时间问题,但是我们现在把问题可以先简化一下。现在汽车里面的语音助手是什么助手,还是上一代的助手,就是功能性的语音问答,你让它开个窗户,调个温度可以做得很好,包括特斯拉这么先进的大厂,现在提供的还是上一代的AI是功能性的,基本上利用基本功能做的,不能说没用,但是马上就面临着怎么通过大模型升级的问题。这件事情肯定是各大厂家和汽车业都聚焦的问题,因为这是很显然的路径,但是在我们说话的这个时间点,你没有找到一家是真的把大模型全做通了,把它部署了交付给客户的,我没有看到,连特斯拉都没有做到。这证明什么呢?从能力上、道理上这件事情都可以做的,但是真正部署到落实当中,这个有一个时间差,这件事情不仅发生在车载里面,你看百度音箱小度小度,开窗户,晚上睡觉关灯都很好,很方便。但是你再跟它多说几句,它马上就说大模型正在怎么样,你需要大模型请对接什么什么,把你引到别处去,他们也在全力以赴的把大模型接通到功能性的对话系统里面去。
现在回想一下座舱里面的环境交互,分三大部分,一部分最基本的就是功能性的,这个在上一代的AI基本做到了,当然还有一些漏缺,毕竟是在补窟窿,一点一点补起来的,靠时间,不可能补的那么全,因为没有大模型。
第二点,实际上就是知识性的交互,除了车环境里面的功能,一个车里面的功能你能数得过来,500个还是1000个,每个细分一下,是一个final set,你每个set得考虑到别人怎么去表达的,最后总是可以把它穷尽掉,所以用老的AI也可以做到。但是一旦超出这个圈,老的AI就是人工智障,怎么这么笨,听不懂我的话,这个问题现在可以解决,这就是怎么把它back up到其他的百科知识。我开车长途三个小时,我路上闲着无聊跟它聊天,或者复习一下英语或者背几个单词,这些事情都可以想到的,但是现在的AI做不到,大模型做到了吗?做到了,但是并不等于座舱里面做到了,这里面这一步没有跨过来。
第三个座舱里面的交互式是情感的交互,这是大模型擅长的,但是大模型走两条道路,一条是知识道路,怎么帮助你解答问题,那个百科知识没话说,你基本上可以相信它,你问10万个为什么基本可靠。但是纵深的知识是有问题的,纵深的只是在垂直领域,在汽车行当,沿途的风景要跟沿途的实时数据挂起来,这些需要的不是大模型本身的数据,需要外挂知识库。
再就是大模型还涉及到情感陪伴、老年陪护,在汽车场景,特别是长途驾驶当中,很容易脾气变得很暴躁,你怎么用一种办法让脾气变好一点,增加客户体验。我这一次走了四五个小时的长途,我下来以后感觉到这一段时间没有白费,又学到了知识,情感上得到了平复,心情比我上路的时候好受多了,这种体验,大模型都有这种潜力,但是真正弄到车舱里面会让最终的消费者感受到,但是这一步没有跨出去,我们可以再讨论为什么没有跨出去。
殷程良:就像人学无止境,不断前进,大模型也是在不断前进,应用也在不断前进。姚总,我想从出行的角度,事实上咱们讲大模型,有知识性、情感型各方面的应用,人工智能里面还有一个很重要,会不会让车越来越个性化。你们有没有考虑在人工智能、大模型也好,对于出行服务和个性化之间如何界定,你们对人工智能的思考应用在车上,从你们的角度应该是什么样子?
姚振:殷老师这个问题特别好,这个从几个层面看,比如说殷老师提到的有人租车租了一周,这个问题很好解决,ID就可以解决,单总提到数字钥匙,我们跟单总也有比较多的合作,就是基于微信蓝牙钥匙的体系,不管通过扫码也好,通过ID绑定也好,人人都有微信,把它切换过去就好了,这个不存在技术问题,其实就是一个连接器的问题。
在此之上,刚才殷老师提到场景的问题,腾讯是做产品出身的,产品经理这个词也是腾讯发明的,我自己本人我来腾讯之前十几年都是技术出身,我之前其实的想法也是技术改变世界,技术做到极致,一定能给业务赋能,但是最近我在腾讯这六年,我一直受到这种冲击,不管做ToC的产品还是ToB的产品,我做汽车行业做了十几年,我们做这些事情要从场景出发,比如说殷老师提到的大出行也好,座舱之外也好,跟手机连接也好,甚至用户的旅程也好,车辆的研产供销服也好,涉及到智能驾驶、智能座舱都提到比较多了其他的场景,比如说销售,车辆作为消费品是决策链特别长,复购率特别低的东西,在销售过程中,大模型也能起到作用,我们都提到千人千面,但是千人千面怎么跟数据结合,怎么能提供给销售顾问一个比较好的智能化的销售助手,这个时候大模型就开始起作用了。
其次买了车以后,车商的智能座舱除了语音交互以外,智能推荐体系也可以结合后市场营销等等,也可以把营销体系、画像、CDP、SRM这些系统,包括蓝牙钥匙全部打通,从这里面再挖掘场景应用,包括车辆的智能客服,车辆使用说明书等等,场景非常多。我们做这个行业很多场景不是腾讯想到的,客户想到的,我们一起共建,这个过程也是我们认为做ToB产品和ToC的区别,我们不能说自己想一个场景,然后觉得市场就会接受,实际上不管主机厂也好,还是用户也好,可能的需求是不一样的,这是大模型比较优秀的点。
就像殷老师提一个问题,我今天的回答是这样,可能明天问我同样的问题,我无法一模一样的回答出来,但是我有一个框架。这个原理就跟大模型非常像,我是基于这个框架来写,我相信在不确定型的时代,这个就是大模型的魅力,输入不确定,回答也不确定,但是过程中要不断地喂数据、喂语料,让它不断地迭代成长,让它的场景更加丰富,在出行过程中,不管是多模态交互也好,智能场景化的推荐也好,包括基于大模型做后市场营销也好等等,这些都是比较好的场景。
再补充一点,我们今天叫百模大战,这个百模我理解还是10亿参数量的通用大模型,其实在汽车行业像我们也做了很多行业大模型,汽车行业,包括研产供销服做了很多行业化的投入,因为这块我们认为通用大模型数据非常多,但是一方面的数据比较滞后,另外一方面李总也提到,它的系统有局限性,比如说跟实时数据没有办法结合,是数据截止到什么时间,我们在行业大模型过程中,就可以聚焦的领域做更多的事情,甚至有些领域是不是客户端可以用小模型,可以场景出发,而不是聚焦在大模型怎么颠覆行业。
大模型的“反噬”殷程良:何总,奇瑞也是整车企业,首先今年奇瑞战绩不错,不过这个战绩绝大部分来自于海外,现在你们在做车的时候,这个模型应用的时候,不能光是中国人,是不是也考虑俄罗斯的战斗民族,或者其他的,在这个应用实践当中,这个民族特性的文化差异里面,是如何去做,境内境外有多大的差异,在你们产品推的过程之中,有没有碰到或者说怎么考虑多文化在你产品模型,其他的开发之中考虑这个智能化开发是怎么做的?
何雷:这个问题还是很有挑战性的。首先说一下,奇瑞出海做得很好,但是有一个很现实的情况就是其实现在海外的智能网联水平,远远落后于国内,或者说奇瑞已经做了20年的海外市场,但是真正的做智能网联可以明确告诉大家,也就是今年开始,才开始把海外的智能网联生态上车。海外市场不像国内互联网这一块发展的很成熟,衣食住行各方面都有,但是海外很多市场,像中东的那些国家,可能每个国家都很小,差异化很大,很多生态都很分散,所以很难统一。
现在可以明确告诉大家,现在我们在说大模型上车,基本上当前还没有考虑海外市场,讯飞的李总也在,我们海外市场也是借助他们的语音能力,但是你说西班牙语、波斯语还在训练,至少今天我给不出答案,客观的情况就在这儿,国内目前为止还在把大模型如何上车这件事情想办法怎么琢磨明白。
从我来看,我们做大模型,把它分成一纵一横两个维度,现在说大模型为什么很多人很兴奋?原因就是座舱的智能化从之前的感知阶段变成认知阶段,这是一个智能化水平的跃迁,这个跃迁带来了很多之前没有走过的路,有无限的可能,所以导致了很多人都在提大模型,但是不知道为什么这么火,车厂也有很多,他们也是搞不明白,大模型到底是什么东西,拿过来怎么用,反正就是要用大模型,这个就是从感知智能向智能阶段跃迁,感知智能我们都很清楚,对于外界的感知,但是认知智能是需要基于这个感知要做理解,理解过了以后,要做对应的推理、联想,做出了超出我们人的理解范围之外的东西,所以纵向维度主要是智能化的跃迁,给整个行业的发展带来的可能性,也就是带来了很多可以做的生意,对车来说就增加他的卖点。
由于这个上面的智能化的紧接进阶,就带来业务维度,从产品,到技术,到运营,大部分都是围绕着不同业态推我们的基础模型,领域模型,小场景、小模型。产品这个角度经常提到AIGC,智能化的场景,你用模型基于我们已有的经验创造出用户感兴趣的,不是现在很多都是按照产品经理,按照规则化的东西设计出来的东西,而是基于你的输入和用户的标签,包括你的车定位,能够自己推理,目前所有的产品经理朝这个方向努力,把过去的感知智能化,到现在生成式人工智能,新的场景、新的功能和服务做这个事。
技术层面来说,怎么提升我们的研发效率,这个就需要整个行业的协同,就涉及到多模的模型基座,到供应商做的领域上的专门的技术模型。
还有研发过程当中,我们刚才说到技术的应用,还有提升技术效率的,关注的人不一定特别多,但是确实是实际情况,我们开发效率也是通过大模型可以解决的,现在已经有人做代码的自动生成,这样的公司还不少。但是这是一个好事,但是未必全是好事,我们一会儿再说负面的东西,能够自动生成代码,甚至基于你的bug库,能帮你把软件bug解决方案能够给你提供一些思路,能够帮助你快速地去解决bug,还有包括一些产品做的需求的挖掘,基于既往的产品库,也许智能座舱有1000个,甚至成千上万,基本上功能加法做的特别多,真正的不能一款车都上,上哪些,每个车上面用户定位不一样,上什么样的定位需求可以让模型做一个判断,甚至是初步的,这是技术层面的基座或者工具化的东西。
剩下的就是运营,运营就是可以生成很多内容,生成文字型、图片型的新媒体。
我还说两点大模型值得我们考虑的问题,现在大模型对于我们整个行业的反噬,为什么呢?现在张嘴都是大模型,但是未必所有人都理解大模型,看到代码能够自动生成,老板就想是不是可以把人员优化了,这是不是一个情况?真正大模型能干什么事情,没有搞明白,闭着眼睛就是投资也好,做方案也好,就把大模型都拉上,但是未必所有的东西都通过认知的方式解决,模型只是基于世界已有的知识联想和创造,没有办法真正的代替人做新的架构,新的理论,做这方面解决问题,这是第一个,对于我们行业造成反噬。
第二,知识产权的问题,大模型基于从互联网上面的内容,包括代码上面的代码,如果这个图片是我设计的,带有知识产权,我申请了发明专利,但是你用的不是一家,势必会对未来你生成内容的知识产权的问题怎么解决,尤其是拿来做商用化,用来做个人的研究没有关系。比如说奇瑞如果申请一个图片做商城上面图片的买卖,我怎么界定知识产权?大模型引用了10家发明专利,是不是10个人都来告我,我如何争辩,这是大模型是个好东西,但是如何能够ToB、ToC,技术层面、业务层面对我们赋能有没有清晰的认识,真正的理解它,其实这个行业里面还是要进一步思考这个问题。
数据有多重要?殷程良:谢谢,何总不光正面的讲,也提出负面的问题,上一场说了半天是帮我们提前做了大模型和智能座舱的问题,其实也提到单机的问题和互通互联的问题,还有未来信息安全和数据安全的问题,这都是问题。
下一个问题倒着来,现在做人工智能是有三要素的,我们今天只提到了一个,最底层的算力,第二个才是今天的主题算法、模型,还有第三个是数据,这是最重要的三要素。
从整车厂,奇瑞的基础训练,你的服务器,你的算力大概是多少,是你自己的吗?跟别人的有没有差距,差距在哪儿,谁是你的合作伙伴?第二,你的数据积累了多少,能够进行这类成规模的,怎么考虑数据和算力的问题?
何雷:这个其实也探讨过,就是关于算力,关于数据,我们车厂自己不会建专门的算力中心,买A100、A800的算力卡,我们不做基础的模型,我们会做一些领域相关的,比如说座舱相关、自动驾驶相关的模型训练。至于说具体的算力是多少,坦白说我还没有做这方面的工作,我给不出答案。但是我知道奇瑞在业务数据这块是非常大的,基本上可供给的每一个方向的数据级别都不会低于BP级别,我们车厂里面的生产制造数据、各种各样的设计数据、用户数据、车厂需求性的数据,这个数据量很大,但是现在还没有专门针对大模型去建算力中心,或者说算力中心也是刚开始,我们在摸索,不像王总在技术模型上已经有明确的答案了。
姚振:首先,因为腾讯不造车,我们也没有合资造车,这块涉及到算力比较大的自动驾驶这些场景,车联网这些场景我们自己没有,我们更多是帮主机厂去建,去年也是在上海松江建了行业第一个智能汽车专有云,提到信息安全就涉及到自然资源部的法规、信息部的《个保法》《网络安全法》《数据安全法》等等,限制都比较多,因为涉及到位置信息等等,所以自驾领域,从采集到标注,到编译这套体系我们是有的,但是这个是给主机厂用的,不是我们自己的数据。回到我们自己的数据,比较强的就是用户的数据、消费者的数据,不管是微信、游戏,这块数据量非常大,我们自己的通用大模型混元也好,包括行业做的营销的应用也好,智能客服的应用也好,都会跟数据做打通,当然是在《个保法》的基础上,通过联邦学习的方式去做隐匿查询等等用户画像和线索评级的应用,这里面涉及到算力,我们自己说实话,不光对客户提供,自己GPU也是非常紧张,因为禁令的原因,最近我们都在测试国产的GPU,这个问题不解决,可能很难往下推动。
殷程良:您建模型建得很好,模型基于的算力是您自己的,还是别人提供的,数据有关的,有请李总。
李维:数据怎么强调也不过分,最后想来想去,整个大模型的趋势叫AGI,从OpenAI推动,最后就是边界越来越大,慢慢渗透到不同的领域,如果在车载领域当中,把车窗的交互和其他的人工智能的体验做上去,最后的护城河就是你的数据,因为你在别的方面没有办法跟真正的通用的大模型的滚滚的往前走的车轮比。
说了半天,你的数据没有积累,没有优化体验的话,我干吗要用你车载的交互,我带上一个手机,手机通上一个大模型,不就把你想要的聊天、情绪陪伴也好,或者问一些知识也好,甚至给我说到石家庄,三天的旅程怎么安排,现在都可以做到了,你做了半天不也是类似的活吗?所以你必须要把自己场景的数据,特别是体验优化到极致,积累到一定程度,这个时候大模型的浪冲过来的时候,不会把你冲走。
殷程良:数据非常重要,数据集非常重要,数据大非常重要,数据多非常重要。
李卫兵:殷老师问了两个问题,一个算力,其实对于讯飞来讲,众所周知的原因,我们做大模型起步开始就强调数据算力的安全性,我们也发布了基于华为昇腾芯片的星火大模型的底座,我们跟华为做了非常深入的合作,把昇腾算力的潜能挖掘的非常大。
我也非常认可数据对于模型效果的提升和保障,科大讯飞作为汽车行业ToB 20年做语音交互积累深厚的公司,我们服务于几乎中国所有的主机厂,合资品牌也有,我们经历了指令性的语音、规则式的语音,到今天大模型的语音交互,车内语音交互方面,我们在行业的积累,不客气的讲是最深的,我们装机超过5000万台,跑在中国大地上,现在已经跑向全球,服务于多少万车主的交互数据,这都是我们跟车厂共同的资产,数据在车厂,但是积累的能力体现在模型上那是在我们这儿。我们未来在汽车领域更多的是提供通用能力,每个车厂在上面再去做特有的特色,我们ToB天然的劣势就是不能直接拥有数据,而是车厂给我们的数据,需要解决一些问题,提供给我们的一些数据。所以我们服务了这么多企业、用户,ToB的基因,数据这块我们有信心快速地把大模型新一轮科技的红利带到消费者面前。
王继明:我回答一下数据的事情,算力众所周知大厂们比较有优势,我是指互联网大厂有优势。长城近两年开始,几乎所有的车都是联网的,所以数据的底座,在合法、合规的前提下,我们已经积累了大量的跟长城车主相关的数据,我们自己有很多数据是花钱存起来了,但是数据的价值没有挖掘的很好,我们也在和合作伙伴一起想如何挖掘,这个事情不止是长城一家的困惑和难点,别的友商也有这样的问题,大家都会收很多的数据。
刚才我们说的是存到服务器上是理性的数据,不是实时,我们还有一个数据需要使用,车作为智能座舱,目前为止车有大量的可以去采集人的信息、车的信息、周边环境信息的传感器,这个数据基于各种原因,实时性、带宽或者合规性,是只能留在本地使用的,这一块就意味着对我们有一个要求,我们后续在车上应该也要具备某一个很强的计算单元,这个单元在车上能够把数据做好,做成端到端,多模的信息采集、处理交互的能力,最终给用户提供服务。
殷程良:最后请商汤王总,他们花了50亿建了那么大的数据,算力上已经投入了非常大,你们怎么看这个问题,包括未来如何更新?
王晓刚:我们目前是3万块高端的GPU,明年英伟达、特斯拉是到10万块,现在是14000块,而且那10万块是H100、B100,我们国产化的芯片只能是7纳米,所以未来就是以空间换时间,别人1000块芯片能做的,我们可能要用1万块、10万块,所以将来导致的必然是算力的集中化,所以将来不会再出现百模大战,一定是少数的集中到算力集中的资源,大模型未来发展的趋势还在加快,这一定是体系化的竞争。
殷程良:说实在的,这个也是我在思考的,百模大战,300多个大模型,还有500、800,但是把理论建模的框架弄出来,可能不那么费劲,但是你要把它训练成非常有用的模型,拿多少数据去喂它,用多少算力,花多长时间那是不得了的事,我刚才讲的就是这个问题,为什么我们的车号称可以直线行、小弯道行,但是一复杂就不行,就是因为你的算力远不如人家,你的数据的积累远不如人家,所以真真正正到最后,我是同意王总的观点的,总会去伪存真,总会合、合、合,最后整合到比较头部的企业,他们拥有强大的算力,又有大量的数据,把模型训练的比较好,这个时候就脱颖而出了,其他的就是市场淘汰的问题了。
Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved