2023WAIC 观察| 大模型“扎堆”，当大家谈论“大模型”时，究竟谈了什么（合合合合成神龙）

在2023世界人工智能大会展馆和论坛“泡”了2天多，所到之处，听到或看到的，基本都是：“大模型”、“生成式AI”、“AIGC”。

相比去年大家对元宇宙的有争议的热情，今年这届WAIC世界人工智能大会，业内对“大模型”发展未来的共识，竟然高度相似。

大模型“百花齐放”，尽管有海外产品的对标，展台的人潮汹涌，论坛期间的观点火花碰撞，无论从底层基础设施的建设、还是行业和场景的落地，甚至商业化的路径，WAIC 像是一场在“无人区”的大型探索的现场。

30多个大模型如今在WAIC上“集结”，经过过去半年多行业的快速进化，如今当企业大咖、专家学者谈论“大模型”时，他们究竟又来谈论什么呢？又有哪些启发性的观点和见解？

观点一：大模型“泛滥”？还只是初级阶段

这届WAIC期间，不仅有超过30多个大模型亮相，大模型、通用人工智能、生成式AI等相关的论坛超过50场。如此集体性的亮相和讨论，意味着什么？

“现在还是大模型发展的初级阶段，我们希望百花齐放，希望整个业态发展起来。目前，技术还在快速发展中，行业也在快速发展，大模型应用什么程度，也在不断变化中，所以说这只是大模型发展的初级阶段。”腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声接受采访时表示。

阿里云CTO周靖人也在接受采访时表示，通用人工智能，大模型引发的整个时代的变化，可能是我们这代人经历的少有的一波巨大机遇。“随着算力不断发展，数据不断膨胀，整个算法的创新和迭代，业界已经涌现各种各样的模型，能够把各个人工智能的能力发挥出来，影响各行各业。”

“大模型的突破掀起了人工智能的新一轮技术革命，随之而来的是产业需求呈现爆炸式增长，全新的应用场景和应用模式正迅速涌现。商汤希望通过‘大模型大装置’持续推动AI基础设施能力的跃进提升，不仅打造通用能力更加强大的基础模型，也进一步高效融合不同垂直领域的专业知识，构建更懂行业、更具专长的专业大模型，从根本上降低大模型的下游应用成本和门槛，让大模型的产业价值在千行百业中绽放。”商汤科技董事长兼CEO徐立说。

昇腾计算业务总裁张迪煊也在WAIC期间分享认为，大模型在深入行业，AI 在驱动科学计算，在超大的 AI 算力及创新算法的加持下，人工智能正在快速发展，进一步影响甚至改变着我们的世界。“任何一个通用目的技术的边际成本逐步降低时，将从创造出远超预期的社会价值和经济效益，据预测生成式 AI 将创造万亿级别的数字经济的增长。从支撑加速到现在成为经济增长的核心引擎。”

综上，我们基本上得出一个结论，大模型不断涌现的背后，跨时代的机遇正在迎面而来，我们需要做的就是抓住它！

观点二：大模型都处于几何级的迭代进化中

过去几个月，各家纷纷发布“大模型”，让人感到惊讶的是，不管是新发布的大模型，还是几个月前的大模型，进化能力和发展速度，实在是太快了！

比如商汤的自研生成式大模型商汤秒画SenseMirage 3.0的模型参数，从今年4月首次发布以来的10亿提升至70亿量级，能够实现专业摄影级的图片细节刻画。商汤如影SenseAvatar 2.0数字人生成平台相较1.0版本的语音和口型流畅度提升30%以上，实现4K高清视频效果，并带来AIGC生成形象及数字人歌唱功能。

同时，商汤琼宇SenseSpace 2.0的空间重建效率提升20%，渲染性能提升50%，每100平方公里场景的建图时间仅需38小时即可完成（1200 TFLOPS/秒算力支持）；而商汤格物SenseThings 2.0对小物体的纹理及材质还原达到毫米级精细度，并突破对高反光和镜面物体的采集难题。

百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰在WAIC期间分享说，百度文心大模型3.5版，实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等，模型效果提升50%，训练速度提升2倍，推理速度提升30倍。

而7月6日在WAIC开幕式和科学前沿全体会议，上海人工智能实验室（上海AI实验室）与商汤科技联合香港中文大学、复旦大学、上海交通大学及清华大学发布全新升级的“书生通用大模型体系”（以下简称“书生大模型”），包括书生·多模态、书生·浦语和书生·天际等三大基础模型，以及首个面向大模型研发与应用的全链条开源体系。

其中，书生·天际（LandMark）是上海AI实验室联合香港中文大学和上海市测绘院发布全球首个城市级NeRF实景三维大模型，具备千亿参数，在全球首次实现对100平方公里城市实景进行4K高精度建模以及编辑。

而书生·浦语（InternLM），作为国内首个正式发布的支持8K语境长度的千亿参数级语言大模型，具有1040 亿参数，是在包含18000 亿 token 的高质量语料上训练而成。自今年6月正式亮相后，书生·浦语在一个月内进行全面升级，比如语境窗口的长度从 2K 提升到 8K，这使其具备了理解长输入、展开复杂推理、以及进行长时间多轮对话的能力；新版模型支持二十多种语言，还可通过表格和图表等方式汇总与呈现复杂信息；在数学评测集 GSM8K 上性能从 62.9 提高到 73.2等。

可见，大模型的迭代、进化是非常快的，需要我们用发展的眼光看待它。

观点三：从单一大模型，到大模型生态

“阿里云将把促进中国大模型生态的繁荣作为首要目标，向大模型创业公司提供全方位的服务，包括最强大的智能算力和开发工具，并在资金和商业化探索方面提供充分支持。“阿里云CTO周靖人在2023WAIC期间说。

阿里云CTO周靖人认为，动辄超千亿参数的大模型研发，不是单一的算法问题，也不是靠简单堆积GPU就能实现的。大模型的研发，是囊括了底层算力、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程，需要AI和云计算的全栈技术能力。大模型的应用落地更是需要丰厚的生态土壤。

据了解，阿里云魔搭社区自推出，如今已聚集180万AI开发者，以及由20多家顶尖人工智能机构贡献的900多个优质AI模型，阿里云正努力把魔搭社区培育成中国最大的“大模型自由市场”。

华为也表示要进一步坚持开源开放，做强昇腾人工智能产业生态。为了进一步推动大模型创新，华为联合26家金融、运营商、互联网等行业领军企业，科研院所和高校，共同启动昇腾AI大模型联合创新。华为表示，将基于昇腾AI提供澎湃算力与高效开发工具，携手伙伴、客户一同提升大模型开发、训练、微调、部署的效率，加速大模型创新业务上线。

腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声也表示，大模型是代，开放很重要，因为大模型外延的领域非常广。AI大模型技术发展和产业探索，离不开产业链协同和生态共建，腾讯希望与行业伙伴携手，共同推进大模型在产业领域的创新和落地。

观点四：MaaS，成为行业标志

“去年我们在业界首次提出了MaaS，以‘模型即服务’的概念定义AI开发的新范式，MaaS提出不到一年，被大家广泛接受，已经成为我们的行业标准。”阿里云CTO周靖人2023WAIC期间分享说。

在周靖人认为，MaaS有几层含义，最底层的含义是要把模型作为重要的生产元素，围绕模型的生命周期提供各种各样的产品和技术。另一层是围绕模型的生态发展，聚焦行业，有行业的专属模型，甚至到某一个企业，根据具体的应用场景，还有企业或者具体场景需要的专属模型，模型正以层次化的结构不断发展、不断创新。此外，模型不光是在云上，在端上、IOT设备里面也发挥了一系列的作用，今后，完整的模型生态不光是今天涉及到的云端，还会有手机端和随身设备，模型在无形之中也形成了立体的服务机制，服务生活的方方面面。

2023WAIC期间，腾讯研究院、同济大学、腾讯云共同发布《人机共生——大模型时代的AI十大趋势报告》中指出，在AI助力产业发展方面，MaaS（Model-as-a-Service）服务和垂直领域应用将是大模型时代AI发展的重要趋势，通过建设可控、可用的安全生态，推动模型的落地和应用，AI技术将为各行业带来更多的机遇和挑战。

腾讯云6月19日首次公布行业大模型研发进展，依托腾讯云TI平台打造行业大模型精选商店，为客户提供MaaS一站式服务，助力客户构建专属大模型及智能应用。据悉，目前腾讯云已经为传媒、文旅、政务、金融等10余个行业提供了超过50个大模型行业解决方案。

优刻得则以MaaS模式，推出“算法模型镜像市场”，上线Alpaca-LoRA7B、ChatGLM-6B、T5-Base、T5-3B、MiniGPT-4、Stable Diffusion 、Milvus向量数据库等7款开源模型和工具，覆盖知识推理、问答、图文生成及绘画设计等 AI 应用领域，通过“大模型大算力”的方式，提供一键部署和开箱即用能力，为用户快速搭建大语言模型的微调或者推理环境。

观点五：更关注大模型的底层算力，尤其是智能算力

大模型的发展，算力尤其是智能算力，成了稀缺资源。

特斯拉创始人兼首席执行官埃隆·马斯克在WAIC开幕式上以视频的方式说：“我们已经见证了数字计算能力的爆炸式增长。一个关键指标是数字计算机与生物大脑计算能力之比。这意味着人类与机器之间的算力比率不断增加，从而拉大了机器和生物之间的算力差距。随着时间的推移，人工智能在整体智能中所占比例将逐渐降低，相对于机器智能而言，这将是一个根本性的深刻变化。尽管现在很难完全理解其影响，但这可能是人类历史上最为深刻的时期之一。”

中国工程院院士、鹏城实验室主任高文院士说，从现在开始，算力也是数字经济发展的一个指数，你算力够，你的数字经济就能够发展好，不够就发展不好，特别是智能算力就非常关键。

华为轮值董事长胡厚崑就在WAIC期间表示，算力是人工智能产业创新的基础，大模型的持续创新，驱动算力需求的爆炸式增长。可以说，大模型训练的效率或者是创新的速度，根本上取决于算力的大小。华为充分发挥云、计算、存储、网络以及能源的综合优势，推出了昇腾 AI 集群，相当于把 AI算力中心当成一台超级计算机来设计，使得昇腾 AI 集群性能更高，并且可靠性更高。“据我所知，目前我们已经可以达到 10%以上的大模型训练效率的提升，可以提供 10 倍以上的系统稳定的提高，支持月级不中断的长期稳定训练。”

华为昇腾计算业务总裁张迪煊也透露说，在算力层面，今年年底明年年初，华为昇腾将做到超过 16000 张卡的集群，成为业界首个万卡的 AI 集群。“我们评估了一下，一个 1750 亿参数，一个 100B 数据的一个模型，大概需要半天时间就可以完成。”

“在基础设施层，阿里云拥有国内最强的智能算力储备，阿里云的智算集群可支持最大十万卡GPU规模，承载多个万亿参数大模型同时在线训练，为大规模AI集群提供无拥塞通讯的自研RDMA网络架构和低成本高可靠的高性能存储CPFS。”阿里云CTO周靖人表示，在AI平台层，以机器学习平台PAI为核心的PaaS服务可支持万卡的单任务分布式训练规模，覆盖全链路AI开发工具与大数据服务，AI训练效率提升可达10倍，推理效率提升可达6倍。

腾讯云今年早些时候发布了面向大模型训练新一代HCC高性能计算集群，整体性能比过去提升了3倍。而就在过去一周，腾讯云首次完整披露了自研星脉高性能计算网络，能提升40%的GPU利用率，节省30%~60%的模型训练成本，为AI大模型带来10倍通信性能提升。基于腾讯云新一代算力集群HCC，可支持10万卡的超大计算规模。最新发布的AI原生向量数据库最高支持10亿级向量检索规模，延迟控制在毫秒级，相比传统单机插件式数据库检索规模提升10倍，同时具备百万级每秒查询（QPS）的峰值能力。

燧原科技则在今年发布了全新文生图MaaS平台服务产品“燧原曜图™（LumiCanvas™），该产品基于燧原科技屡获殊荣的“邃思”系列芯片提供算力，通过软硬件一体的高适应性方案赋能多等领域客户群体有效降低在AIGC应用的工程上的人力投入与算力成本。据了解，当前，燧原科技携手首都在线基于燧原科技的算力以及首都在线的基础设施，以燧原曜图为切入点在多领域进行探索和实践。

燧原科技创始人兼CEO赵立东先生认为，AI芯片作为人工智能发展的核心生产力之引，是当下大模型导致的巨大算力需求与高昂的成本的“破局之道”，燧原科技将全方位降低AI算力中心部署和应用成本在AGI的时代提供普惠的算力，从而赋能人工智能产业的高质量发展。

此外，启明创投合伙人周志峰表示，算力目前是最稀缺的资源，也处于最容易获利的要津。算力是大模型成本结构中最大的一块，GPU的性能，实际上决定了这个新兴行业的步调。

观点六：加速场景行业落地，打通最后一公里

如此多大模型，如何和行业、场景结合，打通最后一公里，也成为此次WAIC的重要关注点。

上海人工智能实验室（上海AI实验室）与商汤科技联合香港中文大学、复旦大学、上海交通大学及清华大学发布的全新升级的书生通用大模型，已助力自动驾驶、智慧医疗、地球科学等多个产业和领域推动智能化进程。

比如在智慧医疗方面，上海AI实验室牵头推出了全球首个医疗多模态基础模型群“OpenMEDLab浦医”，为人工智能大模型在医疗领域的快速发展、高效落地提供了坚实的基础。在地球科学方面，全球中期天气预报大模型“风乌”首次实现气象有效预报时间首破10天，同时“风乌”仅需30秒即可生成未来10天全球高精度预报结果，在效率上大幅优于传统模型。

华为轮值董事长胡厚崑在WAIC期间强调，华为下一个阶段将会全力推进 AI 技术 " 走深入实 "，所谓 " 由深向实 "，华为有两个关键的举措或者说两个抓手，一方面是深耕算力，打造强有力的专利底座来支撑中国的人工智能事业的发展。另一方面，结合大模型，从通用大模型到行业大模型的研究创新来真正让人工智能服务好千行百业，服务好科学研究，服务好科研创新。

腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声认为，产业场景已经成为大模型的最佳练兵场，不过大模型虽好，但用起来还是有很高的门槛，尤其对一些传统领域企业而言，通用大模型无法精准适配、达到降本增效的预期。企业需要的，是在实际场景中真正解决某个问题，而不是在100个场景中解决了70%-80%的问题。针对这些问题，腾讯在6月19日推出了腾讯云MaaS一站式行业大模型解决方案，并已经联合金融、文旅、政务、传媒、教育等十多个行业头部客户，共同打造了超过50个行业大模型解决方案。

比如在文旅领域，在金融领域，腾讯助力中金所技术公司，打造自有模型，降低技术开发与运营成本，支撑多部门业务。针对资源、开发等需求，基于腾讯云TI平台能力，实现资源统一调度，按需扩缩容，降低开发门槛、成本，提高模型开发效率，支持投服部等部门的舆情数据分析场景，每日调用峰值高达1亿次，整体调用成功率超过99%。

商汤也正积极通过大模型的多模态能力组合赋能产业升级。在医疗场景，商汤基于海量医学知识和临床数据打造了中文医疗语言大模型“大医”，提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力，未来也即将支持医学图像、文本、结构化数据等多模态综合分析，持续赋能医院诊疗效率及患者服务提升。

面向线下场景，商汤通过大模型能力为电网巡检带来长尾故障识别、复杂缺陷判断等智能解决方案。基于琼宇2.0的空间重建，商汤为济南马山镇区域开发、合肥中国视界园区、上海瑞金医院等打造实景空间的数字孪生，提升运营管理效率。在珠宝行业，依托格物2.0商汤为珠宝品牌进行珠宝首饰复刻，细致展现商品工艺特点，提升顾客购物体验。

可见在中国大模型大发展中，不仅仅是技术和性能的迭代，同步进行的还有行业和场景的探索式落地。

观点七：安全、可控，依然是重要命题

在大模型发展的过程中，是否安全可控，如何监管，也是一个重要考量的指标。

商汤表示，要倡导“发展”的人工智能伦理观，并积极参与有关数据安全、隐私保护、人工智能伦理道德和可持续人工智能的行业、国家及国际标准的制订，与多个国内及多边机构就人工智能的可持续及伦理发展开展了密切合作。

阿里云则称能够满足大模型企业在不同场景的数据安全要求。阿里云是亚太区最早布局可信计算和机密计算的云服务厂商，在业内首个推出基于SGX2.0和TPM的虚拟化实例。基于TPM、VTPM、虚拟化Enclave等技术，阿里云构建了基于神龙安全芯片的全隔离、高可信的计算环境，并通过硬件层、虚拟化层、应用层三种形态的机密计算能力，确保用户数据的机密性、可用性、完整性。

此次WAIC期间，优刻得董事长兼CEO季昕华则强调中立安全云计算助力大模型发展，“优刻得作为中立第三方，与大模型企业没有竞争，不触碰用户的隐私数据；同时，优刻得具有内资背景，系列安全防护产品及数据保护机制，确保大模型训练稳定可靠运行。并支持私有化部署。”

同时，此次WAIC，蚂蚁集团联合清华大学发布AI安全检测平台“蚁鉴2.0”，作为本届大会的“镇馆之宝”，蚁鉴2.0能够实现用生成式AI能力检测生成式AI模型，可识别数据安全、内容安全、科技伦理三大类的数百种风险，覆盖表格、文本、图像等多种数据和任务类型，是业内首个实现产业级应用的全数据类型AI安全检测平台。

上海企业合合信息在WAIC展示的图像内容安全技术方案，也得到广泛关注，该方案可精准定位截图篡改痕迹，对生成式图片进行智能判别，防止不法分子利用技术手段非法爬取图片上的信息。

大模型每天都在快速进化，从2023世界人工智能大会开始，我们对这波通用人工智能浪潮的汹涌澎湃，甚是期待，也让我们拭目以待！