对话王小川：理想主义和现实主义，都只是AGI的二维投影（启示纪元官方版）

访谈 | 邓咏仪杨轩

文 | 邓咏仪

编辑 | 杨轩

涌现（Emergence），是生成式AI浪潮的一个关键现象：当模型规模扩大至临界点，AI会展现出人类一般的智慧，能理解、学习甚至创造。
「涌现」也发生在现实世界——硅基文明一触即发，AI领域的创业者、创造者，正在用他们的智慧与头脑，点亮实现AGI的漫漫征途。
在新旧生产力交替之际，《智能涌现》推出新栏目「涌现36人」，我们将通过与业界关键人物的对话，记录这一阶段的新思考。

欢迎关注

很难想象，近十年里有哪个尖端技术的普及速度能像大模型一样快：从ChatGPT横空出世，到如今国内热烈讨论落地和商业化，仅仅过去一年多的时间。

但对承载了巨大期待的一个行业而言，现在的进展很难说令市场满意。多数AI应用或者项目都尚在襁褓之中，又或是昙花一现——目前国内流量最高的AI应用，DAU不过百万级别；靠AI收割第一波财富的不是从业者，而是卖199元AI课的“卖课大师”李一舟。

这种失意随着近期的商业化讨论不断发酵。不少投资人认为，埋头做AGI（通用人工智能）希望渺茫，一旦国外有新一代模型开源，很多投入就是徒劳。

选择摆在创业者们面前：是一路直冲，将Scaling Law（规模定律）拉到最高，无限接近AGI；还是“见好就收”，尽快让技术落地赚钱，快速投身到中国的商业社会里？这两派观点随着投资人朱啸虎、月之暗面创始人杨植麟的近期发言，在业内引发了争议。

王小川所创立的百川智能，试图找到一条更“立体”的路径。

“我觉得每一种主义都是看待世界的一个视角，一个投影，但他不代表全部的真相。”王小川将其概括为八个字“盲人摸象，小马过河”。

王小川的许多观点，有着上一代中国互联网竞争的影子：他的上一个公司搜狗，从诞生起就面临百度、360等对手的围追堵截，因此要快速想明白如何落地、生存。

上一次36氪与王小川对话时，百川刚刚成立，当时他就极为强调要“双轮驱动”，技术和应用要并行地做。

在王小川躬身入局整整一年后，我们看到他更多的新思考。他的核心观点在于：AGI的最终目的是要“造人”，所以单纯找个场景，造一个工具或产品，意义不大。

同时，考虑到国内市场的现实情况——无论是人才还是资金都有限，短期用巨量资金砸出规模巨大的模型，这并不现实。

“AGI的理念肯定要有，但在爬AGI的高山时，也要考虑找好'补给站’。”王小川表示。

医疗是现在百川押注的重要方向，百川智能希望能利用大模型真正造出AI医疗助手，从而实现生命模型的目标。这是王小川想出的当下中国AGI的可行路径：既和AGI的目标同频，数据和场景也都还没有被大公司所垄断。

王小川对技术和商业都保持乐观，也希望市场能够给这个赛道更多耐心。他认为，中国大模型的进展远比大家想象的要进展迅速。“去年这个时候，大家都特别担心中国能不能跟上GPT-3.5。但今天大家在问：什么时候能到GPT-4？”

一切看起来都还为时尚早。2024年元旦期间，王小川收到朋友的祝福信息，他乐呵呵地回复：“智能纪元贰年快乐！”

“去年是智能纪元元年，今年是第二年，”王小川说，“我认为我是看到了未来的模样。”

以下为36氪与王小川的对话，经整理编辑：

高看或俯视技术，都会错失很多机会

36氪：最近AI圈还挺热闹，金沙江的朱啸虎最近公开表达的观点引起了广泛的反响，里面也提到了你，最近看这篇专访了吗？第一反应是什么？

王小川：好多朋友转给我，转给我还说：哈哈，这是在夸你，夸百川。我也看了，里面提到我三四次。

其实他也没有对我个人的，或者对百川的负面情绪，这个不代表朱啸虎完全没有AGI理想，只是他对今天大模型这个事情是非常悲观和负面。文章里的语言表达也比较率真，这还挺有喜剧感和冲突的。

36氪：他抛出很多观点，包括大模型这件事创业公司没有资格做，也许终局是卖给大公司，不赚钱的公司不投等等。按百分比来看，你多大程度同意他这些观点？

王小川：我80%是同意的，场景确实很重要，有场景才有生意的本质。这是很率真、真实的表达，逻辑很自洽。第二，这也是对他自己的LP负责任的做法。在他的生意本质里面，他现在只能投他觉得靠谱的事情，不能投太高风险的事情了。

他（朱啸虎）说看不见，想不清楚，那让他相信的唯一办法，就是做出来给他看。那我也接受部分投资人有这样的想法。

36氪：那不同意的部分是什么？

王小川：他对大模型并没有直接的体感。

我觉得做技术投资有两种角度，一种是高看技术，觉得技术有一种光环，能干这个能干那个。

另一种视角是俯视技术，更多是看技术的价值、场景、PMF，能不能解决具体的问题。这种投法不会犯大错，不会投出一个特别不成功的企业。但在生成式AI会带来颠覆性机会的时代里，我认为这可能会错失很多机会。

36氪：今天你感受到业界最关心、最应该讨论的问题是什么？

王小川：就是能否做出超级应用。

你如果没有超级应用就投那么多钱，没有超级应用出来，怎么办？所以朱啸虎就说不投，然后月之暗面就说scale，模型好了以后应用就自然有了。但我觉得他们都没有谈场景本身。

36氪：你觉得你偏向哪一派？

王小川：我觉得每一种主义都是看待世界的一个视角，一个投影，但他不代表全部的真相。

我更愿意用一个人生哲学来解读，就八个字：盲人摸象、小马过河。他们都是只看到各自世界的投影。

36氪：怎么解释？

王小川：我觉得我会更完整地看到这只象。

这是个升维的概念，比如我们画个图，一个圆柱体，你从上往下看，它是个圆。但你平视着看，是个方形，你非要说方对还是圆对呢？它到底是哪个东西？其实它是个圆柱体。

小马过河的意思是，每个公司、投资机构都有自己的角色和选择，我们也不是上帝，而是要做自己。

去年我去美国的时候，我看到OpenAI的登月计划，是要把1000万张GPU连在一起做计算。英伟达一年生产的高端芯片也才100万张，所以美国想的是未来能源会不会不够用。

那么中国有自己的定位，比如朱啸虎就更像是看小花小草，我不求你做多大，但你能尽快找到场景，尽快赚钱。

企业供图

36氪：朱啸虎的观点多大程度代表现在的投资人的意见？你觉得他们为什么会那么想？

王小川：我觉得挺正常的。做大模型的颠覆性变化在于，一是模型越大效果越好，它能掩盖掉小模型，所以投资不是说一个固定投入，就可以开始有收益，而是要持续不断地投入。

二是模型和应用的关系发生了变化。随着模型体量越大，很多应用也被碾压了。对于投资来说，如果你没有对某个场景很有把握，那投资就是个无底洞。

甚至美国也没有给我们带来什么榜样。以前我们的习惯性做法是，美国把技术解决完了，技术已经不是问题了，我们再去做场景，但现在不是。

这种情况下，投资人不适应是正常的，投资方法也确实会发生变化。

36氪：朱啸虎是上一波移动互联网时代里，坚定投To C方向，注重规模的那波投资人。所以他今天讲出这样的观点，会更让人出乎意料。

王小川：他是我很尊重的投资人，但不同时代有不同的投资选择。

上一个互联网时代，大家都是做让生产关系有变化的平台，滴滴、抖音，都是做连接匹配的，这是生产关系的变革。但今天的大模型，是直接提升生产力的。所以改变投资方法，我觉得也特别正常。

36氪：对创业者，上一个时代的打法也不适用了。

王小川：不行的。有的公司说我现在拿这个大模型，学习之前字节的那种APP工厂的做法，看哪个跑出来，那我觉得反而是走得更偏了。很多东西是不能复制的。

包括我们这次创业发现，在很多技术定义上，3年、8年的这种经验没用。现在做大模型最好的就是刚刚毕业的博士生，而且之前就是参与大模型研究的。经验越多，可能变得包袱越大，需要更多变化调整。

模型即应用，核心是找到TPF

36氪：做大模型也做了一年了，你这一年下来整体感觉怎么样？

王小川：有种市场的“推背感”，技术发展太快了，每天都有新的论文，从Pretrain（预训练）到SFT（监督微调），数据从公开网络数据到合成数据，研发节奏非常快。

36氪：这一年的商业化情况怎么样？

王小川：现在商业化远不在我们这样的关键词体系里面。

36氪：你去年去美国考察完之后，说目标要变成“技术上慢OpenAI一步，应用上快三步”，技术要提速。和你刚刚说的相悖吗？

王小川：落地不等于商业化。你得更有应用导向、场景，在场景端先把价值创造出来，这就叫落地。无论是百度还是抖音，第一天也不是先商业化。

我们今天最要解决的问题，就不是Money这个事，是TPF（Technology Product Fit），而不是PMF（Product Market Fit）。

36氪：这和以前说的PMF区别在哪？

王小川：讲PMF，是因为我们以前默认技术不是事儿了，已经可以用了。但大模型是之前的时代没发生过的问题。哪怕在美国，现在也还是只能让技术解决一切问题。技术有了，场景自然也有了，这是不同的做法。

36氪：国内几乎所有做大模型场景都在说，我们要做模型，我们要做应用，双轮驱动。百川也说双轮驱动，你们跟市面上的厂商有什么不一样？

王小川：我们认为模型即应用，同时我们定义的三个价值观（健康、创造、快乐），对应三个世界（生命世界、真实世界、虚拟世界），你们应该没听到第二家这样讲的。

36氪：具体投入到什么样的领域，决定了大家轮子的不一样？

王小川：我一直避免用场景这个词。生命模型是一个场景吗？

场景只是对应PMF（Product Market Fit）里的M，这是用户需求的概念，但这不是等于我们所认为的世界模型，我们说的这个模型是一个数学概念，是我们对世界的建模。

我们现在更多要谈的是TPF（Technology Product Fit），把TPF打穿了，先要回答大模型本质上是个什么东西。

36氪：能不能举个例子？

王小川：比如，一个模型如果是一个生命模型，那我认为健康服务和它是一体的，我就在里面做顾问、做助手。但如果是一个虚拟世界的模型，我就做娱乐。

36氪：“生命世界”、“虚拟世界”“真实世界”这三个世界的思考是怎么来的？

王小川：我是从AI怎么投影到我们所处世界的角度出发的。

我们是活在现实世界里的，但我们也知道，人有精神上、情感上的需求，是会有梦境的，这是虚拟世界。

最后一个是生命世界。它有别于真实世界，物理世界是熵增的，但生命是熵减的。

所以，创造、健康、快乐是这三个世界对应的价值观。

（36氪注：熵增、熵减皆为热力学原理，熵增现通常喻指一个封闭的孤立系统里，事物从有序走向无序——比如衣服穿久了会变旧，最终走向不可用、消亡。但据物理学家薛定谔的观点，生命是熵减的，生命的本质是一个负熵系统，人类可以通过摄取外部的能量来让自己的生命延续，让身体重新健康起来）

36氪：TPF的这个T（Technology），现在有什么可以提供10倍好于以前的能力？

王小川：大模型核心是在造“人”，不是在造工具。人和动物的区别是：第一，人会语言，这是最本质的事情，第二，人会创造使用工具。

昨天还有朋友和我聊，说大模型特别蠢，连7位数的乘法也不会做。我就说，那人也不会呀？

大模型不是精确严谨的计算器，也不是只帮你寻找信息的搜索引擎。大模型是一个智力引擎，从推理到决策，帮你做决策的。

36氪：但我们也观察到一个现象，现在AI应用整个生态里，除了ChatGPT等极少数头部产品之外，很多产品的月活可能就只有百万左右，离“超级应用”很远。

王小川：像朱啸虎讲的，现在很多应用只是“世界”里的一个零部件。现在好多应用，我认为都还没有能够产生真实的用户价值。

36氪：中间的gap主要在哪？

王小川：因为今天的模型很多都是工程师推动的，他们还是从技术去想，所以从技术到产品到marketing这些事上，之前的这样一种思考、沉淀和探索还是不够的。

36氪：所以需要不同的团队吗？比一个团队想做超级应用，应该具备什么样的素质？

王小川：每个公司情况不一样，也有人在小场景里，用小模型，也有不少人赚钱的。

今天的问题不是在于大模型无法赚钱，而是要找到通向AGI的道路上，沿途有什么好场景可以赚钱。我们不是没有场景，而是要想明白：AGI和场景的关系是啥？

36氪：如果说你觉得超级应用还没达成共识，那你自己想明白了吗？

王小川：我觉得模型即应用，这是一体的。模型代表了是你所创造的数学模型对世界的反映。第二是，现在这个模型为什么样的价值去服务？我觉得我们要回答这两个问题。

在AGI的路上，要找到同频或更高的场景

36氪：你说大模型核心是在造“人”，那你怎么思考AGI当前的实现路径？你对实现AGI有多坚定？

王小川：AGI的理想是不可绕过的一个话题，必须要有。

我觉得实现AGI有两个路径，一是把技术做足够好、足够大之后，问题都解决了，不需要Prompt了。

第二是，在模型还没到那么大规模的时候呢？在爬这座山的时候，我们还要在中间找补给站。

我们并不是只走研究技术问题的路线，而是更希望让技术来支持我们“造人”这个目标。

我举个例子，写广告文案不需要特别大的模型，模型做大反而会拖住你的。你再投几亿美金到GPT-4、GPT-5干嘛呢？投入产出就变成负的了。

36氪：什么样的场景才算和AGI的目标有关系？

王小川：第一，这个场景要足够终极，成长性足够大，要让大模型走到AGI的时候，才能让这个场景的实现达到完美的程度。

但同时这个场景的起点又要相对比较低，哪怕没有达到AGI，这个场景也已经可以产生价值，切入广泛人群了。

36氪：那你们要做什么方向？

王小川：原来我们想做的方向有法律、医疗，但后面我们认为做医疗是我们最懂、最心动的，法律就先放弃。

36氪：为什么这么看好医疗？百川是国内大模型厂商里对医疗场景强调最多的。

王小川：我2021年把搜狗卖给腾讯，写告别信的时候就讲了，往后20年要做大众健康和医学，其实我当时是希望做生命的数学模型。

我们知道，把物理学变成数学模型这个工作，是牛顿做的。今天的大语言模型（LLM）是把语言变成了数学，今天我讲的把生命变成数学这个事情，是不低于大模型的，它能帮助我们更好地通向更远的生命世界。

36氪：是什么让你觉得可以做得好医疗？上一个移动互联网时代，无论是巨头还是AI公司，无论To B还是To C，在医疗场景上都不能说做得成功。

王小川：我觉得大家对医疗的本质没有太理解，现在的关键是要造有医疗知识的“人”。

上一代互联网的本质，是在解决信息传递、改变生产关系的问题。医疗领域最缺的资源是医生，但医生的供给是有限的，医疗系统无法有更大的供给，所以上一代互联网做挂号什么的，也没有意义。

我们就谈需不需要的问题，我们需要更多医生吗？如果需要，那剩下的就是技术问题。

36氪：上一代AI也有做很多图像识别辅助诊断，所以你觉得也没有解决核心问题。

王小川：不work，上一个时代的AI并没有解决机器的认知问题。一个医生要和病人正常沟通，需要将学习到的知识和后来的经验融会贯通，靠以前的技术，在图像里学经验，AI是理解不了后面的概念和逻辑的。

36氪：这些人类经验知识的数据是公开的吗？数据获取的门槛会很高吗？

王小川：医疗是各个行业里数据量最充分的行业，没有之一。

医生其实就是初级的科学家，每天都要做科研写论文的，论文还不像物理学论文，给一个最底层的推导，而是要做临床干预性的实验，只要有几十例病人在里面，就是很好的论文。

从case study、RCT再到后面的Meta分析，以及大量的论文、医疗指南、专家共识等这些医学领域知识的总结都能够成为大模型的数据，这些数据以前机器是看不懂的。

36氪：相当于大模型补足了“AI医生”上学、在医院积累经验的部分。

王小川：能看论文能看指南，可以说有60分起步了。

36氪：接下来，最有可能迅速发生改变的几个功能或者场景，是什么？

王小川：我们可能还要一段时间才能给大家展示产品。但我提个很好的场景，问诊。

大模型能够有效地降低误诊率，这在很多小地方的基层医院，是个大问题。如果你颈椎有问题，如果医生经验不够，可能会诊出不同的结果，影响治疗。但有了大模型，它可以按照诊断的SOP（标准化流程）来提问，这可以充分展现它的能力。

36氪：再具体一点，你觉得你想做的这个产品，是什么？

王小川：就是助手。

36氪：在这些行业里，颠覆大厂的可能性有多少？

王小川：你得想，什么场景、数据不在大厂手里。医疗场景在大厂手里吗？要按这种逻辑来思考。

36氪：现在也有很多讨论说，大模型在To B落地，成本太高又太卷，但To C现在也没看到真正爆发的应用，有一些AI生成图片类的应用，大家会觉得昙花一现。

王小川：如果我们盖个摩天大楼，你就不能指望它三个月盖完。你盖个草棚子是很快的。等我们在这个楼里面了才会看到，这可能是个游乐场，再上面会是个医院。

36氪：现在国内大模型厂商在商业化上思路已经有分化，有的侧重To B，还有的就只做To C应用。百川To B和To C都做，有侧重吗？

王小川：我们现在主要To C，To B占20%左右，很小的一个比例。

36氪：现在国内私有化部署的大模型，单价从原来千万元级已经打到了百万元甚至更低。我们可以说，国内To B市场天花板就是很低吗？

王小川：To B确实比To C天花板低很多，现在大模型那么卷，所以这个结论是对的。

另一个对我们的启发是，如果你是模型厂商，没有独有的价值，这个游戏就变成了拼价格的事情。

快速让场景达到可用，才能成为壁垒

36氪：一年前百川刚成立时我们问过你，现在想再问一遍：现在中美在大模型上的差距有多大？

王小川：从0到1阶段的一些创新，我认为差距是在拉大的。但已经突破了从0到1，技术接近可用的时候，我们是跟进得够快的。

去年初，大家都特别担心能不能跟上GPT-3.5，但今天，大家在问，什么时候能到GPT-4？

无论是中国还是美国，大家的进步速度都不是跟中国公司相比。在美国，哪怕是Google等公司都有点跟不上OpenAI的状态。OpenAI是现在人才、算力、资金的制高点。

36氪：这一年以来，你对AGI的实现路径，或者认知和想法有什么大的迭代？

王小川：理解没有太大的变化。我们认为语言为中心，现在依然是。

我觉得更多是从愿景走到实际的体感了。原来做模型的时候，你会有一种冲动和惯性，在模型之上，把我们原有的一些能力放进去，外挂一些应用。但现在很清楚，是要把这些能力要训到模型里面去。

36氪：可以展开讲讲吗，把什么样的能力挂进去？

王小川：比如搜索，原来是像把搜索引擎挂到模型上，现在更多是想让模型懂得怎么用好搜索引擎。

36氪：用开源模型会是个问题吗？国内无论是做AI应用还是说模型层，都有基于开源模型去做的。这会导致我们整体技术上落后吗？

王小川：这不叫落后。美国很多公司也在用开源模型，开源、闭源，这两件事都是生态里很重要的事。在美国，如果不是Meta的LLAMA发布，让开源这个生态打起来了，他们也只有闭源模型。比如我们自己的开源模型，Baichuan2-13B，也让很多中国企业受益，用小模型数据去做产品。

并不是开源落后的问题，而是需要去计算，到底什么公司能够既把模型scale（规模化）到接近OpenAI的水平，同时还能保证自己活下去，这是一个关键问题。

36氪：这一代生成式AI技术发展的瓶颈，或者说现在遇到的最大问题，会有哪些？

王小川：如果沿着Scaling Law继续走，确实对能源消耗太大了，必须把成本降下来。

第二，现在有人提压缩即智能，压缩已有的数据，我们称为分布内的数据，但分布外的知识、能力，要怎么用进来？这是以OpenAI旗下Sora为代表的技术所不够的地方。Sora虽然能力强，但计算能力要求高，而且处理的只是一种快思考，缺乏慢思考的基础。

36氪：对于大模型，接下来你们要重点投入的资源会是什么？

王小川：第一，要scale的话，大家都有共识，要数据、要算力。

并且，我们所说的三个世界里：真实世界、虚拟世界，还有生命世界。每个世界里，我们要去获取和构造这个世界里面需要的这些数据，更有针对性。

36氪：什么才能造就壁垒，数据本身吗？

王小川：是能够更快地使场景达到可用状态，而不是数据本身。

现在，大家每三个月到半年，你用一半的数据训模型，只要是高质量好的数据，就能达成一样的效果。

数据质量越高的时候，对规模的要求就变小了，那训练成本也至少小一倍了。

36氪：钱也是重要资源。现在大厂的投资策略是广撒网，谁都投，你怎么看这种做法？

王小川：我觉得这就是大厂做贡献，能推动进步的方式啊。一开始有人问我们为什么不做人民币架构，做美元架构，也是有这个原因——我们一开始就觉得CVC（Corporate Venture Capital）是最该争取的，他们比纯VC能更长久地支持这个赛道，政府的角色可能没那么快进来。

36氪：今年遇到的投资人里，关心的问题会有什么不一样？

王小川：大厂更多关心算力够不够，VC关心场景咋样。

36氪：2023年以前，大模型领域融到大钱的公司就只有屈指可数的家，百川是其中之一。当时大家的融资规模大概都在3亿美金上下。最近月之暗面的10亿美金融资消息出来，是否意味着战事规模升级了？

王小川：这是正常逻辑。大家都是认为往下是需要逐步去提升这个融资规模的，是行业共识。

36氪：对百川来说，融大钱也是很重要的下一步？

王小川：如果往AGI走，你是需要大钱的。但对我而言，我可能更看重超级应用，至少让大家看到这个事，是有画面感的。

36氪：就是没有超级应用，这个大钱其实也不会来。

王小川：其实我们融的钱，按照现在的进度，也足够支撑很长时间了，我觉得你比我焦虑多了。

36氪：这是我们感觉到的业界情绪。从去年下半年开始，投资人对大模型的态度变得更冷静。你觉得呢？

王小川：肯定的。大家开始想超级应用在哪儿，否则一股脑地融资，如果没超级应用，之后融钱也很难。

36氪：现在大模型在国内拿钱已经很不容易，你怎么说服投资人再继续给你投钱？

王小川：传统VC确实很难继续投钱，风险高、看不清。我觉得往后有两拨力量，一是大厂，其实美国也是，Google、亚马逊、微软都这样。二是政府，这不是靠风险投资逻辑驱动的。

36氪：今年，国内大厂会开始并购大模型公司吗？

王小川：我觉得今年还不会。

36氪：但大厂都全都投了，还投了好多。

王小川：今天能入大厂眼的厂商，如果你做好了，你还能发展下去。但你做不好的话，人家也看不上你。

36氪：去年，全球AI圈里，你觉得发生的最重要的事儿Top 3是什么？

王小川：GPT-4发布是重大的里程碑，比GPT-3.5有巨大的提升，而且后续每一代还会有。

其次是竞争对手起来了，比如Anthropic、还有马斯克的X.AI，不再是OpenAI一家独秀。

还有一个事情是OpenAI内乱，这背后代表的是两种技术思想的分歧，而且大家都不知道AGI什么时候来，会造成多大影响。

36氪：这些事对国内来说是什么信号？

王小川：首先对中国来说我们必须跟进，如果市场上只谈商业化，那我们就完蛋了。

Sora不在AGI主线上，语言才是中轴

36氪：最近Sora让全世界都又震撼了一次，你对Sora怎么看？之前听说团队里很多人和你说要去做Sora，你还发火了。

王小川：对啊，智力是藏在语言里的。Sora既不是AGI，又不是应用。

大家肯定都有技术好奇心，有新东西总是想参与。但我坐在CEO的位置上，就是要做战略道路选择，决定做不做。

36氪：所以你觉得普遍已经超过GPT-3.5这个线了？

王小川：头部这几家大模型公司，包括大厂和创业公司，已经超过了。

36氪：你对Sora怎么看？这对做LLM（大语言模型）的人来说，有什么意义？

王小川：意义不大。

36氪：为什么？

王小川：大家有一个误解在于，觉得Sora好像比GPT又高级了，对吧？原来是文字的，啪一下，又变视频了。

语言所表达的是概念层面的“空间”，但视频所表达的是肉眼可见的空间。语言对空间实体的表达能力，是远高于视频的。本质上，语言描述的概念，代表着对世界更多的认知。

Sora的突破在于，让视频上的表达和语言空间去统一编码（即让大模型将语言和物理意义上的空间表达进行匹配），而且还没有完全解决这个问题。

36氪：毕竟视频所对应的多模态技术，看着比较Fancy。

王小川：你讲得特别对，Fancy。Sora的冲击力更多来自于感官上的冲击，但这并不代表技术是更强的。

GPT的技术难度，以及它可以实现的规模是远高于Sora的。现在大模型到了万亿参数级别，Sora是百亿级别，还是差很多的。

并且，OpenAI是要做AGI的，以后会陆续发GPT-4.5、GPT-5，但Sora只是OpenAI的side project（子项目），并不是主线。

36氪：人类所接收到外部信息里面，语言当然是很大一部分，但图像这类视觉信息，不也是很重要的一部分吗？

王小川：狗是会看视频的，但狗会说话吗？人类的智力是在语言里面的。在实现AGI（通用人工智能）这件事上，视觉不是关键。

36氪：Sora的训练其实也基于很多LLM（大语言模型）的技术，百川自己也有对多模态投入，会往Sora这个方向做吗？

王小川：我们不会做。Sora既不是AGI这个方向的事，也不是一个具体可见的应用方向。现在Sora生成一分钟视频需要20分钟，60美金，做电影可能有点用，但做C端一些互动性的东西，是不太实用的。

36氪：如果Sora不是你们的主线业务，那是谁的主线业务？字节吗？

王小川：特别适合。这个事既没有语言需要那么多智力，又适合直接来跟进。

36氪：而且还特别耗钱。

王小川：哈哈哈哈。

大模型的未来不是工具，而是伙伴

36氪：我看到你在今年春节发了一个新年愿景，是说造一个大模型时代的新物种，不会要求它像工具一样，而是达到人类对伙伴的要求。这个新物种的载体会是什么？

王小川：我觉得载体不是本质问题，但它以后一定会依附某种硬件，比如手机、眼镜、耳机，都可以做。

36氪：如果复盘过去一年，你觉得做的最重要的事是什么？

王小川：做得足够早，和时代脉搏同步了。我们先是把团队搭建起来了，并且现在模型能力接近GPT-4，在中文领域很多任务是超过的。

我们对开源社区也有贡献。去年9月份，我们发布了百川的开源模型，很多大厂还有创业公司都在用。我们得到的数据是，现在报备底层模型的200多家新公司里，有一半以上都是用我们的模型。

并且技术主张和愿景都没有走偏，包括去年我提的“双轮驱动”，大模型和超级应用要一起做，以及增强搜索、强化学习等等方向，今年也会开始一一兑现。

36氪：你怎么想象未来AI能做到的事情？

王小川：今年元旦，有朋友发消息给我说，小川元旦快乐。我就回复：智能纪元贰年快乐。

在我眼里，去年是智能元年，今年是第贰年。我认为我是看到了未来的模样。

去年4月我下场的时候，当时我就在讲，AI一方面是提升这种生产力，另一方面能成为我们的伙伴，甚至还能创造出虚拟世界，成为大家娱乐的天地。

36氪：那些没有被AI学到的数据，那就是AI的盲区，我想这对人类的创造力提出了全新的需求，我们也许不能创造出一个和AI差不多水平，或者人类已有知识库里存在的东西。

在现在AI的水平下，我们人类有价值的地方，或者应该发展价值的地方是什么？

王小川：不同人选择不一样，比如创造力这个现在还是暂时取代不了。所以我觉得就做好两个事情，一个是用好AI，你不会用，你就可能被淘汰。二是投身做AI，把智慧放进去，比如来百川做AI，哈哈。

去年我说了句有点争议的话，我说程序员也是自己的掘墓人，把自己融入进去了，从“小我”变成“大我”。

36氪：但融入之后，我们就会失业了？

王小川：人早晚都会死掉的，怕啥呢？

36氪：大家肯定想的是，死掉之前不要失业……

王小川：但你失业不失业，都要死掉，只有生死才是大问题嘛。

36氪：比如像真正做大模型的人，对未来可能创造出来的东西，你会有恐惧吗？

王小川：没有恐惧。我官宣下场的时候写了句话：发展AGI，帮助繁荣和延续人类文明。这两个任意选一个，都挺好的呀。

36氪：所以这两个是可以分开看的。

王小川：对的。

36氪：想过有失败的可能性吗？

王小川：现在想的是解决各种困难。脑子确实里没有失败这个念头，最好也不要想这个事。

36氪：对于现在的AI行业，您最想知道的一个问题，或者看到的事情，是什么？

王小川：我想看到GPT-4.5或者GPT-5到底有什么大的变化，有多大的进步。

36氪：2024年，你对AI行业会有什么预测吗？

王小川：第一，我觉得美国还会不断地冒出让我们吃惊的进展。

第二，我觉得我们国内市场既不要狂妄，也不要妄自菲薄。我们已经能长出自己的能力来，GPT-3.5，GPT-4，我们是能跟上的。今年，各个厂商都会开始做差异化，我对这个比较乐观。

欢迎交流

欢迎关注