专访|王维嘉①:暗知识,机器认知如何改变商业

专访|王维嘉①:暗知识,机器认知如何改变商业

首页休闲益智人类落花流水更新时间:2024-07-13

《暗知识》一书的作者王维嘉博士,在美国斯坦福大学读博士期间做过人工智能(AI)研究,后来在硅谷和中国创办高科技公司,目前在硅谷专注于投资人工智能。王维嘉每年访问调研上千家硅谷和中国的科技公司,接触顶级大学最前沿的研究,从大量的实践中提炼出对行业的原创的分析和洞见。

王维嘉长期对人类如何获得知识感兴趣,在投资、研究和写作AI的过程中,发现了“暗知识”这样一个人类以往未曾发现的领域。

在王维嘉看来,暗知识对人类的影响刚刚开始。从暗知识这个新视角出发,可以更深刻地理解这次AI巨浪。这波巨浪可能超过互联网,许多行业都会深受影响。其新作《暗知识》希望能回答“AI对我的行业和职业会有什么影响”。

2019年4月,《暗知识》一书刚面世不久,“澎湃新闻(www.thepaper.cn)”记者在上海对王维嘉博士进行了采访。以下是访谈的前半部分,聚焦于机器认知将如何颠覆商业世界。

王维嘉:《暗知识:机器认知如何颠覆商业和社会》(中信出版社)

澎湃新闻:你的新书叫《暗知识》,能不能解释下什么是“暗知识”?

王维嘉:我们人类一直以为所有的知识都是可以用语言文字表达出来的,知识的载体如书籍、报纸、杂志等。那么,一直到70年前,我们知道了还有一种知识是无法用语言文字表达的,叫默知识或者默会知识,就是只可意会不可言传的知识。但是,直到最近,随着人工智能(AI)出现,我发现机器可能还知道一种知识,那是第三类知识,是我们既不可意会也不可言传的。

这一契机就是从AlphaGo下围棋开始的,大家觉得它的围棋下得这么厉害,但不知道它怎么会这么厉害的。聂卫平不知道,柯洁不知道,谷歌工程师也不知道。因为这个事情,就逼我想到,会不会存在这么一类知识,就是我们既无法感受也无法表达的知识。

简单来讲,暗知识,就是既无法感受也无法表达的知识。于是,我们现在发现了第三类的知识类型。第一类,就是明知识,是可以用语言文字表达的;第二类,是可以感受不可表达的,像骑自行车,会骑但说不出怎么学的,每个人都要自己去骑一下才能学会,没法靠看手册学会,表达不出来的,生活中有大量这样直觉的、经验的知识,都是表达不出来的,这叫默知识;第三类,就是今天机器发现的知识,是我们既没法感受也没法表达,这就是暗知识。

澎湃新闻:在你的书中,一上来就举了AlphaGo的例子。事实上我们也知道计算机此前已经能在桥牌、国际象棋等领域打败人类。而围棋,如果算是运动的一种的话,可以被视为最需要智力的运动。那么AlphaGo甚至AlphaGo Zero的出现,是否能被视为一个里程碑,或者说是人与机器关系的标志性事件?

王维嘉:那绝对是一个里程碑事件,而且是重大的里程碑事件。他给了我们两大震撼。

第一,人类一直以为自己是世界上具有最高智慧的生物,没有什么我们不懂的, 可以上火星,可以编辑基因baby,其中围棋又被认为是代表人类最高智能的一种游戏。居然在围棋上,人类被打得落花流水,连还手的招都没有。柯洁在下完棋以后擦着眼泪说,他根本看不到任何赢的希望。聂卫平说,AlphaGo是上帝派来教我们人类下围棋的。这给我们的第一个震撼,就是令人无法理解。

第二个更重要震撼是之后出现的AlphaGo Zero带来的。AlphaGo是先学人类的棋局,然后超过了人类。硅谷的谷歌工程师随后设计了AlphaGo Zero,想要试试让它不学人类,就靠他自己自我对弈。结果7天之后,AlphaGo Zero就超过了原来的AlphaGo,40天之后就全球无敌手,孤独求败了。

AlphaGo Zero为什么给我们带来了更大的震撼呢?因为,人类的经验——棋谱,不仅对AlphaGo Zero一钱不值,而且还是累赘、是束缚,好像它不学人类的东西,反而超脱了,比人类更厉害了。

这件事儿对我们自尊心的打击太大了。我们会觉得那几千万个棋谱属于人类最精华的智慧,但是怎么就在机器面前一钱不值了呢?那么,今后会不会在其他领域也出现类似的情况,比如基因编辑,机器会不会最后发现了一些东西让我们就觉得我们在AI、在机器面前连小学生都不如呢?这是带给我们第二个震撼。

全世界都不知道为什么,没一个人能解释,对人工智能业界和对普通人都是非常大的震撼。这一系列事件也逼着我思考,也是最终让我发现了暗知识。

在人工智能界这有一个专门的名词叫做“AI的不可解释性”,就是AI不可解释,但是偏偏还有很多人研究,想一定要把它给解释了。目前专门有研究,就是把“黑箱”能够变成“白箱”,把它解释出来,结果就是做不到。于是我就想为什么我们会觉得震撼?因为我们有个前提、有个假设,这个假设就是我们人类应该能理解一切东西。如果我们放弃这样的假设,说会不会有一类东西是人类根本就学不会的,或者无法理解的,于是就会豁然开朗。这就是我发现暗知识的一个起点。

澎湃新闻:你刚才也提到基因编辑,在你书里有提到未来可能会有出现人机融合的技术。有没有可能AI自己给自己制作一个生命体的部分,最终成为超越我们的人?你觉得人机融合在未来大概是怎样的形态,会怎样发展?

王维嘉:目前来看应该还没有这种可能。今天的AI主要是基于神经网络的,它的主要功能是从大量的数据里头提取出数据之间的相关性。AI有可能自己制造出一些很精巧的东西,生物的也好,其他什么东西也好,都是有可能的。但是它不会有自我意识,这是特别关键的一点。

我写《暗知识》这本书的有两个目的,一个目的就是因为现在大量的关于AI的书提出各种各样的说法,比如会不会硅基生命取代碳基生命,会不会终结我们人类的演化。对这些问题的回答都是“不会”。因为人产生自我意识这件事很复杂,到今天我们都不知道怎么产生的,那是一个非常小的概率,世界上那么多生物,今天只有人有自我意识,其他生物都没有,其他生物不知道自我和世界是分离的,没有这个概念。

人是怎么有自我意识的?很可能是有一次基因的突变,大脑结构的突变造成的。至于到底是什么时候造成的?怎么造成的?什么条件下造成的?我们都不知道。

机器要产生自我意识,就和人产生自我意识一样,是一个非常小概率,也许要几百万年,也许要各种复杂的条件。对我们来说,在有生之年是不用担心的。

澎湃新闻:在你的书中提到AI时代已经到来,你觉得这个时代的投资机会是怎样的?

王维嘉:实际上,我觉得应该把2012年看作是AI的元年。那一年在美国有一个图像识别比赛,在比赛上机器的准确率第一次一下子提高了十个百分点。三年以后的2015年,机器识别图像的准确率超过了人的准确率。我觉得从那以后,所有的大公司都开始重视AI了,比如谷歌,包括百度也是,在那次比赛之后就开始行动了。

所以说,今天AI时代已经到来了。关于其投资机会,如自动驾驶、人脸识别、医疗、诊断、制药等多了去了。

哪些行业可能会被AI颠覆或者受其影响,我认为有三个判断的依据。

第一,这个行业在其生产过程中是不是产生大量的数据。比如金融行业每天都有消费数据,这个是很典型的。

第二,这些数据里面是不是有很多有用的相关性,有些数据比如说有个空气净化器呼呼地一直在响也产生数据,但是这数据没有什么意义,而如果数据里头能提取出复杂的关系来,这就是有用的暗知识。

第三,这行业要有钱,因为有钱的话大家就会要去颠覆它,或者是就一定有人进去改造这个行业。

不同的行业会对AI技术采取不同的态度。 比如说,医疗行业可以用AI帮忙看X光片子,但看X光片子一定不是医疗行业最核心的能力,帮他看只能帮他增加效率,对他却没有威胁。但是,银行要是把所有的客户数据都给到外面,别人学会了就把他颠覆了,所以说金融行业这样的绝对不会把AI外包的,要么收购团队,要么自己做。

澎湃新闻:就你所见,资本是不是已经有所行动?

王维嘉:行动了。不光是有所行动,中国和美国的风险投资过去大概四五年里最大的投资量或者最热的热点就是人工智能或者叫机器学习。原因很简单,就是那几乎在所有的行业都可以应用。就像我刚才说的,只要这个行业产生数据,只要这行业有钱,都可以被AI改造。

比较AI和互联网很有意思,两者有很大区别。比如说,马云当时做阿里巴巴的时候,办淘宝的时候,零售业根本不知道马云在干什么,好像和他们一点关系没有,等他们明白的时候已经被颠覆了。但是,AI从一开始就在行业中心开始爆炸,比如金融业,第一天就知道这东西是将来最核心的东西。AI和行业的结合特别紧密。

澎湃新闻:你预测资本未来还会有什么变化?

王维嘉:人工智能这个行业还有一个特点,就是它不像互联网那样能一下变出来几亿用户,它要有一个过程,它这个行业的改造是一个深入到行业里面的,需要行业知识去改造生产流程的,是一个很慢的过程。所以说,现在你能发现的好公司,就是那些对行业的痛点和行业的特点特别了解,又知道怎么应用这样的技术的公司。这种公司就可以挖深井,很多投资的标的就是这样一个个挖深井的公司。

澎湃新闻:你觉得,关注在AI时代的行业调整,作出预测并及时调整,是否关系到国家间竞争?

王维嘉:李开复有个观点,认为中国和美国未来是全世界AI最领先的,其他国家都跟在后边吃土,他写了本书叫《AI,Superpower》,在美国卖得还不错。但是如果你了解AI的这个特点,即它是一个to B或者to G的生意, 是对企业的,对政府的生意,你就知道开复这个观点是不对的。原因很简单,比如,法国的一个智慧城市项目,你中国公司怎么去做?几乎是不可能的。或者,法国的核电生意,中国公司或美国公司怎么去?都去不了。一旦它变成to B的生意,国家间的壁垒就全出来了,就很难做了。

而且,AI的本质是算法,法国没有聪明人吗?俄国没有聪明人吗?每个国家都有很多的数学人才、AI的人才。而且,大家用的都是英伟达的芯片和赛灵思的芯片,用的软件都是谷歌的开源软件,都差不多。所以说,国家间我觉得未来的差距不会很大,中国美国现在肯定是领先,但是其他国家,特别是发达国家、有人才的国家的AI水平绝对都不会比中美两国差。

那么,为什么大家会有之前那种成见?因为中美两国的互联网是把其他国家远远甩在了后边。互联网是一个to C的生意、面向消费者的生意,中美两国的市场都是巨大的,美国携英语的优势扫遍全世界,中国本身就用户量很大,任何一个其他国家都没这么多用户。但是到了to B,就不一样了。

澎湃新闻:有很多核心技术可能仍然只掌握在很少数公司手里?

王维嘉:是这样的。现在芯片领域最重要的就是三家公司,一个就是做图形处理器GPU的英伟达,这是现在是第一大的。CPU仍然很重要,英特尔的CPU在数据中心里大量用于识别。 所以英特尔还在。第三家就是一家做现场可编程门阵列(FPGA,Field-Programmable Gate Array)芯片的公司赛灵思(Xlinx)。这三家公司都是美国的公司,都在硅谷。其他在世界上没有了,甚至没有任何一家其他公司能做到接近他们。

算法领域,则是这样。对算法的主要的贡献,可以看图灵奖。这次的图灵奖颁给了三个科学家,这三个科学家原来都在加拿大,现在一个在谷歌、一个在Facebook,一个还在加拿大教书,还有另外一个人其实我觉得应该得图灵奖,但是他太年轻了,刚拿到博士才30岁,也在美国。人才的角度是这样,这四个人,在全世界AI领域我把他们叫“四大天王”,然后下面第二梯队还有很多人,大概有十几二十个人。“四大天王”对这次人工智能浪潮做出了突破性的贡献。第二梯队则属于做出了重大贡献,但是他们没有那么基础性的贡献。华人中有一个这样在第二梯队人,就是吴恩达,很可惜现在没能留在百度。第三梯队的人就多了,包括那些对整个AI的技术产业特别熟,能够担当一个公司的首席技术官的那些人。今天,第一、第二梯队的全部在美国、第三梯队的主要人才都在美国,人才差距还是比较大。

澎湃新闻:就你所知,我国与世界其他国家,目前对于这个领域都有哪些行动?

王维嘉:我的书《暗知识》里有一张AI的产业生态图,位于金字塔顶端的是算法,下面是芯片,然后是计算软件平台,最后是应用。现在,在算法上,肯定是美国加拿大最领先。芯片是美国占统治地位。软件的计算框架,现在谷歌是占统治地位。在应用层面,我觉得中美各有千秋,比如说中国的人脸识别技术远远超前世界任何国家,也超过美国,这个应用美国的市场非常小。

人脸识别,在中国的情况是政府的需求特别大,那些公司也都做得非常好。我也看了一些公司,技术上一骑绝尘,别的国家在后边吃土,真是这样。

自动驾驶,我觉得是软件公司里是一超多强。一超就是谷歌,满分100分的话,谷歌大概可以打60分,其他公司可能就是20分。20分的公司一大堆,中国、美国各有千秋。在汽车厂商中是一超多弱,一超就是特斯拉,其他厂商,包括美国,欧洲,日本厂商的自动驾驶和特斯拉差距非常大。这个差距并非完全是技术,很多是传统汽车产业链的问题。

医疗诊断,中国也做得不错。教育类和语音识别,中国也做得非常好。

制药,绝对是美国强。中国没有新药研发能力,人工智能在制药上的应用全是在美国。

简单来说,核心技术和人才上,美国绝对领先,应用层面上中美互有见长。

现在,政府大力鼓励发展芯片,国内也有大概几十家做AI芯片的公司,有的还做得不错。

芯片的应用市场大概有三个不同的细分市场。一个就是数据中心,这是最大的一块,如谷歌、百度、阿里等做人工智能大概用到几万台甚至几十万台服务器,需要大量的芯片,现在这个市场基本上是被英伟达和英特尔这样公司统治着。对于一个新的公司来讲,开发一款这样的新的芯片出来,我个人觉得难度非常之高。因为那些大公司的数据中心一旦宕机就是几亿、几十亿的损失,要是一款做不到在各种性能上经过实验达到绝对可靠,大公司是不会轻易用的,而成本还要低。所以我觉得大数据中心这个市场现在是非常难进入的。

第二个市场就是边缘计算,比如说汽车自动驾驶里面用的芯片,这是个全新市场。那么,像中国的地平线公司就是做这样的芯片,据说做得还不错。但是,这个市场因为太大了,所以像英伟达、因特尔他们也都非常看好。英特尔去年160亿美金收购了一家以色列的公司Mobileye,特斯拉的半自动驾驶最早就用Mobileye的芯片来做的,Mobileye现在已经把半自动驾驶的市场都拿下来了。英特尔在汽车里面之前是没有市场份额的,所以通过收购企图进入市场。高通也想以440亿美元收购一家荷兰公司NXP,最终这次交易没有完成。英特尔、高通和英伟达,这三家芯片公司分别是三个时代的霸主。PC时代的霸主是英特尔,手机时代霸主是高通,现在人工智能时代的霸主是英伟达。这三家公司同时看好汽车,其他公司再要去和他们竞争,难度也是很大。

还有一个方向,就是试着把芯片做到手机里头。如果哪家公司能做出来一颗被全世界手机用的芯片,那就一定是一家巨无霸公司了。但是,因为手机有其重量,体积、成本等方面的要求,应该是特别不希望再多放一颗芯片进去,一定是希望能把AI的功能放在CPU里面做成一个小模块。这样的话,谁做这件事最容易?就是今天给手机做CPU的公司,比如高通,还有华为的海思,还有联发科、紫光的展讯等。这些公司都是原来做手机CPU的,再自己做个小模块进去就完了,所以也没其他公司什么事儿,要进入也是非常难的。

我觉得,现在新创公司的一个重要的市场就是目前大公司还看不上的,比如家务机器人。扫地机器人现在有几千万台了,但是很不智能,如果把它做得智能一点,弄一颗很便宜的AI芯片进去,未来还可以有擦玻璃机器人等。要是未来的各种机器人的人工智能芯片都是某一家的,那这家公司也是很牛。我觉得,这可能是一个做芯片的新创公司容易突破的地方。

澎湃新闻:对于具体的行业来说,你在书里也详细解读了包括出行、医疗、金融等很多领域。你能不能再大致向读者描述一下你对未来的预测,哪些行业会被取代并逐渐消失,哪些还会留存,哪些甚至会异军突起,人力劳动的机会在哪里?

王维嘉:人工智能特点就是它能够在复杂的变量里、从大量的数据里抽取出其关系或者相关性,那么,让人脑袋越疼的工作对它就越容易。过去电脑取代的很多是体力型的活儿,这次会取代很多一些脑力型的活儿。比如说,有一些比较重复性的工作,像是律师要做的很多文件的调查,还有很多事务性的工作像会计甚至保险精算这些,机器可以读的文件或数据比人要快得多。现在的金融交易员已经被取代的很厉害了,各大公司都不要交易员了。

比较难取代的,我觉得是需要人类情感的工作,如教师、心理咨询师、医生这一类的,因为机器没有情感,冷冰冰的。越需要情感的工作,就越难取代。

澎湃新闻:会不会突然出现一些新的工种?

王维嘉:举个例子,前不久有一个丑闻,亚马逊在全世界雇了一千多个人来听通过智能音箱采集的对话。为什么要听?不是在监听,而是很多对话人工智能机器听不懂,需要人听了以后把内容告诉机器,这是一个训练机器的过程。训练机器,在今天就是给它已知的数据,比如要让机器认识癌细胞,就给它看很多。在给机器看的时候,就要先标注给机器的数据是什么,这就是数据标注员或称为人工智能培训师的工作。

所以,未来训练机器或标注数据,就可能成为一个很大的行业。这个工作对人类特别简单,现在真的才刚开始,也许今后的五年、十年里,机器学习都还需要大量的数据标注。

查看全文
大家还看了
也许喜欢
更多游戏

Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved