按过去互联网的发展规律,元宇宙产业要走向成熟,必然是要基于内容生态的完善和扩张,而内容生态壮大,有赖于那些提供“铲子”的内容工具服商。比如UnityTechnologies的Unity、Epic Games的虚幻引擎、英伟达的Omniverse都是构建元宇宙内容生态的创作工具,尤其是元宇宙中无处不在的3D内容。
Unity CEO John Riccitiello 曾表示:“实时3D的引入将改变人们与数字内容和娱乐的互动方式,我们预计世界上越来越多的内容将是3D、实时和互动的。”英伟达创始人黄仁勋则直接强调:“元宇宙即3D互联网。”
目前,元宇宙在内容创作工具赛道已经初具规模,据《2022年全球元宇宙投融资报告》,2022年全球元宇宙产业共发生704笔融资,总金额达868.67亿元,其中元宇宙行业工具、底层技术和游戏占主要方面。其在发展路径上主要具有以下特点:
3D和沉浸式内容兴起:随着元宇宙的普及,对3D和沉浸式内容的需求也越来越大。因为3D内容可以为用户提供更加逼真和引人入胜的体验。
AI和机器学习的使用:AI和机器学习开始被用于创作更逼真和引人入胜的内容。例如,人工智能可用于生成人和物体的逼真3D模型,机器学习可用于创造更身临其境的体验。
UGC受到广泛关注:元宇宙是一个大型社交空间,因此内容创作工具必须易于使用且可供大量用户访问。
为探讨元宇宙内容工具目前的发展现状,元力社采访到了元宇宙服务商「元客视界」副总经理李淼。「元客视界」脱胎于机器视觉领域头部企业「凌云光」的立体视觉事业部,李淼曾担任该公司立体视觉部市场总监,目前负责「元客视界」产品与解决方案的市场营销与战略推广。
李淼表示,「元客视界」在自主视觉图像技术上积累丰富,拥有底层核心硬件、算法研发能力及整体系统设计与集成能力。目前已构建形成光场重建、运动捕捉、全景成像、XR 拍摄等后台要素类产品;智能虚拟内容制作工作室、智能虚实融合XR演播室等中台产品;以及明星数字人、服务数字人与C端数字人等前台产品,具备完整建制的3D数字内容智能创作设施与服务,是目前国内领先的全栈自研元宇宙解决方案供应商。
元宇宙的发展离不开AI、虚拟人等赛道的支撑,在李淼看来,ChatGPT出现使得服务型虚拟人的应用落地增强了信心。服务型虚拟人的意义是提升了信息咨询的效率和质量,这能在一定程度上缓解社交困难等问题。虚拟人目前已经应用在影视、节目、金融、教育等行业,通过虚拟形象带来虚实结合的视觉和交互体验,成功吸引大量用户消费。
以下是元力社与「元客视界」副总经理李淼对话实录:
元力社:2023年以来,元宇宙热度明显降低,以ChatGPT为代表的AI大模型则风头正盛,您怎么看待元宇宙相关产业处境?有哪些机会和痛点?
李淼:我认为元宇宙是一次虚实融合的世界观的重大升级,它重新完善了技术理论,当然随着元宇宙概念到实现的推进,也遇到了技术瓶颈和社会问题。元宇宙理论上是个开放的世界,需要大量的用户来共建,但现阶段依靠大量专业人员制作内容的效能是无法支撑元宇宙的构建速度的。目前的行业机会是,AIGC能够快速生成文字、图片、视频,甚至在3D内容生产方面也在逐渐突破,在未来的某个时间节点,AIGC会给元宇宙带来指数级的内容生产效率。
元力社:元宇宙是一个宏大的概念,涵盖大量前沿技术,元客视界在能为元宇宙产业生态提供哪些赋能?
李淼:元客视界前身是凌云光立体视觉事业部,目前是凌云光(股票代码:688400)投资设立的全资子公司,我们本身已经聚焦光场立体视觉与人工智能技术十余年,面向元宇宙产业的话,我们能够为元宇宙虚拟现实、Web3.0时代数字人、沉浸媒体、全息通信、计算光学成像等应用提供数字内容智能创作工具平台。
元力社:目前元客视界有哪些主要服务和产品?能够满足市场哪些需求?
李淼:元客视界是国内领先的元宇宙数字内容智能创作工具平台服务商,自主产品包括LuStage光场重建系统、FZMotion运动捕捉系统、InFisionXR虚实融合拍摄系统及MetaWorks 数字人智能制作服务平台,覆盖了数字人、物、场、境的拍摄与制作。目前元客视界的产品与解决方案已搭建了大量的PGC创作服务平台,服务于传媒、娱乐、教育、文旅等行业的数字三维内容制作。
元力社:元宇宙是一个比较新的概念,相关技术处于迅速迭代中,元客视界如何保持领先地位?有哪些核心壁垒和优势?
李淼:元客视界的核心优势在于,我们在光场立体视觉领域研发与行业应用经验非常丰富,光学硬件系统全链条实现了自主可控。核心技术如由AI处理技术赋能的LuStage光场重建系统、FZMotion运动捕捉系统、InFisionXR虚实融合拍摄系统及MetaWorks 数字人智能制作服务平台,能够为数字化的人、物、场、境的拍摄与制作提供高效率、高精度的全栈解决方案,实现元宇宙全场域、沉浸式的虚实交互。
元力社:随着AIGC技术突破,服务型虚拟人有望迎来快速发展,您怎么看到虚拟人的发展前景?元客视界如何在该赛道实现技术落地?
李淼:在我看来,ChatGPT出现使得服务型虚拟人的应用落地增强了信心。服务型虚拟人的意义是提升了信息咨询的效率和质量,在一定程度上缓解社交困难等问题。虚拟人目前已经应用在影视、节目、金融、教育等行业,通过虚拟形象带来虚实结合的视觉和交互体验,成功吸引大量用户消费。在元宇宙领域技术落地上,我们目前已经构建了MetaWorks数字人智能创作服务平台,MetaWorks一方面整合了元客视界的核心硬件能力,即通过LuStage光场重建打造超写实数字人模型,FZMotion多模态运动捕捉系统驱动实现超写实数字人的交互;另一方面布局算力网络和数据中心,构建数字人SaaS平台。
元力社:国内动作捕捉技术目前发展到哪一步了?在元宇宙场景中应用场景有哪些?效果如何?
李淼:可以说,动作捕捉经过十年的市场认知和普及,目前已经被各领域的用户广泛使用。并且随着动作捕捉技术的开源,动作捕捉系统的研发门槛降低,国内已经出现十余家光学及惯性的动作捕捉品牌。动作捕捉的最大优势在于,实现了虚拟人的骨骼驱动与交互,能够将中之人的动作与表情实时映射到虚拟人身上,赋予了人物性格属性,增加了虚拟交互体验的娱乐性,极大减少人与人的社交距离。
元力社:能简单介绍一下元客视界“的LuStage光场重建系统、FZMotion运动捕捉系统、InFisionXR虚实融合拍摄系统及MetaWorks数字人智能制作服务平台”四大工具系统吗?
李淼:FZMotion是凌云光元客视界自主研发的高精度运动捕捉采集与分析系统,具备实时跟踪测量并记录三维空间内的智能体运动姿态以及人体动作捕捉,系统稳定可靠,定位精度可达亚毫米级,广泛应用在影视动画、VR实训、工业仿真、无人机/机器人定位协同控制等领域。
LuStage人脸光场重建系统。主要由156台可编程控制LED光源、高速高分辨率相机阵列、光场重建服务器、球面型支架组成。通过相机阵列同步采集多种光照下的人脸表演过程,进行光场计算,重建出包含三维空间、颜色、角度、时间的完备人脸光场信息,精细度达亚毫米级,并可以反映人脸微表情肌肉运动过程。
InFisionXR虚实融合拍摄系统,名称中的InFision是一个组合词,来自Infinite(无限的)与Vision(视觉)组合,寓意在有限的空间中创造出无限的视界。该系统主要由LED大屏、目标跟踪系统、渲染合成系统、视音频系统组成。应用场景主要是影视拍摄、节目制作、教育实训、XR发布会、汽车广告、直播带货等。
MetaWorks是凌云光推出的专业级面向B端客户的数字人产品线,基于自主研发的LuStage、3D Scan和软件进行数据采集,并根据采集数据进行神经网络学习,完成定制化模型。可提供平面、视频、直播、智能驱动和AI交互的3D数字人产品,为客户提供多用途多媒介场景的数字人服务产品,主要应用场景有影视节目、网络视听、广告营销、政企金融等。
元力社:ChatGPT的成功,受益于谷歌2017年提出的 Transformer 模型,从而颠覆了传统的自然语言处理模型。近几年有研究(ICCV 2021马尔奖最佳论文)显示,Transformer 在计算机视觉领域中也展现出革命性的性能提升,这会让计算机视觉成为继自然语言处理后下一个实现突破的AI技术吗?如果是,对元客视界会有哪些影响?
李淼:Transformer 模型是一种基于自注意力机制的深度神经网络,OpenAI的ChatGPT和Meta的SAM本质上都是Transformer基础上的GPT大模型应用,从原理上讲,万物皆可GPT,无论是语言、图像、视频还是3D建模及其内容都可以基于结构化的语义大模型进行理解和生成。
Transformer技术的快速演进对元客视界的意义重大。目前Transformer模型可以处理图像、视频等视觉数据,完成诸如图像分类、目标检测、语义分割、图像生成、视频理解等多种任务。
元客视界的FZMotion光学运动捕捉系统、LuStage光场重建系统以及InFision XR虚实融合制作系统都将通过Transformer的目标检测、语音分割、视频理解等能力大幅提升性能,同时降低成本,为用户创造更大价值。
元客视界的MetaWorks个性化超写实数字人产品得到ChatGPT等Transformer技术的加持,将让数字人不仅具备真人复刻的外表,还能复制真人的思维、语言和情绪表达能力,大幅加速实现克隆数字人产品应用落地。
Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved