在这个数字化时代,AI数字人技术正以前所未有的速度改变着我们的生活和工作方式。你可能已经注意到,关于数字人技术的宣传口号充斥着市场,声称只需数万元,你就能拥有AI数字人系统源代码,一劳永逸。
2023年,被誉为数字人的“当打之年”,数字人技术迅速发展,为我们带来了前所未有的机遇和挑战。
数字人技术的迅速崛起今年4月,腾讯云发布了智能小样本数智人生产平台,这一平台基于通用多模态大模型技术,仅需3分钟的真人口播视频、100句语音素材等小样本,就能通过多模态数据输入与实时建模,制作出与真人近似的“数智人”。同时,商汤公司也在同一月份发布了“日日新”大模型体系,推出了如影数字人视频生成平台,用户只需提供短短5分钟的真人视频素材,就能轻松生成数字人。
这一系列创新引发了数字人技术的热潮,数字人的应用场景不断扩大,但也伴随着市场格局的混乱。
虚拟人柳夜熙
市场混乱与新挑战数字人市场因这一热潮而出现了混乱。首先,各式各样的数字人公司应运而生,有些拥有强大的AI技术,提供高质量数字人的源码,而也有些是套壳公司,冒充原厂售卖产品和应用。此外,还有众多代理商和渠道商纷纷涌入,试图从这一热门领域中获利,这也是市场混乱的核心原因之一。
另一方面,随着大模型技术的涌现,数字人技术的应用场景日益扩展。然而,对于全新的场景,没有人拥有丰富的经验。数字人制作流程发生了根本性的变化,从建模到动画制作,每个环节都实现了提效。2D数字人逐渐成为焦点,其生产成本下降,使用范围不断扩大,价格也逐渐被压缩,进入了大规模商用化的新阶段。
如今,AI数字人市场正经历着飞速发展,可以说是野蛮生长的阶段。早期进入AI数字人行业的公司,包括技术开发商、OEM厂商、代理商以及数字人内容创作者,都在这个领域中赚得盆满钵满。然而,市场也充斥着一些缺乏技术支持的平台,它们依赖于抄袭他人的成果来吸引客户。这些平台可能使用国外的开源代码,或者通过贴图换脸的方式套在其他产品上的代码。虽然它们在演示中看起来令人惊艳,但实际运行时几乎无法使用。购买了这些产品后,很多人发现无法使程序正常运行,无法满足交付标准,甚至无法退款。这些公司通常会赠送一个大硬盘,里面包含数万个唇形实现迁移,但贴合度非常差,根本无法达到主流的大模型 小样本技术的水平。
数字人技术的崛起带来了无限的可能性,但也需要谨慎对待市场中的混乱和挑战。只有充分了解数字人技术的本质,选择可信赖的合作伙伴,才能在数字化时代中获得持久的成功。
目前市场上备受关注的四大平台,分别是百度曦灵、硅基智能、风平智能以及闪剪。它们在数字人的效果方面各有独特之处。
百度曦灵数字人百度曦灵的数字人建模算法相对简单,采用了一种速成的方式,其中录制的真人视频素材不需要开口说话,而是使用AI算法去模拟预测口型的开合。这种方法的好处在于对训练素材的要求较低,拍摄者只需在镜头前闭着嘴做一些手势动作,建模速度也很快,不到1天就能完成建模。
百度曦灵数字人
然而,这种方式的不足在于效果相对较差,因为AI算法合成的口型和牙齿很难与真实口型相媲美。此外,拍摄素材只包括非口语动作,通常会显得有机械感,肢体动作可能不够自然,口型和牙齿也可能显得不够真实。因此,使用这种方法制作的数字人可能会容易被观众辨别出来。
硅基智能数字人硅基智能采用了更为复杂但效果更好的数字人建模方法。他们录制完整的真人视频素材,使用真实的口型进行训练。这种方法的优点在于效果更真实,录制时可以通过口播台词来实现说话和语气与动作的匹配。因此,训练出来的数字人动作和表情更切合使用场景。但与之相对,这种方法对训练素材拍摄的要求较高,需要拥有良好的口才、表达能力,并且不怯场的人,可能只需10分钟就能搞定拍摄素材。但如果是怯场或不习惯在镜头前表达的人,那就需要多次拍摄以获得满意的素材。
风平智能数字人风平智能也采用了与硅基智能类似的数字人建模方法,即录制完整真人开口说话的视频素材,训练时使用真实口型。这种方法的优势在于效果真实,录制过程可以通过口播台词来实现说话和动作的匹配,数字人的动作表情也更符合使用场景。但与之相关的是,对训练素材拍摄的要求相对较高,需要有拥有良好口才的人,拍摄素材可能需要多次尝试以确保质量。
风平智能数字人
闪剪数字人闪剪数字人具有独特之处,它们支持让照片中的人物说话的功能。这种功能也使用了AI模拟口型的方法,以使照片中的人物的嘴巴动起来说话。然而,由于效果有限,一般只被用作附加小功能,不作为主要特点。硅基智能和闪剪的短视频产品都提供了这项功能,但效果相对较弱。
总的来看,这四款数字人平台采用了不同的数字人建模方法,百度曦灵使用了一种简化的建模方式,效果相对较差,而硅基智能、风平智能和闪剪采用了更为复杂但效果更好的建模方法。然而,无论采用哪种方法,提供高质量的训练素材和合适的声音驱动都是关键,以确保数字人能够达到最佳效果。另外,数字人的隐私安全也是需要考虑的重要问题,其中风平智能提供了一种专利技术的风险管理系统,以提高数字人的隐私安全性。最后,如果有特殊需求,例如使用3D数字人,应该额外考虑数字人平台是否支持这一功能。
在这个数字化时代,数字人技术迅速改变着我们的生活和工作方式。它为我们带来了前所未有的机遇和挑战。然而,市场混乱也伴随而来,需要我们谨慎应对。只有深入了解数字人技术的本质,选择可信赖的合作伙伴,才能在这个充满潜力和风险的领域中取得持久的成功。
Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved