近年来,AI技术的不断发展对各行各业都产生了重大影响,其中影响最深远的显然是娱乐行业。比如在虚拟偶像、配音、电竞等等领域,或多或少都能看到AI的身影。
在表现形式更加单一的配音领域,由于能够更好地模拟真人的声音,完成一些基础工作,AI在配音方面也逐渐显示出了极高的商业价值,成为众多广告主的选择,甚至有取代真人配音演员的趋势。
之前报道过,米哈游的《未定事件簿》因为配音演员出现意外,需要更换角色进行配音。在官方解释中,墨夷这个角色的新配音是由米哈游的“逆熵AI”生成的。
昨天(6号)更新后,官方也正式为角色安装了新的语音。从实际反馈来看,这个AI配音的效果确实让很多玩家惊艳。
点击视听《未定事件簿》 AI配音剪辑:
“未确定的预约书”
音频播放器
使用向上/向下箭头键增加或降低音量。
1.“未确定的预约书”
1:00
“纸人”有救了,逆熵AI是真的。
如果是第一次通过这个游戏接触逆熵AI,可能会对米哈游的技术印象深刻。如果用一句话总结,可以说新AI配音几乎达到了“以假乱真”的程度。
比如在音准方面,反熵AI的表现就相当不错。不仅说话的节奏随课文变化,还会演绎出“你闻到什么了?”“这是不是很难?”等一句问话的时候,声调自然会升高,就像真人说话一样。
在更深的情感层面上,逆熵AI也是非常了不起的。墨夷的性格是一位著名的心理学家,他的举止从容优雅,性格成熟稳重。所以这个角色的声音以温柔成熟为主。逆熵AI合成的音色偏向于沉稳的男声,与墨夷的设计相当吻合。
详细来说,如果你仔细听的话,你很容易就能听出来,逆熵AI其实是通过分析文本的上下文来改变声音的。一个典型的例子就是,当逆熵AI演绎“听话的孩子可以得到最后的奖励”时,为了表现此时墨夷在捉弄主角的情况,采用了挑衅的语气,甚至在结尾加上了一句略显恶劣的嘶嘶声。
当然,虽然某些方面的表现确实不错,但如果要用放大镜来研究整体的声音表现,逆熵AI并不完美。比如在解读一些情绪激烈的句子时,逆熵AI缺乏足够强的语音表达。总的来说,反熵AI和真人相比,在情感细节上也少了一点柔情蜜意。但正如一位玩家所说,如果“你告诉我是AI,我反而会找破绽,但你不告诉我是AI,我就听不出这一段AI的感觉”。这至少可以说明,逆熵AI的性能足以应对绝大多数情况。这也引得一些玩家惊叹“难怪米哈游起来就敢放纯音卡”。
一直以来,我们普遍认为真人配音比AI更具沉浸感,但也有玩家在体验了墨夷的AI配音后,产生了相反的看法。在这些玩家看来,虽然逆熵AI的配音不如真人真实,但这是墨夷第一次打破次元壁自言自语,大大增加了代入感。
聚集的巨人,为什么AI会成为罗马的斗兽场?
其实这已经不是米哈游第一次用逆熵AI给角色配音了。之前米哈游推出的虚拟偶像鹿鸣的声音是用逆熵AI合成的,音色听起来很自然,缺点是有时候反应有点慢。
当然,《未定事件簿》并不是圈内第一个使用AI配音的游戏。同样是在今年8月,网易的少女B游戏《时空中的绘旅人》也遇到了换配音演员的问题,游戏中的角色叶妍原本由蒋光涛配音。
8月22日,时空行者发布声明,称将与网易互娱AI实验室合作,提取叶璇原创配音的声纹特征,录制新的声音。换句话说,这波操作实际上相当于给叶璇换了一个AI语音。
2018年早些时候,互联网巨头微软其实很早就开始给AI配音了。当其虚拟歌曲姬晓宾蔡羽在日本首次亮相时,它声称首次实现了像人类歌手一样的全“气”唱歌,将人工智能虚拟唱歌的质量提高到了一个新的高度。
但问题是,为什么米哈游、网易、微软这样的巨头如此看重AI配音?对此,米哈游总裁大伟哥(刘伟)2019年在母校上海交通大学的演讲中进行了解释。
在这次演讲中,大伟哥表现出了对逆熵技术的极大期待。据他介绍,逆熵AI的目标是通过深度学习记录配音演员的声音和情感,从而通过输入文字输出相应的配音。以后还可以把声音塑造成IP,永久保留声音的版权,甚至可以出售。
今年7月,鹿鸣在哔哩哔哩开通了首次直播。其次,在直播的介绍中,鹿鸣的语音栏目写满了“逆熵AI的产生”。但让玩家震惊的是,逆熵AI产生的声音居然可以实时响应弹幕,还能带来真人特有的情感色彩。
没有人知道鹿鸣的人工智能生成的声音实际上实现了伟哥的预期目标。但结合之前的演讲,若米哈佑真仅通过文字输入就实现了堪比真人的语音输出,并且可以配上感情色彩,这无疑是一个令人振奋的技术突破。从商业角度来说,AI配音无疑比真人配音有着巨大的优势,不仅成本低,而且效率高。过去配音行业一直采用人工配音,人的不确定性会导致费时费力、准确度不够等问题。AI可以有效降低人力成本。
不仅如此,由于AI配音对目标声音的未排序数据进行训练,可以简单快速地生成一个流畅标准的完整音频,避免了人工配音可能出现的发音错误等问题,大大提高了配音效率。
更重要的是,从作品改编的角度来说,AI因为可以不断的改变音色,所以可以极大的扩展对作品的改编。毕竟AI的声音通常是由数据的反复学习构成的,所以只要采集的样本足够多,它就可以随意改变音色,为不同的场景匹配不同的声音。
此前,英国一家初创公司Sonantic已经发布了一个名为《Faith_ First AI That Can Cry》的视频。视频中的AI在吞下大量数据并有目的地训练分辨机械声和人声细微差异的能力后,可以逼真地模拟人声并表达情感。
你可能会觉得这个AI表现出来的情绪可能是事先设定好的,但其实这个情绪是AI通过对文本的分析理解出来的,与作品高度契合。正因如此,一旦AI技术足够成熟,很可能AI会比真人更好地理解作品,从而在配音上表现得更好。
除了以上优势,AI配音是真正的配音无法企及的,即可以模仿或重现一个声音。从小的角度来说,这种能力可以避免和修复真实配音演员的“塌房”问题,从而大大降低后者对游戏角色的影响。
从大的方面来说,用AI来重现逝者的声音,对于一些丧亲者来说,无疑是一种治愈。对于很多先天性语言障碍的聋人来说,AI技术也可以让他们拥有自己的声音。可见,AI配音不仅对游戏行业有影响,对游戏之外的领域也有积极的贡献。
当然,在列举AI这么多优点的同时,真人也不是没有一战之力,在作品的表达上,真人往往比AI更容易凸显作品的“魅力”。很多时候神韵往往是人的主观判断,即使AI表达了人们认为的神韵,也需要足够的时间去吞噬足够的数据。
从结果来看,AI只是一个冷数据的复合体,其最终效果通常不会超出人们的预期。现实中的人虽然没有艾那么稳定,但也会时不时的出现,用自己对作品的理解和人生经历来升华作品。这一点,也许AI永远无法超越。
Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved