英伟达开源 Audio2Face 模型:AI 实时生成面部动画,多语言口型同步
9 月 24 日,英伟达宣布开源生成式 AI 面部动画模型 Audio2Face,涵盖模型、软件开发工具包(SDK)及完整训练框架,希望能在游戏和 3D 应用中,加速开发 AI 智能虚拟角色。该技术通过分析音频中的音素、语调等声学特征,实时驱动虚拟角色面部动作,生成精准的口型同步和自然的情感表情,可广泛应用于游戏、影视制作和客户服务等领域。Audio2Face 支持两种运行模式:预录制音频的离线渲染和动态 AI 角色的实时流式处理。
目前,该技术已获行业广泛采用。例如,游戏开发商 Survios 在《异形:侠盗入侵进化版》(Alien: Rogue Incursion Evolved Edition)中集成 Audio2Face,大幅简化了口型同步与面部捕捉流程。(IT 之家)
本文来自投稿,不代表DEVCN立场,如若转载,请注明出处:https://devcn.xin/6059.html