OpenAI 发布语音模型 GPT-realtim:具备情感感知能力,多语言无缝切换
OpenAI 正式发布语音模型 GPT-realtime(https://openai.com/index/introducing-gpt-realtime/)。据介绍,GPT-realtime 是一款专注于语音 AI Agent 的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解,并可结合语音或文本对话使用,非常适合应用于客服、教育、金融、医疗等领域,用于构建高质量的语音智能体。
本文来自投稿,不代表DEVCN立场,如若转载,请注明出处:https://devcn.xin/5850.html