Qwen 重磅发布：首个端到端全模态 AI 模型 Qwen3-Omni 登场

网站编辑 • 2025年9月23日上午11:52 • 资讯 • 阅读 13

阿里旗下Qwen团队近日动作频频，接连推出两款具有突破性的AI模型——Qwen3-Omni与Qwen-Image-Edit-2509，引发业界广泛关注。其中，Qwen3-Omni作为全球首个原生端到端全模态AI模型，标志着多模态技术进入全新发展阶段。

据悉，Qwen3-Omni的ASR、音频理解、语音对话性能与Gemini 2.5 Pro相当；在保障音频和音视频质量的同时，单模态文本和图像性能无退化；支持119种文本语言，19种语音输入和10种语音输出；支持实时音频、视频交互，211毫秒延迟，可以自然轮流发言和即时文本或语音响应。同时开源的还有一款音频字幕生成器：Qwen3-Omni-30B-A3B-Captioner，是一款通用的、低幻觉的音频字幕生成模型。

本文来自投稿，不代表DEVCN立场，如若转载，请注明出处：https://devcn.xin/6031.html

Qwen 重磅发布：首个端到端全模态 AI 模型 Qwen3-Omni 登场

相关新闻