Qwen 重磅发布:首个端到端全模态 AI 模型 Qwen3-Omni 登场

Qwen 重磅发布:首个端到端全模态 AI 模型 Qwen3-Omni 登场

阿里旗下Qwen团队近日动作频频,接连推出两款具有突破性的AI模型——Qwen3-Omni与Qwen-Image-Edit-2509,引发业界广泛关注。其中,Qwen3-Omni作为全球首个原生端到端全模态AI模型,标志着多模态技术进入全新发展阶段。

据悉,Qwen3-Omni的ASR、音频理解、语音对话性能与Gemini 2.5 Pro相当;在保障音频和音视频质量的同时,单模态文本和图像性能无退化;支持119种文本语言,19种语音输入和10种语音输出;支持实时音频、视频交互,211毫秒延迟,可以自然轮流发言和即时文本或语音响应。同时开源的还有一款音频字幕生成器:Qwen3-Omni-30B-A3B-Captioner,是一款通用的、低幻觉的音频字幕生成模型。

本文来自投稿,不代表DEVCN立场,如若转载,请注明出处:https://devcn.xin/6031.html

(0)
网站编辑网站编辑认证
上一篇 2025年9月23日 上午11:51
下一篇 2025年9月23日 上午11:53

相关新闻