近日阿里云通义千问方面发布并开源多款全新模型,包括全模态模型Qwen3-Omni、语音生成模型Qwen3-TTS,以及图像编辑工具Qwen-Image-Edit-2509。
其中海霞树,Qwen3-Omni被定位为业界首个原生端到端全模态AI模型海霞树申博体育首页,可同步处理文本、图像、音频、视频等多种类型输入,并支持文本与自然语音实时流式输出申博体育首页,解决了长期以来多模态模型需要在不同能力之间进行权衡取舍的难题。
据了解海霞树申博体育首页申博太阳城首页。,Qwen3-Omni基于MoE(专家混合)架构与“思考者-表达者”设计sunbet(中国区)官方网站,,并结合AuT预训练以获得强大的通用表征能力,同时采用多码本设计以将延迟降至最低海霞树。该该模型支持119种文本语言、19种语音输入语言及10种语音输出语言。在36项音视频基准测试中海霞树海霞树,该模型有22项达到全球最新水平,32项在开源模型中领先,其语音识别与对话能力已可对标Gemini 2.5 Pro。
值得一提的是,阿里云通义千问方面还开源了通用型、细节丰富、低幻觉率的专用音频描述模型Qwen3-Omni-30B-A3B-Captioner,以填补开源社区在细节描述与低幻觉率音频生成方面的空白海霞树申博体育首页。
需要注意的是SUNBET申博!,不久前阿里云方面还开源了全新动作生成模型Wan2.2-Animate。据了解,该模型基于此前通义万相开源的Animate Anyone模型全面升级申博体育首页,在人物一致性、生成质量等指标上大幅提升,还同时支持动作模仿和角色扮演两种模式申博,。该模型支持驱动人物sunbet官方网站sunbet申慱官网,,、动漫形象和动物照片sunbet!,可应用于短视频创作、舞蹈模板生成、动漫制作等领域。