品玩3月31日讯,阿里近日正式发布千问新一代全模态大模型Qwen3.5-Omni。该模型在音视频理解、识别及交互等215项任务中取得SOTA(性能最佳)成绩,综合表现超越Gemini-3.1 Pro,跻身全球顶尖全模态大模型行列。
Qwen3.5-Omni具备极强的音视频理解与实时交互能力,支持生成详细且可控的结构化描述,可精准识别113种语言及方言。尤为引人注目的是,模型自然涌现出音视频Vibe Coding能力,用户仅需对着镜头口述需求,即可自主生成App、网页等复杂产品代码。
商业化方面,阿里云百炼已上线Plus、Flash、Light三种API,广泛适用于短视频、游戏及自媒体等行业。开发者调用成本极具竞争力,每百万Tokens输入不到0.8元,仅为Gemini-3.1 Pro的十分之一,普通用户亦可通过Qwen Chat免费体验。





0 条评论
请「登录」后评论