品玩

科技创新者的每日必读

打开APP
关闭

千问是什么?答案正在风中飘荡

请回答:第一,千问还能不能持续地发布“能打”的模型;第二,千问能给正在爆发的全球 token 消费市场带来什么,能给阿里巴巴带来什么

骆轶航

发布于 6小时前

2026年3月30日到4月2日,阿里巴巴旗下的通义实验室密集发布了三个模型:

先是3月30日的 Qwen3.5-Omni,主打全模态交互。它在215项音视频理解、识别、交互任务中取得最佳成绩,多项测试超过 Gemini-3.1 Pro。支持图片、视频、语音、文字的输入与输出。其中,一个意外涌现的能力是“音视频 Vibe Coding”:对着摄像头口述需求,模型可直接生成带 UI 的产品原型代码。这算是 AI 编程的一个新境界。

然后是4月1日的 Wan2.7-Image,主打图像生成与编辑。它在人类偏好盲测中文生图能力排名国内第一,接近了 Nano Banana Pro的水准。在告别 “AI标准脸”上也有突破,可以支持脸型和眼型等细节定制,也能精准指定颜色配比;在多图多主体一致性上也大有进益。

最后是4月2日祭出的重磅作品 Qwen3.6-Plus,主打编程与 Agent。它在 SWE-bench 等多项编程评测中超过参数量2到3倍于它的 GLM-5和 Kimi-K2.5,是目前编程得分最高的国产模型,接近 Claude 系列水平。

编程能力的提升,让 Qwen3.6-Plus 更适合“代理式编程”(Agentic Coding)。在实测中,Qwen3.6-Plus 可自主拆解任务、规划路径、写代码、测试修改,直至完成交付,在前端开发和仓库级复杂任务中都能跑通。基于多模态训练,Qwen3.6-Plus 能看懂设计稿,进而生成前端代码。它支持100万 token 上下文,适配了Claude Code 和 Cline 等主流 Agent 框架。而旗舰版 Qwen3.6-Max 也将在近期发布。

这是通义实验室在林俊旸、郁博文和惠彬原等骨干研究人员在3月初离职之后的第一次密集的模型发布,有着特定的信号意义,也意味着一次真正的变阵。

Model as an Agent

它首先试图证明阿里巴巴和通义实验室的模型研究能力是持续、可演进的,短期的人事震荡没有伤筋动骨,也反向促成了以 token 消费为出发点的架构调整。

尤其是 Wan2.7-image——作为千问大模型旗下的图像生成模型 Wan,此前在 AI 生态的舆论场的抛头露面不像 Qwen 系列那么高频,但 Wan 系列带来的 token 消耗和实际 API 收入比 Qwen 系列更高,是一个很长时间以来被人们忽略的事实。

通义实验室旗下的模型布局是多点的,Wan 不可或缺,这次 Wan2.7-image 与 Qwen3.6-Plus 和 Qwen3.5-Omni 几乎同一时间对外亮相,也赋予了它应有的地位权重。

而这轮模型发布透露的更重要的信号是:Agent 成为了阿里巴巴新模型的战略重心。

Qwen3.6-Plus 主打 Agentic Coding,即代理式编程;Qwen3.5-Omni 涌现出音视频交互的 Vibe Coding;生图模型 Wan2.7 也强调可被 Agent 通过 skills 调用能力,它们指向的是同一件事:自主完成任务的能力,是衡量模型价值更重要的参照系。

Model as an Agent。

这个信号的释放,与阿里巴巴在3月中旬成立 ATH 事业群 (Alibaba Token Hub)之后的一系列战略调整与明晰,形成了紧密的强关联。

一个无可争议的共识是:AI 模型的发展已进入了推理引擎的阶段。

而推理引擎“外化”的最直观的产品形态,即是 Agent。对全球所有的基座模型玩家而言,“通用 Agent” 已经是它们必须“内化”的关键能力。

它可以是基于模型和工程化强大能力的自动化编程,也可以是 Computer Use 和 Phone Use,可以用 CLI 的界面呈现给专业开发者,也可以保留 GUI 界面给普通的生产力创造型用户,但它们本质上都是模型自带的通用 Agent,是专业用户和普通用户消费 token 的 hub。

你甚至可以认为,token hub 就是 Agent。而 ATH,就是阿里巴巴 Agent,更准确点说,是阿里巴巴 Agent 能力的集合。

It's all about Token

顺着这个思路,你就更容易发现千问大模型系列的这次密集发布,与此前的模型亮相背后有着哪些根本的不同。

首先,它前所未有地强调场景导向。

此前千问系列的模型,往往强调“综合能力”的秀肌肉感—— MMLU、C-Eval、GSM8K 等等,都跑一遍,追求一个模型在所有维度的性能指标,都好看。

但这次的变化是:Qwen 3.6-plus 主打以编程为核心的 Agent 能力;Wan2.7-image 主打图像生成与编辑的 Agent 可调用能力;Qwen 3.5-omni 主打多模态交互的 vibe coding Agent 能力。面向不同场景,又都是 Agent 能力驱动。它不再追求在一个通用模型上,什么都能干,大多数 benchmark 都优秀,而转向在具体场景上,用不同的 Model as an Agent,完整地执行不同的任务。阿里巴巴的千问大模型系列,开始用实战表现而非综合指标的排名,来定义模型的能力。

而实战表现,最终指向的是 token 的消耗,从长期看,也就是收入的增长。

其次,它开始把千问模型定义为 Agent 的基础设施。

一直以来,千问大模型,准确地说是 Qwen,在普通用户和专业开发者的视角中,是两个完全不同的东西。普通用户觉得它是个免费的 chatbot,专业开发者觉得它是可以被灵活下载部署的开源模型,基于它衍生自己的模型,或开发自己的垂直 Agent。前者主要来自国内,后者更多聚集在硅谷。但与 ChatGPT 和 Claude 不遗余力的 Agent 化演进不同,Qwen 一直也没被广泛地认为具有强烈的 Agent 属性。现在事情起了变化。

Qwen3.6-Plus 基于其被证明的 Agentic Coding 能力,已被明确设计为 Agent系统的推理引擎,而不是面向终端用户的聊天工具。它与 OpenClaw 和 Claude Code等系统集成,充当推理层,这些工具负责执行和交互,模型更像是一个核心引擎,而非一个模型成品。这也解释了它具有100万 token 上下文窗口的意义:聊天场景下,用户一次消耗几百到几千 token,但 Agent 跑一个任务可能消耗几十万甚至上百万token,100万 token 的上下文可不是技术炫耀,而是 Agent 场景的刚需。

这应该是千问第一次真正地有了自己的 Agent 推理引擎,实现了 Model As an Agent。在几乎所有基座模型公司都意识到 Agent 才是调动 token 消费的第一生产力之后,千问也终于补上了这一环。

更重要的,是它第一时间接入了阿里巴巴的整个业务体系——更准确点说,是阿里巴巴的生产力业务体系。

过去,千问大模型的发布,就是发布模型本身,是通义实验室自己的事。它面向的“客户”,是全球的 AI 开发者,主阵地是 Hugging Face、GitHub 和 Reddit。阿里巴巴旗下的各个业务单元并未受到直接的影响,甚至不同的业务单元还有自己的模型。

但这次三个模型发布的同时,阿里内部的 AI 应用体系第一时间全面接入:由钉钉脱胎而生的 AI 原生企业工作平台“悟空”、千问 APP 和编程工具 Qoder 都在同一星期接入了上述三个模型。通义实验室的“客户”,从全球几乎是免费使用的开发者,变成了阿里巴巴内部有 token 消费需求的生产力业务部门。至于内部怎么结算,那是另外一件事。

这背后的推手当然是 ATH 事业群。它把算力层、模型层、应用层并到一起,形成了“创造token(千问模型)、 输送token(阿里云算力)和 消费token(悟空、千问 APP 等 AI 原生应用)”的链路。千问大模型不再是一个孤立的业务单元,而是阿里 AI 业务体系的供给侧基础设施。至少,在模型和 Agent 能力第一时间接入内部相关业务单元这一点上,阿里巴巴的做法已经跟 Google 没什么两样了。

这三点变化,配合三款“千问系”模型的发布,一个底层逻辑正在浮现,那就是“大家都来用千问大模型”已经不够了,现在需要的是:“大家都来用千问大模型,直接调用模型在不同场景下的 Agent 能力,直接完成工作,在千问上消费 token,给千问,包括阿里云甚至整个阿里巴巴,贡献收入”。

模型是基石,Agent 是入口,模型与 Agent 驱动的 token 消耗,是增长引擎。

这个增长引擎转得起来么?

在千问“三连发”之后的第二天,即2026年4月3日,Qwen 3.6-plus 在全球最重要的模型调用平台 OpenRouter 上的调用量排名已位居第二。目前的第一名是小米的 MiMo-V2-Pro,一直靠免费占据头筹。而 Qwen 3.6-plus 这次是收费的,每百万 token 2元,尽管比 Claude API 便宜得多,但它考验的是模型性能、Agent 引擎能力和综合性价比的整体,全球的开发者和 AI 专业用户都在这里用脚投票。

要知道,这恐怕是千问系列模型第一次在 OpenRouter 调用量榜单上排到前10的位置。千问不再只靠免费部署的开源小尺寸模型通吃开发者市场了,这是最重要的变化。与此同时,阿里云 AI 算力和存储产品最高涨价34%,市场反应目前呈现供不应求。上下游互相拉动,正在形成商业闭环。

过去的一个月,通义实验室、千问大模型乃至整个阿里巴巴的 AI 战略被前所未有地放在聚光灯下审视:一些问题被暴露了,一些遗憾被留下了,一些动作被放大了。

但真正值得被关心的只有两个问题:其一,千问还能不能持续地发布“能打”的模型;其二,千问能给正在爆发的 全球 token 消费市场带来什么,能给阿里巴巴带来什么。

现在来看,两个问题都找到了答案。

骆轶航

Thomas Luo (骆轶航),PingWest 创始人、CEO、总编辑

取消 发布
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测