"试验阶段结束了。" Google Cloud CEO Thomas Kurian 在开场不到三分钟就抛出这句话。
Google Cloud Next 大会于当地时间4月22日上午在拉斯维加斯召开。这是近年来科技圈最受关注的云计算大会之一,今年的主角只有一个:Agent。
从 Keynote 的章节命名就能看出 Google 的野心:Agentic Enterprise Blueprint、Agentic Data Cloud、Agentic Defense、Agentic Taskforce......每一个模块都冠上了"Agentic"的前缀,Google Cloud 向世界介绍的是一套从算力底座到应用前端的完整agent架构。
但如果你把这场 Keynote 从头看到尾,会发现一件非常有意思的事:
Google是真的瞧不上Harness,在整场大会里对这个火热名词一字未提。
在热火朝天的agent浪潮里,Harness是最近一段时间最火热的概念。它被用来描述建设agent的过程里所需要的一切基础设施。
而在疯狂的讨论里,如我们之前所观察的,Google的沉默振聋发聩。它完全缺席了。
这次Google Cloud的大会上,缺席的原因终于明白:
Google根本不认同什么Harness,或者说它拒绝被其他人提出的模棱两可概念牵着鼻子走,它提出的是从AI Hypercomputer(包括新发布的训练和推理分家的更强TPU),Agentic Data Cloud、Agentic Defense、Agentic Task Force,到最重要的Gemini Enterprise Agent Platform的Agent五层架构体系。
它要用这个全家桶抢走所有企业agent的生意。在这次大会上,甚至出现了活久见的一幕:苹果的logo出现在Google的发布会大屏幕上,恍惚以为误入乔布斯剧院。Google就这样以客户案例展示的形式“发布”了新的Siri的关键信息。
这一切都是Google在秀肌肉。
以下是这场长达两小时 Keynote 的核心内容解析。
Sundar Pichai :资本投入创历史
Google CEO Sundar Pichai 公布了一个让人瞠目的数字:Google 在2022年的资本支出为310亿美元,而2026年的预算区间是1750亿至1850亿美元,四年内实现了近6倍的增长。其中超过一半的机器学习算力将专门分配给云业务。
他随即用 Google 自己的案例说明 Agent 的实际价值:
Google 内部目前75%的新代码由 AI 生成,并由工程师审核通过(去年秋天这一比例还是50%)。在一次复杂的代码迁移任务中,工程师组建了由"规划者、协调者、编码者"三类角色构成的 Agent 系统,最终将迁移速度提升了6倍。
在营销层面,团队借助 Gemini 生成大量创意素材变体,实现精细化个性投放,带来70%的制作周期缩短和20%的转化率提升。
在安全层面,Google 安全运营中心的 Agent 每月自动处理数以万计的非结构化威胁报告,将威胁缓解时间压缩了超过90%。
Pichai 随后宣布了大会最重磅的产品:Gemini Enterprise Agent Platform,并将其定义为"Agent 时代的任务控制中枢"。
Gemini Enterprise Agent Platform:企业 Agent 的操作系统
这是整场 Keynote 着墨最多的部分,也是 Google 今年最核心的产品策略落点。
Google 发布了一批新模型,均处于 Preview 阶段:
Gemini 3.1 Pro,最新的旗舰推理模型,专为复杂工作流编排设计,可与企业 API 和系统直接交互,减少调优需求。Databricks、JetBrains、Replit 均已选择接入。
Gemini 3.1 Flash Image(内部代号 Nano Banana 2),面向高保真视觉资产生成。Veo 3.1 Lite,Google 最具成本效益的视频模型,定位高并发视频应用场景。Lyria 3 Pro,企业级音频和音乐生成模型。
值得关注的是,Google 同时支持 Anthropic 全线模型,并在大会上宣布新增对 Claude Opus 4.7 的支持。
此外,Google还宣布成为苹果的首选云合作伙伴,双方正在基于 Gemini 技术共同开发下一代 Apple Foundation Models,这些模型将驱动包括"更个性化的 Siri"在内的苹果未来 AI 功能。
平台的核心价值在于覆盖 Agent 从构建到治理的全生命周期:
Low-Code Agent Studio 允许非技术员工用自然语言创建和部署 Agent,将业务规则融入 LLM 推理,实现可预期的自主执行。
Agent Registry 是 Agent 的"总台账",为组织内每一个内部 Agent 和工具建立索引,确保可发现性与治理合规。Skills & Tools Registry 则提供可复用的模块化指令包,让 Agent 能快速习得特定领域的专项能力。
Agent Marketplace 支持从生态合作伙伴直接搜索和部署专业 Agent,接入方包括 Atlassian、Box、Oracle、ServiceNow、Workday 等主流企业软件厂商。
平台原生支持 Model Context Protocol(MCP),并将全部 GCP 服务暴露为 MCP 接口,使任意 Agent 均可无缝调用任意 GCP 服务。
在安全侧,平台引入了 Agent Identity 机制——每个 Agent 被分配唯一的加密 ID 和明确的授权策略,所有行为均可追踪和审计。Agent Gateway 充当统一管控台,跨组织执行策略,配合 Model Armor 防止敏感数据泄露。
Agent Observability 提供粒度化的执行路径可视化,支持 OTel 标准遥测,开发者可追踪 trace、监控工具调用,诊断推理死循环。
客户采用数据颇为亮眼:
德国保险公司 Signal Iduna 上线数周后即达到80%的使用率,11,000名员工开始自主构建专属 Agent,其健康险 Agent 将用户答复速度提升了37%,周活用户增长400%。KPMG 首月达到90%的采用率,上线超过100个 Agent。Walmart 向门店管理人员推出 Gemini Enterprise,让管理者能花更多时间在卖场与员工、顾客互动,而非坐在办公室盯屏幕。NASA 使用 Gemini Enterprise Agent 为 Artemis II 载人航天任务提供飞行就绪性支持,确保宇航员安全。
此外,Citi Wealth 与 Google Cloud 及 DeepMind 合作,推出了名为"Citi Sky"的 AI 财富团队成员,可全天候多语言为客户提供金融服务。Virgin Voyages 部署了面向船员的 AI 助理"Project Ruby",将生产时间线缩短约60%,并拉动单月销售额增长28%,实现了一个销售纪录季度。
大会还邀请了单板滑雪传奇、三届奥运金牌得主 Shaun White 上台,现场演示 Google Cloud 如何用 AI 分析他在2017年的比赛影像——将一个不到三秒的腾空动作逐帧拆解,追踪三维姿态、旋转速度、腾空时长,为新生代运动员的技术训练提供数据支持。
AI Hypercomputer:算力基础设施的两条腿
负责基础设施的高级副总裁 Amin Vadhat 说:"在 Agent 时代,算力不再由一块芯片定义,算力就是整个数据中心。"
Google 本次发布了 TPU 第八代,并首次拆分为两个独立平台:
TPU 8t(训练专用):将块缩放乘法运算直接内置于 MXU(矩阵运算单元),消除 VPU 计算开销,单 pod 计算性能是上一代的近3倍。芯片间互联带宽是 Ironwood 的两倍,最多可连接96,000颗 TPU,形成3D 环形拓扑,整个 Superpod 提供121 exaflops FP4算力。单 Superpod 共享带宽内存达2 petabytes。Google 将其类比为"可存放美国国会图书馆全部数字馆藏100次"的容量。
TPU 8i(推理及强化学习专用):集成专用集合加速引擎,额外降低5倍延迟;全部内存缓存直接驻留在硅基上,从根本上打破了制约长上下文解码的"内存墙"。采用全新 Boardfly 拓扑,单 pod 部署1,152颗 TPU,可同时运行数百万个并发 Agent,接近零延迟,算力达11.6 FP8 exaflops,较256芯片 Ironwood pod 提升9.8倍。
在网络层,Virgo Network 将134,000颗芯片以47 petabits/s 的无阻塞带宽互联,提供170万 exaflops 的总算力,支持在单一集群中组织超过百万颗 TPU,可将数月的训练时间压缩到数周。
与此同时,Google 宣布将成为全球首批提供 NVIDIA Vera Rubin NVL72 的云厂商,并在其上开放 Virgo 网络支持,最多可连接96万颗 GPU。
在处理器侧,基于 Arm 架构的自研 Google Axion N4A 实例上线,与同类 x86 实例相比,价格性能比提升最高2倍,能耗性能比提升80%。
金融巨头 Citadel Securities 现场分享了实测数据:在 TPU 上运行工作负载的速度是此前的2至4倍,成本降低30%;原本需要数周甚至数天的研究任务,现在可以在数小时乃至数分钟内完成。
Agentic Data Cloud:让 Agent 读懂企业数据
"没有上下文的推理只是猜测。" 负责数据业务的 Karthik Narain 给出了这场演讲里最直白的一句话。
Agentic Data Cloud 由四项核心创新构成:
Knowledge Catalog(知识目录),定位为企业的"通用上下文引擎"。它深度整合 BigQuery,将表结构和元数据映射为统一的业务语义,并通过 Smart Storage 将非结构化数据(PDF、图片等)一落入 Google Cloud Storage 便立即完成标记、富化和 Agent 就绪处理,无需任何人工数据工程。Gemini 会自动提取实体、映射关系、理解业务语义:当 Agent 听到"净收入"或"风险"时,它能理解企业特定的语义含义。
Data Agent Kit,一套内嵌于开发者日常工作流(VS Code、Claude Code、Gemini CLI)的数据科学工具库。开发者只需表达意图,例如"预测客户流失",系统便自动构建数据管道、部署模型,直接在 Agentic Data Cloud 上执行,全程无需手动编排。
Lightning Engine for Apache Spark,Google 重构了 Spark 执行引擎,在 Agent 时代的大规模数据处理场景下,性能是此前市场领导者的2倍,价格性能比也高出2倍。Flipkart、Lowe's、Meesho 等已开始使用。
Cross-Cloud Lakehouse(跨云数据湖仓),这是 Karthik 最着重阐述的一项能力。基于开放的 Apache Iceberg 标准,分析引擎可以直接跨 AWS、Azure 查询数据,数据不移动、零复制、无须承担昂贵的出站流量费,直接实现低延迟访问,彻底打破"数据必须在同一朵云"的历史枷锁。
Agentic Defense:安全也要以机器速度运转
"漏洞从发现到被利用的时间已经变成负数。"安全负责人 Francis deSouza 用这句话揭示了当前网络安全的严峻现实:当前漏洞的平均被利用时间是负7天,也就是说,攻击往往发生在补丁尚未开发出来之前。更令人担忧的是,攻击者从初始入侵到移交给下一个威胁团伙的交接时间,已从过去的8小时压缩到22秒。
应对这一现实,Google 推出了 Gemini 原生的 Agentic 安全运营中心(SOC):triage Agent 将原本30分钟的安全调查压缩至60秒完成;威胁狩猎与检测 Agent 以人类团队无法企及的速度和规模主动扫描风险;结合 Mandiant、VirusTotal 和 Chrome 的全球遥测数据,暗网威胁识别准确率达98%。
大会上,Wiz 正式并入 Google Cloud(此前已宣布收购意向)。Wiz 联合创始人 Yinon Costica 上台介绍了 Wiz 的 AI Application Protection Platform(AI-APP):
Wiz 通过无代理方式自动构建云和代码环境的动态资产清单,并生成安全图谱,直观呈现 AI 应用架构(包括哪个 Agent 运行哪个模型、能访问哪些数据库和工具)。
Wiz Red Agent(红队 Agent)持续自动验证每个暴露风险,像一个友好的白帽黑客不间断扫描攻击面——它能发现认证绕过漏洞,并证明该漏洞确实可被用来渗透后台敏感数据库。Wiz Green Agent(绿队 Agent)则负责自动化完整的修复流程:识别责任人、定位漏洞代码行、生成修复建议,并可直接提交 PR 或触发编码 Agent 自动修复。
Agentic Taskforce:让 Agent 直接服务客户和员工
Google 推出了预建的购物 Agent 和餐饮点单 Agent,支持从发现到结账的全流程自然语言交互。Omnichannel Gateway 确保 Agent 在网页、移动端、语音多个渠道之间无缝衔接,且完整保留对话上下文。
Papa John's 正在用 Food Ordering Agent 构建记忆用户偏好、加速送达的超个性化点餐系统。Best Buy 用 Agent Assist 引导购物者了解复杂产品规格、解决问题、预约服务。Home Depot 的"Magic Apron"助理则覆盖从选购灵感、产品知识到购后支持的全旅程。
演示环节中,YouTube TV 的客服语音 Agent 已在生产环境中服务100%的用户,现场接到来电后,Agent 流畅地推荐了体育订阅方案,并在请求下实时切换为西班牙语为来访者父亲讲解,整个体验自然到与真人客服无异。更重要的是,YouTube TV 团队从零到生产上线,只用了六周。
Google Workspace 产品 VP Yulie Kwon Kim 发布了 Workspace Intelligence,定义为"消除上下文碎片的统一智能层"。
她用一个场景说明问题:一个普通的工作日里,你为了回答一个问题打开了15个标签页,在过期邮件、被人实时编辑的 PPT 和多个表格之间来回跳转。Workspace Intelligence 的目标是让这一切不再发生。
演示中,系统在 Google Chat 的 Ask Gemini 界面里,直接汇总了来自多个来源的最紧急任务,精确定位了"上季度那个带区域销售折线图的 doc",并通过调用"区域营销技能",自动跨邮件、聊天记录、外部 CRM 和企业品牌素材,生成了一份格式精美、符合个人历史风格的 Google Slides 报告。
大会还宣布,从 Microsoft 365 迁移到 Google Workspace 现在可以快5倍,包括法律和财务等对格式要求严苛的复杂团队迁移也在支持范围内。
一场系统架构层面的宣战
纵观整场 Keynote,如果只提炼一个核心判断,那就是:Google 正在将 Agent 从一个功能,升级为一套完整的企业操作系统。
Thomas Kurian 在最后总结时特别强调了"开放",并以此与竞争对手的"围墙花园"策略形成对比:客户可以自由选择最好的芯片和模型、自由在任何地方运行 AI、自由控制自己的数据和 Agent。
但自由不是无序。Google 给出的答案,是用五层架构把这种自由兜住。
AI Hypercomputer,为 Agent 时代重新设计的算力底座,训练与推理首次分开专项优化。Agentic Data Cloud,解决的是 Agent 的"原料"问题:企业数据如何变成 Agent 可信赖的上下文。Agentic Defense,让安全本身也成为自主运行的 Agent,以机器速度对抗机器速度的威胁。Gemini Enterprise Agent Platform,Agent 的构建、部署、治理、优化一体化平台。Agentic Taskforce,面向客户和员工的现成 Agent 部队,以及将 AI 能力深度融入 Workspace 的智能层。
"试验阶段结束了",这句话听起来像一个简单的宣告,但背后是一个清晰的商业逻辑:当75%的 Google Cloud 企业客户已经在使用 AI 产品,当 Walmart 和 Unilever 这样的传统巨头也已将 Agent 部署到门店和采购流程,Google Cloud 需要的不再是说服企业为什么要用 AI,而是向企业提供管理数千个 Agent 的能力。
这正是 Gemini Enterprise Agent Platform 的存在意义。




0 条评论
请「登录」后评论