中文 English

Gemini 3.5 不只是更快:Google I/O 把 AI 战场推向“会干活的代理”

发布时间: 2026-05-20
Google I/O Gemini 3.5 Gemini 3.5 Flash AI Agent Google Antigravity Gemini API AI Search Gemini Spark 人工智能

先说结论

Google I/O 2026 这次最值得关注的,不是又多了一个聊天模型,而是 Google 把 Gemini 3.5 明确推向了“行动层”:首发的 Gemini 3.5 Flash 已经进入 Gemini App、Search AI Mode、Google Antigravity、Gemini API、Android Studio、Gemini Enterprise Agent Platform 和 Gemini Enterprise。Google 官方给出的关键词是 frontier intelligence with action,翻译成人话就是:模型不只是回答你,而是要在工具、代码、文件、搜索、企业流程里替你连续干活。

本文只整理 Google 官方公开资料和公开大会信息,并在此基础上做行业影响分析。文中图片均来自 Google 官方博客公开配图,未包含任何个人账号、内部网络、密钥、私有系统截图或非公开信息。

Gemini 3.5 官方题图

图 1:Google 官方 Gemini 3.5 题图。Google 这次把 Gemini 3.5 放在“智能 + 行动”的叙事里,而不是单纯强调聊天能力。

1. 这次到底发布了什么

Google 在 2026 年 5 月 19 日的 I/O 上发布了 Gemini 3.5 系列,第一款落地模型是 Gemini 3.5 Flash。按照 Google 官方博客的说法,Gemini 3.5 是一个面向复杂 agentic workflows 的模型家族,首发的 3.5 Flash 主打智能体、代码和长周期任务。3.5 Pro 也已经在 Google 内部使用,官方说法是计划在下个月推出。

这几个信息需要拆开看。

第一,Gemini 3.5 不是单个模型名字,而是一代模型家族。现在真正公开可用的是 3.5 Flash,Pro 还没正式开放。文章标题可以写 Gemini 3.5,但具体能力和可用性要落到 3.5 Flash 上,不能把还没发布的 3.5 Pro 当成已经可用的产品。

第二,Flash 这次不是“低端快模型”的定位。Google 明确称它是最强的 agentic 和 coding 模型之一,并给出了 Terminal-Bench 2.1、GDPval-AA、MCP Atlas、CharXiv Reasoning 等指标。它在官方叙事里承担的是“可以大规模跑代理工作流的主力模型”,不是给旗舰模型打下手的便宜替身。

第三,发布范围非常激进。Google 不是先给少数开发者预览,而是把 3.5 Flash 放进了 Gemini App、Search AI Mode、Google Antigravity、Gemini API、AI Studio、Android Studio、Gemini Enterprise Agent Platform 和 Gemini Enterprise。也就是说,它同时进入了消费者入口、开发者入口、企业入口和搜索入口。

Gemini 3.5 官方博客头图

图 2:Gemini 3.5 官方博客头图。Google 把它定义成“面向复杂代理工作流”的模型家族。

2. 为什么说它的重点不是“聊天”,而是“行动”

过去两年的大模型竞争,很多时候还是围绕“回答质量”展开:谁推理更强,谁写作更自然,谁多模态更好,谁上下文更长。但 Gemini 3.5 的发布稿里,Google 的重心明显变了:它反复强调 agentic tasks、long-horizon tasks、subagents、tool calling、coding、production-ready application。

这背后的含义很直接:大模型行业正在从“把问题答得更好”转向“把事情做完”。

如果一个模型只是回答问题,那么它再聪明也只是一个咨询窗口。真正改变工作流的是它能不能持续读取上下文、拆解任务、调用工具、写代码、运行代码、检查结果、修复错误、保存状态,并在用户监督下把一个工作闭环完成。Google 这次把 3.5 Flash 和 Antigravity、Managed Agents、Search agents、Gemini Spark 绑在一起,就是在告诉开发者和企业:模型本体只是发动机,真正的产品是代理运行时。

这也是为什么 3.5 Flash 的“快”很重要。代理系统不是一次请求结束,而是连续几十次甚至几百次模型调用。一个任务里可能有规划、搜索、文件读取、代码生成、测试执行、错误修复、总结汇报等多个阶段。如果每一步都慢,用户体验会崩;如果每一步都贵,企业不会大规模上生产。Google 官方称 3.5 Flash 的输出速度达到其他 frontier models 的 4 倍,并且在长周期任务中成本常常低于其他前沿模型的一半。即便这些数字还需要独立评测继续验证,方向已经非常清楚:未来 AI 竞争会越来越看重“单位时间、单位成本能完成多少真实任务”。

Gemini 3.5 Flash 官方 benchmark 动图

图 3:Google 官方发布的 Gemini 3.5 Flash benchmark 对比图。注意:这是 Google 官方口径,不能等同于第三方长期实测结论。

3. 对开发者:从 Copilot 到“多代理施工队”

开发者是这次发布里受影响最直接的一群人。Google 的开发者新闻稿把主题写得很明白:从 prompt 到 action。围绕 3.5 Flash,Google 同时更新了 Antigravity 2.0、Antigravity CLI、Antigravity SDK、Managed Agents in the Gemini API、AI Studio 移动端和 Android 原生支持。

这里最关键的是 Managed Agents in the Gemini API。Google 官方说明里提到,开发者可以通过一次 API 调用启动一个 agent,它会在隔离的 Linux 环境里推理、使用工具、执行代码,并且后续交互可以恢复同一个环境里的文件和状态。换句话说,Google 开始把“代理运行时”做成基础设施,而不是让每个开发者自己搭沙箱、文件系统、工具调用、会话恢复和安全边界。

这对开发者生态的影响可能很大。

以前做一个 coding agent,需要拼很多层东西:模型 API、工具协议、Shell 沙箱、文件存储、浏览器、日志、权限、回滚、评测。每家公司都要重新造一遍,最后差异还很大。Managed Agents 如果成熟,就会把一部分底层复杂度交给 Google。开发者可以更关注产品体验、任务定义、领域知识和安全策略,而不是先花几周搭 agent harness。

但这也意味着生态控制权会更集中。谁掌握模型、工具协议、运行环境和分发入口,谁就更容易定义下一代 AI 应用的默认形态。过去 IDE 插件是开发者 AI 的入口,未来可能是“代理平台 + 项目状态 + 可恢复任务环境”。这对 Cursor、Windsurf、Claude Code、OpenAI Codex、Replit、JetBrains、Warp 这类工具都会形成新的压力:大家比的不再只是代码补全,而是谁能更稳定地完成跨文件、跨工具、跨小时的任务。

Google I/O 2026 开发者发布配图

图 4:Google I/O 2026 开发者发布配图。Antigravity、Managed Agents 和 Gemini API 是这次开发者侧的重点。

4. 对搜索:Search 可能变成“按需生成的小应用”

Gemini 3.5 Flash 进入 Search AI Mode,是这次发布里最有行业冲击力的部分之一。Google 官方说,Search 从今天开始把 Gemini 3.5 Flash 作为 AI Mode 的默认模型,并推出信息代理、代理式预订、生成式 UI 和个性化智能等能力。

这意味着搜索正在从“找网页”走向“生成工作台”。

传统搜索的核心是索引网页,然后按相关性排序。AI Overview 已经把一部分答案直接聚合出来,而 AI Mode 更像对话式搜索。现在加上 3.5 Flash 和 agentic coding 后,Google 想做的是:当你的问题需要表格、图表、模拟器、时间线、追踪器、计划面板时,Search 可以实时生成一个合适的交互界面。官方举例包括可视化科学问题、生成自定义健身追踪器、为持续任务创建 dashboard。

如果这个方向跑通,影响会非常深。

第一,网页流量分配会继续变化。用户不一定需要点进十个页面再拼答案,Search 会在结果页里生成一个可操作界面。内容网站会更依赖“被引用、被采集、被代理读取”的价值,而不是只依赖点击。

第二,轻量应用的边界会被压缩。很多原本需要独立网页或 App 的小工具,比如预算表、训练计划、搬家清单、旅行比较、购买追踪、学习计划,都可能变成 Search 现场生成的小应用。它们不一定替代专业软件,但会吃掉大量低频、一次性、个性化工具需求。

第三,广告和商业转化会重新设计。Google 还提到 agentic booking、Shopping agents、Universal Cart 等能力。如果搜索可以直接根据条件帮你找服务、比价格、检查档期、甚至呼叫商家,那么“搜索广告”就不只是关键词旁边的链接,而会进入代理决策路径。这会带来效率,也会带来透明度和平台权力的问题。

Google AI Search 官方配图

图 5:Google Search I/O 2026 官方配图。Search AI Mode 使用 Gemini 3.5 Flash 后,重点从答案聚合进一步走向代理和生成式界面。

5. 对普通用户:Gemini Spark 是“全天候个人代理”的试探

消费者侧最值得关注的是 Gemini App 的升级和 Gemini Spark。Google 官方称 Gemini App 月活已经超过 9 亿,覆盖 230 多个国家和 70 多种语言;去年 I/O 这个数字还是 4 亿。这个增长本身就说明,Google 已经不再只是把 Gemini 当实验产品,而是在把它放进日常入口里。

Gemini Spark 的定位是 24/7 personal AI agent。官方描述里,它会在用户指引下帮助管理数字生活、主动执行任务,并先向 trusted testers 推出,随后计划向美国 Google AI Ultra 用户开放 Beta。Gemini App 还加入 Daily Brief、Neural Expressive 新界面、macOS App 后续集成 Spark 和新的语音能力。

这件事的行业意义不在于“又一个个人助手”,而在于 Google 拥有极强的上下文入口:Gmail、Docs、Sheets、Slides、Calendar、Search、Photos、Android、Chrome、Workspace。如果 Spark 能在用户授权下把这些上下文安全地串起来,个人代理会比单纯聊天机器人更接近真实工作流。

当然,风险也同样明显。个人代理越主动,越需要权限;权限越多,越需要透明的审计、撤销、确认和边界控制。用户真正需要的不是一个“什么都替我做”的黑箱,而是一个能说明它准备做什么、为什么这么做、用了哪些数据、可以如何撤销的助手。Google 在发布中反复强调 under your direction、transparency、choice、control,这些词不是装饰,而是个人代理能否被大规模接受的前提。

Gemini App 官方配图

图 6:Gemini App 官方配图。Gemini 3.5 Flash、Gemini Spark、Daily Brief 和 Gemini Omni 共同组成了消费者侧的新 Gemini 叙事。

6. 对企业:自动化从“点状提效”进入“流程级替换”

企业侧,Google 给出的案例很直白:Shopify 用 subagents 做长周期复杂数据分析,Macquarie Bank 用 3.5 Flash 处理 100 页以上复杂文档并给出低延迟建议,Salesforce 将它集成到 Agentforce,Ramp 用它提升复杂发票 OCR 和历史模式推理,Xero 用代理处理 1099 税表相关的多周流程,Databricks 用 agentic workflows 监控、检索、诊断数据环境问题。

这些案例背后的共同点,不是“写一段文案更快”,而是流程级自动化。企业真正贵的地方往往不在单个问题,而在跨系统、跨文件、跨角色、跨时间的重复流程。过去 RPA 能处理规则稳定的点击流,传统机器学习能处理特定预测任务,而大模型代理试图进入的是规则半结构化、上下文复杂、需要判断和工具调用的中间地带。

如果 3.5 Flash 这类高性价比前沿模型能稳定支撑长周期任务,企业 AI 的 ROI 计算方式会变。过去老板问“这次调用多少钱”,未来更可能问“这个流程每月能少消耗多少人工小时、少延迟多少天、少出多少错”。模型价格仍然重要,但不再是唯一核心;延迟、可靠性、可观测性、权限、审计、失败恢复、人工接管都会进入采购标准。

这也是为什么 Gemini Enterprise Agent Platform 值得关注。企业不会只买一个模型 API 就放心把财务、客服、销售、税务、合规流程交出去。它们需要身份权限、数据连接、策略控制、日志审计、沙箱执行、私有部署或区域合规。Google 的全栈优势就在于它可以把模型、云、Workspace、Search、Android、浏览器和企业平台打包成一条链路。

7. 对 AI 行业:真正的竞争单位变成“模型 + 工具 + 入口 + 运行时”

Gemini 3.5 Flash 的行业影响,可以概括成一句话:AI 竞争正在从模型榜单竞争,转向完整代理系统竞争。

模型本身当然还重要。没有足够强的推理、多模态、代码和工具调用能力,代理系统就是空架子。但模型只是其中一层。谁能把模型接进用户每天使用的入口,谁能提供可靠的工具调用和沙箱,谁能让代理保存状态、协同分工、长期执行,谁能让企业放心审计和治理,谁才有机会把 AI 从“试用”推到“生产”。

Google 的优势是入口广:Search、Android、Chrome、Workspace、Gemini App、Cloud、AI Studio、Antigravity。OpenAI 的优势是开发者心智和产品节奏,Anthropic 的优势是长文本、企业可信度和 Claude Code 这类强口碑工具,Meta 的优势是开源生态和分发,xAI、Mistral、DeepSeek 等厂商也会在性能、成本、开放性和地域市场上继续施压。

这次 I/O 的信号是:Google 不准备只做“另一个模型提供商”。它要把 Gemini 3.5 放进默认搜索、默认移动端、默认办公、默认开发工具和默认企业代理平台。这个策略很重,但一旦跑起来,护城河也更深。

对创业公司来说,这既是机会也是警告。机会在于 Managed Agents、Gemini API、AI Studio、Antigravity SDK 可能降低搭建代理产品的门槛;警告在于,通用代理入口和通用小工具会被平台吃掉。更有价值的方向会变成垂直领域数据、专有流程、强工作流集成、可信评测、合规交付和人机协作设计,而不是简单套一层聊天框。

8. 还需要保持冷静的地方

虽然这次发布很有分量,但有几件事需要冷静看。

第一,官方 benchmark 不是长期独立使用体验。Terminal-Bench、GDPval-AA、MCP Atlas、CharXiv 等指标有参考价值,但真实生产环境还要看失败率、可恢复性、工具调用稳定性、长时间任务漂移、上下文污染、权限误用和成本曲线。

第二,代理不是越自主越好。很多任务最适合的是“人监督下的自动化”,而不是完全无人值守。尤其是涉及金钱、合约、医疗、法律、生产系统、个人隐私时,代理必须有审批点、回滚机制和日志。

第三,平台能力越强,锁定效应越强。Managed Agents 很方便,但如果你的关键工作流完全依赖某个平台的运行时、工具协议、沙箱和权限体系,迁移成本会升高。企业在采用时需要保留数据出口、任务日志和跨模型评测能力。

第四,地区和订阅差异会影响体验。很多功能会分国家、语言、订阅层级、测试资格逐步开放。文章里写“已经发布”不等于每个人今天都能在自己的账号里看到全部能力。

9. 我的判断:Gemini 3.5 是 Google 的“代理总动员”

如果只看模型名称,Gemini 3.5 像是 Gemini 3 到 Gemini 4 之间的一次中间更新。但如果看发布方式,它更像 Google 对 AI 产品路线的一次集体转向:Search 要变成代理入口,Gemini App 要变成个人代理,Antigravity 要变成开发者代理平台,Gemini API 要提供托管代理,Enterprise 要承接企业流程自动化。

所以这次真正的标题不是“Google 又发了一个新模型”,而是“Google 开始把 AI 从回答机器推向执行系统”。

这会给整个行业带来三个变化。

第一,速度和成本重新变成核心竞争力。不是为了跑分好看,而是因为代理会消耗大量连续调用。Flash 级模型如果能接近旗舰能力,就会成为代理时代的主力。

第二,应用形态会变。未来很多软件入口可能不是菜单、按钮和表单,而是一个能生成界面、调用工具、保存状态、持续推进任务的代理层。

第三,评测标准会变。我们不应该只问“这个模型回答得对不对”,还要问“它能不能把一个需要两小时的人类任务稳定压缩到二十分钟,并且错误可控、过程可审计、成本可接受”。

Gemini 3.5 Flash 不一定会立刻赢下所有场景,但它把 Google 的意图说得非常清楚:下一轮 AI 竞争,不只是更聪明的模型,而是更可靠、更便宜、更能接进真实世界的执行系统。

来源

  1. Google 官方:Gemini 3.5: frontier intelligence with action,2026-05-19:https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/
  2. Google 官方:Building the agentic future: Developer highlights from I/O 2026,2026-05-19:https://blog.google/innovation-and-ai/technology/developers-tools/google-io-2026-developer-highlights/
  3. Google 官方:Introducing Managed Agents in the Gemini API,2026-05-19:https://blog.google/innovation-and-ai/technology/developers-tools/managed-agents-gemini-api/
  4. Google 官方:The Gemini app becomes more agentic, delivering proactive, 24/7 help,2026-05-19:https://blog.google/innovation-and-ai/products/gemini-app/next-evolution-gemini-app/
  5. Google 官方:A new era for AI Search,2026-05-19:https://blog.google/products-and-platforms/products/search/search-io-2026/
  6. Google 官方:I/O 2026: Welcome to the agentic Gemini era,2026-05-19:https://blog.google/innovation-and-ai/sundar-pichai-io-2026/