93个AI智能体在12小时内从零构建出一个完整操作系统内核的画面,出现在谷歌I/O开发者大会的屏幕上时,2026年5月这场发布会的基调便已确立。
工作人员现场演示了这一过程:一句指令,Antigravity 2.0平台自主调度93个子智能体,发出超1.5万次模型请求,处理26亿个token,12小时后交付了一个功能完整的OS内核,成本不到1000美元。随后,当他试图在该系统上运行游戏《毁灭战士》时,因缺失驱动而失败。他没有写一行代码,当场向Agent下达修复指令,Agent自动识别依赖、生成驱动、完成测试,游戏最终成功运行。
这一演示与同场发布的Gemini Omni、Gemini 3.5 Flash、Gemini Spark等产品,共同勾勒出谷歌AI布局的全貌:从自研的第八代TPU芯片到超过100万块的算力集群,从多模态大模型到个人智能体应用,覆盖了AI产业链从底层硬件到终端用户的每一个环节,而这正是谷歌I/O 2026整场发布会的基调:不是某一项技术的单点突破,而是全栈能力的系统性供应。同时,谷歌输出的核心要义,是其系统工作下能给产业带来最高性价比。面对OpenAI、Anthropic等强劲竞争对手,谷歌这一“老牌”AI企业在新一届开发者大会上进一步强化了“垂直整合、全栈控制”发展战略。
从芯片到模型到应用的全栈控制
理解谷歌的战略意图,需要看清此次发布的三款核心产品如何构成一个相互协作的整体。
Gemini Omni扮演着“感官与表达”的角色。它的价值不在于“视频生成”本身,而在于尝试将物理世界的理解注入生成过程。现场演示中,一句“用黏土动画解释蛋白质折叠”的提示词,Omni便生成了一段教学视频,画面中蛋白质的折叠过程科学精准,黏土质感贯穿始终。谷歌强调,此前的模型已能生成视频和图像,但Omni能进一步尝试处理动能、重力等更接近物理世界的问题。有行业观察者认为,这类统一处理多种模态的模型“标志着行业即将进入一个全新的时代”。但需要指出的是,Omni目前仅首发轻量版本,从会后反馈来看,业界评价不一,有人认为“表现不如预期”。从演示到大规模应用,其稳定性仍有待验证。
Gemini 3.5 Flash则是这一体系的“大脑”。谷歌数据显示,这一轻量模型在编码、工具调用、多模态理解等多项基准测试中,全面超越了三个月前发布的旗舰模型Gemini 3.1 Pro。速度方面,输出达到每秒289个token,约为GPT-5.5和Claude Opus 4.7的4倍。第三方评测机构Artificial Analysis评价称,它在智能与速度的平衡上“占据了目前没人能触及的位置”。用轻量模型超越前代旗舰,说明迭代效率正在提升。但该机构也指出,由于更高的资源消耗,“其运行成本比此前版本高出5倍多”,对企业用户而言,成本与性能的平衡仍是关键。
Antigravity 2.0和Gemini Spark是“双手”,将模型的思考付诸行动。前者已从开发工具演变为独立的Agent优先桌面应用;后者则是一个7×24小时云端运行的个人智能体,可跨Gmail、Docs、日历等谷歌服务自主执行任务,从起草邮件到规划社区派对。谷歌将其定位为“你的个人智能体”。然而从现实角度而言,Spark仍是实验性产品,当AI从“对话伙伴”进化为“执行助手”,安全与可控性的考验也随之升维。
在三者构成从感知、推理到执行的完整闭环的同时,谷歌自研TPU芯片提供强劲的“能力供应”。谷歌CEO皮查伊(Sundar Pichai)表示,谷歌2026年的资本支出预计在1800亿~1900亿美元之间,其中一个重要投资方向是定制芯片。其第八代TPU第一次采用双芯片架构,分别为训练(TPU v8o)和推理(TPU v8i)设计。针对推理优化的TPU v8i,让谷歌能够以比依赖通用GPU的竞争对手更低的成本运行模型,省下来的钱会转给客户。皮查伊说:“这意味着可以在几周而不是几个月内训练出更大、更有能力的模型。”
“全栈帝国”也难逃商业化挑战
将谷歌本次发布的各项产品作为一个整体来观察,其战略逻辑是清晰的:用自研芯片控制成本,用自有生态获取数据,用全栈产品直达用户,形成从基础设施到终端体验的完整闭环。The Cube Research在与谷歌云CEO库里安(Thomas Kurian)交流后总结道:“谷歌试图将自身定位为不仅仅是模型提供商或云供应商,而是编排整个AI驱动系统生命周期的平台。”
这一模式的优势在于协同效应。TPU为模型训练提供算力,模型能力驱动Agent应用,Agent应用产生数据反馈,最后数据反馈回模型训练。各个环节互相增强,理论上可以形成加速迭代的飞轮。此次发布会上,Gemini 3.5 Flash超越前代旗舰、Antigravity从IDE升级为独立应用、Spark实现7×24小时云端运行,都可以视为这一飞轮运转的阶段性产出。
Agent时代的到来,可能进一步放大谷歌的生态整合优势。一个真正有用的个人智能体需要能跨应用读取邮件、编辑文档、管理日程,而这正是与操作系统和办公套件深度绑定的谷歌所拥有的天然优势。Spark是谷歌在Agent竞赛中的核心载体——它基于谷歌云虚拟机,能够跨Gmail、Google Calendar、Docs等服务协同工作,甚至通过Agent Payment Protocol(AP2)和开放标准UCP,被授予在预设限额内自动执行购物交易的权限。库里安在谈及这一战略时曾表示,AI对白领工作形态的冲击正在从概念走向实践。
但Agent的商业化同样面临严峻考验。谷歌此次将Gemini应用的计费方式从“每天能问多少次”改为按算力消耗计算。而改成按算力计费,等于公开承认按次计费的前提——每次调用的成本大致可控——不成立了。即便拥有全球最强基础设施的公司,“都得把消费者订阅改成按量计费,说明AI包月不限量从一开始就是个过渡形态”。与此同时,Spark被纳入新增的100美元/月AI Ultra订阅计划,原250美元的顶级Ultra计划降至200美元。这一系列动作意味着谷歌正试图从售卖“模型访问权”转向售卖“数字劳动力”,即从“算力零售”走向“成果交付”。这一定价策略能否被市场接受,将取决于Spark实际交付的工作质量以及用户对自主决策Agent的信任程度。
从某种意义上说,这场发布会的真正看点,正藏在这些尚未有答案的问题里。
93个AI Agent在深夜协同编写操作系统内核的画面,它展示的是一种新型组织生产力的雏形,但究竟它是一次极限演示、还是可规模化复制的工程能力,仍需要时间检验。谷歌目前拥有多项结构性优势:Gemini应用月活用户一年翻倍突破9亿,搜索AI概览月活超25亿,旗下13款产品各拥有超10亿用户规模。然而历史经验提醒行业不要过早下结论——谷歌毕竟不是将AI能力推向大众的那一位,其模型流量甚至一度仅为OpenAI的10%至15%,直至近期才逐渐攀升。全栈闭环在理论上高效,在实践中却面临组织臃肿、创新迟缓的风险。自有生态的数据优势,在编程等垂直场景中也存在局限性。有分析师指出,“谷歌试图将自身定位为编排整个AI系统生命周期的平台”,但全栈模式的成败同样取决于生态的开放性。
谷歌I/O 2026的发布,是谷歌AI全栈战略的一次系统性展示。它证明了一条“从芯片到应用”的垂直整合路线在AI时代仍然拥有强大的想象空间。但通往超级智能的路不止一条,甚至,迄今为止全球仅有谷歌一家有能力秉持这一路线,在某种意义上说,全球AI竞逐者都是谷歌潜在的竞争对手。强大如谷歌,需要考虑其未来AI生态中谁是值得结盟的对象。
