谷歌垂直整合战略能走多远

第06版：人工智能

上一版下一版

放大+ 缩小- 默认o

谷歌垂直整合战略能走多远

本报记者张琪玮实习生王嘉琪

图为今年谷歌I/O开发者大会现场

93个AI智能体在12小时内从零构建出一个完整操作系统内核的画面，出现在谷歌I/O开发者大会的屏幕上时，2026年5月这场发布会的基调便已确立。

工作人员现场演示了这一过程：一句指令，Antigravity 2.0平台自主调度93个子智能体，发出超1.5万次模型请求，处理26亿个token，12小时后交付了一个功能完整的OS内核，成本不到1000美元。随后，当他试图在该系统上运行游戏《毁灭战士》时，因缺失驱动而失败。他没有写一行代码，当场向Agent下达修复指令，Agent自动识别依赖、生成驱动、完成测试，游戏最终成功运行。

这一演示与同场发布的Gemini Omni、Gemini 3.5 Flash、Gemini Spark等产品，共同勾勒出谷歌AI布局的全貌：从自研的第八代TPU芯片到超过100万块的算力集群，从多模态大模型到个人智能体应用，覆盖了AI产业链从底层硬件到终端用户的每一个环节，而这正是谷歌I/O 2026整场发布会的基调：不是某一项技术的单点突破，而是全栈能力的系统性供应。同时，谷歌输出的核心要义，是其系统工作下能给产业带来最高性价比。面对OpenAI、Anthropic等强劲竞争对手，谷歌这一“老牌”AI企业在新一届开发者大会上进一步强化了“垂直整合、全栈控制”发展战略。

从芯片到模型到应用的全栈控制

理解谷歌的战略意图，需要看清此次发布的三款核心产品如何构成一个相互协作的整体。

Gemini Omni扮演着“感官与表达”的角色。它的价值不在于“视频生成”本身，而在于尝试将物理世界的理解注入生成过程。现场演示中，一句“用黏土动画解释蛋白质折叠”的提示词，Omni便生成了一段教学视频，画面中蛋白质的折叠过程科学精准，黏土质感贯穿始终。谷歌强调，此前的模型已能生成视频和图像，但Omni能进一步尝试处理动能、重力等更接近物理世界的问题。有行业观察者认为，这类统一处理多种模态的模型“标志着行业即将进入一个全新的时代”。但需要指出的是，Omni目前仅首发轻量版本，从会后反馈来看，业界评价不一，有人认为“表现不如预期”。从演示到大规模应用，其稳定性仍有待验证。

Gemini 3.5 Flash则是这一体系的“大脑”。谷歌数据显示，这一轻量模型在编码、工具调用、多模态理解等多项基准测试中，全面超越了三个月前发布的旗舰模型Gemini 3.1 Pro。速度方面，输出达到每秒289个token，约为GPT-5.5和Claude Opus 4.7的4倍。第三方评测机构Artificial Analysis评价称，它在智能与速度的平衡上“占据了目前没人能触及的位置”。用轻量模型超越前代旗舰，说明迭代效率正在提升。但该机构也指出，由于更高的资源消耗，“其运行成本比此前版本高出5倍多”，对企业用户而言，成本与性能的平衡仍是关键。

Antigravity 2.0和Gemini Spark是“双手”，将模型的思考付诸行动。前者已从开发工具演变为独立的Agent优先桌面应用；后者则是一个7×24小时云端运行的个人智能体，可跨Gmail、Docs、日历等谷歌服务自主执行任务，从起草邮件到规划社区派对。谷歌将其定位为“你的个人智能体”。然而从现实角度而言，Spark仍是实验性产品，当AI从“对话伙伴”进化为“执行助手”，安全与可控性的考验也随之升维。

在三者构成从感知、推理到执行的完整闭环的同时，谷歌自研TPU芯片提供强劲的“能力供应”。谷歌CEO皮查伊（Sundar Pichai）表示，谷歌2026年的资本支出预计在1800亿~1900亿美元之间，其中一个重要投资方向是定制芯片。其第八代TPU第一次采用双芯片架构，分别为训练（TPU v8o）和推理（TPU v8i）设计。针对推理优化的TPU v8i，让谷歌能够以比依赖通用GPU的竞争对手更低的成本运行模型，省下来的钱会转给客户。皮查伊说：“这意味着可以在几周而不是几个月内训练出更大、更有能力的模型。”

“全栈帝国”也难逃商业化挑战

将谷歌本次发布的各项产品作为一个整体来观察，其战略逻辑是清晰的：用自研芯片控制成本，用自有生态获取数据，用全栈产品直达用户，形成从基础设施到终端体验的完整闭环。The Cube Research在与谷歌云CEO库里安（Thomas Kurian）交流后总结道：“谷歌试图将自身定位为不仅仅是模型提供商或云供应商，而是编排整个AI驱动系统生命周期的平台。”

这一模式的优势在于协同效应。TPU为模型训练提供算力，模型能力驱动Agent应用，Agent应用产生数据反馈，最后数据反馈回模型训练。各个环节互相增强，理论上可以形成加速迭代的飞轮。此次发布会上，Gemini 3.5 Flash超越前代旗舰、Antigravity从IDE升级为独立应用、Spark实现7×24小时云端运行，都可以视为这一飞轮运转的阶段性产出。

Agent时代的到来，可能进一步放大谷歌的生态整合优势。一个真正有用的个人智能体需要能跨应用读取邮件、编辑文档、管理日程，而这正是与操作系统和办公套件深度绑定的谷歌所拥有的天然优势。Spark是谷歌在Agent竞赛中的核心载体——它基于谷歌云虚拟机，能够跨Gmail、Google Calendar、Docs等服务协同工作，甚至通过Agent Payment Protocol（AP2）和开放标准UCP，被授予在预设限额内自动执行购物交易的权限。库里安在谈及这一战略时曾表示，AI对白领工作形态的冲击正在从概念走向实践。

但Agent的商业化同样面临严峻考验。谷歌此次将Gemini应用的计费方式从“每天能问多少次”改为按算力消耗计算。而改成按算力计费，等于公开承认按次计费的前提——每次调用的成本大致可控——不成立了。即便拥有全球最强基础设施的公司，“都得把消费者订阅改成按量计费，说明AI包月不限量从一开始就是个过渡形态”。与此同时，Spark被纳入新增的100美元/月AI Ultra订阅计划，原250美元的顶级Ultra计划降至200美元。这一系列动作意味着谷歌正试图从售卖“模型访问权”转向售卖“数字劳动力”，即从“算力零售”走向“成果交付”。这一定价策略能否被市场接受，将取决于Spark实际交付的工作质量以及用户对自主决策Agent的信任程度。

从某种意义上说，这场发布会的真正看点，正藏在这些尚未有答案的问题里。

93个AI Agent在深夜协同编写操作系统内核的画面，它展示的是一种新型组织生产力的雏形，但究竟它是一次极限演示、还是可规模化复制的工程能力，仍需要时间检验。谷歌目前拥有多项结构性优势：Gemini应用月活用户一年翻倍突破9亿，搜索AI概览月活超25亿，旗下13款产品各拥有超10亿用户规模。然而历史经验提醒行业不要过早下结论——谷歌毕竟不是将AI能力推向大众的那一位，其模型流量甚至一度仅为OpenAI的10%至15%，直至近期才逐渐攀升。全栈闭环在理论上高效，在实践中却面临组织臃肿、创新迟缓的风险。自有生态的数据优势，在编程等垂直场景中也存在局限性。有分析师指出，“谷歌试图将自身定位为编排整个AI系统生命周期的平台”，但全栈模式的成败同样取决于生态的开放性。

谷歌I/O 2026的发布，是谷歌AI全栈战略的一次系统性展示。它证明了一条“从芯片到应用”的垂直整合路线在AI时代仍然拥有强大的想象空间。但通往超级智能的路不止一条，甚至，迄今为止全球仅有谷歌一家有能力秉持这一路线，在某种意义上说，全球AI竞逐者都是谷歌潜在的竞争对手。强大如谷歌，需要考虑其未来AI生态中谁是值得结盟的对象。

放大+ 缩小- 默认o