皮查伊押注Gemini：谷歌在生成式AI竞赛中重塑自身

商业 2026-05-06 商业现场谷歌, 人工智能, Gemini, OpenAI, 科技公司 1 次浏览

从“AI优先”到被动应战

2015年出任谷歌CEO时，桑达尔·皮查伊在首封股东信中提出“AI优先”的公司愿景，认为人工智能将演变为用户的“全天候智能助手”，并将谷歌的未来押在这一方向上。然而，真正让生成式AI进入公众视野的，却是源自谷歌研究成果、由OpenAI于2022年11月30日推出的ChatGPT。

皮查伊回忆，首次看到ChatGPT时，他的直觉反应是这项技术“普及得比预期更早、更快”，这种感受“既令人不安又令人兴奋”。他意识到，如果AI提前进入“超速发展阶段”，谷歌必须迅速调整。

2023年初，谷歌内部启动“红色代码”，要求员工放下其他项目，加快新AI产品和功能的开发。2023年2月，谷歌推出聊天机器人Bard，被外界普遍视为对ChatGPT的直接回应。

从Bard到Gemini：产品与组织的重组

Bard在ChatGPT发布前已处于开发阶段，但谷歌此前认为其尚未准备好大规模部署。出于“大胆但负责任”的考量，公司对生成式AI可能产生虚假信息保持谨慎。ChatGPT引发的全球热潮推动谷歌加快上线节奏。

Bard的首个版本被认为仓促上马，市场反响平淡。推出一年后，谷歌将其更名为Gemini，使聊天机器人与其背后的大型语言模型统一品牌。

在产品调整的同时，谷歌也重组了AI研究力量。公司原有两大研究机构：

Google Brain：源自Google X“登月计划”，2017年有八名科学家共同发表论文《Attention Is All You Need》，提出变换器（Transformer）架构，为生成式AI奠定基础；
DeepMind：2014年收购的伦敦AI公司，专注通用人工智能（AGI），在蛋白质结构预测等领域取得突破。其AlphaFold技术显著加速药物研发，DeepMind联合创始人兼CEO德米斯·哈萨比斯与总监约翰·贾姆珀因此获得2024年诺贝尔化学奖。

皮查伊表示，虽然同时拥有两支顶级团队“很好”，但当时公司需要“更专注”。2023年4月，谷歌将Google Brain与DeepMind合并为Google DeepMind，由哈萨比斯领导，Google Brain联合创始人杰夫·迪恩出任首席科学家。Google DeepMind首席技术官科雷·卡武克丘奥卢称，这一调整意味着研究必须更直接地转化为现实世界产品，并与谷歌各业务更紧密协作。2025年6月，他兼任谷歌首席AI架构师，直接向皮查伊汇报。

与此同时，长期淡出日常运营的联合创始人拉里·佩奇和谢尔盖·布林重新积极参与AI项目。布林回到一线参与招聘和代码审查。皮查伊表示，“公司创始人与工程师一起熬夜攻关模型细节”对团队具有强烈激励作用。

Gemini 3：技术与市场的转折点

多年积累最终汇聚到Gemini 3这一代模型。2025年11月，谷歌发布Gemini 3 Pro，在多项行业标准基准测试中，在AI能力方面超越OpenAI和Anthropic的同类模型，部分项目优势明显。2025年12月，公司又推出更快、更高效的Gemini 3 Flash。

Gemini 3系列已被用于驱动谷歌搜索及其他产品，获得业内观察者的积极评价。OpenAI CEO萨姆·奥特曼在Gemini 3 Pro发布后向员工发出内部备忘录，称“预计外界氛围会有一段时间比较艰难”。

Gemini 3的推出被视为Alphabet在AI领域稳步推进的一年中的关键节点。经历此前在AI行情中的股价表现不佳并于2025年4月触底后，Alphabet股价已翻倍以上。2026年1月，谷歌与苹果宣布合作，未来版本的Siri及其他苹果AI功能将运行在Gemini上，Alphabet市值首次突破4万亿美元。

尽管如此，从部分指标看，谷歌仍在追赶。Sensor Tower数据显示，2025年Gemini应用月下载量增长480%，但其3.76亿月活用户仍低于ChatGPT的9.45亿。谷歌按自身口径（包括应用和网页版）统计，Gemini月活用户为7.5亿。Similarweb的数据显示，Gemini在AI聊天机器人网站流量中的份额为22%，同比增长逾670%，但仍约为ChatGPT 63%份额的三分之一。

搜索业务的AI平衡术

作为谷歌最核心的业务之一，搜索在引入生成式AI时保持谨慎。2023年I/O开发者大会上，谷歌通过Google Labs重新开放实验项目，让用户试用开发中的AI功能。

首批试验之一是“搜索生成体验”（SGE），在传统蓝色链接结果页上方，适时展示AI生成的摘要。谷歌用一年时间打磨这一功能，并在全面部署时将其更名为“AI概览”。

2024年春季，AI概览在大规模使用中出现多起引发关注的错误案例，其中包括建议用胶水让奶酪粘在披萨上、建议每天吃一块石头等。搜索副总裁莉兹·里德表示，这些错误数量有限，部分源于谷歌低估了用户“恶搞AI”的程度。她指出，在引入AI概览前，几乎没有人会提出“我应该吃多少块石头”之类的问题。随着缺陷被修正，用户研究显示，用户对AI概览的依赖度较高，“他们真的想继续对话”，在没有概览时“会不高兴”。

在此基础上，谷歌推出第二个生成式AI搜索功能——AI模式标签。该功能于2025年3月以Labs实验形式上线，用户可点击进入类似聊天机器人的体验，获得比AI概览更详细的回答，并可继续追问。里德将其比作搜索结果页长期存在的图片、新闻和购物标签，强调AI模式是对传统通用搜索的可选补充，而非替代。

谷歌同时在探索更具代理特征的AI。Google Labs中的Gemini Agent实验已能协助用户进行资料调研和租车预订等任务。负责Gemini应用的副总裁乔什·伍德沃德表示，这类代理式AI目前“有时不稳定”“速度慢”。

里德称，搜索目前在AI应用上追求“既有足够AI，又不过度”的平衡，公司不会将默认设置改为AI模式。她表示，“无意义的AI没用”，搜索之所以存在，是因为“20亿人喜欢用它”，谷歌必须维护这种信任。

“纳诺香蕉”与用户增长

2025年8月，Google DeepMind产品经理奈娜·雷辛哈尼在AI基准平台LMArena上传了一款新的生成式图像模型。她在凌晨2点30分填写名称时，将两个昵称随意组合，形成了“纳诺香蕉”（Nano Banana）这一名称。

这一名称引发关注，模型本身的图像编辑能力也被认为表现突出。用户可在数秒内完成复杂照片编辑，例如将肖像中的连帽衫替换为亮片燕尾服。谷歌迅速将该模型整合进Gemini应用，成为一项广受讨论的功能。

伍德沃德表示，这一功能“几乎赋予了人们超能力”，用户很快开始分享自己创作的内容。随着口碑传播，Gemini在苹果和谷歌应用商店的下载量一度超过ChatGPT。

独立投资者、前谷歌员工M.G.西格勒认为，这一现象类似于OpenAI此前通过帮助用户创作可分享内容（如吉卜力风格滤镜）所制造的传播效应。他指出，谷歌“历来不擅长”制造这类“病毒式时刻”，部分原因在于公司文化，但“纳诺香蕉”是一个例外。

同一时期，OpenAI在2025年的重磅发布——备受期待的GPT-5——被普遍认为表现平平，不过其后续推出的GPT-5.3 Codex获得较好评价。

AI基础设施与成本压力

Gemini 3的广泛部署不仅反映谷歌对模型质量的信心，也依赖其多年建设的云基础设施。皮查伊表示，公司能够“同时在多个产品中激活”新模型，从而放大发布效果。

谷歌在AI算力上的投入相对低调。与OpenAI联合软银、甲骨文推进、计划投入高达5000亿美元建设先进AI“农场”的Stargate项目相比，谷歌鲜少对外高调宣传其资本支出。但公司已在美国多地大规模投资：

在德克萨斯州投入400亿美元建设三个大型AI和云数据中心园区；
在阿肯色、爱荷华、密苏里、俄克拉荷马、南卡罗来纳和弗吉尼亚投入数百亿美元；
在印度、德国、比利时和泰国建设海外基础设施。

Warp CEO、前谷歌首席工程师扎克·劳埃德认为，谷歌在多个方面具备优势，包括自研张量处理单元（TPU）芯片、为大模型提供服务的云基础设施，以及“极其盈利的业务”支撑资本支出和模型训练。

与此同时，生成式AI的经济模型仍在探索中。Alphabet在2026年的资本支出指引为1850亿美元，是2025年的两倍多，此举在今年2月令分析师感到意外。运行大规模AI模型需要巨额数据中心投入，但大多数AI聊天机器人用户既不付费，也不观看广告。

OpenAI在2025年亏损约90亿美元，并于2026年1月宣布在ChatGPT中测试定向广告，例如在用户询问墨西哥菜谱时展示推广辣酱的小广告框。Google DeepMind CEO哈萨比斯在达沃斯世界经济论坛接受Axios采访时，对OpenAI在ChatGPT中引入广告表示惊讶，并称谷歌目前无计划在Gemini中采取类似做法。

谷歌并未完全回避在新AI产品中投放广告。自2025年起，公司在搜索的AI概览和AI模式中测试广告，由算法从整体广告库存中选择相关内容展示，而非单独售卖。谷歌还与Target、沃尔玛、Etsy等零售商合作，将商业链接整合进AI模式和Gemini应用。

第三方早期数据显示，与AI概览相关的广告点击率较高，但传统蓝色链接中的广告互动有所下降，部分用户在被AI概览满足后不再关注下方结果。皮查伊在谈及长期影响时表示，他“始终认为，只要以有意义的方式解决用户问题，就会有商业价值”，并指出用户搜索的许多内容“本质上也带有商业性质”。

与OpenAI的此消彼长

在外界看来，微软凭借自2019年以来对OpenAI的大额投资，被视为在AI实力上最具优势的大型科技公司之一。谷歌则一度被认为受制于既有搜索广告业务，难以在不损害核心收入的前提下全面拥抱AI。

前谷歌员工、Gmail发明者保罗·布赫海特在ChatGPT发布次日曾发文称，“谷歌可能只剩一两年就会被彻底颠覆”，并认为AI将“消灭搜索引擎结果页——他们赚钱的主要来源”，即便谷歌在AI上追上竞争对手，也“无法在不破坏最有价值业务的情况下全面部署”。

此后几年，谷歌并未如上述悲观预期那样走向衰落，但外界对其能否“做出新东西”“赶上竞争对手”“保持势头”的质疑持续存在。伍德沃德表示，公司外部长期存在这类疑问。

与此同时，OpenAI在2025年也在向谷歌的业务版图靠拢。该公司发布了名为Atlas的网页浏览器，开始研发定制AI处理器，并在早期阶段尝试与谷歌价值2950亿美元的广告业务竞争。OpenAI还以65亿美元收购乔尼·艾夫的硬件初创公司Io，进入消费电子领域，而谷歌已通过Pixel手机、Home和Nest设备深耕该市场。谷歌未单独披露硬件收入，而是将其计入2025年总计480亿美元的“订阅、平台和设备”收入中。

部分曾将AI视为“创新者困境”典型案例的观察者开始调整看法。布赫海特如今认为，“谷歌绝对醒来了”，甚至可能是科技领域“最具优势的公司”。

在既有产品中嵌入AI的难题

Gemini 3被视为未来模型和尚未设想的实用功能的基础，但谷歌在将AI深度嵌入现有生产力工具方面仍面临挑战。创意策略分析师马克斯·温巴赫认为，谷歌为Gemini专门打造的许多新产品“很棒”，但当Gemini被嵌入到既有应用（如文字处理和电子表格）时，“基本没用”。

皮查伊也承认，用户在AI证明其价值前会保持谨慎。他表示，如果仅仅因为“这是个时刻”就试图把技术“强加给人们”，可能会引发反弹。

尽管如此，谷歌仍在利用现有应用为Gemini导流。2024年8月，美国法院在反垄断案中认定谷歌搜索业务构成垄断，并对其分发策略施加新限制。谷歌辩称，这些限制不应阻止公司将Gemini应用与谷歌地图和YouTube等核心产品捆绑。相比之下，OpenAI目前唯一的大规模消费级应用是ChatGPT，无法采用类似的捆绑策略。

谷歌同时通过三档付费AI套餐（每月8美元至250美元不等）提供对最新模型和功能的分级访问，以平衡AI计算成本与收入。

投资周期与长期视角

关于当前是否存在“AI泡沫”的问题，皮查伊表示，科技行业会经历“投资不足和过度投资的周期”，难以精确预测。但从十年视角看，他“不认为我们处于AI泡沫”。

投资者M.G.西格勒指出，如果华尔街对科技行业当前AI支出水平产生担忧，谷歌也可能被迫收紧投资，“市场可能会说，‘抱歉，现在不行——几年后再谈’”。

皮查伊称，他以十年为期看待技术发展，这一表述与他2016年股东信中描绘的“通用助手”愿景相呼应。如今，随着Gemini在搜索、云计算、硬件和自动驾驶等业务中的应用扩展，这一愿景正在逐步接近落地。

目前，Alphabet旗下Waymo的机器人出租车已调用Gemini处理复杂场景，例如前方车辆起火时的应对方案。皮查伊表示，“相同的底层技术”正在驱动看似截然不同的业务。

在AI竞赛中，谷歌与OpenAI仍有诸多问题尚待验证，包括如何在控制成本的前提下扩大模型能力、如何在不损害用户信任的情况下商业化生成式AI，以及如何在不削弱既有业务的前提下重塑产品形态。皮查伊则试图通过Gemini，将谷歌打造成用户“唯一重要的”AI入口。

发表评论

登录后才可评论。去登录