皮查伊押注Gemini:谷歌在生成式AI竞赛中重塑自身

从“AI优先”到被动应战

2015年出任谷歌CEO时,桑达尔·皮查伊在首封股东信中提出“AI优先”的公司愿景,认为人工智能将演变为用户的“全天候智能助手”,并将谷歌的未来押在这一方向上。然而,真正让生成式AI进入公众视野的,却是源自谷歌研究成果、由OpenAI于2022年11月30日推出的ChatGPT。

皮查伊回忆,首次看到ChatGPT时,他的直觉反应是这项技术“普及得比预期更早、更快”,这种感受“既令人不安又令人兴奋”。他意识到,如果AI提前进入“超速发展阶段”,谷歌必须迅速调整。

2023年初,谷歌内部启动“红色代码”,要求员工放下其他项目,加快新AI产品和功能的开发。2023年2月,谷歌推出聊天机器人Bard,被外界普遍视为对ChatGPT的直接回应。

从Bard到Gemini:产品与组织的重组

Bard在ChatGPT发布前已处于开发阶段,但谷歌此前认为其尚未准备好大规模部署。出于“大胆但负责任”的考量,公司对生成式AI可能产生虚假信息保持谨慎。ChatGPT引发的全球热潮推动谷歌加快上线节奏。

Bard的首个版本被认为仓促上马,市场反响平淡。推出一年后,谷歌将其更名为Gemini,使聊天机器人与其背后的大型语言模型统一品牌。

在产品调整的同时,谷歌也重组了AI研究力量。公司原有两大研究机构:

  • Google Brain:源自Google X“登月计划”,2017年有八名科学家共同发表论文《Attention Is All You Need》,提出变换器(Transformer)架构,为生成式AI奠定基础;
  • DeepMind:2014年收购的伦敦AI公司,专注通用人工智能(AGI),在蛋白质结构预测等领域取得突破。其AlphaFold技术显著加速药物研发,DeepMind联合创始人兼CEO德米斯·哈萨比斯与总监约翰·贾姆珀因此获得2024年诺贝尔化学奖。

皮查伊表示,虽然同时拥有两支顶级团队“很好”,但当时公司需要“更专注”。2023年4月,谷歌将Google Brain与DeepMind合并为Google DeepMind,由哈萨比斯领导,Google Brain联合创始人杰夫·迪恩出任首席科学家。Google DeepMind首席技术官科雷·卡武克丘奥卢称,这一调整意味着研究必须更直接地转化为现实世界产品,并与谷歌各业务更紧密协作。2025年6月,他兼任谷歌首席AI架构师,直接向皮查伊汇报。

与此同时,长期淡出日常运营的联合创始人拉里·佩奇和谢尔盖·布林重新积极参与AI项目。布林回到一线参与招聘和代码审查。皮查伊表示,“公司创始人与工程师一起熬夜攻关模型细节”对团队具有强烈激励作用。

Gemini 3:技术与市场的转折点

多年积累最终汇聚到Gemini 3这一代模型。2025年11月,谷歌发布Gemini 3 Pro,在多项行业标准基准测试中,在AI能力方面超越OpenAI和Anthropic的同类模型,部分项目优势明显。2025年12月,公司又推出更快、更高效的Gemini 3 Flash。

Gemini 3系列已被用于驱动谷歌搜索及其他产品,获得业内观察者的积极评价。OpenAI CEO萨姆·奥特曼在Gemini 3 Pro发布后向员工发出内部备忘录,称“预计外界氛围会有一段时间比较艰难”。

Gemini 3的推出被视为Alphabet在AI领域稳步推进的一年中的关键节点。经历此前在AI行情中的股价表现不佳并于2025年4月触底后,Alphabet股价已翻倍以上。2026年1月,谷歌与苹果宣布合作,未来版本的Siri及其他苹果AI功能将运行在Gemini上,Alphabet市值首次突破4万亿美元。

尽管如此,从部分指标看,谷歌仍在追赶。Sensor Tower数据显示,2025年Gemini应用月下载量增长480%,但其3.76亿月活用户仍低于ChatGPT的9.45亿。谷歌按自身口径(包括应用和网页版)统计,Gemini月活用户为7.5亿。Similarweb的数据显示,Gemini在AI聊天机器人网站流量中的份额为22%,同比增长逾670%,但仍约为ChatGPT 63%份额的三分之一。

搜索业务的AI平衡术

作为谷歌最核心的业务之一,搜索在引入生成式AI时保持谨慎。2023年I/O开发者大会上,谷歌通过Google Labs重新开放实验项目,让用户试用开发中的AI功能。

首批试验之一是“搜索生成体验”(SGE),在传统蓝色链接结果页上方,适时展示AI生成的摘要。谷歌用一年时间打磨这一功能,并在全面部署时将其更名为“AI概览”。

2024年春季,AI概览在大规模使用中出现多起引发关注的错误案例,其中包括建议用胶水让奶酪粘在披萨上、建议每天吃一块石头等。搜索副总裁莉兹·里德表示,这些错误数量有限,部分源于谷歌低估了用户“恶搞AI”的程度。她指出,在引入AI概览前,几乎没有人会提出“我应该吃多少块石头”之类的问题。随着缺陷被修正,用户研究显示,用户对AI概览的依赖度较高,“他们真的想继续对话”,在没有概览时“会不高兴”。

在此基础上,谷歌推出第二个生成式AI搜索功能——AI模式标签。该功能于2025年3月以Labs实验形式上线,用户可点击进入类似聊天机器人的体验,获得比AI概览更详细的回答,并可继续追问。里德将其比作搜索结果页长期存在的图片、新闻和购物标签,强调AI模式是对传统通用搜索的可选补充,而非替代。

谷歌同时在探索更具代理特征的AI。Google Labs中的Gemini Agent实验已能协助用户进行资料调研和租车预订等任务。负责Gemini应用的副总裁乔什·伍德沃德表示,这类代理式AI目前“有时不稳定”“速度慢”。

里德称,搜索目前在AI应用上追求“既有足够AI,又不过度”的平衡,公司不会将默认设置改为AI模式。她表示,“无意义的AI没用”,搜索之所以存在,是因为“20亿人喜欢用它”,谷歌必须维护这种信任。

“纳诺香蕉”与用户增长

2025年8月,Google DeepMind产品经理奈娜·雷辛哈尼在AI基准平台LMArena上传了一款新的生成式图像模型。她在凌晨2点30分填写名称时,将两个昵称随意组合,形成了“纳诺香蕉”(Nano Banana)这一名称。

这一名称引发关注,模型本身的图像编辑能力也被认为表现突出。用户可在数秒内完成复杂照片编辑,例如将肖像中的连帽衫替换为亮片燕尾服。谷歌迅速将该模型整合进Gemini应用,成为一项广受讨论的功能。

伍德沃德表示,这一功能“几乎赋予了人们超能力”,用户很快开始分享自己创作的内容。随着口碑传播,Gemini在苹果和谷歌应用商店的下载量一度超过ChatGPT。

独立投资者、前谷歌员工M.G.西格勒认为,这一现象类似于OpenAI此前通过帮助用户创作可分享内容(如吉卜力风格滤镜)所制造的传播效应。他指出,谷歌“历来不擅长”制造这类“病毒式时刻”,部分原因在于公司文化,但“纳诺香蕉”是一个例外。

同一时期,OpenAI在2025年的重磅发布——备受期待的GPT-5——被普遍认为表现平平,不过其后续推出的GPT-5.3 Codex获得较好评价。

AI基础设施与成本压力

Gemini 3的广泛部署不仅反映谷歌对模型质量的信心,也依赖其多年建设的云基础设施。皮查伊表示,公司能够“同时在多个产品中激活”新模型,从而放大发布效果。

谷歌在AI算力上的投入相对低调。与OpenAI联合软银、甲骨文推进、计划投入高达5000亿美元建设先进AI“农场”的Stargate项目相比,谷歌鲜少对外高调宣传其资本支出。但公司已在美国多地大规模投资:

  • 在德克萨斯州投入400亿美元建设三个大型AI和云数据中心园区;
  • 在阿肯色、爱荷华、密苏里、俄克拉荷马、南卡罗来纳和弗吉尼亚投入数百亿美元;
  • 在印度、德国、比利时和泰国建设海外基础设施。

Warp CEO、前谷歌首席工程师扎克·劳埃德认为,谷歌在多个方面具备优势,包括自研张量处理单元(TPU)芯片、为大模型提供服务的云基础设施,以及“极其盈利的业务”支撑资本支出和模型训练。

与此同时,生成式AI的经济模型仍在探索中。Alphabet在2026年的资本支出指引为1850亿美元,是2025年的两倍多,此举在今年2月令分析师感到意外。运行大规模AI模型需要巨额数据中心投入,但大多数AI聊天机器人用户既不付费,也不观看广告。

OpenAI在2025年亏损约90亿美元,并于2026年1月宣布在ChatGPT中测试定向广告,例如在用户询问墨西哥菜谱时展示推广辣酱的小广告框。Google DeepMind CEO哈萨比斯在达沃斯世界经济论坛接受Axios采访时,对OpenAI在ChatGPT中引入广告表示惊讶,并称谷歌目前无计划在Gemini中采取类似做法。

谷歌并未完全回避在新AI产品中投放广告。自2025年起,公司在搜索的AI概览和AI模式中测试广告,由算法从整体广告库存中选择相关内容展示,而非单独售卖。谷歌还与Target、沃尔玛、Etsy等零售商合作,将商业链接整合进AI模式和Gemini应用。

第三方早期数据显示,与AI概览相关的广告点击率较高,但传统蓝色链接中的广告互动有所下降,部分用户在被AI概览满足后不再关注下方结果。皮查伊在谈及长期影响时表示,他“始终认为,只要以有意义的方式解决用户问题,就会有商业价值”,并指出用户搜索的许多内容“本质上也带有商业性质”。

与OpenAI的此消彼长

在外界看来,微软凭借自2019年以来对OpenAI的大额投资,被视为在AI实力上最具优势的大型科技公司之一。谷歌则一度被认为受制于既有搜索广告业务,难以在不损害核心收入的前提下全面拥抱AI。

前谷歌员工、Gmail发明者保罗·布赫海特在ChatGPT发布次日曾发文称,“谷歌可能只剩一两年就会被彻底颠覆”,并认为AI将“消灭搜索引擎结果页——他们赚钱的主要来源”,即便谷歌在AI上追上竞争对手,也“无法在不破坏最有价值业务的情况下全面部署”。

此后几年,谷歌并未如上述悲观预期那样走向衰落,但外界对其能否“做出新东西”“赶上竞争对手”“保持势头”的质疑持续存在。伍德沃德表示,公司外部长期存在这类疑问。

与此同时,OpenAI在2025年也在向谷歌的业务版图靠拢。该公司发布了名为Atlas的网页浏览器,开始研发定制AI处理器,并在早期阶段尝试与谷歌价值2950亿美元的广告业务竞争。OpenAI还以65亿美元收购乔尼·艾夫的硬件初创公司Io,进入消费电子领域,而谷歌已通过Pixel手机、Home和Nest设备深耕该市场。谷歌未单独披露硬件收入,而是将其计入2025年总计480亿美元的“订阅、平台和设备”收入中。

部分曾将AI视为“创新者困境”典型案例的观察者开始调整看法。布赫海特如今认为,“谷歌绝对醒来了”,甚至可能是科技领域“最具优势的公司”。

在既有产品中嵌入AI的难题

Gemini 3被视为未来模型和尚未设想的实用功能的基础,但谷歌在将AI深度嵌入现有生产力工具方面仍面临挑战。创意策略分析师马克斯·温巴赫认为,谷歌为Gemini专门打造的许多新产品“很棒”,但当Gemini被嵌入到既有应用(如文字处理和电子表格)时,“基本没用”。

皮查伊也承认,用户在AI证明其价值前会保持谨慎。他表示,如果仅仅因为“这是个时刻”就试图把技术“强加给人们”,可能会引发反弹。

尽管如此,谷歌仍在利用现有应用为Gemini导流。2024年8月,美国法院在反垄断案中认定谷歌搜索业务构成垄断,并对其分发策略施加新限制。谷歌辩称,这些限制不应阻止公司将Gemini应用与谷歌地图和YouTube等核心产品捆绑。相比之下,OpenAI目前唯一的大规模消费级应用是ChatGPT,无法采用类似的捆绑策略。

谷歌同时通过三档付费AI套餐(每月8美元至250美元不等)提供对最新模型和功能的分级访问,以平衡AI计算成本与收入。

投资周期与长期视角

关于当前是否存在“AI泡沫”的问题,皮查伊表示,科技行业会经历“投资不足和过度投资的周期”,难以精确预测。但从十年视角看,他“不认为我们处于AI泡沫”。

投资者M.G.西格勒指出,如果华尔街对科技行业当前AI支出水平产生担忧,谷歌也可能被迫收紧投资,“市场可能会说,‘抱歉,现在不行——几年后再谈’”。

皮查伊称,他以十年为期看待技术发展,这一表述与他2016年股东信中描绘的“通用助手”愿景相呼应。如今,随着Gemini在搜索、云计算、硬件和自动驾驶等业务中的应用扩展,这一愿景正在逐步接近落地。

目前,Alphabet旗下Waymo的机器人出租车已调用Gemini处理复杂场景,例如前方车辆起火时的应对方案。皮查伊表示,“相同的底层技术”正在驱动看似截然不同的业务。

在AI竞赛中,谷歌与OpenAI仍有诸多问题尚待验证,包括如何在控制成本的前提下扩大模型能力、如何在不损害用户信任的情况下商业化生成式AI,以及如何在不削弱既有业务的前提下重塑产品形态。皮查伊则试图通过Gemini,将谷歌打造成用户“唯一重要的”AI入口。


分享:


发表评论

登录后才可评论。 去登录