谷歌云(Google Cloud)周三宣布推出第八代定制人工智能芯片张量处理单元(TPU),并首次将该代产品划分为两条产品线:面向模型训练的TPU 8t,以及针对推理任务的TPU 8i。
推理通常指模型在部署后的持续使用过程,即用户提交提示或请求后由模型进行处理和输出的阶段。谷歌表示,此次发布的两款TPU分别针对训练与推理的不同需求进行优化。
根据谷歌公布的数据,新一代TPU在性能和成本方面较前几代产品有明显提升。公司称,AI模型训练速度最高可提升至原来的3倍,性能成本比提高约80%。此外,新架构支持在单一集群中协同运行超过100万个TPU,旨在为大规模AI工作负载提供更高算力密度。谷歌强调,这些芯片在能耗和成本方面较此前版本更具优势,可在更低能耗和更低成本下向客户提供更多计算能力。
TPU是谷歌为AI工作负载定制的低功耗芯片系列,其名称源自谷歌早期提出的“Tensor”概念,以区别于通用图形处理单元(GPU)。
尽管谷歌持续推进自研AI芯片,但公司目前并未在其云服务中全面替代英伟达技术。与微软和亚马逊等其他大型云服务商类似,谷歌将自研TPU视为对现有基于英伟达系统服务的补充,而非完全替代方案。谷歌同时表示,其云服务计划在今年晚些时候提供英伟达最新芯片Vera Rubin。

市场普遍预期,随着亚马逊、微软和谷歌等超大规模云服务商不断推出自研AI芯片,企业在将AI需求迁移至云端的过程中,部分工作负载可能会逐步转移到这些自研芯片平台上,从而在一定程度上降低对英伟达的依赖。
不过,从当前市场表现来看,英伟达仍然在AI芯片领域保持强势地位。芯片市场分析师Patrick Moorhead在社交平台X上提到,他早在2016年谷歌推出首款TPU时曾判断这可能对英伟达和英特尔不利,但英伟达目前市值已接近5万亿美元,这一结果与当时的预期存在明显差异。
报道指出,如果英伟达的业务规划顺利推进,谷歌作为AI云服务提供商的扩张,预计将为英伟达带来更多业务机会,而非减少,尽管谷歌云中已有相当一部分工作负载运行在谷歌自研芯片上。
谷歌还表示,已与英伟达达成合作,将在计算机网络技术领域展开联合研发,以提升英伟达系统在谷歌云环境中的运行效率。双方计划共同强化一项名为Falcon的软件网络技术。该技术由谷歌于2023年创建并开源,隶属于开源数据中心硬件组织Open Compute Project,旨在优化数据中心网络性能。
在自研芯片迭代与合作伙伴生态并行推进的路径下,谷歌云在AI基础设施层面的产品组合进一步扩展,既包括新一代TPU 8t和TPU 8i,也继续保留并升级对英伟达GPU的支持。
