英伟达在CES发布全新Rubin计算架构

richlovec 1500_400 (1)
 

英伟达在今年的消费电子展(CES)上发布了全新的Rubin计算架构。公司首席执行官黄仁勋在现场表示,该架构是英伟达在人工智能硬件领域“最先进”的技术平台,目前已全面量产,并计划在今年下半年进一步提升产能。

黄仁勋在发布会上称:“Vera Rubin旨在解决我们面临的根本挑战:人工智能所需的计算量正在飞速增长。今天,我可以告诉大家,Vera Rubin已经全面量产。”

Rubin架构最早于2024年对外公布,是英伟达持续硬件迭代周期中的最新一代产品。该架构将接替Blackwell架构,而Blackwell此前已先后取代Hopper和Lovelace架构。英伟达表示,这一持续更新的产品节奏推动公司成长为全球市值最高的企业之一。

英伟达计划将Rubin芯片广泛部署于主要云服务平台。公司称,几乎所有大型云服务提供商都已规划采用Rubin,包括英伟达与Anthropic、OpenAI以及亚马逊网络服务(AWS)等的合作项目。此外,Rubin系统还将用于惠普企业(HPE)的Blue Lion超级计算机,以及劳伦斯伯克利国家实验室即将上线的Doudna超级计算机。

Rubin架构以天文学家Vera Florence Cooper Rubin命名,由六个独立芯片构成,设计为协同工作。Rubin GPU位于系统核心位置,同时通过对BlueField和NVLink系统的更新,针对存储与互联环节中日益突出的瓶颈进行优化。架构中还包含一款新型Vera CPU,英伟达称其专门面向自主推理场景设计。

在存储方面,英伟达人工智能基础设施解决方案高级总监Dion Harris表示,现代人工智能系统对缓存相关内存的需求持续上升。他在一次电话采访中指出,当启用自主智能体或长期任务等新型工作流时,会显著增加对键值缓存(KV cache)的压力和需求。KV缓存是人工智能模型用于压缩输入的一类内存系统。

Harris表示,为应对这一变化,Rubin架构引入了一个新的存储层,可外部连接至计算设备,从而更高效地扩展整体存储池。

性能方面,英伟达给出的内部测试数据显示,Rubin架构在模型训练任务上的运行速度较上一代Blackwell架构提升约3.5倍,在推理任务上的速度提升约5倍,峰值性能最高可达50拍浮点运算每秒(50 petaflops)。公司同时称,新平台在推理场景下的每瓦算力较上一代提高了约8倍。

Rubin的推出正值全球加速建设人工智能基础设施之际。人工智能实验室和云服务提供商持续增加对英伟达芯片及相关配套电力和数据中心设施的投入。黄仁勋曾在2025年10月的财报电话会议上表示,未来五年全球在人工智能基础设施方面的总投入预计将在3万亿至4万亿美元之间。


分享:


发表评论

登录后才可评论。 去登录