微软发布新一代Maia 200芯片 聚焦大规模人工智能推理

richlovec 1500_400 (1)
 

微软宣布推出新一代自研芯片Maia 200,定位为“专为扩展人工智能推理设计的硅基主力芯片”,用于支撑大规模人工智能模型的运行。

与2023年发布的首代产品Maia 100相比,Maia 200在性能和效率方面均有所升级。微软介绍称,Maia芯片集成了超过1000亿个晶体管,在4位精度(FP4)下可提供超过10拍(peta)浮点运算能力,在8位精度(FP8)下约为5拍浮点运算能力,相较前代产品实现明显提升。

微软在介绍中指出,Maia 200主要面向人工智能推理环节,即模型部署后在实际运行中所需的计算过程,与模型训练阶段的计算需求有所不同。随着人工智能企业业务规模扩大,推理成本在整体运营成本中的占比上升,业界开始更加重视通过硬件和软件优化降低推理开销。

微软表示,希望通过Maia 200提升人工智能业务运行效率并降低能耗。公司称,从应用角度看,单个Maia 200节点即可轻松运行当前规模最大的模型,并为未来更大规模模型预留空间。

Maia 200的推出也被视为大型科技公司加速发展自研芯片、降低对Nvidia依赖的一部分。当前,Nvidia的高性能GPU仍是众多人工智能公司基础设施的核心。与此同时,谷歌已推出张量处理单元(TPU),通过云服务向客户提供算力;亚马逊则自研人工智能加速芯片Trainium,并于2023年12月发布最新一代Trainium3。这些自研芯片在部分场景中可替代或分担Nvidia GPU的计算任务,从而压缩整体硬件成本。

在性能对比方面,微软在周一发布的新闻稿中称,Maia在FP4精度下的性能约为第三代亚马逊Trainium芯片的3倍,在FP8精度下的性能则高于谷歌第七代TPU。

微软表示,Maia芯片目前已用于支撑公司“超级智能团队”的人工智能模型运行,并为其聊天机器人产品Copilot提供算力支持。公司称,截至周一,已邀请开发者、学术机构以及前沿人工智能实验室等合作方,使用Maia 200的软件开发工具包对各类工作负载进行测试。


分享:


发表评论

登录后才可评论。 去登录