微软发布新一代Maia 200芯片聚焦大规模人工智能推理

商业 2026-02-04 科技最前沿微软, 人工智能芯片, Maia 200, 云计算基础设施, 半导体 49 次浏览

微软宣布推出新一代自研芯片Maia 200，定位为“专为扩展人工智能推理设计的硅基主力芯片”，用于支撑大规模人工智能模型的运行。

与2023年发布的首代产品Maia 100相比，Maia 200在性能和效率方面均有所升级。微软介绍称，Maia芯片集成了超过1000亿个晶体管，在4位精度（FP4）下可提供超过10拍（peta）浮点运算能力，在8位精度（FP8）下约为5拍浮点运算能力，相较前代产品实现明显提升。

微软在介绍中指出，Maia 200主要面向人工智能推理环节，即模型部署后在实际运行中所需的计算过程，与模型训练阶段的计算需求有所不同。随着人工智能企业业务规模扩大，推理成本在整体运营成本中的占比上升，业界开始更加重视通过硬件和软件优化降低推理开销。

微软表示，希望通过Maia 200提升人工智能业务运行效率并降低能耗。公司称，从应用角度看，单个Maia 200节点即可轻松运行当前规模最大的模型，并为未来更大规模模型预留空间。

Maia 200的推出也被视为大型科技公司加速发展自研芯片、降低对Nvidia依赖的一部分。当前，Nvidia的高性能GPU仍是众多人工智能公司基础设施的核心。与此同时，谷歌已推出张量处理单元（TPU），通过云服务向客户提供算力；亚马逊则自研人工智能加速芯片Trainium，并于2023年12月发布最新一代Trainium3。这些自研芯片在部分场景中可替代或分担Nvidia GPU的计算任务，从而压缩整体硬件成本。

在性能对比方面，微软在周一发布的新闻稿中称，Maia在FP4精度下的性能约为第三代亚马逊Trainium芯片的3倍，在FP8精度下的性能则高于谷歌第七代TPU。

微软表示，Maia芯片目前已用于支撑公司“超级智能团队”的人工智能模型运行，并为其聊天机器人产品Copilot提供算力支持。公司称，截至周一，已邀请开发者、学术机构以及前沿人工智能实验室等合作方，使用Maia 200的软件开发工具包对各类工作负载进行测试。

发表评论

登录后才可评论。去登录