大模型训练

AI 2026-06-14

深圳河套学院联合多家机构，在近千片华为 Ascend 910C 组成的国产算力集群上，稳定完成 1.6 万亿参数 MoE 大模型 DeepSeek‑V4‑Pro 的全参数后训练与 SFT，验证了国产 AI 芯片在大规模模型训练环节的可行性。

科学 2026-05-20

韩国ETRI开发出基于以太网的OmniXtend内存扩展技术，可将分布式资源整合为统一内存池，从根本缓解大规模AI训练中的内存容量瓶颈，并兼顾性能、可扩展性与成本效益。