华为 Ascend 910C 完成 DeepSeek-V4-Pro 全参数后训练:大规模 AI 训练摆脱 NVIDIA 依赖的关键一步
深圳河套学院联合多家机构,在近千片华为 Ascend 910C 组成的国产算力集群上,稳定完成 1.6 万亿参数 MoE 大模型 DeepSeek‑V4‑Pro 的全参数后训练与 SFT,验证了国产 AI 芯片在大规模模型训练环节的可行性。
韩国团队推出基于以太网的内存扩展技术,破解大规模AI训练“内存墙”
韩国ETRI开发出基于以太网的OmniXtend内存扩展技术,可将分布式资源整合为统一内存池,从根本缓解大规模AI训练中的内存容量瓶颈,并兼顾性能、可扩展性与成本效益。
