Gcore 将 NVIDIA Dynamo 集成至 AI 推理方案,称吞吐量最高提升 6 倍
Gcore 表示,已将 NVIDIA 开源推理框架 Dynamo 集成至其 AI 推理解决方案,并以全托管方式提供一键部署,覆盖公有云、私有云、混合云及本地环境。
Meta与NVIDIA达成多年期基础设施合作:将部署数百万颗Blackwell与Rubin GPU
Meta与NVIDIA宣布达成跨越多个GPU世代的长期基础设施合作。Meta计划在AI优化数据中心中部署数百万颗Blackwell与Rubin GPU,并引入Grace及未来的Vera CPU,同时在WhatsApp中采用NVIDIA机密计算技术,构建覆盖CPU、GPU、网络与软件的全栈AI基础设施。
Nvidia追加投资CoreWeave后,转向AI基础设施的比特币矿工股价多数走低
Nvidia与CoreWeave合作加深之际,市场关注独立矿工在获取GPU与融资方面的潜在压力。
Baseten完成3亿美元融资,估值升至50亿美元,押注多模型推理基础设施
IVP、CapitalG与NVIDIA作为基石投资者参与本轮融资。Baseten称将继续围绕推理平台建设,服务更多在生产环境部署多模型的企业客户。
Anthropic首席执行官在达沃斯公开反对对华AI芯片出口
在世界经济论坛达沃斯年会上,Anthropic首席执行官Dario Amodei公开批评美国政府放宽对华AI芯片出口限制,并将相关行为比作“向朝鲜出售核武器”,其言论引发关注,尤其涉及其重要合作伙伴兼投资方英伟达(Nvidia)。
IonQ能否成为“量子计算领域的Nvidia”?技术、生态与财务现实受关注
投资者近期将Nvidia在人工智能芯片领域的主导地位,与少数专注量子计算的纯量子公司相提并论。纽约证券交易所上市的IonQ(IONQ)也借助这一类比,试图将自身定位为未来量子计算工作负载的关键基础设施,类似Nvidia在AI加速器领域的“默认选择”。围绕这一定位,市场关注点主要集中在IonQ的硬件能力、生态系统策略以及财务表现能否支撑其长期平台化叙事。 “量子领域的Nvidia”指向平台与市场结构
Eleveight AI在亚美尼亚数据中心部署NVIDIA B300 Blackwell GPU
Eleveight AI宣布在其位于亚美尼亚的AI专注型数据中心分阶段部署NVIDIA B300 Blackwell GPU,用于支持AI训练与推理工作负载,并计划在完成安装验证后向企业、初创公司及研究机构开放新增算力。
Agentic AI 扩展带来内存架构重构需求
随着基础模型参数规模和上下文窗口快速扩张,Agentic AI 的长期记忆开销正超出现有硬件架构承载能力。业界开始引入专用推理上下文存储层,以缓解 GPU 内存与通用存储之间的性能与成本矛盾。
VAST Data与NVIDIA推出面向智能代理时代的AI推理架构
VAST Data宣布其VAST AI操作系统可原生运行在NVIDIA BlueField-4 DPU上,并支持NVIDIA推理上下文内存存储平台部署,以共享的Pod级KV缓存提升长上下文、多轮及多智能体推理的确定性访问与效率。
