NVIDIA

Agentic AI 扩展带来内存架构重构需求

Agentic AI 扩展带来内存架构重构需求

随着基础模型参数规模和上下文窗口快速扩张,Agentic AI 的长期记忆开销正超出现有硬件架构承载能力。业界开始引入专用推理上下文存储层,以缓解 GPU 内存与通用存储之间的性能与成本矛盾。

VAST Data与NVIDIA推出面向智能代理时代的AI推理架构

VAST Data与NVIDIA推出面向智能代理时代的AI推理架构

VAST Data宣布其VAST AI操作系统可原生运行在NVIDIA BlueField-4 DPU上,并支持NVIDIA推理上下文内存存储平台部署,以共享的Pod级KV缓存提升长上下文、多轮及多智能体推理的确定性访问与效率。