AI推理

Semidynamics获SK海力士战略投资加速内存中心AI推理芯片布局

AI 2026-04-11 小A聊AI

Semidynamics表示，此次投资将推动其面向内存密集型推理工作负载的下一代AI基础设施合作，并支持后续流片与系统级开发。

ZEDEDA调查：企业边缘AI部署加速迈向自主能力，混合云-边缘架构占比达47%

AI 2026-03-14 小A聊AI

ZEDEDA发布2026年边缘AI调查称，边缘AI正从试点走向关键基础设施投入。调查显示，86%的活跃部署企业正在推进代理式、自主边缘能力；运营效率成为最主要衡量指标，相关支出更多纳入核心IT与基础设施预算。

英伟达黄仁勋：代理型 AI 迎来关键拐点，推理优化与企业落地全面提速

AI 2026-03-04

2026 年 2 月 25 日（美国时间），英伟达（NVIDIA）公布 2026 财年第四季度财报{target="_blank"}。公司创始人兼 CEO 黄仁勋（Jensen Huang）在会上表示，代理型 AI（Agentic AI）已经迎来“关键拐点（inflection point）”。黄仁勋指出： “Computing demand is growing expo

Gcore 将 NVIDIA Dynamo 集成至 AI 推理方案，称吞吐量最高提升 6 倍

AI 2026-02-28 小A聊AI

Gcore 表示，已将 NVIDIA 开源推理框架 Dynamo 集成至其 AI 推理解决方案，并以全托管方式提供一键部署，覆盖公有云、私有云、混合云及本地环境。

Innodisk推出CXL加速卡，面向边缘AI提供可扩展内存扩展方案

AI 2026-02-26 小A聊AI

Innodisk宣布推出CXL加速卡（AIC），通过PCIe接口实现不占用系统DIMM插槽的内存扩展，最高支持256GB，并支持CXL 2.0 Type 3特性以适配动态工作负载与边缘部署需求。

VAST Data与NVIDIA推出面向智能代理时代的AI推理架构

AI 2026-01-07 小A聊AI

VAST Data宣布其VAST AI操作系统可原生运行在NVIDIA BlueField-4 DPU上，并支持NVIDIA推理上下文内存存储平台部署，以共享的Pod级KV缓存提升长上下文、多轮及多智能体推理的确定性访问与效率。

MemryX发布MX4加速器路线图：瞄准数据中心“内存墙”瓶颈

AI 2026-01-02

MemryX Inc.宣布其下一代AI推理加速器MX4的战略路线图。公司表示，MX4旨在将其“内存内（at-memory）”数据流架构从边缘部署扩展至数据中心，并计划借助3D混合键合（hybrid-bonded）内存，以缓解行业普遍面临的“内存墙”问题。 MemryX称，公司目前已量产MX3芯片，在特定AI推理应用中可实现相较主流GPU超过20倍的每瓦性能提升。在此基础上，MX4将面向越来越受限于

Semidynamics获SK海力士战略投资加速内存中心AI推理芯片布局

ZEDEDA调查：企业边缘AI部署加速迈向自主能力，混合云-边缘架构占比达47%

英伟达黄仁勋：代理型 AI 迎来关键拐点，推理优化与企业落地全面提速

Gcore 将 NVIDIA Dynamo 集成至 AI 推理方案，称吞吐量最高提升 6 倍

Innodisk推出CXL加速卡，面向边缘AI提供可扩展内存扩展方案

VAST Data与NVIDIA推出面向智能代理时代的AI推理架构

MemryX发布MX4加速器路线图：瞄准数据中心“内存墙”瓶颈

标签

近期热门

《伦敦真主妇》明星朱丽叶·安格斯签约The Arc集团

Hims & Hers叫停仿制Wegovy减肥药计划，宣布两天后紧急转向

美国人口增长率明显放缓移民减少成主因

报道：香港金管局拟于三月发出首批稳定币发行牌照

美国2026纳税年度标准扣除额与税率级距上调或推高实得工资

适合长期阅读的宏观经济经典书籍推荐：从入门框架到全球视角

AD