DeepSeek 迟到的 V4：检验中国 AI 自立雄心的关键一役

科学 2026-04-12 人工智能, 大模型, 芯片, 中国科技, DeepSeek 37 次浏览

全球等待的中国新模型

数周以来，全球科技行业都在关注 DeepSeek 何时推出其备受期待的新一代人工智能模型 V4。外界普遍认为，这款产品将成为衡量中国在这一高速发展领域进展的重要标志。

自 2025 年初，这家初创公司凭借一款低成本聊天机器人一举走向国际舞台以来，已经过去一年多。这款聊天机器人在性能上与美国同类产品相当，却以更低成本著称，被视为中国人工智能崛起的代表之一。

然而，尽管外界多次传出“即将发布”的消息，DeepSeek 的 V4 模型至今仍未正式亮相。

芯片之争与地缘政治

围绕 V4 的最大悬念之一，是其训练和运行所依赖的芯片究竟来自何方：是继续使用全球领先的美国设计，还是转向中国正全力追赶的国产替代方案？这一选择被视为具有明显的地缘政治意味。

Counterpoint Research 首席人工智能分析师孙伟在接受法新社采访时表示：“了解他们用什么芯片非常关键，因为在某种程度上，这将成为中国人工智能能否走向自给自足的一项信号。”

科技媒体 The Information 上周报道称，V4 有望运行在华为最新生产的芯片之上。

如果这一转变成真，将意味着中国在突破美国对英伟达高端 AI 芯片出口限制方面迈出重要一步。报道称，五名直接知情人士透露，为配合 DeepSeek 的发布，包括阿里巴巴、字节跳动和腾讯在内的中国科技巨头，已经大量订购华为芯片。

法新社就此联系了 DeepSeek、华为、阿里巴巴、字节跳动和腾讯，但均未获得回应。

从“副项目”到“警钟”

DeepSeek 最初于 2023 年作为一家对冲基金的副项目起步，该基金手中掌握着一批性能强劲的英伟达处理器。

2025 年 1 月，DeepSeek 推出的 R1 深度推理聊天机器人引发全球关注。R1 的发布一度拖累美国科技股大幅下跌，当时的美国总统唐纳德·特朗普甚至将其形容为对美国科技企业的“警钟”。

R1 的底层基础，是 DeepSeek 在 2024 年 12 月发布的上一代主力模型 V3。

凭借价格低廉且高度可定制的 AI 工具，DeepSeek 在中国本土获得广泛应用，同时也在东南亚和中东等新兴市场迅速走红。

Carthage Capital 基金创始人 Stephen Wu 对法新社表示，传闻中的多模态 V4 模型——既能生成文本，也能生成图片和视频——可能再次对美国科技股估值造成冲击。

他预测：“我认为即将发布的 DeepSeek V4 不会只是一次普通的软件升级，而将是一个高性能的开源模型，能够以极低成本处理超大规模上下文窗口。”

不过，DeepSeek 作为前沿 AI 公司的声誉，也在这一轮等待中面临考验。

从英伟达到国产芯片的代价

DeepSeek 以往的模型高度依赖英伟达芯片。如果 V4 真要全面转向国产芯片，势必需要对系统进行“大规模重新设计”，孙伟指出。

“这种转变可能会拖慢开发节奏，并在性能上做出一定取舍，尤其是对于被寄予厚望、预计将达到最先进水平的 V4 模型而言。”

训练与推理的鸿沟

美国以国家安全为由，禁止向中国出口英伟达最强大的 AI 处理器。

Stephen Wu 认为：“DeepSeek V4 一再推迟的事实，表明在无法不受限制地获取顶级英伟达硬件的情况下，要扩展最前沿的大模型是存在明显阻力的。”

与此同时，有报道称，DeepSeek 为训练 V4，曾通过第三国拆解并走私数千块英伟达顶级 Blackwell 芯片回中国，从而绕过出口禁令。

训练一个先进的 AI 模型需要极其庞大的算力，远远高于后续在用户侧进行生成式 AI 推理时所需的计算资源。

法新社已就此向 DeepSeek 寻求评论。英伟达没有直接回应法新社的置评请求，但对 The Information 表示，目前尚未看到相关证据，“这种走私说法似乎牵强”。

中国厂商的平行尝试

在 DeepSeek 之外，中国其他 AI 企业也在尝试完全基于国产芯片构建系统。

另一家初创公司智谱在今年 1 月发布了一款完全使用华为芯片训练的图像生成模型。

阿里巴巴本周则宣布，将在中国南方建设一个新的 AI 训练与推理数据中心，部署 1 万块自研芯片，由中国电信负责运营。

在这种背景下，DeepSeek 的芯片路线更受关注。Stephen Wu 表示：“如果他们真的已经用华为芯片完整训练出了 V4，那将意味着全球科技与地缘政治格局出现一次重大的转折。”

发表评论

登录后才可评论。去登录