DeepSeek 迟到的 V4:检验中国 AI 自立雄心的关键一役

richlovec 1500_400 (1)
 

全球等待的中国新模型

数周以来,全球科技行业都在关注 DeepSeek 何时推出其备受期待的新一代人工智能模型 V4。外界普遍认为,这款产品将成为衡量中国在这一高速发展领域进展的重要标志。

自 2025 年初,这家初创公司凭借一款低成本聊天机器人一举走向国际舞台以来,已经过去一年多。这款聊天机器人在性能上与美国同类产品相当,却以更低成本著称,被视为中国人工智能崛起的代表之一。

然而,尽管外界多次传出“即将发布”的消息,DeepSeek 的 V4 模型至今仍未正式亮相。

芯片之争与地缘政治

围绕 V4 的最大悬念之一,是其训练和运行所依赖的芯片究竟来自何方:是继续使用全球领先的美国设计,还是转向中国正全力追赶的国产替代方案?这一选择被视为具有明显的地缘政治意味。

Counterpoint Research 首席人工智能分析师孙伟在接受法新社采访时表示:“了解他们用什么芯片非常关键,因为在某种程度上,这将成为中国人工智能能否走向自给自足的一项信号。”

科技媒体 The Information 上周报道称,V4 有望运行在华为最新生产的芯片之上。

如果这一转变成真,将意味着中国在突破美国对英伟达高端 AI 芯片出口限制方面迈出重要一步。报道称,五名直接知情人士透露,为配合 DeepSeek 的发布,包括阿里巴巴、字节跳动和腾讯在内的中国科技巨头,已经大量订购华为芯片。

法新社就此联系了 DeepSeek、华为、阿里巴巴、字节跳动和腾讯,但均未获得回应。

从“副项目”到“警钟”

DeepSeek 最初于 2023 年作为一家对冲基金的副项目起步,该基金手中掌握着一批性能强劲的英伟达处理器。

2025 年 1 月,DeepSeek 推出的 R1 深度推理聊天机器人引发全球关注。R1 的发布一度拖累美国科技股大幅下跌,当时的美国总统唐纳德·特朗普甚至将其形容为对美国科技企业的“警钟”。

R1 的底层基础,是 DeepSeek 在 2024 年 12 月发布的上一代主力模型 V3。

凭借价格低廉且高度可定制的 AI 工具,DeepSeek 在中国本土获得广泛应用,同时也在东南亚和中东等新兴市场迅速走红。

Carthage Capital 基金创始人 Stephen Wu 对法新社表示,传闻中的多模态 V4 模型——既能生成文本,也能生成图片和视频——可能再次对美国科技股估值造成冲击。

他预测:“我认为即将发布的 DeepSeek V4 不会只是一次普通的软件升级,而将是一个高性能的开源模型,能够以极低成本处理超大规模上下文窗口。”

不过,DeepSeek 作为前沿 AI 公司的声誉,也在这一轮等待中面临考验。

从英伟达到国产芯片的代价

DeepSeek 以往的模型高度依赖英伟达芯片。如果 V4 真要全面转向国产芯片,势必需要对系统进行“大规模重新设计”,孙伟指出。

“这种转变可能会拖慢开发节奏,并在性能上做出一定取舍,尤其是对于被寄予厚望、预计将达到最先进水平的 V4 模型而言。”

训练与推理的鸿沟

美国以国家安全为由,禁止向中国出口英伟达最强大的 AI 处理器。

Stephen Wu 认为:“DeepSeek V4 一再推迟的事实,表明在无法不受限制地获取顶级英伟达硬件的情况下,要扩展最前沿的大模型是存在明显阻力的。”

与此同时,有报道称,DeepSeek 为训练 V4,曾通过第三国拆解并走私数千块英伟达顶级 Blackwell 芯片回中国,从而绕过出口禁令。

训练一个先进的 AI 模型需要极其庞大的算力,远远高于后续在用户侧进行生成式 AI 推理时所需的计算资源。

法新社已就此向 DeepSeek 寻求评论。英伟达没有直接回应法新社的置评请求,但对 The Information 表示,目前尚未看到相关证据,“这种走私说法似乎牵强”。

中国厂商的平行尝试

在 DeepSeek 之外,中国其他 AI 企业也在尝试完全基于国产芯片构建系统。

另一家初创公司智谱在今年 1 月发布了一款完全使用华为芯片训练的图像生成模型。

阿里巴巴本周则宣布,将在中国南方建设一个新的 AI 训练与推理数据中心,部署 1 万块自研芯片,由中国电信负责运营。

在这种背景下,DeepSeek 的芯片路线更受关注。Stephen Wu 表示:“如果他们真的已经用华为芯片完整训练出了 V4,那将意味着全球科技与地缘政治格局出现一次重大的转折。”

© 2026 法新社


分享:


发表评论

登录后才可评论。 去登录