DeepSeek发布V4预览模型称推理性能接近当前前沿系统

商业 2026-05-29 科技最前沿 DeepSeek, 大型语言模型, 人工智能, 科技企业, 定价策略 26 次浏览

中国人工智能实验室DeepSeek近日发布其最新大型语言模型DeepSeek V4的两个预览版本，这是继去年推出DeepSeek V3.2及在业内引发关注的R1推理模型之后的又一次重要更新。

两款预览模型参数规模创开放权重新高

DeepSeek表示，此次发布的DeepSeek V4 Flash和V4 Pro均采用专家混合（Mixture-of-Experts）架构，并配备各自100万个令牌的上下文窗口，可在单次提示中处理大型代码库或长篇文档。根据介绍，专家混合方法通过在每次推理中仅激活部分参数，以降低推理成本。

在参数规模方面，V4 Pro的总参数量为1.6万亿，其中活跃参数为490亿。DeepSeek称，该模型为目前最大的开放权重模型，其参数规模超过Moonshot AI的Kimi K 2.6（1.1万亿）、MiniMax的M1（4560亿），并且是DeepSeek V3.2（6710亿）的两倍多。较小的V4 Flash模型总参数量为2840亿，活跃参数为130亿。

声称推理性能接近前沿模型

DeepSeek表示，得益于架构改进，两款V4模型在效率和性能上均优于DeepSeek V3.2。在推理相关基准测试中，公司称这些模型几乎“缩小了与当前领先模型（包括开源和闭源）的差距”。

该实验室还称，其新款V4-Pro-Max模型在推理基准测试中优于开源同类模型，并在部分任务上超过OpenAI的GPT-5.2和Gemini 3.0 Pro。在编码竞赛类基准测试中，DeepSeek表示，两款V4模型的表现“可与GPT-5.4媲美”。

不过，在知识类测试中，这些模型的表现据称仍略逊于部分前沿系统，尤其是OpenAI的GPT-5.4和谷歌最新的Gemini 3.1 Pro。DeepSeek在说明中写道，这种差距表明其“发展轨迹大约落后于最先进的前沿模型3至6个月”。

功能仍限文本模态支持不及闭源对手

DeepSeek介绍，V4 Flash和V4 Pro目前仅支持文本输入与输出，不具备音频、视频及图像的理解和生成能力。这一点与部分闭源模型形成对比，后者已在多模态方向提供更广泛的支持。

定价策略明显低于前沿模型

在价格方面，DeepSeek将V4系列定位于明显低于当前前沿模型的区间。根据公司公布的数据：

V4 Flash每百万输入令牌收费0.14美元，每百万输出令牌收费0.28美元。DeepSeek称，这一价格低于GPT-5.4 Nano、Gemini 3.1 Flash、GPT-5.4 Mini和Claude Haiku 4.5。
V4 Pro每百万输入令牌收费0.145美元，每百万输出令牌收费3.48美元。DeepSeek表示，该定价低于Gemini 3.1 Pro、GPT-5.5、Claude Opus 4.7和GPT-5.4。

发布背景涉及知识产权争议

此次发布时间点引发关注。就在前一日，美国方面指控中国利用数千个代理账户大规模窃取美国AI实验室的知识产权。与此同时，DeepSeek本身也被Anthropic和OpenAI指控存在“蒸馏”行为，即被指实质上复制其AI模型。DeepSeek方面在本次发布中未就相关指控作进一步说明。

发表评论

登录后才可评论。去登录