DeepSeek发布V4预览模型 称推理性能接近当前前沿系统

richlovec 1500_400 (1)
 

中国人工智能实验室DeepSeek近日发布其最新大型语言模型DeepSeek V4的两个预览版本,这是继去年推出DeepSeek V3.2及在业内引发关注的R1推理模型之后的又一次重要更新。

两款预览模型参数规模创开放权重新高

DeepSeek表示,此次发布的DeepSeek V4 Flash和V4 Pro均采用专家混合(Mixture-of-Experts)架构,并配备各自100万个令牌的上下文窗口,可在单次提示中处理大型代码库或长篇文档。根据介绍,专家混合方法通过在每次推理中仅激活部分参数,以降低推理成本。

在参数规模方面,V4 Pro的总参数量为1.6万亿,其中活跃参数为490亿。DeepSeek称,该模型为目前最大的开放权重模型,其参数规模超过Moonshot AI的Kimi K 2.6(1.1万亿)、MiniMax的M1(4560亿),并且是DeepSeek V3.2(6710亿)的两倍多。较小的V4 Flash模型总参数量为2840亿,活跃参数为130亿。

声称推理性能接近前沿模型

DeepSeek表示,得益于架构改进,两款V4模型在效率和性能上均优于DeepSeek V3.2。在推理相关基准测试中,公司称这些模型几乎“缩小了与当前领先模型(包括开源和闭源)的差距”。

该实验室还称,其新款V4-Pro-Max模型在推理基准测试中优于开源同类模型,并在部分任务上超过OpenAI的GPT-5.2和Gemini 3.0 Pro。在编码竞赛类基准测试中,DeepSeek表示,两款V4模型的表现“可与GPT-5.4媲美”。

不过,在知识类测试中,这些模型的表现据称仍略逊于部分前沿系统,尤其是OpenAI的GPT-5.4和谷歌最新的Gemini 3.1 Pro。DeepSeek在说明中写道,这种差距表明其“发展轨迹大约落后于最先进的前沿模型3至6个月”。

功能仍限文本 模态支持不及闭源对手

DeepSeek介绍,V4 Flash和V4 Pro目前仅支持文本输入与输出,不具备音频、视频及图像的理解和生成能力。这一点与部分闭源模型形成对比,后者已在多模态方向提供更广泛的支持。

定价策略明显低于前沿模型

在价格方面,DeepSeek将V4系列定位于明显低于当前前沿模型的区间。根据公司公布的数据:

  • V4 Flash每百万输入令牌收费0.14美元,每百万输出令牌收费0.28美元。DeepSeek称,这一价格低于GPT-5.4 Nano、Gemini 3.1 Flash、GPT-5.4 Mini和Claude Haiku 4.5。
  • V4 Pro每百万输入令牌收费0.145美元,每百万输出令牌收费3.48美元。DeepSeek表示,该定价低于Gemini 3.1 Pro、GPT-5.5、Claude Opus 4.7和GPT-5.4。

发布背景涉及知识产权争议

此次发布时间点引发关注。就在前一日,美国方面指控中国利用数千个代理账户大规模窃取美国AI实验室的知识产权。与此同时,DeepSeek本身也被Anthropic和OpenAI指控存在“蒸馏”行为,即被指实质上复制其AI模型。DeepSeek方面在本次发布中未就相关指控作进一步说明。


分享:


发表评论

登录后才可评论。 去登录