中国AI企业密集开源推理模型:阿里发布「Qwen3-Max-Thinking」,Moonshot AI推出「Kimi K2.5」

richlovec 1500_400 (1)
 

中国多家AI科技企业近期密集推出强调推理能力的开源大规模语言模型(LLM),在复杂推理、智能体(Agent)以及工具调用等方向上加速竞争。

2026年1月26日,阿里巴巴在其「Qwen」模型家族中新增旗舰推理模型「Qwen3-Max-Thinking」。紧接着在27日,中国初创公司 Moonshot AI 也发布了其生成式AI服务「Kimi」的新一代基础模型「Kimi K2.5」。


阿里巴巴推出推理特化开源模型「Qwen3-Max-Thinking」

Qwen3-Max-Thinking.jpg

阿里巴巴旗下 Qwen 开发团队于2026年1月26日正式发布大模型家族新成员「Qwen3-Max-Thinking」,定位为面向复杂推理场景的旗舰级模型,并以开源形式对外提供。

官方介绍称,Qwen3-Max-Thinking通过「更大规模的模型架构 + 大规模强化学习」的组合,在以下多个维度显著提升了性能:

  • 知识覆盖与知识调用能力
  • 复杂推理与多步推理能力
  • 指令理解与执行(指令跟随能力)
  • 与人类偏好的对齐程度
  • 面向智能体(Agent)的综合能力

根据 Qwen 团队公布的数据,在19项主流基准测试中,Qwen3-Max-Thinking的整体表现已达到与 GPT-5.2-Thinking、Claude Opus 4.5、Gemini 3 Pro 相近的水平。

score.jpg qwen3 max bench.jpg

此外,Qwen3-Max-Thinking内置了自适应工具调用能力:

  • 可在需要时自主发起搜索
  • 自动进行代码执行与调试
  • 在 Qwen Chat 中以「按需调用工具」的方式工作

模型还引入了「测试时扩展(test-time scaling)」策略,即在推理阶段根据任务难度动态分配更多计算资源,从而在多项推理类基准上获得进一步性能提升。

目前,Qwen3-Max-Thinking已通过 Qwen Chat 和 API 对外提供,同时以开源模型形式发布,便于开发者在自有环境中部署与二次开发。


Moonshot AI发布开源推理模型「Kimi K2.5」

Kimiai.jpg

2026年1月27日,中国AI初创公司 Moonshot AI 宣布,其生成式AI服务「Kimi」的全新基础模型「Kimi K2.5」正式上线,并以开源形式向社区开放。

Moonshot AI 将 Kimi K2.5 定位为集「视觉理解 + 推理能力 + 智能体功能」于一体的开源模型,称之为「Visual Agentic Intelligence」。

根据该公司官方 X 账号披露的数据,Kimi K2.5 在多项与智能体和多模态相关的基准测试中取得了领先成绩:

  • 智能体相关基准:
    • HLE(full set):50.2%
    • BrowseComp:74.9%
  • 视觉理解与代码生成相关基准:
    • MMMU Pro:78.5%
    • VideoMMMU:86.6%
    • SWE-bench Verified:76.8%

Moonshot AI 表示,这些成绩使 Kimi K2.5 达到了当前开源模型中的顶尖水平。

G_pUaPlaoAAa9as.jpg

「Agent Swarm」:最多100个子智能体的自组织协作

Kimi K2.5 的一大亮点是其「Agent Swarm」能力:

  • 模型可以自主生成并管理最多100个子智能体(Sub-agent)
  • 多个智能体可并行发起工具调用,最多支持约1,500次并行调用
  • 相比单一智能体架构,整体处理速度最高可提升约4.5倍

目前,Agent Swarm 功能仍处于测试(Beta)阶段,但已面向部分用户开放试用。

使用方式与开源情况

Kimi K2.5 已在 Kimi 的网页版与移动应用中上线,支持:

  • 普通聊天模式
  • 面向任务分解与自动化执行的智能体模式

同时,Moonshot AI 提供了面向开发者的 API 接入能力,并推荐在生产环境的软件开发场景中,将 Kimi K2.5 与其开发者工具「Kimi Code」结合使用,以提升代码生成与调试效率。

在开源方面,Kimi K2.5 的模型权重与相关代码已在 Hugging Face 平台公开,方便研究者与开发者进行复现、微调和集成。


中国开源推理模型竞争加速

从阿里巴巴的 Qwen3-Max-Thinking 到 Moonshot AI 的 Kimi K2.5,可以看到中国AI企业在以下方向上明显加速:

  • 将复杂推理与智能体能力作为新一轮竞争焦点
  • 强调多模态(尤其是视觉)与代码生成能力
  • 通过开源权重与API,争取开发者生态与产业落地

随着更多企业加入开源推理模型赛道,围绕智能体、工具调用和长链路推理的应用场景,有望在未来几年内快速扩张。


分享:


发表评论

登录后才可评论。 去登录