中国AI企业密集开源推理模型：阿里发布「Qwen3-Max-Thinking」，Moonshot AI推出「Kimi K2.5」

AI 2026-02-03 大模型, 开源AI, 阿里巴巴, Moonshot AI, 推理模型 125 次浏览

中国多家AI科技企业近期密集推出强调推理能力的开源大规模语言模型（LLM），在复杂推理、智能体（Agent）以及工具调用等方向上加速竞争。

2026年1月26日，阿里巴巴在其「Qwen」模型家族中新增旗舰推理模型「Qwen3-Max-Thinking」。紧接着在27日，中国初创公司 Moonshot AI 也发布了其生成式AI服务「Kimi」的新一代基础模型「Kimi K2.5」。

阿里巴巴推出推理特化开源模型「Qwen3-Max-Thinking」

阿里巴巴旗下 Qwen 开发团队于2026年1月26日正式发布大模型家族新成员「Qwen3-Max-Thinking」，定位为面向复杂推理场景的旗舰级模型，并以开源形式对外提供。

官方介绍称，Qwen3-Max-Thinking通过「更大规模的模型架构 + 大规模强化学习」的组合，在以下多个维度显著提升了性能：

知识覆盖与知识调用能力
复杂推理与多步推理能力
指令理解与执行（指令跟随能力）
与人类偏好的对齐程度
面向智能体（Agent）的综合能力

根据 Qwen 团队公布的数据，在19项主流基准测试中，Qwen3-Max-Thinking的整体表现已达到与 GPT-5.2-Thinking、Claude Opus 4.5、Gemini 3 Pro 相近的水平。

此外，Qwen3-Max-Thinking内置了自适应工具调用能力：

可在需要时自主发起搜索
自动进行代码执行与调试
在 Qwen Chat 中以「按需调用工具」的方式工作

模型还引入了「测试时扩展（test-time scaling）」策略，即在推理阶段根据任务难度动态分配更多计算资源，从而在多项推理类基准上获得进一步性能提升。

目前，Qwen3-Max-Thinking已通过 Qwen Chat 和 API 对外提供，同时以开源模型形式发布，便于开发者在自有环境中部署与二次开发。

Moonshot AI发布开源推理模型「Kimi K2.5」

2026年1月27日，中国AI初创公司 Moonshot AI 宣布，其生成式AI服务「Kimi」的全新基础模型「Kimi K2.5」正式上线，并以开源形式向社区开放。

Moonshot AI 将 Kimi K2.5 定位为集「视觉理解 + 推理能力 + 智能体功能」于一体的开源模型，称之为「Visual Agentic Intelligence」。

根据该公司官方 X 账号披露的数据，Kimi K2.5 在多项与智能体和多模态相关的基准测试中取得了领先成绩：

智能体相关基准：
- HLE（full set）：50.2%
- BrowseComp：74.9%
视觉理解与代码生成相关基准：
- MMMU Pro：78.5%
- VideoMMMU：86.6%
- SWE-bench Verified：76.8%

Moonshot AI 表示，这些成绩使 Kimi K2.5 达到了当前开源模型中的顶尖水平。

「Agent Swarm」：最多100个子智能体的自组织协作

Kimi K2.5 的一大亮点是其「Agent Swarm」能力：

模型可以自主生成并管理最多100个子智能体（Sub-agent）
多个智能体可并行发起工具调用，最多支持约1,500次并行调用
相比单一智能体架构，整体处理速度最高可提升约4.5倍

目前，Agent Swarm 功能仍处于测试（Beta）阶段，但已面向部分用户开放试用。

使用方式与开源情况

Kimi K2.5 已在 Kimi 的网页版与移动应用中上线，支持：

普通聊天模式
面向任务分解与自动化执行的智能体模式

同时，Moonshot AI 提供了面向开发者的 API 接入能力，并推荐在生产环境的软件开发场景中，将 Kimi K2.5 与其开发者工具「Kimi Code」结合使用，以提升代码生成与调试效率。

在开源方面，Kimi K2.5 的模型权重与相关代码已在 Hugging Face 平台公开，方便研究者与开发者进行复现、微调和集成。

中国开源推理模型竞争加速

从阿里巴巴的 Qwen3-Max-Thinking 到 Moonshot AI 的 Kimi K2.5，可以看到中国AI企业在以下方向上明显加速：

将复杂推理与智能体能力作为新一轮竞争焦点
强调多模态（尤其是视觉）与代码生成能力
通过开源权重与API，争取开发者生态与产业落地

随着更多企业加入开源推理模型赛道，围绕智能体、工具调用和长链路推理的应用场景，有望在未来几年内快速扩张。

发表评论

登录后才可评论。去登录