2025年被不少业内人士视为人工智能“情绪检验”的一年,而多位受访专家预计,2026年将成为这项技术走向务实应用的关键节点。行业关注点正从单纯堆叠算力和参数规模,转向如何在合适场景中部署合适模型、将智能嵌入实体设备,并让系统更好融入现有工作流程。
多名受访者在接受 TechCrunch 采访时表示,2026年有望成为从“蛮力扩展”转向“架构创新”、从炫目演示转向定向部署、从宣称完全自主的代理转向切实增强人类工作的代理的转折之年。行业热度仍在,但整体态度趋于冷静。
扩展红利减弱 新架构受关注
2012年,Alex Krizhevsky、Ilya Sutskever 和 Geoffrey Hinton 通过 ImageNet 论文展示了利用海量图像训练模型进行物体识别的路径,在 GPU 支持下,这一高算力路径得以推进,并在随后十年催生了大量针对不同任务的新架构。
这一趋势在 2020 年前后达到高点。OpenAI 发布 GPT-3,将模型规模放大约 100 倍后,在未进行显式训练的情况下展现出编程和推理等能力,被 Workera 首席执行官兼创始人 Kian Katanforoosh 称为“扩展时代”的开端——即相信更多算力、更多数据和更大规模 Transformer 模型将持续带来突破的阶段。
目前,越来越多研究人员认为,单纯依赖扩展的收益正在减弱,行业正重新回到以研究新架构为主的阶段。Meta 前首席人工智能科学家 Yann LeCun 长期强调,不能过度依赖扩展,需要在架构层面取得进展。Sutskever 近期在采访中也表示,现有模型已出现平台期,预训练效果趋于平缓,显示需要新的思路。
Katanforoosh 预计:“在未来五年内,我们很可能会找到一种在性能上显著优于 Transformer 的架构。如果找不到,就很难指望模型能力再有大幅跃升。”
小型模型推动企业落地
在企业应用层面,多名业内人士认为,下一阶段的采用浪潮将更多依赖小型、可灵活微调的语言模型,而非通用型超大模型。大型语言模型在知识泛化方面具备优势,但在成本、延迟和特定领域精度等方面,小型模型正被视为更具性价比的选择。
AT&T 首席数据官 Andy Markus 对 TechCrunch 表示,经微调的小型语言模型有望成为 2026 年的主要趋势,并成为成熟人工智能企业的常用工具。他认为,这类模型在成本和性能上的综合优势,将推动其在企业内部的使用频率超过“开箱即用”的大型通用模型。Markus 指出,在企业业务场景中,如果微调得当,小型模型在准确性上可以与更大模型相当,同时在成本和响应速度方面更具优势。
法国开源人工智能创业公司 Mistral 也持类似观点。该公司称,其小型模型在经过针对性微调后,在多个基准测试中表现优于更大规模模型。奥斯汀企业人工智能公司 ABBYY 的人工智能策略师 Jon Knisley 则表示,小型语言模型在效率、成本和适应性方面的特点,使其特别适合对精度要求较高的定制化应用。
Markus 认为,小型模型将在“代理时代”发挥关键作用;Knisley 则指出,小型模型更易在本地设备上部署,而边缘计算的进展正在加速这一趋势。
世界模型成新热点
不少研究人员指出,人类学习不仅依赖语言,还依赖对现实世界运作方式的体验和理解,而当前大型语言模型本质上仍是“下一个词”的预测系统,并不真正理解世界。由此,能够学习三维空间中物体运动和交互规律、据此进行预测和行动的“世界模型”,被视为下一步的重要方向。
多项动向显示,2026 年或成为世界模型的关键一年。LeCun 离开 Meta 后创立了专注世界模型的实验室,据报道其估值目标为 50 亿美元。谷歌 DeepMind 正推进 Genie 项目,并于 8 月发布最新模型,目标是构建可实时交互的通用世界模型。初创公司 Decart 和 Odyssey 已展示相关演示,Fei-Fei Li 旗下的 World Labs 推出了首个商业世界模型 Marble。
新公司 General Intuition 在 10 月完成 1.34 亿美元种子轮融资,专注于训练代理进行空间推理;视频生成初创公司 Runway 则在 12 月发布其首个世界模型 GWM-1。

尽管研究人员普遍看好世界模型在机器人和自主系统领域的长期潜力,但短期内,游戏行业被认为更可能率先受益。PitchBook 预计,2022 年至 2025 年间,游戏领域世界模型市场规模约为 12 亿美元,并预测到 2030 年将增至 2760 亿美元,驱动因素包括生成交互式虚拟世界和更逼真的非玩家角色等应用。
General Intuition 创始人 Pim de Witte 对 TechCrunch 表示,虚拟环境不仅可能重塑游戏体验,也将成为新一代基础模型的重要测试场。
代理接入真实系统
2025 年,外界对“智能代理”的预期并未完全兑现,其中一个主要原因是难以将代理与实际业务系统打通。由于缺乏对工具和上下文的有效访问能力,多数代理仍停留在试点流程中。
Anthropic 推出的模型上下文协议(Model Context Protocol,MCP)被部分业内人士称为人工智能的“USB-C”,用于让代理与数据库、搜索引擎和 API 等外部工具进行通信,被视为此前缺失的关键连接环节。该协议推出后迅速获得关注。OpenAI 和微软已公开表示支持 MCP,Anthropic 近期还将其捐赠给 Linux 基金会旗下新成立的 Agentic AI Foundation,以推动开源代理工具的标准化。谷歌也开始搭建自有托管 MCP 服务器,将代理连接至其产品和服务。
随着 MCP 降低代理接入真实系统的门槛,多名业内人士预计,2026 年代理相关工作流程有望从演示阶段走向日常使用。Sapphire Ventures 合伙人 Rajeev Dham 认为,这些进展将推动“以代理为先”的解决方案在多个行业中承担“记录系统”的角色。
Dham 表示,随着语音代理处理更多端到端任务,例如接单和客户沟通,它们也将逐步演变为底层核心系统的一部分。他预计,这一趋势将在家政服务、房地产科技、医疗保健等垂直领域,以及销售、IT 和客户支持等横向职能中出现。
强调增强而非完全替代
围绕代理应用的扩展,一些市场参与者对潜在裁员表示担忧。但 Katanforoosh 认为,这并非主流判断。他表示,2026 年“将是人类的一年”。
在 2024 年,几乎所有人工智能公司都曾预测,自动化将显著减少对人力的需求。但在技术尚未完全成熟、宏观经济存在不确定性的背景下,这一论调并未广泛获得认可。Katanforoosh 预计,明年市场将更清晰地认识到“人工智能并未如早先设想那样完全自主”,讨论焦点将更多转向人工智能如何增强而非取代人类工作流程。
他表示,许多企业可能会重新启动招聘,并预计在人工智能治理、透明度、安全和数据管理等领域将出现新的岗位需求。他同时对明年失业率“平均低于 4%”表示乐观。de Witte 则补充称,人们希望“站在 API 之上,而不是之下”,并认为 2026 年在这一点上具有重要意义。
物理人工智能进入主流
多位受访专家指出,小型模型、世界模型和边缘计算的进展,将推动机器学习更多进入实体世界场景。
AT&T Ventures 负责人 Vikram Taneja 对 TechCrunch 表示,2026 年“物理人工智能”将进入主流,新的人工智能驱动设备类别——包括机器人、自动驾驶车辆、无人机和可穿戴设备——将开始更大规模进入市场。
自动驾驶和机器人被视为物理人工智能的典型应用,预计在 2026 年仍将保持增长,但其训练和部署成本依然较高。相比之下,可穿戴设备以更低成本获得了更广泛的消费者接受度。例如,Ray-Ban Meta 等智能眼镜已开始配备可回答用户视野中问题的助手,AI 驱动的健康戒指和智能手表等新形态设备也在普及“始终在线”的个体级推理能力。
Taneja 表示,通信服务提供商将致力于优化网络基础设施,以支撑这波新设备浪潮,而能够灵活提供连接服务的企业将在这一过程中处于相对有利的位置。
