破浪还是潮涨：重新审视人工智能何时超越人类工作者

科学 2026-04-07 人工智能, 大型语言模型, MIT研究, 劳动力市场, 科技政策 54 次浏览

人工智能会在 2027 年后“全面超越人类”吗？

Anthropic 首席执行官 Dario Amodei 近期表示，人工智能可能在 2027 年后不久“几乎在所有方面超越几乎所有人类”。这一判断与当前一些现实数据形成鲜明对比：现阶段的 AI 在 95% 以上的远程自由职业项目中仍然无法成功完成任务，并且依旧在幻觉（捏造事实）、长期规划以及人类轻松应对的抽象推理方面表现不佳。

然而，麻省理工学院（MIT）旗下 METR 团队的最新研究指出，大型语言模型（LLM）的能力确实存在“跳跃式”提升的可能：在短短几年内，从几乎从不成功，跃升到几乎总是成功。如果这种模式在经济的各个领域普遍出现，意味着许多工人可能会在毫无准备的情况下，突然面对 AI 能力的巨大飞跃。

“破浪”还是“潮涨”：AI 能力提升的真实节奏

在这项研究中，MIT 研究人员将 AI 能力的突发式提升比作“破浪”，并试图回答一个关键问题：

人工智能的进步，是在各个任务上频繁出现破浪式飞跃，还是更像潮水般整体平稳上涨？

团队通过分析数千个贴近现实的任务，发现虽然 AI 能力确实在快速进步，但整体趋势更接近“平滑上升曲线”，而非到处都是突然的断崖式飞跃。换言之，“破浪”现象存在，但更像是少数例外，而不是普遍规律。

能力更像“潮水上涨”，而非到处“惊涛骇浪”

MIT 的研究结果显示，在经济中许多不同领域、不同耗时长度的任务上，人工智能的表现都是稳步提升的。这种跨任务的一致性，支持了一个比喻：

AI 能力更像潮水在上涨，而不是一波波突如其来的巨浪。

论文高级作者 Neil Thompson 指出：

“这并不意味着工人就能因此得到保护，潮水依然可能涨得很快。但这说明，只要认真监测进展，工人和政策制定者应该能够预见 AI 能力的提升，而不是完全被打个措手不及。”

当前水平：AI 已能胜任大量文本类工作

研究团队重点考察了美国经济中 63% 的、以文本为主的任务——这些任务在理论上都可以由大型语言模型来完成。

在这些任务中，当模型被提供了正确、充分的信息后：

LLM 能以“经理认为无需人工干预”的最低合格标准，完成约 60% 的任务；
约 26% 的任务质量被评为“优异”。

首席研究员 Matthias Mertens 评价道：

“即便在完全独立完成任务的情况下，大型语言模型也展现出了相当令人印象深刻的熟练度。”

这意味着，在大量基于文本的工作场景中，AI 已经具备了可观的替代或辅助潜力，只是尚未在所有任务上达到稳定、可靠的高水准。

未来数年：进步迅速，但 2027 年“全面超越”或过于激进

MIT 的研究认为，将 2027 年视为 AI 在广泛任务上“全面超越人类工作者”的时间点，可能过于乐观。但他们同样发现了明显的加速趋势：

研究预测，到 2029 年，人工智能在大多数任务上的成功率有望达到 80% 左右。

Neil Thompson 强调，这一预测有重要前提：

“这些结果依赖于 AI 硬件、算法以及模型规模持续进步。如果这些方面的进展放缓，AI 能力提升的速度也会随之减慢。”

换言之，时间表并非板上钉钉，而是取决于整个技术栈能否维持当前的迭代节奏。

对政策与企业的启示

这项研究的结论，对政策制定者和企业管理者都具有直接影响：

如果 AI 能力主要是“潮水式”平稳上涨，而非完全不可预测的“破浪式”飞跃，那么：
- 通过持续监测关键指标，有可能提前识别哪些岗位和任务即将被 AI 大幅替代或重塑；
- 政府可以更有节奏地设计再培训、教育和社会保障政策；
- 企业可以更从容地规划岗位调整、流程重构和技术投资，而不是在某个时间点被动“被浪打翻”。

总体来看，MIT METR 团队的研究并未否定 AI 在未来数年内对劳动力市场带来巨大冲击的可能性，但它提示我们：这种冲击更可能是可监测、可预期的“潮涨”，而不是完全无法提前察觉的“巨浪”。

发表评论

登录后才可评论。去登录