人工智能会在 2027 年后“全面超越人类”吗?
Anthropic 首席执行官 Dario Amodei 近期表示,人工智能可能在 2027 年后不久“几乎在所有方面超越几乎所有人类”。这一判断与当前一些现实数据形成鲜明对比:现阶段的 AI 在 95% 以上的远程自由职业项目中仍然无法成功完成任务,并且依旧在幻觉(捏造事实)、长期规划以及人类轻松应对的抽象推理方面表现不佳。
然而,麻省理工学院(MIT)旗下 METR 团队的最新研究指出,大型语言模型(LLM)的能力确实存在“跳跃式”提升的可能:在短短几年内,从几乎从不成功,跃升到几乎总是成功。如果这种模式在经济的各个领域普遍出现,意味着许多工人可能会在毫无准备的情况下,突然面对 AI 能力的巨大飞跃。
“破浪”还是“潮涨”:AI 能力提升的真实节奏
在这项研究中,MIT 研究人员将 AI 能力的突发式提升比作“破浪”,并试图回答一个关键问题:
人工智能的进步,是在各个任务上频繁出现破浪式飞跃,还是更像潮水般整体平稳上涨?
团队通过分析数千个贴近现实的任务,发现虽然 AI 能力确实在快速进步,但整体趋势更接近“平滑上升曲线”,而非到处都是突然的断崖式飞跃。换言之,“破浪”现象存在,但更像是少数例外,而不是普遍规律。
能力更像“潮水上涨”,而非到处“惊涛骇浪”
MIT 的研究结果显示,在经济中许多不同领域、不同耗时长度的任务上,人工智能的表现都是稳步提升的。这种跨任务的一致性,支持了一个比喻:
AI 能力更像潮水在上涨,而不是一波波突如其来的巨浪。
论文高级作者 Neil Thompson 指出:
“这并不意味着工人就能因此得到保护,潮水依然可能涨得很快。但这说明,只要认真监测进展,工人和政策制定者应该能够预见 AI 能力的提升,而不是完全被打个措手不及。”
当前水平:AI 已能胜任大量文本类工作
研究团队重点考察了美国经济中 63% 的、以文本为主的任务——这些任务在理论上都可以由大型语言模型来完成。

在这些任务中,当模型被提供了正确、充分的信息后:
- LLM 能以“经理认为无需人工干预”的最低合格标准,完成约 60% 的任务;
- 约 26% 的任务质量被评为“优异”。
首席研究员 Matthias Mertens 评价道:
“即便在完全独立完成任务的情况下,大型语言模型也展现出了相当令人印象深刻的熟练度。”
这意味着,在大量基于文本的工作场景中,AI 已经具备了可观的替代或辅助潜力,只是尚未在所有任务上达到稳定、可靠的高水准。
未来数年:进步迅速,但 2027 年“全面超越”或过于激进
MIT 的研究认为,将 2027 年视为 AI 在广泛任务上“全面超越人类工作者”的时间点,可能过于乐观。但他们同样发现了明显的加速趋势:
- 研究预测,到 2029 年,人工智能在大多数任务上的成功率有望达到 80% 左右。
Neil Thompson 强调,这一预测有重要前提:
“这些结果依赖于 AI 硬件、算法以及模型规模持续进步。如果这些方面的进展放缓,AI 能力提升的速度也会随之减慢。”
换言之,时间表并非板上钉钉,而是取决于整个技术栈能否维持当前的迭代节奏。
对政策与企业的启示
这项研究的结论,对政策制定者和企业管理者都具有直接影响:
- 如果 AI 能力主要是“潮水式”平稳上涨,而非完全不可预测的“破浪式”飞跃,那么:
- 通过持续监测关键指标,有可能提前识别哪些岗位和任务即将被 AI 大幅替代或重塑;
- 政府可以更有节奏地设计再培训、教育和社会保障政策;
- 企业可以更从容地规划岗位调整、流程重构和技术投资,而不是在某个时间点被动“被浪打翻”。
总体来看,MIT METR 团队的研究并未否定 AI 在未来数年内对劳动力市场带来巨大冲击的可能性,但它提示我们:这种冲击更可能是可监测、可预期的“潮涨”,而不是完全无法提前察觉的“巨浪”。