破浪还是潮涨:重新审视人工智能何时超越人类工作者

人工智能会在 2027 年后“全面超越人类”吗?

Anthropic 首席执行官 Dario Amodei 近期表示,人工智能可能在 2027 年后不久“几乎在所有方面超越几乎所有人类”。这一判断与当前一些现实数据形成鲜明对比:现阶段的 AI 在 95% 以上的远程自由职业项目中仍然无法成功完成任务,并且依旧在幻觉(捏造事实)、长期规划以及人类轻松应对的抽象推理方面表现不佳。

然而,麻省理工学院(MIT)旗下 METR 团队的最新研究指出,大型语言模型(LLM)的能力确实存在“跳跃式”提升的可能:在短短几年内,从几乎从不成功,跃升到几乎总是成功。如果这种模式在经济的各个领域普遍出现,意味着许多工人可能会在毫无准备的情况下,突然面对 AI 能力的巨大飞跃。

“破浪”还是“潮涨”:AI 能力提升的真实节奏

在这项研究中,MIT 研究人员将 AI 能力的突发式提升比作“破浪”,并试图回答一个关键问题:

人工智能的进步,是在各个任务上频繁出现破浪式飞跃,还是更像潮水般整体平稳上涨?

团队通过分析数千个贴近现实的任务,发现虽然 AI 能力确实在快速进步,但整体趋势更接近“平滑上升曲线”,而非到处都是突然的断崖式飞跃。换言之,“破浪”现象存在,但更像是少数例外,而不是普遍规律。

能力更像“潮水上涨”,而非到处“惊涛骇浪”

MIT 的研究结果显示,在经济中许多不同领域、不同耗时长度的任务上,人工智能的表现都是稳步提升的。这种跨任务的一致性,支持了一个比喻:

AI 能力更像潮水在上涨,而不是一波波突如其来的巨浪。

论文高级作者 Neil Thompson 指出:

“这并不意味着工人就能因此得到保护,潮水依然可能涨得很快。但这说明,只要认真监测进展,工人和政策制定者应该能够预见 AI 能力的提升,而不是完全被打个措手不及。”

当前水平:AI 已能胜任大量文本类工作

研究团队重点考察了美国经济中 63% 的、以文本为主的任务——这些任务在理论上都可以由大型语言模型来完成。

在这些任务中,当模型被提供了正确、充分的信息后:

  • LLM 能以“经理认为无需人工干预”的最低合格标准,完成约 60% 的任务;
  • 26% 的任务质量被评为“优异”。

首席研究员 Matthias Mertens 评价道:

“即便在完全独立完成任务的情况下,大型语言模型也展现出了相当令人印象深刻的熟练度。”

这意味着,在大量基于文本的工作场景中,AI 已经具备了可观的替代或辅助潜力,只是尚未在所有任务上达到稳定、可靠的高水准。

未来数年:进步迅速,但 2027 年“全面超越”或过于激进

MIT 的研究认为,将 2027 年视为 AI 在广泛任务上“全面超越人类工作者”的时间点,可能过于乐观。但他们同样发现了明显的加速趋势:

  • 研究预测,到 2029 年,人工智能在大多数任务上的成功率有望达到 80% 左右。

Neil Thompson 强调,这一预测有重要前提:

“这些结果依赖于 AI 硬件、算法以及模型规模持续进步。如果这些方面的进展放缓,AI 能力提升的速度也会随之减慢。”

换言之,时间表并非板上钉钉,而是取决于整个技术栈能否维持当前的迭代节奏。

对政策与企业的启示

这项研究的结论,对政策制定者和企业管理者都具有直接影响:

  • 如果 AI 能力主要是“潮水式”平稳上涨,而非完全不可预测的“破浪式”飞跃,那么:
    • 通过持续监测关键指标,有可能提前识别哪些岗位和任务即将被 AI 大幅替代或重塑;
    • 政府可以更有节奏地设计再培训、教育和社会保障政策;
    • 企业可以更从容地规划岗位调整、流程重构和技术投资,而不是在某个时间点被动“被浪打翻”。

总体来看,MIT METR 团队的研究并未否定 AI 在未来数年内对劳动力市场带来巨大冲击的可能性,但它提示我们:这种冲击更可能是可监测、可预期的“潮涨”,而不是完全无法提前察觉的“巨浪”。


分享:


发表评论

登录后才可评论。 去登录