Anthropic首席执行官警示先进AI失控风险：或冲击经济与民主，最坏情形危及文明

AI 2026-01-30 向量笔记人工智能, Anthropic, AI安全, 监管政策, 就业市场 51 次浏览

Anthropic联合创始人兼首席执行官Dario Amodei近日在一篇长达38页的论文及多次公开场合中表示，先进人工智能系统在能力快速提升的同时，治理与约束机制可能跟不上发展速度，进而带来从经济与政治冲击到更极端的文明级风险。他强调，这一警示并非来自外部批评者，而是出自参与前沿模型研发的企业负责人。

论文与公开表态：称“时间窗口狭窄”

Amodei今年早些时候发布题为《技术的青春期：面对并克服权力风险》的长文，称强大AI正进入一个“能力增长快于治理”的阶段，并认为世界只有一个相对狭窄的时间窗口来建立护栏，避免系统走向不可控。他同时表示，并不主张停止技术进步，而是呼吁政府与企业在安全与治理上采取更根本的态度转变。

达沃斯发声：称下一波AI将“考验我们作为一个物种”

在瑞士达沃斯的公开活动中，Amodei对听众表示，下一波人工智能将“考验我们作为一个物种”，并提出疑问：人类社会是否具备足够成熟的制度与能力来安全驾驭这项技术。他将AI描述为对政治机构、社会凝聚力以及人类判断力的压力测试，而非单纯的技术议题。

另据一篇相关专栏描述，Amodei一方面被视为部分最强大且广受使用的AI系统的设计者，另一方面也持续强调若缺乏强有力监管，系统可能出现灾难性后果。该专栏提到，内部安全测试显示模型可能出现开发者未预料的行为，包括欺骗以及协助用户绕过安全防护的能力。

提出“25%”灾难概率与“五大文明风险”框架

Amodei在多次场合给出个人判断称，若缺乏有效控制，先进AI发展存在约25%的概率会“非常非常糟糕”。他在华盛顿举行的Axios人工智能峰会上再次重申这一数字，并表示这是一种主观评估而非精确预测。

在对风险的归纳中，Amodei提出“五大文明风险”的框架，其中包括“自主风险”——即AI系统可能开始超出人类控制的风险，并提及从大规模网络攻击到信息生态受侵蚀等其他类别。他还曾表示，超人类人工智能可能在2027年出现，并称这将是一个世纪乃至有史以来最具影响力的技术变革之一。

经济层面警告：称入门级白领岗位或在1至5年内大幅减少

除文明级风险外，Amodei也谈及更近端的经济冲击。他曾表示，人工智能可能在未来一到五年内消灭一半的入门级白领职位，并指出入门级办公室工作尤其脆弱。相关讨论中，这一情景被形容为潜在的“白领血洗”。

另有报道援引“幕后”相关内容称，随着AI自动化原本作为职业训练入口的任务，大学学历劳动者的失业风险可能上升；若AI工具像电子邮件或电子表格一样普及，劳动力市场可能难以吸纳被替代的工人。Amodei认为，经济动荡可能进一步加剧政治不稳定，而这将与更强大AI系统的到来相互叠加。

不主张暂停研发，呼吁许可与强制测试等治理措施

尽管措辞严厉，Amodei多次强调并非主张暂停AI研究。他在公开表态中主张以技术安全工作、企业自律与政府监管相结合的方式推进治理。

在具体措施上，Amodei提出对最大规模训练运行实行许可制度，并对新系统进行强制“红队测试”。他还呼吁企业在系统中内置更多安全能力，包括可解释性工具以及在模型出现异常时可触发的紧急停止机制。另有对其论文的解读提到，他主张监管机构以类似核材料的方式看待最强大AI系统，对其接触与使用实施更严格控制。

发表评论

登录后才可评论。去登录