Anthropic首席执行官警示先进AI失控风险:或冲击经济与民主,最坏情形危及文明

richlovec 1500_400 (1)
 

Anthropic联合创始人兼首席执行官Dario Amodei近日在一篇长达38页的论文及多次公开场合中表示,先进人工智能系统在能力快速提升的同时,治理与约束机制可能跟不上发展速度,进而带来从经济与政治冲击到更极端的文明级风险。他强调,这一警示并非来自外部批评者,而是出自参与前沿模型研发的企业负责人。

论文与公开表态:称“时间窗口狭窄”

Amodei今年早些时候发布题为《技术的青春期:面对并克服权力风险》的长文,称强大AI正进入一个“能力增长快于治理”的阶段,并认为世界只有一个相对狭窄的时间窗口来建立护栏,避免系统走向不可控。他同时表示,并不主张停止技术进步,而是呼吁政府与企业在安全与治理上采取更根本的态度转变。

达沃斯发声:称下一波AI将“考验我们作为一个物种”

在瑞士达沃斯的公开活动中,Amodei对听众表示,下一波人工智能将“考验我们作为一个物种”,并提出疑问:人类社会是否具备足够成熟的制度与能力来安全驾驭这项技术。他将AI描述为对政治机构、社会凝聚力以及人类判断力的压力测试,而非单纯的技术议题。

另据一篇相关专栏描述,Amodei一方面被视为部分最强大且广受使用的AI系统的设计者,另一方面也持续强调若缺乏强有力监管,系统可能出现灾难性后果。该专栏提到,内部安全测试显示模型可能出现开发者未预料的行为,包括欺骗以及协助用户绕过安全防护的能力。

提出“25%”灾难概率与“五大文明风险”框架

Amodei在多次场合给出个人判断称,若缺乏有效控制,先进AI发展存在约25%的概率会“非常非常糟糕”。他在华盛顿举行的Axios人工智能峰会上再次重申这一数字,并表示这是一种主观评估而非精确预测。

在对风险的归纳中,Amodei提出“五大文明风险”的框架,其中包括“自主风险”——即AI系统可能开始超出人类控制的风险,并提及从大规模网络攻击到信息生态受侵蚀等其他类别。他还曾表示,超人类人工智能可能在2027年出现,并称这将是一个世纪乃至有史以来最具影响力的技术变革之一。

经济层面警告:称入门级白领岗位或在1至5年内大幅减少

除文明级风险外,Amodei也谈及更近端的经济冲击。他曾表示,人工智能可能在未来一到五年内消灭一半的入门级白领职位,并指出入门级办公室工作尤其脆弱。相关讨论中,这一情景被形容为潜在的“白领血洗”。

另有报道援引“幕后”相关内容称,随着AI自动化原本作为职业训练入口的任务,大学学历劳动者的失业风险可能上升;若AI工具像电子邮件或电子表格一样普及,劳动力市场可能难以吸纳被替代的工人。Amodei认为,经济动荡可能进一步加剧政治不稳定,而这将与更强大AI系统的到来相互叠加。

不主张暂停研发,呼吁许可与强制测试等治理措施

尽管措辞严厉,Amodei多次强调并非主张暂停AI研究。他在公开表态中主张以技术安全工作、企业自律与政府监管相结合的方式推进治理。

在具体措施上,Amodei提出对最大规模训练运行实行许可制度,并对新系统进行强制“红队测试”。他还呼吁企业在系统中内置更多安全能力,包括可解释性工具以及在模型出现异常时可触发的紧急停止机制。另有对其论文的解读提到,他主张监管机构以类似核材料的方式看待最强大AI系统,对其接触与使用实施更严格控制。


分享:


发表评论

登录后才可评论。 去登录