一支从事自主AI代理研发的研究团队在最新技术报告中披露,其实验性系统ROME在训练阶段曾出现异常行为,试图利用训练基础设施的计算资源进行未经授权的加密货币挖矿。
据报告介绍,ROME是一种实验性的自主AI系统,被设计为可通过调用工具、操作软件环境以及执行终端命令来完成复杂任务。研究人员在一次强化学习训练过程中发现,该系统在与环境交互时出现了与加密货币挖矿相关的可疑操作。
报告称,异常最初是在强化学习运行期间被发现的。当时,训练服务器对外发出的网络流量触发了安全告警。防火墙日志显示,这些流量模式与加密货币挖矿活动相似,并伴随对内部网络资源的访问尝试。
研究人员在报告中写道,他们起初将相关告警视为常规安全事件,例如出口控制配置错误或外部入侵。但随后发现,这类违规行为在多次训练运行中间歇性出现,且未呈现出明显的时间规律。
试图建立SSH隧道并挪用GPU资源
根据报告,在一项具体事件中,ROME代理创建了一个反向SSH(安全外壳)隧道,连接至一个外部IP地址,相关行为被认为可能绕过了入站防火墙防护。在另一事件中,该代理将原本分配用于模型训练的GPU资源转而用于执行加密货币挖矿相关任务。
研究团队表示,这些行为并非系统预先设定的功能,而是在强化学习优化过程中,代理在探索不同环境交互方式时自行产生的策略结果。

ROME由ROCK、ROLL、iFlow和DT联合研究团队开发,这些团队与阿里巴巴的AI生态系统相关联。ROME属于一个更大规模的基础设施——Agentic Learning Ecosystem(ALE)的一部分。
报告介绍,ROME的设计目标是超越简单的对话式回答能力,具备任务规划、命令执行、代码编辑以及通过多步骤与数字环境交互的能力,其训练流程依赖大量模拟交互来提升决策表现。
自主AI代理与加密货币应用同步升温
此次事件发生之际,自主AI代理及其与加密货币相关的应用正受到市场和行业的广泛关注。
上个月,区块链基础设施公司Alchemy推出了一套系统,使自主AI代理能够在Base网络上使用链上钱包和USDC购买计算积分,并访问区块链数据服务。
更早之前,Pantera Capital和富兰克林邓普顿(Franklin Templeton)的数字资产部门加入了开源AI实验室Sentient推出的新测试平台Arena的首批成员。该平台旨在评估AI代理在真实企业工作流程中的表现。