OpenAI升级自动化编码工具Codex 强化桌面与浏览器控制能力

richlovec 1500_400 (1)
 

OpenAI近日宣布,对其自动化编码工具 Codex 进行全面升级,新增多项面向企业和开发者的功能,进一步强化其在桌面控制和工作流集成方面的能力。

桌面后台运行与多代理并行

根据公司公布的信息,此次更新中最受关注的变化之一,是 Codex 现在可以在计算机后台运行,直接控制桌面应用程序。该工具能够在 Mac 上打开任意应用,并通过鼠标光标执行点击和输入操作。

OpenAI在博客中表示,Codex 可以部署多个代理,这些代理“在 Mac 上并行工作,且不会干扰用户在其他应用中的操作”。在这种模式下,用户可以继续使用电脑处理日常任务,而 Codex 代理则在后台独立执行分配的工作。

公司将这一能力定位为“编码助手”的延伸:当用户专注于核心项目时,代理可负责辅助性任务。OpenAI列举的潜在用例包括:迭代前端界面修改、测试应用程序,或在缺乏API支持的应用中完成相关操作。

内置浏览器与网页应用控制

除桌面控制外,Codex 还新增了内置浏览器功能。用户可以向代理下达指令,由代理在特定网页应用上执行相应操作。OpenAI称,这一功能对前端开发和游戏开发场景尤为适用。

公司同时表示,未来计划扩展这一能力,使 Codex 能够“全面控制浏览器,超越本地主机上的网页应用”,但未披露具体时间表。

记忆功能与图像生成

此次更新还引入了一个名为“记忆”的预览功能。OpenAI介绍称,该功能允许 Codex 回顾此前的工作会话,并据此生成与特定用户工作方式相关的重要上下文信息,用于后续任务执行。

在内容生成方面,Codex 新增了图像生成能力。OpenAI表示,该功能可用于创建产品概念图、演示文稿视觉素材、模型图、占位图像以及其他与企业业务相关的视觉内容。

插件集成与轻量文书处理

为扩展 Codex 的执行范围,OpenAI此次集成了111个插件,覆盖 CodeRabbit、GitLab Issues 等多种应用。公司称,通过这些插件,Codex 可以处理涉及相关工具的任务。

OpenAI的表述是,这些插件使 Codex 能够承担一定的轻量文书工作,从而帮助用户组织日常事务。例如,用户可以授权 Codex 访问其 Slack 频道和 Google 日历,并要求其为某一天生成待办事项清单。OpenAI表示,借助新插件体系,这类场景现已可以实现。

与Anthropic竞争加剧

在AI编码工具领域,OpenAI与Anthropic的竞争近期愈发受到关注。此前,TechCrunch报道称,Anthropic的 Claude Code 已成为许多企业的首选工具。

关注该领域的人士注意到,OpenAI此次为 Codex 新增的部分功能,与Anthropic此前为 Claude Code 推出的能力存在相似之处。上个月,Anthropic宣布,Claude 和 Cowork 可以在用户离开键盘时远程控制其 Mac 和桌面。

OpenAI此次更新被视为在企业级编码助手市场上的一次重要动作,显示出公司希望将 Codex 打造成不仅具备代码生成能力、还可深度嵌入各类企业工作流程的多功能工具。

定价调整与企业业务重心

在产品功能更新的同时,OpenAI还宣布,为 ChatGPT 企业版和商业客户提供 Codex 的按需付费定价选项。公司表示,此举旨在为企业在采购该编码工具服务时提供更大灵活性。

曾被视为行业内无可争议的领先者,OpenAI近几个月来与Anthropic的竞争逐步聚焦于企业能力建设,并在一定程度上淡出诸如社交视频应用 Sora 2 等面向消费者的工具。

与此同时,OpenAI近期也面临多起争议,其中包括因 ChatGPT 对部分用户心理健康的潜在影响而引发的诉讼。公司未在此次 Codex 更新公告中就相关争议作出回应。


分享:


发表评论

登录后才可评论。 去登录