OpenAI 大幅升级编码代理「Codex」:迈向“几乎包办所有开发工作”的一体化 AI 搭档
OpenAI 宣布对编码代理 Codex 进行大规模升级,从单一代码生成工具进化为覆盖需求分析、设计、实现、测试与文档编写在内的全流程开发 AI 合作伙伴。
雅各布·安德烈亚斯与布雷特·麦圭尔荣获埃奇顿奖
MIT电气工程与计算机科学系副教授雅各布·安德烈亚斯和化学系副教授布雷特·麦圭尔因其在教学、科研及服务方面的卓越贡献,荣获2026年哈罗德·E·埃奇顿教师成就奖。
斯坦福发布《AI Index 2026》:美中AI模型性能差几乎消失,2026年仅剩2.7%
斯坦福大学人本人工智能研究院(HAI)发布《AI Index 2026》报告:全球顶尖AI模型性能持续提升的同时,美中模型之间的差距已被大幅压缩,到2026年仅剩约2.7%。在多项关键基准上,头部模型已进入“性能横向齐平”阶段,竞争重心正从单纯追求极致性能,转向成本、延迟、可靠性和行业落地能力。
甲骨文扩展 Fusion Applications 专用 AI 代理开发平台 正式推出「Agentic Applications Builder」
日本甲骨文宣布扩展 Oracle AI Agent Studio for Fusion Applications,引入 Agentic Applications Builder、工作流编排、多模态与监控分析等功能,帮助企业以更低门槛、大规模落地成果导向型 AI 代理应用。
Anthropic 发布顶级模型 Claude Opus 4.7:大幅强化高难度软件开发与长时任务能力
Anthropic 推出最新旗舰模型 Claude Opus 4.7,在高难度编码、长时间复杂任务处理、多模态理解以及金融等实务场景中全面超越前代 Opus 4.6,同时在安全性与开发者工具方面继续强化。
将人工智能驱动的蛋白质设计工具普及到全球生物学家手中
OpenProtein.AI由Tristan Bepler博士和前MIT教授Tim Lu博士创立,致力于为蛋白质工程研究者提供开源模型及多种设计工具,助力科学家利用AI加速蛋白质设计与功能预测。
OpenAI 发布防御用途放宽限制模型「GPT-5.4-Cyber」,仅向网络安全从业者开放
OpenAI 扩展其网络安全项目「Trusted Access for Cyber(TAC)」,推出在防御场景下放宽使用限制的专用模型「GPT-5.4-Cyber」,仅向通过严格认证的网络安全专业人士和机构开放。
Google DeepMind 发布机器人视觉语言模型「Gemini Robotics-ER 1.6」,与 Boston Dynamics 协作强化仪表读数等能力
Google DeepMind 推出新一代机器人向视觉语言模型 Gemini Robotics-ER 1.6,在空间推理、多视角理解和任务成功判定等方面大幅升级,并通过 Gemini API 与 Google AI Studio 面向开发者开放预览。
NTT数据集团在京都启用30MW级AI数据中心「京阪奈OSK11数据中心」,并作为IOWN技术验证基地
NTT数据集团在京都府京阪奈地区新建30MW级大型数据中心「京阪奈OSK11数据中心」,面向生成式AI等高负载需求,并作为NTT下一代通信基础设施「IOWN」的技术验证据点。
SpartanX发布全自主AI红队平台,称可持续验证漏洞并覆盖六大攻击面
进攻性安全公司SpartanX宣布推出从零构建的全自主红队平台,核心为由500多个AI进攻代理组成的协调系统,可在六个关键攻击面持续开展利用验证测试,并提供从发现到修复与合规映射的一体化流程。
Strobes Security 发布专有AI协同引擎,称可将渗透测试周期压缩至48小时内
Strobes Security宣布推出面向云端、网页与API等环境的AI协同引擎,通过多代理并行执行与人工监督机制,将传统需两到四周的全范围渗透测试缩短至48小时以内,并提供可追溯审计与工单、合规等系统集成能力。
Adversa AI获2026年人工智能卓越奖“安全与对齐”类别奖项
该公司称,其通过持续对抗性测试平台帮助机构在部署前识别提示注入、模型操控及不安全代理行为等风险。