用视觉感知声音——马里亚诺·萨尔塞多的音乐与人工智能探索
马里亚诺·萨尔塞多,麻省理工学院音乐技术与计算研究生项目的硕士生,正在设计一种人工智能系统,将音乐和其他声音以视觉形式表现出来。
Anthropic 发布 Claude 电脑操作功能「computer use」,可用手机远程指挥 PC 办公
Anthropic 推出让 Claude 直接操作用户电脑的新功能「computer use」,支持在 macOS 桌面端执行点击、输入、文件与浏览器操作,并可通过手机下达任务。该功能目前以 research preview 形式向 Claude Pro / Max 用户开放,内置多重安全与权限控制机制。
Sakana AI 发布面向各国本地化的事后学习技术 推出日本版试验模型「Namazu」及聊天服务「Sakana Chat」
Sakana AI 宣布开发出可将全球顶尖开放权重基座模型适配为各国本地化版本的事后学习技术,并基于该技术推出日本规格试验模型系列「Namazu(α版)」及搭载该模型的聊天服务「Sakana Chat」。
腾讯携手 OpenClaw 推出「微信 ClawBot」:在拥有逾 13 亿用户的 WeChat 中操控 AI 智能体
腾讯在 WeChat(微信)中上线新工具「微信 ClawBot」,用户可直接通过聊天界面调用 OpenClaw AI 智能体执行各类数字化任务,标志着中国互联网巨头在 AI 智能体赛道的竞争进一步升级。
利用计算机视觉增强公民科学进行鱼类监测
麻省理工学院海洋资助项目与Woodwell气候研究中心及其他合作伙伴共同开发了一套基于深度学习的鱼类监测系统。
AI系统学会智能调度仓库机器人交通,提升作业效率
该新方法能够动态判断机器人优先通行权,避免拥堵,显著提升仓库作业吞吐量。
OpenAI Japan 发布未成年人安全“蓝图”:强调年龄识别、家长管理与身心健康
OpenAI Japan 公布《未成年安全性蓝图》,提出在AI服务设计阶段就内嵌未成年人保护机制,通过年龄推定、安全策略与家长管理三层结构,并将“安全优先、重视身心健康”作为面向未成年人的AI设计前提。
法国 Mistral AI 发布企业级专用模型平台「Forge」,用内部数据打造前沿 AI
Mistral AI 推出新系统「Forge」,支持企业基于自身内部数据与业务知识构建前沿级专用大模型,实现与企业流程、制度和代码深度贴合的 AI 能力。
Ping Identity发布“Identity for AI”全面可用版本,提出自治AI运行时身份标准
Ping Identity宣布“Identity for AI”全面可用,面向企业AI代理在生产环境中的运行时行为控制,提供身份确立、持续授权执行与活动检测能力。
中国 MiniMax 开源发布「OpenRoom」:让 AI 角色在虚拟桌面中操作与互动
中国上海 AI 企业 MiniMax 开源发布虚拟桌面环境「OpenRoom」,AI 角色可在 GUI 环境中执行各类操作,并支持通过 UGC 工具扩展应用与故事线。
Vectra AI升级平台 推出面向AI企业的暴露管理功能以提升可观测性
Vectra AI宣布对其平台进行重大升级,新增暴露管理能力,旨在为混合多云环境提供持续资产可视化、主动暴露检测与环境可观测性,帮助组织识别并降低可被利用的安全风险。
OpenAI终止面向大众的 Sora 视频生成应用与 API,将研究重心转向“世界模拟”
OpenAI 宣布停止面向普通用户提供的视频生成 AI「Sora」应用及相关 API 服务,但并未放弃视频生成技术本身,而是把研究重点转向有望推动机器人等领域发展的“世界模拟(World Simulation)”。