用一句话走进虚拟世界:Google 在美推出世界生成 AI 原型「Project Genie」,搭载 DeepMind 世界模型 Genie 3
Google 发布实验性原型 Project Genie,只需输入文字或图片,就能实时生成可行走、可交互的虚拟世界,目前仅向美国的 Google AI Ultra 用户开放体验。
Firefox将生成式AI设为可选功能,Mozilla推出全局开关供用户一键关闭
在各大科技公司加速把生成式人工智能嵌入浏览器与网络服务之际,Mozilla选择在Firefox中提供更明确的用户控制选项。该公司表示,将通过一个“全局总开关”让生成式AI功能成为可选项,用户可在设置中一次性关闭浏览器内所有相关能力。早期反馈显示,不少用户对这种“可拒绝”的设计表示欢迎。 Mozilla此举也被视为对过去数月争议的回应。此前,围绕Firefox在AI功能上的推进力度,以及长期用户是否
Genspark正式进军日本市场,发布支持语音操作与自律工作流的「AI Workspace 2.0」
美国AI初创公司Genspark宣布加速布局日本企业市场,并发布面向业务场景的「AI Workspace 2.0」,集成语音输入、可自定义工作流以及AI邮件收件箱等功能,支持在单一环境内完成信息收集、处理与成果输出。
SpaceX向FCC提交“太空数据中心”计划:打造面向AI的轨道级计算基础设施,卫星规模最高或达100万颗
SpaceX向美国FCC提交新一代卫星星座计划,拟在近地轨道构建依托太阳能供电的“太空数据中心”,为AI提供大规模算力与数据处理能力,远期卫星数量最高可扩展至100万颗。
DeepL发布语音API,支持实时语音转录与多语种翻译
DeepL宣布语音API正式上线,开发者可将实时语音转录与翻译能力集成至应用中。该接口支持音频流式传输,返回源语言转录并可同时翻译至最多五种目标语言,主要面向呼叫中心及BPO等以语音沟通为核心的场景。
Waud Capital Partners任命Prithvi Raj为首席人工智能与数据官
Waud Capital Partners宣布新设首席人工智能与数据官一职,由Prithvi Raj出任,负责推动人工智能与先进数据能力在公司及其投资组合中的开发与落地。
Google为Gemini 3 Flash加入高精度图像理解功能「Agentic Vision」,通过Python再检视图像将质量提升5〜10%
Google在Gemini 3 Flash中新增图像理解功能「Agentic Vision」,通过“思考→行动→观察”的循环与Python代码执行,对图像进行多轮放大、裁剪和再分析,在多项视觉基准测试中将性能提升约5〜10%。
Kong 在 Kong Konnect 目录中推出 MCP 注册表
Kong 表示,新推出的 Kong MCP 注册表将作为 Kong Konnect 目录的新企业级目录,用于注册、发现和管理 MCP 服务器及 AI 原生工具,并与 MCP 生态及 AAIF 标准对接。
JAXA推出 JAXA Earth API v0.1.5:可通过生成式 AI 直接调用地球观测数据
日本宇宙航空研究开发机构(JAXA)发布 JAXA Earth API for Python v0.1.5,并提供面向 Claude Desktop 的 MCP 示例代码,使生成式 AI 能以对话方式直接调用地球观测数据。
Waymo自动驾驶汽车在学校附近与儿童发生接触事故,美国监管机构已展开调查
Waymo在加州圣莫尼卡运营的一辆自动驾驶汽车在学校附近与一名儿童行人发生接触。车辆在约27km/h减速至10km/h以下后仍未能完全停车。美国NHTSA已启动预备调查,Waymo表示将全面配合并持续公开相关信息。
企鹅解决方案宣布首席执行官交接
企鹅解决方案称,现任总裁兼首席执行官马克·亚当斯将退休并辞任董事职务;董事会任命卡什·谢赫自2026年2月2日起出任总裁兼首席执行官及董事。亚当斯将以顾问身份留任九个月以协助过渡。
SMART启动可穿戴成像技术,革新老年护理研究团队
WITEC致力于开发首个可穿戴超声成像系统,实现慢性病实时监测,助力早期发现与及时干预。