中国 Moonshot AI 发布开源模型「Kimi K2.6」:强化长时编码与 Agent 能力,原生多模态支持视觉信息
中国 AI 企业 Moonshot AI 发布最新开源模型「Kimi K2.6」,在长时间编码、Agent 自主执行以及多模态理解等方面全面升级,并通过官方博客与 API 文档向开发者开放。
Google 发布多模态嵌入模型「Gemini Embedding 2」,统一文本、图像、视频与音频向量空间以强化搜索与推荐
Google 推出新一代多模态嵌入模型 Gemini Embedding 2,通过在同一向量空间中表示文本、图像、视频、音频等多种数据形式,提升搜索、推荐与 RAG 等 AI 应用的精度,并已通过 Gemini API 与 Vertex AI 以公测形式开放。
字节跳动正式发布视频生成模型「Seedance 2.0」,多模态输入与参考控制全面升级
字节跳动在其生成式 AI 平台「即梦(Jimeng)」上正式上线视频生成模型 Seedance 2.0,支持图像、视频、音频与文本四种模态输入,并强化参考素材与编辑控制能力,目前正面向会员与非会员分阶段开放。
Clipto.AI完成新一轮融资 估值超2.5亿美元
Clipto.AI表示,新资金将用于加速设备端多模态AI技术研发并支持全球扩张。自2025年7月以来,公司已连续完成Pre-A、Pre-A+及Pre-A++多轮融资。