Google 发布多模态嵌入模型「Gemini Embedding 2」,统一文本、图像、视频与音频向量空间以强化搜索与推荐
Google 推出新一代多模态嵌入模型 Gemini Embedding 2,通过在同一向量空间中表示文本、图像、视频、音频等多种数据形式,提升搜索、推荐与 RAG 等 AI 应用的精度,并已通过 Gemini API 与 Vertex AI 以公测形式开放。
字节跳动正式发布视频生成模型「Seedance 2.0」,多模态输入与参考控制全面升级
字节跳动在其生成式 AI 平台「即梦(Jimeng)」上正式上线视频生成模型 Seedance 2.0,支持图像、视频、音频与文本四种模态输入,并强化参考素材与编辑控制能力,目前正面向会员与非会员分阶段开放。
Clipto.AI完成新一轮融资 估值超2.5亿美元
Clipto.AI表示,新资金将用于加速设备端多模态AI技术研发并支持全球扩张。自2025年7月以来,公司已连续完成Pre-A、Pre-A+及Pre-A++多轮融资。
