多模态模型

科学 2026-04-15

斯坦福团队通过全新测试发现，多款前沿多模态AI在没有任何图像输入的情况下，仍会自信地虚构出极其具体的“视觉描述”，暴露出当前视觉-语言评估体系的严重缺陷。

AI 2026-03-16

Luma AI 推出新一代图像生成模型 Uni-1，将指令理解、推理与图像生成统一到同一模型中。在 RISEBench 推理基准测试中，Uni-1 的综合得分超过 Nano Banana 2 和 GPT Image 1.5，并在物体检测等视觉理解任务上也展现出优于传统“理解专用模型”的性能。

科学 2026-01-30

加州大学河滨分校团队提出“测试时匹配”（TTM）方法，在不引入新训练数据的前提下，大幅提升多模态模型的组合推理能力，并在部分基准上超越更大规模模型。