研究发现多模态AI会为“看不见”的图像编造细节
斯坦福团队通过全新测试发现,多款前沿多模态AI在没有任何图像输入的情况下,仍会自信地虚构出极其具体的“视觉描述”,暴露出当前视觉-语言评估体系的严重缺陷。
Luma AI 发布次世代图像生成模型「Uni-1」:统一理解与生成,推理表现超越 Nano Banana 2 等竞品
Luma AI 推出新一代图像生成模型 Uni-1,将指令理解、推理与图像生成统一到同一模型中。在 RISEBench 推理基准测试中,Uni-1 的综合得分超过 Nano Banana 2 和 GPT Image 1.5,并在物体检测等视觉理解任务上也展现出优于传统“理解专用模型”的性能。
新方法让人工智能像人类般推理,无需额外训练数据
加州大学河滨分校团队提出“测试时匹配”(TTM)方法,在不引入新训练数据的前提下,大幅提升多模态模型的组合推理能力,并在部分基准上超越更大规模模型。