研究称约250件化石可训练图像算法,计算机视觉或缓解脊椎动物古生物学鉴定瓶颈
佛罗里达自然历史博物馆脊椎动物古生物学退休馆长、佛罗里达大学杰出荣誉教授布鲁斯·麦克法登参与的一项研究显示,训练基于图像的人工智能模型用于化石识别,约250件标本即可达到较高准确率并趋于稳定。相关成果发表于《古生物学》。
视频驱动的人工智能让机器人具备“视觉想象力”
研究团队利用海量互联网视频训练世界模型,让机器人在行动前生成未来场景的短视频,从而在陌生环境中完成复杂物理任务。
新AI技术用少量示例视频即可精准识别人类新动作
成均馆大学研究团队提出一种少样本动作识别方法,仅依靠少量示例视频就能高效学习并区分新的人体动作,在动作速度和时长变化下仍保持稳定识别性能,并已入选CVPR 2025口头报告。
新AI模型显著提升单张图像反射去除效果
UNIST团队提出结合互补专家混合与互补交叉注意力的新AI模型,在复杂反射场景下实现更高质量的单张图像反射去除。
利用计算机视觉增强公民科学进行鱼类监测
麻省理工学院海洋资助项目与Woodwell气候研究中心及其他合作伙伴共同开发了一套基于深度学习的鱼类监测系统。
Apple 发布 LiTo:从单张图片生成保留真实反射与光泽的 3D 对象
Apple 推出全新 3D 表达方式 LiTo,只需一张图片,就能生成在不同视角下仍能保持真实反射与光泽效果的 3D 对象。该方法将几何形状与视点依赖的外观统一编码为 3D 潜在表示,并已被 ICLR 2026 收录。
TUM研发AI搜索机器人:结合3D地图与互联网知识寻找遗失物品
慕尼黑工业大学团队开发出一款可自主构建三维环境地图,并利用互联网知识推断物品可能位置的机器人,在寻找丢失物品方面比随机搜索效率提升近30%。
借鉴犬类取物能力:机器人以89%成功率锁定目标物体
布朗大学团队提出一套融合语言与手势的新方法,让机器人在复杂环境中以约89%的成功率找到用户真正想要的物体,表现优于现有物体检索技术。
提升人工智能模型解释预测能力的新方法
一种新方法有望帮助用户在医疗诊断和自动驾驶等安全关键领域判断是否信任模型的预测结果。
安东尼奥·托拉尔巴及三位麻省理工校友荣膺2025年ACM会士称号
托拉尔巴的研究领域涵盖计算机视觉、机器学习及人类视觉感知。
Plainsight发布可扩展企业视觉AI平台,主打端到端VizOps
Plainsight宣布其平台正式发布,定位为端到端VizOps解决方案,覆盖从数据收集、模型训练到部署与监控的计算机视觉全生命周期管理。