耳塞内置微型摄像头:与AI对话获取实时场景信息
华盛顿大学团队在普通无线耳塞中集成微型摄像头,用户可直接与AI对话获取眼前场景信息,并在本地完成处理以增强隐私保护。
新AI系统以95%准确率识别视频篡改帧
一项发表在《工程研究杂志》上的研究提出了一种结合传统图像处理与深度学习的三阶段方法,可在UCF101数据集上以约95%的准确率自动检测并定位视频中的插帧篡改。
VisiPrint系统:用两张图片生成逼真3D打印外观预览
麻省理工学院等机构研发的VisiPrint系统,只需一张切片软件截图和一张材料照片,就能生成逼真的3D打印外观预览,帮助减少反复试错和材料浪费。
HEAPGrasp:更高效的机器人复杂物体抓取新方法
HEAPGrasp 利用手眼主动感知与多视角轮廓重建,让机器人在单摄像头条件下也能高效抓取透明、镜面等复杂光学性质物体,并显著缩短测量路径与执行时间。
新方法让墙壁与桌面秒变触控面板
东北大学团队提出一项新技术,仅依靠AR/MR头显自带摄像头与AI模型,就能把墙壁、桌面等日常表面变成可触控的输入区域,无需额外硬件或传感器。
研究称约250件化石可训练图像算法,计算机视觉或缓解脊椎动物古生物学鉴定瓶颈
佛罗里达自然历史博物馆脊椎动物古生物学退休馆长、佛罗里达大学杰出荣誉教授布鲁斯·麦克法登参与的一项研究显示,训练基于图像的人工智能模型用于化石识别,约250件标本即可达到较高准确率并趋于稳定。相关成果发表于《古生物学》。
视频驱动的人工智能让机器人具备“视觉想象力”
研究团队利用海量互联网视频训练世界模型,让机器人在行动前生成未来场景的短视频,从而在陌生环境中完成复杂物理任务。
新AI技术用少量示例视频即可精准识别人类新动作
成均馆大学研究团队提出一种少样本动作识别方法,仅依靠少量示例视频就能高效学习并区分新的人体动作,在动作速度和时长变化下仍保持稳定识别性能,并已入选CVPR 2025口头报告。
新AI模型显著提升单张图像反射去除效果
UNIST团队提出结合互补专家混合与互补交叉注意力的新AI模型,在复杂反射场景下实现更高质量的单张图像反射去除。
利用计算机视觉增强公民科学进行鱼类监测
麻省理工学院海洋资助项目与Woodwell气候研究中心及其他合作伙伴共同开发了一套基于深度学习的鱼类监测系统。
Apple 发布 LiTo:从单张图片生成保留真实反射与光泽的 3D 对象
Apple 推出全新 3D 表达方式 LiTo,只需一张图片,就能生成在不同视角下仍能保持真实反射与光泽效果的 3D 对象。该方法将几何形状与视点依赖的外观统一编码为 3D 潜在表示,并已被 ICLR 2026 收录。
TUM研发AI搜索机器人:结合3D地图与互联网知识寻找遗失物品
慕尼黑工业大学团队开发出一款可自主构建三维环境地图,并利用互联网知识推断物品可能位置的机器人,在寻找丢失物品方面比随机搜索效率提升近30%。
