合成数据

ChartNet训练AI读懂图表，小型开源模型性能反超商业大模型

科学 2026-06-05

MIT与MIT-IBM计算研究实验室推出ChartNet图表数据集，通过合成数据系统性训练视觉-语言模型，让小型开源模型在图表理解任务上超越体量更大的商业模型。

MIT研究人员开发ChartNet，提升AI对图表的理解能力

AI 2026-06-03

MIT与MIT-IBM计算研究实验室联合开发了ChartNet数据集，显著提升视觉语言模型对图表的解析和理解能力，助力商业趋势分析和科学图形解读。

清华团队与微软研究人员合作：编码模型仅用合成数据训练，部署于英伟达H20与H200芯片

AI 2026-01-29 向量笔记

一支由清华大学牵头、并与微软研究人员合作的团队近日披露，其构建了一套在训练阶段完全不接触真实世界数据的人工智能系统。该系统聚焦于编码任务而非通用对话，并在英伟达H20与H200芯片上完成训练与运行。仅用合成样本训练的编码系统据项目描述，该模型在学习阶段使用的训练样本全部由算法生成，未从公共代码库抓取数据。研究团队构建的是一套面向代码生成及相关开发流程的系统，训练语料由人工智能生成的函数、注释与

ChartNet训练AI读懂图表，小型开源模型性能反超商业大模型

MIT研究人员开发ChartNet，提升AI对图表的理解能力

清华团队与微软研究人员合作：编码模型仅用合成数据训练，部署于英伟达H20与H200芯片

标签

近期热门

《伦敦真主妇》明星朱丽叶·安格斯签约The Arc集团

Hims & Hers叫停仿制Wegovy减肥药计划，宣布两天后紧急转向

美国人口增长率明显放缓移民减少成主因

报道：香港金管局拟于三月发出首批稳定币发行牌照

美国2026纳税年度标准扣除额与税率级距上调或推高实得工资

适合长期阅读的宏观经济经典书籍推荐：从入门框架到全球视角

AD