ChartNet训练AI读懂图表,小型开源模型性能反超商业大模型
MIT与MIT-IBM计算研究实验室推出ChartNet图表数据集,通过合成数据系统性训练视觉-语言模型,让小型开源模型在图表理解任务上超越体量更大的商业模型。
MIT研究人员开发ChartNet,提升AI对图表的理解能力
MIT与MIT-IBM计算研究实验室联合开发了ChartNet数据集,显著提升视觉语言模型对图表的解析和理解能力,助力商业趋势分析和科学图形解读。
清华团队与微软研究人员合作:编码模型仅用合成数据训练,部署于英伟达H20与H200芯片
一支由清华大学牵头、并与微软研究人员合作的团队近日披露,其构建了一套在训练阶段完全不接触真实世界数据的人工智能系统。该系统聚焦于编码任务而非通用对话,并在英伟达H20与H200芯片上完成训练与运行。 仅用合成样本训练的编码系统 据项目描述,该模型在学习阶段使用的训练样本全部由算法生成,未从公共代码库抓取数据。研究团队构建的是一套面向代码生成及相关开发流程的系统,训练语料由人工智能生成的函数、注释与
