清华团队与微软研究人员合作:编码模型仅用合成数据训练,部署于英伟达H20与H200芯片
一支由清华大学牵头、并与微软研究人员合作的团队近日披露,其构建了一套在训练阶段完全不接触真实世界数据的人工智能系统。该系统聚焦于编码任务而非通用对话,并在英伟达H20与H200芯片上完成训练与运行。 仅用合成样本训练的编码系统 据项目描述,该模型在学习阶段使用的训练样本全部由算法生成,未从公共代码库抓取数据。研究团队构建的是一套面向代码生成及相关开发流程的系统,训练语料由人工智能生成的函数、注释与
一支由清华大学牵头、并与微软研究人员合作的团队近日披露,其构建了一套在训练阶段完全不接触真实世界数据的人工智能系统。该系统聚焦于编码任务而非通用对话,并在英伟达H20与H200芯片上完成训练与运行。 仅用合成样本训练的编码系统 据项目描述,该模型在学习阶段使用的训练样本全部由算法生成,未从公共代码库抓取数据。研究团队构建的是一套面向代码生成及相关开发流程的系统,训练语料由人工智能生成的函数、注释与