日本数字厅将于11月公开招募用于“源内”的国产大模型，2027年度起有偿采购并采用行政实务评测

AI 2026-06-03 日本数字厅, 生成式AI, 大语言模型, 政府云, 源内 14 次浏览

デジタル庁は2026年5月29日、政府の生成AI基盤「ガバメントAI『源内』」で使用する国産基盤モデルについて、2027年度向け公募を同年11月に実施予定だと発表{target="_blank"}した。公募開始に先立ち、応募条件や評価テストの実施方法などを事前公表した。

数字厅表示，将在2027年度以政府采购的形式，有偿引入适用于“源内”的高性能国产基础模型。2026年度在“源内”环境中进行评估与验证的5家企业模型，其测试结果也将作为下一年度采购时的重要参考。

“源内”是面向日本政府职员的生成式AI共通基盘。数字厅自2026年5月起启动大规模实证试验，截至5月29日，约有10万名政府职员可使用该平台。今后将逐步扩大覆盖的府省厅与职员人数，目标是为全部府省厅约18万名职员提供可用环境。

以300道题评估是否适用于行政实务

在面向2027年度的公开招募中，数字厅将实施一套评估测试，用于确认基础模型能否在行政实务中被安全且高效地利用。数字厅指出，与主要衡量知识量和逻辑推理能力的标准化学术基准（如 MMLU）不同，政府行政工作所需的能力在性质上存在明显差异。

本次测试将模拟政府职员在日常业务中使用基础模型的具体场景，重点考察模型在指令理解、文书撰写、信息的摘要与整理、调查与分析、依据说明、方案与计划制定以及风险检讨等方面的表现。同时，还会评估模型在法律法规、制度设计、政策运作、社会课题等行政相关领域的知识与理解程度。

测试共设置300道题目，用于覆盖35个能力领域。题目素材将围绕8大类别展开：一般常识、社会与时事问题、日语理解、模型安全性、法律与制度、行政课题、日本的价值观与历史观，以及国际关系与外交。所有问题均以文本形式呈现，不涉及图像、音频或视频。测试总时长上限为15小时，每题的处理时间上限为3分钟。

招募对象为国内开发的自然语言模型

本次公开招募的对象为：在日本国内开发并拥有基础模型、且有意愿在2027年度内向“源内”提供该模型的法人企业。目标模型需能够处理自然语言，仅支持图像、音频、视频、代码等其他模态而不支持自然语言的基础模型不在招募范围之内。

为使政府职员能够在系统中处理“机密性2”级别的信息，入选模型必须具备充分的安全性与安全防护（Security & Safety）能力。同时，基础模型需能够在“政府云”（ガバメントクラウド）环境中稳定运行。每家企业最多只能以一款模型报名。

2026年度评估验证已与5家公司签约

数字厅曾在2025年12月至2026年1月期间，就在“源内”中试用的国产基础模型进行公开招募。到2026年3月为止，从15件申请中选出了7件，但随后有2家公司提出辞退，最终在2026年度与数字厅签订评估与验证合同的企业为5家。

这5家公司分别是：NTTデータ（NTT Data）、ソフトバンク（软银）、日本電気（NEC）、富士通（Fujitsu）以及 Preferred Networks。各公司提供的模型为：NTTデータ的「tsuzumi 2」、ソフトバンク的「Sarashina3 mini」、日本電気的「cotomi v3」、富士通的「Takane 32B」、Preferred Networks 的「PLaMo 2.0 Prime」。

面向2027年度的公开招募预计将于2026年11月启动。数字厅计划在2027年1月完成审查结果通知、实施评估测试并发布采购公告；2027年2月进行评估结果通知与投标；2027年3月确定中标者，并推进在政府云上的部署准备工作。按照时间表，2027年4月起将在“源内”上正式开始使用中标的基础模型。

发表评论

登录后才可评论。去登录