デジタル庁は2026年5月29日、政府の生成AI基盤「ガバメントAI『源内』」で使用する国産基盤モデルについて、2027年度向け公募を同年11月に実施予定だと発表{target="_blank"}した。公募開始に先立ち、応募条件や評価テストの実施方法などを事前公表した。
数字厅表示,将在2027年度以政府采购的形式,有偿引入适用于“源内”的高性能国产基础模型。2026年度在“源内”环境中进行评估与验证的5家企业模型,其测试结果也将作为下一年度采购时的重要参考。
“源内”是面向日本政府职员的生成式AI共通基盘。数字厅自2026年5月起启动大规模实证试验,截至5月29日,约有10万名政府职员可使用该平台。今后将逐步扩大覆盖的府省厅与职员人数,目标是为全部府省厅约18万名职员提供可用环境。
以300道题评估是否适用于行政实务
在面向2027年度的公开招募中,数字厅将实施一套评估测试,用于确认基础模型能否在行政实务中被安全且高效地利用。数字厅指出,与主要衡量知识量和逻辑推理能力的标准化学术基准(如 MMLU)不同,政府行政工作所需的能力在性质上存在明显差异。
本次测试将模拟政府职员在日常业务中使用基础模型的具体场景,重点考察模型在指令理解、文书撰写、信息的摘要与整理、调查与分析、依据说明、方案与计划制定以及风险检讨等方面的表现。同时,还会评估模型在法律法规、制度设计、政策运作、社会课题等行政相关领域的知识与理解程度。
测试共设置300道题目,用于覆盖35个能力领域。题目素材将围绕8大类别展开:一般常识、社会与时事问题、日语理解、模型安全性、法律与制度、行政课题、日本的价值观与历史观,以及国际关系与外交。所有问题均以文本形式呈现,不涉及图像、音频或视频。测试总时长上限为15小时,每题的处理时间上限为3分钟。

招募对象为国内开发的自然语言模型
本次公开招募的对象为:在日本国内开发并拥有基础模型、且有意愿在2027年度内向“源内”提供该模型的法人企业。目标模型需能够处理自然语言,仅支持图像、音频、视频、代码等其他模态而不支持自然语言的基础模型不在招募范围之内。
为使政府职员能够在系统中处理“机密性2”级别的信息,入选模型必须具备充分的安全性与安全防护(Security & Safety)能力。同时,基础模型需能够在“政府云”(ガバメントクラウド)环境中稳定运行。每家企业最多只能以一款模型报名。
2026年度评估验证已与5家公司签约
数字厅曾在2025年12月至2026年1月期间,就在“源内”中试用的国产基础模型进行公开招募。到2026年3月为止,从15件申请中选出了7件,但随后有2家公司提出辞退,最终在2026年度与数字厅签订评估与验证合同的企业为5家。
这5家公司分别是:NTTデータ(NTT Data)、ソフトバンク(软银)、日本電気(NEC)、富士通(Fujitsu)以及 Preferred Networks。各公司提供的模型为:NTTデータ的「tsuzumi 2」、ソフトバンク的「Sarashina3 mini」、日本電気的「cotomi v3」、富士通的「Takane 32B」、Preferred Networks 的「PLaMo 2.0 Prime」。
面向2027年度的公开招募预计将于2026年11月启动。数字厅计划在2027年1月完成审查结果通知、实施评估测试并发布采购公告;2027年2月进行评估结果通知与投标;2027年3月确定中标者,并推进在政府云上的部署准备工作。按照时间表,2027年4月起将在“源内”上正式开始使用中标的基础模型。
