日本数字厅于2026年3月6日宣布,在政府面向生成式AI的共用环境「源内(げんない)」中,将试用7款国产大规模语言模型(LLM),并已完成首批选定。此次从共计15件应募方案中,经过书面审查与性能评估测试后,最终选出7个模型。数字厅计划在2026年度面向全府省厅39个机构、约18万名职员开展大规模实证,在实际行政业务场景中检验这些模型的实用性与适配度。
本次选定的7款国产LLM如下:
- NTT数据:「tsuzumi 2」
- Customer Cloud(カスタマークラウド):「CC Gov-LLM」
- KDDI・ELYZA联合开发:「Llama-3.1-ELYZA-JP-70B」
- 软银(ソフトバンク):「Sarashina2 mini」
- NEC:「cotomi v3」
- 富士通:「Takane 32B」
- Preferred Networks:「PLaMo 2.0 Prime」
数字厅表示,将从完成规定合同签订手续的模型开始,依次在「源内」环境中展开试用与评估。
在政府内部验证:能否真正用于行政实务
数字厅将这些国产LLM定位为“试验性导入”,目的在于通过实际使用来评估其在行政现场中的可用性与潜在课题。试用形式不仅包括以对话型AI服务方式提供,也设想将其嵌入面向特定行政业务的专用AI应用中。
在选定条件方面,除“必须为国内开发的模型”这一前提外,还重点考察了以下要素:
- 是否具备支撑行政实务所需的性能
- 与海外主要LLM相比的竞争力
- 在安全性与风险控制方面的具体举措
- 训练数据是否符合法令与相关规制要求
- 能否在政府共用的「Government Cloud(ガバメントクラウド)」上安全运行
此前,数字厅已为本厅职员构建并运营了生成式AI利用环境「源内」,实现了“全员可用”的内部试行。本次国产LLM的试用,则是在将「源内」扩展为覆盖整个政府机关的共用平台这一整体规划下推进的。
根据公开资料,数字厅计划在2026年度面向全府省厅39个机构、约18万名职员实施大规模实证,在真实的行政业务场景中试用本次选定的国产LLM,以此判断其实际可用性以及与行政实务的匹配程度。


政策背景:政府要“率先使用AI”
此次举措的背后,是“政府要主动带头利用AI”的政策方针。数字厅指出,在少子老龄化加剧、公共部门人力资源持续紧缺的背景下,要维持和提升公共服务质量,积极引入并运用AI已是不可回避的选择。
同时,为了带动民间对AI的投资与应用扩展,政府自身必须率先使用AI,通过实践提升公务员对AI的理解与运用能力。相关资料中也明确提出,将通过以下方式推动这一方针落地:
- 整备并提供政府共通的AI基础设施
- 汇聚与共享各机构的AI应用知识与经验
- 培育与强化国产AI产业与技术能力
- 为其他府省厅提供技术与运用方面的支援

根据数字厅的说明,此次举措也承接了第3次人工智能战略本部上的相关指示,以及2025年12月23日内阁会议决定的《AI基本计划》。在这些政策框架下,政府正加快整备环境,使AI成为公务员日常工作中“习以为常的工具”。本次大规模实证,正是将这一方针具体化、制度化的重要步骤。
瞄准2027年度之后的政府采购与长期应用
在时间安排上,数字厅计划自2026年3月起推进合同签订与技术调试工作,并于同年5月左右启动面向整个政府机关的「源内」大规模实证。国产LLM的正式试用预计在同年8月前后开始。
随后,数字厅计划在2027年1月左右对部分评估与验证结果进行公开。在此基础上,自2027年4月起,将对在实证中表现优异、已被证明适用于行政实务的模型,以“Government AI(ガバメントAI)”的形式纳入政府采购(有偿导入)范围。
因此,本次发布不仅意味着国产LLM在政府系统中的试验性导入启动,也被视为通过政府采购创造稳定需求、支撑国产AI产业发展的“前哨战”。
数字厅表示,希望通过行政现场的实际反馈,持续改进国产AI的性能与易用性;同时,借助政府的长期稳定需求,推动国产AI的培育与强化,并在此过程中提升日本在AI领域的技术自立性与主导权。
