デジタル庁「源内」の国産LLM公募——行政実務向け評価テストの事前公表が現場運用の鍵を握る

デジタル庁が、ガバメントAI「源内」で使用する国産LLMを2026年11月に公募し、2027年度から有償調達する方針を明らかにした。行政実務向けの評価テストを事前公表するという点が、このニュースの注目点のひとつである。

要点

デジタル庁は、ガバメントAI「源内」に搭載する国産LLMを 2026年11月に公募 する予定
採用モデルは 2027年度から有償調達 に移行する計画
行政実務向けの評価テストを 事前公表 し、応募者が事前に準備できる透明性ある調達プロセスを設計
国産LLMの活用を前提としており、データ主権・セキュリティ面での国内調達ニーズへの対応が背景にある
日本政府の生成AI活用施策の一環として、公共領域での基盤モデル整備が本格化しつつある

著者見解

評価テストを事前公表するというアプローチは、PM目線でも調達透明性の観点からも正しい方向だと思います。「どんな基準で選ばれるのかわからない」という状態は、応募者にとっても、後から実態を検証する立場の人間にとっても困る。判断基準を先に明示することで、LLMベンダー側もターゲットを明確にして開発・評価を進めやすくなります。

一方で、個人的に気になるのは「評価テストの通過」と「現場での実際の運用」がどこまで接続されているかという点です。行政実務の現場は幅広く、自治体ごとに業務慣行・使われ方・サポート体制も異なります。評価テストで高スコアを出せるモデルが、実際の利用シーンで形骸化しないかどうかは、調達後の運用設計次第です。

2027年度の有償調達開始までにベンダーが準備できる期間は限られています。まず評価基準に沿った「動くモデル」を確保しつつ、導入後の利用状況・改善サイクル・担当者の属人化を防ぐ体制を並行して整えていくことが現実的だと思います。行政AIは一度入ると長く使われるインフラになりやすいため、最初の設計に保守性と継続改善の仕組みを組み込めるかが、長期的な成否を分けるポイントになるでしょう。

出典: デジタル庁、ガバメントAI「源内」で使う国産LLMを11月公募へ　2027年度に有償調達、行政実務向け評価テストを事前公表

#生成AI活用 #AI #国産LLM #デジタル庁 #行政DX