デジタル庁「源内」の国産LLM公募——行政実務向け評価テストの事前公表が現場運用の鍵を握る

AI開発・生成AI活用公開日:2026年6月2日
高畑 拓海
高畑 拓海

株式会社シンシア 開発支援事業部 部長

デジタル庁が、ガバメントAI「源内」で使用する国産LLMを2026年11月に公募し、2027年度から有償調達する方針を明らかにした。行政実務向けの評価テストを事前公表するという点が、このニュースの注目点のひとつである。


要点

  • デジタル庁は、ガバメントAI「源内」に搭載する国産LLMを 2026年11月に公募 する予定
  • 採用モデルは 2027年度から有償調達 に移行する計画
  • 行政実務向けの評価テストを 事前公表 し、応募者が事前に準備できる透明性ある調達プロセスを設計
  • 国産LLMの活用を前提としており、データ主権・セキュリティ面での国内調達ニーズへの対応が背景にある
  • 日本政府の生成AI活用施策の一環として、公共領域での基盤モデル整備が本格化しつつある

著者見解

評価テストを事前公表するというアプローチは、PM目線でも調達透明性の観点からも正しい方向だと思います。「どんな基準で選ばれるのかわからない」という状態は、応募者にとっても、後から実態を検証する立場の人間にとっても困る。判断基準を先に明示することで、LLMベンダー側もターゲットを明確にして開発・評価を進めやすくなります。

一方で、個人的に気になるのは「評価テストの通過」と「現場での実際の運用」がどこまで接続されているかという点です。行政実務の現場は幅広く、自治体ごとに業務慣行・使われ方・サポート体制も異なります。評価テストで高スコアを出せるモデルが、実際の利用シーンで形骸化しないかどうかは、調達後の運用設計次第です。

2027年度の有償調達開始までにベンダーが準備できる期間は限られています。まず評価基準に沿った「動くモデル」を確保しつつ、導入後の利用状況・改善サイクル・担当者の属人化を防ぐ体制を並行して整えていくことが現実的だと思います。行政AIは一度入ると長く使われるインフラになりやすいため、最初の設計に保守性と継続改善の仕組みを組み込めるかが、長期的な成否を分けるポイントになるでしょう。


出典: デジタル庁、ガバメントAI「源内」で使う国産LLMを11月公募へ 2027年度に有償調達、行政実務向け評価テストを事前公表

著者について

高畑 拓海のプロフィール写真
高畑 拓海
株式会社シンシア 開発支援事業部 部長

営業出身でエンジニアにキャリアチェンジ。要件定義・実装・PM・チームマネジメント・採用までを横断する。TypeScript / React / Next.js / NestJS / Hono / Ruby on Rails を主力に、現場目線・顧客折衝・チームの再現性・ジュニア育成を重視する。

人気記事

    お問い合わせ

    システム開発やAI推進についてのご相談はこちらから

    無料相談を予約する