職務内容
【募集背景・業務内容】
人口減少・少子高齢化に伴う担い手不足が進行する中、公共サービスの維持・高度化に向けて、生成AIをはじめとするAI技術の戦略的活用が不可欠となっています。
デジタル庁では、政府におけるAI基盤である「ガバメントAI」の整備を進めており、その一環として、全職員が利用可能な生成AI活用環境(プロジェクト名:源内(げんない))の内製開発および高度化を推進しています。現在は、国会答弁検索AIや法制度調査支援AIなど、行政実務を支援する複数のアプリケーションを展開し、現場での実装と改善を進めています。
本募集では、ガバメントAIにおける生成AIアプリケーションの設計・実装、またはその品質評価・効果測定のいずれかを主軸として担っていただきます。将来的には、設計と評価の双方を横断し、行政における持続可能かつ説明可能なAI活用モデルの構築を推進していただくことを期待しています。
具体的な業務内容は以下を想定しています。
・各部署へのヒアリングを通じた業務課題の整理およびAI活用仮説の構築
・エージェント型・ワークフロー型AIシステムの設計・実装(概念実証を含む)
・情報検索システム(BM25・ベクトル検索・ハイブリッド検索等)の設計・改善
・LLM出力品質評価の設計(評価指標設計、評価用データセット構築等)
・AIシステムの性能評価および業務効果測定のための実験設計・統計分析
・検証結果に基づく改善提案およびレポーティング
・行政における生成AI活用の安全性・透明性確保に関する取組
・その他、行政運営の遂行に必要な業務
求める人材
以下の3点すべてを満たすこと。
・多種多様な行政業務の背景を理解するための情報収集能力および円滑なコミュニケーション力
・クラウドコンピューティングプラットフォームを活用し、概念実証レベルのプログラムを独力で設計・開発した経験/スキル
・下記「設計」または「評価」のいずれか一方の実務経験
<設計系>
- エージェント型またはワークフロー型AIシステムの設計・実装経験(マルチステップ推論、ツール呼び出し、オーケストレーション等のアーキテクチャ理解を含む)
- 情報検索システムの設計・改善経験(転置インデックスやBM25等の古典的手法から、ベクトル検索・ハイブリッド検索・リランキングまでの技術的理解を含む)
<評価系>
- LLMの出力品質評価の実務経験(評価指標設計、ゴールデンセット構築、LLM-as-a-Judge等を含む)
- AIシステムの性能評価・効果測定のための統計分析・データ分析の実務経験(A/Bテスト設計、統計的因果推論、可視化等を含む)