生成AI活用は「データの壁」に阻まれる 経営層が知るべき、デジタル庁の「データガバナンスガイドライン」とは:生成AI活用を成功させる「4つの柱」
多くの企業が生成AI活用に意欲を示す一方、「データの品質」が成果を妨げる最大の要因となっている。では、生成AIに注目する企業の経営層は何に取り組むべきなのか。そこで役立つのが、デジタル庁が2024年6月に公開した「データガバナンスガイドライン」だ。
顧客情報、取引情報、技術情報――企業活動の中で日々蓄積される膨大なデータは重要な経営資源だ。特に顧客情報はビジネスの根幹を成す競争力の源泉であり、その保護と活用は、企業の最重要課題となっている。
経営層もDX(デジタルトランスフォーメーション)の重要性を理解しており、生成AI(人工知能)への注目度も高い。しかし、生成AIを単なるITツール導入の延長線上と捉え、「生成AIツールを使って業務生産性を向上させていこう」「生成AIツールで開発生産性を高めよう」と号令をかけるだけでは、期待する成果は得られないかもしれない。なぜなら、生成AIの真価は、生成AIはもとより、データの品質やデータの管理体制に左右されるからだ。
企業が生成AIを活用していく上では、自社内に蓄積されたデータと生成AIを組み合わせて差別化する必要がある。特に考えられるのは、RAG(検索拡張生成)を通じて、社内に蓄積された独自データと連携させ、より業務に適した正確な回答を出力させるような取り組みだ。
こうした連携フェーズでは、「高品質なデータ」の存在が必須だ。不正確で統一されていないデータしかなく、データが散在している状況では、AIは正しい学習ができず、誤った結論を導きかねない。事実、PwCコンサルティングが実施した「生成AIに関する実態調査」(2024年6月)でも、生成AIの活用効果が期待未満となった理由のトップとして「データの品質」(30%)が挙げられており、多くの企業が生成AI導入の初期段階で、データの課題に直面していることが明らかになっている。
ここで重要になるのが、「データガバナンス」だ。データガバナンスとは、組織のデータを適切かつ最大限に活用するための仕組みやルールを定めることだ。データガバナンスが確立されていなければ、社内に眠る膨大なデータは単なる情報にすぎず、AI活用どころか、日々の業務効率さえも改善できない。とはいえ、経営層からしても「人材不足など課題は山積みで、データガバナンスといわれても何から始めればいいのか分からない」といった課題もあるだろう。
そこで役立つのが、デジタル庁が2025年6月に公開した「データガバナンスガイドライン」だ。
データガバナンスガイドラインが示す、4つの柱とは
データガバナンスガイドラインは、企業経営者を対象に、データガバナンスの重要性やデータガバナンスの「4つの柱」をまとめ、経営層が取り組むべき行動を明確化したものだ。
4つの柱は以下の通り。ガイドラインでは、それぞれ「基本となる考え方」「経営者が認識しておくべきこと」「望ましい方向性」がまとまっている。
1. 越境データの現実に即した業務プロセス
- データを連携するステークホルダーに渡って業務プロセスを明確にし、データのライフサイクル全般にわたる利活用のトレーサビリティーを可能な限り確保する
- 当該国や地域における現在の法令や国際ルールに基づくリスクへの対応
- データの所在位置を踏まえたデータに付随する法益の確保
- データの共有、連携先やサービサーの行為に起因するリスクへの対応
2. データセキュリティ
- データ起点の発想に転換し、ルール、技術、プロセスを組み合わせて、データのライフサイクルに応じ、データに関わるリスクを許容範囲に納める
- データを共有、連携するステークホルダーの信用度に応じた対応
- データの所在位置を踏まえたデータに付随する法益の確保
- データ利用の正当性
- データの完全性、最新性の確保
- 明文化されたルール、制度、プロセス
3. データマチュリティ
- データ価値の最大化とリスクの最小化を行い、最大のパフォーマンスを出しつつ改善する、企業の総合的な能力
- 継続的なプロセスの改善
- 障害の予測と対策、経営者の説明責任
- AIなどの先端技術やデータに対する費用対効果の分析
- レガシーシステム内のデータをAIや新しい基盤などで活用可能とする
- 人材育成と、ステークホルダーに渡る情報の共有
4. AIなどの先端技術の利活用に関する行動指針
- データの収集、利活用、結果の公表や提供先での利用などに対する指針を、自社内及びステークホルダーへ周知する
- AIや先端技術のデータを扱う現場の行動指針を策定し随時見直しを図る
- 個人情報や機微な情報の保護AI開発事業者にデータを提供する際は、機密保持契約などを結んでおく
- ステークホルダーへの情報提供(透明性の確保)
- 検証可能性の確保(説明責任)
これまでのデータ活用は人が中心となっていたが、生成AI活用が進むことで、データをAIエージェントが自律的に生成、加工する時代へと移行する可能性が出てきた。こうした「自律的なデータ活用」が加速すれば、データガバナンスはますます必須の存在となる。これはIT部門など現場の仕事ではなく、経営戦略そのものとなる。
経営層は現場任せにせず、生成AI活用やデータガバナンスを経営戦略の最優先事項として捉え、自らが旗振り役となって組織を動かす必要があるだろう。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
うちもRAGをやりたい! どうやって進めればいいか詳しく教えて
生成AIの業務活用についてのさまざまな悩みに答える新連載。第1回は、社内情報の活用で話題のRAG(検索拡張生成)を取り上げ、具体的なシステムに落とし込む手順について解説します。データ中心のAI(DCAI:Data-Centric AI)とは?
用語「データ中心のAI」について説明。性能を向上させるために、モデルやアルゴリズムを改善する「モデル中心」のアプローチではなく、機械学習ライフサイクル全体を通じてデータを改善する「データ中心」のアプローチの方が大切だとする、AIの開発方法に関する考え方を指す。Garbage In, Garbage Out(ゴミを入れたら、ゴミが出てくる)とは?
用語「Garbage In, Garbage Out」について説明。ゴミ(Garbage)のような不良データを入力すると、出来上がる機械学習モデルもゴミのように不良なものになる、という戒め/金言のこと。ゴミを入れないのは簡単なように見えて難しい。