企業における生成AIの活用が加速する一方、蓄積したデータをAI自身に理解させなければAI活用の取り組みは頓挫しかねない――そこで本連載は、AI活用の成否を分ける「データマネジメント」に焦点を当てる。初回は、なぜデータマネジメントがAI活用の成否を分けるのか、AIがデータを正しく理解するために求められる取り組みを整理する。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
現在、生成AI(人工知能)やAgentic AI(エージェンティックAI)の登場により、AIとデータを組み合わせた業務変革やビジネスの付加価値創出への期待は飛躍的に高まっている。だが、PwCコンサルティングの調査(「生成AIに関する実態調査2024 春 米国との比較」)によると、生成AIの活用、推進率は米国が91%であるのに対し、日本は67%にとどまっている。より深刻なのは、AI活用から「期待以上の活用効果」が出ている企業の割合だ。米国が33%であるのに対し、日本はわずか9%に過ぎないことだ。
この期待と現実の大きなギャップは、技術の進化に対して、それを生かす仕組み(非技術領域)が追い付いていないことに起因すると筆者は考える。事実、AIプロジェクトの失敗要因に関する同調査の分析では、活用効果が期待未満の企業のうち、30%が失敗の第1位の理由として「データ品質の問題」を挙げている。また、「データの意味・定義の不明確さ」も主要な失敗要因の一つとなっており、AIだけでなくデータ活用の在り方や考え方も変えていく必要がある。
国もデジタル人材育成を議論する中で、生成AIの活用に注目が集まる一方、多くの企業にデータマネジメントのノウハウが不足していることを危惧している状況だ。経済産業省が公開している資料によれば、こうした背景を受け、既存のエンジニアリング領域の国家試験にデータマネジメントを問う問題を追加したり、データマネジメントに関する新たな試験を設立したりするなど、データマネジメントのスキルを国レベルで向上させる検討、議論を進めている状況にある。
そこで本連載は、AI時代に不可欠となる「データマネジメント」、特に「ビジネスメタデータ」の必要性と整備、活用に向けた具体的なアプローチを解説していく。初回となる今回は、なぜデータマネジメントが生成AI活用の成否につながるのか、その背景やビジネスメタデータの必要性を整理する。
なぜ、データがあってもAIが誤解し、ビジネスで活用できないのか。その問題は、長年にわたり企業に根付いてきたデータ管理の構造に起因している。
データ活用がうまくいかない背景には、データが「そのデータの意味を知る人にしか使われない」という現状がある。製造業の現場を例に取ると、「120.5」という数値データを見たとき、熟練の担当者であれば、それが「スピンドル温度(℃)」を示していることを暗黙知によって瞬時に判断できる。
従来は、データ記録者と受領者が暗黙知で理解し合ってきたため、データの論理的な情報が不足していても、問題になることはなかった。しかし、少子高齢化や世代交代が進む中で、暗黙知の継承は困難になっている。
データに「意味」が伴わない場合、データ記録者と受領者以外は何を意味するのか理解することができない。「120.5」とは、「スピンドル温度」なのか、それとも「シャフト径(mm)」を示しているのか、当事者以外は分からない。もしもそれが「スピンドル温度」だと理解できたとしても、それが正常値なのか異常値なのかも判断できない。
このような状況は、AI活用においても致命的だ。もしAIエージェントに何の文脈もなく「120.5」を与えて判断させようとしても、そのデータが「何であり、何を意味し、どう使われるべきか」というビジネスコンテキストが欠けていれば、AIは正しく学習も判断も実行もできないし、場合によってはハルシネーション(幻覚)を引き起こす原因となってしまうだろう。
データの意味が組織で共有されない背景には、日本企業に根深い二重の構造的課題がある。
一つは従来の「メタデータのサイロ」である。多くの日本企業は、部門ごとに業務システムが個別に構築されてきたため、データの全社的な標準化が進んでいない。eコマース(電子商取引)を例にしてみると、EC事業部門、CX(カスタマーエクスペリエンス)部門、実店舗事業部門がそれぞれ保有する「会員データ」は、同じ名称でも部門ごとに重要とされるデータの種類や内容、期待される使途が異なる場合がある。
これにより、データの内容を誰もが理解できるように可視化、共有するためのメタデータが部門間に分断され、企業全体での連携が阻害されてしまう。
そしてもう一つ、AI時代の急速な技術進化によって生まれたのが「ナレッジのサイロ」だ。データサイエンティストやデータエンジニアといった技術の専門家は「分析手法」には精通しているが、データが生成された業務やビジネスの背景にあるナレッジ(知識)が不足しているケースがある。
結果として、ビジネス目的を持つ人と、アナリティクス技術や元データのナレッジを持つ人との間で構造的な隔たりが生じ、データがビジネスに実効性を持って活用されないまま「宝の持ち腐れ」になっている状況が見受けられる。
こうした危機を乗り越え、データ活用のボトルネックを解消する鍵こそが、データマネジメントの中核を成す、メタデータの戦略的活用だ。
メタデータとは、「データを説明するデータ」を指す。実データそのものは、例えて言うなら石油の「原油」や鉱石の「原石」のような資源(原材料)に過ぎず、そのままでは使い道や効果が限定的だ。
このデータという資源に、メタデータを付加して情報化することで、人やAIがビジネス価値の高い分析、判断、作業を可能にする「資産」へと変換される。
メタデータは大きく分けて3つに分類できる。
AI時代において最も重要なのが、データの意味やビジネス的な文脈を定義し、全社で共通理解を可能にするビジネスメタデータとなる。これは、単なるデータやテクニカルメタデータの組み合わせでは理解できないビジネスコンテキスト(背景、意味、使い方、制約など)を補完し、データにビジネス的な価値を持たせるために必要だ。
ビジネスメタデータは、組織内で以下のような役割を果たす。
ビジネスメタデータがAIの活用効果を決定づけることは、RAG(Retrieval-Augmented Generation:検索拡張生成)といった生成AI技術を用いた検証でも顕著に示されている。
例えば生成AIに「直近6カ月の売り上げ減少の主な原因は何で、どのような対策が効果的か分析してください」というプロンプトを投入した場合、ビジネスメタデータの有無により以下のような違いが見られる。
これは、ビジネスメタデータがAIに対して「データの意味、由来、関連性」といったビジネス文脈を与えた結果であり、AI活用を実効性の高いものにするためには不可欠といえる。
データマネジメント、特にビジネスメタデータマネジメントへの取り組みは、単なるIT施策や技術的な裏方業務ではなく、AI時代を勝ち抜くための企業の競争力を左右する経営戦略として位置付けられるべきだ。
ビジネスメタデータが整備されていることは、以下のような具体的なメリットと高い投資対効果をもたらす。
データの活用を目指す企業にとって、今、ビジネスメタデータの整備に着手することは喫緊の課題となっている。その理由は、実データ量(IoT〈Internet of Things〉センサー、画像・動画データ、ERP〈Enterprise Resource Planning〉データなど)がAI活用によって指数関数的に増加する一方で、ビジネスメタデータ整備は線形的にしか進まないという時間差のギャップが存在するためだ。
この時間差を放置し後回しにすると、時間がたつほどに「意味不明」で「使われないデータ」が組織内に蓄積され、結果として取り返しがつかなくなる。
あらためて企業は、データが「ヒト」「モノ」「カネ」に次ぐ第4の経営資源であると強く認識すべきだ。他の経営資源と同様に、データそのものの意味、構造、品質について定期的に現状を把握し、改善を図る必要がある。ビジネスメタデータマネジメントは、部門横断的な取り組みが不可欠であり、現場の従業員やIT部門だけでなく、経営層が強いコミットメントを持ってけん引することが成功の要件となる。
データの「意味」を定義・共有できる仕組み、すなわちデータインテリジェンスの構築こそが、AI革命の時代を勝ち抜き、持続的に価値を創造し難題を解決できる未来を実現するための羅針盤となる。
次回は、ビジネスメタデータの具体的な「見つけ方」や「進め方」といった実践的なアプローチを、深く掘り下げる。
外資系IT企業を中心に様々な技術・マーケティング職を経験。また、ガートナーのアナリストとしてDevOps、SRE、AIOps、RPA分野などの市場動向分析、CTO/CIOへの提言を行う。20年以上にわたり、メディア寄稿記事の執筆や、ガートナー主催イベントでの基調講演を始め、多くのカンファレンス/イベントでの講演経験あり。
2024年7月よりQuollio Technologiesにてマーケティングを統括。
Copyright © ITmedia, Inc. All Rights Reserved.