AISIは「AIセーフティに関するレッドチーミング手法ガイド」を改訂したと発表した。改訂では、RAGの仕組みを実装したAIシステムに対して実際にレッドチーミングを実施し、その手順の解説が追加された。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
情報処理推進機構(IPA)の機関であるAIセーフティ・インスティテュート(AISI)は2025年4月2日、「AIセーフティに関するレッドチーミング手法ガイド」を改訂したと発表した。同ガイドは2024年9月に初版が公開されており、「具体的な実施例を通してより詳細に理解できるようにした」としている。
なお、AIセーフティ・インスティテュートは、内閣府が2024年2月14日に設立した、AI(人工知能)の安全性の評価手法を検討する機関。IPA内に設置されている。
同ガイドは「レッドチーミング手法」(AIシステムの開発者や提供者が、対象のAIシステムに施したリスクへの対策を攻撃者の視点から評価する手法)に関する基本的な考慮事項を示している。レッドチーミングの種類や実施方法、実施体制と実施時期などを体系的にまとめており、「実施の決定とレッドチーム発足」から「改善後のフォローアップ」までを15ステップに分けて説明している。
改訂では、RAG(検索拡張生成)の仕組みを実装したAIシステムに対して実際にレッドチーミングを実施し、その手順を解説するとともに、レッドチーミング実施の成果物をまとめている。また、懸念箇所や保護すべき情報資産を洗い出すために使っていたシステム図を更新している。
別紙「詳細解説書」では、本編に沿ってレッドチーミングを実施する際のポイントや各工程での成果物例が解説されている。高い専門性が求められる第2工程(攻撃計画、実施)を重点的に解説しており、AISIは「実際にレッドチーミングを実施した結果から得られた示唆を示すことで、同ガイドをより実践的な資料として拡充させたい」としている。
別添え資料の「成果物例」では、レッドチーミングを実施する際に作成する成果物の一部を例として示している。例えば、本編のステップ6〜8で作成するリスクシナリオや攻撃シナリオの作成例と攻撃シナリオの実施結果が示されている。
Copyright © ITmedia, Inc. All Rights Reserved.