日本独自の文化や制度が考慮された「安全で高性能な国産LLM」開発とそのサービス化を行うという。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Preferred Networks(以下、PFN)、さくらインターネット、NICT(国立研究開発法人情報通信研究機構)は2025年9月18日、国産生成AIのエコシステム構築に向けて基本合意を締結すると発表した。クラウド基盤からアプリケーションまで「国内で完結した」生成AIの活用を可能にするという。
生成AIは多様な分野で活用が進み、企業にとっても競争力の源泉となることが期待されている一方、悪意ある利用や、意図せずに不適切な出力がなされる可能性、AIエージェントなどの暴走などによる懸念やリスクも指摘されている。また、日本独自の文化や制度が考慮された生成AI活用への期待も高まりつつある。
今回の取り組みでは、日本の文化や社会に留意した「安全で高性能な国産LLM」の開発とそのサービス化を行うという。それらを通じて、日本社会と調和しつつ日本全体の生産性を向上させられる「国産生成AI」に関する学習データの収集、クリーニング、構築から、生成AIの学習、チューニング、サービス提供・実活用まで含めたエコシステムの構築を目指す。
具体的には以下の活動に取り組む。PFNは2026年春に向けて、フルスクラッチ開発した国産LLM「PLaMo 2.0」の後継となるLLM群をNICTと共同開発する。PFNが独自に構築した、日本語データを多く含んだ大量の合成学習データやWebデータに加え、NICTが独自に収集・構築したWebページやインストラクションデータなども学習に使うことで、「日本語性能に優れ、日本の文化、習慣、法制度などへの理解を高めた生成AI」の開発を進めるという。
さくらインターネットは、フルマネージドの生成AI向け実行基盤「さくらの生成AIプラットフォーム」において、NICTとPFNが共同開発するLLMを選択可能な基盤モデルとして提供する。これにより、利用者はクラウド基盤からアプリケーションまで「完全に国内で完結した」生成AIの活用が可能になるという。また、同LLMを「さくらの生成AIプラットフォーム」上でサービス化することでパートナーとの協業にもつなげる。これらを通じて、「データのインプットからアウトプットまでを一貫して整備し、日本企業や官公庁が安心して利用できる『信頼できるAIプラットフォーム』の提供を目指す」としている。
なお、NICTは2008年から独自に収集している700億ページを超える日本語Webページを活用するとともに、PFNと共同開発するLLMやNICTが独自に開発したLLM、これまでに開発した動作原理の異なるAIなどを組み合わせ、「信頼性、創造性、多様性に富んだAI複合体」を開発。これを使って、「どの程度、日本文化に沿った回答がなされるか、ハルシネーションが発生するか」などを動的に評価し、弱点を改善するための学習データを自動生成できる「能動的評価基盤」も開発していくという。NICTは「問題のある生成AIの特定、改善に役立つ他、国産生成AIの能力向上に貢献する」と見込んでいる。
Copyright © ITmedia, Inc. All Rights Reserved.