Google Cloudはフルマネージド統合AI開発プラットフォーム「Vertex AI」で、テキストから音楽を生成する新モデル「Lyria」のプレビュー版を利用できるようにした。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Google Cloudは2025年4月10日(米国時間)、生成AI(人工知能)を構築、使用するためのフルマネージド統合AI開発プラットフォーム「Vertex AI」で、テキストから音楽を生成する新モデル「Lyria」のプレビュー版を利用できるようにした(事前に利用申請、承認が必要)。
Googleは「Vertex AIは動画、画像、音声、音楽の全モダリティ(データ種別)にわたる生成メディアモデルに対応する唯一のプラットフォームとなった。Vertex AIでテキストプロンプトから画像や完全な動画アセット(音楽、音声を含む)など、本番環境対応の完全なアセットを構築できる」としている。
Google Cloudは、Vertex AIで利用可能な既存の動画生成モデル「Veo 2」、音声生成、理解モデル「Chirp 3」、画像生成モデル「Imagen 3」についても、新機能の追加などのアップデートを実施した。
Lyriaの特徴とこれらのモデルの機能強化点は以下の通り。
Lyriaは、テキストプロンプトから幅広いジャンルで高品質かつニュアンス豊かな音楽を生成する。企業はVertex AIでLyriaを活用し、ブランド体験の向上(独自サウンドトラックの作成によるサウンドブランディング)や、コンテンツ制作の効率化(カスタム音楽トラックの迅速な作成によるワークフローの加速、コスト削減)を図れる。
高度な動画生成モデルであるVeo 2は、以下の新しい編集機能とカメラ制御機能のプレビュー版が追加された(事前に利用申請、承認が必要)。これらの機能により、チームは動画コンテンツの編集、再利用を効率化できる。
画期的な音声生成・理解モデルであるChirp 3には、以下の新機能が追加された。
テキストから画像を生成する最高品質のGoogleモデルであるImagen 3では、過去1年間に、より詳細で、より豊かな照明効果の、邪魔なアーティファクトがより少ない画像を生成できるようになった。
また、Imagen 3の編集機能では、画像の欠損または破損部分を再構築するインペインティング機能や、不要なオブジェクトの除去機能が大幅に向上し、より自然でシームレスな編集体験が可能になった。
Lyriaの開発やこれらのモデルの機能強化は、GoogleのAI原則に基づき、「SynthID」によるデジタル透かし、有害コンテンツの生成を防ぐ安全フィルター、データガバナンス(Googleは顧客データをモデルのトレーニングに使用せず、顧客データは顧客の指示に従ってのみ処理される)といった対策により、安全性と責任を優先して進められた。
またGoogleは、顧客がさまざまなGoogle製品で生成されたコンテンツを使用するに際して、サードパーティーの知的財産(著作権を含む)に関する主張があった場合、顧客に補償するとしている。
生成AIは実用段階に入っており、Googeによると、WPP、Agoda、Bending Spoons、Monks.Flow、The Brandtech Group、Bloomberg Connectsなどの企業が、Vertex AIを使って生成メディアモデルを本番環境で活用し、効率性、創造性、顧客エンゲージメントの向上といったビジネス成果につなげているという。
Copyright © ITmedia, Inc. All Rights Reserved.