Google Cloud、「Vertex AI」で音楽生成モデル「Lyria」(プレビュー版)を提供開始:動画、画像、音声、音楽の生成モデルに対応する唯一のプラットフォームに
Google Cloudはフルマネージド統合AI開発プラットフォーム「Vertex AI」で、テキストから音楽を生成する新モデル「Lyria」のプレビュー版を利用できるようにした。
Google Cloudは2025年4月10日(米国時間)、生成AI(人工知能)を構築、使用するためのフルマネージド統合AI開発プラットフォーム「Vertex AI」で、テキストから音楽を生成する新モデル「Lyria」のプレビュー版を利用できるようにした(事前に利用申請、承認が必要)。
Googleは「Vertex AIは動画、画像、音声、音楽の全モダリティ(データ種別)にわたる生成メディアモデルに対応する唯一のプラットフォームとなった。Vertex AIでテキストプロンプトから画像や完全な動画アセット(音楽、音声を含む)など、本番環境対応の完全なアセットを構築できる」としている。
Google Cloudは、Vertex AIで利用可能な既存の動画生成モデル「Veo 2」、音声生成、理解モデル「Chirp 3」、画像生成モデル「Imagen 3」についても、新機能の追加などのアップデートを実施した。
Lyriaの特徴とこれらのモデルの機能強化点は以下の通り。
Lyria:テキストから高品質な音楽を生成
Lyriaは、テキストプロンプトから幅広いジャンルで高品質かつニュアンス豊かな音楽を生成する。企業はVertex AIでLyriaを活用し、ブランド体験の向上(独自サウンドトラックの作成によるサウンドブランディング)や、コンテンツ制作の効率化(カスタム音楽トラックの迅速な作成によるワークフローの加速、コスト削減)を図れる。
Veo 2:包括的な動画作成、編集プラットフォームに進化
高度な動画生成モデルであるVeo 2は、以下の新しい編集機能とカメラ制御機能のプレビュー版が追加された(事前に利用申請、承認が必要)。これらの機能により、チームは動画コンテンツの編集、再利用を効率化できる。
- インペインティング:手動でのレタッチ作業なしで、動画内の不要物を全フレームで自然に削除
- アウトペインティング:既存の動画フレームを拡張し、他のプラットフォーム(Webやモバイル)向けに最適化
- 高度なシネマティック技術:カメラアングルやショット構成などを容易に指示できる
- フレーム補間:2つの動画間をシームレスにつなぐフレームを生成
Chirp 3:カスタムボイス生成と高精度な文字起こし
画期的な音声生成・理解モデルであるChirp 3には、以下の新機能が追加された。
- Instant Custom Voice:一般提供が開始された(事前に利用申請、承認が必要)。10秒の音声サンプルからリアルなカスタム音声を生成できる
- 話者を識別した文字起こし:プレビュー版が提供開始された(事前に利用申請、承認が必要)。複数話者の録音の文字起こしにおいて、話者を正確に分離、識別する
Imagen 3:生成画像の品質と編集機能が向上
テキストから画像を生成する最高品質のGoogleモデルであるImagen 3では、過去1年間に、より詳細で、より豊かな照明効果の、邪魔なアーティファクトがより少ない画像を生成できるようになった。
また、Imagen 3の編集機能では、画像の欠損または破損部分を再構築するインペインティング機能や、不要なオブジェクトの除去機能が大幅に向上し、より自然でシームレスな編集体験が可能になった。
安全性とセキュリティの確保
Lyriaの開発やこれらのモデルの機能強化は、GoogleのAI原則に基づき、「SynthID」によるデジタル透かし、有害コンテンツの生成を防ぐ安全フィルター、データガバナンス(Googleは顧客データをモデルのトレーニングに使用せず、顧客データは顧客の指示に従ってのみ処理される)といった対策により、安全性と責任を優先して進められた。
またGoogleは、顧客がさまざまなGoogle製品で生成されたコンテンツを使用するに際して、サードパーティーの知的財産(著作権を含む)に関する主張があった場合、顧客に補償するとしている。
生成メディアモデルのビジネス活用
生成AIは実用段階に入っており、Googeによると、WPP、Agoda、Bending Spoons、Monks.Flow、The Brandtech Group、Bloomberg Connectsなどの企業が、Vertex AIを使って生成メディアモデルを本番環境で活用し、効率性、創造性、顧客エンゲージメントの向上といったビジネス成果につなげているという。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
「MCPを補完」 オープンなAIエージェント連携プロトコルをGoogle Cloudが発表
Google Cloudが、複数のAIエージェントを連携させる標準プロトコルを発表した。オープンソースとして、コミュニティーやパートナーと開発を進めていくという。AnthropicのMCPとは補完関係にあると強調している。テキストや画像から商用可の動画を生成できるモデル「Veo」をGoogle Cloudが公開、どんな動画が作れる?
Google Cloudは、動画生成モデル「Google Veo」と高品質な画像生成モデル「Imagen 3」について、Google Cloudのフルマネージド統合AI開発プラットフォーム「Vertex AI」上での提供開始を発表した。企業による生成AIアプリ構築はどう楽になる? Google Cloudが開発基盤Vertex AIを強化
Google Cloudが年次イベント「Google Cloud Next '23」で、多数のモデルへの対応、社内の既存アプリやデータとの連携など、企業による生成AIアプリ構築を支援するさまざまな新機能を発表した。