AWS、新たなマルチモーダルAI「Amazon Nova」を発表 「Amazon Bedrock」で利用可能になるユースケースに応じたAIとは:「理解モデル」「コンテンツ生成モデル」の2種類を提供
Amazon Web Servicesは、最先端をうたう新しい基盤モデル「Amazon Nova」を発表した。Amazon Bedrockを通じて「Amazon Nova理解モデル」と「Amazon Novaクリエイティブコンテンツ生成モデル」といった目的別のAIモデルを提供するという。
Amazon Web Services(AWS)は2024年12月3日(米国時間)、最先端(SOTA:State-of-the-Art)をうたう新しい基盤モデル(Foundation Model)「Amazon Nova」を発表した。
AWSは、Amazon Novaについて「フロンティアインテリジェンスと、業界をリードする価格パフォーマンスを提供する。単一のAPIを介して大手AI(人工知能)企業の高性能基盤モデルを利用できるAWSのフルマネージドサービス『Amazon Bedrock』で使用できるようになる」と述べている。
Amazon Novaには大きく分けて「Amazon Nova理解モデル」と「Amazon Novaクリエイティブコンテンツ生成モデル」の2種類がある。
Amazon Nova理解モデル
Amazon Nova理解モデルには、「Amazon Nova Micro」「Amazon Nova Lite」「Amazon Nova Pro」があり、近日中に「Amazon Nova Premier」を追加予定だという。
これらのモデルはテキスト、画像、動画の入力を受け取り、テキストを生成する。機能、精度、速度、コスト面で幅広い選択肢を提供する。それぞれ以下の特徴を持つ。
- さまざまなインテリジェンスクラスにわたって高速で費用対効果の高い推論を実現する
- 最先端のテキスト、画像、動画理解
- テキスト、画像、動画入力によるファインチューニング
- 先進的なエージェント型およびマルチモーダルRAG(検索拡張生成)機能
- Amazon Bedrockによる独自のデータやアプリケーションとの容易な統合
モデルごとの特徴は以下の通り。
Amazon Nova Micro
テキストのみのモデルであり、非常に低コストで最もレイテンシの低い応答を提供する。言語理解、翻訳、推論、コード補完、ブレーンストーミング、数学的問題解決において高いパフォーマンスを発揮する。毎秒200トークンを超える生成速度を持つため、高速の応答を必要とするアプリケーションに最適だ。
- 処理できる入力トークン:最大128K(12万8000)
- 対応言語:200以上
- サポートされているファインチューニング方法:テキスト入力
Amazon Nova Lite
画像、動画、テキスト入力を極めて高速に処理する非常に低コストのマルチモーダルモデル。幅広いタスクでの精度と処理速度の速さから、コストが重要視され、大量処理が必要な幅広いインタラクティブアプリケーションに適している。
- 処理できる入力トークン:最大300K(30万)
- 対応言語:200以上
- サポートされているファインチューニング方法:テキスト、画像、動画入力
Amazon Nova Pro
幅広いタスクにおいて精度、速度、コストの最良の組み合わせを提供する非常に高性能なマルチモーダルモデル。処理能力と、業界をリードする速度および費用対効果により、ほとんどのタスク(動画の要約、Q&A、数学的推論、ソフトウェア開発、マルチステップワークフローを実行するAIエージェントなど)にとって魅力的なモデルとなっている。
テキストおよびビジュアルインテリジェンスのベンチマークで最先端の精度を発揮する他、Comprehensive RAG Benchmark(CRAG)、Berkeley Function Calling Leaderboard、Mind2Webのスコアに反映されているように、指示実行とエージェントワークフローに優れている。
- 処理できる入力トークン:最大300K(30万)
- 対応言語:200以上
- サポートされているファインチューニング方法:テキスト、画像、動画入力
これらの理解モデルは200以上の言語に対応しているが、AWSによると、特に英語、ドイツ語、スペイン語、フランス語、イタリア語、日本語、韓国語、アラビア語、簡体字中国語、ロシア語、ヒンディー語、ポルトガル語、オランダ語、トルコ語、ヘブライ語に強いとされている。
Amazon Nova Premier
複雑な推論タスクや、カスタムモデルの蒸留における教師モデルとしての使用において、Amazon Novaモデルの中で最も高性能なマルチモーダルモデル。まだトレーニング段階にあり、2025年初頭の提供開始を目指している。
Amazon Novaクリエイティブコンテンツ生成モデル
Amazon Novaクリエイティブコンテンツ生成モデルには、「Amazon Nova Canvas」と「Amazon Nova Reel」がある。これらのモデルはテキストや画像の入力を受け取り、画像や動画の出力を生成する。ビジュアルコンテンツ用のカスタマイズ可能な高品質の画像や動画を生成するように設計されている。以下の特徴を持つ。
- 最先端の画像や動画の生成
- ビジュアルコンテンツ生成の制御
- ビジュアルコンテンツのカスタマイズと編集のためのさまざまなアプローチ
- 電子透かしとコンテンツモデレーションによる安全で責任あるAIの使用のサポート
モデルごとの特徴は以下の通り。
Amazon Nova Canvas
プロンプトで提供されたテキストや画像からプロ級の画像を生成する最先端の画像生成モデル。テキスト入力による画像編集を容易にする機能、配色やレイアウトを調整するコントロール機能、安全で責任あるAIの使用をサポートする組み込みの制御機能も提供する。
- 処理できる入力文字数:最大1024
- 対応言語:英語
- サポートされているファインチューニング方法:近く発表予定
Amazon Nova Reel
テキストや画像から高品質の動画を簡単に生成できる最先端の動画生成モデル。自然言語プロンプトの使用によるビジュアルスタイルとテンポの制御(カメラモーションコントロールを含む)をサポートし、安全で責任あるAIの使用をサポートする組み込みの制御機能も提供する。
- 処理できる入力文字数:最大512
- 対応言語:英語
- サポートされているファインチューニング方法:近く発表予定
Amazon Novaのユースケース
AWSは公式ブログ記事で、Amazon Novaモデルがどのように機能するのかを、以下の4つのユースケースでコードサンプルも交えて解説している。
- Amazon Nova Proを使用したドキュメント分析
- Amazon Nova Proを使用した動画分析
- Amazon Nova Reelを使用した動画生成
- 参照画像を組み合わせたAmazon Nova Reelの使用
Amazon Novaの提供リージョン
Amazon Novaモデルは、AWSの米国東部(バージニア北部)リージョンでAmazon Bedrockから利用できる。Amazon Nova Micro、Lite、Proの3モデルは、クロスリージョン推論によって米国西部(オレゴン)および米国東部(オハイオ)リージョンでも利用できる。
Amazon Bedrockの通常の利用時と同様、料金は従量制となっている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
AWS、生成AIアプリの構築、展開基盤「Amazon Bedrock」の新機能を発表
AWSは、基盤モデルを使用した生成AIアプリケーションの構築、展開を支援する「Amazon Bedrock」サービスの新機能を発表した。新機能には、カスタムモデルインポート、モデル評価、「Guardrails for Amazon Bedrock」があり、使用可能な基盤モデルの選択肢も拡大している。東京リージョンで正式提供開始の生成AIサービス「Amazon Bedrock」、企業での利用に向けた仕掛けとは
Amazon Web Servicesの生成AIマネージドサービス「Amazon Bedrock」が、本国でのリリースから数日遅れの10月3日、東京リージョンで正式に提供開始となった。このサービスには、企業での生成AI活用を促進するための幾つかの仕掛けがある。AWS、生成AIのマネージドサービス「Amazon Bedrock」を提供開始
Amazon Web Services(AWS)は、「Amazon Bedrock」の一般提供開始など、生成AIに関する4つのイノベーションを発表した。