AIスタートアップWriterの大規模言語モデル「Palmyra X5」および「Palmyra X4」が、Amazon Web Servicesの「Amazon Bedrock」でフルマネージドサーバレスモデルとして利用可能になった。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Amazon Web Services(AWS)は2025年4月28日(米国時間)、AI(人工知能)スタートアップ(新興企業)Writerの大規模言語モデル(LLM)「Palmyra X5」および「Palmyra X4」が、「Amazon Bedrock」でフルマネージドサーバレスモデルとして利用可能になったと発表した。
Amazon Bedrockは、AI企業の高性能な基盤モデルを単一のAPIで提供するフルマネージドサービス。セキュリティ、プライバシー、責任あるAIを備えた生成AIアプリケーションの構築に必要な幅広い機能を提供する。
Palmyra X5は、Writerが同日発表した基盤モデル。Palmyra X4は、Amazon Bedrock Marketplaceで提供されていた。AWSは、Writerのフルマネージドモデルを提供する最初の主要クラウドプロバイダーとなった。
WriterのPalmyraモデルは、企業が求めるセキュリティ基準と信頼性を維持しながら、複雑なエージェントベースのワークフローをサポートする堅牢(けんろう)なリーズニング機能やマルチステップのツール呼び出し機能を提供する。
Palmyra X5は100万トークン、Palmyra X4は128K(12万8000)トークンのコンテキストウィンドウを備える。両モデルはこれらの長いコンテキストウィンドウにより、アプリケーションおよびエージェント開発におけるコンテキストの制約の一部を取り除き、より深い分析とより包括的なタスクの完了を可能にする。
開発者はこれらのモデルを使って、広範なドキュメントの処理、複雑なマルチステップリーズニングの実行、高度なエージェントワークフローの処理が可能な、より洗練されたアプリケーションやエージェントを構築できる。
また、両モデルは英語、スペイン語、フランス語、ドイツ語、中国語など多くの言語をサポートしており、グローバルなエンタープライズアプリケーションに適している。
WriterのエンドツーエンドプラットフォームとAmazon Bedrockで提供開始されたPalmyra X5は、100万ドル相当のGPUで合成データを用いてトレーニングされた。今後のエージェント時代に企業で求められる動的なリーズニング機能とエンタープライズグレードの信頼性を提供する。
100万トークンのプロンプト全体を22秒で受け入れ、個々の関数呼び出しを3秒で返せる。Palmyra X5のAmazon Bedrockでのオンデマンド料金は、100万入力トークン当たり0.6ドル、100万出力トークン当たり6ドルだ(Palmyra X4は、それぞれ2.5ドル、10ドル)。
ロングコンテキストの処理性能を測定するベンチマークであるOpenAIのMRCR 8(Multi-round co-reference resolution)では、19.1%という優れたスコアを記録している。
「企業はPalmyra X5により、マルチステップエージェント(さまざまなデータベースやシステムからリアルタイムの市場データを取り込み、詳細なレポートを作成するような)において、比類ないパフォーマンスを得ることができる」と、AWSは述べている。同モデルは、財務報告、法的文書分析、医療記録統合、顧客フィードバック分析など、大量の情報の処理にも優れているという。
WriterのPalmyra X5とPalmyra X4は、AWSの米国西部(オレゴン)リージョンにおいて、Amazon Bedrockでフルマネージドとして提供されており、クロスリージョン推論(異なるリージョン間でのルーティングを最適化した推論)がサポートされている。
Copyright © ITmedia, Inc. All Rights Reserved.