Cohereは、企業がAIアプリケーションに情報検索/取得機能を追加できるようにする最新のマルチモーダル埋め込みモデル「Embed 4」の提供を開始した。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
カナダのCohereは2025年4月15日(カナダ時間)、企業がAI(人工知能)アプリケーションに高度な情報検索/取得機能を追加できるようにする最新のマルチモーダル埋め込みモデル「Embed 4」の提供を開始した。これらの機能は、ビジネス上のコンテキストを理解する必要があるAIアシスタントやエージェントを構築する上で不可欠だという。
Embed 4は、Cohereのプラットフォームと「Microsoft Azure AI Foundry」「Amazon SageMaker」で提供されている。VPC(仮想プライベートクラウド)やオンプレミス環境へのプライベートデプロイ(展開)にも対応している。
Embed 4の主な特徴は以下の通り。
文書がテキストベースか、画像、表、グラフ、コード、図表などを含むかにかかわらず、複雑なPDFレポートや動的なプレゼンテーションスライドといった多面的な文書を正確かつ迅速に検索できる独自の機能を持つ。また、現実世界のノイズ(スペルミスやフォーマットの問題など)の多いデータや、スキャンされた、あるいは手書きの文書に対する検索でも、高いパフォーマンスを発揮するようトレーニングされている。
最大128K(12万8000)トークン(約200ページに相当)の長文の文書(アニュアルレポート〈年次財務報告書〉、製品マニュアル、詳細契約書など)の埋め込みを生成でき、文書全体の文脈を保持した検索を実現する。
アラビア語、日本語、韓国語、フランス語など、100以上の言語に対応し、異なる言語間での検索(クロスリンガル検索)もできる。グローバル企業は言語の壁を越えて情報にアクセスできるという。
金融、ヘルスケア、製造など、規制の厳しい業界特有のデータに対する理解が最適化されており、関連性の高い洞察の抽出に優れている。また、機密確保のため、VPCやオンプレミス環境へのデプロイにも対応している。
Cohereは「既存の埋め込みモデルでは、複雑でマルチモーダルなビジネス資料をネイティブに理解できないことから、企業は精度をわずかに上げるためだけに、煩雑なデータ事前処理パイプラインを開発せざるを得ない。Embed 4はこの問題を解決し、これまで検索不能だった膨大な情報から企業とその従業員が洞察を効率的に引き出せるようにする」とした上で、「『グローバル企業におけるマルチモーダル/多言語検索の基盤』『エージェント型エンタープライズAIアプリケーションの基盤』というユースケースで強みを発揮するモデルだ」と、述べている。
Copyright © ITmedia, Inc. All Rights Reserved.