Alibaba Cloudは、Mixture of Expertアーキテクチャを採用した同社の大規模言語モデル「Qwen2.5-Max」のAPI提供を開始した。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Alibaba Cloudは2025年1月28日(中国時間)、「Mixture of Expert」(MoE:混合エキスパート)アーキテクチャを採用した大規模言語モデル(LLM)「Qwen2.5-Max」を発表し、同モデルのAPIをAlibaba Cloudで提供開始した。
Qwen2.5-Maxは、20兆以上のトークンで事前トレーニングされ、教師ありファインチューニング(SFT)と人間のフィードバックによる強化学習(RLHF:Reinforcement Learning from Human Feedback)で事後トレーニングされている。
中国の新興AI企業の高性能オープンソースLLM「DeepSeek-R1」登場 注目の理由は?
Alibaba Cloud、推論能力に焦点を当てたAIモデル「QwQ-32B-Preview」を発表 4つのベンチマークを公開
中国の零一万物(01.AI)、コーディング用LLM「Yi-Coder」をオープンソースとして公開Copyright © ITmedia, Inc. All Rights Reserved.