Cohereがオープンソース化したCommand A+ 218B MoEモデル、企業の主権AIを再構築

技術仕様とアーキテクチャの革新

Command A+の総パラメータは218B、活性化パラメータはわずか25Bで、スパースMoE設計を採用。入力コンテキストは128Kに達し、最大生成長は64K、テキストと画像のデュアルモーダルおよびツール呼び出しに対応。公式にW4A4量子化版が提供され、B200単一枚またはH100二枚で稼働可能で、同規模の密モデルに比べ推論効率が大幅に向上している。

競合MoEモデルとの直接比較

DeepSeek-V2は総パラメータ236B、活性化21Bだが、Command A+はエージェントコーディングタスクで12ポイント上回る。Llama 3.1 405Bは密構造で、単一フォワードに全パラメータの活性化が必要だが、Command A+は同じH100クラスタ上でスループットが2.3倍向上。Mistral Largeは8エキスパート構成だが、Command A+はエキスパート数が多く、48言語に対応しており、Mistralの12言語サポートを大きく上回る。

エージェント能力の定量的向上

τ²-Bench電気通信シナリオのスコアはCommand A Reasoningの37%から85%に上昇し、Terminal-Bench Hardは3%から25%に向上。マルチモーダル文書処理と長期推論能力も同時に強化され、単一モデルでこれまでのCommand Aシリーズすべてのサブモデル機能を統合した。

北米のある電気通信事業者はすでにNorthワークスペース内で既存のハイブリッドモデルスタックをCommand A+に置き換え、デプロイコストを41%削減した。

Apache 2.0ライセンスの商業的価値

Apache 2.0は企業による改変、商用利用、クローズドソース二次開発を許可し、派生コードのオープンソース化を必要としない。開発者はプライベートSaaS製品に直接統合可能で、GPL感染リスクを回避できる。当該ライセンスはLlamaシリーズのカスタムプロトコルと比較して、法的確実性が高く、リスク管理審査や投融資に有利である。

  • 企業は自社ハードウェアデバイスにモデルを組み込み可能で、Cohereへの支払いは不要
  • vLLM、Transformersなど主流フレームワークに対応し、移行コストはほぼゼロ
  • 48言語対応で多国籍コンプライアンス展開の基盤を提供

主権AIの実装パス

モデル重みはすでにHugging Faceにアップロードされ、複数のロスレス量子化版が提供されている。Model Vaultホスティングソリューションは、推論クラスタの自前構築を望まない機関のニーズに応える。両者の組み合わせにより、実験から本番まで完結したループが形成され、主権AIのハードルが単一ノードレベルまで引き下げられた。