MoE架构に関するニュース

オリジナル

DeepSeek-V2オープンソース版リリース：671Bパラメータから37Bのみ活性化、性能はGPT-4oに迫る

中国のAIスタートアップDeepSeekが最新のオープンソース大規模言語モデルDeepSeek-V2を発表。総パラメータ数671億から37億のみを活性化する高効率MoEアーキテクチャで、GPT-4oに匹敵する性能を実現した。

DeepSeek-V2 开源大模型 MoE架构 AI性能基准

2026年2月22日 391

オリジナル

DeepSeek V2開源モデルが圧倒的首位に：236Bパラメータ MoEアーキテクチャのコストパフォーマンスが国際大手を凌駕

中国AIスタートアップDeepSeekが最新の開源大規模言語モデルDeepSeek V2を発表。推論コストはGPT-4oの1/30で、Hugging Faceプラットフォームで急速に人気ランキングトップに躍進した。

DeepSeek V2 MoE架构开源模型 AI技术突破

2026年2月16日 398

オリジナル

DeepSeek-V2発表：中国語数学推論でGPT-4oを超える、236Bパラメータで効率的なリード

中国のAIスタートアップ企業DeepSeekが最新の大規模言語モデルDeepSeek-V2を発表しました。このモデルは、中国語の数学推論ベンチマークでOpenAIのGPT-4oを超える性能を示し、ユニークなMoEアーキテクチャを使用して効率

DeepSeek 中文AI 数学推理 MoE架构

2026年2月3日 301

オリジナル

DeepSeek-V2オープンソース公開：236Bパラメータで16GBのVRAMのみ、数学能力はLlama3を上回り開発者コミュニティを熱狂させる

DeepSeekチームは、236億パラメータで16GBのVRAMのみで効率的に推論できる大規模言語モデルDeepSeek-V2を発表しました。このモデルは数学ベンチマークでMetaのLlama3を上回り、中国のAI業界における大きな突破口と

DeepSeek-V2 开源大模型国产AI MoE架构

2026年2月2日 324