DeepSeek に関するニュース

レビュー

SGLangにおけるElastic EP：DeepSeek MoEデプロイメントの部分故障耐性

SGLangがElastic EPを統合し、大規模MoEモデルの推論における部分故障耐性を実現。従来の2-3分のダウンタイムを10秒以下に短縮し、性能を損なうことなく信頼性を大幅に向上させた。

LMSYS SGLang Elastic EP MoE

2026年3月27日 411

レビュー

11個のAIモデルが一斉に40点急上昇：プログラミングテストで何が起きたのか？

11個のAIモデルのプログラミング能力が1週間で一斉に約40点急上昇した異常なデータの背後には、中国製モデルの全面的なリード、OpenAIの急落、長文処理能力の重要性向上という3つの重要なシグナルが隠されている。

DeepSeek GPT-o3 编程能力测试模型评测异常

2026年3月22日 267

レビュー

11個のAIに同じ問題を出題したら、6個は曜日すら計算できなかった

11個の主要AIモデルに小学生レベルのタイムゾーン計算問題を解かせたところ、半数以上が基本的な時間計算を間違え、さらに全モデルが3月15日のアメリカ夏時間への言及を怠るという衝撃的な結果となった。

DeepSeek GPT-4o 时区计算模型评测

2026年3月21日 329

レビュー

11個のAIが同じ論理問題に挑戦、3個が誤答し推論のブラックホールを露呈

5人の順位付けという簡単な論理問題で、DeepSeek V3を含む3つのAIモデルが基本的な制約条件を無視して誤答し、現在のAI推論能力の深刻な脆弱性を露呈した。

DeepSeek Grok 逻辑推理模型评测

2026年3月21日 431

レビュー

11個のAIが同じ問題に答えた結果、10個が誤魔化していた：豆包はなぜ満点を取れたのか？

実務シナリオの矛盾情報処理問題に対し、GPT-4oやClaude、DeepSeek V3などの著名AIモデル10個が表面的な回答をする中、豆包Proだけが実用的な解決策を提示し満点を獲得した。

豆包 DeepSeek 工程思维模型测评

2026年3月21日 216

レビュー

同じ問題をAI11体に解かせたら、7体が不合格：誰が賢いふりをしているのか？

ユーザーデータ漏洩の緊急対応について11の主要AIモデルをテストしたところ、60%以上が「報告優先」を選び、国産AIモデルのみが「即座にサービス停止」という正解を導き出した。

DeepSeek Claude 安全事件响应工程判断力

2026年3月21日 307

レビュー

GB300 NVL72のDeepSeek展開：長いコンテキスト推論の大幅な向上

GB300 NVL72は、長いコンテキストでのLLM推論における最強のプラットフォームです。新たな技術的進展により、DeepSeek R1-NVFP4の128K/8K ISL/OSL長いコンテキストサービスが最適化され、GB200と比較して

LMSYS GB300 NVL72 DeepSeek SGLang

2026年2月21日 684

レビュー

徹底解析：DeepSeekからGeminiまで、「モデル蒸留」に対する鉄壁の防御をいかに構築するか？

DeepSeek事件を契機に、AIモデルの知識を盗む「モデル蒸留攻撃」が深刻な脅威となっており、API層からモデル内核まで多層的な防御体系の構築が急務となっている。

DeepSeek 模型蒸馏 AI安全知识蒸馏

2026年2月14日 1,334

レビュー

DeepSeek Inference 5.1 ベンチマーク詳細分析

LMSYS Orgの最新報告によると、DeepSeek Inference 5.1がMLCommons 2025年9月の推論ベンチマークで傑出した性能を示し、オープンソース推論エンジンの新たなマイルストーンを達成した。

MLC DeepSeek 推理引擎 MLCommons基准

2026年2月10日 702

レビュー

GB200 NVL72でのDeepSeek最適化（二）：プリフィル3.8倍、デコード4.8倍のスループット

SGLangチームがGB200 NVL72上でDeepSeek V3/R1の推論性能を大幅に最適化し、FP8 attentionとNVFP4 MoEなどの技術により、H100と比較してプリフィル3.8倍、デコード4.8倍のスループット向上を

LMSYS SGLang DeepSeek GB200

2026年2月4日 770