DeepSeek新モデルV4プレビュー版発表、長文処理能力が注目の的に
中国AI企業DeepSeekが新しいフラッグシップモデルV4のプレビュー版を発表し、長文処理能力が特に注目されています。このモデルはAI技術の発展における重要な意義を持ち、業界の注目を集めています。
中国AI企業DeepSeekが新しいフラッグシップモデルV4のプレビュー版を発表し、長文処理能力が特に注目されています。このモデルはAI技術の発展における重要な意義を持ち、業界の注目を集めています。
DeepSeekは中国のAI分野でのリーダー企業として、最新のV4モデルを発表しました。このモデルは技術的な進化を遂げただけでなく、引き続きオープンソースの特性を保ち、業界の発展に新たな活力を注入しています。
SGLangがElastic EPを統合し、大規模MoEモデルの推論における部分故障耐性を実現。従来の2-3分のダウンタイムを10秒以下に短縮し、性能を損なうことなく信頼性を大幅に向上させた。
Anthropicは、中国のAIラボDeepSeek、Moonshot、MiniMaxが24,000個の偽アカウントを使用してClaudeモデルのコアAI能力を抽出しようとしたと告発した。この事件は、米国政府内でAIチップ輸出規制に関する激
GB300 NVL72は、長いコンテキストでのLLM推論における最強のプラットフォームです。新たな技術的進展により、DeepSeek R1-NVFP4の128K/8K ISL/OSL長いコンテキストサービスが最適化され、GB200と比較して
中国のオープンソースAIは追随者からリーダーへと変貌を遂げている。米国のチップ禁輸に直面し、中国の開発者はオープンソース路線に転換、コスト削減だけでなくグローバルな影響力を構築している。
LMSYS Orgの最新報告によると、DeepSeek Inference 5.1がMLCommons 2025年9月の推論ベンチマークで傑出した性能を示し、オープンソース推論エンジンの新たなマイルストーンを達成した。