SGLang に関するAIニュース | Winzheng AI ニュース

SGLangがNVIDIA GTC 2026で輝いた瞬間

SGLangチームがNVIDIA GTC 2026に参加し、パネルディスカッション、Happy Hour、200人規模のMeetup、ハンズオントレーニングラボなど5つのイベントを3日間で開催。LLMエコシステムの中心で大きな成果を収めた。

LMSYS SGLang NVIDIA GTC オープンソースAI

2026年4月2日 760

レビュー

SGLangにおけるElastic EP：DeepSeek MoEデプロイメントの部分故障耐性

SGLangがElastic EPを統合し、大規模MoEモデルの推論における部分故障耐性を実現。従来の2-3分のダウンタイムを10秒以下に短縮し、性能を損なうことなく信頼性を大幅に向上させた。

LMSYS SGLang Elastic EP MoE

2026年3月27日 768

レビュー

SGLang が NVIDIA Nemotron 3 Super に Day-0 対応、効率的なマルチエージェントシステムを実現

SGLangがNVIDIA Nemotron 3 Superに即日対応し、1M tokenのコンテキスト長と高効率なMoEアーキテクチャを活用したマルチエージェントシステムの構築を可能にしました。

LMSYS SGLang Nemotron 3 Super 多代理系统

2026年3月12日 1,102

レビュー

SGLang、NVIDIA GB300 NVL72で25倍の推論性能向上を実現

SGLangチームとNVIDIAの協力により、GB300 NVL72上でDeepSeek R1の推論性能がH200比で最大25倍向上し、大規模MoEモデルの展開コストを大幅に削減しました。

LMSYS SGLang NVIDIA GB300 推理性能

2026年3月5日 809

レビュー

GB300 NVL72のDeepSeek展開：長いコンテキスト推論の大幅な向上

GB300 NVL72は、長いコンテキストでのLLM推論における最強のプラットフォームです。新たな技術的進展により、DeepSeek R1-NVFP4の128K/8K ISL/OSL長いコンテキストサービスが最適化され、GB200と比較して

LMSYS GB300 NVL72 DeepSeek SGLang

2026年2月21日 961

レビュー

計算能力の解放：AMD MI300X上でのQwen3とQwen3-VLの究極レイテンシ最適化

Qwen C端インフラエンジニアリングチームとAMD AIフレームワークチームが協力し、AMD Instinct™ MI300X GPUプラットフォーム上でQwen3-235BとQwen3-VL-235Bの極限レイテンシ最適化を実施し、TT

LMSYS Qwen3 Qwen3-VL AMD MI300X

2026年2月13日 1,331

レビュー

AAAI 2025：LMSYS OrgがChatbot Arenaの最新ベンチマークを発表

LMSYS OrgがAAAI 2025大会でChatbot Arenaの最新ベンチマーク結果を発表し、グローバルAIチャットボットランキングを更新すると共に、開発者に貴重なモデル最適化の洞察を提供した。

MLC AAAI 2025 Chatbot Arena Elo Rating

2026年2月10日 4,106

レビュー

MLPerf Auto v0.5 ベンチマーク結果発表：LMSYS Org がトップに

MLCommonsがAutoML分野の権威あるベンチマークテスト「MLPerf Auto v0.5」の最新結果を発表し、大規模言語モデル（LLM）の自動化調整においてLMSYS Orgがトップの成績を収めた。

MLC MLPerf AutoML LMSYS

2026年2月10日 819

レビュー

DeepSeek Inference 5.1 ベンチマーク詳細分析

LMSYS Orgの最新報告によると、DeepSeek Inference 5.1がMLCommons 2025年9月の推論ベンチマークで傑出した性能を示し、オープンソース推論エンジンの新たなマイルストーンを達成した。

MLC DeepSeek 推理引擎 MLCommons基准

2026年2月10日 885

レビュー

ISO-AUS：MLCommonsが新世代AI推論ベンチマークを発表

MLCommonsとLMSYS Orgが共同で、隔離推論シナリオ向けに設計された革新的なAIモデル評価フレームワーク「ISO-AUS」ベンチマークテストを発表した。

MLC ISO-AUS AI基准 LMSYS

2026年2月10日 878

SGLang に関するニュース

SGLangがNVIDIA GTC 2026で輝いた瞬間

SGLangにおけるElastic EP：DeepSeek MoEデプロイメントの部分故障耐性

SGLang が NVIDIA Nemotron 3 Super に Day-0 対応、効率的なマルチエージェントシステムを実現

SGLang、NVIDIA GB300 NVL72で25倍の推論性能向上を実現

GB300 NVL72のDeepSeek展開：長いコンテキスト推論の大幅な向上

計算能力の解放：AMD MI300X上でのQwen3とQwen3-VLの究極レイテンシ最適化

AAAI 2025：LMSYS OrgがChatbot Arenaの最新ベンチマークを発表

MLPerf Auto v0.5 ベンチマーク結果発表：LMSYS Org がトップに

DeepSeek Inference 5.1 ベンチマーク詳細分析

ISO-AUS：MLCommonsが新世代AI推論ベンチマークを発表