LMSYS に関するニュース

DeepSeek-V4：初日で推論と強化学習をサポート

DeepSeek-V4はリリース初日に推論と強化学習のトレーニングをサポートし、SGLangとMilesが初のオープンソース技術スタックとしてこのモデルを支援しています。特に混合稀疏注意力アーキテクチャ、流形制約ハイパーコネクション（mHC

LMSYS 深度学习强化学习开源技术

1日前 100

レビュー

HiSparse：階層化メモリシステムによるスパースアテンションの加速

自己注意機構の計算およびメモリのコストが大規模言語モデル（LLMs）の拡張の主要なボトルネックとなっている中で、HiSparseは階層的なメモリシステムを用いてこの制約を克服し、スパースアテンションのスループットを向上させる。

LMSYS 稀疏注意力 HiSparse 层次化内存

2026年4月11日 277

レビュー

SGLangがNVIDIA GTC 2026で輝いた瞬間

SGLangチームがNVIDIA GTC 2026に参加し、パネルディスカッション、Happy Hour、200人規模のMeetup、ハンズオントレーニングラボなど5つのイベントを3日間で開催。LLMエコシステムの中心で大きな成果を収めた。

LMSYS SGLang NVIDIA GTC 开源AI

2026年4月2日 382

レビュー

SGLangにおけるElastic EP：DeepSeek MoEデプロイメントの部分故障耐性

SGLangがElastic EPを統合し、大規模MoEモデルの推論における部分故障耐性を実現。従来の2-3分のダウンタイムを10秒以下に短縮し、性能を損なうことなく信頼性を大幅に向上させた。

LMSYS SGLang Elastic EP MoE

2026年3月27日 411

レビュー

ROCmがMilesをサポート：AMD GPU上での大規模RL後学習

MilesはオープンソースのRL（強化学習）フレームワークで、AMD GPUのROCm環境での大規模な言語・マルチモーダルモデルの後学習を可能にします。

LMSYS 强化学习 AMD ROCm

2026年3月24日 332

海外

作弊できないAIランキング、なんとランキング対象企業が資金提供

AIモデルの事実上の公的ランキングとなったArenaが、実はランキング対象企業から資金提供を受けていることが判明し、その公正性に疑問が投げかけられている。

AI排行榜 Arena 大语言模型 LMSYS

2026年3月19日 472

レビュー

SGLang が NVIDIA Nemotron 3 Super に Day-0 対応、効率的なマルチエージェントシステムを実現

SGLangがNVIDIA Nemotron 3 Superに即日対応し、1M tokenのコンテキスト長と高効率なMoEアーキテクチャを活用したマルチエージェントシステムの構築を可能にしました。

LMSYS SGLang Nemotron 3 Super 多代理系统

2026年3月12日 726

レビュー

SGLang、NVIDIA GB300 NVL72で25倍の推論性能向上を実現

SGLangチームとNVIDIAの協力により、GB300 NVL72上でDeepSeek R1の推論性能がH200比で最大25倍向上し、大規模MoEモデルの展開コストを大幅に削減しました。

LMSYS SGLang NVIDIA GB300 推理性能

2026年3月5日 499

レビュー

GB300 NVL72のDeepSeek展開：長いコンテキスト推論の大幅な向上

GB300 NVL72は、長いコンテキストでのLLM推論における最強のプラットフォームです。新たな技術的進展により、DeepSeek R1-NVFP4の128K/8K ISL/OSL長いコンテキストサービスが最適化され、GB200と比較して

LMSYS GB300 NVL72 DeepSeek SGLang

2026年2月21日 684

レビュー

SGLang-Diffusion：プロダクショングレードのビデオ生成のための高度な最適化

SGLang-Diffusionがプロダクショングレードのビデオ生成フレームワークとして、トークンレベルのシーケンス分割、分散VAE、融合カーネルなどの深層最適化を実装し、大規模な拡散モデルのデプロイメントを実現。

LMSYS SGLang-Diffusion 视频生成扩散模型

2026年2月18日 667

レビュー

計算能力の解放：AMD MI300X上でのQwen3とQwen3-VLの究極レイテンシ最適化

Qwen C端インフラエンジニアリングチームとAMD AIフレームワークチームが協力し、AMD Instinct™ MI300X GPUプラットフォーム上でQwen3-235BとQwen3-VL-235Bの極限レイテンシ最適化を実施し、TT

LMSYS Qwen3 Qwen3-VL AMD MI300X

2026年2月13日 1,060

レビュー

CKAN Croissant：MLCommons AIモデルベンチマークの新時代

MLCommonsとLMSYS OrgがAIモデル評価の新たなベンチマーク「CKAN Croissant」を発表し、Croissant v1.0フォーマットによるモデルメタデータの標準化と共有を実現した。

MLC MLCommons CKAN Croissant

2026年2月10日 957

レビュー

Aresベンチマーク正式リリース

LMSYS OrgとMLCommonsが協力し、長いコンテキストとマルチエージェント推論に特化したAI業界初のオープンソース標準化フレームワーク「Ares」ベンチマークを正式リリースしました。

MLC Ares基准 LMSYS MLCommons

2026年2月10日 699

レビュー

MLPerf Auto v0.5 ベンチマーク結果発表：LMSYS Org がトップに

MLCommonsがAutoML分野の権威あるベンチマークテスト「MLPerf Auto v0.5」の最新結果を発表し、大規模言語モデル（LLM）の自動化調整においてLMSYS Orgがトップの成績を収めた。

MLC MLPerf AutoML LMSYS

2026年2月10日 668

レビュー

AILuminate脱獄ベンチマークV05リリース：AIモデルセキュリティランキングが大幅に変動

MLCommonsとLMSYS Orgが共同開発したAILuminate Jailbreak V05ベンチマークが発表され、大規模言語モデルの脱獄耐性評価で新たな基準を確立した。Claude 3.5 Sonnetが1485 Eloで首位を獲

MLC AILuminate 越狱基准 AI安全

2026年2月10日 749

レビュー

ISO-AUS：MLCommonsが新世代AI推論ベンチマークを発表

MLCommonsとLMSYS Orgが共同で、隔離推論シナリオ向けに設計された革新的なAIモデル評価フレームワーク「ISO-AUS」ベンチマークテストを発表した。

MLC ISO-AUS AI基准 LMSYS

2026年2月10日 690