SGLangがNVIDIA GTC 2026で輝いた瞬間

2026年4月2日 1,002 約9分 LMSYS

LMSYS SGLang NVIDIA GTC 开源AI LLM推理 Miles RL

SGLangチームは盛装してNVIDIA GTC 2026に出席し、パネルディスカッション、Happy Hour、200人のMeetup、そしてハンズオントレーニングラボを開催しました。3日間で5つのイベント、LLMエコシステムの中心に身を置き、多くの収穫を得ました。もし見逃してしまった方のために、ここに完全なレビューをお届けします。

SGLang at GTC 2026：5つのイベント、3日間の盛会。

メインカンファレンスのハイライト

SGLangがGTC基調講演に登場

Jensen HuangのGTC基調講演において、SGLangはNVIDIA AIエコシステムのスライドに含まれ、AIネイティブアプリケーションを支える基盤インフラストラクチャスタックに選ばれる栄誉を得ました。

SGLangがNVIDIA GTC 2026基調講演のAIエコシステムスライドに登場。

📝 X振り返り投稿

GTCオープンソースAIパネルディスカッション

火曜日、Ying ShengがGTCの「オープンソースAIの現状」パネルディスカッションに参加し、NVIDIAの戦略的AI責任者Vartika Singh、応用研究VP Jonathan Cohen、UC Berkeley教授Ion Stoica、Hugging FaceプロダクトVP Jeff Boudier、Ai2マルチモーダルAI責任者Ranjay Krishnaと同じ舞台に立ちました。

議論は、複雑なAIシステムのR&Dの中核エンジンとしてのオープンソースAIの役割に焦点を当てました：オープンソースエコシステムが信頼性、拡張性、本番環境対応をどのように確保するか、そして再現可能で監査可能な研究をサポートするコミュニティインフラについて。

Ying Sheng（左から2番目）がGTC 2026「オープンソースAIの現状」パネルディスカッションに参加。

🎬 NVIDIA On-Demand完全録画

SGLangトレーニングラボ

木曜日の午前、RadixArkチームが公式GTCトレーニングラボを主催：「SGLangを使用した高性能LLMサービングとトレーニング」。

ラボは3つの側面をカバー：

SGLang Cookbookパフォーマンスチューニング：実際のデプロイメントでサービングスループットとレイテンシを向上させる実用的なヒント
パフォーマンスプロファイリングとボトルネック分析：LLMサービングシステムのボトルネックを特定し解決する開発者ガイド
SGLang × Miles RL統合：MilesフレームワークのRLトレーニングループでSGLangを推論バックエンドとして使用する実践デモ

GTC 2026 SGLangトレーニングラボ：ハンズオンLLMパフォーマンスチューニングとRLトレーニング。

🎬 NVIDIA On-Demand完全録画 | 📁 ラボ資料ダウンロード

周辺イベント

SGLang × RadixArk GTC Happy Hour

火曜日の夜、SGLangとRadixArkがGTC Happy Hourを共催し、推論とトレーニングエコシステムのビルダー、研究者、創業者が集結。OpenAI、xAI、DeepMind、Meta、NVIDIA、Ollamaなどの友人も参加しました。

SGLang × RadixArk Happy Hour会場。

当夜の2つの技術的焦点：

Banghua Zhu (RadixArk)：RadixArkとMilesを紹介。大規模MoE後処理用に設計されたSGLangネイティブRLトレーニングフレームワーク。
Jason Zhao (ScitiX)：SiMMを展示。長いコンテキストサービングのためSGLangと統合されたオープンソースインメモリKVキャッシュエンジン。

BanghuaがRadixArkとMiles RLフレームワークを紹介。

Z PotentialsとScitiXのスポンサーシップに感謝。📝 X振り返り投稿

BanghuaがNovita GTCイベントに参加

Banghua Zhuが700人以上規模のNovita GTCイベントに出席。Jensen Huangの推論コストと需要の転換点に関する見解、Agentic AI運動の主要な推進力、AIプロダクトが実際の価値を提供する要素について議論。BanghuaはSGLangが推論インフラの未来をどのように形作り、OpenClawからAgentic推論まで次世代ユースケースをサポートし、オープンソースモデルとインフラの進化を推進するかを共有しました。

BanghuaがNovita GTCイベントで講演。

協力パートナーには、NVIDIA、RadixArk、OpenRouter、Google DeepMind、Kimi (Moonshot AI)、Alibaba Cloud、MiniMax、Z.ai、Hugging Face、Kilo Codeが含まれます。

LinkedIn × SGLang Meetup：検索と推薦のためのLLM

水曜日の夜、LinkedIn Mountain View本社で約200名のエンジニアMeetupを開催し、LinkedIn、TikTok、Meta、NVIDIAチームと本番環境レベルのLLM検索・推薦システムについて深く議論しました。

LinkedIn Meetup SGLangグッズ。

LinkedInエンジニアリング共有

LinkedInが最初の3つのエンジニアリング講演：

Fedor Borisyuk：大規模セマンティック検索
Zhipeng Wang：LLM駆動ランキングモデリング最適化
Sundara Raman Ramachandran：LLM推論インフラ最適化、プリフィル専用サービングパスを含み、H100で2–3倍のスループット向上を実現、すでにSGLangにアップストリーム

LinkedInエンジニアがセマンティック検索、ランキング、推論インフラを共有。

関連研究：[1] [2] など | LinkedInブログ

SGLangロードマップとMilesフレームワーク

SGLangコア開発者Liangsheng Yinが2026年上半期のロードマップを詳説。

Mao ChengがMiles RLフレームワークを紹介、3つのコア技術で本番環境でのトレーニング-推論不一致を解決：

重要度サンプリング補正：トレーニングと推論の分布シフトを補償
推論-トレーニング整合：ロールアウト動作と勾配更新の一貫性を確保
Rollout Routing Replay (R3)：リプレイベースルーティング、生成されたロールアウトデータの利用率を向上

Mao ChengがMiles RLフレームワークとトレーニング-推論整合手法を解説。

業界講演

Hongyu Lu (TikTok)：大規模LLM検索
Luke Simon & Xi Liu (Meta)：Generative Reasoning Reranker 論文
Anish Maddipoti (NVIDIA)：Dynamo + NeMoRL

パネルディスカッション

Qing Lanが司会を務めるクロージングディスカッション、ゲストはWenfeng Zhuo、Fedor Borisyuk、Luke Simon、Mao Cheng。トピックは以下を含む：

セマンティックID vs. 埋め込み検索
統合検索+ランキング（OneRecスタイルシステム）は本番環境対応か
LLM推薦システムにおける推論とトレーニングの課題
LLM推薦採用を加速する近い将来のブレークスルー
本番推薦システムにおける継続的学習の役割

クロージングディスカッション：Wenfeng Zhuo、Fedor Borisyuk、Luke Simon、Mao Cheng、司会Qing Lan。

これこそが次世代推薦システムを定義するコラボレーションパターンです：本番環境チームとオープンソースインフラが共に進化。📝 LinkedIn振り返り投稿

未来への展望

GTC 2026は、本番環境エコシステムがオープンソースインフラを中心に加速的に融合していることを浮き彫りにしました。LinkedInスケールのセマンティック検索から、最先端MoEモデルのRL後処理まで、SGLangはますます基盤となる共有レイヤーになっています。私たちは引き続きオープンソースで構築し、Lumaカレンダーで今後のMeetupとオフィスアワーをチェックしてください。