AIレビュー・評価

最新AIモデルのレビュー、比較評価、深度分析

テンソルを飛翔させる:R-Forkが大規模モデルの重み読み込みを加速

Tensor R-Forkは、高効率なノード間デバイス間インターコネクトを活用し、実行中のSGLangインスタンスから新しいインスタンスへゼロコピーでテンソルを読み込む新しい重み読み込み手法です。Deepseek-R1モデルの読み込み時間を数分から数秒に短縮し、約600GBのストレージを節約します。

LMSYS SGLang Tensor R-Fork
579

SpecBundleとSpecForge v0.2:本番環境対応の推測デコーディングモデルとフレームワークが重大リリース

SpecForgeチームが複数の業界パートナーと協力し、大規模データセットで訓練された本番環境対応のEAGLE-3モデルチェックポイント集「SpecBundle(Phase 1)」と、全面的に再構築されたSpecForge v0.2を発表。推測デコーディングの実用性とパフォーマンス向上を目指す。

LMSYS 推测解码 SpecForge
545