レビュー 1Tパラメータを秒単位で更新:大規模分散RLにおけるP2P重み転送 SGLangのRLワークロード向けに、従来のNCCLブロードキャスト方式を補完するRDMAベースのポイントツーポイント重み更新メカニズムを導入。1TパラメータのKimi-K2モデルの重み転送時間を53秒から7.2秒へと7倍高速化した。 LMSYS RDMA传输 P2P权重更新 分布式RL 2026年5月2日 526
レビュー Shopify VLM推論ベンチマークテスト詳解 MLCommonsが発表した最新のVLM推論ベンチマークテストにおいて、Shopifyチームが優れた最適化により業界をリードする性能を達成し、電子商取引分野でのVLM実装に新たな基準を示した。 MLC VLM推理 MLPerf基准 Shopify AI 2026年2月10日 515