レビュー ROCmがMilesをサポート:AMD GPU上での大規模RL後学習 MilesはオープンソースのRL(強化学習)フレームワークで、AMD GPUのROCm環境での大規模な言語・マルチモーダルモデルの後学習を可能にします。 LMSYS 强化学习 AMD ROCm 2026年3月24日 332
レビュー Miles発表:大規模MoEトレーニングのためのエンタープライズ級RLフレームワークを点火 大規模MoEトレーニングと本番ワークロード向けに設計されたエンタープライズ級強化学習フレームワーク「Miles」をリリース。軽量RLフレームワーク「slime」をベースに、信頼性、スケーラビリティ、制御性を強化。 LMSYS Miles 强化学习 MoE训练 2026年2月4日 661