レビュー ROCmがMilesをサポート:AMD GPU上での大規模RL後学習 MilesはオープンソースのRL(強化学習)フレームワークで、AMD GPUのROCm環境での大規模な言語・マルチモーダルモデルの後学習を可能にします。 LMSYS 强化学习 AMD ROCm 2026年3月24日 332