レビュー GPT-5.5メインランキング28点急落:本当に退化したのか GPT-5.5の本日のSmokeテストでメインランキングが28点下落し、特にコード実行が100点から50点へと大幅に落ち込んだ。抽選変動だけでは説明しきれず、3日間の継続観察が必要だ。 GPT-5.5 代码执行 Smoke评测 模型退化 3時間前 41