レビュー 三大モデルが Smoke ランキング首位に並列、実行は満点も制約に警告 Smoke 本日のクイックテストで Claude Opus 4.7、Claude Sonnet 4.6、GPT-5.5 が 87.76 点で並列首位となり、コード実行は満点だが材料制約次元で warn シグナルが発生した。 Claude Opus 材料约束 Smoke 评测 代码执行 8時間前 36