レビュー GPT-5.5 が 23 点急落、Claude 2 モデルが 34 点逆転:Smoke 7 日間データが明かす真の動向 Smoke 7 日間連続クイックテストの結果、首位だった GPT-5.5 は 23.1 点急落した一方、Claude の 2 モデルは 30 点超の逆転劇を演じた。ただし、安定性の低さが信頼性に影を落としている。 Claude Opus 4.7 稳定性 Smoke 评测 诚信评级波动 10時間前 83