レビュー Grok 4の材料制約スコアが25.6点急落、4モデルが主要ランキングで満点並び 2026年6月18日のSmoke軽量評価において、Claude Opus 4.7、DeepSeek V4 Pro、豆包 Pro、GPT-o3の4モデルがコード実行と材料制約の両コア指標で100点を獲得し、主要ランキング総合スコア100点を達 Grok 4 材料约束 Smoke评测 执行与约束 17時間前 37