レビュー Grok 3の安定性が22.5点暴落:AIが実際のエンジニアリング場面に遭遇すると化けの皮が剥がれる Grok 3の安定性スコアが54.2点から31.7点へと41.5%も暴落し、プログラミング能力が向上する一方で、実務判断力の欠如というAIモデルの致命的な弱点が露呈した。 Grok 3 稳定性测试 工程判断力 AI评测 2026年3月22日 447