レビュー Claude 3.5 Sonnetの安定性が23ポイント急落した背後にある技術的真相 Claude 3.5 Sonnet(バージョン4.6)の安定性スコアが54.2から31.2へと42%急落した一方で、プログラミング能力は184%向上するなど、他の評価指標では顕著な改善が見られ、この「トレードオフ」現象の技術的要因を分析する Claude 稳定性测试 AI模型评测 性能分析 2026年3月22日 271