レビュー Qwen Max 安定性が22.8ポイント急落:モデル更新により出力品質に変動 Qwen Maxは今週の評価で極端な二面性を示し、プログラミングや長文処理などの複雑なタスクでは大幅に向上した一方、安定性では崖っぷちのような急落を見せました。 Qwen Max 稳定性测试 AI评测 模型更新 2026年3月22日 296
レビュー Claude 3.5 Sonnetの安定性が23ポイント急落した背後にある技術的真相 Claude 3.5 Sonnet(バージョン4.6)の安定性スコアが54.2から31.2へと42%急落した一方で、プログラミング能力は184%向上するなど、他の評価指標では顕著な改善が見られ、この「トレードオフ」現象の技術的要因を分析する Claude 稳定性测试 AI模型评测 性能分析 2026年3月22日 271