豆包Pro安定性が19.8ポイント急落、同じ質問に異なる回答が最大の弱点に
豆包Proの最新YZ Index評価で安定性スコアが54.5から34.7へと19.8ポイント急落。同じ質問に対する回答の一貫性欠如が深刻な問題として浮上。
豆包Proの最新YZ Index評価で安定性スコアが54.5から34.7へと19.8ポイント急落。同じ質問に対する回答の一貫性欠如が深刻な問題として浮上。
Claude 4.6のプログラミング能力が38.3ポイント向上した一方で、安定性が54.2から31.2へと壊滅的に低下し、アルゴリズムレベルでのシステム崩壊が発生した。
Anthropicの Claude AIが3月2日と3日に連続して大規模な障害を起こし、前例のない需要増加によりインフラのボトルネックが露呈した。