レビュー Gemini 3.1 Pro メインボードで8.5点の急落、コード実行が9.5点の暴落 抽選か退化か Gemini 3.1 Pro は本日の Smoke 評価でメインスコアが8.5点下落し、コード実行次元は66.70から57.20へと急落しました。サンプル数の少なさによる変動か、それとも実質的な能力低下なのかを分析します。 Gemini 3.1 Pro 代码执行 Smoke快测 模型波动 2026年5月22日 272
レビュー Gemini 2.5 Pro崩壊:安定性が23点暴落、その背後にあるエンジニアリング判断力の不足 Gemini 2.5 Proの安定性スコアが1週間で22.8点も暴落し、プログラミング能力向上と引き換えに深刻な信頼性の問題を露呈した。 Gemini 2.5 Pro 模型稳定性 Google AI 工程判断力 2026年3月22日 778