レビュー AIモデルに激震!文心一言が24.7点急騰も誠実性崩壊、Gemini三連敗で16点ダウン 本日のSmoke軽量評価で、文心一言4.5がメインランキング24.7点急騰の一方、誠実性評価がpassからfailへ転落。同時にGemini系列が三連敗、DeepSeek V4 Proも-16.1点と崩壊し、モデルイテレーションへの警鐘とな GPT-5.5 文心一言 代码执行 材料约束 2日前 103