レビュー GLM-4.6、資料制約25点・コード実行88.7点・誠実性プローブがゼロ GLM-4.6は2026-07-05 Run#214のSmokeクイックテストにおいて、コード実行で88.70点を記録した一方、資料制約は25.00点にとどまり、誠実性評価はfailと判定された。同日テストされた11モデルの中で、誠実性プロ GLM-4.6 材料约束 诚信评级 Smoke快测 7時間前 71