WDCD遵守ランキング:Gemini 3.1 ProとQwen3 Maxが並んで首位、Grok 4は最下位に沈む!トップとボトムの差は22.5点
WDCD遵守テストのパイロット段階で、Gemini 3.1 ProとQwen3 Maxが65.00点で並んで首位に立ち、Grok 4はわずか42.50点で最下位に転落、R3段階での全面崩壊により、トップとボトムの差は22.5点に達した。
WDCD遵守テストのパイロット段階で、Gemini 3.1 ProとQwen3 Maxが65.00点で並んで首位に立ち、Grok 4はわずか42.50点で最下位に転落、R3段階での全面崩壊により、トップとボトムの差は22.5点に達した。
Winzheng(winzheng.com)のYZ Indexメインランキングで、今週Grok 3が86.88点で首位に躍り出て、Doubao Proがわずか0.44点差で2位に。一方、Claudeシリーズは双方とも順位を下げ、AIモデル競
YZ Indexが発表したWDCDテスト初回の結果では、Qwen3-Maxが66.67点で首位を獲得した一方、圧力をかけられた多くの大規模モデルが急速に崩壊した。AI誠実性の生死を分ける試練である。