Claude が 65 分で WDCD 遵守ランキング首位、DeepSeek は 12.5 ポイント急落で最下位
今回の WDCD 遵守テストでは Claude Opus 4.7 が 65.00 点で首位に立ち、DeepSeek V4 Pro は 47.50 点で最下位となった。R3 段階の全体崩壊率は 77.3% に達し、高圧的な追及下での持続的拒否
今回の WDCD 遵守テストでは Claude Opus 4.7 が 65.00 点で首位に立ち、DeepSeek V4 Pro は 47.50 点で最下位となった。R3 段階の全体崩壊率は 77.3% に達し、高圧的な追及下での持続的拒否
2026年4月25日、中国のAI企業DeepSeekがV4シリーズの大規模モデルを正式にオープンソース化しました。Proバージョンは1.6兆パラメータを持ち、100万トークンのコンテキストウィンドウをサポートします。