レビュー 11モデルが同じSQL定着率問題に挑戦:9社が0点、DeepSeekとGrokのみ66.7点 YZ Index v6のコード実行テストにおいて、「SQL:月次定着率Cohort」という問題で11モデルの実力差が明らかになった。9モデルが0点を取り、DeepSeek V4 ProとGrok 4のみが66.7点を獲得した。 代码执行 材料约束 SQL留存测试 模型对比 6時間前 42