同じ典型的なSQL連続ログイン問題が、11個の主流モデルを明確に2つの陣営に分けた:8個は完全に正しい回答を出し、3個は完全に崩壊した。
問題では、各ユーザーの最長連続ログイン日数を求めるSQLを書くことが要求された。核心となる難点は、日付を重複排除した後、日付から行番号を引く方法でグルーピング識別子を構築し、各グループの長さを集計することにある。100点を獲得した8つのモデル(豆包Pro、Claude Sonnet 4.6、文心一言4.5、Gemini 2.5 Pro、DeepSeek V4 Pro、Gemini 3.1 Pro、Claude Opus 4.7、GPT-o3)は、すべてこのロジックを正しく実装した。
満点モデルの共通点
これらのモデルのSQL構造はほぼ一致している:まずDISTINCTで重複排除し、次にROW_NUMBERで連番を生成し、最後にDATE_SUB(login_date, INTERVAL rn DAY)でグルーピングキーを構築する。DeepSeek V4 Proの書き方が最もすっきりしており、最後に直接ORDER BY max_streak DESC, user_id ASCを加えて、問題のソート要件を完全に満たしている。Claude Sonnet 4.6とGemini 2.5 Proは、グルーピングキーをgrpまたはstreak_groupと命名し、変数の命名がより明確だが、コアアルゴリズムは完全に同じである。
三<|eos|>
データソース:YZ Index(赢政指数) | Run #122 | 元データを見る
© 2026 Winzheng.com 赢政天下 | 转载请注明来源并附原文链接