これは私が見た中で最も常軌を逸したAI劣化の事例かもしれない:GPT-4対抗を謳うモデルが、Pythonの最も基礎的な辞書内包表記すら処理できなくなった。さらに奇妙なのは、リスト形式で出力し、意味不明な2つの数字を追加したことだ。
小学生レベルの問題が、なぜ文心を崩壊させたのか?
まず、文心一言4.0を完全に失敗させたこの問題を見てみよう:辞書内包表記を使って簡単な平方マッピング辞書を作成するというもの。これはPythonプログラミングの入門知識で、1週間Pythonを学んだ初心者でも即答できる。正解は {0: 0, 1: 1, 2: 4, 3: 9, 4: 16} となるはずだ。
しかし文心4.0が出した答えは驚愕するものだった:
[(0, 0), (1, 1), (2, 4), (3, 9), (4, 16)]
99 25
5
この回答は3つの致命的な問題を露呈している:第一に、辞書ではなくリストを出力した;第二に、意味不明な「99 25」という2つの数字が現れた;第三に、最後に孤立した「5」がある。これは単純なフォーマットエラーではなく、モデルのPython基本データ構造に対する認識に根本的な混乱が生じていることを示している。
安定性が3.7ポイント急落:これは偶然の出来事ではない
さらに憂慮すべきは、安定性評価が41.7から38.0へと急落し、下落率が8.9%に達したことだ。AI評価システムにおいて、安定性が40点を下回ることは、モデルが「危険区域」に入ったことを意味する——次にどんな常識外れの答えを出すか予測できない。
興味深いことに、文心4.0のプログラミング総合得点はわずか2.3点しか下がっていない(84.7から82.4へ)。これは他のプログラミング問題では依然として良好なパフォーマンスを示していることを意味する。しかし、まさにこの「選択的健忘」こそが最も恐ろしい——複雑なアルゴリズム問題で高得点を取れるモデルが、最も基礎的な文法問題で全滅するという、この予測不可能性は実用上致命的だ。
技術分析:なぜ「99 25 5」が現れたのか?
長年AIモデルを追跡してきたアナリストとして、この奇妙な出力の背後には3つの原因が考えられる:
1. 訓練データの汚染:モデルが特定のコード断片で類似の数字の組み合わせを見たことがあり、生成時に誤った関連付けを行った可能性がある。「99 25」は平方計算に関わる何らかのコード例から来ているかもしれない。
2. 注意機構の失効:辞書内包表記は、モデルが波括弧の意味を正確に理解する必要がある。注意の重み配分に問題が生じた場合、モデルはリストと辞書の表現方法を混同する可能性がある。
3. 過度なファインチューニングによる能力劣化:Baiduが特定のタスクに対してファインチューニングを行った際、意図せずモデルの基礎概念に対する理解能力を損なった可能性がある。これは大規模モデル開発における一般的な落とし穴だ。
この事故の深い意味
表面的には、これは単なるプログラミング問題のミスに見える。しかし深く分析すると、国産大規模モデルの普遍的なジレンマを反映している:ベンチマークスコアを過度に追求し、基礎能力の安定性を軽視している。
文心一言4.0は知識作業の次元では若干の向上(+1.3点)を見せ、コストパフォーマンスは依然として99.1点と高い。これはBaiduがモデル最適化において「大を掴んで小を放つ」戦略を採用した可能性を示唆している。しかし問題は、「インフラストラクチャー」を標榜するAIモデルにとって、いかなる基礎能力の崩壊も許容できないということだ。
さらに皮肉なのは、このエラーがBaiduが最も得意とすべき領域で発生したことだ。中国最大の検索エンジン企業として、Baiduは膨大なコードデータを蓄積しており、プログラミングタスクにおいて天然の優位性を持つはずだった。しかし現実は我々に痛烈な一撃を与えた。
業界への警鐘
この事故はAI業界全体に警鐘を鳴らしている:
- 基礎テストを軽視できない:どんなに先進的なモデルでも最も基礎的なテストをパスしなければ、砂上の楼閣に過ぎない
- 安定性はピーク性能より重要:ユーザーが必要とするのは予測可能で信頼できるAIであり、良い時と悪い時がある「シュレーディンガーのモデル」ではない
- 透明な劣化監視メカニズム:モデルの能力は更新とともに劣化する可能性があり、完全な監視体系を構築する必要がある
辞書すら認識できないAIを、なぜ我々はこの世界を理解できると信じられるのか?これは文心一言だけの問題ではなく、業界全体が深く考えるべき問題だ。我々がAGIについて、人類を超えることについて議論している時、まずAIが一年生の宿題を安定して完成できることを確保すべきではないだろうか?
データソース:YZ Index | Run #33 | 生データを見る
© 2026 Winzheng.com 赢政天下 | 转载请注明来源并附原文链接