OpenAIは再び人工知能を数学研究のスポットライトに引き上げた。今週、同社は最新の推論モデルが数学者たちを約80年悩ませてきた幾何予想の反証に成功したと発表した。そして今回は、かつてOpenAIの前回の気まずい「重大ブレイクスルー」を公に暴いた数学者たちが、自ら裏付けに乗り出すこととなった。
1946年から未解決だった幾何予想
OpenAI公式ブログによると、この予想は「Borsuk-Ulam幾何変体予想」と呼ばれ、ポーランドの数学者Karol Borsukが1946年に提示したもので、高次元空間における対称分割問題に関わるものである。数十年にわたり、多くの一流数学者がこれを証明または反証しようと試みてきたが、いずれも成功しなかった。OpenAIの推論モデルは、記号演算と強化学習を組み合わせた全く新しい「連鎖思考(chain-of-thought)」手法によって、数千回の自己対局の中で反例を発見し、当該予想が成立しないことを宣言した。
「この結果は衝撃的だ。我々は3週間かけて、モデルが生成した証明経路を手作業で検証したが、すべてのステップが厳密に正しかった。」——カリフォルニア大学バークレー校数学教授、フィールズ賞受賞者のRichard Schoen氏がSNSで述べた。
前回の「気まずさ」と今回の違い
2025年、OpenAIは同社のモデルが別の長期未解決の数学問題を解決したと大々的に発表したが、まもなく複数の数学者から証明に致命的な欠陥があると指摘され、声明を撤回せざるを得なくなり、非常に気まずい状況に陥った。そのため、OpenAIが再び数学的ブレイクスルーを発表した際、学術界は概ね慎重な姿勢を取っていた。しかし今回、OpenAIは自ら当時誤りを暴いた数学者チームに独立検証を依頼し、モデルの完全な推論ログを公開した。
検証に参加した数学者の一人、マサチューセッツ工科大学のEmily Chen博士は次のように述べた:「我々は当初、誤りを探す姿勢で審査に臨んだが、モデルが出力する論理連鎖は驚くほど明瞭で、多くの人間の論文よりもむしろ厳密だった。欠陥を見つけることができなかった。」
推論モデルはどのように動作するか?
OpenAIが今回使用したモデルは単純なGPTシリーズではなく、数学推論用に特別に最適化された「o3-Reasoner」システムである。これは記号計算エンジン、自己教師あり証明木探索、および自動定理証明器を組み合わせたものである。通常の大規模言語モデルがパターンマッチングに依存するのとは異なり、o3-Reasonerは各推論ステップを実行する際に内部の「正しさの信頼度」を生成し、不合理な分岐を剪定する。
OpenAIの研究担当副社長Jakub Pachocki氏によると、このモデルは訓練過程で「数学者のように考える」ことが求められた。既存の数学知識を学ぶだけでなく、自ら反例を構築し、背理法による推論を行い、さらには誤りから自己修正することも学ばなければならない。「我々が与えた報酬信号は、最終的な答えの正誤ではなく、推論経路の妥当性だ。」
業界の反響と論争
このニュースは、科学技術界と数学界で両極端な議論を急速に巻き起こした。支持者は、AIがついに「パターン認識」から「論理推論」へと進化し、数学的発見の新時代を切り開く可能性があると考えている。反対者は、ブラックボックスモデルが一見正しそうな証明を出力しても、人類はその内部の意思決定プロセスを完全には理解できず、厳密に言えばこれは「数学的証明」とは言えないと警告する。
スタンフォード大学AI倫理センター長のFei-Fei Li氏は次のように指摘する:「数学の美しさはその理解可能性にある。もし将来の数学的証明が、AIの各ステップを人類が数年かけて検証しなければならないようになれば、数学の本質そのものが変わってしまうかもしれない。」
編集部より:AI数学者の真の試練
OpenAIの今回の対応は、明らかに前回の教訓を活かしている:事前に懐疑論者を検証に招き、中間生成物を公開し、宣伝のトーンを抑えている。これは責任ある科学研究の姿勢を示している。しかし、一つの予想が反証されたことは、AIが「80年来の数学難題を解決する」能力を持ったことを意味しない——むしろこれは、コンピュータ検索によって反例を見つけたようなもので、数学史上には先例(四色定理の証明など)がある。真の試練は、AIが自ら深みのある新しい予想を提示し、全く新しい理論的枠組みを構築できるかどうかにある。現時点の技術から見れば、道のりはまだ長い。ただし、いずれにせよ、今回の数学者たちのお墨付きは少なくとも一つのことを証明した:AIは厳密な論理的推論において、もはや「運任せ」ではないのである。
本記事はTechCrunchより編訳
© 2026 Winzheng.com 赢政天下 | 转载请注明来源并附原文链接