GPT-5.5、ネットセキュリティテストでMythos Preview版に追いつく

2026年5月2日 591 約6分 Ars Technica

GPT-5.5 网络安全 AI模型对比 Mythos Preview 科技测评

GPT-5.5、ネットセキュリティテストでMythos Preview版に追いつく

AI駆動型サイバーセキュリティ分野において、モデル能力に関する議論が転換点を迎えつつある。Ars Technicaが入手した最新テストレポートによると、OpenAIのGPT-5.5は複数のサイバーセキュリティベンチマークテストにおいて、今春話題を呼んだMythos Preview（神話プレビュー版）と同等の成績を記録した。この結果は業界に瞬く間に衝撃を与えた——これまでMythos Previewはサイバー攻撃シミュレーションでの驚異的なパフォーマンスから、一部の観測者によって「AIセキュリティ能力の分水嶺」と称されていたためだ。

テスト詳細：誰が誰を追いかけているのか？

本テストは独立系セキュリティ研究機関CyberBenchが主導し、レッドチーム対抗、脆弱性発掘、防御戦略生成などのコアタスクにおける複数の最先端大規模言語モデルのパフォーマンスを評価した。結果として、GPT-5.5は「ゼロデイ脆弱性発見効率」と「適応型攻撃シーケンス生成」の2つのサブ項目でMythos Previewと同等のスコアを獲得し、「複雑な多段階攻撃シミュレーション」のみでわずかに遅れを取った。

「これは特定モデルのブレイクスルーではない」とテストレポートの主執筆者でCyberBenchの主席アナリストであるエレナ・バスケス（Elena Vasquez）氏は指摘する。「GPT-5.5の成績は、トップモデルが互いの長所を取り入れ、セキュリティ能力の軍拡競争が急速にフラット化していることを示している」。同氏はさらに、Mythos Previewはこれまで過剰に持ち上げられており、その優位性はわずかな特定の攻撃ベクトルに集中していたに過ぎないと強調した。

Mythos Preview：神話から平凡へ

Mythos Previewはあまり知られていないセキュリティAIスタートアップによって開発され、4月初旬の発表時には「90%以上の一般的脆弱性を独立して発見できる」と謳い、デモンストレーションでは複数のエンタープライズ級ファイアウォールを突破することに成功していた。このニュースは複数のセキュリティ企業の株価を変動させたほどだ。しかし、今回のテストはその限界を露呈した：防御戦略生成と誤検知率の制御において、GPT-5.5のパフォーマンスはMythosをも上回っていたのだ。

OpenAIはテスト結果に直接回答していないが、同社のセキュリティチームはブログで、GPT-5.5が「敵対的訓練蒸留（adversarial training distillation）」技術を採用し、実際の攻防データ上で繰り返しイテレーションを行うことで、脅威分析能力を大幅に向上させたと明かした。これはMythos Previewが依拠していた「シミュレーション強化学習」ルートとは対照的だ。

編集者注：ブレイクスルーの真偽の駆け引き

テクノロジー業界は常に「次の大きなブレイクスルー」を信奉しているように見える。しかし歴史は繰り返し証明している——真の進歩は漸進的な統合と最適化から生まれることが多いのだと。GPT-5.5がMythos Previewに追いついたということは、根本的なアーキテクチャ変革なしに、訓練方法とデータエンジニアリングによって大幅な能力向上が可能だということを意味している。これは「破壊的イノベーション」を追い求めて巨額の投資を行うスタートアップにとって、まさに警鐘となるだろう。

一方で、サイバーセキュリティの攻防という本質は、永続的なリードが存在しないことを決定づけている。Mythosの「神話」は完全に崩れることはないかもしれないが、私たちに思い出させる——AIセキュリティ競争においては、一鳴驚人よりも持続的なイテレーションのほうが重要であると。企業のセキュリティチームは単一モデルを盲信すべきではなく、多層的かつ複数モデルが連携する防御体系を構築すべきだ。

影響と展望

アナリストは、このテスト結果がAIセキュリティ分野の標準化プロセスを加速させると予測している。CyberBenchは、異なるネットワーク環境下でのモデルのロバスト性テストを含む、より包括的な評価フレームワークの発表を計画している。同時に、OpenAIとMythosの競争も、次世代モデルが現実世界での展開でより厳しい試練を受けることを促すだろう。

しかし、一部のセキュリティ専門家は懸念を表明している：主流AIモデルのセキュリティ能力が同質化に向かうと、攻撃者もこの同質化を利用してより効率的な「汎用敵対的サンプル」を設計する可能性があるという。今後は、絶対的な能力よりも、差別化されたセキュリティ戦略と防御の多様性のほうが注目に値するかもしれない。

本記事はArs Technicaから編訳した

GPT-5.5、ネットセキュリティテストでMythos Preview版に追いつく

テスト詳細：誰が誰を追いかけているのか？

Mythos Preview：神話から平凡へ

編集者注：ブレイクスルーの真偽の駆け引き

影響と展望

関連記事