GLM 5.2が最前線エージェントレベルに到達:オープンソース744BモデルがサイバーセキュリティタスクでOpusおよびGPT-5.5に迫る

近日、中国チームが発表したGLM 5.2は、複数のエージェントベンチマークテストで優れた性能を示し、特にサイバーセキュリティのシナリオにおいて、Claude OpusやGPT-5.5などのクローズドソース最前線モデルに迫る結果を達成した。この進展はグローバルなオープンソースコミュニティの高い注目を集め、専門垂直領域における大規模モデルの応用に新たな参考事例を提供している。

GLM 5.2は7,440億パラメータの規模を採用し、100万トークンの超長コンテキストウィンドウをサポートしている。サイバーセキュリティエージェントタスクにおいて、同モデルは脆弱性分析、脅威インテリジェンスの抽出、攻撃経路のシミュレーションといった複雑なプロセスを自律的に完了でき、総合スコアとクローズドソースモデルとの差は5%以内に縮まった。研究チームはトレーニングの詳細を開示していないが、コミュニティでは知識蒸留と新型アーキテクチャの最適化を組み合わせた可能性が広く指摘されている。

技術的な観点から見ると、100万トークンのコンテキストにより、大規模なコードベースや長大なセキュリティログを一括処理することが可能となっており、これは実際の展開において極めて重要である。従来バージョンと比較して、GLM 5.2はマルチステップ推論とツール呼び出しの正確率が大幅に向上し、一部のサブタスクはすでに本番運用レベルに達している。

オープンソースコミュニティでの議論はコストと性能のバランスに集中している。744Bパラメータモデルは推論コストが高いものの、オープンソースの重みにより研究機関や企業が独自に展開方法を最適化できる。一部の開発者はすでに量子化とMoEルーティングによるVRAM使用量の削減を試みており、初期の結果では推論速度を2〜3倍向上できることが示されている。

業界アナリストは、今回のブレークスルーがサイバーセキュリティ分野へのAI浸透を加速させる可能性があると指摘している。従来のルールエンジンは新型攻撃への対応が困難であるのに対し、エージェントモデルは脅威環境に動的に適応できる。GLM 5.2のオープンソースという特性は、中小企業の利用ハードルを下げ、セキュリティ自動化の普及を促進することが期待される。

ただし、専門家は同時に、モデルの性能が近づいたからといって人間の作業を完全に代替できるわけではないと警告している。サイバーセキュリティは法律遵守や倫理的判断を伴うため、依然として人間の専門家による検証が必要である。また、オープンソースモデルは重みの悪用リスクにも直面しており、適切な利用規範の整備が求められる。

長期的に見ると、GLM 5.2の発表はオープンソースモデルがエージェント能力において重要な一歩を踏み出したことを示している。今後もイテレーションのペースを維持できれば、より多くの垂直領域においてクローズドソースモデルと並行する技術路線を形成し、グローバルなAIエコシステムにより多様な選択肢をもたらすことが期待される。