編集者注:大規模モデルが「使えるもの」から「使いやすいもの」へと進化する中、推論効率が勝敗を左右するカギとなっている。OpenAIとBroadcomの最新の協業は、単なる技術的な提携にとどまらず、AIコンピューティングパワーの構図を塗り替える可能性を秘めている。
最強タッグ:推論専用に設計されたチップ
Ars Technicaの報道によると、OpenAIとチップ大手のBroadcomは2026年6月25日、大規模言語モデル(LLM)の推論タスク専用に設計されたカスタムチップの開発完了を共同発表した。このチップはBroadcomの先進的なASIC(特定用途向け集積回路)設計手法を採用し、Transformerアーキテクチャにおける高並列な行列演算とアテンション機構を深く最適化することで、より低消費電力・小チップ面積で汎用GPUの数倍に及ぶ推論スループットの実現を目指している。
OpenAIのCEO Sam Altmanは声明で「GPT-6などのより大規模なモデルが普及するにつれ、推論コストは広範な展開を阻む核心的なボトルネックとなっている。Broadcomとの協業により、シリコンレベルから推論効率を根本的に再考することが可能となり、AIをより身近で持続可能なものにしていく」と述べた。BroadcomのCEO Hock Tanは、このチップが「AI専用ハードウェアのマイルストーン」であると強調し、Broadcomが成熟した7ナノメートルおよびそれ以上の先進プロセスを活用して量産を行うことを明らかにした。
背景:大規模モデル推論におけるコンピューティングパワーの飢え
今年に入り、AI推論コンピューティングパワーへの世界的な需要は指数関数的な増加を示している。OpenAIのGPT-6モデルを例に挙げると、1回の推論に必要な浮動小数点演算量はGPT-4の10倍を超える一方、応答時間への要求はさらに厳しくなっている。従来のGPUはトレーニング段階では優秀なパフォーマンスを発揮するものの、推論シナリオではメモリ帯域幅と電力効率の面で理想的とは言えず、コスト面での課題に直面することが多い。専用推論チップがこの難題を解決する必然的な道筋であるというのが業界の共通認識となっている。
「チップ業界のムーアの法則はAIによって再定義されつつある。カスタマイズされたASICは大規模モデル時代の『新たな石油』となるだろう。」——市場調査機関Omidiaのアナリスト
実際、GoogleのTPUからAmazonのTrainium/Inferentia、さらにはMicrosoftとAMDの共同カスタムソリューションに至るまで、テック大手はすでに独自開発または共同カスタムによるAIチップへの取り組みを始めていた。OpenAIが今回Broadcomと手を組んだことで、ハードウェアエコシステムにおける重要なピースが埋まることになる。
技術的な特長と潜在的な影響
このプロジェクトに近い関係者によると、同チップは革新的なニアメモリコンピューティングアーキテクチャを採用しており、一部のウェイトを演算ユニットの近傍に直接統合することで、データ転送に伴うレイテンシと消費電力を大幅に削減している。また、動的精度調整をサポートしており、出力品質を損なうことなく精度を下げることで速度を向上させることができる。初期テストによると、同等コストの条件下で、このチップはGPT-6の推論タスクをNVIDIAのH200 GPUの3倍の速度で処理し、消費電力を60%削減できるとされている。
この数値が事実であれば、AI推論市場におけるNVIDIAの支配的地位に直接的な打撃を与えることになる。NVIDIAはすでにGrace Hopper超大型チップやBlackwellアーキテクチャを発表しているが、専用ASICの的を絞った最適化を前にして、その汎用性という優位性が薄れる可能性がある。さらに、このチップの登場はOpenAIのクラウドサービス値下げ戦略を加速させ、開発者がより低コストで大規模モデルAPIを利用できるようになることも期待される。
エコシステムと課題
ただし、専用チップの成功はハードウェア自体だけでなく、ソフトウェアエコシステムのサポートにも大きく依存する。Broadcomは完全なSDK、コンパイラ、および主要フレームワークへの対応を提供する豊富な経験を持ち、OpenAIは膨大な開発者コミュニティと応用シナリオを有している。両社はこのチップをまずMicrosoft AzureとOpenAI自身の推論クラスターに展開し、将来的にはサードパーティのクラウドコンピューティングベンダーへの開放も検討している。
アナリストは、カスタムチップの高い研究開発費用と長い開発サイクルが主なリスクであると指摘している。しかし、OpenAIとBroadcomそれぞれのリソースと強みを考慮すると、この協業は2年以内に大規模な実用化を実現する可能性が高い。その時点でAI推論のコスト曲線は急激な下降を迎え、さらに多くのリアルタイムインタラクティブAIアプリケーションの誕生を促すことになるだろう。
本稿はArs Technicaより編訳
© 2026 Winzheng.com 赢政天下 | 转载请注明来源并附原文链接