NVIDIA副社長、AI演算コストが従業員給与を大幅に上回ると発言 経済性めぐり議論白熱

NVIDIA副社長のBryan Catanzaro氏が先日、自チームのAI演算コストが既に従業員給与を大幅に上回っていると述べた。この情報は複数のソースから確認されている。

なぜ演算コストが人件費を上回るのか

AIシステムの稼働は大規模なGPUクラスタに依存する。現在主流の学習プロセスを例にとると、1000億パラメータ規模のモデル1回の学習には数千枚の高性能GPUを数週間連続稼働させる必要がある。電気代、サーバールームの冷却、ハードウェアの減価償却が主な支出を構成する。Catanzaro氏の発言は、単発の実験ではなく、日常的な推論および反復段階での累積消費を指している。

従業員給与は固定費だが、演算需要はモデル規模とユーザー数に比例して線形的に上昇する。2026年5月のデータでも、1枚あたりの日次電気代と減価償却を合わせると、一部地域のエンジニアの月給水準に迫っていることが示されている。大規模に展開すれば、総量差はさらに拡大する。

技術レベルでのコスト構成

演算コストは3つに分解できる:ハードウェア調達、電力・冷却、ソフトウェアスケジューリング効率である。ハードウェアは18ヶ月ごとに世代交代し、旧型カードの稼働率低下は潜在的な無駄をもたらす。電力コストはデータセンターの立地に左右され、液冷方式はPUEを下げられるものの、初期改修費用が高額である。スケジューリングアルゴリズムがGPUを十分に活用できなければ、アイドル率の上昇がそのまま1タスクあたりのコストを押し上げる。

  • ハードウェア減価償却:主流の学習用カードの寿命は約3年
  • 電力比率:一部クラスタでは総コストの40%超
  • 稼働率:未最適化クラスタでは30%以上のアイドル率が一般的

業界への影響

コスト構造の変化は、企業にAIプロジェクトの優先順位再評価を迫っている。スタートアップは固定資産への投資を避けるため、自社クラスタ構築よりも外部APIの利用を志向する傾向が強まっている。一方、大手テック企業は内製チップと液冷技術の開発を加速させ、tokenあたりの推論コストを1桁下げることを目標としている。

2026年には、一部のクラウドサービス事業者が価格戦略を調整し、長時間占有するGPUインスタンスに対してより高額な料金を課すようになった。これは下層の演算リソースの希少性を直接反映するものである。

今後の最適化の方向性

演算コスト低減の主な方向性として、モデル圧縮、スパース計算、新アーキテクチャがある。モデル蒸留は精度低下を制御可能な範囲に抑えつつパラメータ数を削減できる。スパース注意機構は必要な計算ユニットのみを活性化する。新型チップは特定の演算子向けに最適化され、理論ピーク稼働率は汎用GPUを上回る。