AIデータセンター投資は既に破綻しているのか:湯之上隆のナノフォーカス(92)(2/4 ページ)
AIデータセンターへの投資は異常なほど過熱している。だが、この分野の投資はGPU/広帯域メモリ(HBM)/電力コストなどの要素と制約が絡み合い、ある「ライン」を超えると一気に崩壊する可能性が高い。今回は、GPU/HBM/電力コストから「AIデータセンター投資の破綻ライン」を逆算してみる。
第2章 AIデータセンターのコスト構造
これほどまでに投資が膨張している理由は、AIデータセンター特有のコスト構造にある。まず、AIデータセンターのコスト構造および市場レンジを推定する(図4)。
図4:AIデータセンターのコスト構造、市場レンジ(記事に記載した代表値)[クリックで拡大] 出所:各種市場調査、ベンダ見積レンジ、業界アナリスト推計、TrendForceを始めとする各種メモリ市場レポート、NVIDIA仕様などを基に筆者作成
第一にGPUである。現在のAIインフラは、圧倒的にNVIDIA製GPUに依存している。例えばH100のシステム価格は構成にもよるが1基当たり約2.5万〜4万米ドルとされており(出所:各種市場調査、ベンダー見積レンジ)、8基構成のサーバでは1ラック当たり約300万米ドル規模に達する。さらにGB200世代では、1ラック当たりの価格は数百万米ドル後半(約350万〜550万米ドル規模)に上昇するとみられている(出所:業界アナリスト推計)。
加えて重要なのは、GPU単体ではなく「クラスタ単位」での投資である。現在のAIデータセンターでは、1クラスタ当たり数千〜数万GPUが投入されるケースが一般的になりつつあり、単一クラスタでの投資額は数億米ドルから約7億米ドル規模に達する。
第二にHBMである。H100やGB200では、1GPU当たりHBMを6〜8スタック搭載する構成が一般的である。HBMの単価は世代や契約条件によるが、HBM3/3Eでは1スタック当たり1000〜1500米ドルとされている(出所:TrendForceを始めとする各種メモリ市場レポート)。従って、1GPU当たりのHBMコストは約1万米ドル前後となり、GPU価格の中でも極めて大きな割合を占める。
さらに重要なのは供給制約である。HBM市場はSK hynix、Samsung Electronics、Micron Technologyの3社にほぼ限定されており、特に先端HBMではSK hynixのシェアが50%を超えるとされる(出所:TrendForce, 2025)。この供給集中が、価格低下を抑制する構造を生んでいる。
第三に電力である。AIデータセンターの電力消費は、従来のクラウドと比較して桁違いに大きい(図5)。例えばH100のTDP(注:Thermal Design Powerの略で、チップを冷却するために必要とされる想定最大発熱量)は700W前後、GB200では1kW級とされている(出所:NVIDIA仕様)。仮に1万GPU規模のクラスタを構成すると、GPU単体で10MW規模、ネットワークや冷却を含めると20〜30MW規模に達する。
図5:AIデータセンター年間電力消費とその総費用[クリックで拡大] 出所:各種市場調査、ベンダ見積レンジ、業界アナリスト推計、TrendForceを始めとする各種メモリ市場レポート、NVIDIA仕様などを基に筆者作成
図5の説明に戻ると、年間電力量に換算すると、20MWの場合、20MW × 24時間 × 365日 ≒ 1.75億kWh/年となる。電力単価を0.14米ドル/kWh(≒20円/kWh)とすると、年間電力コストは約2500万米ドルに達する。実際には冗長構成や冷却ロスを考慮すると、3500万米ドル規模/年に達するケースも珍しくないと考えられる。
このように、GPU(CAPEX)、HBM(供給制約)、電力(OPEX)の3要素はいずれも規模とともに加速度的に増大する。その結果、AIインフラのコストは構造的に高止まりし、従来のような規模のスケールによるコスト低減の余地はほとんどないと思われる。
Copyright © ITmedia, Inc. All Rights Reserved.