AIサーバから始まるデータセンターの液体冷却時代：福田昭のデバイス通信（478） AIサーバの放熱技術（11）

今回から、純水や冷却液などの液体を使ってラックマウントサーバを冷却する「液体冷却システム」の概要を解説する。

[福田昭，EE Times Japan] PC用表示関連情報

LINE

Hatena

強制空冷システムから液体冷却システムへ

　サーバやデータセンターなどの放熱技術に注目が集まっている。演算処理を担うGPUとCPUの最大消費電力（熱設計電力（TDP））が増加しつつあることで、効率の高い放熱技術が強く求められるようになってきた。

　そこで本コラムでは、サーバやデータセンターなどを支える最新の放熱技術を第468回から、シリーズで説明している。前々回と前回は、既存の強制空冷システムに液体冷却ユニットを追加した「ハイブリッド冷却システム」の概要を述べた。

　今回から、純水や冷却液などの液体を使ってラックマウントサーバを冷却する「液体冷却システム」の概要を解説する。

　本シリーズの第2回で述べたように、基本的な放熱・冷却技術には気体（通常は空気）の対流を利用した空気冷却（空冷）と、液体（通常は純水あるいは絶縁性液体）の伝導あるいは対流、沸騰を利用した液体冷却（液冷）がある。実際には空冷だけのシステム、空冷と液冷を併用するハイブリッド冷却システム、液冷だけのシステムなどが実用化あるいは研究されており、どちらかに絞られるというわけでは無い。

基本的な放熱・冷却技術の概要［クリックで拡大］

　また液体冷却には大きく分けると、伝導冷却（間接冷却）、対流冷却（直接冷却）、沸騰冷却（直接冷却）の3種類が存在する。原理的な冷却能力が高い方式は順番に、沸騰冷却、対流冷却、伝導冷却となる。ただし対流冷却と沸騰冷却には課題があり、本格的な実用化には至っていない。実用化の実績があるのは、伝導冷却（間接冷却）である。そこで以下は強制空冷と伝導冷却を前提に、両者を比較しよう。

液冷システムの導入コストは高いが運転コストは低い

　空冷と液冷の基本的な違いは、放熱・冷却能力とコストにある。放熱・冷却能力は液冷が圧倒的に高い。伝導冷却でも原理的には、限界がまだ見えていない。ラック当たりの冷却能力は実用レベルで100kWを超えている。現時点では300kWでも実用化が可能だ。強制空冷は限界が既に見えており、ラック当たりで通常は20kW前後、ハイブリッド冷却でも45kW前後とされる。

空冷と液冷の比較（概要）［クリックで拡大］出所：NVIDIAが国際学会Hot Chips 2024のチュートリアルで講義した「Next Generation Cooling for NVIDIA Accelerated Computing」のスライドから抜粋し、筆者が和訳したもの

　コストには導入コストと運転コストがある。液冷システムは複雑なので、導入コストは空冷よりも高い。ただし運転コストは空冷が高く、液冷が低い。ファンが発生する強制対流による放熱は効率が低く、放熱系の消費電力を上昇させる。一方で液冷は基本的に、放熱の効率が非常に高い。放熱系の消費電力は低くて済む。

　また騒音の点でも、液冷は有利である。強制空冷では送風器（ファン）を数多く並べており、送風器全体が発生する騒音はかなりの水準になる。液冷は空冷に比べて送風器の数を減らせるとともに、場合によってはファンレスも可能なので、騒音は小さい。

　サーバの大手ベンダーであるSupermicroは、液冷（伝導冷却）の導入によって冷却用の電力をサーバ当たりで強制空冷の約1割と大幅に減らせるとともに、データセンター全体でも電力を約6割に減らせると主張する。さらにデータセンターが発生する騒音は空冷の約半分になるとする。

⇒（次回に続く）

⇒「福田昭のデバイス通信」連載バックナンバー一覧

AIサーバから始まるデータセンターの液体冷却時代：福田昭のデバイス通信（478） AIサーバの放熱技術（11）

強制空冷システムから液体冷却システムへ

液冷システムの導入コストは高いが運転コストは低い

関連記事