メディア

AIサーバから始まるデータセンターの液体冷却時代福田昭のデバイス通信(478) AIサーバの放熱技術(11)

今回から、純水や冷却液などの液体を使ってラックマウントサーバを冷却する「液体冷却システム」の概要を解説する。

» 2024年10月28日 12時30分 公開
[福田昭EE Times Japan]

強制空冷システムから液体冷却システムへ

 サーバやデータセンターなどの放熱技術に注目が集まっている。演算処理を担うGPUとCPUの最大消費電力(熱設計電力(TDP))が増加しつつあることで、効率の高い放熱技術が強く求められるようになってきた。

 そこで本コラムでは、サーバやデータセンターなどを支える最新の放熱技術を第468回から、シリーズで説明している。前々回前回は、既存の強制空冷システムに液体冷却ユニットを追加した「ハイブリッド冷却システム」の概要を述べた。

 今回から、純水や冷却液などの液体を使ってラックマウントサーバを冷却する「液体冷却システム」の概要を解説する。

 本シリーズの第2回で述べたように、基本的な放熱・冷却技術には気体(通常は空気)の対流を利用した空気冷却(空冷)と、液体(通常は純水あるいは絶縁性液体)の伝導あるいは対流、沸騰を利用した液体冷却(液冷)がある。実際には空冷だけのシステム、空冷と液冷を併用するハイブリッド冷却システム、液冷だけのシステムなどが実用化あるいは研究されており、どちらかに絞られるというわけでは無い。

基本的な放熱・冷却技術の概要 基本的な放熱・冷却技術の概要[クリックで拡大]

 また液体冷却には大きく分けると、伝導冷却(間接冷却)、対流冷却(直接冷却)、沸騰冷却(直接冷却)の3種類が存在する。原理的な冷却能力が高い方式は順番に、沸騰冷却、対流冷却、伝導冷却となる。ただし対流冷却と沸騰冷却には課題があり、本格的な実用化には至っていない。実用化の実績があるのは、伝導冷却(間接冷却)である。そこで以下は強制空冷と伝導冷却を前提に、両者を比較しよう。

液冷システムの導入コストは高いが運転コストは低い

 空冷と液冷の基本的な違いは、放熱・冷却能力とコストにある。放熱・冷却能力は液冷が圧倒的に高い。伝導冷却でも原理的には、限界がまだ見えていない。ラック当たりの冷却能力は実用レベルで100kWを超えている。現時点では300kWでも実用化が可能だ。強制空冷は限界が既に見えており、ラック当たりで通常は20kW前後、ハイブリッド冷却でも45kW前後とされる。

空冷と液冷の比較(概要) 空冷と液冷の比較(概要)[クリックで拡大] 出所:NVIDIAが国際学会Hot Chips 2024のチュートリアルで講義した「Next Generation Cooling for NVIDIA Accelerated Computing」のスライドから抜粋し、筆者が和訳したもの

 コストには導入コストと運転コストがある。液冷システムは複雑なので、導入コストは空冷よりも高い。ただし運転コストは空冷が高く、液冷が低い。ファンが発生する強制対流による放熱は効率が低く、放熱系の消費電力を上昇させる。一方で液冷は基本的に、放熱の効率が非常に高い。放熱系の消費電力は低くて済む。

 また騒音の点でも、液冷は有利である。強制空冷では送風器(ファン)を数多く並べており、送風器全体が発生する騒音はかなりの水準になる。液冷は空冷に比べて送風器の数を減らせるとともに、場合によってはファンレスも可能なので、騒音は小さい。

 サーバの大手ベンダーであるSupermicroは、液冷(伝導冷却)の導入によって冷却用の電力をサーバ当たりで強制空冷の約1割と大幅に減らせるとともに、データセンター全体でも電力を約6割に減らせると主張する。さらにデータセンターが発生する騒音は空冷の約半分になるとする。

(次回に続く)

⇒「福田昭のデバイス通信」連載バックナンバー一覧

Copyright © ITmedia, Inc. All Rights Reserved.

RSSフィード

公式SNS

All material on this site Copyright © ITmedia, Inc. All Rights Reserved.
This site contains articles under license from AspenCore LLC.