AIサーバから始まるデータセンターの液体冷却時代:福田昭のデバイス通信(478) AIサーバの放熱技術(11)
今回から、純水や冷却液などの液体を使ってラックマウントサーバを冷却する「液体冷却システム」の概要を解説する。
強制空冷システムから液体冷却システムへ
サーバやデータセンターなどの放熱技術に注目が集まっている。演算処理を担うGPUとCPUの最大消費電力(熱設計電力(TDP))が増加しつつあることで、効率の高い放熱技術が強く求められるようになってきた。
そこで本コラムでは、サーバやデータセンターなどを支える最新の放熱技術を第468回から、シリーズで説明している。前々回と前回は、既存の強制空冷システムに液体冷却ユニットを追加した「ハイブリッド冷却システム」の概要を述べた。
今回から、純水や冷却液などの液体を使ってラックマウントサーバを冷却する「液体冷却システム」の概要を解説する。
本シリーズの第2回で述べたように、基本的な放熱・冷却技術には気体(通常は空気)の対流を利用した空気冷却(空冷)と、液体(通常は純水あるいは絶縁性液体)の伝導あるいは対流、沸騰を利用した液体冷却(液冷)がある。実際には空冷だけのシステム、空冷と液冷を併用するハイブリッド冷却システム、液冷だけのシステムなどが実用化あるいは研究されており、どちらかに絞られるというわけでは無い。
また液体冷却には大きく分けると、伝導冷却(間接冷却)、対流冷却(直接冷却)、沸騰冷却(直接冷却)の3種類が存在する。原理的な冷却能力が高い方式は順番に、沸騰冷却、対流冷却、伝導冷却となる。ただし対流冷却と沸騰冷却には課題があり、本格的な実用化には至っていない。実用化の実績があるのは、伝導冷却(間接冷却)である。そこで以下は強制空冷と伝導冷却を前提に、両者を比較しよう。
液冷システムの導入コストは高いが運転コストは低い
空冷と液冷の基本的な違いは、放熱・冷却能力とコストにある。放熱・冷却能力は液冷が圧倒的に高い。伝導冷却でも原理的には、限界がまだ見えていない。ラック当たりの冷却能力は実用レベルで100kWを超えている。現時点では300kWでも実用化が可能だ。強制空冷は限界が既に見えており、ラック当たりで通常は20kW前後、ハイブリッド冷却でも45kW前後とされる。
空冷と液冷の比較(概要)[クリックで拡大] 出所:NVIDIAが国際学会Hot Chips 2024のチュートリアルで講義した「Next Generation Cooling for NVIDIA Accelerated Computing」のスライドから抜粋し、筆者が和訳したもの
コストには導入コストと運転コストがある。液冷システムは複雑なので、導入コストは空冷よりも高い。ただし運転コストは空冷が高く、液冷が低い。ファンが発生する強制対流による放熱は効率が低く、放熱系の消費電力を上昇させる。一方で液冷は基本的に、放熱の効率が非常に高い。放熱系の消費電力は低くて済む。
また騒音の点でも、液冷は有利である。強制空冷では送風器(ファン)を数多く並べており、送風器全体が発生する騒音はかなりの水準になる。液冷は空冷に比べて送風器の数を減らせるとともに、場合によってはファンレスも可能なので、騒音は小さい。
サーバの大手ベンダーであるSupermicroは、液冷(伝導冷却)の導入によって冷却用の電力をサーバ当たりで強制空冷の約1割と大幅に減らせるとともに、データセンター全体でも電力を約6割に減らせると主張する。さらにデータセンターが発生する騒音は空冷の約半分になるとする。
(次回に続く)
⇒「福田昭のデバイス通信」連載バックナンバー一覧
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- ラックサーバのデータセンターを支える空冷技術
データセンターの放熱/冷却システムの詳細を解説する。まずは空冷方式を取り上げる。 - サーバの主なフォームファクター
今回は、サーバの主なフォームファクター(外形の形状と寸法)を解説する。大きく分けて、3つのフォームファクターがある。 - 放熱と冷却の基本的な技術
今回は、放熱と冷却の基本的な技術を解説する。 - 熱に関する基礎知識
「Hot Chips 2024」の技術講座(チュートリアル)のテーマは放熱技術だった。CPU/GPUの消費電力が増加し、サーバやデータセンターの放熱技術に対する注目が集まっているからだ。本シリーズでは、Hot Chips 2024の技術講座などをベースに、最新の放熱技術を解説する。 - 3端子貫通型フィルタの接続方法と実装レイアウト
今回は「(2)3端子貫通型フィルタの接続と実装のポイント」の概要を説明する。3端子貫通型フィルタを電源ラインに接続する2つの方法と、それぞれの用途を解説する。 - チップ抵抗器の小型化が過度な温度上昇を招く(前編)
今回から、第4章第1節第3項「部品実装・設計時の注意点」の概要を説明していく。この項は、「熱設計」「電気性能」などの4つのパートで構成される。