液冷と空冷のハイブリッド冷却を液体の熱交換器で強化:福田昭のデバイス通信(477) AIサーバの放熱技術(10)
今回は、既存の強制空冷システムに液体冷却ユニットを追加した「ハイブリッド冷却システム」を、さらに強化する手法を説明する。
既存の強制空冷システムに追加する液冷ユニットの種類
サーバやデータセンターなどの放熱技術に注目が集まっている。演算処理を担うGPUとCPUの最大消費電力(熱設計電力(TDP))が増加しつつあることで、効率の高い放熱技術が強く求められるようになってきた。
そこで本コラムでは、サーバやデータセンターなどを支える最新の放熱技術を第468回から、シリーズで説明している。前回は、既存の強制空冷システムに液体冷却ユニットを追加した「ハイブリッド冷却システム」の概要を述べた。今回はハイブリッド冷却をさらに強化する手法をご説明する。
前回で述べたハイブリッド冷却システムでは、ラックマウントサーバの隣に「サイドカー熱交換器(Side Car HX)」と呼ぶ冷却水の循環器(CDU)を配置した。サイドカー熱交換器はサーバを冷却水で冷やす。一方、サーバによって温められた冷却水は、サーバルームの床下から上昇する冷たい空気を取り込んで温度を下げる。すなわち、サイドカー熱交換器(Side Car HX)そのものは空冷方式となっている。このことはサーバルームにおける空冷の効率を下げる。
冷却液をCRACと同じく水で冷やす液冷ユニット
そこで、サーバルーム内のCRAC(Computer Room Air Conditioner)とサーバルーム外部の液体熱交換器を循環している冷却水の活用を考えた。CDU(Coolant Distribution Unit)をCRACの近くに配置してCRACと同様に、外部からの冷却水で熱交換を実施する。
ハイブリッド冷却システムの全体図。左側がサーバルーム。右側がデータセンター全体の放熱システム(強制空冷のサーバと類似のシステム)。サーバルームの右端にあるCRACに隣接して液冷を担うCDUを配置した[クリックで拡大] 出所:NVIDIAが国際学会Hot Chips 2024のチュートリアルで講義した「Next Generation Cooling for NVIDIA Accelerated Computing」のスライドから
CDUからはサーバルームの床下を通じて冷却液(プロピレングリコール(PG)と純水の混合液体など)をラックマウントサーバに送出し、サーバを冷やす。サーバによって温められた冷却液はCDUに戻る。CDUでは外部からの冷却水によって冷却液の温度を下げる。
サーバルーム内におけるハイブリッド冷却システム(強化版)の構成。強制空冷を担うCRAC(黄色の装置)の近くにCDU(冷却水循環器:黄緑色の装置)を配置した。CDUは液体の熱交換器を内蔵しており、サーバと冷却液をやりとりするとともに、サーバから受け取った冷却液の温度を外部からの冷却水によって下げる[クリックで拡大] 出所:NVIDIAが国際学会Hot Chips 2024のチュートリアルで講義した「Next Generation Cooling for NVIDIA Accelerated Computing」のスライドから
既存の強制空冷システムによっても、ラックマウントサーバは冷やされる。水冷と空冷の割合はおおよそ80%対20%で、水冷に負うところが大きい。冷却能力はラック当たりで最大100kWを超えるとみられる。ただし、コストは前回のサイドカー熱交換器(Side Car HX)に比べると上昇する。
⇒「福田昭のデバイス通信」連載バックナンバー一覧
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- ラックサーバのデータセンターを支える空冷技術
データセンターの放熱/冷却システムの詳細を解説する。まずは空冷方式を取り上げる。 - サーバの主なフォームファクター
今回は、サーバの主なフォームファクター(外形の形状と寸法)を解説する。大きく分けて、3つのフォームファクターがある。 - 放熱と冷却の基本的な技術
今回は、放熱と冷却の基本的な技術を解説する。 - 熱に関する基礎知識
「Hot Chips 2024」の技術講座(チュートリアル)のテーマは放熱技術だった。CPU/GPUの消費電力が増加し、サーバやデータセンターの放熱技術に対する注目が集まっているからだ。本シリーズでは、Hot Chips 2024の技術講座などをベースに、最新の放熱技術を解説する。 - 3端子貫通型フィルタの接続方法と実装レイアウト
今回は「(2)3端子貫通型フィルタの接続と実装のポイント」の概要を説明する。3端子貫通型フィルタを電源ラインに接続する2つの方法と、それぞれの用途を解説する。 - チップ抵抗器の小型化が過度な温度上昇を招く(前編)
今回から、第4章第1節第3項「部品実装・設計時の注意点」の概要を説明していく。この項は、「熱設計」「電気性能」などの4つのパートで構成される。