AI/HPCプロセッサの許容電力を大きく左右するのが、放熱技術(冷却技術)である。ただし放熱性能の高い冷却技術は、一般的にはコストが高い。初期費用、運転費用とも、基本的に高くなる。
コストが最も低い放熱技術は、空気の自然対流を利用した「自然空冷(Natural convection air cooling)」である。ヒートシンクのないプラスチックパッケージ封止の半導体ダイでは、消費電力1W前後までが適用範囲とされる。
消費電力が数ワット以上の半導体ダイではヒートシンクに、空気の対流を強制的に促す「強制空冷(Forced convection air cooling)」を組み合わせることが多い。小さなファン(空冷ファン、送風機)によって空気の対流を促す。より大きな消費電力の半導体ダイに対しては、空気の対流速度(風速)を高めることで対応する。
さらに大きな消費電力を許容可能なのが、液体の自然対流を利用した「自然液冷(Natural convection liquid cooling)」である。液体は空気よりも熱伝導に優れていることが多い(例えば、水の熱伝達係数は空気の約25倍)。自然液冷でも不十分な場合は、液体の対流を強制的に実施する強制液冷(Forced convection liquid cooling)を駆使する。
さまざまな放熱技術(冷却技術)と熱流束(縦軸)、熱伝達係数(横軸)の関係。左下から右上に向かって、空気冷却(空冷)、液体冷却(液冷)、液体から気体への相変化を利用した冷却(相変化冷却)と放熱技術が変化する[クリックで拡大] 出所:TSMC(IEDM 2025のショートコース(番号SC1-5)で公表された講演スライドから)強制液冷でも放熱能力が不足する場合は、液体が気体に変化するときの潜熱(Latent heat)を冷却に利用する「相変化冷却(Phase change cooling)」が選択肢となる。「二相冷却(Two-phase cooing)」とも呼ぶ。
ハイエンドのAI/HPCプロセッサは現在、強制液冷で放熱することが多い。「冷却プレート(Cold plate)」または「ヒートシンク」の内部に冷却用液体(水や非導電性液体など)を通し、プロセッサが発する熱を奪う。冷却プレート内部には数多くの薄いフィンを精密加工によって形成してあり、液体とプレートの接触面積を増やすことで放熱能力を高めている。
次世代の冷却モジュールでは、パッケージの外装であるリッドにも液体を通す。リッドの内部にはマイクロチャンネルと呼ばれる細長い流路を設けてある。さらに将来は、冷却プレートとパッケージを一体化してTIMを省略することが考えられている。
ハイエンドのAI/HPCプロセッサを冷却する強制液冷モジュールの進化。左は現在のモジュール構造例。中央は次世代向けのモジュール構造。リッド内部に液体の流路(マイクロチャンネル)を設ける。右はさらに将来のモジュール構造。冷却プレート(Cold plate)とパッケージを一体化する[クリックで拡大] 出所:TSMC(IEDM 2025のショートコース(番号SC1-5)で公表された講演スライドから)(次回に続く)
⇒「福田昭のストレージ通信」連載バックナンバー一覧
AI/HPCシステムの死命を制する消費電力・放熱設計(前編)
ミニダイ(チップレット)間接続におけるSTCO
インターポーザに複数のシリコンダイを近接して並べる2.5次元集積化
「フラッシュメモリで」AI演算 消費電力はGPU比で1000分の1に
半導体メモリの地域別市場で2番目に大きくなった中国の現状
人工知能(AI)が牽引するHBM系DRAM市場Copyright © ITmedia, Inc. All Rights Reserved.
記事ランキング