「Zen4」のマイクロアーキテクチャは、前世代の「Zen3」をベースに数多くの改良を加えた。分岐予測の強化(サイクル当たりに2つの分岐を予測、分岐先バッファ(BTB)の拡大)、マイクロOpキャッシュ(内部命令キャッシュ)の増量、命令リタイアキューの拡大、整数レジスタファイルと浮動小数点レジスタファイルの拡張、AVX-512命令セットのサポート、ロード/ストアの改良、2次キャッシュの拡大、などがある。
特筆すべきは浮動小数点演算で256ビット幅のAVX-512拡張命令をサポートしたことだろう。AVX-512には数多くの命令セットがあり、Zen4ではVNNI(Vector Neural Network Instruction)命令やBFloat16命令といった機械学習の処理を高速化する命令をサポートする。
その結果、Zen3コアのプロセッサ(64コア構成のEPYC)に比べ、Zen4のプロセッサ(96コア構成のEPYC)は自然言語処理のスループットが約4.2倍、画像分類処理のスループットが約3倍、物体検出処理のスループットが約3.5倍と大きく向上したという。
前回で述べたように、第4世代のEPYCプロセッサである「EPYC 9004」シリーズは8個のCPUコアを内蔵したミニダイ(チップレット)を入出力ミニダイとともに基板に搭載した。CPUコアを内蔵するミニダイ(CCD)は、Zen4コアとコアごとの2次キャッシュ、共有3次キャッシュ、入出力ダイとのインタフェース回路で構成される。製造技術は5nmのFinFETプロセス。製造担当企業はTSMCである。
AMDは新製品発表会「together we advance_data centers」で、Zen4コアと2次キャッシュを含めたシリコンの面積を3.84mm2としていた。8個のコアを搭載するので、単純計算では30.72mm2となる。これに32Mバイトの共有3次キャッシュとインタフェース回路を加えると、1枚のCCDが出来上がる。
⇒「福田昭のデバイス通信」連載バックナンバー一覧
Copyright © ITmedia, Inc. All Rights Reserved.