また第4世代EPYCでは、CPUコアとメモリチャンネルをグループ化することでメモリアクセスを最適化するオプション「NPS(Nodes Per Socket)」を備える。NPSには1、2、4のオプションがある。NPS1はグループ化していない状態で、CPUコアを内蔵するダイ(CCD)とメモリチャンネルを自由に接続する。
NPS2は2つのグループに分けた状態である。12枚のCCDと12チャンネルのメモリを2つに分ける。入出力ダイのメモリチャンネルは6チャンネルずつ左右に分かれているので、左の6チャンネルに近い6枚のCCDで1つのグループを、右の6チャンネルに近い6枚のCCDでもう一つのグループを構成する。こうするとCCDからメモリコントローラーまでの平均的な距離が縮まり、信号伝送の遅延時間が短くなるとともに遅延のばらつきも減少する。
さらにNPS4では、物理的な距離の近い3枚のCCDと3つのメモリチャンネルでグループを作る。信号伝送の平均的な遅延時間がさらに短くなり、遅延のばらつきが減る。この結果、メモリアクセスの実効的な高速化に寄与する。
CPUコアとメモリチャンネルをグループ化する「NPS(Nodes Per Socket)」。CPUコア搭載ダイ(CCD)とIODを接続する12個の「GMI(Global Memory Interconnect)」コントローラーと、12個のメモリコントローラー「UMC(Universal Memory Controller)」を、物理的な距離の長短によって最大で4つのグループに分ける。「NPS4」だと、距離の近い3つのGMIと3つのUMCが一つのグループを作る[クリックで拡大] 出所:AMDAMDは第4世代EPYCの主記憶性能を、第3世代EPYCと比較した結果も示した。主記憶の帯域幅は平均で356Gバイト/秒に達する。第3世代EPYCの2.3倍と広い。シングルランクとデュアルランクの帯域幅の違いは、平均で4.5%と大きく縮まった。第3世代EPYCのDIMMでは平均で25%の性能差があった。
またメモリアクセスのレイテンシ(遅延時間)は、集積規模が拡大したにもかかわらず、第3世代EPYCと比べて13ナノ秒前後(12%前後)の増加で済んだ。
第4世代EPYCの主記憶性能と、第3世代EPYCの主記憶性能の比較。上から「データ転送速度(帯域幅)」「シングルランクとデュアルランクの帯域幅の違い」「アクセス遅延(レイテンシ)の違い」[クリックで拡大] 出所:AMD⇒「福田昭のデバイス通信」連載バックナンバー一覧
AMD、サーバ向け高性能プロセッサ「第4世代EPYC」の第1弾を発表
HDD大手Western Digitalの業績、フラッシュの値下がりで営業利益が前年の3分の1に減少
携帯型MP3プレーヤーの黎明期(1997年〜1998年)
ワイヤレス電力伝送で実際に電子機器を動作させる
ワイヤレス受電用端末の試作に向けたアンテナの設計作業
ワイヤレス電力伝送の過去から未来までを展望Copyright © ITmedia, Inc. All Rights Reserved.
記事ランキング