文部科学省は富岳NEXTに求められる性能については以下のように定めている。
理研は、この目標を満たすための仕様を策定した。合計ノード数はCPUとアクセラレーターで計3400ノード以上、理論FP64ベクトル性能はCPUで48PFLOPS以上、アクセラレーターで2.6EFLOPS以上。理論FP16/BF16行列演算性能はCPUで1.5EFLOPS以上、アクセラレーターで150EFLOPS以上。理論FP8行列演算性能はCPUで3.0EFLOPS以上、アクセラレーターで300EFLOPS以上。sparsity考慮の同理論性能はアクセラレーターで600EFLOPS以上。メインメモリサイズはCPU/アクセラレーター共に10PiB以上。メインメモリバンド幅はCPUで毎秒7PB以上、アクセラレーターで毎秒800PB以上、合計消費電力は計算ノードおよびストレージで40MW以下だ。
この仕様をもとに、CPUとアクセラレーターの開発を主導する企業として、富士通とNVIDIAが一般競争入札で選定された。選定理由について理研は「富士通は『京』や富岳の開発における実績や今後に向けた技術的なコミットメントが高く評価された。NVIDIAは現時点で世界最高のGPUベンダーでありながら理研や富士通との共同研究をさらに推進したいという熱意があり、他社との差別化につながった」とした。
CPUには富士通が現在開発している汎用プロセッサ「FUJITSU-MONAKA」を発展させた「FUJITSU-MONAKA X」(仮称)を用いる。Arm SME(低精度行列演算器)に基づくNPUの搭載も検討する。
ここに、アクセラレーターとしてNVIDIAのGPUを高密度で統合し、計算ノードとする。接続は広帯域でコヒーレントな接続方式を検討している。GPUはNVIDIAの高性能なベクトル処理やAI向け行列演算の技術を搭載し、先端技術を活用した積層メモリの採用も検討する。GPU間のScale-up Networkとして、将来世代のNVLinkによるノード内またはノード間を接続し、複数GPUの広帯域相互接続を行うことも検討する。
CPU/GPUの製造委託先については決定していないというが、「Rapidusを活用する可能性があるか」という質問に対し、富士通 CTO(最高技術責任者)のVivek Mahajan氏は「富士通はTSMCと長年良好な関係にある一方で、『Made with Japan』という戦略においてはRapidusも重要な位置にある」とした。理研 計算科学研究センター センター長の松岡聡氏は「理研は文部科学省が所管する研究機関だが、省庁の垣根を越えた取り組みを行うことがモットーなので、(経済産業省が支援する)Rapidusも重要な位置付けだ」と述べた。
Copyright © ITmedia, Inc. All Rights Reserved.