今回、全8個のベンチマーク全てのスコア結果を提出したのは、唯一NVIDIAだけだった。同社のハードウェアは前回のラウンドと同様に、リスト全体の中で優位性を確保している。提出スコア全体の90%が、NVIDIAおよびパートナー各社が提供するNVIDIA GPUを使用しているという。
NVIDIAによると、同社のA100は、アクセラレーターチップごとの性能において、全8個のベンチマークのうち6個で最速のスコアを達成したという(RetinaNetはGoogleに、ResNetではHabana Labsに、それぞれ敗北している)
NVIDIAがA100のスコアを提出したのは、今回で4回目となる。このため、同社がここ数年の間にどれくらいソフトウェア関連の取り組みを進めてきたのかを考察することができる。最も著しい性能向上を達成したのは、A100を活用した「DGX SuperPOD」のDLRM(深層学習レコメンデーションモデル)のスコアで、約6倍の性能向上を実現した。また、「DGX A100」システムは、BERTにおいて2倍強の性能向上を達成した。NVIDIAはこれについて、「CUDAグラフや最適化ライブラリ、高性能前処理、フルスタックネットワークの向上など、大規模な取り組みの成果だ」としている。
NVIDIA、Google、Graphcore、Habana Labsのシステムについて、MLPerfのスコアをベンチマーク別で比較している。緑のグラフがNVIDIA[クリックで拡大] 出所:NVIDIAGraphcoreは、最新の「Bow IPU」を使用したResNetとBERTのスコアを提出した。ResNetは、MLPerfトレーニングの直近のラウンド(2021年12月)と比較して、システムサイズ全体で約30%高速化し、BERTは約37%高速化している。
Graphcoreのソフトウェア担当シニアバイスプレジデントを務めるMatt Fyles氏は、「これらのスコアは、アプリケーション層、新しいBowシステムを活用したハードウェア、SDK(ソフトウェア開発キット)レベルでも性能改善を続けているわれわれの取り組みの成果だ」と語った。
【翻訳:田中留美、編集:EE Times Japan】
新興企業Syntiant、tinyMLベンチマークで圧勝
22年Q1半導体メーカーランキング、首位SamsungがIntelとの差広げる
シングルプロセッサで200億パラメーターを持つAIモデルを学習
初のWoW技術適用で大幅性能向上、Graphcoreの新IPU
「世界初」3次元Wafer on Wafer技術採用IPUの中身Copyright © ITmedia, Inc. All Rights Reserved.
記事ランキング