推論性能でNVIDIAに挑む AIチップは「省エネ」が競争の軸に:「MLPerf」の最新スコアを公開(4/4 ページ)
推論ベンチマーク「MLPerf」の最新ラウンドのスコアが公開された。その結果からは、AI用プロセッサの新たな競争の軸が、性能そのものよりも「電力効率」に移りつつあることが読み取れる。
Googleは「Trillium」のプレビュー結果を提出
Googleは、2024年後半に発売予定の次世代TPU v6eであるTrilliumの“プレビュー”結果を発表した。Trilliumは画像生成モデル「Stable Diffusion」を、サーバモードで4.49クエリ秒、オフラインモードで5.44サンプル/秒で推論できる。同じラウンドの現世代のTPU v5eと比較すると、性能は約3倍になる。NVIDIA GH200(「Grace Hopper」144GB)と比較すると、GH200はサーバモードで2.02クエリ/秒、オフラインモードで2.30サンプル/秒で、これはTrilliumの約半分の性能である。
Googleは、「Trilliumは、より大きな行列乗算ユニットとより高速なクロック速度によって、前世代と比較してピーク演算性能が4.7倍向上する見通しだ」と述べている。HBMの容量と帯域幅も倍増し、カスタム光インターコネクトにより、チップ間の帯域幅も2倍になったという。
Intelの「Granite Rapids」
IntelはAI推論用CPUを披露した(今回はHabanaからの応募はなかった)。次世代「Xeon」サーバプロセッサである「Granite Rapids」(開発コード名)は、全てのパフォーマンスコア(Pコア、効率コアまたはEコア)を搭載している。Granite Rapidsは、前世代のXeon CPUの1.9倍の性能を提供する。これは、GPT-J(6B)までの小型モデルのみを含む、提出された全てのワークロードの平均値である。
同社は、新しいデータ型の導入やAMX(Advanced Matrix eXtensions)命令セット拡張の効率向上など、CPUロードマップにおいてAIへの投資を継続しているという。
【翻訳:滝本麻貴、編集:EE Times Japan】
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 2024年上半期の半導体業界を振り返る
本稿では、2024年上半期(1〜6月)の半導体業界をEE Times Japanの記事とともに振り返る。 - Intelはどこで間違えた? 〜2つのミスジャッジと不調の根本原因
Intelの業績が低迷している。業績以外でも、人員削減や「Raptor Lake」のクラッシュ問題など、さまざまな問題が露呈していて、Intelが厳しい状況に追い込まれていることが分かる。Intelはなぜ、このような状況に陥っているのか。そこには2つのミスジャッジと、そもそも根本的な原因があると筆者はみている。 - 「Copilot+ PC」を分解 際立つQualcommのスタートダッシュ
2024年6月、「Copilot+ PC」が各社から一斉に発売された。今回、テカナリエは「Surface Laptop(第7世代)」を分解。ひと際目立っていたのが、真っ先にCopilot+ PCに対応したQualcommのチップセットだ。 - ソフトバンクGが英国のAI新興Graphcore買収、4億米ドル規模か
ソフトバンクグループが、英国のAI(人工知能)チップ新興メーカーGraphcoreを買収した。買収価格など明かしていないが、業界関係者によると約4億米ドルだという。 - AIは、シリコンフォトニクスのキラーアプリになるのか?
「AIは、シリコンフォトニクスの幅広い普及を実現する“キラーアプリケーション”なのだろうか」――。SoitecとフランスCEA-LetiがNVIDIAと協働開催したイベントで、業界のキープレイヤーがこの問いについて議論した。