メディア

推論性能でNVIDIAに挑む　AIチップは「省エネ」が競争の軸に：「MLPerf」の最新スコアを公開（4/4 ページ）

» 2024年09月02日 11時30分公開

Googleは「Trillium」のプレビュー結果を提出

　Googleは、2024年後半に発売予定の次世代TPU v6eであるTrilliumの“プレビュー”結果を発表した。Trilliumは画像生成モデル「Stable Diffusion」を、サーバモードで4.49クエリ秒、オフラインモードで5.44サンプル/秒で推論できる。同じラウンドの現世代のTPU v5eと比較すると、性能は約3倍になる。NVIDIA GH200（「Grace Hopper」144GB）と比較すると、GH200はサーバモードで2.02クエリ/秒、オフラインモードで2.30サンプル/秒で、これはTrilliumの約半分の性能である。

　Googleは、「Trilliumは、より大きな行列乗算ユニットとより高速なクロック速度によって、前世代と比較してピーク演算性能が4.7倍向上する見通しだ」と述べている。HBMの容量と帯域幅も倍増し、カスタム光インターコネクトにより、チップ間の帯域幅も2倍になったという。

Intelの「Granite Rapids」

　IntelはAI推論用CPUを披露した（今回はHabanaからの応募はなかった）。次世代「Xeon」サーバプロセッサである「Granite Rapids」（開発コード名）は、全てのパフォーマンスコア（Pコア、効率コアまたはEコア）を搭載している。Granite Rapidsは、前世代のXeon CPUの1.9倍の性能を提供する。これは、GPT-J（6B）までの小型モデルのみを含む、提出された全てのワークロードの平均値である。

　同社は、新しいデータ型の導入やAMX（Advanced Matrix eXtensions）命令セット拡張の効率向上など、CPUロードマップにおいてAIへの投資を継続しているという。

【翻訳：滝本麻貴、編集：EE Times Japan】

原文へのリンク

2024年上半期の半導体業界を振り返る
本稿では、2024年上半期（1～6月）の半導体業界をEE Times Japanの記事とともに振り返る。
Intelはどこで間違えた？～2つのミスジャッジと不調の根本原因
Intelの業績が低迷している。業績以外でも、人員削減や「Raptor Lake」のクラッシュ問題など、さまざまな問題が露呈していて、Intelが厳しい状況に追い込まれていることが分かる。Intelはなぜ、このような状況に陥っているのか。そこには2つのミスジャッジと、そもそも根本的な原因があると筆者はみている。
「Copilot＋ PC」を分解　際立つQualcommのスタートダッシュ
2024年6月、「Copilot＋ PC」が各社から一斉に発売された。今回、テカナリエは「Surface Laptop（第7世代）」を分解。ひと際目立っていたのが、真っ先にCopilot＋ PCに対応したQualcommのチップセットだ。
ソフトバンクGが英国のAI新興Graphcore買収、4億米ドル規模か
ソフトバンクグループが、英国のAI（人工知能）チップ新興メーカーGraphcoreを買収した。買収価格など明かしていないが、業界関係者によると約4億米ドルだという。
AIは、シリコンフォトニクスのキラーアプリになるのか？
「AIは、シリコンフォトニクスの幅広い普及を実現する“キラーアプリケーション”なのだろうか」――。SoitecとフランスCEA-LetiがNVIDIAと協働開催したイベントで、業界のキープレイヤーがこの問いについて議論した。