D-MatrixのCEOであるSid Sheth氏は、2026年1月31日〜2月3日にカタールのドーハで開催された「Web Summit Qatar」において、EE Timesの取材に応じ、「NVIDIA/Groqの取引きにより、カテゴリーとしての低レイテンシ推論に注目が集まった」と述べている。
Sheth氏は「推論の時代がさらに深く進んでいくと、万能なものにはならず、全てがGPUだけという形にもならない。NVIDIA/Groqの取引きは、その概要を明確に示している。全体的な低レイテンシ推論というカテゴリーが新たに登場しつつあり、それはGPUだけのカテゴリーではないのだ」と述べる。
ユーザー体験を向上させるものは、何であれ市場で人気を博すだろうとSheth氏は述べる。
「低レイテンシのオプションが登場するとすぐにエンジニアたちは試し、新たなユースケースが生まれ、気付けばNVIDIAは後手に回っていた。NVIDIAは行動せざるを得なかった。追い込まれたのだ」(Sheth氏)
分散推論(ワークロードの前処理(Prefill)および出力生成(Decode)のフェーズを異なるGPUで実行する手法)の業界トレンドは継続し、この理論はGPU以外のソリューションにも適用される。これらはGPUと連携し、特定ワークロードの加速を実現できる。
「推論を最適化するための制約条件が多岐にわたるため、単一のソリューションで全てを解決するのは、ほぼ不可能だ。LLM、小規模モデル、スループット、レイテンシ、コスト、エネルギー消費に加え、入手可用性という課題もある。こうした多様な要件を単一のGPUで力任せに解決できるとは到底思えない」(Sheth氏)
(NVIDIAがつけた)Groqの200億米ドルという評価額は、確かに市場を落ち着かせたとSheth氏は続ける。「万人のニーズを満たす単一の解決策が存在しないことは、世界全体にとって良いことだろう。この領域には、他の勝者も現れるはずだ」
【翻訳:田中留美、編集:EE Times Japan】
NVIDIAがGroqを「事実上」買収 CUDA Tileが示す次の一手とは
IntelとSambaNova、提携の行く末――「最もあり得るシナリオ」は?
ローム、デンソーによる買収提案は「事実」
25年4QのDRAM市場、SamsungがSKから首位奪還
中国が「半導体製造装置の自給自足」に苦戦している理由(前編)Copyright © ITmedia, Inc. All Rights Reserved.
記事ランキング