80TOPSを5W以下で 韓国DEEPXの「本気」示すエッジAIチップ:CES 2026 現地レポート
AI用半導体を手掛ける韓国のスタートアップDEEPXは「CES 2026」で、同社のチップを使ったデモを展示。低い消費電力と高い推論性能を両立していることを強調した。2nm世代のプロセスを適用する次世代品の概要も示した。
AI用半導体を手掛ける韓国DEEPXは「CES 2026」(2026年1月6〜9日、米国ネバダ州ラスベガス)で、同社のチップを使ったエッジAIのデモを披露した。いずれもチップが低消費電力であることをうたうもので、今後量産予定の次世代チップでは、さらなる省電力化と高性能化を両立させたと語った。

左=DEEPXがブースで展示した製品群。チップや、それを搭載したM.2モジュール、SBC(Single Board Computer)、産業用PCなどがある/右=現行世代の「DX-M1」チップを搭載したM.2モジュール[クリックで拡大]DEEPXの特徴は、独自開発したNPU(Neural Processing Unit)と量子化技術だ。この2つにより、推論精度を大きく低下させずにAIモデルを量子化し、低消費電力で推論を実行できると担当者は説明する。現行世代のAIアクセラレーターである「DX-M1」は同NPUを搭載し、25TOPSの演算性能を実現するにもかかわらず、消費電力は1〜5Wだという。DEEPXは「効率的に推論を実行するにはNPUが最も適している。われわれがNPUの独自開発にこだわるのは、そのためだ」と強調する。
次世代品となる「DX-M2」の詳細もパネルで展示した。DX-M2はSamsung Electronicsの2nm世代GAA(Gate-All-Around)プロセスを適用する。NPUは4コア搭載し、80TOPSや20〜30TPS(Token Per Second)を5W以下で実現する見込みだ。メモリはLPDDR5Xを採用し、帯域幅は153.6GB/s。DEEPXは「消費電力の課題が深刻になる中、いかに低消費電力に抑えられるかがAI用半導体の鍵だ。DX-M2の量産は2026年末に開始する見込みになっている。フィジカルAI時代をけん引するチップだと確信している」と語った。
GPGPUに比べて推論性能は3.5倍
デモでは、DX-M1とGPGPUを用いて、推論性能を比較した。ResNet50を用いた画像認識では、推論精度はいずれも77%前後と同等だったが、推論スピードはDX-M1が958フレーム/秒(fps)に対し、GPGPU(INT8で量子化)は269FPSだった。1TOPS当たりの速度はDX-M1が38.33fps/TOPS、GPGPUが1.34fps/TOPSという結果になった。さらに、ボード上に実装されているDX-M1は手で触れるほど(温かいと感じる程度)だった。「それだけ消費電力(発熱)が小さいということだ」(DEEPX)
さらに、100TOPS(INT8で量子化)の性能と20WのTDP(Thermal Design Power)を両立したPCIeカード「DX-H1 Quattro」を用いた画像認識のデモも行った。DX-H1 Quattroは4つのNPUを搭載した製品で、エッジAIからデータセンターまで幅広く使える。メモリは16GB(ギガバイト)のLPDDR5。デモでは、DX-H1 Quattroを搭載したSupermicroのサーバを用いて、128チャンネルの監視カメラの映像をリアルタイムで画像認識する様子を示した。推論性能の平均は30fpsだという。
![DX-H1 Quattroを用いた128チャンネルの映像を認識するデモ[クリックで拡大]](https://image.itmedia.co.jp/ee/articles/2601/23/mm260123_deepx04a_w290.jpg)
左=DX-H1 Quattroを用いた128チャンネルの映像を認識するデモ/右=DX-H1 Quattroを搭載したSupermicroおよびDell Technologiesのサーバ[クリックで拡大]DEEPXは2018年、AppleやIBMなどで半導体設計を手掛けてきたLokwon Kim氏によって設立されたスタートアップだ。CESに出展するのは2023年、2024年に続き3回目となる。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
「エッジでもLLMを動かす」 韓国新興DEEPX
エッジAI(人工知能)用チップの開発を手掛ける韓国のスタートアップDEEPXが、取り組みを活発化させている。将来的には、LLM(大規模言語モデル)を動作できるようにすることを目指すという。
2026年の半導体市場を占う10の注目トピック
ことし2026年の半導体市場を占う意味で、筆者が注目すべきトピックを独断と偏見で10件ほどピックアップしてみた。
NVIDIAがGroqを「事実上」買収 CUDA Tileが示す次の一手とは
2025年12月、GroqとNVIDIAが非独占的なテクノロジーライセンスの契約を結んだというニュースが発表された。これはNVIDIAによる、事実上のGroqの買収である。NVIDIAの狙いは何なのか。「CUDA」の課題や、新アーキテクチャ「CUDA Tile」の解説を交えて考えてみたい。
NVIDIAやCerebrasをはるかに上回るトークン性能、欧州新興のAIチップ
欧州のAIチップの新興企業であるEuclydは、トークン当たりのコストを低く抑えられるハードウェアアーキテクチャを披露した。同社のチップ「Craftwerk」は、16384個のSIMDプロセッサを搭載し、最大8PFLOPS(FP16)または32PFLOPS(FP4)を実現する。NVIDIAやCerebras Systemsをはるかに上回る、2万トークン/秒を実行できるとする。
エッジAIにこそ先進パッケージング技術が必要
クラウドAI向けでよく語られる3次元実装だが、UCMの担当者は先進パッケージングはエッジAIにこそ向いていると語る。
デバイスを「超省エネ」に導く IPOで製品展開を加速するAmbiq
エッジAI用半導体を手掛ける米Ambiq。半導体を低消費電力で動作できる独自技術「SPOT(スポット)」を生かし、いずれはデータセンターへの展開を目指す。

