YOLOv3を20mWで実行するエッジAIチップ「Ergo」:米新興企業が開発(2/2 ページ)
シリコンバレーの新興企業Perceiveが、ニューラルネットワーク計算を再発明し、エッジAIチップ「Ergo」を開発したと発表した。既にサンプル出荷を開始しているという。
複数のニューラルネットワークを同時に実行
同氏はXperiの理事会に対し、「新興企業をスピンアウトすることにより、電力バジェット20mWでエッジデバイス上で重要な推論を実現する半導体チップを開発する」とするアイデアを提案した。その結果として開発されたErgoは、外形寸法が7×7mmで、外付けRAMなしで4TOPSの性能を達成する(Teig氏によると、実際に4TOPSの性能があるとうたっているGPUと同程度の動作を実現するという)。Ergoは、CNN(Convolutional Neural Network)やRNN(Recurrent Neural Network)などをはじめ、ニューラルネットワークのさまざまなスタイルをサポートする。市場の多くのソリューションがCNNに合わせているのとは対照的だ。またErgoは、複数のヘテロジニアスネットワークを同時に実行することもできる。
Teig氏は、「実行できるネットワークの数を制限するのは、メモリの容量だけだ」と説明している。Perceiveによれば、YOLOv3やM2Det(パラメータ数は6000万〜7000万)、ResNet 28(パラメータ数は数百万)の他、LSTM(Long Short Term Memory)/RNNを同時に実行し、対話や音声処理を行うことを実証しているという。実際のアプリケーションでは、これは画像処理と音声の推論を同時に行える、ということに相当するだろう。
Ergoチップが達成したとする55TOPS/Wの電力効率は、いくつかの競合他社が主張しているものよりも、1桁上の数値になる。Perceiveの主張によれば、6400万パラメータのYOKOv3を30fpsで実行し、消費電力がわずか20mWであるということになる。この高い電力効率は、ニューラルネットワーク処理の決定論的な性質を利用した、パワーゲーティング/クロックゲーティング技術によって実現されていると、Perceiveは説明する。
「バッテリー駆動の設定では、(Ergoチップは)文字通りオフ、つまりゼロミリワットで、マイクロワットレベルのモーションセンサーやアナログマイクで、任意のものを検知する。起動させたら、巨大なニューラルネットワークをロードし、復号も含めて約50ミリ秒以内に実行できる」(Teig氏)
【翻訳:田中留美、編集:EE Times Japan】
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- Ampereがサーバ向けArmプロセッサを開発、Intelに挑戦
新興企業Ampere Computing(以下、Ampere)は、Armベースの80コアプロセッサ「Altra」の出荷を開始したと発表した。“クラウドネイティブ”のプロセッサとして位置付けられる製品だ。 - エッジAI向けチップの製品化に6000万ドルを調達
イスラエル・テルアビブに拠点を置くAI(人工知能)チップの新興企業であるHailoは、シリーズBの投資ラウンドで6000万米ドルを調達した。これにより、同社の資金調達総額は8800万米ドルに達した。 - 戦いの火ぶたが切られたエッジAI市場
人工知能(AI)は過去2年間で、世界的なメガトレンドへと変化した。機械学習は、消費者や自動車、産業、エレクトロニクス全般など、ほぼ全てに何らかの形で影響をもたらしている。さらに、私たちがまだ、うかがい知れない方法で社会や生活に影響を与えると思われる。 - ディープインサイト、組み込み型エッジAIを提供
ディープインサイトは、IoT端末側で学習と推論の両方に対応可能な、組み込み型エッジAI「KAIBER engram(カイバー エングラム)」のライセンス供給を始めた。 - Turingを採用したMXM GPUモジュール、ADLINKが展示
エッジコンピューティング向けの組み込みボードやGPUモジュールなどを手掛けるADLINK Technology(以下、ADLINK)は「embedded world 2020」で、NVIDIAのTuringアーキテクチャに対応した「NVIDIA Embedded Quadro RTX GPU」を採用したMXM GPUモジュールを出展した。