超低消費電力のエッジAI、ASICで100TOPS/Wの実現も：「画質改善＋物体検知」も可能に（1/3 ページ）

エッジでのディープラーニング技術（エッジAI技術）を手掛けるLeapMindは2021年9月30日、超低消費電力のAI（人工知能）推論アクセラレーターIP（Intellectual Property）「Efficiera（エフィシエラ）バージョン2（Efficiera v2）」のβ版をリリースした。正式版は同年11月末に提供を開始する。

[村尾麻悠子，EE Times Japan] PC用表示関連情報

LINE

Hatena

　Efficieraは、LeapMindのコア技術である、機械学習のモデルを軽量化する「極小量子化」技術に基づくアクセラレーターIPで、CNN（畳み込みニューラルネットワーク）の推論演算処理に特化している。2020年10月に発表されたバージョン1では、FPGAへの実装を対象としていたが、バージョン2では、その対象をFPGAだけでなくASIC／ASSPにも拡張する。ハードウェア自体も、100TOPS/Wを実現できるように高性能化している。スマートフォンや監視カメラ、ドライブレコーダーを含め、高精細の画像について高度なエッジAI処理を行うためのシステムや半導体デバイスの開発者に向ける。

1～2ビットまで軽量化する「極小量子化」

　Efficieraに活用されている極小量子化技術は、モデルを圧縮する手法の一つである量子化を極限まで突き詰めたものだ。具体的には、推論モデルのパラメーターを、通常用いられる32ビット浮動小数点（FP32）から、重み係数を1ビット、アクティベーションを2ビットにまで軽量化している。これにより、チップ内部のバスやメモリの占有率も低減できる。

「極小量子化」技術の概要［クリックで拡大］出所：LeapMind

　軽量化すると精度が出しにくくなるというデメリットもあるが、LeapMindは、モデルを工夫することで精度の劣化を最小限に抑えている。

LeapMindの山崎勝利氏出所：LeapMind

　LeapMind執行役員でEfficiera事業を統括する山崎勝利氏は、「エッジAIでは、限られた計算資源でどのように推論を実行するのかが、チャレンジとなっている。同じ計算資源であれば、演算速度を上げれば、モデルの精度は落ちる。例えばFP32での正答率が98％とすると、極小量子化ではそれよりも1～2％精度が下がる。だがその分、メモリの帯域が10分の1以下に下がる」と説明する。

　「100％の精度は無理でも、99％が必要なのか、それとも98％でもいいのか。98％でいいのであれば、推論のスピード（フレーム/秒、fps）をあと10フレーム増やすことができる。そういう議論を顧客としながら設計を進めている。われわれは、精度と速度のトレードオフに関する膨大な知見があるので、“ちょうどいいポイント”を把握している。その“ちょうどよい部分”を標準品として製品化し、市場に投入していこうと考えている」（山崎氏）

　極小量子化により、ダイサイズを小さくできることも利点だ。「ディープラーニングは、行列の積和演算が延々と続くもの。半導体の回路は乗算が大きくなるが、極小量子化は1ビット、2ビットで演算を行うので、足し算のみで済む。これにより、回路を小さくでき、引いてはダイサイズの小型化につながる」（同氏）

　山崎氏は、「当社は2012年12月の設立以来、150件ほどの共同開発案件を手掛けてきた。その中で蓄積した知見を多く持っていることが強みだ」と述べる。「これらの多数のプロジェクトを行う中で、組み込み機器で推論を行うための制限事項も見えてきた。それを克服するために開発したのが、極小量子化技術だ。それを活用したEfficieraに加えて、Efficiera上で動作するモデルなどのソフトウェアもLeapMindが開発している。エッジAIの分野において、ハードとソフトの開発を両方手掛けている企業は、他にないのではないか」（同氏）

Efficieraをより生かせるASIC／ASSP

　　　　　　 | 次のページへ