Ambiq Microは、AIに焦点を当てた独自SDK(ソフトウェア開発キット)「Neural Spot」を提供する。超低消費電力サブスレッショルド/ニアスレッショルド技術を組み合わせることで、高効率の推論を実現するという。
マイコンメーカーのAmbiq Micro(以下、Ambiq)は、AI(人工知能)に焦点を当てた独自のSDK(ソフトウェア開発キット)を手掛けている。同社のAI SDK「Neural Spot」と、超低消費電力サブスレッショルド/ニアスレッショルド技術とを組み合わせることで、高効率の推論を実現することが可能だという。例えばキーワードスポッティングは、1mJ(ミリジュール)未満で実行できる。このような高効率は、特にウェアラブルなどのIoT(モノのインターネット)デバイス向けに適している。IoTデバイスは、既に同社にとって主要市場の一つとなっている。
AmbiqのAI部門担当バイスプレジデントを務めるCarlos Morales氏は、米国EE Timesのインタビューに応じ、「Arm Cortex-Mデバイス上のAIアプリケーションは、性能を微調整する上で課題が数多く残っているため、『TensorFlow Lite for Microcontrollers』のようなオープンソースフレームワークで利用可能なソフトウェアスタックの他にも、特殊なソフトウェアスタックが必要だ」と述べている。
「Armのニューラルネットワークのフレームワーク『CMSIS-NN』は、Armコアを非常にうまく利用することが可能な、最適化されたカーネルを備える。しかし、データを取り込んでそれを次のレイヤーに移動させるということは、数多くの変換が発生するということを意味する。データパスを注意深く設計した場合は、このような変換を実行する必要はない。中心部分を引き抜いて1つずつ呼び出しさえすれば、かなりの高効率化を実現することができる」(Morales氏)
Neural Spotのライブラリは、CMSIS-NNの最適化版をベースとしており、高速フーリエ変換(FFT)などの機能が追加されているという。Morales氏は、「組み込みAIは十数種のモデルに大部分が集中しているため、簡単に最適化することが可能なサブセットであるという点で、クラウドAIとは異なっている」と指摘する。
「TensorFlowに搭載されている音声アクティビティー検出(VAD)は、テンソルのロードを繰り返し多くの時間を費やさなければならないという点で、ひどく劣っている。ただ、もっと低いレベルで書き込めば、突然2〜3ミリ秒で処理可能になる。これは素晴らしいことだ」(Morales氏)
さらに頭痛の種となっているのが、Pythonと、組み込みデバイス上で動作するC/C++コードとの間のミスマッチだ。
Morales氏は、「われわれは組み込みデバイスを、まるでPythonの一部であるかのように扱えるツールを作った。Pythonモデル内部からRPC(Remote Procedure Call)を使用して、評価ボード上で実行可能だ」と述べる。
RPCは、例えばPythonの特徴抽出器やメルスペクトログラム算出を、評価ボード上で動作しているものと簡単に比較できる。(メルスペクトログラムとは、オーディオ処理で使われているオーディオデータを意味する)
Copyright © ITmedia, Inc. All Rights Reserved.