マイコンで深層学習も、エッジコンピューティングの未来：開発が進む「TinyML」（2/2 ページ）

いまやMLを実行するのに優れたTOPS性能を実現可能なプロセッサは必要ない。最新のマイコンの中にはMLアクセラレーターを組み込んだものもあり、エッジデバイスでMLを実行できるケースが増えている。

LINE

Hatena

小さくても強力な「TinyML」

　TinyMLは比較的新しいパラダイムだが、既に推論（比較的性能の低いマイコンを使用）やトレーニング（高性能マイコンを使用）において、精度の低下を最小限に抑えつつ驚くべき成果を達成している。最近の事例としては、音声／顔認識や、音声命令、自然言語処理などの他、複数の複雑な視覚アルゴリズムの並列実行などが挙げられる。

　これは事実上、価格が2米ドル未満で動作周波数500MHzのArm Cortex-M7コアを搭載したマイコンや、28K～128Kバイトのメモリが、センサーの真のインテリジェント化を実現するために必要な性能を提供することができる、ということを意味する。

　これらのマイコンは、このような価格／性能レベルでも、AES-128などの複数のセキュリティ機能だけでなく、複数種類の外部メモリやイーサネット、USB、SPIに向けたサポート機能を備える他、各種センサーやBluetooth、Wi-Fi、SPDIF、I²Cオーディオインタフェースなどを搭載またはサポートすることも可能だ。もう少しコストを掛ければ、1GHzのArm Cortex-M7や、400MHzのCortex-M4、2MバイトのRAM、グラフィックスアクセラレーションなどをデバイスに搭載することもできる。消費電流は、3.3VDC供給でわずか数ミリアンペアだ。

機械学習のユースケース　出典：NXP

「TOPS」について一言

　1つの測定基準を使用して性能を定義するのは、消費者だけではない。設計者たちも常に使用している他、特にマーケティング部門は非常に熱心に使っている。主役となる仕様があれば、デバイス間の違いを容易に判断できるようになるためだ。

　典型的な例はCPUで、長年にわたりクロックレートによって定義されてきた。幸いなことに、設計者と消費者の両方にとって、これはもはや過去の話になっている。CPUの評価に1つの指標を使うのは、エンジンのレッドラインで車の性能を評価するようなものだ。全く無意味というわけではないが、それはエンジンがどれだけ強力であるか、あるいは車がどれだけ優れた性能を発揮するかとはほとんど関係がない。

　残念ながら高性能MPUやマイコンに搭載されるものを含むニューラルネットワークアクセラレーターについても、同様の傾向が強まっている。しかし、実際にはGOPSやTOPSだけを指標とするのはあまり意味がない。これらは実際の動作環境ではなく、ラボで行われた測定値（間違いなく最高の数値）を表している。例えばTOPSは、メモリ帯域幅の制限、必要なCPUのオーバーヘッド、前後の処理などの要因を考慮していない。これら全ての要素を考慮した場合、例えば特定のボードで実際に動作させた場合の性能なら、システムレベルの性能はデータシート上のTOPS値の50～60%になる可能性がある。

　これらの数値は、ハードウェア内の計算エレメントの数にクロック速度を掛けたものであり、機能する必要があるときにデータが利用可能な状態になる頻度ではないのだ。データが常にすぐに利用可能で、消費電力は問題ではなく、メモリの制約がなく、アルゴリズムがハードウェアにシームレスにマッピングされていれば、これらの数値はより意味のあるものになるだろう。しかし、現実の世界ではそのような理想的な環境は存在しない。

　マイコンのMLアクセラレーターに適用した場合、この指標の価値はさらに低くなる。これらの小さなデバイスのTOPS値は通常、1～3TOPSだが、それでも多くのMLアプリケーションで必要とされる推論機能を提供できる。また、低消費電力MLアプリケーション用に特別に設計されたArm Cortexプロセッサに依拠している。そして、整数演算と浮動演算の両方をサポートし、マイコンの他の多くの機能もサポートしていることから、TOPSや他の単一のメトリックでは、単独でもシステム内でも性能を適切に定義することができないことが明らかになっている。

マイコンで実現するエッジコンピューティングの未来

　IoT領域が可能な限り多くの処理をエッジで実行するようになるにつれ、カメラなどのセンサーに取り付けられたマイコン上で推論を実行したいというニーズは増加している。そして、マイコン内のアプリケーションプロセッサやニューラルネットワークアクセラレーターの開発ペースは速く、より高機能なソリューションが登場してきている。このトレンドは、消費電力やサイズを大きく増加させることなく、ニューラルネットワーク処理などのAI中心の機能をアプリケーションプロセッサと一緒にマイコンに統合することにある。

　今日では、モデルをより強力なCPUやGPUでトレーニングし、TensorFlow Liteなどの推論エンジンを使用してマイコンに実装することで、マイコンのリソース要件を満たすようにサイズを縮小することができている。これによって、より大きなML要件に対応するためスケーリングを簡単に行うことができる。近い将来、これらのデバイス上で推論だけでなくトレーニングを実行することも可能になるはずで、マイコンは、より大きく高価なコンピューティングソリューションに対抗する、強力な競争相手になるだろう。

【翻訳：田中留美、編集：EE Times Japan】

原文へのリンク

マイコンで深層学習も、エッジコンピューティングの未来：開発が進む「TinyML」（2/2 ページ）

小さくても強力な「TinyML」

「TOPS」について一言

マイコンで実現するエッジコンピューティングの未来

関連記事