さらに、モデルをFPGAに実装するにあたり各種の方策を凝らしたとする。積和演算にDSPを活用することによる演算高速化や、テンソル積演算器のハードウェア化などによる動作周波数の最適化、テンソルをハードウェアサイズに合わせて分割し多重ループの最適化などを実施した。
また、イベントではDeLTA-Familyを実装したFPGAデバイスによる実機デモを展示。安村氏は、「ディープラーニングによる顔認識アプリケーションをArmアーキテクチャのCPUで実行した場合は、0.6フレーム/秒(fps)程度の速度にとどまってしまう。DeLTA-Familyを活用すれば、ローエンドなFPGAデバイスでも10fps程度のスムーズな動作を実現できる」として、同社ソリューションの優位性を強調した。
応用例で見る、ルネサスの組み込みAI
Intel、“組み込みAIチップ”のPC搭載を狙う
IoTでの使いやすさを追求、組み込みプラットフォーム
ルネサス MCU/MPUのAI処理性能を今後3年で1000倍に
Armの独壇場にはならない? AI向けコア市場
NVIDIAが解説するディープラーニングの基礎(前編)Copyright © ITmedia, Inc. All Rights Reserved.