さらに、モデルをFPGAに実装するにあたり各種の方策を凝らしたとする。積和演算にDSPを活用することによる演算高速化や、テンソル積演算器のハードウェア化などによる動作周波数の最適化、テンソルをハードウェアサイズに合わせて分割し多重ループの最適化などを実施した。
また、イベントではDeLTA-Familyを実装したFPGAデバイスによる実機デモを展示。安村氏は、「ディープラーニングによる顔認識アプリケーションをArmアーキテクチャのCPUで実行した場合は、0.6フレーム/秒(fps)程度の速度にとどまってしまう。DeLTA-Familyを活用すれば、ローエンドなFPGAデバイスでも10fps程度のスムーズな動作を実現できる」として、同社ソリューションの優位性を強調した。
Copyright © ITmedia, Inc. All Rights Reserved.