ハードウェアアーキテクチャとしては、「ビットパラレル方式」を提案する。レイヤーごとの最適量子化では、複数の演算器において、1ビットずつ時間軸方向に割り当てる「ビットシリアル方式」で演算している。
東芝メモリが開発したアルゴリズムをこのビットシリアル方式に割り当てると、使用するビット数は減るものの、そのフィルター内の最大ビット数の演算が完了するのを待たなければならないため、演算器の利用効率が落ちてしまう。さらに、リーク電流も流れてしまうので消費電流が発生する。
それに対し、ビットパラレル方式では、1ビットに分解し、それを各演算器に順番に割り当て、並列動作させる。これによって、演算器の利用効率はほぼ100%に高まり、処理速度(スループット)も高まる。
東芝メモリは、開発したアルゴリズムを、ハードウェアアーキテクチャを用いてFPGAに実装。実際に演算した結果、重みの精度を16ビットに固定した従来の演算に比べ、演算サイクル数を大幅に削減できることが分かった。具体的には、認識精度をほぼ同等レベルに維持しつつ、演算サイクルを約18.7%に削減。これにより、スループットは従来の約5.3倍、消費エネルギーは約18.7%に改善した。
なお、今回開発したアルゴリズムは、学習したモデルに対して量子化するので、学習にかかるコストや時間はこれまでと変わらない。
Copyright © ITmedia, Inc. All Rights Reserved.