メディア

映像処理用RTLコードを5分で生成、シャープ開発の高位合成ツール電力効率はGPU搭載PCの40倍

シャープは、映像データ処理用AI半導体デバイス設計に向け、PythonコードからRTLコードを短時間で生成できる「高位合成ツール」を開発、オープンソースソフトウェア(OSS)として公開した。

» 2025年06月26日 12時10分 公開
[馬本隆綱EE Times Japan]

AI専用デバイスの開発、ツールを活用すればわずか5分で完了

 シャープは2025年6月、映像データ処理用AI半導体デバイス設計に向け、PythonコードからRTLコードを短時間で生成できる「高位合成ツール」を開発、オープンソースソフトウェア(OSS)として公開した。専門技術者でなくてもエッジ端末用のAI半導体デバイスを短い期間で開発できる。しかも、生成したコードを20nmプロセスで製造したFPGAに実装したところ、電力効率はGPU搭載PCに比べ40倍以上も高くなった。

 新エネルギー・産業技術総合開発機構(NEDO)は、「省エネAI半導体およびシステムに関する技術開発事業」の一環として、エッジ領域に適したAI半導体デバイスの早期実現に向け、シャープと共同開発を行ってきた。

 OSSとして公開した高位合成ツールは、映像データ処理用AIアルゴリズムが記述されたPythonコードを読み込んで、ハードウェアの回路図となるRTLコードを、短時間で自動生成できるソフトウェア。生成されたRTLコードをFPGAなどに実装すれば、AI専用処理デバイスとして利用できる。設計回路ツールとして映像データ処理向けAI専用LSIの開発にも利用できるという。

高位合成ツールの利用イメージ 高位合成ツールの利用イメージ[クリックで拡大] 出所:NEDO
高位合成ツールが対象とするデバイスのイメージ 高位合成ツールが対象とするデバイスのイメージ[クリックで拡大] 出所:NEDO

 開発した高位合成ツールは、複数の演算処理を1つの処理に統合するレイヤ統合機能を備えており、演算処理の効率化や高速化を実現した。また、C言語でRTLコードの機能検証が行えるCモデルの生成機能も搭載した。さらに、専用デバイスでAI処理を実行するときに必要となる学習済みパラメーターが得られるよう、量子化対応したAIモデルもPythonコードで生成できる。

 高位合成ツールから生成されるRTLコードには、AI映像処理回路の消費電力を削減するため、新たに開発したさまざまな回路技術が組み込まれている。その1つが「フレームメモリレス構造」である。フレームメモリは使わずに、ラインメモリで効率的な処理を行うことで、消費電力とデータの入出力時間を削減した。

 2つ目は、畳み込み演算などAI演算に特化した4次元での処理に対応する演算器構成である。2次元配列に適した情報処理が可能で、演算性能を飛躍的に高めた。3つ目は、隣接するラインメモリ間に境界バッファを設定したことである。並列処理時に発生する重複処理を削減することで処理効率を向上させた。

 4つ目は、エッジ端末内の計算リソースを抑えるために搭載された量子ツールで、小数点位置の変化に対応した固定小数点演算回路を開発・採用した。これにより、浮動小数点演算に近い精度で、データ処理が可能となった。

高位合成ツールでのデータ処理フロー 高位合成ツールでのデータ処理フロー[クリックで拡大] 出所:NEDO
フレームメモリレス構造による処理時間短縮のイメージ フレームメモリレス構造による処理時間短縮のイメージ[クリックで拡大] 出所:NEDO

 開発した高位合成ツールを用いて、4K映像から8K映像への超解像処理を行うRTLコードを生成。これをFPGAに実装してその性能を評価した。この結果、消費電力1W当たりの情報処理速度は0.374TOPS/Wであった。GPU搭載のPCでは0.0079TOPS/Wであり、電力効率は40倍以上も向上することを確認した。また、RTLコードの生成期間は、専門技術者でも6週間程度を要していたが、開発した高位合成ツールを用いれば、約5分で完了したという。

CNN超解像モデルにおける電力効率の比較 CNN超解像モデルにおける電力効率の比較[クリックで拡大] 出所:NEDO

Copyright © ITmedia, Inc. All Rights Reserved.

RSSフィード

公式SNS

All material on this site Copyright © ITmedia, Inc. All Rights Reserved.
This site contains articles under license from AspenCore LLC.