エッジAIをガンガン処理できる！　「熱くならないプロセッサ」をルネサスが開発：最新世代の独自アクセラレーターを搭載（1/3 ページ）

ルネサスエレクトロニクスは、AI（人工知能）アクセラレーター技術「DRP-AI」の最新世代などを開発。同技術を搭載したビジョンAI用プロセッサ「RZ/V2H」を発表した。高い電力効率を高速な推論処理を両立できることが特徴だという。

LINE

Hatena

　ルネサスエレクトロニクス（以下、ルネサス）は2024年2月22日、独自のAI（人工知能）アクセラレーター技術「DRP-AI」の最新世代と、DRP-AIやCPUなどを協調動作させるヘテロジニアスアーキテクチャを発表した。いずれも、ルネサスが同年2月21日（米国時間）に半導体の国際学会「ISSCC 2024」で発表したものになる。

枝刈り処理に最適化した「DRP-AI」

　DRP（動的再構成プロセッサ）は、ルネサス独自の技術で、チップ内の演算器の回路情報を処理内容に応じて動的に切り替えるもの。必要な回路だけを動作させるので、高速かつ低消費電力の演算が可能になるという。DRPと積和演算ユニットを統合し、AI処理性能に特化したアクセラレーター（AIアクセラレーター）が、DRP-AIだ。

　今回ルネサスが発表したDRP-AIは、ディープラーニングモデルを軽量化する手法の一つである枝刈り（プルーニング）処理に最適化したもので、第3世代となる（以下、DRP-AI3）。2022年12月に発表した第3世代のDRP-AIをさらに改善した。

「DRP-AI」のアーキテクチャ。右側の積和演算ユニット（MAC unit）に、枝刈り処理を効率よく行うための仕組みが搭載されている。左側のDRPと連携することで、設計時に想定していなかった新しいAIモデルやAI処理に柔軟に対応できるようになる［クリックで拡大］出所：ルネサスエレクトロニクス

　枝刈りは、推論精度に影響が少ない演算不要のノード（枝）をスキップし、演算回数を減らす技術だ。ただ、この演算不要のノードはAIモデル内にランダムに存在する。そのため、並列処理によって演算を高効率化するAIハードウェア／アクセラレーターでは、演算不要のノードを効率よく処理することが難しい。

既存の並列プロセッサによる枝刈りモデル処理の課題。並列演算器では、ゼロの重みもゼロ以外の重みも全て演算されてしまう。つまり、ゼロを増やしても、トータルの演算時間を削減できず、枝刈りの効果が十分に得られない［クリックで拡大］出所：ルネサスエレクトロニクス

　ルネサスが開発したDRP-AI3は、回路情報を動的に変更するDRPの柔軟性を生かし、演算不要のノードを高い効率で処理できるという。具体的には、重要な重みのみを抽出して圧縮する「フレキシブルN：M枝刈り手法」を採用した。圧縮することで、演算サイクル数を削減できる。さらに、DRP-AI3では、AIモデルの重み行列グループごとに圧縮率を自由に変えられる他、その圧縮率に応じて演算サイクル数も調整できる。これにより、演算サイクル数を最小で16分の1に、消費電力を最小で約8分の1以下に削減できるという。ルネサスのエンベッデッドプロセッシング第一事業部でシニアプリンシパルプロダクトエンジニアを務める野瀬浩一氏は、「高い枝刈り率と、高速な処理性能を両立できる」と強調する。

DRP-AI3では、「フレキシブルN：M枝刈り手法」を採用し、枝刈りモデルに最適な処理ができるとする

DRP-AI3では、「フレキシブルN：M枝刈り手法」を採用し、枝刈りモデルに最適な処理ができるという［クリックで拡大］出所：ルネサスエレクトロニクス

枝刈りモデルの処理性能を、既存のアクセラレーターと比較したもの。左は一般的な並列プロセッサ。モデルの軽量化はできても、演算サイクル数を減らすことはできない。中央は、「隣接する2つの重みデータのうち、どちらか1つを選択して演算する」という枝刈り手法を適用したもの。「ただしこの手法は、構造的な限界により、演算量を最大でも2分の1にしか削減できない」（野瀬氏）［クリックで拡大］出所：ルネサスエレクトロニクス

DRP-AI、DRP、CPUが協調動作

　　　　　　 | 次のページへ

エッジAIをガンガン処理できる！ 「熱くならないプロセッサ」をルネサスが開発：最新世代の独自アクセラレーターを搭載（1/3 ページ）

枝刈り処理に最適化した「DRP-AI」

エッジAIをガンガン処理できる！　「熱くならないプロセッサ」をルネサスが開発：最新世代の独自アクセラレーターを搭載（1/3 ページ）