150m上空から人を検知可能　4K映像をエッジで推論できるLSI：2025年度内に製品化予定

NTTは、4Kカメラなどで撮影した高精細の映像を、エッジ／端末機器上でリアルタイムAI推論できる「AI推論LSI」を開発した。このLSIをドローンに搭載すれば、高さ150mの上空から人や物を検出できるという。

LINE

Hatena

AI推論高精細化技術と独自の映像AI推論エンジンで実現

　NTTは2025年4月、4Kカメラなどで撮影した高精細の映像を、エッジ／端末機器上でリアルタイムAI推論できる「AI推論LSI」を開発した。このLSIをドローンに搭載すれば、高さ150mの上空から人や物を検出できるという。2025年度内にNTTイノベーティブデバイスが製品化の予定。

　電力制約が厳しいエッジ／端末機器では、AI推論に用いるデバイスの消費電力を数十Wに抑える必要がある。このため、サーバなどに用いられる高性能なGPUなどは搭載できない。消費電力が1桁以上も大きいからだ。

　また、エッジ／端末機器などの用途では、入力画像のサイズにも制限があるという。例えば、物体検出のAI推論モデルである「YOLOv3」公式モデルでは最大サイズが「608×608画素」である。こうした制約があるため、4Kカメラで撮影した映像でも、実際は小さな画像サイズに縮小してAI推論を行う。この結果、小さい物体は検出できないこともあったという。

　そこで今回、「AI推論高精細化技術」と「独自の映像AI推論エンジン」を開発した。これによって、エッジ／端末機器側でも4K映像からリアルタイムに物体検出ができるようになった。しかも消費電力は20W以下だという。

超高精細映像AI推論LSIの概要［クロックで拡大］出所：NTT

　具体的には、AI推論高精細化技術を用いて、入力画像サイズを制約サイズまで分割する。その上で分割画像ごとに推論を行う。これにより、小さな物体が検出できる。これと並行して画像全体を縮小して推論を行う。その後、全体画像と分割画像による推論結果を合成すれば、最終的な検出結果が得られるという。

　ただ、4K映像など分割画像数が大きくなると、計算量も膨大になる。これを可能にするのが新たに開発したAI推論エンジンである。フレーム間相関を利用した演算効率化などにより、検出精度を確保しつつ演算量を削減した。この結果、電力消費を抑えることに成功した。

AI推論高精細化技術の概要と、AI推論エンジンのブロック図［クロックで拡大］出所：NTT

150m上空から人を検知可能　4K映像をエッジで推論できるLSI：2025年度内に製品化予定

AI推論高精細化技術と独自の映像AI推論エンジンで実現

関連記事

関連リンク

150m上空から人を検知可能 4K映像をエッジで推論できるLSI：2025年度内に製品化予定

AI推論高精細化技術と独自の映像AI推論エンジンで実現

関連記事

関連リンク

150m上空から人を検知可能　4K映像をエッジで推論できるLSI：2025年度内に製品化予定