150m上空から人を検知可能 4K映像をエッジで推論できるLSI:2025年度内に製品化予定
NTTは、4Kカメラなどで撮影した高精細の映像を、エッジ/端末機器上でリアルタイムAI推論できる「AI推論LSI」を開発した。このLSIをドローンに搭載すれば、高さ150mの上空から人や物を検出できるという。
AI推論高精細化技術と独自の映像AI推論エンジンで実現
NTTは2025年4月、4Kカメラなどで撮影した高精細の映像を、エッジ/端末機器上でリアルタイムAI推論できる「AI推論LSI」を開発した。このLSIをドローンに搭載すれば、高さ150mの上空から人や物を検出できるという。2025年度内にNTTイノベーティブデバイスが製品化の予定。
電力制約が厳しいエッジ/端末機器では、AI推論に用いるデバイスの消費電力を数十Wに抑える必要がある。このため、サーバなどに用いられる高性能なGPUなどは搭載できない。消費電力が1桁以上も大きいからだ。
また、エッジ/端末機器などの用途では、入力画像のサイズにも制限があるという。例えば、物体検出のAI推論モデルである「YOLOv3」公式モデルでは最大サイズが「608×608画素」である。こうした制約があるため、4Kカメラで撮影した映像でも、実際は小さな画像サイズに縮小してAI推論を行う。この結果、小さい物体は検出できないこともあったという。
そこで今回、「AI推論高精細化技術」と「独自の映像AI推論エンジン」を開発した。これによって、エッジ/端末機器側でも4K映像からリアルタイムに物体検出ができるようになった。しかも消費電力は20W以下だという。
具体的には、AI推論高精細化技術を用いて、入力画像サイズを制約サイズまで分割する。その上で分割画像ごとに推論を行う。これにより、小さな物体が検出できる。これと並行して画像全体を縮小して推論を行う。その後、全体画像と分割画像による推論結果を合成すれば、最終的な検出結果が得られるという。
ただ、4K映像など分割画像数が大きくなると、計算量も膨大になる。これを可能にするのが新たに開発したAI推論エンジンである。フレーム間相関を利用した演算効率化などにより、検出精度を確保しつつ演算量を削減した。この結果、電力消費を抑えることに成功した。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
AlNパワー半導体開発加速に弾み 電流輸送機構を解明
東京大学の研究グループと日本電信電話(NTT)は、窒化アルミニウム(AlN)系半導体を用いたショットキーバリアダイオード(SBD)を作製し、その電流輸送機構を解明した。今後、AlN系半導体を用いた低損失パワー半導体デバイスの実現に取り組む。伝送容量50倍、455Tbpsの空間多重長距離光伝送に成功
日本電信電話(NTT)は、外乱の影響を受ける陸上フィールド環境での実験において、最大455Tbps(テラビット/秒)の空間多重長距離光伝送に成功した。この伝送容量は、現行システムの50倍以上となる。また、伝送距離が1000kmを超える場合でも、大容量伝送が可能なことを実証した。波長を変換しながら3000kmの長距離伝送、NTTとNEC
NTTとNECは、波長を変換しながら長距離光伝送を可能にする技術を確立した。開発した技術を活用すれば、「IOWNオールフォトニクス・ネットワーク(APN)」の適用エリアを拡大できるという。無線FE、300GHz帯で160Gbpsのデータ伝送に成功
NTTは、300GHz帯の半導体回路を用いた小型無線フロントエンド(FE)を開発し、160Gビット/秒のデータ伝送に成功した。6G(第6世代移動通信)で超高速通信を実現するための重要なデバイスとなる。100Tbps超の伝送容量で800kmの光増幅中継伝送に成功
NTTは2024年9月3日、既存のファイバー上で集中光増幅器のみを用いて、毎秒100テラビット(100Tbps)を超える伝送容量で800km以上の長距離光増幅中継伝送に「世界で初めて」(同社)成功したと発表した。新たに開発した超長波長帯一括変換技術を用いて実現したものだ。超短グラフェンプラズモン波束を電気的に発生、制御
NTTは、東京大学や物質・材料研究機構(NIMS)と共同で、パルス幅が1.2ピコ秒と極めて短いグラフェンプラズモン波束を電気的に発生させ、伝搬制御することに成功した。これを利用して、テラヘルツ(THz)電気信号の位相や振幅が変調できることを実証した。