AI認識に必要最小限まで映像データを圧縮する新技術:従来比10分の1以上の圧縮を実現
富士通研究所は2020年3月5日、高精細/大容量な映像データをAI(人工知能)が認識可能な必要最小限のサイズまで高圧縮する技術を開発した、と発表した。従来の人間による視認を目的とした圧縮技術と比較し10分の1以上の圧縮が可能となり、運用、伝送回線コストを大幅な削減が実現できるという。同社は、2020年度中の実用化を目指している。
富士通研究所は2020年3月5日、高精細/大容量な映像データをAI(人工知能)が認識可能な必要最小限のサイズまで高圧縮する技術を開発した、と発表した。従来の人間による視認を目的とした圧縮技術と比較し10分の1以上の圧縮が可能となり、運用、伝送回線コストの大幅な削減が実現できるという。同社は、2020年度中の実用化を目指している。
映像を解析するAI手法としてはディープラーニングが多用されるが、エッジサーバだけで大規模な映像を解析する場合、エッジサーバ増強などによる計算パワー確保が必要となる。そのため、クラウドを利用した処理が有効とされているが、ネットワーク帯域がひっ迫しないよう、映像データの品質を維持しつつクラウドへ送信できる高圧縮技術が求められている。
「AIの判断基準」に着目して実現
富士通研究所は今回、映像からヒト/動物/モノなどを認識する際、判断基準となる特徴において重視する画像の領域が、AIと人間では異なることに着目。AIが重視する領域を自動解析し、その領域ごとに圧縮率を変えることで、AIが認識できる必要最小限のサイズまでデータ圧縮を可能にする技術を開発した。
具体的には、まず、オリジナル画像全体の圧縮率を変えて画質を変化させ、その圧縮率を変化させた時のAIの認識結果への影響度を、格子状に区切った画像領域ごとに集計。AIが認識する過程における特徴の重要度合いを、全ての領域ごとに判定する。そして、それぞれの領域において認識精度を急激に劣化させる直前の圧縮率を、「認識精度に影響しない圧縮率」として推定するというもの。さらに、連続する画像におけるAIの認識結果をフィードバックすることで、必要最小限まで圧縮率を高める。
技術の概要。例えば、「男性の人間」の画像の場合、AIの判断基準として重視された「顔部分」の画像領域は低圧縮となり、重要度合いの低い身体や背景の領域ははそれぞれ、高圧縮、超高圧縮し、クラウドに伝送する(クリックで拡大) 出典:富士通研究所
同社によると、工場で梱包作業を行う複数作業員の様子を4Kの高精細カメラで撮影した映像のAI認識にこの技術を適用したところ、認識精度が劣化することなく、データサイズを10分の1に削減できたという。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 「世界初」高速化&精度劣化監視の新AI技術
富士通研究所は2019年10月25日、川崎市中原区の本社で行われた富士通の研究開発戦略説明会で、AI運用時の精度劣化を監視し、再学習なしに自動修復できる「High Durability Learning」と、AI処理を最大10倍高速化できる「Content-Aware Computing」という2つの新技術を発表した。同社によるといずれも世界初の技術という。 - 3DセンサーとAIで骨格認識、体操競技の採点を支援
富士通は、「CEATEC 2019」(2019年10月15〜18日、幕張メッセ)で、3D(3次元)センシングと機械学習を活用する自動採点システムなどを展示した。 - 組み込みAIを加速する、ルネサスの新Processing-in-Memory
ルネサス エレクトロニクスは、メモリ回路内でメモリデータの読み出し中に積和演算を行う既存のProcessing-in-Memory(PIM)を改良した、新たなPIM技術を開発したと発表した。同技術をベースに開発したAIアクセラレーターをテストチップに実装して推論処理を行ったところ、8.8TOPS/Wの電力効率を実証したという。 - AI戦略、NXPの立ち位置とは
NXP Semiconductorsにおける、機械学習分野の開発は現在、どのようになっているのか。同社のAI戦略・パートナーシップ部門担当ディレクターを務めるAli Osman Ors氏に聞いた。 - 車載向けSoC、高速かつ低電力で深層学習を実行
東芝デバイス&ストレージは、深層学習を用いた画像認識を高速かつ低消費電力で実行できる車載向けSoCを開発した。 - 進歩したAIが乗り越えるべき新たな課題
AI(人工知能)は2017年に、精度やスケーラビリティが大きく改善したが、2019年は偏りをなくし、意思決定の透明性を高める取り組みが盛んになると予想される。