「ついに普及へのしきい値を超えた」、組み込み画像認識の業界団体が発足:センシング技術 画像認識
ゲーム機をはじめとした一般消費者向けの電子機器や、自動車、そしてデジタルサイネージやPOSシステムといった商業用途の組み込み機器など、さまざまな分野で画像認識の普及に弾みがつき始めている。そこで半導体ベンダーなどの業界各社が、普及促進に取り組む「Embedded Vision Alliance」を発足させた。
コンピュータによる画像認識技術は、30年を超える長い研究の歴史があり、さまざまな応用分野で実用化されている。先行したのはビジネスや商工業の分野である。光学文字認識(OCR:Optical Character Recognition)やセキュリティ監視システム、工業用検査/製造装置など、数多くの製品があり、大きな市場を形成している。これに対し、一般消費者向けの組み込み機器の分野では、比較的実用化が遅かった。この状況が劇的に変わりつつある――。
この変化を捉えた各社が、組み込み機器における画像認識技術の普及を促進する業界団体「Embedded Vision Alliance」が発足した。現在のところ、半導体ベンダーやIPコアベンダー、開発ツールベンダー、半導体流通やデザインサービスを手掛ける技術商社など、17社が参加している。2011年5月31日にWebサイトを公開し、組み込み機器開発者の啓発を狙ったコンテンツの提供を始めた。将来的には、技術標準の策定や、低コストの開発プラットフォームの提供を目指す。
Embedded Vision Allianceを主導するのは、組み込みプロセッサのベンチマークテストなどを手掛ける技術コンサルティング企業の米Berkeley Design Technology, Inc.(BDTI)である。同社の創設者でプレジデントを務めるジェフ・バイヤー(Jeff Bier)氏によれば、これまで組み込み機器の分野では、画像認識の採用は限定的だったという。「画像認識は、非常に大きなコンピュータリソースが必要になる場合が多い。そのためコストや消費電力の制約が特に厳しい組み込み機器の分野では、画像認識を利用しにくかった」(同氏)。近年になって、プロセッサやGPU、DSP、FPGA、ASSPなどの半導体チップのコストと消費電力の低減が進んだ結果、組み込み機器で画像認識を採用できる「しきい値をついに超えた」(同氏)というわけだ。画像認識に欠かせないイメージセンサーについても、「携帯電話機市場で大量に消費されることで、価格が下がっている」(同氏)ことが追い風になっている。
組み込み機器の画像認識としては、既にデジタルカメラやビデオカメラの顔認識が広く普及しており、一部の自動車では白線や歩行者検出の機能が実用化されていた。最近では、Microsoftが家庭用ゲーム機「Xbox 360」向けに開発したジェスチャ認識コントローラ「Kinect」が、発売後5カ月間で1000万台の販売を記録するなど、比較的価格が低く量産規模の大きな機器でも画像認識の応用が始まっている。「ゲーム機にとどまらず、各種の家電機器にジェスチャ認識インタフェースが搭載される可能性がある。自動車でも、安全や運転支援機能の搭載が高級車から大衆車へと広がる。デジタルサイネージやPOSシステムといった商業用途の組み込み機器、医療分野や産業分野、防衛分野などでも、いっそうの用途拡大が見込める。Kinectの成功が実証しているように、組み込み分野でも画像認識機能の需要は高い」(バイヤー氏)。
Embedded Vision Allianceの参加企業である。大手半導体ベンダーの他、IPコアベンダーや開発ツールベンダー、半導体流通やデザインサービスを手掛ける技術商社など、現時点で17社が参加している。
「組み込み」ならではの課題に挑む
ただし、半導体チップのコストや消費電力の低減が進んだというだけでは、組み込み機器に簡単に画像認識機能を取り込めるわけではない。さまざまなハードルが残っている。「高度で複雑な画像認識アルゴリズムを開発できるツールや、そのアルゴリズムを許容できるレベルの消費電力量で実行できるチップが入手できたとしても、それだけでは十分とはいえない。画像認識システムの実装は、まだまだ難易度が高い作業だ。例えば、“コンピュータ画像認識(computer vision)”というキーワードでインターネット検索を実行すると、結果の95%は学術的な論文や教科書である。まだ画像認識を扱える技術者は限られており、多くの技術者が利用できる状況にはなっていない」(バイヤー氏)。
画像認識の実装が難しい理由としては、「組み込み機器に搭載する際には、最適な実装形態を見極めるために複雑なトレードオフを考慮する必要がある」(バイヤー氏)ことを挙げている。同氏によると、例えば720pのオプティカルフローアルゴリズムを最新のVLIW型DSPアーキテクチャに最適化すると、5フレーム/秒で1GHzのクロック速度が必要になるという。そのため実際には、高度に並列化した専用ハードウェアが必要になる。しかも、多様かつ動的なアルゴリズムが求められるので、固定的な機能の演算回路では効率を高めにくい。
そこでEmbedded Vision Allianceでは、組み込み分野で画像認識の利用を検討する技術者に向けて、実装時に直面するさまざまなトレードオフに対して適切な判断を下せるような情報をWebサイト(www.embedded-vision.com)を介して提供していくという。
当初の活動としては、組み込みシステムやシステムLSIを手掛ける設計者に対して、画像認識に関する技術的な教育コンテンツや、画像認識の応用事例などを提供する。これにより、組み込み機器への画像認識の普及促進を目指す。
長期的には、「技術標準を策定したい」(バイヤー氏)との構想を掲げる。「例えば、無線インタフェースは今、さまざまな規格が標準化されており、それに準拠したモジュールやプロトコルスタックが数多く流通している。組み込み機器の開発者は、それらを利用することで、比較的簡単に無線インタフェースを搭載できる環境が整っている。画像認識も、将来はそのように手軽に利用できるようにしていきたい」(同氏)。
Copyright © ITmedia, Inc. All Rights Reserved.