「はい、ピース!」をすぐに認識/撮影、オムロンがハンドジェスチャー認識技術を開発:センシング技術
オムロンは、同社の顔画像センシング技術「OKAO Vision」をベースに、手や指を動かすことで機器を制御する「ハンドジェスチャー認識技術」を開発した。
オムロンは2012年5月28日、カメラに向かって手や指を動かすことで機器を制御する「ハンドジェスチャー認識技術」を開発したと発表した。
特徴は、同社が得意とする顔認識技術と組み合わせたこと。例えば、機器に視線が向いているときだけ手の動きを検出するといったように、顔の向きや位置とジェスチャーを組み合わせて処理することで誤検出を抑えられる。さらに、手の検出範囲を顔の周囲に制限することで、カメラで撮影した全領域を処理するのに比べて処理負荷を減らせ、検出時間を短縮できるといった効果がある。
従来は、ジェスチャーを認識させる初期動作として例えば「手を振る」といった動作が必要だったが、このような初期動作も不要にできるという。「ジェスチャー認識機能を搭載した機器が既に製品化されているが、これまで何をトリガーに認識をスタートさせるのかという点が課題だった。ジェスチャーと顔認識を組み合わせれば、顔の位置や向きと手の位置関係を基に認識処理を自動でスタートさせることが可能だ」(同社)。
2012年末までに商品化開発を完了
今回開発したハンドジェスチャー認識技術は、同社が1995年から技術開発を進めてきた顔画像センシング技術「OKAO Vision」を発展させたもの。OKAO Visionは、顔や人の位置を検出する「顔検出・人検出」や、顔の詳細を認識する「顔認証・笑顔度推定」、顔の各部分を見つける「顔器官検出・視線検出」、顔をきれいに表現する「美肌補正・瞳補正」といった機能で構成されており、デジタルカメラやビデオカメラ、スマートフォンに多くの採用実績があるという。このような顔認識の技術をベースにハンドジェスチャー認識技術の開発を2〜3年前に開始した。
一言に手といっても、各人で指の長さや太さ、例えば「ピース」をしたときの形状が異なる。また、顔であれば、目や口、鼻といった特徴的な要素があるが、手はそれに比べると特徴的な要素が少ない。そこで、大量の手のサンプルを基に共有する色や形状を手の特徴量として抽出する「統計的識別手法」や、手のモデルと実画像が類似しているかどうかを判断する「モデルフィッティング技術」を応用して手の形状をモデル化することで、正確かつ高速なハンドジェスチャー認識を実現したという。
開発したハンドジェスチャー認識技術のデモの様子 30フレーム/秒のスピードで画像を処理し、手や指の位置・形状、動きを同時に認識する。プログラムコードは数100Kバイト程度で、スマートフォンやタブレットPCでも問題なく動作させることができるという。
2012年末までに商品化に向けた開発を完了させ、その後、機器メーカー向けに販売を開始する。想定する用途は、テレビやノートPCの制御や、デジタルカメラやスマートフォン、タブレットPCのカメラ撮影時の認識処理など。同社は、ハンドジェスチャー認識技術に顔認識技術を組み合わせることで、より自然に人の意図を理解した認識が可能になると考えており、今後、「人の行動からその人が何をしようとしているかなど、『意図』を理解するセンシング技術の開発を進めていく」(同社)という。
モーションセンシング(Motion Sensing)特選コーナー
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 身ぶり手ぶりで機器を操作、ジェスチャ認識システムは実用段階へ(前編)
2010年5月12日〜14日の会期で開催された組み込み機器の総合展示会「第13回組込みシステム開発技術展(ESEC 2010)」では、ジェスチャ・インターフェイスを使うことで、機器操作の自由度が高まることを、複数の企業がアピールしていた。 - 身ぶり手ぶりで機器を操作、ジェスチャ認識システムは実用段階へ(後編)
一般的なカメラではなく、赤外線LEDと赤外線を検出するカメラを組み合わせて、利用者の動きを検出する手法もある。 - 成長の鍵は産業オートメーションと海外市場、オムロンが長期戦略を策定
新長期戦略の要旨は3つ。1つ目は産業オートメーション分野の強化、2つ目は新興国市場での売上高拡大、3つ目は環境分野を中心にした新規事業の立ち上げである。 - 手と声でスマートテレビを操作、Samsungがモーションコントロールを実演
「Hi(やぁ)」と呼び掛けてテレビを起動させ、手振りの動作でチャンネルやメニューを選択したり、音量を調節したりできる。Samsungはこのようなモーションコントロールを紹介した。