エッジ上でキーワード検出&話者認識できるAI、東芝:「世界初」とする新AI技術
東芝は2020年2月20日、処理能力に制約があるエッジデバイス上でも高速で動作する音声キーワード検出機能付き話者認識AIを「世界で初めて」(同社)開発した、と発表した。このAI技術によってネットワーク接続していない家電などのエッジデバイスでも3回の発話で話者登録ができ、音声による操作や話者に合わせた機器の動きの変更が可能になるという。
東芝は2020年2月20日、処理能力に制約があるエッジデバイス上でも高速で動作する音声キーワード検出機能付き話者認識AIを「世界で初めて」(同社)開発した、と発表した。このAI技術によってネットワーク接続していない家電などのエッジデバイスでも3回の発話で話者登録ができ、音声による操作や話者に合わせた機器の動きの変更が可能になるという。
「世界初」を実現した2つのポイント
東芝はこの技術には2つの特長がある、と説明している。1つ目の特長は、キーワード検出で用いた情報の活用だ。音声が入力されると、キーワード検出のニューラルネットワークで周辺雑音などの影響を吸収しつつ音声処理を行う形になるが、この技術ではニューラルネットワークの「中間出力」を話者登録および話者認識に利用する。中間出力を使うことで、話者認識の際にも周辺の雑音の影響を抑えることが可能となり、話者認識のための音声処理の時間を大幅に削減。限られた機能上でも高速な動作を実現したという。
2つ目の特長は、ニューラルネットワークのデータ拡張手法の活用だ。データ拡張手法とは、少ないデータ(発話)で学習する手法の1つ。ニューラルネットワークのノード間の接続の重みをランダムにゼロにすることで、同じ話者がさまざまなしゃべり方で発話したような音声情報を模擬的に生成する。この手法を使うことで、話者の発話数が少なくても話者を学習することができ、話者登録時の必要発話数の削減を実現している。
実際に、3回の発話で話者登録する条件で比較評価を行ったところ、話者認識で用いられる一般的な手法「i-vector」では話者100人の識別精度が71%だったのに対し、この手法では89%という結果になったといい、東芝は、「家電などエッジデバイスを操作する場面では、登録話者は5〜10人程度と想定されることから、十分に実用性能がある」としている。また、サーバで計算量、処理速度の計測を行ったところ、組み込みシステムでも問題なく動作するという結果が得られたという。
東芝は、この技術を実際の組み込みシステムに搭載し、家電などのユースケースで実用性の検証を進めていく。また、東芝のコミュニケーションAI「RECAIUS(リカイアス)」での活用についても、東芝デジタルソリューションズと連携して検討を進めていく方針だ。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- エンドポイントAI向け新Cortex-Mプロセッサ&NPU
Armは2020年2月10日、機械学習(ML)に特化した新プロセッサコアIP「Arm Cortex-M55」と初のCortex-M向けマイクロNPU(ニューラルプロセッシングユニット)IP「Arm Ethos-U55」を発表した。エッジAIよりさらに先のエンドデバイス上でのAI処理に向けた製品で、2つのIPを組み合わせることでMLパフォーマンスを従来に比べ最大480倍向上できるという。いずれも同日からライセンス提供を開始。ArmはこれらのIPを用いた最終半導体製品の出荷開始は、2021年初頭と予想している。 - ピン数の少ないDRAM、エッジAIをサポート
これまで次世代メモリに関しては、さまざまな議論がなされてきた。例えば、「IoT(モノのインターネット)の登場によって生み出されたビジネスチャンスにどう対応するのか」「SRAMのような高価格帯製品を選択せずに済む方法はあるのか」といった内容が挙げられる。Etronは、答えの一つが「低減ピンカウント(RPC:Reduced Pin Count)DRAM」だと考えているようだ。 - あいまいな命令でも理解!エッジAIによるHMI制御技術
三菱電機は2020年1月28日、エッジで動作可能かつ曖昧な命令でも不足情報を自動補完して理解するAI技術を開発した、と発表した。同社のAI(人工知能)技術「Maisart(マイサート)」を活用したもの。家電や車載情報機器のHMI(Human Machine Interface)制御技術として、2022年以降の商用化を目指す。 - Apple、エッジAIの新興企業を買収
エッジAI(人工知能)技術を手掛ける米スタートアップXnorが、Appleによってひそかに買収されたと報道されている。 - デアゴスティーニでラズパイ使ったIoT、エッジAIも!?
「週刊○○」と題したさまざまなテーマのパートワーク(分冊百科)を提供することで知られるデアゴスティーニ・ジャパンが2020年3月から、Raspberry Piを使ったIoT(モノのインターネット)講座「本気で学ぶIoT」を開始する。毎月届く各種デバイスとオンラインテキストで学習することで、最終的にはエッジAIの活用まで習得できるカリキュラムが組まれているという。 - ソシオネクスト、エッジAIソリューションで協業
ソシオネクストは、Foxconn Technology Groupおよび、Network Optixと共同で「エッジAIソリューション」を開発した。