開き直る人工知能 〜 「完璧さ」を捨てた故に進歩した稀有な技術:Over the AI ―― AIの向こう側に(14)(2/9 ページ)
音声認識技術に対して、長らく憎悪にも近い感情を抱いていた筆者ですが、最近の音声認識技術の進歩には目を見張るものがあります。当初は、とても使いものにはならなかったこの技術は、なぜそこまでの発展を遂げられたのか――。そこには、「音声なんぞ完璧に聞き取れるわけない!」という、ある種の“開き直り”があったのではないでしょうか。
何かが「変」な、音声認識技術のトレンド
こんにちは、江端智一です。今回は、「音声認識技術」についてお話したいと思います。
定番のフレーズなので、もう飽き飽きしている人も多いと思いますが、まあ、これも私なりの「けじめ」として今回も申し上げます。
「音声認識技術が“人工知能”なのかどうか」の判定については、『江端AIドクトリン』に基づき、「江端が『AI』と思ったものであれば、誰がどう反論しようが、それはAIである」を押し通します*)。
*)正直なところ、"音声認識技術"を、"AI技術"と言い張ることには、さすがの私も抵抗があるのですが、"AI技術"に必須の"インタフェース技術"ということで押し通します。
さて、冒頭で紹介したように、私が「腰が抜ける」ほど驚いた「音声認識技術」のパラダイムシフトが、いつごろ発生したのかを調べるために、今回も定番の"Googleトレンド"を使って、そのトレンドを分析しました。
でも、何か変なんです。
「音声認識」を見出しとする記事は、どんどん減っています。グラフに表示されている期間中、音声認識に対する大きな技術革新あった事実は読み取れません(2012年に、ちょっとしたトリガが観測できますが)。
次に、「音声認識」に関する歴史をご覧いただきたいと思います。
SFの世界においては、対話できるコンピュータとして2001年宇宙の旅の「HAL9000」、対話できる自動車「ナイトライダー」などがありました。しかし、その当時の音声認識技術は、まだ実用化には程遠く、研究室での研究レベルにとどまっていました。
実用化が始まったのは1990年あたりで、音声認識が製品として適用された最初のモノは、カーナビゲーションシステム(カーナビ)だったと思います。
もちろん、カーナビの音声による操作は、安全運転に貢献するという面もあったでしょうが、音声認識技術をハードウェアに実装して、研究開発費を回収できるような製品は、カーナビくらいしかなかったと思います(例:自宅のドアの鍵を「開けドア」のようにすることもできたかもしれませんが、鍵を使った方が安全な上に安価です。パソコンのパスワード入力についても同様のことが言えます)。
要するに、音声認識技術を社会インフラとして使うニーズ、あるいは、音声認識技術の研究開発コストを回収できる対象製品がなかったのです。
Copyright © ITmedia, Inc. All Rights Reserved.