開き直る人工知能 〜 「完璧さ」を捨てた故に進歩した稀有な技術:Over the AI ―― AIの向こう側に(14)(3/9 ページ)
音声認識技術に対して、長らく憎悪にも近い感情を抱いていた筆者ですが、最近の音声認識技術の進歩には目を見張るものがあります。当初は、とても使いものにはならなかったこの技術は、なぜそこまでの発展を遂げられたのか――。そこには、「音声なんぞ完璧に聞き取れるわけない!」という、ある種の“開き直り”があったのではないでしょうか。
“福音”のような技術だったはずなのに……
音声認識は、その後、ソフトの世界に移行し、エンタメ系(ゲーム)で適用されたこともありましたが、これも、次のバージョンに引き継がれることなく消滅していきました。何度言い直しても、ゲームキャラクターが、言葉を全然理解してくれないゲームなんか、楽しいわけがありません。
そして、音声認識技術に対する不信感を決定づけた製品が、1999年に発売された、パソコン用音声認識ソフトウェア「ViaVoice」でした。
これは日本国内でも、大々的にテレビCMが放映されました。男性アイドルグループのメンバーの1人が、音声だけで電子メールの文面を作成し、音声で、そのままメール送信をするというCM*)でしたが、"Windows95"のブーム後、パソコンのキーボード入力が不得意な人にとっては、「ViaVoice」は福音のようなソフトウェアとして映ったものでした。
*)元SMAPの香取慎吾さんが、ヘッドセットで『先日いただいたべったら漬け、あなたの温もりがこもっていた、あなたの愛がこもっていた、まる』と言うだけで、メールの文章が作成される、という内容のCMでした。
しかし、その希望は、絶望という最悪の形で終息します。「ViaVoice」は、とても実用レベルで使えるようなものではなかったのです。私も試したのですが、認識精度は極めて悪く、私の記憶している限り、文章の体を成すフレーズは、ただの1回も作ることができませんでした。
おまけに、音声認識の結果を、ディスプレイで確認して、キーボードで修正しなければならない、と ―― まさに、本末転倒を絵に書いたような製品でした。
ここに、
―― 音声認識は使えない
という認識が世界中で共有され、「音声認識技術、冬の時代」が始まるのです。
そして、その後、冒頭の、米国での不愉快な自動電話応答システムの体験(2000〜2002年)を経て、私の「音声認識技術」に対する不信感は、憎悪にまで発展します。
私は、この「音声認識技術、冬の時代」を終わらせた(のか?)Appleの「Siri」については全く知りませんでした。"Siri"のつづりを"Silly(浅はかな)"と思い込んでいたくらいです*)。
*)憎悪もここまで徹底すれば、ある種の美学だと思います。
「音声認識技術」と「江端」、歴史的和解の瞬間
私が「変だな」と感じるようになったのは、2年くらい前です。次女が、スマホに変な呪文『"ハイ! シリー"』と唱えていた時です ―― が、私は、あまり気にしていませんでした。ティーンエージャーの奇行をいちいち気にしていては、保護者はやっていけません。
また、嫁さんが、スマホのGoogleの検索エンジンに対して、検索キーワードをしゃべり始めた時には、「まあ、音声のいくつかでも拾えれば、全部入力するよりはラクだろうしね」くらいにしか考えていませんでした。
しかしながら ―― 皆さん、ついに、今年(2017年)のゴールデンウイークに「その時」がやってまいります(NHK歴史情報番組「その時歴史が動いた」の松平定知アナウンサー風に)。
史実(江端のブログ)には、江端が自ら発したフレーズ「ロウケン スギタ」が、「老犬過ぎた」ではなく、「介護老人保健施設スギタ」と表示されたのを見て、愕然(がくぜん)としている様子が、明確に記載されております。
実に20年近い月日を経て、「音声認識技術」と「江端」は、歴史的和解に至ったのです。
Copyright © ITmedia, Inc. All Rights Reserved.