クリムゾンテクノロジーが「AI・人工知能 EXPO」に、リアルタイム音声変換システム「リアチェン voice」を出展した。リアチェン voiceを活用すれば、異性を含む他人やキャラクターの声で話したり、歌ったりすることが可能になる。
2017年6月27日、「AI・人工知能 EXPO」のプレス限定先行公開が東京ビッグサイトで開催された(本開催は2017年6月28〜30日)。クリムゾンテクノロジーはその会場にて、独自開発の統計的声質変換法「Metamorphone」を用いたリアルタイム音声変換システム「リアチェン voice」を披露。展示スペースでは実際に、リアチェン voiceでの音声変換を実演してみせた。
Metamorphoneは、クリムゾンテクノロジーと奈良先端科学技術大学院大学戸田智基客員教授(名古屋大学教授)の研究グループが共同で開発した統計的声質変換法だ。リアチェン voiceはMetamorphoneにより、ある話者の声色をリアルタイムで他の人やキャラクターの声に変換できる。変換の際はもちろん、発話内容は保たれる。
リアチェン voiceでは、学習部と変換部の2つを経由して音声が変換される。学習部では、変換元の話者と変換先の話者の両者が同じ内容を発話した音声データを多数用い、時間的マッチング(時間伸縮)、特徴量の抽出、パラメータ推定などを行う。これにより、事前に変換モデルを学習しておく。
一方、変換部では、変換元の話者の音声の特徴量から、統計モデルを用いて元話者の音声をフィルタリングすることで、変換先の話者の特徴を持った音声を出力する。男女の声を相互変換するために、音高の変換も行っている。
クリムゾンテクノロジーは今回、リアチェン voiceの活用例として、オリジナル音声メッセージカードや着ぐるみ装着例を参考出展した。クリムゾンテクノロジー代表取締役の飛河和生氏によると、同社は今後メッセージカードや着ぐるみへのリアチェン voiceの応用を進めていく考えだという。
「リアチェン voiceを使えば、メッセージカードに自分の好きな声でメッセージを吹き込める。また、着ぐるみを着た人が自分の声ではなく、着ぐるみに合った声で話したり、歌ったりできるようになる」(飛河氏)。
カラオケなどで活用することもできるのだろうか。飛河氏はそれに関して、「版権の問題もあるが、それ以前に音声変換時の遅延時間が現時点では約100ミリ秒あるので、リアチェン voiceをすぐにカラオケへ応用することは難しい。現段階ではどうしても音声変換のタイムラグが気になるだろう。だが、Metamorphoneの技術がさらに発展すれば、好きな歌手やアニメキャラクターの声で歌を歌うことがいずれは可能になると思う」と語った。
また、リアチェン voiceの他の用途としては、コールセンターでの活用を挙げている。「男性は声が低いため、コールセンターの電話対応には女性の声が最適だ。リアチェン voiceを活用すれば、男性でも女性の声で電話対応できるようになるだろう。それも、人に最も不快感を与えない“いい声”でだ」(飛河氏)。
Copyright © ITmedia, Inc. All Rights Reserved.