音声再生専用ハード搭載でCPUの負荷を低減するマイコン:セイコーエプソン(2/2 ページ)
セイコーエプソンは2018年7月31日、音声再生専用のハードウェアを搭載した32ビットマイコン「S1C31D50」を発表した。給湯器リモコンや家電、音声でアラートを発する火災警報器など、音声をクリアに出力する必要がある組み込み機器に向ける。
ナレーターいらず、音声はPCで作成する
セイコーエプソンは、「簡単に使ってもらうために、開発環境にもごだわった」と述べる。「通常、音声再生機能を搭載するには、ナレーターとスタジオを予約し、音声を録音して、チェックして、必要があれば再度録音して、という作業を繰り返す。これにかなり時間とコストがかかっている。さらに、昨年発売したモデルに音声を3つだけ追加したい、といった場合は、全て録音し直さなくてはならない」(セイコーエプソン)
S1C31D50の開発環境では、セイコーエプソンの音声作成ツールを使って、PCで音声データを作成できる。「お風呂が沸きました」など、必要な音声をテキスト入力し、フレーズ間のディレイタイムを調節後、サウンドROM作成のボタンをクリックするだけで、ナレーターの音声とそん色のない音声を作成することができる。日本語だけでなく、英語、中国語、韓国語の計4カ国語に対応している。
PCツール上の音声番号を、HW Processorの制御用レジスタに指定すれば音声を再生できるので、音声データの接続などのコード作成および評価は不要だ。さらに、wavファイルをインポートすることで既存音声も使用できる上に、新たに音声を追加したい場合も、テキストを入力するだけで簡単に行える。
セイコーエプソンは、S1C31D50用の評価ボードも用意している。「任意の音声を出力するまでに、これまではスタジオやナレーターの予約だけで1カ月近くかかっていたものが、評価ボードを使えば約30分ほどでできるようになる」(同社)
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 開き直る人工知能 〜 「完璧さ」を捨てた故に進歩した稀有な技術
音声認識技術に対して、長らく憎悪にも近い感情を抱いていた筆者ですが、最近の音声認識技術の進歩には目を見張るものがあります。当初は、とても使いものにはならなかったこの技術は、なぜそこまでの発展を遂げられたのか――。そこには、「音声なんぞ完璧に聞き取れるわけない!」という、ある種の“開き直り”があったのではないでしょうか。 - モノマネする人工知能 〜 自動翻訳を支える影の立役者
最近の機械翻訳の発展には目を見張るものがあります。なぜ、ここまで進化しているのでしょうか。AI(人工知能)による翻訳、通訳を取り上げ、その発展の理由を探ってみると、その根底には、あるパラダイムシフトが存在していたことが分かりました。 - AIで複数の同時音声を分離、再現率は驚異の90%
三菱電機は研究成果披露会で、同社独自のAI技術「ディープクラスタリング」を用いた音声分離技術を発表した。この技術では、マイク1本で録音した複数話者の同時音声を分離し、きれいに再現できる。従来の技術では原音再現率が51%だったが、三菱電機の音声分離技術の場合90%以上となる。 - 自分の声を他人やキャラクターの声に変えるAI技術
クリムゾンテクノロジーが「AI・人工知能 EXPO」に、リアルタイム音声変換システム「リアチェン voice」を出展した。リアチェン voiceを活用すれば、異性を含む他人やキャラクターの声で話したり、歌ったりすることが可能になる。 - NXP、音声認識技術でAmazonと協業
NXP Semiconductorsは、Amazonが提供するクラウドベースの音声認識サービス「Amazon Alexa」に対応した機器の開発を簡素化することができる「NXPリファレンスプラットフォーム」を発表した。 - 医療現場で多言語翻訳の臨床試験、富士通も参加
情報通信研究機構(NICT)と富士通は、病院などの医療現場で多言語音声翻訳システムを活用した臨床試験を行う。病院を訪れる外国人患者数が増加する中で、言葉の壁を感じさせずに、日本人医療者と自由に会話できる環境を提供する。