会話音声から満足や不満を自動的に特定する技術:「声の明るさ」を定量化
富士通研究所は、顧客と応対者の会話音声から自動的に満足や不安を特定する音声分析技術を開発した。2016年末から富士通とエフサスでコールセンター関連サービスで商品化予定という。
人の判断と比較して約70%の精度
富士通研究所は2016年10月17日、コールセンターや銀行窓口などで、顧客と応対者の会話音声から自動的に満足や不安を特定する音声分析技術を開発したと発表した。
同技術により、満足や不満を人が聞いて判断した結果と比較して、約70%の精度で推定可能。富士通とエフサスのコールセンター3拠点において、同技術の評価ツールを用いて実施した実証実験では、教育にかかる時間が30%減と効率化を実現できたという。
同技術は、2016年度末から富士通とエフサスでコールセンター関連サービスで商品化予定。また、富士通のAI技術「Human Centric AI Zinrai」を強化する技術としても利用し、銀行窓口や医療、教育現場などにおいて、2018年度の製品化を目指す。
声の高さの変化パターンから
コールセンターや遠隔教育サービスなどでは従来、音声認識技術を用いて顧客との会話音声を文字に変換して、顧客の感情を把握する取り組みが行われてきた。
しかし、実際の会話は文法と関係なく話されるほか、周囲の雑音の影響もあるため、誤って変換される場合があるなど、技術的に困難な部分が多い。文字に起こして分析する手法そのものも、顧客の感情を正確に捉えることが難しかったという。
富士通研究所が開発した技術は、声の高さの変化から「声の明るさ」を定量化する。一般的に、明るい声は声のトーンが高く、声のトーンや声量が大きく変化する性質がある。明るい声には、話し始めや話し終わりの声の高さの変化に特有の性質があることも分かったという。そのため、声の高さの平均や変化の分析と、音声データ中の相対的な位置における特有の変化を捉える手法を組み合わせて、声の明るさの定量化に成功した。
また、富士通研究所は、声の印象として知覚される「明るさ」と「満足感」には高い相関関係があるため、独自の調査結果に基づく変換式により会話中の満足感も定量化。これと現場の応対評価の結果と合わせて、機械学習を用いて満足や不満の判定閾値(しきいち)を学習することで、自動的に満足・不満箇所を特定する技術も開発した。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- “B5サイズの電気自動車”が13万円で予約開始
日本のスタートアップCOCOA MOTORSは、同社が開発した、13型ノートPCと同等サイズの電気自動車「WALKCAR」の一般予約を開始した。価格は12万8000円。どうする! 買っちゃう!? - 虹彩認証でスマホのパスワードが不要に
Tessera Technologiesの完全子会社である米FotoNationは、一連の新しい生体認証アルゴリズムを開発したと発表した。顔認識および虹彩認識技術を適用することで、スマートフォンのパスワードを不要にすることが可能だという。 - 200kmを検知、ミリ波レーダー向けCMOS回路
富士通研究所は、周波数の変調速度を高めたCMOSミリ波信号源回路を開発した。「76G〜81GHzの広帯域で世界最速の周波数変換を実現した」(同社)ことで、車載レーダー用途では、相対速度が時速200kmでも、車両や歩行者などのターゲットを検知することが可能になる。 - ゲート長1nmのトランジスタ、CNT活用で米が開発
米国のローレンスバークレー国立研究所が、カーボンナノチューブ(CNT)をゲートに用いて、ゲート長がわずか1nmのトランジスタを開発した。 - 透明スクリーンにホログラフィック映像を表示
情報通信研究機構(NICT)電磁波研究所の電磁波応用総合研究室は、透明な光学スクリーンにホログラム映像が浮かび上がるプロジェクション型ホログラフィック3D映像技術を開発した。実用的な画面サイズと視野角の両立を可能にした。 - もう1つのAIが創り出す「空中映像」に触れる
アスカネットは、「Aerial Imaging-空中ディスプレイ」と呼ぶ空間映像技術について、プレスカンファレンスを開催した。同社のAIプレートは、高輝度な空中映像を実像として結像できるという。