メディア

教師データなしでもAI技術の判断精度を向上高次元データの特徴を正確に獲得

富士通研究所は、教師データなしでも入力データの特徴量を正確に捉えることができるAI技術「DeepTwin(ディープツイン)」を開発した。2021年度中の実用化を目指す。

» 2020年07月15日 13時30分 公開
[馬本隆綱EE Times Japan]

画像/音声圧縮技術の知見とディープラーニングを融合

 富士通研究所は2020年7月、教師データなしでも入力データの特徴量を正確に捉えることができるAI技術「DeepTwin(ディープツイン)」を開発したと発表した。2021年度中の実用化を目指す。開発成果は、富士通のAI技術「FUJITSU Human Centric AI Zinrai(ジンライ)」に活用していく予定である。

 一般的に、AIの学習には大量の教師データを用いる。しかし、教師データの作成には膨大な時間とコストが必要となる。このため、ディープラーニングを使い、入力データの次元を削減する手法などが用いられてきた。ところが、削減の方法によっては入力データの特徴を正確に捉えることができず、AIが誤った判定を下すこともあったという。

従来技術による次元削減の課題 (クリックで拡大) 出典:富士通研究所

 そこで同社は、情報通信分野で蓄積してきた画像/音声データ圧縮技術の知識とディープラーニングを融合させることで、従来の課題を解決した。具体的には、分布や確率が未知の高次元データに対し、その次元をニューラルネットワークの一つであるオートエンコーダーで削減。次元削減後のデータは、元の高次元データの特徴を保持しつつ、情報量や次元が最小化されていることを数学的に証明した。復元した時の誤差も一定の範囲に抑えられているという。

データの特徴に忠実な分布や確率を獲得する理論フレームワーク (クリックで拡大) 出典:富士通研究所

 また、高次元データで削除すべき次元数と削除後のデータ分布をパラメーターで制御し、圧縮後に最小化すべき評価項目をディープラーニングで最適化した。これによって、削減後もデータの特徴を正確に捉えることが可能となった。

次元削減変換と分布/確率を求めるディープラーニング技術 (クリックで拡大) 出典:富士通研究所

 富士通研究所は、データマイニングの国際学会「Knowledge Discovery and Data Mining(KDD)」が配布する「通信アクセスデータ」や、カリフォルニア大学アーヴァイン校が配布している「甲状腺数値データ」「不整脈データ」を用いて、開発した「DeepTwin」による異常検知のベンチマークを行った。この結果、従来のディープラーニングベースの誤り率と比べ、最大37%も改善するなど世界最高レベルの精度を実現していることが分かった。

DeepTwinと従来技術の異常検知誤り率を比較 出典:富士通研究所

Copyright © ITmedia, Inc. All Rights Reserved.

RSSフィード

公式SNS

All material on this site Copyright © ITmedia, Inc. All Rights Reserved.
This site contains articles under license from AspenCore LLC.