メディア

NEC、半分の学習データ量で済む深層学習技術苦手な学習データを集中的に生成

NECは、学習データ量が従来のほぼ半分でも、高い識別精度を維持できるディープラーニング(深層学習)技術を開発した。

» 2019年08月22日 10時30分 公開
[馬本隆綱EE Times Japan]

専門家によるデータ生成の調整も不要

 NECは2019年8月、学習データ量が従来のほぼ半分でも、高い識別精度を維持できるディープラーニング(深層学習)技術を開発したと発表した。多くの学習データを収集することが難しい、製品の外観検査やインフラ保全などの用途に向ける。

 ディープラーニングを応用したシステムで、識別の精度を向上させるには、識別が難しい「苦手な学習データ」を、より多く学習することが効果的といわれている。従来は、「データ拡張」と呼ばれる手法で、データ量を人工的に増やしてきた。ところが、この方法だと高い効果が得られる苦手な学習データを生成するまでに至らなかったという。

従来技術(データ拡張)と、今回開発した技術の違い 出典:NEC
従来技術では識別が苦手な学習データを生成するのは難しい 出典:NEC

 そこでNECは、ニューラルネットワークの中間層で得られる特徴量を意図的に変化させ、識別がしにくい「苦手な学習データ」を、集中的に人工生成させ、識別精度を高めることに成功した。手書き数字認識や物体認識の公開データベースを用いて、開発した技術を評価したところ、学習データ量が半分でも、識別精度は従来技術と変わらないことが分かった。

公開データベースによる評価結果 (クリックで拡大) 出典:NEC

 また、ニューラルネットワーク内部の数値に基づき、自動的に学習データを生成することが可能だ。このため、さまざまなデータに対し汎用的かつ効率良く適用することができる。データの種類が異なっても、従来のように専門家がデータ生成方法を調整する必要はないという。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSフィード

公式SNS

All material on this site Copyright © ITmedia, Inc. All Rights Reserved.
This site contains articles under license from AspenCore LLC.