“データの意味を推定”するAI、NECが開発:1カ月要した作業が1時間に短縮
NECは、さまざまなデータシートに記載された数値の意味を推定するAI(人工知能)技術「データ意味理解技術」を開発した。専門家でも1カ月要していたデータ統合作業を、わずか1時間に短縮できるという
1カ月要した作業時間を1時間に短縮
NECは2019年8月、さまざまなデータシートに記載された数値の意味を推定するAI(人工知能)技術「データ意味理解技術」を開発したと発表した。これまで専門家が1カ月かけて行っていたデータ統合作業を、わずか1時間に短縮できることを確認した。
あらゆる業種の企業が作成した膨大なデータは、表名や列名が統一されていない場合が多い。これらのデータを共有して統合、分析を行うには、専門家が表データの表記ゆれを精査するなど、人手で統合する必要があった。このため、データ統合に膨大な時間が必要となり、作業者によるスキルのばらつきなども課題となっていた。
NECが開発したデータ意味理解技術は、表データの構造と数値特性を含む、さまざまな単語のナレッジグラフを活用することで、データの統合作業を自動化し効率を大幅に改善できる、独自の機械学習アルゴリズムである。
具体的には、同じ意味の数値データは分布傾向が似ていることを利用し、ナレッジグラフ上にある単語ごとの数値分布と比較する。これにより、列名がないデータであっても、それは「売上高」などと推定することができるという。
また、ナレッジグラフ上のネットワーク距離を活用して、「推定対象のデータ列の意味候補」と「同一表データにある他のデータ列の意味」の共起関係を推定する。例えば、同じ表データに「氏名」の項目があれば、他のデータが「気温」ではなく、「年齢」が妥当であると推定する。これによって推定の精度を高めた。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- NEC史上最年少で主席研究員になった天才がもたらした、起死回生のチャンス
1990年代、シリコンバレーでのコーポレートベンチャリング活動で、うまくいったとは言えないNEC。そこからは、コーポレートベンチャリングに対しては守りの経営が長く続いた。だが、NEC史上最年少で主席研究員となった、ある人物がそれを大きく変えようとしている。 - 2023年までに量子コンピュータの実用化を目指すNEC
NECは、2023年までに、1ミリ秒と長いコヒーレント時間を持つアニーリング型量子コンピュータ(量子アニーリングマシン)を本格的に実用化すべく、開発を進めている。 - FPGAでエッジAIを高速に、NECが専用ツールをデモ
NECは「第8回 IoT/M2M展」(2019年4月10〜12日、東京ビッグサイト)で、FPGAを使った高速画像判定や、顔が写っていなくても人物を照合できる技術、推論を高速化する「NEC AI Accelerator」などを展示した。 - NEC、顔画像のみに頼らない人物照合技術を開発
NECは、カメラに映った服装や体型からでも人物を照合できる技術を開発した。多くの人物や遮る物があって、照合したい人物の顔や体の一部が確認できない場所でも、全身の外観画像を用いて同一人物かどうかを判定することが可能となる。 - NECと東大、カメラで高速かつ高精度に物体認識
NECと東京大学の研究グループは共同で、「高速カメラ物体認識技術」を開発した。撮影した大量の画像データから、不具合のある製品などを高速かつ高精度に判別することができる。 - NEC、シリコンバレーにAIデータ分析の新会社を設立
NECは2018年4月26日、AIを活用した新たなデータ分析事業の展開について記者会見を都内で開催し、データ分析ソフトウェアを開発および販売する新会社を米国に設立すると発表した。