メディア

IoT時代、ディープラーニングの主用途は制御かPFN、同社のAI事業を説明(2/2 ページ)

» 2017年07月25日 15時30分 公開
[辻村祐揮EE Times Japan]
前のページへ 1|2       

データ量1.6ZB時代に必要な処理性能

 PFNはディープラーニングのIoTへの応用だけでなく、IoTの加速により大量のデータが溢れ返る時代に向け、ディープラーニングの処理能力向上にも取り組んでいる。西川氏によると、2015年に200エクサバイト(EB)程度だったデータ量が、2020年にはその8倍の1.6ゼタバイト(ZB)くらいになるという。そうなると、相応の処理性能がディープラーニングに求められる。

IoT普及に伴うデータ増加量の予測 出典:PFN(クリックで拡大)

 副社長の岡野原大輔氏は、「IoTが普及し機械が生成するデータ量が増加すると、ディープラーニングに必要な計算リソースも加速度的に上昇していく。現時点では、数ぺタFLOPS程度(GPU300個分)で済んでいるが、2019年くらいには1エクサFLOPS相当の計算リソースが必要となる。その後、10エクサFLOPS、100エクサFLOPSと、必要な計算リソースは膨れ上がっていく」と説明する。

データ量増加に伴う計算リソース増加量の予測 出典:PFN(クリックで拡大)

 ディープラーニングは学習データが多いほど高精度になるため、いかに大量のデータを学習させるかが重要だ。その手段の1つとして、PFNはスーパーコンピューティング(並列計算)の活用に注目している。同社は既に、ResNet-50というタスクを128個のGPUで並列処理する実験に成功。従来の100倍に近い速度で達成した。

Chainer MNと他のフレームとの比較 出典:PFN(クリックで拡大)

 実験では、複数のコンピュータで分散学習する機能を同社のディープラーニングフレームワーク「Chainer」に搭載させるための追加パッケージ「Chainer MN(Multi Node)」を活用した。PFNの齋藤俊太氏によると、MXNet、CNTK、TensorFlowといった他のディープラーニングフレームワークに比べ、Cainer MNは学習完了に必要な時間が短いという。

 PFNが注目するもう1つの手段が、同社がエッジヘビーコンピューティングと呼ぶ分散コンピューティングだ。全てのデータをクラウドで一元処理するのではなく、デバイスに近いエッジの部分で分散的にデータを処理する手法である。西川氏は「データ量が爆発的に増加すると、デバイスに近いところ、エッジで処理する必要がある。そうすれば、重要なデータだけをクラウドに上げられるし、全てのデータを対象にできる」と語った。

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.

RSSフィード

公式SNS

All material on this site Copyright © ITmedia, Inc. All Rights Reserved.
This site contains articles under license from AspenCore LLC.