NVIDIAは、自然な顧客対応を可能にするリアルタイム会話型AI(人工知能)プラットフォームを発表した。BERTを53分間でトレーニングし、推論は2ミリ秒で行う。
NVIDIAは2019年8月、自然な顧客対応を可能にするリアルタイム会話型AI(人工知能)プラットフォームを発表した。AI言語モデルの「BERT(Bidirectional Encoder Representations from Transformers)」を1時間未満でトレーニングし、推論をわずか2ミリ秒で行うことができるという。
コミュニケーションツールとして、チャットボットなど対話できるロボットが数年前から登場してきた。ただ、これらの製品は限定された会話にとどまっているのがほとんどで、人間並みの自然な対応を可能にするには、極めて大型のAIモデルを用意する必要があった。
新たに開発したリアルタイム会話型AIプラットフォームは、これまで提供してきたAIプラットフォームを最適化することで、トレーニング時間や推論時間といった自然言語理解性能を大幅に向上させた。
リアルタイム会話型AIプラットフォームは、92ノードのディープラーニングシステム「NVIDIA DGX-2H」からなり、1472個の「NVIDIA V100」GPUコアを搭載したスーパーコンピュータ「NVIDIA DGX SuperPOD」でBERTの大型バージョンを実行することにより、BERT-Largeのトレーニング時間をわずか53分に短縮することができた。従来システムではトレーニングに数日間要していたという。
また、AIモデルをGPU上で高速に推論できるよう最適化するライブラリー「NVIDIA TensorRT」を実装した「NVIDIA T4 GPU」を利用すれば、BERT-Base SQuADデータセットでの推論を、わずか2.2ミリ秒で実行できるという。
さらに、BERTやTransformerをベースとした、世界最大の言語モデル構築とトレーニングを行った。NVIDIAのカスタムモデルは83億のパラメーターを持ち、その規模はBERT-Largeの24倍である。
Copyright © ITmedia, Inc. All Rights Reserved.