NVIDIA、リアルタイム会話型AIプラットフォーム:最新の自然言語理解を活用
NVIDIAは、自然な顧客対応を可能にするリアルタイム会話型AI(人工知能)プラットフォームを発表した。BERTを53分間でトレーニングし、推論は2ミリ秒で行う。
BERT-Largeのトレーニング時間を53分に短縮
NVIDIAは2019年8月、自然な顧客対応を可能にするリアルタイム会話型AI(人工知能)プラットフォームを発表した。AI言語モデルの「BERT(Bidirectional Encoder Representations from Transformers)」を1時間未満でトレーニングし、推論をわずか2ミリ秒で行うことができるという。
コミュニケーションツールとして、チャットボットなど対話できるロボットが数年前から登場してきた。ただ、これらの製品は限定された会話にとどまっているのがほとんどで、人間並みの自然な対応を可能にするには、極めて大型のAIモデルを用意する必要があった。
新たに開発したリアルタイム会話型AIプラットフォームは、これまで提供してきたAIプラットフォームを最適化することで、トレーニング時間や推論時間といった自然言語理解性能を大幅に向上させた。
リアルタイム会話型AIプラットフォームは、92ノードのディープラーニングシステム「NVIDIA DGX-2H」からなり、1472個の「NVIDIA V100」GPUコアを搭載したスーパーコンピュータ「NVIDIA DGX SuperPOD」でBERTの大型バージョンを実行することにより、BERT-Largeのトレーニング時間をわずか53分に短縮することができた。従来システムではトレーニングに数日間要していたという。
また、AIモデルをGPU上で高速に推論できるよう最適化するライブラリー「NVIDIA TensorRT」を実装した「NVIDIA T4 GPU」を利用すれば、BERT-Base SQuADデータセットでの推論を、わずか2.2ミリ秒で実行できるという。
さらに、BERTやTransformerをベースとした、世界最大の言語モデル構築とトレーニングを行った。NVIDIAのカスタムモデルは83億のパラメーターを持ち、その規模はBERT-Largeの24倍である。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- NVIDIA、99ドルのAIコンピュータを発表
NVIDIAは、高い演算性能を持ちながら消費電力が小さいCUDA-X AI(人工知能)コンピュータ「Jetson Nano」を発表した。開発者や個人のクリエーターなどに向けた「開発者キット」の価格はわずか99米ドルである。 - NVIDIAがTuring世代の「GeForce RTX 2060」を発表
NVIDIAは、同社の「Turing GPU」アーキテクチャをベースとした、初となるミドルレンジGPU「GeForce RTX 2060(以下、RTX 2060)」を発表した。PCゲーマー向けに、リアルタイムのレイトレーシンググラフィックスを、349米ドルという低価格のカードで提供可能だという。 - 個人情報を守る協調機械学習が医療用AIを加速する
英国の国民健康保険(NHS:National Health Service)が使用するための、業界初となる医療画像向けのAI(人工知能)プラットフォームの実現を目指し、新しいプロジェクトが始動する。これは、King’s College London(KCL)とNVIDIAが共同で進めるプロジェクトで、放射線処理の中で最も時間がかかる放射線データの解釈を、自動化することを目指すという。 - NVIDIAが語るVoltaとTuring、最新GPUはこう使おう
NVIDIAのGPUアーキテクチャである「Turing」と「Volta」。これら2つのアーキテクチャでは、RTコアとTensorコアという2つのユニットが性能躍進の立役者となった。GTC Japan 2018の講演から、アーキテクチャをおさらいし、最新GPUを効率的に活用するための手法を紹介する。