Xilinx、エッジ向けVersalプラットフォームを開発:自動運転システムなどを視野に(1/2 ページ)
Xilinxは、7nmプロセスを用いたマルチコアヘテロジニアス演算プラットフォーム「Versal ACAP(Adaptive Compute Acceleration Platform)」の新シリーズとして、自動運転システムなどに適応できるエッジ向け「Versal AI Edge(エッジ)」を発表した。
単位ワット当たりのAI性能、GPUに比べ最大4倍に
Xilinxは2021年6月9日、7nmプロセスを用いたマルチコアヘテロジニアス演算プラットフォーム「Versal ACAP(Adaptive Compute Acceleration Platform)」の新シリーズとして、自動運転システムなどに適応できるエッジ向け「Versal AI Edge(エッジ)」を発表した。
Versal ACAPは、Xilinxが従来のFPGAやCPU、GPUとは全く異なるカテゴリーとして位置付ける製品群。「スカラーエンジン」や「リアルタイムプロセッサ」「適応型エンジン」「AI/DSPエンジン」などを集積している。
これまで、クラウドとネットワーク向けに「Versal AI Core(コア)」や「Versal Prime(プライム)」「Versal Premium(プレミアム)」といったシリーズを発表してきた。新製品は、単位ワット当たりの性能を高めるなど、エッジ側に要求される性能や機能を実現した新シリーズとなる。
Versal AIエッジシリーズには、大きく3つの特長がある。「新たなAIエンジン(AIエンジン-ML)とメモリ階層における技術革新」「安全性とセキュリティで10倍の演算密度を達成」そして、「拡張性と適応性に優れたエッジ/エンドポイント向けプラットフォーム」を実現したことだ。
機械学習に最適化した「AIエンジン-ML」
1つ目は、AIエンジンとメモリ階層における技術革新である。同社でVersal AIエッジシリーズのプロダクトライン担当シニアマネジャーを務めるRehan Tahir氏は、「一般的なGPUと比較して、単位ワット当たりのAI性能を最大4倍に高めることができた」という。
機械学習に最適化した「AIエンジン-ML」は、これまでの「AIエンジン」に比べ乗算器を2倍に増やし、コア当たりINT8の性能を2倍とした。また、INT4演算は4倍、BFLOAT16演算は16倍を実現した。データメモリはこれまでの2倍となる64kバイトを内蔵した。さらに、新たなメモリタイルを採用。AIエンジン-MLアレイ全体で最大38Mバイトを搭載する。この結果、AIエンジンに比べ2分の1のレイテンシで4倍のML演算を可能にした。
メモリ階層も工夫した。4MバイトのアクセラレーターRAMを内蔵したことで、「ML演算の処理能力を20%向上させた」(Tahir氏)という。これまでオフチップのDDRメモリに保存していたAIイメージと演算データの保持やセーフティクリティカルなコードも、アクセラレーターRAMに格納することが可能だ。また、適応型エンジンには、「LUT RAM」や「ブロックRAM」「Ultra RAM」を内蔵し、最適な帯域幅のメモリを選択することができるという。
Copyright © ITmedia, Inc. All Rights Reserved.