検索
ニュース

Xilinx、エッジ向けVersalプラットフォームを開発自動運転システムなどを視野に(1/2 ページ)

Xilinxは、7nmプロセスを用いたマルチコアヘテロジニアス演算プラットフォーム「Versal ACAP(Adaptive Compute Acceleration Platform)」の新シリーズとして、自動運転システムなどに適応できるエッジ向け「Versal AI Edge(エッジ)」を発表した。

Share
Tweet
LINE
Hatena

単位ワット当たりのAI性能、GPUに比べ最大4倍に

 Xilinxは2021年6月9日、7nmプロセスを用いたマルチコアヘテロジニアス演算プラットフォーム「Versal ACAP(Adaptive Compute Acceleration Platform)」の新シリーズとして、自動運転システムなどに適応できるエッジ向け「Versal AI Edge(エッジ)」を発表した。

 Versal ACAPは、Xilinxが従来のFPGAやCPU、GPUとは全く異なるカテゴリーとして位置付ける製品群。「スカラーエンジン」や「リアルタイムプロセッサ」「適応型エンジン」「AI/DSPエンジン」などを集積している。

 これまで、クラウドとネットワーク向けに「Versal AI Core(コア)」や「Versal Prime(プライム)」「Versal Premium(プレミアム)」といったシリーズを発表してきた。新製品は、単位ワット当たりの性能を高めるなど、エッジ側に要求される性能や機能を実現した新シリーズとなる。


Versal ACAPの製品群 (クリックで拡大) 出典:Xilinx

 Versal AIエッジシリーズには、大きく3つの特長がある。「新たなAIエンジン(AIエンジン-ML)とメモリ階層における技術革新」「安全性とセキュリティで10倍の演算密度を達成」そして、「拡張性と適応性に優れたエッジ/エンドポイント向けプラットフォーム」を実現したことだ。


Versal AIエッジの特長 (クリックで拡大) 出典:Xilinx

機械学習に最適化した「AIエンジン-ML」


Rehan Tahir氏

 1つ目は、AIエンジンとメモリ階層における技術革新である。同社でVersal AIエッジシリーズのプロダクトライン担当シニアマネジャーを務めるRehan Tahir氏は、「一般的なGPUと比較して、単位ワット当たりのAI性能を最大4倍に高めることができた」という。

 機械学習に最適化した「AIエンジン-ML」は、これまでの「AIエンジン」に比べ乗算器を2倍に増やし、コア当たりINT8の性能を2倍とした。また、INT4演算は4倍、BFLOAT16演算は16倍を実現した。データメモリはこれまでの2倍となる64kバイトを内蔵した。さらに、新たなメモリタイルを採用。AIエンジン-MLアレイ全体で最大38Mバイトを搭載する。この結果、AIエンジンに比べ2分の1のレイテンシで4倍のML演算を可能にした。

AIエンジン-MLアレイの構成イメージと、アクセラレーターRAMの概要 (クリックで拡大) 出典:Xilinx

 メモリ階層も工夫した。4MバイトのアクセラレーターRAMを内蔵したことで、「ML演算の処理能力を20%向上させた」(Tahir氏)という。これまでオフチップのDDRメモリに保存していたAIイメージと演算データの保持やセーフティクリティカルなコードも、アクセラレーターRAMに格納することが可能だ。また、適応型エンジンには、「LUT RAM」や「ブロックRAM」「Ultra RAM」を内蔵し、最適な帯域幅のメモリを選択することができるという。

       | 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る