Xilinx、エッジ向けVersalプラットフォームを開発：自動運転システムなどを視野に（1/2 ページ）

Xilinxは、7nmプロセスを用いたマルチコアヘテロジニアス演算プラットフォーム「Versal ACAP（Adaptive Compute Acceleration Platform）」の新シリーズとして、自動運転システムなどに適応できるエッジ向け「Versal AI Edge（エッジ）」を発表した。

[馬本隆綱，EE Times Japan] PC用表示関連情報

LINE

Hatena

単位ワット当たりのAI性能、GPUに比べ最大4倍に

　Xilinxは2021年6月9日、7nmプロセスを用いたマルチコアヘテロジニアス演算プラットフォーム「Versal ACAP（Adaptive Compute Acceleration Platform）」の新シリーズとして、自動運転システムなどに適応できるエッジ向け「Versal AI Edge（エッジ）」を発表した。

　Versal ACAPは、Xilinxが従来のFPGAやCPU、GPUとは全く異なるカテゴリーとして位置付ける製品群。「スカラーエンジン」や「リアルタイムプロセッサ」「適応型エンジン」「AI／DSPエンジン」などを集積している。

　これまで、クラウドとネットワーク向けに「Versal AI Core（コア）」や「Versal Prime（プライム）」「Versal Premium（プレミアム）」といったシリーズを発表してきた。新製品は、単位ワット当たりの性能を高めるなど、エッジ側に要求される性能や機能を実現した新シリーズとなる。

Versal ACAPの製品群（クリックで拡大）出典：Xilinx

　Versal AIエッジシリーズには、大きく3つの特長がある。「新たなAIエンジン（AIエンジン-ML）とメモリ階層における技術革新」「安全性とセキュリティで10倍の演算密度を達成」そして、「拡張性と適応性に優れたエッジ／エンドポイント向けプラットフォーム」を実現したことだ。

Versal AIエッジの特長（クリックで拡大）出典：Xilinx

機械学習に最適化した「AIエンジン-ML」

Rehan Tahir氏

　1つ目は、AIエンジンとメモリ階層における技術革新である。同社でVersal AIエッジシリーズのプロダクトライン担当シニアマネジャーを務めるRehan Tahir氏は、「一般的なGPUと比較して、単位ワット当たりのAI性能を最大4倍に高めることができた」という。

　機械学習に最適化した「AIエンジン-ML」は、これまでの「AIエンジン」に比べ乗算器を2倍に増やし、コア当たりINT8の性能を2倍とした。また、INT4演算は4倍、BFLOAT16演算は16倍を実現した。データメモリはこれまでの2倍となる64kバイトを内蔵した。さらに、新たなメモリタイルを採用。AIエンジン-MLアレイ全体で最大38Mバイトを搭載する。この結果、AIエンジンに比べ2分の1のレイテンシで4倍のML演算を可能にした。

AIエンジン-MLアレイの構成イメージと、アクセラレーターRAMの概要（クリックで拡大）出典：Xilinx

　メモリ階層も工夫した。4MバイトのアクセラレーターRAMを内蔵したことで、「ML演算の処理能力を20％向上させた」（Tahir氏）という。これまでオフチップのDDRメモリに保存していたAIイメージと演算データの保持やセーフティクリティカルなコードも、アクセラレーターRAMに格納することが可能だ。また、適応型エンジンには、「LUT RAM」や「ブロックRAM」「Ultra RAM」を内蔵し、最適な帯域幅のメモリを選択することができるという。

10倍の演算密度を実現

　　　　　　 | 次のページへ