メディア

20ストリームの画像データを同時に処理できるSoCAmbarellaの車載SoC(2/2 ページ)

» 2022年01月13日 10時30分 公開
[Sally Ward-FoxtonEE Times]
前のページへ 1|2       

第3世代CVFlowアクセラレーターエンジンを搭載

 AmbarellaのCV3-High SoCは、照明/運転状況が厳しい環境でも動作可能な、イメージシグナルプロセッサを搭載する。また、ステレオカメラを処理するためのステレオ/高密度オプティカルフローアクセラレーターの他、Armの「Cortex-A78AE」を16個と、セーフティアイランド、ビデオコーデックなども備える。GPUは主にパーキングアシストに向けたセンサー出力の視覚表示をレンダリングするために使われている。

Ambarella「CV3」のブロック図。CVFlowエンジンの最上部で動作するのは、16個のArmコア「Cortex-A78AE」と、ステレオ/高密度オプティカルフロープロセッサ、イメージシグナルプロセッサ、ビデオコーデック、GPUである[クリックで拡大] 出所:Ambarella

 第3世代のCVFlowアクセラレーターエンジンが同シリーズで実装されるのは、今回が初めてである。旧世代のCVFlowエンジンとは対照的に、2つのブロックで構成されている。1つは、AIワークロードに対応するためのニューラルベクトルプロセッサ(NVP:Neural Vector Processor)で、もう1つは、浮動小数点対応の汎用ベクトルプロセッサ(GVP:General Vector Processor)だ。コンピュータビジョンワークロードはNVPから、浮動小数点ワークロードはArm CPUからオフロードされる。例えば、レーダー処理はGVPで対応し、知覚はNVPで実行することになる。いずれのブロックも、社内IPをベースとしている。

 NVPと新しいGVPとの間でワークロードを分割することにより、NVPでは、畳み込み処理やマトリクス処理をさらに最適化することが可能になる。

 Kohn氏は、「内部メモリシステムとそのシステム間のインターコネクトを最適化することにより、ボトルネックを取り除いて効率性を高められた他、内部のデータパスも全て再最適化することができた。つまり、アーキテクチャの根本的な変更というより、細部を修正することで、ボトルネックを取り除いてコアネットワーク処理を最適化したということだ」と述べる。

 またNVPバージョンは、グラフネットワークやトランスフォーマーなどのリアルタイムアプリケーション向けとして最近使われ始めた高性能ネットワークに共通した演算も追加している。

 NVPは、500eTOPSの8ビット性能または1000eTOPSの4ビット性能を達成する(Kohn氏によると、より現実的なシナリオとしては、別のネットワークレイヤーで使われる場合の精度が混在した状態になるという)。Ambarellaの第2世代SoCと比べると、性能は42倍向上した。

 同製品ファミリーのデバイスは将来的に、CVFlowエンジンのサイズや、イメージパイプラインのエンコーディング、複数の周辺機器などが拡大していくだろう。またソフトウェアについては、エントリーモデルやミドルクラス、高級車などでも使えるよう、CV3ファミリー全体で移行されていくとみられる。

 CV3-High全体の消費電力量は約50Wで、旧世代品と比べるとワット当たりの性能は4倍高い。その要因の1つとしては、5nmプロセス技術への移行が挙げられる。

 AmbarellaのCV3ファミリーにとって初となるSoCは、2022年前半にサンプル出荷が開始される予定だ。

【翻訳:田中留美、編集:EE Times Japan】

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.

RSSフィード

公式SNS

All material on this site Copyright © ITmedia, Inc. All Rights Reserved.
This site contains articles under license from AspenCore LLC.