メディア

14ビデオストリーム上でAIを同時に実行可能なSoCAmbarellaが開発(2/2 ページ)

» 2021年07月07日 11時30分 公開
[Sally Ward-FoxtonEE Times]
前のページへ 1|2       

アクセラレーターエンジン

 同SoCに搭載されているAIアクセラレーターは、畳み込みニューラルネットワーク(CNN)をはじめ、他の一般的なAI機能の高速化を実現することが可能なベクトルプロセッサだ。標準的なコンピュータビジョン(画像処理認識)のワークロード向けとして使用することもできる。またユーザーは、ニューラルネットワークを部分的に実行するか(例:シングルショット検出ネットワーク(SSD)のアルゴリズムのソートなど)、またはArm「Cortex-A76」のデュアルコアプロセッサで実行するかを選択することが可能だ。

 ソフトウェアスタックの実行により、アプリケーションでスパース係数をうまく利用して、ゼロに近いネットワーク係数値を切り捨ててゼロにするという技術を適用できるようになる。この手法では、アルゴリズムを“枝刈り(プルーニング)”することで計算要件を大幅に削減することが可能だ。

 Gigot氏は、「スパース化は、ゼロ係数が存在する場合に、スキップ機能を使うことで、アーキテクチャ内で操作を実行せずに済むため、われわれにとっては非常に効果的な技術である」と述べている。

 「このプロセスでは通常、係数全体の50〜80%がターゲットとして認識される。スパース化後に、プロセスのさなかに失われた予測精度を取り戻すために、多少の再トレーニングが必要な場合もある。再トレーニングでは通常、精度をオリジナルモデルの1%未満に戻すことが可能だ。特に、モデル規模を最大で5分の1に縮小できることから、大半の顧客にとっては許容範囲のトレードオフだといえる。また当社は、よりアーキテクチャを意識したスパース化や量子化ツールなどの開発も進めているところだ」(同氏)

マルチセンサーカメラシステム向けの「CV5S」は、Ambarellaの最新世代の「CVflow」が搭載されている 出典:Ambarella(クリックで拡大)

 最大14のビデオストリームをサポートでき、これらのストリーム上でAIを同時に実行可能であるということは、顧客企業は複数のニューラルネットワークを同時に実行することになるのだろうか。また、何らかの多重化方式が必要なのだろうか。

 Gigot氏はこの疑問に対し、「答えはいずれも”イエス”だ。CVflowは、非常に高速なベクトルエンジンであり、CNNエンジンだ。全てが時分割で実行される。ハードウェアの中に異なるパスを用意することで、オペレーションを並列処理することができるが、GPU上のバッチ処理と完全に異なるような特定のネットワークには関連付けしない」と説明した。

 CV5SとCV52Sは、2021年10月にサンプル出荷を開始する。

【翻訳:田中留美、編集:EE Times Japan】

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.

RSSフィード

公式SNS

All material on this site Copyright © ITmedia, Inc. All Rights Reserved.
This site contains articles under license from AspenCore LLC.