Transformerモデルの推論を実行するエッジAIチップ:米新興企業Perceive(2/2 ページ)
XperiからスピンアウトしたAIチップ開発の新興企業Perceiveが、第2世代チップ「Ergo 2」をリリースした。1万パラメータ超のTransformerモデルの推論をエッジで実行可能だという。
Transformerモデルを圧縮
PerceiveはErgo 2向けに、Transformerモデルを圧縮する方法を開発し、その圧縮モデルをハードウェアでサポートしている。
Perceiveの優位性は、ワークロードの操作、ハードウェアアクセラレーションにそれぞれどの程度依存しているのだろうか。
Teig氏は、「両方に依存しているが、その大半は確実にソフトウェアまたは計算だといえる。第1に、圧縮が存在する箇所に対して数学的手法を用いること。第2が、ソフトウェアの観点から見ること。そして第3が、半導体チップ/ハードウェア上でニューラルネットワークの表現を加速することである」と述べる。
Perceiveの圧縮ツールフローは、マクロ、マイクロ、コンパイル3つで構成される。マクロは、大規模圧縮の可能性を見つけ出して利用する。マイクロは、別の圧縮技術を適用してもっと小規模な圧縮の可能性を探し出す。そしてコンパイルステージでは、メモリを管理して電力消費量を最適化する。Ergo 2の性能は、この3つの全てに依存している。
Perceiveのソフトウェアスタックは、SDKレベルでPytorchモデルを再トレーニングすることにより、ErgoまたはErgo 2との互換性を確保している。また、CPU上で後処理タスク向けに使用するCライブラリの他、顧客側で構築可能で、低消費電力動作向けに最適化されたニューラルネットワークモデルを約20モデルそろえたModel Zooなどもある。
また、Ergo 2は、アーキテクチャ変更も可能で、例えば新しい統合型メモリ空間(初代Ergoは、ニューラルネットワークおよびオンチップCPU向けに個別のメモリ空間を確保していた)や、Transformerモデル向けのハードウェアサポートなどを備える。Teig氏は、新しいメモリ空間の具体的な大きさについては明かさなかったが、「統合型メモリ空間は、サブシステムでメモリをもっと効率的に共有可能であるということを意味する」と主張している。例えば、画像推論の実行中、まずメモリ全体が最初にフレームバッファーとして使われれることがある。そして、ニューラルネットワークが画像を解析する過程で、CPUが同じメモリを後処理向けに使用する前に、必要に応じて徐々にメモリを占有することが可能だ。
【翻訳:田中留美、編集:EE Times Japan】
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- シングルプロセッサで200億パラメーターを持つAIモデルを学習
Cerebras Systems(以下、Cerebras)は、第2世代のウエハースケールエンジンの能力を披露し、単一デバイスでトレーニングしたAI(人工知能)モデルとして最大記録を樹立したと発表した。 - マイコン用エッジAI開発環境、STがクラウド版を発表
STMicroelectronicsは、既存のオフライン版と並行して、機械学習開発環境「STM32Cube.AI」のクラウド版を発表した。同社は、クラウドアクセス可能なテスト用マイコンボードも提供するという。 - 低消費電力で高速な推論を実現する組み込みAIチップ
ルネサス エレクトロニクス(以下、ルネサス)は2022年12月8日、NEDOのプロジェクトにおいて、従来技術に比べて最大10倍の電力効率を実現したAI(人工知能)チップを開発したと発表した。 - 「インテリジェントエッジが「産業分野革新の原動力に」、ADI
Analog Devices(以下、ADI)はドイツ・ミュンヘンで開催された欧州最大規模のエレクトロニクス展示会「electronica 2022」(2022年11月15〜18日)に出展した。会場で取材に応じた同社の産業およびマルチマーケット担当シニアバイスプレジデント、Martin Cotter氏は、「インテリジェントエッジが産業分野におけるブレークスルーの原動力となる」とし、同社の取り組みについて語った。 - 画像処理速度を4倍に、モデル圧縮とFPGA実装も自動化
沖電気工業(OKI)とOKIアイディエス、フランスMipsologyは2022年10月17日、AI(人工知能)による画像処理速度を従来比4倍に高速化する技術を発表した。3社は同日に記者説明会を開催し、同技術のデモを披露した。 - 「汎用FPGAの空白を埋める」、Efinixの成長戦略を聞く
FPGAはかつては2社が独占していたが、現在は60億米ドルを超えるFPGA市場のさまざまな隙間を埋めようとする企業が数多く存在する。そうした企業の1つで、近くナスダック上場も計画する成長企業EfinixのCEOに、米国EE Timesが独占インタビューを行った。