メディア

10億パラメータモデルがエッジで動く Armの新プラットフォームArmv9ベースのCPUコア+NPUで構成(1/2 ページ)

Armは、エッジAI向けに最適化した「Armv9」ベースのプラットフォームを発表した。コンパクトなプロセッサコア「Cortex-A320」と、NPU(Neural Processing Unit) IP(Intellectual Property)「Ethos-U85」で構成されるもので、10億パラメータのAIモデルを実行可能だという。

» 2025年03月06日 09時30分 公開
[村尾麻悠子EE Times Japan]

 Armは2025年2月27日、エッジAI向けに最適化した「Armv9」ベースのプラットフォーム(以下、Armv9エッジAIプラットフォーム)を発表した。新しいプロセッサコア「Cortex-A320」と、Armの第3世代NPU(Neural Processing Unit) IP(Intellectual Property)「Ethos-U85」を組み合わせたもので、10億パラメータのAIモデルを組み込み機器で実行できるとする。なお、Ethos-U85はArmが2024年4月に発表した第3世代のNPUで、組み込み機器でトランスフォーマーモデルをサポートする。第2世代NPUの「Ethos-U65」に比べて4倍となる最大4TOPSのAI処理能力を実現している。

「Arm v9」ベースのエッジAI用プラットフォームの概要[クリックで拡大] 出所:Arm 「Arm v9」ベースのエッジAI用プラットフォームの概要[クリックで拡大] 出所:Arm

 今回発表したCortex-A320は、Armv9ベースのプロセッサコアとしては最もコンパクトだという。同じくArmv9を採用している「Cortex-A720/A520/A720AE/A520AE」などとバイナリ互換で動作する。Ethos-U85については、今回のプラットフォームリリースに合わせて、新たにLinuxドライバーの提供をオープンソースで開始した。

 Armは2024年4月、マイコン向けプロセッサコア「Cortex-M85」とEthos-U85を組み合わせたIoTレファレンスデザインプラットフォーム「Corstone-320」を発表した。Armv9エッジAIプラットフォームは、Corstone-320に比べ、機械学習性能を8倍向上させた。

「Corstone-320」とArmv9エッジAIプラットフォームのブロック図[クリックで拡大] 出所:Arm 「Corstone-320」とArmv9エッジAIプラットフォームのブロック図[クリックで拡大] 出所:Arm

「4Gバイトのメモリの壁」を越える

アーム 応用技術部 ディレクターを務める中島理志氏 アーム 応用技術部 ディレクターを務める中島理志氏

 Armの日本法人であるアームで、応用技術部 ディレクターを務める中島理志氏は、Corstone-320の発表から1年をたたずして今回のプラットフォームが発表された背景について「ここ数年で急速に普及してきた生成AIの波が、エッジ側の要求を大きく変えているからだ」と説明する。

 AIモデルのパラメータがFP16で表現されている場合、10億パラメータという大規模言語モデル(LLM)としては比較的小さなモデルであっても、2GB(バイト)のメモリを消費する。そのため、32ビットアーキテクチャを採用したCortex-MをホストCPUに採用すると、どうしても「4GBのメモリの壁」に阻まれてしまう。「そのギャップを埋める根本的な解決法は、CPUのアーキテクチャを32ビットから64ビットアーキテクチャに変えるしかない。そのため、Armv9ベースのCortex-A320を開発するに至った」(中島氏)

 Armv9ベースであれば、サーバ用CPUコア「Neoverse」向けなどで、既に確立されている生成AI向けのソフトウェアスタックを流用できる可能性もある。Linuxやオープンソースソフトウェアの資産をそのままエッジに用いることもできる。

 スマートフォン向けやNeoverseのアーキテクチャは、ハイパフォーマンス向けに作られているので、バッテリー駆動のIoT機器/エッジ機器に使うには難しいという。そのため、エネルギー効率の高いCortex-A320を開発した。

Cortex-A320の性能。10年前の製品ではあるが、現在多くの機器に搭載されている「Cortex-A35」に比べ機械学習演算の性能は10倍になり、スカラー性能は30%上がっている[クリックで拡大] 出所:Arm

 Armv9を採用する最大の利点として、セキュリティの強化とAI演算性能を挙げた。ポインタ認証や分岐ターゲット識別、メモリタギング拡張といった高度なセキュリティ機能をエッジデバイスでも実現できるようになる。さらに、Cortex-A320では、Armv9で全面的に採用した拡張機能「SVE(Scalable Vector Extension)2」を使えるので、推論の演算性能を向上させられる。SVE2は、SIMDエンジンである「NEON」の後継である。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

RSSフィード

公式SNS

All material on this site Copyright © ITmedia, Inc. All Rights Reserved.
This site contains articles under license from AspenCore LLC.