エッジAI(人工知能)向けのアクセラレーターを手掛ける日本のスタートアップEdgeCortixが、新しいプラットフォーム「SAKURA-II」を発表した。CNN(畳み込みニューラルネットワーク)モデルだけでなく、トランスフォーマーモデルを容易に実装できることが特徴だ。
組み込み機器に特化した推論技術を手掛けるEdgeCortixは「第8回 AI・人工知能 EXPO【春】」(2024年5月22〜24日、東京ビッグサイト)で、エッジ(組み込み機器)向けの生成AIアクセラレーター「SAKURA-II」を展示した。ビジョンモデルから大規模言語モデル(LLM)までさまざまな種類のAI(人工知能)モデルを、高い電力効率で実行できることが最大の特徴だ。同社は、組み込み機器での生成AIの活用を加速できると意気込む。
EdgeCortixは2019年に設立された日本発のスタートアップ企業だ。IP(Intellectual Property)、ハードウェア、ソフトウェアをフルスタックで提供する。
具体的には、1)動的に再構成可能なプロセッサアーキテクチャである「DNA(Dynamic Neural Accelerator)」技術(IP)、2)同IPを搭載したハードとしてAIアクセラレーター、3)コンパイラおよびソフトウェアフレームワーク「MERA」、4)AIアクセラレーターを搭載したモジュールやボードという4つがある。2)のAIアクセラレーターとしては、2023年4月に「SAKURA-I」の出荷を発表している。今回開発したSAKURA-IIはその後継となる製品だ。
EdgeCortix グローバルセールス担当エグゼクティブバイスプレジデントのTim Vehling氏によれば、現在のエッジAIのトレンドとして推論モデルの移行が挙げられるという。「昨年(2023年)まではほとんどがCNN(畳み込みニューラルネットワーク)ベースだったが、急速にTransformerベースへと移行している。ResNetやYOLOを使った画像認識や物体検出から、生成AIを活用したいというニーズに変化している」(同氏)
こうしたトレンドに対応すべく開発したのがSAKURA-IIだ。フォームファクターはM.2とPCI Express(PCIe)カードの2種類を用意した。INT8で最大60TOPS、BF16で30TFLOPSの演算性能を実現しつつ、消費電力はわずか8W(AIアクセラレーターチップの仕様)や10W(ボードの仕様)に抑えている。Vehling氏は「業界最高レベルの電力効率を実現した」と強調する。BF16のサポートは、EdgeCortixとしては初めてになる。「エッジAIでも、より高い精度を求める声が高まってきたため、従来のINT8に加えBF16も対応した」(同氏)
Copyright © ITmedia, Inc. All Rights Reserved.