M.2モジュールは、8Gバイトまたは16Gバイトの堅牢なメモリを搭載していて、これはエッジで生成AIワークロードを実行する上で重要である。特筆すべきはDRAMの帯域幅で、「競合のAIアクセラレーターに比べて2〜4倍の帯域幅を持つ」(Vehling氏)という。「AIモデルのパラメータ数が桁違いに増加する中、エッジで生成AIを実行するためには広い帯域幅が極めて重要だ。SAKURA-IIに搭載したDRAMのピーク帯域幅は68Gバイト/秒になる。エッジAI向けとしてはかなり高い」
EdgeCortixが提供するMERAは、モデルの生成からSAKURA-IIへの実装までを包括的にサポートする。従来のCNNモデルだけでなく、パラメータ数が70億〜80億などのLLMなど、新しいTransformerモデルにも対応している。
Vehling氏は、エッジAIには、それに特化したアクセラレーターが電力効率の点では最もよいと述べる。「CPUは設計に柔軟性があるが、AIアプリケーション向けには最適化されておらず電力効率は低い。GPUは高性能だが電力消費量が大きく、こちらも電力効率の点でいえば低い。エッジAIは、コスト、サイズ、電力の点で他のアプリケーションよりも制約が多いので、エッジAIに最適化したアクセラレーターが不可欠であるというのが、われわれの考え方だ」
Copyright © ITmedia, Inc. All Rights Reserved.