メディア

Pat Gelsinger氏がほれ込むAIチップ新興推論を100倍高速化：英Fractileへの投資を明らかに（2/2 ページ）

» 2025年02月10日 11時30分公開

CNNよりもLLMに圧倒的に向くアーキテクチャ

　Goodwin氏は、「インメモリコンピューティングは、畳み込みニューラルネットワーク（CNN）推論に対して適度なメリットをもたらすが、CNNワークロードでは、行列積や他の演算を混在させなければならない場合が多く、行列やカーネルが小さくなる。インメモリアクセラレーターは、メモリ内で重み係数が固定されるため、プロセッサとメモリ間で重みを転送し続ける必要はない。しかし、チップ上でアクティベーションを移動させることは、まだワークロードの比較的大きな部分を占めているため、インメモリコンピューティングがCNNにもたらす性能メリットは、比較的ささやかなものとなる」と説明する。

　LLMの場合、重みの数はアクティベーションよりもはるかに多く、アクティベーションのサイズは小さい。こうしたワークロードの特性により、インメモリコンピューティングが提供するメリットが大きくなる。

　Goodwin氏は、「数十億パラメータモデルの特質の1つとなるのが行列乗算であり、特に、非常に幅の広い行列となる。アクティベーションはこのような行列の両端から発生するため、推論向けウェイトの場合と比べて1万分の1程度と非常に小さい。これは、行列やウェイトをメモリ内に固定することによるメリットをどれくらいまで押し上げられるかという観点から見た、設計ポイントの変化だといえる」と述べる。

　また同氏は、「インメモリコンピューティングは、LLM向けとして非常に適しているが、CNN時代のために構築された既存の多くのインメモリコンピューティングアーキテクチャには、デメリットもある。LLMはCNNとは異なり、可変長の入力／出力を特徴とするからだ」と付け加えた。

　「既存のコンセプトでは、シングルユーザーであってもLLMによって負担が生じる。そこには2つの異なる段階があり、各段階の継続期間は不明だ。例えば、コンパイラのパラダイムが、何をどの順で実行する必要があるのかという固定リストを想定し、特定の方法でチップ全体を流れるようにコンパイルされ、いつトリガーされるのかを計算する場合は、そのシーケンス長に収まるようパディングで埋める必要があるため、本質的に性能が少し低下してしまう」（Goodwin氏）

　既存のアーキテクチャが、行列-行列乗法を中心に構築されているのは、データをよりうまく再利用するためであり、また特定のサイズのシストリックアレイが存在するためでもある。プロンプト処理（長いデータシーケンス）とデコードステージ（一度に1ワード）を切り替えるワークロードの場合、行列-ベクトル乗算の方が柔軟性が高く、より適しているとGoodwin氏は付け加え、柔軟性がFractileのアーキテクチャの重要な部分であると述べた。

【翻訳：田中留美、編集：EE Times Japan】

原文へのリンク

「フラッシュメモリで」AI演算　消費電力はGPU比で1000分の1に
フローディア（Floadia）が、SONOS構造のフラッシュメモリを用いて超低消費電力で推論を行うCiM（Computing in Memory）技術を開発中だ。GPUに比べ1000分の1ほどの消費電力で積和演算を実行できるという。2025年春ごろには試作チップができ上がる。
生成AIを省電力で実行するアナログインメモリコンピューティング
Sagence AIによると、アナログインメモリコンピューティングチップは、高性能CPUおよびGPUベースのシステムと比較してエネルギー効率とコスト削減を促進することで、AI推論アプリケーションが直面する電力と性能の難題を解決できるという。
「電流を流すだけで積和演算」 TDKの超省電力AI用デバイス
TDKは、スピントロニクス技術を活用するニューロモーフィック素子として「スピンメモリスタ」を開発した。AIで多用される積和演算を、GPUに比べて100分の1の消費電力で実行できるという。フランスCEAと東北大学との協業により、2030年の量産技術の確立を目指す。TDKは、スピンメモリスタのデモを「CEATEC 2024」で公開する予定だ。
「回復には数年」 Intelがロードマップを全面見直し
米国EE Timesが調査したアナリストらによると、Intelは、経営立て直しの道を歩み始めるに当たり、一部新製品の発売を中止し、プロセス技術のロードマップを遅らせるという。同社の回復には数年を要するとみられる。
半導体製造でのPFASを除去　3年以内の商用化目指す米国研究者
イリノイ大学アーバナシャンペーン校で化学工学を研究するXiao Su氏のチームは、電界駆動でPFASを除去できるナノろ過技術を発表した。チームは商用化を目指していて、ベンチャーキャピタルや半導体メーカーが関心を寄せているという。