生成AIを省電力で実行するアナログインメモリコンピューティング:電力やコストの課題解消を狙う(2/2 ページ)
Sagence AIによると、アナログインメモリコンピューティングチップは、高性能CPUおよびGPUベースのシステムと比較してエネルギー効率とコスト削減を促進することで、AI推論アプリケーションが直面する電力と性能の難題を解決できるという。
Sagenceのアナログインメモリコンピューティング技術、その詳細
では、Sagenceのアナログインメモリコンピューティング技術は、AI推論が直面する電力や性能、価格、環境持続可能性といった困難な課題にどのように対処できるのだろうか。同社のインメモリコンピューティングソリューションは、アナログ技術を選択し、エネルギー効率とコストにおけるアナログ固有の利点を活用している。
まず、インメモリコンピューティングは、AI推論アプリケーションにおける効率性の本質的な要素と密接に関係している。メモリセル内のストレージと演算を統合することで、AIコンピューティングに不可欠なベクトル行列乗算を実行するための、単一目的のメモリストレージや複雑にスケジューリングされた乗算回路を排除できるのだ。
Sagenceは、マルチレベルメモリセル内に「ディープサブスレッショルドコンピューティング」を組み込んだ初の技術だと主張している。「これは前例のない組み合わせで、スケールの大きな推論を実現するために必要な、飛躍的改善への扉を開くものだ」(Sarin氏)
Sarin氏によると、静的にスケジューリングされた「ディープサブスレッショルドインメモリコンピューティング」アーキテクチャは非常にシンプルで、CPUやGPUに求められる動的スケジューリングのばらつきや複雑さを排除している。同氏は「動的スケジューリングは、ランタイムコードを生成するSDKに極端な要求を突きつけ、コストと消費電力の非効率をもたらす」と述べている。
SagenceのAI設計フローは、PyTorch、ONNX、TensorFlowのような標準ベースのインタフェースを使用して学習済みのニューラルネットワークをインポートし、Sagenceのフォーマットに自動的に変換する。同社のシステムは、GPUソフトウェアがニューラルネットワークを作成したかなり後にニューラルネットワークを受け取るため、さらなるGPUソフトウェアの必要性を排除できるという。
同社によると、大規模言語モデルLlama2-70Bを666Kトークン/秒に正規化した性能で処理するGPUと比較し、Sagenceのテクノロジーは10分の1の消費電力、20分の1の価格、20分の1のラックスペースで動作可能だという。これは、データセンターにおけるAIコンピューティングが、モデルのトレーニングからモデルの展開、推論タスクへと移行している現在、大幅な改善となる。
【翻訳:滝本麻貴、編集:EE Times Japan】
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
小型高性能のエッジAI新興Axelera、初期チップをデモ
エッジAIアクセラレーターを手掛ける欧州のスタートアップAxelera AIが、「Embedded Vision Summit 2023」(米国カリフォルニア州/2023年5月23〜25日)で、動作可能な初期チップのデモを披露した。AI技術が切り開く「インメモリコンピューティング」の可能性
人工知能(AI)とインメモリコンピューティングへの関心が著しく高まる中、ReRAM(抵抗変化型メモリ)は人間の脳を模倣する能力を解き放つ鍵になり得る。とはいえ、まだ課題は残っている。2029年に「シンギュラリティ」が到来か 〜半導体は「新ムーアの法則」の時代へ
“まだまだ先”だと思っていた「シンギュラリティ」の到来は、ぐっと早まり、なんとあと5年以内にやってくるという。そこで本稿では、シンギュラリティが到来しているであろう2030年の半導体世界市場を予測してみたい。その頃には、チップ当たりではなく、パッケージ当たりの演算能力を指標にするような「新ムーアの法則」が、半導体の進化をけん引しているのではないだろうか。2024年は「エッジAIデバイス元年」 主要AI PCを分解
さまざまなモバイル機器で、AI(人工知能)機能は既に必須になりつつある。特に2024年はAI PCが相次いで市場に投入され、「エッジデバイスAI元年」とも呼べるほどである。今回は、2024年後半に発売された主要AI PCやプロセッサを取り上げよう。自動運転やロボティクスにマルチモーダルLLM適用を目指す
イメージプロセッサを手掛ける米Ambarellaによれば、マルチモーダル基盤モデルは、より“人間に近いAI”を実現し、より高度な自動運転や、ロボットの自動化の加速に貢献するという。「お皿サイズの巨大AIチップ」を手掛けるCerebrasが上場へ
データセンター用の巨大なAI(人工知能)チップを手掛ける米Cerebras SystemsがIPO(新規株式公開)を申請した。ただし懸念もある。その一つが、売上高のほとんどをアラブ首長国連邦アブダビの技術メーカーG42を占めていることだ。