メディア

AI推論はもっと「省エネ」にできる メモリ圧縮技術でZeroPointとRebellionsが協業(2/3 ページ)

» 2025年04月25日 11時10分 公開
[Nitin DahadEE Times]

メモリには多くの「冗長なデータ」が保存されている

 Moreau氏は、2025年初めに行われた米国EE Timesとのブリーフィングの中で、メモリに保存されているデータ全体の70%以上が冗長であるという点を強調し「これはつまり、その冗長を全て取り除いても、ロスレス圧縮を提供できるということだ。しかし、これをシームレスに機能させるためには、ナノ秒スケールウィンドウ(ほんの数システムクロックサイクルに相当)の範囲内で、非常に特殊な3つの処理を実行する技術が必要になる」と述べている。

 「1つ目は圧縮と展開。2つ目は、結果として生じるデータを圧縮すること(圧縮データの小さなチャンクを個々のキャッシュラインにまとめることで、見かけのメモリ帯域幅を劇的に高める)。そして3つ目は、データをシームレスに管理することで、1つにまとめられたデータが配置されている場所を追跡する技術だ。レイテンシを最小限に抑えるためには、このような種類のハードウェアベースのメモリ最適化アプローチは通常、キャッシュライン精度で機能しなければならない。つまり、64バイトのチャンクでデータを圧縮・コンパクション・管理する必要があるということだ(ZSTDやLZ4などの既存の圧縮手法で使われている4〜128kBという非常に大きいデータサイズとは対照的である)」(Moreau氏)

 また同氏は「これが正しく実行されれば、非常に大きなメリットが得られる。一般的なワークロードの場合、例えばハイパースケールデータセンターでは、対応可能なメモリ容量/帯域幅が2〜4倍に増加し、ワット当たりの性能は50%向上、(主に高効率化によって)総所有コスト(TCO)を劇的に削減できる」と述べている。

 Moreau氏は「われわれはこのソリューションの開発において、圧縮/コンパクション/メモリ管理技術が基本的なモデルワークロードにどのようなメリットを提供できるのか、つぶさに検討した」と述べる。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSフィード

公式SNS

All material on this site Copyright © ITmedia, Inc. All Rights Reserved.
This site contains articles under license from AspenCore LLC.