DRAM不足で変わるAIシステム設計 エッジAIや特化型モデルに追い風:「大規模化」から「最適化」へ(2/2 ページ)
DRAMの価格が急騰し供給不足が問題となる中、AIシステム設計にも変化が表れている。大規模なAIモデルが無制限に使用されるのではなく、小規模な特化型モデルがより多く用いられるようになってきている。
リソースの制約は設計の前提に
DRAM不足は、必ずしもAIの成長を鈍化させるわけではない。AIをより現実的なものへと強制的に変化させているのだ。
設計の意思決定はかつて、モデルサイズやメモリフットプリントの他、どこで推論を実行するのかなど、抽象的なものだった。しかし現在はコストや可用性、そしてシステムが本当に導入可能なのかどうかという点に直接結び付いている。このため、技術的に可能なものと実際に実現可能なものとの差が縮まってきている。
実際、性能の定義そのものも変化しつつある。特に、レイテンシや消費電力、メモリ制約などが固定された状態で継続的に実行する必要があるタスクでは、より大規模なモデルの方が優れているとは限らない。ローカル導入されたドメイン特化型のモデルが、最適な選択肢となる場合が多い。
エッジAIは、このようなモデルに適した設計となっている。メモリ構成は実際に利用可能なものと合致していて、導入モデルも制約のあるコンポーネントや集中型インフラへの依存度を軽減している。
これは、モデルサイズやメモリ要件の他、日々のタスクにおける「効果的な性能」とは何かを再検討することにつながる。多くの場合、ドメイン特化型のモデルは、特にレイテンシやプライバシー、消費電力量が重要な検討事項とされる環境下において、大規模な汎用システムよりも実用的であることが実証されている。
こうした点で、制約を考慮した設計は、ある種の安定性をもたらす。より厳しいメモリ制約下で構築されたシステムは、コスト変動や供給の不透明性による影響を受けにくい。開発チームは、リソース可用性を予測できないような環境でも、より高い予測可能性をもって導入/拡大していける。
問題はもはや「どれだけ多くのAIタスクを実行できるか」ではなく、「重要なAIタスクをいかに効率的に実行するか」なのだ。
【翻訳:田中留美、編集:EE Times Japan】
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
ソニー半導体、26年度は減収見込み メモリ市況不透明
ソニーグループは2026年5月8日、2026年度通期の業績見通しを発表した。イメージング&センシングソリューション(I&SS)分野の2026年度売上高は前年同期比4%減の2兆700億円と、減収を見込んでいる。一方、営業利益は同12%増の4000億円になると見ている。
「世界初」成果で1000層超3Dフラッシュに道筋、キオクシアとSandisk
キオクシアとSandiskが、ウエハー間Cu直接接合によるマルチ積層セルアレイCMOS(MSA-CBA)構造で、「世界初」(両社)のクアッドレベルセル(QLC)動作の実証に成功した。両社はこの成果を1000層以上の超高密度3Dフラッシュメモリ実現に向けた重要な技術的マイルストーンと位置付ける。
SAIMEMORYの垂直ビルド構造メモリ開発がNEDO採択
SAIMEMORYは、同社の次世代メモリ技術「ZAM(Z-Angle Memory)」開発プロジェクトが新エネルギー・産業技術総合開発機構(NEDO)の「高メモリ密度・広帯域・低消費電力な革新的メモリの製造技術開発」に採択されたと発表した。また富士通、日本政策投資銀行、理研、ソフトバンクを引受先としてシリーズAラウンドの資金調達を実施したことも発表した。
メモリも中国が猛追 YMTCは新工場建設
中国のNAND型フラッシュメモリメーカーであるYMTC(Yangtze Memory Technologies Corp)が新工場を建設しているという。米国による厳しい対中規制が続く中、中国はメモリでも猛追している。
NORフラッシュにもAI需要の波、迫る供給危機
DRAMとNAND型フラッシュメモリの供給不足に続いて、もう1つのメモリ分野であるNOR型フラッシュメモリでも供給危機が発生しつつあり、値上げの可能性も報じられている。一方でAIアプリケーションがかつてない高密度を要求することから、3D構造化への期待も高まっている。