高速ストレージUFS 5.0が導くオンデバイスAIの新時代:10.8GB/sのデータ転送でLLMをもっと「賢く」
10.8GB/sという高速インタフェースを備えるUFS 5.0が間もなく登場する。スマートフォンにUFS 5.0が採用されれば、オンデバイスAIはさらに進化するとみているのがキオクシアだ。高速データ転送が可能な大容量UFSであれば、サイズが大きい大規模言語モデル(LLM)やRAG(検索拡張生成)用データベースを格納できるようになるからだ。
スマホのオンデバイスAI機能が急速に進化
AI機能を搭載したスマートフォン(AIスマートフォン)が急速に普及している。特に、2023年以降に登場したハイエンドのAIスマホは大規模言語モデル(LLM)を搭載し、生成AIを活用した機能が追加されている。オンデバイスAI(端末内で生成AIを実行する機能)は、クラウドAIのようなネットワーク接続を必要とせず、プライバシーを確保できるという利点に加え、リアルタイム翻訳のようなユーザーにとって高い利便性を実現できる。
オンデバイスAIのさらなる高性能化の鍵を握るのが、スマホなどのモバイル機器向けに設計されたフラッシュストレージ規格UFS(Universal Flash Storage)だ。キオクシアは、UFSの最新規格であるUFS 5.0は、オンデバイスAIを大きく変える可能性があると強調する。
高速インタフェースのUFS 5.0なら、LLMを「賢く」できる
UFSは現在、スマホのストレージとして主流になっている。ハイエンドの機種ではUFS4.0/4.1が一般的に採用されていて、キオクシアもUFS 4.0/4.1に準拠した製品をスマートフォン向けに量産中である。
半導体製品などの標準規格を策定する業界団体であるJEDEC(Joint Electron Device Engineering Council)は2025年10月、UFS 5.0の仕様策定がほぼ完了したことを発表した。
UFS 5.0の最大の特徴は、10.8GB/s(10830MB/s)(注1)に達する転送速度だ。ハイエンドスマートフォンに搭載されているUFS 4.1(4640MB/s)に比べて2倍以上と、圧倒的な転送速度を備える。キオクシア メモリ事業部の渡辺匠氏は「AIの普及により、UFSのインタフェースの高速化に対する要求は一気に高まった」と語る。「これまでは規格策定が先行して進み、約4年ごとに一度のペースで転送速度が2倍になってきた。だが近年は、オンデバイスAI技術の進化に伴って、スマートフォンメーカー側から高速化の要求が強くなっている」
飛躍的に高まった転送速度は、オンデバイスAIの高機能化に大きく貢献する可能性がある。より規模の大きなLLMをスマホに搭載できるようになるからだ。
スマホで生成AIを使う場合、まずはUFSに保存されているLLMをシステムメモリであるDRAMにロードする。その後、SoC(System on Chip)がDRAMからLLMのパラメータを読み出し、演算処理(推論)を行う。
問題は近年、生成AIを“より賢く”するために、LLMのパラメータ数が増大する傾向にあることだ。オンデバイスAIに搭載されているLLMのパラメータ数は30億〜40億くらいとされる。これを8ビット量子化(INT8)すると、容量は3GB(ギガバイト)〜4GB(注2)程度になる。「UFS 4.0/4.1の転送速度だと1秒以下で読み込める規模だが、LLMのサイズが大きくなっていくとロード時間が長くなり、ユーザーが最初の回答を得るまでの時間(Time to First Token)もそれだけ長くなっていく」(渡辺氏)。生成AIを“賢く”するために、より大規模なLLMを搭載するのであれば、UFS では、高速な転送速度が不可欠になるのだ。
10.8GB/sに上るUFS 5.0の転送速度であれば、パラメータ数が増えても、LLMを高速にロードすることができる。これは、オンデバイスAIのユーザビリティの向上に直結する。「UFS 4.0/4.1では適用できるLLMのサイズが3〜4GB程度だが、UFS 5.0では10GBくらいまで増加できる」(渡辺氏)
渡辺氏によれば、キオクシアのUFS技術には3つの強みがある。1つ目はフラッシュメモリそのものだ。キオクシアのUFS 5.0に用いる3次元フラッシュメモリは、2枚のウエハーを高精度に貼り合わせる独自の「CMOS directly Bonded to Array(CBA)」技術を適用した最新の「第8世代BiCS FLASH(注3)」だ。CBAは、メモリセルの制御を担うCMOS回路とメモリセルアレイを別々のウエハーで作り込み、2枚のウエハーを高精度に貼り合わせる技術だ。CMOS回路とメモリセルのそれぞれに適したプロセスで製造できるので、フラッシュメモリの性能、電力効率、ビット密度の大幅な向上を実現できる。
2つ目が自社で開発するフラッシュメモリのコントローラー技術だ。UFS 5.0では、物理層にMIPI Allianceの規格「M-PHY version 6.0」を、プロトコルには「UniPro version 3.0」を使用する。キオクシアは、これらの規格策定に初期段階から携わり、UFS 5.0向けの高速インタフェースの開発を早くから進めてきた。さらに、コントローラーの電源設計を最適化し、バッテリー動作が求められるモバイル機器において高性能化と低消費電力の両立を実現してきた。3つ目がECC(誤り訂正符号)技術だ。強力なECCによって、フラッシュメモリの性能を最大限に引き出せる。
スマホでもRAGを
転送速度が速いUFS 5.0を使えば、より大規模なLLMを置けるだけでなく、RAG(検索拡張生成)用データベースも格納できる可能性が出てくる。RAGは、企業のデータベースなどの外部情報とLLMを組み合わせることで、生成AIの回答の精度を高める技術である。
キオクシアは、データセンターのRAG向けに、データ探索ソフトウェア「KIOXIA AiSAQ(キオクシア アイザック)(注3)」をオープンソースで公開している。KIOXIA AiSAQを使うと、RAG用データベースをSSDに保存したままデータを検索できるので、DRAMを消費せずに済む。キオクシアはKIOXIA AiSAQをスマートフォン向けに適用することも検討しており、技術的な検証はできている。RAG用データベースをDRAMに展開せず、UFSに配置できるようになるので、RAG用データベースの容量も増やすことができるようになる。
DRAMの容量増加がコストの点から限られる中、大容量のUFSにLLMとRAG用データベースを格納できれば、オンデバイスAIのユーザーエクスペリエンスはさらに高まるはずだ。
AIの思考能力と知識を「分離」させ、AIシステム全体を最適化する
UFS 5.0の登場は、オンデバイスAIのシステム構成に新たな最適化をもたらし、スマートフォンにおけるストレージの立ち位置を変える可能性がある。そう語るのは、キオクシア 先端技術研究所 AI・システム研究開発センター グループ長の出口淳氏だ。
前述したように、AIを賢くする方法の一つは、LLMの規模を大きくすることだ。“知識を蓄える”ためにLLMのパラメータ数を増やせば、その分演算量も増えるので、GPUの演算性能も向上させなくてはならない。出口氏はこれを「知識を演算で再現している状態」だと語る。
「AIの思考能力(推論性能)と知識(データ)の両方を、演算で表現しているのが現状だ。だがこのまま右肩上がりで成長させていくのは、コストや電力の観点で考えてもいずれ限界が来る」(出口氏)。AIの思考能力と知識を分離すべきではないか――。そう考えていたキオクシアは、生成AIが普及する数年前から、その“分離”を実現するためにフラッシュメモリ/ソフトウェアの両面で研究開発に取り組んできた。KIOXIA AiSAQは、その成果の一つでもある。
究極的には、思考能力と知識を分離できれば、思考(推論)のみにGPUを用いて、知識を蓄える部分はフラッシュメモリが担えばよい。デバイス本来の役割を生かせる自然な形だ。演算量が減るのでGPUの消費電力削減につながり、低消費電力のAIアクセラレーター採用などの選択肢も広がる。「半導体デバイスを適材適所で使うことで、AIシステム全体をこれまでとは違う形で最適化できるのではないか」(出口氏)
「記憶」がAIの個性になる時代へ
データが“知識”になるAIでは、フラッシュメモリやUFSの立ち位置も変わる。「これまではAI学習向けのデータをプールするだけの存在として捉えられていた」(出口氏)が、これからはAIの個性を形づくるための役割を担うようになるとキオクシアは考えている。
「人間の個性は、記憶や経験によって形成されていく。今後はAIも、同じLLMをベースにしていても、RAG用データベースのような外部の“記憶・経験”が追加されていくことで、よりパーソナライズされた個性のあるものになっていくのではないか。AIの個性につながる記憶や経験を担うのは、まさにフラッシュメモリであり、その技術を手掛けるわれわれだと思っている。当社のミッションである「『記憶』で世界をおもしろくする」にもつながる」(出口氏)
高速データ転送によって、LLMやRAG用データベースのさらなる活用を促すUFS 5.0。キオクシアの技術を結集したUFS 5.0製品は、進化するAIシステムを下支えし、オンデバイスAIを「より賢く」「より個性豊かに」進化させる上で、重要な役割を担っていく。
※本記事は掲載時点の情報であり、最新の情報とは異なる場合があります。
(注1)1GB/sを1,000,000,000バイト/秒、1MB/sを1,000,000バイト/秒として計算しています。インタフェースの速度から計算した理論値であり、ご使用機器での速度を保証するものではありません。読み出しおよび書き込み速度は、ホストシステム、読み書き条件、ファイルサイズなどによって変化します。
(注2)1GBを1,073,741,824バイトとして計算しています。
(注3)「BiCS FLASH」および「KIOXIA AiSAQ」はキオクシア株式会社の登録商標です。
Copyright © ITmedia, Inc. All Rights Reserved.
提供:キオクシア株式会社
アイティメディア営業企画/制作:EE Times Japan 編集部/掲載内容有効期限:2026年3月24日







