拡大するエッジAI市場:可能性は無限大
AI(人工知能)は当初、データセンターやクラウドを対象としていたが、近年ネットワークエッジへの移行が急速に進んでいる。ネットワークエッジでは、エンドユーザーの近くでローカルに迅速かつ重要な決定を行う必要がある。
AI(人工知能)は当初、データセンターやクラウドを対象としていたが、近年ネットワークエッジへの移行が急速に進んでいる。ネットワークエッジでは、エンドユーザーの近くでローカルに迅速かつ重要な決定を行う必要がある。もちろん、トレーニングはクラウドで行うことも可能だが、自動運転などのアプリケーションでは、一刻を争う意思決定(車や歩行者の発見)をエンドユーザー(ドライバー)の近くで行うことが重要である。エッジシステムは、最大で毎秒60フレーム(60fps)の画像に基づいて意思決定を行うことで、迅速なアクションを可能にする。
エッジシステムは、コストパフォーマンスや消費電力性能がCPUやGPU、FPGAよりもはるかに高いエッジ推論アクセラレーターによって実現される。
エンドユーザーの近くで推論を行えるようになったことで、まったく新しい市場とアプリケーションの世界が開かれている。実際に、米国の市場調査会社であるIDCは、「AIソフトウェアやハードウェア、サービスの市場は2024年までに5000億米ドルを突破する見通しで、5年間の年平均成長率(CAGR)が17.5%になり、総売上高が5543億米ドルという驚異的な額に達すると予想される」と報告している。
こうした急成長の背景には、AIが“ハイエンド機能”から消費者に近い製品になり、AI機能が実質的に一般の人々に身近なものになっていることがあると考えられる。さらに、最近の製品は、AI推論で必ずと言っていいほど問題になる“コストの壁”が打破されつつあり、設計者は手頃な価格のより幅広い製品にAIを組み込めるようになっている。
自動運転は、エッジAI推論の最も一般的な事例の一つだが、実際は、実現間近もしくは既に実現する市場は他にも数多くある。以下にいくつかの例を紹介するが、技術が進化し、市場がAIアクセラレーターの量産出荷の恩恵を受けるようになれば、可能性は無限に広がる。
エッジサーバ:多くのエッジサーバは、工場や病院、小売店、金融機関、その他の企業に導入されている。大抵の場合、カメラ型のセンサーがサーバに接続されているが、事故や盗難に備えて何が起こっているか記録しているだけである。現在、これらのサーバは、AI推論機能を備えた低コストのPCIe(PCI Express)推論ボードで充電できる。
高精度/高解像度の画像:高精度/高品質の画像に対する需要は非常に高い。その用途は、ロボット工学やインダストリアルオートメーション、工業検査、医療用画像、科学画像、監視用カメラ、物体認識、フォトニクスなど幅広い。センサーは、0.5〜6Mピクセルをキャプチャーして正しく認識することが非常に重要であるため、最高クラスのモデルを採用し(例えば「YOLOv3」)、可能な限り最大の画像サイズを使用する必要がある。
音声/低スループット推論:「Amazon Echo」などのアプリケーションは、既に広く普及しており、今後も引き続き進化していくとみられる。音声処理には、キーワード認識だけでも数十億MAC/秒以下が必要だ。これは、エッジAI推論アクセラレーター向けに最適だといえる。
スマートフォン:スマートフォン用アプリケーションプロセッサは、そのほとんどがAIモジュール(SoC/System on Chip)を搭載し、シンプルなニューラルネットワークモデルのローカル処理を実行している。このため、スマートフォンは現在、エッジAIを導入した機器としては最も市場に投入されている製品となった。
エッジAIに対する4つの要件
エッジAI推論に関しては、上述の市場だけでなく、これらのアクセラレーターのメリットを活用すべく台頭しているさまざまな市場において、重要な要件が4つある。
1つ目が、低レイテンシだ。全てのエッジアプリケーションにおいて、レイテンシは「#1」とされている。これは、バッチサイズがほぼ常に1であることを意味する。
また、BF16/INT8のサポートも非常に重要である。顧客は、量子化に投資するための準備が整った段階で、浮動小数点とINT8の両方を実行可能な推論アクセラレーターを使用することにより、BF16で迅速なスタートを切ってINT8へのシームレスな移行を実現することができる。
さらに、高スループットも必要不可欠だ。アプリケーションはほぼ全て、30fpsあるいは60fpsのフレームレートでメガピクセル画像を処理する必要がある。現在は、自社のアプリケーション向けに動作可能なモデルを保有している企業も多く、ソリューションがどのように自社モデルを動作させるのかということだけが重要視されている。大事なのはスループットであるため、TOPSなどの無意味なベンチマークは不要なのだ。
顧客企業が必要としているのは、1米ドル当たりまたは1W当たりのスループット/画像サイズであるため、指数関数的に大規模な市場のローエンドで、新しいアプリケーションが登場する可能性が高い。このような効率要件に対応した、さまざまなソリューションが台頭している。
エッジ推論は、その効率性と精度から恩恵を受けられる市場やアプリケーションが数多くあるので、多くの技術革新が行われている。高価格帯のシステムの性能と同等あるいは上回るものが、より低価格で提供されるケースもある。これにより、エッジAIが、これまでは考えられなかったようなアプリケーションにまで広がっていくことは十分に考えられる。エッジAIは現在、最もエキサイティングな分野の一つだろう。
【翻訳:田中留美、編集:EE Times Japan】
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 複数AIアクセラレーター搭載の評価チップを試作
新エネルギー・産業技術総合開発機構(NEDO)と産業技術総合研究所(産総研)および、東京大学は共同で、仕様が異なる6種類のAIアクセラレーターを搭載した評価チップ「AI-One」を設計、試作を始めた。これを活用すると、短い期間で安価にAIチップの設計と評価が可能になる。 - 汎用PC+FPGAで構成する量子コンピュータ
エレコムグループの1社で半導体設計などを手掛けるディー・クルー・テクノロジーズ(以下、D-CLUE)は、「第1回 量子コンピューティングEXPO 春」(2021年4月7〜9日/東京ビッグサイト 青海展示棟)で、同社が開発中のイジングマシンを紹介した。 - Intelの第3世代「Xeon SP」、AI性能や暗号化を強化
Intelは2021年4月6日、10nmプロセスを採用した第3世代の「Intel Xeon スケーラブル・プロセッサ(SP)」(開発コード名:Ice Lake)を発表した。1〜2ソケット向けの製品で、CPUコアには新しい世代の「Sunny Cove」を採用し、最大40コアを搭載する。前世代品と比較して、性能が46%向上しているとする。 - 低消費電力の組み込みビジョンを車載/医療機器に
ラティスセミコンダクター(以下、ラティス)は2021年3月4日、低消費電力の組み込みビジョンシステム向け「ソリューション・スタック」の最新版「Lattice mVision 2.0」と、システム制御向けソリューション・スタックの最新版「Lattice Sentry 2.0」を発表した。 - PALTEK、エッジAI向けハードIPのEdgeCortixと提携
PALTEKは、EdgeCortixと販売代理店契約を結んだ。ザイリンクス製アクセラレーターカードに、EdgeCortixが開発したエッジデバイス用推論プロセッサ向けハードウェアIPを実装し、省スペースや低電力化を必要にするエッジAI用途に提案していく。