ここ数年の間、AI(人工知能)チップ新興企業の“カンブリア爆発”(一気に出現すること)について書かれた記事が多くみられるようになった。初期に登場した一部の企業は、自社のAIチップを搭載したモジュール/カードなどを広く提供することによって、実世界においてデザインウィンを獲得したり、世界的な流通チャネルを構築するなど、成熟しつつあるようだ。
ここ数年の間、AI(人工知能)チップ新興企業の“カンブリア爆発”(一気に出現すること)について書かれた記事が多くみられるようになった。初期に登場した一部の企業は、自社のAIチップを搭載したモジュール/カードなどを広く提供することによって、実世界においてデザインウィンを獲得したり、世界的な流通チャネルを構築するなど、成熟しつつあるようだ。
最近発表された製品の中でも、特に注目を集めているものについて、以下にまとめていきたい。
イスラエル・テルアビブに拠点を置くAIチップの新興企業であるHailoは、同社のエッジアプリケーション向けAIアクセラレータチップ「Hailo-8」をベースとしたAIアクセラレータモジュールを、2品種発表している。これらのモジュールは、標準的なM.2およびmini-PCIeフォーマットを採用し、スマートシティーやスマートリテール、スマートホーム、Industry 4.0アプリケーションなどのファンレス構造のエッジボックス向けとして最適である。これらのエッジボックスが実行可能なタスクとしては、複数のビデオストリーム分析を、レイテンシを低減したりプライバシー関連の問題を回避するためにエッジで実行する必要がある場合などが挙げられる。
Hailo-8は、構造が定義されたデータフローアーキテクチャを用いることで、3TOPS/Wの電力効率で26TOPSの演算性能を実現するという。ASIL-Bアプリケーション向けに適しているとして車載用に認定され、「AEC-Q100 Grade-2」にも準拠している。
Hailoは最近、同社のモジュールについて、Googleの「Edge TPU」向けに最適化されたEfficientNet-EdgeTPUなどのさまざまな性能ベンチマークに基づき、新しい数値を発表している。これにより、Intelの「Myriad-X」やGoogleのEdge TPU(Coral M.2)モジュールを完全に打ち負かす性能を実現したことが明らかになった。しかしこれは、驚くようなことではないだろう。Hailo-8が26TOPSの演算性能を達成する一方で、他の競合モジュールのピーク性能はわずか4TOPSであるためだ。ただ、少し驚いたのは、Hailoが社内で実施した試験の結果、Google Edge TPUモジュールの性能が、IntelのMyriad-Xモジュールと比べて平均で2倍高いことが分かったという点だ。
Hailo-8は既に、Foxconnが開発した、エッジアプリケーションでビデオ処理を行うためのエッジボックス「BOXiedge」に搭載されている。このファンレスボックスは、深層学習の推論アクセラレーション向けとして、ソシオネクストの並列プロセッサ「SynQuacer SC2A11」と、Hailo-8を搭載しているという。
Hailoは2017年に創設され、現在では100人を超す従業員を抱えている。同社はこれまでに、NECや、スイスABBのベンチャーキャピタルであるABB Technology Venturesなどの戦略的投資家たちから、8800万米ドルを超える資金を調達したという。
Groqは現在、TSP(Tensor Streaming Processor)チップの出荷を開始している。同社のPCIeカード8枚を、データセンターのAI推論向けシャシーに統合することで、サーバノードとして機能するという。同社が発表した数値によると、このTSPの演算性能は、業界最高クラスとなる1POPS(1000TOPS)を実現した他、ResNet-50 v2のバッチサイズ1では、商用利用可能なAIアクセラレーターチップの中で最速となる、1万8900IPSを達成したという。
Groqは最近、新たな資金調達に成功したという。金額は明かさず、自動車分野も含めターゲット市場を広げているとだけ述べた。
Groqの新しいデータセンター向けボックスは、Groqのカードを8枚(TPUチップを8個)搭載し、5Uのフォームファクタ―で消費電力は3.3kWだという。Groqは、この性能と消費電力の組み合わせは、データセンターのTCO(Total Cost of Ownership)の面でかなりの利点をもたらすと強調した。
英国のAIアクセラレーターチップのスタートアップGraphcoreは、2018年に同社初のシリコンを発表し、2020年夏には第2世代のチップ「Colossus Mark 2」を発表したばかりだ。Colossus Mark 2は、データセンター向けAI学習において250TFLOPSの性能を実現し、これによってGraphcoreはNVIDIAの競合とも呼べる地位になったのではないか。
GraphcoreのシステムソリューションであるIPU(Intelligence Processing Unit)は1UのサーバブレードにColossus Mark 2を4個搭載したもので、FP16でペタフロップスの処理能力を実現する。Graphcoreによれば、同社のIPUは、金融サービスやヘルスケア、学術研究など多くの分野で採用されているという。
【翻訳:田中留美、編集:EE Times Japan】
Copyright © ITmedia, Inc. All Rights Reserved.