メディア

FPGAはAIデータセンターの新たな選択肢になるのかNVIDIAに挑む米新興(2/3 ページ)

» 2025年02月25日 14時30分 公開
[Sally Ward-FoxtonEE Times]

FPGAの利点

 「FPGAは、GPU/ASICソリューションのようなFLOPSを提供することはできないが、他のメリットがある」(Sohmers氏)

 「われわれは、プロダクトマーケットフィット(PMF)の実現を確信できるまでは、ASICの構築に膨大な時間や資金を費やしたくない。他のAIチップメーカーもそれぞれ独自の問題を抱えているが、どのメーカーにも、特に第1世代のデバイスに関してPMFの問題がある。FPGAを利用することで、非常に迅速なイテレーション(設計サイクルの反復)が可能になり、顧客と共にそのイテレーションをスタートさせることができた」(Sohmers氏)

 同氏は、「顧客からの売り上げこそが、PMFの最良の指標となる」と付け加えた。

 Sohmers氏は、「Groq以前のAI SCPのLambdaでの経験から、迅速なイテレーションサイクルと、顧客との定期的な話し合いの必要性が浮き彫りになった。しかし、全てのAIチップメーカーがそれを十分に認識しているわけではない」と述べる。「最も重要なのは、正しいものを確実に構築し、その前提を常にアップデートすることだ」と述べる(同氏)

 Positronは、同社のPCIeカードを数千枚単位で購入する顧客を確保しているが、Atlasアプライアンスのフォームファクターは、NVIDIA製品を調達してそれを接続し、貸し出すことに慣れている大半のクラウドメーカー向けに最適だ。

 Sohmers氏は、「このアプライアンスモデルは、トークンイン/アウトするだけのブラックボックスであり、顧客にとっては、当社のハードウェアを購入し、それを所有することによる設備投資や運営コストの観点から見たメリットを全て享受することが可能な、最も簡単な方法だ。また顧客は、既存のNVIDIAベースのシステムを簡単に交換、補強することもできる」と述べている。

 Positronの最新のソフトウェアリリースによると、同社のAtlas LLM推論アプライアンスは、NVIDIAのHopperベースのシステムで同じ推論ワークロードを実行した場合と比べて、性能が70%高速化(トークン/秒)し、ワット当たりの性能は3.5倍、1米ドル当たりの性能も3.5倍になるという。Sohmers氏は、「これはAlteraのFPGA『Agilex-7M』をベースとしており、部品がまだ一般には入手不可能であるため、今のところPositronだけが出荷を許可されている。これらのFPGAは、32GB(ギガバイト)の広帯域メモリ(HBM)を搭載する」と述べている。

 現行世代のAtlasは、PCIeカード上でFPGAを4個使用する4Uシステムだ。ターンキーアプライアンスとして設計されており、HuggingFaceや顧客の独自モデルからバイナリーを取り込み、ゼロステッププロセスで実行する(再コンパイルは不要)

 Sohmers氏は、「ワンステッププロセスでは、手順が多すぎる。Positronでモデルを実行するために必要なものは、全く新しくもユニークでもない」と述べる。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSフィード

公式SNS

All material on this site Copyright © ITmedia, Inc. All Rights Reserved.
This site contains articles under license from AspenCore LLC.