チップレットベースのデータセンターAI製品に注力、韓国新興:通信分野にも積極進出(1/3 ページ)
韓国のAI(人工知能)チップ新興企業Rebellionsは、チップレットベースのデータセンター用AIアクセラレーターの開発と展開に力を入れている。2020年に設立された同社はさまざまな企業と協業しながら、韓国で存在感を高めている。
韓国のAI(人工知能)チップ新興企業Rebellionsは、ADTechnologyとSamsung Foundry(以下、Samsung)、Armとの協業により、チップレットベースのデータセンターAIアクセラレーター製品を構築していくという。Rebellionsは、近々発表予定のチップレットベースのAIアクセラレーター「Rebel」と、ADTechnologyのArmベースのCPUチップレットを統合する予定だ。
ADTechnologyのCPUチップレットは、コンピュートサブシステム「Arm Neoverse」の「V3」をベースとしている。同社は、Samsungの2nm世代プロセスを適用してこのCPUチップレットを設計/実装する予定だという。
RebellionsのCTO(最高技術責任者)を務めるJinwook Oh氏は、米国EE Timesの取材に対し、「Rebellionsは既にArmエコシステムに参加しており、既存のチップでArm IP(Intellectual Property)を使用している。(Rebellionsの第2世代チップ)『Atom』の開発プロジェクトではArmから多大な支援を受けた」と述べている。
また同氏は、「われわれがArmを選択したもう一つの理由に、ArmのCPU IPは検証やソフトウェアスタック開発のために簡単にエミュレートできるという点がある」と述べる。
推論向けの第1/第2世代チップ
2020年設立のRebellionsは、既に2世代のチップを市場に投入している。
Rebellionsの第1世代チップ「Ion」は、金融取引分野に向けた低レイテンシ推論をターゲットとしている。CGRA(Coarse-Grained Reconfigurable Architecture:粗粒度再構成可能アーキテクチャ)によく似たRebellionsのアクセラレーターのシングルインスタンスを搭載、TSMCの7nmプロセスで製造されていて、FP16演算で4TFLOPSを提供する。
Rebellionsの第2世代チップAtomは、電力効率の高いデータセンター向け推論エンジンとして設計されている。Atomは現在、カードやサーバ、ラックスケールシステムとして市場に出回っている。
Oh氏は、「Atomは、LLM(大規模言語モデル)の人気が急上昇する前に開発された製品で、外部メモリGDDR6を使用しているにもかかわらず、電力効率の高いLLM推論向けに使用できる」と述べる。
「Atomは、コンピュータビジョンやLLM向けに積極的に使われている。7B LLMは、8枚のカード全体に分散させることで40トークン/秒/ユーザー(token/s/user)(総スループットは1000〜2000トークン/秒)を提供することが可能だ。われわれは現在、顧客向けにより高密度かつ演算性能の高いサーバを構築すべく、1枚のカードに4つのAtomチップを搭載したもう1つ別のカードの開発に取り組んでいるところだ」(Oh氏)
また同氏は、「8Atom構成は、『Llama 70B』をサポート可能だ。Atomの主要顧客である韓国の通信事業者やクラウドソリューションプロバイダー、企業、韓国の公共部門などは、カスタムRAG(Retrieval-Augmented Generation:検索拡張生成)やエージェント型AI、チャットボットなどに使用している」と説明した。
各Atomチップは、64MB(メガバイト) SRAMで32TFLOPSのFP16演算性能を提供するニューラルエンジンを8個搭載している。ニューラルエンジンは2つのクラスタに配置され、それぞれがローカルNoC(Network-on-Chip)とL1キャッシュを搭載する。Atomは、消費電力量を75〜130W(INT8精度で0.5TOPS/Wに相当)に設定することが可能だ。
Copyright © ITmedia, Inc. All Rights Reserved.