チップレットベースのデータセンターAI製品に注力、韓国新興：通信分野にも積極進出（1/3 ページ）

韓国のAI（人工知能）チップ新興企業Rebellionsは、チップレットベースのデータセンター用AIアクセラレーターの開発と展開に力を入れている。2020年に設立された同社はさまざまな企業と協業しながら、韓国で存在感を高めている。

LINE

Hatena

　韓国のAI（人工知能）チップ新興企業Rebellionsは、ADTechnologyとSamsung Foundry（以下、Samsung）、Armとの協業により、チップレットベースのデータセンターAIアクセラレーター製品を構築していくという。Rebellionsは、近々発表予定のチップレットベースのAIアクセラレーター「Rebel」と、ADTechnologyのArmベースのCPUチップレットを統合する予定だ。

　ADTechnologyのCPUチップレットは、コンピュートサブシステム「Arm Neoverse」の「V3」をベースとしている。同社は、Samsungの2nm世代プロセスを適用してこのCPUチップレットを設計／実装する予定だという。

　RebellionsのCTO（最高技術責任者）を務めるJinwook Oh氏は、米国EE Timesの取材に対し、「Rebellionsは既にArmエコシステムに参加しており、既存のチップでArm IP（Intellectual Property）を使用している。（Rebellionsの第2世代チップ）『Atom』の開発プロジェクトではArmから多大な支援を受けた」と述べている。

　また同氏は、「われわれがArmを選択したもう一つの理由に、ArmのCPU IPは検証やソフトウェアスタック開発のために簡単にエミュレートできるという点がある」と述べる。

推論向けの第1／第2世代チップ

　2020年設立のRebellionsは、既に2世代のチップを市場に投入している。

　Rebellionsの第1世代チップ「Ion」は、金融取引分野に向けた低レイテンシ推論をターゲットとしている。CGRA（Coarse-Grained Reconfigurable Architecture：粗粒度再構成可能アーキテクチャ）によく似たRebellionsのアクセラレーターのシングルインスタンスを搭載、TSMCの7nmプロセスで製造されていて、FP16演算で4TFLOPSを提供する。

　Rebellionsの第2世代チップAtomは、電力効率の高いデータセンター向け推論エンジンとして設計されている。Atomは現在、カードやサーバ、ラックスケールシステムとして市場に出回っている。

Rebellionsの技術ロードマップ［クリックで拡大］出所：Rebellions

　Oh氏は、「Atomは、LLM（大規模言語モデル）の人気が急上昇する前に開発された製品で、外部メモリGDDR6を使用しているにもかかわらず、電力効率の高いLLM推論向けに使用できる」と述べる。

　「Atomは、コンピュータビジョンやLLM向けに積極的に使われている。7B LLMは、8枚のカード全体に分散させることで40トークン/秒/ユーザー（token/s/user）（総スループットは1000～2000トークン/秒）を提供することが可能だ。われわれは現在、顧客向けにより高密度かつ演算性能の高いサーバを構築すべく、1枚のカードに4つのAtomチップを搭載したもう1つ別のカードの開発に取り組んでいるところだ」（Oh氏）

　また同氏は、「8Atom構成は、『Llama 70B』をサポート可能だ。Atomの主要顧客である韓国の通信事業者やクラウドソリューションプロバイダー、企業、韓国の公共部門などは、カスタムRAG（Retrieval-Augmented Generation：検索拡張生成）やエージェント型AI、チャットボットなどに使用している」と説明した。

　各Atomチップは、64MB（メガバイト） SRAMで32TFLOPSのFP16演算性能を提供するニューラルエンジンを8個搭載している。ニューラルエンジンは2つのクラスタに配置され、それぞれがローカルNoC（Network-on-Chip）とL1キャッシュを搭載する。Atomは、消費電力量を75～130W（INT8精度で0.5TOPS/Wに相当）に設定することが可能だ。

チップレートベースの第3世代品

原文へのリンク

　　　　　　 | 次のページへ