ハードウェアについて、Keller氏は「ようやく実現しつつある」と述べている。
Keller氏は「通常、ハードウェアとソフトウェアを出荷するには、信じられないほど多くの段階を踏まなければならない。ラボで動かしてみて、『よしいいぞ、準備ができた』と言ったその6カ月後にも、まだバグを修正しているといった具合だ。だがわれわれは成功し始めている」と述べた。
近日発売予定の「Nebula」PCIeカードにはワンチップ版と2チップ版があり、いずれもTenstorrentの12nmプロセス採用シリコン「Wormhole」の第2世代品をベースとしている。また、開発キットはTenstorrentのシリコンの第1世代品「Grayskull」をベースにしたものだ。
Keller氏によると、GrayskullはPCIeのみだったが、アプリケーションはワンチップが使用可能、もしくは2〜3種のチップはホストを介してPCIe上で相互に通信できたという。また、同氏はGrayskullがWormholeに比べコストパフォーマンスでは劣る点にも言及した。
Keller氏は「Wormholeの優れた点として、100ギガビットイーサネット(100GbE)ポートを16個搭載していることが挙げられる。当社のPCIeカードは、そのうち2ポートが背面に出ており、それらを1つに束ねられる。さらに2ポートをカード上部に露出させているので、複数のカードを使う場合、チップをメッシュ状に実装できる」と述べた。
こうした構造は、大規模言語モデル(LLM)を加速化する上で適している。LLMでは、アクセラレーターとホスト間の通信よりも、アクセラレーター同士の通信が必要になる。2個のカードと32個のカードの間でのアクセラレーター同士のトラフィックは、100GbEを介して転送される。
Keller氏は「このアプローチは比較的うまくいき始めている。1年前にも適切に作動できていたが、スケーリングはかなわなかった。そして、新たなモデルの立ち上げも、非常に困難だった。そこでソフトウェアの大幅なリライトを行ったところ、非常に良い状況になってきている」と述べた。
Tenstorrentは、32個のWormholeを用いた4Uラックスケールシステム「Galaxy」を構築した。Keller氏によれば、同システムも今後、早い時期に市場に投入されるという。
Keller氏によると、真のTenstorrentのスタイルとして、1〜8枚のカードを搭載した暗号通貨のリグなど、コンピュータ向けのあらゆる種類のフォームファクターを調査しているという。それにより、良いバランスのコストパフォーマンスがもたらされる。
また、同社はクラウドで開発者に向け、旧世代のGrayskullチップ1000個を利用可能にしている。このインフラは次世代のWormholeハードウェアに向けて可能な限り早くアップグレードされる予定だ。さらに、Tenstorrentの6nmプロセス採用チップ「Black Hole」もテープアウトした。
【翻訳:田中留美、滝本麻貴、青山麻由子、編集:EE Times Japan】
Copyright © ITmedia, Inc. All Rights Reserved.