メディア

光トランシーバーのForm Factorの新動向（8）～CPO/NPOと新しいデータセンター：光伝送技術を知る（19）　光トランシーバー徹底解説（13）（2/4 ページ）

» 2022年01月27日 11時30分公開

[高井厚志，EE Times Japan]

新しいデータセンターの動向

　この30年間同様、光モジュール市場に大きな影響を及ぼすシステムの変革がおおむね10年ごとに起こるとするなら、2020年代の光技術をけん引するシステムは何だろうか。

　AI（人工知能）やML（機械学習）、HPC（High Performance Computing）、量子コンピュータ／量子通信、デジタルツイン、5G（第5世代移動通信）、IoT（モノのインターネット）、エッジコンピューティング／データセンター、自動運転、スマートファクトリーなど、従来にもまして新しい技術やシステムの言葉が世の中にあふれている。

　大きな方向性としては、「センサーから膨大な情報（ビッグデータ）を収集、処理、保存し、収集したビッグデータを基にAIが学習、推論し、PhysicsなどをベースにHPCがシミュレーションを行うサイクル」が、新しいデータセンターの中心機能となっていくのではないか。

　そこに、リアルタイムという要素が加わる。自動運転、Industrie 4.0、医療や輸送などの分野で、AIやHPCを駆使したデジタルツインの実用化に向け、さかんに研究開発が行われている。この実現に向け、ユーザーの近傍に構築するデータセンターにAI／HPCが用いられ、情報のやり取りには5Gなどの無線技術が用いられることが期待されている。そして、中央の大規模なグローバルデータセンターとローカルなエッジデータセンターの協働や役割分担が想定される。

　このような応用に対し、AI Clusterやスーパーコンピュータを自前で持つという企業もあるだろうが、ICの性能向上が著しい中で、アップグレードを含む保守などの経済性などを考えれば、クラウドデータセンターの手法が選択肢として考えられる。特に、学習に関して自前システムで行うのは多くの場合経済的ではないだろう。

　これに対してプラットフォーマーはどう対応しようとしているのだろうか。2021年6月のOFCではGoogleが、次世代のCloud 3.0には3つのポイントがあると述べている。1）Serverless Compute、2）Real-Time Intelligence、3）Machine Learningだ。やはり、AI／MLを中心としたシステムを考えていることが分かる。また、1）は多数のサーバを並べてつないだハイパースケールクラウドデータセンターとは、姿が異なることを表明している。

　計算能力に優れたプロセッサノード（Processor Node）を多数接続して膨大な計算を短時間で行う試みは、1990年代の並列コンピュータの時代から綿々と続いてきた。鍵となる技術の一つがノード間通信であり、高速大容量で低レイテンシな接続が要求され、光技術あるいは光配線技術が注目される。

　理研の富岳やGoogle TPUなどにおいてそのネットワークは100G～400Gであり、この帯域がアプリケーションを制限しているとも言われている。新しいシステムでは数Tbit/sの接続を実現することで、さまざまなアプリケーションを実現する多様なアルゴリズムのAI／ML／HPCを、同じアーキテクチャで実現できるのではないかと期待している。

　図2に示すように、ノードの接続にはさまざまな方式がある。Teslaが開発中のAIトレーニングマシン「Dojo」の2次元メッシュや、富岳の複雑な6次元メッシュ／トーラスなどがある。GoogleのTPUは、v2とv3は2次元トーラス、v4は3次元トーラスである。この接続の仕方とデータ量が、アプリケーションと計算能力を決定する。