図2に典型的なハイパースケールデータセンターの構造の模式図を示す。一般的には、サーバを数十台あるいは100台以上収納可能なラックに、1台あるいは数台のTOR(Top of Rack)スイッチが設置されている。拡張・更新などの単位となる複数のラックを並べた設備を「Row」と呼ぶ。RowのTORに接続されたLeafスイッチを含めた構成を「Pod」と呼ぶ。さらにその上位に、TOR間を結ぶノンブロックネットワークが階層的に形成されている。この記事では、単にネットワークという時はこのノンブロックネットワークを指す。
TORの重要な機能は、サーバのデータをノンブロックネットワークに乗せることである。後述するように、このネットワークは低レイテンシを実現するため、回線交換的で同一のデータレートとなっている。一般的にサーバインタフェースはネットワークのデータレートよりも低いので、TORで、ネットワークと同じ高速パケットに変換する。なお、TORは2:1などOversubscriptionとなっている。サーバとTORの接続は、価格や扱いやすさといった理由から、電気ケーブルが使われることが多いが、さらに高速になった場合、細線軽量で低消費電力なAOC(Active Optical Cable)が期待されている。
高速で低レイテンシの「東西トラフィック」を実現するネットワークは、ノンブロックの回線交換の技術である「折り返しClos Network」を基本としている。Clos Networkは、1952年にCharles Closによって理論づけられた、多段スイッチで構成されるノンブロックの回線交換ネットワークだ。これは、電話交換機に応用された。図3は、16x16 Clos Networkとその折り返しを示した図だ。折り返しを左回りに90度回転させると、図2と同じ構造を見て取ることができる。
このようなネットワークが使用されるのは、宛先を見てデータのルートを回線交換スイッチのように切り替える単純化された機能により、データを蓄積することがなく、低レイテンシを達成できるからである。このため、ネットワークのデータレートは同一であり、同じ形状の光モジュールが大量に使用される。
データセンターでは、2段のスイッチをサーバに近い方から「Leaf」と「Spine」スイッチと呼ぶ。
図2中には、ノンブロックネットワークを構成するLeafとSpineスイッチも示している。同一データレートのため、同じソケットが並ぶスイッチとなっていて、この例ではQSFPソケットが32個並んでいる。機能が単純化されたことにより、最近は、市販のスイッチICを用い、ソフトウェアも分離(ユーザーが用意)した「ホワイトボックス(White Box)スイッチ」と呼ばれる低価格のスイッチの市場が拡大している(最近はこの低価格汎用スイッチをNO Brandの場合は「White Box」、Brandのある場合は「Blue Box」の様に色を付けているケースも多い)。
Copyright © ITmedia, Inc. All Rights Reserved.