図9に、AMDのサーバ用プロセッサ「EPYC」を示す。EPYCは32コアを有するCPUで、1チップで形成する場合、図9の左のように面積が777mm2と巨大なチップとなる。この巨大チップを、チップレットの手法を取り入れて、図9の右側のように4分割して製造し、その後接続する。4分割したそれぞれのチップ面積は213mm2で、213×4=852mm2と、分割する前より大きくなってしまうが、それを差し引いても分割した方が有利であることを図10で説明する。
図10の横軸はチップ面積、縦軸は歩留りを示す。グラフは2本あるが、ブルーのラインは欠陥密度が1個/cm2で量産初期の頃の歩留りと思えばよい。一方、オレンジのラインは欠陥密度が0.22個/cm2で、量産プロセスが改善され、成熟した頃の歩留りだと考えればよい。
さて、EPYCを1チップ(777mm2)で製造する場合、量産初期の歩留りはたった4%しかない。たとえ量産プロセスを最適化しても歩留りは26%にしかならない。
これに対して4分割したEPYC(213mm2)の場合、量産初期の歩留りは21%で、プロセスを最適化し、成熟した頃の歩留りは59%になる。つまり、4分割したチップは分割前の巨大チップに対して、その歩留りは量産初期で5.3倍、成熟した頃でも2.3倍になる。
この条件の下で、1枚のウエハーから何個のEPYCが形成できるかを、図11を使って説明する。EPYCを1チップ(777mm2)で製造する場合、ウエハー1枚当たりのチップ数は69個であり、成熟した歩留りが26%であるため、実際に取得できるチップ数は69×26%=17個となる。
一方、4分割したチップ(213mm2)は、ウエハー1枚当たり273個となり、成熟した歩留り59%ならば、取得できるチップ数は273×59%=161個になる。4個で1チップであるから、実際に形成できるEPYCは161÷4=40個となる。
これは1チップ(777mm2)で形成する場合の17個に対して、4分割した方が約2.4倍多くEPYCを作れることを意味している。逆に言えば、チップを4分割することにより、EPYC1チップ当たりのコストを2.4分の1に減らすことが可能になるというわけだ。
チップを分割することにより歩留りを向上させ、その結果としてチップ当たりのコストを下げることができる。これが、チップレットのメリットの一つである。しかも、チップレットの長所はこれだけではない。
図12に、AMDのサーバ用プロセッサEPYCの第1世代と第2世代の比較を示す。第1世代のEPYCでは、14nmで形成したチップを4個使ってプロセッサを構築している。一方、第2世代では、オレンジで示したプロセッサ8チップを7nmで製造し、ブルーで示したInput/Output(IO)チップを14nmで形成して、これらをインターポーザ上に配置してEPYC用プロセッサを構築している。
つまり、最も高速動作が求められるプロセッサは、2019年当時の最先端の7nmで形成し、それほど最先端でなくてもいいI/Oは14nmというように、それぞれのチップに最適なプロセスノードを選択できるというわけだ。
これを突き止めると、Samsungが図1に示したような芸当が可能になる。チップレットを採用しない場合は図1の左のように、チップ全体を同じプロセスノードで製造しなければならない。この弊害として、チップ面積が大きくなるとともに歩留りが低下し、1チップ当たりのコストが高騰することは前述した通りである。それ以外にも、同一のマスクに、CPU、GPU、モデム、SRAM、Serdes/DDRを配置するために、クリティカルなパタンとラフパタンが混在し、製造工程は複雑になる。
一方、図1の右側では、GPUをAノード、CPUをBノード、SRAMをCノード、I/OをDノードというように、それぞれの機能にとって最適なテクノロジーノードでチップを製造し、それらを1枚のインターポーザ上に配置する。まるで、各種の半導体のモジュールをレゴブロックのように作って組み合せることができるわけだ。
チップレットには、このようなメリットがある。さらに、CPU、GPU、DRAMなどをうまく配置することによって、SoCのAIの処理速度を格段に向上させることが可能になることを次節で示す。
Copyright © ITmedia, Inc. All Rights Reserved.