2018-03-28

NVIDIAのDGX-1とDGX-2の比較とNVSwitchについてのメモ

公開用Blogもってないのでここにメモしとく

DGX-1とDGX-2の比較

 DGX-1DGX-2DGX-1比 参考DGX-1*3
価格$149K$399K268% $447K
消費電力3.2kw10kw313% 9.6kw
CPUXeon E5-2698(20core)*2XeonPlatinum(28core?)*2140%? Xeon(20core)*6
Memory512GB1.5TB300% 1.5TB
GPUVolta*8Volta*16200% Volta*24
GPU-Memory128GB(16GB*8)512GB(32GB*16)400% 384GB(16GB*24)
SSD1.92T*430TB375% 23TB(1.92*12)

所感

値段2.5倍、消費電力3倍をどうみるか。

用途によってはDGX-2(Volta*16)よりDGX-1を3台(Volta*24)とかのほうが・・・

NVSwitch

消費電力高そう。

上記比較CPU数同じ、GPU倍、で多分増えてるPCIeスイッチ増加分にSSDメモリ増量を含めても消費電力3倍以上というのは・・・

上記の表から単純に考えて NVSwitch12個の消費電力+(PCIeスイッチ*X) = Xeon*4 + Volta*8 - HBM2 128GB分 - SSD7TB分。NVSwitch1つで数十Wはありそう、100w超えるかも。

18Portある。

DGX-2での接続不明

GPU-Switch間は各GPUから6Switchに1Portづつ接続Switchの8Portを使用。ここまでは確実だと思う、これ以外の接続思いつかない。図みたらそうっぽい。

問題Switch間がどうつながるか、6基づつで1クラスタクラスタ内はSwitch接続不要クラスタ間は別クラスタの1SwitchGPU接続数と同じ8Port使用とか?(合計16Port使用)

全然違った。クラスタ間は別クラスタ6Switchに1Portづつだった。

消費電力は1つ100w12Switchで1.2Kwだと。GPU間そんなつかわないならSwitch減らしてGPU増やしたいところ。

https://news.mynavi.jp/article/20180404-611133/

いや、クラスタ間は予想通りだった。そしてSwitch減らしたいというのは同意

https://news.mynavi.jp/article/20180418-617343/

所感

X86系ではGPU接続優先でCPU-GPU間は重視しない方向性にし、

Power系でCPU-GPU間を重視する方向性に行くように見える。

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん