RTX6000 Adax4枚搭載マシン

電力工学に携わるお客様より、ご予算1300万円以内の条件で深層学習用マシンをご相談いただきました。

希望としては、GPUのVRAM容量を重視しており、それと同時に適切な納期 (入手に時間がかかりすぎない) ことも条件とされています。
具体的なスペックは、CPUはIntel Xeon Platinum 8368 (2.40 GHz 38コア) x2相当で、メモリ容量は512GB以上をご指定です。
また、GPUの候補としてNVIDIA A100、 NVIDIA V100、 NVIDIA RTX6000 Ada、 NVIDIA A6000 の4つが挙がっており、この中のどれかを総VRAM容量が128GB程度になるように搭載したいというご依頼です。
その他、ストレージは20TB程度、OSはRed Hat Enterprise Linux 8の条件もご連絡いただいています。

お客様からのご相談内容を踏まえて、弊社からは下記の構成をご提案しました。

CPU Intel Xeon Platinum 8460Y+ (2.00GHz 40コア) x2
メモリ 512GB REG ECC
ストレージ 7.68TB SSD S-ATA ×4 (RAID5)
ビデオ on board
GPU NVIDIA RTX 6000 Ada 48GB ×4
ネットワーク on board (10GBase-T x2)
筐体+電源 4Uラックマウント筐体 + リダンダント電源5400W
OS Rocky Linux 8

CPUは第3世代Xeon Platinumをご希望いただきましたが、2024年1月現在、後継品である第4世代の製品が展開されています。
そのため、第4世代XeonでIntel Xeon Platinum 8368と同等スペックのIntel Xeon Platinum 8460Y+ (2.00GHz 40コア) x2を選択しています。

DeepLearningに適したGPUの選定

GPU候補のうち、NVIDIA A100はご相談をいただいた時点で納期が長期化しており、納期を重視する場合にはマッチしない製品でした。
V100はA100と同じGPGPU専用カードの旧世代製品ですが、V100は既に終息しており、仮に入手できたとしてもDeepLearning用途で利用される単精度・半精度の演算性能はアーキテクチャーの世代差によりRTX A6000やRTX6000 Adaよりも低くなります。
また、現時点で総合的には最高の性能を持ったGPUにNVIDIA H100がありますが、非常に高額でありコストパフォーマンスの観点からも扱いの難しい製品です。
これらのことより、総VRAM容量128GB程度の組み合わせを効率よく実現する場合A6000、 もしくはRTX6000 Adaをおすすめします。

本件のお客様へのご提案では、ご予算に合わせて、RTX6000 Ada x4枚(総VRAM容量192GB)を選択しています。
また、本構成はRTX6000 Adaを合計9枚まで増設可能です。
なお、実際の運用においては消費電力の都合上、200V環境が必要となります。

本事例の構成は、お客様から頂戴した条件を元に検討した内容です。
いただいた条件に合わせて柔軟にマシンをご提案いたしますので、掲載内容とは異なる条件でご検討の場合でも、お気軽にご相談ください。

キーワード

・DeepLearningとは
DeepLearningは機械学習の一種であり、多層のニューラルネットワークを用いて高度なパターン認識や予測を行う手法。一般的に大量のデータを必要とするため、データが豊富な場合に効果的な手法とされている。 また、DeepLeanigは画像認識や音声認識、自然言語処理などの分野で広く用いられている。複雑な特徴や関係性を学習することができるため、従来の機械学習手法よりも高い精度を発揮することができる。

参考:【特集記事】機械学習ってなんだろう ※弊社オウンドメディア「TEGAKARI」に飛びます