土砂移動シミュレーション用マシン

建設作業の安全性に関する研究に携わるお客様より、Ansys Rockyを用いた土砂移動シミュレーションのためのマシン導入をご相談いただきました。現在ご使用のワークステーションではシミュレーション内容にスペックが追い付かなくなっているため、新たなマシンを導入したいというお考えです。

【現在のマシンスペック】

OS:Windows 10 Pro
GPU:GeForce RTX 2080 Ti 11GB
CPU:Core i7-9700K 3.60GHz
メモリ:32 GB
ストレージ1:S-ATA HDD 4TB
ストレージ2:M.2 SSD 512GB

具体的には、DEM/SPHという手法でシミュレーションを行い、砂と水を模擬した粒子を合計100万~300万個ほど扱う想定です。この粒子の多さから、処理能力が高くメモリ容量の大きいGPUを必要とされています。現在の環境では10秒のシミュレーションに合計4日ほどの計算コストがかかっているため、これを数十回以上連続で実施し、現実の実験データに近づけることが目的です。

シミュレーション内容に対して、お客様が検討されたスペックは以下の通りです。

【想定スペック】

OS: Windows 10 Pro
GPU: Geforce RTX 4090
メモリ: 256GB
ストレージ: SSD 2TB

将来のスペック拡張や、現在使用しているGPUを新しいマシンに移植することを考慮して、GPUを1枚追加できる筐体がご希望です。また、GPUの候補としてRTX 4090の他にRTX 6000 Adaも想定されており、多くの粒子を扱うシミュレーションで比べた場合、GPUメモリ容量の影響がシミュレーションの実行時間に大きく作用するのかという質問もいただいています。

上記のご相談内容を踏まえて、弊社からは下記の構成をご提案しました。

CPU Intel Xeon W5-3435X 3.10GHz(TB3.0時4.70GHz) 16C/32T
メモリ 合計 256GB DDR5 4800 REG ECC 32GB × 8
ストレージ 2TB SSD S-ATA
ビデオ NVIDIA Geforce RTX4090 24GB
ネットワーク on board (1GbE x1 /10GbE x1)
筐体+電源 タワー型筐体 + 1000W
OS Microsoft Windows 11 Professional 64bit

単精度と倍精度

GPUの選定では、実施する計算が単精度と倍精度のどちらであるかが重要です。

ANSYS社の提供するANSYS ROCKY GPU Buying Guideでは、扱う粒子の形状が球体状である場合には、単精度が高いGPUが推奨されています。粒子の形状が崩壊する場合や、複雑な形状をしている場合には倍精度対応が推奨されます。本事例では、お客様のシミュレーションは主に球状の粒子を扱うとのことでしたので、単精度の高いGPUで問題ありません。お客様の選定されたGeforce RTX 4090は単精度計算に強いGPUですので、用途にマッチしています。

GPUメモリの容量とシミュレーション実行時間の関係

Rocky GPU Buying Guide | Ansys Knowledgでは、GPUメモリについて以下の記述があります。

If you intend to run very large cases、 with millions of particles、 you should consider GPUs with larger memory size.

そのため、RTX 4090のGPUメモリ容量である24GBの範囲に収まる計算内容であれば、RTX 4090で問題ありません。

RTX 4090とRTX 6000 Adaを比較すると、RTX4090は動作クロックが高い反面、CUDAコア数がRTX6000Adaよりも少なくなります。そのため、理論値の並列計算ではRTX6000Adaが単精度91.1TFLOPSに対し、RTX4090は83TFLOPSと少し劣ります。

参考:NVIDIA RTX 6000 Ada 世代

参考:GeForce RTX 4090 グラフィックス カード|NVIDIA

この2つのGPUをベンチマーク比較すると、RTX 4090側の方が高いスコアで表示されますが、その要因はGPUの動作クロックに起因するものと考えられます。高クロック維持するため、RTX 4090の消費電力はRTX 6000 Adaの1.5倍を要求します。
そのため、ゲームのような瞬間的にピークが発生するような使い方では、動作クロックを高くできるRTX 4090のベンチマークの方が高い値となります。長時間多くのコアへ高負荷がかかる場合、熱や電力の問題で高いクロックを維持し続けることが難しいため、一般的なピークで計測されるベンチマークとは異なる結果になる場合があります。

GPU増設への対応

将来的にRTX 4090 を1枚追加することを想定し、1600Wの電源ユニットを搭載しています。本事例の構成にRTX 4090を追加する場合は、消費電力の関係上200V電源環境でのご利用が必須です。なお、搭載可能なGPU (RTX 4090) は合計2枚までですのでご承知おきください。
加えて、200V電源環境でのご利用に向けて、200V電源ケーブルを追加しております。

また、お手持ちのGPUである RTX 2080Ti の搭載可否は、カードの大きさや物理クーラーの形状次第となります。移植予定のRTX 2080Tiが内排気モデルの場合、マシン本体における排熱面の問題から移植してのご利用を推奨いたしません。おそれ入りますが、予めご了承ください。

■キーワード

・Ansys Rockyとは

Ansys Rockyは、粉体挙動を高精度にシミュレーションできる離散要素法(DEM)ベースのソフトウェア。非球体粒子のモデル化やGPUによる高速計算に加え、Ansysソフトウェアとの連成解析にも対応している。

参考:Ansys Rocky|CAE・Ansysの活用推進、解析に関するご相談なら:サイバネット ※外部サイトに飛びます

用途と予算だけで気軽に見積 - テグシスのかんたんお問合せフォーム