Geforce RTX4090搭載 機械学習用マシン

スポーツや人体構造の研究に携わるお客様より、機械学習用のマシンをご相談いただきました。
機械学習用の環境を初めて導入するため、予算100万円で上記用途のスターター構成をご希望です。

具体的な用途としては、既存モデルの検証・転移学習やファインチューニングおよび、モデルの学習及び推定を予定されており、扱うデータ量は大きくならない見込みです。

なお、利用しているノートPCはVRAM容量が6GBあり、頻繁にメモリリソースの不足が発生して処理が停止してしまうというお悩みを伺っています。そのため、新たに導入するマシンではVRAM容量を重視したいとのご要望をいただきました。

OSはUbuntu 22.04をご希望で、マシンの冷却にあたって、オーバーヒートを防ぐための対策についてもご質問いただいています。

 

ご相談の内容を踏まえ、弊社からは下記の構成をご提案しました。

CPU Core i7-14700K (3.40GHz 8コア+2.50GHz 12コア)
メモリ 64GB
ストレージ1 1TB SSD M.2
ストレージ2 4TB HDD S-ATA
ビデオ NVIDIA Geforce RTX4090 24GB
ネットワーク on board(2.5GBase-T x1) Wi-Fi x1
筐体+電源 ミドルタワー型筐体 + 1500W
OS Ubuntu 22.04

2023年12月時点で最新の第14世代Coreシリーズを搭載した構成です。

機械学習のためのGPU選択

機械学習でCUDAを利用することを想定し、GPUはハイエンドモデルのNVIDIA GeForce RTX4090を搭載しています。
NVIDIA Geforce RTX4090はGeForceシリーズの中では現在最上位のモデルで、単純な処理性能は現在販売されているビデオカードの中でも最高クラスです。ビデオメモリ容量は、ワークステーション・サーバー向けのハイエンドモデルと比較するとやや少ない24GBです。
大規模言語モデルのような巨大なモデルを扱う場合は不足感が出る可能性がありますが、ご相談内容のようにあまり大きくないモデルを扱う用途であれば、高い処理性能が期待できます。

また、ご予算の面でも、選択可能なGPUの中でGeforce RTX4090は最もスペックの高い製品です。

マシンの冷却について

本構成の冷却装置は、CPU・GPUともに空冷クーラーを採用しています。
CPUクーラーは大型ヒートシンクを備えたハイエンド製品を採用しているため、手動でのオーバークロックなどを行っていないデフォルト設定でのご利用においては、顕著な問題は起こりません。
また、弊社では製造時に12時間のフル稼働で動作テストを行い、動作中の温度の推移に問題がないことを確認して出荷します。

ご利用にあたり、特に注意が必要なのは設置場所の室温です。
弊社での動作チェック時は室温25℃を基準にしています。この室温を超えると直ちに問題が発生するわけではありませんが、30℃を超える環境で常用した場合、CPUやGPUの冷却が適切に行われないことによる問題の発生リスクが高まります。
その他、空気の流れが悪い場所や、周囲に熱を持ちやすいものがあるなど、マシンの排熱を妨げる環境で設置されている場合、筐体内の排気が滞ることによる問題の発生リスクがあります。
マシンの背面側には一定のスペースを作るなど、設置レイアウトに配慮していただけますと幸いです。

 

本事例の構成は、お客様から頂戴した条件を元に検討した内容です。
いただいた条件に合わせて柔軟にマシンをご提案いたしますので、掲載内容とは異なる条件でご検討の場合でも、お気軽にご相談ください。

 

■キーワード

・CUDA Toolkitとは
CUDA Toolkitは、NVIDIAが提供しているGPU向けのパラレルコンピューティングプラットフォーム。C/C++からNVIDIAのGPUアーキテクチャを利用した高速なパラレルプログラミングが可能。DeepLearningや科学計算、コンピュータグラフィックスなど、様々な分野でGPUの計算能力を活かすことができる。コンパイラ、ライブラリ、デバッガなどのツールが含まれており、SDKとして提供されている。マルチGPU環境もサポートしており、ワークステーションからクラウドまで幅広い環境で活用できる。

参考:CUDA Toolkit (NVIDIA Corporation) ※外部サイトに飛びます