DeepLabCut ver2.3用マシン (2024年2月版)

事例No.PC-10086をご覧になったお客様より、DeepLabCut ver2.3用のワークステーションをご相談いただきました。予算100万円程度での最適な構成をご希望です。

処理能力の水準としては、お客様が現在使用しているNVIDIA RTX A6000 x1枚を搭載したワークステーションと同等以上の速度でDeepLabCutを動かせる構成が必要であり、あわせてDeepLabCut ver2.3の事前インストールもご要望いただいています。

その他、具体的なスペックとしては,以下の条件です。

CPU DeepLabCutが問題なく動く程度の能力
メモリ 128GB
GPU RTX A6000と同程度の速度でDeepLabCutの解析ができるもの (Geforce RTX4090等)
ストレージ 1TB M.2 SSD x2枚

お客様よりご連絡いただいた内容をふまえ,弊社からは下記の構成をご提案しました。

CPU Core i9-14900K (3.20GHz 8コア+2.40GHz 16コア)
メモリ 128GB
ストレージ1 1TB SSD M.2 NVMe Gen4
ストレージ2 1TB SSD M.2 NVMe Gen4
ビデオ NVIDIA Geforce RTX4090 24GB
ネットワーク on board (2.5GBase-T x1) Wi-Fi x1
筐体+電源 ミドルタワー型筐体 + 1500W
OS Microsoft Windows 11 Professional 64bit
その他 DeepLabCut インストール

2024年2月時点で最新の第14世代Core i9を搭載した構成です。予算に合わせて合計24コアのCore i9-14900Kを選択しています。

なお、実際にDeepLabCutを実行した際に負荷がかかる箇所はGPUが大半で、CPUに高い負荷がかかる場面はかなり少ないと考えられます。
そのため、CPUの性能を重視しない場合はCore i7などの下位モデルに変更することも可能です。

GeForce RTX4090とRTX A6000、どちらが最適?

お客様のご希望に合わせて、GPUはNVIDIA GeForce RTX4090 24GBを選択しています。
NVIDIA GeForce RTX4090 24GBとNVIDIA RTX A6000 48GBを比較すると、チップの世代とVRAM容量に違いがあります。チップの世代はRTX4090で採用されているものの方が新しいですが,VRAM容量はA6000の半分です。
DeepLabCutのGPU処理はTensorFlowを基盤としており、GPU利用中の挙動もTensorFlowの特性に準じます。TensorFlowのデフォルト設定で実行した場合、DeepLabCutは確保できるだけのビデオメモリを確保して処理を実行します。そのため、VRAM容量の差による影響が生じることも考えられますが、RTX4090のCUDAコア数は18,000以上でA6000の2倍に近い値です。実際の利用ではVRAM容量の差よりもCUDAコア数の差による影響の方がより大きく現れると考えられるため、RTX A6000と比較しても解析速度の向上が期待できます。

なお、DeepLabCut公式リポジトリに掲載されているGPUの要件では8GB以上のVRAMが推奨として示されています。その値から考えると、RTX4090の24GBも十分なVRAMが確保されていると言えます。

 

本事例の構成は、お客様から頂戴した条件を元に検討した内容です。
いただいた条件に合わせて柔軟にマシンをご提案いたしますので、掲載内容とは異なる条件でご検討の場合でも、お気軽にご相談ください。

■キーワード

・DeepLabCutとは

DeepLabCutは、動物の行動を分析するためのオープンソースのディープラーニングツール。動画から動物の特定の身体部位を識別しマーカーレスでの追跡が可能で、精度の高い動きの分析を提供する。

参考:DeepLabCut — The Mathis Lab of Adaptive Intelligence ※外部サイトに飛びます