遺伝的能力の推定計算用マシン

PC-8850Bの遺伝子発現解析用マシン (2022n年9月版) をご覧いただいたお客様より、ゲノムデータや統計解析を使用した計算を行うためのマシンをご相談いただきました。
SNP (スニップ/一塩基多型) という遺伝子型の情報を使い、遺伝子的能力の推定を行う計算を行う想定で、具体的には、1万x1万以上の行列を処理するため、大容量のメモリが必要と伺っています。

また、 現在使用中のマシンスペックは以下の通りです。

・機種はMac Pro
・CPU:Xeon E5-2697v2 2.7GHz 12コア
・メモリ:64GB

使用しているプログラムはBLUPF90で、複数の計算を処理するにあたり、64GBメモリでは不足気味であることが分かっています。

その他の用途として、将来的にはPythonを用いた16S リボソームRNAのデータ解析や、畜産のビッグデータを使用した機械学習での利用予定があると伺っています。

OSは使い慣れたWindowsをご希望いただいており、ストレージ容量は4TB以上が必須という条件です。
お客様からは「PCに詳しくないので具体的な要望を出すことは難しいが、予算内でできる限り高スペックなマシンを提案して欲しい」とのコメントをいただきました。

それらを踏まえた上で、弊社からは下記のスペック構成をご提案しています。

【主な仕様】

CPU AMD Ryzen ThreadripperPRO 5975WX (3.60GHz 32コア)
メモリ 256GB
ストレージ1 4TB SSD S-ATA
ストレージ2 16TB HDD S-ATA
ビデオ NVIDIA Geforce RTX3090
ネットワーク on board (1GbE x1 10GBase-T x1)
筐体+電源 タワー型筐体 + 1000W
OS Microsoft Windows 11 Pro 64bit
その他 TPMモジュール

ご覧いただいた事例No.PC-8850Bをベースに、構成を変更してご提案しました。

■Point

・メインの用途を考えると、CPUでの処理が主になると考えられる。
・メモリは64GBで不足「気味」なので、それ以上の容量があれば余裕をもって同じ処理を実行できると推測。

CPUは、コア数とクロックのバランスのよいThreadripperPRO 5975WXを選定しました。
また、メモリは余裕をみて256GBとしています。現在お使いのマシンの4倍に相当する容量ですので、同じ処理を比較的余裕を持って実施できる想定です。

その他、将来的に機械学習の手法を取り入れる可能性があることを考慮し、機械学習で利用されることの多いハイエンドGPUを搭載しています。機械学習の実装にも種類がありますので、NVIDIA GPUに対応するGPGPUフレームワークやCUDA Toolkitを介したプログラムを利用しない、またはそれほど本格的に取り組む想定ではない場合には、必ずしもこのGPUである必要はありませんので、安価な製品に変更することで価格を抑えることができます。

なお、ご利用中のMac Proと比較するとパーツの世代差が大きいため、性能の向上を体感できる構成です。

本事例の構成は、お客様から頂戴した条件を元に検討した内容です。
掲載内容とは異なる条件でご検討の場合でも、お気軽にご相談ください。

■FAQ

・BLUPF90系プログラムとは
BLUEPF90系プログラムは、動物飼育における混合モデル計算用の統計ソフトウェアパッケージ。
動物や植物の育種のための量的遺伝子学的アプローチで用いられる。
Fortran 90/95で記述されたプログラムは、何十万もの遺伝子型からゲノミック選抜を行うことができる。

参考:BLUPF90 Family of Programs ※外部サイトに飛びます

 

・機械学習とは
機械学習は、データ蓄積により特定のタスクをコンピュータ上で実行できるようになる仕組み。
コンピュータが自律的に認識・予測精度を向上させる。
機械学習に関しては、弊社オウンドメディア「TEGAKARI」の関連記事をご覧ください。

参考:【特集記事】機械学習ってなんだろう