ddRAD-Seq解析用ワークステーション

森林の生態系に関する研究に携わるお客様より、次世代シーケンサー解析用マシンをご相談いただきました。
具体的には Illumina NovaSeqX によるddRAD-Seq解析用のワークステーションの導入を検討されています。
主な用途は、下記のとおりです。

・解析ソフトStacksによる大容量シーケンスリードのデータ解析
・数万SNPsを対象としたADMIXTURE、 PCA、BayesAss等の集団遺伝学解析

現在は、以前テグシスより購入した下記構成のPCをご利用いただいていますが、計算がとても速い一方で、実施する処理の規模が大きくないためにスペックを十分に活かしきれていないとの感想をいただいました。

■利用しているPCの構成
CPU AMD Ryzen Threadripper3 3970X (3.70GHz 32コア)
メモリ 256GB
ストレージ1 500GB SSD S-ATA
ストレージ2 8TB HDD S-ATA
ビデオ NVIDIA T400 2GB
ネットワーク on board(10/100/1000Base-T x1) Wi-Fi x1
筐体+電源 ミドルタワー型筐体 + 850W
OS Ubuntu 20.04

そのため、今回のご提案では、利用中のPCよりも多少スペックが落ちても構わないので、予算70-80万円程度を前提に最適な構成を提案して欲しいと伺っています。

お客さまご希望を踏まえて、弊社からは下記の構成をご提案しました。

CPU AMD Ryzen9 7950X (4.50GHz 16コア)
メモリ 192GB
ストレージ1 500GB SSD S-ATA
ストレージ2 8TB HDD S-ATA
ビデオ NVIDIA T400 4GB
ネットワーク on board(2.5G x1 10/100/1000Base-T x1) Wi-Fi x1
筐体+電源 ミドルタワー型筐体 + 850W
OS Ubuntu 22.04

ご予算内で解析処理性能を重視した構成

ご予算70万~80万円の条件を前提に、現在ご利用のマシンからスペックをスケールダウンした構成です。

CPUは2024年6月時点で最新であるRyzen 7000シリーズの最上位モデルAMD Ryzen9 7950Xを搭載しています。
ストレージなどの基本的な構成は現在ご利用いただいているマシンを踏襲しつつ、スペックが解析速度に大きく影響するCPUとメモリ容量に重点的にご予算を割くようにパーツを選定しています。
16コア/32スレッドを搭載したCPUと192GBのメモリ容量により、ご予算内で検討可能な構成の中でも、特に高速な解析処理の実行が期待できます。
なお、CPUコア数・メモリ容量ともにこのシステムの上限となります。より性能の高いマシンや将来的なアップグレードを想定した構成をご希望の場合にはご相談ください。

本事例の構成は、お客様から頂戴した条件を元に検討した内容です。
いただいた条件に合わせて柔軟にマシンをご提案いたしますので、掲載内容とは異なる条件でご検討の場合でも、お気軽にご相談ください。

 

用途と予算だけで気軽に見積 - テグシスのかんたんお問合せフォーム

 

■キーワード

・ddRAD-Seq解析とは

ddRAD-Seq (double digest restriction-site associated DNA sequencing) 解析は、次世代シーケンシング技術を用いて制限酵素認識サイトの近隣領域を解析する手法であるRAD-seq (Restriction-site Associated DNA Sequencing) 解析の一種。モデル以外の種からゲノム規模のデータを配列決定できるため、大量の遺伝子マーカーの開発を迅速かつ効率的に行うことができる。

・Stacksとは

Stacksは、Illumina プラットフォームによって生成されるような短い読み取りシーケンスから遺伝子座を構築するためのソフトウェアパイプライン。RAD-seqなどの制限酵素ベースのデータを用いて遺伝地図を構築し、集団ゲノミクスや系統解析を行うために開発された。

参考:Stacks※外部サイトに飛びます

・ADMIXUTUREとは

ADMIXTUREは、多座 SNP 遺伝子型データセットから個々の祖先を最大尤度で推定するためのソフトウェア。高速数値最適化アルゴリズムを使用することにより、推定値を迅速に計算することができる。

参考:ADMIXTURE: fast ancestry estimation※外部サイトに飛びます

・BayesAssとは

BayesAssは、連鎖していない多座遺伝子型を使用して集団間の最近の移住率を推測するためのプログラム。マルコフ連鎖モンテカルロ法を用いて集団間最近の移住率の事後確率を推定することができる。

参考:brannala / BA3 ※外部サイトに飛びます