シングルセルRNA-seq解析用マシン (2023年05月版)

遺伝子研究に携わるお客様より、PythonやRを用いたシングルセルRNA-seq解析を行うためのマシンをご相談いただきました。
FastQCデータからQC (Quality Control)、マッピング、定量、データ解析まで実施する予定で、現状のマシンでは、処理の実施から完了までに24時間程度かかっているため、処理時間を短縮したいと伺っています。また、RのParallelパッケージは使用していないので、クロック数を重視する構成をご希望です。

ご連絡いただいた条件を踏まえて、弊社からは以下の構成をご提案しました。

【主な仕様】

CPU Core i9-13900KS (3.20GHz 8コア + 2.40GHz 16コア)
メモリ 128GB
ストレージ1 4TB SSD M.2
ストレージ2 16TB HDD S-ATA
ビデオ NVIDIA T400 4GB MiniDisplayPort x3
ネットワーク on board (2.5GBase-T x1) Wi-Fi x1
筐体+電源 ミドルタワー筐体 + 850W
OS Microsoft Windows 11 Professional 64bit

コア数よりもクロック数を重視した構成が望ましいとのことから、Core i9-13900KSを用いた構成としております。Core i9-13900KSは発熱が大きいため、本構成のCPUクーラーは通常よりも大きいサイズに換装しています。

もし、RのParallelパッケージを使用している場合や、同時に走らせる計算数を増やしたい場合には、AMDのCPU(ThreadripperPRO)を用いた構成も選択肢に入ります。その場合は、計算数や規模に合わせたメモリ容量の設定も合わせてご検討ください。

本事例の構成は、お客様から頂戴した条件を元に検討した内容です。
掲載内容とは異なる条件でご検討の場合でも、お気軽にご相談ください。

■FAQ

・Rとは
Rとはオープンソース・フリーソフトウェアの統計解析向けプログラミング言語/開発実行環境。統計処理のための計算やグラフ化で利用される。
多くのライブラリが存在するため、ライブラリを呼び出すだけで複雑な手法を扱うことができる。

参考:The R Project for Statistical Computing ※外部サイトに飛びます

 

・WSL2とは
Windows Subsystem for Linux 2 (WSL2) はWindows上でLinux向けバイナリを実行する方法の一つ。

参考:【記事】Windows Subsystem for Linux 2(WSL2)のGPUサポートについて【1/3】
参考:【記事】Windows Subsystem for Linux 2(WSL2)のGPUサポートについて【2/3】
参考:【記事】Windows Subsystem for Linux 2(WSL2)のGPUサポートについて【3/3】

 

・FastQCとは
FastQCは次世代シーケンサー (NGS)のデータ解析に使われるツールの1つであり、シークエンスデータの品質チェックに利用される。NGSプラットフォームから得られるファイルの品質を評価し、品質が低い箇所や異常のある箇所を検出して報告することができる。

参考:FastQC (Babraham Bioinformatics) ※外部サイトに飛びます

 

・Pythonとは
Pythonは、Python Software Foundation (PSF) が著作権を保持する、オブジェクト指向プログラミング言語。プログラミングの構文がシンプルなため可読性が高く、目的に応じたライブラリやフレームワークといったコンポーネントが豊富に揃っていることも特徴。プログラミングの初学者から上級者に至るまで人気の言語。

参考:Python ※外部サイトに飛びます

参考:【特集記事】プログラミング言語 Python その人気の理由は?- Python プログラミングを加速するツールたち ※弊社オウンドメディア「TEGAKARI」に飛びます