ゲノム研究に携わるお客様より、バイオインフォマティクス解析を行うLinuxのワークステーションの導入をご相談いただきました。主な用途はHi-Cデータ、scRNAseq、scATACseqなどのデータ解析で、Bowtie2、STAR、BWA、samtools、Juicer/juicebox、R (Seurat、Singac、etc…)の利用を想定されています。
具体的には下記のような条件を考えていらっしゃるため、予算内で実現できるかどうかをご質問いただきました。
CPU:指定なし (クロックは下げてもコア数の方が重視。コア数は20-36程度)
メモリ:128GB-256GB (メモリ容量を重視したい) 32GB x6枚の構成を考えている。
Storage:指定なし (2TB以上)
OS:Linux OS (Ubuntu24.04 or 22.04)
設置場所:居室
予算:100万円以内
これらの条件を踏まえ、弊社からは下記の構成をご提案しました。
CPU | Intel Xeon W5-2565X 3.20GHz (TB3.0時 最大4.8GHz) 18C/36T |
メモリ | 合計192GB DDR5 5600 REG ECC 32GB x 6 |
ストレージ | 2TB SSD M.2 NVMe Gen4 |
ビデオ | NVIDIA RTX A400 4GB (MiniDisplayPort x4) |
ネットワーク | on board (2.5GbE x1 /10GbE x1) |
筐体+電源 | ミドルタワー筐体 + 1000W 80PLUS PLATINUM |
OS | Ubuntu 24.04 |
ご予算の100万円の範囲内で、できる限りご要望にあわせた構成です。
GPUの優先度は低いため、CPUやメモリを重視
ご連絡いただいたソフトウェアはいずれもGPU性能を必要としないため、ビデオカードには画面出力用としてRTX A400を採用しています。GPU計算を行う予定がある場合にはご連絡ください。
メモリ構成について
ご要望にあわせて32GB x6枚の構成としていますが、本構成のメモリチャネルに合わせて4の倍数でモジュールを搭載する構成がベストです。そのため、メモリ6枚のうち2枚は、4枚搭載時に発揮される本来の最高速度よりもわずかに遅くなりますので、予めご承知おきください。
■キーワード・Hi-Cとは Hi-C(High-throughput Chromosome Conformation Capture)は、シーケンシングによりゲノムの三次元構造を解析するための革新的な技術。2009年に開発された手法で、細胞核内でのDNAの空間的配置を高解像度で明らかにすることができる。 ・scRNAseqとは シングルセルRNA-seq (scRNA-seq) は個々の細胞レベルで遺伝子発現を解析可能にする技術。細胞のトランスクリプトームマッピングを行うことで、細胞間の違いを明らかにする。同種の細胞でも個々に微細な違いがあるため、このような解析手法が必要とされる。活用としては、例えばがん細胞内の異質性の解明や細胞分化のプロセス解明などが期待される。また、少ない量のRNAからの解析が可能であり、細密な解析に利用されている。 ・scATACseqとは シングルセルATAC-seq (scATACseq)は、個々の細胞レベルでクロマチンアクセシビリティを網羅的に解析する技術。細胞集団内のエピジェネティックな多様性を詳細に調べることが可能。scATAC-seqは、scRNA-seqと組み合わせることで、より包括的な細胞状態の理解が可能になる。 ・Bowtie2とは Bowtie2は、シーケンスリードを参照配列にアライメントするためのツール。哺乳類のような比較的長いゲノムのアライメントに優れている。 ・STARとは STAR は RNA-Seqで得られたリード(生データ)をリファレンス配列にマッピングするプログラム。Github上で公開されており、要求されるスペックは高いものの、高速なマッピング速度を有している。 ・BWAとは BWAはヒトゲノムなどの大規模な参照ゲノムに対して、低発散配列をマッピングするためのソフトウェアパッケージ。BWA-backtrack、BWA-SW、BWA-MEMの3つのアルゴリズムで構成されている。 ・Samtoolsとは Samtoolsは次世代シーケンサーから出力されたデータを操作するためのプログラム群。 ・Juicerとは Hi-Cデータを解析するためのオープンソースツール。生の配列データから正規化されたコンタクトマップを作製したり、テラバイト規模のHi-Cデータセットを処理することができる。 ・JuiceBoxとは Juicerで生成された.hicファイルを視覚化するためのアプリケーション。生成されたHi-Cマップを直感的に閲覧し、解析することができる。
・Rとは Rとはオープンソース・フリーソフトウェアの統計解析向けプログラミング言語/開発実行環境。統計処理のための計算やグラフ化で利用される。 多くのライブラリが存在するため、ライブラリを呼び出すだけで複雑な手法を扱うことができる。 |
■ このPC事例に関する詳細、お問い合わせはこちら ※事例の名称またはご希望の条件などをご記入ください。 |