統計解析ソフトウェア「Stata」を快適に利用するためのマシンのご紹介

■こちらは、2021年9月9日に投稿された記事のため、情報の内容が古い可能性があります。

R&D向け海外製品調達 と その利用に最適な構成のPC製作サービス

オーダーメイドPCの製作サービス「テグシス」と 研究開発者向け海外製品調達・コンサルティングサービス「ユニポス」という2種類のサービスを提供するテガラだからこそ可能な、「R&D向け海外製品の購入とその利用に最適化したカスタムPCの製作」というワンストップサービスをご紹介いたします。

たとえば、ソフトウェアを動かすためにはPCが必要であり、専門的なソフトウェアにはそのために必要な条件(※メモリの容量や、ハイエンドなビデオカードの搭載など)がある場合があります 。そんな条件に合致したPCを探す手間を省略し、海外から調達した製品とその動作に最適なPCをセットにしてご提供できることが、テガラの強みです。

今回は、兼ねてよりユニポスで取り扱ってまいりました  統計解析ソフトウェア「Stata」のご利用に最適なマシンをご案内します。

Stata について

データ分析、データ管理のみならず、モデリング、図表作成などの機能を備えた、データサイエンスと推論に必要なすべてが含まれた統合型統計ソフトウェアパッケージとなります。

マウスによるGUI操作に加え、強力かつ直感的なコマンドシンタックスでの実行も可能なので、使いやすく かつ高速で正確なのが特徴です。

様々な分野に関する数百もの統計ツールが用意されており、これ1本で、行動科学、疫学・生物統計、経済、教育、政治学、公衆衛生学、公共政策、社会学、財務・ビジネス・およびマーケティングなど、あらゆる分野での統計分析が可能です。

※UI(クリックすると拡大します)

主な統計機能

線形モデル、 パネルデータ/縦断データ、マルチレベル混合効果モデル、選択モデル、 ERM(拡張回帰モデル)、GLM(一般化線形モデル)、FMM(有限混合モデル) 、空間自己回帰モデル、 ANOVA(分散分析)/MANOVA(多変量分散分析)、疫学、DSGEモデル(動学的確率的一般均衡モデル)、テスト/予測/効果、 コントラスト/ペアワイズ比較/マージン、 リサンプリングとシミュレーションの方法、多変量メソッド、時系列、生存分析、ベイズ分析、メタアナリシス、検出力/精度/サンプルサイズ、治療効果/因果推論、Lasso(なげなわ)、SEM(構造方程式モデリング)、潜在クラス分析、多重代入、調査方法、クラスター分析、 IRT(項目反応理論)、ネットワーク分析 など

※そのほか機能詳細につきましては、こちら(機能一覧) をご参照ください。

 

エディションの種類

データの規模や処理数に応じて、Stata/MP、Stata/SE、Stata/BE の3つのエディション(パッケージ)からご選択いただけます。

  • Stata/MP: 大規模なデータセット向けかつ、並列処理で高速な分析を必要とする場合
  • Stata/SE: 大規模データセット向け
  • Stata/BE: 中規模データセット向け

 

Stata/MPについて

Stata/MP はマルチコア・マルチプロセッサを最大限に活用するためのエディションで、コア数に応じたライセンスの提供が可能です。

コンピュータのすべてのコアで計算量の多いタスクを実行することで、実行速度が大幅に向上します。Stata/SEとStata/MP の処理速度を比較しますと、Stata/MPは、比較的安価な2コアのコンピュータで約33~50%、標準的な4コアのコンピュータで約50~75%、分析に要する時間を短縮できます。

なお Stata/MPは、マルチプロセッサ搭載のワークステーションやサーバーであれば、さらに高速処理が可能です(最大64コア/プロセッサをサポートします)。

※処理性能の詳細につきましては こちらの Performance of Stata/MP ( PDFダウンロード ) をご参照ください。

またシステムで利用可能なRAMの容量によりますがStata/MPはStata/SEよりもさらに大きなデータセットをサポートします。

Stata/SEが最大で約21億の観測数(複数のレコード)と最大 32,767 個の変数を分析できるのに対し、Stata/MPは100〜200億の観測数、コンピュータのハードウェア構成によっては最大1兆の観測数、ならびに最大120,000個の変数を分析することができます。

なおStata/MPは、他のエディションのStataと互換性があります。 Stata/MPの速度を向上させるために、分析を再定式化または変更する必要はありません。

エディション 変数の最大値 独立変数の最大値 観測データの最大値
Stata/MP 120,000 65,532 200億*
Stata/SE 32,767 10,998 21.4億
Stata/BE 2,048 798 21.4億

 * 観測データの最大値は、システムで使用可能なRAMの容量によって制限されます。

本内容は、Stata/MP is the fastest and largest edition of Stata.を参考にしています
https://www.stata.com/statamp/

 

なお各エディションの詳細につきましては こちら(比較表) をご確認ください。

Stataに最適な構成のPC

今回はintel Core i9をベースとしたStataのすべてのエディションに対応可能なモデル(※)と、大量なデータセットにおいても高速かつ快適に動作するAMD Ryzen Threadripper をベースとしたStata/MP 用のモデルをご用意いたしました。

※Stata/SE と Stata/BEは並列処理をサポートしないため、クロックを重視したCPU(Core i9 11900K 最大クロック5.3GHz)を採用した1つ目のモデルをご参照ください(こちらのモデルはStata/MPでも8コアライセンスまで対応可能です)。

Stata用マシンの構成例

 

どちらのモデルもご利用時の動作の快適性を考慮し、コア数に合わせて十分なメモリを搭載しておりますので、標準的な分析から複雑で高機能な分析を必要とするものまでを一貫して行えます。

もちろんお客さまのご要望に合わせた仕様、構成での対応も可能ですので、是非お問い合わせいただけますと幸いです。