自分だけのTesla Personal Supercomputer Systemを構築するためのガイド
このガイドは、Tesla Personal Supercomputer Systemを構築する手助けをします。システムやワークステーションを構築した経験があれば、自分だけのシステムを構築したいと思うかもしれません。さもなければ、この小売店から、既製のTesla Personal Supercomputerを、ご購入いただくのが一番簡単です。
どのようなシステム構築も、自己責任で行ってください。このようなシステムを構築する際、たくさんのコンポーネントが選択可能です。NVIDIAは、一般的なアドバイスはしますが、コンポーネントのコンフィギュレーションや組み合わせすべてをテストすることはできません。
パーソナル・スーパーコンピューターの構築において、なぜTesla製品が、一般コンシューマー向け製品よりも優れているのかという質問が数多く寄せられました。詳細は、ここをクリックしてご確認ください。
主要コンポーネントの最低限必要なスペック
これらの最小仕様は、「Teslaパーソナル・スーパーコンピューター」と呼べるシステムが欲しい方向けです。より少ないTesla GPU でワークステーションを構築することも可能です。
- 3x Tesla C1060
- Quad-core CPU: 2.33 GHz (Intel or AMD)
- 12 GB システムメモリ (各Tesla C1060に対して4GBのシステムメモリ)
- Linux 64-bit or Windows XP 64-bit
- 音響システム< 45 dBA
- 1200 W電源
4 Tesla C1060システムコンフィギュレーションの例
構築用として提案されたコンポーネントのリスト。メモリ、CPU,電源、ケースなど、リスト内の多くのコンポーネントは適切な相当物および適当なコンポーネントで代用が可能です。当社ではPSC用のコンポーネントは一切保証しておらず、それらに関しては構築者の責任とします。
4 Tesla C1060コンフィギュレーション
| |
| Tyan S7025 |
| 4x PCI-e x16 Gen2スロット |
| 4x Tesla C1060 |
| オンボードグラフィックス(Linuxで動くものの場合、Windowsでは、PCI-eスロットの1つにNVIDIA GPUが必要です |
| デュアルソケットIntel Xeon Nehalem |
| 24 GB (6x 4GB) DDR3 DIMMs (マザーボードは最大64 GB) |
| Coolmax CUQ-1350B 1350W |
| Lian Li PC-P80 |
| 640 GB |
| マルチDVDドライブ |
| Intel Xeon用 |
プレビルトSuperMicro SuperServer 7046GT-TRF
4 GPUシステム、デュアルソケットNehalem、最大96 GBメモリ
3枚のTesla構成 + 1枚のQuadro FX5800
マザーボード
Tesla C1060コンピューティングプロセッサは、dual-wide PCI-e x16 Gen2ボードです。Gen 1 PCI-e x16スロットにも対応しますが、CPUとGPU間のシステムの低帯域幅を招き、アプリケーションのパフォーマンスに影響を及ぼすことがあります(アプリケーションによる)。
そこで、互いに離れたデュアルスロットのPCI-e x16スロットを3または4スロット備えたマザーボードを使用しなければいけません。
CPUs
CPUの選択は、使用するマザーボードにより決まります。少なくとも、次のような2.33 GHz quad-core CPUを使用することをお勧めします。
- Intel Xeon または Core i7 quad-core
- AMD Phenom または Opteron quad-core
システムメモリ
「Tesla C2050」は、それぞれ4GBのGPUメモリを備えているため、「Tesla C2050」1基あたり、少なくとも3GB、出来れば3GBのシステムメモリを推奨します。ですから、3X「Tesla C2050」システムには少なくとも12GBのシステムメモリ、4X「Tesla C2050」システムには少なくとも16GBのシステムメモリを用いてください。
電源
電源については、いくつか選択肢があります。少なくとも1350ワットの良質な電源を選択してください。例えば、「Coolmax CUQ-1350B 1350W」などです。各「Tesla C2050」に6ピン1つと8ピン1つを持たせることを推奨しますが、「Coolmax CUQ-1350B」などの電源は、2つの6ピン電源コネクタで充分な負荷を与えることができます。電源を選択する際に、仕様を理解しておくことがとても重要です。
ハードドライブ、DVD、その他のコンポーネント
ハードドライブやDVDドライブの選択は、あなたにゆだねられています。一般的に、少なくとも160GBのハードドライブが備えられていればベストです。
コンピュータケース/筐体
ケース/筐体の選択は重要です。というのも、Tesla C1060プロセッサボード4機をプラグインする時、8スロット備えたケースが必要となります。
8スロット備えた、市販されている既製のケースは次のとおりです。
- ABS Canyon 695
- Ashinne ASR405
- Chenbro RM41300G
- Lian-Li PC-P80
- ThermalTake ArmorPlus
dual-wide GPUボード4機に合わせ、余分な8番目のスロットをカットして、7スロットの筐体にすることもできるかもしれません。自己責任でやってみてください。
クーリングシステム
(Lian-Liのような)システムケースには、独自のシステムファンが付いています。Teslaボード側で空気を吹きつけるように、少なくともケースファンがひとつ備えられている(つまり、マザーボードに空気を直接吹きつける)ものを、一般的にお勧めしています。ケース内の空気を45℃以下に保つことがポイントです。
作動システム
この高メモリ、ハイパフォーマンスシステムが最高に作動するために、Linux 64-bitまたはWindow XP 64-bitのどちらかをお勧めします。Win7を使いたいと言う方は、最高のCUDAパフォーマンスを提供するNVIDIAのTCCドライバをお勧めします。TCCドライバは、Tesla製品ファミリーのみに対応します。最新のTCCドライバは、「
nvidia.co.jp」の通常のドライバをダウンロードするページで見つけることがます。古いTCCドライバについては、下記から探すことができます。:
http://www.nvidia.co.jp/object/tesla-win7-64bit-259.03-whql-driver-jp.html。「リリース・ハイライト」を読み、TCCドライバで何がサポート外になるかを必ず確認しておいてください。
システム評価
システムを組み立て、それにオペレーティングシステムをインストールしたら、CUDAドライバ、CUDAツールキット、さらにオプションでCUDA SDK用例を、
CUDA Zoneからダウンロードしてください。
CUDAドライバ、ツールキット、及びSDK用例をダウンロード後、CUDA SDKから、次のコマンドを実行してください。
- deviceQuery
- これは、システム内のTesla GPUの数を報告します。
- bandwidthTest --memory=pinned --device=N
- システム内の4機の C1060、N=0, 1, 2, 3の各C1060に対し、実行してください。
- これは、CPUから/CPUへのPCI-E帯域幅、さらに各GPUを報告します。
- PCI-E x16 Gen2最大帯域幅は、5及び6 GBytes/secの間です。PCI-E x16 Gen1及びPCI-E x8 Gen2は、そのおよそ半分です。
- nbody --benchmark --n=131072 --device=N
- システム内のTesla GPUと同インスタンス数、同時に実行してください。
- つまり、4機のTesla C1060sには、N=0,1,2,3で同時に4インスタンス実行します。
- これは、Tesla GPU全体でnbodyプログラム実行します。
DGEMM burn-in test を使用し、ご自身の設定の安定性をテストしてください。
問題点/疑問点を報告
NVIDIAは、Tesla Personal Supercomputerを構築する個人を直接サポートしませんが、CUDA forums を使用して、他のCUDAディベロッパに、このようなシステムを構築した際の経験について質問することをお勧めしています。
Tesla C1060について、もっと知ってください
あなたのTesla Personal Supercomputerの写真を送ってください。PSCのギャラリのここに飾ります。