8コアXeon×4+Tesla搭載 超高性能パソコン 性能評価レポート
お客さまより計算・分析用PCとして製作のご依頼をいただいた、 8コアXeon×4やGPGPUを搭載する超高性能パソコンについて 性能評価を行いましたのでご紹介します。
主な仕様
OS | Microsoft Windows Server 2012 Standard |
チップセット | Intel C602 |
CPU | Intel Xeon E5-4650 2.70GHz(TB 3.30GHz) x4 合計32コア |
メモリ | 合計256GB DDR3-1600 PC3-12800 ECC Registered 16GB x16 |
SSD | 512GB S-ATA 6Gb/s MLC 2.5” Plextor M5 Proシリーズ x4(RAID 0:2TB) |
HDD | 4TB S-ATA 7200rpm 3.5” |
CD/DVD | DVDスーパーマルチドライブ |
GPU | nVidia Quadro 6000 6GB PCI-E DVI-I x1 / DisplayPort x2 |
GPGPU | nVidia Tesla K20 PCI-E |
筐体 | タワー 1400W |
外形寸法 | 幅178x高さ462x奥行x721(mm) |
より詳細な仕様についてはこちらをご覧下さい:
8コアXeon×4 + Tesla搭載 計算・分析用超高性能マシン
マシン概観
超高性能なXeonを4個搭載しているため、大型のヒートシンク、多数の冷却ファン…と、熱対策に重点を置いた設計をしています。
また、下部にはQuadro 6000とTesla K20を搭載しています。3DCG等の描画はQuadroに、数値計算はTeslaにと分業化しています。
まずはGPGPUの計算性能を測定するため、ベンチマークテストとして「nVidia CUDA N-Body」を走らせたところ、Tesla K20は[448.6GFLOPS]という数字が出ました。Tesla C1060では[443.4GFLOPS]、GeForce 8800 GTSでは[202.1GFLOPS]、Quadro FX 570Mでは[42.5 GFLOPS]ですので、ボード単体ではほぼ最高性能です。
さらにQuadroの3D描画性能を測定するため、「CINEBENCH」でQuadro6000のOpenGL測定をしたところ、69.78fpsとなりCINEBENCHに最初からプリセットされている測定データとの比較ランキングでは1位を記録しました。ATI FirePro V8750の約1.4倍、Quadro FX 5800の1.5倍で、旧世代のQuadroより高速化されているのがわかります。
ストレージについては「CrystalDiskMark」にて測定を行ないましたが、4台でRAID 0を構築することにより、SSD単体での測定値(代理店によるもの)と比較して、以下のようになりました。
Read | Write | |
シーケンシャル | 約4.8倍 | 約2.4倍 |
ランダム512KB | 約5.3倍 | 約2倍 |
ランダム4KB | 約2.2倍 | 約0.5倍 |
ランダム4KB QD32 | 約1.2倍 | 約0.7倍 |
読込速度は飛躍的に向上しましたが、ランダム4KBや書込速度はあまり伸びませんでした。RAIDコントローラによって差が出てきますので、オンボードRAIDですと、この程度が限界のようです。それでも、秒間GB単位での書込速度ですので、HDDと比べると10倍近い差になります。読込みにしても書込みにしても、明らかな速度を体感できます。
まとめ
CPUのコア数、クロック、メモリ容量・帯域、GPUの描画性能、GPGPUの計算性能、ストレージの読込・書込速度、いずれを取っても一級品のマシンです。よほどのことがない限りはこれで能力が足らない…とはなりませんので、演算にしてもレスポンスにしても、ご満足いただけると思います。
(技術部:伊藤)
※今回検証したマシンの詳細は以下のページに掲載しております。
8コアXeon×4 + Tesla搭載 計算・分析用超高性能マシン