8コアXeon×4+Tesla搭載 超高性能パソコン 性能評価レポート

お客さまより計算・分析用PCとして製作のご依頼をいただいた、 8コアXeon×4やGPGPUを搭載する超高性能パソコンについて 性能評価を行いましたのでご紹介します。

 

主な仕様

OS  Microsoft Windows Server 2012 Standard
チップセット  Intel C602
CPU  Intel Xeon E5-4650 2.70GHz(TB 3.30GHz) x4 合計32コア
メモリ  合計256GB DDR3-1600 PC3-12800 ECC Registered 16GB x16
SSD  512GB S-ATA 6Gb/s MLC 2.5”
Plextor M5 Proシリーズ x4(RAID 0:2TB)
HDD  4TB S-ATA 7200rpm 3.5”
CD/DVD  DVDスーパーマルチドライブ
GPU  nVidia Quadro 6000 6GB PCI-E DVI-I x1 / DisplayPort x2
GPGPU  nVidia Tesla K20 PCI-E
筐体  タワー 1400W
外形寸法  幅178x高さ462x奥行x721(mm) 

より詳細な仕様についてはこちらをご覧下さい:
8コアXeon×4 + Tesla搭載 計算・分析用超高性能マシン

マシン概観

超高性能なXeonを4個搭載しているため、大型のヒートシンク、多数の冷却ファン…と、熱対策に重点を置いた設計をしています。
また、下部にはQuadro 6000とTesla K20を搭載しています。3DCG等の描画はQuadroに、数値計算はTeslaにと分業化しています。

 

まずはGPGPUの計算性能を測定するため、ベンチマークテストとして「nVidia CUDA N-Body」を走らせたところ、Tesla K20は[448.6GFLOPS]という数字が出ました。Tesla C1060では[443.4GFLOPS]、GeForce 8800 GTSでは[202.1GFLOPS]、Quadro FX 570Mでは[42.5 GFLOPS]ですので、ボード単体ではほぼ最高性能です。

 

さらにQuadroの3D描画性能を測定するため、「CINEBENCH」でQuadro6000のOpenGL測定をしたところ、69.78fpsとなりCINEBENCHに最初からプリセットされている測定データとの比較ランキングでは1位を記録しました。ATI FirePro V8750の約1.4倍、Quadro FX 5800の1.5倍で、旧世代のQuadroより高速化されているのがわかります。


 

ストレージについては「CrystalDiskMark」にて測定を行ないましたが、4台でRAID 0を構築することにより、SSD単体での測定値(代理店によるもの)と比較して、以下のようになりました。

  Read Write
 シーケンシャル  約4.8倍  約2.4倍
 ランダム512KB  約5.3倍  約2倍
 ランダム4KB  約2.2倍  約0.5倍
 ランダム4KB QD32  約1.2倍  約0.7倍

 

読込速度は飛躍的に向上しましたが、ランダム4KBや書込速度はあまり伸びませんでした。RAIDコントローラによって差が出てきますので、オンボードRAIDですと、この程度が限界のようです。それでも、秒間GB単位での書込速度ですので、HDDと比べると10倍近い差になります。読込みにしても書込みにしても、明らかな速度を体感できます。

 

そして、これだけの高性能となると当然のように消費電力も半端ではありません。電源はリダンダント(冗長構成)で1400Wが2つ搭載されておりますが、以前別の電源を使用した事例で、200V環境でないと1400W出力ができない(100V環境だと1200Wまで)ということがあったため、今回もお客様には200V環境でお使いいただくようお願いしております。MAX負荷時には1000Wを超える消費電力になるため、こういった高性能マシンを購入する際には電源環境も配慮する必要があります。
 
また、消費電力が高いということは、それにともなって高熱を発生するという問題も生じます。当初、CPUはパッシブヒートシンク(直接冷却ファンが付かないもの)で、筐体内部のファン4基とエアシュラウド(冷却風が拡散しないよう、通り道を矯正する機構)による冷却を想定していましたが、思うような効果を得られなかったため、アクティブヒートシンク(ファン付きヒートシンク)に変更して対応しました。(以下写真)
 
 
このマシンでは適切な冷却処理を施していますので、CPUのターボブースト機能も正常に動作します。メーカー公称値である3.30GHzの動作を確認することはできませんでしたが、3.24GHzまではリアルタイムで動作を確認することができました。4プロセッサ用CPUは、コア数が多い分クロックが低い、というのが今までの通例でしたが、E5-46xxシリーズではシングルコアのクロック面でも十分な速度が期待できます。
 

 

まとめ

CPUのコア数、クロック、メモリ容量・帯域、GPUの描画性能、GPGPUの計算性能、ストレージの読込・書込速度、いずれを取っても一級品のマシンです。よほどのことがない限りはこれで能力が足らない…とはなりませんので、演算にしてもレスポンスにしても、ご満足いただけると思います。

(技術部:伊藤)

 

※今回検証したマシンの詳細は以下のページに掲載しております。
8コアXeon×4 + Tesla搭載 計算・分析用超高性能マシン

このエントリーをはてなブックマークに追加