・総合窓口:
TEL . 03-6823-6789 ・サポート窓口: TEL . 03-5823-7422 |
Intel® Sandy Bridge Xeon® プロセッサのベンチマーク
はじめに
Intel® SandyBridgeでは、演算幅が従来の128bitから256bitに拡張されました。
256bitの演算幅で計算を行うには Intel® Composerで”-xAVX”オプションをつけてプログラムをリコンパイルする必要があります。
以下に示すベンチマークテスト結果は”-xAVX”オプションをつけてプログラムをリコンパイルして実行した時の値です。
ちなみに、HPLはCPU依存型のプログラム特性で、姫野ベンチマークテストはメモリバンド幅依存型のプログラム特性です。
”-xAVX”オプションを使うには6系(CentOS 6.2など)のOS環境が必要です。SandyBridgeは、5系OSでも動作します(弊社ではCentOS5.7で動作確認を行いました)が、”-xAVX”オプションは使えません。
但し、バイナリプログラムは5系(CentOS 5.7など)OS環境で動作します。
CPU依存型のHPLはまさにCPUの周波数性能そのものに依存するため、性能向上は見られませんでした。
メモリバンド幅依存の姫野ベンチマークテストは、かなりの性能向上を示しています。
お使いの計算プログラムがCPU依存型の場合、6系OS環境下で”-xAVX”オプションでプログラムをリコンパイルすれば性能向上が期待できそうです。
商用ソフトについては提供する ISVベンダーの対応如何によります。
お使いの計算プログラムがメモリバンド幅依存の場合、5系OS環境下でバイナリ形式で実行しても性能向上が期待できそうです。
SandyBridgeでは
メモリチャネルが3本から4本に増加した事、DDR3周波数帯域が1333MHzから1600MHzに増加した事が性能向上に寄与しているといえます。
弊社はお客様のプログラムをお預かりしてベンチマークテストを行います。詳しくはお問合せください。
■お問い合わせメールフォーム
HPL
HPLはチューニングが難しいが、ここではN=20000、NB=120での結果を示す。MPIはIntelMPI4.0を使用した。
結果(単位はGFLOPS)
![]() HPL(N=20000、NB=120)
E5シリーズはAVXオプションでビルドしたバイナリを用いている。
2way 単ノードで270GFLOPSに到達しており、5690と比較し、クロックは30%減だが、
パフォーマンスは50%以上の向上である。
HPLにおいては5472,5690はクロック比相当の違いであることがわかる。
姫野ベンチマーク
姫野ベンチマークはSIZE L Fortran77 MPI版を用いた。
結果(単位はMFLOPS)
![]() 姫野ベンチマークテスト(SIZE=L)
E5シリーズは8並列でサチっているものの、2way単ノードでは過去最高値を出している。
(これまでの2way 最高はOpteron 6000系で22000程度)FSB1600、DDR3 4チャンネルなどの効果と見られる。
動作環境
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||