Jump to content 日本-日本語
≫  お問い合わせ

製品とサービス  >  HP ProLiant サーバ  >  技術情報  >  White Paper

whitepaper

技術資料

HP ProLiant サーバ

目次

概要
  AMD Opteron™ プロセッサアーキテクチャ
  HP ProLiant DL585のアーキテクチャ概要
  スケーラビリティの結果
  結論 / 関連情報 / コメント送信のお願い

PDFファイル ダウンロード

このホワイトペーパーのPDFファイルをこちらからダウンロードしてご覧下さい。
(PDFファイル、488KB)
コンテンツに進む

HP ProLiant DL585プラットフォームにおけるAMD Opteron™ プロセッサのスケーラビリティとパフォーマンス

スケーラビリティの結果

 
HPは、HP ProLiant DL585システムが多様なサーバ環境でどのように拡張できるかを示すために、いくつかの代表的な分野についてテストを実行しました。テストには、エンタープライズ リソース プランニング アプリケーション(SAP® ソリューション等)、メッセージング(MMB3)、サーバベースコンピューティング、CPU処理(SPEC)、およびオンライントランザクション処理があります。
 

プロセッサの追加

ここでは、プロセッサを追加した場合の効果を示す3つのテストの結果を説明します。具体的には、Two-tier SAP Sales and Distribution(SD)標準アプリケーション作業負荷、サーバベースコンピューティング(SBC)作業負荷、およびSPEC CPU 2000作業負荷です。

【SAP】
SAP SD作業負荷は、エンタープライズ リソース プランニングなどのアプリケーションを表したものです。テストは、どちらかといえばプロセッサおよびメモリ集中型で、I/O集中型ではありません。

テストで使用されたHP ProLiant DL585システムには4つのプロセッサボードが含まれています。3つ以下のプロセッサのパフォーマンスを調べるために、エンジニアはオペレーティングシステム(Microsoft® Windows® Server 2003 Enterprise Edition)を使用してシステムで1、2、または3つのプロセッサのみを使用するように制限しました。テストは、合計で16GBのPC2100メモリを搭載した2.2GHzプロセッサを使用して実行されました。各テストでは、使われているプロセッサが1つか4つかに関わらず、16GBメモリを使用しました。それぞれの事例でNUMAメモリ構成を使用し4 、バンクインタリーブが使用可能でした。

プロセッサ数を2倍にすると、このSAP作業負荷のパフォーマンスは比例して増大しました。4-Wayシステムは、2-Wayシステムに比べてパフォーマンスが88パーセント高くなり、2-Wayシステムは単一プロセッサシステムに比べて85パーセント高くなりました。2.4GHzプロセッサを使用すると、同じようなすばらしいスケーラビリティが実現します。この結果は、CPUバウンドアプリケーションでHP ProLiant DL585がほぼ完璧なリニアスケーリングを実現していて、それがAMD Opteron™ プロセッサの統合メモリコントローラと低レイテンシのインターコネクトによるものであることを示しています。

図3. SAP SD作業負荷を使用した1、2および4プロセッサでのプロセッサスケーリング
(2.2GHzプロセッサ、16GB PC2100メモリ)
SAP SD作業負荷を使用した1、2および4プロセッサでのプロセッサスケーリング<br>
      (2.2GHzプロセッサ、16GB PC2100メモリ)

【サーバベースコンピューティング】
SBC環境でサポートされる最適ユーザー数を判断するために、4 GBのPC2100メモリを搭載した4P HP ProLiant DL585サーバを使用してMicrosoft® Windows® Server 2003 Enterprise EditionとMicrosoft® Office XPを実行しました。図4に、テスト環境を示します。すべての常駐クライアントアプリケーションは、ターミナルサービスを実行しているHP ProLiant DL585サーバ上に常駐しており、サーバ上で実行されました。

図4. SBCテスト環境
SBCテスト環境

2つのプロセッサを使用したテストと4つのプロセッサを使用したテストを実行しました。各テストでは、プロセッサボード間で4GBのメモリを均等に共有しました。2つのプロセッサのみを使用したテストでは、プロセッサボード3および4は物理的に分離されていて、ソフトウェアを使用してプロセッサを制限していません。

ターミナルサービス環境では、プロセッサ数を2倍にするとサーバがサポートできる「ヘビー」ユーザーが57パーセント増加しました(図5)。詳細なテスト結果で言及しているように、 5ターミナルサービスのシステムパフォーマンスを最適化するには、十分なメモリが必要不可欠になります。64ビット版Windows® Server 2003のリリース時には、HP ProLiant DL585サーバは4GBの物理メモリに直接アドレス指定できるようになります。これによって、HP ProLiant DL585サーバのパフォーマンスが大幅に増強されることになるはずです。

図5. HP ProLiant DL585サーバは、SBC環境でプロセッサの数を2倍にすると
パフォーマンスが50パーセント以上向上
ProLiant DL585サーバは、SBC環境でプロセッサの数を2倍にするとパフォーマンスが50パーセント以上向上

【SPEC CPU 2000】
SPEC CPU 2000テスト6 は、整数コンポーネント(CINT2000 このリンクをクリックすると、HP社外へリンクします。 ) (英語)および浮動小数点コンポーネント(CFP2000 このリンクをクリックすると、HP社外へリンクします。) (英語)を含むCPU集中型のベンチマークセットです。テストされたすべてのモジュールでは、SuSE Linux Enterprise Server 8 for AMD64 SP3のオペレーティングシステムを実行しました。2-Wayシステムから4-Wayシステムへ変換するのに、プロセッサボードが物理的に追加されました。ノード毎のメモリ総数は、PC2700メモリで8GBと一定でした。SPECテストを使用した今までの調査では、メモリ総数がベンチマークスコア全体にそれほど影響しませんでした7 。従って、このテストはプロセッサ数を増やした場合の影響を評価するのに使用できます。

図6は、2-Wayから4-Wayシステムへ移行するとパフォーマンスが約87パーセント向上することを示しています。これは、SAP作業負荷の結果ですでに説明した、プロセッサ数を2倍にするとパフォーマンスが88パーセント改善したという内容と一致します。

図6. HP ProLiant DL585システムのプロセッサ数を増やした場合の
SPECint rate base 2000およびSPECfp rate base 2000の結果
 ProLiant DL585システムのプロセッサ数を増やした場合のSPECint rate base 2000およびSPECfp rate base 2000の結果

4 NUMAメモリ構成は、約6パーセントパフォーマンスを向上させるので、すべてのSAPテストで使用されました。ノードインタリーブは無効でした。
  5 資料『◆◆Scalability and performance of HP ProLiant DL585 servers with AMD Opteron™ Model 848 (2.2 GHz/1 MB) processors in an SBC environment◆◆』はhttp://h71019.www7.hp.com/ActiveAnswers/cache/70281-0-0-0-121.aspx にあります。
  6 SPEC CPU 2000テストの関連情報については、www.spec.org/cpu2000/ このリンクをクリックすると、HP社外へリンクします。 (英語)を参照してください。
  7 メモリ総数が最小メモリ総数よりも大きい(たとえば1GBや2GBなど)場合は、このようになります。

プロセッサ周波数の向上

2-Tier SAP SD作業負荷およびMicrosoft® Exchange MAPI Messaging Benchmark (MMB3)の2つのテストで、プロセッサ周波数の増加の影響を示しています。

【SAP】
このグループのSAPテストでは、HP ProLiant DL585サーバに2.2GHzまたは2.4GHzのプロセッサボードが4つ含まれていて、合計16GBのメモリを使用しています。正規化した結果では、プロセッサ周波数が9パーセント向上するとパフォーマンスが6パーセント向上したことがわかります(図7)。つまり、このアーキテクチャでは周波数が向上すると60パーセント以上のスケーラビリティが実現します。

図7. プロセッサ周波数が9パーセント向上すると SAP SD作業負荷を
使用した パフォーマンスが6パーセント向上
プロセッサ周波数が9パーセント向上するとSAP SD作業負荷を使用したパフォーマンスが6パーセント向上

【MMB3】
Microsoft®では、一般的な企業の環境における単一サーバのメッセージングスループットを測定するために、MMB3作業負荷を設計しました(プロファイルはMedium LoadSim Userと呼ばれています)。8 HPでは、MMB3結果を4-Way HP ProLiant DL585サーバで測定し、最初に2.2GHzプロセッサを使用し次に2.4GHzプロセッサを使用しました。いずれの構成でもMicrosoft® Windows® Server 2003 Enterprise EditionおよびMicrosoft® Exchange Server 2003 SP1を使用し、メモリは4GBで、秒あたりのメッセージ数は同一(6000 MMB3)です。

図8で示しているように、プロセッサ周波数が向上するとCPUの利用率が52パーセントから48パーセントに低下し、CPUの利用率が7パーセント変化しました。プロセッサ周波数の向上による変化は9パーセントのみだったので、このことは、統合メモリコントローラを搭載して外部フロントサイドバスを省いたことが、Micorosoft® Exchangeなどのメモリの影響を受けやすいアプリケーションのパフォーマンス面で大きなメリットとなっていることを示しています。

このテストでは32ビットWindows®が直接アドレス指定できる4GBのRAMに制限されていたので、今後64ビット拡張を使用し、より大きなメモリサイズに直接アドレス指定ができるようになると、さらにパフォーマンス面の恩恵を受けることが期待されます。

図8. MMB3ベンチマークでは、CPU周波数が9パーセント向上すると、
それに比例してCPUの利用率が7パーセント低下(CPU利用率は低い方がよい)
MMB3ベンチマークでは、CPU周波数が9パーセント向上すると、それに比例してCPUの利用率が7パーセント低下

8 MMB3の関連情報については、Microsoft® Webサイト(www.microsoft.com/exchange/evaluation/
performance/mmb3.mspx
このリンクをクリックすると、HP社外へリンクします。 (英語))にあります。

メモリの追加

一般的なオンライントランザクション処理(OLTP)負荷と4-Way HP ProLiant DL585サーバを使用していくつかのテストを行いました。OLTPベンチマークは、顧客履歴、嗜好、クレジットカード情報、保管番号、保管在庫などを大規模なデータベースから引き出してくるオンライン発注システムなどのシステムに相当するものです。システム構成は以下の通りです。
  • Microsoft® Windows® Server 2003, Enterprise Edition SP1
  • 2.4GHzプロセッサ×4
  • メモリ構成は、8、12、16、24、32、48、および64GBでPC2100とPC2700メモリを使用(PC2100は48GBまで)
  • ノードインタリーブはすべての状況で有効
  • バンクインタリーブは、16GB、32GB、および64GB構成で使用可能
  • 4つのプロセッサボードで均一にメモリを割り当て
図9は、8GBのメモリを使用するベースラインシステム構成に比べてパフォーマンスが改善していることを示しています。システムメモリが2倍になると、パフォーマンスはそれに比例して向上しています。PC2700メモリはPC2100よりも高速なため、予想通りPC2700メモリを追加した場合の方がパフォーマンスの向上幅がわずかながら大きくなります。

図9.メモリ容量の増加に比例したOLTPパフォーマンスの向上
メモリ容量の増加に比例したOLTPパフォーマンスの向上
*バンクインタリーブは16GB、32GB、および64GB構成で使用可能です。

これらのOLTPテストでは、4-Wayシステムにメモリを追加すると、追加するメモリの量に応じてパフォーマンスが50パーセント向上することを示しています。バンクインタリーブの効果については、このテスト条件ではパフォーマンスへの影響はそれほど見られませんでした。

メモリ速度の向上

同じOLTPテスト構成を使用して、PC2700とPC2100メモリのパフォーマンスの違いを調べることができます。図10は、PC2700メモリの相対パフォーマンスがPC2100メモリを超えることを示しています。PC2700メモリは平均で約2.25パーセント向上します。このテストを8GBおよび12GB構成で行ったときは、I/Oサブシステムが過負荷になりプロセッサがI/O要求で待機していました。この場合、プロセッサの能力が100パーセント活かされません。16GBのメモリでは、I/Oとプロセッサとの差異が釣り合うようになり、24GBのメモリでそれが大幅に改善されます。8GBおよび12GB構成を割り引いて考えた場合、PC2700メモリを使用するとパフォーマンスは平均して2.9パーセント向上します。

図10.OLTP作業負荷を使用した場合のPC2700メモリの相対パフォーマンス
OLTP作業負荷を使用した場合のPC2700メモリの相対パフォーマンス

これは、PC2700を使用した場合PC2100メモリと比較してパフォーマンスが2.9パーセント改善したSAPテストと同じような結果になりました(図11)。SAPテストでは、4-Wayの2.4GHzシステムを使用し、メモリは12GBのPC2100または12GBのPC2700でした。いずれの場合もバンクインタリーブは使用していません。

図11.SAPテスト結果での高速メモリの効果
SAPテスト結果での高速メモリの効果

前のページへ 次のページへ
PDFファイルをご覧いただくには、Adobe® Reader® が必要です。
アドビシステムズ社のウェブサイト より、ダウンロード(無料)の上ご覧ください。
印刷用画面へ印刷用画面へ
プライバシー ご利用条件・免責事項