Jump to content
日本-日本語

HP Integrity サーバー

 製品 
 サポート 
 ソリューション 

Superdome 2を徹底解剖

ミッションクリティカル・システムを第2世代へと導くその実像とは?

Content starts here
Superdome 2を徹底解剖
2010年4月27日、日本ヒューレット・パッカードは、今後の新しい時代を担うインフラとして生まれ変わったHPの第2世代フラグシップ・プラットフォーム、「HP Integrity Superdome 2(以下、Superdome 2)」を発表した。数千人規模のエンジニアを投入し6年という歳月を費やして完成させたフルモデルチェンジのSuperdome 2とは一体どのような製品なのか?次の10年を支える技術を結集させ実現した「ブレード時代の新しいSuperdome 2」の実像に迫ってみたい。
2010年5月
テクニカルライター
吉川 和巳

ページ:  戻る   |   1   2

「全停止障害は1000年に1回」を目標とした高信頼性※

Itaniumプロセッサー 9300番台プロセッサーからは、従来のフロント・サイド・バス(FSB)からインテル® QuickPath テクノロジー(QPI)に変更されている。HPはこのプラットフォームデザインをベースにチップセットを開発している。開発されたチップセットはHP sx3000と呼ばれ、メモリバッファーチップ、I/Oコントローラチップ、クロスバーチップの3種類で構成されている。インテルはメモリバッファーチップ、I/Oコントローラチップを提供しているが、8ソケット以上のスケールアップをするためのノードコントローラは各ベンダーが開発しなければならない。HPがノードコントローラ以外も自社開発にこだわった理由について白井氏は「HPが自社開発にこだわった理由は性能と信頼性の両方です。まず性能についてですが、メモリバッファーチップはインテル製よりも転送速度を若干速くし、I/OコントローラチップはPCI Expressのレーン数を多くしています。ノードコントローラ間の通信は最大でQPIのスペックの2倍から2.5倍の転送速度で転送可能で、さらにL4キャッシュをノードコントローラに搭載しています。信頼性については、クロスバーの活性交換を実現させるために自社で開発するチップセットが必須でした。」

やはり、このこだわりにはHPが長年基幹用途のサーバーを開発し続けてきたプラットフォーム・ベンダーとしての意地がみえる。

※ HP Integrity Superdome 2の複数パーティション(nPars)環境において筺体全停止を引き起こす可能性としてのMTBFの設計目標値は、1000年以上に設定されています(本情報は、設計目標値であり、保証するものではありません)。
Superdome 2のセルブレードとsx3000チップセット(青色部分)
図6:Superdome 2のセルブレードとsx3000チップセット(青色部分)

OSの機能なしでハードウェアを管理するSuperdome 2 OA

Superdome 2の設計で白井氏が今回もっとも強調したポイントは、統合管理アーキテクチャとして開発された「Superdome 2 Onboard Administrator(以下、Superdome 2 OA)」の存在である。「Superdome 2は高信頼性と高品質だけでなく、さらに安全性までを考慮したデザインにするためOSの機能なしでハードウェアを管理し報告するしくみの研究に取り組みました。その結果、Superdome 2内部で発生するイベント管理からHPサポート担当者へのイベント通知までが完結できる仕組みを開発しました。これがSuperdome 2 OAとアナリシスエンジンと呼ばれるファームウェアです。」
Superdome 2 OAを中心とする各種管理コンポーネント
図7:Superdome 2 OAを中心とする各種管理コンポーネント

Superdome 2 OAの説明の前に、まず、旧Superdomeのイベント管理について、確認の意味でも説明しよう。旧Superdomeのイベント管理は、システム系と環境系のそれぞれのイベントがそれぞれの専用記憶領域にログとして報告される。具体的には、システム系イベントはプロセッサーやメモリI/Oのエラーでプロセッサーとチップセットがハンドリングし記憶領域に報告、環境系イベントは温度、電源、ファンのエラーでMP(Management Processor)がハンドリングし専用の記録領域に報告する。その報告されたイベントはHP-UXにより定期的にチェックされ必要に応じてエラーハンドリングやイベント通知を行う。例えばDPRという機能はHPUXがイベントの閾値を管理しコアをディアクティベートさせている。イベント通知はHP-UX経由でSNMPトラップやEメールなどの方法により行われ、旧Superdomeから直接イベントを確認する方法はコマンドラインインターフェースしかなかった。ただし、これはHPが投資保護を優先させた結果、初期リリースから10年間このハードウェア障害管理方法を変更しなかったともいえる。

イベントのチャート図、旧Superdome(左)とSuperdome 2(右)
図8:イベントのチャート図、旧Superdome(左)とSuperdome 2(右)

一方、Superdome 2で採用されたSuperdome 2 OAは、エンクロージャー内部で発生した全てのイベントを一括管理しHP-UXを経由することなくHPカスタマセンターに直接通知までしてしまう仕組みだ。全てのイベントというのはSFW(System firmware)とMFW(Management Firmware)の2種類から報告されるイベントで、SFWはPAL、SAL、ブートプログラム、ACPIで、MFWはそれ以外のシステム系と環境系も含めたファームウェアになる。これらのイベントをアナリシスエンジンがハンドリングをする。例えばSuperdome 2ではDPRもアナリシスエンジンがイベントの閾値を管理しコアをディアクティベートする。イベント通知もアナリシスエンジンがHP-UXを経由することなく通知するのだ。

「ミッションクリティカル・クラウド」とは

Superdome 2はクラウドコンピューティングの考え方である「使った分だけ課金される購入形態」を採用している。「Superdome 2はソケットの数だけプロセッサーが搭載された状態で出荷されますが、ライセンスを購入されているプロセッサーのみご利用頂く方式を採用しています。この方式は「iCAP」と呼ばれる方式で追加のCPUリソースが必要になったときに物理的なプロセッサーリソースとしてオンライン追加(アクティベート)できることです。それだけでなくDPRによるコアが削除(ディアクティベート)された場合の代替えコアとして利用することも可能です。」(白井氏)

つまり、この「iCAP」を利用すれば導入時に想定していたCPUリソースで足りなくなった場合でも物理的な作業なくプロセッサーを追加することができる。また複数のパーティション間やサーバー間でもライセンスを移動させることでCPUリソースの貸し借りができる。さらにHP-UXのリソースマネージャを利用すれば自動でリソースの再配分を行うことも可能だ。別な見方をすればハードウェアの拡張性、高信頼性、高品質、安全性、高性能という全てを満たしているSuperdome 2だからこそ実現できる技術であり、これがミッションクリティカル・クラウドを支える技術ということになるのだろう。
iCAPによるクラウド型の購入形態
図9:iCAPによるクラウド型の購入形態

ここまで見てきたように、Superdome 2は、従来のミッションクリティカル・サーバーの堅牢性はそのままにしながら、ブレード世代、クラウド世代に中核となる“新しいミッションクリティカル・クラウド基盤”としての製品と言えるだろう。

※一部機能については、近い将来実装予定のものも含みます。
戻る ページ:  戻る   |   1   2

お問い合わせ

ご相談窓口

※機器のお見積については、代理店、または弊社営業にご相談下さい。

ご購入後のお問い合わせ

オンラインサポート
製品の標準保証でご利用いただける無償のサービスです。

ショールーム

ショールーム 導入をご検討のお客様へ
業務アプリケーションの継続・標準化・開発性とシステム担当者様、システム開発者様が抱える悩み・疑問に対する解決策実体験して頂けます。
このページのトップへ戻る