Jump to content 日本-日本語

製品  >  ソフトウェア  >  HP-UX  >  Knowledge-on-Demand

LinuxかHP-UX、あなたはどっち?
〜潜むリスクを完全比較、適材適所のOS選択 〜

第3回 障害発生時における迅速な切り分けを比較
HP-UX/Integrityサーバー お問い合せ
コンテンツに進む
連載 “LinuxかHP-UX、あなたはどっち? 第3回 障害発生時における迅速な切り分けを比較
事業の根幹に関わる重要なミッションクリティカル・システムには、決してシステムを止めることにない可用性が求められる。 高可用性を実現するためにシステムを冗長化・多重化することも重要だが、どんなに堅牢なシステムを構築したとしても、障害発生のリスクをゼロにすることは不可能だ。 しかし、たとえ障害発生のリスクをゼロにできなくても、障害発生の根本原因を即座に発見・特定できれば、障害発生によるダウンタイムの短縮に大きく寄与することになり、再発というリスクも防止できる。 今回は、障害発生時において迅速な切り分けを実現するHP-UX/Integrityサーバーの優位性を解説する。
第3回 障害発生時における迅速な切り分けを比較
具体的な事例に見る復旧までの時間の差:ハードウェアダンプ機能の有効性を示すHP-UX
システムがサポートするイベントトレーサビリティにおけるHP-UXとLinuxの比較
根本原因の究明こそが再発防止を含めた障害対応
Twitterでフォローする - 日本ヒューレット・パッカード外のウェブサイトへ Twitterでつぶやく
2010年11月
大神企画 富樫 純一
  ページ:  戻る   |   1   2

具体的な事例に見る復旧までの時間の差:ハードウェアダンプ機能の有効性を示すHP-UX

ハードウェアダンプ機能の有効性を理解するために、ここで具体的な障害事例を想定して解説してみよう。

HAクラスター構成により冗長化されたHP-UX/Integrityサーバーがある。稼働系システムに何らかの障害が発生してシステムがダウンし、業務サービスは待機系システムにフェイルオーバーした。

このとき、HP-UXのシステム運用管理担当者は、リモートから障害の原因を調査し、稼働系システムのNVRAMに残されたハードウェアダンプファイルを参照する。そして、ログにより以下のような記載を確認した。

HP-UXでの対応例
図3:HP-UXでの対応例

これにより、CPUへの電源供給が絶たれたことが、障害の原因と特定できた。該当するコンポーネントを交換してシステムを再起動し、業務を復帰させることが可能になった。ハードウェアダンプが記録されていたために、障害発生時の切り分けが容易になり、原因を明確にできたとともに、短時間のうちに正常なシステムへと復旧することが可能だった。

一方、Linux/x86サーバーではどうだろうか。同様に、HAクラスター構成により冗長化されたLinux/x86サーバーがあり、稼働系システムに障害が発生してシステムがダウンして業務サービスが待機系システムにフェイルオーバーしたとしよう。

Linuxのシステム運用管理担当者は、リモートから障害の原因調査を開始し、システムログを確認してみる。しかし、「予期せぬエラー」によりシステムダウンが発生したという限定的な情報しか得られないケースもある。

そこでシステム運用管理担当者は、データセンターに設置されている該当のサーバーの場所まで足を運び、原因究明にあたる。目視をして確認しても異常が発見できないため、限られたシステムログしかない場合では原因がハードウェアにあるのか、ソフトウェアにあるのか切り分けられない。そこで、システムボードの交換、CPUモジュールの交換、メモリモジュールの交換、I/Oバックプレーンの交換などを見込みで試してみる。一つずつ交換しながら原因究明にあたると時間がかかるので、原因になりそうなコンポーネント・モジュールをまとめて交換し、明確な原因を特定できないまま応急処置的に復旧させた。

これにより、とりあえず障害発生前の状況に戻すことは可能だろう。しかし、根本原因が特定されていなければ、再び同じ障害・エラーに見舞われるリスクを完全に払拭することはできない。故障していないコンポーネント・モジュールを交換することにより、本来は必要のないコストをかけることにもなりかねない。業務システムを利用するユーザー部門も「本当にハードウェアの問題だったのだろうか。ソフトウェアには原因がないのだろうか。また同じエラーが発生して業務を止めることにならないだろうか」といった不安や懸念を抱えたままになる。そして、同じ障害・エラーが繰り返されれば、システム運用管理担当部門への信頼が失墜することになる。

この事例から、ハードウェアが独自に取得するログによって障害発生時の切り分けが可能なHP-UX/Integrityサーバーに優位性があることは明らかだ。冗長化構成にし、決して停めたくないミッションクリティカル・システムならばなおさらのこと、HP-UX/Integrityサーバーを選択すべきだろう。

システムがサポートするイベントトレーサビリティにおけるHP-UXとLinuxの比較

ここまでは、HP-UX/Integrityサーバーに搭載されたハードウェアダンプ収集機能により、ハードウェアイベントに関するトレーサビリティに優れていることを紹介した。 次にHP-UX、とLinuxの、イベントトレーサビリティを実現するさまざまなモニタリングツール、およびログファイルについて比較してみよう。

まずHP-UXでは、修正可能なメモリエラーや物理ディスク障害など、ハードウェアに関連するイベントのトレーサビリティを実現するツールとして「HP EMS(Event Monitoring Service)」や「System Fault Management(SFM)」を用意している。これらは障害監視の為のフレームワークで、ハードウエアで発生する障害だけでなくOSやミドルウエアで発生する障害も検知しsyslog等をつかって通知することが可能だ。 また、システム運用管理ツールの「HP SMH(System Management Homepage)」、CPUやメモリの利用率といった性能に関するイベントには、パフォーマンスの監視、診断をリアルタイムで行う「HP GlancePlus」が用意されており、psやtop、vmstat、iostatなどのコマンド/ツールだけでは入手困難なパフォーマンス情報を入手できる。

EMS Event Descriptions
SFM: Event Descriptions

イベント・ディスクリプション:多くのイベントの種類が設定されている
図4:イベント・ディスクリプション:多くのイベントの種類が設定されている

これに対し、Linux/x86サーバーも、ハードウェアダンプ機能を除けば、さまざまなツールによってイベントのトレーサビリティが可能になっている。[rsyslog]や「syslog-ng」のような先進的な機能を実装している他、「procfs」等を使えばパフォーマンス情報のみならずカーネル内の情報を簡単に入手することも可能だ。また、「HP GlancePlus」のLinux版も用意しており、様々な情報収集が可能となっている。

HP-UX/IntegrityサーバーとLinux/x86サーバーの違いは、ツールを開発したベンダーが直接サポートしているか否かというところにある。HP-UX用の各種ツールは、開発者であるHP自身がHP-UXの標準またはオプション機能として提供しているものであり、すべてがサポート対象範囲になる。しかし、オープンソースのLinuxの場合、SIベンダーかディストリビューターとサポート契約を結び、ツールのサポートもその範囲に含める必要がある。また、ツールの開発が終息を迎えたら、自己責任で最新バージョンにアップデートしなければならない。その点、HP-UXはOSのサポート範囲内で、すべてのアップデートに対応する。ツールを使う安心感は、設計・開発元による一貫したベンダーサポートという意味では当然のことながらHP-UXのほうが優位になる。

ちなみに、HPの場合、Linux向けの管理ツールを簡単に導入・更新できるようにするためのソフトウェアパッケージ「PSP(ProLiant Support Pack)」が無償で提供されている。

根本原因の究明こそが再発防止を含めた障害対応

障害発生が避けられないものであれば、少なくとも同じ障害の再発を防止するために、根本原因の究明は欠かせない。しかし、発生原因のヒントがなければ、究明するまでに膨大な時間がかかるものだ。

今回紹介したように、ハードウェアダンプ機能を搭載したHP-UX/Integrityサーバーならば、原因の発見・特定にかかる時間を最小化することができる。障害を起こさない、障害が発生しても業務が停止しないように冗長化するといったシステム上の対策も重要だが、障害発生原因を切り分けられることも可用性を高めるためには非常に重要なのだ。

連載記事一覧 戻る ページ: 1   2  

  このページのトップへ戻る

Twitterでつぶやく「LinuxかHP-UX、あなたはどっち?」
〜適材適所のOS選択、ミッションクリティカル・システムに最適なプラットフォームは?〜

本特集記事を読んだ方は話題のTwitterを使って、ぜひあなたのお声を聞かせて下さい。

ミッションクリティカル・システムにはLinux

ミッションクリティカル・システムにはLinux
Linuxを選ぶ方は、以下の「投稿する」ボタンをクリックしてください。
ハッシュタグは「#ChoiceLinux」!

ミッションクリティカル・システムにはHP-UX

ミッションクリティカル・システムにはHP-UX
HP-UXを選ぶ方は、以下の「投稿する」ボタンをクリックしてください。
ハッシュタグは「#ChoiceHPUX」!
※Twitterアカウントをお持ちでない方はこちらから登録して下さい。
※記載されているハッシュタグ(Linuxの場合は#ChoiceLinux、HP-UXの場合は#ChoiceHPUX)は消さないでください。

Twitterでフォローする - 日本ヒューレット・パッカード外のウェブサイトへ Twitterでフォロー

お問い合わせ

ご購入前のお問い合わせ


ご購入後のお問い合わせ

HPEサポートセンター
製品の標準保証でご利用いただける無償のサービスです。

ショールーム

ショールーム 導入をご検討のお客様へ
業務アプリケーションの継続・標準化・開発性とシステム担当者様、システム開発者様が抱える悩み・疑問に対する解決策実体験して頂けます。
印刷用画面へ
プライバシー ご利用条件・免責事項