Jump to content 日本-日本語

製品  >  ソフトウェア  >  HP-UX   >  Knowledge-on-Demand  >  HAクラスターの教科書

HAクラスターの教科書
〜簡単!ライバルに差をつけるHP Serviceguard構築〜

第4日目:HAクラスターを構成する

HP-UX/Integrityサーバー お問い合せ
コンテンツに進む
第4日目:HAクラスターを構成する
前回は、共有ディスクのハードウェア構成を再確認し、共有ボリュームの作成を実施しました。いよいよ今回は、HP Serviceguardの設定作業にとりかかります。1時間目でHAクラスターのフェイルオーバーの仕組みをあらためて理解したのち、2時間目でクラスター構成ファイルの書き方を説明します。
HAクラスターの教科書応用編〜簡単!ライバルに差をつけるHP Serviceguard構築〜 4日目
フェイルオーバーの仕組みを知る
クラスター構成ファイルの作成
2008年11月
日本ヒューレット・パッカード株式会社
HAクラスターの教科書:登場人物紹介 このリンクをクリックすると、新しいウィンドウが開きます
石ノ上君:
先生、前回までの作業で、ハードウェアやネットワーク、共有ディスクの構成までできあがりました。
石ノ上君
ボブ先生
ボブ先生:
石ノ上君のHAクラスター構築も、いよいよ佳境に入った感じだね。今回はまずHP Serviceguardのフェイルオーバーの仕組みをおさらいして、その後で実際にクラスターの構成作業に入ろう。

今日の時間割 フェイルオーバーの仕組みを知る クラスター構成ファイルの作成 練習問題

1時間目:フェイルオーバーの仕組みを知る

Serviceguardのフェイルオーバー処理は、大きく分けて以下の3つの段階で構成されます。

  • 第1段階:障害の検知
  • 第2段階:クラスターの再構成
  • 第3段階:パッケージのリカバリ

フェイルオーバーの内訳
図1:フェイルオーバーの内訳

ここでは、これら3つの段階について動作メカニズムを説明します。

第1段階:障害の検知

「障害の検知」段階とは、ノード障害、ネットワーク障害、およびアプリケーション障害をHP Serviceguardが検出する段階です。これらの障害は、各ノードが数秒間隔で送信するハートビートパケットの喪失をはじめ、ネットワーク・インタフェース・カード(NIC)からのエラー、アプリケーション・プロセスのダウンやストレージのエラーといった事象をきっかけに検出されます。

石ノ上君:
なるほど、前々回で勉強したハートビートの仕組みによって、ノードの障害を検出するのですね。たとえば、プライマリ・ノードからセカンダリ・ノードへ届くハートビートが途絶えたら、HP Serviceguardがセカンダリ・ノード上でアプリケーションを起動してくれるわけですね。
石ノ上君
ボブ先生
ボブ先生:
いや、話はそう単純じゃないんだ。もしかすると、プライマリ・ノードは実はまだ稼働していて、プライマリ・ノードとセカンダリ・ノード間のネットワークがダウンしているだけかもしれない。もしそうなら、プライマリ・ノードとセカンダリ・ノードの両方でアプリケーションが重複して起動してしまい、最悪の場合はデータが破損することもある。このようにクラスターが分断された状態は「スプリット・ブレイン」と呼ばれていて、それを防ぐのが第2段階の「クラスターの再構成」なんだ。

第2段階:クラスターの再構成

第1段階で障害が検出されると、第2段階である「クラスターの再構成」が始まります。この段階では、以下の3つの手順を通じて、スプリット・ブレインを防ぎながらクラスターを構成し直します。

  • エレクション
  • クラスター・ロックの取得
  • クワイエセンス(待ち時間)

このうち「エレクション(election)」とは、3台以上のノードで構成されるクラスターにおいて、スプリット・ブレインを防ぐための手順です。エレクションでは、生き残ったノード(つまりお互いに通信が可能なノード)が集まってグループを形成します。そして、「ノード数がクラスター全体の半数を超えるグループ」が新しいクラスターを構成し、ほかのグループは動作を停止します。クラスターのノード数が偶数の場合、「過半数を超えるグループ」ができず、両方のグループが過半数になってしまうことがあります。たとえば全ノード数が4台のクラスターにて2台ずつがグループを構成した場合や、全ノード数が2台のクラスターのように過半数のグループになってしまう場合は、タイブレーカとして、次に説明するクラスター・ロックを用います。

一方、「クラスター・ロックの取得」とは、クラスターの外側に存在する第3者(クラスター・ロックと呼ばれる)が仲介してスプリット・ブレインを解消する手順です。HP Serviceguardでは、クラスター・ロックとして以下の2つの手段をサポートしています。

  • ロック・ディスク
  • クォーラム・サーバ

ロック・ディスクは、共有ディスクをクラスター・ロックとして用いる方法です。生き残ったノードが共有ディスク上の特定の領域に“早い者勝ち”でマークを付けることで、どのノードが新しいクラスターを構成するか決めます。

もうひとつのクォーラム・サーバ(Quorum Server)とは、クラスター以外のマシンで稼働する専用ソフトウェアです。各ノードが早い者勝ちでクォーラム・サーバにネットワーク経由でアクセスし、新しいクラスターを構成するノードを決定します。

クワイエセンスは残存ノードが正常に動作しているかどうかを決めるための待ち時間です。クワイエセンスの時間内にTOCが発生しなかったノードは正常に動作していると判断されます。

また、アプリケーションの障害の場合、プライマリ・サーバがダウンしているわけではないので、 第2段階で述べたクラスター再構成は行われず、スタンバイ・サーバ上で第3段階へと進みます。

詳しくは、以前の特集記事、「HAクラスターの疑問を解く・後編」をご参照下さい。

クォーラム・サーバの構成図
図2:クォーラム・サーバの構成図

石ノ上君:
ロック・ディスクは共有ディスクをそのままクラスター・ロックとして使えますが、クォーラム・サーバはわざわざ専用のサーバを稼働させる必要があるのですね。なにかメリットはあるのですか?
石ノ上君
ボブ先生
ボブ先生:
たしかに構成はロック・ディスクのほうがシンプルだね。でも、ロック・ディスクの方法では、クォーラム・サーバよりもクラスター・ロックの取得に時間を要してしまうんだ。クォーラム・サーバの方が早くクラスター・ロックを取得できるから、その分、フェイルオーバー時間が格段に短くなる。それに、クォーラム・サーバのソフトウェアはごく軽量だから、独立したサーバ・マシンを用意せずに管理サーバなどに間借りしても問題はないんだ。

第3段階:パッケージのリカバリ

第2段階においてクラスターの再構成が完了すると、新しいHAクラスターが形成されます。この上で、実際にアプリケーションの移動を行う第3段階「パッケージのリカバリ」が実施されます。これについて詳しくは次回説明します。

ワンポイントレッスン

クォーラム・サーバの設定

クォーラム・サーバはsoftware.hp.comから無償でダウンロード可能です。以下のような手順で簡単に設定可能です。

  1. swinstallコマンドを実行して、インストールします。
  2. /etc/cmcluster/qs_authfileの編集して、管理対象のクラスターノードを記述します。
    • serverA
    • serverB
  3. /etc/inittabの編集します。
    • 例)qs:345:respawn:/usr/lbin/qs >> /var/adm/qs/qs.log 2>&
  4. Quorum Serverのプロセスを起動します。
    • # init q

参考資料:
HA Simple Cluster構築手順 1.2 Quorumサーバの設計 3.1 Quorumサーバの構築
HP Serviceguard Quorum Server バージョン A.03.00 リリースノート

連載記事一覧 1  |  2 次のページへ

本ページの内容は執筆時の情報に基づいており、異なる場合があります。

お問い合わせ

ご購入前のお問い合わせ


ご購入後のお問い合わせ

オンラインサポート
製品の標準保証でご利用いただける無償のサービスです。

ショールーム

ショールーム 導入をご検討のお客様へ
業務アプリケーションの継続・標準化・開発性とシステム担当者様、システム開発者様が抱える悩み・疑問に対する解決策実体験して頂けます。
印刷用画面へ
プライバシー ご利用条件・免責事項