日本-日本語

製品  >  ソフトウェア  >  OpenVMS  >  マニュアル

OpenVMS マニュアル


HP OpenVMS
OpenVMS Cluster システム


目次 索引

付録C クラスタのトラブルシューティング



ここでは,以下のトラブルシューティング操作を実行するのに役立つ情報をまとめます。

  • コンピュータのブートまたはクラスタへの参加での障害

  • クラスタのハング

  • CLUEXIT バグチェック

  • ポート・デバイスの問題



C.1.1 予備チェックリスト

診断手順を開始する前に,以下の確認を行ってください。

  • すべてのクラスタ・ハードウェア・コンポーネントが正しく接続されており,正しく動作しているかどうか確認します。

  • 『OpenVMS Cluster Software Software Product Description (SPD 29.78.xx)』に指定されている要件に従って, OpenVMS Cluster コンピュータとマス・ストレージ・デバイスが構成されていることを確認します。

  • サテライトをクラスタに追加する場合は,『OpenVMS Cluster Software SPD』に指定されている要件に従って, LAN が構成されていることを確認しなければなりません。また, 第 4 章 で説明した手順に従って,ネットワークを正しく構成し,起動したかどうかも確認しなければなりません。

予備チェックを実行し,必要に応じて適切な処置を実行した後,コンピュータがまだブートできなかったり,クラスタに参加できない場合は, C.2C.3 項の手順に従って,障害からの回復を試みてください。

C.1.2 ブート・イベント・シーケンス

診断手順と回復手順を効果的に実行するには,コンピュータがブートし,クラスタに参加するときに,どのようなイベントが実行されるかを理解しておく必要があります。ここでは,これらのイベントの概要を示し,コンソールに表示される典型的なメッセージも示します。

発生するイベントは,コンピュータが新しいクラスタにブートされる最初のコンピュータであるのか,アクティブ・クラスタでブートされているのかに応じて異なります。また,一部のイベント (パスワードとグループ番号が格納されているクラスタ・データベースのロードなど) は,LAN あるいは IP を利用した OpenVMS Cluster システムでのみ発生します。

通常のイベント・シーケンスは 表 C-1 に示すとおりです。

表 C-1 ブート・イベント・シーケンス
手順 操作
1 コンピュータがブートする。コンピュータがサテライトの場合は,以下のようなメッセージに,サテライトをダウンライン・ロードした MOP サーバの名前と LAN アドレスが表示される。この時点で,サテライトは MOP サーバとの通信を完了しており, OpenVMS Cluster 通信機能を使用してシステム・ディスク・サーバとの通信を続行している。
%VAXcluster-I-SYSLOAD, system loaded from Node X...

ブート中のコンピュータに対して, OpenVMS "バナー・メッセージ" が以下の形式で表示される。
operating-system Version
n.n dd-mmm-yyyy hh:mm.ss

2 コンピュータがクラスタを作成するか,またはクラスタに参加しようとすると,以下のメッセージが表示される。
waiting to form or join an OpenVMS Cluster system

コンピュータが LAN ベースの OpenVMS Cluster のメンバである場合は,クラスタ・セキュリティ・データベース (クラスタ・パスワードとグループ番号が格納されている) がロードされる。必要に応じて,MSCP サーバと TMSCP サーバもロードできる。

%VAXcluster-I-LOADSECDB, loading the cluster security database

%MSCPLOAD-I-LOADMSCP, loading the MSCP disk server
%TMSCPLOAD-I-LOADTMSCP, loading the TMSCP tape server

コンピュータが IP ベースの OpenVMS Cluster のメンバである場合,クラスタ・セキュリティ・データベース,MSCP サーバおよび TMSCP サーバとともに, IP 構成ファイルもロードされる。

%VMScluster-I-LOADIPCICFG, loading the IP cluster configuration 
file

%VMScluster-S-LOADEDIPCICFG, Successfully loaded IP cluster configuration file

IP ベースのクラスタ通信のために IP インタフェースと TCP/IP サービスが有効にされる。マルチキャスト・アドレスおよびユニキャスト・アドレスが IP バス WE0 のリストに追加され,Hello パケットを送信します。

%PEA0, Configuration data for IP clusters found

%PEA0, IP Multicast enabled for cluster communication, Multicast address, 224.0.0.3
%PEA0, Cluster communication enabled on IP interface, WE0
%PEA0, Successfully initialized with TCP/IP services
%PEA0, Remote node Address, 16.138.185.68, added to unicast list of IP bus, WE0
%PEA0, Remote node Address, 15.146.235.222, added to unicast list of IP bus, WE0
%PEA0, Remote node Address, 15.146.239.192, added to unicast list of IP bus, WE0
%PEA0, Hello sent on IP bus WE0
%PEA0, Cluster communication successfully initialized on IP interface , WE0
3 コンピュータがクラスタを検出すると,そのクラスタに参加しようとする。クラスタが検出されると,接続マネージャは以下の形式で 1 つ以上のメッセージを表示する。
%CNXMAN, Sending VAXcluster membership request to system X...

クラスタを検出できない場合,クォーラムを確立できるだけの十分な票数があるとき (つまり,十分な数の投票メンバがブートされているとき) は,接続マネージャはクラスタを作成する。

4 ブート・コンピュータがクラスタに参加すると,接続マネージャは以下の形式のメッセージを表示する。
%CNXMAN, now a VAXcluster member -- system X...

コンピュータのブート中にクォーラムが失われた場合や,コンピュータが 2 分間のブート中にクラスタに参加できない場合は,接続マネージャは以下のようなメッセージを表示する。

%CNXMAN, Discovered system X...

%CNXMAN, Deleting CSB for system X...
%CNXMAN, Established "connection" to quorum disk
%CNXMAN, Have connection to system X...
%CNXMAN, Have "connection" to quorum disk

最後の 2 つのメッセージは,すでに確立されている接続を示している。

5 クラスタにクォーラム・ディスクが含まれている場合は,以下のメッセージも表示されることがある。
%CNXMAN, Using remote access method for quorum disk

%CNXMAN, Using local access method for quorum disk

最初のメッセージは,ディスクが使用できない状態であるか, MSCP サーバを介してアクセスされるために,接続マネージャがクォーラム・ディスクに直接アクセスできないことを示している。ディスクに直接アクセス可能なクラスタ内の別のコンピュータが,ディスクに対して信頼性のある接続が確立されているかどうかを確認しなければならない。

2 番目のメッセージは,接続マネージャがクォーラム・ディスクに直接アクセスでき,ディスクに直接アクセスできないコンピュータにディスクの状態情報を提供できることを示している。

注意: クォーラム・ディスクがまだ構成されていないために,最初は接続マネージャがクォーラム・ディスクを確認できないことがある。その場合,接続マネージャは,最初はリモート・アクセスを使用し,後でローカル・アクセスに切り換える。

6 コンピュータがクラスタに参加した後,通常のスタートアップ・プロシージャが実行される。最初に実行される機能の 1 つとして,OPCOM プロセスが起動される。
%%%%%%%%%%% OPCOM 15-JAN-1994 16:33:55.33 %%%%%%%%%%%

Logfile has been initialized by operator _X...$OPA0:
Logfile is SYS$SYSROOT:[SYSMGR]OPERATOR.LOG;17
%%%%%%%%%%% OPCOM 15-JAN-1994 16:33:56.43 %%%%%%%%%%%
16:32:32.93 Node X... (csid 0002000E) is now a VAXcluster member
7 他のコンピュータがクラスタに参加すると,OPCOM は以下のようなメッセージを表示する。
%%%%% OPCOM 15-JAN-1994 16:34:25.23 %%%%% (from node X...)

16:34:24.42 Node X... (csid 000100F3)
received VAXcluster membership request from node X...

この後,スタートアップ・プロシージャが続行されると,さまざまなメッセージが表示され,スタートアップ・イベントが報告されます。

ヒント: トラブルシューティングのために,スタートアップ・プロセスの各フェーズ,たとえばディスクのマウントやキューの起動などを報告するメッセージをサイト固有のスタートアップ・プロシージャに指定することができます。

C.2 サテライトのブート障害

サテライトを正しくブートするには,サテライトが LAN あるいは IP を介して MOP サーバと通信しなければなりません。この通信を確認するには, DECnet イベント・ログ機能を使用できます。以下の操作を実行してください。

手順 操作
1 MOP サーバにシステム管理者としてログインする。
2 管理レイヤ・イベントのイベント・ロギングがまだ有効に設定されていない場合は,以下の NCP コマンドを入力して有効にする。
NCP> SET LOGGING MONITOR EVENT 0.*

NCP> SET LOGGING MONITOR STATE ON
3 以下の DCL コマンドを入力して,ダウンライン・ロード・イベントを報告する DECnet メッセージをターミナルが受信できるようにする。
$ REPLY/ENABLE=NETWORK

4 サテライトをブートする。サテライトと MOP サーバが通信でき,すべてのブート・パラメータが正しく設定されている場合は,以下のようなメッセージが MOP サーバのターミナルに表示される。
DECnet event 0.3, automatic line service

From node 2.4 (URANUS), 15-JAN-1994 09:42:15.12
Circuit QNA-0, Load, Requested, Node = 2.42 (OBERON)
File = SYS$SYSDEVICE:<SYS10.>, Operating system
Ethernet address = 08-00-2B-07-AC-03
DECnet event 0.3, automatic line service
From node 2.4 (URANUS), 15-JAN-1994 09:42:16.76
Circuit QNA-0, Load, Successful, Node = 2.44 (ARIEL)
File = SYS$SYSDEVICE:<SYS11.>, Operating system
Ethernet address = 08-00-2B-07-AC-13

場合 対処法
サテライトが MOP サーバ (VAX または Alpha) と通信できない。 そのサテライトに対するメッセージは表示されない。 LAN ケーブル接続またはアダプタ・サービスに問題があると考えられる。
DECnet データベースにサテライトのデータが正しく指定されていない (たとえば,ハードウェア・アドレスが不正である)。 以下のようなメッセージに正しいアドレスが表示され,ロードが要求されたことが示される。
 DECnet event 0.7, aborted service

request
From node 2.4 (URANUS) 15-JAN-1994
Circuit QNA-0, Line open error
Ethernet address=08-00-2B-03-29-99

ノード名,ノード・アドレス,システム・ルートが表示されていないことに注意する。

サテライト・ブートのトラブルシューティングについては, C.2.2C.2.5 項を参照してください。トラブルシューティングの説明では,システム・パラメータが正しく設定されているかどうか確認することが頻繁に求められます。

C.2.1 接続メッセージの表示

会話型ブートで接続メッセージの表示を有効にするには,以下の操作を行います。

手順 操作
1 サテライトの NISCS_CONV_BOOT システム・パラメータを 1 に設定することにより,会話型ブートを有効に設定する。 Integrity および Alpha システムでは,ディスク・サーバのシステム・ルートで I64VMSSYS.PAR ファイルおよび ALPHAVMSSYS.PAR ファイルをそれぞれ更新する。
2 会話型ブートを実行する。

Integrity および Alpha システムでは,コンソールから以下のコマンドを入力する。

>>> b -flags 0,1

VAX システムでは,レジスタ R5 のビット <0> をセットする。たとえば, VAXstation 3100 システムでは,コンソールから以下のコマンドを入力する。

>>> B/1

3 接続メッセージを確認する。

サテライト・ブートで接続メッセージを表示して,大規模なクラスタのどのシステムがブート・プロセスでクラスタ・サテライトにシステム・ディスクをサービスしているかを判断する。ブートの問題が発生した場合は,この表示を利用することで,システム・ディスクを現在サービスしているシステムの問題を切り分けるのに役立つ。その後,サーバ・システムに複数の LAN アダプタがある場合は,特定の LAN アダプタを切り分けることができる。

4 LAN アダプタを切り分ける。

LAN アダプタを切り分けるには,1 つのアダプタだけが接続された状態でリブートを行う。つまり,サーバ・システムで 1 つの LAN アダプタを除き,他のすべてのアダプタを切断し,サテライトをリブートする。そのアダプタがシステム・ディスク・サーバに接続されているときに,サテライトが正しくブートされる場合は,他の LAN アダプタに対しても同じ手順を実行する。問題のあるアダプタを突き止めることができるまで,この操作を繰り返す。



C.2.2 OpenVMS Cluster のサテライトのブートに関する一般的なトラブルシューティング

サテライトをブートできない場合は,ここで説明する手順に従って, OpenVMS Cluster システムで問題点を診断し,修正します。

手順 操作
1 ブート・デバイスが使用可能であるかどうか確認する。複数のシステム・ディスクからサテライトがブートされるようなクラスタの場合は,このチェックが特に重要である。
2 DECnet ネットワークが起動され,動作しているかどうか確認する。
3 クラスタ・グループ・コードとパスワードを確認する。クラスタ・グループ・コードとパスワードは, CLUSTER_CONFIG.COM プロシージャを使用して設定される。
4 正しい OpenVMS Integrity ライセンス,OpenVMS Alpha ライセンス,および OpenVMS VAX ライセンスをインストールしたかどうか確認する。
5 各サテライト・ノードで,以下のようにシステム・パラメータの値が設定されているかどうか確認する。
VAXCLUSTER = 2
NISCS_LOAD_PEA0 = 1
NISCS_USE_UDP=0 or 1 based on LAN or IP interconnect
NISCS_LAN_OVRHD = 0
NISCS_MAX_PKTSZ = 1498 1
SCSNODE はコンピュータの名前である。
SCSSYSTEMID はコンピュータ識別番号である。
VOTES = 0

SCS パラメータ値は,システム構成に応じて異なる設定になる。

関連項目: これらの SCS パラメータの設定方法については, 付録 A を参照。

ブートできないサテライト・ノードでシステム・パラメータ値を確認するには, OpenVMS Cluster で実行中のシステムのうち,サテライト・ノードのローカル・ノードにアクセスできるシステムで, SYSGEN ユーティリティを起動する (SYSGEN ユーティリティは,同じ種類のオペレーティング・システムを稼動しているノードから起動しなければならない。たとえば,Alpha サテライト・ノードをトラブルシューティングする場合は,Alpha システムで SYSGEN ユーティリティを実行しなければならない)。システム・パラメータが以下のように設定されているかどうか確認する。

手順 操作
A システム・ディスクからサテライト・ノードのローカル・ルートを検索する。以下の例は,DECnet for OpenVMS を実行している Alpha システムの例である。
$ MCR NCP SHOW NODE HOME CHARACTERISTICS

Node Volatile Characteristics as of 10-JAN-1994 09:32:56
Remote node = 63.333 (HOME)
Hardware address = 08-00-2B-30-96-86
Load file = APB.EXE
Load Assist Agent = SYS$SHARE:NISCS_LAA.EXE
Load Assist Parameter = ALPHA$SYSD:[SYS17.]

この例のローカル・ルートは ALPHA$SYSD:[SYS17.] である。

関連項目: NCL コマンドを使用する場合については,DECnet-Plus のマニュアルを参照。

B システム・プロンプトに対して SHOW LOGICAL コマンドを入力して,ALPHA$SYSD の論理名を変換する。
$ SHO LOG ALPHA$SYSD

"ALPHA$SYSD" = "$69$DUA121:" (LNM$SYSTEM_TABLE)
C サテライトのローカル・ディスクにアクセスできるシステムで, SYSGEN ユーティリティを起動する (この例では,パラメータ・ファイル I64VMSSYS.PAR あるいは ALPHAVMSSYS.PAR を使用して Integrity システムあるいは Alpha システムで SYSGEN ユーティリティを起動します)。以下の例は,サテライト・ノードのローカル・ルートにあるシステム・パラメータ・ファイルを使用して, SYSGEN コマンド USE を入力し,その後, SHOW コマンドを入力して問題のパラメータを確認する方法を示している。
$ MCR SYSGEN

SYSGEN> USE $69$DUA121:[SYS17.SYSEXE]ALPHAVMSSYS.PAR
SYSGEN> SHOW VOTES
Parameter
Name Current Default Min. Max. Unit Dynamic
--------- ------- ------- --- ----- ---- -------
VOTES 0 1 0 127 Votes
SYSGEN> EXIT


1 Ethernet アダプタの場合,NISCS_MAX_PKTSZ の値は 1498 である。 Gigabit Ethernet および 10 Gb Eithernet アダプタの場合,この値は 8192 である。


目次 索引

プライバシー ご利用条件・免責事項