日本-日本語 |
|
|
|
OpenVMS マニュアル |
|
HP OpenVMS
|
目次 | 索引 |
ここでは,以下のトラブルシューティング操作を実行するのに役立つ情報をまとめます。
予備チェックを実行し,必要に応じて適切な処置を実行した後,コンピュータがまだブートできなかったり,クラスタに参加できない場合は, C.2 〜
C.3 項の手順に従って,障害からの回復を試みてください。
診断手順と回復手順を効果的に実行するには,コンピュータがブートし,クラスタに参加するときに,どのようなイベントが実行されるかを理解しておく必要があります。ここでは,これらのイベントの概要を示し,コンソールに表示される典型的なメッセージも示します。
発生するイベントは,コンピュータが新しいクラスタにブートされる最初のコンピュータであるのか,アクティブ・クラスタでブートされているのかに応じて異なります。また,一部のイベント (パスワードとグループ番号が格納されているクラスタ・データベースのロードなど) は,LAN あるいは IP を利用した OpenVMS Cluster システムでのみ発生します。
通常のイベント・シーケンスは 表 C-1 に示すとおりです。
付録 C
クラスタのトラブルシューティングC.1 コンピュータ障害の診断
C.1.1 予備チェックリスト
C.1.2 ブート・イベント・シーケンス
手順 | 操作 |
---|---|
1 | コンピュータがブートする。コンピュータがサテライトの場合は,以下のようなメッセージに,サテライトをダウンライン・ロードした MOP サーバの名前と LAN アドレスが表示される。この時点で,サテライトは MOP サーバとの通信を完了しており, OpenVMS Cluster 通信機能を使用してシステム・ディスク・サーバとの通信を続行している。
%VAXcluster-I-SYSLOAD, system loaded from Node X...ブート中のコンピュータに対して, OpenVMS "バナー・メッセージ" が以下の形式で表示される。 operating-system Version n.n dd-mmm-yyyy hh:mm.ss |
2 | コンピュータがクラスタを作成するか,またはクラスタに参加しようとすると,以下のメッセージが表示される。
waiting to form or join an OpenVMS Cluster system コンピュータが LAN ベースの OpenVMS Cluster のメンバである場合は,クラスタ・セキュリティ・データベース (クラスタ・パスワードとグループ番号が格納されている) がロードされる。必要に応じて,MSCP サーバと TMSCP サーバもロードできる。
コンピュータが IP ベースの OpenVMS Cluster のメンバである場合,クラスタ・セキュリティ・データベース,MSCP サーバおよび TMSCP サーバとともに, IP 構成ファイルもロードされる。
IP ベースのクラスタ通信のために IP インタフェースと TCP/IP サービスが有効にされる。マルチキャスト・アドレスおよびユニキャスト・アドレスが IP バス WE0 のリストに追加され,Hello パケットを送信します。
|
3 | コンピュータがクラスタを検出すると,そのクラスタに参加しようとする。クラスタが検出されると,接続マネージャは以下の形式で 1 つ以上のメッセージを表示する。
%CNXMAN, Sending VAXcluster membership request to system X... クラスタを検出できない場合,クォーラムを確立できるだけの十分なボーツ数があるとき (つまり,十分な数のボーツ・コンピュータがブートされているとき) は,接続マネージャはクラスタを作成する。 |
4 | ブート・コンピュータがクラスタに参加すると,接続マネージャは以下の形式のメッセージを表示する。
%CNXMAN, now a VAXcluster member -- system X... コンピュータのブート中にクォーラムが失われた場合や,コンピュータが 2 分間のブート中にクラスタに参加できない場合は,接続マネージャは以下のようなメッセージを表示する。
最後の 2 つのメッセージは,すでに確立されている接続を示している。 |
5 | クラスタにクォーラム・ディスクが含まれている場合は,以下のメッセージも表示されることがある。
%CNXMAN, Using remote access method for quorum disk 最初のメッセージは,ディスクが使用できない状態であるか, MSCP サーバを介してアクセスされるために,接続マネージャがクォーラム・ディスクに直接アクセスできないことを示している。ディスクに直接アクセス可能なクラスタ内の別のコンピュータが,ディスクに対して信頼性のある接続が確立されているかどうかを確認しなければならない。 2 番目のメッセージは,接続マネージャがクォーラム・ディスクに直接アクセスでき,ディスクに直接アクセスできないコンピュータにディスクの状態情報を提供できることを示している。 注意: クォーラム・ディスクがまだ構成されていないために,最初は接続マネージャがクォーラム・ディスクを確認できないことがある。その場合,接続マネージャは,最初はリモート・アクセスを使用し,後でローカル・アクセスに切り換える。 |
6 | コンピュータがクラスタに参加した後,通常のスタートアップ・プロシージャが実行される。最初に実行される機能の 1 つとして,OPCOM プロセスが起動される。
%%%%%%%%%%% OPCOM 15-JAN-1994 16:33:55.33 %%%%%%%%%%% |
7 | 他のコンピュータがクラスタに参加すると,OPCOM は以下のようなメッセージを表示する。
%%%%% OPCOM 15-JAN-1994 16:34:25.23 %%%%% (from node X...) |
この後,スタートアップ・プロシージャが続行されると,さまざまなメッセージが表示され,スタートアップ・イベントが報告されます。
ヒント: トラブルシューティングのために,スタートアップ・プロセスの各フェーズ,たとえばディスクのマウントやキューの起動などを報告するメッセージをサイト固有のスタートアップ・プロシージャに指定することができます。
サテライトを正しくブートするには,サテライトが LAN あるいは IP を介して MOP サーバと通信しなければなりません。この通信を確認するには, DECnet イベント・ログ機能を使用できます。以下の操作を実行してください。
C.2 サテライトのブート障害
手順 | 操作 | ||||||
---|---|---|---|---|---|---|---|
1 | MOP サーバにシステム管理者としてログインする。 | ||||||
2 | 管理レイヤ・イベントのイベント・ロギングがまだ有効に設定されていない場合は,以下の NCP コマンドを入力して有効にする。
NCP> SET LOGGING MONITOR EVENT 0.* |
||||||
3 | 以下の DCL コマンドを入力して,ダウンライン・ロード・イベントを報告する DECnet メッセージをターミナルが受信できるようにする。
$ REPLY/ENABLE=NETWORK |
||||||
4 | サテライトをブートする。サテライトと MOP サーバが通信でき,すべてのブート・パラメータが正しく設定されている場合は,以下のようなメッセージが MOP サーバのターミナルに表示される。
DECnet event 0.3, automatic line service
|
サテライト・ブートのトラブルシューティングについては, C.2.2 〜 C.2.5 項を参照してください。トラブルシューティングの説明では,システム・パラメータが正しく設定されているかどうか確認することが頻繁に求められます。
C.2.1 接続メッセージの表示
会話型ブートで接続メッセージの表示を有効にするには,以下の操作を行います。
手順 | 操作 |
---|---|
1 | サテライトの NISCS_CONV_BOOT システム・パラメータを 1 に設定することにより,会話型ブートを有効に設定する。 Integrity および Alpha システムでは,ディスク・サーバのシステム・ルートで I64VMSSYS.PAR ファイルおよび ALPHAVMSSYS.PAR ファイルをそれぞれ更新する。 |
2 | 会話型ブートを実行する。
Integrity および Alpha システムでは,コンソールから以下のコマンドを入力する。
VAX システムでは,レジスタ R5 のビット <0> をセットする。たとえば, VAXstation 3100 システムでは,コンソールから以下のコマンドを入力する。
|
3 | 接続メッセージを確認する。
サテライト・ブートで接続メッセージを表示して,大規模なクラスタのどのシステムがブート・プロセスでクラスタ・サテライトにシステム・ディスクをサービスしているかを判断する。ブートの問題が発生した場合は,この表示を利用することで,システム・ディスクを現在サービスしているシステムの問題を切り分けるのに役立つ。その後,サーバ・システムに複数の LAN アダプタがある場合は,特定の LAN アダプタを切り分けることができる。 |
4 | LAN アダプタを切り分ける。
LAN アダプタを切り分けるには,1 つのアダプタだけが接続された状態でリブートを行う。つまり,サーバ・システムで 1 つの LAN アダプタを除き,他のすべてのアダプタを切断し,サテライトをリブートする。そのアダプタがシステム・ディスク・サーバに接続されているときに,サテライトが正しくブートされる場合は,他の LAN アダプタに対しても同じ手順を実行する。問題のあるアダプタを突き止めることができるまで,この操作を繰り返す。 |
サテライトをブートできない場合は,ここで説明する手順に従って, OpenVMS Cluster システムで問題点を診断し,修正します。
C.2.2 OpenVMS Cluster のサテライトのブートに関する一般的なトラブルシューティング
手順 | 操作 | ||||||||
---|---|---|---|---|---|---|---|---|---|
1 | ブート・デバイスが使用可能であるかどうか確認する。複数のシステム・ディスクからサテライトがブートされるようなクラスタの場合は,このチェックが特に重要である。 | ||||||||
2 | DECnet ネットワークが起動され,動作しているかどうか確認する。 | ||||||||
3 | クラスタ・グループ・コードとパスワードを確認する。クラスタ・グループ・コードとパスワードは, CLUSTER_CONFIG.COM プロシージャを使用して設定される。 | ||||||||
4 | 正しい OpenVMS Integrity ライセンス,OpenVMS Alpha ライセンス,および OpenVMS VAX ライセンスをインストールしたかどうか確認する。 | ||||||||
5 | 各サテライト・ノードで,以下のようにシステム・パラメータの値が設定されているかどうか確認する。
VAXCLUSTER = 2 SCS パラメータ値は,システム構成に応じて異なる設定になる。 関連項目: これらの SCS パラメータの設定方法については, 付録 A を参照。 ブートできないサテライト・ノードでシステム・パラメータ値を確認するには, OpenVMS Cluster で実行中のシステムのうち,サテライト・ノードのローカル・ノードにアクセスできるシステムで, SYSGEN ユーティリティを起動する (SYSGEN ユーティリティは,同じ種類のオペレーティング・システムを稼動しているノードから起動しなければならない。たとえば,Alpha サテライト・ノードをトラブルシューティングする場合は,Alpha システムで SYSGEN ユーティリティを実行しなければならない)。システム・パラメータが以下のように設定されているかどうか確認する。
|
目次 | 索引 |
|