日本-日本語
日本HPホーム 製品 & サービス OpenVMS製品情報
≫  お問い合わせ


OpenVMS マニュアル


 

OpenVMS ドキュメント
ライブラリ

タイトルページ
目次
まえがき
第1章:OpenVMS Cluster システムの管理の概要
第2章:OpenVMS Cluster の概念
第3章:OpenVMS Cluster インターコネクト構成
第4章:OpenVMS Cluster オペレーティング環境
第5章:共用環境の準備
第6章:クラスタ・ストレージ・デバイス
第7章:クラスタ・キューの設定と管理
第8章:OpenVMS Cluster システムの構成
第9章:大規模な OpenVMS Cluster システムの構築
第10章:OpenVMS Cluster システムの保守
付録A :クラスタ・システム・パラメータ
付録B :共通ファイルの作成
付録C :クラスタのトラブルシューティング
付録D :LAN 制御のためのサンプル・プログラム
付録E :LAN 制御のためのサブルーチン
付録F :NISCA プロトコルのトラブルシューティング
付録G :NISCA トランスポート・プロトコル輻輳制御
索引
PDF
OpenVMS ホーム

HP OpenVMS
OpenVMS Cluster システム


目次 索引



通信に関する問題を診断するには, 表 C-4 の説明に従って,Show Cluster ユーティリティを起動します。

表 C-4 仮想サーキットの状態の確認方法
手順 操作 調べる対象
1 SHOW CLUSTER コマンド ADD CIRCUIT,CABLE_STATUS を入力して,SHOW CLUSTER のレポートをカスタマイズする。このコマンドは,SHOW CLUSTER を実行しているコンピュータから見たときの,すべての仮想サーキットに関する情報クラスを追加する。 CABLE_STATUS は,ローカル・システム上の CI インタフェースからリモート・システム上の CI インタフェースまでのサーキットのパスの状態を示す。 主に,障害があるコンピュータに対して OPEN 状態の仮想サーキットがあるかどうかをチェックする。仮想サーキットをオープンできない問題と,仮想サーキットをオープン状態に維持できない問題の一般的な原因は以下のとおりである。

  • どちらか一方にポート・エラーがある。

  • ケーブル・エラーがある。

  • ソフトウェアに問題があるために,ポートがオフラインに設定されている。

  • 両側で非ページング・プールが不足している。

  • SCSNODE,SCSSYSTEMID,PAMAXPORT,PANOPOLL, PASTIMOUT,PAPOLLINTERVAL システム・パラメータの値が正しく設定されていない。

2 クラスタ内の各アクティブ・コンピュータから SHOW CLUSTER を実行して,各コンピュータから障害があるコンピュータを見たときに,そのビューが他の各コンピュータのビューと一致するかどうかを確認する。

状態 対処法
すべてのアクティブ・コンピュータから障害のあるコンピュータを見たときのビューが一致している。 問題は障害のあるコンピュータにあると考えられる。
複数のアクティブ・コンピュータの中の 1 台だけで,新しいコンピュータで障害が発生していることが検出された。 その特定のコンピュータに問題がある可能性がある。

障害のあるコンピュータに対して仮想サーキットをオープンできない場合は,SHOW CLUSTER の表示の一番下の部分を確認する。

  • 障害のあるコンピュータのポートに対するサーキットに関する情報。部分的にオープン状態になっている仮想サーキットは,表示の一番下に示される。サーキットが OPEN 以外の状態で示される場合は,ローカル・ポートとリモート・ポートの間の通信は実行されており,障害はおそらくポートまたはケーブル・ハードウェアより高いレベルにあると考えられる。

  • 障害があるポートに対するパス A とパス B の両方が正常であるかどうか確認する。どちらか一方のパスが正常に動作していないと,コンピュータはクラスタに参加できないことがある。



C.9.4 LAN 接続の確認

付録 D.4 節 で説明している Local Area OpenVMS Cluster Network Failure Analysis Program では, HELLO データグラム・メッセージを使用して,PEDRIVER で使用されるネットワーク・パス (チャネル) を継続的にチェックします。このチェック・プロセスをネットワークの物理的な記述と組み合わせると,以下のことが可能になります。

  • 障害のあるネットワーク・コンポーネントを切り分けることができます。

  • 障害のあるチャネルをひとまとめにし,それを物理ネットワーク記述にマッピングできます。

  • チャネル障害に関連する共通のコンポーネントを切り分けることができます。



C.10 ポート・デバイスのエラー・ログ・エントリの分析

エラー・ログに記録されたイベントを監視すると,問題を予測し,回避するのに役立ちます。エラーの総数 (DCL コマンド SHOW DEVICES device-name によって表示) から,エラーが増加しているかどうか判断することができます。その場合,エラー・ログを確認しなければなりません。

C.10.1 エラー・ログの確認

DCL コマンド ANALYZE/ERROR_LOG は,Error Log ユーティリティを起動して,エラー・ログ・ファイルの内容を報告します。

関連項目: Error Log ユーティリティの詳細については,『OpenVMS システム管理ユーティリティ・リファレンス・マニュアル』を参照してください。

エラー・ログ・エントリの中には,単に情報を提供するだけのものと,操作が必要なものがあります。

表 C-5 情報を提供するエラー・ログ・エントリとその他のエントリ
エラーの種類 操作が必要か 目的
情報エラー・ログ・エントリに対しては,操作は必要ない。たとえば,クラスタ内のコンピュータをシャットダウンすると,そのコンピュータとの間に仮想サーキットをオープンしている他のすべてのアクティブ・コンピュータのエラー・ログにエントリが作成される。このようなコンピュータは,イベントに対して最大 3 つのエラーを記録する。

  • Path A received no response. (パス A が応答を受信しなかった。)

  • Path B received no response. (パス B が応答を受信しなかった。)

  • The virtual circuit is being closed. (仮想サーキットがクローズされている。)

不要 これらのメッセージは正常終了メッセージであり,シャットダウンされたコンピュータとの間のサーキットの状態が変化したことを反映するものである。
その他のエラー・ログ・エントリは,パフォーマンスの低下や,致命的でない問題がハードウェアにあることを示す。このような状況では,オペレーティング・システムは問題なく操作を続行できる。 必要 致命的でない問題 (たとえば 1 つの CI パスが失われたなど) が深刻な問題 (たとえば両方のパスが失われたなど) にならないようにするには,これらの問題を早期に検出することが重要である。



C.10.2 形式

LAN 上でエラーや他のイベントが発生すると,ポート・ドライバは以下の 2 種類の形式のいずれかで,システム・エラー・ログに情報を記録します。

  • デバイス・アテンション
    LAN のデバイス・アテンション・エントリは通常, LAN アダプタ・デバイスのエラーを記録します。

  • ログ・メッセージ
    ログ・メッセージ・エントリは,エラー・データを含むメッセージ・パケットや,エラー状況を示すメッセージ・パケットを受信したことを記録します。

これらの形式については, 付録 C.10.4 項 を参照してください。

C.10.3 LAN のデバイス・アテンション・エントリ

例 C-1 は,LAN のデバイス・アテンション・エントリを示しています。

例 C-1 LAN のデバイス・アテンション・エントリ
**** V3.4  ********************* ENTRY  337 ******************************** (1)
 
 
Logging OS                        1. OpenVMS 
System Architecture               2. Alpha 
OS version                           XC56-BL2 
Event sequence number            96. 
Timestamp of occurrence              16-SEP-2009 16:33:03 (2)
Time since reboot                    0 Day(s) 0:50:08 
Host name                            PERK 
 
System Model                         AlphaServer ES45 Model 2 (3)
 
Entry Type                       98. Asynchronous Device Attention 
 
 
---- Device Profile ---- 
Unit                                 PERK$PEA0 (4)
Product Name                         NI-SCA Port 
 
---- NISCA Port Data ---- 
Error Type and SubType        x0700  Device Error, Fatal Error Detected by 
                                     Datalink(5)
Status                    x0000120100000001 (6)
Datalink Device Name                 EIA2: (7)
Remote Node Name (8)
Remote Address            x0000000000000000 (9)
Local Address             x000063B4000400AA (10)
Error Count                       1. Error Occurrences This Entry (11)
 
----- Software Info ----- 
UCB$x_ERRCNT                      2. Errors This Unit 

以下の表は, 例 C-1 に示した LAN のデバイス・アテンション・エントリについて説明しています。

エントリ 説明
(1) 最初の 4 行はエントリの見出しである。これらの行には,このエラー・ログ・ファイルでのエントリの番号,アーキテクチャ,OS バージョン,およびこのエラーのシーケンス番号が示される。ログ・ファイルの各エントリには,このような見出しが記録される。
(2) この行には,日付と時刻が示される。
(3) 次の 2 行には,システム・モデルとエントリの種類が示される。
(4) この行には,エントリが記録される原因になったサブシステムとコンポーネントの名前が示される。
(5) この行には,エントリの原因が示される。この例では,LAN ドライバが致命的なエラーのためにデータ・リンクをシャットダウンしている。可能であれば,データ・リンクは自動的に再起動される。
(6) 最初のロングワードは,LAN ドライバから返された I/O 終了状態を示している。 2 番目のロングワードは,LAN ドライバから PEDRIVER ドライバに渡された VCI イベント・コードである。
(7) DATALINK NAME は,エラーが発生した LAN デバイスの名前である。
(8) REMOTE NODE は,パケットの送信先のリモート・ノードの名前である。0 が表示された場合は,リモート・ノードが使用可能な状態でないか,またはパケットがエラーに関連付けられていないことを示す。
(9) REMOTE ADDR は,パケットの送信先のリモート・ノードの LAN アドレスである。0 が表示された場合は,パケットがエラーに関連付けられていないことを示す。
(10) LOCAL ADDR はローカル・ノードの LAN アドレスである。
(11) ERROR CNT。一部のエラーは非常に高い率で発生する可能性があるため,一部のエラー・ログ・エントリは,エラーが複数回発生したことを表す。このフィールドは,その回数を示している。エントリのタイムスタンプの前の 3 秒間に発生したエラーが数えられる。



C.10.4 ログ・メッセージ・エントリ

ログ・メッセージ・エントリは,ポート・ドライバが解釈できないデータや,状態フィールドにエラー・コードを含む応答を LAN ポートが受信したときに作成されます。

C.10.5 エラー・ログ・エントリの説明

ここでは,CI および LAN ポートのエラー・ログ・エントリについて説明します。各エントリの後に,関連するポート・ドライバ (たとえば PADRIVER,PBDRIVER,PEDRIVER) について簡単に説明し,システム管理者が実行すべき操作についても説明します。コンパックのサポートに連絡し,クラッシュ・ダンプを保存するように求められている場合は,エラーの発生後,できるだけ早くクラッシュ・ダンプをとることが重要です。CI エントリの場合,パス A とパス 0 は同じパスであり,パス B とパス 1 も同じパスです。

表 C-6 はエラー・ログ・メッセージを示しています。

表 C-6 すべてのデバイスのポート・メッセージ
メッセージ 結果 ユーザの対処
BIIC FAILURE ポート・ドライバがポートを再初期化しようとしている。50 回失敗すると,デバイスがオフラインとしてマークされる。 コンパックのサポートに連絡する。
11/750 CPU MICROCODE NOT ADEQUATE FOR PORT ポート・ドライバは再試行せずに,ポートをオフラインに設定する。さらに,コンピュータが HSC サブシステムからブートされるか,またはクラスタに参加しているために,このポートが必要な場合は,コンピュータは UCODEREV コード・バグチェックでバグチェックを行う。 必要なコンピュータ・マイクロコード・リビジョンの詳細については,最新の OpenVMS Cluster Software SPD の適切な節を参照。必要に応じて,コンパックのサポートに連絡する。
PORT MICROCODE REV NOT CURRENT, BUT SUPPORTED ポート・ドライバは,マイクロコードが現在のレベルでないことを検出したが,正常に動作を続行する。このエラーは単に警告としてのみ記録される。 マイクロコードを更新する必要がある場合は,コンパックのサポートに連絡する。
DATAGRAM FREE QUEUE INSERT FAILURE ポート・ドライバがポートを再初期化しようとしている。 50 回失敗した後,デバイスはオフラインとしてマークされる。 コンパックのサポートに連絡する。このエラーは,インターロックされているキューへのアクセス権を取得できないために発生する。問題の原因として, CI ハードウェアの故障,メモリ,SBI (11/780), CMI (11/750),BI (8200,8300,8800) の競合が考えられる。
DATAGRAM FREE QUEUE REMOVE FAILURE ポート・ドライバがポートを再初期化しようとしている。 50 回失敗した後,デバイスはオフラインとしてマークされる。 コンパックのサポートに連絡する。このエラーは,インターロックされているキューへのアクセス権を取得できないために発生する。問題の原因として,CI ハードウェアの故障,メモリ,SBI (11/780),CMI (11/750), BI (8200,8300,8800) の競合が考えられる。
FAILED TO LOCATE PORT MICROCODE IMAGE ポート・ドライバがデバイスをオフラインとしてマークしたが,再試行は行わない。 コンソール・ボリュームにマイクロコード・ファイル CI780.BIN (CI780,CI750,CIBCI のいずれかの場合),または CIBCA--AA 用のマイクロコード・ファイル CIBCA.BIN が格納されているかどうか確認する。その後,コンピュータをリブートする。
HIGH PRIORITY COMMAND QUEUE INSERT FAILURE ポート・ドライバがポートを再初期化しようとしている。 50 回失敗した後,デバイスはオフラインとしてマークされる。 コンパックのサポートに連絡する。このエラーは,インターロックされているキューへのアクセス権を取得できないために発生する。問題の原因として,CI ハードウェアの故障,メモリ,SBI (11/780),CMI (11/750),BI (8200,8300,8800) の競合が考えられる。
MSCP ERROR LOGGING DATAGRAM RECEIVED HSC サブシステムからエラー・メッセージを受信すると,ポート・ドライバはエラーをログに記録し,他の操作を行わない。適切な HSC コンソール・コマンドを使用して, HSC 情報エラー・ログ・データグラムの送信を無効にする必要がある。このようなデータグラムは,エラー・ログ・データ・ファイルでかなり多くの領域を使用するからである。 エラー・ログ・データグラムは,何らかの理由で (たとえば, HSC コンソールで用紙切れが発生した場合など) HSC コンソールで収集できない場合にだけ,読み込む必要がある。ログに記録されたこの情報は,HSC コンソールに記録されたメッセージと重複する。
INAPPROPRIATE SCA CONTROL MESSAGE ポート・ドライバはリモート・ポートへのポート間仮想サーキットをクローズしている。 コンパックのサポートに連絡する。ローカル・コンピュータとリモート・コンピュータからエラー・ログおよびクラッシュ・ダンプを保存する。
INSUFFICIENT NON-PAGED POOL FOR INITIALIZATION ポート・ドライバはデバイスをオフラインとしてマークし,再試行を行わなかった。 NPAGEDYN または NPAGEVIR の値を大きくして,コンピュータをリブートする。
LOW PRIORITY CMD QUEUE INSERT FAILURE ポート・ドライバはポートを再初期化しようとしている。 50 回失敗した後,デバイスはオフラインとしてマークされる。 コンパックのサポートに連絡する。このエラーは,インターロックされているキューへのアクセス権を取得できないために発生する。問題の原因として, CI ハードウェアの故障,メモリ,SBI (11/780), CMI (11/750),BI (8200,8300,8800) の競合が考えられる。
MESSAGE FREE QUEUE INSERT FAILURE ポート・ドライバはポートを再初期化しようとしている。 50 回失敗した後,デバイスはオフラインとしてマークされる。 コンパックのサポートに連絡する。このエラーは,インターロックされているキューへのアクセス権を取得できないために発生する。問題の原因として, CI ハードウェアの故障,メモリ,SBI (11/780), CMI (11/750),BI (8200,8300,8800) の競合が考えられる。
MESSAGE FREE QUEUE REMOVE FAILURE ポート・ドライバはポートを再初期化しようとしている。 50 回失敗した後,デバイスはオフラインとしてマークされる。 コンパックのサポートに連絡する。このエラーは,インターロックされているキューへのアクセス権を取得できないために発生する。問題の原因として, CI ハードウェアの故障,メモリ,SBI (11/780), CMI (11/750),BI (8200,8300,8800) の競合が考えられる。
MICRO-CODE VERIFICATION ERROR ポートにロードされたばかりのマイクロコードを読み込んでいるときに,ポート・ドライバがエラーを検出した。ドライバはポートを再初期化しようとする。50 回失敗した後,デバイスはオフラインとしてマークされる。 コンパックのサポートに連絡する。
NO PATH-BLOCK DURING VIRTUAL CIRCUIT CLOSE ポート・ドライバはポートを再初期化しようとしている。 50 回失敗した後,デバイスはオフラインとしてマークされる。 コンパックのサポートに連絡する。ローカル・コンピュータからエラー・ログとクラッシュ・ダンプを保存する。
NO TRANSITION FROM UNINITIALIZED TO DISABLED ポート・ドライバはポートを再初期化しようとしている。 50 回失敗した後,デバイスはオフラインとしてマークされる。 コンパックのサポートに連絡する。
PORT ERROR BIT(S) SET ポート・ドライバはポートを再初期化しようとしている。 50 回失敗した後,デバイスはオフラインとしてマークされる。 maintenance timer expiration ビットは, PASTIMOUT システム・パラメータの値が小さすぎるために,大きくしなければならないことを示している可能性がある。特に,ローカル・コンピュータが特権付きユーザ作成ソフトウェアを実行している場合は,この状況が発生する。他のすべてのビットについては,コンパックのサポートに問い合わせる。
PORT HAS CLOSED VIRTUAL CIRCUIT リモート・ポートに対してローカル・ポートがオープンした仮想サーキットをポート・ドライバがクローズした。 仮想サーキットがクローズされた理由については,エラー・ログ・エントリの PPD$B_STATUS フィールドを確認する。リモート・コンピュータで障害が発生した場合や,リモート・コンピュータがシャットダウンされた場合は,このエラーが発生するのが正常である。PEDRIVER の場合は, PPD$B_OPC フィールドの値を無視する。この値は不明のオペレーション・コードである。

PEDRIVER がこれらのエラーを数多くログに記録した場合, LAN またはリモート・システムに問題があるか,または非ページング・プールがローカル・システムで不足している可能性がある。

PORT POWER DOWN ポート・ドライバがポート操作を停止し,電力がポート・ハードウェアに供給されるようになるのを待っている。 ポート・ハードウェアへの電力を復旧する。
PORT POWER UP ポート・ドライバがポートを再初期化し,ポート操作を再起動した。 処置は必要ない。
RECEIVED CONNECT WITHOUT PATH-BLOCK ポート・ドライバがポートを再初期化しようとしている。 50 回失敗した後,デバイスはオフラインとしてマークされる。 コンパックのサポートに連絡する。ローカル・コンピュータからエラー・ログとクラッシュ・ダンプを保存する。
REMOTE SYSTEM CONFLICTS WITH KNOWN SYSTEM リモート・コンピュータの SCSSYSTEMID および SCSNODE の値が,仮想サーキットがすでにオープンされている他のコンピュータの設定と同じであることを構成ポーラが検出した。 できるだけ速やかに新しいコンピュータをシャットダウンする。 SCSYSTEMID および SCSNODE の値を固有の値に設定してリブートする。新しいコンピュータは,操作に必要な時間だけ稼動させ,直ちにシャットダウンする。クラスタを実行しているときに,他の仮想サーキット障害がクラスタ内で発生しているときに,ID が競合する 2 台のコンピュータがポーリングすると,クラスタ内のコンピュータは CLUEXIT バグチェックでシャットダウンされる可能性がある。
RESPONSE QUEUE REMOVE FAILURE ポート・ドライバはポートを再初期化しようとしている。 50 回失敗した後,デバイスはオフラインとしてマークされる。 コンパックのサポートに連絡する。このエラーは,インターロックされているキューへのアクセス権を取得できないために発生する。問題の原因として, CI ハードウェアの故障,メモリ,SBI (11/780), CMI (11/750),BI (8200,8300,8800) の競合が考えられる。
SCSSYSTEMID MUST BE SET TO NON-ZERO VALUE ポート・ドライバは,再試行を実行せずにポートをオフラインに設定する。 会話型ブートによってコンピュータを再起動し,SCSSYSTEMID を正しい値に設定する。同時に,SCSNODE が空白以外の正しい値に設定されていることを確認する。
SOFTWARE IS CLOSING VIRTUAL CIRCUIT ポート・ドライバはリモート・ポートへの仮想サーキットをクローズする。 仮想サーキットがクローズされた原因については,エラー・ログ・エントリを確認する。たとえば,両方のパスで送信障害または受信障害が発生すると,このエラーが発生する。このようなエラーは,このリモート・コンピュータに対するパスが正常でないことを示す,1 つまたは 2 つの前のエラー・ログ・エントリから検出されることがある。
SOFTWARE SHUTTING DOWN PORT ポート・ドライバはポートを再初期化しようとしている。 50 回失敗すると,デバイスはオフラインとしてマークされる。 ポートを再初期化できない原因を他のエラー・ログ・エントリから確認する。
UNEXPECTED INTERRUPT ポート・ドライバはポートを再初期化しようとしている。 50 回失敗した後,デバイスはオフラインとしてマークされる。 コンパックのサポートに連絡する。
UNRECOGNIZED SCA PACKET ポート・ドライバは,リモート・ポートに対する仮想サーキットをクローズする。仮想サーキットがすでにクローズされている場合,ポート・ドライバはリモート・ポートからのデータグラムの受信を禁止する。 コンパックのサポートに連絡する。このエントリが記録されているエラー・ログ・ファイルを保存し,ローカル・コンピュータとリモート・コンピュータの両方からクラッシュ・ダンプを保存する。
VIRTUAL CIRCUIT TIMEOUT ポート・ドライバは,ローカル CI ポートがリモート・ポートに対してオープンした仮想サーキットをクローズする。このようなクローズが行われるのは,リモート・コンピュータが CI マイクロコード・バージョン 7 以上を実行している場合か,ローカル・コンピュータから送信されたメッセージにリモート・コンピュータが応答できない場合である。 リモート・コンピュータが停止またはシャットダウンされている場合や,障害が発生している場合は,このエラーが発生するのは正常である。このエラーは,ローカル・コンピュータの TIMVCFAIL システム・パラメータの値が小さすぎることを意味することがある。特に,リモート・コンピュータが特権付きユーザ作成ソフトウェアを実行している場合は,このような状況が発生する。
INSUFFICIENT NON-PAGED POOL FOR VIRTUAL CIRCUITS ポート・ドライバは,プールが不足しているために仮想サーキットをクローズする。 DCL コマンド SHOW MEMORY を入力して必要なプールを判断した後,適切なシステム・パラメータを調整する。


目次 索引

© 2012 Hewlett-Packard Development Company, L.P.