C.6.2 クラスタ・リソースにアクセスできない |
|
共用クラスタ・リソースへのアクセスは,分散ロック・マネージャによって調整されます。特定のプロセスがリソース (たとえば共用データ・ファイル) に対するロックを獲得すると,そのリソースに対して互換性のないロックを要求したクラスタ内の他のプロセスは,元のロックが解放されるまで待たなければなりません。元のプロセスがかなり長い時間にわたってロックを保持している場合,そのロックが解放されるのを待っている他のプロセスはハングしているように見えることがあります。
場合によっては,システム動作で長期間にわたってリソースに対する制限付きロックを取得しなければならないことがあります。たとえば,ボリュームの再構築を実行するには,システム・ソフトウェアが再構築するボリュームに対して排他的ロックを獲得します。このロックが保有されている間,他のプロセスはディスク・ボリューム上で領域を割り当てることができません。このような操作を実行しようとすると,プロセスはハングしているように見えることがあります。
システムの操作にとって必要なデータが格納されているファイルへのアクセスは,分散ロック・マネージャによって調整されます。この理由から,プロセスがこれらのリソースのいずれかに対してロックを取得した後,そのプロセスの処理ができなくなった場合,クラスタはハングしているように見えることがあります。
たとえば,プロセスが書き込みアクセスのためにシステム登録ファイル (SYS$SYSTEM:SYSUAF.DAT) の一部をロックした場合,この状況が発生することがあります。同じユーザ名や類似したユーザ名を持つアカウントへのログインや,そのユーザ名へのメールの送信など,ファイルのその部分へのアクセスが必要な操作は,元のロックが解放されるまで実行されません。通常,このロックは迅速に解放されるため,ユーザがロック操作に気付くことはありません。
しかし,ロックを保有しているプロセスを処理できなくなった場合,他のプロセスも待ち状態になります。登録ファイルはログイン時に使用され,多くのプロセス生成操作 (たとえばバッチ・ジョブやネットワーク・ジョブなど) でも使用されるため,クラスタ内でブロックされたプロセスが急増します。このような状況でも,分散ロック・マネージャは正常に機能しているため,ブロードキャスト・メッセージや他の手段によって問題が発生したことがユーザに通知されることはありません。
オペレーティング・システムがバグチェック操作を実行するのは,正常なシステム動作を損なう可能性がある状況や,データの整合性をおかす危険性のある条件を検出した場合だけです。 CLUEXIT バグチェックは,接続マネージャによって開始される一種のバグチェックです。接続マネージャは,協調動作する OpenVMS Cluster コンポーネントの相互関係を管理する OpenVMS Cluster ソフトウェアのコンポーネントです。このようなバグチェックの大部分は,ハードウェア障害 (特に通信パスの障害),構成エラー,システム管理エラーから発生した状況によって起動されます。
C.7.1 バグチェックの原因になる状況 |
|
CLUEXIT バグチェックが実行される最も一般的な状況は,以下のとおりです。