JPH0728667A

JPH0728667A - 故障許容コンピュータシステム

Info

Publication number: JPH0728667A
Application number: JP6140633A
Authority: JP
Inventors: Richard N Taylor; ノーコットテイラーリチャード
Original assignee: Fujitsu Services Ltd
Current assignee: Fujitsu Services Ltd
Priority date: 1993-06-26
Filing date: 1994-06-23
Publication date: 1995-01-31
Also published as: EP0632381A2; DE69430649T2; DE69430649D1; AU6593694A; EP0632381B1; US5517616A; GB9313255D0; AU674231B2; EP0632381A3

Abstract

(57)【要約】【目的】コンピュータシステムにおいて、システム内
で故障が発生した箇所をより監視要素によって具体的に
識別し、オペレータの介在なしに最も適当な回復動作を
行うことを可能にする。【構成】コンピュータシステムは複数の複製されたユ
ニットを具備する。これらユニットの少なくとも２つ
が、システムの状態を監視するための監視要素を含む。
これら監視要素は、状態情報を交換するため相互に通信
を行い、これら監視要素の両方が両監視要素によって集
められた情報に基づいてシステムの状態の組み合わされ
た観点を形成できるようにする。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、故障許容(fault-toler
ant)コンピュータシステムに関する。

【０００２】

【従来の技術】故障許容性(fault tolerance)は、コン
ピュータシステム内においてシステムの要素を複製する
ことによって達成できることが知られている。例えば、
一方が現用ユニット(active unit)として機能し、他方
が待機ユニット(stand-by)として機能する２つの処理ユ
ニットを提供することができる。即ち、回復不可能な故
障が現用ユニット内において検出された場合、待機ユニ
ットが現用ユニットとして切り替えられ、システムの動
作を継続することができる。同様に、ディスクミラー化
システム(disk mirroring system)を使用してデータ格
納ユニットを複製することが知られている。

【０００３】

【発明が解決しようとする課題】このようなシステム内
においては、より適切な回復動作が行えるように、故障
の箇所をどのようにして正確に決定するかという問題が
発生するが、本発明の目的はかかる問題を解決するため
の新規の方法を提供することにある。

【０００４】

【課題を解決するための手段】本発明によると、複数の
相互接続されたユニットを具備するコンピュータシステ
ムが提供される。これらユニットのうち少なくとも２つ
が、システムの状態を監視する監視手段を有しており、
更にこれら監視手段は状態情報を交換するため相互に通
信を行う。それにより、これら監視手段の両方が、両監
視手段によって集められた情報に基づいてシステムの状
態の結合された観点(view)を形成することを可能にす
る。後に説明されるように、本発明は、故障を単にロー
カル的観点のみではなくシステムのグローバル的観点に
基づいて故障が識別されるべきことを可能にする。この
ようにして、故障が発生した箇所をより具体的に識別
し、オペレータの介在なしに最も適当な回復動作を行う
ことが可能となる。

【０００５】

【実施例】本発明による１つのコンピュータシステムの
一例について、以下、添付図面を参照しつつ説明する。

【０００６】図１に示されるように、このシステムは、
２つの処理ユニット１０及び１１を含む。これら処理シ
ステムの各々は、例えば、UNIXオペレーティングシステ
ムの下で動作(running)するICL DRS 6000プロセッサか
ら構成されていてもよい。これら処理ユニットは、両方
とも２つのデータ格納ユニット１２及び１３へのアクセ
スを有している。各データ格納ユニットは、例えば、複
数のディスクドライブを保持するキャビネットから構成
される。これらの処理ユニットは、１又は複数のローカ
ルエリアネットワーク(local area network: LAN)１４
によって相互接続されている。

【０００７】動作において、処理ユニット１０、１１の
一方は現用ユニット(active unit)として機能し、他方
は待機ユニット(stand-by)として機能する。現用処理ユ
ニットの失敗又は故障(failure)を示す故障状態(fault
condition)が検出されると、システムは他方の処理ユニ
ットを現用ユニットにするために切り替えられ、それに
よりシステムの動作を継続することができる。

【０００８】データ格納ユニット１２、１３はパラレル
に使用され、データはこれら２つのユニットの間でミラ
ー化(mirrored)される。このようしてデータ格納ユニッ
トの１つが故障した場合でもデータは存在し続け、シス
テム動作を継続することができる。また、これらユニッ
トの１つが故障した後でもミラー動作(mirror operatio
n)を継続することができるように、待機ユニットとして
更なるデータ格納ユニット（不図示）を提供することも
できる。

【０００９】処理ユニット１０、１１の各々は、ここで
は高可用性マネージャ(high availability manager: HA
M)と呼ばれるソフトウエア要素を動作させるが、これは
システム監視及び管理設備を提供するためである。

【００１０】図２は、HAMの一例を示す図である。HAM２
０は、複数のサブテストモジュール２１を含む。これら
のモジュールは、ローカルプロセッサ（即ち、HAMがそ
の中で動作するプロセッサ）及びこれに接続されたユニ
ットに関連する種々のチェックを行う。例えば、これら
のチェックには、プロセッサとデータ格納ユニットとの
間のインターフェースのチェックが含まれる。テストモ
ジュール２１は、一連の状態報告を生成する。後述する
ように、HAMはまた遠隔処理ユニット内のHAMからの状態
報告(status reports)を受信する。

【００１１】テストモジュール及び遠隔HAMから送られ
てきたこれらの状態報告は、UNIXパイプ２２により監視
要素２３に供給される。監視要素２３は、周期的に、即
ち２乃至３秒毎に動作してパイプ２２からの状態報告を
読み出し適当な動作を行う。監視要素２３はシステム状
態テーブル２４を維持する。システム状態テーブル２４
は、各サブテストについて、そのサブテストからの最新
の状態報告を含むエントリを保持する。各エントリは、
対応するサブテストから状態報告が受信されるごとに所
定の初期値にリセットされる年令値(age value)を含
む。状態テーブル２４内の全ての年令値は、監視要素２
３によって周期的に減分される。これにより、各年令値
は、対応する状態報告がどれ位長い間有効であったかを
示す。

【００１２】監視要素２３は、また複数のレコードを含
むコンフィギュレーションファイル２５へのアクセスも
持つ。各レコードは、１又は複数の状態報告の特定の組
合わせを指定し、またこの組合わせが発生した場合に行
われるべき動作を指定する。この動作には、例えば、オ
ペレータへのエラーメッセージの表示や幾つかの自動故
障回復動作の実行が含まれる。コンフィギュレーション
ファイル２５内の各レコードは、またオプションとし
て、動作がトリガされる前にその状態報告がどれ位長く
有効であるべきかを指定する時間値(time value)を含む
こともできる。これにより、他のプロセッサに特定の故
障状況に関する報告を転送するための時間を与えて、そ
の結果システムワイド(system-wide)の決定が故障位置
及びその故障に対して採られるべき動作に関して可能と
なる。ある状態報告は、状態テーブル内のその年令値が
この時間値よりも小さい場合に“熟した(mature)”と見
なされる。

【００１３】後に詳細に説明されるように、監視要素２
３はコンフィギュレーションファイル２５を走査し、状
態報告ファイル内の現在報告されている故障状態にマッ
チするレコードを見つける。レコードが発見された場合
は、そのレコードで指定された動作が行われる。

【００１４】図３は監視要素２３の動作を示すフロー図
であり、以下、同フロー図のステップに沿ってその動作
を説明する。

【００１５】ステップ(301)において、監視要素２３が
パイプ２２から状態報告を得る。

【００１６】ステップ(302)において、監視要素２３
は、すると、状態報告をそれが良い報告であるか悪い報
告であるか、即ちそれが新たな故障状態が検出されてい
ることを示すか否かを調べるためにチェックする。

【００１７】ステップ(303)において、状態報告が悪い
報告である場合には、その状態報告がローカル処理ユニ
ットからのものであるか又は遠隔処理ユニットからのも
のであるかを調べるためのチェックが行われる。

【００１８】ステップ(304)において、状態報告がロー
カル処理ユニットからのものである場合、その状態報告
を含むメッセージが生成され、LAN１４を通じて遠隔処
理ユニットに送られる。遠隔処理ユニット内のHAM２０
がこのメッセージを受信すると、その状態報告をそのパ
イプ２２に送る。

【００１９】ステップ(305)において、監視要素２３
は、次に、そのローカルな状態テーブル２４内の適当な
エントリを、そのエントリ内にその状態報告を書き込む
ことにより更新し、そのエントリの年令値をリセットす
る。

【００２０】ステップ(306)において、状態報告が良い
報告である場合には、監視要素２３はパイプ２２から次
の状態報告を得るためにステップ(301)に戻る。一方、
状態報告が悪い報告である場合には、以下のステップが
実行される。

【００２１】ステップ(307)において、コンフィギュレ
ーションファイル２５が開かれる。

【００２２】ステップ(308)において、そのコンフィギ
ュレーションファイル２５から１つのレコードが読み出
される。

【００２３】ステップ(309)において、状態テーブル２
４が、次に、そのレコードによって指定される特定の報
告又は報告の組合わせが存在するか否かを見い出すため
に調べられる。

【００２４】ステップ(310)において、状態報告の指定
された組合わせが存在する場合には、これら報告が熟し
ているか否か、即ちこれらが（存在する場合）コンフィ
ギュレーションファイル２５のレコード内で指定される
時間値よりも長時間に渡って有効であったか否かを知る
ためにチェックされる。これは、状態テーブル２４のエ
ントリ内の年令値をコンフィギュレーションファイル２
５のレコード内の時間値と比較する動作を含む。

【００２５】ステップ(311)において、報告が熟してい
る場合、監視要素２３はコンフィギュレーションファイ
ル２５のレコード内で指定されている動作を示すエラー
メッセージを生成する。そして状態テーブル２４内の関
連するエントリが“報告済(reported)”とマークされ
る。一旦報告済とマークされると、その状態が変化する
か又は削除されるまでエラー状態は監視要素２３によっ
て無視される。

【００２６】ステップ(312)において、コンフィギュレ
ーションファイル２５がその後閉じられ、監視要素２３
は次の状態報告を得るためステップ(301)に戻る。

【００２７】ステップ(313)において、状態報告の指定
された組合わせが存在しない場合、又はその報告がまだ
熟していない場合は、コンフィギュレーションファイル
２５の終端に達したか否かを調べるためのチェックが行
われる。終端に達してない場合には、監視要素２３はコ
ンフィギュレーションファイル２５からの次のレコード
を読み出すためステップ(308)に戻る。

【００２８】ステップ(314)において、コンフィギュレ
ーションファイルの終端に達した場合には、現在の状態
報告と関連して任意のレコードがコンフィギュレーショ
ンファイル２５内に発見されたか調べるためのチェック
が行われる。

【００２９】ステップ(315)において、有効なレコード
が発見されなかった場合は、認識されてない故障状態が
検出されたことを示すエラーメッセージが生成される。
そうすると、監視要素２３はコンフィギュレーションフ
ァイル２５を閉じて、次の状態報告を得るためにステッ
プ(312)に進む。

【００３０】要約すると、各HAMが故障の位置について
の決定をその状態報告ファイルの内容に基づいて行うこ
とがわかる。各状態報告ファイルは、両方のHAMによっ
て生成された状態報告を保持する。これにより、各HAM
は、ローカルテストモジュール２１によって集められた
ローカル情報のみならず、遠隔プロセッサ内のHAMから
送られた情報にも基づいて故障の分析をすることができ
る。従って、各HAMは、故障を単にローカル的な観点(vi
ew)からではなく、システムのグローバル的な観点(vie
w)に基づいて検出することができる。

【００３１】例えば、処理ユニットの１つがそのデータ
格納インターフェースの１つの上に故障を有する場合、
そのHAMは対応するデータ格納ユニットが消失したこと
を検出し、他方の処理ユニット内のHAMに状態報告メッ
セージを送り、他方のユニットにこのことを知らせる。
その一方、他方の処理ユニット内のHAMは、両方のデー
タ格納ユニットが正常に動作していることを検出し、第
１の処理ユニット内のHAMに状態報告メッセージを送
り、第１の処理ユニットにこの事実を知らせる。これに
より、両方のHAMがそれらの状態テーブル内の状態報告
から第１の処理ユニット上のデータ格納インターフェー
スが故障したことを推論でき、そして両方のHAMがこの
故障から回復するための適当な動作、例えば第２の処理
ユニットを現用プロセッサにするための切り替え動作を
行う。尚、HAM間の情報の交換なしには、いずれのHAMも
この故障の位置を識別することができないことに注意す
べきである。

【００３２】

【発明の効果】以上説明したように、本発明によると、
コンピュータシステムにおいて、故障が発生した箇所を
より具体的に識別し、オペレータの介在なしに最も適当
な回復動作を行うことが可能となる。

【図面の簡単な説明】

【図１】本発明を具現化する故障許容コンピュータシス
テム全体のブロック図である。

【図２】本発明による故障許容コンピュータシステムの
高可用性マネージャ(HAM)要素のブロック図である。

【図３】HAMの動作を示すフロー図である。

【符号の説明】

１０処理ユニット１１処理ユニット１２データ格納ユニット１３データ格納ユニット２０高可用性マネージャ（ＨＡＭ）２１テストモジュール２２パイプ２３監視要素２４システム状態テーブル２５コンフィギュレーションファイル

Claims

【特許請求の範囲】

【請求項１】コンピュータシステムにおいて、前記コ
ンピュータシステムが、 (a)第１及び第２の相互接続されたユニット、 (b)システムの状態の第１のローカル的観点を形成する
ためにシステムを監視する、前記第１のユニット内の第
１の監視手段、 (c)システムの状態の第２のローカル的観点を形成する
ためにシステムを監視する、前記第２のユニット内の第
２の監視手段、及び (d)前記第１及び第２の監視手段にシステムの状態のそ
れらの夫々対応するローカル的観点に関する情報を交換
することを許容するように前記第１及び第２の監視手段
を相互接続する相互接続手段を具備し、ここで (e)前記第１及び第２の監視手段の各々が、システムの
状態の結合されたグローバル的観点を形成するために前
記システムの状態の第１及び第２のローカル的観点を結
合する結合手段を更に具備することを特徴とするシステ
ム。
【請求項２】請求項１に記載のコンピュータシステム
において、 (a)前記監視手段の各々が複数の状態報告を保持する状
態テーブルを有し、これらの報告の幾つかはその監視手
段によってローカル的に生成され、これら報告のその他
は前記他方の監視手段によって生成され、更に(b)前記
監視手段の各々が、状態報告の所定の組合わせについて
その状態テーブルをサーチし、そして前記組合わせが検
出された場合所定の動作を開始する手段を有することを
特徴とするコンピュータシステム。
【請求項３】請求項２に記載のコンピュータシステム
において、前記所定の動作が、状態報告のある組合わせ
に対して、これらの状態報告が少なくとも所定の時間だ
け有効であった場合にのみ開始されることを特徴とする
コンピュータシステム。