JPH07191920A - コンピュータネットワーク - Google Patents
コンピュータネットワークInfo
- Publication number
- JPH07191920A JPH07191920A JP5331908A JP33190893A JPH07191920A JP H07191920 A JPH07191920 A JP H07191920A JP 5331908 A JP5331908 A JP 5331908A JP 33190893 A JP33190893 A JP 33190893A JP H07191920 A JPH07191920 A JP H07191920A
- Authority
- JP
- Japan
- Prior art keywords
- failure
- computer
- management
- fault
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Computer And Data Communications (AREA)
- Small-Scale Networks (AREA)
- Multi Processors (AREA)
Abstract
(57)【要約】
【目的】通信ネットワーク上の各コンピュータの障害の
排除および回復などを迅速に行う。 【構成】このコンピュータネットワークは、通信ネット
ワーク1に複数のコンピュータ2および障害管理コンピ
ュータ3を接続してなるものであって、障害管理コンピ
ュータ3は、障害情報の収集、障害発生状況の判断、障
害の排除および回復指示などを行う障害管理プログラム
4を有し、各コンピュータ2は、プログラム12からの
障害情報の受け取りそれをまとめて障害通知データを作
成し、障害管理コンピュータ3に送信する障害管理プロ
グラム9を有している。
排除および回復などを迅速に行う。 【構成】このコンピュータネットワークは、通信ネット
ワーク1に複数のコンピュータ2および障害管理コンピ
ュータ3を接続してなるものであって、障害管理コンピ
ュータ3は、障害情報の収集、障害発生状況の判断、障
害の排除および回復指示などを行う障害管理プログラム
4を有し、各コンピュータ2は、プログラム12からの
障害情報の受け取りそれをまとめて障害通知データを作
成し、障害管理コンピュータ3に送信する障害管理プロ
グラム9を有している。
Description
【0001】
【産業上の利用分野】本発明は、例えばローカル・エリ
ア・ネットワーク(LAN)などのコンピュータネット
ワークに関する。
ア・ネットワーク(LAN)などのコンピュータネット
ワークに関する。
【0002】
【従来の技術】一般に、コンピュータネットワークにお
いては、通信ネットワーク上のあるコンピュータに障害
が発生しても、その障害発生を検知する側の障害管理コ
ンピュータは定期的に問い合わせを行って障害を検知す
るようになっているため、そのときでなければ、障害を
検知できず、障害復旧に時間がかかっており迅速な対応
が望まれている。
いては、通信ネットワーク上のあるコンピュータに障害
が発生しても、その障害発生を検知する側の障害管理コ
ンピュータは定期的に問い合わせを行って障害を検知す
るようになっているため、そのときでなければ、障害を
検知できず、障害復旧に時間がかかっており迅速な対応
が望まれている。
【0003】従来のコンピュータネットワークは、通信
ネットワーク上に少なくとも1台の障害管理コンピュー
タと、複数の非管理コンピュータとを接続して構成され
ている。
ネットワーク上に少なくとも1台の障害管理コンピュー
タと、複数の非管理コンピュータとを接続して構成され
ている。
【0004】このネットワークの場合、障害管理コンピ
ュータは、複数の非管理コンピュータに対して定期的に
問い合わせを行って、非管理コンピュータのプログラム
実行記録などをチェックし、プログラムの実行状況や障
害の有無などを確認している。そして、そのとき、障害
発生などを検知すれば、オペレータに対してその障害発
生状況を通知するように制御されている。
ュータは、複数の非管理コンピュータに対して定期的に
問い合わせを行って、非管理コンピュータのプログラム
実行記録などをチェックし、プログラムの実行状況や障
害の有無などを確認している。そして、そのとき、障害
発生などを検知すれば、オペレータに対してその障害発
生状況を通知するように制御されている。
【0005】ところで、障害管理コンピュータが通信ネ
ットワーク上のある非管理コンピュータに対して定期確
認後、直ぐにその非管理コンピュータに障害が発生した
場合、障害管理コンピュータは一定時間経過するまで次
の確認を行わないことから、それまで障害の発生は検知
されず、障害管理コンピュータ側では障害の有無を認知
できない。
ットワーク上のある非管理コンピュータに対して定期確
認後、直ぐにその非管理コンピュータに障害が発生した
場合、障害管理コンピュータは一定時間経過するまで次
の確認を行わないことから、それまで障害の発生は検知
されず、障害管理コンピュータ側では障害の有無を認知
できない。
【0006】しかしながら、これでは、非管理コンピュ
ータの障害が大きい場合、例えばプログラムなどが停止
した場合や暴走した場合などは、障害発生の検知時間が
遅れるほどその非管理コンピュータ自身のプログラム処
理が遅れるだけでなく、その非管理コンピュータにも、
またその非管理コンピュータに接続されている他の資源
にも多大な影響を及ぼすことになる。
ータの障害が大きい場合、例えばプログラムなどが停止
した場合や暴走した場合などは、障害発生の検知時間が
遅れるほどその非管理コンピュータ自身のプログラム処
理が遅れるだけでなく、その非管理コンピュータにも、
またその非管理コンピュータに接続されている他の資源
にも多大な影響を及ぼすことになる。
【0007】
【発明が解決しようとする課題】このように上述した従
来のコンピュータネットワークでは、障害管理コンピュ
ータからの定期的な確認(一方的な問い合わせ)により
非管理コンピュータが管理されていたが、これでは、非
管理コンピュータに障害が発生した場合、障害管理コン
ピュータは確認時間が来るまで非管理コンピュータ側の
障害を認知できず、確認までの時間が長いほど障害の影
響が大きくなるという問題があった。
来のコンピュータネットワークでは、障害管理コンピュ
ータからの定期的な確認(一方的な問い合わせ)により
非管理コンピュータが管理されていたが、これでは、非
管理コンピュータに障害が発生した場合、障害管理コン
ピュータは確認時間が来るまで非管理コンピュータ側の
障害を認知できず、確認までの時間が長いほど障害の影
響が大きくなるという問題があった。
【0008】本発明はこのような課題を解決するために
なされたもので、非管理コンピュータに障害が発生した
場合、その障害に迅速に対応できるコンピュータネット
ワークを提供することを目的としている。
なされたもので、非管理コンピュータに障害が発生した
場合、その障害に迅速に対応できるコンピュータネット
ワークを提供することを目的としている。
【0009】
【課題を解決するための手段】本発明のコンピュータネ
ットワークは上記した目的を達成するために、通信ネッ
トワークに複数のコンピュータと、これらコンピュータ
を管理する管理コンピュータとを接続してなるコンピュ
ータネットワークにおいて、前記各コンピュータが、所
定の処理を実行すると共に実行中の処理に障害が発生し
た場合、その障害の情報を出力する処理手段と、この処
理手段により出力された障害情報を受け取り、前記障害
情報に自身の資源名を対応させて障害通知情報を作成
し、前記管理コンピュータに送信する障害通知手段を具
備し、前記管理コンピュータが、前記各コンピュータか
らの前記障害通知情報を収集し、各障害通知情報を基に
前記各コンピュータの障害発生状況を判断する障害管理
手段を具備している。
ットワークは上記した目的を達成するために、通信ネッ
トワークに複数のコンピュータと、これらコンピュータ
を管理する管理コンピュータとを接続してなるコンピュ
ータネットワークにおいて、前記各コンピュータが、所
定の処理を実行すると共に実行中の処理に障害が発生し
た場合、その障害の情報を出力する処理手段と、この処
理手段により出力された障害情報を受け取り、前記障害
情報に自身の資源名を対応させて障害通知情報を作成
し、前記管理コンピュータに送信する障害通知手段を具
備し、前記管理コンピュータが、前記各コンピュータか
らの前記障害通知情報を収集し、各障害通知情報を基に
前記各コンピュータの障害発生状況を判断する障害管理
手段を具備している。
【0010】またこのコンピュータネットワークの前記
管理コンピュータは、前記障害管理手段により判断され
た前記各コンピュータの障害発生状況に応じて、対応す
る前記コンピュータに障害の排除および回復を指示する
指示手段をさらに具備している。さらにこのコンピュー
タネットワークの前記各コンピュータは、前記通信ネッ
トワークを通じて前記指示手段からの障害に対する排除
および回復指示を受信し、その指示を対応する資源に与
える障害排除および回復手段をさらに具備している。
管理コンピュータは、前記障害管理手段により判断され
た前記各コンピュータの障害発生状況に応じて、対応す
る前記コンピュータに障害の排除および回復を指示する
指示手段をさらに具備している。さらにこのコンピュー
タネットワークの前記各コンピュータは、前記通信ネッ
トワークを通じて前記指示手段からの障害に対する排除
および回復指示を受信し、その指示を対応する資源に与
える障害排除および回復手段をさらに具備している。
【0011】またこのコンピュータネットワークは、通
信ネットワークに複数のコンピュータと、これらコンピ
ュータを管理する管理コンピュータとを接続してなるコ
ンピュータネットワークにおいて、前記各コンピュータ
が、内部で動作するプログラムの稼働状況を監視し、障
害が発生した場合、その障害の内容に自身の資源名を対
応させて障害通知情報を作成し前記通信ネットワーク上
の前記管理コンピュータに送信する障害通知手段と、前
記管理コンピュータが、前記障害通知手段からの障害通
知情報を受信する受信手段と、前記障害通知情報を解読
するために、予め前記障害の内容に対応付けて適用する
障害の排除および回復動作が登録された登録手段と、前
記受信手段により前記障害通知情報が受信されたとき、
前記障害通知情報と前記登録手段とを対応させて適用す
る障害の排除および回復動作を指示する指示手段と、前
記受信手段により受信された障害通知情報を保存する保
存手段とを具備している。
信ネットワークに複数のコンピュータと、これらコンピ
ュータを管理する管理コンピュータとを接続してなるコ
ンピュータネットワークにおいて、前記各コンピュータ
が、内部で動作するプログラムの稼働状況を監視し、障
害が発生した場合、その障害の内容に自身の資源名を対
応させて障害通知情報を作成し前記通信ネットワーク上
の前記管理コンピュータに送信する障害通知手段と、前
記管理コンピュータが、前記障害通知手段からの障害通
知情報を受信する受信手段と、前記障害通知情報を解読
するために、予め前記障害の内容に対応付けて適用する
障害の排除および回復動作が登録された登録手段と、前
記受信手段により前記障害通知情報が受信されたとき、
前記障害通知情報と前記登録手段とを対応させて適用す
る障害の排除および回復動作を指示する指示手段と、前
記受信手段により受信された障害通知情報を保存する保
存手段とを具備している。
【0012】
【作用】本発明では、各コンピュータが自身に発生した
障害を能動的に障害管理コンピュータに通知し、その障
害を通知された障害管理コンピュータはその障害通知情
報を基に指示動作とその補助動作、例えば保存手段に障
害通知情報を保存するなどを行う。
障害を能動的に障害管理コンピュータに通知し、その障
害を通知された障害管理コンピュータはその障害通知情
報を基に指示動作とその補助動作、例えば保存手段に障
害通知情報を保存するなどを行う。
【0013】したがって、各コンピュータに発生した障
害の排除および回復などの処理を迅速に行えるようにな
る。
害の排除および回復などの処理を迅速に行えるようにな
る。
【0014】
【実施例】以下、本発明の実施例を図面を参照して詳細
に説明する。
に説明する。
【0015】図1は本発明に係る一実施例のコンピュー
タネットワークの構成を示す図である。
タネットワークの構成を示す図である。
【0016】図1において、1は通信ネットワークであ
る。2は通信ネットワーク1に接続された複数のコンピ
ュータであり、各コンピュータ2は自身にインスツール
されたプログラムを実行する。3は通信ネットワーク1
に接続された障害管理コンピュータであり、通信ネット
ワーク1上の各コンピュータ2を定期的に監視し、ネッ
トワーク全体を管理する。4は障害管理コンピュータ3
にインスツールされた障害管理プログラムであり、障害
情報の収集、障害発生状況の判断、障害の排除および回
復などを行う。5は障害管理プログラムの中の障害判断
部であり、障害発生状況の判断を行う。6は障害情報で
あり、障害判断部5によって判断された例えば障害発生
状況のデータや障害そのもののデータである。7は障害
情報が記憶・保存される記憶装置である。8はデータベ
ースであり、障害管理プログラム4が障害発生状況に応
じて実行すべき処理内容が登録されている対応テーブル
を有している。9は上記複数の中の1つのコンピュータ
にインスツールされた障害管理プログラムであり、自コ
ンピュータ内のプログラムについてその稼働状況の監
視、すなわちプログラムからの障害情報の受取り、プロ
グラムからの通常の出力情報の読取りなどを行って、そ
れをまとめて障害通知データを作成し、障害管理コンピ
ュータに送信する。またこの障害管理プログラム9は、
障害管理コンピュータから障害の排除指示や回復指示な
どを受取り、その指示に従って、例えばプログラムの強
制終了や停止したプログラムの起動などを行う。10は
障害管理プログラムの中の障害情報作成部であり、該障
害通知情報を作成する。11は障害管理プログラムの中
の障害排除および回復処理部であり、指示内容に基づ
き、対応するプログラムの障害を排除および回復などを
行う。12はコンピュータ内にインスツールされている
プログラムであり、自身に障害が発生した場合、自身で
能動的に障害情報を検知し障害管理プログラム9に出力
する。
る。2は通信ネットワーク1に接続された複数のコンピ
ュータであり、各コンピュータ2は自身にインスツール
されたプログラムを実行する。3は通信ネットワーク1
に接続された障害管理コンピュータであり、通信ネット
ワーク1上の各コンピュータ2を定期的に監視し、ネッ
トワーク全体を管理する。4は障害管理コンピュータ3
にインスツールされた障害管理プログラムであり、障害
情報の収集、障害発生状況の判断、障害の排除および回
復などを行う。5は障害管理プログラムの中の障害判断
部であり、障害発生状況の判断を行う。6は障害情報で
あり、障害判断部5によって判断された例えば障害発生
状況のデータや障害そのもののデータである。7は障害
情報が記憶・保存される記憶装置である。8はデータベ
ースであり、障害管理プログラム4が障害発生状況に応
じて実行すべき処理内容が登録されている対応テーブル
を有している。9は上記複数の中の1つのコンピュータ
にインスツールされた障害管理プログラムであり、自コ
ンピュータ内のプログラムについてその稼働状況の監
視、すなわちプログラムからの障害情報の受取り、プロ
グラムからの通常の出力情報の読取りなどを行って、そ
れをまとめて障害通知データを作成し、障害管理コンピ
ュータに送信する。またこの障害管理プログラム9は、
障害管理コンピュータから障害の排除指示や回復指示な
どを受取り、その指示に従って、例えばプログラムの強
制終了や停止したプログラムの起動などを行う。10は
障害管理プログラムの中の障害情報作成部であり、該障
害通知情報を作成する。11は障害管理プログラムの中
の障害排除および回復処理部であり、指示内容に基づ
き、対応するプログラムの障害を排除および回復などを
行う。12はコンピュータ内にインスツールされている
プログラムであり、自身に障害が発生した場合、自身で
能動的に障害情報を検知し障害管理プログラム9に出力
する。
【0017】以下、図2〜図4を参照してこのコンピュ
ータネットワークの動作を説明する。 図2は各コンピ
ュータにより作成される障害通知データの構成を示す
図、図3は図2の障害通知データの構成中の障害情報文
字列の一例を示す図、図4はデータベースの対応テーブ
ルの内容を示す図である。
ータネットワークの動作を説明する。 図2は各コンピ
ュータにより作成される障害通知データの構成を示す
図、図3は図2の障害通知データの構成中の障害情報文
字列の一例を示す図、図4はデータベースの対応テーブ
ルの内容を示す図である。
【0018】このコンピュータネットワークの場合、障
害管理コンピュータ3は、通信ネットワーク1上の各コ
ンピュータ2を監視している。またコンピュータ2(非
管理コンピュータ)の障害管理プログラム9は自コンピ
ュータ内のプログラム12から何らかの情報が入力され
ることを待機している。
害管理コンピュータ3は、通信ネットワーク1上の各コ
ンピュータ2を監視している。またコンピュータ2(非
管理コンピュータ)の障害管理プログラム9は自コンピ
ュータ内のプログラム12から何らかの情報が入力され
ることを待機している。
【0019】ここで、プログラム12より、例えばプロ
グラム9が実行していた処理が何らかの原因で停止して
いるという障害情報などの情報が出力され、それを待機
状態にある障害管理プログラム9が受信すると、障害管
理プログラム9はその障害情報を基に、図2に示すよう
に、自身が動作している資源名、つまりコンピュータ名
21、障害が発生した自身のプログラム名22、障害情
報文字列(任意の文字列)23などから構成される障害
通知データを作成する。
グラム9が実行していた処理が何らかの原因で停止して
いるという障害情報などの情報が出力され、それを待機
状態にある障害管理プログラム9が受信すると、障害管
理プログラム9はその障害情報を基に、図2に示すよう
に、自身が動作している資源名、つまりコンピュータ名
21、障害が発生した自身のプログラム名22、障害情
報文字列(任意の文字列)23などから構成される障害
通知データを作成する。
【0020】この障害通知データの障害情報文字列は、
非管理コンピュータ2に発生した内容を記述した任意の
文字列であり、図3に示すように、例えばプログラムの
処理が停止した場合は、“停止”、プログラムが終了し
た場合、“終了”、障害をメッセージ形式で示す場合
“障害:XXXX発生”、他のプログラムに対する起動
要求であれば“プログラムXを起動せよ”、コンピュー
タ2に接続されている磁気ディスク装置などの不具合で
あれば、“ディスクXXXXにXXX発生”などと記述
され、その情報内容に対応した文字列が記述される。
非管理コンピュータ2に発生した内容を記述した任意の
文字列であり、図3に示すように、例えばプログラムの
処理が停止した場合は、“停止”、プログラムが終了し
た場合、“終了”、障害をメッセージ形式で示す場合
“障害:XXXX発生”、他のプログラムに対する起動
要求であれば“プログラムXを起動せよ”、コンピュー
タ2に接続されている磁気ディスク装置などの不具合で
あれば、“ディスクXXXXにXXX発生”などと記述
され、その情報内容に対応した文字列が記述される。
【0021】コンピュータ2の障害管理プログラム9は
上記障害通知データを作成すると、障害通知データを通
信ネットワーク1に送出する。
上記障害通知データを作成すると、障害通知データを通
信ネットワーク1に送出する。
【0022】一方、障害管理コンピュータ3は通信ネッ
トワーク上の各コンピュータ2を監視しており、通信ネ
ットワーク1を通じて障害管理プログラム4に障害通知
データが受信される。
トワーク上の各コンピュータ2を監視しており、通信ネ
ットワーク1を通じて障害管理プログラム4に障害通知
データが受信される。
【0023】すると、障害管理プログラム4の障害判断
部5は、受信した障害通知データを記憶装置7に記憶す
ると共にその内容を解析する。
部5は、受信した障害通知データを記憶装置7に記憶す
ると共にその内容を解析する。
【0024】障害判断部5は、障害通知データの内容を
解析する場合、まず、障害通知データより障害情報文字
列23、つまり“停止”を抽出し、図4に示すように、
データベース8の対応テーブル41の内容と照らし合わ
せ、最適な動作を実行するコマンドを取り出す。この対
応テーブル41には、発生し得る障害情報(“停止”、
“終了”、“障害:XXXX発生”、“プログラムXを
起動せよ”、“ディスクXXXXにXXX発生”)など
の文字列に対応させて動作指示コマンド(シグナルXを
送信、次のプログラムを起動、なし、指定プログラムを
起動、なし)などが登録されており、この実施例のよう
に、例えば“停止”という文字列が抽出されると、この
対応テーブル41により「シグナルXを送信」というコ
マンド名が取り出される。
解析する場合、まず、障害通知データより障害情報文字
列23、つまり“停止”を抽出し、図4に示すように、
データベース8の対応テーブル41の内容と照らし合わ
せ、最適な動作を実行するコマンドを取り出す。この対
応テーブル41には、発生し得る障害情報(“停止”、
“終了”、“障害:XXXX発生”、“プログラムXを
起動せよ”、“ディスクXXXXにXXX発生”)など
の文字列に対応させて動作指示コマンド(シグナルXを
送信、次のプログラムを起動、なし、指定プログラムを
起動、なし)などが登録されており、この実施例のよう
に、例えば“停止”という文字列が抽出されると、この
対応テーブル41により「シグナルXを送信」というコ
マンド名が取り出される。
【0025】そして障害判断部5は、障害通知データよ
りコンピュータ名およびプログラム名を参照してその宛
先に対して、取り出したコマンドの処理、つまりプログ
ラム12の処理停止を回復するための信号であるシグナ
ルXを送信する処理を実行する。なお上記対応テーブル
41で「なし」が取り出された場合、障害判断部5は、
コンピュータ2に対する処理を何も実行しない。
りコンピュータ名およびプログラム名を参照してその宛
先に対して、取り出したコマンドの処理、つまりプログ
ラム12の処理停止を回復するための信号であるシグナ
ルXを送信する処理を実行する。なお上記対応テーブル
41で「なし」が取り出された場合、障害判断部5は、
コンピュータ2に対する処理を何も実行しない。
【0026】これにより、通信ネットワーク1を通じて
シグナルXが送信されてくると、宛先であるコンピュー
タ2の障害管理プログラム9はそれを受信し、障害排除
および回復処理部は障害の排除および回復処理、つまり
そのシグナルXをプログラム12に与えプログラムを再
起動させる処理を実行する。
シグナルXが送信されてくると、宛先であるコンピュー
タ2の障害管理プログラム9はそれを受信し、障害排除
および回復処理部は障害の排除および回復処理、つまり
そのシグナルXをプログラム12に与えプログラムを再
起動させる処理を実行する。
【0027】このように本実施例のコンピュータネット
ワークによれば、通信ネットワーク1に接続された障害
管理コンピュータ3に対して各コンピュータ2が自身の
障害発生内容を能動的に通知するので、障害を通知され
た障害管理コンピュータ3はその通知内容に基づいて即
座に最適な動作を指示、例えば処理停止したコンピュー
タ2のプログラム12を再起動させるようになり、障害
の排除および回復などが迅速に行えるようになる。
ワークによれば、通信ネットワーク1に接続された障害
管理コンピュータ3に対して各コンピュータ2が自身の
障害発生内容を能動的に通知するので、障害を通知され
た障害管理コンピュータ3はその通知内容に基づいて即
座に最適な動作を指示、例えば処理停止したコンピュー
タ2のプログラム12を再起動させるようになり、障害
の排除および回復などが迅速に行えるようになる。
【0028】またコンピュータ2から受信した障害通知
データは、記憶装置7内に保存されるので、オペレータ
がそれを呼び出して障害発生の原因を調査することもで
きる。 次に、図5を参照して他の実施例について説明
する。
データは、記憶装置7内に保存されるので、オペレータ
がそれを呼び出して障害発生の原因を調査することもで
きる。 次に、図5を参照して他の実施例について説明
する。
【0029】上記実施では、コンピュータ2のプログラ
ムとして、自身で障害を検出する能動型のプログラム1
2の場合について説明したが、これ以外に、例えば障害
管理プログラム9によってその稼働状況が監視されるプ
ログラム51などの場合、障害管理プログラム9がプロ
グラム51を極めて短い時間で定期監視する。
ムとして、自身で障害を検出する能動型のプログラム1
2の場合について説明したが、これ以外に、例えば障害
管理プログラム9によってその稼働状況が監視されるプ
ログラム51などの場合、障害管理プログラム9がプロ
グラム51を極めて短い時間で定期監視する。
【0030】この場合、障害管理プログラム9はプログ
ラム51が処理を実行しているか否か(停止または終
了)程度の大まかな監視を行うことにより、その2つの
障害に対してタイムリーな対応を取ることができる。
ラム51が処理を実行しているか否か(停止または終
了)程度の大まかな監視を行うことにより、その2つの
障害に対してタイムリーな対応を取ることができる。
【0031】また障害管理コンピュータ3がネットワー
ク上の各コンピュータ2を定期的に監視していることを
知らない従来のプログラム52の場合、通常、プログラ
ム52の実行過程で生じた障害の情報は何らかの形でデ
ータ保存手段53に保存されるので、障害管理プログラ
ム9がそのデータ保存手段53を上記同様に極めて短い
時間で定期的にアクセスすることにより障害情報を読み
出せるので、障害に対する対応はオペレータとなるが上
記同様に障害に対してタイムリーな対応を取ることがで
きる。
ク上の各コンピュータ2を定期的に監視していることを
知らない従来のプログラム52の場合、通常、プログラ
ム52の実行過程で生じた障害の情報は何らかの形でデ
ータ保存手段53に保存されるので、障害管理プログラ
ム9がそのデータ保存手段53を上記同様に極めて短い
時間で定期的にアクセスすることにより障害情報を読み
出せるので、障害に対する対応はオペレータとなるが上
記同様に障害に対してタイムリーな対応を取ることがで
きる。
【0032】
【発明の効果】以上説明したように本発明のコンピュー
タネットワークによれば、ネットワーク上の各コンピュ
ータが自身の障害を能動的に障害管理コンピュータに通
知し、障害管理コンピュータはその通知に基づいて最適
な指示動作を即座に実行するので、障害の排除および回
復などの対応が迅速に行えるようになる。
タネットワークによれば、ネットワーク上の各コンピュ
ータが自身の障害を能動的に障害管理コンピュータに通
知し、障害管理コンピュータはその通知に基づいて最適
な指示動作を即座に実行するので、障害の排除および回
復などの対応が迅速に行えるようになる。
【図面の簡単な説明】
【図1】本発明に係る一実施例のコンピュータネットワ
ークの構成を示す図である。
ークの構成を示す図である。
【図2】このコンピュータネットワークにおいて各コン
ピュータにより作成される障害通知データの構成を示す
図である。
ピュータにより作成される障害通知データの構成を示す
図である。
【図3】図2の障害通知データの構成中の障害情報文字
列の一例を示す図である。
列の一例を示す図である。
【図4】データベースの対応テーブルの内容を示す図で
ある。
ある。
【図5】本発明のコンピュータネットワークにおいて他
の実施例の構成を示す図である。
の実施例の構成を示す図である。
1…通信ネットワーク、2…コンピュータ、3…障害管
理コンピュータ、4…障害管理プログラム、5…障害管
理プログラム4の中の障害判断部、6…障害情報、7…
記憶装置、8…データベース、9…障害管理プログラ
ム、10…障害管理プログラム9の中の障害情報作成
部、11…障害管理プログラム9の中の障害排除および
回復処理部、12…コンピュータ2のプログラム。
理コンピュータ、4…障害管理プログラム、5…障害管
理プログラム4の中の障害判断部、6…障害情報、7…
記憶装置、8…データベース、9…障害管理プログラ
ム、10…障害管理プログラム9の中の障害情報作成
部、11…障害管理プログラム9の中の障害排除および
回復処理部、12…コンピュータ2のプログラム。
Claims (4)
- 【請求項1】 通信ネットワークに複数のコンピュータ
と、これらコンピュータを管理する管理コンピュータと
を接続してなるコンピュータネットワークにおいて、 前記各コンピュータが、 所定の処理を実行すると共に実行中の処理に障害が発生
した場合、その障害の情報を出力する処理手段と、 この処理手段により出力された障害情報を受け取り、前
記障害情報に自身の資源名を対応させて障害通知情報を
作成し、前記管理コンピュータに送信する障害通知手段
を具備し、 前記管理コンピュータが、 前記各コンピュータからの前記障害通知情報を収集し、
各障害通知情報を基に前記各コンピュータの障害発生状
況を判断する障害管理手段を具備したことを特徴とする
コンピュータネットワーク。 - 【請求項2】 請求項1記載のコンピュータネットワー
クにおいて、 前記管理コンピュータが、 前記障害管理手段により判断された前記各コンピュータ
の障害発生状況に応じて、対応する前記コンピュータに
障害の排除および回復を指示する指示手段をさらに具備
したことを特徴とするコンピュータネットワーク。 - 【請求項3】 請求項2記載のコンピュータネットワー
クにおいて、 前記各コンピュータが、 前記通信ネットワークを通じて前記指示手段からの障害
に対する排除および回復指示を受信し、その指示を対応
する資源に与える障害排除および回復手段をさらに具備
したことを特徴とするコンピュータネットワーク。 - 【請求項4】 通信ネットワークに複数のコンピュータ
と、これらコンピュータを管理する管理コンピュータと
を接続してなるコンピュータネットワークにおいて、 前記各コンピュータが、 内部で動作するプログラムの稼働状況を監視し、障害が
発生した場合、その障害の内容に自身の資源名を対応さ
せて障害通知情報を作成し前記通信ネットワーク上の前
記管理コンピュータに送信する障害通知手段と、 前記管理コンピュータが、 前記障害通知手段からの障害通知情報を受信する受信手
段と、 前記障害通知情報を解読するために、予め前記障害の内
容に対応付けて適用する障害の排除および回復動作が登
録された登録手段と、 前記受信手段により前記障害通知情報が受信されたと
き、前記障害通知情報と前記登録手段とを対応させて適
用する障害の排除および回復動作を指示する指示手段
と、 前記受信手段により受信された障害通知情報を保存する
保存手段とを具備したことを特徴とするコンピュータネ
ットワーク。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5331908A JPH07191920A (ja) | 1993-12-27 | 1993-12-27 | コンピュータネットワーク |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5331908A JPH07191920A (ja) | 1993-12-27 | 1993-12-27 | コンピュータネットワーク |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH07191920A true JPH07191920A (ja) | 1995-07-28 |
Family
ID=18248984
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP5331908A Pending JPH07191920A (ja) | 1993-12-27 | 1993-12-27 | コンピュータネットワーク |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH07191920A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002135438A (ja) * | 2000-10-19 | 2002-05-10 | Japan Science & Technology Corp | 携帯電話端末機によるコンピュータ・ネットワーク遠隔監視システム |
| JP2006165909A (ja) * | 2004-12-06 | 2006-06-22 | Allied Telesis Holdings Kk | ネットワーク監視装置、ネットワーク監視方法、及びネットワーク監視プログラム |
-
1993
- 1993-12-27 JP JP5331908A patent/JPH07191920A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002135438A (ja) * | 2000-10-19 | 2002-05-10 | Japan Science & Technology Corp | 携帯電話端末機によるコンピュータ・ネットワーク遠隔監視システム |
| JP2006165909A (ja) * | 2004-12-06 | 2006-06-22 | Allied Telesis Holdings Kk | ネットワーク監視装置、ネットワーク監視方法、及びネットワーク監視プログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6397244B1 (en) | Distributed data processing system and error analysis information saving method appropriate therefor | |
| JP5286942B2 (ja) | 制御方法、制御プログラム及び情報処理装置 | |
| US6434605B1 (en) | Automatic detection and recovery for problems arising with interconnected queue managers | |
| US20080244307A1 (en) | Method to avoid continuous application failovers in a cluster | |
| US20080288812A1 (en) | Cluster system and an error recovery method thereof | |
| CN113825164A (zh) | 网络故障修复方法、装置、存储介质及电子设备 | |
| CN108833190A (zh) | 一种nfs服务故障告警方法、装置和存储介质 | |
| JP2012003651A (ja) | 仮想化環境監視装置とその監視方法およびプログラム | |
| JP2002024039A (ja) | ソフトウェア管理システム | |
| JP2001005692A (ja) | 計算機システムおよびその保守管理システム並びに障害通知方法 | |
| US5583986A (en) | Apparatus for and method of duplex operation and management for signalling message exchange no. 1 system | |
| JPH07191920A (ja) | コンピュータネットワーク | |
| CN115242820B (zh) | 一种集群节点故障处理方法、装置、设备及介质 | |
| CN111666178A (zh) | 一种安全监控方法及其系统 | |
| WO2024098938A1 (zh) | 网络存储功能故障检测及容灾方法及相关设备 | |
| JP3691272B2 (ja) | 分散処理システムおよび障害解析情報の保存方法 | |
| CN118631545A (zh) | 分布式节点的隔离方法及装置 | |
| JP3757072B2 (ja) | ネットワークシステムを構成する計算機の監視方法 | |
| JPH10260870A (ja) | システム起動/終了制御装置 | |
| JPH11272507A (ja) | 監視情報通報システムおよびそのプログラム記録媒体 | |
| JP2000092054A (ja) | ネットワークシステム | |
| JPH0291735A (ja) | リモート障害保守管理システム | |
| US20060248531A1 (en) | Information processing device, information processing method and computer-readable medium having information processing program | |
| JPH10247961A (ja) | 申告故障対応方法とその設備オペレーションシステム | |
| JP2007058679A (ja) | プロセス管理システム、プロセス管理方法及び冗長システム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20031202 |