JP3147811B2 - 多数の情報処理装置からなるシステムにおける障害検出方式 - Google Patents

多数の情報処理装置からなるシステムにおける障害検出方式

Info

Publication number
JP3147811B2
JP3147811B2 JP09651397A JP9651397A JP3147811B2 JP 3147811 B2 JP3147811 B2 JP 3147811B2 JP 09651397 A JP09651397 A JP 09651397A JP 9651397 A JP9651397 A JP 9651397A JP 3147811 B2 JP3147811 B2 JP 3147811B2
Authority
JP
Japan
Prior art keywords
information processing
test diagnosis
test
diagnosis
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP09651397A
Other languages
English (en)
Other versions
JPH10283216A (ja
Inventor
弘介 金光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP09651397A priority Critical patent/JP3147811B2/ja
Publication of JPH10283216A publication Critical patent/JPH10283216A/ja
Application granted granted Critical
Publication of JP3147811B2 publication Critical patent/JP3147811B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は多数の情報処理装置
からなるシステムにおける障害検出方式に関し、特に、
情報処理装置間を巡回して試験診断を実行する障害検出
方式に関する。
【0002】
【従来の技術】多数の情報処理装置からなるシステムに
おける情報処理装置間の接続方法には従来、数多くの方
法が用いられている。
【0003】ところで、システムにおける情報処理装置
の台数が多くなると、全ての情報処理装置を相互に接続
した場合、コストが高くなってしまい、且つ、構造が複
雑になってしまうことから、通常、複数の情報処理装置
をグループに分け、各グループ内の情報処理装置につい
て全て相互接続する、という方式が用いられる。
【0004】このようなシステムにおける障害監視とし
ては、グループ内で一定時間毎に情報処理装置間の相互
監視を行い、障害を検出すると、隣のグループに障害を
報告する、という方法がとられている。
【0005】
【発明が解決しようとする課題】しかしながら、複数の
情報処理装置を複数のグループに分け、各グループ内の
情報処理装置を相互接続する、という従来の接続方式で
は、グループ間を接続する手段に障害が発生すると、あ
るグループから他のグループへの障害の報告ができず、
障害が発生した情報処理装置のグループ以外のグループ
は、システム内で障害が発生したことを検出できないた
めに、システムとしての可用性が保証できない、ことに
なる。
【0006】この問題点を防ぐ方法として、全ての情報
処理装置を相互に接続するという方法もあるが、上述し
たように、多数の情報処理装置からなるシステムの場合
には、コストが非常に高くなってしまうことや、接続方
式が非常に複雑になってしまうという問題があり、現実
的な解ではなかった(すなわち実際上採用することは困
難である)。
【0007】また、1つのグループ内の情報処理装置を
全て相互に接続する必要があるため、1グループあたり
の情報処理装置数の上限など、情報処理装置の接続方法
に制約があり、構成の変化に対して柔軟に対応できな
い、という別の問題点も有している。
【0008】したがって、本発明は、上記問題点に鑑み
てなされたものであって、その目的は、上記問題点を解
消し、多数の情報処理装置からなる大規模なシステムに
おいて、全ての情報処理装置において必ず試験診断を実
行することにより速やかに障害の検出を行うと共に、障
害によりシステム内の情報処理装置が分断された場合で
あっても、分断されたそれぞれの情報処理装置の障害を
検出することができ、且つ性能低下を抑止し、高い可用
性をもったシステムを実現する障害検出方式を提供する
ことにある。
【0009】本発明の他の目的は、隣接する情報処理装
置のみを接続する方式をとることにより、情報処理装置
の数などの構成の変化に柔軟なシステムを実現可能とし
た障害検出方式を提供することにある。
【0010】
【課題を解決するための手段】前記目的を達成するた
め、本発明の障害検出方式は、複数の情報処理装置を含
むシステムにおいて、各情報処理装置が、自情報処理装
置の試験診断を実行する手段と、前記自情報処理装置の
試験診断の実行結果を報告する手段と、他の情報処理装
置に試験診断の実行を指示する手段と、前記他情報処理
装置における試験診断の実行の結果を監視する手段と、
前記自情報処理装置における試験診断の実行の時間間隔
を監視する手段と、自装置において試験診断実行中
ときに、他の情報処理装置から試験診断の実行の指示
受けた場合、新たに他の情報処理装置に対する試験診断
の実行を指示することなく、現在実行中の前記試験診断
へ集約する手段と、を含むことを特徴とする。
【0011】本発明の障害検出方式においては、複数の
情報処理装置を含むシステムの障害検出方式において、
ある情報処理装置から試験診断の実行の指示を受けた他
の情報処理装置は、自装置の試験診断を実行し試験診断
結果を前記試験診断の実行の指示を発行した前記情報処
理装置に返却し、前記試験診断の実行の指示を発行した
前記情報処理装置は、前記他の情報処理装置からの試験
診断結果の報告を受け、該報告の内容が異常である場
合、もしくは所定の監視時間内に前記他の情報処理装置
から試験診断結果の報告を受け取らない場合には、前記
他の情報処理装置は障害と判断し、障害と判断された前
記情報処理装置以外の他の情報処理装置に対して試験診
断の実行の指示を送出し、一方、前記他の情報処理装置
から前記監視時間内に受け取った試験診断結果の報告の
内容が正常である場合には、試験診断が正常に巡回して
いるものと判断して次の試験診断の実行の待ち状態とな
り、前記各情報処理装置は、自装置において一定時間試
験診断が実行されていないことを検出した場合に、自動
的に自装置の試験診断の実行を開始し、更に、前記各情
報処理装置は、自装置の試験診断の実行中に、更に別に
試験診断の実行指示を受けた場合、これら複数の試験診
断を、現在実行中の一つの試験診断に集約する、ことを
特徴とする。
【0012】[発明の概要]本発明において、情報処理
装置は、他の情報処理装置から診断の実行を指示受ける
ことにより試験診断を行い、試験診断を行ったら指示を
受けた情報処理装置に試験診断実行結果を返し、試験診
断の実行指示を行った情報処理装置以外の他の情報処理
装置に対して、試験診断の実行を指示する。そして、他
の情報処理装置に対して、試験診断実行を指示した情報
処理装置は、上記他の情報処理装置の試験診断の実行結
果を監視する。
【0013】また、情報処理装置は、一定時間試験診断
が実行されていないことを検出したら、自動的に自己の
試験診断の実行を開始する。
【0014】そして、情報処理装置が、自己の試験診断
の実行中に、試験診断の実行指示を受けた場合、すなわ
ち、一つの情報処理装置に対して、複数の試験診断の指
示が重なった場合、後から指示された試験診断に対して
は、連鎖的に他の情報処理装置に対する試験診断の開始
を指示することは行わず、これにより、複数の試験診断
を一つに集約する。
【0015】
【発明の実施の形態】次に本発明の実施の形態について
図面を参照して詳細に説明する。
【0016】図1は、本発明の実施の形態の構成を示す
ブロック図である。図1を参照すると、本発明の第1の
実施の形態は、複数(n台)の情報処理装置1−1、1
−2…、1−nから構成されている。
【0017】図1を参照して、各情報処理装置1−1、
…、1−nは、いずれも、他の情報処理装置との通信を
行う通信制御手段11と、自情報処理装置が正常に動作
することを確認する試験診断制御手段12と、自情報処
理装置において試験診断が実行された時間間隔を監視す
る試験診断実行間隔監視手段13と、を備えている。
【0018】図2は、図1に示した通信制御手段11の
構成を示すブロック図である。図2を参照すると、通信
制御手段11は、指示受信手段111と、試験起動手段
112と、終了報告送信手段113と、指示送信手段1
14と、終了報告監視手段115と、を備えている。
【0019】指示受信手段111は、他の情報処理装置
から送られてくる試験診断実行指示の受け付けを行う。
【0020】試験診断起動手段112は、指示受信手段
111が試験診断実行指示を受け付けると、試験診断制
御手段12の起動を行う。
【0021】終了報告手段113は、試験診断制御手段
12による試験診断の実行結果の報告を、試験診断の実
行指示を発した情報処理装置に対して行う。
【0022】指示送信手段114は、自情報処理装置の
試験診断の実行が終了した後に、適切なアルゴリズムに
従って全情報処理装置に対して試験診断が実行されるよ
うに、試験診断の指示を受けた情報処理装置以外の情報
処理装置に対して、試験診断の実行を指示する。
【0023】終了報告監視手段115は、試験診断の実
行を指示した先の情報処理装置の報告を待ち合わせ、報
告の内容が正常終了であれば、試験診断が正常に巡回し
ているものと判断し、以後、指示受信手段111により
新たな試験診断の指示を待つ。一方、報告の内容が異常
終了あるいは一定時間内に報告がない場合には、試験実
行指示先の情報処理装置は障害状態であるものと判断
し、試験診断の巡回を継続させるために、別の情報処理
装置に対して、試験診断の実行の指示を新たに行う。
【0024】図3は、図1に示した試験診断制御手段1
2の構成を示すブロック図である。図3を参照すると、
試験診断制御手段12は、現在自情報処理装置において
試験診断を行うか否かの判定を行う試験診断判定手段1
21と、現在自情報処理装置において試験が行われてい
るかどうかを記憶している診断実行中フラグ122と、
実際に自情報処理装置の試験診断を実行する試験診断実
行手段123と、を備えている。
【0025】図4は、図1に示した試験診断実行間隔監
視手段13の構成を示すブロック図である。図4を参照
すると、試験診断実行間隔監視手段13は、最後に自情
報処理装置において試験診断が実行された時間(時刻)
を記憶している試験時間記憶手段131と、現在の時間
(時刻)と試験時間記憶手段131に記憶されている時
間(時刻)の差から、自情報処理装置において一定時間
試験診断が実行されていないことを検出する時間間隔監
視手段132と、を備えている。
【0026】次に本発明の実施の形態の動作について説
明する。図5乃至図7は、本発明の実施の形態の動作を
説明するための流れ図である。
【0027】まず、図1乃至図5の流れ図を参照して、
一つの情報処理装置から他の情報処理装置への試験診断
の実行の指示について説明する。本発明の実施の形態の
障害検出方式においては、情報処理装置は、論理的に接
続されている情報処理装置間に通信制御手段11を用い
て、試験診断実行を指示し(ステップA1)、終了報告
監視手段115において、試験診断実行が指示された情
報処理装置からの終了報告が一定時間(監視時間)内に
受信されることを待ち合わせる(ステップA2およびス
テップA3)。
【0028】そして、試験診断の終了報告を受信した場
合(ステップA2のNo分岐)、情報処理装置は、試験
診断の実行が指示された情報処理装置から異常終了の報
告が送信されているか否かを判定し(ステップA4)、
異常終了の場合(ステップA4のYes分岐)、または
一定時間(監視時間)内に終了報告が行われなかった場
合(ステップA3のNo分岐)には、試験診断が指示さ
れた情報処理装置が障害状態にあるものと判断し、障害
状態になった情報処理装置以外の情報処理装置に対し
て、試験診断の実行を指示する(ステップA6)。
【0029】試験診断が指示された情報処理装置から、
一定時間内に正常終了の終了報告が行われた場合(ステ
ップA4のNo分岐)には、情報処理装置(指示を出し
た情報処理装置)は、通信制御手段11の指示受信手段
111によって、次の試験診断実行の指示を待ち合わせ
る(ステップA5)。
【0030】次に、図1乃至図4、及び図6を参照し
て、他の情報処理装置から試験診断の実行を指示された
情報処理装置の動作について説明する。
【0031】試験診断の実行を指示された情報処理装置
は、通信制御手段11の指示受信手段111により指示
を受信し(ステップB1)、診断起動手段112によ
り、試験診断制御手段12を起動する。
【0032】試験診断制御手段12が起動されると、試
験診断判定手段121は、診断実行中フラグ122を参
照し(ステップB2)、自情報処理装置において試験診
断が実行中状態であれば(ステップB2のYes分
岐)、その終了を待ち合わせ(ステップB10)、当該
試験診断の実行結果を、通信制御手段11を用いて、試
験診断の実行指示を行った情報処理装置に対して報告す
る(ステップB11)。
【0033】試験診断が実行中でなかった場合には(ス
テップB2のNo分岐)、診断実行中フラグ122を診
断実行中状態に変更し(ステップB3)、試験診断実行
手段123により自情報処理装置の試験診断の実行を開
始する(ステップB4)。
【0034】試験診断の実行が終了すると、試験診断が
終了した時間を、時間間隔監視手段13の試験時間記憶
手段131に記憶し(ステップB5)、試験診断実行手
段12の診断実行中フラグ122を、診断実行中でない
状態に変更し(ステップB6)、通信制御手段13の終
了報告送信手段113により、試験診断実行の指示を行
った情報処理装置に対して、試験診断の実行結果の報告
を行う(ステップB7)。
【0035】試験診断の実行結果が正常である場合は、
試験診断機能を、他の情報処理装置に巡回させるため
に、指示送信手段114を用いて、他の情報処理装置に
試験診断の実行を指示する(ステップB8およびステッ
プB9)。
【0036】次に、図1乃至図4、及び図7を参照し
て、情報処理装置における試験診断実行処理間隔の監視
の動作について説明する。
【0037】各情報処理装置は、試験診断実行間隔監視
手段132を有し、試験時間記憶手段131の記録され
ている試験診断が最後に実行された時間と、現在時間と
の差から、自情報処理装置に一定時間内に、試験診断機
能が巡回してこなかったことを検出した場合(図7のス
テップC1のNo分岐)には、システム内の情報処理装
置間の接続が分断され、自情報処理装置を含む情報処理
装置群が孤立状態であるために、自情報処理装置に試験
診断機能が巡回して来ない可能性があるものと判断し、
自情報処理装置から隣合う情報処理装置に新たに試験診
断の実行を指示する(ステップC2)。
【0038】
【実施例】上記した本発明の実施の形態について具体例
を以て説明すべく、次に本発明の実施例について図面を
参照して詳細に説明する。
【0039】図8に示すように、図1の構成を持つ情報
処理装置が複数論理的に接続されており、ある情報処理
装置において試験診断が実行されている。なお、図8に
おいて、記号「○」は正常な情報処理装置、「J」は巡
回ジョブの存在する情報処理装置、網掛け部は巡回ジョ
ブの到達可能範囲を示し、また情報処理装置は隣接する
もの同士は接続されているものとする。
【0040】この試験診断が実行されている情報処理装
置に着目すると、この情報処理装置は自己の試験診断を
実行し、自身が正常であることを確認しており、自身が
正常であることを確認すると、論理的に隣合う情報処理
装置に試験診断の実行を指示し、実行を指示された情報
処理装置は自己の試験診断を実行し、正常であることを
確認すると、さらに論理的に隣合う情報処理装置に対し
て試験診断の実行を指示する。
【0041】このようにして、図8に示すシステムにお
いては、全ての情報処理装置が全て正常に動作している
ために、情報処理装置間に連鎖的に試験診断が行われ、
全ての情報処理装置に対して試験診断を巡回させること
が可能である。なお、連鎖的に試験診断が行われる動作
を「巡回ジョブ」と呼ぶ。
【0042】ある時点で、図9に示すように、いくつか
の情報処理装置において、例えば電源障害が発生し(記
号「X」で障害が発生し通信不可能な情報処理装置を表
している、図9では、5つ)、システム内の通信経路が
遮断され、巡回ジョブが到達可能な(巡回ジョブが動作
する)情報処理装置群201と、そうでない情報処理装
置群202とに分断されたとする。
【0043】情報処理装置群201内には巡回ジョブが
存在し(図中Jで示す情報処理装置)、情報処理装置群
201内のそれぞれの情報処理装置には巡回ジョブが巡
回してくるため、各情報処理装置はシステム内に障害が
発生したことを検出でき、かつ情報処理装置群201の
新たな障害が発生すれば、これを検出することができ
る。
【0044】一方、情報処理装置群202内には巡回ジ
ョブが存在していないため、情報処理装置群202内の
情報処理装置は、システム内に障害が発生したことを検
出できず、且つ、情報処理装置群201内の新たな障害
が発生しても、これを検出することはできない状態にあ
る。
【0045】本実施例では、システムがこの状態に遷移
すると、情報処理装置群202内には巡回ジョブが巡回
してこないため、情報処理装置群202内の情報処理装
置内の時間間隔監視手段13の試験時間記憶手段131
の内容が更新されない。
【0046】この状態で一定時間が経過すると、時間間
隔監視手段132が自情報処理装置において、試験診断
が実行されていないことを検出し、自情報処理装置にお
いて試験診断の実行を開始し、再び、図10に示すよう
に、情報処理装置群202の全ての情報処理装置に対し
巡回ジョブが巡回する状態に復旧する。
【0047】図10の状態において、何らかの要因によ
り情報処理装置の障害が取り除かれると、図11に示す
ように、障害解消後、システム内において、複数の巡回
ジョブ(記号Jで示す)が存在することになる。
【0048】このように、システム内に複数の巡回ジョ
ブが存在することになるが、有限の時間内には、ある情
報処理装置で試験診断が実行されているときに、その情
報処理装置に対して、試験診断の指示が行われ、この指
示は、試験診断判定手段121により自情報処理装置に
おいて試験実行中であるものと判断され、先に実行され
ていた試験診断の実行が終了するまで待ち合わせを行
い、先に実行されていた試験診断の結果を返す。
【0049】このことにより、複数の巡回ジョブがシス
テム内に複数存在しても、同じ場所に到達し得る巡回ジ
ョブは一つずつ消えて行き、最終的に、システム内に存
在する巡回ジョブの数は1に収束する。すなわち、図1
2に示すように、障害解消後、有限時間経過後には、あ
る情報処理装置において巡回ジョブ実行中に巡回ジョブ
が到着すると、当該ジョブは消去され、結局、システム
内には、一つは巡回ジョブ(図中Jで示す)が存在する
ことになる。
【0050】このように、本実施例においては、障害に
よりシステム内の複数の情報処理装置がいくつかの群に
分断され、試験診断機能の巡回が行われなくなった場合
には、情報処理装置は自動的に新たな試験診断機能の巡
回を開始するため、分断されたそれぞれの群の情報処理
装置の障害を検出することができる。
【0051】また、本実施例においては、ある情報処理
装置において試験診断の実行指示を重複して受けた場
合、その情報処理装置において試験診断を一つに集約す
るようにしたことにより、システム内において情報処理
装置が複数の試験診断機能を実行することによる性能の
低下を回避している。
【0052】さらに、本実施例においては、システム内
のすべての情報処理装置同士が任意の数の情報処理装置
を経由して接続されていれば、巡回ジョブが連鎖的にシ
ステム内を巡回してゆくことにより、すべての情報処理
装置において試験診断を実行することができる、という
利点を有する。
【0053】
【発明の効果】以上説明したように、本発明によれば、
下記記載の効果を奏する。
【0054】(1)本発明の第1の効果は、障害により
システム内の情報処理装置が分断された場合でも、分断
されたそれぞれの情報処理装置の障害を検出することが
できる、ということである。
【0055】その理由は、本発明においては、システム
内が障害により分断されたことにより試験診断機能の巡
回が行われなくなった場合には、自動的に新たな試験診
断機能の巡回が開始される、ためである。
【0056】(2)本発明の第2の効果は、システム内
において複数の試験診断機能の実行による性能の低下を
抑えることができる、ということである。
【0057】その理由は、本発明においては、ある情報
処理装置において試験診断の実行指示を重複して受けた
場合、その情報処理装置において試験診断を一つに集約
するように構成されている、ことによる。
【0058】(3)本発明の第3の効果は、すべての情
報処理装置同士が任意の数の情報処理装置を経由して接
続されていれば、すべての情報処理装置において試験診
断を実行することができる、ということである。
【0059】その理由は、本発明においては、試験診断
機能の巡回は、情報処理装置を経由して連鎖的に行われ
る、ためである。
【図面の簡単な説明】
【図1】本発明の実施の形態の情報処理装置の構成及び
接続の様子を示すブロック図である。
【図2】本発明の実施の形態における情報処理装置の通
信制御手段の構成を示すブロック図である。
【図3】本発明の実施の形態における情報処理装置の試
験診断制御手段の構成を示すブロック図である。
【図4】本発明の実施の形態における情報処理装置の時
間間隔監視手段の構成を示すブロック図である。
【図5】本発明の実施の形態における試験診断実行処理
の動作を説明するための処理フローチャートである。
【図6】本発明の実施の形態における試験診断実行処理
の動作を説明するための処理フローチャートである。
【図7】本発明の実施の形態における試験診断実行処理
間隔監視の動作を説明するためのフローチャートであ
る。
【図8】本発明の一実施例を説明するための図であり、
障害発生前の多数の情報処理装置からなるシステムを模
式的に示す図である。
【図9】本発明の一実施例を説明するための図であり、
障害発生後の多数の情報処理装置からなるシステムを模
式的に示す図である。
【図10】本発明の一実施例を説明するための図であ
り、障害発生後、一定時間経過後の多数の情報処理装置
からなるシステムを模式的に示す図である。
【図11】本発明の一実施例を説明するための図であ
り、障害解消直後の多数の情報処理装置からなるシステ
ムを模式的に示す図である。
【図12】本発明の一実施例を説明するための図であ
り、障害解消後一定時間経過後の多数の情報処理装置か
らなるシステムを模式的に示す図である。
【符号の説明】
1−1〜1−n 情報処理装置(プロセッサ) 11 通信制御手段 12 試験診断制御手段 13 時間間隔監視手段 111 指示受信手段 112 診断起動手段 113 終了報告送信手段 114 指示送信手段 115 終了報告監視手段 121 試験診断判定手段 122 診断実行中フラグ 123 試験診断実行手段 131 試験時間記憶手段 132 時間間隔監視手段 J 巡回ジョブの存在する情報処理装置 X 障害が発生し通信不能な情報処理装置
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 11/22 - 11/34 G06F 15/16 - 15/177

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】複数の情報処理装置を含むシステムにおい
    て、 各情報処理装置が、 自情報処理装置の試験診断を実行する手段と、 前記自情報処理装置の試験診断の実行結果を報告する手
    段と、 他の情報処理装置に試験診断の実行を指示する手段と、 前記他情報処理装置における試験診断の実行の結果を
    監視する手段と、 前記自情報処理装置における試験診断の実行の時間間隔
    を監視する手段と、自装置において 試験診断実行中のときに、他の情報処
    理装置から試験診断の実行の指示を受けた場合、新たに
    他の情報処理装置に対する試験診断の実行を指示するこ
    となく、現在実行中の前記試験診断へ集約する手段と、 を含むことを特徴とする障害検出方式。
  2. 【請求項2】複数の情報処理装置を含むシステムの障害
    検出方式において、 ある情報処理装置から試験診断の実行の指示を受けた他
    の情報処理装置は、自装置の試験診断を実行し試験診断
    結果を前記試験診断の実行の指示を発行した前記情報処
    理装置に返却し、 前記試験診断の実行の指示を発行した前記情報処理装置
    は、前記他の情報処理装置からの試験診断結果の報告を
    受け、該報告の内容が異常である場合、もしくは所定の
    監視時間内に前記他の情報処理装置から試験診断結果の
    報告を受け取らない場合には、前記他の情報処理装置は
    障害と判断し、障害と判断された前記情報処理装置以外
    の他の情報処理装置に対して試験診断の実行の指示を送
    出し、一方、前記他の情報処理装置から前記監視時間内
    に受け取った試験診断結果の報告の内容が正常である場
    合には、試験診断が正常に巡回しているものと判断して
    次の試験診断の実行の待ち状態となり、 前記各情報処理装置は、自装置において一定時間試験診
    断が実行されていないことを検出した場合に、自動的に
    自装置の試験診断の実行を開始し、 更に、 前記各情報処理装置は、自装置の試験診断の実行中に、
    更に別に試験診断の実行指示を受けた場合、これら複数
    の試験診断を、現在実行中の一つの試験診断に集約す
    る、 ことを特徴とする障害検出方式。
  3. 【請求項3】前記試験診断の実行が指示された情報処理
    装置は、前記試験診断の実行の指示を受け、自装置にお
    いて現在試験診断が実行中であるか否かを判定し、実行
    中でなければ、自装置の試験診断を実行後、試験診断結
    果の報告を前記試験診断の実行の指示を送出した前記情
    報処理装置に返却し、試験診断結果が正常の場合には、
    前記試験診断の実行の指示を行った情報処理装置以外の
    他の情報処理装置に試験診断の実行の指示を送出し、 一方、実行中であれば、実行中の試験診断の終了の後
    に、試験診断結果の報告を前記試験診断の実行の指示を
    送出した前記情報処理装置に返却し、且つ前記試験診断
    実行中に到来した試験診断の指示は消去する、 ことを特徴とする請求項2記載の障害検出方式。
  4. 【請求項4】前記情報処理装置が前回の試験診断を実行
    した時間と現在の時間とを定期的に照合し、あらかじめ
    定めた一定時間以内に試験診断が行われていない場合に
    は、自装置に対して試験診断の実行の指示を行う、こと
    を特徴とする請求項2又は3記載の障害検出方式。
  5. 【請求項5】複数の情報処理装置を含むシステムの障害
    検出方式において、 前記各情報処理装置が、自装置の試験診断を実行を制御
    する試験診断制御手段と、 自装置の試験診断の実行結果を他の情報処理装置に報告
    し、他の情報処理装置に試験診断の実行を指示し、更
    に、他の情報処理装置における試験診断の実行の結果を
    監視する通信制御手段と、 自装置における試験診断の実行の時間間隔を監視する時
    間間隔監視手段と、 を備え、 前記試験診断制御手段は、自装置において現在試験診断
    実行中における他の情報処理装置からの試験診断の実行
    の指示に対しては、新たに他の情報処理装置に対する試
    験診断の実行を指示することなく、前記現在実行中の試
    験診断へ集約する、ことを特徴とする障害検出方式。
JP09651397A 1997-03-31 1997-03-31 多数の情報処理装置からなるシステムにおける障害検出方式 Expired - Fee Related JP3147811B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP09651397A JP3147811B2 (ja) 1997-03-31 1997-03-31 多数の情報処理装置からなるシステムにおける障害検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09651397A JP3147811B2 (ja) 1997-03-31 1997-03-31 多数の情報処理装置からなるシステムにおける障害検出方式

Publications (2)

Publication Number Publication Date
JPH10283216A JPH10283216A (ja) 1998-10-23
JP3147811B2 true JP3147811B2 (ja) 2001-03-19

Family

ID=14167224

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09651397A Expired - Fee Related JP3147811B2 (ja) 1997-03-31 1997-03-31 多数の情報処理装置からなるシステムにおける障害検出方式

Country Status (1)

Country Link
JP (1) JP3147811B2 (ja)

Also Published As

Publication number Publication date
JPH10283216A (ja) 1998-10-23

Similar Documents

Publication Publication Date Title
US5287461A (en) Method and apparatus for remotely accessing a plurality of server consoles
US5774640A (en) Method and apparatus for providing a fault tolerant network interface controller
US7801984B2 (en) Diagnostic/remote monitoring by email
US20040001449A1 (en) System and method for supporting automatic protection switching between multiple node pairs using common agent architecture
EP1550036A2 (en) Method of solving a split-brain condition
WO1999041889A1 (en) Method and apparatus for testing network, and recording medium
JP3147811B2 (ja) 多数の情報処理装置からなるシステムにおける障害検出方式
JP3779121B2 (ja) データ伝送システム
JPH0983516A (ja) ネットワーク障害診断装置
JP3356809B2 (ja) Lan障害監視装置及びlan障害監視システム及びそれにおけるロギングデータ採集方法
CN114489749B (zh) 一种软件系统实时重构方法和重构管理中心
JP2501335B2 (ja) ゲ−トウェイのバックアップ方式
JP3317278B2 (ja) Fddi障害監視方法、fddi障害監視装置、プログラムを記録した記録媒体、ネットワークシステム
JPH10105498A (ja) ネットワークシステム、ネットワークシステムにおける 通信サーバの切り替え方法および通信サーバの切り替え 用プログラムを記憶した記憶媒体
JP2555214B2 (ja) 障害被疑装置の制御方法
JP3458371B2 (ja) データ伝送制御方法および装置
JP2000244520A (ja) 二重化ネットワークの異常診断方法
JPH02310755A (ja) ヘルスチェック方式
JP3740198B2 (ja) 分散システムでの運用コマンドの処理機構の実現方法
JP3012491B2 (ja) 二重化装置のマイクロ診断方法
JP3084383B2 (ja) リング通信路障害処理方式
JP3033660B2 (ja) データ通信制御における障害検出方法
JPH07212461A (ja) 通信ルート管理システム
JPH1022947A (ja) ネットワーク管理システム
JPH09311841A (ja) マルチプロセッサシステム

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20001212

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080112

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090112

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100112

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees