JPH01169545A - 多重化コンピュータシステムにおける障害検出方式 - Google Patents

多重化コンピュータシステムにおける障害検出方式

Info

Publication number
JPH01169545A
JPH01169545A JP62325334A JP32533487A JPH01169545A JP H01169545 A JPH01169545 A JP H01169545A JP 62325334 A JP62325334 A JP 62325334A JP 32533487 A JP32533487 A JP 32533487A JP H01169545 A JPH01169545 A JP H01169545A
Authority
JP
Japan
Prior art keywords
computer
output
cpu
signal
generating means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62325334A
Other languages
English (en)
Inventor
Kazuhiko Ikeda
和彦 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PFU Ltd
Original Assignee
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PFU Ltd filed Critical PFU Ltd
Priority to JP62325334A priority Critical patent/JPH01169545A/ja
Publication of JPH01169545A publication Critical patent/JPH01169545A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概 要〕 この発明は多重化コンピュータシステムにおける相互診
断による障害検出方式に関し、相互診断時におけるCP
uの負荷の軽減を図り、かつ障害検出に要する時間の短
縮を図ることを目的とし、少なくとも第1および第2の
コンピュータにより構成される多重化コンピュータシス
テムにおける障害検出方式であって、前記第1のコンピ
ュータと前記第2のコンピュータの間を接続する相互診
断用の通信バスと、前記第1のコンピュータに接続され
、前記第1のコンピュータの所定プログラムにより印加
される起動信号および再起動信号により出力する第1の
信号発生手段と、前記第2のコンピュータに接続され、
前記第2のコンピュータの所定プログラムにより印加さ
れる起動信号および再起動信号により出力する第2の信
号発生手段と、前記第1の信号発生手段の出力を監視し
、前記第2のコンピュータに通知する第2の出力監視手
段と、前記第2の信号発生手段の出力を監視し、前記第
1のコンピュータに通知する第1の出力監視手段とによ
り構成される。
(産業上の利用分野) 本発明は多重化コンピュータシステムにおける障害検出
方式に関し、特に、システム内のコンピュータ(以下C
PI1)間の相互診断を行ない、異常検出を行なう障害
検出方式に関する。
〔従来の技術] 第4図は従来の障害検出方式を説明するシステム構成図
の一例である。図に示すように、コンピュータcpu 
iおよびCPII2により構成される2重化システムに
おいて、CPU 1とCPU 2の間は、例えば通信路
としてR5232C等を用いた相互のシステム診断のた
めの通信バスAが設けられ、一定時間毎に相互診断を行
なっている。この場合、例えばCPU 1を主業務を実
行する主系とすると、CPU 2は待機もしくは従業務
を実行する従系である。相互診断は例えばcpu tか
ら自系が正常であることおよび相手が正常か否かの情報
を相手側に送出し、一定時間経過後までに相手側から応
答がなければ、自系は他系が異常であると認識してシス
テムの切り離し等の対策を行なう。これらの診断はCP
U 2からCPU 1へも同様に双方向に行なわれる。
〔発明が解決しようとする問題点〕
上述した従来方式では、まず、比較的多くの情報を通信
する一方1.相手からの応答をも監視しなければならず
、診断のためにCPUの負荷が増大するという問題を生
じている。即ち、前述の如く一方を主系、他方を従系と
すると、主系側は実際のジョブの実行に加えて相互診断
も行なうことになりその分だけジョブ処理が遅れること
になる。さらに、一定時間経過後のタイムアウトを検出
するためにその時間分だけ待たないと異常検出できない
という時間的なロスもある。
本発明の目的は、多重化コンピュータシステムにおける
障害検出方式において、相互診断時におけるcpuの負
荷の軽減を図り、かつ障害検出に要する時間の短縮を図
ることを目的とする。
(問題点を解決するための手段〕 第1図は本発明に係る障害検出方式の原理構成図である
。本図では2重化システムについて示しており、Aは従
来の相互診断用の通信バスである。
C1およびC2は所定のプログラムにより印加される起
動信号および再起動信号によって出力する第1および第
2の信号発生手段、C3およびC4は前記信号発生手段
の出力を監視する第1および第2の出力監視手段である
。第1のコンピュータCPU lは通信路B1を介して
第1信号発生手段C1と第2出力監視手段C4を経てC
PU 2へ接続され、第2のコンピュータCPIJ 2
は通信路B2を介して第2信号発生手段C2と第1の出
力監視手段C3を経てCPU 1へ接続される。
(作 用〕 第1図の構成において、プログラムが正常に動作してい
るときは信号発生手段は起動信号を印加した後、一定時
間間隔内に印加される再起動信号にもとづいて出力し続
ける。この出力を相手側では出力監視手段の出力により
監視する。プログラム等が正常動作時であれば常に再起
動信号はオン状態になっていて信号発生手段は出力し続
けている。一方、プログラムハングあるいはハードウエ
アの異常等により前記一定時間間隔内に再起動信号が供
給されないと出力監視手段により出力の変化を検知し相
手系のCPUに異常が通知される。この場合、信号発生
手段は起動信号により一定時間だけ出力し、その時間内
に再起動が行なわれているときには再度その時点から一
定時間だけ出力される回路構成となっている。従って一
定時間内に再起動信号が印加されていればその出力は常
にオン状態となっている。さらに、これら手段の異常に
も対処するために、従来の相互診断通信バスAを介して
メツセージ交換することにより相手側の異常を確認する
こともできる。
〔実施例〕
第2図は本発明に係る障害検出方式の一実施例構成図、
第3図はその信号タイミングチャートである。第2図に
示すように、コンピュータCPU 1とCPU 2で構
成される2重化システムにおいて、Aは従来の例えばR
5232C等の相互通信路であり、B1およびB2はC
P[I 1とCPo 2間に新たに設けられる通信路で
あって、B1はCPU 1からCPU 2へ、B2はC
Pt12からCPt11への伝送に使用される。第1お
よび第2の信号発生手段は、起動信号としてのトリガT
RIの印加役所定時間後に、再起動信号としての再トリ
ガTR2の印加により出力する第1および第2のリトリ
ガラブル単安定マルチ回路CIおよびC2であり、第1
および第2の出力監視手段は、相手側の出力の立下りの
変化を検出して自系のCPUに割込みを発生させる第1
および第2の割込み要求回路C3およびC4により、構
成される。この場合、cpu tは通信路B1を介して
リトリガラプル単安定マルチ回路CIと割込み要求回路
C4を経てCPU 2に接続され、CP[I2は通信路
B2を介してリトリガラプル単安定マルチ回路C2と割
込み要求回路C3を経てCPU 1に接続される。
このような構成において、CPU 1を主業務を実行す
る主系とし、CPU 2を待機又は従業務を実行する従
系とすると、各CPUは各々に属するリトリガラブル単
安定マルチ回路に対し、第3図に示すようにその出力を
オフさせる時間り。以内の一定時間間隔でプログラムに
より再トリガTR2を印加する。再トリガTR2を実行
するのは、例えば単一システムで行なわれているウオッ
チドックタイマによるシステムループやプログラムハン
グ等の検出と同様に行われる。正常時、即ち、相手側に
異常がないときは常に再トルガTR2が一定時間間隔し
い内に供給されている。
一方、例えば、主系のCPt11がプログラムハングや
ハードウェア異常等により正常動作しなくなると、時間
゛間隔t。内に再トリガTR2を印加しなくなり、リト
リガラプル単安定マルチ回路CIのトリガTRIが、時
間間隔tw以降にオフになり、リトリガラブル単安定マ
ルチ回路の出力の変化、即ち、立下りTtにより割込み
要求回路C4が動作して従系のCPt12に割込み動作
が発生する。
従系はこの割込み動作により主系に何らかの異常が発生
したことを検知する。この際、自系の割込み要求回路あ
るいは主系のリトリガラプル単安定マルチ回路の故障の
場合もあり得るため、割込み要求発生後直ちにジョブを
主系から従系に切り換えることはせず、cpu iとC
PII2を接続している相互診断通信バスAを利用して
主系に対してメツセージを送出する。主系のcpuが異
常状態であれば、このメツセージに正常に応答せず、従
系は無応答を含む応答の異常を検知して今まで主系で実
行していたジョブを引き継いで実行する。以上の如く主
系に異常が発生してもジョブを停止することなく実行す
ることができる。従系に異常が発生しても上記と逆のル
ートで全く同様に処理することができる。
このメツセージ交換の効果は、プログラムによるリトリ
ガラブル単安定マルチ回路の再トリガ周期がCPLIへ
の負荷の増大等の外的要因により変動することからして
、CPU負荷が増大して再トリガが遅れ、その役割込み
要求が発生しても正常動作の確認が可能なことである。
従って、リトリガラプル単安定マルチの出力時間を、標
準的な再トリガ周期と比べて十分長くとる必要はなく、
必要最少限の時間にセットすることが可能となり、その
結果障害検出時間の短縮を図ることができる。
また、CPU負荷にはほとんど影響を与えないような十
分に長い周期で相互通信バスAによるメツセージ交換を
行なうことにより正常性が確認できる。従って、前述の
ように、リトリガラブル単安定マルチ回路の出力又は割
込み回路が故障してcpuの異常が検出不能となっても
相互通信バスによるメツセージ交換により相手CPUの
異常が検出でき、システム動作の続行が可能である。
〔発明の効果〕
以上説明したように、本発明によれば、CPU間の相互
診断において、診断のために増大するCPU負荷を大幅
に低減し、かつ障害検出時間も短縮することができる効
果がある。
【図面の簡単な説明】
第1図は本発明方式の原理構成図、 第2図は本発明の一実施例構成図、 第3図は第2図の信号タイミングチャート、および、 第4図は従来方式を説明する構成図である。 (符号の説明) CPU 1 、  CPU2 ・:] 7ビユータ、A
・・・相互診断通信バス、 CI、C2・・・リトリガラプル単安定マルチ回路、C
3、C4・・・割込み要求回路。

Claims (1)

  1. 【特許請求の範囲】 1、少なくとも第1および第2のコンピュータにより構
    成される多重化コンピュータシステムにおける障害検出
    方式において、 前記第1のコンピュータ(CPU1)と前記第2のコン
    ピュータ(CPU2)の間を接続する相互診断用の通信
    バス(A)と、 前記第1のコンピュータに接続され、前記第1のコンピ
    ュータの所定プログラムにより印加される起動信号(T
    R1)および再起動信号(TR2)により出力する第1
    の信号発生手段(C1)と、 前記第2のコンピュータに接続され、前記第2のコンピ
    ュータの所定プログラムにより印加される起動信号およ
    び再起動信号により出力する第2の信号発生手段(C2
    )と、 前記第1の信号発生手段の出力を監視し、前記第2のコ
    ンピュータに通知する第2の出力監視手段(C4)と、 前記第2の信号発生手段の出力を監視し、前記第1のコ
    ンピュータに通知する第1の出力監視手段(C3)と、 を備え、前記第2の出力監視手段は、前記第1の信号発
    生手段の出力の所定時間経過後の変化を検出して前記第
    2のコンピュータに対して異常を通知し、前記第1の出
    力監視手段は前記第2の信号発生手段の出力の所定時間
    経過後の変化を検出して前記第1のコンピュータに異常
    を通知し、かつ、前記相互診断通信バスAを介して前記
    異常についてのメッセージ変換を行なうようにしたこと
    を特徴とする障害検出方式。
JP62325334A 1987-12-24 1987-12-24 多重化コンピュータシステムにおける障害検出方式 Pending JPH01169545A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62325334A JPH01169545A (ja) 1987-12-24 1987-12-24 多重化コンピュータシステムにおける障害検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62325334A JPH01169545A (ja) 1987-12-24 1987-12-24 多重化コンピュータシステムにおける障害検出方式

Publications (1)

Publication Number Publication Date
JPH01169545A true JPH01169545A (ja) 1989-07-04

Family

ID=18175648

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62325334A Pending JPH01169545A (ja) 1987-12-24 1987-12-24 多重化コンピュータシステムにおける障害検出方式

Country Status (1)

Country Link
JP (1) JPH01169545A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011040842A (ja) * 2009-08-07 2011-02-24 Meidensha Corp 二重化システムの装置切替方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011040842A (ja) * 2009-08-07 2011-02-24 Meidensha Corp 二重化システムの装置切替方式

Similar Documents

Publication Publication Date Title
JPH01169545A (ja) 多重化コンピュータシステムにおける障害検出方式
JPH10116261A (ja) 並列計算機システムのチェックポイントリスタート方法
JPH0588926A (ja) 監視制御系の自動切替回路
JP6089766B2 (ja) 情報処理システム、及び情報処理装置の障害処理方法
JP6654662B2 (ja) サーバ装置およびサーバシステム
JPH1196033A (ja) 情報処理装置
JPH0652130A (ja) マルチプロセッサシステム
JP2998804B2 (ja) マルチマイクロプロセッサシステム
JP2013254333A (ja) 多重系制御システム及びその制御方法
JPH11175108A (ja) 二重化コンピュータ装置
CN116820837B (zh) 一种关于系统组件的异常处理方法及装置
JPH03266131A (ja) 多重化システムの無応答判定方式
JP2744113B2 (ja) 計算機システム
JPH01234966A (ja) 多重化コンピュータシステムにおける障害検出方式
JP2879480B2 (ja) 冗長計算機システムの同期外れ時の切替方式
JPH01120652A (ja) 入出力装置監視時間設定方式
JPH11250026A (ja) 並列マルチプロセッサシステムの障害リカバリ方法及び方式
JPH0271336A (ja) プロセッサの障害状態監視方式
JPH06290126A (ja) 計算機システム障害監視方式
JPH10143393A (ja) 診断処理装置
JPH07200334A (ja) 二重化同期運転方式
CN119226050A (zh) 一种多余度非相似架构的高可靠计算机系统
JP3055906B2 (ja) 緊急動作方式
JPH01230111A (ja) 電源制御方式
JPH02310735A (ja) 障害検出方式