JPH11265321A - 障害復旧方法、中央処理装置及び中央処理システム - Google Patents
障害復旧方法、中央処理装置及び中央処理システムInfo
- Publication number
- JPH11265321A JPH11265321A JP10065521A JP6552198A JPH11265321A JP H11265321 A JPH11265321 A JP H11265321A JP 10065521 A JP10065521 A JP 10065521A JP 6552198 A JP6552198 A JP 6552198A JP H11265321 A JPH11265321 A JP H11265321A
- Authority
- JP
- Japan
- Prior art keywords
- central processing
- processing unit
- failure
- cycle
- fault
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 13
- 230000015654 memory Effects 0.000 claims abstract description 57
- 230000004044 response Effects 0.000 claims description 41
- 238000011084 recovery Methods 0.000 claims description 25
- 238000012544 monitoring process Methods 0.000 description 9
- 239000002131 composite material Substances 0.000 description 5
- 230000009977 dual effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Landscapes
- Techniques For Improving Reliability Of Storages (AREA)
- Hardware Redundancy (AREA)
- Monitoring And Testing Of Exchanges (AREA)
- Exchange Systems With Centralized Control (AREA)
- Sub-Exchange Stations And Push- Button Telephones (AREA)
- Telephonic Communication Services (AREA)
Abstract
(57)【要約】
【課題】 二重冗長構成の中央処理システムで、障害の
発生先を判定して多様な障害復旧処理を実行する。 【解決手段】 中央処理装置として機能しているアクト
系の第1の中央処理装置と、中央処理装置として機能し
ていないスタンバイ系で、この第1の中央処理装置と同
一の構成を有する第2の中央処理装置とを並置し、これ
ら第1及び第2の中央処理装置の主メモリに対して同一
サイクルで同一情報を書き込むときに発生する障害の復
旧方法において、前記書き込み動作中に発生した障害
が、第1又は第2のどちらの中央処理装置で発生したか
を、アクト系の第1の中央処理装置が判定し、この判定
の結果に応じて異なる復旧処理を行う。
発生先を判定して多様な障害復旧処理を実行する。 【解決手段】 中央処理装置として機能しているアクト
系の第1の中央処理装置と、中央処理装置として機能し
ていないスタンバイ系で、この第1の中央処理装置と同
一の構成を有する第2の中央処理装置とを並置し、これ
ら第1及び第2の中央処理装置の主メモリに対して同一
サイクルで同一情報を書き込むときに発生する障害の復
旧方法において、前記書き込み動作中に発生した障害
が、第1又は第2のどちらの中央処理装置で発生したか
を、アクト系の第1の中央処理装置が判定し、この判定
の結果に応じて異なる復旧処理を行う。
Description
【0001】
【発明の属する技術分野】本発明は、中央処理システム
に関し、たとえばPBX(構内交換機)のプログラムお
よびシステムデータなどが格納されるRAM(ランダム
アクセスメモリ)に障害が発生した場合のシステムバッ
クアップ機能などを提供する中央処理システムに適用し
得るものである。
に関し、たとえばPBX(構内交換機)のプログラムお
よびシステムデータなどが格納されるRAM(ランダム
アクセスメモリ)に障害が発生した場合のシステムバッ
クアップ機能などを提供する中央処理システムに適用し
得るものである。
【0002】また本発明は、かかる中央処理システムの
構成要素としての中央処理装置に関するものである。
構成要素としての中央処理装置に関するものである。
【0003】さらに本発明は、かかる中央処理システム
において使用する障害復旧方法に関するものである。
において使用する障害復旧方法に関するものである。
【0004】
【従来の技術】従来、交換システムや情報処理システム
においては、システムの稼動停止を防ぐため、あるいは
システムの信頼性向上のために、しばしば二重冗長構成
が採られている。
においては、システムの稼動停止を防ぐため、あるいは
システムの信頼性向上のために、しばしば二重冗長構成
が採られている。
【0005】この二重冗長構成では、現にシステムの中
央処理装置として動作しているアクト系(運用中)の中
央処理装置と、この中央処理装置と同一構成の中央処理
装置であって中央処理装置として動作していないスタン
バイ系(待機中)の中央処理装置を並置している。
央処理装置として動作しているアクト系(運用中)の中
央処理装置と、この中央処理装置と同一構成の中央処理
装置であって中央処理装置として動作していないスタン
バイ系(待機中)の中央処理装置を並置している。
【0006】そしてこれら2つの中央処理装置に内蔵さ
れている主メモリ(RAM)には、同一サイクルで同一
のプログラムやデータが書き込み(二重書き込み)され
る。書き込みが終わると各主メモリからは、応答信号が
送出され、ワイヤードORの応答通知ラインに供給され
る。
れている主メモリ(RAM)には、同一サイクルで同一
のプログラムやデータが書き込み(二重書き込み)され
る。書き込みが終わると各主メモリからは、応答信号が
送出され、ワイヤードORの応答通知ラインに供給され
る。
【0007】当該書き込みのアクセスタイムアウト時間
は、システムとして最適なある単一の時間に規定され、
その時間において各主メモリから送出されるはずの2つ
の応答信号のどちらか一つでも送出されない場合には、
タイムアウト障害となり、アクト系の中央処理装置で割
込みが行われ、障害復旧処理が実行されている。
は、システムとして最適なある単一の時間に規定され、
その時間において各主メモリから送出されるはずの2つ
の応答信号のどちらか一つでも送出されない場合には、
タイムアウト障害となり、アクト系の中央処理装置で割
込みが行われ、障害復旧処理が実行されている。
【0008】
【発明が解決しようとする課題】しかしながら上述の方
法では、二重書き込みアクセスにおいてタイムアウト障
害が発生したために一方の主メモリから応答信号が送出
されない場合、それがどちらの主メモリであるかを判別
する手段が無く、あらかじめ規定された割込み処理で、
アクト系、スタンバイ系の双方に対し同じ障害復旧処理
を行っていた。
法では、二重書き込みアクセスにおいてタイムアウト障
害が発生したために一方の主メモリから応答信号が送出
されない場合、それがどちらの主メモリであるかを判別
する手段が無く、あらかじめ規定された割込み処理で、
アクト系、スタンバイ系の双方に対し同じ障害復旧処理
を行っていた。
【0009】
【課題を解決するための手段】かかる課題を解決するた
め、第1の発明では、中央処理装置として機能している
アクト系の第1の中央処理装置と、中央処理装置として
機能していないスタンバイ系で、この第1の中央処理装
置と同一の構成を有する第2の中央処理装置とを並置
し、これら第1及び第2の中央処理装置の主メモリに対
して同一サイクルで同一情報を書き込むときに発生する
障害の復旧方法において、前記書き込み動作中に発生し
た障害が、第1又は第2のどちらの中央処理装置で発生
したかを、アクト系の第1の中央処理装置が判定し、こ
の判定の結果に応じて異なる復旧処理を行うことを特徴
とする。
め、第1の発明では、中央処理装置として機能している
アクト系の第1の中央処理装置と、中央処理装置として
機能していないスタンバイ系で、この第1の中央処理装
置と同一の構成を有する第2の中央処理装置とを並置
し、これら第1及び第2の中央処理装置の主メモリに対
して同一サイクルで同一情報を書き込むときに発生する
障害の復旧方法において、前記書き込み動作中に発生し
た障害が、第1又は第2のどちらの中央処理装置で発生
したかを、アクト系の第1の中央処理装置が判定し、こ
の判定の結果に応じて異なる復旧処理を行うことを特徴
とする。
【0010】また、内蔵している自系メモリと外部の他
系メモリに対して同一サイクルで同一情報を書き込む中
央処理装置において、以下のようにしたことを特徴とす
る。
系メモリに対して同一サイクルで同一情報を書き込む中
央処理装置において、以下のようにしたことを特徴とす
る。
【0011】すなわち、第2の発明では、(1)自系メ
モリに対する1サイクル分の情報書き込みが終了したこ
とを、内蔵している中央処理部制御回路に通知する自系
応答手段と、(2)他系メモリに対する1サイクル分の
情報書き込みが終了したことを、前記中央処理部制御回
路に通知する他系応答手段とを備え、(3)前記サイク
ルに対応した所定のタイミングまでに、前記自系又は他
系の応答手段から前記通知がないときは前記中央処理部
が、どちらの応答手段からの通知がないかによって異な
る復旧処理を行うことを特徴とする。
モリに対する1サイクル分の情報書き込みが終了したこ
とを、内蔵している中央処理部制御回路に通知する自系
応答手段と、(2)他系メモリに対する1サイクル分の
情報書き込みが終了したことを、前記中央処理部制御回
路に通知する他系応答手段とを備え、(3)前記サイク
ルに対応した所定のタイミングまでに、前記自系又は他
系の応答手段から前記通知がないときは前記中央処理部
が、どちらの応答手段からの通知がないかによって異な
る復旧処理を行うことを特徴とする。
【0012】また、第3の発明にかかる中央処理システ
ムは、請求項3又は4のいずれかの中央処理装置を複数
接続することにより構成することを特徴とする。
ムは、請求項3又は4のいずれかの中央処理装置を複数
接続することにより構成することを特徴とする。
【0013】
【発明の実施の形態】(A)実施形態 以下、本発明にかかる障害復旧方法、中央処理装置及び
中央処理システムを、PBX交換機に適用した場合を例
に、一実施形態について説明する。
中央処理システムを、PBX交換機に適用した場合を例
に、一実施形態について説明する。
【0014】(A−1)実施形態の構成 実施形態にかかる中央処理システム10を図1に示す。
【0015】図1において、中央処理システム10は中
央処理装置11および12の2つのパッケージから構成
されている。
央処理装置11および12の2つのパッケージから構成
されている。
【0016】中央処理装置11内のタイムアウト監視回
路13は、二重書き込みアクセスサイクルの開始ごとに
MPU14から送出される起動信号を受信すると初期値
からカウントをはじめるタイマで、MPU14による自
系メモリ15、他系メモリ16へのアクセスサイクルご
とにあらかじめ設定されたタイムアウト時間(タイミン
グ)の経過をMPU制御回路17に通知する回路であ
る。起動信号の供給を受けるためにタイムアウト監視回
路13の入力端子は、複合バス18のなかの制御バスに
接続し、出力端子はMPU制御回路17に接続してい
る。
路13は、二重書き込みアクセスサイクルの開始ごとに
MPU14から送出される起動信号を受信すると初期値
からカウントをはじめるタイマで、MPU14による自
系メモリ15、他系メモリ16へのアクセスサイクルご
とにあらかじめ設定されたタイムアウト時間(タイミン
グ)の経過をMPU制御回路17に通知する回路であ
る。起動信号の供給を受けるためにタイムアウト監視回
路13の入力端子は、複合バス18のなかの制御バスに
接続し、出力端子はMPU制御回路17に接続してい
る。
【0017】複合バス18には、MPU14、タイムア
ウト監視回路13間の制御バスのほか、MPU14から
自系メモリ15、他系メモリ16に至るアドレス・バス
およびデータ・バスが含まれる。
ウト監視回路13間の制御バスのほか、MPU14から
自系メモリ15、他系メモリ16に至るアドレス・バス
およびデータ・バスが含まれる。
【0018】MPU14は、(二重書き込みも含む)基
本的なPBX交換プログラムの実行にともなって必要と
なるデータやプログラムを自系メモリ15と他系メモリ
16に書き込む(二重書き込み)ために、複合バス18
で自系および他系メモリ15,16に接続されている。
本的なPBX交換プログラムの実行にともなって必要と
なるデータやプログラムを自系メモリ15と他系メモリ
16に書き込む(二重書き込み)ために、複合バス18
で自系および他系メモリ15,16に接続されている。
【0019】自身に対するこの書き込みが終了したこと
をアクセス応答信号で通知するために(中央処理装置1
1の主メモリである)自系メモリ15は、制御バス21
で自系受信回路19に接続されている。自系受信回路1
9はこの応答信号の受信を通知するためにMPU制御回
路17に接続されている。
をアクセス応答信号で通知するために(中央処理装置1
1の主メモリである)自系メモリ15は、制御バス21
で自系受信回路19に接続されている。自系受信回路1
9はこの応答信号の受信を通知するためにMPU制御回
路17に接続されている。
【0020】同様に、自身に対する前記書き込みが終了
したことをアクセス応答信号で通知するために(中央処
理装置12の主メモリである)他系メモリ16は、制御
バス22で、中央処理装置11内の他系受信回路23に
接続されている。そして他系受信回路23はこの応答信
号の受信を通知するためにMPU制御回路17に接続さ
れている。
したことをアクセス応答信号で通知するために(中央処
理装置12の主メモリである)他系メモリ16は、制御
バス22で、中央処理装置11内の他系受信回路23に
接続されている。そして他系受信回路23はこの応答信
号の受信を通知するためにMPU制御回路17に接続さ
れている。
【0021】一方、MPU制御回路17は、自系用の障
害要因レジスタ24と他系用の障害要因レジスタ25を
備え、アクセスタイムアウトエラーなど自系メモリ15
へのアクセスで発生した障害要因を障害要因レジスタ2
4に格納し、他系メモリ16へのアクセスで発生した障
害要因を障害要因レジスタ25に格納する。
害要因レジスタ24と他系用の障害要因レジスタ25を
備え、アクセスタイムアウトエラーなど自系メモリ15
へのアクセスで発生した障害要因を障害要因レジスタ2
4に格納し、他系メモリ16へのアクセスで発生した障
害要因を障害要因レジスタ25に格納する。
【0022】またMPU制御回路17は、前記1サイク
ル内の後述するタイミングまでに自系、他系の受信回路
19、23が応答信号の受信を知らせてきたことを示す
応答通知信号を送出するために、MPU14に接続され
ている。
ル内の後述するタイミングまでに自系、他系の受信回路
19、23が応答信号の受信を知らせてきたことを示す
応答通知信号を送出するために、MPU14に接続され
ている。
【0023】障害要因レジスタ24に接続された割込み
回路26は、少なくとも障害要因レジスタ24に格納さ
れている自系の障害要因を示す信号を送出するために、
割込み制御回路27に接続されている。
回路26は、少なくとも障害要因レジスタ24に格納さ
れている自系の障害要因を示す信号を送出するために、
割込み制御回路27に接続されている。
【0024】同様に、障害要因レジスタ25に接続され
た割込み回路28は、少なくとも障害要因レジスタ25
に格納されている他系の障害要因を示す信号を送出する
ために、割込み制御回路27に接続されている。
た割込み回路28は、少なくとも障害要因レジスタ25
に格納されている他系の障害要因を示す信号を送出する
ために、割込み制御回路27に接続されている。
【0025】割込み制御回路27は、割込み回路26ま
たは28からの出力信号に応じて、基本的なPBX交換
プログラムを実行しているMPU14に対し、ハードウ
エア的に割込みを行うために内部バス20でMPU14
に接続されている。
たは28からの出力信号に応じて、基本的なPBX交換
プログラムを実行しているMPU14に対し、ハードウ
エア的に割込みを行うために内部バス20でMPU14
に接続されている。
【0026】割込み用の内部バス20はたとえば3本の
信号線から構成され3ビットの情報を伝送する内部バス
で、障害要因および障害の発生個所が自系か他系かに応
じてレベル0〜7の異なる割込み信号をMPU14に伝
送する。この割込み信号のレベルすなわち割込みレベル
に応じてMPU14は、自系または他系どちらのメモリ
で障害が発生したかを認識し、異なる割込み処理(割込
みプログラム)を実行する。
信号線から構成され3ビットの情報を伝送する内部バス
で、障害要因および障害の発生個所が自系か他系かに応
じてレベル0〜7の異なる割込み信号をMPU14に伝
送する。この割込み信号のレベルすなわち割込みレベル
に応じてMPU14は、自系または他系どちらのメモリ
で障害が発生したかを認識し、異なる割込み処理(割込
みプログラム)を実行する。
【0027】なお、中央処理装置12の構成は、中央処
理装置11とまったく同一なので、中央処理装置12の
主メモリである他系メモリ16以外は省略する。
理装置11とまったく同一なので、中央処理装置12の
主メモリである他系メモリ16以外は省略する。
【0028】以下、このような構成を有する本実施形態
の動作について説明する。
の動作について説明する。
【0029】(A−2)実施形態の動作 あらかじめタイムアウト監視回路13は、自系メモリ1
5に対するアクセスタイムアウト時間TSと、他系メモ
リ16に対するアクセスタイムアウト時間TOの情報を
得ている。ここではTSの方がTOより長く、たとえば
TS=10μS、TO=5μSとする。ただし必要に応
じて、TSの方がTOより短くなるように設定してもよ
いし、その時間も5μS、10μSより短くてもよく長
くてもよい。要するにシステムのタイミング設計が許容
し、MPU制御回路17が認識できる程度にTSとTO
のあいだに時間差があればよい。PBX交換機の中央処
理装置として動作しているアクト系の中央処理装置11
内のMPU14は正常時には、自系メモリ15および他
系メモリ16に対して同時にアクセスし、同一のデータ
またはプログラムを書き込むとともに、当該アクセス開
始時にはタイムアウト監視回路13に起動信号を送出す
る。
5に対するアクセスタイムアウト時間TSと、他系メモ
リ16に対するアクセスタイムアウト時間TOの情報を
得ている。ここではTSの方がTOより長く、たとえば
TS=10μS、TO=5μSとする。ただし必要に応
じて、TSの方がTOより短くなるように設定してもよ
いし、その時間も5μS、10μSより短くてもよく長
くてもよい。要するにシステムのタイミング設計が許容
し、MPU制御回路17が認識できる程度にTSとTO
のあいだに時間差があればよい。PBX交換機の中央処
理装置として動作しているアクト系の中央処理装置11
内のMPU14は正常時には、自系メモリ15および他
系メモリ16に対して同時にアクセスし、同一のデータ
またはプログラムを書き込むとともに、当該アクセス開
始時にはタイムアウト監視回路13に起動信号を送出す
る。
【0030】タイムアウト監視回路13はこの起動信号
を受信すると、初期値から時間のカウントをはじめる。
を受信すると、初期値から時間のカウントをはじめる。
【0031】当該アクセスによる書き込みが完了すると
各メモリ15,16が、制御バス21,22で受信回路
19,23に応答信号を送出する。正常時には受信回路
19および23はそれぞれ、タイミングTS、TOまで
に応答信号を受信し、これらを検出したMPU制御回路
17は、両応答信号の受信を示す1つの応答通知をMP
U14に送出する。
各メモリ15,16が、制御バス21,22で受信回路
19,23に応答信号を送出する。正常時には受信回路
19および23はそれぞれ、タイミングTS、TOまで
に応答信号を受信し、これらを検出したMPU制御回路
17は、両応答信号の受信を示す1つの応答通知をMP
U14に送出する。
【0032】このときにはまだ、MPU制御回路17
は、タイムアウト監視回路13が送出するTO経過通知
もTS経過通知も受信していない。通常は、応答通知を
送出してからMPU14がつぎの1サイクルをはじめる
までの期間に、MPU制御回路17はTO経過通知とT
S経過通知を相次いで受信することになる。もちろん他
系メモリ22からの応答信号受信、TO=5μS経過通
知受信、自系メモリ15からの応答信号受信、TS=1
0μS経過通知受信という順番になってもよい。
は、タイムアウト監視回路13が送出するTO経過通知
もTS経過通知も受信していない。通常は、応答通知を
送出してからMPU14がつぎの1サイクルをはじめる
までの期間に、MPU制御回路17はTO経過通知とT
S経過通知を相次いで受信することになる。もちろん他
系メモリ22からの応答信号受信、TO=5μS経過通
知受信、自系メモリ15からの応答信号受信、TS=1
0μS経過通知受信という順番になってもよい。
【0033】どのケースであれ正常時には、少なくとも
TS=10μSの経過までにはMPU制御回路17は応
答通知の送出を終えており、TO、TSの経過通知受信
によって特に動作を行うことはない。
TS=10μSの経過までにはMPU制御回路17は応
答通知の送出を終えており、TO、TSの経過通知受信
によって特に動作を行うことはない。
【0034】応答通知を受信したあとでMPU14は、
自系メモリ15、他系メモリ16に対してつぎの1サイ
クルの書き込みアクセスを開始するとともに、タイムア
ウト監視回路13はふたたびこの開始タイミングで初期
値からカウントをはじめる。正常な状態がつづいている
あいだは、このような二重書き込みのサイクルが繰り返
される。
自系メモリ15、他系メモリ16に対してつぎの1サイ
クルの書き込みアクセスを開始するとともに、タイムア
ウト監視回路13はふたたびこの開始タイミングで初期
値からカウントをはじめる。正常な状態がつづいている
あいだは、このような二重書き込みのサイクルが繰り返
される。
【0035】このサイクルが繰り返されているあいだ、
スタンバイ系の中央処理装置12はスタンバイ(待機)
状態を維持している。
スタンバイ系の中央処理装置12はスタンバイ(待機)
状態を維持している。
【0036】ところがある1サイクルにおいて、自系メ
モリ15からの応答信号はタイムアウト時間TSまでに
自系受信回路19で受信されたものの、他系メモリ16
から出力されるはずの応答信号がタイムアウト時間TO
までに受信されなかったとする。
モリ15からの応答信号はタイムアウト時間TSまでに
自系受信回路19で受信されたものの、他系メモリ16
から出力されるはずの応答信号がタイムアウト時間TO
までに受信されなかったとする。
【0037】この場合、当該サイクルで、TO=5μS
の経過通知までに他系受信回路23が他系メモリ16か
らの応答信号を受信していないことを検出したMPU制
御回路17は、TO経過通知後ただちに、他系用の障害
要因レジスタ25に障害要因としてタイムアウトエラー
を格納し、当該二重書き込みのサイクルを終了させる。
これに前後して自系メモリ15から送出された応答信号
の受信が、MPU制御回路17に検出される。
の経過通知までに他系受信回路23が他系メモリ16か
らの応答信号を受信していないことを検出したMPU制
御回路17は、TO経過通知後ただちに、他系用の障害
要因レジスタ25に障害要因としてタイムアウトエラー
を格納し、当該二重書き込みのサイクルを終了させる。
これに前後して自系メモリ15から送出された応答信号
の受信が、MPU制御回路17に検出される。
【0038】タイムアウトエラーの格納を割込み回路2
8が検出すると割込み制御回路27は、MPU14に対
し割込み信号を送出する。この割込み信号のレベルは、
障害の発生個所が他系メモリ16または他系メモリ16
に影響する複合バス18の周辺個所であることと、障害
要因がタイムアウトエラーであることを示すもので、上
述のレベル0〜7の8つのレベルのなかから選択された
ものである。
8が検出すると割込み制御回路27は、MPU14に対
し割込み信号を送出する。この割込み信号のレベルは、
障害の発生個所が他系メモリ16または他系メモリ16
に影響する複合バス18の周辺個所であることと、障害
要因がタイムアウトエラーであることを示すもので、上
述のレベル0〜7の8つのレベルのなかから選択された
ものである。
【0039】割込み信号を受信することによってMPU
14は、スタンバイ系の他系メモリ16に対しては書き
込みアクセスを行わずに障害修復処理を行うとともに、
自系メモリ15に対してはこれまでどおり、データなど
の書き込みを行う。したがって中央処理装置11による
PBX交換機の中央処理装置としての働きは、当該障害
発生によってまったく影響を受けることがない。
14は、スタンバイ系の他系メモリ16に対しては書き
込みアクセスを行わずに障害修復処理を行うとともに、
自系メモリ15に対してはこれまでどおり、データなど
の書き込みを行う。したがって中央処理装置11による
PBX交換機の中央処理装置としての働きは、当該障害
発生によってまったく影響を受けることがない。
【0040】そして障害修復処理によって他系メモリ1
6部での障害が修復された場合には、ふたたび二重書き
込みが開始される。なお、障害修復処理を実行するのは
MPU14ではなく、中央処理装置12に内蔵されたM
PU(MPU14に相当するもの)が実行するようにし
てもよい。この場合、割込み信号を受信したときにMP
U14は、スタンバイ系中央処理装置12の切り離しを
行い、障害修復後に再組み込みを行うなどの処理を実行
することになる。
6部での障害が修復された場合には、ふたたび二重書き
込みが開始される。なお、障害修復処理を実行するのは
MPU14ではなく、中央処理装置12に内蔵されたM
PU(MPU14に相当するもの)が実行するようにし
てもよい。この場合、割込み信号を受信したときにMP
U14は、スタンバイ系中央処理装置12の切り離しを
行い、障害修復後に再組み込みを行うなどの処理を実行
することになる。
【0041】一方、正常に二重書き込みが行われている
ときにある1サイクルにおいて、他系メモリ16からの
応答信号はタイムアウト時間TOまでに他系受信回路2
3で受信されたものの、自系メモリ15から出力される
はずの応答信号がタイムアウト時間TSまでに受信され
なかったとする。
ときにある1サイクルにおいて、他系メモリ16からの
応答信号はタイムアウト時間TOまでに他系受信回路2
3で受信されたものの、自系メモリ15から出力される
はずの応答信号がタイムアウト時間TSまでに受信され
なかったとする。
【0042】この場合、当該サイクルで、TS=10μ
Sの経過通知までに自系受信回路19が自系メモリ15
からの応答信号を受信していないことを検出したMPU
制御回路17は、TS経過通知後ただちに、自系用の障
害要因レジスタ24に障害要因としてタイムアウトエラ
ーを格納し、当該二重書き込みのサイクルを終了させ
る。この場合このときには、他系メモリ16からの応答
信号の受信は、すでにMPU制御回路17に検出されて
いる。
Sの経過通知までに自系受信回路19が自系メモリ15
からの応答信号を受信していないことを検出したMPU
制御回路17は、TS経過通知後ただちに、自系用の障
害要因レジスタ24に障害要因としてタイムアウトエラ
ーを格納し、当該二重書き込みのサイクルを終了させ
る。この場合このときには、他系メモリ16からの応答
信号の受信は、すでにMPU制御回路17に検出されて
いる。
【0043】上記の他系のタイムアウトエラーの場合と
同様に、このタイムアウトエラーの格納を自系用の割込
み回路26が検出すると、割込み制御回路27はMPU
14に対し割込み信号を送出する。ただしこの割込み信
号のレベルは上述した割込み信号とは異なる。障害要因
がタイムアウトエラーである点では上述のケースと同じ
であるが、障害の発生個所が自系メモリ15または自系
メモリ15に影響する複合バス18の周辺個所である点
が異なるためである。
同様に、このタイムアウトエラーの格納を自系用の割込
み回路26が検出すると、割込み制御回路27はMPU
14に対し割込み信号を送出する。ただしこの割込み信
号のレベルは上述した割込み信号とは異なる。障害要因
がタイムアウトエラーである点では上述のケースと同じ
であるが、障害の発生個所が自系メモリ15または自系
メモリ15に影響する複合バス18の周辺個所である点
が異なるためである。
【0044】割込み信号から自系メモリ15に障害が発
生したことを認識したMPU14は、ひとまず二重書き
込みのサイクルを終了して、上記とは異なる割込み処理
を行う。
生したことを認識したMPU14は、ひとまず二重書き
込みのサイクルを終了して、上記とは異なる割込み処理
を行う。
【0045】この割込み処理の内容はタイムアウト時間
と1サイクルの時間との関係によって変わり得る。長い
方のタイムアウト時間、すなわち本実施形態では自系タ
イムアウト時間TS=10μSの経過したあとの残りの
1サイクルの時間に障害修復処理を実行するだけの余裕
がない場合には、二重書き込みのサイクルを終了すると
同時に、これまでスタンバイ系であった中央処理装置1
2をアクト系として自系はPBX交換機の中央処理装置
としての動作を中止して障害修復処理に専従する。障害
修復後には、自系中央処理装置11はスタンバイ系とな
ってもよいし、ふたたびアクト系となり他系中央処理装
置12をスタンバイ系としてもよい。
と1サイクルの時間との関係によって変わり得る。長い
方のタイムアウト時間、すなわち本実施形態では自系タ
イムアウト時間TS=10μSの経過したあとの残りの
1サイクルの時間に障害修復処理を実行するだけの余裕
がない場合には、二重書き込みのサイクルを終了すると
同時に、これまでスタンバイ系であった中央処理装置1
2をアクト系として自系はPBX交換機の中央処理装置
としての動作を中止して障害修復処理に専従する。障害
修復後には、自系中央処理装置11はスタンバイ系とな
ってもよいし、ふたたびアクト系となり他系中央処理装
置12をスタンバイ系としてもよい。
【0046】余裕がある場合には、その期間に障害修復
処理を実行してみて修復できればつぎの1サイクルがは
じまるはずの時刻にはふたたび二重書き込みサイクルを
開始し、修復できなければその時点で他系中央処理装置
12をアクト系とし、MPU14は障害修復処理に専従
するようにしてもよい。これにより当該PBX交換機の
動作にはまったく影響が表れない。
処理を実行してみて修復できればつぎの1サイクルがは
じまるはずの時刻にはふたたび二重書き込みサイクルを
開始し、修復できなければその時点で他系中央処理装置
12をアクト系とし、MPU14は障害修復処理に専従
するようにしてもよい。これにより当該PBX交換機の
動作にはまったく影響が表れない。
【0047】なお、あらかじめ格納された障害修復処理
プログラムで障害が修復できない場合には、パッケージ
ごと中央処理装置が取り替えられることになる。
プログラムで障害が修復できない場合には、パッケージ
ごと中央処理装置が取り替えられることになる。
【0048】(A−3)実施形態の効果 以上のように、本実施形態によれば、同じ障害要因に対
しても障害の発生個所に応じて異なる割込み処理で、障
害修復やアクト系とスタンバイ系の切り替えなどの多様
な処理を含む障害復旧処理を実行することができ、障害
発生時にも中央処理装置としての動作に影響を与えず、
システムの信頼性を高めることができる。
しても障害の発生個所に応じて異なる割込み処理で、障
害修復やアクト系とスタンバイ系の切り替えなどの多様
な処理を含む障害復旧処理を実行することができ、障害
発生時にも中央処理装置としての動作に影響を与えず、
システムの信頼性を高めることができる。
【0049】(B)他の実施形態 なお、上記の実施形態では、自系タイムアウト時間TS
の方が他系タイムアウト時間TOより長いものとした
が、実際には複合バス18においても、制御バス21,
22においても他系の伝送遅延の方が大きくなるのが普
通であるので、TSの方がTOより短くなるように設定
した方が、システムのタイミング設計上有利である。
の方が他系タイムアウト時間TOより長いものとした
が、実際には複合バス18においても、制御バス21,
22においても他系の伝送遅延の方が大きくなるのが普
通であるので、TSの方がTOより短くなるように設定
した方が、システムのタイミング設計上有利である。
【0050】また必要に応じて、3つ以上の中央処理装
置を接続して三重冗長以上の冗長度でシステムを構成し
てもよい。この場合、請求項における「中央処理装置」
は必ずしも1つの中央処理装置であることを意味せず、
1または複数の中央処理装置を意味する。
置を接続して三重冗長以上の冗長度でシステムを構成し
てもよい。この場合、請求項における「中央処理装置」
は必ずしも1つの中央処理装置であることを意味せず、
1または複数の中央処理装置を意味する。
【0051】さらに、上述の実施形態においては、PB
X交換機に適用した場合を例に説明したが、本発明の適
用範囲はこれに限定されず、少なくとも一定時間は稼動
停止することなく動作しつづけることを求められる機器
のなかの、冗長構成をなす中央処理装置に広く適用する
ことができ、その信頼性を高める。
X交換機に適用した場合を例に説明したが、本発明の適
用範囲はこれに限定されず、少なくとも一定時間は稼動
停止することなく動作しつづけることを求められる機器
のなかの、冗長構成をなす中央処理装置に広く適用する
ことができ、その信頼性を高める。
【0052】
【発明の効果】以上のように、第1の発明にかかる障害
復旧方法では、書き込み動作中に発生した障害が、アク
ト系又はスタンバイ系のどちらの中央処理装置で発生し
たかを判定し、この判定の結果に応じて異なる復旧処理
を行うので、多様な割込み処理で多様な障害復旧処理を
実行することが可能で、障害復旧方法の信頼性を高める
ことができる。
復旧方法では、書き込み動作中に発生した障害が、アク
ト系又はスタンバイ系のどちらの中央処理装置で発生し
たかを判定し、この判定の結果に応じて異なる復旧処理
を行うので、多様な割込み処理で多様な障害復旧処理を
実行することが可能で、障害復旧方法の信頼性を高める
ことができる。
【0053】また、第2の発明にかかる中央処理装置で
は、自系メモリに対する1サイクル分の情報書き込みが
終了したことを、内蔵している中央処理部制御回路に通
知する自系応答手段と、他系メモリに対する1サイクル
分の情報書き込みが終了したことを、前記中央処理部制
御回路に通知する他系応答手段とを備えて、どちらの応
答手段からの通知がないかによって異なる復旧処理を行
うので、想定される障害状況に応じて柔軟に多彩な復旧
処理を用意することができ、信頼性が高い。
は、自系メモリに対する1サイクル分の情報書き込みが
終了したことを、内蔵している中央処理部制御回路に通
知する自系応答手段と、他系メモリに対する1サイクル
分の情報書き込みが終了したことを、前記中央処理部制
御回路に通知する他系応答手段とを備えて、どちらの応
答手段からの通知がないかによって異なる復旧処理を行
うので、想定される障害状況に応じて柔軟に多彩な復旧
処理を用意することができ、信頼性が高い。
【0054】さらに、このような中央処理装置を複数接
続することにより構成された第3の発明にかかる中央処
理システムでは、当該中央処理装置による冗長構成で、
システム全体として信頼性の向上を図ることができる。
続することにより構成された第3の発明にかかる中央処
理システムでは、当該中央処理装置による冗長構成で、
システム全体として信頼性の向上を図ることができる。
【図1】実施形態にかかる中央処理システムの構成を示
すブロック図である。
すブロック図である。
10…中央処理システム、11,12…中央処理装置、
13…タイムアウト監視回路、14…MPU、15…自
系メモリ、16…他系メモリ、17…MPU制御回路、
18…複合バス、19,23…受信回路、20…内部バ
ス、21,22…制御バス、24,25…障害要因レジ
スタ、26,28…割込み回路。
13…タイムアウト監視回路、14…MPU、15…自
系メモリ、16…他系メモリ、17…MPU制御回路、
18…複合バス、19,23…受信回路、20…内部バ
ス、21,22…制御バス、24,25…障害要因レジ
スタ、26,28…割込み回路。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI H04Q 3/58 101 H04Q 3/58 101
Claims (5)
- 【請求項1】 中央処理装置として機能しているアクト
系の第1の中央処理装置と、中央処理装置として機能し
ていないスタンバイ系で、この第1の中央処理装置と同
一の構成を有する第2の中央処理装置とを並置し、これ
ら第1及び第2の中央処理装置の主メモリに対して同一
サイクルで同一情報を書き込むときに発生する障害の復
旧方法において、 前記書き込み動作中に発生した障害が、第1又は第2の
どちらの中央処理装置で発生したかを、アクト系の第1
の中央処理装置が判定し、 この判定の結果に応じて異なる復旧処理を行うことを特
徴とする障害復旧方法。 - 【請求項2】 請求項1の障害復旧方法において、 前記アクト系の第1の中央処理装置では、第1の障害要
因記憶手段に第1の中央処理装置で発生した障害の障害
要因を記憶し、第2の障害要因記憶手段に第2の中央処
理装置で発生した障害の障害要因を記憶しておき、 前記アクト系の第1の中央処理装置に内蔵されている中
央処理部は、前記障害要因に応じた割込みレベルで割込
みを受け、 割込みを受けた当該中央処理部は、この障害要因を記憶
している障害要因記憶手段が第1の障害要因記憶手段で
ある場合には少なくともスタンバイ系とアクト系の切り
替えを含む復旧処理を行い、前記の障害要因を記憶して
いる障害要因記憶手段が第2の障害要因記憶手段である
場合には少なくともスタンバイ系とアクト系の切り替え
を含まない復旧処理を行うことを特徴とする障害復旧方
法。 - 【請求項3】 内蔵している自系メモリと外部の他系メ
モリに対して同一サイクルで同一情報を書き込む中央処
理装置において、 自系メモリに対する1サイクル分の情報書き込みが終了
したことを、内蔵している中央処理部制御回路に通知す
る自系応答手段と、 他系メモリに対する1サイクル分の情報書き込みが終了
したことを、前記中央処理部制御回路に通知する他系応
答手段とを備え、 前記サイクルに対応した所定のタイミングまでに、前記
自系又は他系の応答手段から前記通知がないときは前記
中央処理部が、どちらの応答手段からの通知がないかに
よって異なる復旧処理を行うことを特徴とする中央処理
装置。 - 【請求項4】 請求項3の中央処理装置において、 前記復旧処理は、1サイクル内の第1のタイミングまで
に自系応答手段からの通知がない場合には、少なくとも
自系の中央処理装置をスタンバイ系にすると共に他系メ
モリを内蔵している中央処理装置をアクト系にし、当該
1サイクル内の第2のタイミングまでに他系応答手段か
らの通知がない場合には、少なくとも自系の中央処理装
置をそのままアクト系として維持する処理であり、 前記の復旧処理を当該1サイクル以内に実行したうえ
で、少なくともアクト系の主メモリに対する次ぎの1サ
イクル以降の情報書き込みを、正常に実行する手段を備
えることを特徴とする中央処理装置。 - 【請求項5】 請求項3又は4のいずれかの中央処理装
置を複数接続することにより構成することを特徴とする
中央処理システム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10065521A JPH11265321A (ja) | 1998-03-16 | 1998-03-16 | 障害復旧方法、中央処理装置及び中央処理システム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10065521A JPH11265321A (ja) | 1998-03-16 | 1998-03-16 | 障害復旧方法、中央処理装置及び中央処理システム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH11265321A true JPH11265321A (ja) | 1999-09-28 |
Family
ID=13289423
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP10065521A Pending JPH11265321A (ja) | 1998-03-16 | 1998-03-16 | 障害復旧方法、中央処理装置及び中央処理システム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH11265321A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008310411A (ja) * | 2007-06-12 | 2008-12-25 | Nec Corp | 二重化装置および障害時系切替方法 |
| CN111382019A (zh) * | 2018-12-26 | 2020-07-07 | 佳能株式会社 | 信息处理装置、信息处理装置的控制方法和存储介质 |
-
1998
- 1998-03-16 JP JP10065521A patent/JPH11265321A/ja active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008310411A (ja) * | 2007-06-12 | 2008-12-25 | Nec Corp | 二重化装置および障害時系切替方法 |
| CN111382019A (zh) * | 2018-12-26 | 2020-07-07 | 佳能株式会社 | 信息处理装置、信息处理装置的控制方法和存储介质 |
| CN111382019B (zh) * | 2018-12-26 | 2024-05-24 | 佳能株式会社 | 信息处理装置、信息处理装置的控制方法和存储介质 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0186006B1 (en) | Multiprocessor system | |
| US5452443A (en) | Multi-processor system with fault detection | |
| US4351023A (en) | Process control system with improved system security features | |
| US20060248384A1 (en) | Method and apparatus for recovery from loss of lock step | |
| JPH08320835A (ja) | 外部バスの障害検出方法 | |
| JPH11265321A (ja) | 障害復旧方法、中央処理装置及び中央処理システム | |
| JP3025732B2 (ja) | 多重化コンピュータシステムの制御方式 | |
| JP3313667B2 (ja) | 二重化システムの障害検出方式及びその方法 | |
| JPH0764930A (ja) | Cpu間相互監視方法 | |
| JP2001175545A (ja) | サーバシステムおよび障害診断方法ならびに記録媒体 | |
| JP3169488B2 (ja) | 通信制御装置 | |
| JPH05216855A (ja) | マルチcpu制御方式 | |
| KR19980063196A (ko) | 이중화 프로세서 시스템의 동작모드 결정방법 | |
| JP2879480B2 (ja) | 冗長計算機システムの同期外れ時の切替方式 | |
| JPH09293020A (ja) | インターフェース回路 | |
| JP2000172575A (ja) | メモリーバックアップシステム | |
| JPS60140438A (ja) | 情報処理系の系切替制御方式 | |
| JPH04360242A (ja) | 二重化システムの系切替装置およびその方法 | |
| JP2954040B2 (ja) | 割込監視装置 | |
| JPS6213702B2 (ja) | ||
| JPS634210B2 (ja) | ||
| CN120560945A (zh) | 非透明桥监控方法、装置、设备及计算机可读存储介质 | |
| JPH06168151A (ja) | 2重化計算機システム | |
| JPH04211841A (ja) | 二重化処理装置 | |
| JPH03111962A (ja) | マルチプロセッサ・システム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040312 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040330 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20040803 |