JPH0792763B2 - 障害処理方式 - Google Patents
障害処理方式Info
- Publication number
- JPH0792763B2 JPH0792763B2 JP63289170A JP28917088A JPH0792763B2 JP H0792763 B2 JPH0792763 B2 JP H0792763B2 JP 63289170 A JP63289170 A JP 63289170A JP 28917088 A JP28917088 A JP 28917088A JP H0792763 B2 JPH0792763 B2 JP H0792763B2
- Authority
- JP
- Japan
- Prior art keywords
- arithmetic processing
- processing unit
- error
- interrupt
- failure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 6
- 238000012545 processing Methods 0.000 claims description 44
- 238000003672 processing method Methods 0.000 claims description 7
- 230000001629 suppression Effects 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 6
- 238000012423 maintenance Methods 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 238000011084 recovery Methods 0.000 claims 1
- 238000012937 correction Methods 0.000 description 5
- 230000010365 information processing Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
Landscapes
- Retry When Errors Occur (AREA)
- Hardware Redundancy (AREA)
- Debugging And Monitoring (AREA)
Description
【発明の詳細な説明】 技術分野 本発明は障害処理方式に関し、特にエラー訂正可能な制
御記憶を有する演算処理装置において訂正可能エラーが
多発した場合の障害処理方式に関する。
御記憶を有する演算処理装置において訂正可能エラーが
多発した場合の障害処理方式に関する。
従来技術 従来、この種の情報処理装置は制御記憶にエラー訂正回
路を有しており、訂正可能なエラーが発生した場合にそ
れぞれ多発したとしてもそのまま処理を続行するように
なっている。またエラーが発生した場合、サービスプロ
セッサ等によりエラー情報が収集されるが、訂正可能エ
ラーの多発によりこのエラー情報がオーバフローするた
め、エラー受付抑止を行っている装置もある。
路を有しており、訂正可能なエラーが発生した場合にそ
れぞれ多発したとしてもそのまま処理を続行するように
なっている。またエラーが発生した場合、サービスプロ
セッサ等によりエラー情報が収集されるが、訂正可能エ
ラーの多発によりこのエラー情報がオーバフローするた
め、エラー受付抑止を行っている装置もある。
上述した従来の情報処理装置では、制御記憶に訂正可能
なエラーが発生してもそのまま動作を続行するようにな
っているために、訂正可能なエラーが多発した場合に演
算処理装置の性能が低下するという欠点がある。また、
訂正可能なエラーが多発しているため、訂正可能エラー
が訂正不能なエラーとなっていまった場合、演算処理装
置の動作続行が不可能となり、本情報処理装置が運転停
止となってしまうという欠点がある。
なエラーが発生してもそのまま動作を続行するようにな
っているために、訂正可能なエラーが多発した場合に演
算処理装置の性能が低下するという欠点がある。また、
訂正可能なエラーが多発しているため、訂正可能エラー
が訂正不能なエラーとなっていまった場合、演算処理装
置の動作続行が不可能となり、本情報処理装置が運転停
止となってしまうという欠点がある。
場合によっては、訂正可能エラーであっても、制御記憶
内のマイクロプログラムのステップにより命令実行不能
となることもある。
内のマイクロプログラムのステップにより命令実行不能
となることもある。
発明の目的 そこで、本発明はかかる従来技術の欠点を解決すべくな
されたものであって、その目的とするところは、訂正可
能エラーが多発した場合、情報処理システム全体のシス
テムダウンを防止するようにした障害処理方式を提供す
ることにある。
されたものであって、その目的とするところは、訂正可
能エラーが多発した場合、情報処理システム全体のシス
テムダウンを防止するようにした障害処理方式を提供す
ることにある。
発明の構成 本発明による障害処理方式は、演算処理装置の障害発生
時に障害情報の収集及び障害救済処理を行う障害処理方
式であって、前記演算処理装置からの訂正可能エラーの
発生報告毎にこの発生回数を計数する計数手段と、前記
計数手段の計数回数が一定時間内に予め定められた回数
になったとき前記訂正可能エラーの発生報告の受付を抑
止する抑止手段と、前記回数になったときに前記演算処
理装置への割込みを発生させる割込み手段と、しかる後
に前記演算処理装置をシステムから切離す手段とを設
け、前記演算処理装置内のソフトウェアビジブルレジス
タの内容を凍結させて他の正常な演算処理装置へ前記レ
ジスタの各内容を移送制御するようにしたことを特徴と
する。
時に障害情報の収集及び障害救済処理を行う障害処理方
式であって、前記演算処理装置からの訂正可能エラーの
発生報告毎にこの発生回数を計数する計数手段と、前記
計数手段の計数回数が一定時間内に予め定められた回数
になったとき前記訂正可能エラーの発生報告の受付を抑
止する抑止手段と、前記回数になったときに前記演算処
理装置への割込みを発生させる割込み手段と、しかる後
に前記演算処理装置をシステムから切離す手段とを設
け、前記演算処理装置内のソフトウェアビジブルレジス
タの内容を凍結させて他の正常な演算処理装置へ前記レ
ジスタの各内容を移送制御するようにしたことを特徴と
する。
更に前記抑止手段は、抑止開始から一定時間後に抑止解
除されてエラー情報の収集を行って保守者への警告をな
すよう構成されており、前記演算処理装置は、前記割込
みを自己の命令実行の切れ目で受けて次の命令の実行を
抑止し前記割込み手段へ当該割込みに対する応答を送出
するよう構成されており、この応答を受けてから前記移
送制御をなすようにしたことを特徴とする。
除されてエラー情報の収集を行って保守者への警告をな
すよう構成されており、前記演算処理装置は、前記割込
みを自己の命令実行の切れ目で受けて次の命令の実行を
抑止し前記割込み手段へ当該割込みに対する応答を送出
するよう構成されており、この応答を受けてから前記移
送制御をなすようにしたことを特徴とする。
実施例 次に、本発明の実施例について図面を参照して説明す
る。
る。
第1図は本発明の一実施例を示す構成図である。図にお
いて、障害処理装置1は演算処理装置2を含むその他の
装置の障害発生時における障害情報収集及び障害救済処
理を行う。
いて、障害処理装置1は演算処理装置2を含むその他の
装置の障害発生時における障害情報収集及び障害救済処
理を行う。
制御記憶回路3は演算処理装置2のマイクロプログラム
を格納するメモリであり、エラー訂正コードをも有して
いる。この制御記憶回路3から読出されたマイクロプロ
グラムデータはマイクロ命令読出しレジスタ5へセット
されて指令を実行するが、それに先立ちエラー訂正回路
4においてデータの正当性チェックが行われ、訂正可能
なエラーであれば訂正されたデータをマイクロ命令読出
しレジスタ5へセットする。このときエラー訂正回路4
は障害処理装置1のエラー受付け回路8へエラー発生通
知を行う。エラー受付け回路8は障害処理制御部7への
割込みを発生する。尚、このエラー通知はエラー抑止回
路9により受付けを抑止することが可能となっている。
を格納するメモリであり、エラー訂正コードをも有して
いる。この制御記憶回路3から読出されたマイクロプロ
グラムデータはマイクロ命令読出しレジスタ5へセット
されて指令を実行するが、それに先立ちエラー訂正回路
4においてデータの正当性チェックが行われ、訂正可能
なエラーであれば訂正されたデータをマイクロ命令読出
しレジスタ5へセットする。このときエラー訂正回路4
は障害処理装置1のエラー受付け回路8へエラー発生通
知を行う。エラー受付け回路8は障害処理制御部7への
割込みを発生する。尚、このエラー通知はエラー抑止回
路9により受付けを抑止することが可能となっている。
エラーカウンタ10はエラー受付け回路8により受付けら
れたエラー発生通知の回数を計数するものであり、ある
一定時間毎にリセットされるものとする。よって、この
エラーカウンタ10は当該一定時間内における演算処理装
置2の訂正可能エラーの発生回数を計数することにな
る。このエラーカウンタ10による計数内容が予め設定さ
れている回数に達すると、障害処理装置制御部7はエラ
ー抑止回路9によりエラー発生報告の受付けを抑止する
よう制御する。同時に、通信部11を介して演算処理装置
2への命令停止割込みをマイクロプログラム制御部6へ
発生するものである。
れたエラー発生通知の回数を計数するものであり、ある
一定時間毎にリセットされるものとする。よって、この
エラーカウンタ10は当該一定時間内における演算処理装
置2の訂正可能エラーの発生回数を計数することにな
る。このエラーカウンタ10による計数内容が予め設定さ
れている回数に達すると、障害処理装置制御部7はエラ
ー抑止回路9によりエラー発生報告の受付けを抑止する
よう制御する。同時に、通信部11を介して演算処理装置
2への命令停止割込みをマイクロプログラム制御部6へ
発生するものである。
次に第2図の動作フローチャートを使用して全体的な動
作について説明する。障害処理装置制御部7は上記で説
明したエラー発生報告を受けると、カウンタ10を更新し
てカウンタが予め決められた値Nをオーバしたかどうか
をチェックする。オーバしていなければそのまま動作を
続行させる。尚、カウンタ10は第2図には図示していな
いが最初のエラー発生から予め決められた時間経過した
らリセットされるものとする。カウンタ10がNをオーバ
した場合は、エラー抑止回路9をセットし一旦エラー受
付けを抑止する。
作について説明する。障害処理装置制御部7は上記で説
明したエラー発生報告を受けると、カウンタ10を更新し
てカウンタが予め決められた値Nをオーバしたかどうか
をチェックする。オーバしていなければそのまま動作を
続行させる。尚、カウンタ10は第2図には図示していな
いが最初のエラー発生から予め決められた時間経過した
らリセットされるものとする。カウンタ10がNをオーバ
した場合は、エラー抑止回路9をセットし一旦エラー受
付けを抑止する。
次に演算処理装置2以外に演算処理装置が存在するかチ
ェックされ、存在しなければやはり動作を続行する。こ
の場合図示していないが、エラー抑止回路9はセット後
一定時間経過後解除され、エラー情報が収集される。こ
れにより保守者等への警告とする。
ェックされ、存在しなければやはり動作を続行する。こ
の場合図示していないが、エラー抑止回路9はセット後
一定時間経過後解除され、エラー情報が収集される。こ
れにより保守者等への警告とする。
次に他の演算処理装置が存在した場合について説明す
る。この場合演算処理装置2に対し演算処理装置通信部
11を経由しマイクロプログラム制御部へ命令停止割込み
を通知する。演算処理装置2のマイクロプログラムはソ
フトウェア命令を実行しており、該割込みを命令の切れ
目で受け、次命令の実行を抑止して障害処理装置1に応
答を返す。応答を受けた障害処理装置1は、演算処理装
置2のソフトウェアビジブルレジスタを診断インタフェ
ースを介して抜出し、他の正常な演算処理装置(図示せ
ず)へ移送する。以降の処理は周知の技術であるプロセ
ッサリリーフ処理の動作であり、ここでは特に説明しな
い。
る。この場合演算処理装置2に対し演算処理装置通信部
11を経由しマイクロプログラム制御部へ命令停止割込み
を通知する。演算処理装置2のマイクロプログラムはソ
フトウェア命令を実行しており、該割込みを命令の切れ
目で受け、次命令の実行を抑止して障害処理装置1に応
答を返す。応答を受けた障害処理装置1は、演算処理装
置2のソフトウェアビジブルレジスタを診断インタフェ
ースを介して抜出し、他の正常な演算処理装置(図示せ
ず)へ移送する。以降の処理は周知の技術であるプロセ
ッサリリーフ処理の動作であり、ここでは特に説明しな
い。
発明の効果 以上説明したように、本発明によれば、制御記憶回路の
訂正可能エラーの多発を検出し、多発と判断したときに
周知の技術であるプロセッサリリーフ処理を使用して演
算処理装置をシステムから切離すことを可能にすること
により、制御記憶の訂正可能エラー多発が訂正不能エラ
ーとなったり又エラーの発生しているマイクロプログラ
ムのステップによって命令実行不可となったりして、シ
ステムの運転を停止させてしまうということをなくすと
いう効果がある。
訂正可能エラーの多発を検出し、多発と判断したときに
周知の技術であるプロセッサリリーフ処理を使用して演
算処理装置をシステムから切離すことを可能にすること
により、制御記憶の訂正可能エラー多発が訂正不能エラ
ーとなったり又エラーの発生しているマイクロプログラ
ムのステップによって命令実行不可となったりして、シ
ステムの運転を停止させてしまうということをなくすと
いう効果がある。
【図面の簡単な説明】 第1図は本発明の実施例のブロック図、第2図は第1図
のブロックの動作を示すフローチャートである。 主要部分の符号の説明 1……障害処理装置 2……演算処理装置 4……エラー訂正回路 5……マイクロ命令読出しレジスタ 8……エラー受付け回路 9……エラー抑止回路 10……エラーカウンタ
のブロックの動作を示すフローチャートである。 主要部分の符号の説明 1……障害処理装置 2……演算処理装置 4……エラー訂正回路 5……マイクロ命令読出しレジスタ 8……エラー受付け回路 9……エラー抑止回路 10……エラーカウンタ
Claims (2)
- 【請求項1】演算処理装置の障害発生時に障害情報の収
集及び障害救済処理を行う障害処理方式であって、前記
演算処理装置からの訂正可能エラーの発生報告毎にこの
発生回数を計数する計数手段と、前記計数手段の計数回
数が一定時間内に予め定められた回数になったとき前記
訂正可能エラーの発生報告の受付を抑止する抑止手段
と、前記回数になったときに前記演算処理装置への割込
みを発生させる割込み手段と、しかる後に前記演算処理
装置をシステムから切離す手段とを設け、前記演算処理
装置内のソフトウェアビジブルレジスタの内容を凍結さ
せて他の正常な演算処理装置へ前記レジスタの各内容を
移送制御するようにしたことを特徴とする障害処理方
式。 - 【請求項2】前記抑止手段は、抑止開始から一定時間後
に抑止解除されてエラー情報の収集を行って保守者への
警告をなすよう構成されており、前記演算処理装置は、
前記割込みを自己の命令実行の切れ目で受けて次の命令
の実行を抑止し前記割込み手段へ当該割込みに対する応
答を送出するよう構成されており、この応答を受けてか
ら前記移送制御をなすようにしたことを特徴とする請求
項1記載の障害処理方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63289170A JPH0792763B2 (ja) | 1988-11-16 | 1988-11-16 | 障害処理方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63289170A JPH0792763B2 (ja) | 1988-11-16 | 1988-11-16 | 障害処理方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH02135533A JPH02135533A (ja) | 1990-05-24 |
| JPH0792763B2 true JPH0792763B2 (ja) | 1995-10-09 |
Family
ID=17739669
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63289170A Expired - Fee Related JPH0792763B2 (ja) | 1988-11-16 | 1988-11-16 | 障害処理方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0792763B2 (ja) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2674894B2 (ja) * | 1991-03-20 | 1997-11-12 | 茨城日本電気株式会社 | 情報処理装置 |
| JP2758742B2 (ja) * | 1991-07-19 | 1998-05-28 | 日本電気株式会社 | 誤動作検出方式 |
| JP2814988B2 (ja) * | 1996-04-12 | 1998-10-27 | 日本電気株式会社 | 障害処理方式 |
| JP5451087B2 (ja) * | 2009-01-26 | 2014-03-26 | エヌイーシーコンピュータテクノ株式会社 | 障害処理装置および方法 |
| JP2012083992A (ja) * | 2010-10-13 | 2012-04-26 | Nec Computertechno Ltd | データ障害処理装置、及びデータ障害処理方法 |
| TWI638262B (zh) * | 2017-11-17 | 2018-10-11 | 慧榮科技股份有限公司 | 資料儲存裝置及應用於其上的操作方法 |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5739465A (en) * | 1980-08-15 | 1982-03-04 | Nippon Signal Co Ltd:The | Multisystem computer device |
| JPS5785151A (en) * | 1980-11-17 | 1982-05-27 | Nec Corp | Error recovery system of logical device |
| JPS57114954A (en) * | 1981-01-05 | 1982-07-17 | Nec Corp | Error recovery system for logical device |
| JPS57137939A (en) * | 1981-02-18 | 1982-08-25 | Univ Kyoto | Parallel counting and sorting method and its circuit |
| JPS5971551A (ja) * | 1982-10-18 | 1984-04-23 | Nec Corp | 情報処理装置 |
-
1988
- 1988-11-16 JP JP63289170A patent/JPH0792763B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JPH02135533A (ja) | 1990-05-24 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CA1310422C (en) | Methods and apparatus for fault recovery | |
| JP4873073B2 (ja) | 情報処理装置及び情報処理装置の障害復旧方法 | |
| CN107077408A (zh) | 故障处理的方法、计算机系统、基板管理控制器和系统 | |
| WO2018103185A1 (zh) | 故障处理的方法、计算机系统、基板管理控制器和系统 | |
| CN114911659A (zh) | 一种ce风暴抑制方法、装置及相关设备 | |
| JPH0792763B2 (ja) | 障害処理方式 | |
| JP2870250B2 (ja) | マイクロプロセッサの暴走監視装置 | |
| JPH06175887A (ja) | 障害監視/通知方式 | |
| JPH06175934A (ja) | 1ビットエラー処理方式 | |
| JP2004086520A (ja) | 監視制御装置及び監視制御方法 | |
| KR860000793B1 (ko) | 초기 프로그램 로오드방식 | |
| JPS6084651A (ja) | 入出力装置の制御方式 | |
| JP2814988B2 (ja) | 障害処理方式 | |
| JPS5971551A (ja) | 情報処理装置 | |
| JPH01217651A (ja) | 障害自動通報方式 | |
| JPH05100910A (ja) | 障害処理方式 | |
| CN115061776A (zh) | 一种虚拟机异常的处理方法、电子设备和存储介质 | |
| JPH03216748A (ja) | リモートチャネル装置 | |
| JP3330261B2 (ja) | ディジタル保護・制御装置 | |
| JPS593638A (ja) | 情報処理装置 | |
| JP2012198728A (ja) | プログラム実行装置及び情報保管装置及び情報処理方法及びコンピュータプログラム | |
| JPH02189643A (ja) | データ処理装置 | |
| JPH0651935U (ja) | マルチcpuシステムに於ける障害管理装置 | |
| JPS6220013A (ja) | マイクロコンピユ−タ応用機器の電源切断装置 | |
| HK40053474A (en) | Method for fault handling, computer system, baseboard management controller and system |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |