JPH01314341A - Trouble processing system for information processor - Google Patents
Trouble processing system for information processorInfo
- Publication number
- JPH01314341A JPH01314341A JP63147127A JP14712788A JPH01314341A JP H01314341 A JPH01314341 A JP H01314341A JP 63147127 A JP63147127 A JP 63147127A JP 14712788 A JP14712788 A JP 14712788A JP H01314341 A JPH01314341 A JP H01314341A
- Authority
- JP
- Japan
- Prior art keywords
- circuit
- retry
- processing
- interrupt
- processing unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 claims description 12
- 238000000034 method Methods 0.000 claims description 9
- 238000001514 detection method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Landscapes
- Retry When Errors Occur (AREA)
Abstract
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は情報処理装置の障害処理方式に関し、特に中央
処理装置、入出力制御装置およびサービスプロセッサを
含む情報処理装置における障害処理方式に関する。DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a failure handling method for an information processing device, and particularly to a failure handling method for an information processing device including a central processing unit, an input/output control unit, and a service processor.
従来、この種の情報処理装置は、システムの運用および
障害監視用に使用するためにサービスプロセッサを常備
しており、中央処理装置の障害時には中央処理装置内の
障害検出回路で障害をI*出してサービスプロセッサに
割込み信号を出すことにより、サービスプロセッサが中
央処理装置内の内部情報を読み出して中央処理装置をリ
セットするようになっている。そして、リセットされた
中央処理装置は、リトライ処理を行い、リトライ成功の
場合にはプログラムの走行が可能となるようになってい
る。Conventionally, this type of information processing equipment has always been equipped with a service processor for use in system operation and fault monitoring, and in the event of a fault in the central processing unit, a fault detection circuit within the central processing unit issues an I* signal. By issuing an interrupt signal to the service processor, the service processor reads internal information within the central processing unit and resets the central processing unit. The reset central processing unit then performs a retry process, and if the retry is successful, the program can run.
ところで、従来の情報処理装置は、入出力制御装置が主
記憶装置または中央処理装置にアクセス中に中央処理装
置が障害となった場合でも、サービスプロセッサには障
害報告が行われるものの、入出力制御2I装置には障害
報告が行われない構成となっていた。By the way, in conventional information processing devices, even if the central processing unit fails while the input/output control unit is accessing the main storage device or the central processing unit, the failure is reported to the service processor, but the input/output control The 2I device was configured so that no failure reports were made.
上述した従来の情報処理装置では、入出力制御装置から
の主記憶装置または中央処理装置のアクセス中に中央処
理装置に障害が発生した場合に、中央処理装置の障害は
サービスプロセッサには報告されるが入出力制御2I装
置には報告されなかったので、入出力制御装置は中央処
理装置の障害を認知することができず、中央処理装置か
らの応答待ちで監視タイム等のタイムアウトを検出して
しまい、入出力制御装置も中央処理装置とともに障害と
なり、二重障害が発生するという欠点がある。In the conventional information processing device described above, if a failure occurs in the central processing unit while the input/output control unit is accessing the main storage device or the central processing unit, the failure of the central processing unit is reported to the service processor. was not reported to the I/O control 2I device, so the I/O control device was unable to recognize the failure of the central processing unit and detected a timeout such as monitoring time while waiting for a response from the central processing unit. , the input/output control unit also becomes a failure together with the central processing unit, resulting in a double failure.
また、中央処理装置と入出力制御装置とが二重障害とな
った場合には、システムの障害解析が容易にできないと
いう欠点がある。Furthermore, if there is a double failure in the central processing unit and the input/output control unit, there is a drawback that failure analysis of the system cannot be easily performed.
本発明の目的は、上述の点に鑑み、中央処理装置の障害
時に中央処理装置からの応答待ちで人出力制御装置も障
害となるような二重障害の発生を未然に防止することが
できるようにした情報処理装置の障害処理方式を提供す
ることにある。In view of the above-mentioned points, an object of the present invention is to prevent the occurrence of a double failure in which the human output control device also becomes a failure while waiting for a response from the central processing unit when the central processing unit fails. An object of the present invention is to provide a failure handling method for an information processing device.
本発明の情報処理装置の障害処理方式は、中央処理装置
の障害時にサービスプロセッサに割込みをかけて障害報
告を行う障害報告回路と、前記中央処理装置のリトライ
処理を行うCPUIJ)ライ処理回路と、このCPUリ
トライ処理回路による前記中央処理装置のリトライ処理
の結果かリトライ成功であったときに前記サービスプロ
セッサに割込みをかけてリトライ成功報告を行うリトラ
イ処理割込み回路と、入出力制御装置のリトライ処理を
行うl0PU)ライ処理回路と、前記障害報告回路およ
び前記リトライ処理割込み回路からの割込みを受け付け
る前記サービスプロセッサ内の割込み受付回路と、前記
割込み受付回路により前記障害報告回路からの割込みが
受け付けられたときに前記中央処理装置をリセットして
前記CPUリトライ処理回路による前記中央処理装置の
リトライ処理を実行させるとともに前記入出力側rB装
置の動作を停止させ前記割込み受付回路により前記リト
ライ処理割込み回路からの割込みが受け付けられたとき
に前記10Pリトライ処理回路による前記入出力制御装
置のリトライ処理を実行させるスタート/ストップ制御
回路とを有する。The failure processing method of the information processing device of the present invention includes: a failure reporting circuit that interrupts a service processor to report the failure when a failure occurs in the central processing unit; and a CPUIJ) lie processing circuit that performs retry processing of the central processing unit. A retry processing interrupt circuit that interrupts the service processor to report a retry success when the result of the retry processing of the central processing unit by the CPU retry processing circuit is a success; l0PU) when an interrupt from the failure reporting circuit is accepted by the interrupt acceptance circuit in the service processor, and the interrupt acceptance circuit in the service processor accepts interrupts from the failure reporting circuit and the retry processing interrupt circuit; The CPU retry processing circuit resets the central processing unit to cause the CPU retry processing circuit to execute retry processing of the central processing unit, stops the operation of the input/output side rB device, and causes the interrupt acceptance circuit to accept an interrupt from the retry processing interrupt circuit. and a start/stop control circuit that causes the 10P retry processing circuit to execute retry processing of the input/output control device when the 10P retry processing circuit is accepted.
本発明の情報処理装置の障害処理方式では、障害報告回
路が中央処理装置の障害時にサービスプロセッサに割込
みをかけて障害報告を行い、CPUIJ)ライ処理回路
が中央処理装置のリトライ処理を行い、リトライ処理割
込み回路がCPUリトライ処理回路による中央処理装置
のリトライ処理の結果がリトライ成功であったときにサ
ービスプロセッサに割込みをかけてリトライ成功報告を
行い、IOPリトライ処理回路が入出力制御装置のリト
ライ処理を行い、サービスプロセッサ内の割込み受付回
路が障害報告回路およびリトライ処理割込み回路からの
割込みを受け付け、スタート/ストップ制御回路が割込
み受付回路により障害報告回路からの割込みが受け付け
られたときに中央処理装置をリセットしてCPUリトラ
イ処理回路による中央処理装置のリトライ処理を実行さ
せるとともに入出力制御装置の動作を停止させ割込み受
付回路によりリトライ処理割込み回路からの割込みが受
け付けられたときにIOPリトライ処理回路による入出
力制御装置のリトライ処理を実行させる。In the failure handling method of the information processing device of the present invention, the failure reporting circuit interrupts the service processor to report the failure when the central processing unit fails, and the CPUIJ) write processing circuit performs retry processing of the central processing unit to retry. When the retry processing of the central processing unit by the CPU retry processing circuit results in a successful retry, the processing interrupt circuit interrupts the service processor to report the retry success, and the IOP retry processing circuit performs the retry processing of the input/output control device. The interrupt acceptance circuit in the service processor accepts interrupts from the failure reporting circuit and the retry processing interrupt circuit, and the start/stop control circuit interrupts the central processing unit when the interrupt acceptance circuit accepts the interrupt from the failure reporting circuit. is reset, the CPU retry processing circuit executes the retry processing of the central processing unit, the operation of the input/output control device is stopped, and the IOP retry processing circuit executes the retry processing when an interrupt from the interrupt reception circuit is accepted. Executes retry processing of the input/output control device.
次に、本発明について図面を参照して詳細に説明する。 Next, the present invention will be explained in detail with reference to the drawings.
第1図は、本発明の一実施例の情報処理装置の障害処理
方式の構成を示すブロック図である0本実施例の情報処
理装置の障害処理方式は、中央処理装置lと、サービス
プロセッサ2と、2台の入出力制御装置3および4とか
ら、その主要部が構成されている。FIG. 1 is a block diagram showing the configuration of a failure handling system of an information processing apparatus according to an embodiment of the present invention. and two input/output control devices 3 and 4.
中央処理装置1は、中央処理装置1の障害を検出する障
害検出回路10と、サービスプロセッサ2に割込み信号
を送出して障害報告を行う障害報告回路11と、中央処
理装置1の障害時にサービスプロセッサ2からスタート
指示を受けて命令等のリトライ (リトライ処理)を行
うCPU (中央処理装置)リトライ処理回路12と、
CPUリトライ処理回路12による中央処理装置1のリ
トライ処理の結果がリトライ成功のときにサービスプロ
セッサ2に割込み信号を送出してリトライ成功報告を行
うIJ )ライ処理割込み回路13とを含んで構成され
ている。The central processing unit 1 includes a failure detection circuit 10 that detects a failure in the central processing unit 1, a failure reporting circuit 11 that sends an interrupt signal to the service processor 2 to report a failure, and a failure detection circuit 11 that sends an interrupt signal to the service processor 2 to report a failure. a CPU (central processing unit) retry processing circuit 12 that receives a start instruction from 2 and performs retry (retry processing) of commands, etc.;
When the result of the retry processing of the central processing unit 1 by the CPU retry processing circuit 12 is a retry success, the IJ sends an interrupt signal to the service processor 2 to report the retry success. There is.
サービスプロセッサ2は、中央処理袋ffl内の障害報
告回路11およびリトライ処理割込み回路13からの障
害報告およびリトライ成功報告としての割込み信号を受
け付ける割込み受付回路20と、中央処理装置1ならび
に入出力制御装置3および4に対して命令のスタートお
よびストップの指示を行うスタート/ストップ制御回路
21とを含んで構成されている。The service processor 2 includes an interrupt receiving circuit 20 that receives interrupt signals as failure reports and retry success reports from the failure reporting circuit 11 and retry processing interrupt circuit 13 in the central processing bag ffl, the central processing unit 1, and the input/output control unit. The start/stop control circuit 21 instructs 3 and 4 to start and stop instructions.
人出力制御装置3および4は、IOP (入出力制御装
置)リトライ処理回路30および31をそれぞれ含んで
構成されている。The human output control devices 3 and 4 are configured to include IOP (input/output control device) retry processing circuits 30 and 31, respectively.
次に、このように構成された本実施例の情報処理装置の
障害処理方式の動作について説明する。Next, the operation of the failure handling method of the information processing apparatus of this embodiment configured as described above will be explained.
中央処理装置1内で障害が発生すると、障害検出回路1
0が障害の発生を認識し、障害報告回路11がサービス
プロセッサ2に障害報告として割込み信号を送出する。When a failure occurs in the central processing unit 1, the failure detection circuit 1
0 recognizes the occurrence of a fault, and the fault reporting circuit 11 sends an interrupt signal to the service processor 2 as a fault report.
サービスプロセッサ2では、割込み受付回路20が障害
報告回路11からの障害報告としての割込み信号を受け
付けると、割込み受付回路20は、スタート/ストップ
制御回路21にスタート/ストップ指示を出す。In the service processor 2, when the interrupt receiving circuit 20 receives an interrupt signal as a fault report from the fault reporting circuit 11, the interrupt receiving circuit 20 issues a start/stop instruction to the start/stop control circuit 21.
割込み受付回路20からのスタート/ストップ指示を受
けたスタート/ストップ制御回路21は、中央処理装置
ff1l内をリセットしてCPUIJ)ライ処理回路1
2にリトライスタート指示を出すとともに、人出力制御
装置3および4のIOPリトライ処理回路30および3
1に中央処理装置1に障害が発生したためのストップ指
示を出す。The start/stop control circuit 21, which has received the start/stop instruction from the interrupt reception circuit 20, resets the inside of the central processing unit ff1l and returns the processing circuit 1 to the CPUIJ).
2, and the IOP retry processing circuits 30 and 3 of the human output control devices 3 and 4.
1, a stop instruction is issued because a failure has occurred in the central processing unit 1.
スタート/ストップ制御回路21からのリトライスター
ト指示を受けたCPUリトライ処理回路12は、障害内
容をプログラムに通知する等の障害処理を実行した後に
リトライ処理を実行し、リトライ処理の結果をリトライ
処理割込み回路13に通知する。The CPU retry processing circuit 12, which has received the retry start instruction from the start/stop control circuit 21, executes the retry processing after executing fault processing such as notifying the program of the content of the fault, and sends the result of the retry processing to the retry processing interrupt. Notify circuit 13.
CPUリトライ処理回路12からリトライ処理の結果を
通知されたり°トライ処理別込み回路13は、CPUリ
トライ処理回路12から通知された中央処理装置1のリ
トライ処理の結果がリトライ成功のときには、サービス
プロセッサ2にリトライ成功報告として割込み信号を送
出する。When the result of the retry processing of the central processing unit 1 notified from the CPU retry processing circuit 12 is a successful retry, the separate try processing circuit 13 is notified of the result of the retry processing by the CPU retry processing circuit 12. An interrupt signal is sent as a retry success report.
また、スタート/ストップ制御回路21からのストップ
指示を受けたrOPリトライ処理回路30および31は
、入出力制御装置3および4の動作を停止させる。Further, the rOP retry processing circuits 30 and 31 that have received a stop instruction from the start/stop control circuit 21 stop the operations of the input/output control devices 3 and 4.
リトライ処理割込み回路13からのリトライ成功報告と
しての割込み信号を受け付けた割込み受付回路20は、
スタート/ストップ制御回路21にスタート指示を出す
。The interrupt reception circuit 20 receives the interrupt signal as a retry success report from the retry processing interrupt circuit 13, and
A start instruction is issued to the start/stop control circuit 21.
割込み受付回路20からのスタート指示を受けたスター
ト/ストップ制御回路21は、入出力制御装置3および
4内のl0PIJI−ライ処理回路30および31にリ
トライスタート指示を出す。The start/stop control circuit 21, which has received the start instruction from the interrupt acceptance circuit 20, issues a retry start instruction to the l0PIJI-Rye processing circuits 30 and 31 in the input/output control devices 3 and 4.
スタート/ストップ制御回路21からのリトライスター
ト指示を受けたl0PIJI−ライ処理回路30および
31は、ストップ指示を受けたときの命令の実行(リト
ライ処理)を行い、入出力制御袋W3および4の動作を
再スタートさせる。The l0PIJI-Rye processing circuits 30 and 31, which have received the retry start instruction from the start/stop control circuit 21, execute the command (retry processing) when receiving the stop instruction, and control the operation of the input/output control bags W3 and 4. restart.
なお、CPUリトライ処理回路12による中央処理装置
1のリトライ処理の結果がリトライ不成功であった場合
には、リトライ処理割込み回路13がサービスプロセッ
サ2の割込み受付回路20に割込みをかけないので、ス
タート/ストップ制御回路21からはスタート指示が出
されない。この結果、入出力制御装置3および4はスト
ップ指示を受けた状態で停止したままとなる。Note that if the result of the retry processing of the central processing unit 1 by the CPU retry processing circuit 12 is that the retry is unsuccessful, the retry processing interrupt circuit 13 does not interrupt the interrupt acceptance circuit 20 of the service processor 2. /The stop control circuit 21 does not issue a start instruction. As a result, the input/output control devices 3 and 4 remain stopped while receiving the stop instruction.
ところで、上記実施例では、中央処理装置1に接続され
る入出力制御装置を入出力制御装置3および4の2台と
したが、入出力制御装置が何台であっても本発明が同様
に適用可能であることはいうまでもない。By the way, in the above embodiment, the input/output control devices connected to the central processing unit 1 are two input/output control devices 3 and 4, but the present invention can be applied similarly regardless of the number of input/output control devices. Needless to say, it is applicable.
(発明の効果〕
以上説明したように本発明は、中央処理装置および入出
力制御装置にCPUリトライ処理回路およびl0PIJ
)ライ処理回路を設はサービスプロセッサ内にこれらリ
トライ処理回路をスタートおよびストップさせるスター
ト/ストップ制御回路を設けて、中央処理装置の障害時
にサービスプロセッサが入出力制御装置をストップさせ
、中央処理装置がリトライ処理に成功した場合に入出力
制御装置を再スタートさせることにより、中央処理装置
からの応答待ちで人出力制?11装置も障害となるよう
な二重障害の発生を防ぐことができるという効果がある
。(Effects of the Invention) As explained above, the present invention provides a central processing unit and an input/output control unit with a CPU retry processing circuit and an l0PIJ.
) A start/stop control circuit is provided in the service processor to start and stop these retry processing circuits, so that the service processor stops the input/output control device when the central processing unit fails, and the central processing unit By restarting the input/output control device when the retry process is successful, is it possible to control human output while waiting for a response from the central processing unit? This has the effect that it is possible to prevent the occurrence of double failures that would also cause failures for the No. 11 devices.
また、リトライ不成功時には人出力制2B !i置をス
トップしたままの状態にしておくため、中央処理装置の
障害解析時に入出力制御装置の状態を参照できるという
効果がある。Also, if the retry is unsuccessful, the human output system is 2B! Since the i-position remains stopped, there is an advantage that the state of the input/output control device can be referenced when analyzing a failure of the central processing unit.
第1図は本発明の一実施例の情報処理装置の障害処理方
式の構成を示すブロック図である。
図において、
1・・・中央処理装置、
2・・・サービスプロセッサ、
3.4・入出力制御装置、
lO・・・障害検出回路、
11・・・障害報告回路、
12・・・CPU+J)ライ処理回路、13・・・リト
ライ処理割込み回路、
20・・・割込み受付回路、
21・・・スタート/ストップ制御回路、30.3l−
10Pリトライ処理回路である。FIG. 1 is a block diagram showing the configuration of a failure handling method of an information processing apparatus according to an embodiment of the present invention. In the figure, 1... Central processing unit, 2... Service processor, 3.4. Input/output control device, lO... Fault detection circuit, 11... Fault reporting circuit, 12... CPU+J) light Processing circuit, 13... Retry processing interrupt circuit, 20... Interrupt reception circuit, 21... Start/stop control circuit, 30.3l-
This is a 10P retry processing circuit.
Claims (1)
かけて障害報告を行う障害報告回路と、前記中央処理装
置のリトライ処理を行うCPUリトライ処理回路と、 このCPUリトライ処理回路による前記中央処理装置の
リトライ処理の結果がリトライ成功であったときに前記
サービスプロセッサに割込みをかけてリトライ成功報告
を行うリトライ処理割込み回路と、 入出力制御装置のリトライ処理を行うIOPリトライ処
理回路と、 前記障害報告回路および前記リトライ処理割込み回路か
らの割込みを受け付ける前記サービスプロセッサ内の割
込み受付回路と、 前記割込み受付回路により前記障害報告回路からの割込
みが受け付けられたときに前記中央処理装置をリセット
して前記CPUリトライ処理回路による前記中央処理装
置のリトライ処理を実行させるとともに前記入出力制御
装置の動作を停止させ前記割込み受付回路により前記リ
トライ処理割込み回路からの割込みが受け付けられたと
きに前記IOPリトライ処理回路による前記入出力制御
装置のリトライ処理を実行させるスタート/ストップ制
御回路と、 を有することを特徴とする情報処理装置の障害処理方式
。[Scope of Claims] A failure reporting circuit that interrupts a service processor to report a failure when a failure occurs in a central processing unit; a CPU retry processing circuit that performs retry processing of the central processing unit; a retry processing interrupt circuit that interrupts the service processor and reports retry success when the result of the retry processing of the central processing unit is a retry success; an IOP retry processing circuit that performs retry processing of the input/output control device; an interrupt acceptance circuit in the service processor that accepts interrupts from the failure reporting circuit and the retry processing interrupt circuit; and an interrupt acceptance circuit in the service processor that resets the central processing unit when the interrupt acceptance circuit accepts the interrupt from the failure reporting circuit. causes the CPU retry processing circuit to execute retry processing of the central processing unit, stops the operation of the input/output control device, and causes the IOP retry when the interrupt acceptance circuit accepts an interrupt from the retry processing interrupt circuit. A failure handling method for an information processing device, comprising: a start/stop control circuit that causes a processing circuit to execute retry processing of the input/output control device.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63147127A JPH01314341A (en) | 1988-06-14 | 1988-06-14 | Trouble processing system for information processor |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63147127A JPH01314341A (en) | 1988-06-14 | 1988-06-14 | Trouble processing system for information processor |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH01314341A true JPH01314341A (en) | 1989-12-19 |
Family
ID=15423163
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63147127A Pending JPH01314341A (en) | 1988-06-14 | 1988-06-14 | Trouble processing system for information processor |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH01314341A (en) |
-
1988
- 1988-06-14 JP JP63147127A patent/JPH01314341A/en active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH01314341A (en) | Trouble processing system for information processor | |
| JP3420919B2 (en) | Information processing device | |
| JPH01314340A (en) | Trouble processing system for information processor | |
| JPS6019540B2 (en) | Configuration switching control method | |
| JPS61224056A (en) | Processing system for detecting trouble of channel | |
| JPS6290068A (en) | Standby system monitoring method | |
| JP2746184B2 (en) | Fault logging system | |
| JP2001005683A (en) | Failure detection method and method for redundant system | |
| JPH1160102A (en) | Elevator control device | |
| JPS6155748A (en) | Electronic computer system | |
| JPH0690693B2 (en) | Channel failure recovery controller | |
| JPH02141831A (en) | Peripheral system fault processing system in virtual computer system | |
| JPS6220584B2 (en) | ||
| JPS61169036A (en) | System supervisory device | |
| JPS6388660A (en) | microprocessor system | |
| JPS632922Y2 (en) | ||
| JP2771197B2 (en) | Remote monitoring device | |
| JP2725107B2 (en) | Interrupt device | |
| JPH04102154A (en) | Information processor | |
| JPH02311933A (en) | Interruption control system | |
| JPS6330660B2 (en) | ||
| JPS59119451A (en) | Diagnosing system of electronic computer system | |
| JPS62256162A (en) | Change over controller for duplex computer system | |
| JPH05250222A (en) | Cpu monitoring device | |
| JPH05100884A (en) | Switching system at the time of fault occurrence in duplex operation |