JPS63140341A - 論理装置のエラ−回復方式 - Google Patents
論理装置のエラ−回復方式Info
- Publication number
- JPS63140341A JPS63140341A JP61288179A JP28817986A JPS63140341A JP S63140341 A JPS63140341 A JP S63140341A JP 61288179 A JP61288179 A JP 61288179A JP 28817986 A JP28817986 A JP 28817986A JP S63140341 A JPS63140341 A JP S63140341A
- Authority
- JP
- Japan
- Prior art keywords
- error
- retry
- logical
- logical unit
- logical device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011084 recovery Methods 0.000 title claims abstract description 17
- 238000000034 method Methods 0.000 claims description 29
- 230000010365 information processing Effects 0.000 claims description 10
- 238000012545 processing Methods 0.000 abstract description 24
- 238000012544 monitoring process Methods 0.000 abstract description 10
- 238000003745 diagnosis Methods 0.000 abstract 1
- 238000007796 conventional method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Landscapes
- Retry When Errors Occur (AREA)
- Hardware Redundancy (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は論理装置のエラー回復方式に関し、特に複数の
論理装置が主記憶装置を共有した情報処理システムにお
いて何れかの論理装置にエラーが発生した場合に他の正
常な論理装置でエラー回復処理を行なう論理装置のエラ
ー回復方式に関する。
論理装置が主記憶装置を共有した情報処理システムにお
いて何れかの論理装置にエラーが発生した場合に他の正
常な論理装置でエラー回復処理を行なう論理装置のエラ
ー回復方式に関する。
従来、この種のエラー回復方式としては、例えば特開昭
57−064849号公報(特願昭55−141323
号)に見られる方式が知られている。
57−064849号公報(特願昭55−141323
号)に見られる方式が知られている。
上記従来方式は、ある論理装置(中央処理装置)でエラ
ーが発生し、このエラーを発生した命令がメモリ書換え
の条件等で再試行可能と判断された場合、先ずエラーを
発生した論理装置で所定回数の再試行を行なわせ、それ
でもエラーの回復が行なわれなかったときに、その命令
を他の正常な論理装置で再試行させるように構成されて
いる。
ーが発生し、このエラーを発生した命令がメモリ書換え
の条件等で再試行可能と判断された場合、先ずエラーを
発生した論理装置で所定回数の再試行を行なわせ、それ
でもエラーの回復が行なわれなかったときに、その命令
を他の正常な論理装置で再試行させるように構成されて
いる。
上述した従来の方式では、エラーの原因が間欠故障で且
つ再試行可能であって然もエラーの発生した論理装置で
の再試行に成功すれば、システムダウン等を回避でき、
またエラー原因が固定故障によるものであっても再試行
可能であれば正常な他の論理装置で再試行が成功するこ
とによりシステムダウン等を回避できる。
つ再試行可能であって然もエラーの発生した論理装置で
の再試行に成功すれば、システムダウン等を回避でき、
またエラー原因が固定故障によるものであっても再試行
可能であれば正常な他の論理装置で再試行が成功するこ
とによりシステムダウン等を回避できる。
しかし、間欠故障であっても常に再試行可能となるもの
ではなく、命令実行中のメモリ書換えタイミングによっ
ては再試行不可能となる場合もある。また、間欠故障を
一度おこしな論理装置は再び間欠故障をおこす確率が高
いと考えられるから、再試行を先ずエラーの発生した論
理装置で行なわせるこの方式では、その再試行の途中に
おいて再び間欠故障によるエラーが発生しそのエラーの
命令が今度は再試行不可能となる可能性がある。このよ
うな場合、再試行不可能であるが故にシステムダウンや
ジョブアボート等につながるという問題点がある。
ではなく、命令実行中のメモリ書換えタイミングによっ
ては再試行不可能となる場合もある。また、間欠故障を
一度おこしな論理装置は再び間欠故障をおこす確率が高
いと考えられるから、再試行を先ずエラーの発生した論
理装置で行なわせるこの方式では、その再試行の途中に
おいて再び間欠故障によるエラーが発生しそのエラーの
命令が今度は再試行不可能となる可能性がある。このよ
うな場合、再試行不可能であるが故にシステムダウンや
ジョブアボート等につながるという問題点がある。
このエラー回復方式を改善したものとして、論理装置で
エラーが発生した場合でかつエラーの命令が再試行可能
と判断されたとき、このエラーを発生した論理装置で再
試行することなく、他の正常な論理装置に上記エラーの
命令からの再試行を行なわせるようにした方式が考えら
れている。この方式では安全のため、間欠障害が一度で
も発生すると障害装置を切り離してしまうため、エラー
を発生した論理装置での再試行が成功し、故障装置の切
り離しが避けられたケースにおいてはシステムの性能を
無駄に低下させるという欠点があった。
エラーが発生した場合でかつエラーの命令が再試行可能
と判断されたとき、このエラーを発生した論理装置で再
試行することなく、他の正常な論理装置に上記エラーの
命令からの再試行を行なわせるようにした方式が考えら
れている。この方式では安全のため、間欠障害が一度で
も発生すると障害装置を切り離してしまうため、エラー
を発生した論理装置での再試行が成功し、故障装置の切
り離しが避けられたケースにおいてはシステムの性能を
無駄に低下させるという欠点があった。
本発明の目的は、このような問題点を解決し、エラーを
発生した装置での再試行を許可するか禁止するかを指示
するための再試行モードを設け、システムの使用者にど
ちらのエラー回復方式で運用するかを選択可能にするこ
とにある。
発生した装置での再試行を許可するか禁止するかを指示
するための再試行モードを設け、システムの使用者にど
ちらのエラー回復方式で運用するかを選択可能にするこ
とにある。
本発明の論理装置のエラー回復方式は、複数の論理装置
が主記憶装置を共有する情報処理システムにおける前記
論理装置のエラー回復方式において、前記論理装置でエ
ラーが発生し、エラーとなった命令が再試行可能な場合
に、選択的に設定可能なエラー発生装置での再試行を制
御する再試行モードが再試行許可状態ならば、該エラー
を発生した論理装置でエラーとなった命令がらの再試行
を行ない、再試行モードが再試行禁止状態ならば該エラ
ーを発生した論理装置で再試行することなく他の正常な
論理装置に前記エラーとなった命令からの再試行を行な
わせるようにしたことを特徴とする。
が主記憶装置を共有する情報処理システムにおける前記
論理装置のエラー回復方式において、前記論理装置でエ
ラーが発生し、エラーとなった命令が再試行可能な場合
に、選択的に設定可能なエラー発生装置での再試行を制
御する再試行モードが再試行許可状態ならば、該エラー
を発生した論理装置でエラーとなった命令がらの再試行
を行ない、再試行モードが再試行禁止状態ならば該エラ
ーを発生した論理装置で再試行することなく他の正常な
論理装置に前記エラーとなった命令からの再試行を行な
わせるようにしたことを特徴とする。
次に本発明の実施例について図面を参照して説明する。
第1図は本発明の一実施例の情報処理システム、のブロ
ック図であり、情報処理装置1と診断処理装置2とから
成り、情報処理装置1と診断処理装置2は診断インクフ
ェイス3で接続されている。
ック図であり、情報処理装置1と診断処理装置2とから
成り、情報処理装置1と診断処理装置2は診断インクフ
ェイス3で接続されている。
、情報処理装置1は、例えば中央処理装置である複数の
論理装置11..13と、これら複数の論理装置11.
13に接続され両輪理装置がちアクセス可能な主記憶装
置12と、論理装置11.13および主記憶装置12に
接続された監視手段14とを含み、一つのオペレーティ
ング・システムで制御されている。上記監視手段14は
、論理装置11.13の故障(エラー)を検出する機能
と、故障を検出するとその故障した論理装置の内部状態
を保存して診断インタフェイス3を介して診断処理装置
2にその旨を通知する機能とを有している。なお、第1
図では論理装置が2台の場合を図示したが、論理装置が
3台以上備わっている情報処理システムに対しても本発
明は適用可能である。
論理装置11..13と、これら複数の論理装置11.
13に接続され両輪理装置がちアクセス可能な主記憶装
置12と、論理装置11.13および主記憶装置12に
接続された監視手段14とを含み、一つのオペレーティ
ング・システムで制御されている。上記監視手段14は
、論理装置11.13の故障(エラー)を検出する機能
と、故障を検出するとその故障した論理装置の内部状態
を保存して診断インタフェイス3を介して診断処理装置
2にその旨を通知する機能とを有している。なお、第1
図では論理装置が2台の場合を図示したが、論理装置が
3台以上備わっている情報処理システムに対しても本発
明は適用可能である。
また、診断処理装置2は、内部状態の読出し手段21と
、再試行可能性の判断手段22と、引継ぎ情報の編集・
作成手段23と、引継ぎ情報の設定手段24と、引継ぎ
処理の再実行・継続の指示手段25とを含む。
、再試行可能性の判断手段22と、引継ぎ情報の編集・
作成手段23と、引継ぎ情報の設定手段24と、引継ぎ
処理の再実行・継続の指示手段25とを含む。
このうち、内部状態の読出し手段21は、監視手段14
から上記通知があったときに監視手段14によって保存
された故障発生論理装置の内部状態を読出す手段であり
、再試行可能性の判断手段22は、その読出された内部
状態に基づいてエラーを発生した命令の再試行の可能性
の判断、再試行モードが再試行許可状態か再試行禁止状
態かの判断、固定エラー(予め定められた回数再試行を
失敗したケース)の判断を行なう手段である。
から上記通知があったときに監視手段14によって保存
された故障発生論理装置の内部状態を読出す手段であり
、再試行可能性の判断手段22は、その読出された内部
状態に基づいてエラーを発生した命令の再試行の可能性
の判断、再試行モードが再試行許可状態か再試行禁止状
態かの判断、固定エラー(予め定められた回数再試行を
失敗したケース)の判断を行なう手段である。
また、引継ぎ情報の編集・作成手段23は、再試行可能
性の判断手段22で再試行可能かつ再試行禁止状態と判
断されるか、再試行可能かつ固定エラーと判断されたと
きに、故障した論理装置上で実行していた処理の引継ぎ
情報を前記内部状態から編集・作成する手段であり、引
継ぎ情報の設定手段24は、引継ぎ情報の編集・作成手
段2Bで作成された引継ぎ情報を故障が検出された論理
装置以外の他の正常な論理装置に設定する手段である。
性の判断手段22で再試行可能かつ再試行禁止状態と判
断されるか、再試行可能かつ固定エラーと判断されたと
きに、故障した論理装置上で実行していた処理の引継ぎ
情報を前記内部状態から編集・作成する手段であり、引
継ぎ情報の設定手段24は、引継ぎ情報の編集・作成手
段2Bで作成された引継ぎ情報を故障が検出された論理
装置以外の他の正常な論理装置に設定する手段である。
更に、引継ぎ処理の再実行・継続の指示手段25は、引
継ぎ情報の設定手段24により設定された情報をもとに
その正常な論理装置上で故障の検出された論理装置で行
なわれていた処理を引継いで再実行させることを指示す
る手段である。
継ぎ情報の設定手段24により設定された情報をもとに
その正常な論理装置上で故障の検出された論理装置で行
なわれていた処理を引継いで再実行させることを指示す
る手段である。
次に、第1図において論理装置11に故障が発生した場
合を例にして本実施例の動作を説明する。
合を例にして本実施例の動作を説明する。
論理装置11に故障が発生すると、これが監視手段14
で検出される。監視手段14はこれを検出すると、論理
装置11の処理を中断させてその内部状態を保存し、診
断インタフェイス3を介して診断処理装置2に論理装置
11が故障した旨の通知を行なう。
で検出される。監視手段14はこれを検出すると、論理
装置11の処理を中断させてその内部状態を保存し、診
断インタフェイス3を介して診断処理装置2に論理装置
11が故障した旨の通知を行なう。
これに応答して診断処理装置2は内部状態の読出し手段
21を起動し、第2図の処理51に示すようにこの手段
21により監視手段14で保存された論理装置11の内
部状態を読出す。次に診断処理装置2は、上記読出され
た内部状態から検出されたエラーが再試行可能かつ再試
行禁止状態か、あるいは再試行可能かつ固定エラーかを
再試行の可能性判断手段22で判断しく処理52)、条
件を満さない場合には、エラー発生の論理装置11の障
害処理を行なう。この障害処理において、再試行可能な
エラーで再試行が成功すれば、そのまま継続して運転が
行なわれる。そうでなければ、エラー発生の論理装置1
1のシステムからの切り離しが行なわれる。
21を起動し、第2図の処理51に示すようにこの手段
21により監視手段14で保存された論理装置11の内
部状態を読出す。次に診断処理装置2は、上記読出され
た内部状態から検出されたエラーが再試行可能かつ再試
行禁止状態か、あるいは再試行可能かつ固定エラーかを
再試行の可能性判断手段22で判断しく処理52)、条
件を満さない場合には、エラー発生の論理装置11の障
害処理を行なう。この障害処理において、再試行可能な
エラーで再試行が成功すれば、そのまま継続して運転が
行なわれる。そうでなければ、エラー発生の論理装置1
1のシステムからの切り離しが行なわれる。
一方、処理52で再試行可能かつ再試行禁止状態と判断
されるか、再試行可能かつ固定エラーと判断されたとき
は、引継ぎ情報の編集・作成手段23により読出しな内
部状態から引継ぎ情報を編集・作成しく処理53)、引
継ぎ情報の設定手段24によって正常な論理装置13に
対し設定させる(処理54)。
されるか、再試行可能かつ固定エラーと判断されたとき
は、引継ぎ情報の編集・作成手段23により読出しな内
部状態から引継ぎ情報を編集・作成しく処理53)、引
継ぎ情報の設定手段24によって正常な論理装置13に
対し設定させる(処理54)。
そして次に、引継ぎ処理の再実行・継続の指示手段25
により正常な論理装置13に引継ぎを指示しく処理55
)、論理装置13に引継いだ処理の再実行・継続を行な
わせる。
により正常な論理装置13に引継ぎを指示しく処理55
)、論理装置13に引継いだ処理の再実行・継続を行な
わせる。
これにより、再試行可能な故障の検出された論理装置で
実行されていたエラー発生時の処理が故障の検出された
論理装置上ではなく他の正常な論理装置上で再実行され
、論理装置11で発生したエラーの回復が行なわれると
共に、その後の処理も故障の発生した論理装置ではなく
正常な論理装置に引継がれる。正常の論理装置が故障し
た論理装置の処理を引継いだ場合、通常その故障した論
理装置は論理的にシステムから切り離される。
実行されていたエラー発生時の処理が故障の検出された
論理装置上ではなく他の正常な論理装置上で再実行され
、論理装置11で発生したエラーの回復が行なわれると
共に、その後の処理も故障の発生した論理装置ではなく
正常な論理装置に引継がれる。正常の論理装置が故障し
た論理装置の処理を引継いだ場合、通常その故障した論
理装置は論理的にシステムから切り離される。
=9−
以上の説明は、論理装置11が故障した場合であるが、
論理装置13が故障した場合も上述で説明したように診
断処理装置2の制御のもとに正常な論理装置11に処理
を引継いで、論理装置13上で行なわれていた処理を継
続して行なうことができる。
論理装置13が故障した場合も上述で説明したように診
断処理装置2の制御のもとに正常な論理装置11に処理
を引継いで、論理装置13上で行なわれていた処理を継
続して行なうことができる。
以上説明したように本発明は、複数の論理装置が主記憶
装置を共有する情報処理システムG得おいて、論理装置
でエラーが発生し、エラーとなった命令が再試行可能な
場合に、エラー発生装置での再試行を制御する再試行モ
ードを設け、エラー発生装置の内部状態に基づき選択的
にエラー回復制御を実施できるようにすることにより、
運用時にどちらのエラー回復方式を採用するかを選択す
ることができ、融通性のあるシステム運用が行なえると
いう効果がある。
装置を共有する情報処理システムG得おいて、論理装置
でエラーが発生し、エラーとなった命令が再試行可能な
場合に、エラー発生装置での再試行を制御する再試行モ
ードを設け、エラー発生装置の内部状態に基づき選択的
にエラー回復制御を実施できるようにすることにより、
運用時にどちらのエラー回復方式を採用するかを選択す
ることができ、融通性のあるシステム運用が行なえると
いう効果がある。
第1図は本発明の一実施例を示し、第2図は本実施例の
流れ図を示す。 1・・・情報処理装置、2・・・診断処理装置、3・・
・診断インタフェイス、11.13・・・論理装置、1
2・・・主記憶装置、14・・・監視手段、21・・・
内部状態の読出し手段、22・・・再試行可能性の判断
手段、23・・・引継ぎ情報の編集・作成手段、24・
・・引継ぎ情報の設定手段、25・・・引継ぎ処理の再
実行・継続の指示手段。
流れ図を示す。 1・・・情報処理装置、2・・・診断処理装置、3・・
・診断インタフェイス、11.13・・・論理装置、1
2・・・主記憶装置、14・・・監視手段、21・・・
内部状態の読出し手段、22・・・再試行可能性の判断
手段、23・・・引継ぎ情報の編集・作成手段、24・
・・引継ぎ情報の設定手段、25・・・引継ぎ処理の再
実行・継続の指示手段。
Claims (1)
- 複数の論理装置が主記憶装置を共有する情報処理システ
ムにおける前記論理装置のエラー回復方式において、前
記論理装置でエラーが発生し、エラーとなった命令が再
試行可能な場合に、選択的に設定可能なエラー発生装置
での再試行を制御する再試行モードが再試行許可状態な
らば、該エラーを発生した論理装置でエラーとなった命
令からの再試行を行ない、再試行モードが再試行禁止状
態ならば、該エラーを発生した論理装置で再試行するこ
となく他の正常な論理装置に前記エラーとなった命令か
らの再試行を行なわせるようにしたことを特徴とする論
理装置のエラー回復方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61288179A JPS63140341A (ja) | 1986-12-02 | 1986-12-02 | 論理装置のエラ−回復方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61288179A JPS63140341A (ja) | 1986-12-02 | 1986-12-02 | 論理装置のエラ−回復方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS63140341A true JPS63140341A (ja) | 1988-06-11 |
Family
ID=17726832
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP61288179A Pending JPS63140341A (ja) | 1986-12-02 | 1986-12-02 | 論理装置のエラ−回復方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS63140341A (ja) |
-
1986
- 1986-12-02 JP JP61288179A patent/JPS63140341A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2552651B2 (ja) | 再構成可能なデュアル・プロセッサ・システム | |
| JPS63140341A (ja) | 論理装置のエラ−回復方式 | |
| JPS62172436A (ja) | 論理装置のエラ−回復方式 | |
| JPS6341943A (ja) | 論理装置のエラ−回復方式 | |
| JPS63136142A (ja) | 論理装置のエラ−回復方式 | |
| JPH0287235A (ja) | 情報処理装置 | |
| JPH07120296B2 (ja) | ホットスタンバイシステムにおけるエラー制御方式 | |
| JPH0690693B2 (ja) | チャネル障害回復制御装置 | |
| JPS6128141B2 (ja) | ||
| JPS622334B2 (ja) | ||
| JPS60134942A (ja) | 異常状態におけるバツクアツプシステム | |
| JPS597982B2 (ja) | 計算機システムのシステム障害時の再開始方式 | |
| JPS5929890B2 (ja) | 予備切替制御方式 | |
| JPS6143739B2 (ja) | ||
| JPS635779B2 (ja) | ||
| JPH04256049A (ja) | データ処理装置 | |
| JPH03156646A (ja) | 障害情報の出力方式 | |
| JPS62296264A (ja) | デ−タ処理システムの構成制御方式 | |
| JPH02135535A (ja) | 情報処理システム | |
| JPS59135553A (ja) | 障害情報保持方式 | |
| JPS6132126A (ja) | デ−タ処理システムの復旧方式 | |
| JPH0756759A (ja) | 情報処理装置 | |
| JPS6077252A (ja) | 入出力制御装置 | |
| JPS5870368A (ja) | 複合計算機システムにおける構成切替方式 | |
| JPH0430224A (ja) | タスクの実行継続方法 |