JPH058452B2 - - Google Patents

Info

Publication number
JPH058452B2
JPH058452B2 JP62203458A JP20345887A JPH058452B2 JP H058452 B2 JPH058452 B2 JP H058452B2 JP 62203458 A JP62203458 A JP 62203458A JP 20345887 A JP20345887 A JP 20345887A JP H058452 B2 JPH058452 B2 JP H058452B2
Authority
JP
Japan
Prior art keywords
processor
signal
instruction
retry
microprogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62203458A
Other languages
English (en)
Other versions
JPS63153646A (ja
Inventor
Akihisa Makita
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Publication of JPS63153646A publication Critical patent/JPS63153646A/ja
Publication of JPH058452B2 publication Critical patent/JPH058452B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Retry When Errors Occur (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、複数のプロセツサを有する電子デイ
ジタル計算機システムに使用される誤り回復シス
テムに関し、特に、密結合マルチプロセツサシス
テムに使用される誤り回復システムに関する。
[従来の技術] 電子デイジタル計算機システムとして、密結合
マルチプロセツサシステムがこの技術分野におい
て知られており、それは、複数のプログラムを格
納する主記憶装置と、プログラムを処理する複数
のプロセツサを備えている。各プログラムは連続
する命令から成る。密結合マルチプロセツサシス
テムの知られた一つとして、日本電気株式会社に
より製造されたACOS1500は「2レベルのキヤツ
シユやパイプライン処理の工夫で速度を上げた大
型コンピユータACOS1500」という題で1985年7
月15日に日経マグロウヒル社によつて発行された
日経エレクトロニクスに馬場征彦他によつて開示
されている(参考文献1)。
ACOS1500のプロセツサの一つにおいて一つの
命令を実行中に、誤り即ち故障が発生すると、そ
のプロセツサは、参考文献1に開示されているよ
うに、プロセツサの一つにおいて誤りを回復する
ために、命令の実行をリトライしている。誤りが
間欠的すなわち一時的なものであるなら、そのリ
トライは結果として成功する。したがつて、プロ
セツサは継続して計算機システムで使用される。
誤りが長命なもの、すなわち固定誤りであるな
ら、リトライは完全になされず、すなわち、失敗
に終わる。したがつて、プロセツサはチエツク状
態にされ、他のプロセツサは、障害プロセツサの
状態データを主記憶装置を介して他のプロセツサ
へ転送することによつて、命令の実行を引継ぐ。
一つのプロセツサ内に取出された命令は、マイ
クロステツプの連続からなるマイクロプログラム
の制御の下で、その一つのプロセツサにおいて実
行手段によつて実行される。ACOS1500におい
て、マイクロプログラムはマイクロステツプの中
にチエツクポイントを持つ。誤りがプロセツサの
一つで起こつたとき、マイクロプログラムは、参
考文献1に開示されているように、誤りが発生す
る前の最新のチエツクポイントからリスタートさ
れる。マイクロプログラムリスタートが成功に終
わつたとき、この一つのプロセツサは引続きシス
テム内で正常なプロセツサとして使用される。
[発明が解決しようとする問題点] しかしながら、一度プロセツサが誤りに遭遇す
ると、たとえリスタートが完全になされた後で
も、他の誤りが再びこのプロセツサで発生し易
く、結果としてシステムダウンしてしまう。
ジエ・エイ・アルルプラガソン(J.A.
Arulpragason)による英国特許明細書第1163859
号(参考文献2)は、プロセツサの一つにおいて
誤りが発生すると、他のプロセツサへ障害プロセ
ツサ内の状態情報を主記憶装置を介して他のプロ
セツサへ転送することによつて障害プロセツサで
実行していた命令の実行を引継がせる誤り回復シ
ステムが開示されている。
日本電気株式会社に譲渡された大和田寛行によ
る米国特許第4443849号明細書(参考文献3)は、
障害プロセツサ内の状態データを主記憶装置を介
さず付加記憶装置を介して他のプロセツサへ転送
する誤り回復システムを開示している。
しかしながら、これら参考文献2及び3はマイ
クロプログラムリスタートにつては何も述べてい
ない。
本発明の目的は、マルチプロセツサシステムに
使用され、プロセツサの一つに誤りが発生したと
き、チエツクポイントからのマイクロプログラム
リスタートが成功した後、その一つのプロセツサ
をチエツク状態にすることが出来、それによつ
て、システムがダウンするのを減少できる誤り回
復システムを提供することにある。
[問題点を解決するための手段] 本発明が適用される誤り回復システムは、複数
のプログラムを記憶するために主記憶装置と前記
プログラムを処理するための複数のプロセツサと
を有する電子計算機システムと組合わせて使用さ
れる。各プログラムは連続する命令から成る。各
プロセツサは、前記命令の選択された一つを取出
し、この選択された命令のリトライの実行が許さ
れる第1の時間期間と前記選択された命令のリト
ライの実行が許されない第2の時間期間の間、選
択された命令の各々をマイクロプログラム制御の
下で実行し、情報のかたまりを発生する実行手段
を有する。マイクロプログラムは、連続するマイ
クロステツプを有し、マイクロプログラムのリス
タートが予め定めされたマイクロステツプのチエ
ツクポイントから許される第1の間隔を持つ。各
プロセツサは、更に、実行手段の動作を監視し、
選択された命令の特定の一つを実行中に誤りが検
出されたとき誤り信号を発生し、特定の命令の実
行を中断する監視手段、この監視手段に作用的に
結合され、前記第1の時間期間の間、命令リトラ
イ可能信号を発生する命令リトライ可能信号発生
手段、及び監視手段に作用的に結合され、前記第
1の間隔の間、マイクロプログラムリスタート可
能信号を発生するマイクロプログラムリスタート
可能信号発生手段を有する。誤り回復システム
は、前記プロセツサの第1のプロセツサの監視手
段からの誤り信号に応答して、第1のプロセツサ
のマイクロプログラムリスタート可能信号発生手
段をアクセスし、マイクロプログラムリスタート
可能信号がマイクロプログラムリスタート可能信
号発生手段から検出されたときマイクロプログラ
ムリスタート信号を発生する。第1のプロセツサ
は、マイクロプログラムリスタート信号に応答し
て、チエツクポイントからマイクロプログラムの
リスタートを行う。誤り回復システムは、第1の
プロセツサの固定誤りの発生に活性化され、プロ
セツサの第2のプロセツサに特定の命令の実行を
引継がせる。
本発明によれば、第1のプロセツサは、更に、
そのなかの監視手段に作用的に結合され、マイク
ロプログラムのリスタートが成功した後、第1の
プロセツサの命令リトライ可能信号発生手段から
の命令リトライ可能信号を検出し、固定誤り信号
を発生する固定誤り信号発生手段を有する。誤り
回復システムは、固定誤り信号に応答して引継信
号を発生する手段を有し、それによつて第1のプ
ロセツサをチエツク状態に置く。
[実施例] 以下、本発明の実施例について図面を参照して
説明する。
第1図を参照すると、本発明の一実施例による
誤り回復システムと組み合わせて使用される電子
計算機システム即ち密結合マルチプロセツサシス
テムは、複数のプログラムを記憶するための主記
憶装置10を有する。各プログラムは連続する命
令から成る。計算機システムは、プログラムの選
択された一つを処理するための複数のプロセツサ
(第1及び第2のプロセツサ11及び12が例と
してこの図に示されている。)を有する。第1及
び第2のプロセツサ11及び12は、システム制
御装置13を介して、主記憶装置10に結合され
ている。主記憶装置10は計算機システムそれ自
身の活動を支援するための一つのオペレーテイン
グシステム14を有する。
主記憶装置10は、第1及び第2のプロセツサ
11及び12のアクテイブ状態を夫々示すための
メモリセルからなる第1及び第2の動作表示器1
51及び152を持つメモリ領域15を持つ。
システム制御装置13は、第1及び第2のプロ
セツサ11及び12が夫々計算機システムに接続
されていることを示すフリツプフロツプのような
第1及び第2の接続表示器131及び132を有
する。プロセツサ11及び12が接続されていな
い時、フリツプフロツプ131及び132は夫々
リセツトされる。フリツプフロツプ131及び1
32は夫々のプロセツサがシステムに接続される
ことによつてセツトされる。
システム制御装置13は、更に、第1及び第2
のプロセツサ11及び12のチエツク状態を夫々
示すためのフリツプフロツプのような第1及び第
2のプロセツサチエツク表示器136及び137
を有する。第1及び第2のプロセツサ11及び1
2の一つが固定誤りに遭遇すると、プロセツサの
一つがチエツク状態に成り、第1及び第2のプロ
セツサチエツク表示器136及び137の対応す
る一つがセツトされる。
第1のプロセツサ11は、主記憶装置10から
命令の選択された一つを取出し、マイクロプログ
ラム制御の下で、この選択された命令を実行し、
情報のかたまりを発生する実行回路111を有す
る。この実行回路111による選択された命令の
実行は、第2図を参照して後で詳細に説明される
ように、選択された命令のリトライの実行が許さ
れる第1の時間期間と選択された命令のリトライ
の実行が許されない第2の時間期間からなる時間
の間、行われる。実行回路111は、ジエネラル
レジスタ、イントラクシヨンカウンタ等のソフト
ウエアビジブルレジスタと呼ばれるレジスタ(図
示せず。)を有する。
第1のプロセツサ11は、更に、実行回路11
1の動作を監視するための監視回路112を有す
る。この監視回路112は、パリテイチエツク回
路、演算結果の一致検出回路、シーケンス正当性
チエツク回路等からなる誤り検出回路(図示せ
ず)を有する。各誤り検出回路は、実行回路11
1によつて選択された命令を実行中に誤りが検出
された時、誤り信号ERを発生する。この誤り信
号に応答して、監視回路112は参考文献3に述
べられているように、この選択された命令の実行
を中断する。
第2図を参照して、実行回路111による選択
された命令の実行は、この技術分野において良く
知られているように、複数の逐次ステツプS1〜S5
からなる。実行回路111の起動後、主記憶装置
10内の命令の選択された一つが、第1のステツ
プS1で取出され、取り出された命令はそれから第
2のステツプS2で解読される。それから、そのよ
うな演算の実行は第3のステツプS3で実施され、
演算の結果は第4のステツプS4で、例えば、プロ
セツサのレジスタの予め決められたエリアに格納
される。最後のステツプS5は命令アドレスを更新
するためのステツプである。
プロセツサが普通の命令を実行している場合に
おいて、ステツプS1から演算結果の格納がされる
直前のステツプS4の途中までの範囲で誤りが発生
しても、リトライがその普通の命令の始めからな
すことが可能である。従つて、この範囲が上述し
た第1の時間期間である。しかしながら、ステツ
プS4の演算結果の格納がされた直後からステツプ
S5までの他の範囲で誤りが発生すると、その命令
のリトライが不可能である。上述した第2の時間
期間は、ステツプS4の演算結果の格納がされた直
後からステツプS5までの範囲である。
ソフトウエアビジブルレジスタの内容を更新す
るための命令や主記憶装置10の記憶されたデー
タを更新するための命令のようなある命令に関連
して、ステツプS3でソフトウエアビジブルレジス
タや主記憶装置10の情報が更新された後、命令
のリトライは不可能である。何故なら、命令の実
行のために必要とされる情報が更新によつて変化
するからである。従つて、ある命令に於いて、第
1の時間期間は、ステツプS1から更新がされる直
前のステツプS3までの範囲であり、第2の時間期
間は、ステツプS3内の更新が完了した点からステ
ツプS5までの範囲である。
再び第1図を参照して、第1のプロセツサ11
は、監視回路112に作用的に結合された命令リ
トライ可能信号発生回路113を持つ。命令リト
ライ可能信号発生回路113は、第1の時間期間
の間、命令リトライ可能信号を発生する。フリツ
プフロツプが、また命令リトライ可能信号発生回
路113として使用され、ハードウエアやマイク
ロプログラム制御によつて、第1の時間期間の間
セツトされ、第2の時間期間の間リセツトされ
る。
上述したある命令に関連して、命令の実行中更
新がなされた後で誤りが発生した時でさえ、命令
の実行がマイクロプログラムのリスタートによつ
てなされる場合がある。即ち、もし更新された情
報が命令の実行の達成とは無関係あるいはもし変
化された情報が予め定めされたマイクロステツプ
即ちマイクロプログラムのチエツクポイントから
のリスタートにより回復出来るなら、命令の実行
は、参考文献1に述べられているように、チエツ
クポイントからのマイクロプログラムのリスター
トによつて継続される。マイクロプログラムのリ
スタートは、ステツプS5内の命令アドレスの更新
がなされた後に誤りが発生したとき、許されな
い。チエツクポイントからステツプS5内の命令ア
ドレスの更新がなされるまでの範囲は、マイクロ
プログラムリスタート可能期間と呼ばれる。
再び第1図を参照して、フリツプフロツプのよ
うなマイクロプログラムリスタート可能信号発生
回路114は、監視回路112に作用的に結合さ
れ、マイクロプログラムリスタート可能期間の
間、ハードウエア又はマイクロプログラム制御の
下にマイクロプログラムリスタート可能信号を発
生するためにセツトされる。
第3図を参照すると、スタツキング用のデータ
退避命令を行う場合のマイクロステツプの過程が
フローチヤートで示してある。
マイクロステツプA0は、スタツクの準備をす
るマイクロステツプで、主記憶装置に退避すべき
内容を持つ複数のベースレジスタ及び複数のジエ
ネラルレジスタを指示するためのデータが、アド
レスレジスタの内容(T)で示されるアドレスに従つ
て主記憶装置に格納される。次のマイクロステツ
プA1で、アドレスレジスタTの内容(T)に“4”
を加えた和(T+4)をワークレジスタyに格納
している。
このマイクロステツプA1は、上述したチエツ
クポイントとして決定される。それゆえに、マイ
クロプログラムリスタート可能信号MREがマイ
クロプログラムリスタート可能信号発生回路11
4(第1図)から発生され、即ち、フリツプフロ
ツプがこのマイクロステツプA1でセツトされる。
と同時に、ソフトウエアに見えないレジスタZに
マイクロステツプA1に対応するマイクロプログ
ラムアドレスA1が保持される。
それから、マイクロステツプA2で、ワークレ
ジスタyの内容(y)に“4”が加えられ、その加算
結果(y+4)が再びワークレジスタyに格納さ
れ、それから、ベースレジスタBR0の内容
(BR0)(4バイト幅を持つ)が主記憶装置10に
ワークレジスタyで示される内容(y)によつて与え
られるアドレスに従つて格納される。主記憶装置
内の情報がマイクロステツプA2で更新されるの
で、命令リトライがマイクロステツプA2以降許
されない。それゆえに、命令リトライ可能信号発
生回路113(第1図)はリセツトされる。
その後、同様なマイクロステツプ動作がベース
レジスタ及びジエネラルレジスタの内容を退避す
るために実行される。マイクロステツプAnで、
主記憶装置に退避されるべき最後のジエネラルレ
ジスタGRoの最終内容(GRo)が主記憶装置に格
納される。即ち、ワークレジスタyの内容(y)に
“4”を加え、その加算結果を再びワークレジス
タyに格納し、それから、ジエネラルレジスタ
GRoの内容(GRo)が主記憶装置10にワークレ
ジスタyの内容で示されるアドレス(y)に従つて格
納される。
その次のマイクロステツプBで、ワークレジス
タyの内容(y)がソフトウエアビジブルレジスタの
一つであるアドレスレジスタTに格納される。ア
ドレスレジスタTが更新されるため、チエツクポ
イントからのマイクロプログラムリスタートが許
されず、マイクロステツプB及び引き続くマイク
ロステツプでマイクロプログラムリスタート信号
発生回路114はリセツトされる。
従つて、チエツクポイントA1からのはじまる
マイクロプログラムリスター可能範囲は、マイク
ロステツプA1からマイクロステツプAnまでの範
囲許される。マイクロプログラムリスタートにお
いて、レジスタZの内容(Z)がマイクロプロプログ
ラムアドレスカウンタ(図示せず)に格納され、
マイクロステツプが再びマイクロステツプA1
ら行われる。
マイクロステツプBの次のマイクロステツプC
では、インストラクシヨンカウンタICの内容
(IC)にインストラクシヨンレングス(IL)が加
えられ、その加算結果が再びインストラクシヨン
カウンタICに格納されている。従つて、命令ア
ドレスが更新される。このマイクロステツプC
は、第2図のステツプS5に対応する。
第1図に戻つて、第1のプロセツサ11は、さ
らに、ユーザにより、例えば、プログラムのデバ
ツグがなされている時、手で入力されたリトライ
要求を保持するためのフリツプフロツプのような
リトライ要求表示器115を持つ。
また、第1のプロセツサ11は、固定誤りを発
生するための固定誤り発生器116を有している
が、この固定誤り発生器116については後で第
5図を参照して詳細に説明する。
第2のプロセツサ12は上述した第1のプロセ
ツサ11の配列と同様の配列を有する。プロセツ
サ12の詳細はその簡単化のために図面及び説明
を省略する。
第1及び第2のプロセツサ11及び12の一つ
で発生した誤りを回復する為に、誤り回復装置2
0がシステム制御装置13を介して第1及び第2
のプロセツサ11及び12に結合されている。誤
り回復装置20はサービスプロセツサ30にも結
合されている。
第1のプロセツサ11に誤りが発生した場合を
想定しているので、誤り回復装置20と第1のプ
ロセツサ11との接続関係のみについて第1図に
示し、図面の簡単化の目的のために、第2のプロ
セツサ12と装置20との接続関係については省
略する。
誤り回復装置20は、接続表示器132をアク
セスし、第2のプロセツサの接続状態を検出する
ための接続検出器21と、動作表示表示器152
をアクセスし、第2のプロセツサ12がアクテイ
ブかインアクテイブかを検出するための動作検出
器22と、第1のプロセツサチエツク表示器13
6に第1のプロセツサ11のチエツク状態を書込
むために引継信号を発生するための引継信号発生
回路23を有する。また、誤り回復装置20は、
命令リトライ可能信号IREを得るために命令リト
ライ可能信号発生回路113をアクセスするため
の第1のアクセス回路24と、マイクロプログラ
ムリスタート可能信号MREを得るためにマイク
ロプログラムリスタート可能信号発生回路114
をアクセスするための第2のアクセス回路25
と、オペレータによつて要求されたリトライ要求
RRを検出するためのリトライ要求表示器115
をアクセスするためのリトライ要求検出器26と
を有する。これら回路21〜26は、誤り回復装
置20内の制御回路27によつて制御される。
さて、第1図に加え第4図A乃至第4図Cに示
されたフローチヤートを参照して、誤り回復装置
20の動作を説明する。
第1のプロセツサ11に誤りが発生すると、誤
り回復装置20は第1のプロセツサ11からの誤
り信号ERに応答して第1のプロセツサ11の誤
りを回復するための動作を開始する。制御回路2
7は、第1のステージSa1で、接続検出器21を
起動して、第2の接続表示器132の内容を読込
む。制御回路27は、第2のステージSa2で、読
込み内容を決定する。読込み内容が、第2のプロ
セツサ12が本計算機システムに接続されている
ことを示しているとき、動作が第2のステージ
Sa2から第3のステージSa3に移り、制御回路2
7は、動作検出器22を起動して、第2の動作表
示表示器152の内容を検出する。それから、制
御回路27は、第4のステージSa4で、第2のプ
ロセツサ12がアクテイブかインアクテイブかを
判断する。第2のプロセツサ12がアクテイブな
ら、動作は、第5のステージSa5に進み、リトラ
イ検出器26がリトライ要求表示器115の内容
を読込むために起動される。リトライ要求1が次
の第6のステージSa6で決定された時、動作は第
6のステージSa6から第7のステージSa7(第4図
B)に移る。第7のステージSa7で、制御回路2
7は、第1のアクセス回路24を起動して、命令
リトライ可能信号発生回路113をアクセスす
る。命令リトライ可能信号IREが命令リトライ可
能信号発生回路113から読込まれた時、動作は
第8のステージSa8を介して第9のステージSa9
に進む。第9のステージSa9で制御回路27は、
引継信号発生回路23を起動して、引継信号TO
を発生し、それは、第1のプロセツサのチエツク
状態を書込むために第1のプロセツサチエツク表
示器136をセツトする。
命令リトライ可能信号IREが第8のステージ
Sa8で決定されない時、動作は、第8のステージ
Sa8から第10のステージSa10に移り、ここで、マ
イクロプログラムリスタート可能信号発生回路1
14が第2のアクセス回路25によつてアクセス
される。マイクロプログラムリスタート可能信号
MREが第11のステージSa11で検出されない時、
動作は、第11のステージSa11から第9のステージ
Sa9に移る。
上の説明からわかるように、命令リトライ可能
信号IREが検出されるか、又は、命令リトライ可
能信号IREとマイクロプログラムリスタート可能
信号MREの両方とも検出されないなら、制御回
路27は、第1のプロセツサチエツク表示器13
6をセツトする。
引継信号TOに応答して、第1のプロセツサ1
1内の状態信号は、参考文献1〜3に開示されて
いる知られた方法で、第2のプロセツサ12に転
送され、誤りが発生した時に第1のプロセツサ1
1で処理されていた命令が再び第2のプロセツサ
12において命令の始めから実行される。
即ち、プロセツサチエツク表示器136が引継
信号TOによつてセツトされた時、システム制御
装置13は、第1のプロセツサ11がプロセツサ
のチエツク状態に置かれたことを、第2のプロセ
ツサ12及びサービスプロセツサ30に通知す
る。第2のプロセツサ12はオペレーテイングシ
ステム(OS)14内に格納されている例外処理
プログラムに知らせる。一方、サービスプロセツ
サ30は、状態信号、即ち、第1のプロセツサ1
1内のソフトウエアビジブルレジスタの内容を主
記憶装置10の所定のエリア(図示せず)に転送
する。
ついでながら、状態信号は、参考文献3に記述
された記憶装置に転送されても良い。
それから、例外処理プログラムは、第2のプロ
セツサ12において実行される。即ち、状態信号
が主記憶装置10あるいは記憶装置から読出さ
れ、誤りが発生した時に第1のプロセツサ11で
処理されていた命令のリトライの実行が可能か否
かを判断される。リトライ可能であれば、命令の
実行が第2のプロセツサでリトライされる。
第11のステージSa11に戻つて、マイクロプログ
ラムリスタート可能信号MREが読込まれたと判
定されたら、第1のプロセツサ11は、第12のス
テージSa12でリセツトされる。それから、制御回
路27は、第1のマイクロプログラムリスタート
信号MR1を発生し、それは、第13のステージ
Sa13で、第1のプロセツサ11に供給される。そ
れから、第1のプロセツサ11はチエツクポイン
トからマイクロプログラムをリスタートする。
第5図及び第1図を参照して、マイクロプログ
ラムのリスタート後の第1のプロセツサ11の動
作を説明する。
第1のマイクロプログラムリスタート信号
MR1に応答して、固定誤り発生器116は、監
視回路112と共に動作し、マイクロプログラム
のリスタートが成功したか否かを判定する(第5
図の第14のステージSa14)。成功と判定された時、
固定誤り発生器116は、成功通知信号SIを発生
し、それによつて、マイクロプログラムのリスタ
ートが成功したことを誤り回復装置20へ通知す
る(第15のステージSa15)。固定誤り発生器11
6は、また、命令リトライ可能信号発生回路11
3をアクセスする。その後、命令リトライ可能信
号発生回路113が主記憶装置10から第1のプ
ロセツサ11内に取出された新しい命令の実行に
よつてセツトされた時、固定誤り発生器116
は、第16のステージSa16で固定誤り信号PEを発
生する。
ここで、第4図Bに戻つて、第17のステージ
Sa17で、固定誤り信号PEを受信すると、誤り回
復装置20の制御回路27は、第9のステージ
Sa9の動作を実行し、第1のプロセツサチエツク
表示器136をセツトする。従つて、第1のプロ
セツサ11で取出された新しい命令の実行が上述
した状態信号の転送をして第2のプロセツサ12
によつて引き継がれる。
第5図において、第14のステージSa14で、マイ
クロプログラムのリスタート成功しないと判定さ
れた時、第18のステージSa18で固定誤り発生器1
16は、固定誤り信号PEを発生する。それから、
誤り回復回路20の制御回路27は、また、第17
のステージSa17及び第9のステージSa9の動作を
実行し、プロセツサチエツク表示器136がセツ
トされる。
第2のステージSa2(第4図A)に戻つて、第
2のプロセツサ12の接続が決定されない時、制
御回路27は、第19のステージSa19(第4図C)
の動作を行い、第1のアクセス回路24によつて
命令リトライ可能信号発生回路113をアクセス
する。
第2のプロセツサ12が第4のステージSa4
インアクテイブと判定された時又はリトライ要求
が第6のステージSa6で検出された時、制御回路
27の動作は、また第19のステージSa19に進む。
命令リトライ可能信号IRSが第19のステージ
Sa19の後第20のステージSa20で決定された時、制
御回路27は、第21のステージSa21で第1のプロ
セツサ11をリセツトし、そして第22のステージ
Sa22で、命令リトライ信号IRを第1のプロセツ
サ11に供給する。従つて、第1のプロセツサ1
1は、命令のリトライの実行を実施する。
第20のステージSa20で、命令リトライ可能信号
IRSが検出されない時、第23のステージSa23で、
マイクロプログラムリスタート可能信号発生回路
114が第2のアクセス回路25でアクセスされ
る。第24のステージSa24で、マイクロプログラム
リスタート可能信号MREが検出された時、制御
回路27は、第25のステージSa25で第1のプロセ
ツサ11をリセツトし、それから、第2のマイク
ロプログラムリスタート信号MR2を第1のプロ
セツサ11に供給する。マイクロプログラムのリ
スタートプログラムのリスタートが第1のプロセ
ツサ11においてチエツクポイントから行われ
る。
第24のステージSa24で、マイクロプログラムリ
スタート可能信号MREが検出されない時、制御
回路27は、第27のステージSa27で第1のプロセ
ツサ11をリセツトする。それから、制御回路2
7は第28のステージSa28でオペレーテイングシス
テム(OS)14への障害通知を第1のプロセツ
サ11にさせるために誤り通知指令EICを発生す
る。
[発明の効果] 以上の説明したように本発明は、マイクロプロ
グラムのリスタートが成功したら、次の命令が命
令リトライ可能状態になつた時に、第1のプロセ
ツサから固定誤りを発生させ、他の正常なプロセ
ツサ(第2のプロセツサ)に第1のプロセツサの
ジヨブを引継がせているので、システムダウンす
るのを回避することが出来る。
【図面の簡単な説明】
第1図は本発明の一実施例による誤り回復シス
テムの構成を示すブロツク図、第2図は命令リト
ライ可能範囲とマイクロプログラムリスタート可
能範囲を説明するための一般の命令の概略の流れ
を示すフローチヤート、第3図はマイクロプログ
ラムリスタート可能範囲及びマイクロプログラム
リスタートをスタツキング用のデータ退避命令を
行う場合を例にしたマイクロステツプのフローチ
ヤート、第4図A,B、及びCは第1図に示した
誤り回復装置の動作を説明するためのフローチヤ
ート、第5図は第1図に示した第1のプロセツサ
の固定誤り発生装置の動作を説明するためのフロ
ーチヤートである。 10……主記憶装置、11……第1のプロセツ
サ、12……第2のプロセツサ、13……システ
ム制御装置、14……オペレーテイングシステ
ム、15……メモリ領域、20……誤り回復装
置、21……接続検出器、22……動作検出器、
23……引継信号発生回路、24……第1のアク
セス回路、25……第2のアクセス回路、26…
…リトライ要求検出器、27……制御回路、30
……サービスプロセツサ、111……実行回路、
112……監視回路、113……命令リトライ可
能信号発生回路、114……マイクロプログラム
リスタート可能信号発生回路、115……リトラ
イ要求表示器、116……固定誤り発生器、13
1……第1の接続表示器、132……第2の接続
表示器、136……第1のプロセツサチエツク表
示器、137……第2のプロセツサチエツク表示
器、151……第1の動作表示器、152……第
2の動作表示器。

Claims (1)

  1. 【特許請求の範囲】 1 複数のプログラムを記憶するための主記憶装
    置と前記プログラムを処理するための複数のプロ
    セツサとを有する電子計算機システムと組合わせ
    て使用される誤り回復システムであつて、各プロ
    グラムは連続する命令から成り、各プロセツサ
    は、前記命令の選択された一つを取出し、該選択
    された命令のリトライの実行が許される第1の時
    間期間と該選択された命令のリトライの実行が許
    されない第2の時間期間の間、前記選択された命
    令の各々をマイクロプログラム制御の下で実行
    し、情報のかたまりを発生する実行手段を有し、
    前記マイクロプログラムは、連続するマイクロス
    テツプからなり、マイクロプログラムのリスター
    トが予め定めされたマイクロステツプのチエツク
    ポイントから許される第1の間隔をもち、各プロ
    セツサは、更に、前記実行手段の動作を監視し、
    選択された命令の特定の一つを実行中に誤りが検
    出されたとき誤り信号を発生し、特定の命令の実
    行を中断する監視手段、該監視手段に作用的に結
    合され、前記第1の時間期間の間、命令リトライ
    可能信号を発生するための命令リトライ可能信号
    発生手段、及び前記監視手段に作用的に結合さ
    れ、前記第1の間隔の間、マイクロプログラムリ
    スタート可能信号を発生するためのマイクロプロ
    グラムリスタート可能信号発生手段を有し、前記
    誤り回復システムは、前記プロセツサの第1のプ
    ロセツサの前記監視手段からの誤り信号に応答し
    て、前記第1のプロセツサの前記マイクロプログ
    ラムリスタート可能信号発生手段をアクセスし、
    前記マイクロプログラムリスタート可能信号が前
    記マイクロプログラムリスタート可能信号発生手
    段から検出されたときマイクロプログラムリスタ
    ート信号を発生し、前記第1のプロセツサは、前
    記マイクロプログラムリスタート信号に応答し
    て、前記チエツクポイントからマイクロプログラ
    ムのリスタートを実行し、前記誤り回復システム
    は、前記第1のプロセツサの固定誤りの発生に活
    性化され、前記プロセツサの第2のプロセツサに
    特定の命令の実行を引継がせるものにおいて、 前記第1のプロセツサは、更に、そのなかの前
    記監視手段に作用的に結合され、前記マイクロプ
    ログラムのリスタートが成功した後、前記第1の
    プロセツサの前記命令リトライ可能信号発生手段
    からの前記命令リトライ可能信号を検出し、固定
    誤り信号を発生する検出手段を有し、 前記誤り回復システムは、前記固定誤り信号に
    応答して、引継信号を発生する手段を有し、それ
    によつて前記第1のプロセツサをチエツク状態に
    する誤り回復システム。 2 更に、前記第1のプロセツサからの前記誤り
    信号に応答して、前記第1のプロセツサの前記命
    令リトライ可能信号発生手段をアクセスし、前記
    命令リトライ可能信号が前記第1のプロセツサの
    前記命令リトライ可能信号発生手段から検出され
    たとき、第1のイネーブル信号を発生する第1の
    アクセス手段を有し、そして前記引継信号発生手
    段は、前記第1のアクセス手段に結合され、前記
    第1のイネーブル信号に応答して前記引継信号を
    発生する特許請求の範囲第1項に記載の誤り回復
    システム。 3 前記主記憶装置は更に前記第2のプロセツサ
    のアクテイブ状態を表示するための動作表示手段
    を有し、前記誤り回復システムは、更に、前記誤
    り信号に応答して、前記動作表示手段をアクセス
    し、前記第2のプロセツサのアクテイブ状態が前
    記動作表示手段で検出されないとき、インアクテ
    イブ信号を発生する動作検出手段を有し、前記引
    継信号発生手段は、また前記動作検出手段に結合
    され、前記インアクテイブ信号によつてインアク
    テイブ状態に置かれる特許請求の範囲第2項に記
    載の誤り回復システム。 4 前記誤り回復システムは、更に、前記第1の
    イネーブル信号と前記インアクテイブ信号に応答
    して、前記第1のプロセツサへ命令リトライ信号
    を発生する命令リトライ指示手段を有し、前記第
    1のプロセツサは前記命令リトライ信号に応答し
    て特定の命令のリトライの実行を行う特許請求の
    範囲第3項に記載の誤り回復システム。 5 前記第1のプロセツサは、更に、手で入力さ
    れたリトライ要求を保持するリトライ要求表示手
    段を有し、そして、前記誤り回復システムは、更
    に、前記誤り信号に応答して前記リトライ要求表
    示手段をアクセスし、前記リトライ要求が前記リ
    トライ要求表示手段から検出されたとき、第2の
    イネーブル信号を発生するリトライ要求検出手段
    を有し、前記引継信号発生手段は、前記リトライ
    要求検出手段に結合され、前記第2のイネーブル
    信号によつてインアクテイブ状態に置かれ、前記
    誤り回復システムは、更に、前記第1のイネーブ
    ル信号と前記第2のイネーブル信号に応答して、
    前記第1のプロセツサへ命令リトライ信号を発生
    する命令リトライ指示手段を有し、前記第1のプ
    ロセツサは前記命令リトライ信号に応答して特定
    の命令の実行をリトライする特許請求の範囲第2
    項に記載の誤り回復システム。 6 更に、前記引継信号に応答して前記第1のプ
    ロセツサをチエツクすべき状態を表示するための
    プロセツサチエツク表示手段を有する特許請求の
    範囲第1項に記載の誤り回復システム。
JP62203458A 1986-08-18 1987-08-18 誤り回復システム Granted JPS63153646A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP19354986 1986-08-18
JP61-193549 1986-08-18
JP61-193550 1986-08-18

Publications (2)

Publication Number Publication Date
JPS63153646A JPS63153646A (ja) 1988-06-27
JPH058452B2 true JPH058452B2 (ja) 1993-02-02

Family

ID=16309908

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62203458A Granted JPS63153646A (ja) 1986-08-18 1987-08-18 誤り回復システム

Country Status (1)

Country Link
JP (1) JPS63153646A (ja)

Also Published As

Publication number Publication date
JPS63153646A (ja) 1988-06-27

Similar Documents

Publication Publication Date Title
US4852092A (en) Error recovery system of a multiprocessor system for recovering an error in a processor by making the processor into a checking condition after completion of microprogram restart from a checkpoint
US5317752A (en) Fault-tolerant computer system with auto-restart after power-fall
JPS638835A (ja) 障害回復方法
JPS62298839A (ja) 障害時に計算機システムを再始動する方法
WO1999057632A2 (en) Initializing and restarting operating systems
JP3481737B2 (ja) ダンプ採取装置およびダンプ採取方法
US5146569A (en) System for storing restart address of microprogram, determining the validity, and using valid restart address to resume execution upon removal of suspension
JPH0552981B2 (ja)
JPH07141176A (ja) コマンドリトライ制御方式
US4987532A (en) Electronic computer system with means for issuing a non-store request before executing state transition prosecution
JPH058452B2 (ja)
JP2823230B2 (ja) 処理の継続実行方法
JPS6336023B2 (ja)
JP2922981B2 (ja) タスクの実行継続方法
JP2679575B2 (ja) 入出力チャネルの障害処理システム
JPH05165730A (ja) データ処理装置
JPS6130296B2 (ja)
JPH07109592B2 (ja) Cpu―io並列動作シミュレーション方法
JPH0149975B2 (ja)
JP3331695B2 (ja) 時刻同期方法
JPS5932821B2 (ja) 情報処理装置
JPS6130297B2 (ja)
JP2814988B2 (ja) 障害処理方式
JPS622334B2 (ja)
JPS6156537B2 (ja)