JPH02194444A - 情報処理装置の再立ち上げ装置 - Google Patents

情報処理装置の再立ち上げ装置

Info

Publication number
JPH02194444A
JPH02194444A JP1014457A JP1445789A JPH02194444A JP H02194444 A JPH02194444 A JP H02194444A JP 1014457 A JP1014457 A JP 1014457A JP 1445789 A JP1445789 A JP 1445789A JP H02194444 A JPH02194444 A JP H02194444A
Authority
JP
Japan
Prior art keywords
data
read
main memory
processing device
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1014457A
Other languages
English (en)
Other versions
JPH07117902B2 (ja
Inventor
Tadashi Hara
忠 原
Atsushi Takahashi
淳 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
NEC Engineering Ltd
Original Assignee
NEC Corp
NEC Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, NEC Engineering Ltd filed Critical NEC Corp
Priority to JP1014457A priority Critical patent/JPH07117902B2/ja
Publication of JPH02194444A publication Critical patent/JPH02194444A/ja
Publication of JPH07117902B2 publication Critical patent/JPH07117902B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Retry When Errors Occur (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は情報処理装置の再立ち上げ装置に関し、特に破
壊された場合に復旧困難な重要データを格納する重要領
域を主記憶に有する情報処理装置で主記憶障害が発生し
た場合に、前記重要領域の破壊の有無を検査して再立ち
上げの可否を決定する情報処理装置の再立ち上げ装置に
関する。
〔従来の技術〕
通常、情報処理装置で障害が検出された場合、この障害
が診断処理装置に報告され、この診断処理装置において
情報処理装置の再立ち−Fげ処理が実行されるようにな
っている。即ち、診断処理装置は上記の報告を受けると
、情報処理装置の動作を止め、障害発生時の情報処理装
置内のソフトウェアビジプルな情報をスキャンバスと呼
ばれるバスにより抜き取り、情報処理装置をクリアして
障害を消した後に、抜き取、ったソフトウェアビジプル
な情報を情報処理装置内に再設定する。これ(こより情
報処理装置はソフトウェアから見て障害発生時点と同じ
動作状態に設定されるつ情報処理装置の障害が固定の場
合は再変同じ障害が検出され動作不能状態となるが、間
欠障害であれば再立ち上げされることにより正常動作可
能と、なる。
ところで、情報処理装置の構成制御n情報や状態管理情
報など情報処理装置にとって重要なデータを主記憶の一
部の領域である重¥領域に格納している情報処理装置に
おいては、イの重要データは主記憶にしか存在しないた
め、それが破壊された場合の復旧が困難であり、情報処
理装置の正常動作に致命的な影9を与4える。従って、
重要領域に障害が発生した場合には情報処理装置を再立
ち上げしてはならない。他゛ツノ、重要領域以外の主記
憶の他の領域にはソフトウェアデータなと外部記憶装置
の内容でバンクアンプされたデータが記憶さねているの
で、それが破壊されても再ロードすることによって復旧
が可能であり、情報処理装置に致命的な影響は与えない
、従って、重要領域以外のj已記憶の領域に障害が定住
した場合には情報処理装置の再立ち上げを行うことがで
きる。
このように、重要領域をに記憶に有する情報処理装置で
は、障害箇所が重要領域か否かにより再立ち上げの可能
性が決定するため、それにがかる再立ちEげ制御時に障
害箇所が重要領域か否かを判定している。そしてこの判
定は従来次のようにして行われていた。
情報処理装置からの主記憶アクセスで障害が発生した場
合、障害が検出された主記憶アクセスアドレスが情報処
理装置内に保持されてい乙。そこで診断処理装置は情報
処理装置から障害報告を受けると、その情報処理装置内
に保持′されている土。
記憶アクセスアドレスが重要領域内”アドレスか否かを
羽べ、重要領域内アドレスであればi9領域に障害箇所
が存在し、重要領域以外のアドレスであれば重要領域に
障害箇所は存在しないと判定するものである。
〔発明が解決しようとする課題] 上述の通り従来は、L記憶アクセスにかかる障害が発生
した場合、その障害箇所が重要z1域におけるものか、
重要領域以外の領域におけるものかを、障害が検出され
た主記憶アクセスアドレスそのもので判定し、再立ち上
げの可能、不可能を決定していた。
しかし、主記憶の障害のリースとして連続アドレスの障
害があり、かかる障害については、障害が検出された主
記憶アクセスアドレスだけで障害箇所が重要領域かそれ
以外の領域か或いはその双方かを判断することは困難で
ある。即ち、連続アトL、=スの障害であって障害箇所
が重要領域とそれ以外の領域:こ存在する場合、重要領
域以外の領域に対するアクセスで障害が検出されると、
重要領域にも障害箇所が存在するにもかかわらず、従来
においては障害箇所が重要領域でないと判定され、再立
ち上げ可能と決定されてしまう。
本発明はこのような事情に鑑みて為されたものであり、
その目的は、主記憶にかかる障害の箇所を正確に突き止
め、重要領域に障害が存在する場合に再立ち上げ可能と
決定してし、まうことのない情報処理装置の再立ち上げ
装置を提供することにある。
(1題を解決するための手段) 本発明は上記の目的を達成するために、破壊された場合
に復旧困難な重要データを格納する重要領域を含む主記
憶を備えた情報処理装置の再立ち上げを行う装置におい
て、前記主記憶のm害発生時に、前記主記憶に格納され
ているデータを読み出す診断リード手段と、この診断リ
ード手段により読み出されたデータのエラーを検出する
エラー検出手段と、前記診断リード手段により読み出さ
れたデータが前記重要領域内のデータか否かを判定する
判定手段と、この判定手段の判定結果および前記エラー
検出手段の検出結果に基づき、前記診断リード手段で読
の出された前記重要領域内のデータのエラー時には前記
情報処理装置の再立ち上げ処理を中止し、それ以外の場
合には再立ち上げ処理を続行する立ち上げ制御手段とを
有している。
〔作用〕
本発明の情報処理装置の再立ち上げ装置において(よ、
主記憶に障害が発生すると、診断リード手段が主記憶に
格納されているデータを読み出し、この読め出されたデ
ータについて、エラー検出手段がエラーの有無を検出す
ると共に判定手段が重要領域内のy−夕か否かを判定し
、これらの結果に基づいて立ち上げ制御手段が、診断リ
ード手段で読み出された重要領域内のデータのエラー時
には情報処理装置の再立ち上げ処理を中止し、それ以外
の場合には再立ちトげ処理を続行する。
(実施例〕 次に、本発明の実施例について図面を参照して詳細に説
明する。
第1図は本発明を適用した計算機システムの一例を示す
ブロック図であり、診断処理装置101と、情報処理装
置102と、主記憶103と、エラー検出回路+04と
を含むシステムを示す。
同図において、主記憶103は第2回にも示すように重
要領域103aとそれ以外の領域103bとから構成さ
れている。ここで、重要領域103aは0番地からBA
R番地までの若いアドレスに固定されており、復旧が困
難な重要データを格納するやまた、他の領域103bに
はソフi・ウェアデータ等の復旧可能なデータを格納し
ている。
Iラー検出回路104は、主記憶103から読み出され
たデータ(READ  DATA)にエラーが存在する
か否かを検出する回路であり、エラーを検出したときは
その旨の報告PTVERをエラー報告線110を介し、
て情報処理装置102および診断処理装置101に出す
情報処理装置102で実行されるソフトウェアは主記憶
103N、こ格納されており1、情報処理!41置10
2は上記憶アクセス用のアドレスレジスタ105ぼアト
1.・ス(MEM  ADR3)を設定することにより
、主記憶103をアクセスすることができる。即ち、デ
ータWRITE  DATAを主記憶103に書き込む
ことができ、また主記憶103からデータ(READ 
 r)ATA)を読め出すことができる。この読み出さ
れたデータは情報処理装置102に加えられると共に、
前述したエラー検出回路104および診断処理装置10
1にも加えられている。なお、後述する診断リード時に
主記憶103から読み出されたデータは、診断処理装置
101においてログ情報とし“ζ図示しない外部記憶装
置に格納される。また情報処理装置102には障害検出
機構(図示せず)があり、この機構で障害が検出される
と、1害報告CHECKが障害報告線111を介して診
断処理装置101に送出される。ここで、主記憶103
にかかる障害時には、先ず主記憶103から読み出され
たデータ(READ  DATA)のエラーがエラー検
出回路104で検出されて情報処理袋2102にエラー
報告が為され、この情報処理装置102から障害報告&
Ijll 11を介して診断処理装置】Olに主記憶1
03に障害が発生した旨の報告が為される。
診断処理装置101は、情報処理装置102の再立ち上
げを実行する装置であり、スキャンパス113により情
報処理装置102のソフトウェアビジプルな情報を抜き
取ったり、逆に元に戻す]−段や、情報処理装置102
に対しデータ(DATA)を送1むしてそれを制御する
f段などに加え、次のようなf段を備えている。
・診断リード手段 主記憶103内のデータを抜き取るために、情報処理装
置 1.02内の主記憶アクセス用のアドレスレジスタ
105に診断リードアドレス設定バス1 +、 2を介
してアドレス(ADR3)を設定することにより、主記
憶103に格納されているY−タを読み出す手段である
。なお、この診断リードの際も読み出しデータのエラー
検出がエラー検出回路104で行われる。
・アドレス判定手段 上記の診断リード手段により読み出されたデータが重要
領域103 a内のデータか否かを判定する手段である
。これは本実施例においては、診断リードでアドレスレ
ジスタ105に設定した主記憶103のアドレス(AD
R3)のコピーを保持する診断リードアドレスレジスタ
106と、重要領域103aの最大アドレスBAR(第
2図参照)が設定された重要領域埼界アドレスレジスタ
107と、両アドレスレジスタの内容を比較し、診断リ
ードアドレスレジスタ106に保持されたアドレス(A
DR5)が重要M域境界アドレスレジスタ107に設定
されたアドレス(B A R)以下であるとき、重要領
域103a内のデータがリードされたことを再立ち上げ
制御手段109に通知する比較器108とで構成される
・再立ら上げ制御手段109 情報処理装置102の再立ち上げにかかる主たる制御を
行う手段である。この再立ち上げ制御手段109は、主
記憶103の重9領域103a内のアドレスに対する診
断リード時に、エラー検出回路104で読み出しデータ
のエラーが検出された場合、再立ち]−1げ処理を中止
し、重要領域103a以外の領域103bのア1゛レス
に対する診断リードで、読み出しy−夕のエラーが検出
された場合は重要6N域103a以外の全主記憶データ
を再設定することにより再立ち一部げ処理を継続する機
能を有している。
次に、このように構成された本実施例の動作を説明する
情報処理装置102で何等かの障害が検出された場合、
これが障害報告線111を介して診断処理装置101に
報告される。診断処理装置101はこの報告を受けて、
情報処理装置102内のソフトウェアビジプルな情報を
スキャンバス113にて抜き取る処理、主記憶103内
のデータを診断リードにより読み出しつつ再立ち上げの
可能性を判断する処理を行い、また再立ち上げ可能と判
断した場合ムこ情報処理袋2102をクリアする処理、
抜き取ったソフトウェアビジプルな情報を↑り報処理装
置102に再設定する処理1重要領域l03a以外の主
記憶データの再ロード処理を行った後に情報処理装置1
02を動作可能な状態にする処理等を実行する。
第3図は再立ち上げ制御手段109が行う上述した処理
のうち、障害報告線111を介して情報処理装置102
から主記憶103のアクセスエラーが報告された際に実
行される処理の一部を示している。同図に示すように、
主記憶“?クセスエラー時には、診断リードによって主
記憶103からデータを1つずつ読み出しくSl)、こ
の読み出しデータについてエラー検出回路104でエラ
ーが検出されたか否かをチエツクする(S2)、エラー
が検出されれば、そのリードアドレス(ADR3)のコ
ピーを保持する診断リードアドレスレジスタ106と重
要iI域103aの最大アドレス(BAR)が設定され
た重要領域境界アドレスレジスタ107とを比較してい
る比較器108の出力をチエツクして、今回の診断リー
ドのアクセスが重要領域103aにおけるものか否かを
判定しく33)、重要SJI域103aのアクセスであ
れば再立ち上げ不可能と判断して再立ち上げ処理を中止
する。また、今回の読み出しデータについてエラーが検
出されないか或いは検出されても重要領域103aのデ
ータでなければ、主記憶103の全アドレスについて診
断リードしたか否かを判定しくS4)、終了しでいなけ
れば処理S1に戻って次のデータの診断リードを行う。
また全アドレスを終了していれば再立ち上げ可能と判断
して再立ち上げ処理を続行する。以上のように個々の上
記憶データを診断リードで抜き取るごとに、データの正
常性を確かめることで上記(1jio3内の障害箇所を
網羅し、その結果に応して再立ち上げの可能性を決定す
る。なお、主記憶103における重要領域103aのサ
イズはごく小さなものであり、間欠障害のほとんどの場
合は再立ち上げすることにより復旧可能である。
(発明の効果〕 以上説明したように、本発明の情報処理装置の再立ち上
げ装置においては、主記憶にかかる障害の発生時に、主
記憶のデータを順次読み出してエラーの有無をチエツク
すると共にそのデータが重要領域内のデータか否かをチ
エツクするものであり、主記憶内の障害箇所を網羅する
ことができるので、主記憶にかかる障ムの箇所を正確に
突き11:めることができ、重要領域に障害が存在する
場合に再立ち上げ可能と決定し重要領域内のデータが不
正のまま再立ち上げが実行されるのを確実に防止するこ
とができる効果がある。
【図面の簡単な説明】
第1図は本発明を適用した計算機システムの一例を示す
ブロック図、 第2図は主記憶103の構成例を示づlおよび、第3圓
は再立ち上げ制ニア3手段109の処理の一部を示釘流
れ図である。 図において、 101・・・診断処理装置 102・・・情報処理装置 103・・・主記憶 103a・・・重要領域 103b・・・重要領域以外の領域 104・・・エラー検出回路 105・・・主記憶アクセス用のアドレスレジスタ10
6・・FJKリードアドレスレジスタ107・・・重要
領域境界アドレスレジスタ106・・・アドレスの比較
器 109・・・再立ち上げ制御手段 110・・・エラー報告線 111・・・障害報告線 12・・・診断リードアドレス設定バス13・・・スキ
ャンバス 特許出願人 日本電気株式会社外1名

Claims (1)

  1. 【特許請求の範囲】 破壊された場合に復旧困難な重要データを格納する重要
    領域を含む主記憶を備えた情報処理装置の再立ち上げを
    行う装置において、 前記主記憶の障害発生時に、前記主記憶に格納されてい
    るデータを読み出す診断リード手段と、該診断リード手
    段により読み出されたデータのエラーを検出するエラー
    検出手段と、 前記診断リード手段により読み出されたデータが前記重
    要領域内のデータか否かを判定する判定手段と、 該判定手段の判定結果および前記エラー検出手段の検出
    結果に基づき、前記診断リード手段で読み出された前記
    重要領域内のデータのエラー時には前記情報処理装置の
    再立ち上げ処理を中止し、それ以外の場合には再立ち上
    げ処理を続行する立ち上げ制御手段とを有することを特
    徴とする情報処理装置の再立ち上げ装置。
JP1014457A 1989-01-24 1989-01-24 情報処理装置の再立ち上げ装置 Expired - Lifetime JPH07117902B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1014457A JPH07117902B2 (ja) 1989-01-24 1989-01-24 情報処理装置の再立ち上げ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1014457A JPH07117902B2 (ja) 1989-01-24 1989-01-24 情報処理装置の再立ち上げ装置

Publications (2)

Publication Number Publication Date
JPH02194444A true JPH02194444A (ja) 1990-08-01
JPH07117902B2 JPH07117902B2 (ja) 1995-12-18

Family

ID=11861574

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1014457A Expired - Lifetime JPH07117902B2 (ja) 1989-01-24 1989-01-24 情報処理装置の再立ち上げ装置

Country Status (1)

Country Link
JP (1) JPH07117902B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111227856A (zh) * 2018-11-29 2020-06-05 佳能株式会社 放射线摄像系统、控制装置、控制方法和计算机可读介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111227856A (zh) * 2018-11-29 2020-06-05 佳能株式会社 放射线摄像系统、控制装置、控制方法和计算机可读介质

Also Published As

Publication number Publication date
JPH07117902B2 (ja) 1995-12-18

Similar Documents

Publication Publication Date Title
US6823476B2 (en) Mechanism to improve fault isolation and diagnosis in computers
JP3481737B2 (ja) ダンプ採取装置およびダンプ採取方法
EP0762282A1 (en) Atomic update of EDC protected data
JP2021531568A (ja) コモンモード障害信号に応じたメモリスキャン動作
US7139942B2 (en) Method and apparatus for memory redundancy and recovery from uncorrectable errors
US20120331339A1 (en) Control system software execution during fault detection
JP2009003592A (ja) コンピュータの異常検出・復旧方式
US5461588A (en) Memory testing with preservation of in-use data
US20100169572A1 (en) Data storage method, apparatus and system for interrupted write recovery
JPH02194444A (ja) 情報処理装置の再立ち上げ装置
JP2004252525A (ja) エミュレータおよびプログラム
JP2513060B2 (ja) 故障回復型計算機
JP3357777B2 (ja) プログラム制御システム
JPH03130835A (ja) 情報処理装置の再立ち上げ装置
JPH08137764A (ja) 記憶装置のソフトエラー回復方法と固定障害検出方法
JP2776815B2 (ja) 多重プロセッサシステムの障害回復方法
JP3191282B2 (ja) 障害情報データ収集方式
JPS6051142B2 (ja) ロギングエラ−制御方式
CN121412033A (zh) 一种应用恢复方法、装置和设备
JPH04111032A (ja) 多重化記憶装置
JPS6356751A (ja) メモリパトロ−ル制御方式
JPH04125753A (ja) メモリのオンライン診断方式
JP6334969B2 (ja) 演算処理装置、制御方法、及び、プログラム
JPH05324487A (ja) メモリ制御システム
JPS60110047A (ja) エラ−訂正方式