JPH0395634A - 計算機システム再起動制御方式 - Google Patents

計算機システム再起動制御方式

Info

Publication number
JPH0395634A
JPH0395634A JP1231491A JP23149189A JPH0395634A JP H0395634 A JPH0395634 A JP H0395634A JP 1231491 A JP1231491 A JP 1231491A JP 23149189 A JP23149189 A JP 23149189A JP H0395634 A JPH0395634 A JP H0395634A
Authority
JP
Japan
Prior art keywords
processor
restart
fault
computer system
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1231491A
Other languages
English (en)
Inventor
Naohiko Kaseda
悴田 直彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP1231491A priority Critical patent/JPH0395634A/ja
Publication of JPH0395634A publication Critical patent/JPH0395634A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Retry When Errors Occur (AREA)
  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、計算機システムに障害が発生しその運用が停
止した場合、自動的に再起動を行なう計算機システム再
起動制御方式に関する。
(従来の技術) 計算機システムを構成する場合、ハードウエアの故障や
プログラムの暴走等の障害に対処する対策が講じられる
。例えば、運用が停止し処理の滞るのを防止したい場合
には、通常運用する計算機システムのほかに予備として
同一の計算機システムを設け、障害発生時には、その運
用を直ちに予備の計算機システムに切換えるものがある
。また、運用停止がさほど問題にならない場合には、予
備の計算機システムを持たない単一計算機システムが利
用される。
第2図に、従来の単一計算槻システムのブロック図を示
す。
図において、計算機システム1は、システム全体の制御
管理を行なうシステム制御装置2と、このシステム制御
装置2に接続されたオペレータ会話装置3と処理装置5
とから構成されている。
システム制御装置2は、処理装置5の起動及びその動作
が正常に行なわれているか否かを監視するプロセッサ等
から構戊されたものである。オペレータ会話装置3は、
オペレータが操作するキ−ボードやディスプレイ等から
なり、システム制御装置2に向けて各抽コマンドの入力
等を行なう端末装置である。処理装置5は、実際にデー
タの演算等を行なうもので、プロセッサ6、主記憶装置
7、ディスク装置8とから構威されている。なお、各部
は共通バス4により接続されている。プロセッサ6は、
処理装置5を構成する各部の制御管理を行なうものであ
る。主記憶装置7は、プロセッサ6の動作に必要なプロ
グラムやデータを格納するRAM等から構成されたもの
である。ディスク装置8は、ハードディスク等の記録媒
体を用いてデータの保存を行なうもので、磁気ディスク
9が設けられている。
以上の構或の計算機システムlにおいて、システム制御
装置2には、プロセッサ6を起動する為のブートプログ
ラムが予め格納されている。また、ディスク装置8の磁
気ディスク9には、システムの運用操作を司る基本プロ
グラムをロードするためのイニシャルプログラムが格納
されている。
さて、オペレータ会話装置3からシステム制御装置2に
起動指令が人力されると、システム制御装置2は、ブー
トプログラムを共通バス4を介して主記憶装置7に転送
する。更に、プロセッサ6に起動指令を出す。プロセッ
サ6は、この起動指令を受付けると、主記憶装置7に記
憶されたブートプログラムを実行し、今度は、ディスク
装置8からイニシャルプログラムを読出し、主記憶装置
7に記憶させる。更に、当該イニシャルプログラムを実
行しシステム運用,操作を司る基本プログラムの起動を
終了する。以上の手順により計算機システム1の起動が
終了する。
さて、プロセッサ6は、動作が正常であることをシステ
ム制御装置2に通知するため、一定の周期で、システム
制御装置2に設けられた監視用タイマのリセット命令を
発行する。タイマのリセット命令が発行されず、監視用
タイマか所定の計数を行なった場合、システム制御装置
2は、プロセッサ6のプログラムか暴走したものと判断
し、プロセッサ6の動作を強制的に停止させる。また、
プロセッサ6は、処理装置5を構成する各部にハード的
な障害が発生したことを認識すると、自らその運用を停
止する。この場合、システム制御装置2への割込みがか
からないため、システム制御装置2は、プロセッサ6の
停止を認識することができる。
さて、システム制御装置2は、プロセッサ6の動作の停
止を認識し場合、オペレータ会話装置3等を通じて、オ
ペレータに障害発生を認識させる。
オペレータは、計算機システム1に障害が発生し、運用
が停止したことを認識した場合、障害原因の調査を行な
った後、再起動、即ちオペレータ会話装置3を用いて起
動指令の入力を行なうことになる。
さて、運用の停止時間が制限されるような場合で、かつ
障害の原因がプロセッサ6のリセット等により解除が可
能な場合には、オペレータが才ベレー夕会話装置3から
プロセッサ6のリセット指令を入力する。この際、後に
障害原因の解析を行なうために、プロセッサ6のリセッ
ト指令をきっかけに、プロセッサ6自身が、現在プロセ
ッサ6がどのような状態にあるかを示す内部レジスタの
内容(状況情報)を主記憶装置7に複写する処理を行な
う。才ベレータは、主記憶装置7に複写された状況情報
データをディスク装置8に格納するためのプログラムの
実行指令をオペレータ会話装置3より人力し、その後シ
ステムの再起動指令の人力を行なうことになる。このデ
ィスク装置8に複写された情報に基づいて、後に保守・
サービス員が計算機システムlの障害の解析を行なうこ
とになる。
また、オペレータ等が配置されずに、無人で運用されて
いる計算機システム1の場合に、自動的に再起動する方
法としては、プロセッサ6が、障害を検出し、停止時に
プロセッサ6自体が主記憶装置7の固定番地を参照し、
無条件で自動的に再スタート、即ち既に主記憶装置7に
記憶されたイニシャルプログラム等に基づいた動作を行
なうものがある。
(発明が解決しようとする課題) しかしながら、無人で運用されている計算機システム1
の場合には、その運用停止後無条件で再起動してしまう
ため、障害発生時の状況情報を保存できないといった問
題が生じていた。また、運用停止時にプロセッサ6の状
態を示す状況情報を保存し、その後、再び起動を行なう
計算機システム1においては、必ずオペレータが常駐し
なければならないという問題が生じていた。さらに、計
算機システムを2重化して、障害の発生したシステムの
調査中に他のシステムで運用を継続する方法もあるが、
同一システムを2つ用意するために約2倍のコストがか
かるといった問題が生じていた。
本発明は以上の点に着目してなされたもので、2重化シ
ステムを構築する必要が燕〈、障害が発生した場合にオ
ペレータの介入なしに速やかに運用を再開(再起動)す
ることができ、さらに、後に障害の解析を行なうことが
できる計算機システム再起動制御方式を提供するもので
ある。
(課題を解決するための手段) 本発明の計算機システム再起動制御方式は、プロセッサ
と、前記プロセッサの障害検出及び障害復旧の制御を行
なうシステム制御装置とを備え、前記システム制御装置
は、前記障害を検出する障害検出手段と、前記障害発生
時に前記プロセッサの状況の記録及び前記プロセッサの
再起動を実行するか否かの動作選択を設定しておく動作
選択設定手段とを轍えたものである。
(作用) 以上の方式において、予め動作選択設定手段に、プロセ
ッサの状況の記録を実行するか否か及び再起動を実行す
るか否かの情報を設定しておく。そして、システム制御
装置の障害検出手段がプロセッサの障害を検出した場合
、動作選択設定手段の内容を読取り、プロセッサの状況
を記録するか否か及びプロセッサの再起動を実行するか
否かを判断する。プロセッサの状況を記録する指示がな
されていた場合には、プロセッサの状況を示す状況情報
を記録する。また再起動する指示がなされていた場合に
は、プロセッサの再起動の処理を実行する。このように
、動作選択設定手段の内容により、適宜、障害発生時の
対策を講じることができる。
(実施例) 第1図に、本発明に係る計算機システムのブロック図を
示す。
図において、計算機システムlは、先に第2図において
説明したものと同様に、システム全体の制御管理を行な
うシステム制御装置2と、このシステム制御装置2に接
続されたオペレータ会話装置3と、共通バス4を介して
接続された処理装置5とから構成されている。なお、第
2図と同一の部分には同一の符号を付し、重複する説明
は省略する。
システム制御装置2には、障害検出手段21、状況情報
複写手段22、再起動実行手段23、動作選択設定手段
24、そしてブートプログラムを格納したROM25が
設けられている。障害検出手段21は、処理装置5の障
害、例えばプロセッサ6のプログラムの暴走やプロセッ
サ6の動作停止を検出するもので、監視タイマ(例えば
ウォッチドッグタイマ)等から構成されている。状況情
報複写手段22は、障害検出手段21が障害を検出した
場合、プロセッサ6に設けられた内部レジスタ6aの内
容の記録(ディスク装置8への複写)の指示を出すもの
である。なお、内部レジスタ6aは、プロセッサ6の機
能として持つ普通のレジスタである。再起動実行手段2
3は、障害検出手段21が障害を検出した場合、プロセ
ッサ6に再起動命令を出力するものである。動作選択制
御手段24は、状況情報複写手段22が状況情報の複写
を実行するか否か及び再起動実行手段23が再起動を実
行するか否かの設定を行なうレジスタ等から構成された
ものである。
第3図に、動作選択設定手段の構成図を示す。
図は、システム制御装置2のデータ長(32ビット)に
対応した32ビットのレジスタの構成を示している。
図において、第30ビットは、再起動を実行するか否か
の設定を行なう再起動指示フラグ24a、第31ビット
は、状況情報の記録を実行するか否かの設定を行なう複
写指示フラグ24bである。
どちらのフラグも、その内容が゛1′゛の場合は処理を
実行し、内容が“0゜゜の場合は処理を実行しないこと
を意味する。
ここで再び第1図に戻って、本発明の説明を行なう。
以上の構成の計算機システムエにおいて、動作選択設定
手段24の再起動指示フラグ24a及び複写指示フラグ
24b共に、その内容が゛1”に設定されているものと
する。従って、状況情報複写手段22はプロセッサ6の
内部レジスタ6aの内容を主記憶装置7を介してディス
ク装置8の磁気ディスク9に複写する処理を実行する。
同様に、再起動実行手段23は、プロセッサ6の再起動
を実行する。
さて、オペレータ会話装置3からシステム制御装置2に
起動指令が入力されると、システム制御装置2は、ブー
トプログラムを共通バス4を介して主記憶装置7に転送
する。更に、プロセッサ6に起動指令を出す。プロセッ
サ6は、この起動指令を受付けると、主記憶装置7に記
憶されたブートブログラムを参照し、今度は、ディスク
装置8からイニシャルプログラムを読出し、主記憶装置
7に記憶させる。更に、当該イニシャルプログラムを実
行し、システム運用,操作を司る基本プログラムの起動
を終了する。以上の手順により計算機システム1の起動
が終了する。
ところで、プロセッサ6は、動作が正常であることをシ
ステム制御装置2に通知するため、一定の周期で、障害
検出手段21に設けられた監視用タイマのリセット命令
を発行する。タイマのリセット命令が発行されず、例え
ばプロセッサ6が暴走し割込みが発生しない場合には、
監視用タイマはその計数を継続する。そして、この計数
値が所定の値を超えた場合、システム制御装置2は、プ
ロセッサ6に障害が発生したものと判断し、プロセッサ
6の動作を強制的に停止させる。また、プロセッサ6は
、主記憶装置7の異常やディスク装置8のアクセスエラ
ー等が発生した場合には、自らその動作を停止する。こ
の場合にも、システム制御装置2には割込みがかからず
、障害検出手段21が障害を検出することになる。
障害検出手段21は、処理装置5の障害を検出した場合
、状況情報複写手段22及び再起動実行手段23を起動
する。
先ず、状況情報複写手段22は、動作選択設定手段24
の内容を読取り、第3lビットの内容が゛1”か否かの
判断を行なう。ここでは、先に内容が”1゛に設定され
ているから、状況情報複写手段22は、状況情報の複写
を実行することになる。具体的には、先ずシステム制御
装置2は、プロセッサ6に内部レジスタ6aの内容(状
況情報)複写の指示を出す。この指示を受けたプロセッ
サ6は、内部レジスタ6aの内容を、一旦、主記憶装置
7の空き領域に転送する。その後、システム制御装置2
は、プロセッサ6のリセットを行なうと同時に、主記憶
装置7に格納された状況情報複写用のプログラムを参照
して動作する起動をかける。プロセッサ6は、この起動
を指示を受けると、ディスク装置8をアクセスし、主記
憶装置7に記憶された状況情報を磁気ディスク9に複写
する。
次に、システム制御装置2の再起動実行手段23は、動
作選択設定手段24の内容を読取り、第30ビットの内
容が“1゜゛か否かの判断を行なう。ここでは、先に内
容が゛1゜゜に設定されているから、再起動実行手段2
3は、プロセッサ6に再起動の指示を出すことになる。
プロセッサ6は、この再起動の指示を受けると、主記憶
装置7に記憶されたブートプログラムを参照して、その
動作を開始する。
なお、動作選択設定手段24の第30ビットが“O”に
設定されていたような場合、システム制御装置2の再起
動実行手段23は、オペレータ会話装置3を介して障害
発生の表示を行なう。また、再起動のみを実行させる場
合には、動作選択設定手段24の第31ビットを゛゜O
゛゜に設定しておけば良い。
以上の説明のように、動作選択設定手段の内容に基づい
て、状況情報の記録及び再起動を実行する。
本発明は以上の実施例に限定されない。
実施例では、プロセッサ6の状況を示す状況情報(内部
レジスク6aの内容)を、一旦主記憶装置7に複写した
後、ディスク装置8に再度複写する手順を説明したが、
例えばプロセッサ6から直接ディスク装置8に複写して
も構わない。
(発明の効果) 以上構成の本発明の計算機システム再起動制御方式によ
ると、処理装置に障害が発生した場合、無人で自動的に
再起動を行なうことができ、かつ状況情報の記録を行な
うことができる。このため、無人で運用されているシス
テムにおいても、後に障害の解析作業等を行なうことが
できる。また、システム毎に、自動的に再起動を行なう
か否か及び状況情報の記録を行なうか否かの選択を行な
うことができるため、システムの設置された環境に応じ
てその運用形態を容易に選択することができる。
【図面の簡単な説明】
第1図は本発明に係る計算機システムのブロック図、第
2図は従来の単一計算機システムのブロック図、第3図
は動作選択設定手段の構戊図である。 2・・・システム制御装置、 3・・・オペレータ会話装置、5・・・処理装置、6・
・・プロセッサ、6a・・・内部レジスタ、7・・・主
記憶装置、8・・・ディスク装置、21・・・障害検出
手段、22・・・状況情報複写手段、23・・・再起動
実行手段、 24・・・動作選択設定手段。

Claims (1)

  1. 【特許請求の範囲】 プロセッサと、 前記プロセッサの障害検出及び障害復旧の制御を行なう
    システム制御装置とを備え、 前記システム制御装置は、 前記障害を検出する障害検出手段と、 前記障害発生時に前記プロセッサの状況の記録及び前記
    プロセッサの再起動を実行するか否かの動作選択を設定
    しておく動作選択設定手段とを備えたことを特徴とする
    計算機システム再起動制御方式。
JP1231491A 1989-09-08 1989-09-08 計算機システム再起動制御方式 Pending JPH0395634A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1231491A JPH0395634A (ja) 1989-09-08 1989-09-08 計算機システム再起動制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1231491A JPH0395634A (ja) 1989-09-08 1989-09-08 計算機システム再起動制御方式

Publications (1)

Publication Number Publication Date
JPH0395634A true JPH0395634A (ja) 1991-04-22

Family

ID=16924324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1231491A Pending JPH0395634A (ja) 1989-09-08 1989-09-08 計算機システム再起動制御方式

Country Status (1)

Country Link
JP (1) JPH0395634A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006107430A (ja) * 2004-09-30 2006-04-20 Microsoft Corp コンピュータプログラムの無応答部分を識別するための方法、システムおよび装置
JP2016186688A (ja) * 2015-03-27 2016-10-27 日本電気株式会社 情報処理装置、デバイス、および復旧方法、並びにコンピュータ・プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006107430A (ja) * 2004-09-30 2006-04-20 Microsoft Corp コンピュータプログラムの無応答部分を識別するための方法、システムおよび装置
JP2016186688A (ja) * 2015-03-27 2016-10-27 日本電気株式会社 情報処理装置、デバイス、および復旧方法、並びにコンピュータ・プログラム

Similar Documents

Publication Publication Date Title
US6438709B2 (en) Method for recovering from computer system lockup condition
JPH07117903B2 (ja) 障害回復方法
JP3481737B2 (ja) ダンプ採取装置およびダンプ採取方法
KR100899582B1 (ko) 정보 처리 장치, 그 제어 장치, 그 제어 방법 및 제어프로그램을 저장한 컴퓨터 판독 가능한 기록 매체
JPH09251443A (ja) 情報処理システムのプロセッサ障害回復処理方法
JPH02294739A (ja) 障害検出方式
JPS6119061B2 (ja)
JPH0395634A (ja) 計算機システム再起動制御方式
JP3317361B2 (ja) メモリのバッテリバックアップ制御方式
JP2000099372A (ja) コンピュータシステム
JP3185446B2 (ja) 計算機システム
JP2679575B2 (ja) 入出力チャネルの障害処理システム
JP4788516B2 (ja) 動的置き換えシステム、動的置き換え方法およびプログラム
JP2000347758A (ja) 情報処理装置
JPS585856A (ja) 論理装置のエラ−回復システム
JP2624106B2 (ja) 交換システムにおけるバックアップファイルの自動検証処理方法
JP2849780B2 (ja) 計算機システム
JPH0659941A (ja) 情報処理装置
JPH0695974A (ja) メモリ保護方式
JPS6119060B2 (ja)
JPS62284440A (ja) 端末装置のソフトウエア資源保守方式
JPH07200334A (ja) 二重化同期運転方式
JP3340284B2 (ja) 冗長システム
JPH0721091A (ja) 電子計算機における停電処理方法
JPS62212865A (ja) マルチプロセツサ制御方式