JPS598064A

JPS598064A - 多重系計算機システムの障害診断方式

Info

Publication number: JPS598064A
Application number: JP57115477A
Authority: JP
Inventors: Sei Ogiwara; 荻原　聖; Eiji Hasegawa; 栄司長谷川
Original assignee: Toshiba Corp; Tokyo Shibaura Electric Co Ltd
Current assignee: Toshiba Corp
Priority date: 1982-07-05
Filing date: 1982-07-05
Publication date: 1984-01-17

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔発明の技術分野〕本発明は、多重系計算機システムの障害診断方式、特に
障害を発生した計算機の主メモリ上にある障害発生直前
までの情報を保存し得る多重系計算機システムの障害診
断方式に関するものである。

〔発明の技術的背票〕

一般に計算機システムを停止に至らしめるような重大な
障害発生直前としては、それを構成するハードウェアの
重要部分の故障及びバグによるプログラムのＭ走等が考
えられる。

これらの障害の診断をし障害原因を判明させるために最
も有効な手掛りとなる情報は、障害のため停止に至った
時の引算機システムの主メモリ上に存在する。こ第１は
停止した際に主メモリ上に保存されている情報には停止
に至る迄のプログラムの走行壮態や外部記憶装置や周辺
機器との入出力状態などがあるためである。このため、
従来、停止に至る際主メモリ上の情報を、一旦外部記憶
装随に退避させておき、訓η機システムを再起動させた
後、その情報をラインプリンタ等に出力し、障害診断を
行なっている。

第１図によって、従来の障害診断方式を説明する。第１
図に示す計算機システムは中央演算処理装置（以下ＣＰ
Ｕと云う）１、主メモリ２、外部記憶装置（以下バルク
メモリと云う）３、ラインプリンタ（以下ＬＰと云う）
４を設けている。６けパスでを）る。

今、この削舞機システムに前記したようなノ・−ドウエ
ア、又はソフトウェアに起因する障害が発生すると、通
常割込みと云う形で（以下障害割込みと太う）　ＣＰＵ
　１に通知される。ここで障害発生割込みを受信したＣ
ＰＵ　１は、それ迄実行していたグログラムを中断し２
、直ちに主メモリ情報退避グログラム２−１に側脚を移
す。主メモリ情報退避プログラム２−１はこのような状
況下、即ち、今まさに引算機システムが停止せんとする
直前に動作する必要のあるプログラムであるため、通常
のプログラムのように常時はバルクメモリ３上にあシ、
実行時のみ主メモリ２上にロードさせる形態はとれず、
主メモリに常駐する形態のプログラム（主常駐プログラ
ムと云う）である。

主メモリ情報退避プログラム２−１の動作はよく知られ
ているため、詳細な説明は省くが、次のような機能を有
している。

即ち、主メモリ２上にある情報を全量又は選択的に信号
系Ａを通してバルクメモリ３の主メモリ情報保存領域３
−１に転送保存した後、６１算機システムを停止させる
。そし７でバルクメモリ３の主メモリ情報保存領域３−
１に保存さノ１．でいる情報は、引算機システムを再度
起動した後、図示しないプログラムによって、信号系Ｂ
を通してＬＰ４宿に出力し、障害診断に供している。

〔背策技術の問題点〕

以上が訓算機システムにおける障害診断方式の代表［Ｆ
ＩＪであるが、これには次のような欠点を有し７ている
。即ち、障害原因がハードウェアにあって前記障害発生
割込みを発生しえなくなったり、信号系ＡＶｒＣよるバ
ルクメモリ３への転送が不可能になった場合には、この
方式は全く機能し々くなると云うことである。

更に又、障害片囚がソフトウェアにあってプログラムの
藁走により、主メモリ情報退避プログラム２−１が破壊
４　ｈ、たよりな場合も同様である。

多重系システムも上記同様の方法で障害診断のための情
報を得ている。

〔発明の目的〕

本発明は上記欠点を解決することを目的としてなされた
ものであり、ハードウェア及びソフトウェアのいずれの
障害発生に際しても障害診断のための重要な手掛かりの
喪失を防ぎ得る多重余計ａ機システムの障害診断方式を
提供することを目的としている。

〔発明の概要〕

そして本発明では多重系を構成する計算機のいずれかの
系列において障害が発生した場合、障害を発生した系列
の主メモリ上にある情報を残りの正常動作している系列
で採集することにより、障害診断のための重要々手掛り
の喪失を防ごうとするものである。

実施例以下図面を参照しつつ実施例を説明する。第２図は本発
明による多重系計算機システムの障害診断方式の一実施
列構成図である。

第２図は２重系の計算機システムであって、これら各計
算機はＣＰＵ　１　ａ　、　１　ｂ　、主メモリ２ａ。

２ｂ、バルクメモリ３ａ＋３ｂｘ　ＬＰ４ａ、４ｂをそ
なえていることは第１１￥１と同様である。なお、サフ
ィックスａを伺１．た削讃機を第１系列、ｂを付した側
ａ機を第２系列と称することにする。

５ａ、５ｂは互に相手系の主メモリをアクセス可能にす
るための装ＦＩ　ｓ即ち、ＣＰＵ　１　ａ　ｉ７ｔｇＷ
　５　Ｂ＋５ｂを介して相手系にある主メモＩＪ　２　
ｂをアクセスすることができ、又、ＣＰＵ　１　ｂは装
置５ｂ。

５ａを介（７て相手系にある主メモ’Ｊ　２　ａをアク
セスすることができるもσ）で、コンピュータシステム
リンケーノ装置（以下Ｃ８Ｌと云う）と称することにす
る。

次に第３図のフローグーヤードｖＣよって上記第２図々
示実舵例の動作を説明する。

今、第１系列の旧算機に障害が発生した場合を説明する
と、ステップＡ、Ｂのオア条件により、ステッｆＣＶ？
Ｘ示さノする第２系列のＣＰＵ　２　ｂに障害発生が通
知きれる。即ち、図示しない第１系列の停止検出装Ｗ１
．出力を第２系列の割込み横用装置に入力するなどのノ
・−ドウエアによる手段（ステップＡ）、又は第２系列
にある他系状態監視グログラムによる検出などのソフト
ウェアによる手段（ステップＢ）のいずれかによって、
正常な第２系列が第１系列の障害発生を知、２−（ステ
ップＣ）。

第１系列の障害停止の通知を受けた第２系列の主メモリ
情報退避プログラム２ｂ−２は、信号系Ｃを介して障害
停止した第１系列の主メモリ２１上にある情報をＣ８Ｌ
　５　ａ　、　５　ｂを経由して第２系列のバルクメモ
Ｉ７３　ｂの主メモリ情報保存領域３ｂ−２に保存する
（ステップＤ）。

なお、第２系列の計瀞機システムにおける主メモリ情報
退避プログラム２ｂ−２の前記動作は他の業務プログラ
ムの実行と並行して行なうことが可能である。

なお、多重系計算機システムを構成する計算機け、各々
独立して動作するものでけ々く、各耐η−機は有機的に
結合して動作している。したがって上記実施例で説明し
た第２系列の主メモリ退避プログラム２ｂ−２によって
、第１系列の主メモリ上［Ｓる情報の採集と共に、第２
系列自身の主メモリ２ｂ上にある情報も併せて、バルク
メモリ３ｂｖＣある主メモリ情報保存領３ｂ〜２に保存
するようにさぜれは、より広範な障害診断のための情報
を供することができる。

〔発明の効果〕

以上Ｈ’ｌｌ’明し戸如く、本発明によれば多重系言１
算機システムにおいて、多１１系を構成する計算機のい
ずれかの系列で障害が発生した場合、残りの正常動作し
７ている系列により障害を発生した系列の主２ノモリ上
の情報を採集すると共に、更に必要に応じて正′帛な系
ダ１の主メモリ上にある障害を発生した系列の状態に関
係する同時点の＋９を報をも採集することができるσ）
で、より正確でかつ広範々障害診断のための情報を喪失
することのない多重系計ｎ機ンステムのし一害診断方式
を提供できる。

【図面の簡単な説明】

第１図は従来の障害診断方式を説明するための構成図、
第２図ｄ本発明による多重系計算機システムの障害診断
方式を説明するための構成図、第３図は動作説明のため
のフローチャートである。 ■・・・中央演η処理装置Ｍ　２・・・主メモリ２−１
・・・主メモリ情報退避プログラム３・・・外部記憶装
置３−１・・・主メモリ情報保存領域４・・ラインプリンタ５ａ　、５ｂ・・・他系の主メモリをアクセスする装置慣°許出願人東京芝浦電気株式会社

Claims

【特許請求の範囲】

複数の計算機から構成される多重計算機システム内の障
害発生に際し、障害発生計算機の主メモリ上にある情報
を喪失することなく保存し得る多重系計算機システムの
障害診断方式において、障害発生時に作動する主メモリ
退避プログラムにより障害発生計算機の主メモリ上にあ
る情報を、正常動作計算機の主メモリ情報保存領域に採
集することを特徴とする多重系引算機システムの障害診
断方式。