JPS5969848A - 二重化計算機システムの障害監視方式 - Google Patents

二重化計算機システムの障害監視方式

Info

Publication number
JPS5969848A
JPS5969848A JP57181985A JP18198582A JPS5969848A JP S5969848 A JPS5969848 A JP S5969848A JP 57181985 A JP57181985 A JP 57181985A JP 18198582 A JP18198582 A JP 18198582A JP S5969848 A JPS5969848 A JP S5969848A
Authority
JP
Japan
Prior art keywords
computer
file
data
computer system
main
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57181985A
Other languages
English (en)
Inventor
Masataka Kato
正孝 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57181985A priority Critical patent/JPS5969848A/ja
Publication of JPS5969848A publication Critical patent/JPS5969848A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0763Error or fault detection not based on redundancy by bit configuration check, e.g. of formats or tags
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 この発明は、二重化計算機システムの障害監視方式に係
り、さらに詳細には実作’!j中の主系計算機の稼動状
態を待機中の従系計算機により監視させて速やか々障害
対処を可能さした新しい障害監視方式に関するものであ
る。
二重化計勢機システムは、計算機システムの信頼性を高
めるだめの一手法であり、一般的に一方の計算機を実作
業に従事させ、他方の計算機を待機状態にしておき、実
作業側の生糸計神機に障害が発生したとき実作業のダ・
持ちを待機側の従糸計15機に胴桟わりさせる構成であ
る。この主糸計算機から従系計11機への切換えist
 、短時間に狛われるのが望ましいのであるか、その切
換操作は複雑てか々り高度な技術を必要さ−するため専
用の保守員を配置していない電鏝機センタなどでは短時
間で処置1することがでさ々いのか実情である。従って
、この種の二重化計算機システムにおいて現稼動システ
ムにおける障害の自動的な障害監視と原因#I祈ならび
に処置法のメンセージ化の開発が要望されている この発明は、以十のような要望を満たして未熟々2ペレ
ークによってもシステム障害の対処を短時間で行えるよ
うにした新しい二重化計算機システムの障害監視方式を
提供しようとするものである。
簡単に述べるとこの発明は、2台の主系および従糸計算
桜に共通にファイルを設け、該共通ファイルに対し、所
定の時間間隔で主系の計算機から自己処理テークを書込
ませる一方、従系の計算機によりその書込まれたテーク
を読出させるようにし、該従系計′l1機はその続出し
タイミングで所望のシ゛−夕が読出せ々いとき前記主系
計算機制御による現稼動システムに障害が発生したもの
として該主系計算機のメンセージ・ログを自動解析する
ようにしたことを特徴とするものである。
以)、この発明の好ましい実施例につき図面を参照して
さらに詳細に説明する。
図rII]はこの発明の1実施例を概念的に示すシステ
ムフロック図であり、同図において1および2は計算機
 3,4および5は前記両社算機にそれぞれ共通のデー
タモニタ用ファイル、メンセージログ・ファイルおよび
保守メツセージ・ファイル。
6は入出力装置、7は入出力装設切換器、8および9は
オペレータコンソールを示す。
計シ機1.2はそれぞれプロセッサ11 、21とメイ
ンメモリ12.22とタイマIJ 、23とデータモニ
タ回1914,24なとをそなえている。
上記構成において計梼機1を実作業側、計算機2を待機
側とした々きの計算機2してよる計′#機1の障害監視
と処理前作を説明する。なお、説明を理解し易くするた
め図における48勺線を、実働中のものは実線で、休止
中のものは点線で示した、。
すなわち、計算機1側ではブ1コセッ′4j11が任意
の仕事(ジョグ)をそのブロクラムに従って入出力装置
6を制御しながら実行する1、メンセージ・ログ・ファ
イル4はこの七きの処刑ログを例えは最新の数ステップ
分ずつ格納吋る。この間、タイマ1′5は所定の時間間
隔で障害監視用の、タイミング信号を前記プロセッサ1
1に出力する。このタイミンク信ぢ1(よってプロセッ
サ11は、そのときの処理テークをデータモニタ用ファ
イル3に所一定&ステップずつ順次書込む。従ってデー
タモニタ用ファイル3には実作業側計算機1の稼動状態
が時々刻々書込まれる。
一力、待機側計$ia2ではタイマ23が前記タイマ1
3と同様の障害監視用タイミング信号を順次出力し、か
つプロセッサ21ハこのタイミング信号に応答してデー
タモニタ回路24を駆動する。
これによってテークモニタ回路24は前記データモニタ
用ファイル3に書込まれた計算機1の処理データを読出
ずとともに内容解析する。この解析結ヲ、、所望とおり
の正しいデータが存在するときF′i実作業側計′#i
d!に1を含めた現材動システムにター常かないことを
認識しプロセッサ21にその旨を通知する。しかるに、
テークが耽出せないか。
もしくにそのデータの発生タイミングが時間的にり゛ね
ていることを検出したときは現稼動システムに異常すな
わち障害か発生したものと認識しグロセツツー21に通
知する。これによって、プロセツダ゛21は1すその障
害発生事態をオペレータコンソール9に」、リオベレー
タに報知するとともに。
メツセージ・ログ・ファイル4からログデータを読出し
、てテークモニタ回路24に入力する。テークモニタ回
路24は、該ログデータを解析してその結果をプロセッ
サ21に出力する。これにより。
プロセッサ21は電券Φセンタ(ユーザ)ごとにい 保守メツセージを予め作成しWE’録してした保守メツ
セージ・ファイルから計当するメツセージを胱出し、前
記オペレータコンソール9に供給して表示させる。オペ
レータはこの表示された日本語の保守メツセージ例えげ
[作業中のジョブの関連ファイルのある@域にバグが発
生しているので修正しなさい」により、障害原因とそね
の対処法を知り半速そのファイル修正作業にとりかかれ
るこ七になる。
なお1以上の実施例は待機側計p機によって実作業側計
算機の稼動状態を監視する場合について説明したが、こ
れと並行して実作業側計算機によって待機側計鉋機の稼
動状態を監視しても良く。
かくすれば両計篤機の保全状態を常に監視できて便利で
ある。またデータのモニタ、[λグツアイルの解析はテ
ークモニタ回路14.24による%−ド的なものの他、
ソフト的に行うことも可能であさて5以上の説明から明
らかなように、この発明によれは二重化計算機システム
において実作業中の計神機の障害発生とそれの対処法を
速やかに知ることができるので、システムに不慣れなオ
ペレークによってもその障害処理を短時間で行うこ々か
できる。従って、システムの高信頼性ヲ図る上にきわめ
て有益である。
【図面の簡単な説明】
図面はこの発り]の1実施例を説明するためのシステム
フロック図である。 1および2:計算機、3°テ一タモニク用7ア本・ イル、ゞヴンヤージ ログ ファイル、5°保?メンセ
ーシフフ′イル、6°入出力装置、7:大田力h[切換
器、8および9 オベレー=タコンソール。 11および21 プロセン−!7’、12および22メ
インメモリ、13および23゛タイマ、14および24
 テータモニタ回路。

Claims (1)

  1. 【特許請求の範囲】 入出力公館を、116用する2台の計算機をそなえてな
    る二重化計3Ii機システムにおいて、2台の前E計算
    機に共通にファイルを設け 該共通ファイルに対し、所
    定の時間間隔で主系の計q−機から自己処理テータを書
    込捷せる一方、従糸の計神機によりその書込丼れたクー
    ツを読出させるようにし。 訃従系計算aにしその読出しタイミングで所望のテーク
    が読出→tないとき前記主糸計算機制御による現稼動シ
    ステムに障害が発生したものとして該主糸計%4ftの
    メンセージ・ログを自動解析するようにしたことを特徴
    とする二重化計算機システムの障害監視方式1
JP57181985A 1982-10-15 1982-10-15 二重化計算機システムの障害監視方式 Pending JPS5969848A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57181985A JPS5969848A (ja) 1982-10-15 1982-10-15 二重化計算機システムの障害監視方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57181985A JPS5969848A (ja) 1982-10-15 1982-10-15 二重化計算機システムの障害監視方式

Publications (1)

Publication Number Publication Date
JPS5969848A true JPS5969848A (ja) 1984-04-20

Family

ID=16110303

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57181985A Pending JPS5969848A (ja) 1982-10-15 1982-10-15 二重化計算機システムの障害監視方式

Country Status (1)

Country Link
JP (1) JPS5969848A (ja)

Similar Documents

Publication Publication Date Title
JP2007511806A (ja) 技術的装置を制御するための冗長性自動化システム及びその作動方法
JP2519276B2 (ja) 障害情報収集処理方式
JPS5969848A (ja) 二重化計算機システムの障害監視方式
JPH05314075A (ja) オンラインコンピュータ装置
JPH02132529A (ja) 自動監視切替制御装置
JPH03137732A (ja) 端末制御装置の切換え方式
JPH036748A (ja) オンライン端末装置
JPS6112580B2 (ja)
JPH0319978B2 (ja)
JPS5941214B2 (ja) 状態監視方式
JPS6290068A (ja) 予備系監視方式
JPS63177231A (ja) 並列プログラムデバグ方式
JPH0277943A (ja) システムリカバリ方法
JPS62123531A (ja) Cpu監視装置
JPS644211B2 (ja)
JPS60254362A (ja) デ−タ処理装置における状態情報の退避方法
JPS6368951A (ja) チヤネルエラ−ロギング方式
JPS6230464B2 (ja)
JPS62120548A (ja) 情報処理システムの試験方式
JPS5822469A (ja) 中央監視制御装置
JPS622335B2 (ja)
JPH0149975B2 (ja)
JPH02212946A (ja) 情報処理装置の障害通知方式
JPS5927355A (ja) 情報処理システム
JPS62298841A (ja) フア−ムウエア・デバツグ方式