JPH10143393A - 診断処理装置 - Google Patents

診断処理装置

Info

Publication number
JPH10143393A
JPH10143393A JP8318718A JP31871896A JPH10143393A JP H10143393 A JPH10143393 A JP H10143393A JP 8318718 A JP8318718 A JP 8318718A JP 31871896 A JP31871896 A JP 31871896A JP H10143393 A JPH10143393 A JP H10143393A
Authority
JP
Japan
Prior art keywords
diagnostic
stall
stall monitoring
slave
processing device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8318718A
Other languages
English (en)
Inventor
Kiwamu Sato
藤 究 佐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Engineering Ltd
Original Assignee
NEC Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Engineering Ltd filed Critical NEC Engineering Ltd
Priority to JP8318718A priority Critical patent/JPH10143393A/ja
Publication of JPH10143393A publication Critical patent/JPH10143393A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 【課題】従来のデュアル構成における、主系,従系それ
ぞれの系のOSストール監視タイマを接続し、OSの状
態を監視することにより、OSに影響を与えることなく
迅速にシステム運行の継続を可能にする。 【解決手段】オペレーティングシステム1と、主系と従
系との2つの診断装置2,3とを備え、従系診断装置3
に主系診断装置2の障害を通知する通信経路S1,S2
を設ける。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、診断処理装置に関
する。
【0002】
【従来の技術】大型汎用コンピュータの診断制御装置
は、システム障害情報の収集とシステム立ち上げ処理と
を主に行い、オペレーティング・システム(OS)のス
トール監視も本装置内に設けられたウォチドックタイマ
(以下WDTと略記す)により行う。このWDTは一定
時間ごとに送られてくるパルス信号でカウントダウンす
るダウンカウンタと、これにOSからの割り込み信号に
より任意の値を設定する装置とから成る。WDTに対し
て、OSは定期的に割り込み信号を入れるので、通常は
カウンタの値はゼロにならないが、OSが故障などによ
り割り込み信号を送ることが出来ないと、カウンタの値
がゼロになることで、OSのストールを検知する。ここ
で、ストールとはプログラムが何らかの原因で動けなく
なった状態をいい、OSはオペレーティング・システム
である。
【0003】通常、OSは、OSのストールを監視する
ために一定時間内にストールタイマの初期化命令を診断
処理装置に発行する。また、診断処理装置はそのリプラ
イをOSに返却する。デュアル構成におけるOSストー
ル監視は、主系となる診断処理装置のタイマを使用して
いる。その主系となる診断処理装置のストール監視タイ
マに障害が発生した場合、従系の診断処理装置が主系の
記憶装置内にある診断装置障害フラグをセットする。O
Sは主系の診断処理装置からのリプライがない場合、主
系の記憶装置のフラグを参照し、ストール監視タイマ障
害と判断し、従系の診断処理装置に初期化命令を発行す
る。このように、従来装置ではOSが診断処理装置の状
態監視と管理とを行う必要があった。
【0004】特開平7−219790号公報に開示され
ておおり、その構成が開示されている図3を参照する
と、この構成は、マルチプロセスで構成されたプログラ
ムにおける、各プロセスのストール状態の検出を可能に
する目的で、1個の親プロセス100とN個の子プロセ
ス200からなるマルチプロセスで構成された適用業務
を処理するプログラムで、親プロセス100内で動作し
N個の子プロセス200を監視するイベント監視手段1
02と、親プロセス100内で動作し、イベント監視手
段102を時間監視するタイマ監視手段101と、子プ
ロセス200内で動作し、親プロセス100からの監視
イベントBに対して応答イベントCを返すイベント応答
手段201−1を有する。
【0005】しかしながら、かかる構成においては、親
プロセスと複数の子プロセスとから成るマルチプロセス
を前提条件とし、親プロセスが子プロセスをそれぞれ監
視する方法であり、子プロセス同士の相互監視手段は一
切設けられていない。
【0006】また、特開平5−265807号公報に開
示されているシステムストール検出方式は、タスクとし
て実行されるプログラムを複数のグループに区分した各
グループ毎に設けられ、プログラムの実行開始もしくは
実行終了に際してストール監視要求を発するストール監
視要求手段と、複数のストール監視要求を受け付け、タ
イマ値の設定を行うと共に、タイムアウトした際にその
旨の通知を行うストール監視外部タイマと、ストール監
視外部タイマからタイムアウトした旨の通知を受け、自
系のコンピュータシステム及び他系のコンピュータシス
テムに外部割り込みによりシステムストール検出の旨を
通知するシステム割り込み通知手段とを備える。
【0007】しかしながら、かかる構成においては、シ
ステムストールの対象となる複数のプログラムのタスク
を問題としており、グループ毎に設けられたプログラム
同士の情報の交換はない。また、システム割り込み通知
手段が故障すれば、システムストールの検出の旨を通知
できないという難点がある。
【0008】
【発明が解決しようとする課題】そこで本発明の目的
は、従来のデュアル構成における、主系,従系それぞれ
の系のOSストール監視タイマを接続し、OSの状態を
監視することにより、OSに影響を与えることなく迅速
にシステム運行の継続を可能にする診断処理装置を提供
することにある。
【0009】また本発明の他の目的は、ストール監視外
部タイマが故障した場合でもシステムのストール監視が
続行できるようにした診断処理装置を提供することにあ
る。
【0010】
【課題を解決するための手段】前述の課題を解決するた
め、本発明による診断処理装置は、オペレーティングシ
ステムと、主系と従系との2つの診断装置とを備えた診
断処理装置において、前記従系診断装置に前記主系診断
装置の障害を通知する第1の通信経路を設けて構成され
る。
【0011】ここで、前記主系診断装置の障害を検知し
た前記従系診断装置は、自らのストール監視タイマを起
動させ、システムのストール監視を続行させ、また、前
記主系診断装置に、前記従系診断装置の障害を通知する
第2の通信経路を備えることができる。
【0012】
【発明の実施の形態】本発明の診断処理装置の実施形態
の構成が図1のブロック図に、その動作が図2のタイミ
ング図にそれぞれ示されている。図1及び図2におい
て、本発明の実施形態は、OS1、主系診断装置2、従
系診断装置3及びクロック装置4を備えて構成される。
OS1は、システム割り込み検出手段11とストール監
視要求手段12とを含み、クロック装置4との間に、主
系と従系の2つの診断処理装置2,3が介在する。主系
の診断処理装置2は、従系の診断処理3からの出力信号
と、系識別手段21の出力信号とを入力とする第1のO
Rゲート22と、この第1のORゲート22の出力信号
を入力とする系識別フリップフロップ23と、このフリ
ップフロップ23の出力信号とOS1のストール監視要
求手段12からの出力信号とが入力される第2のAND
ゲート24と、クロック装置4からのクロック信号と、
フリップフロップ23の出力信号とを入力する第3のA
NDゲート25と、OS1のストール監視要求手段12
からの出力信号、第2のANDゲート24の出力信号、
第3のANDゲート25の出力信号及び主系診断装置障
害検出手段27からの検出信号を入力する主系のストー
ル監視タイマ26とを備える。
【0013】従系診断処理装置3は、上述した主系のも
のと共通する機能を備える。即ち、系識別手段31,第
1のORゲート32,系識別フリップフロップ33,第
2のANDゲート34,第3のANDゲート35,従系
のストール監視タイマ36及び従系診断装置障害検出手
段37とを備える。さらに、主系と従系の診断処理装置
2と3のストール監視タイマ26と36の出力信号同士
を入力とするORゲート5を備える。ここで、通信経路
S1,S2が、主系と従系との間を往復している。
【0014】このように、本実施形態は、主系と従系の
2つの系を持つ情報処理装置において、両系の診断処理
装置2,3が通信経路S1,S2により結ばれている。
この実施形態では、主系の診断処理装置2と従系の診断
処理装置3とは、同一ロジック回路で構成されており、
設置されたそれぞれの系に内蔵された系識別手段21,
31により判別し、主系診断装置2ならば、その出力は
“1”で、従系診断装置3ならば、“0”を出力するの
で、それによりそれぞれの診断処理装置は、主系,従系
の診断処理装置2,3として動作するようにしている。
【0015】OS1が管理するストール監視手段12
は、主系のシステムストール監視タイマ26と従系のシ
ステムストール監視タイマ36とに、カウント初期値を
設定する。両系のシステムストール監視タイマ26及び
36は、クロック装置4から送出される1秒周期のパル
ス信号により、カウントダウンを行う。しかし、従系の
システムストール監視タイマ36への1秒クロック信号
とOS1のストール監視手段12からのリセット信号と
が入力されるが、系識別手段31により系識別フリップ
フロップ33に“ゼロ”が設定され、その出力との上記
各信号との論理積を取られ、システムストール監視タイ
マ36への入力は抑止される。このため、従系のシステ
ムストール監視タイマ36は通常は動作せず、反対に主
系の系識別フリップフロップ23には、“1”が設定さ
れるので、システムストール監視タイマ26は、上記各
信号が入力され1秒クロックのタイミングでカウントダ
ウンを行う。両系のどちらかのシステムストール監視タ
イマ26,36のカウント値がゼロになると、OS1内
のシステム割り込み検出手段11にシステムストールが
発生したことを通知する。
【0016】次に図1の回路の動作について、図2のタ
イムチャートを参照して説明する。図2において、通
常、システムのストール監視は、上記のように主系の方
で行われる。しかし、時刻T1のタイミングにおいて、
主系診断装置上でハードウウェア故障やデータ欠け等の
診断装置の障害が発生した場合、診断装置障害検出手段
37の出力信号が“0”から“1”となり、その出力信
号は従系診断装置の系識別フリップフロップ33に
“1”を設定する。これにより、今まで系識別フリップ
フロップ33の出力との論理積をとっているために、従
系のストール監視タイマ36への入力が妨げられていた
ストール監視要求手段12からのリセット信号とクロッ
ク装置4から送られる1秒クロック信号とが供給され、
従系のストール監視タイマ36が活動する。一方、リセ
ット信号T0に遅れる時刻T1の時点で診断装置障害検
出手段37の出力信号は、主系のストール監視タイマ2
6に診断装置障害発生を通知し、その通知を受けた主系
のストール監視タイマ1Aは、カウント値をホールド
し、時刻T1以降はタイマ1Aに1秒クロック信号が入
力されていても“ゼロ”にならない。
【0017】以上のように、本発明の実施形態によれ
ば、主系と従系との2つの診断装置で構成されているシ
ステムにおいては、主系診断装置で障害が起こった場
合、従系のストール監視タイマにシステムストール監視
を引き継がせるために、主系と従系との診断処理装置間
に信号線、即ち通信経路を設けて、従系診断装置に主系
診断装置の障害が起こったことを知らせる。主系診断装
置の障害を検知した従系診断装置は、自分のストール監
視タイマを起動させ、システムのストール監視を続行す
る。
【0018】上述本発明の実施形態では、主系と従系と
もそれぞれANDゲート,ORゲートを用いているが、
これに限定されるものではなく、NANDゲート,NO
Rゲートを用いてもよい。この場合は、適切にインバー
タが使用されていることがある。
【0019】本発明によれば、従来装置では診断処理装
置が障害に陥ったとき、一定時間OSのストール監視が
中断されるので、この間にOSがストールすると診断処
理装置の切り替えもできなくなり、システムの自動再立
ち上げも出来なくなる危険を回避することができる。
【0020】
【発明の効果】以上説明したように、本発明の診断処理
装置によれば、主系,従系の2つの診断処理装置で構成
されているシステムにおいて、これら診断装置上に設け
られたOSストール監視タイマの機能を主系の診断処理
装置が故障した場合にも続行できるように、従系の診断
処理装置との間に通信経路を設け、主系の診断処理装置
が障害を起こしたときには、その障害の通知を従系の診
断処理装置に通知し、OSストール監視の続行を可能に
することが出来る。
【図面の簡単な説明】
【図1】本発明による診断処理装置の実施形態を示す構
成ブロック図である。
【図2】本発明の実施形態の動作を示すタイミングであ
る。
【図3】従来のマルチプロセス制御方式を示すブロック
図である。
【符号の説明】
1 OS 2 主系診断処理装置 3 従系診断処理装置 4 クロック装置 5,22,32 ORゲート 11 システム割り込み手段 12 ストール監視要求手段 21,31 系識別手段 23,33 系識別フリップフロップ 24,25,34,35 ANDゲート 26,36 ストール監視タイマ 27,37 障害検出手段

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】オペレーティングシステムと、主系と従系
    との2つの診断装置とを備えた診断処理装置において、
    前記従系診断装置に前記主系診断装置の障害を通知する
    第1の通信経路を設けたことを特徴とする診断処理装
    置。
  2. 【請求項2】前記主系診断装置の障害を検知した前記従
    系診断装置は、自らのストール監視タイマを起動させ、
    システムのストール監視を続行する請求項1に記載の診
    断処理装置。
  3. 【請求項3】前記主系診断装置に、前記従系診断装置の
    障害を通知する第2の通信経路も備える請求項1に記載
    の診断処理装置。
JP8318718A 1996-11-13 1996-11-13 診断処理装置 Pending JPH10143393A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8318718A JPH10143393A (ja) 1996-11-13 1996-11-13 診断処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8318718A JPH10143393A (ja) 1996-11-13 1996-11-13 診断処理装置

Publications (1)

Publication Number Publication Date
JPH10143393A true JPH10143393A (ja) 1998-05-29

Family

ID=18102201

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8318718A Pending JPH10143393A (ja) 1996-11-13 1996-11-13 診断処理装置

Country Status (1)

Country Link
JP (1) JPH10143393A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010186313A (ja) * 2009-02-12 2010-08-26 Mitsubishi Electric Corp 構成制御システム
JP2012014549A (ja) * 2010-07-02 2012-01-19 Nec Corp 二重化システム、そのデータ処理方法およびデータ処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010186313A (ja) * 2009-02-12 2010-08-26 Mitsubishi Electric Corp 構成制御システム
JP2012014549A (ja) * 2010-07-02 2012-01-19 Nec Corp 二重化システム、そのデータ処理方法およびデータ処理装置

Similar Documents

Publication Publication Date Title
US5491787A (en) Fault tolerant digital computer system having two processors which periodically alternate as master and slave
EP2518627B1 (en) Partial fault processing method in computer system
JPH01258057A (ja) 複数のプロセッサを同期する装置
US7089413B2 (en) Dynamic computer system reset architecture
EP1675006A2 (en) Fault tolerant computer system and interrupt control method for the same
JP3329986B2 (ja) マルチプロセッサシステム
US6321289B1 (en) Apparatus for automatically notifying operating system level applications of the occurrence of system management events
US6463492B1 (en) Technique to automatically notify an operating system level application of a system management event
JPH10143393A (ja) 診断処理装置
US7243257B2 (en) Computer system for preventing inter-node fault propagation
JPH0944376A (ja) プロセス状態管理方式
JP2998804B2 (ja) マルチマイクロプロセッサシステム
JP2937857B2 (ja) 共通記憶装置のロックフラグ解除方式および方法
JPH064301A (ja) 時分割割込制御方式
JPH0652130A (ja) マルチプロセッサシステム
JPH11175108A (ja) 二重化コンピュータ装置
JP2002318643A (ja) 情報処理装置
JPH1027110A (ja) 複数台のコンピュータによるコンピュータシステム
JP2744113B2 (ja) 計算機システム
JP2588290B2 (ja) データ入出力システム
JP2834062B2 (ja) 情報処理システム
JPH05233576A (ja) 二重システム
JPH0822441A (ja) 情報処理装置およびその通信エラー検出方法
JPS62106564A (ja) 情報処理システムの現用/予備切り替え制御方式
JPH0748198B2 (ja) マルチプロセッサシステム