JPH10143393A

JPH10143393A - 診断処理装置

Info

Publication number: JPH10143393A
Application number: JP8318718A
Authority: JP
Inventors: Kiwamu Sato; 藤究佐
Original assignee: NEC Engineering Ltd
Current assignee: NEC Engineering Ltd
Priority date: 1996-11-13
Filing date: 1996-11-13
Publication date: 1998-05-29

Abstract

(57)【要約】【課題】従来のデュアル構成における、主系，従系それ
ぞれの系のＯＳストール監視タイマを接続し、ＯＳの状
態を監視することにより、ＯＳに影響を与えることなく
迅速にシステム運行の継続を可能にする。【解決手段】オペレーティングシステム１と、主系と従
系との２つの診断装置２，３とを備え、従系診断装置３
に主系診断装置２の障害を通知する通信経路Ｓ１，Ｓ２
を設ける。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、診断処理装置に関
する。

【０００２】

【従来の技術】大型汎用コンピュータの診断制御装置
は、システム障害情報の収集とシステム立ち上げ処理と
を主に行い、オペレーティング・システム（ＯＳ）のス
トール監視も本装置内に設けられたウォチドックタイマ
（以下ＷＤＴと略記す）により行う。このＷＤＴは一定
時間ごとに送られてくるパルス信号でカウントダウンす
るダウンカウンタと、これにＯＳからの割り込み信号に
より任意の値を設定する装置とから成る。ＷＤＴに対し
て、ＯＳは定期的に割り込み信号を入れるので、通常は
カウンタの値はゼロにならないが、ＯＳが故障などによ
り割り込み信号を送ることが出来ないと、カウンタの値
がゼロになることで、ＯＳのストールを検知する。ここ
で、ストールとはプログラムが何らかの原因で動けなく
なった状態をいい、ＯＳはオペレーティング・システム
である。

【０００３】通常、ＯＳは、ＯＳのストールを監視する
ために一定時間内にストールタイマの初期化命令を診断
処理装置に発行する。また、診断処理装置はそのリプラ
イをＯＳに返却する。デュアル構成におけるＯＳストー
ル監視は、主系となる診断処理装置のタイマを使用して
いる。その主系となる診断処理装置のストール監視タイ
マに障害が発生した場合、従系の診断処理装置が主系の
記憶装置内にある診断装置障害フラグをセットする。Ｏ
Ｓは主系の診断処理装置からのリプライがない場合、主
系の記憶装置のフラグを参照し、ストール監視タイマ障
害と判断し、従系の診断処理装置に初期化命令を発行す
る。このように、従来装置ではＯＳが診断処理装置の状
態監視と管理とを行う必要があった。

【０００４】特開平７−２１９７９０号公報に開示され
ておおり、その構成が開示されている図３を参照する
と、この構成は、マルチプロセスで構成されたプログラ
ムにおける、各プロセスのストール状態の検出を可能に
する目的で、１個の親プロセス１００とＮ個の子プロセ
ス２００からなるマルチプロセスで構成された適用業務
を処理するプログラムで、親プロセス１００内で動作し
Ｎ個の子プロセス２００を監視するイベント監視手段１
０２と、親プロセス１００内で動作し、イベント監視手
段１０２を時間監視するタイマ監視手段１０１と、子プ
ロセス２００内で動作し、親プロセス１００からの監視
イベントＢに対して応答イベントＣを返すイベント応答
手段２０１−１を有する。

【０００５】しかしながら、かかる構成においては、親
プロセスと複数の子プロセスとから成るマルチプロセス
を前提条件とし、親プロセスが子プロセスをそれぞれ監
視する方法であり、子プロセス同士の相互監視手段は一
切設けられていない。

【０００６】また、特開平５−２６５８０７号公報に開
示されているシステムストール検出方式は、タスクとし
て実行されるプログラムを複数のグループに区分した各
グループ毎に設けられ、プログラムの実行開始もしくは
実行終了に際してストール監視要求を発するストール監
視要求手段と、複数のストール監視要求を受け付け、タ
イマ値の設定を行うと共に、タイムアウトした際にその
旨の通知を行うストール監視外部タイマと、ストール監
視外部タイマからタイムアウトした旨の通知を受け、自
系のコンピュータシステム及び他系のコンピュータシス
テムに外部割り込みによりシステムストール検出の旨を
通知するシステム割り込み通知手段とを備える。

【０００７】しかしながら、かかる構成においては、シ
ステムストールの対象となる複数のプログラムのタスク
を問題としており、グループ毎に設けられたプログラム
同士の情報の交換はない。また、システム割り込み通知
手段が故障すれば、システムストールの検出の旨を通知
できないという難点がある。

【０００８】

【発明が解決しようとする課題】そこで本発明の目的
は、従来のデュアル構成における、主系，従系それぞれ
の系のＯＳストール監視タイマを接続し、ＯＳの状態を
監視することにより、ＯＳに影響を与えることなく迅速
にシステム運行の継続を可能にする診断処理装置を提供
することにある。

【０００９】また本発明の他の目的は、ストール監視外
部タイマが故障した場合でもシステムのストール監視が
続行できるようにした診断処理装置を提供することにあ
る。

【００１０】

【課題を解決するための手段】前述の課題を解決するた
め、本発明による診断処理装置は、オペレーティングシ
ステムと、主系と従系との２つの診断装置とを備えた診
断処理装置において、前記従系診断装置に前記主系診断
装置の障害を通知する第１の通信経路を設けて構成され
る。

【００１１】ここで、前記主系診断装置の障害を検知し
た前記従系診断装置は、自らのストール監視タイマを起
動させ、システムのストール監視を続行させ、また、前
記主系診断装置に、前記従系診断装置の障害を通知する
第２の通信経路を備えることができる。

【００１２】

【発明の実施の形態】本発明の診断処理装置の実施形態
の構成が図１のブロック図に、その動作が図２のタイミ
ング図にそれぞれ示されている。図１及び図２におい
て、本発明の実施形態は、ＯＳ１、主系診断装置２、従
系診断装置３及びクロック装置４を備えて構成される。
ＯＳ１は、システム割り込み検出手段１１とストール監
視要求手段１２とを含み、クロック装置４との間に、主
系と従系の２つの診断処理装置２，３が介在する。主系
の診断処理装置２は、従系の診断処理３からの出力信号
と、系識別手段２１の出力信号とを入力とする第１のＯ
Ｒゲート２２と、この第１のＯＲゲート２２の出力信号
を入力とする系識別フリップフロップ２３と、このフリ
ップフロップ２３の出力信号とＯＳ１のストール監視要
求手段１２からの出力信号とが入力される第２のＡＮＤ
ゲート２４と、クロック装置４からのクロック信号と、
フリップフロップ２３の出力信号とを入力する第３のＡ
ＮＤゲート２５と、ＯＳ１のストール監視要求手段１２
からの出力信号、第２のＡＮＤゲート２４の出力信号、
第３のＡＮＤゲート２５の出力信号及び主系診断装置障
害検出手段２７からの検出信号を入力する主系のストー
ル監視タイマ２６とを備える。

【００１３】従系診断処理装置３は、上述した主系のも
のと共通する機能を備える。即ち、系識別手段３１，第
１のＯＲゲート３２，系識別フリップフロップ３３，第
２のＡＮＤゲート３４，第３のＡＮＤゲート３５，従系
のストール監視タイマ３６及び従系診断装置障害検出手
段３７とを備える。さらに、主系と従系の診断処理装置
２と３のストール監視タイマ２６と３６の出力信号同士
を入力とするＯＲゲート５を備える。ここで、通信経路
Ｓ１，Ｓ２が、主系と従系との間を往復している。

【００１４】このように、本実施形態は、主系と従系の
２つの系を持つ情報処理装置において、両系の診断処理
装置２，３が通信経路Ｓ１，Ｓ２により結ばれている。
この実施形態では、主系の診断処理装置２と従系の診断
処理装置３とは、同一ロジック回路で構成されており、
設置されたそれぞれの系に内蔵された系識別手段２１，
３１により判別し、主系診断装置２ならば、その出力は
“１”で、従系診断装置３ならば、“０”を出力するの
で、それによりそれぞれの診断処理装置は、主系，従系
の診断処理装置２，３として動作するようにしている。

【００１５】ＯＳ１が管理するストール監視手段１２
は、主系のシステムストール監視タイマ２６と従系のシ
ステムストール監視タイマ３６とに、カウント初期値を
設定する。両系のシステムストール監視タイマ２６及び
３６は、クロック装置４から送出される１秒周期のパル
ス信号により、カウントダウンを行う。しかし、従系の
システムストール監視タイマ３６への１秒クロック信号
とＯＳ１のストール監視手段１２からのリセット信号と
が入力されるが、系識別手段３１により系識別フリップ
フロップ３３に“ゼロ”が設定され、その出力との上記
各信号との論理積を取られ、システムストール監視タイ
マ３６への入力は抑止される。このため、従系のシステ
ムストール監視タイマ３６は通常は動作せず、反対に主
系の系識別フリップフロップ２３には、“１”が設定さ
れるので、システムストール監視タイマ２６は、上記各
信号が入力され１秒クロックのタイミングでカウントダ
ウンを行う。両系のどちらかのシステムストール監視タ
イマ２６，３６のカウント値がゼロになると、ＯＳ１内
のシステム割り込み検出手段１１にシステムストールが
発生したことを通知する。

【００１６】次に図１の回路の動作について、図２のタ
イムチャートを参照して説明する。図２において、通
常、システムのストール監視は、上記のように主系の方
で行われる。しかし、時刻Ｔ１のタイミングにおいて、
主系診断装置上でハードウウェア故障やデータ欠け等の
診断装置の障害が発生した場合、診断装置障害検出手段
３７の出力信号が“０”から“１”となり、その出力信
号は従系診断装置の系識別フリップフロップ３３に
“１”を設定する。これにより、今まで系識別フリップ
フロップ３３の出力との論理積をとっているために、従
系のストール監視タイマ３６への入力が妨げられていた
ストール監視要求手段１２からのリセット信号とクロッ
ク装置４から送られる１秒クロック信号とが供給され、
従系のストール監視タイマ３６が活動する。一方、リセ
ット信号Ｔ０に遅れる時刻Ｔ１の時点で診断装置障害検
出手段３７の出力信号は、主系のストール監視タイマ２
６に診断装置障害発生を通知し、その通知を受けた主系
のストール監視タイマ１Ａは、カウント値をホールド
し、時刻Ｔ１以降はタイマ１Ａに１秒クロック信号が入
力されていても“ゼロ”にならない。

【００１７】以上のように、本発明の実施形態によれ
ば、主系と従系との２つの診断装置で構成されているシ
ステムにおいては、主系診断装置で障害が起こった場
合、従系のストール監視タイマにシステムストール監視
を引き継がせるために、主系と従系との診断処理装置間
に信号線、即ち通信経路を設けて、従系診断装置に主系
診断装置の障害が起こったことを知らせる。主系診断装
置の障害を検知した従系診断装置は、自分のストール監
視タイマを起動させ、システムのストール監視を続行す
る。

【００１８】上述本発明の実施形態では、主系と従系と
もそれぞれＡＮＤゲート，ＯＲゲートを用いているが、
これに限定されるものではなく、ＮＡＮＤゲート，ＮＯ
Ｒゲートを用いてもよい。この場合は、適切にインバー
タが使用されていることがある。

【００１９】本発明によれば、従来装置では診断処理装
置が障害に陥ったとき、一定時間ＯＳのストール監視が
中断されるので、この間にＯＳがストールすると診断処
理装置の切り替えもできなくなり、システムの自動再立
ち上げも出来なくなる危険を回避することができる。

【００２０】

【発明の効果】以上説明したように、本発明の診断処理
装置によれば、主系，従系の２つの診断処理装置で構成
されているシステムにおいて、これら診断装置上に設け
られたＯＳストール監視タイマの機能を主系の診断処理
装置が故障した場合にも続行できるように、従系の診断
処理装置との間に通信経路を設け、主系の診断処理装置
が障害を起こしたときには、その障害の通知を従系の診
断処理装置に通知し、ＯＳストール監視の続行を可能に
することが出来る。

【図面の簡単な説明】

【図１】本発明による診断処理装置の実施形態を示す構
成ブロック図である。

【図２】本発明の実施形態の動作を示すタイミングであ
る。

【図３】従来のマルチプロセス制御方式を示すブロック
図である。

【符号の説明】

１ＯＳ２主系診断処理装置３従系診断処理装置４クロック装置５，２２，３２ＯＲゲート１１システム割り込み手段１２ストール監視要求手段２１，３１系識別手段２３，３３系識別フリップフロップ２４，２５，３４，３５ＡＮＤゲート２６，３６ストール監視タイマ２７，３７障害検出手段

Claims

【特許請求の範囲】

【請求項１】オペレーティングシステムと、主系と従系
との２つの診断装置とを備えた診断処理装置において、
前記従系診断装置に前記主系診断装置の障害を通知する
第１の通信経路を設けたことを特徴とする診断処理装
置。
【請求項２】前記主系診断装置の障害を検知した前記従
系診断装置は、自らのストール監視タイマを起動させ、
システムのストール監視を続行する請求項１に記載の診
断処理装置。
【請求項３】前記主系診断装置に、前記従系診断装置の
障害を通知する第２の通信経路も備える請求項１に記載
の診断処理装置。