JPH0477139A - 障害被疑装置の制御方法 - Google Patents

障害被疑装置の制御方法

Info

Publication number
JPH0477139A
JPH0477139A JP2188365A JP18836590A JPH0477139A JP H0477139 A JPH0477139 A JP H0477139A JP 2188365 A JP2188365 A JP 2188365A JP 18836590 A JP18836590 A JP 18836590A JP H0477139 A JPH0477139 A JP H0477139A
Authority
JP
Japan
Prior art keywords
state
failure
standby
fault
disconnected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2188365A
Other languages
English (en)
Other versions
JP2555214B2 (ja
Inventor
Yasuo Ogasawara
康夫 小笠原
Akiyoshi Taguchi
明美 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2188365A priority Critical patent/JP2555214B2/ja
Publication of JPH0477139A publication Critical patent/JPH0477139A/ja
Application granted granted Critical
Publication of JP2555214B2 publication Critical patent/JP2555214B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Detection And Prevention Of Errors In Transmission (AREA)
  • Hardware Redundancy (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [概要] メモリ、中央処理装置、スイッチ部等の各装置がそれぞ
れ二重化された通信処理システムにおける障害被疑装置
の制御方式に関し。
システム中の二重化した装置について救済可能な障害に
対して装置を切離しすることなく、またダブル障害(運
用中と待機中の両装置の障害)の発生を防止できる障害
被疑装置の制御方式を提供することを目的とし。
運用中の装置に障害が検出されると不安定な待機中の状
態に移行し、待機中の状態では、動作状態に関する情報
を求めて該情報が予め決められた正常性を表す規定条件
を外れると該装置をシステムから切離して障害中の状態
に設定し、該規定条件の範囲内であると運用中の状態へ
移行するよう構成する。
[産業上の利用分野] 本発明はメモリ、中央処理装置、スイッチ部等の各装置
がそれぞれ二重化された通信処理システムにおける障害
被疑装置の制御方式に関する。
ディジタル交換機等の通信処理システムは、常時稼働す
ることが要求されているため、主要な装置は全て二重化
されて、一方が運用中の状態に、他方が待機中の状態に
おかれ、運用中の装置に障害が発生した場合、再試行を
実行してそれでも障害が発生すると直ちに運用中の装置
を障害状態としてシステムから切り離し、待機中の装置
を運用状態に切り換えることにより運用に支障をきたさ
ないようになっている。
[従来の技術] 第4図は通信処理システムの構成図、第5図1!切来例
の処理フロー図、第6図は従来例による状態遷移の関係
説明図である。
第4図の通信処理システムは、具体的にはディジタル交
換機として構成される。
第4図において、CCは中央制御装置(Central
 Controller) 、 CHCはチャネル制御
装置(Channel Signaling Equi
pment)、  CS Eは共iIl線信号装置(C
on+son Channel Signaling 
Equipment)、 C3EIは共通線信号装置イ
ンタフェース(C3EInterface) 、  D
 S Mはディジタルスイッチモジュール(Digit
al 5w1tch Module)、 D Tはディ
ジタル端末(Digital Tera+1nal)、
 L Cは集線装置(LineConcen tra 
tor) 、 M Mは主記憶装置(Main Mem
ory)、R2Oはリモートスイッチユニット(Rem
oteS@itching Unit)、  STPは
信号中継点(Signaling Transfer 
Po1nt)を表し1図示されないが他に共通線信号装
置C3Eが接続されたバスにファイル記憶装置や保守者
用のコンソール装置等が設けられる。
第4図のシステムでは、中央制御装置CC2主記憶装置
MM、チャネル制御装置CHC,ディジタルスイッチモ
ジュールDSMや、複数の共通線信号装置C3E等はそ
れぞれ二重化されており一方が0系で、他方を1系とし
てそれぞれ番号を付して表示する。
システムが動作している時は、それぞれ一方の装置が運
用中(アクl−: ACT)の状態で動作し他方が待機
中(スタンバイ:5BY)の状態に置かれて動作する場
合1両状態の装置は共にシステムに接続した状態である
のでI N S (In 5ervice)状態にある
という、また、二重化装置が同時に運用中の状態で動作
する場合があり、この時−方の装置が、主(マスク)で
他方が従(スレーブ)として機能し、誤りの際には直ち
に一方から他方へ切り換えることができる。
システムに接続された装置に障害が発生した時その装置
をシステム(中央制御装置やバス)から切り離した状態
をOU S (Out Of System)状態にな
るという。
中央制御装置CCは1通話路を構成するディジタルスイ
ッチメモリDSMの制御を行うと共に。
チャネル制御装置CHCを介して共通線信号装置CSE
等の入出力装置の制御を行う。共通線信号装置は公知の
ように共通線信号方式におけるレベル2(プロトコルの
レベル2)の機能を内蔵するファームウェアにより実行
する。
レベル3以上の機能は本体の主記憶装置MMに格納され
たオンラインソフトウェアが提供しており、共通線信号
装置C3Eはチャネル制御装置CHC,共通バスを経由
してダウンロードにより転送される。また2中央制御装
置CCは、共通線信号装置C3Eの動作を常に関しして
おり、障害が発生した場合、即座に待機系に切り換えて
安定したサービスを提供している。障害と判定された装
置は従来は即座にシステムから切り離されて3通常人手
を介せずにシステムに復帰させることができなかった。
二重化された各装置に対する従来の処理フロー図を第5
図に、従来例による状態遷移の関係説明図を第6図に示
す。
第5図の処理フローを以下に説明する。
運用中の装置に障害が発生すると、障害発止装置に対し
て主記憶装置のプログラムにより再試行が実行される(
第5図50.51)、この結果により固定障害か間歇障
害かを判断しく同52)。
正常であれば間歇障害として通常の処理を続行しく同5
3)、繰り返した再試行により障害が発生すると固定障
害として、障害装置を運用中の状態から切離しく同54
)、更にOUSの状態で診断処理の起動を行う(同55
)、この診断では障害の状況に応じて装置試験が必要か
否かを判断して(人手による)、不要なら障害時に得ら
れたデータの解析処理の起動(同60)を行い、必要と
判断されると、装置試験を実施する(同57)。
続いて当該試験で障害を検出したか否かを判断し、未検
出なら装置を待機中に移行しく同59)。
検出の場合、その障害解析処理を起動しく同60)、障
害個所の表示(同61)を行って、処理終了(該装置障
害中として)する(同62)、この状態では装置が切離
された状態であるから、保守者の介入によりコマンドを
投入して装置を再度システムに接続する必要がある(同
63)。
第6図において、未実装の状態から工事中の状態になり
(■)、装置の実装が行われ試験を行った後運用に移行
しく■)、その状態で障害になると■により待機中の状
態か、■によりφ障害中の状態へ移行しく第9図の54
に対応)、待機中の診断処理により障害と判断されると
■を経て障害中の状態になる。また、障害中の状態で試
験で障害が発生しないと、保守者がコマンドを投入する
ことにより待機中に移行(■)する、さらに別のコマン
ドを投入することにより待機中(@)へ移行できる。
また、障害中でも必要ならコマンドを投入して運用中の
状態へ移行(■)することもできる。そして待機中から
各種のコマンドの投入(■または■)により運用中に移
行でき、待機中から障害中に移行(■)する場合がある
このように運用中と待機中及び障害中の各状態の間の移
行は必要に応じて任意に実行することができる。
[発明が解決しようとする課題] 上記した従来例の方式によれば、固定障害と診断されシ
ステムから切離されて診断処理が実行されて、固定障害
であると判定されると装置はシステムから切離されたま
まとなって人手の介入なしにシステムに復帰することが
できない。
ところが、固定障害と決定された装置でも部分的な機能
障害や、電源の瞬断などによる間歇障害またはファーム
ウェアのバグ等の障害の場合、所定の回復処理を施すこ
とにより動作できる場合がある。特にその装置が本体ソ
フトウェア(中央制御装置が主記憶装置から供給するプ
ログラム)からのダウン・ローディングにより機能が提
供されている装置等では間歇障害によるプログラム暴走
の可能性が高い。
このように従来の方式では殆ど動作できるかも知れない
装置を障害としてシステムから切離してしまうという問
題があった。
本発明はシステム中の二重化した装置における救済可能
な障害に対して装置を切離しすることなく、またダブル
障害(運用中と待機中の両装置の障害)の発生を防止で
きる障害被疑装置の制御方式を提供することを目的とす
る。
[課題を解決するための手段] 第1図は本発明の原理説明図である。
この図には、二重化された通信処理システムの従装置の
運用状態の遷移が示されている。
第1図において、10は装置が運用中の状態11は装置
が待機中の状態、111は規定条件判定手段、12は装
置が障害中の状態、121は障害中の規定条件判定手段
を表す。
本発明は、運用中の状態から単純に障害中の状態に遷移
させずに、−旦不安定な待機(SBY)状態に移行し、
待機状態において障害中への移行または運用中への移行
について予め定めた条件をを設けてその条件を満たすと
それぞれの状態に移行可能にするものである。
[作用] 通信処理システムの二重化された装置(中央制御装置、
メモリ、ディジタルスイッチメモリ、共通線信号装置等
)に対する本発明による制御の原理を第1図を参照しな
がら説明する。
運用中の状態10にある装置(従装置)で障害が検出さ
れると、該装置を待機中の状態IIに遷移する。この待
機中の状態11では、規定条件判定手段111によりリ
トライ動作の結果や以前の障害内容の分析等が行われて
動作状態に関する情報(パラメータ)をチエツクし、予
め設定された正常性を表す規定条件を満たすか否かを判
断する。
規定条件を外れている場合は待機中から障害中の状態へ
移行し、該規定条件の範囲内であると一定の時間内に何
も起きない場合運用中の状態10へ移行する(アクトタ
イミングという)。
障害中の状態12の状態に移行すると、ここでも規定条
件判定手段121により動作状態に関する情報をチエツ
クして、設定された条件を満たすか否かを判定する。そ
れぞれの規定条件を満足する場合は、障害中の状態12
から待機中の状態11へ移行する。規定条件を外れたこ
とが判ると装置を切離して診断動作が行われ、その結果
良好な状態であることが判ると、従来と同様に保守者の
入力操作により待機中の状jL!il 1.または運用
中の状[10に戻ることができる。
[実施例] 第2図は実施例の処理フロー図、第3図は本発明による
状態遷移の関係説明図である。
本発明は具体的には第4図に示す通信処理システムに実
施することができ、二重化された各装置はそれぞれ上位
の装置からの制御により状態管理が実行される。例えば
、スレーブの入出力装置(第4図の共通線信号装置C3
E)は、上位のスレーブの中央制御装置CCにより状態
遷移の管理が行われる。
第2図の処理フローを説明する。
最初に運用中の装置に障害が発生すると、この状態のま
ま同し動作を上位の装置から再試行が実行される(第2
図20.21)。次に再試行の結果を見て、再試行で障
害が発生しない場合2間歇障害(例えは、電源の瞬断に
より突発的に発生するような障害)としてそのまま通常
の処理を続行しく同23)、再試行でも障害が発生した
ら固定障害として当該装置を待機中に移行する(同24
)。
待機中では、装置制御パラメータのチエツクを行う。こ
の場合、装置制御パラメータとしては。
当該装置の障害情報のロギング情報を見て9時間に対す
る障害の発生頻度、障害の内容(ハードウェア障害、パ
リティ−エラー、ソフトウェアエラー等)、装置の性格
(重要性、使用頻度が低い等)等が用いられ、これらの
情報はデータベースとしてシステムが備えられ動作に応
じて変化する。
その中の1つまたは複数の項目をチエツク対象とし、各
チエツク対象に対し予め規定された条件を越える(障害
状態に移行すべき状況)か否がを判断し2条件を越える
と該装置を障害中に移行しく同27)、越えないと該装
置の状況を保持して装置を待機中に保持する(同26)
この待機中に保持された装置は、その後一定時間内に何
も生じないと運用中の状態に移行する。
これをアクトタイミングといい、この時は初期立ち上げ
と同様のレベル(従装置の内部ソフトウェアのダウンロ
ーディング、リセット、クリアスタート等の初期設定再
開)により実施される。
上記の装置制御パラメータの例としては1例えば障害の
発生頻度の規定条件として r1時間に5回」に設定さ
れている場合、当該装置に障害が1時間に5回以上発生
すると、この装置は障害中に移行される。
障害中(この時は切離しされてない)に移行すると、上
記ステップ25と異なる規定条件を用いて装置制御パラ
メータのチエツクを行い(同2728)、規定条件を満
たす場合、装置の待機中への移行要求が発生して装置は
待機中に移行する(同29)、規定条件を越えた場合は
装置切り離しの指示(保守者による切離しコマンドの投
入による)が実行される(同30)。
このステップ30から最後のステップ39までは、従来
例の処理フロー(第5図参照)のステップ54乃至ステ
ップ63と同じ内容であるので以下のフローの説明を省
略する。
次に本発明による状態遷移の関係を第3図を用いて説明
する。
未実装から、工事中の状態を経て、運用中の状態になっ
た時、障害が発生するとAで示す判断が行われる。これ
は第2図のステンプ22に相当しこの結果経路■により
待機中の状態になる。この状態ではBの判断(上記した
アクトタイミングが成立するか否かの判断)で■の経路
により運用中の状態に移行する場合と、Cの判断(第2
図の25)を行って■の経路により障害中の状態に移行
する場合がある。障害中の状態になると、Dの判断(第
2図28)を行って条件を満たすと■の経路で待機中に
移行する。
第3図の■は待機中の状態において、保守者により装置
を運用中の状態へ移行させるためのコマンド投入が行わ
れる場合を示す。同様に障害中の状態において、保守者
により装置を待機中の状態または運用中の状態へ移行さ
せるためのコマンド投入が行われる場合を示す。
第4図の通信処理システムの例により説明すると、中央
制御装置CCは共通線信号装置C3E等の入出力装置の
動作を監視して、従来は障害が発生すると待機系の装置
を運用系に切り換えて、障害を発生した装置はシステム
から切離していたが障害の発生原因としてファームウェ
アのバグやプロセンサの間歇障害等のソフト障害も含ま
れており、そのような障害発生の時直ちに障害状態にせ
ずに本発明により待機状態にして、続けて再度ローディ
ング、初期設定及び再起動により運用中にすれば救済す
ることができる。
すなわち、C3Hのような従装置に障害が発生した時に
自刃で再生するチャンスを与えてシステムの信幀性を高
めることができる。また、この共通線信号装置C3E等
の入出力装置の一部機能にバグがあり、そのために片方
をシステムから切離した場合、もう一方に同様の障害が
発生すると一重障害になってしまいシステムが停止し重
大な影響を与えてしまうが1本発明により一部のバグで
直ちにシステムから切離さないことによりこのような事
態を防止できる。
[発明の効果] 本発明によれば二重化装置における間歇障害により障害
状態へ移行することを防止し、各装置が備える全体の中
の影響が少ない一部の機能障害により直ちに障害状態及
びシステムからの切離し状態へ移行するのを防止するこ
とができる。またファームウェアのバグに対する救済を
実現できる。
さらに、二重障害に対するガードによるシステム信転性
の向上を実現することができる。
11:待機中の状態 111:規定条件判定手段 12:障害中の状態 121:規定条件判定手段

Claims (2)

    【特許請求の範囲】
  1. (1)メモリ、中央処理装置、スイッチ部等の各装置が
    それぞれ二重化された通信処理システムにおいて、 運用中の装置に障害が検出されると不安定な待機中の状
    態に移行し、 待機中の状態では、動作状態に関する情報を求めて該情
    報が予め決められた正常性を表す規定条件を外れると該
    装置をシステムから切離して障害中の状態に設定し、該
    規定条件の範囲内であると運用中の状態へ移行すること
    を特徴とする障害被疑装置の制御方式。
  2. (2)請求項1において、 障害中の状態の装置は診断により良好な結果が得られる
    と待機中の状態に戻るよう制御することを特徴とする障
    害被疑装置の制御方式。
JP2188365A 1990-07-17 1990-07-17 障害被疑装置の制御方法 Expired - Fee Related JP2555214B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2188365A JP2555214B2 (ja) 1990-07-17 1990-07-17 障害被疑装置の制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2188365A JP2555214B2 (ja) 1990-07-17 1990-07-17 障害被疑装置の制御方法

Publications (2)

Publication Number Publication Date
JPH0477139A true JPH0477139A (ja) 1992-03-11
JP2555214B2 JP2555214B2 (ja) 1996-11-20

Family

ID=16222346

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2188365A Expired - Fee Related JP2555214B2 (ja) 1990-07-17 1990-07-17 障害被疑装置の制御方法

Country Status (1)

Country Link
JP (1) JP2555214B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008527566A (ja) * 2005-01-12 2008-07-24 ハネウェル・インターナショナル・インコーポレーテッド 冗長管理交換オペレーションを制御する地上ベースのソフトウェアツール

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008527566A (ja) * 2005-01-12 2008-07-24 ハネウェル・インターナショナル・インコーポレーテッド 冗長管理交換オペレーションを制御する地上ベースのソフトウェアツール
JP4927759B2 (ja) * 2005-01-12 2012-05-09 ハネウェル・インターナショナル・インコーポレーテッド 冗長管理交換オペレーションを制御する地上ベースのソフトウェアツール

Also Published As

Publication number Publication date
JP2555214B2 (ja) 1996-11-20

Similar Documents

Publication Publication Date Title
JPH03131939A (ja) 高信頼性コンピュータ診断システム
US6192485B1 (en) Redundant apparatus
JP2001060160A (ja) 制御装置のcpu二重化システム
JPH0477139A (ja) 障害被疑装置の制御方法
JPS62236056A (ja) 情報処理システムの入出力制御装置
JPS6213700B2 (ja)
JPH04116473A (ja) 信号ケーブル接続状態監視機能付きの分散制御システム
JP3156987B2 (ja) バス故障診断方式
JPS60134942A (ja) 異常状態におけるバツクアツプシステム
JPH09162976A (ja) 分散処理システムのモジュール運転状態制御方法
JPH0436857A (ja) マルチプロセッサシステムにおけるバス診断方式
JP2626484B2 (ja) 系切り替え試験方法
JPH0294748A (ja) 自動診断方式
JPH0553938A (ja) 二重化構成の中央制御装置切替え方式
JPH10242889A (ja) 二重化装置の相互監視方法
JPS58214952A (ja) 情報処理方式
JPH0454747A (ja) データ転送システム
KR200270668Y1 (ko) 제어부의 상태를 반영하는 이중화 장치
JPS5927356A (ja) 2重化装置における障害切分方式
JPH04243341A (ja) ループ状データ伝送システムにおけるデータ伝送装置の診断方式
KR100257162B1 (ko) 이중화 시스템에서 상대 시스템의 감시방법 및 장치
JPH02278435A (ja) 二重化計算機システム
JPH01216438A (ja) 障害通知方式
JPS60105356A (ja) 予備装置の診断方式
JPS5850372B2 (ja) デ−タ集配信処理システム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080822

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees