JPH1074108A - 障害検出方式 - Google Patents

障害検出方式

Info

Publication number
JPH1074108A
JPH1074108A JP22990196A JP22990196A JPH1074108A JP H1074108 A JPH1074108 A JP H1074108A JP 22990196 A JP22990196 A JP 22990196A JP 22990196 A JP22990196 A JP 22990196A JP H1074108 A JPH1074108 A JP H1074108A
Authority
JP
Japan
Prior art keywords
failure
temporary
component
control unit
temporary failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP22990196A
Other languages
English (en)
Inventor
Isamu Yamane
勇 山根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP22990196A priority Critical patent/JPH1074108A/ja
Publication of JPH1074108A publication Critical patent/JPH1074108A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Testing And Monitoring For Control Systems (AREA)

Abstract

(57)【要約】 【課題】 従来は、被監視システムの管理者がしきい値
の設定を誤った場合等では、故障部品が潜在化し、シス
テムの運用、維持に支障を来す。また、障害検出後に修
理された部品による潜在化している不具合に迅速に対応
できない。 【解決手段】 被監視システム18A〜18Cは、部品
に自動復旧可能な一時的故障が発生した時にその部品の
一時的故障発生を示す一時故障情報を送信する機能と、
外部からの障害検出通知を受信したときは障害検出通知
された部品をシステムから切り離す機能を少なくとも有
する。監視システム11は、一時故障情報を分析する中
央制御部12と、一時故障情報を受信し、障害検出通知
を送信する通信制御部13と、中央制御部12からの分
析結果を故障履歴データベース15に蓄積制御する故障
情報蓄積部14と、中央制御部12からの表示情報が入
力される障害表示制御部16と、表示情報を表示する表
示装置17とからなる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は障害検出方式に係
り、特にシステムの一時故障発生時の障害検出方式に関
する。
【0002】
【従来の技術】システムの故障が発生しても、その故障
が再試行などにより自動的に復旧する一時的な故障であ
る場合は、その故障は表面上はなかったものとして正常
に処理されるため、不良部品が実装されていたり、調整
不十分なまま出荷されていたり、経年変化や運用環境変
化などにより品質の劣化が生じていても、劣化の進み具
合が分からず、障害の発生を事前に回避することができ
ず、システムの性能と信頼性が低下してしまう。
【0003】そこで、上記の一時故障が発生した時は再
試行回数あるいは故障発生回数を記憶しておき、その回
数がしきい値を越えたときに劣化状態を通知するように
した障害検出方式が従来より知られている(例えば、特
開平4−165538号公報:発明の名称「劣化状態検
出機能付き周辺記憶装置」)。
【0004】図3は上記と同様の障害検出をする従来の
障害検出方式の一例の構成図を示す。同図において、監
視システム1は中央制御部2、通信制御部3、障害表示
制御部4及び表示装置5から構成されており、被監視シ
ステム6A、6B及び6Cの障害を検出する。被監視シ
ステム6A、6B及び6Cはそれぞれ同様の構成で、中
央制御部7、状態情報記憶部8及び通信制御部9から構
成されている。
【0005】この従来方式では、監視システム1は被監
視システム6A、6B及び6Cからの一時故障情報を通
信制御部3を介して受信する。いま、被監視システム6
Aで故障検出後に自動的に復旧する一時的な故障が発生
したとすると、その故障情報は中央制御部7に転送され
る。中央制御部7は、入力された故障情報により故障部
位を認識し、状態情報記憶部8に記憶されている該当部
品のエラーカウンタ値を+1加算更新する。
【0006】そして、中央制御部7は、状態情報記憶部
8から加算後の該当部品のエラーカウンタ値を読み取
り、予め被監視システム6Aで設定されているしきい値
と比較する。比較結果がしきい値以下であれば処理は終
了するが、しきい値と同じあるいは越えている場合は一
時故障通知のあった部品を障害とみなし、その部品をシ
ステムから切り離す。更に、中央制御部7は、通信制御
部9を起動して監視システム1に対し障害の通知を行
う。
【0007】監視システム1は、被監視システム6A〜
6Cからの障害情報を通信制御部3で受信すると、中央
制御部2に転送する。中央制御部2は転送されてきた障
害情報から障害を発生した被監視システム6Aとその障
害内容を認識し、障害表示制御部4に表示情報を転送
し、表示装置5でその障害内容を表示させる。
【0008】
【発明が解決しようとする課題】しかるに、上記の従来
の障害検出方式では、被監視システム6A〜6C個々に
しきい値が設定され、そのしきい値に対して一時故障発
生回数を比較するものであるため、被監視システム6A
〜6Cの管理者がしきい値の設定を誤った場合、あるい
は故意または過失により不適正な値に設定した場合、故
障部品が潜在化することになり、システムの運用、維持
に支障を来すという問題がある。
【0009】また、一旦、障害検出された部品を修理
後、他の被監視システムに転用して潜在化している不具
合により故障が再発しても、またそのシステムで設定さ
れているしきい値に達するまでは一時故障を繰り返さな
ければ、障害検出されないという問題がある。
【0010】本発明は以上の点に鑑みなされたもので、
全被監視システムが共通の適正なしきい値により一時故
障部品の障害検出ができる障害検出方式を提供すること
を目的とする。
【0011】また、本発明の他の目的は、潜在化してい
る不具合に対して迅速に対応できる障害検出方式を提供
することにある。
【0012】
【課題を解決するための手段】本発明は上記の目的を達
成するため、部品に自動復旧可能な一時的故障が発生し
た時にその部品の一時的故障発生を示す一時故障情報を
送信する機能と、外部からの障害検出通知を受信したと
きは障害検出通知された部品をシステムから切り離す機
能を少なくとも有する一又は二以上の被監視システム
と、一時故障情報を受信し、障害検出通知を送信する通
信制御部と、通信制御部により受信された一時故障情報
に基づき一時故障を発生した部品の履歴を蓄積する履歴
蓄積手段と、履歴蓄積手段から得られた一時故障を発生
した部品の故障発生回数が予め定めたしきい値以上かど
うか判定し、しきい値以上であるときは部品の障害と判
断して障害検出通知を行う検出手段とを備えた監視シス
テムとを有することを特徴とする。
【0013】この発明では、被監視システムからの一時
故障情報を監視システムで分析して、部品単位で一時故
障発生回数を記憶し、その一時故障発生回数がしきい値
以上となったときに障害発生と検出するようにしている
ため、すべての被監視システムの各部品の一時故障発生
回数は共通のしきい値と比較されて障害発生かどうか監
視システムで判断される。
【0014】また、本発明における監視システムの履歴
蓄積手段は、一時故障を発生した部品が障害発生部品と
して検出手段により判定され、被監視システムで正常な
部品に交換された後もそのまま履歴を保存し、また検出
手段はその後に障害発生部品を修理した修理部品の一時
故障発生を示す一時故障情報を通信制御部を介して受信
したときは、履歴蓄積手段から一時故障を発生した修理
部品の修理前の累積故障発生回数を検索し、修理部品の
障害と判断して障害検出通知を行うようにしたことを特
徴とする。
【0015】この発明では、一旦障害発生と検出された
部品が修理された後に一時故障を発生した場合は、修理
前の一時故障発生回数に更に+1加算された値が一時故
障発生回数となるので、しきい値よりも大であり、直ち
に障害発生と検出されることとなる。
【0016】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面と共に説明する。図1は本発明になる障害検出方
式の一実施の形態の構成図を示す。この実施の形態は、
内部で自動的に復旧可能な一時的故障発生時にその一時
故障情報を送信する機能を備えた複数の被監視システム
18A、18B及び18Cと、上記一時故障情報を受信
して蓄積し、蓄積された一時故障回数を計測し予め設定
されているしきい値と比較する手段を備えた監視システ
ム11とから構成されている。
【0017】監視システム11は、システムの各部を統
括制御すると共に、監視対象となるすべての被監視シス
テム18A〜18Cの一時故障情報を分析する中央制御
部12と、被監視システム18A〜18Cからの一時故
障情報を受信する通信制御部13と、中央制御部12か
らの分析結果を故障履歴データベース15に蓄積制御す
る故障情報蓄積部14と、中央制御部12からの表示情
報が入力される障害表示制御部16と、障害表示制御部
16により表示情報を表示する表示装置17とから構成
されている。
【0018】次に、この実施の形態の動作について、図
2の動作説明用フローチャートを併せ参照して説明す
る。被監視システム18Aにおいて一時故障が発生した
場合を例にとって図1の監視システム11の障害検出動
作について説明するに、被監視システム18Aは一時故
障情報を監視システム11に送信する(図2のステップ
21)。監視システム11はその通信制御部13で上記
の一時故障情報を受信して中央制御部12へ転送する
(図2のステップ22)。
【0019】中央制御部13は受信された一時故障情報
を分析し、一時故障が発生した故障部品のシリアル番号
を認識する。その結果、中央制御部12は故障情報蓄積
部14を介して全被監視システムの故障履歴データベー
ス15に対し、一時故障を発生した故障部品のシリアル
番号の一時故障発生回数を更新登録(蓄積)する(図2
のステップ22)。
【0020】その後、中央制御部12は故障情報蓄積部
14を介して故障履歴データベース15からシリアル番
号に基づいて該当部品の履歴を検索する(図2のステッ
プ23)。中央制御部12はシリアル番号に基づいて検
索した該当部品の履歴から、その部品の一時故障発生回
数と監視システム11で予め設定しているしきい値とを
大小比較し(図2のステップ24)、一時故障発生回数
がしきい値未満であるときには処理を終了する。
【0021】一方、一時故障発生回数がしきい値と同じ
かそれより大であるときには、中央制御部12は当該部
品を障害とみなし、故障履歴データベース15にその旨
を登録すると共に、障害表示に必要な情報を障害表示制
御部16に転送し、表示装置17に障害発生を表示する
(図2のステップ25)。 中央制御部12は更に、通
信制御部13を介して一時故障情報を送信した当該被監
視システム18Aに対して部品の障害通知を行う(図2
のステップ26)。
【0022】当該被監視システム18Aは上記の障害通
知を受信すると、当該部品をシステムから切り離す(図
2のステップ27)。そして、被監視システム18Aに
おいて障害通知を受けた部品が正常な部品に交換されて
システムに組み込まれると、被監視システム18Aは監
視システム11に障害の復旧を通知する(図2のステッ
プ28)。
【0023】監視システム11ではその通信制御部13
で上記の障害の復旧通知を受信して中央制御部12へ転
送し、中央制御部13が障害復旧通知入力に基づいて障
害表示制御部16を制御して表示装置17における障害
発生表示を解除すると共に、故障情報蓄積部14を制御
して故障履歴データベース15に交換後の部品のシリア
ル番号を登録する(図2のステップ29)。ただし、中
央制御部12は前記障害部品については履歴を故障履歴
データベース15にそのまま保存する。
【0024】その後、被監視システム18Aで障害とさ
れて正常部品と交換された前記障害部品が修理された
後、例えば被監視システム18Bに転用された場合、そ
の部品が再び被監視システム18Bにおいて一時故障を
発生したものとすると、被監視システム18Bから一時
故障情報が監視システム11に送信される(図2のステ
ップ21)。
【0025】監視システム11内の中央制御部13は受
信された一時故障情報を分析し、一時故障が発生した故
障部品のシリアル番号を認識し、故障履歴データベース
15に対し、一時故障を発生した故障部品のシリアル番
号の一時故障発生回数を更新登録(蓄積)する(図2の
ステップ22)。 その後、中央制御部12は故障情報
蓄積部14を介して故障履歴データベース15からシリ
アル番号に基づいて該当部品の履歴を検索する(図2の
ステップ23)。
【0026】中央制御部12は検索した該当部品のシリ
アル番号から、その部品が以前被監視システム18Aに
おいてしきい値を越えて障害検出されたものであると認
識し、その一時故障発生回数は既に障害検出時にしきい
値を越えているから、被監視システム18Bにおいて当
該修理部品にとって初めての一時故障発生であっても、
中央制御部12は上記の一時故障回数としきい値との比
較の結果障害発生と判断し、故障履歴をもとに図2のス
テップ25以降の障害検出処理を行う。
【0027】
【発明の効果】以上説明したように、本発明によれば、
すべての被監視システムの各部品の一時故障発生回数は
共通のしきい値と比較されて障害発生かどうか監視シス
テムで判断されるため、全被監視システムが共通の適正
なしきい値により一時故障部品の障害検出ができる。
【0028】また、本発明によれば、一旦障害発生と検
出された部品が修理された後に一時故障を発生した場合
は、直ちに障害発生と検出されるため、潜在している不
具合に対して迅速に対応することができる。
【図面の簡単な説明】
【図1】本発明の一実施の形態の構成図である。
【図2】図1の動作説明用フローチャートである。
【図3】従来の一例の構成図である。
【符号の説明】
11 監視システム 12 中央制御部 13 通信制御部 14 故障情報蓄積部 15故障履歴データベース 16 障害表示制御部 17 表示装置 18A、18B、18C 被監視システム

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 部品に自動復旧可能な一時的故障が発生
    した時にその部品の一時的故障発生を示す一時故障情報
    を送信する機能と、外部からの障害検出通知を受信した
    ときは該障害検出通知された部品をシステムから切り離
    す機能を少なくとも有する一又は二以上の被監視システ
    ムと、 前記一時故障情報を受信し、前記障害検出通知を送信す
    る通信制御部と、該通信制御部により受信された前記一
    時故障情報に基づき一時故障を発生した部品の履歴を蓄
    積する履歴蓄積手段と、前記履歴蓄積手段から得られた
    前記一時故障を発生した部品の故障発生回数が予め定め
    たしきい値以上かどうか判定し、該しきい値以上である
    ときは該部品の障害と判断して前記障害検出通知を行う
    検出手段とを備えた監視システムとを有することを特徴
    とする障害検出方式。
  2. 【請求項2】 前記監視システムの履歴蓄積手段は、前
    記一時故障を発生した部品が障害発生部品として前記検
    出手段により判定され、前記被監視システムで正常な部
    品に交換された後もそのまま履歴を保存し、 前記検出手段はその後に該障害発生部品を修理した修理
    部品の一時故障発生を示す一時故障情報を前記通信制御
    部を介して受信したときは、前記履歴蓄積手段から一時
    故障を発生した該修理部品の修理前の累積故障発生回数
    を検索し、該修理部品の障害と判断して前記障害検出通
    知を行うことを特徴とする請求項1記載の障害検出方
    式。
  3. 【請求項3】 前記監視システムは、 前記一時故障情報を受信し、前記障害検出通知を送信す
    る通信制御部と、 一時故障を発生した部品の履歴を蓄積する履歴蓄積手段
    と、 前記通信制御部により受信された前記一時故障情報を分
    析し、一時故障を発生した部品の故障発生回数を前記履
    歴蓄積手段に更新登録した後、更新後の一時故障発生回
    数と前記しきい値とを比較し、該一時故障発生回数が該
    しきい値以上かどうか判定し、該しきい値以上であると
    きは、前記通信制御部から前記障害検出通知を前記一時
    故障情報を送信した被監視システムへ送信させる中央制
    御部と、 前記中央制御部からの表示情報が入力される障害表示制
    御部と、 前記障害表示制御部により表示情報を表示する表示装置
    とを有することを特徴とする障害検出方式。
JP22990196A 1996-08-30 1996-08-30 障害検出方式 Pending JPH1074108A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP22990196A JPH1074108A (ja) 1996-08-30 1996-08-30 障害検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22990196A JPH1074108A (ja) 1996-08-30 1996-08-30 障害検出方式

Publications (1)

Publication Number Publication Date
JPH1074108A true JPH1074108A (ja) 1998-03-17

Family

ID=16899511

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22990196A Pending JPH1074108A (ja) 1996-08-30 1996-08-30 障害検出方式

Country Status (1)

Country Link
JP (1) JPH1074108A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001077767A1 (en) * 2000-04-07 2001-10-18 Sintokogio, Ltd. Method for supporting maintenance of facility and system
US6718513B1 (en) * 2000-01-31 2004-04-06 Fujitsu Limited Fault monitoring system and fault reporting method
JP2007299413A (ja) * 2007-06-08 2007-11-15 Ricoh Co Ltd 画像形成装置管理システムとそれに使用する通信コントロール装置および識別情報管理方法
US10545812B2 (en) 2016-12-09 2020-01-28 Ricoh Company, Ltd. Information processing system, information processing apparatus, and medium

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6718513B1 (en) * 2000-01-31 2004-04-06 Fujitsu Limited Fault monitoring system and fault reporting method
WO2001077767A1 (en) * 2000-04-07 2001-10-18 Sintokogio, Ltd. Method for supporting maintenance of facility and system
US6665581B2 (en) 2000-04-07 2003-12-16 Sintokogio, Ltd. Method of supporting maintenance of facility and system
JP2007299413A (ja) * 2007-06-08 2007-11-15 Ricoh Co Ltd 画像形成装置管理システムとそれに使用する通信コントロール装置および識別情報管理方法
US10545812B2 (en) 2016-12-09 2020-01-28 Ricoh Company, Ltd. Information processing system, information processing apparatus, and medium

Similar Documents

Publication Publication Date Title
US6862688B2 (en) Fault handling system and fault handling method
GB2299693A (en) Client/server systems
US7278048B2 (en) Method, system and computer program product for improving system reliability
US20090249117A1 (en) Apparatus maintenance system and method
US11703846B2 (en) Equipment failure diagnostics using Bayesian inference
JPH1074108A (ja) 障害検出方式
JPH0721049A (ja) 障害処理システム
JP4437513B2 (ja) 異常検出システム
JPH07160326A (ja) プラント監視装置
CN112751688B (zh) 一种otn设备的流控处理方法、电子设备及存储介质
JPH06324916A (ja) 障害情報ロギング方式
JP2560875B2 (ja) 情報処理系の障害通知方式
JPH0955735A (ja) 通信網故障診断システムおよび通信網故障診断方法
JPH08249212A (ja) 多重化されたコンピュータシステムにおける障害監視方法
CN119557146B (zh) 电动车显示仪表的异常重启保护方法及系统
JPH05334205A (ja) 計算機システムにおけるi/oタイムアウト障害処理方式
JP3002317B2 (ja) 設備機器の遠隔監視装置
JPH01217651A (ja) 障害自動通報方式
JPH06244935A (ja) 電子交換機構成装置の故障診断システム
JP2003303117A (ja) 情報機器管理システム
JPH09325809A (ja) 状変検出方法
JPH07325729A (ja) 障害判定機能付マルチプロセッサ装置
CN119201519A (zh) 故障检测方法、装置、设备及介质
KR20000051984A (ko) 엘리베이터의 원격 고장 검출 시스템 및 그의 제어 방법
JPH04287460A (ja) 障害検出方式