JPH06175887A - 障害監視/通知方式 - Google Patents

障害監視/通知方式

Info

Publication number
JPH06175887A
JPH06175887A JP4322915A JP32291592A JPH06175887A JP H06175887 A JPH06175887 A JP H06175887A JP 4322915 A JP4322915 A JP 4322915A JP 32291592 A JP32291592 A JP 32291592A JP H06175887 A JPH06175887 A JP H06175887A
Authority
JP
Japan
Prior art keywords
threshold value
function
threshold
failure
alarm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4322915A
Other languages
English (en)
Inventor
Kunio Sunada
久仁男 砂田
Kazuyuki Nishikawa
和幸 西川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Computer Electronics Co Ltd
Hitachi Ltd
Original Assignee
Hitachi Computer Electronics Co Ltd
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Computer Electronics Co Ltd, Hitachi Ltd filed Critical Hitachi Computer Electronics Co Ltd
Priority to JP4322915A priority Critical patent/JPH06175887A/ja
Publication of JPH06175887A publication Critical patent/JPH06175887A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Abstract

(57)【要約】 【目的】ネットワークの障害管理で、エージェント機能
からマネージャ機能へ報告したアラーム情報の障害内容
別に最適化されたしきい値情報をもうけ、しきい値の規
定回数以上発生した障害情報をネットワーク/システム
管理者に報告し、予防保守実施の判断をおこなうこと。 【構成】エージェント機能2で障害を検知すると、アラ
ーム情報を作成して、マネージャ機能1へアラーム情報
を通知する。機能1では通知されたアラーム情報の障害
種別に対応したMS(メモリ)16に格納されているカ
ウンタを更新(+1)し、障害種別に対応したしきい値
と比較する。このときカウンタがしきい値以上の場合、
監視端末12に障害内容を出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、マネージャ機能とエー
ジェント機能から構成されるネットワーク管理システム
で、エージェント機能から報告されたアラーム情報の管
理方式に関する。
【0002】
【従来の技術】マネージャ機能とエージェント機能から
構成されるネットワーク管理システムにおいては、エー
ジェント側で発生した障害をマネージャ機能に報告する
手段としてアラーム通知機能がある。
【0003】エージェント側で発生する障害には、即座
に報告すべき重大なものと、回復処理あるいは再試行等
の結果、障害回復するような軽度なもの、乃至は警告的
なものがある。
【0004】重大障害については、即座に報告する必要
があるが、本発明に関わる軽度な、あるいは警告的な障
害については、最終的に重大障害になる兆候を示してい
ることから、アラーム種別毎にカウンタをもうけ、当該
障害発生の都度、該当するカウンタを更新し、障害発生
回数が保守運用で決められた規定回数(しきい値)を超
えたときシステム管理者に報告し、システムの予防保守
に活用していた。
【0005】以上述べたように、本発明に関わる従来方
式では、障害発生回数のしきい値をシステムの保守運用
をおこなっている人の経験により決定していた。
【0006】なお、関連技術としては、例えば特開平4
−117854を挙げることができる。
【0007】
【発明が解決しようとする課題】上記したように従来
は、エージェント側で発生した軽度な、あるいは警告的
な障害についてのしきい値を、保守・運用をおこなう人
の経験等により決定してシステムに組み込んでいるた
め、しきい値が保守に見合った値になっていなかったり
することがある。
【0008】また、しきい値は人手によって入力してい
るため、システムの変更の都度、しきい値の変更作業を
おこなわなければならないという問題があった。
【0009】
【課題を解決するための手段】この発明は、エージェン
ト側で発生した軽度な、あるいは警告的な障害の発生回
数を、アラーム種別に一定期間採取する機構をマネージ
ャ側にもうけ、採取した障害発生回数の実績値と設定済
のしきい値をもとに最適なしきい値を求める。さらに、
再びエージェント側で発生した障害の発生回数を採取
し、しきい値の最適化を動的におこなう。
【0010】
【作用】しきい値の最適化は、一定期間採取した障害発
生回数の実績値としきい値を比較し、実績値がしきい値
より極端に小さいときはしきい値の数値を低くし、実績
値がしきい値より大きいときはシステム管理者に報告
後、問題がなければしきい値の数値を高くする。
【0011】
【実施例】以下本発明の実施例を図面によって詳述す
る。
【0012】図1は本発明の一実施例を模式的に示した
図、図2はしきい値の最適化の動作を説明するフローチ
ャートである。図1において、1はマネージャ機能、2
はエージェント機能で、3はマネージャ機能とエージェ
ント機能を結ぶ通信回線である。
【0013】本発明が適用されるネットワーク・システ
ムは、図1に示すように、マネージャ機能1には操作端
末11、監視端末12、しきい値記録ファイル13、カ
ウンタ記録ファイル14、しきい値制御部15、MS
(メモリ)16、しきい値最適化処理部17、タイマ監
視処理部18、カウンタ値−しきい値比較処理部19、
カウンタ制御部20、アラーム受信処理部21、通信制
御部22を備え、エージェント機能2には通信制御部3
1、アラーム作成処理部32、障害検知機構33を備え
て構成されている。
【0014】マネージャ機能1は、エージェント機能2
から、通信制御部22とアラーム受信処理部21を通じ
てアラーム通知情報を受けとり、更に、カウンタ制御部
20に移行し、MS(メモリ)16に格納されているア
ラームの内容別に対応するカウンタを更新(+1)す
る。そして、カウンタ値−しきい値比較処理部19にお
いて、更新された前記カウンタの内容と前記カウンタに
対応するMS(メモリ)16上に格納されている前記し
きい値を比較し、前記カウンタの内容が前記しきい値と
等しいか大きい場合、前記アラームの内容に対応する障
害情報を監視端末12に表示する。これによってシステ
ム管理者は、エージェント2において予防保守すべき障
害兆候が発生したこと知ることができる。
【0015】さらに、マネージャ機能1は、周期的に起
動するタイマ監視処理部18を有し、ある時間を経過す
るとしきい値制御部15とカウンタ値制御部20に報告
をおこなう。しきい値制御部15では、報告を受けると
しきい値最適化処理部17に制御を渡し、MS(メモ
リ)16に格納されている前記カウンタ及び、前記しき
い値を比較し、しきい値の最適化をおこなう。カウンタ
制御部20では、報告を受けるとMS(メモリ)16に
格納されている前記カウンタ全てを0クリアする。
【0016】エージェント機能2は、障害が発生すると
障害検知機構33が障害を検知し、次に、アラーム作成
処理部32がアラーム通知情報を作成し、通信制御部3
1を通じてマネージャ機能1に前記アラーム通知情報を
転送しアラーム通知をおこなう。
【0017】また、マネージャ機能1のシステム停止処
理において、MS(メモリ)16上に格納されている前
記しきい値情報と前記カウンタ情報を、各々しきい値情
報記録ファイル13とカウンタ情報記録ファイル14に
格納・保持しておくことにより、システム停止までに有
効であったしきい値情報及び、前記障害発生回数を保持
しておくことができる。
【0018】また、マネージャ機能1のシステム立ち上
げ処理においては、しきい値情報記録ファイル13とカ
ウンタ情報記録ファイル14に格納・保持されている前
記しきい値情報と前記カウンタ情報を読みだし、MS
(メモリ)16上に格納しておくことにより、システム
停止後からの前記アラーム通知処理を継続して行うこと
ができる。
【0019】前記しきい値情報の変更が必要になった場
合においては、マネージャ機能1に接続されている操作
端末11に、設定済みのしきい値情報を表示したのち、
操作端末11より新たなしきい値情報を任意に人手入力
する。入力された新たなしきい値情報はしきい値制御部
15に渡され、新たなしきい値情報を、MS(メモリ)
16に格納されているしきい値情報と入れ替える。
【0020】次に、しきい値の最適化の処理動作を図2
に示すフローチャートで説明する。
【0021】始めにアラーム種別の障害発生回数と対応
するしきい値を比較して(ステップ100)、前記障害
回数が前記しきい値より小さいときは、前記障害発生回
数と前記しきい値との差を比較して(ステップ10
1)、差が許容範囲を超えていればしきい値を低くする
(ステップ102)。許容範囲を超えていなければしき
い値の最適化はおこなわない。もし、前記障害発生回数
が前記しきい値以上ならば、予防保守が必要かどうかを
システム管理者に応答要求をおこない(ステップ10
3)、必要でなければしきい値を高くし(ステップ10
4)、必要ならばしきい値の最適化をおこなわない。
【0022】最後に全てのアラーム種別のしきい値の最
適化が終了したか判定して(ステップ105)、終了し
ていないときは判定するアラーム種別を変えてフローチ
ャートの始めに戻り、終了したときはしきい値の最適化
処理を終了する。
【0023】
【発明の効果】以上詳細に説明したように本発明によれ
ば、エージェント側で発生した各種障害情報について、
マネージャから予防保守すべき障害発生回数の規定値
(しきい値)を任意に設定し、マネージャ側で受領した
アラームの障害内容別の障害発生回数がしきい値に達し
た場合、端末等にメッセージを出力することにより、早
期対策すべき障害発生内容を見逃してしまうことがなく
なる。
【0024】また、しきい値の最適化機能により、障害
発生回数の実績値から適切なしきい値に自動的に変更し
てくれるため、しきい値の見直しをおこなわなくて済む
ようになる。
【図面の簡単な説明】
【図1】本発明の一実施例を模式に示した図である。
【図2】しきい値の最適化の動作を説明するフローチャ
ート図である。
【符号の説明】
1…マネージャ機能、 2…エージェント機能、 3…通信回線、 11…操作端末、 12…監視端末、 13…しきい値記録ファイル、 14…カウンタ記録ファイル、 15…しきい値制御部、 16…MS(メモリ)、 17…しきい値最適化処理部 18…タイマ監視処理部、 19…カウンタ値−しきい値比較処理部、 20…カウンタ制御部、 21…アラーム受信処理部、 22…通信制御部、 31…通信制御部、 32…アラーム作成処理部、 33…障害検知機構。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】コンピュータ・ネットワーク・システム
    で、マネージャ機能とエージェント機能から構成される
    ネットワーク管理システムの障害管理機能において、エ
    ージェント機能にアラームを報告する機能をもうけ、マ
    ネージャ機能にアラーム種別毎に障害発生回数を更新/
    保持する処理部と、前記アラーム種別に対応し動的に最
    適化された障害発生回数の規定回数(しきい値)をもう
    け、エージェント機能が存在するネットワーク資源内で
    障害が発生した場合、マネージャ機能に報告されたアラ
    ームの障害発生回数がある一定期間内に、対応するしき
    い値に達すると、出力装置によりオペレータやネットワ
    ーク/システム管理者に報告し、また、ある一定期間に
    達したときは、前記アラーム種別毎の障害発生回数を全
    てゼロクリアすることを特徴とする障害監視/通知方
    式。
  2. 【請求項2】請求項1において、前記動的に最適化され
    た障害発生回数の規定回数(しきい値)は、ある一定期
    間内に発生した前記アラーム種別に対応した前記障害発
    生回数の実績値をもとに自動的に決定することを特徴と
    する障害監視/通知方式。
  3. 【請求項3】請求項1において、前記しきい値及び、前
    記障害発生回数のカウンタをメモリ上からオペレータコ
    マンドあるいはシステム停止指示によって外部記憶装置
    内に格納し保持する手段をもうけ、システムの停止後、
    システムの再立ち上げ時に外部記憶装置からメモリに回
    復できることを特徴とする障害監視/通知方式。
  4. 【請求項4】請求項1において、マネージャ機能に対し
    て、前記しきい値を出力装置に表示する手段と入力装置
    から再設定する手段をもうけ、前記しきい値を任意に変
    更できることを特徴とする障害監視/通知方式。
JP4322915A 1992-12-02 1992-12-02 障害監視/通知方式 Pending JPH06175887A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4322915A JPH06175887A (ja) 1992-12-02 1992-12-02 障害監視/通知方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4322915A JPH06175887A (ja) 1992-12-02 1992-12-02 障害監視/通知方式

Publications (1)

Publication Number Publication Date
JPH06175887A true JPH06175887A (ja) 1994-06-24

Family

ID=18149052

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4322915A Pending JPH06175887A (ja) 1992-12-02 1992-12-02 障害監視/通知方式

Country Status (1)

Country Link
JP (1) JPH06175887A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08161207A (ja) * 1994-12-07 1996-06-21 Nec Corp ネットワークシステム
CN1312591C (zh) * 2003-10-07 2007-04-25 威盛电子股份有限公司 预取数据控制器及其方法
JP2007249741A (ja) * 2006-03-17 2007-09-27 Fujitsu Ltd 被疑箇所特定装置および処理方法
JP2007293887A (ja) * 2007-05-30 2007-11-08 Ntt Docomo Inc サーバ装置、移動通信端末、情報送信システム及び情報送信方法
US7299035B2 (en) 2002-01-17 2007-11-20 Ntt Docomo, Inc. Server device, mobile communications terminal, information transmitting system and information transmitting method
JP2009064098A (ja) * 2007-09-04 2009-03-26 Nec Corp 運用管理システムおよび定義不足の分析方法
CN114964779A (zh) * 2022-05-23 2022-08-30 北京唐智科技发展有限公司 一种轴承故障检测方法、系统及装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08161207A (ja) * 1994-12-07 1996-06-21 Nec Corp ネットワークシステム
US7299035B2 (en) 2002-01-17 2007-11-20 Ntt Docomo, Inc. Server device, mobile communications terminal, information transmitting system and information transmitting method
CN1312591C (zh) * 2003-10-07 2007-04-25 威盛电子股份有限公司 预取数据控制器及其方法
JP2007249741A (ja) * 2006-03-17 2007-09-27 Fujitsu Ltd 被疑箇所特定装置および処理方法
US7694179B2 (en) 2006-03-17 2010-04-06 Fujitsu Limited Suspected place identifying apparatus and processing method
JP2007293887A (ja) * 2007-05-30 2007-11-08 Ntt Docomo Inc サーバ装置、移動通信端末、情報送信システム及び情報送信方法
JP2009064098A (ja) * 2007-09-04 2009-03-26 Nec Corp 運用管理システムおよび定義不足の分析方法
CN114964779A (zh) * 2022-05-23 2022-08-30 北京唐智科技发展有限公司 一种轴承故障检测方法、系统及装置

Similar Documents

Publication Publication Date Title
CN101401135B (zh) 根据实时服务降级动态区分网络故障优先次序的方法和装置
WO1997024839A9 (en) Fault impact analysis
CN107681786B (zh) 一种变电站设备监控信息告警二次智能分级的方法
US8205116B2 (en) Common chronics resolution management
JPH06175887A (ja) 障害監視/通知方式
JPH05143377A (ja) アラーム通知方式
US11862007B2 (en) Method for automatically analyzing and filtering out redundant alarms in the fault management system of radio transceiver stations
JP2004164271A (ja) ジョブ実行監視方法及びプログラム
JPH08147030A (ja) プラント監視装置
JPH06324916A (ja) 障害情報ロギング方式
JP3368311B2 (ja) 設備故障通報装置
KR0183138B1 (ko) 종합정보통신망 교환 시스템의 장애 진단을 위한 장애 정보 전처리 방법
JP3025573B2 (ja) ビル遠隔監視装置
KR100269865B1 (ko) 디지털 이동통신 시스템에서의 경보 데이터 복구장치 및 방법
JP2932992B2 (ja) 作業管理アラームイベント抑止方式
JPH01217651A (ja) 障害自動通報方式
CN119850320B (zh) 一种第三方系统故障应急处理方法、装置、设备及介质
JPH10154981A (ja) 監視装置
JP2000181761A (ja) 端末監視システム及び方法
JPH02216931A (ja) 障害情報通知方式
JPH1074108A (ja) 障害検出方式
KR0134704B1 (ko) 신호중계교환기에서의 운용관리장치 프로세스 감시방법
JP2000089981A (ja) 障害発生自動判定方法
JPH08242230A (ja) 障害アラームの出力制御方式
JPH04332227A (ja) 障害情報通報先制御方式