JPH04213123A - 電子計算機の故障予防保全方式 - Google Patents
電子計算機の故障予防保全方式Info
- Publication number
- JPH04213123A JPH04213123A JP2405320A JP40532090A JPH04213123A JP H04213123 A JPH04213123 A JP H04213123A JP 2405320 A JP2405320 A JP 2405320A JP 40532090 A JP40532090 A JP 40532090A JP H04213123 A JPH04213123 A JP H04213123A
- Authority
- JP
- Japan
- Prior art keywords
- storage device
- error
- preventive maintenance
- fault
- function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Debugging And Monitoring (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【0001】
【産業上の利用分野】この発明は電子計算機システムに
関し、特に外部記憶装置に故障が発生し復旧不可能にな
る以前に、オンラインにて外部記憶装置の定期的自己診
断を行う電子計算機の故障予防保全方式に関するもので
ある。
関し、特に外部記憶装置に故障が発生し復旧不可能にな
る以前に、オンラインにて外部記憶装置の定期的自己診
断を行う電子計算機の故障予防保全方式に関するもので
ある。
【0002】
【従来の技術】電子計算機における記憶装置は、その使
い方から故障が発生すると、即システムダウンにつなが
るケースが多く、単に故障率が低いからといって安心で
きるものではない。故障の多くは記憶装置に予め保持さ
れていたプログラムを必要時、読み込むと正しく読めな
かったり、読み込んだ内容が違っていたりすることであ
り、この場合、計算機は正常動作をしない。従って、こ
れら故障を未然に防ぐことがシステムの信頼性を上げる
要素であるが、従来の方式は、適切とは言えなかった。
い方から故障が発生すると、即システムダウンにつなが
るケースが多く、単に故障率が低いからといって安心で
きるものではない。故障の多くは記憶装置に予め保持さ
れていたプログラムを必要時、読み込むと正しく読めな
かったり、読み込んだ内容が違っていたりすることであ
り、この場合、計算機は正常動作をしない。従って、こ
れら故障を未然に防ぐことがシステムの信頼性を上げる
要素であるが、従来の方式は、適切とは言えなかった。
【0003】第1の方式は、既に一般的なように、保守
員が定期点検時、装置の診断プログラムを実行し、エラ
ーの有無をチェックし、保全を行う方式である。
員が定期点検時、装置の診断プログラムを実行し、エラ
ーの有無をチェックし、保全を行う方式である。
【0004】また、第2の方式は、前述に比して一般的
ではないが、電子計算機システムが動作し、記憶装置を
アクセスする時その領域でエラーが発生すると、そのエ
ラーの履歴を格納しておき、定期点検時保守員がその履
歴を見て保全を行う方式である。
ではないが、電子計算機システムが動作し、記憶装置を
アクセスする時その領域でエラーが発生すると、そのエ
ラーの履歴を格納しておき、定期点検時保守員がその履
歴を見て保全を行う方式である。
【0005】ここで示すエラーとはソフトウェア、ハー
ドウェアともリトライ可能なエラーを指しており、それ
ぞれリトライ回数を定め、それ以内にエラーが復旧する
と、エラーメッセージ等は出力しないのが一般的である
。
ドウェアともリトライ可能なエラーを指しており、それ
ぞれリトライ回数を定め、それ以内にエラーが復旧する
と、エラーメッセージ等は出力しないのが一般的である
。
【0006】上記第2の方式は、リトライで正常な場合
でも、エラーとみなして発生をカウントしかつリトライ
回数もカウントするのが一般的である。
でも、エラーとみなして発生をカウントしかつリトライ
回数もカウントするのが一般的である。
【0007】また記憶装置のエラーは、その進行がリト
ライで復旧するケースの増加およびリトライ回数の増加
に表れるのも一般的である。
ライで復旧するケースの増加およびリトライ回数の増加
に表れるのも一般的である。
【0008】
【発明が解決しようとする課題】従来の電子計算機の故
障予防保全方式は、オフラインで保守要員の定期的な診
断プログラムの実施による外部記憶装置の確認、及び計
算機の記憶装置に格納されているエラー情報の収集によ
るエラー解析を実施しなければならず、その為、診断に
人手と時間を要すると共に、次の定期点検に入る間に故
障が発生した場合、故障発見が遅れ故障の度合が進行し
てしまうという慮れもあった。
障予防保全方式は、オフラインで保守要員の定期的な診
断プログラムの実施による外部記憶装置の確認、及び計
算機の記憶装置に格納されているエラー情報の収集によ
るエラー解析を実施しなければならず、その為、診断に
人手と時間を要すると共に、次の定期点検に入る間に故
障が発生した場合、故障発見が遅れ故障の度合が進行し
てしまうという慮れもあった。
【0009】この発明は上記のような問題点を解消する
ためになされたもので、電子計算機の通常の稼動と並行
し、稼動を停止している期間を縫って計算機の自己診断
機能を働かせ、オンラインで故障監視、発見ができる電
子計算機の故障予防保全方式を得ることを目的とする。
ためになされたもので、電子計算機の通常の稼動と並行
し、稼動を停止している期間を縫って計算機の自己診断
機能を働かせ、オンラインで故障監視、発見ができる電
子計算機の故障予防保全方式を得ることを目的とする。
【0010】
【課題を解決するための手段】この発明に係る電子計算
機の故障予防保全方式は、電子計算機が定期的に行う外
部記憶装置のアクセス動作に並行して周期的に外部記憶
装置の自己診断を行い、該自己診断結果を保持更新しエ
ラー履歴を生成すると共に、エラー回数を監視し一定回
数以上のエラー発生に対して警報出力する機能を備えた
ものである。
機の故障予防保全方式は、電子計算機が定期的に行う外
部記憶装置のアクセス動作に並行して周期的に外部記憶
装置の自己診断を行い、該自己診断結果を保持更新しエ
ラー履歴を生成すると共に、エラー回数を監視し一定回
数以上のエラー発生に対して警報出力する機能を備えた
ものである。
【0011】
【作用】この発明によれば、電子計算機の外部記憶装置
の故障に対する自己診断を、電子計算機の通常の稼動と
並行して自動的に行い、この自己診断結果よりエラー履
歴を生成し、一定回数以上のエラー発生に対して警報を
操作員に告知するといった外部記憶装置の診断、診断結
果の格納、エラー警報管理を一体化して電子計算機が重
大故障に至らないよう予防保全を行うものである。
の故障に対する自己診断を、電子計算機の通常の稼動と
並行して自動的に行い、この自己診断結果よりエラー履
歴を生成し、一定回数以上のエラー発生に対して警報を
操作員に告知するといった外部記憶装置の診断、診断結
果の格納、エラー警報管理を一体化して電子計算機が重
大故障に至らないよう予防保全を行うものである。
【0012】
【実施例】以下、この発明の一実施例を図によって説明
する。図1において、1は計算機システムのH/W構成
を示す。11は主記憶装置、12は中央処理装置、13
は入出力制御装置14は対象外部記憶装置である。
する。図1において、1は計算機システムのH/W構成
を示す。11は主記憶装置、12は中央処理装置、13
は入出力制御装置14は対象外部記憶装置である。
【0013】また、2は計算機システム内の外部記憶装
置内におけるS/Wイメージを表したものである。21
はOS(オペレーティングシステム)、22は予防保全
方式を実施するユーティリティプログラムであり、3つ
の機能を備えている。また、23はアプリケーションソ
フトである。上記ユーティリティプログラム22の3つ
機能としては以下の通りである。
置内におけるS/Wイメージを表したものである。21
はOS(オペレーティングシステム)、22は予防保全
方式を実施するユーティリティプログラムであり、3つ
の機能を備えている。また、23はアプリケーションソ
フトである。上記ユーティリティプログラム22の3つ
機能としては以下の通りである。
【0014】
(a) オンライン点検機能…計算機システムの動作
に影響を与えることなしに任意に指定した周期で記憶装
置の全領域の診断を実施する機能、エラー発生の際はエ
ラーヒストリー機能に順次格納される。 (b) エラーヒストリー機能…aの機能でのエラー
発生状況を貯え、指定フォーマットに変換して、順次更
新しヒストリーとして保持する機能、エラー情報はH/
Wリトライ,S/Wリトライで復旧されたもの全てが対
象。 (c) 点検管理機能…計算機システムに影響を与え
ず、指定周期にて、エラーヒストリー機能で格納された
エラー情報を参照し予防保全基準と計算機のシステム規
模に応じ、アラームを発生する機能、例えば計算機シス
テム上ではエラーとしないH/Wリトライによるエラー
がある回数超えた場合アラームをメッセージアウトする
ものである。
に影響を与えることなしに任意に指定した周期で記憶装
置の全領域の診断を実施する機能、エラー発生の際はエ
ラーヒストリー機能に順次格納される。 (b) エラーヒストリー機能…aの機能でのエラー
発生状況を貯え、指定フォーマットに変換して、順次更
新しヒストリーとして保持する機能、エラー情報はH/
Wリトライ,S/Wリトライで復旧されたもの全てが対
象。 (c) 点検管理機能…計算機システムに影響を与え
ず、指定周期にて、エラーヒストリー機能で格納された
エラー情報を参照し予防保全基準と計算機のシステム規
模に応じ、アラームを発生する機能、例えば計算機シス
テム上ではエラーとしないH/Wリトライによるエラー
がある回数超えた場合アラームをメッセージアウトする
ものである。
【0015】次に実際の予防保全方式について説明する
。図2のシーケンスを例に説明すると、先ずシーケンス
1は通常の計算機システムにおける外部記憶装置のアプ
リケーションウェアのアクセスである。外部記憶装置に
対しアクセスした際、正常終了であれば計算機システム
は次のシーケンスとして動作を継続する。しかしシーケ
ンス2により、エラーが発生した場合、エラーヒストリ
ー機能によりエラー情報の収集が開始される。アプリケ
ーションウェア動作の間にシーケンス3〜5(点線)の
オンライン点検機能が計算機システムに影響を与えない
周期でアクセスが順次外部記憶装置に対し実行されてい
る。正常終了した時(シーケンス3,4)は動作が続行
され、エラーが発生した場合は(シーケンス5)、アプ
リケーションソフトウェアと同様にエラーヒストリー機
能によりエラー情報がスタックされる。この際、点検管
理機能の動作が、エラーヒストリー機能により収集され
たと同時に判定処理動作が実行される。
。図2のシーケンスを例に説明すると、先ずシーケンス
1は通常の計算機システムにおける外部記憶装置のアプ
リケーションウェアのアクセスである。外部記憶装置に
対しアクセスした際、正常終了であれば計算機システム
は次のシーケンスとして動作を継続する。しかしシーケ
ンス2により、エラーが発生した場合、エラーヒストリ
ー機能によりエラー情報の収集が開始される。アプリケ
ーションウェア動作の間にシーケンス3〜5(点線)の
オンライン点検機能が計算機システムに影響を与えない
周期でアクセスが順次外部記憶装置に対し実行されてい
る。正常終了した時(シーケンス3,4)は動作が続行
され、エラーが発生した場合は(シーケンス5)、アプ
リケーションソフトウェアと同様にエラーヒストリー機
能によりエラー情報がスタックされる。この際、点検管
理機能の動作が、エラーヒストリー機能により収集され
たと同時に判定処理動作が実行される。
【0016】図3は点検管理機能の判定処理一事例であ
る(ディスク装置を例)。リトライで救えたコレクタブ
ルデータチェックエラーが発生した場合、20回発生し
たかという判定を実施し回数が基準内であれば図の通り
判定処理としては完了する。次に図で示した基準値を超
えた場合は、警報プログラムが起動されユーザーに警報
する等、計算機システムユーザーとの取り決めに従い処
理を実施する。
る(ディスク装置を例)。リトライで救えたコレクタブ
ルデータチェックエラーが発生した場合、20回発生し
たかという判定を実施し回数が基準内であれば図の通り
判定処理としては完了する。次に図で示した基準値を超
えた場合は、警報プログラムが起動されユーザーに警報
する等、計算機システムユーザーとの取り決めに従い処
理を実施する。
【0017】この予防保全方式は、特に固定ヘッドディ
スク装置に有効であるが、他に光(磁気)DISK,フ
ロッピーディスク,マグネットテープ装置のような外部
記憶装置に対しても適用できる。
スク装置に有効であるが、他に光(磁気)DISK,フ
ロッピーディスク,マグネットテープ装置のような外部
記憶装置に対しても適用できる。
【0018】
【発明の効果】以上のように、この発明によれば、電子
計算機の通常の外部記憶装置のアクセスに並行して、外
部記憶装置の自己診断、エラー履歴、故障警報を行う機
能を備えたことで、オンラインでの自己診断が可能とな
り人的な省力化が図れると共に、予防保全を早期に、且
つ確実に実施できるという効果がある。
計算機の通常の外部記憶装置のアクセスに並行して、外
部記憶装置の自己診断、エラー履歴、故障警報を行う機
能を備えたことで、オンラインでの自己診断が可能とな
り人的な省力化が図れると共に、予防保全を早期に、且
つ確実に実施できるという効果がある。
【図1】この発明の一実施例による電子計算機の故障予
防保全方式における計算機システムのハードウェア構成
図と外部記憶装置のソフトウェアイメージを示す図であ
る。
防保全方式における計算機システムのハードウェア構成
図と外部記憶装置のソフトウェアイメージを示す図であ
る。
【図2】本実施例方式の動作を説明するシーケンスであ
る。
る。
【図3】本実施例方式における点検管理機能の判定処理
の一事例を示すフローチャートである。
の一事例を示すフローチャートである。
1 計算機システム
2 外部記憶装置のソフトウェアイメージ14
外部記憶装置 21 オペレーティングシステム 22 ユーティリティプログラム
外部記憶装置 21 オペレーティングシステム 22 ユーティリティプログラム
Claims (1)
- 【請求項1】 電子計算機が定期的に行う外部記憶装
置のアクセス動作に並行して周期的に外部記憶装置の自
己診断を行い、該自己診断結果を保持更新しエラー履歴
を生成すると共に、エラー回数を監視し一定回数以上の
エラー発生に対して警報出力する機能を備えたことを特
徴とする電子計算機の故障予防保全方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2405320A JPH04213123A (ja) | 1990-12-06 | 1990-12-06 | 電子計算機の故障予防保全方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2405320A JPH04213123A (ja) | 1990-12-06 | 1990-12-06 | 電子計算機の故障予防保全方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH04213123A true JPH04213123A (ja) | 1992-08-04 |
Family
ID=18514934
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2405320A Pending JPH04213123A (ja) | 1990-12-06 | 1990-12-06 | 電子計算機の故障予防保全方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH04213123A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6622264B1 (en) * | 1999-10-28 | 2003-09-16 | General Electric Company | Process and system for analyzing fault log data from a machine so as to identify faults predictive of machine failures |
| CN103729274A (zh) * | 2013-12-31 | 2014-04-16 | 广州华多网络科技有限公司 | 音频故障检测方法和系统 |
-
1990
- 1990-12-06 JP JP2405320A patent/JPH04213123A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6622264B1 (en) * | 1999-10-28 | 2003-09-16 | General Electric Company | Process and system for analyzing fault log data from a machine so as to identify faults predictive of machine failures |
| CN103729274A (zh) * | 2013-12-31 | 2014-04-16 | 广州华多网络科技有限公司 | 音频故障检测方法和系统 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4922491A (en) | Input/output device service alert function | |
| JP3481737B2 (ja) | ダンプ採取装置およびダンプ採取方法 | |
| JP2017091077A (ja) | 擬似故障の発生プログラム、発生方法、及び発生装置 | |
| US7171586B1 (en) | Method and apparatus for identifying mechanisms responsible for “no-trouble-found” (NTF) events in computer systems | |
| CN118981405A (zh) | 基于Autosar的任务监测方法、装置、设备、存储介质及产品 | |
| JPH10312327A (ja) | ミラーリング監視方式 | |
| KR100319852B1 (ko) | 장애복구기능을갖는컴퓨터시스템및그방법 | |
| JPH04213123A (ja) | 電子計算機の故障予防保全方式 | |
| JP3040186B2 (ja) | 制御用ディジタルコントローラ | |
| JP3342039B2 (ja) | ファイルを管理する処理装置 | |
| JP3357777B2 (ja) | プログラム制御システム | |
| JPH0424838A (ja) | マルチプロセッサの障害管理方式 | |
| JPH05274093A (ja) | ボリューム障害防止制御方式 | |
| CN117743008B (zh) | 多核处理器故障诊断与异常处理方法、主控板卡及设备 | |
| JP2766362B2 (ja) | 電力制御ディジタルコントローラのエラー情報ファイル生成方式 | |
| JP7235346B2 (ja) | システム、および制御方法 | |
| JP3084823B2 (ja) | オペレータズコンソール | |
| JP4593301B2 (ja) | エレベータの故障解析装置 | |
| JP2002278798A (ja) | 障害監視装置及びその方法並びに記憶媒体 | |
| JPH06265445A (ja) | 監視装置 | |
| JP2844361B2 (ja) | 異常回復処理方式 | |
| JP2833928B2 (ja) | 診断初期化方式 | |
| JPS5827538B2 (ja) | 相互監視方式 | |
| JPH076103A (ja) | 入出力チャネルの障害処理システム | |
| JPS61120248A (ja) | 診断方式 |