JPH04369067A - 障害処理装置 - Google Patents

障害処理装置

Info

Publication number
JPH04369067A
JPH04369067A JP3145777A JP14577791A JPH04369067A JP H04369067 A JPH04369067 A JP H04369067A JP 3145777 A JP3145777 A JP 3145777A JP 14577791 A JP14577791 A JP 14577791A JP H04369067 A JPH04369067 A JP H04369067A
Authority
JP
Japan
Prior art keywords
log
log data
processing device
information processing
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3145777A
Other languages
English (en)
Other versions
JP3014490B2 (ja
Inventor
Tomoyoshi Asashita
浅下 朝義
Kazuo Hibi
一夫 日比
Teruyuki Harada
原田 輝之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Hitachi Computer Engineering Co Ltd
Original Assignee
Hitachi Ltd
Hitachi Computer Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, Hitachi Computer Engineering Co Ltd filed Critical Hitachi Ltd
Priority to JP3145777A priority Critical patent/JP3014490B2/ja
Publication of JPH04369067A publication Critical patent/JPH04369067A/ja
Application granted granted Critical
Publication of JP3014490B2 publication Critical patent/JP3014490B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、障害処理技術に関し、
特に、複数台の情報処理装置とサービスプロセッサとの
間に介在し、情報処理装置における障害発生時のログデ
ータの採取およびサービスプロセッサへの引き渡しなど
の障害処理を行なう障害処理装置に適用して有効な技術
に関する。
【0002】
【従来の技術】従来、この種の障害処理装置は、情報処
理装置から障害発生の報告を受けると、最初に障害が発
生した情報処理装置から内部状態(ログデータ)を順次
全て取り出し、障害処理装置内の情報処理装置毎に指定
されたログエリアにログデータを一時格納し、磁気記憶
装置等の記憶装置を持つサービスプロセッサ(SVP)
にログデータ格納要求を発行し、ログデータをサービス
プロセッサに引渡し、障害が発生した情報処理装置の再
起動を行なう障害処理を行なっていた。
【0003】再起動により情報処理装置は動作中となる
が、再び障害が起こると障害処理装置は、サービスプロ
セッサへのログデータの引渡しが完了していない場合は
、ログエリアが空き状態になるまでログエリアへのログ
データの格納が待たされ、ログエリアが空き状態になる
とログデータを採取し障害処理を開始していた。
【0004】また、特開平2ー143333に開示され
る障害処理技術では、一定のログエリアを障害発生の都
度循環させて使用することにより、ログエリアの使用率
を上げて高速な障害処理を実現しようとしている。
【0005】
【発明が解決しようとする課題】上述した従来の障害処
理装置は、情報処理装置毎にログエリアが定められてお
り、しかもログデータは磁気記憶装置等の記憶装置を持
つサービスプロセッサに引取られるまで保持されるので
、サービスプロセッサにログデータが引き取られる前に
同一情報処理装置の障害が多発し、指定されたログエリ
アが一杯になると障害処理装置の障害処理はログエリア
が空くまで待たされ、同一情報処理装置で障害が発生し
たとしても障害のいかんに関わらず情報処理装置のログ
データ全てを採取しているので、ログデータの採取に障
害処理の時間のほとんどを費やしてしまい高速な障害処
理が行なえないという欠点がある。
【0006】また、ログエリアを循環使用する場合では
、ログエリアにおけるログデータの格納アドレスの管理
などのために、制御ソフトウェアが煩雑になるという問
題がある。
【0007】本発明の目的は、障害が頻発する場合でも
、ログデータの採取および障害処理を遅滞無く高速に遂
行することが可能な障害処理技術を提供することにある
【0008】本発明の前記ならびにその他の目的と新規
な特徴は、本明細書の記述および添付図面から明らかに
なるであろう。
【0009】
【課題を解決するための手段】本願において開示される
発明のうち、代表的なものの概要を簡単に説明すれば、
下記のとおりである。
【0010】すなわち、請求項1記載の本発明の障害処
理装置は、個々の情報処理装置における障害部位を識別
可能にする情報処理装置状態テーブルと、この情報処理
装置状態テーブルにより障害部位判定を行いログデータ
量を決める障害部位判定部と、ログデータ量に対応した
大きさの異なる単位格納領域をそれぞれ有するログエリ
アと、各ログエリアにおける個々の単位格納領域の使用
状態を示すログエリア管理テーブルと、ログエリアの確
保の可否を判定するログエリア判定部と、ログエリアの
確保ができる場合にログデータの採取を行なうログデー
タ採取部とを備えたものである。
【0011】また、請求項2記載の本発明の障害処理装
置は、請求項1記載の障害処理装置において、任意の障
害発生におけるログデータ量に適合する規模の単位格納
領域を有するログエリアに空きが無いとき、ログデータ
量を変更するログ変更部を備えたものである。
【0012】
【作用】上記した請求項1記載の本発明の障害処理装置
では、障害部位対応にログデータ量を決め、ログデータ
量に対応した複数のログエリアを持つことにより、障害
が頻発する場合でも、ログデータの採取がまたされるこ
となく、障害処理を高速に行なうことができる。
【0013】また、上記した請求項2記載の本発明の障
害処理装置では、複数の情報処理装置における同一規模
の障害発生や、特定の情報処理装置における同一障害が
頻発した場合でも、ログデータ量を変更することで、規
模の異なる単位格納領域からなる他のログエリアを使用
することが可能となり、ログデータの採取がまたされる
ことなく、高速な障害処理を行なうことができる。
【0014】
【実施例1】次に、本発明の一実施例である障害処理装
置について図面を参照しながら詳細に説明する。
【0015】図1は本実施例の障害処理装置を含む情報
処理システムの構成の一例を示すブロック図であり、図
2,図3および図4は、本実施例の障害処理装置の内部
構成の一部をさらに詳細に例示した説明図である。
【0016】この実施例1における情報処理システムは
、複数の情報処理装置11,12,…,1nからなる情
報処理装置群1と、情報処理装置11〜1nに障害が発
生した場合、障害処理を行なう障害処理装置2と、障害
処理装置2からの要求によりログデータを引き取り、補
助記憶装置に記憶するサービスプロセッサ(SVP)3
とから構成されている。
【0017】障害処理装置2は、情報処理装置11〜1
nと対応した障害部位を識別できる情報処理装置状態テ
ーブル211,212,…,21nと、この情報処理装
置状態テーブル211〜21nにより障害部位判定を行
いログデータ量を決める障害部位判定部22と、複数種
のログデータ量に対応したログブロック(単位格納領域
)をそれぞれ含むログエリア241,242,…,24
nと、当該ログエリア241〜24nの使用状態を示す
ログエリア管理テーブル251,252,…,25nと
、ログエリアの確保ができるか否かを判定するログエリ
ア判定部23と、ログエリアの確保ができるとログデー
タ採取を行なうログデータ採取部26と、サービスプロ
セッサにログデータ格納要求を出し障害回復処理を行な
う障害処理部27とから構成されている。
【0018】各情報処理装置11〜1nの各々に対応し
て設けられている情報処理装置状態テーブル211〜2
1nの各々は、図2に例示されるように、複数の障害部
位の各々に対応したエントリ41〜エントリ4nを備え
ており、任意の情報処理装置11〜1nの一つにおいて
障害が発生したとき、対応する情報処理装置状態テーブ
ル211〜21nのうちの一つを参照することにより、
当該情報処理装置11〜1nにおける障害部位および当
該障害に対処するために必要なログデータ量などを把握
することが可能になっている。
【0019】ログエリア241〜24nの各々は、図4
に例示されるように、所定の記憶容量を有する複数のロ
グブロック61〜ログブロック6nで構成されており、
各ログエリア241〜24nの各々における、個々のロ
グブロック61〜ログブロック6nの容量は異なってい
る。たとえば、ログエリア241では、個々のログブロ
ックの容量が16kBであり、ログエリア242では、
個々のログブロックの容量が32kBである、といった
構成になっている。
【0020】そして、ログエリア241〜24nの各々
に対応したログエリア管理テーブル251〜25nには
、図3に例示されるように、個々のログエリアに所属す
るログブロックの各々に対応した、使用フラグ511〜
51nと、対応するログブロック61〜6nを識別する
ログブロック番号521〜52nが記録されたエントリ
が設けられており、使用フラグ511〜51nを参照す
ることにより、各ログエリア241〜24n毎に当該ロ
グエリアに所属するログブロックが使用中か否かを知る
ことができるようになっている。
【0021】以下、本実施例の障害処理装置2およびそ
れを含む情報処理装置の作用の一例を、図6のフローチ
ャートなどを参照しながら詳細に説明する。
【0022】情報処理装置群1の中のいずれかの情報処
理装置に障害が発生すると、障害処理装置2は、その報
告を受けて障害処理を起動する。
【0023】まず、障害部位判定部22は障害の発生し
た情報処理装置112と対応した情報処理装置状態テー
ブル212を参照して障害部位とログデータ量を決め(
処理71)、ログエリア判定部23は、前記ログデータ
量に適合したサイズのログブロックを有するログエリア
241を選択し(処理72)、選択されたログエリアの
使用状態をログエリア管理テーブル251の使用フラグ
511〜51nを参照して調べる。
【0024】そして、ログエリア241のログブロック
61〜6nの一つが空いていると判断する(処理73)
と(たとえばログブロック62が空きの場合)、ログデ
ータの採取をログデータ採取部26に指示し、当該ログ
データ採取部26は、当該情報処理装置112の内部か
らログデータを採取してログブロック62に転送し、ロ
グエリア管理テーブル251の、当該ログブロック62
に対応した使用フラグ512をセット(使用中表示)す
る(処理75)。
【0025】このような、ログデータの採取が終了する
と障害処理部27はサービスプロセッサ3に対してログ
データ格納要求を出す(処理76)。そして、当該情報
処理装置112の再起動を行なう障害回復処理を実行す
る(処理77)。サービスプロセッサ3がログデータ格
納を終了するとログエリア判定部23はログエリア管理
テーブル251の、ログブロック62に対応した使用フ
ラグ512をリセット(空き表示)しログエリアを解放
し、次の障害発生に備える。
【0026】また、処理73において、対応するログエ
リア241がない場合には、当該ログエリア241のロ
グブロック61〜6nに空きができるまで待ち、処理7
2に戻る。
【0027】ここで、サービスプロセッサ3がログデー
タを格納するまでに情報処理装置群1から障害が発生し
た場合、障害部位が異なれば、すなわちログデータ量が
異なる場合は、使用中のログブロック62以外の他のロ
グエリア242,…,24nを使用してログデータの採
取を行ない、また、同一障害部位の場合には、すなわち
ログデータ量が同じ場合には、おなじログエリア241
に属する他の空いているログブロック61,63〜6n
を使用してログデータの採取を遂行する。
【0028】これにより、種々の障害が頻発し、先行す
る障害に関するログデータが残っている場合でも、障害
処理が待たされることがなく、高速に障害処理を遂行す
ることができる。
【0029】また、所定の大きさのログブロック61〜
6nを単位としてログエリア251〜25nの管理を行
うので、たとえば特定領域を循環使用する場合のような
煩雑なアドレス管理などが不要となり、制御ソフトウェ
アやハードウェアの規模を簡略化することができる。
【0030】
【実施例2】図5は、本発明の他の実施例である障害処
理装置を含む情報処理システムの構成の一例を示すブロ
ック図であり、図7は、その作用の一例を示すフローチ
ャートである。
【0031】本実施例2の情報処理システムは、複数の
情報処理装置11,12,…,1nからなる情報処理装
置群1と、情報処理装置11〜1nに障害が発生した場
合、障害処理を行なう障害処理装置8と、障害処理装置
8からの要求によりログデータを引き取り、補助記憶装
置に記憶するサービスプロセッサ3とから構成されてい
る。
【0032】障害処理装置8は、情報処理装置と対応し
た障害部位を識別できる情報処理装置状態テーブル21
1,212,…,21nと、このテーブルにより障害部
位判定を行いログデータ量を決める障害部位判定部22
と、ログデータ量に対応したログエリア241,242
,…,24nと、そのログエリアの使用状態を示すログ
エリア管理テーブル251,252,…,25nと、ロ
グエリアの確保ができるか判定するログエリア判定部2
3と、ログエリアの確保ができるとログデータ採取を行
なうログデータ採取部26と、サービスプロセッサ3に
ログデータ格納要求を出し障害回復処理を行なう障害処
理部27とを備えており、これら各部は、上記実施例1
の場合と同様である。
【0033】この実施例2の場合、障害処理装置8は、
ログ変更部81を備えている。
【0034】すなわち、ログ変更部81は、障害部位判
定と対応したログエリア管理テーブルにてログエリアが
全て使用中の時、たとえば、当該障害の解析に最小限必
要な情報を当初のログデータから抽出してログデータ量
を削減することなどによって、ログデータ量を変更する
動作を行うとともに、変更後のログデータ量に対応した
ログエリアの使用状態を調べて選択する動作を行うもの
である。
【0035】以下、本実施例2の障害処理装置およびそ
れを含む情報処理装置の作用の一例を説明する。
【0036】情報処理装置群1の中のいずれかの情報処
理装置に障害が発生すると、障害処理装置8は、その報
告を受けて上述の障害処理を起動する。
【0037】そして、処理71〜処理73まで、実施例
1の場合と同様の処理を遂行し、処理73において、当
該ログデータ量に適合したサイズのログブロックを有す
る、たとえばログエリア241の複数のログブロック6
1〜6nがすべて使用中である場合には、ログ変更部8
1を起動してログデータ量を変更し(処理74A)、処
理72に戻って、変更後のログデータ量に対応した他の
ログエリア242,…,24nを使用してログデータの
採取を行う。
【0038】これにより、ログデータ量の規模が同様の
障害が多発する場合でも、ログデータの採取を確実に行
なうとともに、障害処理を高速に行なうことができる。
【0039】以上本発明者によってなされた発明を実施
例に基づき具体的に説明したが、本発明は前記実施例に
限定されるものではなく、その要旨を逸脱しない範囲で
種々変更可能であることはいうまでもない。
【0040】
【発明の効果】本願において開示される発明のうち、代
表的なものによって得られる効果を簡単に説明すれば、
以下のとおりである。
【0041】すなわち、請求項1記載の本発明の障害処
理装置によれば、障害が頻発する場合でも、ログデータ
の採取および障害処理を遅滞無く高速に遂行することが
できるという効果が得られる。
【0042】また、請求項2記載の本発明の障害処理装
置によれば、ログデータ量の規模が同様の障害が多発す
る場合でも、ログデータの採取を確実に行なうとともに
、障害処理を高速に行なうことができるという効果が得
られる。
【図面の簡単な説明】
【図1】本発明の一実施例である障害処理装置を含む情
報処理システムの構成の一例を示すブロック図である。
【図2】本発明の一実施例である障害処理装置の内部構
成の一部をさらに詳細に例示した説明図である。
【図3】本発明の一実施例である障害処理装置の内部構
成の一部をさらに詳細に例示した説明図である。
【図4】本発明の一実施例である障害処理装置の内部構
成の一部をさらに詳細に例示した説明図である。
【図5】本発明の他の実施例である障害処理装置を含む
情報処理システムの構成の一例を示すブロック図である
【図6】本発明の一実施例である障害処理装置の作用の
一例を示すフローチャートである。
【図7】本発明の他の実施例である障害処理装置の作用
の一例を示すフローチャートである。
【符号の説明】
1  情報処理装置群 2  障害処理装置 3  サービスプロセッサ(SVP) 8  障害処理装置 11〜1n  情報処理装置 22  障害部位判定部 23  ログエリア判定部 26  ログデータ採取部 27  障害処理部 41〜4n  エントリ 61〜6n  ログブロック(単位格納領域)81  
ログ変更部 211〜21n  情報処理装置状態テーブル241〜
24n  ログエリア 251〜25n  ログエリア管理テーブル511〜5
1n  使用フラグ 521〜52n  ログブロック番号

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】  複数台の情報処理装置とサービスプロ
    セッサとの間に介在し、前記情報処理装置に障害が発生
    したとき、該情報処理装置から障害発生時のデータ採取
    を行い、ログエリアに一時的に障害情報として記憶して
    おき、ログデータ格納要求をサービスプロセッサに発行
    して、前記障害情報を含むログデータを前記サービスプ
    ロセッサに引き渡し、障害処理を行なう障害処理装置で
    あって、個々の前記情報処理装置の各々における障害部
    位を識別する情報処理装置状態テーブルと、この情報処
    理装置状態テーブルにより障害部位判定を行いログデー
    タ量を決める障害部位判定部と、複数種のログデータ量
    に対応した少なくとも一つの単位格納領域をそれぞれ含
    む複数のログエリアと、このログエリアの各々における
    前記単位格納領域の使用状態を示すログエリア管理テー
    ブルと、前記ログエリアの確保の可否を判定するログエ
    リア判定部と、前記ログエリアの確保が可能な場合に前
    記ログデータの採取を行なうログデータ採取部とを有す
    ることを特徴とする障害処理装置。
  2. 【請求項2】  複数台の情報処理装置とサービスプロ
    セッサとの間に介在し、前記情報処理装置に障害が発生
    したとき、該情報処理装置から障害発生時のデータ採取
    を行い、ログエリアに一時的に障害情報として記憶して
    おき、ログデータ格納要求をサービスプロセッサに発行
    して、前記障害情報を含むログデータをサービスプロセ
    ッサに引き渡し、障害処理を行なう障害処理装置であっ
    て、個々の前記情報処理装置の各々における障害部位を
    識別する情報処理装置状態テーブルと、このテーブルに
    より障害部位判定を行いログデータ量を決める障害部位
    判定部と、複数種のログデータ量に対応した少なくとも
    一つの単位格納領域をそれぞれ含む複数のログエリアと
    、このログエリアにおける前記単位格納領域の使用状態
    を示すログエリア管理テーブルと、前記ログエリアの確
    保の可否を判定するログエリア判定部と、前記ログエリ
    アの確保が可能な場合に前記ログデータの採取を行なう
    ログデータ採取部と、前記障害による前記ログデータ量
    に適合する前記ログエリアが全て使用中の時、前記ログ
    データ量を変更するログ変更部とを有することを特徴と
    する障害処理装置。
JP3145777A 1991-06-18 1991-06-18 障害処理装置 Expired - Fee Related JP3014490B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3145777A JP3014490B2 (ja) 1991-06-18 1991-06-18 障害処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3145777A JP3014490B2 (ja) 1991-06-18 1991-06-18 障害処理装置

Publications (2)

Publication Number Publication Date
JPH04369067A true JPH04369067A (ja) 1992-12-21
JP3014490B2 JP3014490B2 (ja) 2000-02-28

Family

ID=15392929

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3145777A Expired - Fee Related JP3014490B2 (ja) 1991-06-18 1991-06-18 障害処理装置

Country Status (1)

Country Link
JP (1) JP3014490B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007099593A1 (ja) * 2006-02-28 2007-09-07 Fujitsu Limited 監視装置、監視プログラム、および情報処理システム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02143333A (ja) * 1988-11-24 1990-06-01 Nec Corp 障害処理装置
JPH0392941A (ja) * 1989-09-06 1991-04-18 Hitachi Ltd 領域管理方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02143333A (ja) * 1988-11-24 1990-06-01 Nec Corp 障害処理装置
JPH0392941A (ja) * 1989-09-06 1991-04-18 Hitachi Ltd 領域管理方式

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007099593A1 (ja) * 2006-02-28 2007-09-07 Fujitsu Limited 監視装置、監視プログラム、および情報処理システム
US7925745B2 (en) 2006-02-28 2011-04-12 Fujitsu Limited Monitoring apparatus, executive program, and information processing system

Also Published As

Publication number Publication date
JP3014490B2 (ja) 2000-02-28

Similar Documents

Publication Publication Date Title
JPH04369067A (ja) 障害処理装置
CA1273437A (en) Apparatus for input/output notification to a processor
EP0320876A2 (en) Fault information collection processing system
CN117076341A (zh) 数据存储方法、装置、计算机设备及计算机可读存储介质
JP2936170B2 (ja) 障害処理方式
JP2842766B2 (ja) 情報処理システム
JP2784520B2 (ja) ファイル転送装置
JP2533636B2 (ja) Ras情報収集方法
JPH04328646A (ja) 障害情報の採取方式
JP3013993B2 (ja) ベクトル処理方式
JPS593531A (ja) 端末出力処理方式
JPH05197597A (ja) プログラム組み込み型プロセッサ装置におけるエラーロギング方式
Potter et al. No. 1 ESS ADF: Magnetic tape subsystem
JPH01149123A (ja) 出力プリンタ変更方式
JPH0752400B2 (ja) 診断装置付電子計算機システム
JPH02216549A (ja) 発生頻度別ロギング情報格納方式
JPH0836515A (ja) ファイル復旧方式
JPH03657B2 (ja)
JPH05108445A (ja) ジヤーナル採取方式
JP2001148708A (ja) ネットワーク管理システム及びネットワーク管理プログラムを記録した記録媒体
JPH0511328B2 (ja)
JPH04165402A (ja) 製造管理システム
JPH044643A (ja) 通信制御装置
JPS6273341A (ja) 情報処理装置
JPS5999558A (ja) メモリ・ダンプ方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees