JPH04302342A - 故障診断方法 - Google Patents

故障診断方法

Info

Publication number
JPH04302342A
JPH04302342A JP3066623A JP6662391A JPH04302342A JP H04302342 A JPH04302342 A JP H04302342A JP 3066623 A JP3066623 A JP 3066623A JP 6662391 A JP6662391 A JP 6662391A JP H04302342 A JPH04302342 A JP H04302342A
Authority
JP
Japan
Prior art keywords
bus
service processor
maintenance register
control means
functional unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3066623A
Other languages
English (en)
Other versions
JPH0776948B2 (ja
Inventor
Koji Kanamaru
孝二 金丸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PFU Ltd
Original Assignee
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PFU Ltd filed Critical PFU Ltd
Priority to JP3066623A priority Critical patent/JPH0776948B2/ja
Publication of JPH04302342A publication Critical patent/JPH04302342A/ja
Publication of JPH0776948B2 publication Critical patent/JPH0776948B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は故障診断方式に関し、特
に、バスを2重化した高信頼性コンピュータシステムに
おいて、バスエラー発生時の原因調査の困難性を解決す
るために、バス毎に独立してアクセス可能なレジスタを
設け、故障中のバスからアクセスを行い、そのエラー情
報から故障個所を推測することにより、故障個所を容易
に切り分けることができるようにした故障診断方式に関
する。
【0002】一般のシステムでは、コンピュータを構成
するシステムバスの故障等で、そのシステムバスにバス
エラーが発生すると、原因不明の状態でコンピュータが
システムダウンしてしまうことがある。予めシステムダ
ウンを予測しているならば、システムの停止時にそのバ
スの故障個所の調査を行えばよいが、システムダウンを
許さない高信頼性システムではシステムを停止して原因
調査を行うことができない。従って、運転を停止するこ
となく故障個所を調査する手段が必要である。
【0003】
【従来の技術】図6は従来の高信頼性システムの構成図
であり、図7は故障の説明をタイミングチャートで示し
たものである。一般に、高信頼性システムでは同一機能
を有する機能ユニット(マイクロプロセッサ等)を複数
並列接続し、かつこれらは複数のバスに並列接続された
構成をとる。(A)に示すように、現用系のバス1と待
機系のバス2を設け、故障時には一方のバスに切り換え
て運用を保持しシステムダウンにならないような構成を
採用している。ホストコンピュータ(CPU)を含む各
機能ユニット1,2,3,・・・は、各内部のバス切換
部SWを介して両方のバス1及び2に接続されている。 通常の状態ではバス切換部SWはバス制御部BCの制御
のもとでバス1側に接続されており、例えば、機能ユニ
ット1からの処理アクセスは、実線で示すようにバス1
を経て所定の機能ユニット(例えば、機能ユニット3)
の処理部にて処理される。従って、従来構成ではバス制
御部は接続されたバス側にのみ接続されることになる。
【0004】ここで、バス1上の“X”にてバスエラー
が発生したとすると、(B)に示すように、バスエラー
のメッセージを送出した後にバス1を故障状態として記
録してソフトウェアの処理から切り離し、全ての処理を
バス2を使用して行うことによりシステムダウンするこ
となく処理を続行する。即ち、バス1の点線で示す経路
は故障中であるから、バス切換部SWを切り換えてバス
2側に接続して機能ユニット3に処理アクセスを送出す
る。このように高信頼性システムではバスの切り換え機
能を各機能ユニットが備え、システムダウンすることな
く処理を続行して高信頼性を確保している。
【0005】図8はバスエラーの処理フローチャートで
ある。バスエラーが発生すると、エラー情報のロギング
を行い(ステップ1)、バスエラーを発生したバス1か
ら待機系のバス2への切り換えを行った後(ステップ2
)、処理アクセスをリトライし(ステップ3)、リトラ
イが成功したか否か判定し(ステップ4)、リトライが
成功したならば(YES)、アクセス処理を続行する(
ステップ5)。しかし、ステップ4にてリトライが不成
功であれば(NO)、エラー情報のロギングを行い(ス
テップ6)、システムダウンとする(ステップ7)。
【0006】
【発明が解決しようとする課題】しかしながら、上述の
ように、故障が発生したときに単に現用系から待機系に
バス切換を行う構成では、機能ユニットの全てが処理実
行中のバス2に接続されるので、各機能ユニット内の故
障ならば調査診断のためのアクセス可能であるが、例え
ばバスと機能ユニット間の図示しないバスドライバの故
障では、バス1を使用して機能ユニットのレジスタRを
アクセスしようとしても応答が返らず、従って、どこが
故障したか分からず故障部分の調査を行うことができな
いという問題がある。
【0007】一方、図9は上述の問題に対処した従来の
故障調査アクセスの方法である。図示のように、バス1
が故障中でバス2を使用して処理アクセスが一旦終了し
たとすると、処理の終結後に全ての機能ユニットのバス
切換部SWを故障中のバス1側に切り換えた後、CPU
を含む機能ユニット1から特殊コマンドを送出し各機能
ユニットをバス1に切り換え、各機能ユニットのレジス
タを順次アクセスして、故障個所判断通知を行い、最後
にバス2側に切り換えてその後に次の処理を行うように
している。ここで、特殊コマンドとは、例えばDMAの
バス切換に使用するバス一斉切換コマンドを利用する。
【0008】しかし、この方法では図示のように各レジ
スタをアクセスしている間は次の処理までの間が停止時
間となり、処理の一時停止を許さない高信頼性システム
では問題である。本発明の目的は、高信頼性システムの
故障診断において、アクセス中の処理を中断することな
く故障診断調査を行うことができる故障診断方式を提供
することにある。
【0009】
【課題を解決するための手段】図1は本発明の原理構成
図である。本発明は、現用系のバス1と待機系のバス2
を配置し、複数の機能ユニット1〜3を前記両方のバス
に接続して冗長構成をとる高信頼性システムにおいて、
該機能ユニットの何れかをサービスプロセッサとして使
用するか、若しくは該現用系バス及び待機系バスによっ
て共用されるサービスプロセッサ4(図2)を設け、さ
らに、各機能ユニット内にバス制御手段BCと該バス制
御手段に接続された保守レジスタHRを備え、かつ該バ
ス制御手段と保守レジスタの対は該現用系のバス及び待
機系のバスの各々に設けられ、故障の調査診断に際して
、該サービスプロセッサは各機能ユニットの該保守レジ
スタを故障中のバスを経てアクセスし、アクセス結果か
らバスエラーの発生箇所を推測することを特徴とする。
【0010】
【作用】本発明では何れかの機能ユニットにサービスプ
ロセッサの機能を持たせるか、若しくは新たなサービス
プロセッサを接続し、このサービスプロセッサを用いて
各機能ユニット内の保守レジスタを故障中のバスを経て
参照し、他のバスで処理アクセスを続行しながら、調査
診断を行うようにしたものである。
【0011】
【実施例】図2は本発明の一実施例構成図であり、図3
は本発明の処理タイミングチャートである。図中、4は
サービスプロセッサ(SVP)であり、内部のバス切換
部SWにより現用系のバス1又は待機系のバス2に接続
される。HRは保守レジスタでありバス制御部BCとと
もに、サービスプロセッサ4を除く全ての機能ユニット
1〜3に内蔵される。しかも図示のように各機能ユニッ
ト内にバス1及びバス2の両方に対して設けられる。従
って、保守レジスタHRは機能ユニットの接続状態にか
かわらず両方のバスからアクセスすることができる。
【0012】また、サービスプロセッサ4は他の機能ユ
ニットと同等のプロセッサで充分である。そして、図示
のように、機能ユニット1〜3のバス切換部SWは故障
していないバス2の側に接続されているが、サービスプ
ロセッサ4のバス切換部SWは故障したバス1の側に接
続されている。このように接続することによりサービス
プロセッサ側から故障中のバス1を経て処理アクセスと
競合することなく故障診断アクセス行うことができる。
【0013】図3に示すようにバス1を使用してアクセ
ス処理中にバスエラー“X”が発生すると、バス2に切
り換えられ処理が続行されるが、後述するようにサービ
スプロセッサ4から故障中のバス1を用いて処理アクセ
スと調査アクセスが競合しないようにして故障調査を行
うことができる。即ち、サービスプロセッサ4は処理ア
クセスとは独立して稼働し、サービスプロセッサ4から
故障中のバス1を使用して保守レジスタHRのアクセス
を行い、アクセス時におけるバスエラーの有無と、保守
レジスタHRに記録されたバスエラー検出履歴情報等を
チェックする。そして、複数の機能ユニットのレジスタ
がバスエラーを検出或いはアクセス時にバスエラーを発
生したときはバス自体の故障であり、1つの機能ユニッ
トのレジスタのみがバスエラーを検出或いはアクセス時
にバスエラーを発生したときは、その機能ユニットの故
障であると判断する。
【0014】図4は本発明の保守レジスタの一実施例構
成図である。図示のように、エラー検出履歴として、ア
ダプタエラー、コントロールバスエラー、データバスエ
ラー、アドレスバスエラー等を規定し、各エラーの格納
スペースを設け、さらに切換状態の表示スペースを設け
る。そして、各機能ユニット(アダプタ)種を表示する
スペースを設ける。
【0015】図5は本発明の一実施例処理フローチャー
トである。前述のように、サービスプロセッサから保守
レジスタのアクセスを行うが、まず、サービスプロセッ
サから各アダプタをアクセスし(ステップ1)、バスエ
ラーが発生しているか否か判定し(ステップ2)、発生
していれば(YES)バスエラーの発生したアダプタを
記録する(ステップ3)。
【0016】一方、バスエラーが発生していなければ(
NO)保守レジスタ内容を記録し(ステップ4)、次に
、全てのアダプタをアクセスしたか判定し(ステップ5
)、全てのアダプタをアクセスしていなければ(NO)
ステップ1に戻り、全てのアダプタをアクセスしていれ
ば(YES)、次にバスエラーの発生したアダプタは複
数あるか否か判定し(ステップ6)、複数のアダプタで
あれば(YES)マザーボード、即ち、システムバスの
故障と判断し、サービスプロセッサ又は複数のアダプタ
を接続したマザーボードの交換を促す表示を行い(ステ
ップ7)、1つのアダプタのみであれば(NO)、サー
ビスプロセッサはバスエラーの発生したアダプタの交換
を促す表示を行い(ステップ8)、そして、アダプタエ
ラーが表示されているアダプタの交換を促す表示を行う
(ステップ9)。
【0017】なお、バス自体の故障の場合は、前述のよ
うにマザーボードを交換するためにシステムを一時停止
させなくてはならないが、実際問題としてマザーボード
の故障率は非常に低く、ステップ7による影響は殆ど無
視することができる。
【0018】
【発明の効果】以上説明したように、本発明によれば、
高信頼性システムにおいて、現用系のバスに故障が発生
してもシステムを停止することなく高信頼性システムで
の処理を続行しつつ故障個所を調査診断することができ
るので、故障調査に要する時間を時間を大幅に低減する
ことができ、かつ信頼性の高いサービスを行うことがで
きる。
【図面の簡単な説明】
【図1】本発明の原理構成図である。
【図2】本発明の一実施例構成図である。
【図3】本発明の処理タイミングチャートである。
【図4】本発明の一実施例保守レジスタの構成図である
【図5】本発明の一実施例処理フローチャートである。
【図6】従来の構成図である。
【図7】従来の処理タイミングチャートである。
【図8】従来の処理フローチャートである。
【図9】従来の対処を説明する処理タイミングチャート
である。
【符号の説明】
1〜3…機能ユニット 4…サービスプロセッサ SW…バス切換部 BC…バス制御部 HR…保守レジスタ CPU…ホストコンピュータ SVP…サービスプロセッサ

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】  現用系のバス(1)と待機系のバス(
    2)を配置し、複数の機能ユニット(1〜3)を前記両
    方のバスに接続して冗長構成をとる高信頼性システムに
    おいて、該機能ユニットの何れかをサービスプロセッサ
    として使用し、さらに、各機能ユニット内にバス制御手
    段(BC)と該バス制御手段に接続された保守レジスタ
    (HR)を備え、かつ該バス制御手段と保守レジスタの
    対は該現用系のバス及び待機系のバスの各々に設けられ
    、故障の調査診断に際して、該サービスプロセッサは各
    機能ユニットの該保守レジスタを故障中のバスを経てア
    クセスし、アクセス結果からバスエラーの発生箇所を推
    測することを特徴とする故障診断方式。
  2. 【請求項2】  現用系のバス(1)と待機系のバス(
    2)を配置し、複数の機能ユニット(1〜3)を前記両
    方のバスに接続して冗長構成をとる高信頼性システムに
    おいて、該現用系バス及び待機系バスによって共用され
    るサービスプロセッサ(4)を接続し、さらに、各機能
    ユニット内にバス制御手段(BC)と該バス制御手段に
    接続された保守レジスタ(HR)を備え、かつ該バス制
    御手段と保守レジスタの対は該現用系のバス及び待機系
    のバスの各々に設けられ、故障の調査診断に際して、該
    サービスプロセッサは各機能ユニットの該保守レジスタ
    を故障中のバスを経てアクセスし、アクセス結果からバ
    スエラーの発生箇所を推測することを特徴とする故障診
    断方式。
  3. 【請求項3】  該保守レジスタはエラー検出履歴とし
    て、アダプタエラー、コントロールエラー、データバス
    エラー、アドレスバスエラーを格納する請求項1又は2
    に記載の故障診断方式。
  4. 【請求項4】  該保守レジスタはさらに切換状態の表
    示とアダプタ種の表示を格納する請求項1又は2に記載
    の故障診断方式。
JP3066623A 1991-03-29 1991-03-29 故障診断方法 Expired - Lifetime JPH0776948B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3066623A JPH0776948B2 (ja) 1991-03-29 1991-03-29 故障診断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3066623A JPH0776948B2 (ja) 1991-03-29 1991-03-29 故障診断方法

Publications (2)

Publication Number Publication Date
JPH04302342A true JPH04302342A (ja) 1992-10-26
JPH0776948B2 JPH0776948B2 (ja) 1995-08-16

Family

ID=13321201

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3066623A Expired - Lifetime JPH0776948B2 (ja) 1991-03-29 1991-03-29 故障診断方法

Country Status (1)

Country Link
JP (1) JPH0776948B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5596322B2 (ja) * 2009-09-18 2014-09-24 エヌイーシーコンピュータテクノ株式会社 多重化サービスプロセッサ、多重化サービスプロセッサの障害処理方法、およびプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5897765A (ja) * 1981-12-04 1983-06-10 Matsushita Electric Ind Co Ltd マルチプロセツサ−システムの共通バス方式
JPS60134352A (ja) * 1983-12-21 1985-07-17 Hitachi Ltd 二重化バス制御装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5897765A (ja) * 1981-12-04 1983-06-10 Matsushita Electric Ind Co Ltd マルチプロセツサ−システムの共通バス方式
JPS60134352A (ja) * 1983-12-21 1985-07-17 Hitachi Ltd 二重化バス制御装置

Also Published As

Publication number Publication date
JPH0776948B2 (ja) 1995-08-16

Similar Documents

Publication Publication Date Title
JPH0792765B2 (ja) 入/出力コントローラ
US5742851A (en) Information processing system having function to detect fault in external bus
KR100566340B1 (ko) 정보 처리 장치
JPS6119061B2 (ja)
JPH06259343A (ja) 多重バス制御方式及びそれを用いたシステム
JPH04302342A (ja) 故障診断方法
JPS62236056A (ja) 情報処理システムの入出力制御装置
JPH0754947B2 (ja) 予備系監視方式
JP3230798B2 (ja) 冗長システム
JP3291729B2 (ja) 二重化計算機システム
JPS5870670A (ja) 二重系の交換機の障害情報転送方式
JP2001175545A (ja) サーバシステムおよび障害診断方法ならびに記録媒体
JPH079636B2 (ja) バス診断装置
JP4027008B2 (ja) 通信制御装置
JPH07114521A (ja) マルチマイクロコンピュータシステム
JPH03160529A (ja) 二重化計算機システム
JPH05289896A (ja) フォールトトレラントコンピュータ
JPS6113627B2 (ja)
JPS59123056A (ja) 冗長機能自動切替システム
JPS6367646A (ja) 障害箇所切離し機能付情報処理システム
JPH08314843A (ja) 計算機システム
JPH0879281A (ja) バス故障診断方式
JPH0844682A (ja) 耐故障性計算機の制御方式
JPH04241038A (ja) 高信頼化コンピュータシステム及びその復旧方法並びにプロセッサボード及びその交換方法
JPH08137709A (ja) 情報処理システム