JPH04213738A - データ処理装置の異常検出方式 - Google Patents

データ処理装置の異常検出方式

Info

Publication number
JPH04213738A
JPH04213738A JP2401593A JP40159390A JPH04213738A JP H04213738 A JPH04213738 A JP H04213738A JP 2401593 A JP2401593 A JP 2401593A JP 40159390 A JP40159390 A JP 40159390A JP H04213738 A JPH04213738 A JP H04213738A
Authority
JP
Japan
Prior art keywords
cpu
signal
bus
failure
nmi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2401593A
Other languages
English (en)
Inventor
Kazuhiro Kushitani
和浩 櫛谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Computer Engineering Corp
Original Assignee
Toshiba Corp
Toshiba Computer Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Computer Engineering Corp filed Critical Toshiba Corp
Priority to JP2401593A priority Critical patent/JPH04213738A/ja
Publication of JPH04213738A publication Critical patent/JPH04213738A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、データ処理装置の異
常検出方式に関する。
【0002】
【従来の技術】一般に、コンピュータシステムにおいて
は、障害発生によってシステム停止、暴走、ハングアッ
プ等の状況を作り出さないために、障害の発生時点でそ
れを検出して、その波及を最小限に止めることが要求さ
れている。
【0003】このため、従来では、異常検出回路によっ
てマイクロプロセッサの障害発生を検出した際に、その
マイクロプロセッサを直ぐに初期化する方式が採用され
ていた。
【0004】異常検出回路としては、ウォッチドッグタ
イマ(WDT;watch dog timer )が
良く知られている。このウォッチドッグタイマ(WDT
)は、一定周期ごとにカウンタをリセットすることによ
ってプログラムの異常ループや暴走を検知するものであ
る。このウォッチドッグタイマは、監視計時機構とか、
ハートビート回路と称されることもある。
【0005】例えば、ウォッチドッグタイマを(WDT
)利用した異常検出回路は、プログラムループ中に挿入
したWDT用の信号出力命令によるパルスが一定時間内
に出力されるか否かを調べ、この出力が時間内に無い場
合に、マイクロプロセッサが暴走していると認識して、
マイクロプロセッサをリセットするように構成されてい
る。
【0006】この様に、従来は、異常を検知した時点で
直ぐに初期化が行われるので、障害発生に至るまでの情
報を保持できず、障害発生の原因を認識する事が困難で
あった。
【0007】
【発明が解決しようとする課題】従来では、異常を検知
した時点で直ぐに初期化が行われるので、障害発生に至
るまでの情報を保持できず、障害発生の原因を認識する
事が困難となる欠点があった。
【0008】この発明はこのような点に鑑みてなされた
もので、異常検知時に障害発生に至るまでの情報を保持
できるようにして、障害発生の原因認識を容易に実行す
る事を可能とする異常検出方式を提供することを目的と
する。
【0009】
【課題を解決するための手段および作用】この発明によ
る異常検出方式は、障害発生の検出時にCPUを初期化
するように構成されたデータ処理装置において、前記C
PUの動作監視をする監視手段と、この監視手段によっ
て前記CPUの障害が検出された際、前記CPUに対し
て割り込み信号を供給してレジスタ内容の退避を実行さ
せる割り込み手段と、前記割り込み信号が前記CPUに
よって受け付けられたか否かを監視し、受け付けられな
かった際に前記CPUの待機状態を解除するためのステ
ータス信号を発生する手段と、前記CPUによるレジス
タ内容の退避処理が起動されるまでの実行過程を示す情
報を管理する管理手段とを具備し、前記CPUの初期化
前に前記レジスタ内容を退避すると共に、その初期化後
に前記管理手段の内容を参照して障害発生の原因を検出
する事を特徴とする。
【0010】この異常検出方式においては、CPUの障
害が検出された際に、CPUに対して割り込み信号が供
給されてレジスタ内容の退避のための割り込み処理が起
動され、その後でその初期化が行われる。一方、割り込
み信号がCPUによって受け付けられなかった場合には
、CPUの待機状態を解除するためのステータス信号が
発生され、レジスタ内容の退避処理が促される。退避処
理が起動されるまでのこの様な実行過程は、管理手段で
管理されており、その初期化後にその管理手段の内容を
参照することによって障害発生の原因を検出する事がで
きる。
【0011】
【実施例】以下、図面を参照してこの発明の実施例を説
明する。
【0012】図1にはこの発明の一実施例に係わる異常
検出方式を実現するためのデータ処理装置の構成が示さ
れている。このデータ処理装置は、内部バスを介して複
数のプロセッサボードが結合されて成るマルチプロセッ
サシステムを構成する1つのプロセッサボードであり、
CPU1 、ウォッチドッグタイマ(WDT)2 、N
MI(non−maskable interrupt
)出力回路5 、タイマ7 、REDY出力回路9 、
ANDゲート12、リセット回路15、およびステータ
スレジスタ17を備えている。
【0013】CPU1 は、このプロセッサボード全体
の制御を司どるものであり、正常動作時には定期的にト
リガパルスTRGを発生し、ライン3 を介してウォッ
チドッグタイマ(WDT)2 に供給する。
【0014】ウォッチドッグタイマ(WDT)2 は、
CPU1 の動作を監視するためのものであり、トリガ
パルスTRGが所定期間以上発生されなかった際にCP
U1 の暴走を検知して、異常検知信号EDを発生する
。この異常検知信号EDは、ライン4 を介してNMI
出力回路5 、タイマ7 、およびステータスレジスタ
17に供給される。NMI出力回路5 は、異常検知信
号EDの検知後直ちにマスク不能な割り込み信号(NM
I)を出力して、CPU1 に供給する。
【0015】タイマ7 は、異常検知信号EDによって
起動され、所定期間経過後にREADY出力回路9 ,
リセット回路15に出力指令OUT1 ,2 を供給す
る。ここで、出力指令OUT2 は、出力指令OUT1
 よりも一定時間遅れて発生される。
【0016】READY出力回路9 は、出力指令OU
T1 によって起動されてREADY信号を発生する。 このREADY信号はANDゲート12の一方の入力に
供給され、そのANDゲート12の他方の入力にはバス
リクエスト信号が供給される。このバスリクエスト信号
は、図2で後述するが、このプロセッサボードが他のボ
ードをアクセスしている事を示すものである。バスリク
エスト信号の発生中にREADY信号が発生されると、
そのREADY信号はCPU1 に供給されると共に、
ステータスレジスタ17に供給される。また、READ
Y出力回路9 は、CPU1 からのNMI受付信号A
CKを受信するとディセーブル状態に設定され、REA
DY信号の発生動作が禁止される。
【0017】リセット回路15は、出力指令OUT2 
によって起動されてリセット信号CLRを発生する。こ
のリセット信号CLRは、CPU1 に供給されると共
に、ステータスレジスタ17にも供給される。
【0018】ステータスレジスタ17は、ウォッチドッ
グタイマ(WDT)からの異常検知信号ED、CPU1
 からのNMI受付信号ACK、ANDゲート12から
のREADY信号、リセット回路15からのクリア信号
CLRをラッチする。次に、図1のプロセッサボードに
おける障害検出動作を説明する。
【0019】通常、CPU1 は、ウォッチドッグタイ
マ(WDT)2 に対して定期的にトリガ信号TRGを
送信している。しかし、暴走等の障害発生によってトリ
ガ信号TRGが途絶えると、それによってウォッチドッ
グタイマ(WDT)2 は障害の発生を検知し、異常検
知信号EDをNMI出力回路、タイマ7 、ステータス
レジスタ17に供給する。NMI出力回路5 は、異常
検知信号EDを検知すると、ライン6 を介してCPU
1に割り込み信号NMIを供給する。ここで、CPU1
 が割り込み信号NMIを受け付けた場合と受け付けな
い場合とでは処理が異なる。まず、CPU1 が割り込
み信号NMIを受け付けた場合について説明する。
【0020】CPU1 が割り込み信号NMIを受け付
けると、所定の割り込み処理が起動され、CPU1 の
内部レジスタの内容がメモリ上に退避される。そして、
CPU1は、NMI受付信号ACKを発生する。NMI
受付信号ACKは、READY出力回路9 をディセー
ブル状態に設定すると共に、ステータスレジスタ17で
ラッチされる。その後、タイマ7 から出力指令OUT
2 が発生され、リセット回路15に供給される。
【0021】リセット回路15は、出力指令OUT2 
を受け取るとリセット信号CLRを発行してCPU1 
をリセットする。また、リセット信号CLRは、ステー
タスレジスタ17でラッチされる。
【0022】CPU1 は、リセット後、ステータスレ
ジスタ17にラッチされた内容、つまり異常検知信号E
D、NMI受付信号ACK、リセット信号CLRという
一連の信号から、レジスタ内容の退避処理の起動が、内
部的なREADY信号の発生を伴わずに、異常検知信号
EDによって直接的に起動されたことを認識できる。ま
た、退避したレジスタ内容のを読取ることによって、ど
のような内部状態でリセットされたかを認識することも
できる。次に、CPU1が割り込み信号NMIを受け付
けなかった場合について説明する。
【0023】CPU1 が他のボードをアクセス中であ
ってそのボードからCPU1 にREADY信号が返送
されない場合には、CPU1 は割り込み信号NMIを
受け付けることができない。CPU1 が割り込み信号
NMIを受け付けないでいると、タイマ7 からREA
DY出力回路9 に出力指令OUT1 が発生される。 この場合、READY出力回路9にはNMI受付信号A
CKが供給されてないので、READY出力回路9 は
イネーブル状態である。このため、READY出力回路
9 は、出力指令OUT1 に応答して、READY信
号を発生する。
【0024】この時、CPU1 がスレーブ装置をアク
セス中であった場合、バスリクエスト信号(図2で後述
する)がアクティブ状態であるので、ANDゲート12
からはREADY信号が出力され、CPU1 に供給さ
れると共に、ステータスレジスタ17でラッチされる。
【0025】READY信号がCPU1 に供給される
と、CPU1 は割り込み信号NMIの受け付けが可能
になり、前述した一連の処理によって、レジスタ内容の
退避処理、リセット処理が行われる。この場合、ステー
タスレジスタ17には、異常検知信号ED、READY
信号、NMI受付信号ACK、リセット信号CLRとい
う一連の信号がラッチされることになる。
【0026】CPU1 は、ステータスレジスタ17の
内容から内部的なREADY信号の発生によってリセッ
トが行われたことを読取ることができ、これによって内
部バス系の障害が発生したことを認識できる。
【0027】また、ANDゲート12からREADY信
号が出力されてもCPU1 が割り込みNMI信号を受
け付け無い場合や、ANDゲート12からREADY信
号が出力されずCPU1 が割り込みNMI信号を受け
付け無い場合が考えられる。
【0028】前者の場合は、内部バスの障害の他に、図
1のプロセッサボード内部で故障が発生していると認識
でき、後者の場合は、内部バスでは無く、プロセッサボ
ード内部で故障であると判断できる。また、これらの状
況が発生していることは、ステータスレジスタ17の内
容から判断することができる。
【0029】以上のように、この実施例においては、C
PU1 の障害が検出された際に、CPU1 に対して
割り込み信号NMIが供給されてレジスタ内容の退避の
ための割り込み処理が起動され、その後でその初期化が
行われる。一方、割り込み信号NMIがCPU1 によ
って受け付けられなかった場合には、CPU1 の待機
状態を解除するためのステータス信号が発生され、待機
状態を解除が促される。退避処理が起動されるまでのこ
の様な実行過程は、ステータスレジスタ17で管理され
ており、その初期化後にそのステータスレジスタ17の
内容を参照することによって障害発生の原因を検出する
事ができ、また、退避したレジスタ内容をによって同様
な状態でオフセットされたかを知ることもできるように
なる。図2には、図1のプロセッサボードの内部バスへ
の具体的な接続状態が示されている。
【0030】図において、20はプロセッサボードであ
り、このプロセッサボード20には、CPU1 、バス
リクエスタ21、バスアービタ22、内部バスインター
フェース(IF)23、異常検出回路30が設けられて
いる。CPU1 は図1のCPU1 を示すものであり
、また、異常検出回路30は、図1のウォッチドッグタ
イマ(WDT)2 、NMI(non−maskabl
e interrupt)出力回路5 、タイマ7 、
REDY出力回路9、ANDゲート12、リセット回路
15、およびステータスレジスタ17から構成されるも
のである。バスリクエスタ21は、内部バス24の使用
権をバスアービタ22に対して要求し、使用権が獲得で
きたことをCPU1 に通知する。バスアービタ22は
、内部バス24の使用権をバス使用要求を出しているも
のの内で最も優先順位の高いものに与える。内部バスイ
ンターフェース(IF)23は、プロセッサボード20
と内部バス24間の信号の授受を行う。内部バス24に
は、さらに、マスターボード群25、スレーブボード群
26が接続されている。
【0031】また、図において、31はバスリクエスト
信号線であり、CPU1 からのバス要求信号をバスリ
クエスタ21に伝達する。32はバス獲得信号線であり
、バスリクエスタ21からのバス獲得信号をバスアービ
タ22に伝達する。33はバス使用許可信号線であり、
バスアービタ22からのバス使用許可信号をバスリクエ
スタ21に通知する。34はバス使用許可通知信号線で
あり、バスリクエスタ21からのバス使用許可通知信号
をCPU1 に通知する。
【0032】35はバスリクエスト信号線群であり、マ
スタボード群25からのバス使用要求信号群を伝達する
。36はバス獲得要求信号線群であり、内部バスインタ
ーフェース23からのバス獲得要求信号群をアービタ2
2に伝達する。37はバス使用許可信号線群であり、バ
スアービタ22から内部バスインターフェース23にバ
ス使用許可信号群を伝達する。38はバス使用許可通知
信号線群であり、内部バスインターフェース23から内
部バス24を介してマスタボード群25にバス使用許可
通知信号群を伝達するものである。
【0033】39はXACK信号線であり、プロセッサ
ボード20がスレーブボート群26をアクセスした場合
に、アクセスサレタスレーブボートからプロセッサボー
ド20にREADY信号を伝達するものである。40は
READY信号線であり、内部バスインオターフェース
23からCPU1 にREADY信号を返送する。41
は内部バス信号線群であり、プロセッサボード20がス
レーブボード群26をアクセスするために必要なデータ
、アドレス、コマンドを伝達する。次に、内部バス24
に対するアクセス手順を説明する。
【0034】プロセッサボード20のCPU1 がマス
タボード群25またはスレーブボード群26をアクセス
する場合には、CPU1 は、まず、バス要求信号をバ
スリクエスタ21に供給する。バス要求信号を受け取っ
たバスリクエスタ21は、バスアービタ22に対してバ
ス獲得信号を出力する。バスアービタ22は、他に優先
度の高いバスリクエストが無ければ、バス使用許可信号
をバスリクエスタ21に供給する。バスリクエスタ21
は、バス使用許可信号を受け取ると、CPU1 に対し
てバス使用許可通知信号を供給する。
【0035】バス使用許可通知信号を受け取ると、CP
U1 は、内部バスインターフェース23、内部バス信
号線群41、内部バス24を介して、マスタボード群2
5またはスレーブボード群26をアクセスする。アクセ
スされたマスタボードまたはスレーブボードは、内部バ
ス24、内部バスインターフェース23を介してREA
DY信号をCPU1 に返送する。READY信号を受
け取ったCPU1 は、次ぎの実行サイクルに進む。一
方、このREADY信号が返送されないと、CPU1 
はそのサイクルを終了することが出来ず、待機状態とな
る。
【0036】この様な状態は、例えば、マスタボードま
たはスレーブボードの故障や、マスタボードが内部バス
23の使用権を放さないといった内部バス23に関係す
る障害によって発生されるものである。
【0037】このような障害発生時には、前述したよう
に、異常検出回路30からREADY信号がCPU1 
に発生され、これによってその障害の原因を検出するこ
とができる。
【0038】
【発明の効果】以上詳記したように本発明によれば、異
常検知時に障害発生に至るまでの情報を保持できるよう
になり、障害発生の原因認識を容易に実行する事が可能
となる。
【図面の簡単な説明】
【図1】この発明の一実施例に係わる異常検出方式を実
現するためのデータ処理装置の構成を示すブロック図。
【図2】図1に示したデータ処理装置による内部バスへ
のアクセス動作を説明するためのブロック図。
【符号の説明】
1 …CPU、2 …ウォッチドッグタイマ、5 …N
MI出力回路、7 …タイマ、9 …READY出力回
路、15…リセット回路、17…ステータスレジスタ。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】  障害発生の検出時にCPUを初期化す
    るように構成されたデータ処理装置において、前記CP
    Uの動作監視をする監視手段と、この監視手段によって
    前記CPUの障害が検出された際、前記CPUに対して
    割り込み信号を供給してレジスタ内容の退避を実行させ
    る割り込み手段と、前記割り込み信号が前記CPUによ
    って受け付けられたか否かを監視し、受け付けられなか
    った際に前記CPUの待機状態を解除するためのステー
    タス信号を発生する手段と、前記CPUによるレジスタ
    内容の退避処理が起動されるまでの実行過程を示す情報
    を管理する管理手段とを具備し、前記管理手段の内容を
    参照して障害発生の原因を検出する事を特徴とする異常
    検出方式。
JP2401593A 1990-12-12 1990-12-12 データ処理装置の異常検出方式 Pending JPH04213738A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2401593A JPH04213738A (ja) 1990-12-12 1990-12-12 データ処理装置の異常検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2401593A JPH04213738A (ja) 1990-12-12 1990-12-12 データ処理装置の異常検出方式

Publications (1)

Publication Number Publication Date
JPH04213738A true JPH04213738A (ja) 1992-08-04

Family

ID=18511423

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2401593A Pending JPH04213738A (ja) 1990-12-12 1990-12-12 データ処理装置の異常検出方式

Country Status (1)

Country Link
JP (1) JPH04213738A (ja)

Similar Documents

Publication Publication Date Title
EP0196331B1 (en) Method of and arrangement for ordering of multiprocessor operations in a multiprocessor system
EP0186006B1 (en) Multiprocessor system
US8700835B2 (en) Computer system and abnormality detection circuit
JP4487756B2 (ja) コンピュータシステム及びシステム監視プログラム
JPH04213738A (ja) データ処理装置の異常検出方式
JPH1153225A (ja) 障害処理装置
JP3626292B2 (ja) バスインタフェース制御方式
JP7600691B2 (ja) 画像形成装置、画像形成装置の制御方法および制御装置
JP2998804B2 (ja) マルチマイクロプロセッサシステム
JPH09160840A (ja) バス通信装置
EP0366433A2 (en) Multiprocessor interlock
JPS63251842A (ja) マルチプロセツサの異常検出制御方法
JPH05224999A (ja) 暴走処理装置
JPH06214831A (ja) 中央処理装置の異常検出装置
JPS63251840A (ja) マルチプロセツサの異常検出制御方法
JP2550708B2 (ja) デバッグ方式
JP2837893B2 (ja) マイクロコンピュータ装置
JPS622334B2 (ja)
CN120508455A (zh) 基于axi通信的隔离保护系统及方法
CN120561044A (zh) 双主板bmc访问共用设备冲突解决方法及其系统
JPH0449461A (ja) バスロック解除方式
JP2815730B2 (ja) アダプタ及びコンピュータシステム
JPH03100736A (ja) パトロール診断装置
JPH04148266A (ja) マルチプロセッサシステム
JPS63251841A (ja) マルチプロセツサの異常検出制御方法