JPH0335346A - マルチコンピュータシステムにおける相互診断方式 - Google Patents

マルチコンピュータシステムにおける相互診断方式

Info

Publication number
JPH0335346A
JPH0335346A JP1169680A JP16968089A JPH0335346A JP H0335346 A JPH0335346 A JP H0335346A JP 1169680 A JP1169680 A JP 1169680A JP 16968089 A JP16968089 A JP 16968089A JP H0335346 A JPH0335346 A JP H0335346A
Authority
JP
Japan
Prior art keywords
computer
mutual diagnosis
control field
normal message
mutual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1169680A
Other languages
English (en)
Inventor
Kazuya Shinjo
新庄 和哉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1169680A priority Critical patent/JPH0335346A/ja
Publication of JPH0335346A publication Critical patent/JPH0335346A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) この発明は、マルチコンピュータシステムにおける相互
診断処理の負荷軽減に好適な相互診断方式に関する。
(従来の技術) 一般にマルチコンピュータシステムは、複数の計算機と
、これらの計算機に共有される共有メモリを備えている
。従来、この種のマルチコンピュータシステムにおける
相互診断は、一定周明を定め、その周朋毎に他計算機に
メッセー、ジを送信し、ある一定時間内に、送信したメ
ツセージに対する応答メツセージを確認することにより
行われていた。この相互診断を目的とするメツセージ交
信は相互診断メツセージ交信と呼ばれる。
以上の相互診断では、一定周期毎に必ず相互診断メツセ
ージ交信を行わなければならないため、計算機の負荷が
高いとき並びに診断周期が短いときには相互診断による
オーバーヘッドが顕著に現われるという問題があった。
このオーバーヘッドを軽減するために、計算機の空き時
間を利用して不定期で相互診断を行う方式や、診断周期
を長く設定する方式等が考えられる。しかし、この方式
ハ診断性能を犠牲にするもので、マルチコンピュータシ
ステムの異常検出の遅れを招く虞があり、適用しがたい
(発明が解決しようとする課題) 上記したように従来のマルチコンピュータシステムにお
ける相互診断方式では、システムの異常を確実且つ速や
かに検出するために、一定周期毎に必ず相互診断メツセ
ージ交信を行わなければならず、したがってシステムの
オーバーヘッドが大きいという問題があった。
この発明は上記事情に鑑みてなされたものでその目的は
、マルチコンピュータシステムの相互診断におけるオー
バーヘッドが、診断性能を犠牲にすることなく軽減でき
るマルチコンピュータシステムにおける相互診断方式を
提供することにある。
[発明の構成] (課題を解決するための手段) この発明は、マルチコンピュータシステムの共有メモリ
上に、この共有メモリを共有する各計算機間で通常メツ
セージ交信(相互診断メツセージ交信とは別の通常のメ
ツセージ交信)が行われたことを示す交信確認情報が記
録される制御フィールドを設けると共に、上記各計算機
に、通常メツセージ交信を行った際には上記制御フィー
ルドにその旨を示す交信確認情報を記録する通常メツセ
ージ交信手段と、一定周期毎の相互診断に際して上記制
御フィールドを参照して相手計算機との間で通常メツセ
ージ交信が行われたが否かを判別し、この判別結果に応
じて相互診断を実行する(0互診断手段とを設け、通常
メツセージ交信が行ゎれたことが判別された場合には相
互診断を省略して対応する交信確認情報を上記制御フィ
ールドから消去するようにしたことを特徴とするもので
ある。
(作 用) 上記の構成によれば、計算機間で必要に応じて通常メツ
セージ交信が行われると、その旨を示す交信確認情報が
共有メモリ上の制御フィールドに記録される。通常メツ
セージ交信が行われたということは、その交信相手が正
常であることである。このため、上記のように交信確認
情報を制御フィールドに記録することは、相互診断を行
ってその結果が正常な場合にその旨を記録したことと等
価となる。したがって、計算機において一定周期毎の相
互診断を実行しようとする際に制御フィールドを参照す
ることにより、最も最近の相互診断周期の間に相互診断
相手との間で通常メツセージ交信が正常に行われたか否
かを判別することが可能となる。そこで上記の構成にお
いては、制御フィールドの参照により、相互診断相手と
の間で通常メツセージ交信が正常に行われたことを判別
した場合には、相互診断の代替処理が行われて正常判定
がなされたものとして、該当周期における相互診断が省
略され、対応する交信確認情報が制御フィールドから消
去される。これに対して、対応する交信確認情報が記録
されておらず、相互診断相手との間の通常メツセージ交
信が正常に行われたことが判別できない場合には、従来
と同様に相互診断が行われる。
(実施例) 第1図はこの発明を適用するマルチコンピュータシステ
ムの一実施例を示すブロック構成図である。、同図にお
いて、IIA 、 IIB 、 IIc 4;!計算機
、12は計算機11A−11cによって共有される共有
メモリである。計算機11A−110間のメツセージ交
信は共有メモリ12を介して行われる。この共有メモリ
12の所定領域には、計算機11A 、 11B 、 
IIcに対応して3つの制御フィールド13A 、 1
3B 。
13cが確保される。制御フィールド13Aは計算機1
1Aから他計算機(ここでは計算機11B 、 tic
 )に対する通常のメツセージ交信が確認されたことを
示すためのフィールド、制御フィールド13Bは計算機
11Bから細針算機(ここでは計算機11c 。
11A )に対する通常のメツセージ交信が確認された
ことを示すためのフィールド、制御フィールド13cは
計算機11Cから細針算機(ここでは計算機11A 、
 IIB )に対する通常のメツセージ交信が確認され
たことを示すためのフィールドである。
第2図は第1図の制御フィールド13A −13cのフ
ォーマットを示す。図に示すように、制御フィールド1
3AのビットOは計算機11Aが計算機11Bに対して
通常のメツセージを送信したことを示す送信確認ビット
に、ビット1は計算機11r3が計算機11Aからの通
常のメツセージを受信したことを示す受信確認ビットに
、ビット2は計算機U^が計算機11cに対して通常の
メツセージを送信したことを示す送信確認ビットに、ビ
ット3は計算機11Gが計算機11Aからの通常のメツ
セージを受信したことを示す受信確認ビットに、それぞ
れ割当てられている。また、制御フィールド13Bのビ
ットOは計算機11Bが計算機11Cに対して通常のメ
ツセージを送信したことを示す送信確認ビットに、ビッ
ト1は計算機lICが計算機11Bからの通常のメツセ
ージを受信したことを示す受信確認ビットに、ビット2
は計算機11Bが計算機11Aに対して通常のメツセー
ジを送信したことを示す送信確認ビットに、ビット3は
計算機11Aが計算機11Bからの通常のメツセージを
受信したことを示す受信確認ビットに、それぞれ割当て
られている。また、制御フィールド13cのビットOは
計算機ttCが計算機11Aに対して通常のメツセージ
を送信したことを示す送信確認ビットに、ビット1は計
算機11Aが計算機+ICからの通常のメツセージを受
信したことを示す受信確認ビットに、ビット2は計算機
11Gが計算機11Bに対して通常のメツセージを送信
したことを示す送信確認ビットに、ビット3は計算機1
1Bが計算機+ICからの通常のメツセージを受信した
ことを示す受信確認ビットに、それぞれ割当てられてい
る。
第3図は第1図の計算機11Aにおける計算機11Bと
の間の相互診断動作を説明するためのフローチャートを
示す。
次に、この発明の一実施例の動作を上記第1図乃至第3
図を適宜参照して説明する。
まず第1図のマルチコンピュータシステムにおいて、計
算機間の通常のメツセージ交信時に行われる制御フィー
ルドに対するビット操作について、計算機11^、 I
IBの通常メツセージ交信を例に説明する。計算機11
A 、 IIBは、通常の機能(通常メツセージ交信)
において、細針算機に対してメツセージを送信したとき
は、共有メモリ12に確保された制御フィールド13A
 、 13Bの対応する送信確認ビットをオンする。こ
れにより、例えば計算機11Aから計算機11Bへ通常
のメツセージを送信した場合であれば、制御フィールド
13Aのビット0が計算機+1Aによってオン(“1”
に設定)される。また、計算機11Bから計算機11A
へ通常のメツセージを送信した場合であれば、・制御フ
ィールド13Bのビット2が計算機11Bによってオン
される。また計算機11^、 IIBは、細針算機から
通常のメツセージを受信したときには、その送信元に固
有の制御フィールドの対応する受信確認ビットをオンす
る。これにより、計算機118が計算機11Aからのメ
ツセージを受信した場合であれば、制御フィールド13
Aのビット1が計算機11Bによってオンされる。また
、計算機+1Aが計算機11Bからのメツセージを受信
した場合であれば、制御フィールド13Bのビット3が
計算機11Aによってオンされる。
上記したように本大施例では、計算機間で通常のメツセ
ージ交信が正常に行われると、対応する制御フィールド
の送信確認ビット並びに受信確認ビットがオンされる。
具体的には、上記のように計算機11Aから計算機11
Bに通常のメツセージが送信されて、計算機11Bにお
いて正常に受信された場合であれば、制御フィールド1
3Aのビット0.1がいずれもオンされる。また、計算
機11Bから計算機11Aに通常のメツセージが送信さ
れて、計算機11Aにおいて正常に受信された場合であ
れば、制御フィールド13Bのビット2,3がいずれも
オンされる。なお、計算機11Aから計算機11cに通
常のメツセージが送信されて、計算機ttCにおいて正
常に受信された場合であれば、制御フィールド13Aの
ビット2.3がいずれもオンされることは明らかである
次に、第1図のマルチコンピュータシステムにおける相
互診断について、計算機11Aが11算機1113との
間の相互診断を行う場合を例に説明する。
まず計算機11Aは、制御フィールド13Aのビット0
.1がいずれもオン状態にあるか否かをチエツク、する
(第3図ステップSt)。もし、制御フィールド13A
のビット0,1の少なくとも一方がオフ状態にある場合
には、計算機11Aは周知の方式で計算機11Bとの間
の相互診断を行う(第3図ステップS2)。次に計算機
11Aは制御フィールド13Aのビット0.1を全てオ
フ(“0“クリア)して(第3図ステップS3)、通常
の処理に入る。
そして一定周期(所定の相互診断周期)が経過すると(
第3図ステップS4)、計算機11Aは再び第3図のス
テップSlを実行し、制御フィールド13Aのビット0
,1がいずれもオン状態にあるか否かをチエツクする。
もし、制御フィールド13^のビット0,1がいずれも
オン状態にある場合には、計算機11Aは、前記相互診
断周期の間に計算機11^から計算機11Bへの通常の
メツセージ交信が正常にj−rわれでいることが確認で
きたものとして(したがって現在の相互診断周期におけ
る相互診断処理は不要であるものとして)、第3図ステ
ップS2の相互診断処理をスキップして第3図ステップ
S3に進む。そして計算機+1Aは、制御フィールド1
3Aのビット0,1を全てオフした後、通常の処理に入
る。
以上のように、制御フィールド13Aのビット0.1が
いずれもオン状態にある場合には、第3図ステップSt
の判定処理だけで、最も最近のt目互診断周期内に計算
機11Aから計算機11Bへの通常のメツセージ交信が
正常に行われたことが確認できるので、上記のように第
3図ステップS2の相互診断処理を省略しても何等問題
とならず、この相互診断処理の省略により、計算機11
A 、 IIBは通常の処理のための時間を十分に確保
でき、システムのオーバーヘッドが軽減される。
なお、計算機11Aが計算機llCとの間の相互診断を
行う場合には、制御フィールド13Aのビット2,3の
状態をチエツクすることで、本来の相互診断処理を省略
できるか否かが判別できることは明らかである。同様に
、計算機11Bが計算機用Cとの間の相互診断を行う場
合には、制御フィールド13Bのビット0,1の状態を
チエツクすることで、また計算機11Bが計算機11A
との間の相互診断を行う場合には、制御フィールド13
Bのビット2,3の状態をチエツクすることで、それぞ
れ本来の相互診断処理を省略できるか否かが判別できる 以上はマルチコンピュータシステムにおける相互診断に
ついて説明したが、本発明は相互診断を行うシステムで
あれば、他のシステムにも応用可能である。
[発明の効果] 以上詳述したようにこの発明によれば、計算機間で通常
メツセージ交信が行われたということは、その交信相手
が正常であるということに着目して、通常メツセージ交
信が行われた際に、その旨を共有メモリ上に設けけられ
た制御フィールドに記録するようにし、相互診断周期毎
の相互診断の際に上記制御フィールドを参照してその参
照結果に応じて相互診断を省略する構成としたので、一
定周期毎に無条件で相互診断を行っていた従来方式に比
べて相互診断に起因するオーバーヘッドを軽減すること
ができる。しかも、相互診断を省略するのは、対応する
相互診断周期において、対応する計算機間で通常メツセ
ージ交信が正常に行われた場合であり、相互診断省略に
よる悪影響(診断性能の低下)はない。
【図面の簡単な説明】
第1図はこの発明を適用するマルチコンピュタシステム
の一実施例を示すブロック構成図、第2図は第1図に示
す制御フィールドIIA 、 1111 。 ttCのフォーマット図、第3図は第1図に示す計算機
11Aにおける計算機11Bとの間の相互診断動作を説
明するためのフローチャートである。 11A 1B 1C ・・・計算機、 12・・・共有メモリ、 3A 3B 3c ・・・制御フィ ル ド。 出廟人代理人

Claims (1)

  1. 【特許請求の範囲】 複数の計算機と、この複数の計算機によって共有される
    共有メモリとを備えたマルチコンピュータシステムにお
    いて、 上記共有メモリ上に、上記各計算機間で通常メッセージ
    交信が行われたことを示す交信確認情報が記録される制
    御フィールドを設けると共に、上記各計算機に、上記通
    常メッセージ交信を行った際には上記制御フィールドに
    その旨を示す上記交信確認情報を記録する通常メッセー
    ジ交信手段と、一定周期毎の相互診断に際して上記制御
    フィールドを参照して相手計算機との間で上記通常メッ
    セージ交信が行われたか否かを判別し、この判別結果に
    応じて相互診断を実行する相互診断手段とを設け、 上記相互診断に際して上記通常メッセージ交信が行われ
    たことが判別された場合には上記相互診断を省略して対
    応する上記交信確認情報を上記制御フィールドから消去
    するようにしたことを特徴とするマルチコンピュータシ
    ステムにおける相互診断方式。
JP1169680A 1989-06-30 1989-06-30 マルチコンピュータシステムにおける相互診断方式 Pending JPH0335346A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1169680A JPH0335346A (ja) 1989-06-30 1989-06-30 マルチコンピュータシステムにおける相互診断方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1169680A JPH0335346A (ja) 1989-06-30 1989-06-30 マルチコンピュータシステムにおける相互診断方式

Publications (1)

Publication Number Publication Date
JPH0335346A true JPH0335346A (ja) 1991-02-15

Family

ID=15890918

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1169680A Pending JPH0335346A (ja) 1989-06-30 1989-06-30 マルチコンピュータシステムにおける相互診断方式

Country Status (1)

Country Link
JP (1) JPH0335346A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08305675A (ja) * 1995-04-28 1996-11-22 Nippon Denki Ido Tsushin Kk マルチプロセッサシステムおよびその運転管理方 法
JP2008060713A (ja) * 2006-08-29 2008-03-13 Fuji Xerox Co Ltd 情報処理装置およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08305675A (ja) * 1995-04-28 1996-11-22 Nippon Denki Ido Tsushin Kk マルチプロセッサシステムおよびその運転管理方 法
JP2008060713A (ja) * 2006-08-29 2008-03-13 Fuji Xerox Co Ltd 情報処理装置およびプログラム

Similar Documents

Publication Publication Date Title
JP2996440B2 (ja) データ処理システムの診断方式
CN113608914A (zh) 一种芯片、芯片的功能安全检测方法、介质和电子设备
US6604154B1 (en) Data processing device
JPH0335346A (ja) マルチコンピュータシステムにおける相互診断方式
US7500154B2 (en) Method and system for generating a console log
JP2000155738A (ja) データ処理装置
JPH06103251A (ja) 情報処理装置の監視制御方式
JP2524673B2 (ja) 直接メモリアクセス装置
JP2856150B2 (ja) トランザクション履歴記録システム
JP3254814B2 (ja) データ転送方法
JP3110382B2 (ja) 非接触icカード用データ受信回路
JPS6152752A (ja) 異常表示回路
JP2001043104A (ja) コンピュータシステムのバス監視装置
JPH0635816A (ja) マルチcpuシステム
JPH07271626A (ja) ディジタル制御システム
JPS62105243A (ja) システム障害の復旧装置
JPH01318337A (ja) 二重化装置内の通信方法
JPH0589022A (ja) 情報処理装置
JPH1125044A (ja) オンライン診断方式
JPH10254733A (ja) マイクロコンピュータ監視装置
JPH0512181A (ja) 電子計算機
JPH08297596A (ja) サンプリングトレース回路
JPH05143498A (ja) 分散システムの通信障害対応方法
JPH103463A (ja) プロセッサ間通信方法
JPH0448342A (ja) インタフェース障害処理方式