JPH0750464B2 - 疎結合マルチプロセッサシステム - Google Patents

疎結合マルチプロセッサシステム

Info

Publication number
JPH0750464B2
JPH0750464B2 JP63056717A JP5671788A JPH0750464B2 JP H0750464 B2 JPH0750464 B2 JP H0750464B2 JP 63056717 A JP63056717 A JP 63056717A JP 5671788 A JP5671788 A JP 5671788A JP H0750464 B2 JPH0750464 B2 JP H0750464B2
Authority
JP
Japan
Prior art keywords
processor
communication
disconnected
processors
operating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63056717A
Other languages
English (en)
Other versions
JPH01229359A (ja
Inventor
光明 正田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63056717A priority Critical patent/JPH0750464B2/ja
Publication of JPH01229359A publication Critical patent/JPH01229359A/ja
Publication of JPH0750464B2 publication Critical patent/JPH0750464B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は疎結合マルチプロセッサシステムに関する。
〔従来の技術〕
疎結合マルチプロセッサシステムでは、プロセッサ監視
装置が各プロセッサの切り離しを行う。具体的には、プ
ロセッサ監視装置が、切り離されるべきプロセッサに対
して、切り離しを通知する。一方、他のプロセッサに
は、このプロセッサが切り離された旨の通知を行い、こ
のプロセッサとの交信を禁止する。
〔発明が解決しようとする課題〕
ところが、このような疎結合マルチプロセッサシステム
では、伝送路や受信装置の異常のために、この通知が切
り離されるべきプロセッサに届かないことがある。この
ような状況では、切り離されるべきプロセッサ以外のシ
ステムは、このプロセッサが切り離されたものとして処
理を行う。同時に、本来切り離されるべきプロセッサ
は、自身が切り離されたことを認識しないまま、通常通
りの動作を継続する。この結果、本来切り離されるべき
プロセッサが、共有ファイルをアクセスして、その内容
を破壊してしまうという欠点があった。
〔課題を解決するための手段〕
本発明の疎結合マルチプロセッサシステムは、 全プロセッサのシステムとしての動作状態を認識するプ
ロセッサ状態認識手段を有し、 各プロセッサは、他のプロセッサのシステムとしての動
作状態が変化したことを知らせる前記プロセッサ状態認
識手段からの通知を記憶し、かつ、システムから切離さ
れた他のプロセッサからの通信を受取らない機能を持
ち、他のプロセッサが自プロセッサの通信を受取らない
ことを検出した場合、自プロセッサが前記プロセッサ状
態認識手段からの通知により該通信相手プロセッサのシ
ステムとしての動作状態をどのように記憶しているか
を、プロセッサのシステムとしての動作状態の変化が他
のプロセッサに認識されるに要する最大時間以上経過後
に調べ、システムとして動作中であると記憶していると
きは自プロセッサの動作を停止する。
〔作用〕
プロセッサ監視装置からの切り離し指示が、切り離され
るべきプロセッサに通知されなかったときでも、切り離
されるべきプロセッサは、他のプロセッサとのプロセッ
サ間通信により、そのことを認識して自プロセッサの動
作を停止するので、システムから切離されたプロセッサ
がプロセッサ間で共有しているファイルにアクセスして
内容を破壊することがない。
〔実施例〕
次に、本発明の実施例について図面を参照して説明す
る。
第1図は本発明の疎結合マルチプロセッサシステムの一
実施例のブロック図、第2図は第1図のプロセッサ間通
信制御部31,32,…,3nの処理の流れ図である。
疎結合マルチプロセッサシステムはプロセッサ11,12
…,1nとプロセッサ監視装置2により構成され、各プロ
セッサ11,12,…,1nには、それぞれプロセッサ間通信
制御部31,32,…,3nが設けられている。また、各プロ
セッサ11,12,…,1nは通信路41,42,…,4nを介してプ
ロセッサ監視装置2に接続され、プロセッサ間通信制御
部31,32,…,3nにより通信路5を介して相互に接続さ
れている。プロセッサ監視装置2は一定時間ごとにハー
トビートチェックにより動作中の全プロセッサ11,12
…,1nのシステムとしての動作状態を監視し、障害等の
発生によりシステムから切り離すべき状態にあるプロセ
ッサを発見した場合は、このプロセッサに切り離しを指
示するとともに、このプロセッサが切り離されたことを
他の全プロセッサ11,12,…,1nのプロセッサ間通信制
御部31,32,…,3nに通知する。プロセッサ間通信制御
部31,32,…,3nは第2図に示すように、通信路5を介
してプロセッサ11,12,…,1n相互間の通信を司どって
おり(ステップ11)、システムから切離されたプロセッ
サ11,12,…,1nからの通信は無視して受取らないよう
になっている。また、プロセッサ間通信制御部31,32
…,3nは、他のプロセッサ11,12,…,1nが自プロセッ
サからの通信を受取らない場合は通信エラーとして検出
する。通信相手プロセッサ11,12,…,1nが通信を受取
らないので通信エラーとして検出される原因として、 (1)通信相手プロセッサ11,12,…,1nが、通信元プ
ロセッサである自プロセッサがシステムから切離された
と認識している場合と、(2)通信相手プロセッサ11,1
2,…,1nがシステムから切離されて、通信元プロセッ
サである自プロセッサの通信を受取らない場合とがあ
る。
以上の2つのうち(2)の場合であれば自プロセッサを
自ら停止させる必要がないので、これを確認するために
通信エラーを検出したとき(ステップ12)、ある一定時
間に設定されたタイマを起動してタイムアウトするまで
待つ(ステップ13)。タイマがタイムアウトすると通信
エラーとなった相手プロセッサ11,12,…,1nのシステ
ムとしての動作状態を自プロセッサがどのように認識し
ているかを調べ(ステップ14)、システムから切離され
たと認識しているならば、通信エラーとなった原因は相
手プロセッサ11,12,…,1nがシスムから切離されたた
めであるので何も行なわないが、システムとして動作中
であると認識しているならば、相手プロセッサ11,12
…,1nが通信元プロセッサ、すなわち自プロセッサがシ
ステムから切離されたと認識しているためであり、ま
た、あるプロセッサ11,12,…,1nが他のプロセッサか
ら見てシステムから切離されているということは、その
プロセッサがシステムから切離されていることであるの
で、自プロセッサを停止させる(ステップ15)。
なお、ステップ12で通信エラーを検出してから一定時間
待つ(ステップ13)ためのタイマの設定時間は、あるプ
ロセッサ11,12,…,1nがシステムから切離されてか
ら、そのことがプロセッサ監視装置2を介して動作中の
他のプロセッサ11,12,…,1nに認識されるに必要な最
大時間よりも大きな値としておく。
次に、本実施例の動作を説明する。
動作中の疎結合マルチプロセッサシステムでプロセッサ
11がシステムから切離された場合について説明する。
プロセッサ監視装置2は、ハートビートチェックの結果
プロセッサ11が切り離すべき状態にあると検出すると、
プロセッサ11に切り離しを指示する。しかしながら、伝
送路41の異常により、この通知はプロセッサ11に到達し
ない。このため、プロセッサ11は通常動作を継続する。
一方、プロセッサ監視装置2は、プロセッサ11が切り離
された旨を他のプロセッサ12,…,1nに通知し、プロセ
ッサ間通信制御部32,…,3nはプロセッサ11がシステム
から切離されたことを記憶するとともにプロセッサ11
らの通信を受取らなくなる。プロセッサ間通信制御部31
は、他のプロセッサ12,…,1nへの通信を通信エラーと
して検出するのでタイマを起動し、タイムアウトすると
他のプロセッサ12,…,1nの動作状態を自プロセッサ11
がどのように認識しているかを調べ、この場合システム
として動作中であると認識しているので、自プロセッサ
11はシステムから切離されていると判断して自プロセッ
サ11を停止させる。
〔発明の効果〕
以上説明したように本発明は、各プロセッサで他のプロ
セッサのシステムとしての動作状態が変化したことを認
識し、システムから切離されたプロセッサからの通信を
受取らないようにし、他のプロセッサが通信を受取らな
いとき、その相手プロセッサのシステムとしての動作状
態を自プロセッサがどのように認識しているかを、ある
プロセッサの状態変化が他のプロセッサに認識されるに
要する時間以上経過してから調べて、システムとして動
作中であると認識しているならば、プロセッサが自発的
に停止する。すなわち、本来切り離されるべきプロセッ
サが、その旨の通知を受信していないときでも、他プロ
セッサとの交信が行われれば、このプロセッサは自身が
切り離されていることを認識する。したがって、共有フ
ァイルへのアクセスに先立ってプロセッサ間通信が実施
されれば、本来切り離されるべきプロセッサが共有ファ
イルの内容を破壊することはない。実際には、プロセッ
サ間通信は頻繁に行われるので、多くの場合、共有ファ
イルの破壊を防止できる。
【図面の簡単な説明】
第1図は本発明の疎結合マルチプロセッサシステムの一
実施例のブロック図、第2図は第1図のプロセッサ間通
信制御部31,32,…,3nの処理の流れ図である。 11,12,…,1n……プロセッサ、2……プロセッサ監視
装置、31,32,…,3n……プロセッサ間通信制御部、41,
42,…,4n,5……通信路。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】疎結合マルチプロセッサシステムにおい
    て、 全プロセッサのシステムとしての動作状態を認識するプ
    ロセッサ状態認識手段を有し、 各プロセッサは、他のプロセッサのシステムとしての動
    作状態が変化したことを知らせる前記プロセッサ状態認
    識手段からの通知を記憶し、かつ、システムから切離さ
    れた他のプロセッサからの通信を受取らない機能を持
    ち、他のプロセッサが自プロセッサの通信を受取らない
    ことを検出した場合、自プロセッサが前記プロセッサ状
    態認識手段からの通知により該通信相手プロセッサのシ
    ステムとしての動作状態をどのように記憶しているか
    を、プロセッサのシステムとしての動作状態の変化が他
    のプロセッサに認識されるに要する最大時間以上経過後
    に調べ、システムとして動作中であると記憶していると
    きは自プロセッサの動作を停止することを特徴とする疎
    結合マルチプロセッサシステム。
JP63056717A 1988-03-09 1988-03-09 疎結合マルチプロセッサシステム Expired - Lifetime JPH0750464B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63056717A JPH0750464B2 (ja) 1988-03-09 1988-03-09 疎結合マルチプロセッサシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63056717A JPH0750464B2 (ja) 1988-03-09 1988-03-09 疎結合マルチプロセッサシステム

Publications (2)

Publication Number Publication Date
JPH01229359A JPH01229359A (ja) 1989-09-13
JPH0750464B2 true JPH0750464B2 (ja) 1995-05-31

Family

ID=13035237

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63056717A Expired - Lifetime JPH0750464B2 (ja) 1988-03-09 1988-03-09 疎結合マルチプロセッサシステム

Country Status (1)

Country Link
JP (1) JPH0750464B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0460750A (ja) * 1990-06-28 1992-02-26 Fujitsu Ltd クラスタ停止装置

Also Published As

Publication number Publication date
JPH01229359A (ja) 1989-09-13

Similar Documents

Publication Publication Date Title
KR100557399B1 (ko) 네트웍 매체 링크상태 기능을 이용한 컴퓨터 클러스터링시스템의 가용도 개선방법
US20020152425A1 (en) Distributed restart in a multiple processor system
US5594893A (en) System for monitoring and controlling operation of multiple processing units
JPH0750464B2 (ja) 疎結合マルチプロセッサシステム
JPH0588926A (ja) 監視制御系の自動切替回路
JPH08287030A (ja) 多重系計算機システムの自動再起動装置および方法
JP3107104B2 (ja) 待機冗長方式
JPH11175108A (ja) 二重化コンピュータ装置
JPH01166161A (ja) マルチプロセッサシステムの相互監視方式
JPS6252907B2 (ja)
JPH04153810A (ja) 異常処理方式
JP2744113B2 (ja) 計算機システム
JPH03266131A (ja) 多重化システムの無応答判定方式
JPH0430245A (ja) マルチプロセッサ制御方式
JPS60254338A (ja) マルチプロセツサの異常検出方式
JPS61267810A (ja) 停電検出判定回路
JPH08305675A (ja) マルチプロセッサシステムおよびその運転管理方 法
JPH04340649A (ja) サブシステムのダウン検出方式
JPH0460750A (ja) クラスタ停止装置
JPH05120048A (ja) 障害識別方式
JPH0253156A (ja) 入出力装置における異常監視装置
JPS62190536A (ja) 冗長構成制御方式
JPH05298136A (ja) 冗長化情報システムの立上げ方法
JPH0535517A (ja) 二重化系の切替装置
JPS63279646A (ja) 網管理装置の自動再開処理方式