JPS622335B2 - - Google Patents

Info

Publication number
JPS622335B2
JPS622335B2 JP55117751A JP11775180A JPS622335B2 JP S622335 B2 JPS622335 B2 JP S622335B2 JP 55117751 A JP55117751 A JP 55117751A JP 11775180 A JP11775180 A JP 11775180A JP S622335 B2 JPS622335 B2 JP S622335B2
Authority
JP
Japan
Prior art keywords
processor
processors
management
interrupt
management processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55117751A
Other languages
Japanese (ja)
Other versions
JPS5743255A (en
Inventor
Hideharu Kobayashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP55117751A priority Critical patent/JPS5743255A/en
Publication of JPS5743255A publication Critical patent/JPS5743255A/en
Publication of JPS622335B2 publication Critical patent/JPS622335B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Small-Scale Networks (AREA)
  • Hardware Redundancy (AREA)

Description

【発明の詳細な説明】 本発明は、管理プロセツサにより障害時の再開
処理を行なうよう構成したマルチプロセツサシス
テムに関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a multiprocessor system configured to perform restart processing in the event of a failure using a management processor.

一般に、マルチプロセツサシステムは、制御プ
ログラムは一つであるが、複数のプロセツサを持
ち、プロセツサ、主記憶装置、入出力装置が、一
つのバスで接続されているシステム形式をいう。
そして、各プロセツサが異なる機能を分担し、並
列してデータ処理を行なう。
In general, a multiprocessor system has one control program but multiple processors, and the processors, main storage, and input/output devices are connected through a single bus.
Each processor takes on a different function and processes data in parallel.

しかし、従来、電子交換システムにおいては、
障害処理が複雑なため、多数のプロセツサを接続
してのマルチプロセツサシステムは実現されてい
ない。
However, conventionally, in electronic exchange systems,
Due to the complexity of failure handling, a multiprocessor system in which a large number of processors are connected has not been realized.

本発明は、斯かる実情に鑑みてなされたもの
で、複雑な障害処理を、他のプロセツサの運転・
保守管理を行なう管理プロセツサにより集中管理
することにより簡単化した、電子交換システム等
にも適用し得るマルチプロセツサシステムを提供
することを目的とする。
The present invention has been made in view of the above circumstances, and allows complex failure processing to be performed by operating and processing other processors.
It is an object of the present invention to provide a multiprocessor system that can be applied to electronic exchange systems and the like, which is simplified by centrally managing it using a management processor that performs maintenance and management.

即ち、本発明は、複数の二重化されたプロセツ
サと、該各プロセツサに付属し、バスを介してプ
ロセツサ間のデータ転送を行なうデータ転送装置
とを備えて構成されるマルチプロセツサシステム
であつて、上記複数のプロセツサの中から他のプ
ロセツサの運転・保守を管理する管理プロセツサ
を設けると共に、他の各プロセツサについては、
二重化された一方がダウンした時、プロセツサダ
ウン信号を送出すると共に、二重化された他方に
より正常系を確立するよう構成し、且つ、上記管
理プロセツサの外部装置として、上記プロセツサ
ダウン信号を表示して上記管理プロセツサに読取
らしめる手段と、上記管理プロセツサから上記各
プロセツサに割込ませる手段とを備えて、障害時
の再開処理を行なうよう構成したものである。
That is, the present invention is a multiprocessor system comprising a plurality of duplex processors and a data transfer device attached to each processor and transferring data between the processors via a bus. A management processor is provided to manage the operation and maintenance of other processors from among the plurality of processors mentioned above, and for each of the other processors,
When one of the duplexed processors goes down, it sends out a processor down signal and the other duplexed processor establishes a normal system, and displays the processor down signal as an external device of the management processor. The system is configured to perform restart processing in the event of a failure, including means for causing the management processor to read the data and means for causing the management processor to interrupt each of the processors.

以下、本発明を図面に示す実施例に基づいて説
明する。
Hereinafter, the present invention will be explained based on embodiments shown in the drawings.

第1図は本発明マルチプロセツサシステムの一
実施例を示す概念図であり、第2図は上記実施例
に使用されるマルチプロセツサ制御装置の詳細、
及び、該制御装置と各プロセツサとの接続関係と
を示す概念図である。同図において本発明マルチ
プロセツサシステムは、二重化されたプロセツサ
10〜12と、管理プロセツサ20と、マルチプ
ロセツサ制御装置30とを備えて構成される。
FIG. 1 is a conceptual diagram showing an embodiment of the multiprocessor system of the present invention, and FIG. 2 shows details of the multiprocessor control device used in the above embodiment.
Also, it is a conceptual diagram showing the connection relationship between the control device and each processor. In the figure, the multiprocessor system of the present invention includes duplicated processors 10 to 12, a management processor 20, and a multiprocessor control device 30.

上記プロセツサ10〜12及び管理プロセツサ
20は、各々二重化されて構成されている。管理
プロセツサ20は、複数の二重化されたプロセツ
サの中から、他のプロセツサ(この実施例ではプ
ロセツサ10〜12)を運転・保守管理するプロ
セツサとして設定される。一方、他のプロセツサ
10〜12は、情報処理を行なうプロセツサであ
つて、二重化された一方がダウンした時、プロセ
ツサダウン信号を送出すると共に、二重化された
他方により正常系を確立するよう構成される。
The processors 10 to 12 and the management processor 20 are each configured to be duplicated. The management processor 20 is set as a processor that operates and maintains other processors (processors 10 to 12 in this embodiment) from among a plurality of duplicated processors. On the other hand, the other processors 10 to 12 are processors that perform information processing, and are configured to send out a processor down signal when one of the duplexed processors goes down, and to establish a normal system using the other duplexed processor. Ru.

上記プロセツサ10〜12と管理プロセツサ2
0とは、システムバス50aにて接続され、信号
線10a〜12aと20aにて各々接続れたデー
タ転送装置101〜121,201を介して情報
の転送を行なう。該システムバス50aに接続さ
れているバス制御装置50は、システムバス50
aの制御を行ない、制御信号線20cを介して管
理プロセツサ20により制御される。又、管理プ
ロセツサ20には、入出力バス20bを介して入
出力制御装置40〜42及びマルチプロセツサ制
御装置30が接続される。入出力制御装置40〜
42は、入出力バス20bとは信号線40a〜4
2aを介して接続され、管理プロセツサ20に制
御されて、信号線40b〜42bを介して入出力
装置401〜421を制御している。
The above processors 10 to 12 and the management processor 2
0 is connected via a system bus 50a, and information is transferred via data transfer devices 101-121, 201 connected via signal lines 10a-12a and 20a, respectively. The bus control device 50 connected to the system bus 50a is connected to the system bus 50a.
a, and is controlled by the management processor 20 via the control signal line 20c. Further, input/output control devices 40 to 42 and a multiprocessor control device 30 are connected to the management processor 20 via an input/output bus 20b. Input/output control device 40~
42, the input/output bus 20b is the signal line 40a to 4.
2a, and is controlled by the management processor 20 to control input/output devices 401-421 via signal lines 40b-42b.

上記マルチプロセツサ制御装置30は、制御部
301と、各プロセツサに対応するプロセツサダ
ウン表示レジスタ302と、各プロセツサ割込制
御レジスタ303とから構成されている。
The multiprocessor control device 30 is composed of a control section 301, a processor down indication register 302 corresponding to each processor, and each processor interrupt control register 303.

この制御部301は、上記管理プロセツサ20
から、入出力バス20bを介して入力した命令を
解釈して、プロセツサダウン表示レジスタ302
に対する表示読取りと、各プロセツサ割込制御レ
ジスタ303に対するプロセツサ割込制御とを判
別し、各々に対応してプロセツサダウン表示レジ
スタ読取り及びリセツト信号302a、又はプロ
セツサ割込制御信号301aを出力する。
This control unit 301 controls the management processor 20
, interprets the instructions input via the input/output bus 20b, and outputs the processor down indication register 302.
It discriminates whether to read the display for the processor interrupt control register 303 or to control the processor interrupt to each processor interrupt control register 303, and outputs a processor down display register read and reset signal 302a or a processor interrupt control signal 301a corresponding to each processor interrupt control register 303.

プロセツサダウン表示レジスタ302は、二重
化されたプロセツサの一方がダウンした時に、信
号線10b〜12bを介して送出されるプロセツ
サダウン信号によつてセツトされる。そして、管
理プロセツサ20からのリセツト信号により、リ
セツトされる。
Processor down indication register 302 is set by a processor down signal sent via signal lines 10b to 12b when one of the duplicated processors goes down. Then, it is reset by a reset signal from the management processor 20.

プロセツサ割込制御レジスタ303は、管理プ
ロセツサからのプロセツサ割込制御信号301a
によつて、任意の1ビツト又はすべてのビツトを
同時にセツト・リセツト可能である。このプロセ
ツサ割込制御レジスタ303の出力であるプロセ
ツサ割込制御信号303a〜303cは、二重化
されたプロセツサ10〜12各々の割込原因レジ
スタ102〜122の該当する1ビツトを、セツ
ト又はリセツトする。割込原因レジスタ102〜
122該当する1ビツトがセツトされると、プロ
セツサ10〜12内のプログラムに割込が発生
し、管理プロセツサ20からの割込であることが
プロセツサ10〜12のプログラムに判断出来
る。
The processor interrupt control register 303 receives the processor interrupt control signal 301a from the management processor.
It is possible to set/reset any one bit or all bits simultaneously. Processor interrupt control signals 303a-303c, which are output from processor interrupt control register 303, set or reset the corresponding one bit in interrupt cause registers 102-122 of each of duplexed processors 10-12. Interrupt cause register 102~
122 When the corresponding 1 bit is set, an interrupt occurs to the programs in the processors 10 to 12, and the programs in the processors 10 to 12 can determine that the interrupt is from the management processor 20.

なお、プロセツサダウン表示レジスタ302及
びプロセツサ割込制御レジスタ303のビツト数
は、マルチプロセツサシステムにおける論理的最
大プロセツサ対数だけある。又、第2図に示して
いないが、プロセツサ割込制御レジスタ303は
複数個あり、従つて、各プロセツサ10〜12へ
の割込制御信号はプロセツサ当り複数個あり、管
理プロセツサ20から、各プロセツサ10〜12
に対して、複数の種類の割込が存在することは言
うまでもない。
Note that the number of bits in the processor down indication register 302 and the processor interrupt control register 303 is equal to the logical maximum logarithm of processors in the multiprocessor system. Although not shown in FIG. 2, there are a plurality of processor interrupt control registers 303, and therefore, there are a plurality of interrupt control signals for each processor 10 to 12. 10-12
Needless to say, there are multiple types of interrupts.

次に本発明によるシステムの障害処理動作につ
いて説明する。
Next, the failure handling operation of the system according to the present invention will be explained.

システムの障害時の再開手順は、次の5つの部
分から成る。先ず、障害プロセツサから管理プ
ロセツサに対し障害通知を行ない、次に、障害
プロセツサは通知後停止状態になり、ついで、
管理プロセツサは他のプロセツサへ部分システム
ダウム通知を行い、更に、上記プロセツサは上
記部分システムダウン通知併う処理終了報告を行
ない、最後に、管理プロセツサは全プロセツサ
に対して再開指令を出す。
The system failure restart procedure consists of the following five parts: First, the failure processor notifies the management processor of the failure, then the failure processor enters the stopped state after notification, and then,
The management processor notifies other processors that the partial system is down, and furthermore, the processors issue a processing completion report together with the partial system down notification.Finally, the management processor issues a restart command to all processors.

以下に、上記5段階の動作について、図面を参
照しながら詳述する。
Below, the above five steps of operation will be explained in detail with reference to the drawings.

障害プロセツサから管理プロセツサへの障害
通知。
Fault notification from fault processor to managing processor.

各プロセツサは、ソフト制御では処理するこ
とが出来ない障害が発生すると、その検出回路
(第1,2図には示していない)が動作し、プ
ロセツサダウン信号を信号線10b,11b又
は12bを介してパルスで送出する。と同時
に、二重化された一方の正常系が確立される。
すると、マルチプロセツサ制御装置30のプロ
セツサダウン表示レジスタ302の障害発生プ
ロセツサに対応するビツトが、1にセツトされ
る。一方、管理プロセツサ20は、周期的にプ
ログラム制御にて、このプロセツサダウン表示
レジスタ302を入出力バス20bを介してル
ツクインしている。プロセツサダウン表示レジ
スタ302を読み込んで、1がセツトされてい
るビツト位置により、どのプロセツサ対が障害
によりダウンしたかを知ることが出来る。
When a fault that cannot be handled by software control occurs in each processor, its detection circuit (not shown in Figures 1 and 2) operates and sends a processor down signal to signal line 10b, 11b, or 12b. It is sent out in pulses through the At the same time, one of the duplicated normal systems is established.
Then, the bit corresponding to the faulty processor in the processor down indication register 302 of the multiprocessor control device 30 is set to 1. On the other hand, the management processor 20 periodically looks up the processor down indication register 302 via the input/output bus 20b under program control. By reading the processor down indication register 302, it is possible to know which processor pair has gone down due to a failure based on the bit position set to 1.

障害プロセツサは障害通知後停止状態にな
る。
The faulty processor enters the stopped state after being notified of the fault.

この動作は、障害プロセツサが、管理プロセ
ツサ20にプロセツサダウン信号を出した後、
自動的に該プロセツサのマイクロプログラムの
特定アドレスを設定し、二重化された一方の正
常系を確立し、マイクロプログラムに制御を渡
す。マイクロプログラムでは、この状態に入つ
た事を、第1図に示すデータ転送装置101,
111又は121を介して管理プロセツサ20
に通知し、その後、管理プロセツサ20から割
込が有るか否かをルツクインしながら停止状態
(ソフト上は停止状態で、マイクロプログラム
のみ動作している。)になつている。
This operation occurs after the faulty processor issues a processor down signal to the management processor 20.
A specific address of the microprogram of the processor is automatically set, one of the duplexed normal systems is established, and control is passed to the microprogram. In the microprogram, the data transfer device 101 shown in FIG.
Management processor 20 via 111 or 121
Thereafter, it is in a stopped state (software is in a stopped state, only the microprogram is running) while checking whether there is an interrupt from the management processor 20.

管理プロセツサは他のプロセツサへ部分シス
テムダウン通知を行う。
The management processor notifies other processors of partial system down.

通常、負荷分散システムでは、各プロセツサ
が互に関連し、本システムの如く、データ転送
装置101〜121を介して互に情報の通信を
行なつているので、通信相手のプロセツサがダ
ウンした場合は、その事実を知る必要がある。
そこで管理プロセツサ20は、プロセツサダウ
ン表示レジスタ302を読出した結果、いずれ
かのビツトに1がセツトされている場合は、該
当プロセツサ以外に割込制御信号を送出して、
他のプロセツサに割込を発生させて部分システ
ムダウンを通知する。通知後、管理プロセツサ
20は、プロセツサダウン表示レジスタ302
の該当ビツトを、リセツトしておく。
Normally, in a load balancing system, each processor is related to each other and communicates information with each other via data transfer devices 101 to 121, as in this system, so if the communicating partner's processor goes down, , you need to know that fact.
Therefore, if any bit is set to 1 as a result of reading the processor down indication register 302, the management processor 20 sends an interrupt control signal to a processor other than the processor in question.
Generates an interrupt to other processors to notify them of partial system down. After the notification, the management processor 20 registers the processor down indication register 302.
Reset the corresponding bit.

プロセツサは部分システムダウン通知に併う
処理後終了報告を行なう。
The processor issues a completion report after processing in response to the partial system down notification.

部分システムダウン通知を割込によつて知ら
された他のプロセツサは、オンライン処理のあ
い間に、障害プロセツサに関連する情報を初期
設定した後、処理終了した旨を、データ転送装
置101,111又は121を介して管理プロ
セツサ20に通知する。
The other processors that have been notified of the partial system down notification by an interrupt initialize information related to the faulty processor during online processing, and then notify the data transfer device 101, 111 or 111 that the processing has ended. 121 to the management processor 20.

管理プロセツサは全プロセツサに対して再開
指令を出す。
The management processor issues a restart command to all processors.

管理プロセツサ20は、各プロセツサに部分
システムダウン通知を出した後、各プロセツサ
がその処理終了報告をデータ通信装置を介して
管理プロセツサ20の主記憶装置(図に示して
いない、プロセツサ10〜12の中に含まれ
る。)に知らせてくるのを、ルツクインで監視
し、全プロセツサから処理終了報告がきた後、
プロセツサ割込制制レジスタ303の全ビツト
を一斉に1にセツトして、全プロセツサに対し
て同時に再開指令を送出する。この指令を、各
プロセツサは割込により受け、障害発生プロセ
ツサが正常系で動作可能なことを知り、従来通
り、データ転送装置101〜121を介して情
報の転送を開始する。
After the management processor 20 issues a partial system down notification to each processor, each processor sends its processing completion report to the main storage of the management processor 20 (not shown in the figure). (included in the file) is monitored by Ruthin, and after receiving processing completion reports from all processors,
All bits in the processor interrupt control register 303 are set to 1 at the same time, and a restart command is sent to all processors at the same time. Each processor receives this command via an interrupt, learns that the faulty processor can operate normally, and starts transferring information via the data transfer devices 101 to 121 as before.

以上説明したように、本発明は、管理プロセツ
サより複数のプロセツサの状態を監視し、1個で
もプロセツサに異常があれば他のプロセツサに割
込で通知し、全プロセツサが処理完了後、管理プ
ロセツサが再開指令を全プロセツサに一斉に出す
よう構成したことにより、システム全体を一括管
理でき、マルチプロセツサの複雑な障害からの再
開処理を簡明化する効果がある。
As explained above, the present invention allows the management processor to monitor the status of multiple processors, and if even one processor has an abnormality, it notifies the other processors with an interrupt, and after all processors have completed their processing, the management processor By configuring the system so that the restart command is issued to all processors at the same time, the entire system can be managed in one go, which has the effect of simplifying restart processing from complex multiprocessor failures.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明マルチプロセツサシステムの一
実施例を示す概念図であり、第2図は上記実施例
に使用されるマルチプロセツサ制御装置の詳細、
及び、該制御装置と各プロセツサとの接続関係と
を示す概念図である。 10〜12……プロセツサ、20……管理プロ
セツサ、30……マルチプロセツサ制御装置、4
0〜42……入出力制御装置、50……バス制御
装置、101〜121,201……データ転送装
置、102〜122……割込原因レジスタ、30
1……制御部、302……プロセツサダウン表示
レジスタ、303……プロセツサ割込制御レジス
タ。
FIG. 1 is a conceptual diagram showing an embodiment of the multiprocessor system of the present invention, and FIG. 2 shows details of the multiprocessor control device used in the above embodiment.
Also, it is a conceptual diagram showing the connection relationship between the control device and each processor. 10-12...Processor, 20...Management processor, 30...Multiprocessor control device, 4
0-42...Input/output control device, 50...Bus control device, 101-121, 201...Data transfer device, 102-122...Interrupt cause register, 30
1...Control unit, 302...Processor down indication register, 303...Processor interrupt control register.

Claims (1)

【特許請求の範囲】 1 複数の二重化されたプロセツサと、該各プロ
セツサに付属し、バスを介してプロセツサ間のデ
ータ転送を行なうデータ転送装置とを備えて構成
されるマルチプロセツサシステムであつて、 上記複数のプロセツサの中から他のプロセツサ
の運転・保守を管理する管理プロセツサを設ける
と共に、他の各プロセツサについては、二重化さ
れた一方がダウンした時、プロセツサダウン信号
を送出すると共に、二重化された他方により正常
系を確立するよう構成し、且つ、上記管理プロセ
ツサの外部装置として、上記プロセツサダウン信
号を表示して上記管理プロセツサに読取らしめる
手段と、上記管理プロセツサから上記各プロセツ
サに割込ませる手段とを備えて、障害時の再開処
理を行なうよう構成したことを特徴するマルチプ
ロセツサシステム。
[Scope of Claims] 1. A multiprocessor system comprising a plurality of duplex processors and a data transfer device attached to each processor and transferring data between the processors via a bus. , A management processor is provided to manage the operation and maintenance of other processors among the plurality of processors mentioned above, and when one of the duplexed processors goes down, it sends out a processor down signal and and a means for displaying the processor down signal to be read by the management processor, as an external device to the management processor, and a means for displaying the processor down signal to be read by the management processor; What is claimed is: 1. A multiprocessor system comprising means for causing an interrupt, and configured to perform restart processing in the event of a failure.
JP55117751A 1980-08-28 1980-08-28 Multiprocessor system Granted JPS5743255A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP55117751A JPS5743255A (en) 1980-08-28 1980-08-28 Multiprocessor system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP55117751A JPS5743255A (en) 1980-08-28 1980-08-28 Multiprocessor system

Publications (2)

Publication Number Publication Date
JPS5743255A JPS5743255A (en) 1982-03-11
JPS622335B2 true JPS622335B2 (en) 1987-01-19

Family

ID=14719410

Family Applications (1)

Application Number Title Priority Date Filing Date
JP55117751A Granted JPS5743255A (en) 1980-08-28 1980-08-28 Multiprocessor system

Country Status (1)

Country Link
JP (1) JPS5743255A (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6883121B1 (en) * 2000-09-11 2005-04-19 Rockwell Collins Method and system for monitoring microprocessor integrity

Also Published As

Publication number Publication date
JPS5743255A (en) 1982-03-11

Similar Documents

Publication Publication Date Title
EP0010211B1 (en) Data storage subsystem comprising a pair of control units and method for the automatic recovery of data from a defaulting one of these control units
US4775976A (en) Method and apparatus for backing up data transmission system
US4894828A (en) Multiple sup swap mechanism
US4392208A (en) Data processing system and diagnostic unit
JPH0651802A (en) Programmable controller having backup function
JPS61502223A (en) Reconfigurable dual processor system
JPS586975B2 (en) remote modem adapter
JPS5812603B2 (en) I/O Activity Monitor
WO2024016864A1 (en) Processor, information acquisition method, single board and network device
JP2519276B2 (en) Failure information collection processing method
JPS5868165A (en) Additional function unit in microprocessor and operation thereof
JPS622335B2 (en)
JP2693627B2 (en) Redundant system of programmable controller
JPH02132529A (en) Automatic monitoring switching control device
JPS6112580B2 (en)
JPS5917467B2 (en) Control computer backup method
JPH083807B2 (en) Automatic switching device for dual magnetic disk device
JPH05224964A (en) Bus abnormality information system
JPS6113627B2 (en)
JPH0155502B2 (en)
JPS634366A (en) Mutual monitor system for multicomputer
JPH07114521A (en) Multi-microcomputer system
CN118550782A (en) Register fault simulation method, device, equipment and medium
JPS595331A (en) Waiting system in magnetic disk subsystem
EP1380954B1 (en) Computer system and data processing method