JPS622335B2 - - Google Patents
Info
- Publication number
- JPS622335B2 JPS622335B2 JP55117751A JP11775180A JPS622335B2 JP S622335 B2 JPS622335 B2 JP S622335B2 JP 55117751 A JP55117751 A JP 55117751A JP 11775180 A JP11775180 A JP 11775180A JP S622335 B2 JPS622335 B2 JP S622335B2
- Authority
- JP
- Japan
- Prior art keywords
- processor
- processors
- management
- interrupt
- management processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multi Processors (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
- Small-Scale Networks (AREA)
- Hardware Redundancy (AREA)
Description
【発明の詳細な説明】
本発明は、管理プロセツサにより障害時の再開
処理を行なうよう構成したマルチプロセツサシス
テムに関する。DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a multiprocessor system configured to perform restart processing in the event of a failure using a management processor.
一般に、マルチプロセツサシステムは、制御プ
ログラムは一つであるが、複数のプロセツサを持
ち、プロセツサ、主記憶装置、入出力装置が、一
つのバスで接続されているシステム形式をいう。
そして、各プロセツサが異なる機能を分担し、並
列してデータ処理を行なう。 In general, a multiprocessor system has one control program but multiple processors, and the processors, main storage, and input/output devices are connected through a single bus.
Each processor takes on a different function and processes data in parallel.
しかし、従来、電子交換システムにおいては、
障害処理が複雑なため、多数のプロセツサを接続
してのマルチプロセツサシステムは実現されてい
ない。 However, conventionally, in electronic exchange systems,
Due to the complexity of failure handling, a multiprocessor system in which a large number of processors are connected has not been realized.
本発明は、斯かる実情に鑑みてなされたもの
で、複雑な障害処理を、他のプロセツサの運転・
保守管理を行なう管理プロセツサにより集中管理
することにより簡単化した、電子交換システム等
にも適用し得るマルチプロセツサシステムを提供
することを目的とする。 The present invention has been made in view of the above circumstances, and allows complex failure processing to be performed by operating and processing other processors.
It is an object of the present invention to provide a multiprocessor system that can be applied to electronic exchange systems and the like, which is simplified by centrally managing it using a management processor that performs maintenance and management.
即ち、本発明は、複数の二重化されたプロセツ
サと、該各プロセツサに付属し、バスを介してプ
ロセツサ間のデータ転送を行なうデータ転送装置
とを備えて構成されるマルチプロセツサシステム
であつて、上記複数のプロセツサの中から他のプ
ロセツサの運転・保守を管理する管理プロセツサ
を設けると共に、他の各プロセツサについては、
二重化された一方がダウンした時、プロセツサダ
ウン信号を送出すると共に、二重化された他方に
より正常系を確立するよう構成し、且つ、上記管
理プロセツサの外部装置として、上記プロセツサ
ダウン信号を表示して上記管理プロセツサに読取
らしめる手段と、上記管理プロセツサから上記各
プロセツサに割込ませる手段とを備えて、障害時
の再開処理を行なうよう構成したものである。 That is, the present invention is a multiprocessor system comprising a plurality of duplex processors and a data transfer device attached to each processor and transferring data between the processors via a bus. A management processor is provided to manage the operation and maintenance of other processors from among the plurality of processors mentioned above, and for each of the other processors,
When one of the duplexed processors goes down, it sends out a processor down signal and the other duplexed processor establishes a normal system, and displays the processor down signal as an external device of the management processor. The system is configured to perform restart processing in the event of a failure, including means for causing the management processor to read the data and means for causing the management processor to interrupt each of the processors.
以下、本発明を図面に示す実施例に基づいて説
明する。 Hereinafter, the present invention will be explained based on embodiments shown in the drawings.
第1図は本発明マルチプロセツサシステムの一
実施例を示す概念図であり、第2図は上記実施例
に使用されるマルチプロセツサ制御装置の詳細、
及び、該制御装置と各プロセツサとの接続関係と
を示す概念図である。同図において本発明マルチ
プロセツサシステムは、二重化されたプロセツサ
10〜12と、管理プロセツサ20と、マルチプ
ロセツサ制御装置30とを備えて構成される。 FIG. 1 is a conceptual diagram showing an embodiment of the multiprocessor system of the present invention, and FIG. 2 shows details of the multiprocessor control device used in the above embodiment.
Also, it is a conceptual diagram showing the connection relationship between the control device and each processor. In the figure, the multiprocessor system of the present invention includes duplicated processors 10 to 12, a management processor 20, and a multiprocessor control device 30.
上記プロセツサ10〜12及び管理プロセツサ
20は、各々二重化されて構成されている。管理
プロセツサ20は、複数の二重化されたプロセツ
サの中から、他のプロセツサ(この実施例ではプ
ロセツサ10〜12)を運転・保守管理するプロ
セツサとして設定される。一方、他のプロセツサ
10〜12は、情報処理を行なうプロセツサであ
つて、二重化された一方がダウンした時、プロセ
ツサダウン信号を送出すると共に、二重化された
他方により正常系を確立するよう構成される。 The processors 10 to 12 and the management processor 20 are each configured to be duplicated. The management processor 20 is set as a processor that operates and maintains other processors (processors 10 to 12 in this embodiment) from among a plurality of duplicated processors. On the other hand, the other processors 10 to 12 are processors that perform information processing, and are configured to send out a processor down signal when one of the duplexed processors goes down, and to establish a normal system using the other duplexed processor. Ru.
上記プロセツサ10〜12と管理プロセツサ2
0とは、システムバス50aにて接続され、信号
線10a〜12aと20aにて各々接続れたデー
タ転送装置101〜121,201を介して情報
の転送を行なう。該システムバス50aに接続さ
れているバス制御装置50は、システムバス50
aの制御を行ない、制御信号線20cを介して管
理プロセツサ20により制御される。又、管理プ
ロセツサ20には、入出力バス20bを介して入
出力制御装置40〜42及びマルチプロセツサ制
御装置30が接続される。入出力制御装置40〜
42は、入出力バス20bとは信号線40a〜4
2aを介して接続され、管理プロセツサ20に制
御されて、信号線40b〜42bを介して入出力
装置401〜421を制御している。 The above processors 10 to 12 and the management processor 2
0 is connected via a system bus 50a, and information is transferred via data transfer devices 101-121, 201 connected via signal lines 10a-12a and 20a, respectively. The bus control device 50 connected to the system bus 50a is connected to the system bus 50a.
a, and is controlled by the management processor 20 via the control signal line 20c. Further, input/output control devices 40 to 42 and a multiprocessor control device 30 are connected to the management processor 20 via an input/output bus 20b. Input/output control device 40~
42, the input/output bus 20b is the signal line 40a to 4.
2a, and is controlled by the management processor 20 to control input/output devices 401-421 via signal lines 40b-42b.
上記マルチプロセツサ制御装置30は、制御部
301と、各プロセツサに対応するプロセツサダ
ウン表示レジスタ302と、各プロセツサ割込制
御レジスタ303とから構成されている。 The multiprocessor control device 30 is composed of a control section 301, a processor down indication register 302 corresponding to each processor, and each processor interrupt control register 303.
この制御部301は、上記管理プロセツサ20
から、入出力バス20bを介して入力した命令を
解釈して、プロセツサダウン表示レジスタ302
に対する表示読取りと、各プロセツサ割込制御レ
ジスタ303に対するプロセツサ割込制御とを判
別し、各々に対応してプロセツサダウン表示レジ
スタ読取り及びリセツト信号302a、又はプロ
セツサ割込制御信号301aを出力する。 This control unit 301 controls the management processor 20
, interprets the instructions input via the input/output bus 20b, and outputs the processor down indication register 302.
It discriminates whether to read the display for the processor interrupt control register 303 or to control the processor interrupt to each processor interrupt control register 303, and outputs a processor down display register read and reset signal 302a or a processor interrupt control signal 301a corresponding to each processor interrupt control register 303.
プロセツサダウン表示レジスタ302は、二重
化されたプロセツサの一方がダウンした時に、信
号線10b〜12bを介して送出されるプロセツ
サダウン信号によつてセツトされる。そして、管
理プロセツサ20からのリセツト信号により、リ
セツトされる。 Processor down indication register 302 is set by a processor down signal sent via signal lines 10b to 12b when one of the duplicated processors goes down. Then, it is reset by a reset signal from the management processor 20.
プロセツサ割込制御レジスタ303は、管理プ
ロセツサからのプロセツサ割込制御信号301a
によつて、任意の1ビツト又はすべてのビツトを
同時にセツト・リセツト可能である。このプロセ
ツサ割込制御レジスタ303の出力であるプロセ
ツサ割込制御信号303a〜303cは、二重化
されたプロセツサ10〜12各々の割込原因レジ
スタ102〜122の該当する1ビツトを、セツ
ト又はリセツトする。割込原因レジスタ102〜
122該当する1ビツトがセツトされると、プロ
セツサ10〜12内のプログラムに割込が発生
し、管理プロセツサ20からの割込であることが
プロセツサ10〜12のプログラムに判断出来
る。 The processor interrupt control register 303 receives the processor interrupt control signal 301a from the management processor.
It is possible to set/reset any one bit or all bits simultaneously. Processor interrupt control signals 303a-303c, which are output from processor interrupt control register 303, set or reset the corresponding one bit in interrupt cause registers 102-122 of each of duplexed processors 10-12. Interrupt cause register 102~
122 When the corresponding 1 bit is set, an interrupt occurs to the programs in the processors 10 to 12, and the programs in the processors 10 to 12 can determine that the interrupt is from the management processor 20.
なお、プロセツサダウン表示レジスタ302及
びプロセツサ割込制御レジスタ303のビツト数
は、マルチプロセツサシステムにおける論理的最
大プロセツサ対数だけある。又、第2図に示して
いないが、プロセツサ割込制御レジスタ303は
複数個あり、従つて、各プロセツサ10〜12へ
の割込制御信号はプロセツサ当り複数個あり、管
理プロセツサ20から、各プロセツサ10〜12
に対して、複数の種類の割込が存在することは言
うまでもない。 Note that the number of bits in the processor down indication register 302 and the processor interrupt control register 303 is equal to the logical maximum logarithm of processors in the multiprocessor system. Although not shown in FIG. 2, there are a plurality of processor interrupt control registers 303, and therefore, there are a plurality of interrupt control signals for each processor 10 to 12. 10-12
Needless to say, there are multiple types of interrupts.
次に本発明によるシステムの障害処理動作につ
いて説明する。 Next, the failure handling operation of the system according to the present invention will be explained.
システムの障害時の再開手順は、次の5つの部
分から成る。先ず、障害プロセツサから管理プ
ロセツサに対し障害通知を行ない、次に、障害
プロセツサは通知後停止状態になり、ついで、
管理プロセツサは他のプロセツサへ部分システム
ダウム通知を行い、更に、上記プロセツサは上
記部分システムダウン通知併う処理終了報告を行
ない、最後に、管理プロセツサは全プロセツサ
に対して再開指令を出す。 The system failure restart procedure consists of the following five parts: First, the failure processor notifies the management processor of the failure, then the failure processor enters the stopped state after notification, and then,
The management processor notifies other processors that the partial system is down, and furthermore, the processors issue a processing completion report together with the partial system down notification.Finally, the management processor issues a restart command to all processors.
以下に、上記5段階の動作について、図面を参
照しながら詳述する。 Below, the above five steps of operation will be explained in detail with reference to the drawings.
障害プロセツサから管理プロセツサへの障害
通知。 Fault notification from fault processor to managing processor.
各プロセツサは、ソフト制御では処理するこ
とが出来ない障害が発生すると、その検出回路
(第1,2図には示していない)が動作し、プ
ロセツサダウン信号を信号線10b,11b又
は12bを介してパルスで送出する。と同時
に、二重化された一方の正常系が確立される。
すると、マルチプロセツサ制御装置30のプロ
セツサダウン表示レジスタ302の障害発生プ
ロセツサに対応するビツトが、1にセツトされ
る。一方、管理プロセツサ20は、周期的にプ
ログラム制御にて、このプロセツサダウン表示
レジスタ302を入出力バス20bを介してル
ツクインしている。プロセツサダウン表示レジ
スタ302を読み込んで、1がセツトされてい
るビツト位置により、どのプロセツサ対が障害
によりダウンしたかを知ることが出来る。 When a fault that cannot be handled by software control occurs in each processor, its detection circuit (not shown in Figures 1 and 2) operates and sends a processor down signal to signal line 10b, 11b, or 12b. It is sent out in pulses through the At the same time, one of the duplicated normal systems is established.
Then, the bit corresponding to the faulty processor in the processor down indication register 302 of the multiprocessor control device 30 is set to 1. On the other hand, the management processor 20 periodically looks up the processor down indication register 302 via the input/output bus 20b under program control. By reading the processor down indication register 302, it is possible to know which processor pair has gone down due to a failure based on the bit position set to 1.
障害プロセツサは障害通知後停止状態にな
る。 The faulty processor enters the stopped state after being notified of the fault.
この動作は、障害プロセツサが、管理プロセ
ツサ20にプロセツサダウン信号を出した後、
自動的に該プロセツサのマイクロプログラムの
特定アドレスを設定し、二重化された一方の正
常系を確立し、マイクロプログラムに制御を渡
す。マイクロプログラムでは、この状態に入つ
た事を、第1図に示すデータ転送装置101,
111又は121を介して管理プロセツサ20
に通知し、その後、管理プロセツサ20から割
込が有るか否かをルツクインしながら停止状態
(ソフト上は停止状態で、マイクロプログラム
のみ動作している。)になつている。 This operation occurs after the faulty processor issues a processor down signal to the management processor 20.
A specific address of the microprogram of the processor is automatically set, one of the duplexed normal systems is established, and control is passed to the microprogram. In the microprogram, the data transfer device 101 shown in FIG.
Management processor 20 via 111 or 121
Thereafter, it is in a stopped state (software is in a stopped state, only the microprogram is running) while checking whether there is an interrupt from the management processor 20.
管理プロセツサは他のプロセツサへ部分シス
テムダウン通知を行う。 The management processor notifies other processors of partial system down.
通常、負荷分散システムでは、各プロセツサ
が互に関連し、本システムの如く、データ転送
装置101〜121を介して互に情報の通信を
行なつているので、通信相手のプロセツサがダ
ウンした場合は、その事実を知る必要がある。
そこで管理プロセツサ20は、プロセツサダウ
ン表示レジスタ302を読出した結果、いずれ
かのビツトに1がセツトされている場合は、該
当プロセツサ以外に割込制御信号を送出して、
他のプロセツサに割込を発生させて部分システ
ムダウンを通知する。通知後、管理プロセツサ
20は、プロセツサダウン表示レジスタ302
の該当ビツトを、リセツトしておく。 Normally, in a load balancing system, each processor is related to each other and communicates information with each other via data transfer devices 101 to 121, as in this system, so if the communicating partner's processor goes down, , you need to know that fact.
Therefore, if any bit is set to 1 as a result of reading the processor down indication register 302, the management processor 20 sends an interrupt control signal to a processor other than the processor in question.
Generates an interrupt to other processors to notify them of partial system down. After the notification, the management processor 20 registers the processor down indication register 302.
Reset the corresponding bit.
プロセツサは部分システムダウン通知に併う
処理後終了報告を行なう。 The processor issues a completion report after processing in response to the partial system down notification.
部分システムダウン通知を割込によつて知ら
された他のプロセツサは、オンライン処理のあ
い間に、障害プロセツサに関連する情報を初期
設定した後、処理終了した旨を、データ転送装
置101,111又は121を介して管理プロ
セツサ20に通知する。 The other processors that have been notified of the partial system down notification by an interrupt initialize information related to the faulty processor during online processing, and then notify the data transfer device 101, 111 or 111 that the processing has ended. 121 to the management processor 20.
管理プロセツサは全プロセツサに対して再開
指令を出す。 The management processor issues a restart command to all processors.
管理プロセツサ20は、各プロセツサに部分
システムダウン通知を出した後、各プロセツサ
がその処理終了報告をデータ通信装置を介して
管理プロセツサ20の主記憶装置(図に示して
いない、プロセツサ10〜12の中に含まれ
る。)に知らせてくるのを、ルツクインで監視
し、全プロセツサから処理終了報告がきた後、
プロセツサ割込制制レジスタ303の全ビツト
を一斉に1にセツトして、全プロセツサに対し
て同時に再開指令を送出する。この指令を、各
プロセツサは割込により受け、障害発生プロセ
ツサが正常系で動作可能なことを知り、従来通
り、データ転送装置101〜121を介して情
報の転送を開始する。 After the management processor 20 issues a partial system down notification to each processor, each processor sends its processing completion report to the main storage of the management processor 20 (not shown in the figure). (included in the file) is monitored by Ruthin, and after receiving processing completion reports from all processors,
All bits in the processor interrupt control register 303 are set to 1 at the same time, and a restart command is sent to all processors at the same time. Each processor receives this command via an interrupt, learns that the faulty processor can operate normally, and starts transferring information via the data transfer devices 101 to 121 as before.
以上説明したように、本発明は、管理プロセツ
サより複数のプロセツサの状態を監視し、1個で
もプロセツサに異常があれば他のプロセツサに割
込で通知し、全プロセツサが処理完了後、管理プ
ロセツサが再開指令を全プロセツサに一斉に出す
よう構成したことにより、システム全体を一括管
理でき、マルチプロセツサの複雑な障害からの再
開処理を簡明化する効果がある。 As explained above, the present invention allows the management processor to monitor the status of multiple processors, and if even one processor has an abnormality, it notifies the other processors with an interrupt, and after all processors have completed their processing, the management processor By configuring the system so that the restart command is issued to all processors at the same time, the entire system can be managed in one go, which has the effect of simplifying restart processing from complex multiprocessor failures.
第1図は本発明マルチプロセツサシステムの一
実施例を示す概念図であり、第2図は上記実施例
に使用されるマルチプロセツサ制御装置の詳細、
及び、該制御装置と各プロセツサとの接続関係と
を示す概念図である。
10〜12……プロセツサ、20……管理プロ
セツサ、30……マルチプロセツサ制御装置、4
0〜42……入出力制御装置、50……バス制御
装置、101〜121,201……データ転送装
置、102〜122……割込原因レジスタ、30
1……制御部、302……プロセツサダウン表示
レジスタ、303……プロセツサ割込制御レジス
タ。
FIG. 1 is a conceptual diagram showing an embodiment of the multiprocessor system of the present invention, and FIG. 2 shows details of the multiprocessor control device used in the above embodiment.
Also, it is a conceptual diagram showing the connection relationship between the control device and each processor. 10-12...Processor, 20...Management processor, 30...Multiprocessor control device, 4
0-42...Input/output control device, 50...Bus control device, 101-121, 201...Data transfer device, 102-122...Interrupt cause register, 30
1...Control unit, 302...Processor down indication register, 303...Processor interrupt control register.
Claims (1)
セツサに付属し、バスを介してプロセツサ間のデ
ータ転送を行なうデータ転送装置とを備えて構成
されるマルチプロセツサシステムであつて、 上記複数のプロセツサの中から他のプロセツサ
の運転・保守を管理する管理プロセツサを設ける
と共に、他の各プロセツサについては、二重化さ
れた一方がダウンした時、プロセツサダウン信号
を送出すると共に、二重化された他方により正常
系を確立するよう構成し、且つ、上記管理プロセ
ツサの外部装置として、上記プロセツサダウン信
号を表示して上記管理プロセツサに読取らしめる
手段と、上記管理プロセツサから上記各プロセツ
サに割込ませる手段とを備えて、障害時の再開処
理を行なうよう構成したことを特徴するマルチプ
ロセツサシステム。[Scope of Claims] 1. A multiprocessor system comprising a plurality of duplex processors and a data transfer device attached to each processor and transferring data between the processors via a bus. , A management processor is provided to manage the operation and maintenance of other processors among the plurality of processors mentioned above, and when one of the duplexed processors goes down, it sends out a processor down signal and and a means for displaying the processor down signal to be read by the management processor, as an external device to the management processor, and a means for displaying the processor down signal to be read by the management processor; What is claimed is: 1. A multiprocessor system comprising means for causing an interrupt, and configured to perform restart processing in the event of a failure.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP55117751A JPS5743255A (en) | 1980-08-28 | 1980-08-28 | Multiprocessor system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP55117751A JPS5743255A (en) | 1980-08-28 | 1980-08-28 | Multiprocessor system |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS5743255A JPS5743255A (en) | 1982-03-11 |
| JPS622335B2 true JPS622335B2 (en) | 1987-01-19 |
Family
ID=14719410
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP55117751A Granted JPS5743255A (en) | 1980-08-28 | 1980-08-28 | Multiprocessor system |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5743255A (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6883121B1 (en) * | 2000-09-11 | 2005-04-19 | Rockwell Collins | Method and system for monitoring microprocessor integrity |
-
1980
- 1980-08-28 JP JP55117751A patent/JPS5743255A/en active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS5743255A (en) | 1982-03-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0010211B1 (en) | Data storage subsystem comprising a pair of control units and method for the automatic recovery of data from a defaulting one of these control units | |
| US4775976A (en) | Method and apparatus for backing up data transmission system | |
| US4894828A (en) | Multiple sup swap mechanism | |
| US4392208A (en) | Data processing system and diagnostic unit | |
| JPH0651802A (en) | Programmable controller having backup function | |
| JPS61502223A (en) | Reconfigurable dual processor system | |
| JPS586975B2 (en) | remote modem adapter | |
| JPS5812603B2 (en) | I/O Activity Monitor | |
| WO2024016864A1 (en) | Processor, information acquisition method, single board and network device | |
| JP2519276B2 (en) | Failure information collection processing method | |
| JPS5868165A (en) | Additional function unit in microprocessor and operation thereof | |
| JPS622335B2 (en) | ||
| JP2693627B2 (en) | Redundant system of programmable controller | |
| JPH02132529A (en) | Automatic monitoring switching control device | |
| JPS6112580B2 (en) | ||
| JPS5917467B2 (en) | Control computer backup method | |
| JPH083807B2 (en) | Automatic switching device for dual magnetic disk device | |
| JPH05224964A (en) | Bus abnormality information system | |
| JPS6113627B2 (en) | ||
| JPH0155502B2 (en) | ||
| JPS634366A (en) | Mutual monitor system for multicomputer | |
| JPH07114521A (en) | Multi-microcomputer system | |
| CN118550782A (en) | Register fault simulation method, device, equipment and medium | |
| JPS595331A (en) | Waiting system in magnetic disk subsystem | |
| EP1380954B1 (en) | Computer system and data processing method |