JPH03282942A - Multiprocessor system - Google Patents
Multiprocessor systemInfo
- Publication number
- JPH03282942A JPH03282942A JP2085127A JP8512790A JPH03282942A JP H03282942 A JPH03282942 A JP H03282942A JP 2085127 A JP2085127 A JP 2085127A JP 8512790 A JP8512790 A JP 8512790A JP H03282942 A JPH03282942 A JP H03282942A
- Authority
- JP
- Japan
- Prior art keywords
- data
- processor
- memory
- control processor
- main
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Retry When Errors Occur (AREA)
- Multi Processors (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.
Description
【発明の詳細な説明】
〔産業上の利用分野〕
この発明は、ある特定の機能を有する複数のマイクロプ
ロセッサ・ボードを汎用バスに接続することにより汎用
的なデータプロセッサとして作動するマルチプロセッサ
システムに関する。DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a multiprocessor system that operates as a general-purpose data processor by connecting a plurality of microprocessor boards each having a certain function to a general-purpose bus. .
一般に、マルチプロセッサシステムにおいては、ハード
ウェアによるシステムフォールト(例えばメモリ化け、
不正割り込み、バスロック)やソフトウェアの不正アド
レスのアクセスによるバスエラーなどがオペレーティン
グシステム(O8)内で発生すると、システムオペレー
タ(SO)用のコンソール端末装置等にシステムがフォ
ールトしたことやそのエラー内容などを出力した後、シ
ステム全体をストール(システムダウン)するようにし
ている。Generally, in multiprocessor systems, system faults caused by hardware (e.g. memory corruption,
When a bus error (such as an illegal interrupt or bus lock) or a bus error due to software accessing an illegal address occurs within the operating system (O8), the console terminal device for the system operator (SO) will display a message indicating that the system has failed and the details of the error. After outputting , the entire system is stalled (system down).
一方、システムオペレータは、システムがダウンした場
合、メインスイッチを一部オフにした後再びオンにして
電源を再投入することによって、システムの再立ち上げ
を行なうようにしている。On the other hand, when the system goes down, the system operator restarts the system by turning off some of the main switches and then turning them on again to turn on the power.
しかしながら、システムオペレータによるシステムの再
立ち上げでは、その機能が回復するまでにある程度の時
間を要することは否めず、特に上述のようなシステムフ
ォールトによるストールが頻繁に起きるような場合、シ
ステムオペレータの再立ち上げによる労力が多大なもの
になり、またシステムの停止期間も長くなることから各
種作業に支障をきたすなどの不都合があった。However, when the system operator restarts the system, it is undeniable that it takes a certain amount of time for the system's functionality to be restored, and especially when stalls occur frequently due to system faults as mentioned above, the system operator restarts the system. There were inconveniences such as a large amount of effort required to start up the system, and a long period of system downtime, which hindered various operations.
したがって、このマルチプロセッサシステムがマルチユ
ーザ型のものである場合には、遠隔地でこのシステムを
使用しているオペレータは、突然のシステムダウンに際
してその再立ち上げを自ら行なうことができないために
、その停止期間が長時間にわたることもあった。Therefore, if this multi-processor system is a multi-user type, an operator using this system in a remote location will not be able to restart the system himself if the system suddenly goes down. In some cases, the outage period was long.
また、このマルチプロセッサシステムでは、システムフ
ォールトの発生によってストールすると、主記憶装置、
各マイクロプロセッサ・ボード上のローカルメモリ及び
マイクロプロセッサの内部レジスタにそれぞれ格納され
ているデータの一部あるいは全部が失われるために、シ
ステムの再立ち上げが行なわれても、システムフォール
ト発生前の処理の続きを行なうことができなかった。In addition, in this multiprocessor system, if the system stalls due to the occurrence of a system fault, the main memory
Even if the system is restarted because some or all of the data stored in the local memory on each microprocessor board and the internal registers of the microprocessor are lost, processing before a system fault occurs I was unable to continue.
この発明は上記の点に鑑みてなされたものであり、シス
テムフォールトの発生によるシステムの停止期間を短く
し、且つその時のデータの消失を防止することも目的と
する。The present invention has been made in view of the above points, and an object of the present invention is to shorten the period during which a system is stopped due to the occurrence of a system fault, and also to prevent data loss at that time.
この発明は上記の目的を達成するため、上述のようなマ
ルチプロセッサシステムにおいて、第1図に機能ブロッ
ク図で示すように、ハードウェアあるいはソフトウェア
によるシステムフォールトが発生した際に、自動的にシ
ステムの再立ち上げを実行する再立上手段Aを設けたも
のである。In order to achieve the above object, the present invention automatically restarts the system when a system fault occurs due to hardware or software in the multiprocessor system as described above, as shown in the functional block diagram in FIG. This is provided with a restarting means A that executes restarting.
また、そのシステムフォールトによるシステムダウン時
に、主記憶装置Bと各マイクロプロセッサ・ボード上の
ローカルメモリC及びマイクロプロセッサの内部レジス
タDにそれぞれ格納されているデータを2次記憶装置E
にセーブするデータセーブ手段Fと、再立上手段Aによ
るシステムの再立ち上げ後に、2次記憶装置Eにセーブ
した上記各データを主記憶装置Bと前記ローカルメモリ
C及び内部レジスタDにそれぞれリストアするデータリ
ストア手段Gとを設けたものである。In addition, when the system goes down due to a system fault, the data stored in the main memory B, local memory C on each microprocessor board, and internal register D of the microprocessor is transferred to the secondary memory E.
After the system is restarted by the data save means F and the restart means A, each of the above data saved in the secondary storage device E is restored to the main storage device B, the local memory C, and the internal register D, respectively. A data restore means G is provided.
この発明によるマルチプロセッサシステムでは。 In a multiprocessor system according to this invention.
ハードウェアあるいはソフトウェアによるシステムフォ
ールトの発生によってこのシステム全体を一部リセット
するが、その後再立上手段Aがシステムの再立ち上げを
自動的に行なうので、システムの停止期間が短縮される
。When a system fault occurs due to hardware or software, a part of the entire system is reset, but the restarting means A automatically restarts the system thereafter, thereby shortening the system stop period.
なお、通常のマルチプロセッサシステムにおいて起動時
に行なわれるシステム診断(メモリテスト、各周辺機器
に対する初期化チエツクなど)を、再立上手段Aによる
システムの立ち上げ後にも行なうようにすれば、システ
ムダウンの根本原因を容易に究明することが可能になる
。Note that if the system diagnosis (memory test, initialization check for each peripheral device, etc.) that is performed at startup in a normal multiprocessor system is also performed after the system is started up using restart means A, system downtime can be prevented. It becomes possible to easily investigate the root cause.
また、そのシステムフォールトによるシステムダウン時
に、主記憶装置Bと各マイクロプロセッサ・ボード上の
ローカルメモリC及びマイクロプロセッサの内部レジス
タDにそれぞれ格納されているデータをデータセーブ手
段Fが2次記憶装置Eにセーブし、再立上手段Aによる
システムの再立ち上げ後に、2次記憶装MEにセーブし
た上記各データをデータリストア手段Gが主記憶装置B
と前記ローカルメモリC及び内部レジスタDにそれぞれ
リストアするので、データの消失が確実に防止され、リ
ストア終了後にはシステムフォールト発生前の処理の続
きを行なうことができる。In addition, when the system goes down due to a system fault, the data save means F saves the data stored in the main memory B, the local memory C on each microprocessor board, and the internal register D of the microprocessor, respectively, to the secondary memory E. After the system is restarted by the restart means A, the data restore means G transfers the above data saved to the secondary storage ME to the main storage B.
Since the data is restored to the local memory C and the internal register D, data loss is reliably prevented, and after the restoration is completed, it is possible to continue the process that was performed before the system fault occurred.
したがって、システムの信頼性も向上する。Therefore, the reliability of the system is also improved.
以下、この発明の実施例を添付図面に基づいて具体的に
説明する。Embodiments of the present invention will be specifically described below with reference to the accompanying drawings.
第2図は、この発明の一実施例であるマルチプロセツサ
システムの一例を示すブロック構成図である。FIG. 2 is a block diagram showing an example of a multiprocessor system according to an embodiment of the present invention.
このマルチプロセッサシステム1は、それぞれ汎用の1
6又は32ビツトのCPU及びローカルメモリ(RAM
)を内蔵したシステムコンソール制御プロセッサ2.メ
インプロセッサ3.システムメモリ4.ファイル制御プ
ロセッサ5.システムディスク制御プロセッサ6、及び
端末制御プロセッサ7等によって構成され、これらはシ
ステムバス8によって相互に接続されている。This multiprocessor system 1 includes a general-purpose
6 or 32 bit CPU and local memory (RAM)
) system console control processor with built-in 2. Main processor 3. System memory 4. File control processor5. It is composed of a system disk control processor 6, a terminal control processor 7, etc., and these are interconnected by a system bus 8.
システムコンソール制御プロセッサ(SCP)2は、シ
ステムコンソール(SC)9との入出力制御を司り、ハ
ード的にはシステムバス8の状態を常時監視し、不良等
を検出した時にはアービトレーション(調停)を行なう
。A system console control processor (SCP) 2 is in charge of input/output control with the system console (SC) 9, and in terms of hardware, it constantly monitors the status of the system bus 8 and performs arbitration when a defect is detected. .
また、システムバス8上にリセット信号を出力して、他
の全てのプロセッサ3,5〜7に対してリセットをかけ
る機能も持っている。It also has the function of outputting a reset signal onto the system bus 8 to reset all other processors 3, 5-7.
さらに、このシステムコンソール制御プロセッサ2は、
このシステム中量も負荷が低く(フォールトが起こりに
くい)且つ上述した各機能を持ち合わせている点から、
後述するブーストラップ(システムの再立ち上げ)機能
も持たせている。Furthermore, this system console control processor 2
This system also has a low load (faults are unlikely to occur) and has the above-mentioned functions, so
It also has a bootstrap (system restart) function, which will be described later.
なお、その機能を実現するのに必要な後述するりスター
トフラグの状態を記憶するために、不揮発性メモリも内
蔵している。Note that a non-volatile memory is also included in order to store the state of a start flag, which will be described later, which is necessary to realize this function.
メインプロセッサ(MP)3はこのシステム全体を統括
的に制御するメインCPUを持つプロセッサであり、オ
ペレーティングシステム及びユーザプログラムはここで
使用される。The main processor (MP) 3 is a processor having a main CPU that centrally controls the entire system, and the operating system and user programs are used here.
システムメモリ(SM)4はこのシステムで汎用的に使
用される第1図に示した主記憶装置Bに相当するメモリ
であり、主にプロセッサ間のコマンド(clld) /
レスポンス(rspLパケット用データ。The system memory (SM) 4 is a memory corresponding to the main memory B shown in FIG. 1, which is commonly used in this system, and is mainly used for commands (clld) /
Response (data for rspL packet.
及びファイルデータ等を格納する。and store file data, etc.
ファイル制御プロセッサ(FP)5は、オペレーティン
グシステムの付加を分散させるために設けられたもので
あり、ファイルのl10(ディスクに対する読み出し及
び書込)をメインプロセッサ3の指示によって実行する
。A file control processor (FP) 5 is provided to distribute the addition of an operating system, and executes file l10 (reading and writing to and from the disk) according to instructions from the main processor 3.
システムディスク制御プロセッサ(SDP)6は、ファ
イル制御プロセッサ5の指示によって、第1図の2次記
憶装置Eに相当するシステムディスク(SD)10の制
御を司る。A system disk control processor (SDP) 6 controls a system disk (SD) 10, which corresponds to the secondary storage device E in FIG. 1, according to instructions from the file control processor 5.
端末制御プロセッサ(TP)7はユーザの端末制御用プ
ロセッサであり、メインプロセッサ3の指示によって端
末装置111〜llnを制御する。A terminal control processor (TP) 7 is a user terminal control processor, and controls the terminal devices 111 to lln according to instructions from the main processor 3.
また、プリンタ12の制御も行なう。It also controls the printer 12.
第3図は、この各プロセッサ2,3.5〜7のマスタ/
スレーブの関係及びシステムメモリ4との関係を示す。Figure 3 shows the master/processor of each processor 2, 3.
The relationship between slaves and the system memory 4 is shown.
この図から分かるように、メインプロセッサ(MP)3
は全てのプロセッサのマスクであるため、このメインプ
ロセッサ3がフォールトを起こした場合にはシステム全
体が機能を停止してしまう。As you can see from this diagram, main processor (MP) 3
Since this is a mask for all processors, if this main processor 3 causes a fault, the entire system will stop functioning.
ここで、メインプロセッサ3が機能を停止する原因とな
る2種類のフォールトについて簡単に説明する。Here, two types of faults that cause the main processor 3 to stop functioning will be briefly explained.
■ソフトウェアフォールト
オペレーティングシステムで認知できるバスエラー、イ
リーガルインタラブド等が発生し、コレ以上動作が不可
能となってシステムパニックに陥る。■Software fault A bus error, illegal interaction, etc. that can be recognized by the operating system occurs, making it impossible to operate any further and causing a system panic.
■ハードウェアフォールト
メインプロセッサ3内のCPUがハード的な原因で暴走
あるいは停止する。■Hardware fault The CPU in the main processor 3 runs out of control or stops due to hardware reasons.
このようなことから、メインプロセッサ3は内部でフォ
ールトが生じた場合、直ちにシステムコンソール制御プ
ロセッサ2に所定の指示を与えて後述する第4図以降に
示す処理を行なわせるようにした。For this reason, when a fault occurs internally, the main processor 3 immediately gives a predetermined instruction to the system console control processor 2 to cause it to perform the processes shown in FIG. 4 and subsequent figures, which will be described later.
また、他のプロセッサ3,5〜7のいずれかがフォール
トした場合には、メインプロセッサ3はそれを検出して
そのプロセッサに対してリセット。Further, if any of the other processors 3, 5 to 7 faults, the main processor 3 detects it and resets that processor.
初期化及び診断を行ない、システムオペレータに対して
エラーを通知する。Performs initialization and diagnostics, and notifies system operators of errors.
例えば、システムコンソール制御プロセッサ2に指示を
与えてシステムコンソール9にエラー情報を送出させ、
その表示画面にその情報を表示させてシステムオペレー
タに知らせる。For example, by giving instructions to the system console control processor 2 to send error information to the system console 9,
The information is displayed on the display screen to notify the system operator.
なお、システムコンソール制御プロセッサ2が、第1図
の再立上手段A、データセーブ手段F、及びデータリス
トア手段Gとしての機能も果たす。Incidentally, the system console control processor 2 also functions as the restarting means A, the data saving means F, and the data restoring means G in FIG.
また、全てのプロセッサ2,3.5〜7上のローカルメ
モリ及びCPUの内部レジスタが、それぞれ第1図のロ
ーカルメモリC及び内部レジスタDに相当する。Further, local memories on all processors 2, 3.5 to 7 and internal registers of the CPU correspond to local memory C and internal register D in FIG. 1, respectively.
次に、このように構成されたこの実施例の作用について
第4図以降も参照して具体的に説明する。Next, the operation of this embodiment configured as described above will be specifically explained with reference to FIG. 4 and subsequent figures.
第4図は、システムコンソール制御プロセッサ2による
システムフォールト発生時の処理内容を示すフローチャ
ートである。FIG. 4 is a flowchart showing the processing contents performed by the system console control processor 2 when a system fault occurs.
このルーチンは図示しないメインルーチンによってコー
ルされるとスタートし、まずステップ1でメインプロセ
ッサ3から後述するハンドシェイク・タイムアウト信号
が入力された否かを判断し。This routine starts when called by a main routine (not shown), and first, in step 1, it is determined whether a handshake timeout signal, which will be described later, has been input from the main processor 3.
入力されるとステップ2へ進み、入力されなければステ
ップ8へ進んで、メインプロセッサ3からシステムフォ
ールトの通知がきているかどうかを判断する。If it is input, the process proceeds to step 2; if not, the process proceeds to step 8, where it is determined whether a system fault notification has been received from the main processor 3.
そして、システムフォールトの通知がきていればステッ
プ2へ進み、きていなければステップ1へ戻る。Then, if a system fault notification has been received, proceed to step 2; if not, return to step 1.
ステップ2では、ファイル制御プロセッサ(FP)5及
びシステムディスク制御プロセッサ(SDP)6は正常
に動作しているか否かを判断し、正常に動作していれば
、ステップ3でフォールト内容をシステムディスク(S
D) 10ヘセーブするようにファイル制御プロセッ
サ(FP)5に指示を与え、ステップ4で自己の内部レ
ジスタ内のデータをシステムメモリ(SM)4に書き出
すように各プロセッサ3.5〜7に指示を与える。In step 2, the file control processor (FP) 5 and system disk control processor (SDP) 6 determine whether or not they are operating normally. S
D) Instruct the file control processor (FP) 5 to save to 10, and instruct each processor 3.5 to 7 to write the data in its own internal register to the system memory (SM) 4 in step 4. give.
このとき、システムコンソール制御プロセッサ(SCP
)2内体も内部レジスタ内のデータをシステムメモリ4
に書き出す。At this time, the system console control processor (SCP)
) 2 The internal body also transfers the data in the internal registers to the system memory 4
Write it down.
次いで、ステップ5でシステムメモリ(SM)4内の全
てのデータをシステムディスク(S D) 10に書き
込むようにファイル制御プロセッサ(FP)5に指示を
与え、ステップ6でシステムコンソール制御プロセッサ
(SPC)2に内蔵されてしする不揮発性メモリ内のり
スタートフラグをオン状態にした後、ステップ7でシス
テムをリセット、すなわち全てのプロセッサ(システム
コンソール制御プロセッサ2自体も含む)をリセットし
て処理を終了する。Then, in step 5, the file control processor (FP) 5 is instructed to write all the data in the system memory (SM) 4 to the system disk (SD) 10, and in step 6, the file control processor (FP) 5 is instructed to write all the data in the system memory (SM) 4 to the system disk (SD) 10, and in step 6, After turning on the start flag in the non-volatile memory built into the processor 2, the system is reset in step 7, that is, all processors (including the system console control processor 2 itself) are reset, and the process is terminated.
一方、ステップ2において、ファイル制御プロセッサ(
FP)5あるいはシステムディスク制御プロセッサ(S
DP)6が正常な動作をしていない場合には、ステップ
9で端末制御プロセッサ(TP)7は正常に動作してい
るか否かを判断する。On the other hand, in step 2, the file control processor (
FP) 5 or system disk control processor (S
If the terminal control processor (TP) 6 is not operating normally, in step 9 the terminal control processor (TP) 7 determines whether it is operating normally.
そして、端末制御プロセッサ7が正常に動作していれば
、プリンタ12でフォールト内容をプリントアウトでき
るように端末制御プロセッサ(TP)7に指示を与えた
後ステップ6へ進む。If the terminal control processor 7 is operating normally, an instruction is given to the terminal control processor (TP) 7 so that the fault details can be printed out using the printer 12, and then the process proceeds to step 6.
また、端末制御プロセッサ7が正常に動作していなけれ
ば、システムコンソール(SC)9にフォールト内容を
出力してその表示画面に表示させた後ステップ6へ進む
。If the terminal control processor 7 is not operating normally, the fault details are output to the system console (SC) 9 and displayed on its display screen, and then the process proceeds to step 6.
なお、メインプロセッサ3及びシステムコンソール制御
プロセッサ2は、ハンドシェイクすなわち互いに正常な
動作を行なっているか否かの確認を定期的に行なってお
り、いずれも正常でなくなると相手にハンドシェイク・
タイムアウト信号を出力する。The main processor 3 and the system console control processor 2 regularly perform handshakes, that is, confirm whether or not each other is operating normally.
Output a timeout signal.
ここで、システムコンソール制御プロセッサ2及びメイ
ンプロセッサ3の各ハンドシェイク処理を第5図及び第
6図によって簡単に説明する。Here, each handshake process of the system console control processor 2 and the main processor 3 will be briefly explained with reference to FIGS. 5 and 6.
第5図はシステムコンソール制御プロセッサ2によるハ
ンドシェイク処理を示すフローチャートであり、メイン
ルーチンによってコールされるとスタートする。FIG. 5 is a flowchart showing handshake processing by the system console control processor 2, which starts when called by the main routine.
そしてまず、タイマをスタートさせ、続いてタイマ値T
が設定値T1に達したか否かを判断するが、最初はその
ままメインルーチンへリターンし、その後設定値T1に
達した時にハンドシェイクフラグがオン状態か否かの判
断を行なう。First, start the timer, and then set the timer value T.
It is determined whether or not the handshake flag has reached the set value T1. At first, the process directly returns to the main routine, and then when the handshake flag reaches the set value T1, it is determined whether or not the handshake flag is on.
そして、オン状態でなければ、タイマ値Tが設定値T2
に達したか否かを判断し、達してなければ再びハンドシ
ェイクフラグがオン状態か否かの判断に戻る。If it is not on, the timer value T is set to T2.
It is determined whether the handshake flag has been reached, and if it has not been reached, the process returns to determining whether the handshake flag is on.
そして、タイマ値Tが設定値T2に達する前にハンドシ
ェイクフラグがオン状態になると、それをオフ状態にし
、タイマをリセットにした後メインルーチンへリターン
する。If the handshake flag turns on before the timer value T reaches the set value T2, it is turned off, the timer is reset, and the process returns to the main routine.
それに対して、ハンドシェイクフラグがオフ状態のまま
タイマ値Tが設定値T2に達してしまうと、メインプロ
セッサ3八ハンドシエイク・タイムアウト信号を出力す
る。On the other hand, if the timer value T reaches the set value T2 while the handshake flag remains off, the main processor 38 outputs a handshake timeout signal.
なお、設定値T1及びTlはTl <Tlの関係にある
。Note that the set values T1 and Tl have a relationship of Tl < Tl.
第6図はメインプロセッサ3によるハンドシェイク処理
を示すフローチャートであり、メインルーチンによって
コールされるとスタートする。FIG. 6 is a flowchart showing handshake processing by the main processor 3, which starts when called by the main routine.
そしてまず、タイマをスタートさせ、続いてタイマ値T
が設定値T1に達したか否かを判断するが、最初はその
ままメインルーチンへリターンし、その後設定値T1に
達した時にハンドシェイクフラグがオフ状態か否かの判
断を行なう。First, start the timer, and then set the timer value T.
It is determined whether or not the handshake flag has reached the set value T1. Initially, the process returns to the main routine as it is, and then, when the handshake flag reaches the set value T1, it is determined whether or not the handshake flag is in the off state.
そして、オフ状態でなければ、タイマ値Tが設定値T2
に達したか否かを判断し、達してなければ再度ハンドシ
ェイクフラグがオフ状態か否かの判断に進んでこの処理
を繰り返す。If it is not off, the timer value T is set to T2.
It is determined whether or not the handshake flag has been reached, and if it has not been reached, the process is repeated by determining whether the handshake flag is off.
そして、タイマ値Tが設定値T2に達する前にハンドシ
ェイクフラグがオフ状態になると、それをオン状態にし
、タイマをリセットにした後メインルーチンへリターン
する。If the handshake flag turns off before the timer value T reaches the set value T2, it is turned on, the timer is reset, and the process returns to the main routine.
それに対して、ハンドシェイクフラグがオン状態のまま
タイマ値Tが設定値T2に達してしまうと、システムコ
ンソール制御プロセッサ2ヘノ1ンドシエイク・タイム
アウト信号を出力する。On the other hand, if the timer value T reaches the set value T2 while the handshake flag remains on, a handshake timeout signal is output to the system console control processor 2.
次に、システムコンソール制御プロセッサ2によるシス
テムリセット後の再立上処理を、第7図のフローチャー
トを参照して説明する。Next, the restart processing after system reset by the system console control processor 2 will be explained with reference to the flowchart of FIG.
このルーチンはメインルーチンによってコールされると
スタートし、まずシステムメモリ(S M)4に対する
リード/ライトをテストした後、不揮発性メモリ内のり
スタートフラグがオン状態か否かを判断する。This routine starts when called by the main routine, first tests read/write to the system memory (SM) 4, and then determines whether the write start flag in the nonvolatile memory is on.
そして、リスタートフラグがオン状態でなければ、・各
プロセッサ3,5〜7に初期化を指示し。If the restart flag is not in the on state, - Instruct each processor 3, 5 to 7 to initialize.
直ちにメインルーチンへリターンする。Immediately return to the main routine.
また、リスタートフラグがオン状態ならば、システムデ
ィスク(SD)10のセーブ領域にセーブされたデータ
をシステムメモリ4に戻すようにファイル制御プロセッ
サ(FP)5に指示を与え、次いでシステムメモリ4に
戻されたデータのうち対応するデータ(先にセーブした
データ)を引き取るように各プロセッサ3,5〜7に指
示を与える。If the restart flag is on, it instructs the file control processor (FP) 5 to return the data saved in the save area of the system disk (SD) 10 to the system memory 4, and then returns the data to the system memory 4. An instruction is given to each processor 3, 5-7 to receive the corresponding data (previously saved data) from among the returned data.
このとき、システムコンソール制御プロセッサ2自体も
、システムメモリ4から先にシステムディスク10にセ
ーブしたフォールト内容を引き取る。At this time, the system console control processor 2 itself also retrieves the fault contents previously saved on the system disk 10 from the system memory 4.
そして、そのフォールト内容をシステムコンソール9へ
出力してその表示画面に表示させ、その後各プロセッサ
3,5〜7に再スタートを指示してメインルーチンへリ
ターンする。Then, the fault contents are outputted to the system console 9 and displayed on the display screen, and then each processor 3, 5 to 7 is instructed to restart, and the process returns to the main routine.
それによって、システムコンソール制御プロセッサ2を
含む全てのプロセッサ2,3.5〜7、すなわちマルチ
プロセッサシステム1全体が再起動する。As a result, all the processors 2, 3.5 to 7, including the system console control processor 2, ie, the entire multiprocessor system 1 is restarted.
このように、この実施例によるマルチプロセッサシステ
ム1では、システムフォールトの発生によってこのシス
テム全体を一旦はりセットするが。In this manner, in the multiprocessor system 1 according to this embodiment, the entire system is temporarily reset when a system fault occurs.
その後システムの再立ち上げを自動的に行なうので1.
システムの停止期間が短縮する。After that, the system will be restarted automatically, so 1.
System downtime is reduced.
また、そのシステムフォールトによるシステムダウン時
に、システムメモリ(主記憶装置)と各プロセッサ上の
ローカルメモリ及びCPUの内部レジスタにそれぞれ格
納されているデータをシステムディスク(2次記憶装置
)にセーブし、システムの再立ち上げ後に、そのシステ
ムディスクにセーブした各データを上述のシステムメモ
リ、ローカルメモリ及び内部レジスタにそれぞれリスト
アするので、データの消失が確実に防止され、リストア
終了後にはシステムフォールト発生前の処理の続きをそ
のまま行なうことができる。In addition, when the system goes down due to a system fault, the data stored in the system memory (main memory), local memory on each processor, and internal registers of the CPU is saved to the system disk (secondary storage), and the system After the system is restarted, each data saved on the system disk is restored to the system memory, local memory, and internal registers mentioned above, so data loss is reliably prevented, and after the restoration is completed, the processing before the system fault occurred can be resumed. You can proceed directly.
したがって、システムダウンによる障害を最小限に抑え
ることができる。Therefore, failures due to system failure can be minimized.
なお、この発明はマルチユーザ、マルチタスク型のエン
ジニアリングワークステーション(EVS)を含む各種
情報処理装置に適用し得るものである。Note that the present invention is applicable to various information processing apparatuses including multi-user, multi-task engineering workstations (EVS).
以上説明したように、この発明によるマルチプロセッサ
システムによれば、システムフォールトの発生によるシ
ステムの停止期間が短縮し、しかもその時のデータの消
失を確実に防止することができる。As described above, according to the multiprocessor system according to the present invention, the period during which the system is stopped due to the occurrence of a system fault can be shortened, and data loss at that time can be reliably prevented.
第1図はこの発明の基本構成を示す機能ブロック図、
第2図はこの発明の一実施例であるマルチプロセッサシ
ステムを示すブロック構成図、
第3図は同じくその各プロセッサのマスタ/スレーブの
関係及びシステムメモリとの関係を示す説明図、
第4図は同じくそのシステムコンソール制御プロセッサ
によるシステムフォール時の処理内容を示すフロー図、
第5図は同じくシステムコンソール制御プロセッサによ
るハンドシェイク処理を示すフロー図、
第6図は第2図のメインプロセッサによるハンドシェイ
ク処理を示すフロー図、
第7図は第2図のシステムコンソール制御プロセッサに
よるシステムリセット後の再立上処理を示すフロー図で
ある。
1・・・マルチプロセッサシステム
2・・・システムコンソール制御プロセッサ3・・・メ
インプロセッサ 4・・・システムメモリ5・・・
ファイル制御プロセッサ
6・・・システムディスク制御プロセッサ7・・・端末
制御プロセッサ 8・・・システムバス9・・・シス
テムコンソール
10・・・システムディスク 11・・・端末装置1
2・・・プリンタ
ul
第4図
第7図FIG. 1 is a functional block diagram showing the basic configuration of this invention. FIG. 2 is a block diagram showing a multiprocessor system which is an embodiment of this invention. FIG. 3 is a master/slave relationship of each processor. FIG. 4 is a flowchart showing the processing by the system console control processor at the time of system failure; FIG. 5 is a flowchart showing the handshake processing by the system console control processor. , FIG. 6 is a flowchart showing handshake processing by the main processor of FIG. 2, and FIG. 7 is a flowchart showing restart processing after system reset by the system console control processor of FIG. 2. 1... Multiprocessor system 2... System console control processor 3... Main processor 4... System memory 5...
File control processor 6... System disk control processor 7... Terminal control processor 8... System bus 9... System console 10... System disk 11... Terminal device 1
2...Printer UL Figure 4 Figure 7
Claims (1)
・ボードを汎用バスに接続することにより汎用的なデー
タプロセッサとして作動するマルチプロセッサシステム
において、ハードウェアあるいはソフトウェアによるシ
ステムフオールトが発生した際に、自動的にシステムの
再立ち上げを実行する再立上手段を設けたことを特徴と
するマルチプロセッサシステム。 2 請求項1記載のマルチプロセッサシステムにおいて
、 前記システムフオールトによるシステムダウン時に、主
記憶装置と前記各マイクロプロセッサ・ボード上のロー
カルメモリ及びマイクロプロセッサの内部レジスタにそ
れぞれ格納されているデータを2次記憶装置にセーブす
るデータセーブ手段と、前記再立上手段によるシステム
の再立ち上げ後に、前記2次記憶装置にセーブした前記
各データを前記主記憶装置と前記ローカルメモリ及び前
記マイクロプロセッサの内部レジスタにそれぞれリスト
アするデータリストア手段とを設けたことを特徴とする
マルチプロセッサシステム。[Claims] 1. In a multiprocessor system that operates as a general-purpose data processor by connecting a plurality of microprocessor boards with specific functions to a general-purpose bus, a system fault occurs due to hardware or software. 1. A multiprocessor system characterized by being provided with a restart means for automatically restarting the system when the system is restarted. 2. The multiprocessor system according to claim 1, wherein when the system goes down due to the system fault, the data stored in the main memory, the local memory on each microprocessor board, and the internal register of the microprocessor, respectively, is transferred to the secondary memory. data saving means for saving in a storage device; and after restarting the system by the restarting means, each data saved in the secondary storage device is saved in the main storage device, the local memory, and an internal register of the microprocessor. A multiprocessor system comprising: a data restore means for restoring data to each of the data processors;
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2085127A JPH03282942A (en) | 1990-03-30 | 1990-03-30 | Multiprocessor system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2085127A JPH03282942A (en) | 1990-03-30 | 1990-03-30 | Multiprocessor system |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH03282942A true JPH03282942A (en) | 1991-12-13 |
Family
ID=13849983
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2085127A Pending JPH03282942A (en) | 1990-03-30 | 1990-03-30 | Multiprocessor system |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH03282942A (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2018092488A (en) * | 2016-12-06 | 2018-06-14 | 株式会社リコー | Electronic apparatus, image forming apparatus, control method, and program |
-
1990
- 1990-03-30 JP JP2085127A patent/JPH03282942A/en active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2018092488A (en) * | 2016-12-06 | 2018-06-14 | 株式会社リコー | Electronic apparatus, image forming apparatus, control method, and program |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2012069032A (en) | Information processor | |
| CN118132386B (en) | System crash information storage method, device and computer system | |
| JP3481737B2 (en) | Dump collection device and dump collection method | |
| JPH0693229B2 (en) | Data processing device | |
| JP2004302731A (en) | Information processing apparatus and fault diagnosis method | |
| JP2003186697A (en) | System and method for testing peripheral device | |
| JPH03282942A (en) | Multiprocessor system | |
| JP2000099372A (en) | Computer system | |
| JPS6363935B2 (en) | ||
| JP2785992B2 (en) | Server program management processing method | |
| JP2855633B2 (en) | Fault diagnosis device for dual port memory in multiprocessor system | |
| JP2998804B2 (en) | Multi-microprocessor system | |
| JPS6113626B2 (en) | ||
| JPH0534877B2 (en) | ||
| JPH05216855A (en) | Multi CPU control system | |
| JPH11149457A (en) | Cpu degrading system for cluster connection multi-cpu system | |
| JPS62212865A (en) | Multiprocessor control system | |
| JPS6128141B2 (en) | ||
| CN120670198A (en) | Double-watchdog monitoring method and device and electronic equipment | |
| JPH03138753A (en) | Boot loader for multiprocessor system | |
| JP2000172575A (en) | Memory backup system | |
| JPH0659941A (en) | Information processor | |
| JP2001117796A (en) | Computer system and program recording medium | |
| JP2870083B2 (en) | Microcomputer with built-in watchdog timer | |
| JP2001350643A (en) | Control method and abnormality monitoring device for microcomputer |