JPH02238558A - Boot system for parallel computer - Google Patents
Boot system for parallel computerInfo
- Publication number
- JPH02238558A JPH02238558A JP6006089A JP6006089A JPH02238558A JP H02238558 A JPH02238558 A JP H02238558A JP 6006089 A JP6006089 A JP 6006089A JP 6006089 A JP6006089 A JP 6006089A JP H02238558 A JPH02238558 A JP H02238558A
- Authority
- JP
- Japan
- Prior art keywords
- cpu
- computer
- communication port
- address
- host computer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Multi Processors (AREA)
- Stored Programmes (AREA)
Abstract
Description
【発明の詳細な説明】
[概要]
1個のホスト計算機と複数個のプロセッサエレメン1・
とがバスを介して接続された分散メモリ型並列計算機の
ブート方式に関し、
分散メモリ型並列計算機のプロセッサエレメントの数を
増やせるという利点を十分に生かすことができるように
することを目的とし、
各プロセッサエレメント内に、CPUと、バスと接続さ
れた通信ポートと、プロセッザエレメントのリセット時
にCPUから出力されるアドレスをデコードして通信ポ
ートをアクセスするアドレスデコーダとを具備し、全て
のプロセッサエレメントが通信ポートをアクセスしたこ
とをホスト計算機側で検知したら、ホスト計算機から各
プロセッサエレメントに対してブートプログラムを送出
し、各プロセッサエレメント側では、通信ポートから人
力されるブーl・プログラムをCPUにより順次実行す
るように構成する。[Detailed Description of the Invention] [Summary] One host computer and a plurality of processor elements 1.
The purpose of the present invention is to provide a boot method for distributed memory parallel computers that are connected via a bus, so that each processor can take full advantage of the advantage of increasing the number of processor elements in a distributed memory parallel computer The element is equipped with a CPU, a communication port connected to the bus, and an address decoder that decodes the address output from the CPU when the processor element is reset and accesses the communication port, so that all processor elements communicate. When the host computer detects that the port has been accessed, the host computer sends a boot program to each processor element, and each processor element sequentially executes the Boolean program manually input from the communication port by the CPU. Configure it as follows.
[産業上の利用分野コ
本発明は1個のホスト計算機と複数個のプロセッサエレ
メントとがバスを介して接続された分散メモリ型並列計
算機のブー1・方式に関する。[Industrial Field of Application] The present invention relates to a distributed memory parallel computer system in which one host computer and a plurality of processor elements are connected via a bus.
近年、コンピュータシステムの高速化が要求されている
。高速化の一つの実現法として、並列51算機が用いら
れる。ここで、並列計算機とは、プログラムを実行する
計算要素(プロセッサエレメント;Processor
Element,以下略してPEと記す)を複数個
結合して一つの計算機を構成したものである。この種の
並列計算機には、大きく分けて2つの実現方法が考えら
れる。In recent years, there has been a demand for faster computer systems. A parallel 51 computer is used as one method for achieving higher speeds. Here, a parallel computer is a computational element (processor element) that executes a program.
A single computer is constructed by combining a plurality of Elements (hereinafter abbreviated as PE). Broadly speaking, there are two possible implementation methods for this type of parallel computer.
一つは複数のPEで大きなメモリを共有する共有メモリ
型並列計算機であり、もう一つはPE毎に独立したメモ
リをもつ分散メモリ型並列計算機である。後者の分散メ
モリ型並列計算機は、PEの数を大きくすることが可能
であるという特徴をもっテイル。ところが、一つのPE
のハード量が大きくなるとこの特徴を生かすことができ
なくなる。One is a shared memory type parallel computer in which a large memory is shared by multiple PEs, and the other is a distributed memory type parallel computer in which each PE has an independent memory. The latter distributed memory type parallel computer has the characteristic that it is possible to increase the number of PEs. However, one PE
If the amount of hardware increases, this feature cannot be utilized.
このため、PEのハートウエア量は小さく抑える必要が
ある。また、PEO数が増加するに伴い、効率的なブー
ト方法が要求されている。Therefore, it is necessary to keep the amount of hardware in the PE small. Additionally, as the number of PEOs increases, efficient boot methods are required.
[従来の技術]
第7図は、従来の分散メモリ型並列計算機の構成ブロッ
ク図である。1個のホス1・51算機1と複数個のPE
2とがバス3を介して接続されている。[Prior Art] FIG. 7 is a block diagram of a conventional distributed memory parallel computer. One host 1/51 calculator 1 and multiple PEs
2 are connected via a bus 3.
第8図は各PEの内部構成例(従来)を示す図である。FIG. 8 is a diagram showing an example (conventional) internal configuration of each PE.
PEは、図に示すようにバス3と接続された通信ポート
2a,RAM2b,CPU2c,ROM2d及びこれら
を接続する内部バス2eより構成されている。ROM2
d内にはブートアップ(IPL.イニシャル・プログラ
ムロ一ド)用のプログラムが格納されている。As shown in the figure, the PE is composed of a communication port 2a connected to a bus 3, a RAM 2b, a CPU 2c, a ROM 2d, and an internal bus 2e connecting these. ROM2
A boot-up (IPL. initial program load) program is stored in d.
このように構成された分散メモリ型並列計算機のブート
アップ(IPL)は、PE内に用意されたROM2dに
格納されたプログラムによって行われる。第9図は、従
来のブートアップの手順を示すフローチャートである。Boot-up (IPL) of the distributed memory type parallel computer configured in this way is performed by a program stored in the ROM 2d prepared in the PE. FIG. 9 is a flowchart showing a conventional boot-up procedure.
先ず、ユーザがホス1・計算機1を初期化する(S1)
。その後、ホス1・計算機1はIPLを開始する(S2
)。次に、ホストnI算機]はIPLの一つの手順とし
てPE2を初期化する(S3)。First, the user initializes the host 1 and computer 1 (S1)
. After that, the host 1 and computer 1 start IPL (S2
). Next, the host nI computer initializes PE2 as one procedure of IPL (S3).
各PE2はROM2d内に格納されているIPLプログ
ラムの実行を開始する(S4)。次に、ホスト計算機1
はPE2に対してOS等をバス3を介して送信し、各P
E2はIPLの実行の過程で、OS等をホスト計算機1
からバス3を介して受信する(S5)。そして、各PE
2はIPLを終了し、動作を開始し、ホスト計算機1は
IPLを終了し、動作を開始する(S6)。ここで、動
作とは本来の並列処理動作をいう。Each PE2 starts executing the IPL program stored in the ROM2d (S4). Next, host computer 1
transmits the OS etc. to PE2 via bus 3, and
E2 installs the OS, etc. on the host computer 1 during the IPL execution process.
from the bus 3 (S5). And each PE
2 ends IPL and starts operation, and host computer 1 ends IPL and starts operation (S6). Here, the operation refers to the original parallel processing operation.
[発明が解決しようとする課題]
従来の方式では、各PE毎にブートプログラムを書込ん
だROMを用意し、そのプログラムによりブートアップ
(IPL)を行っていた。しかしながら、この構成をと
るとROMの周辺等を含め、ある程度のハードウエアが
必要となる。また、PEの数だけROM等を用意せねば
ならず、システム作製時のコス1・アップ及び動作時の
信頼性の低下にもつながる可能性がある。以上により、
従来システムではPEの台数を増やせるという利点を十
分に生かすことができなかった。[Problems to be Solved by the Invention] In the conventional system, a ROM in which a boot program is written is prepared for each PE, and boot-up (IPL) is performed using the program. However, this configuration requires a certain amount of hardware including the ROM and the like. Furthermore, it is necessary to prepare as many ROMs as there are PEs, which may lead to an increase in cost when manufacturing the system and a decrease in reliability during operation. Due to the above,
In the conventional system, it was not possible to take full advantage of the advantage of increasing the number of PEs.
本発明はこのような課題に鑑みてなされたものであって
、分散メモリ型並列計算機のPEの数を増やせるという
利点を十分に生かすことができる並列計算機のブート方
式を提供することを1」的としている。The present invention has been made in view of the above-mentioned problems, and an object thereof is to provide a boot method for a parallel computer that can fully utilize the advantage of increasing the number of PEs in a distributed memory parallel computer. It is said that
[課題を解決するための手段] 第1。図は本発明方式の原理ブロック図である。[Means to solve the problem] First. The figure is a block diagram of the principle of the system of the present invention.
第7図と同一のものは、同一の符号を付して示す。Components that are the same as those in FIG. 7 are designated by the same reference numerals.
図において、]はホス1・計算機、3はバス、4はバス
に接続された複数個のPEである。各PEJ内には、C
PU4aと、バス3と接続された通信ポート4bと、P
Eのリセット時にCPU4aから出力されるアドレスを
デコードして通信ポー1・4bをアクセスするアドレス
デコーダ4cと、RAM4dより構成されている。図で
は1つのPEについてその内部構成を示しているが、他
のPEについても同様である。In the figure, ] is a host 1/computer, 3 is a bus, and 4 is a plurality of PEs connected to the bus. Within each PEJ, C
PU4a, communication port 4b connected to bus 3, and P
The address decoder 4c decodes the address output from the CPU 4a at the time of resetting the E, and accesses the communication ports 1 and 4b, and a RAM 4d. Although the figure shows the internal configuration of one PE, the same applies to other PEs.
[作用]
リセット時には、アドレスデコーダ4cはcPU4aか
ら出力されるアドレスデータをデコードして通信ポー1
・4bをアクセスするようにする。[Function] At the time of reset, the address decoder 4c decodes the address data output from the cPU 4a and opens the communication port 1.
・Enable access to 4b.
そして、全てのPE4が通信ポート4bにアクセスした
ことをホスト計算機1側で検知したら、ホス1・計算機
1。から各PE4に対してブー1・プログラムを送出し
、各PE4側では、通信ボー1・4bから入力されるブ
ー1・プログラムをCPU4aにより順次実行するよう
にする。このような構成とすることにより、IPL時の
プログラムは各PE4に対してホス1・計算機1がら提
供されるので、各PE4内にIPLプログラムを格納し
たROMが不要となる。従って、木発明方式によれば分
散メモリ型並列計算機のPEO数を増やせるという利点
を十分に生かすことができる。Then, when the host computer 1 detects that all PEs 4 have accessed the communication port 4b, the host 1/computer 1. The Boo 1 program is sent to each PE 4 from the CPU 4a, and on each PE 4 side, the Boo 1 program input from the communication boards 1 and 4b is sequentially executed by the CPU 4a. With this configuration, the program during IPL is provided to each PE4 from the host 1 and computer 1, so a ROM storing the IPL program is not required in each PE4. Therefore, according to the tree invention method, the advantage of being able to increase the number of PEOs in a distributed memory parallel computer can be fully utilized.
[実施例]
以下、図面を参照して本発明の実施例を従来例と対比し
つつ詳細に説明する。[Embodiments] Hereinafter, embodiments of the present invention will be described in detail in comparison with conventional examples with reference to the drawings.
本発明はPEのCPUから見えるアドレス空間のデコー
ドの方法を工夫することにより、ROMを必要としない
方式としたものである。第2図はアドレス空間を示す図
であり、(イ)は従来のアドレス空間を、(口)は本発
明によるアトルス空間をそれぞれ示している。ここでは
、次の仮定をしている。先ずPEのCPUはポスI・計
算機がら初期化(リセット)されると、アトルスooo
o(#は16進を示す)から命令を取出し、実行を開始
する。バスからのデータは、ポー1・(アドレスFOO
O.)を読むことにより受取る。アドレスは全て16進
であり、図に示す値は例示である。The present invention provides a system that does not require a ROM by devising a method for decoding the address space visible from the CPU of the PE. FIG. 2 is a diagram showing an address space, in which (a) shows a conventional address space, and (b) shows an atrus space according to the present invention. Here, we make the following assumptions. First, when the PE CPU is initialized (reset) as a post I/computer, atlus ooo
The instruction is taken from o (# indicates hexadecimal) and execution begins. Data from the bus is port 1 (address FOO
O. ) by reading. All addresses are in hexadecimal, and the values shown in the figure are examples.
従来のアドレス空間は、(イ)に示すようにアドレスo
ooo.〜2000#はROMに割当てられており、こ
こにIPLプログラムが格納されていた。後(7) 2
0 0 0 # − F O O O #まテi;i
R A M領域とPORT (ポー1・)領域が適宜
割当てられていた。そして、PEか初期化されると、P
E内(7)CPULi7ドl/ ス0 0 0 0 #
から2000mの間に置かれたROMに格納されている
IPLによって動作に必要なOS等(これらはポス1・
計算機により作成される)をポー1・から読出し、RA
Mに書込んでいく。The conventional address space has an address o as shown in (a).
ooo. ~2000# was allocated to the ROM, and the IPL program was stored here. After (7) 2
0 0 0 # - F O O O #matei;i
A RAM area and a PORT (port 1) area were appropriately allocated. Then, when PE is initialized, P
In E (7) CPULi7 dollar l/s0 0 0 0 #
The IPL stored in the ROM placed between 2000m from
(created by a computer) from port 1 and RA
Write to M.
これに対し、本発明の場合には(口)に示すようにアド
レス0000#から2000mまでをボI・のアドレス
としている。従って、PEが初期化されてPE内のCP
Uがoooo#がらアドレスを出力すると、第1図に示
したアドレスデコダがこのアドレスをデコードしてボー
1・ア1・レスに変換し、通信ポートをアクセスするよ
うにする。On the other hand, in the case of the present invention, the addresses 0000# to 2000m are used as the addresses of voice I., as shown in (mouth). Therefore, when the PE is initialized, the CP in the PE
When U outputs an address as oooo#, the address decoder shown in FIG. 1 decodes this address and converts it to baud 1, a1, address, and accesses the communication port.
この間に、ホスト計算機からIPLのブロクラムを各P
Eに対して送出し、各PEでは通信ボー1・を経由して
CPUにそのプログラムを!jえ、I I)Lを実行さ
せるのである。従って、本発明によればIPLプログラ
ムを格納したROMは必要ないことになる。During this time, the IPL blockram is transferred from the host computer to each PC.
E, and each PE sends the program to the CPU via communication board 1. It is to execute II)L. Therefore, according to the present invention, a ROM storing an IPL program is not required.
次に、ホスl・計算機がPEに送るデータとPEのCP
Uが実行する命令の関係を更に詳細に説明する。ここで
は、PEのCPUが実行する命令を以下のように定義す
る。Next, the data that the host/computer sends to the PE and the PE's CP
The relationship between the instructions executed by U will be explained in more detail. Here, the instructions executed by the CPU of the PE are defined as follows.
ST ADDR .アドレス(ADDR)にレジス
タの値を書込む
LD ADDR ,アドレスの(A D D R)
の値をレジスタに読込む
また、ホスト計算機がPEに送るOSのデータ列をOS
O,OSI,・・OSZ (OSZが最終データ1デー
タの個数は100#と仮定)と書き表すものとすると、
従来方式によりホスト計算機がPEに送るデータとPE
のCPUが実行する命令列は、第3図に示すようなもの
となる。時刻t,からt2までの間がホスト計算機から
各PEにOSを送信しているンーケンスである。STADDR. Write the register value to address (ADDR) LD ADDR , address (ADDR)
In addition, the OS data string that the host computer sends to the PE is read into the register.
Assuming that OSZ is written as O, OSI, ... OSZ (assuming that the number of final data 1 data is 100#),
Data and PE sent from the host computer to the PE using the conventional method
The instruction sequence executed by the CPU is as shown in FIG. The period from time t to t2 is a sequence in which the host computer transmits the OS to each PE.
第4図はホスト計算機かPEに送るデータとPEのCP
Uが実行する命令例(本発明)を示す図である。従来例
では、第3図に示すようにホス1・計算機からはOS命
令のみが与えられているたけであったが、第4図の本発
明の場合にはホスト計算機はOS命令のみならずLD
FOOOsなる命令とST 20DOmなる命令を
送っている。Figure 4 shows the data sent to the host computer or PE and the PE's CP.
It is a figure which shows the example of an instruction (this invention) which U executes. In the conventional example, only OS instructions are given from the host 1/computer as shown in FIG. 3, but in the case of the present invention shown in FIG. 4, the host computer receives not only OS instructions but also LD.
It is sending commands FOOOs and ST 20DOm.
これら命令は、従来方式では内蔵のROMから与えられ
ていたものである。PE側ではこのLD命令が通信ポー
トから受取られるとCPUの命令として実行される。つ
まり、PE側ではCPUから出力されるアドレス000
01〜2000mを全て通信ポートのアドレスFOOO
#に変換し、通信ポートから入力されるデータをCPU
が実行すべき命令として取り込み実行を進めていくもの
である。In the conventional system, these instructions are given from the built-in ROM. On the PE side, when this LD command is received from the communication port, it is executed as a CPU command. In other words, on the PE side, the address 000 output from the CPU
All communication port addresses from 01 to 2000m are FOOO
Convert the data input from the communication port to # and send it to the CPU.
The command is taken in as an instruction to be executed and the execution proceeds.
第4図において、時刻t1からt2の範囲がホスト計算
機から各PEにOSを送信しているシケンスである。前
述したように、PEのCPUが実行する命令もホス1・
計算機からPEに送り出されている。このことは言い換
えれば、従来ROMに格納していたIPLをホスト計算
機から送り出した命令で行っていることになる。従って
、各PE内にROMを用意する必要がなくなったのであ
る。このことが可能となったのは、前述したアドレスの
デコードの工夫がポイントとてある。更に説明する。P
E内のCPUは、初期化後アドレスoooo.から実行
を始める。In FIG. 4, the range from time t1 to t2 is the sequence in which the OS is transmitted from the host computer to each PE. As mentioned above, the instructions executed by the PE CPU are also executed by the host 1.
It is sent from the computer to the PE. In other words, the IPL, which was conventionally stored in the ROM, is performed using an instruction sent from the host computer. Therefore, it is no longer necessary to prepare a ROM in each PE. This was made possible due to the above-mentioned address decoding technique. I will explain further. P
After initialization, the CPU in E is at address oooo. Start execution from.
そして、アドレスooooエから命令を読込み、実行し
、次にはアドレス0001おから命令を読込み実行する
。このように、アドレスを1つずつ更新しながら実行す
る。従来は、アドレス0000あからのアドレス空間に
IPLを書込んだROMを置くことにより、IPLを実
行していた。本発明では、この空間に通信ポートを割当
て、CPUが初期化後、命令をアドレスoooo.から
読込もうとすると、通信ポートのデータ、即ちホスト計
算機からバスを介して送られてくる命令が読込まれるこ
とになる。Then, the instruction is read from address oooo and executed, and then the okara instruction from address 0001 is read and executed. In this way, the process is executed while updating the addresses one by one. Conventionally, IPL was executed by placing a ROM in which IPL was written in the address space starting from address 0000. In the present invention, a communication port is allocated to this space, and after the CPU is initialized, instructions are sent to address oooo. If an attempt is made to read from the host computer, the data of the communication port, that is, the command sent from the host computer via the bus, will be read.
第5図は本発明の一実施例を示す構成ブロック図である
。第1図と同一のものには、同一の符号を付して示す。FIG. 5 is a block diagram showing an embodiment of the present invention. Components that are the same as those in FIG. 1 are designated by the same reference numerals.
図では、PEを1個しか示していないが、実際にはバス
3に複数個接続されている。Although only one PE is shown in the figure, a plurality of PEs are actually connected to the bus 3.
ホスト計算機1は、CPUia,メモリ1b及びバス3
を介してPE4との接続制御を行うインターフェイス部
]Cより構成されている。このインターフエイス部1c
には、バス3が接続される他に制御線5が接続されてい
る。この制御線5は各PE4とも接続されている。PE
4において、4eはバス3を介してホスト計算機1との
接続制御を行うインターフェイス部、4fはP E J
内の内部バスである。第1図で示した通信ポート4b
はインターフエイス部4eに含まれる。このように構成
されたシステムの動作を説明すれば、以下のとおりであ
る。The host computer 1 includes a CPUia, a memory 1b, and a bus 3.
The PE 4 is configured with an interface section]C that controls connection with the PE4 via the interface section C. This interface section 1c
In addition to the bus 3, a control line 5 is also connected to the . This control line 5 is also connected to each PE4. P.E.
4, 4e is an interface unit that controls connection with the host computer 1 via the bus 3, and 4f is a P E J
There is an internal bus inside. Communication port 4b shown in Figure 1
is included in the interface section 4e. The operation of the system configured as described above will be explained as follows.
第6図は本発明によるブートシーケンスを示す図である
。以下、このシーケンス図に沿って第5図に示すシステ
ムの動作を説明する。先ず、インターフェイス部]Cを
介してホス1・計算機1からPEへのリセット信号が出
力される(■)。一方、PE4側では、インターフェイ
ス部4eを介して送られたきたリセット信号を受けて内
部の状態をリセットして初期化する( (1))。リセ
ットされると、CPU4aはアドレス0000#から命
令をフエツチして実行するようになっている。そこで、
CPU4aはアドレスoooo.をアドレスデータとし
て出力する。このアドレスデータはアドレスデコーダ4
cによってインターフェイス部4e内の通信ポートをア
クセスする信号に変換される。この結果、通信ポートが
アクセスされる( (2))。しかしながら、制御線5
を介してACK信号(確認信号)がまだ有効になってい
ないのでそのままホールド状態となる( (3))。FIG. 6 is a diagram showing a boot sequence according to the present invention. The operation of the system shown in FIG. 5 will be explained below along with this sequence diagram. First, a reset signal is output from the host 1/computer 1 to the PE via the interface section C (■). On the other hand, on the PE4 side, upon receiving the reset signal sent via the interface section 4e, the internal state is reset and initialized ((1)). When reset, the CPU 4a fetches and executes instructions from address 0000#. Therefore,
The CPU 4a has the address oooo. is output as address data. This address data is sent to address decoder 4.
c is converted into a signal for accessing the communication port in the interface section 4e. As a result, the communication port is accessed ((2)). However, control line 5
Since the ACK signal (acknowledgment signal) has not yet become valid, the device remains in a hold state ((3)).
一方、ホスト計算機側では、全てのPE4が通信ポート
4bをアクセスするのをインターフエイス部1cを介し
てCPU1aにより監視している。On the other hand, on the host computer side, the CPU 1a monitors access by all PEs 4 to the communication port 4b via the interface unit 1c.
そして、全てのPEが通信ポートをアクセスするのを待
ってPEの第1命令を通信ボート4bに出力する(■)
。また、それと同時に制御線5のACK信号を有効にす
る(■)。Then, wait until all PEs access the communication ports and output the PE's first command to the communication port 4b (■)
. At the same time, the ACK signal on the control line 5 is enabled (■).
PE側ではACK信号が有効になるまでホールドされて
いたが、ACK信号が有効になったのを受けてCPU4
aが第1命令を読込み実行する( (4)).次に、C
PU4aが第2の命令をフェッチするためのアドレス信
号0 0 0 1− sを出力すると、このデータは再
度アドレステコーダ4cにより通信ポー1・4bをアク
セスする信号に変換され、通信ポート4cをアクセスす
る( (5))。On the PE side, the ACK signal was held until it became valid, but when the ACK signal became valid, the CPU4
a reads and executes the first instruction ((4)). Next, C
When the PU 4a outputs the address signal 0 0 0 1-s for fetching the second instruction, this data is again converted by the address encoder 4c into a signal for accessing the communication ports 1 and 4b, and the address signal 0 0 1-s is used to access the communication port 4c. ((5)).
この時、ACK信号は無効状態になっているので、AC
K信号が有効になるまでホールドされる((6))。At this time, the ACK signal is in an invalid state, so the AC
It is held until the K signal becomes valid ((6)).
ホスト計算機側では、全てのPEが通信ボーI・をアク
セスするのを待って、PEの次の命令を通信ポート4b
に出力する(■)。それと同時に、制御線5のACK信
号を有効にする(■)。The host computer side waits for all PEs to access the communication port 4b, and then sends the PE's next command to the communication port 4b.
Output to (■). At the same time, the ACK signal on the control line 5 is enabled (■).
PE側では、第2命令を通信ポート4bを介して読込み
実行する( (7))。このようにしてPE側では、C
PU4aがフエツチする命令(命令アドレス)がIFF
F#を越えない間、(5)(6), (7)を繰り返
す( (8))。一方、PE側ではブートシーケンスを
終了するまで■,■を繰返す(■)。OSをホスト計算
機から送る場合には、第4図で示したように、ホスト計
算機は、PEが実行すべき命令に合わせて、OSのデー
タを送ればよい。On the PE side, the second command is read and executed via the communication port 4b ((7)). In this way, on the PE side, C
The instruction (instruction address) fetched by PU4a is IFF
Repeat (5), (6), and (7) until F# is not exceeded ((8)). On the other hand, on the PE side, ■ and ■ are repeated until the boot sequence is completed (■). When the OS is sent from the host computer, the host computer only needs to send the OS data in accordance with the instructions to be executed by the PE, as shown in FIG.
[発明の効果]
以上、詳細に説明したように、本発明によればPEがリ
セットされてからPE内のCPUが命令フエツチ用に出
力するアドレスをデコードして通信ポー1・をアクセス
する信号に変換してやり、IPLのための命令を通信ポ
ート経由でポス1・剖算機から貰って実行する構成とす
ることにより、PE内のROMを不要とすることができ
る。従って、本発明によれば分散メモリ型並列計算機の
PEの数を増やせるという利点を十分に生かすことがで
きるようになる。[Effects of the Invention] As described above in detail, according to the present invention, after the PE is reset, the CPU in the PE decodes the address output for instruction fetch and converts it into a signal for accessing the communication port 1. The ROM in the PE can be made unnecessary by converting the data and receiving the command for IPL from the POS 1 autopsy machine via the communication port. Therefore, according to the present invention, it is possible to fully utilize the advantage of being able to increase the number of PEs in a distributed memory parallel computer.
第1図は本発明方式の原理ブロック図、第2図はアドレ
ス空間を示す図、
第3図はホスト計算機がPEに送るデータとPEのCP
Uが実行する命令例(従来)を示す図、第4図はホスト
計算機がPEに送るデータとPEのCPUが実行する命
令例(本発明)を示す図、第5図は本発明の一実施例を
示す構成ブロック図、
第6図は本発明にょるブートシーケンスを示す図、
第7図は従来の分散型並列計算機の構成ブロック図、
第8図は各PEの内部構成例(従来)を示す図、第9図
は従来のブー1・アップの手順を示すフローチャートで
ある。
第1図において、
1はホスト計算機、
3はバス、
4はPE,
4aはCPU,
4bは通信ポート、
4cはアドレスデコーダ、
4dはRAMである。
] 7
従来■分徹メモリ型並列計算機■構成プロ・ンク図第7
閤Figure 1 is a principle block diagram of the method of the present invention, Figure 2 is a diagram showing the address space, and Figure 3 is a diagram showing the data sent by the host computer to the PE and the CP of the PE.
FIG. 4 is a diagram showing an example of an instruction executed by U (conventional), FIG. 4 is a diagram showing data sent from a host computer to a PE, and an example of an instruction (present invention) executed by the PE's CPU, and FIG. 5 is an example of an implementation of the present invention. FIG. 6 is a configuration block diagram showing an example of the boot sequence according to the present invention. FIG. 7 is a configuration block diagram of a conventional distributed parallel computer. FIG. 8 is an example of the internal configuration of each PE (conventional). The figure shown in FIG. 9 is a flowchart showing the conventional boo1-up procedure. In FIG. 1, 1 is a host computer, 3 is a bus, 4 is a PE, 4a is a CPU, 4b is a communication port, 4c is an address decoder, and 4d is a RAM. ] 7 Conventional ■Distributed memory type parallel computer■Configuration diagram No. 7
閤
Claims (1)
ント(4)とがバス(3)を介して接続された分散メモ
リ型並列計算機において、 各プロセッサエレメント(4)内に、 CPU(4a)と、 バス(3)と接続された通信ポート(4b)と、プロセ
ッサエレメントのリセット時にCPU(4a)から出力
されるアドレスをデコードして通信ポート(4b)をア
クセスするアドレスデコーダ(4c)とを具備し、 全てのプロセッサエレメント(4)が通信ポート(4b
)をアクセスしたことをホスト計算機(1)側で検知し
たら、ホスト計算機(1)から各プロセッサエレメント
(4)に対してブートプログラムを送出し、 各プロセッサエレメント(4)側では、通信ポート(4
b)から入力されるブートプログラムをCPU(4a)
により順次実行するように構成したことを特徴とする並
列計算機のブート方式。[Claims] In a distributed memory parallel computer in which one host computer (1) and a plurality of processor elements (4) are connected via a bus (3), in each processor element (4) , a CPU (4a), a communication port (4b) connected to the bus (3), and an address decoder that decodes the address output from the CPU (4a) when the processor element is reset and accesses the communication port (4b). (4c), and all processor elements (4) have communication ports (4b
) is detected on the host computer (1) side, the host computer (1) sends a boot program to each processor element (4), and each processor element (4) side sends a boot program to the communication port (4).
The boot program input from b) is sent to the CPU (4a)
A boot method for a parallel computer, characterized in that it is configured to be executed sequentially.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1060060A JP2749105B2 (en) | 1989-03-13 | 1989-03-13 | Boot method of parallel computer |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1060060A JP2749105B2 (en) | 1989-03-13 | 1989-03-13 | Boot method of parallel computer |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH02238558A true JPH02238558A (en) | 1990-09-20 |
| JP2749105B2 JP2749105B2 (en) | 1998-05-13 |
Family
ID=13131164
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1060060A Expired - Fee Related JP2749105B2 (en) | 1989-03-13 | 1989-03-13 | Boot method of parallel computer |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2749105B2 (en) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH05242057A (en) * | 1992-02-27 | 1993-09-21 | Sanyo Electric Co Ltd | Method for starting multi-processor system |
| US6839835B2 (en) * | 2000-02-02 | 2005-01-04 | Canon Kabushiki Kaisha | Method of loading initial program in processor system |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS56145411A (en) * | 1980-04-11 | 1981-11-12 | Panafacom Ltd | Program load system |
| JPS5995665A (en) * | 1982-11-24 | 1984-06-01 | Mitsubishi Electric Corp | Multiple computer system |
| JPS59116875A (en) * | 1982-12-23 | 1984-07-05 | Fujitsu Ltd | Ipl method of multiprocessor system |
| JPS61180352A (en) * | 1984-12-30 | 1986-08-13 | Fujitsu Ltd | Down-loading system for program |
| JPS63148354A (en) * | 1986-12-12 | 1988-06-21 | Nec Corp | Initial program loading system |
-
1989
- 1989-03-13 JP JP1060060A patent/JP2749105B2/en not_active Expired - Fee Related
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS56145411A (en) * | 1980-04-11 | 1981-11-12 | Panafacom Ltd | Program load system |
| JPS5995665A (en) * | 1982-11-24 | 1984-06-01 | Mitsubishi Electric Corp | Multiple computer system |
| JPS59116875A (en) * | 1982-12-23 | 1984-07-05 | Fujitsu Ltd | Ipl method of multiprocessor system |
| JPS61180352A (en) * | 1984-12-30 | 1986-08-13 | Fujitsu Ltd | Down-loading system for program |
| JPS63148354A (en) * | 1986-12-12 | 1988-06-21 | Nec Corp | Initial program loading system |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH05242057A (en) * | 1992-02-27 | 1993-09-21 | Sanyo Electric Co Ltd | Method for starting multi-processor system |
| US6839835B2 (en) * | 2000-02-02 | 2005-01-04 | Canon Kabushiki Kaisha | Method of loading initial program in processor system |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2749105B2 (en) | 1998-05-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4942519A (en) | Coprocessor having a slave processor capable of checking address mapping | |
| JP4226085B2 (en) | Microprocessor and multiprocessor system | |
| Chen et al. | Supporting distributed shared memory on multi-core network-on-chips using a dual microcoded controller | |
| WO2001057660A2 (en) | Virtual rom for device enumeration | |
| JP2001092662A (en) | Processor core and processor using the same | |
| JPH076151A (en) | Cpu core bus optimized for access of on-chip memory device | |
| JPH03216776A (en) | Integrated circuit device and microprocessor consisting of this circuit device | |
| GB2216306A (en) | Load and synchronize computer architecture and process | |
| JPH0530112A (en) | Control method for digital signal processing system | |
| JPH07120338B2 (en) | Method for a data processor to coordinate the execution of instructions by a coprocessor and the data processor | |
| JP7093979B2 (en) | Device proxy device and computer system including it | |
| JPH02238558A (en) | Boot system for parallel computer | |
| US5499363A (en) | Microprocessor coupled to coprocessor by coprocessor bus separate from system bus to external memory for increased efficiency | |
| JP2010003151A (en) | Data processing apparatus | |
| EP0218335A2 (en) | Control store for electronic processor | |
| JP3139310B2 (en) | Digital signal processor | |
| JPH01130250A (en) | Memory transfer system | |
| JP3168845B2 (en) | Digital signal processor | |
| JP3127737B2 (en) | Digital signal processor | |
| JPH07302255A (en) | Semiconductor integrated circuit device and processor and emulator for emulation thereof | |
| Zhang et al. | PMD | |
| JP2927751B2 (en) | Information processing apparatus, information processing method, and scheduling apparatus | |
| JPH0444131A (en) | Execution device and method for inter-processor communication in multiple OS running system | |
| JP2003029966A (en) | Data processing device | |
| JPH02181282A (en) | Single chip microcomputer |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |