JPH01123354A - モジユール化並列計算機 - Google Patents
モジユール化並列計算機Info
- Publication number
- JPH01123354A JPH01123354A JP62282399A JP28239987A JPH01123354A JP H01123354 A JPH01123354 A JP H01123354A JP 62282399 A JP62282399 A JP 62282399A JP 28239987 A JP28239987 A JP 28239987A JP H01123354 A JPH01123354 A JP H01123354A
- Authority
- JP
- Japan
- Prior art keywords
- processors
- module
- data
- modules
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Multi Processors (AREA)
- Complex Calculations (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野]
本発明は、並列計算機に係わり、特に偏微分方程式の数
値解を並列処理により求めるのに好適な格子結合型の並
列計算機のモジュール化に関する。
値解を並列処理により求めるのに好適な格子結合型の並
列計算機のモジュール化に関する。
[従来の技術]
従来、複数台のプロセッサによって並列に処理する計算
機が開発されている。特に偏微分方程式を解くために適
した並列処理計算機がACMTransactions
on Computer Systems、voil
、No、3August 1983.P195−221
に提案されている。本特許出願人も、先に特許出願59
−273061号(特開昭61−151773号)「並
列m埋計算機」なる出願をした。両者とも格子結合され
たMIMD型(多重命令流多重データ流型)計算機であ
る。
機が開発されている。特に偏微分方程式を解くために適
した並列処理計算機がACMTransactions
on Computer Systems、voil
、No、3August 1983.P195−221
に提案されている。本特許出願人も、先に特許出願59
−273061号(特開昭61−151773号)「並
列m埋計算機」なる出願をした。両者とも格子結合され
たMIMD型(多重命令流多重データ流型)計算機であ
る。
前者では隣接するプロセッサ間を共有メモリを介して接
続している。隣接するプロセッサ間のデータ転送は送信
側プロセッサが受信側プロセッサと互いに共有するメモ
リへデータを格納し、受信側プロセッサが格納されたデ
ータを人力することで行なわれる。隣接しないプロセッ
サへのデータ転送は中間のプロセッサを径由して行うこ
とができる。
続している。隣接するプロセッサ間のデータ転送は送信
側プロセッサが受信側プロセッサと互いに共有するメモ
リへデータを格納し、受信側プロセッサが格納されたデ
ータを人力することで行なわれる。隣接しないプロセッ
サへのデータ転送は中間のプロセッサを径由して行うこ
とができる。
後者は、中間のプロセッサを径由することによる時間の
遅れを最小にするための発明であり、プロセッサ間のデ
ータ転送に FIFO(First InFirst
0ut)メモリを連結しデータ転送バスを構成し、遠方
のプロセッサ間の転送時間を短縮している。
遅れを最小にするための発明であり、プロセッサ間のデ
ータ転送に FIFO(First InFirst
0ut)メモリを連結しデータ転送バスを構成し、遠方
のプロセッサ間の転送時間を短縮している。
これらの計算機はプロセッサ台数を増やすことにより計
算速度を増大させることが容易であり、現在、実際に稼
動しているプロセッサ数十台の規模を拡張し、将来は数
百〜数万台の規模となると考えられる。しかし、プロセ
ッサ台数が増えるにしたがい、プロセッサ間のデータ線
の本数−が増え、この結果、システムの信頼性が低下す
る。そこで複数台のプロセッサをモジュール化すること
により、モジュールの接続データ線の信頼性を向上する
ことが望ましい。
算速度を増大させることが容易であり、現在、実際に稼
動しているプロセッサ数十台の規模を拡張し、将来は数
百〜数万台の規模となると考えられる。しかし、プロセ
ッサ台数が増えるにしたがい、プロセッサ間のデータ線
の本数−が増え、この結果、システムの信頼性が低下す
る。そこで複数台のプロセッサをモジュール化すること
により、モジュールの接続データ線の信頼性を向上する
ことが望ましい。
[発明が解決しようとする問題点コ
しかし、上記従来技術は、モジュール化について十分に
配慮されておらず、モジュール化するプロセッサの台数
を増やすにしたがって、−モジュールに接続するデータ
線の本数が増大する問題がある。第3図に、上記従来技
術で、MxN台のプロセッサpH+ P12+・・・P
イNを−モジュールとしてモジュール化する例を示す。
配慮されておらず、モジュール化するプロセッサの台数
を増やすにしたがって、−モジュールに接続するデータ
線の本数が増大する問題がある。第3図に、上記従来技
術で、MxN台のプロセッサpH+ P12+・・・P
イNを−モジュールとしてモジュール化する例を示す。
第3図に示すように、−モジュールに接続される双方向
のデータ線の本数は、4方向合わせると2X (M+N
)木となり、例えばM=N±4の16台のプロセッサを
−モジュールとする場合、合計16本のデータ線が−モ
ジュールに接続されることになり、モジュール化による
信頼性の向上をそれほど期待できない。また、−モジュ
ールに多数のデータ線を接続することは、モジュールを
コンパクトに実装できないというような実装上の問題を
生じさせる。
のデータ線の本数は、4方向合わせると2X (M+N
)木となり、例えばM=N±4の16台のプロセッサを
−モジュールとする場合、合計16本のデータ線が−モ
ジュールに接続されることになり、モジュール化による
信頼性の向上をそれほど期待できない。また、−モジュ
ールに多数のデータ線を接続することは、モジュールを
コンパクトに実装できないというような実装上の問題を
生じさせる。
また、モジュール間を1本の双方向のデータ線で接続す
ることは容易に考えつるが、各々のプロセッサから該当
するデータを取り出し、順番を定めて送る合理的な方式
は公知でない。
ることは容易に考えつるが、各々のプロセッサから該当
するデータを取り出し、順番を定めて送る合理的な方式
は公知でない。
本発明の目的は、接続データ線の本数を最少にし得るモ
ジュール化並列計算機を提供することにある。
ジュール化並列計算機を提供することにある。
[問題点を解決するための手段]
本発明は、二次元格子に結合されたプロセッサをモジュ
ール化する際に、モジュール間で論理的に隣接するプロ
セッサの全てを結合するのではなく、モジュール間では
特定のプロセッサ間だけを物理的に結合すれば、偏微分
方程式の数値解析を並列処理する場合、最も重要な隣接
プロセッサへのデータ転送を、途中のプロセッサを径由
して実行でき、これによりモジュール間のデータ線の本
数を削減できることに着眼することにより生まれた。
ール化する際に、モジュール間で論理的に隣接するプロ
セッサの全てを結合するのではなく、モジュール間では
特定のプロセッサ間だけを物理的に結合すれば、偏微分
方程式の数値解析を並列処理する場合、最も重要な隣接
プロセッサへのデータ転送を、途中のプロセッサを径由
して実行でき、これによりモジュール間のデータ線の本
数を削減できることに着眼することにより生まれた。
本発明は、二次元格子に結合された複数のプロセッサを
モジュールとしたモジュール化並列計算機であって、−
モジュール内の外周の一辺に位置するプロセッサが通信
メモリを介して互に結合され、外周の一辺の端にあたる
プロセッサからモジュール外に出力されたデータ信号が
、隣接する他のモジュール内の同様に結合された外周の
一辺に位置するプロセッサのうち反対の端にあたるプロ
セッサに入力するようになされ、以て、隣接モジュール
間で互に論理的に隣りにあるプロセッサがモジュール内
の外周の一辺上の結合されたプロセッサ台数分だけ互に
離れて接続されていることを特徴とする。
モジュールとしたモジュール化並列計算機であって、−
モジュール内の外周の一辺に位置するプロセッサが通信
メモリを介して互に結合され、外周の一辺の端にあたる
プロセッサからモジュール外に出力されたデータ信号が
、隣接する他のモジュール内の同様に結合された外周の
一辺に位置するプロセッサのうち反対の端にあたるプロ
セッサに入力するようになされ、以て、隣接モジュール
間で互に論理的に隣りにあるプロセッサがモジュール内
の外周の一辺上の結合されたプロセッサ台数分だけ互に
離れて接続されていることを特徴とする。
すなわち、本発明では、モジュール間で、論理的に隣り
でなく、互いに対角に位置するプロセッサ間を物理的に
結合したことにより、MXN台のプロセッサを−モジュ
ールとした場合、モジュール間で論理的に隣りとなるプ
ロセッサは、全て、物理的な結合の関係ではM台(又は
8台)先に有ることになり、論理的に隣りとなるプロセ
ッサへのデータ転送をM−1台(又はN−1台)のプロ
セッサを径由して一斉に送ることができる。
でなく、互いに対角に位置するプロセッサ間を物理的に
結合したことにより、MXN台のプロセッサを−モジュ
ールとした場合、モジュール間で論理的に隣りとなるプ
ロセッサは、全て、物理的な結合の関係ではM台(又は
8台)先に有ることになり、論理的に隣りとなるプロセ
ッサへのデータ転送をM−1台(又はN−1台)のプロ
セッサを径由して一斉に送ることができる。
[作 用]
(扁微分方程式を各部分領域を各プロセッサに分担させ
て並列処理する場合、論理的に隣りにあるプロセッサ間
で一斉にデータ転送を行なう。異なるモジュールにあり
論理的に隣り合せにあるプロセッサは通信メモリを介し
て結合されており、隣のモジュールにあり、論理的に隣
りにあるプロセッサは、−外周辺上にN台のプロセッサ
がある場合、接続上はN台離れて接続される。隣りのモ
ジュールの論理的に隣りのプロセッサへは、−外周辺上
のプロセッサが一斉に通信メモリへ転送するデータを書
き込みN台先へ順送りすることにより、−斉にデータを
転送することができる。
て並列処理する場合、論理的に隣りにあるプロセッサ間
で一斉にデータ転送を行なう。異なるモジュールにあり
論理的に隣り合せにあるプロセッサは通信メモリを介し
て結合されており、隣のモジュールにあり、論理的に隣
りにあるプロセッサは、−外周辺上にN台のプロセッサ
がある場合、接続上はN台離れて接続される。隣りのモ
ジュールの論理的に隣りのプロセッサへは、−外周辺上
のプロセッサが一斉に通信メモリへ転送するデータを書
き込みN台先へ順送りすることにより、−斉にデータを
転送することができる。
[実 施 例]
以下、本発明の一実施例を図面を用いて説明する。
第1図は本発明の一実施例のモジュール化並列計算機の
一モジュールの構成図である。第1図において、1はモ
ジュール、2はプロセッサ、3は転送制御回路、4はモ
ジュール内転送回路である。5は通信メモリであり、F
IFO(First INFirst 0ut)を用い
る。モジュール1は、モジュール内転送回路4により二
次元格子状に結合されたMXN台(図では3X3台)の
プロセッサ2で構成される。図中の上下左右の隣接する
図示されていないモジュールの論理的に隣りに有るプロ
セッサとの間でデータの転送を行なうために、モジュー
ル1の外周にあたるプロセッサ2に対して通信メモリ5
を配置し、−外周辺上の通信メモリ5を単方向のデータ
線50によって連結し、両端のデータ線および同期信号
を(101,102,103) 。
一モジュールの構成図である。第1図において、1はモ
ジュール、2はプロセッサ、3は転送制御回路、4はモ
ジュール内転送回路である。5は通信メモリであり、F
IFO(First INFirst 0ut)を用い
る。モジュール1は、モジュール内転送回路4により二
次元格子状に結合されたMXN台(図では3X3台)の
プロセッサ2で構成される。図中の上下左右の隣接する
図示されていないモジュールの論理的に隣りに有るプロ
セッサとの間でデータの転送を行なうために、モジュー
ル1の外周にあたるプロセッサ2に対して通信メモリ5
を配置し、−外周辺上の通信メモリ5を単方向のデータ
線50によって連結し、両端のデータ線および同期信号
を(101,102,103) 。
(111,112,113) 、 (121,122,
123) 、 (131,132,133)としてモジ
ュール1の外に出力している。通信メモリ5に対してプ
ロセッサ2は、転送制御回路3を介してデータ信号23
.30により接続される。
123) 、 (131,132,133)としてモジ
ュール1の外に出力している。通信メモリ5に対してプ
ロセッサ2は、転送制御回路3を介してデータ信号23
.30により接続される。
なお、モジュール内のプロセッサ間でデータの転送を行
なうために、プロセッサ2は各行、各列毎にモジュール
内転送回路4に接続される。
なうために、プロセッサ2は各行、各列毎にモジュール
内転送回路4に接続される。
第1図の実施例では、モジュールの一外周辺上のプロセ
ッサ2の結合として、先に本出願人か出願した特許出願
59−273081号(特開昭61−151773号)
に開示されている結合を用いている。この結合によれば
、離れたプロセッサ間でも高速にデータ転送が可能であ
り本発明には最も適している。
ッサ2の結合として、先に本出願人か出願した特許出願
59−273081号(特開昭61−151773号)
に開示されている結合を用いている。この結合によれば
、離れたプロセッサ間でも高速にデータ転送が可能であ
り本発明には最も適している。
もちろん、この代りに、転送する時間と手順が多くかか
ルコとにはなるが、ACM Transaction
onComputer Systems、voil、N
o3.August 1983.P195−221に示
される共有メモリを介した結合方式を用いることも可能
である。
ルコとにはなるが、ACM Transaction
onComputer Systems、voil、N
o3.August 1983.P195−221に示
される共有メモリを介した結合方式を用いることも可能
である。
第2図は本実施例に係る複数のモジュール1を接続した
構成図であり、特にモジュール1の外周にあたるプロセ
ッサ2の結合を示している。データ信号121.122
は上隣のモジュールのデータ信号101.102に接続
され、同様にデータ信号131,132は右隣のモジュ
ールのデータ信号111,112に接続される。この結
合方式では、−モジュールの外周辺上にN台のプロセッ
サ2が有る場合、隣のモジュールで互に論理的に隣りに
あるプロセッサ(例えば第2図のPイ、とP’ll;P
N2とP ’ +2 * P MNとP’IN)は、
物理的な結合の関係では互に常にN台先にあることにな
る。同様に、−モジュールの他の一外周辺上にM台のプ
ロセッサがある場合、隣のモジュールで互に論理的に隣
りにあるプロセッサ(例えば第2図のpHとP“IN;
P21とP”2N : P MlとP″MN)は互に常
にM台先にあることになる。
構成図であり、特にモジュール1の外周にあたるプロセ
ッサ2の結合を示している。データ信号121.122
は上隣のモジュールのデータ信号101.102に接続
され、同様にデータ信号131,132は右隣のモジュ
ールのデータ信号111,112に接続される。この結
合方式では、−モジュールの外周辺上にN台のプロセッ
サ2が有る場合、隣のモジュールで互に論理的に隣りに
あるプロセッサ(例えば第2図のPイ、とP’ll;P
N2とP ’ +2 * P MNとP’IN)は、
物理的な結合の関係では互に常にN台先にあることにな
る。同様に、−モジュールの他の一外周辺上にM台のプ
ロセッサがある場合、隣のモジュールで互に論理的に隣
りにあるプロセッサ(例えば第2図のpHとP“IN;
P21とP”2N : P MlとP″MN)は互に常
にM台先にあることになる。
第4図は転送制御回路3の構成を示す。転送制御回路3
は同期回路35、デコーダ36、カウンタ回路37、パ
ルス発生回路38、ゲート39h)らなり、パルス発生
回路38からはライトパルス380、リードパルス38
1が出力され、デコーダ36からのライト信号360、
リード信号361 と論理和がとられ、ライト信号30
b、リード信号30cとなり、それぞれ右隣と左隣のF
IFOを用いた通信メモリ5のライト端子とリード端子
へ接続される。データ線30aは2つの通信メモリ5を
結ぶデータ線50に接続され、ゲート39を通してプロ
セッサ2からのデータ信号23aに接続される。
は同期回路35、デコーダ36、カウンタ回路37、パ
ルス発生回路38、ゲート39h)らなり、パルス発生
回路38からはライトパルス380、リードパルス38
1が出力され、デコーダ36からのライト信号360、
リード信号361 と論理和がとられ、ライト信号30
b、リード信号30cとなり、それぞれ右隣と左隣のF
IFOを用いた通信メモリ5のライト端子とリード端子
へ接続される。データ線30aは2つの通信メモリ5を
結ぶデータ線50に接続され、ゲート39を通してプロ
セッサ2からのデータ信号23aに接続される。
プロセッサ2が通信メモリ5ヘデータを出力する時は、
データ信号23aヘデータが送出され、アドレス信号2
3bへ出力信号が送出され、ライト信号30bが送出さ
れ、ゲート39が開き、右隣の通信メモリ5にデータが
格納される。プロセッサ2が通信メモリ5からデータを
入力する時は、入力信号がアドレス信号23bへ送出さ
れ、リード信号30cが送出され、ゲート39が開き、
左隣の通信メモリ5からデータがデータ信号23aへ送
出され、プロセッサ2ヘデータが送られる。通信メモリ
5の間でデータを転送する時はカウンタ回路37ヘライ
トパルス380およびリードパルス381の発信回数を
指定する。この時、アドレス信号23bをデコーダ36
がデコードし、カウンタ回路37への書き込みを選択し
、データとしてデータ信号23aを介してカウンタ回路
37へ、発信回数を書き込む。カウンタ回路37は、発
信回数をカウントダウンし、周期的に信号370をパル
ス発生回路38へ送出する。パルス発生回路38は、リ
ードパルス381を送出し、左側の通信メモリ5にリー
ド信号30cを送り、左側の通信メモリ5にデータ信号
50を送出させた後、ライトパルス380を送出し、右
側の通信メモリ5にライト信号3Qbを送出し、右側の
通信メモリ5に、左側の通信メモリ5が送出したデータ
を読み込ませる。カウンタ回路37へ書き込む発信回数
を適切に決めることで、第2図に示した異なるモジュー
ルの論理的に隣にあるプロセッサ間のデータ転送ができ
る。例えば外周の1辺にN台のプロセッサがあり各々の
プロセッサ間でn個のデータを転送するときには、各々
のプロセッサは、まず転送するn個のデータを通信メモ
リ5に書き込んだ後、カウンタ回路37に発信回数とし
てn(N−1)を書き込む。これにより、異なるモジュ
ールの論理的隣りにあるプロセッサへの転送が実行され
る。
データ信号23aヘデータが送出され、アドレス信号2
3bへ出力信号が送出され、ライト信号30bが送出さ
れ、ゲート39が開き、右隣の通信メモリ5にデータが
格納される。プロセッサ2が通信メモリ5からデータを
入力する時は、入力信号がアドレス信号23bへ送出さ
れ、リード信号30cが送出され、ゲート39が開き、
左隣の通信メモリ5からデータがデータ信号23aへ送
出され、プロセッサ2ヘデータが送られる。通信メモリ
5の間でデータを転送する時はカウンタ回路37ヘライ
トパルス380およびリードパルス381の発信回数を
指定する。この時、アドレス信号23bをデコーダ36
がデコードし、カウンタ回路37への書き込みを選択し
、データとしてデータ信号23aを介してカウンタ回路
37へ、発信回数を書き込む。カウンタ回路37は、発
信回数をカウントダウンし、周期的に信号370をパル
ス発生回路38へ送出する。パルス発生回路38は、リ
ードパルス381を送出し、左側の通信メモリ5にリー
ド信号30cを送り、左側の通信メモリ5にデータ信号
50を送出させた後、ライトパルス380を送出し、右
側の通信メモリ5にライト信号3Qbを送出し、右側の
通信メモリ5に、左側の通信メモリ5が送出したデータ
を読み込ませる。カウンタ回路37へ書き込む発信回数
を適切に決めることで、第2図に示した異なるモジュー
ルの論理的に隣にあるプロセッサ間のデータ転送ができ
る。例えば外周の1辺にN台のプロセッサがあり各々の
プロセッサ間でn個のデータを転送するときには、各々
のプロセッサは、まず転送するn個のデータを通信メモ
リ5に書き込んだ後、カウンタ回路37に発信回数とし
てn(N−1)を書き込む。これにより、異なるモジュ
ールの論理的隣りにあるプロセッサへの転送が実行され
る。
第5図はモジュール内転送回路4の構成を示し、1行ま
たは1列のモジュール内転送回路4とプロセッサ2につ
いて示しである。(第5図において、第4図と同じ符号
は同じ構成のものを示しているが、第4図のもの自体を
示しているのではない。)通信メモリ5とプロセッサ2
の接続関係は、モジュール外への転送と同様である。こ
れは、プロセッサ2の通信メモリ5への制御方式を同一
にするためで、他の結合方式であっても良い。ただし、
異なるモジュールへの転送回路が単方向で順回させてい
るのに対し、モジュール内転送回路4では、2つの単方
向の転送回路4a。
たは1列のモジュール内転送回路4とプロセッサ2につ
いて示しである。(第5図において、第4図と同じ符号
は同じ構成のものを示しているが、第4図のもの自体を
示しているのではない。)通信メモリ5とプロセッサ2
の接続関係は、モジュール外への転送と同様である。こ
れは、プロセッサ2の通信メモリ5への制御方式を同一
にするためで、他の結合方式であっても良い。ただし、
異なるモジュールへの転送回路が単方向で順回させてい
るのに対し、モジュール内転送回路4では、2つの単方
向の転送回路4a。
4bにより双方向としている。
以下、本発明のモジュール化並列計算機による並列計算
の方法を説明する。二次元拡散方程式%式% φ:求める変数)を、時間と位置について差分化し、 φ、(、v+1) = λφl−1(Jv)+ (1−2λ) <61CJ
v)+λφlヤ、CJv)+λφ1J−(1v)+(1
−2λ)φI(Jv)十λφ■」φ(1v)とした差分
式を適当な境界条件のもとに解く。
の方法を説明する。二次元拡散方程式%式% φ:求める変数)を、時間と位置について差分化し、 φ、(、v+1) = λφl−1(Jv)+ (1−2λ) <61CJ
v)+λφlヤ、CJv)+λφ1J−(1v)+(1
−2λ)φI(Jv)十λφ■」φ(1v)とした差分
式を適当な境界条件のもとに解く。
ここに、
λ;Δt/Δx2 =Δt/Δy2
Δtは差分化する時間間隔
ΔX、Δyは差分化する格子間隔
である。
並列計算は、第2図に示す複数のモジュール1を結合し
たモジュール化並列計算機で行なう。まず、計算領域を
分割し、分割した部分領域を各々のプロセッサ2へ分担
させる。その結果、ある部分領域(it≦i≦I2.J
1≦j≦J2)は、例えばモジュールM m1m2内の
プロセッサPPl92において計算されることになる。
たモジュール化並列計算機で行なう。まず、計算領域を
分割し、分割した部分領域を各々のプロセッサ2へ分担
させる。その結果、ある部分領域(it≦i≦I2.J
1≦j≦J2)は、例えばモジュールM m1m2内の
プロセッサPPl92において計算されることになる。
ここに、m1m2は二次元格子に接続されたモジュール
1の番号、plp2はモジュール内のプロセッサ2の番
号を示す。差分式に示されるように、格子点ijの変数
φ、(、v+1)は古い時刻(ν)の格子点iJとそれ
に隣接する格子点の値を用いて計算できる。第6図に並
列計算の流れを示す。第6図について説明すると、 (1)各々のプロセッサがφ五」の初期値φ、to+を
設定する。
1の番号、plp2はモジュール内のプロセッサ2の番
号を示す。差分式に示されるように、格子点ijの変数
φ、(、v+1)は古い時刻(ν)の格子点iJとそれ
に隣接する格子点の値を用いて計算できる。第6図に並
列計算の流れを示す。第6図について説明すると、 (1)各々のプロセッサがφ五」の初期値φ、to+を
設定する。
(2)各々のプロセッサが上下左右のプロセッサヘ送る
データを、それぞれの方向に用意された通信メモリへ出
力し、同一モジュール内のプロセッサへの転送の場合、
カウンタ37の計数値をOとする。異なるモジュールの
゛論理的に隣にあるプロセッサへ転送する場合、カウン
タ37の計数値をN台先に送るように設定する。例えば
モジュールの外周辺にN台のプロセッサがあり、n個の
データを送るときには、カウンタ37の計数値としてn
(N−1)を設定する。
データを、それぞれの方向に用意された通信メモリへ出
力し、同一モジュール内のプロセッサへの転送の場合、
カウンタ37の計数値をOとする。異なるモジュールの
゛論理的に隣にあるプロセッサへ転送する場合、カウン
タ37の計数値をN台先に送るように設定する。例えば
モジュールの外周辺にN台のプロセッサがあり、n個の
データを送るときには、カウンタ37の計数値としてn
(N−1)を設定する。
(3)上下左右のプロセッサから送られたデータを通信
メモリから読み込む。
メモリから読み込む。
(4)各々のプロセッサが、前述した差分式に基づ(ν
) (V)や計算す、。
) (V)や計算す、。
き、φ からφ
(5)時刻を更新する。
(6)終了時刻に達したならば計算を終了する。
以上述べたように、本発明のモジュール化並列計算機に
よれば、複数のモジュール内の複数のプロセッサの並列
処理により、拡散方程式等の偏微分方程式の数値解を求
めることが可能である。また、モジュール間は、高々、
単方向の2木のデータ信号で接続されるので、接続によ
る信頼性の低下を防ぐことができ、より多くのプロセッ
サの結合によりシステム全体の可能性を向上することが
できる。
よれば、複数のモジュール内の複数のプロセッサの並列
処理により、拡散方程式等の偏微分方程式の数値解を求
めることが可能である。また、モジュール間は、高々、
単方向の2木のデータ信号で接続されるので、接続によ
る信頼性の低下を防ぐことができ、より多くのプロセッ
サの結合によりシステム全体の可能性を向上することが
できる。
なお、実装技術の進歩により、モジュールの追加をデー
タ線の接続だけで行なえるようになれば、例えばプロセ
ッサ4×4台を1モジユールとして、ユーザが解くべき
問題に合わせて大きなシステムを組むことが可能になり
、拡張性に冨んだ並列計算機になりつる。
タ線の接続だけで行なえるようになれば、例えばプロセ
ッサ4×4台を1モジユールとして、ユーザが解くべき
問題に合わせて大きなシステムを組むことが可能になり
、拡張性に冨んだ並列計算機になりつる。
[発明の効果]
本発明によれば、異なるモジュールにあり且つ論理的に
隣合わせになるプロセッサを、モジュールの一外周辺上
のプロセッサ台数だけ互に離れた位置にあるように結合
じているので、転送手順が繁雑にならず、モジュール間
のデータ線の本数を単方向で2木に抑えることができる
。
隣合わせになるプロセッサを、モジュールの一外周辺上
のプロセッサ台数だけ互に離れた位置にあるように結合
じているので、転送手順が繁雑にならず、モジュール間
のデータ線の本数を単方向で2木に抑えることができる
。
第1図は本発明の一実施例に係るモジュール化並列計算
機の一モジュールの構成図、第2図は本発明の一実施例
に係るモジュール化並列計算機の構成図、第3図は従来
の格子結合並列計算機のモジュール化の概念図、第4図
は第1図における転送制御回路3の構成図、第5図は第
1図におけるモジュール内転送回路4の構成図、第6図
は°本発明のモジュール化並列計算機による偏微分方程
式の並列計算の流れ図である。 1・・・モジュール、 2・・・プロセッサ、3・・
・転送制御回路、 4・・・モジュール内転送回路、 5・・・通信メモリ、 35・・・同期回路36・・・
デコーダ、 37・・・カウンタ回路、38・・・パ
ルス発生回路。 1 モジュール 2 プロt−7−’す゛ 3 転送制御回路 4 モジュール内転送回路 5 通信メモリ 鵬2図 1 モジ゛ニール 2 プロ乞ツサ 粥3図 第4区 5通信メ七り 35同期回路 36 テ°コータ゛ 37 カウンタ回路 38 ノVルス発生回路 姑5図 ? プロセッサ 3 転送制御回路 5 通信メtす
機の一モジュールの構成図、第2図は本発明の一実施例
に係るモジュール化並列計算機の構成図、第3図は従来
の格子結合並列計算機のモジュール化の概念図、第4図
は第1図における転送制御回路3の構成図、第5図は第
1図におけるモジュール内転送回路4の構成図、第6図
は°本発明のモジュール化並列計算機による偏微分方程
式の並列計算の流れ図である。 1・・・モジュール、 2・・・プロセッサ、3・・
・転送制御回路、 4・・・モジュール内転送回路、 5・・・通信メモリ、 35・・・同期回路36・・・
デコーダ、 37・・・カウンタ回路、38・・・パ
ルス発生回路。 1 モジュール 2 プロt−7−’す゛ 3 転送制御回路 4 モジュール内転送回路 5 通信メモリ 鵬2図 1 モジ゛ニール 2 プロ乞ツサ 粥3図 第4区 5通信メ七り 35同期回路 36 テ°コータ゛ 37 カウンタ回路 38 ノVルス発生回路 姑5図 ? プロセッサ 3 転送制御回路 5 通信メtす
Claims (1)
- 二次元格子に結合された複数のプロセッサをモジュール
としたモジュール化並列計算機であって、一モジュール
内の外周の一辺に位置するプロセッサが通信メモリを介
して互に結合され、外周の一辺の端にあたるプロセッサ
からモジュール外に出力されたデータ信号が、隣接する
他のモジュール内の同様に結合された外周の一辺に位置
するプロセッサのうち反対の端にあたるプロセッサに入
力するようになされ、以て、隣接モジュール間で互いに
論理的に隣りにあるプロセッサがモジュール内の外周の
一辺上の結合されたプロセッサ台数分だけ互に離れて接
続されていることを特徴とするモジュール化並列計算機
。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62282399A JP2602852B2 (ja) | 1987-11-09 | 1987-11-09 | モジユール化並列計算機 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62282399A JP2602852B2 (ja) | 1987-11-09 | 1987-11-09 | モジユール化並列計算機 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH01123354A true JPH01123354A (ja) | 1989-05-16 |
| JP2602852B2 JP2602852B2 (ja) | 1997-04-23 |
Family
ID=17651902
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP62282399A Expired - Lifetime JP2602852B2 (ja) | 1987-11-09 | 1987-11-09 | モジユール化並列計算機 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2602852B2 (ja) |
-
1987
- 1987-11-09 JP JP62282399A patent/JP2602852B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JP2602852B2 (ja) | 1997-04-23 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7447720B2 (en) | Method for finding global extrema of a set of bytes distributed across an array of parallel processing elements | |
| US7574466B2 (en) | Method for finding global extrema of a set of shorts distributed across an array of parallel processing elements | |
| US4574345A (en) | Multiprocessor computer system utilizing a tapped delay line instruction bus | |
| JPH03500585A (ja) | トロイダル接続された分布記憶装置型並列計算機のための増強された入出力アーキテクチャ | |
| EP0293701A2 (en) | Parallel neighborhood processing system and method | |
| US11017290B2 (en) | Signal processing module, especially for a neural network and a neuronal circuit | |
| JPH0675986A (ja) | 大規模並列コンピューティング・システム装置 | |
| EP0402891A2 (en) | Multiprocessor system with vector pipelines | |
| US20040215927A1 (en) | Method for manipulating data in a group of processing elements | |
| EP1314099B1 (en) | Method and apparatus for connecting a massively parallel processor array to a memory array in a bit serial manner | |
| JPH04316153A (ja) | ニューロプロセッサ | |
| JPH04295953A (ja) | 要素プロセッサの2次元アレイを内蔵する並列データ処理装置および要素プロセッサのサブアレイユニット | |
| US7263543B2 (en) | Method for manipulating data in a group of processing elements to transpose the data using a memory stack | |
| JPH01123354A (ja) | モジユール化並列計算機 | |
| US20040193842A1 (en) | Active memory processing array topography and method | |
| US8856493B2 (en) | System of rotating data in a plurality of processing elements | |
| JPS61256478A (ja) | 並列処理計算機 | |
| JPH0646413B2 (ja) | デ−タ処理プロセッサ | |
| JPH02108150A (ja) | コンピュータの並列分散処理装置 | |
| JP2522406B2 (ja) | 全結合型ネットワ―ク並列処理方法と装置 | |
| JPH05324584A (ja) | ハイパーキューブの割当方法 | |
| JPH0368045A (ja) | 主記憶制御方式 | |
| US7676648B2 (en) | Method for manipulating data in a group of processing elements to perform a reflection of the data | |
| JPS6236580B2 (ja) | ||
| JPH04291681A (ja) | 超高速画像処理システムのフィルタリング処理方式 |