JPS62206660A - プロセツサ結合装置 - Google Patents
プロセツサ結合装置Info
- Publication number
- JPS62206660A JPS62206660A JP4847286A JP4847286A JPS62206660A JP S62206660 A JPS62206660 A JP S62206660A JP 4847286 A JP4847286 A JP 4847286A JP 4847286 A JP4847286 A JP 4847286A JP S62206660 A JPS62206660 A JP S62206660A
- Authority
- JP
- Japan
- Prior art keywords
- loop
- data
- packet
- processor
- processors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
- G06F15/8007—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors
- G06F15/8023—Two dimensional arrays, e.g. mesh, torus
Landscapes
- Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multi Processors (AREA)
- Small-Scale Networks (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の技術分野〕
本発明は並列処理システムにおけるプロセッサの結合方
式に関する。
式に関する。
より高い性能を実現する九め、並列処理を基本とする計
算機が多数提案されてきている。この並列処理方式にお
いては、プロセッサ間でデータをいかに高速に転送する
かが性能向上の鍵であシ多数のプロセッサの結合方式が
重要な問題となる。
算機が多数提案されてきている。この並列処理方式にお
いては、プロセッサ間でデータをいかに高速に転送する
かが性能向上の鍵であシ多数のプロセッサの結合方式が
重要な問題となる。
その結合方法がシステムの性能を決定する最大の1因と
言って本過言ではない。プロセッサを結合する方法とし
て従来から様々な方式が提案されている。よく用いられ
るものにバスによる結合方式がある。これは1本のバス
に18個のプロセッサを結合し、このバスを介して互に
データを転送し7?、シ制御情報を送受したりしながら
、処理を進めていく方式である。この方式では、ある瞬
間を見た場合1つのプロセッサしかデータを転送するこ
とができず、このバス上のデータ転送の競合がシステム
の性能のネックとなってしまい、大規模な並列処理シス
テムを実現することができない。
言って本過言ではない。プロセッサを結合する方法とし
て従来から様々な方式が提案されている。よく用いられ
るものにバスによる結合方式がある。これは1本のバス
に18個のプロセッサを結合し、このバスを介して互に
データを転送し7?、シ制御情報を送受したりしながら
、処理を進めていく方式である。この方式では、ある瞬
間を見た場合1つのプロセッサしかデータを転送するこ
とができず、このバス上のデータ転送の競合がシステム
の性能のネックとなってしまい、大規模な並列処理シス
テムを実現することができない。
このバス方式を拡張して、複pi組のデータ転送を同時
に行うため、バスを複数本設は念方式も考えられている
。この方式ではバスの本数だけの並列度でもってデータ
転送できるが、バスの本数に応じ九ボートを各プロセッ
サに設けなければならず、さらにバスを多数設置するこ
とは物理的に不可能であり(せいぜい4〜8本)、この
複数本のバス方式でも大規模な並列処理システムは実現
不可能である。他の方法として共有メモリを介して多数
のプロセッサを結合する方法も従来から良く用いられて
いる。大型計算機におけるマルチプロセッサは−1とん
どこの共有メモリ方式を採用している。この共有メモリ
方式では、各プロセッサ間で共有するデータを非常に容
易にかつ柔軟にアクセスできる反面、共有メそり會アク
セスする恵めのボート数をあまり大きくすることができ
ず(高28ケ程高であシ)この方式も大規模な並列処理
システムを実現することができない、ま九個の方法とし
てマトリックススイッチによ逆結合する方法がある。こ
れは第5図に示すように複数台のプロセッサ(ここでは
n台と仮定する)1,2.・・・、Nを文字通vH2個
のスイッチ11,12,13.・・・・・、NNiマト
リックス状に配置し、このスイッチを開閉することによ
p任意の2つのプロセッサ間でデータを転送しようとす
る方式である3例えばスイッチ12金オンすると、プロ
セッサ1からプロセッサ2ヘデータを転送でき、tたス
イッチ3Nをオンするとプロセッサ3からプロセッサ2
ヘデータを転送することができる。このようにマトリッ
クススイッチ方式では、任意の2つのプロセッサ間でデ
ータを転送することができ、しかも転送先が異なる限5
nMのデータを同時に転送することが可能で、非常に柔
軟で高い転送能力をもつ結合方式を実現することができ
る1例えばプロセッサ1→プロセッサ2.プロセッ?2
→プロセッサ3.・・・・・・、プロセッサN→プロセ
ッサ1.といりた8組のデータ転送4.スイッチ12,
23.・・・・・・、N1をオンすることによi同時に
実行することができる。しかしながら本方式では、N台
のプロセッサに対し、N2個のスイッチが必要となシ、
マトリックススイッチ部のハードウェアが非常に大きく
なりてしまり。
に行うため、バスを複数本設は念方式も考えられている
。この方式ではバスの本数だけの並列度でもってデータ
転送できるが、バスの本数に応じ九ボートを各プロセッ
サに設けなければならず、さらにバスを多数設置するこ
とは物理的に不可能であり(せいぜい4〜8本)、この
複数本のバス方式でも大規模な並列処理システムは実現
不可能である。他の方法として共有メモリを介して多数
のプロセッサを結合する方法も従来から良く用いられて
いる。大型計算機におけるマルチプロセッサは−1とん
どこの共有メモリ方式を採用している。この共有メモリ
方式では、各プロセッサ間で共有するデータを非常に容
易にかつ柔軟にアクセスできる反面、共有メそり會アク
セスする恵めのボート数をあまり大きくすることができ
ず(高28ケ程高であシ)この方式も大規模な並列処理
システムを実現することができない、ま九個の方法とし
てマトリックススイッチによ逆結合する方法がある。こ
れは第5図に示すように複数台のプロセッサ(ここでは
n台と仮定する)1,2.・・・、Nを文字通vH2個
のスイッチ11,12,13.・・・・・、NNiマト
リックス状に配置し、このスイッチを開閉することによ
p任意の2つのプロセッサ間でデータを転送しようとす
る方式である3例えばスイッチ12金オンすると、プロ
セッサ1からプロセッサ2ヘデータを転送でき、tたス
イッチ3Nをオンするとプロセッサ3からプロセッサ2
ヘデータを転送することができる。このようにマトリッ
クススイッチ方式では、任意の2つのプロセッサ間でデ
ータを転送することができ、しかも転送先が異なる限5
nMのデータを同時に転送することが可能で、非常に柔
軟で高い転送能力をもつ結合方式を実現することができ
る1例えばプロセッサ1→プロセッサ2.プロセッ?2
→プロセッサ3.・・・・・・、プロセッサN→プロセ
ッサ1.といりた8組のデータ転送4.スイッチ12,
23.・・・・・・、N1をオンすることによi同時に
実行することができる。しかしながら本方式では、N台
のプロセッサに対し、N2個のスイッチが必要となシ、
マトリックススイッチ部のハードウェアが非常に大きく
なりてしまり。
プロセッサの台数が増加すると、このハードウェアの量
はその台数の2乗に比例して増えるため。
はその台数の2乗に比例して増えるため。
プロセッサの台数をあまシ大きくできない欠点がある。
実用的には16台程度が限度であシ、この方式によって
も大規模な並列処理システムは構築できない。また、さ
らに他の方式としてこのマトリックススイッチのハード
ウェアIk’r減らす工夫をし念第6図に示す次のよう
な結合方式も提案されている。図は8台のプロ上ツナ1
01〜10B’esスイツチ111〜134を用いて結
合したものである。
も大規模な並列処理システムは構築できない。また、さ
らに他の方式としてこのマトリックススイッチのハード
ウェアIk’r減らす工夫をし念第6図に示す次のよう
な結合方式も提案されている。図は8台のプロ上ツナ1
01〜10B’esスイツチ111〜134を用いて結
合したものである。
このスイッチ111〜134は、すべて同一の機能をも
っておL 111に示すように、2つの入力a、bを
そのままストレートにX、Yに出力する機能と、クロス
してY、Xに出力する機能をもっており、いずれか一方
の接続が制御線(図示せず)によシ選択される。この結
合方法はオメガネットワークと呼ばれてお夛、スイッチ
111〜134を適切に切シ換えるととくより任意のプ
はセッサ間でデータを転送することができる。この方法
では、スイッチの個数はプロセッサの台数をNとすると
Ttot2Nとな夕第5図のマトリックススイッチと比
べ少くなる。しかも各スイッチの出力端は、他のスイッ
チの入力かあるいはプロセッサの入力の1つにだFj接
続されておシ、接続関係が完全に1:lとなり電気的特
性上、パルスの反射等金低くすることができ都合が良い
、この点が5図に示した。マトリックススイッチは、1
つのスイッチの出力は他の(n−1)個のスイッチの出
力端子と1つのプロセッサの入力端子に接続されており
1反射等に起因するノイズが発生する恐れがある。この
オメガネットワーク方式は、マトリックス方式に比べ。
っておL 111に示すように、2つの入力a、bを
そのままストレートにX、Yに出力する機能と、クロス
してY、Xに出力する機能をもっており、いずれか一方
の接続が制御線(図示せず)によシ選択される。この結
合方法はオメガネットワークと呼ばれてお夛、スイッチ
111〜134を適切に切シ換えるととくより任意のプ
はセッサ間でデータを転送することができる。この方法
では、スイッチの個数はプロセッサの台数をNとすると
Ttot2Nとな夕第5図のマトリックススイッチと比
べ少くなる。しかも各スイッチの出力端は、他のスイッ
チの入力かあるいはプロセッサの入力の1つにだFj接
続されておシ、接続関係が完全に1:lとなり電気的特
性上、パルスの反射等金低くすることができ都合が良い
、この点が5図に示した。マトリックススイッチは、1
つのスイッチの出力は他の(n−1)個のスイッチの出
力端子と1つのプロセッサの入力端子に接続されており
1反射等に起因するノイズが発生する恐れがある。この
オメガネットワーク方式は、マトリックス方式に比べ。
ハード量が少くなる等の利点がある反面、プロセッサ間
の接続関係に少し制限が生じる。例えば。
の接続関係に少し制限が生じる。例えば。
プロセッサー01がアクセス′?102に、スイッチ1
11.121,131を介してデータを送っている時に
、プロセラf105は1o a Ks転送先が異なるに
もかかわらず、データを送ることができ表い。すなわち
、オメガネットワーク方式では、全く任意の組合せのデ
ータ転送金同時に実行できない場合が生じるという欠点
がある。
11.121,131を介してデータを送っている時に
、プロセラf105は1o a Ks転送先が異なるに
もかかわらず、データを送ることができ表い。すなわち
、オメガネットワーク方式では、全く任意の組合せのデ
ータ転送金同時に実行できない場合が生じるという欠点
がある。
本発明は以上の欠点に鑑みなされ念もので、その目的と
するところは、多数のプロセラ?を結合してなる並列処
理システムにおいて、その構成要素であるプロセッサ間
での高速なデータ転送が可能となる結合手段を提供する
ことにある。すなわち、その目的とするところは並列処
理システムを構成する任意のプロセッサ間でデータを転
送することができ、さらに転送先が異なるかぎりデータ
転送による競合が生じない、なおかつハードウェア量の
少い、プロセッサ結合手段を提倶することにある。また
他の目的とするところは結合部を構成するにあたって配
線が入力端子と出力端子の間で1:1に配線でき、電気
的特性上反射等のノイズの発生しない構成のとれる結合
手段を提供することにある。
するところは、多数のプロセラ?を結合してなる並列処
理システムにおいて、その構成要素であるプロセッサ間
での高速なデータ転送が可能となる結合手段を提供する
ことにある。すなわち、その目的とするところは並列処
理システムを構成する任意のプロセッサ間でデータを転
送することができ、さらに転送先が異なるかぎりデータ
転送による競合が生じない、なおかつハードウェア量の
少い、プロセッサ結合手段を提倶することにある。また
他の目的とするところは結合部を構成するにあたって配
線が入力端子と出力端子の間で1:1に配線でき、電気
的特性上反射等のノイズの発生しない構成のとれる結合
手段を提供することにある。
る)1mXnの短形状にならべ、各列方向のm個のBL
をループ状に結合しくこのループを8−LOOPと呼ぶ
。計n個存在する)%さらに各行方向のn個のBL=i
もループ状に結合しくこのループftD−LOOPと呼
ぶ。計量個存在する)、この8−LOOPおよびD−L
OOP上を各ループ上のBLに対応し次パケットを巡回
させ、(5−LOOP上にはm個の。
をループ状に結合しくこのループを8−LOOPと呼ぶ
。計n個存在する)%さらに各行方向のn個のBL=i
もループ状に結合しくこのループftD−LOOPと呼
ぶ。計量個存在する)、この8−LOOPおよびD−L
OOP上を各ループ上のBLに対応し次パケットを巡回
させ、(5−LOOP上にはm個の。
D−LOOP上にはn個のパケットが存在することにな
る)、データを転送しようとするBLは、5−LOOP
上のそのBLに対応しなバケツ)Kデータ金転送先のB
I、番号とともに載せ、5−LOOPを巡回せしめ、さ
らに8−LOOP上に移され九データは、転送先のBL
の属するD−LOOPに結合されたBLに到達した時そ
のBLが取り込み、さらにそのBLはこの取シ込んだデ
ータ11:、D−LOOP上を巡回している。転送先の
BLに対応したパケットに移しD−LOOP上を巡回せ
しめ、このパケット上のデータは、転送先のBLに到達
し九時点でそのBLK取p込まれるようにし、各プロセ
ッサ間でのデータ転送を実現している。
る)、データを転送しようとするBLは、5−LOOP
上のそのBLに対応しなバケツ)Kデータ金転送先のB
I、番号とともに載せ、5−LOOPを巡回せしめ、さ
らに8−LOOP上に移され九データは、転送先のBL
の属するD−LOOPに結合されたBLに到達した時そ
のBLが取り込み、さらにそのBLはこの取シ込んだデ
ータ11:、D−LOOP上を巡回している。転送先の
BLに対応したパケットに移しD−LOOP上を巡回せ
しめ、このパケット上のデータは、転送先のBLに到達
し九時点でそのBLK取p込まれるようにし、各プロセ
ッサ間でのデータ転送を実現している。
〔発明の効果〕
本発明によ、り、5−LOOP上のBLは送るべきデー
タを自分に対応し九パケットに常に送出する九め、他の
同一8−LOOP上のBLがデータを転送しようとして
も何ら影Vを受けることなく、データ=i8−LOOP
上に送出で1!、さらに転送先のBI、の属するD−L
OOP上では、D−BLへ転送すべ龜データが他になけ
れば、すなわち転送先がすべて異なれば、D−LOOP
上の転送すべきBLに対応するパケットは常に空いてお
り、他のBL間のデータ転送の影響は全く受けることな
く目的のBLにデータを送りつけることができる。また
この結合方式では必要とされる結合手段BLの数は、プ
ロセッサの台数に等しく、先に説明し次マトリックスス
イッチやオメガネットワークに比べ大幅に減小している
。またBL間の接続もすべて1:1となり、電気的特性
上反射等のノイズの低い結合方式提供することができる
。
タを自分に対応し九パケットに常に送出する九め、他の
同一8−LOOP上のBLがデータを転送しようとして
も何ら影Vを受けることなく、データ=i8−LOOP
上に送出で1!、さらに転送先のBI、の属するD−L
OOP上では、D−BLへ転送すべ龜データが他になけ
れば、すなわち転送先がすべて異なれば、D−LOOP
上の転送すべきBLに対応するパケットは常に空いてお
り、他のBL間のデータ転送の影響は全く受けることな
く目的のBLにデータを送りつけることができる。また
この結合方式では必要とされる結合手段BLの数は、プ
ロセッサの台数に等しく、先に説明し次マトリックスス
イッチやオメガネットワークに比べ大幅に減小している
。またBL間の接続もすべて1:1となり、電気的特性
上反射等のノイズの低い結合方式提供することができる
。
本発明を実施例に基づき詳しく説明する。第1図に本発
明により成る並列処理システムの構成例を示す1図は1
6台のプロセッサを結合した場合の図であ5,160〜
175がそれぞれ16台のプロセッサに対応して設けら
れた結合手段BLである。
明により成る並列処理システムの構成例を示す1図は1
6台のプロセッサを結合した場合の図であ5,160〜
175がそれぞれ16台のプロセッサに対応して設けら
れた結合手段BLである。
各BLに対し夫々プロセッサが接続されているが、図が
煩雑となる九め% 4つのBL160,164゜168
.172に対応するプロセッサのみを140〜143に
示し九。短形状に配置され7jBLは、(図では4×4
に配置)各列ごとにループ状に接続される。C脂に示す
ようKBL 160,164,168゜172がループ
150で、BL161,165,169゜173がルー
プ151で同様に他のBLもループ152゜153で結
合されている。この150〜153のループ@8−LO
OPと呼ぶ、ま念BLは各行方向にもループ状に結合さ
れている。図に示すようにBL160〜163がループ
154で、BL164〜167がループ155で、同様
に他のBL4.ループ156.157で結合されている
。この方向のループをD−LOOPと呼ぶ、この2種類
のループ上をそれぞれ、各ループ上のBLK対応し之パ
ケットが回っている8例えば5−LOOP150には、
それぞれ13L160,164゜188.172に対応
したパケットが計4つ回っている。他の5−LOOP1
51〜153も同様に4つのパケットが回っている。ま
たD−LOOP154にはBL160〜163に対応し
て4つのパケットが回ってbる。他のD−L00F15
5〜157も同様である。このパケットは転送すべきデ
ータを格納し、目的のBLに配ぶ役目を果すもので、そ
の形式は第2図に示すとうシである。5−LOOP上の
パケットを同図(8)K、D−LOOP上のパケットを
同図(b)に示し念。
煩雑となる九め% 4つのBL160,164゜168
.172に対応するプロセッサのみを140〜143に
示し九。短形状に配置され7jBLは、(図では4×4
に配置)各列ごとにループ状に接続される。C脂に示す
ようKBL 160,164,168゜172がループ
150で、BL161,165,169゜173がルー
プ151で同様に他のBLもループ152゜153で結
合されている。この150〜153のループ@8−LO
OPと呼ぶ、ま念BLは各行方向にもループ状に結合さ
れている。図に示すようにBL160〜163がループ
154で、BL164〜167がループ155で、同様
に他のBL4.ループ156.157で結合されている
。この方向のループをD−LOOPと呼ぶ、この2種類
のループ上をそれぞれ、各ループ上のBLK対応し之パ
ケットが回っている8例えば5−LOOP150には、
それぞれ13L160,164゜188.172に対応
したパケットが計4つ回っている。他の5−LOOP1
51〜153も同様に4つのパケットが回っている。ま
たD−LOOP154にはBL160〜163に対応し
て4つのパケットが回ってbる。他のD−L00F15
5〜157も同様である。このパケットは転送すべきデ
ータを格納し、目的のBLに配ぶ役目を果すもので、そ
の形式は第2図に示すとうシである。5−LOOP上の
パケットを同図(8)K、D−LOOP上のパケットを
同図(b)に示し念。
5−LOOP上のパケット210はデータを格納する2
11、相手先プルセッサ番号(即ちBL層番号を格納す
る212.そのパケットにデータが入りているか否かを
示すフラグを格納する213.およびそのパケットかど
のBLK対応しているのかを示す情報を格納する214
,04つのフィールドからなっている。またD−LOO
P上のパケットにデータが格納されているかを示す22
3およびそのパケットがどのBLに対応しているのか?
示す情報を格納する22403つのフィールドから成っ
ている。
11、相手先プルセッサ番号(即ちBL層番号を格納す
る212.そのパケットにデータが入りているか否かを
示すフラグを格納する213.およびそのパケットかど
のBLK対応しているのかを示す情報を格納する214
,04つのフィールドからなっている。またD−LOO
P上のパケットにデータが格納されているかを示す22
3およびそのパケットがどのBLに対応しているのか?
示す情報を格納する22403つのフィールドから成っ
ている。
なお213あるいは223のフィールドはデータ転送が
スムーズに行なわれている場合、即ち送り出し次データ
が滞ることなく相手のプロセッサに転送されている場合
は、常に送多出し次データは受は取られており、パケッ
トは常に空の状態で戻って来るはずであり不要である。
スムーズに行なわれている場合、即ち送り出し次データ
が滞ることなく相手のプロセッサに転送されている場合
は、常に送多出し次データは受は取られており、パケッ
トは常に空の状態で戻って来るはずであり不要である。
しかしながら同一のプロセッサへ核数台のプロセッサか
ら同時にデータを転送したり、あるいは転送先のプロセ
ッサの都合でデータが受は取れなかったすしてパケット
が空状態で戻ってとない場合がある。パケットが′空゛
か否かを示す7ラグ213および223が設けられでい
る。
ら同時にデータを転送したり、あるいは転送先のプロセ
ッサの都合でデータが受は取れなかったすしてパケット
が空状態で戻ってとない場合がある。パケットが′空゛
か否かを示す7ラグ213および223が設けられでい
る。
BLの詳細なグキック図は第5図に示すとうりであ夛、
プロセッサから信号I!l350f:介して送られてき
ちデータを格納するレジスタ300.8−LOOP上の
データを一時格納するレジスタ302゜D−LOOP上
のデータを一旦格納するレジスタ3o4゜プロセッサに
信号53s1を介して送るデータを格納するためのレジ
スタ301.さらに8−LOOPのデータをD−LOO
Pに移すなめ一旦バッ7アリングを行う±めのレジスタ
ファイル310金主な構成要素として−る。なお303
,305はマルチプレクサであり、それぞれ8−LOO
P、D−LOOPEデータを送出する比めに用いられる
。なお図の簡単化のため各ループのデータをy視してマ
ルチプレクサ等を制御する回路については省略し友。
プロセッサから信号I!l350f:介して送られてき
ちデータを格納するレジスタ300.8−LOOP上の
データを一時格納するレジスタ302゜D−LOOP上
のデータを一旦格納するレジスタ3o4゜プロセッサに
信号53s1を介して送るデータを格納するためのレジ
スタ301.さらに8−LOOPのデータをD−LOO
Pに移すなめ一旦バッ7アリングを行う±めのレジスタ
ファイル310金主な構成要素として−る。なお303
,305はマルチプレクサであり、それぞれ8−LOO
P、D−LOOPEデータを送出する比めに用いられる
。なお図の簡単化のため各ループのデータをy視してマ
ルチプレクサ等を制御する回路については省略し友。
次にこれらの結合手段によシデータがどのようにして転
送されるかについて説明する。第4図(a)。
送されるかについて説明する。第4図(a)。
(b)は夫々D−LOOP及び8−LOOPの制御手順
を示し。
を示し。
これらは独立の制御回路で実行される。今仮りにBL1
60からBL175ヘデータを転送する場合を考える。
60からBL175ヘデータを転送する場合を考える。
BL160は、プロセッサから送られ念データ、送り先
BL番号を160内のレジスタ300に一旦格伯する。
BL番号を160内のレジスタ300に一旦格伯する。
BL160はイぎ号線330を介して302に取シ込オ
れる8−LOOP上のパケットヲ監視しておff、 #
¥4図(b) 、 Wc2図(a)に示し7’h214
,213のtおよびfフィールドをチェックしている。
れる8−LOOP上のパケットヲ監視しておff、 #
¥4図(b) 、 Wc2図(a)に示し7’h214
,213のtおよびfフィールドをチェックしている。
tフィールド214によりそのパケットがBL160自
身に対応するものであり、かつfフィールドが70゛で
あることすなわち、そのパケットが空であることを検出
すれば、マルチプレクサ303によりレジスタ300の
内容を信号線331を介して$−LOOP上に送出する
。この時fフィールドを了にしてデータがパケットに載
りていることを表示する。tおよびfフィールドが所望
の状態にならなければ、レジスタ302に受は取ったパ
ケットをそのま1s−LOOPに出力する。この手順に
よpS−LOOP上に次々と送出すべきデータ金出力す
る。8−LOOP上に送出されたデータは、次々と8−
LOOP上のBLを移動していく、各BLは5−LOO
P上のパケットのfフィールド213.相手先プロセッ
サ番号(即ちBL層番号を格納するPU、yイールド2
12を監視してお少、fフィールドが′1′でかつその
PU−yイールドが、そのBLのべするD−LOOP上
に存在するBL誉号であれば、レジスタファイル310
に取り込もうとする。レジスタファイル310の各レジ
スタは、D−LOOP上DBLにそれぞれ対応している
。各レジスタには、そのレジスタにデータが格納されて
いるかを示すフラグfが1ビツトづつ付加されている。
身に対応するものであり、かつfフィールドが70゛で
あることすなわち、そのパケットが空であることを検出
すれば、マルチプレクサ303によりレジスタ300の
内容を信号線331を介して$−LOOP上に送出する
。この時fフィールドを了にしてデータがパケットに載
りていることを表示する。tおよびfフィールドが所望
の状態にならなければ、レジスタ302に受は取ったパ
ケットをそのま1s−LOOPに出力する。この手順に
よpS−LOOP上に次々と送出すべきデータ金出力す
る。8−LOOP上に送出されたデータは、次々と8−
LOOP上のBLを移動していく、各BLは5−LOO
P上のパケットのfフィールド213.相手先プロセッ
サ番号(即ちBL層番号を格納するPU、yイールド2
12を監視してお少、fフィールドが′1′でかつその
PU−yイールドが、そのBLのべするD−LOOP上
に存在するBL誉号であれば、レジスタファイル310
に取り込もうとする。レジスタファイル310の各レジ
スタは、D−LOOP上DBLにそれぞれ対応している
。各レジスタには、そのレジスタにデータが格納されて
いるかを示すフラグfが1ビツトづつ付加されている。
5−LOOP上のデータをレジスタファイル310に取
シ込こもうとする時、送夕先のBLに対応するレジスタ
の7ラグfがゝrならば、iだ前のデータが残っており
新たに次のデータを取り込むことができず、レジスタ3
02に取り込んだデータはそのまま5−LOOPK出力
される。対応するレジスタのfフィールドが46で空の
場合には、レジスタ302に取シ込んだデータをレジス
フアイル内の対応するレジスタに取り込み、そのレジス
タのフラグfを了とし、かつレジスタ302に取り込ん
だ5−LOOP上のパケットのfフィールド213を0
とし% 5−LOOPに送出しデータを受は取り九こと
を表示する。この結果データの送フ手は次のデータをそ
のパケットに栽せることか可能となる。
シ込こもうとする時、送夕先のBLに対応するレジスタ
の7ラグfがゝrならば、iだ前のデータが残っており
新たに次のデータを取り込むことができず、レジスタ3
02に取り込んだデータはそのまま5−LOOPK出力
される。対応するレジスタのfフィールドが46で空の
場合には、レジスタ302に取シ込んだデータをレジス
フアイル内の対応するレジスタに取り込み、そのレジス
タのフラグfを了とし、かつレジスタ302に取り込ん
だ5−LOOP上のパケットのfフィールド213を0
とし% 5−LOOPに送出しデータを受は取り九こと
を表示する。この結果データの送フ手は次のデータをそ
のパケットに栽せることか可能となる。
B L 160からBL175に対し送出されたデータ
は、上に説明し九手順によシBL172のレジスタファ
イル310に取り込まれる。次にBL172は信号線3
40よりレジスタ304に取シ込′まれたD−LOOP
上のバケツ)1監視しておL第411 (a)そのtフ
イ、−ルド224が、転送先のBL番号を示し、かつf
フィールド223が′♂でそのパケットが空であること
を検出すれば、レジスタ7アイルに取シ込んだデータを
マルチプレクサ350を介して信号線341によシD−
LOOPK出力する。この時D−LOOP上のfフィー
ルド22 a t’rにする。tたレジスタファイル内
の対応するレジスタの7,7グr t”ciとし1次の
データ18−LOOPから受は取れるようにする。
は、上に説明し九手順によシBL172のレジスタファ
イル310に取り込まれる。次にBL172は信号線3
40よりレジスタ304に取シ込′まれたD−LOOP
上のバケツ)1監視しておL第411 (a)そのtフ
イ、−ルド224が、転送先のBL番号を示し、かつf
フィールド223が′♂でそのパケットが空であること
を検出すれば、レジスタ7アイルに取シ込んだデータを
マルチプレクサ350を介して信号線341によシD−
LOOPK出力する。この時D−LOOP上のfフィー
ルド22 a t’rにする。tたレジスタファイル内
の対応するレジスタの7,7グr t”ciとし1次の
データ18−LOOPから受は取れるようにする。
当然のことなからtフィールドが相手先のBL番号であ
りたとしても、fフィールドが了であれば、前のデータ
が取フ込まれていないことを示しており、データはレジ
スタファイルに残されたままになっている。BL175
はD−LOOP上のパケットを信号線340を介し取シ
込み、tフィルド224が自分の番号であり、かつfフ
ィールドがTであれば、そのデータをレジスタ301に
取少込み信号1II351を介してプロセッサに送夕つ
ける。この時D−LOOPへはfフィールド22 a
foとしたパケットtD−LOOPに送出し、次のデー
タが受は取れることを示す、なお以前にレジスタ301
に取シ込んだデータが末だプロセッサに送シっけられて
いなければ、D−LOOPのデータは受は取られず。
りたとしても、fフィールドが了であれば、前のデータ
が取フ込まれていないことを示しており、データはレジ
スタファイルに残されたままになっている。BL175
はD−LOOP上のパケットを信号線340を介し取シ
込み、tフィルド224が自分の番号であり、かつfフ
ィールドがTであれば、そのデータをレジスタ301に
取少込み信号1II351を介してプロセッサに送夕つ
ける。この時D−LOOPへはfフィールド22 a
foとしたパケットtD−LOOPに送出し、次のデー
タが受は取れることを示す、なお以前にレジスタ301
に取シ込んだデータが末だプロセッサに送シっけられて
いなければ、D−LOOPのデータは受は取られず。
そのtまD−LOOP上に送シ出される。
以上説明し九ように、データは8−LOOP、D−LO
OPを介して目的のプロセッサに転送されていくが、5
−LOOP上ではそのループ上のBLに対応して1つの
パケットが回っておシ、他のBLが同時にデータを転送
しても何ら影響を受けることなく。
OPを介して目的のプロセッサに転送されていくが、5
−LOOP上ではそのループ上のBLに対応して1つの
パケットが回っておシ、他のBLが同時にデータを転送
しても何ら影響を受けることなく。
データ′eS−LOOP上のパケットに送り出すことが
できる。さらにD−LOOP上においても、転送先のB
Lに対応して1つのパケットが回っているため、■−の
BLへのデータ転送が、複a(!litのBLから行な
われないかぎゃ、他のデータ転送の影響を受けることな
く、目的のBLに対するD−LOOP上のパケットへデ
ータを送り出すことができる。すなわち本発明によれば
、すべてのプロセッサは、対応するBLを介して、全く
同時に1転送先が異る限り、互に競合することなく、デ
ータを転送することができる。またこの結合方式を実現
する上での結合手段であるBLは、プロセッサの台数外
あれば良く、マトリックススイッチ等に比べ非常に少い
ハードウェアで実現できる。さらにとのBLは全く同一
仕様であ5.LSI化に適した結合方式と考えられる。
できる。さらにD−LOOP上においても、転送先のB
Lに対応して1つのパケットが回っているため、■−の
BLへのデータ転送が、複a(!litのBLから行な
われないかぎゃ、他のデータ転送の影響を受けることな
く、目的のBLに対するD−LOOP上のパケットへデ
ータを送り出すことができる。すなわち本発明によれば
、すべてのプロセッサは、対応するBLを介して、全く
同時に1転送先が異る限り、互に競合することなく、デ
ータを転送することができる。またこの結合方式を実現
する上での結合手段であるBLは、プロセッサの台数外
あれば良く、マトリックススイッチ等に比べ非常に少い
ハードウェアで実現できる。さらにとのBLは全く同一
仕様であ5.LSI化に適した結合方式と考えられる。
さらに第3図から明らかなように、各BL間の配繕はす
べて1:1であ九反射等によるノイズの低い結合方式を
提供することができる。
べて1:1であ九反射等によるノイズの低い結合方式を
提供することができる。
′M1図は本発明による並列処理システム構成図、第2
図はデータ転送パケットのフォーマット図。 第3図は結合手段の一構成図、g4図は各ループの制御
手順を示す図、ms図及び第6図は従来システムを示す
図である。 140−%−143プロセッサ 160〜175 結合手段 B L (Bus Lo
gic)150〜153 5−LOOP 154〜157 D−LOOP 第1図 第4図 (a)o−Loop +用罠
図はデータ転送パケットのフォーマット図。 第3図は結合手段の一構成図、g4図は各ループの制御
手順を示す図、ms図及び第6図は従来システムを示す
図である。 140−%−143プロセッサ 160〜175 結合手段 B L (Bus Lo
gic)150〜153 5−LOOP 154〜157 D−LOOP 第1図 第4図 (a)o−Loop +用罠
Claims (1)
- 多数のプロセッサ(m×n台以下とする)からなる並列
処理システムのプロセッサ結合装置において、各プロセ
ッサに対応して結合手段(BL)を設け、このBLをm
行×n列の短形状に配置し、各列方向のm個のBLをそ
れぞれS−LOOPと呼ぶループで結合し、さらに各行
方向のn個のBLをそれぞれD−LOOPと呼ぶループ
で結合し、該n個のS−LOOP上およびm個のD−L
OOP上にそれぞれ各ループ上のBLに対応したパケッ
トを巡回せしめ、各BLに、転送すべきデータを、該B
Lの属するS−LOOP上のBLに対応して設けられた
パケットに、転送すべきデータとともに送り先のBL番
号を載せS−LOOP上を巡回せしめる手段と、S−L
OOP上を巡回してしるパケット上の送り先のBL番号
を監視し、該パケット上のデータがその番号で示される
BLが属するD−LOOP上のn個のBLのいづれかへ
転送するデータであればそのデータを取り込み、さらに
D−LOOP上を巡回せしめる手段とを具備せしめたこ
とを特徴とするプロセッサ結合装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4847286A JPS62206660A (ja) | 1986-03-07 | 1986-03-07 | プロセツサ結合装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4847286A JPS62206660A (ja) | 1986-03-07 | 1986-03-07 | プロセツサ結合装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS62206660A true JPS62206660A (ja) | 1987-09-11 |
Family
ID=12804321
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP4847286A Pending JPS62206660A (ja) | 1986-03-07 | 1986-03-07 | プロセツサ結合装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS62206660A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0830571A (ja) * | 1995-07-24 | 1996-02-02 | Hitachi Ltd | データ転送ネットワーク |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS54140437A (en) * | 1978-04-24 | 1979-10-31 | Toshiba Corp | Parallel process system |
| JPS60140457A (ja) * | 1983-12-28 | 1985-07-25 | Hitachi Ltd | コンピュータシステム |
| JPS60175174A (ja) * | 1984-02-21 | 1985-09-09 | Agency Of Ind Science & Technol | 並列デ−タ転送方式 |
-
1986
- 1986-03-07 JP JP4847286A patent/JPS62206660A/ja active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS54140437A (en) * | 1978-04-24 | 1979-10-31 | Toshiba Corp | Parallel process system |
| JPS60140457A (ja) * | 1983-12-28 | 1985-07-25 | Hitachi Ltd | コンピュータシステム |
| JPS60175174A (ja) * | 1984-02-21 | 1985-09-09 | Agency Of Ind Science & Technol | 並列デ−タ転送方式 |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0830571A (ja) * | 1995-07-24 | 1996-02-02 | Hitachi Ltd | データ転送ネットワーク |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR900006791B1 (ko) | 패킷 스위치식 다중포트 메모리 n×m 스위치 노드 및 처리 방법 | |
| JP3628706B2 (ja) | メモリインタフェースユニット、共有メモリスイッチシステムおよび関連の方法 | |
| Patel | Processor-memory interconnections for multiprocessors | |
| KR900006793B1 (ko) | 패킷 스위치 다중 대기행렬 NxM 스위치 노오드 및 처리 방법 | |
| US5053942A (en) | Bit-sliced cross-connect chip having a tree topology of arbitration cells for connecting memory modules to processors in a multiprocessor system | |
| US4952930A (en) | Multipath hierarchical network | |
| TW201108668A (en) | Buffered crossbar switch system | |
| IE49451B1 (en) | Digital communication networks employing speed independent switches | |
| JPH02501183A (ja) | 層をなしたネツトワーク | |
| US6356109B1 (en) | Programmable device | |
| JPS6360579B2 (ja) | ||
| JP2005004895A (ja) | 同期バンク型メモリ | |
| JPS6259495A (ja) | 通信接続スイッチの優先処理手順を修正する方法 | |
| US5388230A (en) | Parallel processor having multi-processing units either connected or bypassed in either series or parallel by the use of bus switching | |
| US5717646A (en) | Random access multiport memory capable of simultaneously accessing memory cells from a plurality of interface ports | |
| JPS62206660A (ja) | プロセツサ結合装置 | |
| CN101014948A (zh) | 单指令多数据处理器结构中的互连 | |
| JP2006260127A (ja) | 結合網およびそれを用いたマルチポートメモリ | |
| US6901070B2 (en) | Dynamically programmable integrated switching device using an asymmetric 5T1C cell | |
| US9268600B2 (en) | Picoengine pool transactional memory architecture | |
| JPH0351340B2 (ja) | ||
| JP3323142B2 (ja) | クロスバ装置、多段クロスバ装置及び情報処理装置 | |
| JPH07110798A (ja) | 並列処理システム | |
| JP3609908B2 (ja) | 計算機接続装置 | |
| JP2883750B2 (ja) | 無限のチャネル拡張性を有するディジタル通信回路網 |