JPS58159171A - 並列処理方式 - Google Patents
並列処理方式Info
- Publication number
- JPS58159171A JPS58159171A JP4220882A JP4220882A JPS58159171A JP S58159171 A JPS58159171 A JP S58159171A JP 4220882 A JP4220882 A JP 4220882A JP 4220882 A JP4220882 A JP 4220882A JP S58159171 A JPS58159171 A JP S58159171A
- Authority
- JP
- Japan
- Prior art keywords
- processor
- memory
- data
- program
- processors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
- G06F15/8007—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors
Landscapes
- Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multi Processors (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の属する技術分野〕
本発明は、並列処理方式、%に1データ処理装置におけ
る並列処理方式に関する。
る並列処理方式に関する。
一般に、演算処理を高速化する方法の1つとして並列処
理方式がある。
理方式がある。
この並列処理方式は、処理すべきプログラムの中で並列
に実行できる部分を各々入なるプロセッサで実行し、h
台のプロセッサで理想的にはへ倍の性能を得ようとする
ものである(実際には並列に実行できない部分や並列動
作を制御するための余分な時間・・・・・・オーバヘッ
ド・・・・・・のため、へ倍以下の性能しか得られない
。) 〔、従来技術〕 従来の並列処理方式は、制御プロセッサと、それぞれが
データを記憶する複数のデータメモリと、前記制御プロ
セッサに並列に接続された複数のプロセッサと、前記複
数のプロセッサと前記複数のデータメモリとを並行して
相互に接続するためのメモリ スイッチとを含み、前記
複数のプロセッサのそれぞれはプロセッサエレメントと
、前6.プロセツサエレメントを前記制御プロセッサと
接続するための制御プロセッサインターフェースと、前
記プロセッサエレメントを前記メモリスイッチと接続す
るためのメモリスイッチインク・−フェースとを含んで
構成される。
に実行できる部分を各々入なるプロセッサで実行し、h
台のプロセッサで理想的にはへ倍の性能を得ようとする
ものである(実際には並列に実行できない部分や並列動
作を制御するための余分な時間・・・・・・オーバヘッ
ド・・・・・・のため、へ倍以下の性能しか得られない
。) 〔、従来技術〕 従来の並列処理方式は、制御プロセッサと、それぞれが
データを記憶する複数のデータメモリと、前記制御プロ
セッサに並列に接続された複数のプロセッサと、前記複
数のプロセッサと前記複数のデータメモリとを並行して
相互に接続するためのメモリ スイッチとを含み、前記
複数のプロセッサのそれぞれはプロセッサエレメントと
、前6.プロセツサエレメントを前記制御プロセッサと
接続するための制御プロセッサインターフェースと、前
記プロセッサエレメントを前記メモリスイッチと接続す
るためのメモリスイッチインク・−フェースとを含んで
構成される。
次に、従来の並列処理方式について、図面を参照して詳
細に説明する。
細に説明する。
IP、1図は従来の並列処理システムの一例を示すシス
テム構成図であり、第2図は第1図に示すプロセッサの
一例を示す詳細ブロック図である。
テム構成図であり、第2図は第1図に示すプロセッサの
一例を示す詳細ブロック図である。
第1図に示す並列処理方式は、制御プロセッサCPと、
この制御プロセッサCPに専用の制御専用メモリC)’
Ml、C)’N2と、制御プロセッサCPに並列接続さ
れたプロセッサ)’)’1−)’)’16と、プログラ
ムおよびデータを記憶したメモリMMI〜MM32と、
16台のプロセッサと32台1リメモリとを相互に遊行
して接続するために16刈32=512個の接続点をも
つメモリスイッチとを含んでいる。
この制御プロセッサCPに専用の制御専用メモリC)’
Ml、C)’N2と、制御プロセッサCPに並列接続さ
れたプロセッサ)’)’1−)’)’16と、プログラ
ムおよびデータを記憶したメモリMMI〜MM32と、
16台のプロセッサと32台1リメモリとを相互に遊行
して接続するために16刈32=512個の接続点をも
つメモリスイッチとを含んでいる。
プロセッサPP1〜)’)’16はいずれも同一の構成
をなし、第2図に示すように、プロセッサエレメントP
Eと、メモリスイッチインターフニースゲMalと、制
御プロセッサインターフェースCPlを含んでいる。メ
モリインターフェースMalは、プロセッサエレメント
PEからデータあるい、文プログラムの読出を行なうた
めのアクセス要求1r5?モリスイッチN8を介してメ
モリMMI−NM32に供給するとともにメモリjll
1M 1−JN 32から読み出したデータをプロセッ
サエレメントPEに供給するとともにプロセッサエレメ
ントPEでの演算結果などをメモリjvlN 1−MR
432に記憶させるために供給する。制御プロセッサイ
ンターフェースCPlはインターフェースaを介して制
御プロセッサCPと接続され、プログラム実行開始指示
aTARTやプログラム実行停止指示8T(J)’t−
制御プロセッサCPから供給されて、プロセッサエレメ
ントPEに供給したシプロセッサエレメントPEからの
処理終了通知ENDを制御プロセッサCPに供給する0 すなわち、メモリスイッチ′MSを介して16台のブロ
セ、す)’)’1.)’P16が32台のメモリNNI
&、JN32にアクセスできるようになっておシ、各プ
ロセッサPP1〜)’P16は各々独立にプログラムを
実行することが可能である0制御プロセツサCPはプロ
セッサPP1〜)’)’16とのインタフェース1を通
してプログラム実行開始指示5TART t−供給した
シ、プロセッサが実行を完了したときの処理終了通知E
NDを受理するO この制御プロセッサCPの制御の干でプロセラtPP1
〜P)’16は解くべきプログ?ム中の並列処理部分に
ついて分担して実行する。たとえば、町+bl @ a
l+ b、 I ・、Jln +btssという計算で
あればi番目のプロセッサPPiがal+bl ttt
算する。
をなし、第2図に示すように、プロセッサエレメントP
Eと、メモリスイッチインターフニースゲMalと、制
御プロセッサインターフェースCPlを含んでいる。メ
モリインターフェースMalは、プロセッサエレメント
PEからデータあるい、文プログラムの読出を行なうた
めのアクセス要求1r5?モリスイッチN8を介してメ
モリMMI−NM32に供給するとともにメモリjll
1M 1−JN 32から読み出したデータをプロセッ
サエレメントPEに供給するとともにプロセッサエレメ
ントPEでの演算結果などをメモリjvlN 1−MR
432に記憶させるために供給する。制御プロセッサイ
ンターフェースCPlはインターフェースaを介して制
御プロセッサCPと接続され、プログラム実行開始指示
aTARTやプログラム実行停止指示8T(J)’t−
制御プロセッサCPから供給されて、プロセッサエレメ
ントPEに供給したシプロセッサエレメントPEからの
処理終了通知ENDを制御プロセッサCPに供給する0 すなわち、メモリスイッチ′MSを介して16台のブロ
セ、す)’)’1.)’P16が32台のメモリNNI
&、JN32にアクセスできるようになっておシ、各プ
ロセッサPP1〜)’P16は各々独立にプログラムを
実行することが可能である0制御プロセツサCPはプロ
セッサPP1〜)’)’16とのインタフェース1を通
してプログラム実行開始指示5TART t−供給した
シ、プロセッサが実行を完了したときの処理終了通知E
NDを受理するO この制御プロセッサCPの制御の干でプロセラtPP1
〜P)’16は解くべきプログ?ム中の並列処理部分に
ついて分担して実行する。たとえば、町+bl @ a
l+ b、 I ・、Jln +btssという計算で
あればi番目のプロセッサPPiがal+bl ttt
算する。
このような従来の並列処理システムの性能t−高めるに
は各プロセッサの性能を高くするかプロセッサの台数を
増やす必要がある。
は各プロセッサの性能を高くするかプロセッサの台数を
増やす必要がある。
しかしながら、プロセッサの性能を高めるとその装置寸
法が大きくなり多数並べることが困難になる。さらに、
プロセッサの台数を増やすとメモリを並行して使用でき
るようにするためにはメモリも増大する必要がありメモ
リスイッチはプロセッサの台数とメモリの台数との積で
増大して複雑・大規模になり、やは夛実現困難になる(
たとえばクロスバ・スイッチで考えるとプロセッサ台数
とメモリ台数を各々2倍にするとスイッチの規模Vi、
2X1共4倍になる)。こうしA、欠点のため大規模、
超高性能の並列処理システムはほとんど実用化されてい
ない。
法が大きくなり多数並べることが困難になる。さらに、
プロセッサの台数を増やすとメモリを並行して使用でき
るようにするためにはメモリも増大する必要がありメモ
リスイッチはプロセッサの台数とメモリの台数との積で
増大して複雑・大規模になり、やは夛実現困難になる(
たとえばクロスバ・スイッチで考えるとプロセッサ台数
とメモリ台数を各々2倍にするとスイッチの規模Vi、
2X1共4倍になる)。こうしA、欠点のため大規模、
超高性能の並列処理システムはほとんど実用化されてい
ない。
すなわち、従来の並列処理方式は並列度を増大させるこ
とが困難であるという欠点があった。
とが困難であるという欠点があった。
本発明の目的は並列度を増大できる並列処理方式を提供
することにある。
することにある。
すなわち、本発明の目的は並列処理を分担する各プロセ
ッサをさらに複数のプロセッサエレメントからなる並列
処理プロセッサとすることによシメモリスイッチの規模
を大きくすることなく並列度を高めて上記欠点を解決し
大規模、超高性能を有する並列処理システムを提供する
ことにある。
ッサをさらに複数のプロセッサエレメントからなる並列
処理プロセッサとすることによシメモリスイッチの規模
を大きくすることなく並列度を高めて上記欠点を解決し
大規模、超高性能を有する並列処理システムを提供する
ことにある。
本発明の並列処理方式は、制御プロセッサと、それぞれ
がデータを記憶する複数のデータメモリと、前記制御プ
ロセッサに並列に接続された複数のプロセッサと、前記
複数のプロセッサと前記複数のデータメモリとを並行し
て相互に接続するためのメモリ スイッチを含み、前記
複数のプロセッサのそれぞれは、並列に設けられた複数
のプロセッサエレメントと、各プロセッサエレメントに
共通に設けられプログラムを記憶するプログラムメモリ
と、前記複数のプロセッサエレメントを前記制御プロセ
ッサと接続する九めの制御プロセッサインターフェース
と、前記複数のプロセッサエレメントを前記メモリスイ
ッチと接続するためのメモリスイッチインターフェース
と、前記メモリスイッチインターフェースに接続され前
記データメモリに記憶したデータの一部の写しを記憶す
るデータ用キャッジΔ′メモリとを含んで構成される。
がデータを記憶する複数のデータメモリと、前記制御プ
ロセッサに並列に接続された複数のプロセッサと、前記
複数のプロセッサと前記複数のデータメモリとを並行し
て相互に接続するためのメモリ スイッチを含み、前記
複数のプロセッサのそれぞれは、並列に設けられた複数
のプロセッサエレメントと、各プロセッサエレメントに
共通に設けられプログラムを記憶するプログラムメモリ
と、前記複数のプロセッサエレメントを前記制御プロセ
ッサと接続する九めの制御プロセッサインターフェース
と、前記複数のプロセッサエレメントを前記メモリスイ
ッチと接続するためのメモリスイッチインターフェース
と、前記メモリスイッチインターフェースに接続され前
記データメモリに記憶したデータの一部の写しを記憶す
るデータ用キャッジΔ′メモリとを含んで構成される。
すなわち、本発明の並列処理方式は、複数のプロセッサ
エレメントと該複数のプロセッサエレメントで共有され
るプログラム用メモリと該複数のプロセッサエレメント
で共有されるデータ用キャッジ番メモリと、該複数のプ
ロセッサエレメントから発生するデータメモリへのアク
セス要求の中から各データメモリアクセスタイミング毎
に一つを選択して処理する回路とから構成される演算処
理装置複数台と複数のデータメモリと任意の上記演算処
理装置から任意の上記データメモリへのアクセスを可能
にするメモリ・スイッチとを備えて構成される。
エレメントと該複数のプロセッサエレメントで共有され
るプログラム用メモリと該複数のプロセッサエレメント
で共有されるデータ用キャッジ番メモリと、該複数のプ
ロセッサエレメントから発生するデータメモリへのアク
セス要求の中から各データメモリアクセスタイミング毎
に一つを選択して処理する回路とから構成される演算処
理装置複数台と複数のデータメモリと任意の上記演算処
理装置から任意の上記データメモリへのアクセスを可能
にするメモリ・スイッチとを備えて構成される。
さらに、本発明の並列処理方式は、上述の構成に加えて
、制御プロセッサと該制御プロセッサから上記全プロセ
ッサエレメントにプログラム実行開始を指示する通信手
段と上記各プロセッサエレメントからプログラム実行終
了を上記制御プロセッサに通知する手段とを備え、上記
制御プロセッサの制御下で一つのプログラム中の並列処
理部分を上記全プロセッサエレメントにより並列に実行
するように構成される。
、制御プロセッサと該制御プロセッサから上記全プロセ
ッサエレメントにプログラム実行開始を指示する通信手
段と上記各プロセッサエレメントからプログラム実行終
了を上記制御プロセッサに通知する手段とを備え、上記
制御プロセッサの制御下で一つのプログラム中の並列処
理部分を上記全プロセッサエレメントにより並列に実行
するように構成される。
すなわち、本発明の並列処理方式は並列処理を分担する
各プロセッサを並列に動作する複数のプロセッサエレメ
ントで構成することによp1メモリスイッチの規模を大
きくすることなく実質的な並列処理プロセッサ台数を増
やしている。
各プロセッサを並列に動作する複数のプロセッサエレメ
ントで構成することによp1メモリスイッチの規模を大
きくすることなく実質的な並列処理プロセッサ台数を増
やしている。
すなわち、本発明の並列処理システムは、n台のプロセ
ッサと、m台すなわち、n台あるいば1台などn台以上
のデータメモリと、このn台のプロセッサとm台のデー
タメモリとをahするためのmXn個の接続点を有する
メモリスイッチとを含み、このn台のプロセッサのそれ
ぞれの1台のプロセッサの内部構造k1台のプロセッサ
エレメントと、この1台のプロセッサエレメントで共通
的に使用される、(メモリで1台のプロセッサエレメン
トの実行すべきプログラムを格納した1台のプログラム
メモリと、1台のプロセッサエレメントのそれぞれから
前記m台のデータメモリへのアクセス要求を受けて、処
理するメモリスイッチインターフェースとを含んでいる
。すなわち、このメモリスイッチインターフェースはメ
モリのアらのアクセス要求の中から1つを選択して選択
されたアクセス要求をメモリスイッチを介してデータ用
メモリへ送出する。このアクセス要求が読出要求であれ
ばデータメモリから送られてくるチータラ要求元のプロ
セッサエレメントに渡す。このように、メモリスイッチ
インターフェースで、データメモリへのアクセス・イン
ターフェースを1本に絞っているのでメモリスイッチの
規模(プロセッサを接続するためのインタフェース数)
を路にすることができる。この場合データ用メモリへの
アクセスが1台のプロセッサエレメント間で競合するの
でこれが性能上のボトルネックになる可能性がある。
ッサと、m台すなわち、n台あるいば1台などn台以上
のデータメモリと、このn台のプロセッサとm台のデー
タメモリとをahするためのmXn個の接続点を有する
メモリスイッチとを含み、このn台のプロセッサのそれ
ぞれの1台のプロセッサの内部構造k1台のプロセッサ
エレメントと、この1台のプロセッサエレメントで共通
的に使用される、(メモリで1台のプロセッサエレメン
トの実行すべきプログラムを格納した1台のプログラム
メモリと、1台のプロセッサエレメントのそれぞれから
前記m台のデータメモリへのアクセス要求を受けて、処
理するメモリスイッチインターフェースとを含んでいる
。すなわち、このメモリスイッチインターフェースはメ
モリのアらのアクセス要求の中から1つを選択して選択
されたアクセス要求をメモリスイッチを介してデータ用
メモリへ送出する。このアクセス要求が読出要求であれ
ばデータメモリから送られてくるチータラ要求元のプロ
セッサエレメントに渡す。このように、メモリスイッチ
インターフェースで、データメモリへのアクセス・イン
ターフェースを1本に絞っているのでメモリスイッチの
規模(プロセッサを接続するためのインタフェース数)
を路にすることができる。この場合データ用メモリへの
アクセスが1台のプロセッサエレメント間で競合するの
でこれが性能上のボトルネックになる可能性がある。
しかし、この問題は第1に、プロセッサエレメントで共
用するプログラム専用のプログラムメモリt−持たせる
ことで軽減している。すなわち、通常のコンビエータで
はプログラムもデータも同じメモリに格納しているが本
発明に使用するプロセッサではプログラムは1台のプロ
セッサエレメントに共用される専用のプログラムメモリ
に格納されているのでメモリスイッチインターフェース
を介してのメモリへのアクセスはデータに対するものに
限られ、通常のコンピュータに比しアンセス頻度は最大
H位に低減される。
用するプログラム専用のプログラムメモリt−持たせる
ことで軽減している。すなわち、通常のコンビエータで
はプログラムもデータも同じメモリに格納しているが本
発明に使用するプロセッサではプログラムは1台のプロ
セッサエレメントに共用される専用のプログラムメモリ
に格納されているのでメモリスイッチインターフェース
を介してのメモリへのアクセスはデータに対するものに
限られ、通常のコンピュータに比しアンセス頻度は最大
H位に低減される。
第2に、メモリスイッチインターフェースに接続された
データ用キャッシュメモリによりデータメモリへのアク
セス頻度をさらに軽減している。
データ用キャッシュメモリによりデータメモリへのアク
セス頻度をさらに軽減している。
すなわちデータ用キャッシュ・イモリにr/′i1台の
プロセッサエレメントで共通に利用できるデータ(たと
えば定数など)や計算の途中結果などがならずしもデー
タメモリに格納しておかなくてもよいデータを格納して
、データメモリへアクセスする回数をへらす〇 このため、メモリスイッチインターフェースはプロセッ
サエレメントからデータメモリへのアクセス要求があっ
た場合そのデータがすでにデータ用キャッシュメモリに
格納されていないかを調べそこに格納されていればそこ
から読み出し、ないときのみデータ用メモリへ要求を出
す。
プロセッサエレメントで共通に利用できるデータ(たと
えば定数など)や計算の途中結果などがならずしもデー
タメモリに格納しておかなくてもよいデータを格納して
、データメモリへアクセスする回数をへらす〇 このため、メモリスイッチインターフェースはプロセッ
サエレメントからデータメモリへのアクセス要求があっ
た場合そのデータがすでにデータ用キャッシュメモリに
格納されていないかを調べそこに格納されていればそこ
から読み出し、ないときのみデータ用メモリへ要求を出
す。
次に、本発明の実施例について、図面を参照して詳細に
説明する。
説明する。
第3図は本発明の一実施例を示すシステム構成図、第4
図は第3図に示すプロセッサの詳細ブロック図である。
図は第3図に示すプロセッサの詳細ブロック図である。
フロセラ?)’Pl’〜)’)’16’は内部に8台の
プロセッサエレメントPE1〜PE8を含む並列処理方
式のプロセッサで各々8個のプログラムを並タリに実行
する能力を有しているがプロセッサの台数やその中のプ
ロセッサエレメントの台数はこの例に限定されるもので
はない。
プロセッサエレメントPE1〜PE8を含む並列処理方
式のプロセッサで各々8個のプログラムを並タリに実行
する能力を有しているがプロセッサの台数やその中のプ
ロセッサエレメントの台数はこの例に限定されるもので
はない。
各プロセッサPP l/へ)’)’15/はメモリスイ
ッチM8t−介して任意のデータ メモリDN l 、
DhA 32に対してデータの続出、書込ができる。デ
ータメモリの台数は第3図でti32台としているが、
これはプロセッサの台数やデータメモリの性能、データ
メモリの使用S度によって定められこの例に限定される
ものではない。
ッチM8t−介して任意のデータ メモリDN l 、
DhA 32に対してデータの続出、書込ができる。デ
ータメモリの台数は第3図でti32台としているが、
これはプロセッサの台数やデータメモリの性能、データ
メモリの使用S度によって定められこの例に限定される
ものではない。
また、メモリスイッチN8の構成については完全なりロ
スバ一方式をはじめとして多数の構成法があるがそのい
ずれかに限定されるものではない。
スバ一方式をはじめとして多数の構成法があるがそのい
ずれかに限定されるものではない。
ここでは−例として完全クロスバ一方式を仮定しており
複数のプロセッサから同時にデータメモリへのアクセス
要求が発生しても同一のデータメモリへアクセスしでい
かぎシ競合は起らないとしている。他の構成のメモリス
イッチMSを用いたとしても本発明の効果には関係しな
い。
複数のプロセッサから同時にデータメモリへのアクセス
要求が発生しても同一のデータメモリへアクセスしでい
かぎシ競合は起らないとしている。他の構成のメモリス
イッチMSを用いたとしても本発明の効果には関係しな
い。
制御プロセッサCPは制御専用メモリC)’Nl。
Ck’M2を有しさらにメモリスイッチMSを介してデ
ータメモリDNl〜DIIJ32へもアクセスできる。
ータメモリDNl〜DIIJ32へもアクセスできる。
制御専用メモリの台数も本例では2・台とじ7いるがこ
れに限定される訳ではない。制御プロセッサC)’#′
iインタフェース2を介して各プロセッサ)’)’1’
〜)’)’16’のそれぞれの制御プロセッサインター
7エーxc)’l’を介して各プロセッサと通信するこ
とができる。
れに限定される訳ではない。制御プロセッサC)’#′
iインタフェース2を介して各プロセッサ)’)’1’
〜)’)’16’のそれぞれの制御プロセッサインター
7エーxc)’l’を介して各プロセッサと通信するこ
とができる。
第4FIAFi第3図に示すプロセッサの一例を示すブ
ロック図である。
ロック図である。
プロセッサニレメン) PEI−J’E8は各々プログ
ラムを実行する能力を有するプロセッサエレメントでそ
のプログラムはプロセッサニレメン) )’El〜)’
E8に共通に接続され九専用のプログラムメモリPMに
格納されている。プログラムメモリコントローラPMC
dプログラムメモリPMのアクセスを制御するもので、
プロセッサエレメントPE1〜PE8からのアクセスの
交通會理などの制御を行なう。
ラムを実行する能力を有するプロセッサエレメントでそ
のプログラムはプロセッサニレメン) )’El〜)’
E8に共通に接続され九専用のプログラムメモリPMに
格納されている。プログラムメモリコントローラPMC
dプログラムメモリPMのアクセスを制御するもので、
プロセッサエレメントPE1〜PE8からのアクセスの
交通會理などの制御を行なう。
メモリスイッチインターフェースN81’ハ各ニア’ロ
セツサエレメント)’El〜PE8が第3図に示すデー
タメモリDMI〜L)N32にアクセスするための制御
回路で複数のプロセッサエレメントPE1〜PE8から
同時にアクセス要求があったときにはそれらの中から1
つを一定のアルゴリズムに従って選択し、選択されたア
クセス要求をメモリスイッチM8工1 を経てデータメモIJDM1〜l)N32のいずれか送
出する。読出動作であれば送ったアドレスに従って該当
するデータメモリから送られてくるデータを要求元のプ
ロセッサエレメントに引き渡す制御も行う。
セツサエレメント)’El〜PE8が第3図に示すデー
タメモリDMI〜L)N32にアクセスするための制御
回路で複数のプロセッサエレメントPE1〜PE8から
同時にアクセス要求があったときにはそれらの中から1
つを一定のアルゴリズムに従って選択し、選択されたア
クセス要求をメモリスイッチM8工1 を経てデータメモIJDM1〜l)N32のいずれか送
出する。読出動作であれば送ったアドレスに従って該当
するデータメモリから送られてくるデータを要求元のプ
ロセッサエレメントに引き渡す制御も行う。
データ用キャッシェメモリDCの動作は一般のコンビエ
ータ用キャッシュメモリと閤様である。
ータ用キャッシュメモリと閤様である。
すなわち、プロセッサエレメy))’E1〜)’E8が
らデータメモリDN1〜DN32へのアクセス要求があ
るとメモリスイッチインターフェースNSI’はデータ
用キャッジ為メモリDCの内容を調べて求めるデータが
すてにそこに格納されているときはそこから読み出して
プロセッサエレメントPEl〜PE8 へ渡たす。ない
場合にはデータメモリL1vl〜DN 32ヘアクセス
要求を出し、データメモリDN1〜DN32から送られ
てきたデータを要求元のプロセッサニレメン))’El
〜PEsへ引渡すと共にメモリスイッチインターフェー
スM81’にモ格納しておき、同じデータが再び要求さ
れたときに備える(この要求は他のプロセッサエレメン
トからでもよい)。
らデータメモリDN1〜DN32へのアクセス要求があ
るとメモリスイッチインターフェースNSI’はデータ
用キャッジ為メモリDCの内容を調べて求めるデータが
すてにそこに格納されているときはそこから読み出して
プロセッサエレメントPEl〜PE8 へ渡たす。ない
場合にはデータメモリL1vl〜DN 32ヘアクセス
要求を出し、データメモリDN1〜DN32から送られ
てきたデータを要求元のプロセッサニレメン))’El
〜PEsへ引渡すと共にメモリスイッチインターフェー
スM81’にモ格納しておき、同じデータが再び要求さ
れたときに備える(この要求は他のプロセッサエレメン
トからでもよい)。
また、データメモνDM1〜DN32への誉込みに際し
て紘同じデータをデータ用キャッシェメモリDCにも格
納しておき後で再びこれを読み出すときに備える。キャ
ッシユからの追出しアルゴリズムなども汎用コンビエー
タのキャッシユにおける一般的手法が適用できるが、本
コンビエータ・シスfムが専用機的であることからプロ
セッサニレメン)PEI〜PE8のプログラムによりそ
れを制御させるようにしてもよいであろう。すなわち、
キャッジ龜に格納しておきたい データと格納する必要
のないデータをプログラムに指定させることや、キャッ
シュではなくアドレス指定可能なメモリとしてしまう方
法(この時はプロセッサエレメント)’B1.)’IJ
からはデータメモリDNx〜DN32と別のメモリとし
て見え、そこへ伺を格納するかはすべてプロセッサエレ
メントのプログラムで指定されることになる)などが考
えられる。
て紘同じデータをデータ用キャッシェメモリDCにも格
納しておき後で再びこれを読み出すときに備える。キャ
ッシユからの追出しアルゴリズムなども汎用コンビエー
タのキャッシユにおける一般的手法が適用できるが、本
コンビエータ・シスfムが専用機的であることからプロ
セッサニレメン)PEI〜PE8のプログラムによりそ
れを制御させるようにしてもよいであろう。すなわち、
キャッジ龜に格納しておきたい データと格納する必要
のないデータをプログラムに指定させることや、キャッ
シュではなくアドレス指定可能なメモリとしてしまう方
法(この時はプロセッサエレメント)’B1.)’IJ
からはデータメモリDNx〜DN32と別のメモリとし
て見え、そこへ伺を格納するかはすべてプロセッサエレ
メントのプログラムで指定されることになる)などが考
えられる。
制卸プロセッサインターフェースC)’l’−i制御プ
ロセッブロPと通信するための回路で各プロセッサエレ
メントPEt〜l’E3と制御プロセッサCP間の通信
およびそのプロセッサ)’P1’〜P)’16’自身と
制御プロセッサCP間の通信を制御する(本方式ではン
7トウェアから見えるのは各プロセッサエレメント)’
El〜PE8でありプロセッサ)’)’l’〜P)’1
6’は物理的ながたtカ(装置単位)としてしか意味が
ないので、制御プロセッサCPとの通信も論理的にはプ
ロセッサエレメントと制御ブロセ、すCP間が主であ嶋
。
ロセッブロPと通信するための回路で各プロセッサエレ
メントPEt〜l’E3と制御プロセッサCP間の通信
およびそのプロセッサ)’P1’〜P)’16’自身と
制御プロセッサCP間の通信を制御する(本方式ではン
7トウェアから見えるのは各プロセッサエレメント)’
El〜PE8でありプロセッサ)’)’l’〜P)’1
6’は物理的ながたtカ(装置単位)としてしか意味が
ないので、制御プロセッサCPとの通信も論理的にはプ
ロセッサエレメントと制御ブロセ、すCP間が主であ嶋
。
この通信の例としては各プロセッサエレメントPE1〜
PE8にプログラム実行の開始を指示するプログラム実
行開始指示5TARTや、プログラム実行停止指示5T
(J)’などがある。プロセッサニレメン))’El〜
PE8はプログラム実行開始指示8 TAR,Tを受け
てプログラムの実行t−開始し、所定の条件を満した時
あるいはプログラム実行停止指示510Pを受けたとき
に動作を中止する。また、IIJ#プロセブロインター
フェースCP l’はプロセッサエレメント)’El、
)’E13から制御プロセッサCPへインターフェース
at−介して情報を伝えるための制御も行い、たとえば
プログラム実行開始指示S’FARTを受けて実行開始
彼、特定のプロセッサエレメントPE1−PE8が実行
を終了したなどある条件を満したらそれを制御プロセッ
サCPに伝えるものも制御プロセッサインターフェース
e)’l’である。
PE8にプログラム実行の開始を指示するプログラム実
行開始指示5TARTや、プログラム実行停止指示5T
(J)’などがある。プロセッサニレメン))’El〜
PE8はプログラム実行開始指示8 TAR,Tを受け
てプログラムの実行t−開始し、所定の条件を満した時
あるいはプログラム実行停止指示510Pを受けたとき
に動作を中止する。また、IIJ#プロセブロインター
フェースCP l’はプロセッサエレメント)’El、
)’E13から制御プロセッサCPへインターフェース
at−介して情報を伝えるための制御も行い、たとえば
プログラム実行開始指示S’FARTを受けて実行開始
彼、特定のプロセッサエレメントPE1−PE8が実行
を終了したなどある条件を満したらそれを制御プロセッ
サCPに伝えるものも制御プロセッサインターフェース
e)’l’である。
各プロセッサニレメン))’El〜)’E13の構成は
−出す点が異なる。一般のコンビエータでは命令語とデ
ータは同一のメモリに格納されるが本発明を用いた並列
処理システムではデータメモリDMI〜DM32へのア
クセス バスの負荷を組滅するため命令語はプログラム
メモI)PMpミ噛4に格納している。これはデータに
ついては各プロセッサエレメント)’El−PH8の相
互間で受渡しする必要があるとともに各プロセッサPP
l′〜)’P16’の相互間でも受渡しの必要があるの
で共通のデータメモリに格納せざるを得ないけれど、プ
ログラムはその必要性がなく、各プロセッサエレメント
PEx−JEg4に共有されるが、各プロセッサ)’)
’l/〜)’)’15/ごとに設けられている専用のメ
モリ中に格納しておけるという性質を利用している。
−出す点が異なる。一般のコンビエータでは命令語とデ
ータは同一のメモリに格納されるが本発明を用いた並列
処理システムではデータメモリDMI〜DM32へのア
クセス バスの負荷を組滅するため命令語はプログラム
メモI)PMpミ噛4に格納している。これはデータに
ついては各プロセッサエレメント)’El−PH8の相
互間で受渡しする必要があるとともに各プロセッサPP
l′〜)’P16’の相互間でも受渡しの必要があるの
で共通のデータメモリに格納せざるを得ないけれど、プ
ログラムはその必要性がなく、各プロセッサエレメント
PEx−JEg4に共有されるが、各プロセッサ)’)
’l/〜)’)’15/ごとに設けられている専用のメ
モリ中に格納しておけるという性質を利用している。
各プロセッサエレメント)’El〜PE8はプログラム
メモ+)PMに格納されたプログラムに従りてデータ用
キャッジ集メモリDCあるいはデータメモリDNU1〜
DM32からデータを読み出して処理し、結果をデータ
メモリDM1〜DM32ならびにデータ用キャツシエメ
モリDCへ戻すという動作を繰り返すことになる。
メモ+)PMに格納されたプログラムに従りてデータ用
キャッジ集メモリDCあるいはデータメモリDNU1〜
DM32からデータを読み出して処理し、結果をデータ
メモリDM1〜DM32ならびにデータ用キャツシエメ
モリDCへ戻すという動作を繰り返すことになる。
第3図に示す並列処理システムにおいて、プログラムを
実行する時の動作は次のようになる。
実行する時の動作は次のようになる。
をとりあげる。
演算開始前にデータAi、Biを制御プロセッサCPが
データメモIJDMI〜1)N32に入れるOたとえば
、データA、〜A、はデータメモ+7DM1に、データ
A9〜A1・はデータメモリDM2に格絡し、以下同様
にしてデータA 11 @ ’= A H鵞畠 はデ
ータメモリDM16に格納する。同様に、データ81〜
B6はデータメモリDM17に、データB、〜BI6は
データメモリDM18に、データBS!+1〜B11@
はデータメモリDM32に格納する。
データメモIJDMI〜1)N32に入れるOたとえば
、データA、〜A、はデータメモ+7DM1に、データ
A9〜A1・はデータメモリDM2に格絡し、以下同様
にしてデータA 11 @ ’= A H鵞畠 はデ
ータメモリDM16に格納する。同様に、データ81〜
B6はデータメモリDM17に、データB、〜BI6は
データメモリDM18に、データBS!+1〜B11@
はデータメモリDM32に格納する。
128台のプロセッサエレメントがあシ、1番目のプロ
セッサニレメン))’EfはAixHiの計算をして演
算結果Ci ′t−データメモリに格納する。この計算
をやるためのプログラムは各プロセッサエレメントPE
1〜PEsに共通なプログラムPMの中に格納されてお
り、各プロセッサエレメントPE1〜PE8の中の命令
アドレス レジスタにはそのプロセッサニレメン))’
El〜PEsが実行すべき最初の命令語のプログラムメ
モリPMのアドレスが設定される二これは制御プロセッ
サCPの制御下でデータメモリDNI〜DJ2からメモ
リスイッチMSおよびメモリスイッチインターフェース
MSl’−f通して行なわれるか、あるいはインターフ
ェースaおよび制御プロセッサインターフェースCP1
′を通して行なわれる。
セッサニレメン))’EfはAixHiの計算をして演
算結果Ci ′t−データメモリに格納する。この計算
をやるためのプログラムは各プロセッサエレメントPE
1〜PEsに共通なプログラムPMの中に格納されてお
り、各プロセッサエレメントPE1〜PE8の中の命令
アドレス レジスタにはそのプロセッサニレメン))’
El〜PEsが実行すべき最初の命令語のプログラムメ
モリPMのアドレスが設定される二これは制御プロセッ
サCPの制御下でデータメモリDNI〜DJ2からメモ
リスイッチMSおよびメモリスイッチインターフェース
MSl’−f通して行なわれるか、あるいはインターフ
ェースaおよび制御プロセッサインターフェースCP1
′を通して行なわれる。
以上の準備は制御プロセッサCPが行い、完了するとイ
ンターフニースミf通して128台のすべてのプロセッ
サエレメント宛のプログラム実行開始指示5TARTを
プロセッサPPl/〜)’)’16”に送出する。これ
によって、すべてのプロセッサエレメ7)PEI〜PE
sは各々の命令アドレスレジスタの値に従ってプログラ
ムメモリPMから命令語t−読み出し、解読して実行す
る。
ンターフニースミf通して128台のすべてのプロセッ
サエレメント宛のプログラム実行開始指示5TARTを
プロセッサPPl/〜)’)’16”に送出する。これ
によって、すべてのプロセッサエレメ7)PEI〜PE
sは各々の命令アドレスレジスタの値に従ってプログラ
ムメモリPMから命令語t−読み出し、解読して実行す
る。
いま、プロセッサ)’)’ l’中のプロセッサエレメ
ントPElを例にとれは、データメモリDNxから読み
出したデータ人、とデータメモリDMx7から読み出し
たデータB1に対しA、xB、のittλ倉して演算結
果Crt−データメモリに格納する。
ントPElを例にとれは、データメモリDNxから読み
出したデータ人、とデータメモリDMx7から読み出し
たデータB1に対しA、xB、のittλ倉して演算結
果Crt−データメモリに格納する。
Meに、プロセッサエレメントP E 2 ilA、x
Hlの計算をして、演算結果C2を格納し、以下四様に
、プロセッサエレメント)’E8はAIXH,→Csの
処理をする。これらの処理は各プロセッサニレメントム
を実行するとしているがそれは異なるプログラムであっ
てもよいしたとえ一一プログラムであっても条件分岐が
入る場合にL各プロセッサエレメントに途中から異なる
命令シーケンスを実行することKなる可能性がある。
Hlの計算をして、演算結果C2を格納し、以下四様に
、プロセッサエレメント)’E8はAIXH,→Csの
処理をする。これらの処理は各プロセッサニレメントム
を実行するとしているがそれは異なるプログラムであっ
てもよいしたとえ一一プログラムであっても条件分岐が
入る場合にL各プロセッサエレメントに途中から異なる
命令シーケンスを実行することKなる可能性がある。
ここで、プログラムメモリPMに格納されているプログ
ラムについてすこし説明する。
ラムについてすこし説明する。
プログラムメモリPMに記憶されたプログラムが各プ四
セッサエレメントPE1〜PE8毎に異なるものである
場合Fi特に問題はないが唯一りのプログ2ムをすべて
のプロセッサニレメン))’El〜PERが共用する場
合にはそれを可能にする丸めに特別の工夫が必袂である
。加算0乗算といった演算処理の動作やその順序は各プ
ロセッサニレメン))’El、)’IIJに共通であっ
ても使用するデータメモリDNx−DN32に記憶され
ているデータはプロセッサニレメン))’El−)’E
8毎に異なるからである。このためにはたとえばインデ
ックス レジスタなどを用いてプログラム中の命令語の
オペランド アドレスを修正して使用するなどが考えら
れる。たとえば[A番地のデータをアキュムレータに加
算せよ」という命令時の場合、各プロセッサニレメン)
)’El〜PE8は自分のインデックレジメタ中にプロ
セッサエレメント番号「目を記憶し、上記命令[fを実
行するときには該インデックスレジスタで番地Aを修飾
し[A−NJ番地のデータをアキエムレータに加算する
ればよい。これによシ各プロセッサエレメントPE1〜
PE8はすべて同じ加算動作をするが用いるデータは互
いに異なるようにできる。
セッサエレメントPE1〜PE8毎に異なるものである
場合Fi特に問題はないが唯一りのプログ2ムをすべて
のプロセッサニレメン))’El〜PERが共用する場
合にはそれを可能にする丸めに特別の工夫が必袂である
。加算0乗算といった演算処理の動作やその順序は各プ
ロセッサニレメン))’El、)’IIJに共通であっ
ても使用するデータメモリDNx−DN32に記憶され
ているデータはプロセッサニレメン))’El−)’E
8毎に異なるからである。このためにはたとえばインデ
ックス レジスタなどを用いてプログラム中の命令語の
オペランド アドレスを修正して使用するなどが考えら
れる。たとえば[A番地のデータをアキュムレータに加
算せよ」という命令時の場合、各プロセッサニレメン)
)’El〜PE8は自分のインデックレジメタ中にプロ
セッサエレメント番号「目を記憶し、上記命令[fを実
行するときには該インデックスレジスタで番地Aを修飾
し[A−NJ番地のデータをアキエムレータに加算する
ればよい。これによシ各プロセッサエレメントPE1〜
PE8はすべて同じ加算動作をするが用いるデータは互
いに異なるようにできる。
各プロセッサエレメントPE1〜PE8から各データメ
モリDNI〜DM32へのアクセス要求(Ai 、Bi
を読み出し九り、Ci t−格納するための景S)はメ
モリスイッチインターフェースM81’で交通整理され
、競合した場合は1つだけ選択されて他は待たされるの
で、各プロセッサニレメン))’El〜PE8 の命令
実行のタイξングはずれてくる可能性がある。同様に、
プログラムメモリPMへのアクセスについてもプロセッ
サニレメン))’El〜PE8 の相互間で競合が発生
するが、これはプログラムメモリPMの制御部であるプ
ログ2ムメモリコントローラPMCが交通整理する。し
たがって、たとえ同一のプログラムを実行していても、
すべてのプロセッサエレメントPEI、)’E8がまっ
たく同期して同時刻に同じ動作・処理をしている訳では
ない。
モリDNI〜DM32へのアクセス要求(Ai 、Bi
を読み出し九り、Ci t−格納するための景S)はメ
モリスイッチインターフェースM81’で交通整理され
、競合した場合は1つだけ選択されて他は待たされるの
で、各プロセッサニレメン))’El〜PE8 の命令
実行のタイξングはずれてくる可能性がある。同様に、
プログラムメモリPMへのアクセスについてもプロセッ
サニレメン))’El〜PE8 の相互間で競合が発生
するが、これはプログラムメモリPMの制御部であるプ
ログ2ムメモリコントローラPMCが交通整理する。し
たがって、たとえ同一のプログラムを実行していても、
すべてのプロセッサエレメントPEI、)’E8がまっ
たく同期して同時刻に同じ動作・処理をしている訳では
ない。
演算処理AixHi−*Ciの処理が完了すると制御プ
ロセッサインターフェースC)’1/およびインターフ
ェース麿を通って制御プロセッサCPにこの旨通知され
る。制御プロセッサCPは128台すC4はデータメモ
IJI)Ml〜DN32の中に格納されているからII
I御プロブロサCPはメモリスイッチM8を介してデー
タメモリDMI〜f)MB2にアクセスして演算結果C
i を読出順に加算する。この動作バ一般的コンビエー
タにおける加算と同じで制御プロセッサCP内のプログ
ラムによル、演算結果CI + C1+・・・C1□
を逐−読み出して加算する。
ロセッサインターフェースC)’1/およびインターフ
ェース麿を通って制御プロセッサCPにこの旨通知され
る。制御プロセッサCPは128台すC4はデータメモ
IJI)Ml〜DN32の中に格納されているからII
I御プロブロサCPはメモリスイッチM8を介してデー
タメモリDMI〜f)MB2にアクセスして演算結果C
i を読出順に加算する。この動作バ一般的コンビエー
タにおける加算と同じで制御プロセッサCP内のプログ
ラムによル、演算結果CI + C1+・・・C1□
を逐−読み出して加算する。
この加算が終了すれは求める答となる。
各プロセッサエレメントPEI、)’E8から制御プロ
セッサCPへの通知は上記のように各プロセッサエレメ
ントPE1〜PE8が終る毎に制御プロセッサCPに通
知してもよいが、プロセラ))’)’l’〜)’)’1
5/ の内でまとめて通知することで制御プロセッサC
Pとの間の通信量を減らすことも考えられよう。
セッサCPへの通知は上記のように各プロセッサエレメ
ントPE1〜PE8が終る毎に制御プロセッサCPに通
知してもよいが、プロセラ))’)’l’〜)’)’1
5/ の内でまとめて通知することで制御プロセッサC
Pとの間の通信量を減らすことも考えられよう。
サエレメントPE1〜PEsが途中まで行う方法も考え
られる。すなわち、たとえばC1+ C意+・・・+C
aはプロセッサ)’)’l’の中で次のようにすればよ
い。
られる。すなわち、たとえばC1+ C意+・・・+C
aはプロセッサ)’)’l’の中で次のようにすればよ
い。
(C++C*) 、(CI+C4) 、CCs十C@)
、(Cy +CI)の4つの計算を4つのプロセッサ
エレメント)’El、)’E8を使って並列に行い、そ
0結米をそれぞれDI 、Dl e Da + D4と
すると次に(IJI+Dり。
、(Cy +CI)の4つの計算を4つのプロセッサ
エレメント)’El、)’E8を使って並列に行い、そ
0結米をそれぞれDI 、Dl e Da + D4と
すると次に(IJI+Dり。
(Da +D4 )を並列に行い、その結果を各々E1
. E。
. E。
とすると1&後にE、+E、 t−計算する。これを各
プロセッサ)’)’1’〜)’)’15/内でやれは制
御プロセッサC)’#−116台のプロセッサ)’)’
1’〜)’)’16’の残した16個の演算結果の総
和を計算するだけでよい(前の例では制御プロセラ?C
)’Fi127(gIの加算をやることになるがこの方
法なら15回の加算ですむ)。
プロセッサ)’)’1’〜)’)’15/内でやれは制
御プロセッサC)’#−116台のプロセッサ)’)’
1’〜)’)’16’の残した16個の演算結果の総
和を計算するだけでよい(前の例では制御プロセラ?C
)’Fi127(gIの加算をやることになるがこの方
法なら15回の加算ですむ)。
この計算過程で演算結果CM−,−C,はデータメモI
JDNl−DM3’2から読み出してくる必要があるが
データD、〜D4. E、 、 E、はいずれもデータ
用キャッシェメモリDCに格納しておけばよくデータメ
モljDMl〜DN32へ格納してまたそこから読み出
してくる必要はない(但し本実施例ではデータメモリD
Nl〜DN32データ用キャッシュメモリDCの両方に
格納し、キャツシ二からQtMみ出してくることになる
)O El+E、の結果はかならずデータメモリDNi〜DM
32に残さないと制御プロセッサCPが次の計算(16
台のプロセッサ)’)’1’〜P)’16’の演算結果
を合計する)を実行できない。
JDNl−DM3’2から読み出してくる必要があるが
データD、〜D4. E、 、 E、はいずれもデータ
用キャッシェメモリDCに格納しておけばよくデータメ
モljDMl〜DN32へ格納してまたそこから読み出
してくる必要はない(但し本実施例ではデータメモリD
Nl〜DN32データ用キャッシュメモリDCの両方に
格納し、キャツシ二からQtMみ出してくることになる
)O El+E、の結果はかならずデータメモリDNi〜DM
32に残さないと制御プロセッサCPが次の計算(16
台のプロセッサ)’)’1’〜P)’16’の演算結果
を合計する)を実行できない。
どこまでの計算をプロセッサがやシ、どこから制御プロ
セッサCPがやるかの制御はこのシステムを使用する人
のプログラムに・よってすべて行なわれるので制御プロ
セッサCPの性能ならびにプロセッサの台数と性能に応
じてクースノ(イケースで判断されることになろう。
セッサCPがやるかの制御はこのシステムを使用する人
のプログラムに・よってすべて行なわれるので制御プロ
セッサCPの性能ならびにプロセッサの台数と性能に応
じてクースノ(イケースで判断されることになろう。
このように、第3図に示す実施例では8台のプロセッサ
エレメントPE1〜)’E8’eそれぞれ含んだ16台
のプロセッサ)’)’l’〜)’)’16’で128の
並列演算ができるが実際に128台の独立し九プロセッ
サをおいたとするとメモリスイッチMSの規模は128
X32になるのに比し本例では16X32で済み装置実
現上有利になる(コスト、装置の大きさ、性能などの面
で)。
エレメントPE1〜)’E8’eそれぞれ含んだ16台
のプロセッサ)’)’l’〜)’)’16’で128の
並列演算ができるが実際に128台の独立し九プロセッ
サをおいたとするとメモリスイッチMSの規模は128
X32になるのに比し本例では16X32で済み装置実
現上有利になる(コスト、装置の大きさ、性能などの面
で)。
本発明の並列処理方式は、制御プロセッサに並列接続さ
れ複数のデータメモリとメモリスイア・チを介して相互
に並行して接続されるプロセッサのそれぞれが、単一の
プロセッサエレメントからなる代りに、並列に動作する
複数のプロセッサエレメントを並列に設けることによフ
、メモリスイッチ側から見た場合には単一のプロセッサ
エレメントしか有していないように見えながら時分割で
複数のプロセッサエレメントをメモリスイッチに接続す
ることができる九め、並列度を増大できるという効果が
ある。
れ複数のデータメモリとメモリスイア・チを介して相互
に並行して接続されるプロセッサのそれぞれが、単一の
プロセッサエレメントからなる代りに、並列に動作する
複数のプロセッサエレメントを並列に設けることによフ
、メモリスイッチ側から見た場合には単一のプロセッサ
エレメントしか有していないように見えながら時分割で
複数のプロセッサエレメントをメモリスイッチに接続す
ることができる九め、並列度を増大できるという効果が
ある。
すなわち、本発明の並列処理方式は、複数のプロセッサ
を内蔵するプロセッサを並列におき、制御プロセッサの
制御下に並列動作されるように構成することで大きな並
列度の並列演算を実現容易にし、かつ並列演算できない
部分は制御プロセッサで処理することで融通性が増し応
用分野が拡大するという効果を有する。
を内蔵するプロセッサを並列におき、制御プロセッサの
制御下に並列動作されるように構成することで大きな並
列度の並列演算を実現容易にし、かつ並列演算できない
部分は制御プロセッサで処理することで融通性が増し応
用分野が拡大するという効果を有する。
【図面の簡単な説明】
第1図は従来の一例を示すシステム構成図、第2図は第
1図に示すプロセッサの詳細ブロック図、第3図は本発
明の一実施例を示すシステム構成図、第4図は第3図に
示すプロセッサの詳細ブロック図である。 CP・・・・・・制御プロセッサ、PPl〜)’)’1
6 、 )’)’1’〜P)’16’・・・・・・プロ
セッサ、C)’Ml、CI’N2・・・・・・制御専用
メモリ、N8・・印・メモリスイッチ、MM1〜NN3
2・・・・・・メモリ、 MB2.Nf91’ ・・・
・・・メモリスイッチインターフェース、CPl、CP
1′・・・・・・制御I/’ロセッサインターフェース
、PE、PE1〜PE8 ・・・°°°プロセッサエレ
メント、DMl〜DM32・・・・・・データメモリ、
DC・・・・・・データ用キャッシェメモリ、PM・・
・・・・プログラムメモリ、k’Mc・・団・プログラ
ムメモリコントローラ、 a・・・・・・インターフェース。 \−/ 第 7図 CP 第?聞
1図に示すプロセッサの詳細ブロック図、第3図は本発
明の一実施例を示すシステム構成図、第4図は第3図に
示すプロセッサの詳細ブロック図である。 CP・・・・・・制御プロセッサ、PPl〜)’)’1
6 、 )’)’1’〜P)’16’・・・・・・プロ
セッサ、C)’Ml、CI’N2・・・・・・制御専用
メモリ、N8・・印・メモリスイッチ、MM1〜NN3
2・・・・・・メモリ、 MB2.Nf91’ ・・・
・・・メモリスイッチインターフェース、CPl、CP
1′・・・・・・制御I/’ロセッサインターフェース
、PE、PE1〜PE8 ・・・°°°プロセッサエレ
メント、DMl〜DM32・・・・・・データメモリ、
DC・・・・・・データ用キャッシェメモリ、PM・・
・・・・プログラムメモリ、k’Mc・・団・プログラ
ムメモリコントローラ、 a・・・・・・インターフェース。 \−/ 第 7図 CP 第?聞
Claims (1)
- 【特許請求の範囲】 制御プロセッサと、それぞれがデータを記憶する複数の
データメモリと、前記制御プロセッサに並列に接続され
た複数のプロセッサと、前記複数のプロセッサと前記複
数のデータメ七りとを並行。 して相互に接続するためのメモリ スイッチとを含み、
前記複数のプロセッサのそれぞれは、並列に設けられた
複数のプロセッサエレメントと、各プロセッサエレメン
トに共通に設けられプログラムを記憶するプログラムメ
モリと、前記a数のプロセッサエレメントを前記制御プ
ロセッサと接続するための制御プロセッサインターフェ
ースと、前記複数のプロセッサエレメントを前記メモリ
スイッチと接続するためのメモリスイッチインターフェ
ースと、前記メモリスイッチインターフェースに接続さ
れ前記データメモリに記憶したデータの一部の写しを記
憶するデータ用キャッジ1′メモリとを含むことを特徴
とする並列処理方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4220882A JPS58159171A (ja) | 1982-03-17 | 1982-03-17 | 並列処理方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4220882A JPS58159171A (ja) | 1982-03-17 | 1982-03-17 | 並列処理方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS58159171A true JPS58159171A (ja) | 1983-09-21 |
| JPS6259347B2 JPS6259347B2 (ja) | 1987-12-10 |
Family
ID=12629595
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP4220882A Granted JPS58159171A (ja) | 1982-03-17 | 1982-03-17 | 並列処理方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS58159171A (ja) |
-
1982
- 1982-03-17 JP JP4220882A patent/JPS58159171A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS6259347B2 (ja) | 1987-12-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5535406A (en) | Virtual processor module including a reconfigurable programmable matrix | |
| JP2770603B2 (ja) | 並列計算機 | |
| CN112799726B (zh) | 数据处理装置、方法及相关产品 | |
| JPH0425586B2 (ja) | ||
| JP6802480B2 (ja) | プロセッサ、情報処理装置及びプロセッサの動作方法 | |
| JPS58159171A (ja) | 並列処理方式 | |
| JPH07271744A (ja) | 並列計算機 | |
| CN117590783A (zh) | 一种基于共享存储介质的多核心控制切换系统及方法 | |
| JP7487334B2 (ja) | 処理ノード動作の制御 | |
| US11500632B2 (en) | Processor device for executing SIMD instructions | |
| JPS6022779B2 (ja) | 多重処理系のプログラム・ロ−デイング方法 | |
| JPS6259345B2 (ja) | ||
| JPS6246026B2 (ja) | ||
| JPH01177672A (ja) | ディジタル信号処理装置 | |
| Gannon et al. | Parallel architectures for iterative methods on adaptive, block structured grids | |
| EP3953815B1 (en) | Computing device and computing system based on said device | |
| JPH0358163A (ja) | 疎結合型マルチプロセッサシステム | |
| JPS6259346B2 (ja) | ||
| JPH01263858A (ja) | マルチプロセッサシステム | |
| Wong et al. | A microprocessor-based office image processing system | |
| JPH0215152Y2 (ja) | ||
| CN119513025A (zh) | 基于risc-v指令集的高性能ai多核处理器架构 | |
| Ghosal et al. | SHAMP: an experimental shared memory multimicroprocessor system for performance evaluation of parallel algorithms | |
| JPH06324999A (ja) | マルチプロセッサシステム | |
| Masko | Scheduling task graphs for execution in dynamic SMP clusters with bounded number of resources |