JPH09128351A - 並列計算機における並列プロセススケジューリング方法および並列計算機用処理装置 - Google Patents
並列計算機における並列プロセススケジューリング方法および並列計算機用処理装置Info
- Publication number
- JPH09128351A JPH09128351A JP7281021A JP28102195A JPH09128351A JP H09128351 A JPH09128351 A JP H09128351A JP 7281021 A JP7281021 A JP 7281021A JP 28102195 A JP28102195 A JP 28102195A JP H09128351 A JPH09128351 A JP H09128351A
- Authority
- JP
- Japan
- Prior art keywords
- parallel
- value
- processing device
- synchronization
- parallel process
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/40—Transformation of program code
- G06F8/41—Compilation
- G06F8/45—Exploiting coarse grain parallelism in compilation, i.e. parallelism between groups of instructions
- G06F8/451—Code distribution
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multi Processors (AREA)
Abstract
される並列計算機において、1つのジョブを2以上のP
Eによりステップ毎に同期させながら並列プロセスとし
て実行する際に、システムのスループット性能を低下さ
せない協調スケジューリングを実現する。 【解決手段】 実行中の並列プロセスが並列同期待ち状
態になると、不活性化機能4により当該並列プロセスを
不活性化してこの並列プロセスの割付を禁止し、割付機
能6により、実行可能な他のジョブのプロセスの割付を
行なう。この他のジョブの実行中に条件設定機能5によ
り設定された条件が満たされると、割込み生成機能7に
より、現在実行中の処理に対する割込み信号を生成し、
活性化機能8により、並列同期待ち状態であった並列プ
ロセスを活性化して、この並列プロセスの割付を再開す
るように構成する。
Description
4,図5) (c)第2実施形態の並列計算機用処理装置の説明(図
6,図7) (d)第3実施形態の並列計算機用処理装置の説明(図
8) 発明の効果
〔以下、PE(Processor Element)という〕を相互に通
信可能に接続して構成される並列計算機において、ある
1つのジョブを2以上の処理装置によりステップ毎に同
期させながら並列プロセスとして実行する際に適用され
る並列プロセススケジューリング方法、および、この方
法を適用される処理装置に関し、特に、複数業務を複数
PEにより並列的に行なう分散主記憶MIMD(Multip
le Instruction stream Multiple Data stream)型並列
計算機システムに用いて好適の技術に関する。
うに膨大なデータを高速に処理する必要性から、コンピ
ュータシステムの高速化や大容量化が要求されるてい
る。これに伴って、複数のPEをそなえて相互に通信を
行ないながら並列的に処理を行なう並列処理技術が研究
・開発されている。
図9に示すように、n台のPE(PE番号として#0〜
#n−1が付与されているものとする)101が、通信
網としてのPE間結合網100を介して相互に通信可能
に接続されている。各PE101には、図10に示すよ
うに、転送処理部102,命令処理部(CPU)103
および主記憶104がそなえられている。
4上のデータの送受信処理を行なうものであり、命令処
理部103は、PE101相互間の通信に際してプログ
ラム処理を行なうものである。なお、上述のように転送
処理部102と命令処理部103とを独立に設けること
により、命令処理部103の負荷とオーバヘッドとを削
減できるようになっている。また、転送処理部102
は、送信処理と受信処理とを同時並列的に行なえるよう
に構成され、これにより、データ転送速度とデータ転送
効率との向上をはかっている。
機システムにおいては、通常、1つのジョブは、複数の
異なるPE101により並列的に処理されるプロセス
(以下、並列プロセスという)として実行されている。
このように実行されるジョブを並列ジョブと呼ぶ。さら
に、近年、複数の並列ジョブの多重実行機能や、並列ジ
ョブと非並列ジョブとの多重実行機能が要求されてい
る。
並列ジョブと非並列ジョブと)が多重実行されている時
には、各PE101上でプロセスをスケジュールし、プ
ロセススイッチ(プロセスの切替)を行なう必要があ
る。このとき、複数のPE101の相互間で協調するこ
となく並列プロセスをスケジュールすると、並列プロセ
スのミクロな実行時間差のために並列プロセスの同期待
ち時間が大きくなるという課題がある。この同期待ち時
間の増大を避けるためには、並列プロセスのスケジュー
リングでは、複数のPE101の相互間で協調し合った
スケジューリング、即ち、PE間協調スケジューリング
を行なう必要がある。
みを実行している場合の一般的な並列プロセススケジュ
ーリングの例を示すもので、この図11に示す例では、
1つのジョブが、5台のPE101上で、それぞれプロ
セス番号0〜4を付された5つのプロセスとして並列的
に実行されており、各プロセスは、同期点1,2で示す
ように、ステップ毎に同期しながら実行されている。
調スケジューリングとしてギャングスケジューリングと
呼ばれる同期スケジューリングを行なった場合の例を示
すもので、この図12に示す例でも、図11に示した例
と同様、5台のPE101上で、それぞれプロセス番号
0〜4を付された5つのプロセスとして並列的に実行さ
れており、各プロセスは、同期点1,2で示すように、
ステップ毎に同期しながら実行されている。
ードキャストされたプロセス切替指令を受信したこと、
または、PE101の相互間で同期した時計が予定時刻
になったことを契機にして、全ての並列プロセスが同時
に割り付けられる。例えば図12に示す例では、タイム
スライス毎に、他の並列ジョブや非並列ジョブのプロセ
ス(図12では図示省略)がディスパッチ(割付)され
る。
ば、並列プロセスをプロセススイッチしたことに起因す
るプロセス間同期オーバヘッドの増大は起こらない。ま
た、図11に示すようにシステムで並列ジョブが1つだ
け動作している場合に比べ、単位時間当たりで並列ジョ
ブの実行時間割合倍の性能向上を期待できる。なお、図
11および図12中、tは1タイムスライスであり、
“○”は各プロセスが並列同期待ち状態になった時点
(つまり、今回のステップで割り付けられた処理を完了
した時点)を示し、“●”は各プロセスを実行する各P
E101で並列同期(バリア)を検出した時点(つま
り、当該並列プロセスを実行する全てのPE101が今
回のステップで割り付けられた処理を完了した時点)を
示している。
実行されている期間を示し、横方向の細線は、プロセス
が並列同期待ち状態であることを示している。この細線
で示すように、従来、各プロセスは、並列同期待ち状態
で実際には何ら処理を行なわない状態であっても、並列
同期を検出するまで、各タイムスライスに対してディス
パッチ(割付)されている。
および図12に示すいずれの並列プロセススケジューリ
ング手法でも、各プロセスは、並列同期待ち状態で実際
には何ら処理を行なわない状態であっても、並列同期を
検出するまで、各タイムスライスに対してディスパッチ
されている。
る場合でも、並列同期待ち状態の並列プロセスに対して
タイムスライスが与えられてしまい、各並列プロセスの
処理時間に差がある場合には、システム全体のスループ
ット性能を低下させるなどの課題があった。本発明は、
このような課題に鑑み創案されたもので、並列同期待ち
状態にある並列プロセスはディスパッチせず、代わりに
実行可能な他のジョブのプロセスをディスパッチできる
ようにして、システムのスループット性能を低下させな
い協調スケジューリングを実現した、並列計算機におけ
る並列プロセススケジューリング方法および並列計算機
用処理装置を提供することを目的とする。
ック図であり、この図1に示すように、本発明の並列プ
ロセススケジューリング方法を適用される並列計算機1
は、個別に処理を実行する複数の処理装置(以下、PE
という)2と、これらの複数のPE2を相互に通信可能
に接続する通信網3とをそなえて構成され、ある1つの
ジョブを、複数のPE2のうちの2以上のPE2によ
り、ステップ毎に同期させながら並列プロセスとして実
行するようになっている。
件設定機能5,割付機能6,割込み生成機能7および活
性化機能8を有している。ここで、不活性化機能4は、
当該並列プロセスとして今回のステップで割り付けられ
た処理を完了し、他のPE2が当該並列プロセスとして
今回のステップで割り付けられた処理を完了するのを待
つ並列同期待ち状態になった際に、当該並列プロセスの
割付を禁止すべく当該並列プロセスを不活性状態にする
機能である。
による当該並列プロセスの不活性化と同時に、当該並列
プロセスの割付を再開する際に満たされるべき条件を設
定する機能であり、割付機能6は、実行可能な他のジョ
ブが存在する場合には、当該並列プロセスが不活性状態
である期間中、その他のジョブについてのプロセスの割
付を行なう機能である。
能5により設定された前記条件が満たされた場合、現在
実行中の処理に対する割込み信号を生成する機能であ
り、活性化機能8は、割込み生成機能7からの割込み信
号に応じて、当該並列プロセスの割付を再開すべく当該
並列プロセスを活性状態にする機能である。上述のよう
な機能4〜8を有するPE2では、実行中の並列プロセ
スが並列同期待ち状態になると、不活性化機能4により
当該並列プロセスを不活性化することで、この並列プロ
セスの割付が禁止され、代わって、実行可能な他のジョ
ブが存在する場合には、割付機能6により、この他のジ
ョブについてのプロセスの割付が行なわれる。
により設定された前記条件が満たされると、割込み生成
機能7により、現在実行中の処理に対する割込み信号が
生成された後、活性化機能8により、並列同期待ち状態
であった並列プロセスが活性化され、この並列プロセス
の割付が再開される。このようにして、並列同期待ち状
態にある並列プロセスをディスパッチせず代わりに実行
可能な他のジョブのプロセスをディスパッチするととも
に、所定条件が満たされると並列プロセスの割付を再開
して次のステップの処理を実行するといった、並列プロ
セスの協調スケジューリングを実現することができる
(以上、請求項1,8)。
しては、下記項目〔1〕〜〔3〕の3種類がある。 〔1〕転送パケット数に応じた割込み生成機能 並列計算機1において、データ処理動作とは非同期に行
なわれるパケット送受信により通信網3を介して送信側
PE2から受信側PE2へデータ(パケット)を転送す
べく、各PE2にデータ転送用の転送処理部がそなえら
れている場合、割込み生成機能7を、カウンタ,期待値
レジスタ,比較器および割込み生成回路から構成するこ
とができる。
並列同期待ち状態になると、当該並列プロセスを実行す
る他PE2から転送されてくるパケットの数を、カウン
トアップまたはカウントダウンすることにより計数する
ものであり、期待値レジスタは、条件設定機能5によ
り、並列同期待ち状態になってから他PE2が今回のス
テップを完了するまでの間に他PE2から転送されてく
る予定のパケットの数に基づいて、カウンタによるカウ
ント値の期待値を設定されるものである。また、比較器
は、期待値レジスタに設定された期待値とカウンタによ
る実カウント値とを比較するものであり、割込み生成回
路は、比較器による比較結果に応じ前記割込み信号を生
成するものである。
有するPE2では、実行中の並列プロセスが並列同期待
ち状態になると、当該並列プロセスを実行する他PE2
から自PE2へ転送されてくるパケットの数が、カウン
タをカウントアップまたはカウントダウンすることによ
り計数される。そして、そのカウンタによる実カウント
値と条件設定機能5により期待値レジスタに設定された
期待値とが一致したことが比較器にて検知されると、割
込み生成回路により割込み信号が生成される。つまり、
転送パケット数が期待値に到達したことを、並列プロセ
スの割付を再開する条件(並列同期待ち状態の解除条
件)として、割込み生成機能7を実現することができる
(以上、請求項2,9)。
れぞれ並列プロセスとして実行されている場合、パケッ
ト中に、各ジョブに対応したプロセス識別子を設定し、
各PE2において、期待値をプロセス識別子毎に設定す
るとともに、カウンタによるカウント値を格納する領域
をプロセス識別子毎に主記憶上に確保し、カウンタの計
数,期待値の設定および割込み信号の生成をプロセス識
別子毎に行なうことにより、ジョブ毎に、並列プロセス
の非活性化/活性化を行なうことができる(以上、請求
項3,10)。
た割込み生成機能 並列計算機1において、データ処理動作とは非同期に行
なわれるパケット送受信により通信網3を介して送信側
PE2から受信側PE2へデータ(パケット)を転送す
べく各PE2にデータ(パケット)転送用の転送処理部
をそなえ、この転送処理部が、当該並列プロセスを実行
する他PE2から特定種別のパケットであるメッセージ
パケットを受信すると、その受信データを、ベースアド
レスと書込ポインタとの加算値に従って主記憶上のサイ
クリックキューであるメッセージ受信キューに格納する
とともに、書込ポインタの指示値を、メッセージ受信キ
ューにおける次の空き領域の先頭アドレスに更新するよ
うに構成されている。
ジスタ,比較器および割込み生成回路から構成すること
ができる。ここで、期待値レジスタは、条件設定機能5
により、並列同期待ち状態になってから他PE2が今回
のステップを完了するまでの間に他PE2から転送され
てくる予定の全メッセージパケットのデータ容量等の情
報に基づいて、転送処理部の書込ポインタの指示値の期
待値を設定されるものである。また、比較器は、期待値
レジスタに設定された期待値と書込ポインタの実指示値
とを比較するものであり、割込み生成回路は、比較器に
よる比較結果に応じ前記割込み信号を生成するものであ
る。
有するPE2では、実行中の並列プロセスが並列同期待
ち状態になると、当該並列プロセスを実行する他PE2
からメッセージパケットを受信すると、その受信データ
が、ベースアドレスと書込ポインタとの加算値に従って
主記憶上のサイクリックキューであるメッセージ受信キ
ューに格納されるとともに、その書込ポインタの指示値
が、メッセージ受信キューにおける次の空き領域の先頭
アドレスに更新される。
件設定機能5により期待値レジスタに設定された期待値
とが一致したこと、または、期待値と実指示値とが不一
致になったこと、または、実指示値が期待値を超えたこ
とが、比較器にて検知されると、割込み生成回路により
割込み信号が生成される。つまり、メッセージパケット
受信量が期待値に到達したことを、並列プロセスの割付
を再開する条件(並列同期待ち状態の解除条件)とし
て、割込み生成機能7を実現することができる(以上、
請求項4,11)。
れぞれ並列プロセスとして実行されている場合、パケッ
ト中に、各ジョブに対応したプロセス識別子を設定し、
各PE2において、期待値およびベースアドレスをプロ
セス識別子毎に設定するとともに、メッセージ受信キュ
ーおよび書込ポインタをプロセス識別子毎にそなえ、メ
ッセージ受信キューへのデータ書込,書込ポインタの更
新,期待値の設定および割込み信号の生成をプロセス識
別子毎に行なうことにより、ジョブ毎に、並列プロセス
の非活性化/活性化を行なうことができる(以上、請求
項5,12)。
込み生成機能 複数のPE2の相互間で各PE2が当該並列プロセスと
して今回のステップで割り付けられた処理を完了したか
否かを示す1ビット以上の状態値を送受信するための状
態通信部と、この状態通信部を通じて得られた当該並列
プロセスを実行するPE2からの状態値が全て一致した
ことを検出すると同期検出信号を出力する同期検出機構
とが各PE2にそなえられている場合、条件設定機能5
により、同期検出機構から同期検出信号が出力されるこ
とが前記条件として設定され、割込み生成機能7が同期
検出機構により実現され、この同期検出機構からの同期
検出信号を前記割込み信号として用いる。
有するPE2では、実行中の並列プロセスが並列同期待
ち状態になった後、PE2の同期検出機構から同期検出
信号が、割込み生成機能7の割込み信号として出力され
る。つまり、各PE2の同期検出(バリア検出)を、並
列プロセスの割付を再開する条件として、割込み生成機
能7を実現することができる(以上、請求項6,1
3)。
れぞれ並列プロセスとして実行されている場合、パケッ
ト中に、各ジョブに対応したプロセス識別子を設定する
とともに、割込み生成機能7を実現する同期検出機構を
プロセス識別子毎にそなえ、同期検出機構による同期検
出およびおよび割込み信号の生成をプロセス識別子毎に
行なうことにより、ジョブ毎に、並列プロセスの非活性
化/活性化を行なうことができる(以上、請求項7,1
4)。
施の形態を説明する。 (a)本実施形態の並列計算機の説明 図2は本発明の一実施形態としての並列プロセススケジ
ューリング方法を適用された並列計算機の全体構成を示
すブロック図であり、この図2に示すように、本実施形
態の並列計算機10も、図1に示したものと同様、個別
に処理を実行するn台のPE(PE番号として#0〜#
n−1が付与されているものとする)11と、これらの
PE11を相互に通信可能に接続するPE間結合網12
とをそなえて構成され、ある1つのジョブを、n台のP
E11のうちの2台以上のPE11により、ステップ毎
に同期させながら並列プロセスとして実行するようにな
っている。
11のブロック内に表記されるように、少なくとも転送
処理部13,CPU14および主記憶15をそなえて構
成されている。なお、図2においては、PE番号#0の
PE11についてのみその内部を図示しているが、他の
PE番号#1〜#n−1のPE11も、同様に構成さ
れ、後述する各種機能を有することは言うまでもない。
のデータの送受信処理を行なうもので、CPU14によ
るデータ処理動作とは非同期に、パケット送受信により
PE間結合網12を介して他のPE11との間でデータ
転送を行なうものであり、この転送処理部13(または
PE11の第3実施形態で後述する同期検出機構61)
に、後述する割込み生成機能24がそなえられている。
この転送処理部13の詳細構成(特に割込み生成機能2
4の構成)や動作については図4〜図8により後述す
る。
データ,プログラム等に基づいてデータ処理動作(実際
の並列プロセスの実行動作等)を行なうとともに、転送
処理部13に対してデータ転送指令を行なうもので、後
述する不活性化機能21,条件設定機能22,割付機能
23および活性化機能25を有している。ここで、不活
性化機能21は、当該並列プロセスとして今回のステッ
プで割り付けられた処理を完了し、他のPE11が当該
並列プロセスとして今回のステップで割り付けられた処
理を完了するのを待つ並列同期待ち状態になった際に、
当該並列プロセスの割付を禁止すべく当該並列プロセス
を不活性状態にする機能である。
21による当該並列プロセスの不活性化と同時に、当該
並列プロセスの割付を再開する際に満たされるべき条件
(並列同期待ち状態の解除条件)を設定する機能であ
り、割付機能23は、実行可能な他のジョブが存在する
場合には、当該並列プロセスが不活性状態である期間
中、その他のジョブについてのプロセスの割付を行なう
機能である。
機能22により設定された条件が満たされた場合、現在
実行中の処理に対する割込み信号を生成する機能であ
り、活性化機能25は、割込み生成機能24からの割込
み信号に応じて、当該並列プロセスの割付を再開すべく
当該並列プロセスを活性状態にする機能である。なお、
不活性化機能21,条件設定機能22,割付機能23お
よび活性化機能25は、実際には、後述するように、O
S(Operating System)の基本的部分であるスーパバイ
ザにより実現される機能である。ここで、スーパバイザ
とは、タイムシェアリング,入出力,マルチプログラミ
ングなどの機能を制御すべく主記憶15に常駐している
プログラムのことで、狭義のOSである。
の動作(即ち、本実施形態の並列プロセススケジューリ
ング方法)について説明する。各PE11において、C
PU14により実行中の並列プロセスが並列同期待ち状
態になった時には、その並列同期待ち状態になった旨を
示すシステムコールが前記条件を伴ってその並列プロセ
スから発行される。
イザは、通知された条件が成立した時に割込み信号を割
込み生成機能24により生成させるように、転送処理部
13(割込み生成機能24)のパラメータを設定すると
ともに、並列同期待ち状態になった並列プロセスを不活
性状態に遷移させ、この並列プロセスがディスパッチさ
れないようにする(以上が不活性化機能21および条件
設定機能22)。
になった並列プロセス以外に実行可能なジョブが存在す
る場合には、割付機能23により、この他のジョブ(他
の並列ジョブあるいは非並列ジョブ)についてのプロセ
スの割付が行なわれる。この他のジョブの実行中に、条
件設定機能5により転送処理部13(または同期検出機
構61)側に設定された前記条件が成立した時には、割
込み生成機能24により、現在実行中の処理に対する割
込み信号が生成されてCPU14へ出力される。この割
込み信号を通知されたスーパバイザは、並列同期待ち状
態であった該当並列プロセスを活性化し(活性化機能2
5)、その並列プロセスのディスパッチを再開する。
図で、この図3は、前述した図12に示すギャングスケ
ジューリングを行なったものに対応している。この図3
に示す例でも、ある並列ジョブが、図12に示した例と
同様、5台のPE11上で、それぞれプロセス番号0〜
4を付された5つのプロセスとして並列的に実行されて
おり、各プロセスは、同期点1,2で示すように、ステ
ップ毎に同期しながら実行されている。
“○”は各プロセスが並列同期待ち状態になりシステム
コールを発行した時点(つまり、今回のステップで割り
付けられた処理を完了した時点)を示し、“●”は各P
E11で前記条件が成立し割込み生成機能24により割
込み信号が生成された時点を示している。また、横方向
の太線は、プロセスが実際に実行されている期間を示し
ている。
方法と、図12に示した従来のスケジューリング手法と
の異なる点は、図12に示した横方向の細線が無くなっ
ている点である。つまり、従来、各プロセスは、並列同
期待ち状態で実際には何ら処理を行なわない状態であっ
ても、並列同期を検出するまで、各タイムスライスに対
してディスパッチされていたが、本実施形態では、並列
同期待ち状態の並列プロセスをディスパッチすることが
なくなる。これにより、前記条件が成立するまでの間、
新たに空いたCPU14のタイムスライスに、他のプロ
セスをディスパッチすることが可能になる。
る、または、並列ジョブと非並列ジョブとを同時に実行
するような多重ジョブ環境において、並列同期待ち状態
にある並列プロセスをディスパッチする代わりに実行可
能な他のジョブのプロセスをディスパッチするという協
調スケジューリングが可能になるので、係る多重ジョブ
環境にある並列計算機10のスループット性能が大幅に
向上することになる。
ジューリングに適用した場合について説明したが、図1
1に示した一般的な並列プロセススケジューリングに
も、上述と同様にして適用することが可能で、この場合
も本実施形態と同様の作用効果を得ることができること
は言うまでもない。次に、各PE11における割込み生
成機能24を実現する3つの実施形態について、図4〜
図8により詳細に説明する。
置の説明 図4は本発明の第1実施形態としての並列計算機用処理
装置の要部構成を示すブロック図であり、この図4で
は、転送処理部13における受信系と、この受信系に付
加された割込み生成機能24とが詳細に図示されてお
り、転送処理部13に本来そなえられている送信系の図
示は省略されている。
憶アクセス制御部で、この主記憶アクセス制御部16
は、CPU14からの指令に応じ主記憶15に対してア
クセスを行ない、主記憶15からCPU14へのデータ
転送や、CPU14から主記憶15へのデータ転送を制
御するものである。また、図4中、30は転送処理部1
3の一部を構成する主記憶アクセス制御部で、この主記
憶アクセス制御部30は、転送処理部13の受信系およ
び送信系からの指令に応じ主記憶15に対してアクセス
を行ない、主記憶15から送信系へのデータ転送や、受
信系から主記憶15へのデータ転送を制御するものであ
る。さらに、この主記憶アクセス制御部30には、割込
み生成機能24における各種レジスタ(後述)へのデー
タ設定を行なうためのアドレスデコーダ30Aとしての
機能もそなえられている。図4に示すように、第1実施
形態としてのPE11の転送処理部13の受信系は、コ
マンドレジスタ31,デコーダ32,制御回路33,入
力バッファ34,アドレスレジスタ35およびアドレス
生成回路36から構成されている。
結合網12からのデータ受信時に、受信したパケットの
ヘッダ内に含まれる転送コマンド(コマンドコード)を
一時的に保持するものであり、デコーダ32は、コマン
ドレジスタ31に保持されたコマンドコードを解析する
ものであり、制御回路33は、このデコーダ32の解析
結果に基づいて、受信系の各部を制御するものである。
介して送信側PE11から受信したパケットを一時的に
保持するもので、この入力バッファ34に保持されたパ
ケットボディのデータは、図5に示すフローチャートに
従って後述するごとく、アドレスレジスタ35に示され
るアドレスと組になって、順次、主記憶アクセス制御部
30を介して主記憶15に格納されるようになってい
る。
4に保持されているパケットボディを書き込むべき主記
憶15上のアドレスを一時的に保持するもので、このア
ドレスレジスタ35には、まず、受信したパケットのヘ
ッダにて指定されるアドレスデータ(パケットボディ受
信アドレス)が保持され、以後、アドレス生成回路36
により生成されたアドレスデータが保持されるようにな
っている。
ドレスデータがアドレスレジスタ35に設定されると、
入力バッファ34から主記憶15へのデータ書込を行な
う度に、アドレスレジスタ35に設定されたアドレス値
に対して1回のデータ格納バイト長を加算するもので、
その加算結果は、アドレスレジスタ35に設定されるよ
うになっている。このアドレス生成回路36による加算
処理は、パケットボディの受信(書込)を終了するまで
行なわれる。
系には、割込み生成機能24が付加されている。第1実
施形態としてのPE11における割込み生成機能24
は、図4に示すように、カウンタアドレスレジスタ4
1,カウンタ値レジスタ42,デクリメンタ43,カウ
ンタ期待値レジスタ44,比較器45および割込み生成
回路46によって実現されている。
は、受信したパケットのヘッダにて指定される受信カウ
ンタアドレスを保持するものである。この第1実施形態
では、後述するごとく並列同期待ち状態になった並列プ
ロセスについて他のPE11から転送されてきたパケッ
トの数を計数しているが、カウンタアドレスレジスタ4
1に保持される受信カウンタアドレスは、その計数結果
(カウント値)を格納すべき主記憶15上のアドレスを
指定するものである。
状態になった並列プロセスについてのパケットを受信す
る度に、主記憶15上の受信カウンタアドレス(カウン
タアドレスレジスタ41に保持されたアドレス)から主
記憶アクセス制御部30を介して読み出されたカウント
値を保持するものである。デクリメンタ43は、カウン
ト値レジスタ42に保持されたカウント値から1を減算
するもので、その減算結果は、比較器45へ出力される
とともに、主記憶アクセス制御部30を介して主記憶1
5上の受信カウンタアドレスに書き込まれる。このよう
にデクリメンタ43による減算結果を主記憶15上の受
信カウンタアドレスに書き込むことにより、並列同期待
ち状態になった並列プロセスについての受信パケット数
に関する情報であるカウント値が更新される。
アドレスレジスタ41,カウント値レジスタ42および
デクリメンタ43により、並列同期待ち状態の並列プロ
セスを実行する他のPE11から転送されてくるパケッ
トの数をカウントダウンにより計数するカウンタとして
の機能が実現されている。また、カウンタ期待値レジス
タ44は、処理中の並列プロセスが並列同期待ち状態に
なると、前述したCPU14(スーパバイザ)の条件設
定機能22により、主記憶アクセス制御部30(アドレ
スデコーダ30A)を介して所定のカウンタ期待値を設
定されるものである。このカウンタ期待値は、並列同期
待ち状態になってから他のPE11が今回のステップを
完了するまでの間に他のPE11から転送されてくる予
定のパケットの数に基づいて設定されるもので、例え
ば、主記憶15上の受信カウンタアドレスにおけるカウ
ント値が“8”であり、並列同期待ち状態になってから
受信する予定のパケット数が“6”ある場合には、所定
のカウンタ期待値として“2”が設定されることにな
る。
4に設定されたカウンタ期待値とデクリメンタ43の出
力値(実カウント値)とを比較するもので、これらの値
が一致した場合に一致信号〔不一致時に“0”(Lowレベ
ル)で一致時に“1”(Highレベル)になる信号〕を出
力するものである。そして、割込み生成回路46は、比
較器45による比較結果に応じ、CPU14(スーパバ
イザ)に対して割込み信号を生成するもので、割込み保
留レジスタ47,割込み生成マスクレジスタ48および
ANDゲート49により構成されている。
器45からの一致信号を保持し、その保持信号をAND
ゲート49へ出力するものである。また、割込み生成マ
スクレジスタ48は、割込みを生成させるか否かをCP
U14側から予め定めるためのマスク情報を設定され、
その設定情報をANDゲート49へ出力するものであ
る。このマスク情報としては、割込みを発生させる場合
に“1”が設定される一方、割込みを発生させない場合
(つまり割込み保留レジスタ47からの信号をマスクす
る場合)に“0”される。
レジスタ47からの信号と割込み生成マスクレジスタ4
8からの信号との論理積を算出し、その結果を割込み生
成信号としてCPU14へ出力するものである。つま
り、割込み生成マスクレジスタ48にマスク情報として
“1”が設定されている場合に、比較器45からの一致
信号が立ち上がって割込み保留レジスタ47に保持され
る信号が“1”になると、ANDゲート49からCPU
14へ出力される割込み生成信号が“1”に立ち上が
り、CPU14において割込み処理が行なわれるように
なっている。
作について、図5のフローチャート(ステップS1〜S
16)に従って説明する。ここでは、特に割込み生成機
能24の動作を説明すべく、PE11が、ある並列プロ
セスについて並列同期待ち状態になってからその並列プ
ロセスについてのパケットを他のPE11から受信する
際の、転送処理部13の受信系および割込み生成機能2
4の動作について説明する。このとき、カウンタ期待値
レジスタ44には、CPU14(スーパバイザ)の条件
設定機能22により、所定のカウンタ期待値が既に設定
されているものとする。
2に接続された各PE11の入力バッファ34の空きワ
ード数を、常時、捕捉しており(ステップS1)、所定
PE11を宛先(受信側PE)とするパケットが存在
し、且つ、この受信側PE11の入力バッファ34が空
いている場合には(ステップS2)、1ワード目にパケ
ット送信開始信号を伴ってパケットの転送を開始し(ス
テップS3)、受信側PE11の入力バッファ34の空
き状態に応じて、パケットの全体をその受信側PE11
に転送する(ステップS4)。このステップS4による
処理は、1つのパケットの転送を終了するまで(ステッ
プS5でYES判定となるまで)繰り返し行なわれ、パ
ケットの転送を終了すると、ステップS1に戻る。
2から受信側PE11へのパケット転送が開始される
と、受信側PE11の転送処理部13内の受信系では、
入力バッファ34が空いている限り、パケットを読み込
む(ステップS6)。このとき、パケットヘッダ内の各
指定データが流れるタイミングで、各指定データが、対
応するレジスタ31,35,41に読み込まれる。つま
り、コマンドレジスタ31にはコマンドコードが、アド
レスレジスタ35にはパケットボディ受信アドレスが、
カウンタアドレスレジスタ41には受信カウンタアドレ
スが読み込まれる(ステップS7)。
に読み込まれたコマンドコードはデコーダ32により解
読されて、パケット受信格納方法を制御するための信号
が、制御回路33により生成される(ステップS8)。
そして、転送処理部13の受信系は、アドレスレジスタ
35に設定されたアドレスと入力バッファ34からのパ
ケットデータとを組にして主記憶アクセス制御部30へ
送り、この主記憶アクセス制御部30を介して、パケッ
トボディを主記憶15上の指定アドレスに格納する(ス
テップS9)。
回格納すると、アドレス生成回路36により、アドレス
レジスタ35のアドレス値に1回のデータ格納バイト長
が加算され、アドレスレジスタ35に設定される(ステ
ップS10)。これらのステップS9およびS10によ
る処理は、パケットボディを全て受信するまで(ステッ
プS11でYES判定となるまで)繰り返し実行され
る。
理部13の受信系は、カウンタアドレスレジスタ41に
保持されているアドレスを主記憶アクセス制御部30に
送り、主記憶15上のそのアドレスから、該当並列プロ
セスについてのカウント値を読み込み、カウント値レジ
スタ42に設定する(ステップS12)。カウント値レ
ジスタ42に設定されたカウント値はデクリメンタ43
により1だけ減算された後、その減算結果(新たなカウ
ント値)をデータとし、且つ、カウンタアドレスレジス
タ41に保持されているデータをアドレスとして主記憶
アクセス制御部30に送出する。これにより、デクリメ
ンタ43による減算結果が、主記憶15上の受信カウン
タアドレスに書き込まれ、並列同期待ち状態になった並
列プロセスについての受信パケット数に関する情報であ
るカウント値が更新される(ステップS13)。
15に書き込むと同時に、比較器45により、カウンタ
期待値レジスタ44に設定されたカウンタ期待値とデク
リメンタ43の出力値(実カウント値)とが比較され、
これらの値が一致した場合(ステップS14でYES判
定の場合)、比較器45からの一致信号が立ち上がり割
込み保留レジスタ47に“1”が設定される(ステップ
S15)。
にマスク情報として“1”が設定されていれば、割込み
生成回路46(ANDゲート49)からCPU14へ出
力される割込み信号が“1”に立ち上がり(ステップS
16)、CPU14において割込み処理が行なわれる。
このステップS16による処理を終了した後、もしく
は、比較器45の比較結果が不一致であった場合(ステ
ップS14でNO判定の場合)、転送処理部13の受信
系は受信待機状態になる。
1によれば、実行中の並列プロセスが並列同期待ち状態
になると、当該並列プロセスを実行する他のPE11か
ら自PE11へ転送されてくるパケットの数がカウント
ダウンにより計数され、その実カウント値と条件設定機
能22によりカウンタ期待値レジスタ44に設定された
期待値とが一致したことが比較器45にて検知される
と、割込み生成回路46により割込み信号が生成され
る。つまり、転送パケット数が期待値に到達したこと
を、並列プロセスの割付を再開する条件(並列同期待ち
状態の解除条件)として、割込み生成機能24が実現さ
れる。
1のCPU14で実行される並列プロセスが1種類であ
るものとして説明しているが、第1実施形態では、並列
計算機10上で複数のジョブがそれぞれ並列プロセスと
して実行されている場合にも対応することができる。た
だし、その場合、転送されるパケットのヘッダ中に、各
ジョブに対応したプロセス識別子を設定する。また、割
込み生成機能24をプロセス識別子毎にそなえて、カウ
ンタ期待値をプロセス識別子毎にカウンタ期待値レジス
タ44に設定するとともに、デクリメンタ43の出力値
(カウント値)を格納する領域をプロセス識別子毎に主
記憶15上に確保する。これにより、パケットヘッダ中
のプロセス識別子に対応して、受信パケット数の計数,
カウンタ期待値の設定および割込み信号の生成を行な
え、ジョブ毎に、並列プロセスの非活性化/活性化を行
なうことができる。
ケット数をデクリメンタ43により減算(カウントダウ
ン)して計数しているが、逆にインクリメンタによりカ
ウントアップして計数するようにしてもよい。この場
合、当然、カウンタ期待値レジスタ45には、そのカウ
ントアップ処理に対応した値がカウンタ期待値として設
定される。例えば、主記憶15上の受信カウンタアドレ
スにおけるカウント値が“8”であり、並列同期待ち状
態になってから受信する予定のパケット数が“6”ある
場合には、所定のカウンタ期待値として“14”が設定
されることになる。
置の説明 図6は本発明の第2実施形態としての並列計算機用処理
装置の要部構成を示すブロック図であり、この図6で
も、第1実施形態と同様、転送処理部13における受信
系と、この受信系に付加された割込み生成機能24とが
詳細に図示されており、転送処理部13に本来そなえら
れている送信系の図示は省略されている。図6中、既述
の符号と同一の符号はほぼ同一部分を示しているので、
その詳細な説明は省略する。
0において、プログラミングモデルとしてメッセージパ
ッシングモデルが採用され転送処理部13によりパケッ
トとしてメッセージパケットが転送されるものとする。
図6に示すように、第2実施形態としてのPE11の転
送処理部13の受信系は、第1実施形態と同様のコマン
ドレジスタ31,デコーダ32,制御回路33および入
力バッファ34を有するほか、アドレスレジスタ37,
加算器38,メッセージ受信キューベースアドレスレジ
スタ39,書込ポインタ40,1加算器50,読出ポイ
ンタ51および比較器52を有して構成されている。
態のものと同様、PE間結合網12を介して送信側PE
11から受信したパケットを一時的に保持するものであ
るが、この入力バッファ34に保持されたパケットボデ
ィのデータは、図7に示すフローチャートに従って後述
するごとく、アドレスレジスタ37に示されるアドレス
と組になって、順次、主記憶アクセス制御部30を介し
主記憶15上のメッセージ受信キュー(サイクリックキ
ュー)17に格納されるようになっている。
4に保持されているパケットボディを書き込むべき主記
憶15上のアドレスを一時的に保持するもので、このア
ドレスレジスタ37には、加算器41からの値がアドレ
スデータとして保持されるようになっている。加算器3
8は、入力バッファ34に保持されているパケットボデ
ィを主記憶15上のメッセージ受信キュー17に格納す
る際の書込アドレスを順次生成するためのもので、レジ
スタ39に保持されるメッセージ受信キューベースアド
レス(メッセージ受信キュー17の空きの先頭アドレ
ス)と書込ポインタ40の値とを加算し、前記書込アド
レスとしてアドレスレジスタ37へ出力する。
定されているが、主記憶15へのデータ書込を開始する
と、その書込ポインタ40の値は、メッセージ受信キュ
ー17に対してこの受信キュー17の1ブロック分のデ
ータが書き込まれる度に、1加算器50により1ずつカ
ウントアップされる。従って、加算器38からの出力
は、メッセージ受信キューベースアドレスを初期値とし
て1ブロック分のデータ書込毎に1ずつ順に増加する。
このような加算器38からのアドレス値は、パケットを
全て書き込むまでアドレスレジスタ39に順次設定され
る。
レスレジスタ37に順次設定されるアドレスと組になっ
て、主記憶アクセス制御部30を介して主記憶15のメ
ッセージ受信キュー17に書き込まれる。なお、読出ポ
インタ51は、サイクリックキューであるメッセージ受
信キュー17の読出位置を示すものであり、比較器52
は、1加算器50により1を加算された書込ポインタ4
0の値と読出ポインタ51の値とを比較し、一致した場
合には、メッセージ受信キュー17でデータのオーバフ
ローが発生したものと判断し、割込み信号を生成してC
PU14に対して出力するものである。
系にも、第1実施形態と同様、割込み生成機能24が付
加されている。第2実施形態としてのPE11における
割込み生成機能24は、図6に示すように、書込ポイン
タ期待値レジスタ53,比較器54および第1実施形態
と同様の割込み生成回路によって実現されている。ここ
で、書込ポインタ期待値レジスタ53は、処理中の並列
プロセスが並列同期待ち状態になると、前述したCPU
14(スーパバイザ)の条件設定機能22により、主記
憶アクセス制御部30(アドレスデコーダ30A)を介
して所定の書込ポインタ期待値を設定されるものであ
る。この書込ポインタ期待値は、並列同期待ち状態にな
ってから他のPE11が今回のステップを完了するまで
の間に他のPE11から転送されてくる予定の全メッセ
ージパケットのデータ容量に基づいて設定されるもの
で、その全メッセージパケットを受信した場合に書込ポ
インタ40が示すものと考えられる値である。
タ53に設定された書込ポインタ期待値と書込ポインタ
40の実指示値とを比較するもので、これらの値が一致
した場合に一致信号〔不一致時に“0”で一致時に
“1”になる信号〕を出力するものである。なお、比較
器54は、書込ポインタ期待値と書込ポインタ40の実
指示値とを比較した結果、期待値と実指示値とが不一致
になったこと、または、実指示値が期待値を超えたこと
を検知した場合に、前述のような所定信号を出力するも
のとして構成することもできる。
形態のものと同様、比較器54による比較結果に応じ、
CPU14(スーパバイザ)に対して割込み信号を生成
するもので、前述と全く同様の割込み保留レジスタ4
7,割込み生成マスクレジスタ48およびANDゲート
49により構成されている。つまり、割込み生成マスク
レジスタ48にマスク情報として“1”が設定されてい
る場合に、比較器54からの一致信号が立ち上がって割
込み保留レジスタ47に保持される信号が“1”になる
と、ANDゲート49からCPU14へ出力される割込
み生成信号が“1”に立ち上がり、CPU14において
割込み処理が行なわれるようになっている。
作について、図7のフローチャート(ステップS21〜
S39)に従って説明する。ここでも、特に割込み生成
機能24の動作を説明すべく、PE11が、ある並列プ
ロセスについて並列同期待ち状態になってからその並列
プロセスについてのメッセージパケットを他のPE11
から受信する際の、転送処理部13の受信系および割込
み生成機能24の動作について説明する。このとき、書
込ポインタ期待値レジスタ53には、CPU14(スー
パバイザ)の条件設定機能22により、所定の書込ポイ
ンタ期待値が既に設定されているものとする。
様、このPE間結合網12に接続された各PE11の入
力バッファ34の空きワード数を、常時、捕捉しており
(ステップS21)、所定PE11を宛先(受信側P
E)とするメッセージパケットが存在し、且つ、この受
信側PE11の入力バッファ34が空いている場合には
(ステップS22)、1ワード目にパケット送信開始信
号を伴ってメッセージパケットの転送を開始し(ステッ
プS23)、受信側PE11の入力バッファ34の空き
状態に応じて、メッセージパケットの全体をその受信側
PE11に転送する(ステップS24)。このステップ
S24による処理は、1つのメッセージパケットの転送
を終了するまで(ステップS25でYES判定となるま
で)繰り返し行なわれ、メッセージパケットの転送を終
了すると、ステップS21に戻る。
網12から受信側PE11へのパケット転送が開始され
ると、受信側PE11の転送処理部13内の受信系で
は、入力バッファ34が空いている限り、メッセージパ
ケットを読み込む(ステップS26)。このとき、パケ
ットヘッダ内のコマンドコードが流れるタイミングで、
そのコマンドコードをコマンドレジスタ31に読み込む
(ステップS27)。コマンドレジスタ31に読み込ま
れたコマンドコードはデコーダ32により解読されて、
パケット受信格納方法を制御するための信号が、制御回
路33により生成される(ステップS28)。
ジスタ39に保持されるメッセージ受信キューベースア
ドレスと書込ポインタ40の値とを加算器38により加
算した結果が、アドレスレジスタ37に書込アドレスと
して設定された後(ステップS29)、書込ポインタ4
0の値が、1加算器50により1だけカウントアップさ
れる(ステップS30)。
プされた書込ポインタ40の値(実指示値)は、比較器
54により、書込ポインタ期待値レジスタ53に設定さ
れた期待値と比較され、これらの値が一致した場合(ス
テップS31でYES判定の場合)、比較器54からの
一致信号が立ち上がり割込み保留レジスタ47に“1”
が設定される(ステップS32)。
にマスク情報として“1”が設定されていれば、割込み
生成回路46(ANDゲート49)からCPU14へ出
力される割込み信号が立ち上がり(ステップS33)、
CPU14において割込み処理が行なわれ、転送処理部
13の受信系は受信待機状態になる。比較器54の比較
結果が不一致であった場合(ステップS31でNO判定
の場合)、比較器52により、ステップS30により1
だけカウントアップされた書込ポインタ40の値(実指
示値)と、読出ポインタ51の値とが比較される。そし
て、これらの値が一致した場合(ステップS34でYE
S判定の場合)には、メッセージ受信キュー17でデー
タのオーバフローが発生したものと判断されて、比較器
52からCPU14へ出力される割込み信号が立ち上が
り(ステップS35)、CPU14において割込み処理
が行なわれ、転送処理部13の受信系は受信待機状態に
なる。
合(ステップS34でNO判定の場合)、転送処理部1
3の受信系は、アドレスレジスタ37に設定されたアド
レスと入力バッファ34からのパケットデータとを組に
して主記憶アクセス制御部30へ送り、この主記憶アク
セス制御部30を介して、パケットデータを主記憶15
上のメッセージ受信キュー17内へ格納する(ステップ
S36)。
1回格納すると、図示しないアドレス生成回路によりア
ドレスレジスタ37のアドレス値に1回のデータ格納バ
イト長が加算され、その加算結果が、アドレスレジスタ
37に設定される(ステップS37)。ステップS36
およびS37による処理は、メッセージ受信キュー17
に対して1ブロック分のパケットデータ転送を完了する
か、パケットの全てをメッセージ受信キュー17に転送
するまで(ステップS38でYES判定となるまで)繰
り返し実行される。
よる処理は、パケットの受信を完了するまで、つまり、
パケットの全てをメッセージ受信キュー17に転送する
まで(ステップS39でYES判定となるまで)繰り返
し実行される。ステップS39でYES判定となると、
転送処理部13の受信系は受信待機状態になる。このよ
うに、第2実施形態としてのPE11によれば、実行中
の並列プロセスが並列同期待ち状態になると、当該並列
プロセスを実行する他のPE11からメッセージパケッ
トを受信すると、その受信データが、書込ポインタ40
の指示値に従って主記憶15上のメッセージ受信キュー
17に格納されるとともに、その書込ポインタ40の指
示値が、メッセージ受信キュー17における次の空き領
域の先頭アドレスに更新される。
と書込ポインタ期待値レジスタに設定された期待値とが
一致したことが比較器54にて検知されると、割込み生
成回路46により割込み信号が生成される。つまり、メ
ッセージパケット受信量が期待値に到達したことを、並
列プロセスの割付を再開する条件(並列同期待ち状態の
解除条件)として、割込み生成機能24が実現される。
1のCPU14で実行される並列プロセスが1種類であ
るものとして説明しているが、この第2実施形態でも、
並列計算機10上で複数のジョブがそれぞれ並列プロセ
スとして実行されている場合にも対応することができ
る。ただし、その場合、転送されるパケットのヘッダ中
に、各ジョブに対応したプロセス識別子を設定する。ま
た、割込み生成機能24をプロセス識別子毎にそなえ、
書込ポインタ期待値をプロセス識別子毎に書込ポインタ
期待値レジスタ53に設定し、メッセージ受信キューベ
ースアドレスレジスタ39,書込ポインタ40および読
出ポインタ51等をプロセス識別子毎にそなえ、さら
に、メッセージ受信キュー17を、プロセス識別子毎に
主記憶15上に確保する。これにより、パケットヘッダ
中のプロセス識別子に対応して、メッセージ受信キュー
17へのデータ書込,書込ポインタ40の更新,期待値
の設定および割込み信号の生成をプロセス識別子毎に行
なうことにより、ジョブ毎に、並列プロセスの非活性化
/活性化を行なうことができる。
置の説明 図8は本発明の第3実施形態としての並列計算機用処理
装置の要部構成を示すブロック図である。第3実施形態
のPE11は、同期検出(バリア検出)に応じた割込み
生成機能24を有するもので、図8に示すような同期検
出機構61と前述と同様機能の割込み生成マスクレジス
タ48およびANDゲート49とにより、第3実施形態
の割込み生成機能24が実現されている。
うに、各PE11の相互間が、状態通信部としてのBS
T(Barrier STate)放送装置60により接続されてい
る。このBST放送装置60は、複数のPE11の相互
間で各PE11が当該並列プロセスとして今回のステッ
プで割り付けられた処理を完了したか否かを示すバリア
状態値(1ビット長の変数)を送受信するためのもの
で、例えば、PE番号#0,#1,#2,…,#(n−
1),#0,#1,…の順に、各PE11のバリア状態
値(後述する出力レジスタ62に保持される値)を全て
のPE11に放送するものである。
置60を通じて得られた当該並列プロセスを実行するP
E11からのバリア状態値が全て一致したことを検出す
ると同期検出信号〔同期検出時に“1”(Highレベル)
になる信号〕を出力する同期検出機構61がそなえられ
ている。そして、本実施形態の割込み生成機能24で
は、ANDゲート49により、同期検出機構61からの
同期検出信号と、割込み生成マスクレジスタ48との論
理積が算出され、その論理積結果が割込み信号としてC
PU14に対して出力されるようになっている。
マスク情報として“1”が設定されている場合に、同期
検出機構61からの同期検出信号が立ち上がると、AN
Dゲート49からCPU14へ出力される割込み生成信
号が“1”に立ち上がり、CPU14において割込み処
理が行なわれる。次に、図8を参照しながら、この第3
実施形態で用いられる同期検出機構61の構成および動
作について説明する。
ジスタ62,バリア状態値入力レジスタ63,現同期値
レジスタ64,排他的論理和ゲート65,ANDゲート
66,バリアマスクレジスタ67,セレクタ68,現在
ポインタ69,1加算器70,同期開始PE番号ポイン
タ71,比較器72,前バリア同期値レジスタ73,N
OTゲート74,ANDゲート75および否定論理比較
器76から構成されている。
スタ64,73,ポインタ71)の書込タイミングを与
えるイネーブル信号の入力を示し、レジスタ48,6
2,67,73に付された“∈∋”は、CPU14(プ
ログラム)からアクセス可能であることを示すものであ
る。ここで、バリア状態値出力レジスタ62は、自PE
11のバリア状態値(BST OUT)を保持し、BS
T放送装置60に送出するものである。
放送装置60から前述のごとく放送される各PE11の
バリア状態値(BST IN)を順次受信して保持する
ものである。現同期値レジスタ64は、現在の同期値
(CSYNC;Current SYNChronization value)を保持
するものであり、排他的論理和ゲート(EOR)65
は、バリア状態値入力レジスタ63の値(BST I
N)と現同期値レジスタ64の値(CSYNC)との排
他的論理を算出するものである。つまり、排他的論理和
ゲート65の出力値は、バリア状態値入力レジスタ63
の値(BST IN)と現同期値レジスタ64の値(C
SYNC)とが異なる場合に“1”になる。
65からの値とセレクタ68からの値との論理積を算出
して出力するものである。バリアマスクレジスタ67
は、本実施形態の並列計算機10においてPE11がn
台そなえられる場合、nビット長のビット列として構成
され、このバリアマスクレジスタ67のビットx(x=
0〜n−1)には、PE番号xのPE11からのバリア
状態値を本PE11の並列同期対象とするか否かが設定
される。例えば、PE番号xのPE11からのバリア状
態値を本PE11の並列同期対象とする場合には“1”
が、並列同期対象としない場合には“0”が設定され
る。
指示されるビット位置のバリアマスク値をバリアマスク
レジスタ67から選択してANDゲート66へ出力する
ものである。現在ポインタ(C pointer;Current poin
ter)69は、現在、バリア同期値入力レジスタ63に保
持されているバリア状態値を送出したPE11のPE番
号を指示してセレクタ68に出力するものである。この
現在ポインタ69の指示値は、1マシンサイクル毎に1
加算器70により1を加算される。この現在ポインタ6
9の初期値が適切に設定されれば、現在ポインタ69の
示す値を、常に、バリア同期値入力レジスタ63からの
バリア状態値に対応するPE番号に合わせることが可能
である。
r;Synchronization Start pointer)71は、BST放送
装置60により放送されたバリア状態値が、現同期レジ
スタ64の値(CSYNC)と等しくなった最初のPE
11のPE番号を保持するものである。つまり、“同期
開始PE番号ポインタ71の指示値”〜“現在ポインタ
69の指示値”のPE番号をもつPE11で、且つ、こ
の指示値範囲のPE番号のバリアマスク値が“1”であ
るPE11のバリア状態値(BST OUT)は、現同
期値レジスタ64に保持されている値(CSYNC)と
同じである。
に1を加算した値と、同期開始PE番号ポインタ71の
指示する値とを比較し、これらの値が一致した場合に比
較結果として“1”をANDゲート75へ出力するもの
である。前バリア同期値レジスタ73は、最後に同期し
たときのバリア状態値(LBSY;Last Barrier SYnch
ronization value)を保持するものである。
同期値レジスタ64および同期開始PE番号ポインタ7
1にイネーブル信号として入力される。また、NOTゲ
ート74は、ANDゲート66の出力値を反転するもの
であり、ANDゲート75は、NOTゲート74の出力
値と比較器72からの比較結果との論理積を算出し、前
バリア同期値レジスタ73へイネーブル信号として出力
するものである。
は、前バリア同期値レジスタ73に保持されている値
(LBSY)とバリア状態値出力レジスタ62に保持さ
れている値(BST OUT)とについて後述するよう
な手順で比較を行なうことによってバリア同期検出を行
ない、バリア同期が検出されると、“1”を同期検出信
号として出力するものである。
では、ANDゲート66からの出力値は、今回受信した
バリア状態値の送信元PE11が同期対象(セレクタ6
8からの出力値が“1”)であり、且つ、今回受信した
バリア状態値と現在の同期値(CSYNC)とが異なる
場合に“1”になる。そして、ANDゲート66からの
出力値が“1”になったタイミングで、現同期値レジス
タ64および同期開始PE番号ポインタ71にイネーブ
ル信号が入力され、現同期値レジスタ64の値(CSY
NC)としてバリア状態値入力レジスタ63の値(BS
T IN)が設定されるとともに、同期開始PE番号ポ
インタ71の値として現在ポインタ69の値が設定され
る。これにより、このとき現在ポインタ69の指示する
PE番号が、最初に同期したPE11のPE番号として
同期開始PE番号ポインタ71に保持される。
現在ポインタ69の指示値に1を加算した値と同期開始
PE番号ポインタ71の指示する値とが一致した場合、
即ちバリア同期を検出したタイミングでに“1”に立ち
上がる。このとき、“同期開始PE番号ポインタ71の
値”〜“ポインタ71の値にn−2を加算した値”をP
E番号としてもつPE11は同期していることになる。
Dゲート66からの出力値が“0”の場合、即ち、現在
ポインタ69の指示するPE番号のPE11からのバリ
ア状態値が現在の同期を崩さない場合に、“1”にな
る。従って、比較器72からの信号が“1”になり、且
つ、NOTゲート74の出力値が“1”である場合、つ
まりANDゲート75の出力値が“1”になった時点
で、同期対象の全てのPE11のバリア状態値が現同期
値レジスタ64の値(CSYNC)であることが示され
たことになる。
“1”になったタイミングで、ANDゲート75の出力
値“1”がイネーブル信号として前バリア同期値レジス
タ73に与えられ、この前バリア同期値レジスタ73の
値(LBSY)として現同期値レジスタ64の値(CS
YNC)が設定される。そして、否定論理比較器(!比
較器)76により、前バリア同期値レジスタ73の値
(LBSY)とバリア状態値出力レジスタ62の値(B
ST OUT)とが比較される。この比較器76による
同期検出の手順は次の通りである。
T OUT”であるとする。“BST OUT”の値を
反転することにより、“BST OUT”!=“LBS
Y”となる。ここで、“!”はC言語での否定論理を意
味しており、“!=”は“not equal"を意味している。
同期対象の全てのPE11のバリア状態値が一致してい
ること即ちバリア同期が検出された時、“LBSY”=
“BST OUT”が設定される。
T”の期間がバリア同期待ちの期間であり、“LBS
Y”==“BST OUT”の期間がバリア同期期間で
このとき比較器76は同期検出信号として“1”を出力
する。そして、前述した通り、割込み生成マスクレジス
タ48にマスク情報として“1”が設定されている場合
に、同期検出機構61(比較器76)からの同期検出信
号が立ち上がると、ANDゲート49からCPU14へ
出力される割込み生成信号が“1”に立ち上がり、CP
U14において割込み処理が行なわれる。
のPE11によれば、実行中の並列プロセスが並列同期
待ち状態になると、各PE11の同期検出機構61の同
期検出信号が、割込み生成機能24の割込み信号として
利用される。つまり、各PE11の同期検出(バリア検
出)が、並列プロセスの割付を再開する条件として用い
られて、割込み生成機能7が実現される。
1のCPU14で実行される並列プロセスが1種類であ
るものとして説明しているが、この第3実施形態でも、
並列計算機10上で複数のジョブがそれぞれ並列プロセ
スとして実行されている場合にも対応することができ
る。ただし、その場合、転送されるパケットのヘッダ中
に、各ジョブに対応したプロセス識別子を設定する。ま
た、割込み生成機能24を実現する同期検出機構61を
プロセス識別子毎にそなえ、同期検出機構61による同
期検出およびおよび割込み信号の生成をプロセス識別子
毎に行なうことにより、ジョブ毎に、並列プロセスの非
活性化/活性化を行なうことができる。
機における並列プロセススケジューリング方法および並
列計算機用処理装置によれば、複数の並列ジョブを同時
に実行する、または、並列ジョブと非並列ジョブとを同
時に実行するような多重ジョブ環境において、並列同期
待ち状態にある並列プロセスをディスパッチする代わり
に実行可能な他のジョブのプロセスをディスパッチする
という協調スケジューリングが可能になるので、係る多
重ジョブ環境にある並列計算機のスループット性能の向
上に寄与するところが大きい(請求項1〜14)。
したこと,メッセージパケット受信量が期待値に到達し
たこと、あるいは、同期検出を並列同期待ち状態の解除
条件(割込み生成条件)として割込み信号を生成し、並
列プロセスの割付を再開して次のステップに移行し、当
該並列プロセスを、通常通り実行することができる(請
求項2,4,6,9,11,13)。
毎に割込み生成等を行なうことにより、並列計算機上で
複数のジョブがそれぞれ並列プロセスとして実行されて
いる場合でも、各ジョブ毎に、並列プロセスの非活性化
/活性化を行なうことができる(請求項3,5,7,1
0,12,14)。
ジューリング方法を適用された並列計算機の全体構成を
示すブロック図である。
理装置の要部構成を示すブロック図である。
説明するためのフローチャートである。
理装置の要部構成を示すブロック図である。
説明するためのフローチャートである。
理装置の要部構成を示すブロック図である。
ック図である。
ブロック図である。
を示す図である。
としてギャングスケジューリングを行なった場合の例を
示す図である。
Claims (14)
- 【請求項1】 個別に処理を実行する複数の処理装置
と、これらの複数の処理装置を相互に通信可能に接続す
る通信網とをそなえ、ある1つのジョブを、該複数の処
理装置のうちの2以上の処理装置により、ステップ毎に
同期させながら並列プロセスとして実行する並列計算機
において、 各処理装置が、当該並列プロセスとして今回のステップ
で割り付けられた処理を完了し、1以上の他処理装置が
当該並列プロセスとして今回のステップで割り付けられ
た処理を完了するのを待つ並列同期待ち状態になった
際、 当該並列プロセスの並列同期待ち状態になった処理装置
では、 当該並列プロセスの割付を禁止すべく当該並列プロセス
を不活性状態にするとともに、当該並列プロセスの割付
を再開する際に満たされるべき条件を設定し、 当該処理装置により実行可能な他のジョブが存在する場
合には、該他のジョブについてのプロセスの割付を行な
い、 前記条件が満たされると現在実行中の処理に対する割込
み信号を生成して、当該並列プロセスの割付を再開すべ
く当該並列プロセスを活性状態にすることを特徴とす
る、並列計算機における並列プロセススケジューリング
方法。 - 【請求項2】 該並列計算機において、データ処理動作
とは非同期に行なわれるパケット送受信により該通信網
を介して送信側処理装置から受信側処理装置へデータを
転送する場合、 当該並列プロセスの並列同期待ち状態になった処理装置
では、 当該並列プロセスを実行する前記他処理装置から当該処
理装置へ転送されるパケットの数を、カウンタをカウン
トアップまたはカウントダウンすることにより計数し、 並列同期待ち状態になってから前記他処理装置が今回の
ステップを完了するまでの間に当該処理装置へ転送され
る予定のパケットの数に基づいて、該カウンタによるカ
ウント値の期待値を設定し、 該期待値と該カウンタによる実カウント値とが一致した
場合に前記条件が満たされたものと判断して、前記割込
み信号を生成することを特徴とする、請求項1記載の並
列計算機における並列プロセススケジューリング方法。 - 【請求項3】 複数のジョブがそれぞれ並列プロセスと
して実行されている場合、 パケット中に、各ジョブに対応したプロセス識別子を設
定し、 各処理装置において、該期待値を前記プロセス識別子毎
に設定するとともに、該カウンタによるカウント値を格
納する領域を前記プロセス識別子毎に主記憶上に確保
し、 当該並列プロセスの並列同期待ち状態になった処理装置
では、該カウンタの計数,該期待値の設定および前記割
込み信号の生成を前記プロセス識別子毎に行なうことを
特徴とする、請求項2記載の並列計算機における並列プ
ロセススケジューリング方法。 - 【請求項4】 該並列計算機において、データ処理動作
とは非同期に行なわれるパケット送受信により該通信網
を介して送信側処理装置から受信側処理装置へデータを
転送し、特定種別のパケットであるメッセージパケット
を受信すると、その受信データを、ベースアドレスと書
込ポインタとの加算値に従って主記憶上のサイクリック
キューであるメッセージ受信キューに格納するととも
に、該書込ポインタの指示値を、該メッセージ受信キュ
ーにおける次の空き領域の先頭アドレスに更新する場
合、 当該並列プロセスの並列同期待ち状態になった処理装置
では、 並列同期待ち状態になってから前記他処理装置が今回の
ステップを完了するまでの間に当該処理装置へ転送され
る予定の全メッセージパケットのデータ容量等の情報に
基づいて、該書込ポインタの指示値の期待値を設定し、 該期待値と該書込ポインタの実指示値とが一致した場合
または該期待値と該書込ポインタの実指示値とが不一致
になった場合または該書込ポインタの実指示値が該期待
値を超えた場合に前記条件が満たされたものと判断し
て、現在実行中の処理に対する割込み信号を生成するこ
とを特徴とする、請求項1記載の並列計算機における並
列プロセススケジューリング方法。 - 【請求項5】 複数のジョブがそれぞれ並列プロセスと
して実行されている場合、 メッセージパケット中に、各ジョブに対応したプロセス
識別子を設定し、 各処理装置において、該期待値および該ベースアドレス
を前記プロセス識別子毎に設定するとともに、該メッセ
ージ受信キューおよび該書込ポインタを前記プロセス識
別子毎にそなえ、 当該並列プロセスの並列同期待ち状態になった処理装置
では、該メッセージ受信キューへのデータ書込,該書込
ポインタの更新,該期待値の設定および前記割込み信号
の生成を前記プロセス識別子毎に行なうことを特徴とす
る、請求項4記載の並列計算機における並列プロセスス
ケジューリング方法。 - 【請求項6】 該並列計算機において、該複数の処理装
置の相互間で、各処理装置が当該並列プロセスとして今
回のステップで割り付けられた処理を完了したか否かを
示す1ビット以上の状態値が送受信されるとともに、当
該並列プロセスを実行する処理装置からの状態値が全て
一致したことを検出すると同期検出信号を出力する同期
検出機構が各処理装置にそなえられている場合、 当該並列プロセスの並列同期待ち状態になった処理装置
では、当該処理装置の該同期検出機構から同期検出信号
が出力された場合に前記条件が満たされたものと判断し
て、現在実行中の処理に対する割込み信号を生成するこ
とを特徴とする、請求項1記載の並列計算機における並
列プロセススケジューリング方法。 - 【請求項7】 複数のジョブがそれぞれ並列プロセスと
して実行されている場合、各処理装置に該同期検出機構
を各並列プロセス毎にそなえ、当該並列プロセスの並列
同期待ち状態になった処理装置では、該同期検出機構に
よる同期検出およびおよび前記割込み信号の生成を各並
列プロセス毎に行なうことを特徴とする、請求項6記載
の並列計算機における並列プロセススケジューリング方
法。 - 【請求項8】 通信網を介して複数の他処理装置と相互
に通信可能に接続され並列計算機を構成する処理装置で
あって、ある1つのジョブを、該複数の他処理装置のう
ちの1以上の他処理装置とともに、ステップ毎に同期さ
せながら並列プロセスとして実行する並列計算機用処理
装置において、 当該並列プロセスとして今回のステップで割り付けられ
た処理を完了し、前記1以上の他処理装置が当該並列プ
ロセスとして今回のステップで割り付けられた処理を完
了するのを待つ並列同期待ち状態になった際に、当該並
列プロセスの割付を禁止すべく当該並列プロセスを不活
性状態にする不活性化機能と、 該不活性化機能による当該並列プロセスの不活性化と同
時に、当該並列プロセスの割付を再開する際に満たされ
るべき条件を設定する条件設定機能と、 実行可能な他のジョブが存在する場合には、当該並列プ
ロセスが不活性状態である期間中、該他のジョブについ
てのプロセスの割付を行なう割付機能と、 前記条件が満たされると現在実行中の処理に対する割込
み信号を生成する割込み生成機能と、 該割込み生成機能からの割込み信号に応じて、当該並列
プロセスの割付を再開すべく当該並列プロセスを活性状
態にする活性化機能とがそなえられていることを特徴と
する、並列計算機用処理装置。 - 【請求項9】 データ処理動作とは非同期に行なわれる
パケット送受信により、該通信網を介して該複数の他処
理装置との間でデータ転送を行なう転送処理部がそなえ
られるとともに、 該割込み生成機能が、 当該並列プロセスの並列同期待ち状態になると、当該並
列プロセスを実行する前記1以上の他処理装置から転送
されてくるパケットの数を、カウントアップまたはカウ
ントダウンすることにより計数するカウンタと、 該条件設定機能により、並列同期待ち状態になってから
前記1以上の他処理装置が今回のステップを完了するま
での間に前記1以上の他処理装置から転送されてくる予
定のパケットの数に基づいて、該カウンタによるカウン
ト値の期待値を設定される期待値レジスタと、 該期待値レジスタに設定された期待値と該カウンタによ
る実カウント値とを比較する比較器と、 該比較器による比較結果に応じ前記割込み信号を生成す
る割込み生成回路とから実現されていることを特徴とす
る、請求項8記載の並列計算機用処理装置。 - 【請求項10】 複数のジョブがそれぞれ並列プロセス
として実行されている場合、 パケット中に、各ジョブに対応したプロセス識別子が設
定され、 該期待値が前記プロセス識別子毎に設定されるととも
に、該カウンタによるカウント値を格納する領域が、前
記プロセス識別子毎に主記憶上に確保されていることを
特徴とする、請求項9記載の並列計算機用処理装置。 - 【請求項11】 データ処理動作とは非同期に行なわれ
るパケット送受信により該通信網を介して該複数の他処
理装置との間でデータ転送を行なう転送処理部をそな
え、 該転送処理部が、当該並列プロセスを実行する前記1以
上の他処理装置から特定種別のパケットであるメッセー
ジパケットを受信すると、その受信データを、ベースア
ドレスと書込ポインタとの加算値に従って主記憶上のサ
イクリックキューであるメッセージ受信キューに格納す
るとともに、該書込ポインタの指示値を、該メッセージ
受信キューにおける次の空き領域の先頭アドレスに更新
するように構成され、 該割込み生成機能が、 該条件設定機能により、並列同期待ち状態になってから
前記1以上の他処理装置が今回のステップを完了するま
での間に前記1以上の他処理装置から転送されてくる予
定の全メッセージパケットのデータ容量等の情報に基づ
いて、該書込ポインタの指示値の期待値を設定される期
待値レジスタと、 該期待値レジスタに設定された期待値と該書込ポインタ
の実指示値とを比較する比較器と、 該比較器による比較結果に応じ前記割込み信号を生成す
る割込み生成回路とから実現されていることを特徴とす
る、請求項8記載の並列計算機用処理装置。 - 【請求項12】 複数のジョブがそれぞれ並列プロセス
として実行されている場合、 メッセージパケット中に、各ジョブに対応したプロセス
識別子が設定され、 該期待値および該ベースアドレスが前記プロセス識別子
毎に設定されるとともに、該メッセージ受信キューおよ
び該書込ポインタが前記プロセス識別子毎にそなえられ
ていることを特徴とする、請求項11記載の並列計算機
用処理装置。 - 【請求項13】 該複数の他処理装置との間で、当該並
列プロセスとして今回のステップで割り付けられた処理
を完了したか否かを示す1ビット以上の状態値を送受信
するための状態通信部と、 該状態通信部を通じて得られた、当該並列プロセスを実
行する全ての処理装置の状態値が、一致したことを検出
すると同期検出信号を出力する同期検出機構とがそなえ
られ、 該条件設定機能により、該同期検出機構から同期検出信
号が出力されることが前記条件として設定され、 該割込み生成機能が該同期検出機構により実現され、該
同期検出機構からの同期検出信号が前記割込み信号とし
て用いられることを特徴とする、請求項8記載の並列計
算機用処理装置。 - 【請求項14】 複数のジョブがそれぞれ並列プロセス
として実行されている場合、該同期検出機構が各並列プ
ロセス毎にそなえられていることを特徴とする、請求項
13記載の並列計算機用処理装置。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP28102195A JP3573546B2 (ja) | 1995-10-27 | 1995-10-27 | 並列計算機における並列プロセススケジューリング方法および並列計算機用処理装置 |
| US08/677,984 US5781775A (en) | 1995-10-27 | 1996-07-10 | Parallel process scheduling method in a parallel computer and a processing apparatus for a parallel computer |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP28102195A JP3573546B2 (ja) | 1995-10-27 | 1995-10-27 | 並列計算機における並列プロセススケジューリング方法および並列計算機用処理装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH09128351A true JPH09128351A (ja) | 1997-05-16 |
| JP3573546B2 JP3573546B2 (ja) | 2004-10-06 |
Family
ID=17633189
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP28102195A Expired - Fee Related JP3573546B2 (ja) | 1995-10-27 | 1995-10-27 | 並列計算機における並列プロセススケジューリング方法および並列計算機用処理装置 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US5781775A (ja) |
| JP (1) | JP3573546B2 (ja) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2009223788A (ja) * | 2008-03-18 | 2009-10-01 | Fujitsu Microelectronics Ltd | プロセス間通信機構 |
| WO2012093496A1 (ja) * | 2011-01-07 | 2012-07-12 | 富士通株式会社 | マルチタスクスケジューリング方法、およびマルチコアプロセッサシステム |
| JP5590032B2 (ja) * | 2009-06-30 | 2014-09-17 | 富士通株式会社 | 計算装置および並列計算機システム |
| US8881265B2 (en) | 2011-09-08 | 2014-11-04 | Panasonic Intellectual Property Corporation Of America | Computer system, computer system control method, computer system control program, and integrated circuit |
| JP2016206817A (ja) * | 2015-04-20 | 2016-12-08 | 株式会社デンソー | 電子制御装置 |
| US10162675B2 (en) | 2015-03-23 | 2018-12-25 | Nec Corporation | Parallel processing system |
Families Citing this family (43)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3730740B2 (ja) * | 1997-02-24 | 2006-01-05 | 株式会社日立製作所 | 並列ジョブ多重スケジューリング方法 |
| US6253228B1 (en) * | 1997-03-31 | 2001-06-26 | Apple Computer, Inc. | Method and apparatus for updating and synchronizing information between a client and a server |
| JPH11259437A (ja) * | 1998-03-12 | 1999-09-24 | Hitachi Ltd | 不要バリア命令の削減方式 |
| JP2000132529A (ja) * | 1998-10-23 | 2000-05-12 | Sony Corp | 並列処理装置、並列処理方法および記録媒体 |
| JP3976432B2 (ja) * | 1998-12-09 | 2007-09-19 | エヌイーシーコンピュータテクノ株式会社 | データ処理装置およびデータ処理方法 |
| US6842899B2 (en) | 1999-12-21 | 2005-01-11 | Lockheed Martin Corporation | Apparatus and method for resource negotiations among autonomous agents |
| JP3349490B2 (ja) * | 2000-02-14 | 2002-11-25 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 画像表示方法、画像表示システム、ホスト装置、画像表示装置、およびディスプレイ用インターフェイス |
| US6317695B1 (en) | 2000-03-30 | 2001-11-13 | Nutec Sciences, Inc. | Seismic data processing method |
| DE10028140A1 (de) * | 2000-06-07 | 2001-12-20 | Siemens Ag | Verfahren zur Organisation des Ablaufs elektronisch gesteuerter Schaltvorgänge |
| US6993764B2 (en) * | 2000-06-30 | 2006-01-31 | The Regents Of The University Of California | Buffered coscheduling for parallel programming and enhanced fault tolerance |
| US7080376B2 (en) * | 2001-09-21 | 2006-07-18 | Intel Corporation | High performance synchronization of accesses by threads to shared resources |
| US7013344B2 (en) * | 2002-01-09 | 2006-03-14 | International Business Machines Corporation | Massively computational parallizable optimization management system and method |
| US7577816B2 (en) * | 2003-08-18 | 2009-08-18 | Cray Inc. | Remote translation mechanism for a multinode system |
| US7653906B2 (en) * | 2002-10-23 | 2010-01-26 | Intel Corporation | Apparatus and method for reducing power consumption on simultaneous multi-threading systems |
| JP4891521B2 (ja) * | 2003-03-28 | 2012-03-07 | 三洋電機株式会社 | データ入出力方法、およびその方法を利用可能な記憶装置およびホスト装置 |
| US7503048B1 (en) | 2003-08-18 | 2009-03-10 | Cray Incorporated | Scheduling synchronization of programs running as streams on multiple processors |
| US7743223B2 (en) * | 2003-08-18 | 2010-06-22 | Cray Inc. | Decoupling of write address from its associated write data in a store to a shared memory in a multiprocessor system |
| US8307194B1 (en) | 2003-08-18 | 2012-11-06 | Cray Inc. | Relaxed memory consistency model |
| US7735088B1 (en) * | 2003-08-18 | 2010-06-08 | Cray Inc. | Scheduling synchronization of programs running as streams on multiple processors |
| US7519771B1 (en) | 2003-08-18 | 2009-04-14 | Cray Inc. | System and method for processing memory instructions using a forced order queue |
| US7421565B1 (en) * | 2003-08-18 | 2008-09-02 | Cray Inc. | Method and apparatus for indirectly addressed vector load-add -store across multi-processors |
| US7543133B1 (en) | 2003-08-18 | 2009-06-02 | Cray Inc. | Latency tolerant distributed shared memory multiprocessor computer |
| US8171474B2 (en) * | 2004-10-01 | 2012-05-01 | Serguei Mankovski | System and method for managing, scheduling, controlling and monitoring execution of jobs by a job scheduler utilizing a publish/subscription interface |
| US8392900B1 (en) * | 2005-03-17 | 2013-03-05 | Hewlett-Packard Development Company, L.P. | Methods and systems for barrier reduction in parallel processing systems |
| US8478834B2 (en) | 2007-07-12 | 2013-07-02 | International Business Machines Corporation | Low latency, high bandwidth data communications between compute nodes in a parallel computer |
| US8959172B2 (en) * | 2007-07-27 | 2015-02-17 | International Business Machines Corporation | Self-pacing direct memory access data transfer operations for compute nodes in a parallel computer |
| US20090031001A1 (en) * | 2007-07-27 | 2009-01-29 | Archer Charles J | Repeating Direct Memory Access Data Transfer Operations for Compute Nodes in a Parallel Computer |
| US9009350B2 (en) * | 2008-04-01 | 2015-04-14 | International Business Machines Corporation | Determining a path for network traffic between nodes in a parallel computer |
| US9225545B2 (en) * | 2008-04-01 | 2015-12-29 | International Business Machines Corporation | Determining a path for network traffic between nodes in a parallel computer |
| US8266477B2 (en) * | 2009-01-09 | 2012-09-11 | Ca, Inc. | System and method for modifying execution of scripts for a job scheduler using deontic logic |
| US8544026B2 (en) * | 2010-02-09 | 2013-09-24 | International Business Machines Corporation | Processing data communications messages with input/output control blocks |
| US8949453B2 (en) | 2010-11-30 | 2015-02-03 | International Business Machines Corporation | Data communications in a parallel active messaging interface of a parallel computer |
| US8949328B2 (en) | 2011-07-13 | 2015-02-03 | International Business Machines Corporation | Performing collective operations in a distributed processing system |
| US8930962B2 (en) | 2012-02-22 | 2015-01-06 | International Business Machines Corporation | Processing unexpected messages at a compute node of a parallel computer |
| US20130247069A1 (en) * | 2012-03-15 | 2013-09-19 | International Business Machines Corporation | Creating A Checkpoint Of A Parallel Application Executing In A Parallel Computer That Supports Computer Hardware Accelerated Barrier Operations |
| US10142417B2 (en) | 2012-04-17 | 2018-11-27 | Nimbix, Inc. | System and method for managing heterogeneous data for cloud computing applications |
| US8775576B2 (en) | 2012-04-17 | 2014-07-08 | Nimbix, Inc. | Reconfigurable cloud computing |
| US9973566B2 (en) | 2013-11-17 | 2018-05-15 | Nimbix, Inc. | Dynamic creation and execution of containerized applications in cloud computing |
| US9519490B2 (en) | 2013-03-07 | 2016-12-13 | Microsoft Technology Licensing, Llc | Adaptive data synchronization |
| US9329899B2 (en) | 2013-06-24 | 2016-05-03 | Sap Se | Parallel execution of parsed query based on a concurrency level corresponding to an average number of available worker threads |
| US9588983B2 (en) | 2013-10-17 | 2017-03-07 | Microsoft Technology Licensing, Llc | Data classification for adaptive synchronization |
| DE102017209697A1 (de) * | 2016-06-13 | 2017-12-14 | Denso Corporation | Parallelisierungsverfahren, Parallelisierungswerkzeug und fahrzeuginterne Vorrichtung |
| US10235207B2 (en) * | 2016-09-30 | 2019-03-19 | Nimbix, Inc. | Method and system for preemptible coprocessing |
Family Cites Families (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6385858A (ja) * | 1986-09-30 | 1988-04-16 | Agency Of Ind Science & Technol | 手続の並列実行管理方式 |
| US5438680A (en) * | 1988-04-29 | 1995-08-01 | Intellectual Properties And Technology, Inc. | Method and apparatus for enhancing concurrency in a parallel digital computer |
| DE68927946T2 (de) * | 1988-08-02 | 1997-10-16 | Philips Electronics Nv | Verfahren und Vorrichtung für die Synchronisierung von parallelen Prozessoren unter Verwendung einer unscharf definierten Sperre |
| JP2829078B2 (ja) * | 1990-02-05 | 1998-11-25 | 株式会社日立製作所 | プロセス分散方法 |
| US5339415A (en) * | 1990-06-11 | 1994-08-16 | Cray Research, Inc. | Dual level scheduling of processes to multiple parallel regions of a multi-threaded program on a tightly coupled multiprocessor computer system |
| JP2770603B2 (ja) * | 1991-03-14 | 1998-07-02 | 三菱電機株式会社 | 並列計算機 |
| FR2684467B1 (fr) * | 1991-11-29 | 1994-03-04 | Sextant Avionique | Procede pour le test et, eventuellement, la validation des primitives d'un executif temps reel. |
| JP2772304B2 (ja) * | 1992-04-10 | 1998-07-02 | 富士通株式会社 | 並列処理の負荷均一化方法 |
| US5590323A (en) * | 1994-05-13 | 1996-12-31 | Lucent Technologies Inc. | Optimal parallel processor architecture for real time multitasking |
| US5615127A (en) * | 1994-11-30 | 1997-03-25 | International Business Machines Corporation | Parallel execution of a complex task partitioned into a plurality of entities |
-
1995
- 1995-10-27 JP JP28102195A patent/JP3573546B2/ja not_active Expired - Fee Related
-
1996
- 1996-07-10 US US08/677,984 patent/US5781775A/en not_active Expired - Lifetime
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2009223788A (ja) * | 2008-03-18 | 2009-10-01 | Fujitsu Microelectronics Ltd | プロセス間通信機構 |
| JP5590032B2 (ja) * | 2009-06-30 | 2014-09-17 | 富士通株式会社 | 計算装置および並列計算機システム |
| WO2012093496A1 (ja) * | 2011-01-07 | 2012-07-12 | 富士通株式会社 | マルチタスクスケジューリング方法、およびマルチコアプロセッサシステム |
| JP5720699B2 (ja) * | 2011-01-07 | 2015-05-20 | 富士通株式会社 | マルチタスクスケジューリング方法、およびマルチコアプロセッサシステム |
| US9563465B2 (en) | 2011-01-07 | 2017-02-07 | Fujitsu Limited | Multi-task scheduling method for assigning threads based on time slices to multi-core processors and multi-core processor system therefor |
| US8881265B2 (en) | 2011-09-08 | 2014-11-04 | Panasonic Intellectual Property Corporation Of America | Computer system, computer system control method, computer system control program, and integrated circuit |
| US10162675B2 (en) | 2015-03-23 | 2018-12-25 | Nec Corporation | Parallel processing system |
| JP2016206817A (ja) * | 2015-04-20 | 2016-12-08 | 株式会社デンソー | 電子制御装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| US5781775A (en) | 1998-07-14 |
| JP3573546B2 (ja) | 2004-10-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH09128351A (ja) | 並列計算機における並列プロセススケジューリング方法および並列計算機用処理装置 | |
| JP3557947B2 (ja) | 複数のプロセッサで同時にスレッドの実行を開始させる方法及びその装置並びにコンピュータ可読記録媒体 | |
| EP1242883B1 (en) | Allocation of data to threads in multi-threaded network processor | |
| JP2511397B2 (ja) | 多重プロセッサデ―タ処理システム及びその操作方法 | |
| JP3010400B2 (ja) | 共有メモリ制御方法及び共有メモリ制御装置 | |
| JP2008506187A (ja) | 複数のカーネルの並列実行のための方法およびシステム | |
| WO2020186836A1 (zh) | 任务调度 | |
| JPH1185618A (ja) | 仮想メモリ変換を制御する方法 | |
| US7007138B2 (en) | Apparatus, method, and computer program for resource request arbitration | |
| CA1304513C (en) | Multiple i/o bus virtual broadcast of programmed i/o instructions | |
| JP4168281B2 (ja) | 並列処理システム、インタコネクションネットワーク、ノード及びネットワーク制御プログラム | |
| JP4608100B2 (ja) | 多重処理システムにおける改良結果処理方法 | |
| US7590990B2 (en) | Computer system | |
| US20030014558A1 (en) | Batch interrupts handling device, virtual shared memory and multiple concurrent processing device | |
| JP2002530736A5 (ja) | ||
| CN108958904B (zh) | 嵌入式多核中央处理器的轻量级操作系统的驱动程序框架 | |
| JPH11312148A (ja) | バリア同期方法及び装置 | |
| CN108958905B (zh) | 嵌入式多核中央处理器的轻量级操作系统 | |
| CN100576175C (zh) | 用于多个内核的并行执行的方法和系统 | |
| EP0884682A2 (en) | Cache memory management method for real time operating system | |
| JP2708172B2 (ja) | 並列処理方法 | |
| JP3524961B2 (ja) | マルチプロセッサシステムおよび同システムにおけるタスクスケジューリング方法 | |
| CN121187791B (zh) | 基于多核CPU的Linux用户态下保证硬实时的方法 | |
| JP2795312B2 (ja) | プロセス間通信スケジューリング方式 | |
| JPH08106440A (ja) | 分散共有メモリ計算機システム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040227 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040323 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040521 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040622 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040629 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080709 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090709 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100709 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100709 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110709 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110709 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120709 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120709 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130709 Year of fee payment: 9 |
|
| LAPS | Cancellation because of no payment of annual fees |