JPH0341550A

JPH0341550A - 並列分散処理方法

Info

Publication number: JPH0341550A
Application number: JP17782489A
Authority: JP
Inventors: Mie Inaoka; 稲岡　美恵; Kenji Shima; 憲司嶋
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1989-07-10
Filing date: 1989-07-10
Publication date: 1991-02-22

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】【産業上の利用分野】

この発明は、並列処理装置で実行させるプログラムを前
記並列処理装置を構成する複数のプロセフすに割り付け
る並列分散処理方法に関するものである。

【従来の技術】

第４図は、巡回パイプライン機能を有するデータ駆動形
のプロセッサの構成を示すブロック図である。第５図は
、このデータ駆動形プロセッサで使用するパケットの構
成図であり、このパケットはタグ（データの識別子）、
第１データおよび第２データで構成され、該タグはスル
ーパケットフラグ、外部フラグ、世代番号あるいはカラ
一番号、行先ノード番号、命令およびＬ／Ｒフラグより
構成されている。第４図において、１０は外部よりデータおよびタグから
なるパケットを入力する入力部、１１はデータフローグ
ラフを記憶し、前記入力部１０から出力されたパケット
のタグの一部であるノード番号に従って命令を読み出し
、この読み出した命令を新たなタグとし、前記パケット
のデータとともに命令パケットを生成するプログラム記
憶部、１２は前記プログラム記憶部１１から出力された
命令パケットを人力し、該命令パケットが有するタグと
同一のタグを有する命令パケットを検出して演算パケッ
トとして出力するか、検出できない場合は前記プログラ
ム記憶部１工から入力された該命令パケットを記憶する
発火処理部、１３は前記発火処理部１２から出力された
演算パケットを入力し、該演算パケットのタグの一部で
指定される演算を実行し、結果パケットを出力する演算
処理部、１４は前記演算処理部１３から出力される結果
パケットを人力し、該結果パケットのタグの一部である
外部フラグの指示により外部へ出力するか、あるいは前
記入力部１０へ出力する出力部である。第６図は以上のように構成されるデータ駆動形プロセッ
サに実行させるための、従来の並列分散処理方法を示す
フローチャートであり、以下第７図で示されるデータフ
ローグラフを第８図に示すように各プロセッサに分割す
るアルゴリズムについて説明する。分割するプログラム（第８図で示すデータフローグラフ
）は、各ランクａｎ（ｎ＝ｔ＋ｚ＋・・・＋ｎ）にｂ個
のノードが並列に配置されているとすると、まず、第８
図の総ノード数を求め（ステップ５Ｔ１）、第（１１式
より１つのプロセッサあたりの分割ノード数を決める（
ステップ５Ｔ２）。総ノード数・・・・・・・・・（１）使用するプロセッサ数次にランクａ１から順番に、ステップＳＴ２で求めた１
つのプロセッサあたりの分割ノード数ずつ各プロセッサ
に割り付ける。データ駆動形プ９センサでは同一ランクのノードは並列
に実行される。従って、各ランク毎のノード数（各ラン
クの並列度と同義）を調べることにより、プロセッサに
かかる負荷変化の概要がわかる。この負荷変化の概要と
してランク数と各ランクのノード数（並列度）との関係
を示したグラフが第９図である。上述した従来の並列分散処理方法は、各プロセッサに割
り付けるノード数を均等にしているので（第１０図）、
各プロセッサのプログラム容量は均等になるが、この各
プロセッサにかかる負荷をそのプロセッサ内で並列に処
理されるノード数で測った場合、負荷が均等化されてい
るとはいえない。また、各世代でプログラムを実行させ
る場合（１度に入力する数個のパケットの組を世代と呼
び、その世代を連続的に入力する）、各プロセッサにか
かる負荷（並列に処理されるノード数）がこの各プロセ
ンサに割り付けられたノード数にほぼ等しいと仮定する
と、この負荷は均等に割り付けられているといえる。し
かし、ノードを等しくするためには、プログラムにおけ
る並列度が高い部分（第１０図の場合、第４．第５プロ
セツサに割り付けられている部分）のノードを割り付け
られるプロセンサでのランク数が、他の部分よりも少な
くなり、そのため、並列度の高い部分でのプロセッサ間
転送が多くなる。また、並列度が高い部分のみ各ランク
毎のノードを分割する方法（第１１図）もあるが、その
場合もプロセッサ間転送の増加は回避できない。

【発明が解決しようとする課題】

従来の並列分散処理方式は以上のように構成されている
ので、各プロセッサの負荷を分散して均等化すると、プ
ログラムにおける高並列度の部分ではプロセッサ間転送
が増加するなどの課題があった。この発明は上記のような課題を解消するためになされた
もので、プロセンサ間転送を減少させるとともに、各プ
ロセッサにかかる負荷を均等化する並列分散処理方法を
得ることを目的とする。

【課題を解決するための手段】

この発明に係る並列分散処理方法は、並列処理装置で実
行するプログラムをランク数の均等な複数のプロセスに
分割し、前記並列処理装置を構成する複数のプロセッサ
の中から、各プロセンサの並列処理能力を考慮して各プ
ロセスの並列度に対応した台数だけ、各プロセス毎に割
り付け、各プロセス毎に決定されたプロセッサへ世代を
投入し、各世代毎に動作させることで、順次各プロセス
を実１行するようにしたものである。

【作　用】

この発明における並列分散処理方法は、実行するプログ
ラムをランク数の均等なプロセスに分割したので、並列
度の高いプロセスを実行する場合でもプロセッサ間転送
の増加を防ぐとともに、並列度の高いプロセスは同一プ
ロセスを複数のプロセッサで実行するので、各プロセッ
サの負荷を均等化する。

【発明の実施例】

以下、この発明の一実施例を第１図のフローチャートを
用いて説明するが、ここで分割するプログラムは第７図
に示したデータフローグラフを考え、実行するプロセッ
サとしては第４図に示した巡回パイプライン機能を有す
るデータ駆動形プロセッサとする。まず、実行するプログラムをランク数が均等になるよう
に複数のプロセスに分割しくステップ５Ｔ４）、この分
割されたプロセス毎に平均並列度（各ランクの並列度は
そのランク中のノード数である）を求める（ステップ５
Ｔ５）。ここで１つのプロセスについて平均並列度とプ
ロセッサのパイプライン段数（プロセッサの機能分割数
で、この数が大きいほど並列処理能力が大きい）から各
プロセスに割り付けられるプロセッサ数ｍを求める（ス
テップ５Ｔ６）。ｍ＝〔（平均並列度）／（パイプライン段数）〕・・・
（２）ここで、第（２）式の記号〔〕は（平均並列度）／（パ
イプライン段数）を越えない最大の整数を求める記号で
ある。さらにこのプロセスを実行するプロセッサを並列
処理装置を構成する複数のプロセッサの中からｍ個割り
付けると（ステップ５Ｔ７）、このｍ個のプロッサに順
次世代データを割り振るために（世代データを第２図の
ように順次割り振る）前のプロセスの出力（第３図（ａ
））を、第３図（ｂ）に示すような条件で第１から第ｍ
のこのプロセスに割り付けられたプロセッサのいずれか
へ分散的に出力するように書換える（ステップ５Ｔ８）
。以上のステップＳＴ６からの処理は各プロセスについ
て順次実行されるが、この実行したプロセスが当該プロ
グラムの最終プロセスであることが確認されると（ステ
ップ５Ｔ９）プロセッサへの割り付けは終了し、世代毎
に実行する。連続多世代でプログラムを実行させたとき、各プロセス
にかかる負荷が、プロセス内のノード数に等しいと仮定
し、該プロセスの平均並列度がプロセッサのパイプライ
ン段数に等しい時（状態１）の負荷を１とすると、（平均並列度）／（パイプライン段数）＃ｍ（：整数）
・・・（３）であるプロセスの負荷はｍとなる（状態２）。この発明によると状態２のプロセスは、ｍ個のプロセッ
サに割り付けられることになり、各プロセッサの世代流
量は状ｃ、１の１／ｍとなる。従って、プロセッサ１個
あたりの負荷はｍ　ｘ　’へ＝１となり、平均並列度が
パイプライン段数に等しい場合と同じになる。また、こ
の時ランク数は他のプロセスと同じであり、実行世代毎
にプロセッサに順次投入するので、他のプロセッサと比
較して、特に該プロセスのプロセッサ間転送が増加する
ということはない。なお、上記実施例では各プロセスに割り付けるプロセッ
サ数を決定する指標に、プロセッサのパイプライン段数
を使用したが、各プロセスの平均並列度のうち、最小値
を使用することにより、平均並列度の最小値で各プロセ
ンサの負荷を均等化できる。また、上記実施例では動作プログラムを変化させて、ソ
フトウェアにより各プロセスを実行するプロセッサを割
り付けたが、ハードウェアの命令に世代別出力命令を付
加させる（命令数を増やす）ことにより、ハードウェア
で実現することも可能である。

【発明の効果】

以上のように、この発明によればプログラムをランク数
の均等なプロセスに分割し、並列処理装置を構成する複
数のプロセッサの中から、各プロセスの並列度に対応し
た台数だけ実行するプロセッサをプロセス毎に割り付け
、この割り付けられたプロフサに世代データを投入して
動作させ、順次各プロセスを実行するようにしたので、
各プロセスにおけるプロセッサ間転送の回数のばらつき
を防ぎ、各プロセッサの負荷を均等化できる効果がある
。

【図面の簡単な説明】

第１図はこの発明の一実施例による並列分散処理方法の
動作を説明するフローチャート、第２図は各プロセスを
実行するプロセッサに投入する世代の振分は動作を示す
図、第３図は世代毎の出力プロセッサの決定動作を示す
図、第４図はこの発明および従来技術により分割された
プログラムを実行する巡回パイプライン機能を有するデ
ータ駆動形プロセッサを示すブロック図、第５図はこの
データ駆動形プロセッサに入力されるパケットを示す構
成図、第６図は従来の並列分散処理方法の動作を説明す
るフローチャート、第７図はもとのプログラムとしての
データフローグラフ図、第８図は従来の並列分散処理方
法による分割結果を示す図、第９図は第７図のデータフ
ローグラフのランク数とノード数の関係を示すグラフ図
、第１０図は第９図のグラフに分割結果を示したグラフ
図、第１１図は第１０図と同様に第９図のグラフに分割
結果を示したグラフ図である。図において、１０は入力部、１１はプログラム記憶部、
１２は発火処理部、１３は演算処理部、１４は出力部で
ある。なお、図中、同一符号は同一、又は相当部分を示す。特許出　願　人　三菱電機株式会社「岑）　　さぐｑの第９図うｉり第０図第］］図

Claims

【特許請求の範囲】

並列処理を実行する並列処理装置を構成し、多世代実行
が可能な複数のプロセッサに、前記並列処理装置で多世
代実行させるプログラムを割り付ける並列分散処理方法
において、前記並列処理装置で実行するプログラムをラ
ンク数の均等な複数のプロセスに分割し、前記各プロセ
ス毎にこのプロセスを実行するプロセッサを、プロセス
の並列度に対応した台数だけ前記複数のプロセッサの中
からそれぞれ割り付けし、前記プロセスを割り付けられ
たプロセッサに世代データを投入し、該投入された世代
毎に実行させることを特徴とする並列分散処理方法。