JPH06103248A

JPH06103248A - 並列処理計算機

Info

Publication number: JPH06103248A
Application number: JP4250858A
Authority: JP
Inventors: Kazuyuki Tanaka; 一行田中
Original assignee: Sanyo Electric Co Ltd
Current assignee: Sanyo Electric Co Ltd
Priority date: 1992-09-21
Filing date: 1992-09-21
Publication date: 1994-04-15

Abstract

(57)【要約】【構成】全ての処理要素を放送可能モードに設定した
後、放送禁止モードにすべき処理要素にホスト計算機１
２から放送禁止指定パケットを入力し、全ての処理要素
を放送許可モードあるいは放送禁止モードに設定する。
ホスト計算機１２の命令によって、放送禁止モードの処
理要素にデータを放送しない放送パケットを入力する
と、放送許可モードの処理要素では、放送パケットが
保持するデータを自身のメモリまたはレジスタに書き込
み、ＰＥ番号をインクリメントして隣接するプロセサに
向けて転送する。放送禁止モードの処理要素では、デー
タを自身のメモリには書き込まずにプロセサ番号のイン
クリメントのみを行う。【効果】任意の処理要素に放送パケットのデータを書
き込める。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は並列処理計算機に関
し、特にたとえば複数の処理要素を含み、処理要素間に
おいて、各処理要素に付与された処理要素番号に従って
データの送受信を行う、並列処理計算機に関する。

【０００２】

【従来の技術】近年、実用的な並列処理計算機の実現に
向けて研究が進められている。特に、半導体技術の進歩
に伴い、通信制御部とデータ処理部とを１チップＬＳＩ
の処理要素として実現し、この処理要素ＬＳＩを多数個
接続して並列処理計算機を実現する研究が多く見られ
る。

【０００３】たとえば、昭和５９年（１９８４年）４月
９日付で発行された“日経エレクトロニクス(Nikkei El
ectronics)”の第１８１頁から第２１８頁に開示されて
いる並列処理計算機においては、ＩｍＰＰ(Image Pipel
ined Processor) と呼ばれる１チップの処理要素を複数
個リング状に接続してデータの送受信を行う、データ通
信システムが構成される。

【０００４】また、本件発明者等は、情報処理学会第３
８回（平成元年（１９８９年）前期）全国大会論文集２
Ｔ−２の第１０４８頁−１０４９頁に開示されているよ
うに、１チップ化された処理要素を最大１０２４台接続
した大規模並列データ駆動計算機ＥＤＤＥＮ(Enhanced
Data Driven ENgine) の開発を進めている。これらの従
来の並列処理計算機では、ホスト計算機から各処理要素
にデータを入力する場合、処理要素毎にデータをロード
するか、または全ての処理要素に同じデータを放送（ブ
ロードキャスト）するしかできない。

【０００５】

【発明が解決しようとする課題】したがって、一部の処
理要素にはデータを入力させたくない場合には、データ
を放送することはできない。したがって、データを入力
させたくないプロセサ以外の全てのプロセサに対して、
各処理要素毎にデータをロードしていかなければなら
ず、手間がかかってしまうという問題点があった。

【０００６】それゆえに、この発明の主たる目的は、任
意の処理要素にのみ同じデータを放送できる、並列処理
計算機を提供することである。

【０００７】

【課題を解決するための手段】この発明は、複数の処理
要素、複数の処理要素を結合してネットワークを構成す
る通信線、および各処理要素を放送禁止モードおよび放
送許可モードのいずれかに設定する放送モード設定手段
を備え、放送許可モードに設定された処理要素のみが放
送データを取り込む、並列処理計算機である。

【０００８】

【作用】放送モード設定手段によって、各処理要素を放
送許可モードあるいは放送禁止モードに設定する。そし
て、放送禁止モードの処理要素には放送しない放送パケ
ットを入力すると、放送許可モードの処理要素では、放
送パケットが保持する放送データを自身のメモリまたは
レジスタに書き込み、プロセサ番号をインクリメントし
て放送パケットを隣接プロセサに転送する。放送禁止モ
ードの処理要素では、放送パケットが保持する放送デー
タを自身のメモリおよびレジスタに書き込まず、プロセ
サ番号のインクリメントだけを行い、放送パケットを隣
接プロセサに転送する。これを処理要素のモードに応じ
て繰り返すことによって、放送許可モードの全ての処理
要素に放送パケットが保持する放送データを書き込む。

【０００９】

【発明の効果】この発明によれば、任意の処理要素に、
放送パケットが保持する放送データを書き込むことがで
きる。この発明の上述の目的，その他の目的，特徴およ
び利点は、図面を参照して行う以下の実施例の詳細な説
明から一層明らかとなろう。

【００１０】

【実施例】図１はこの発明の一実施例としてのデータ駆
動並列処理計算機を示すブロック図である。以下におい
てはこの発明がデータ駆動並列処理計算機に適用された
場合について説明するが、この発明は、特に言及した場
合を除いて、データ駆動形以外の並列処理計算機にも同
様に適用できることを予め指摘しておく。

【００１１】図１を参照して、この実施例の並列処理計
算機１０はホスト計算機（これは上位ネットワークであ
ってもよい）１２を含み、このホスト計算機（または上
位ネットワーク）１２が、インタフェース１４を介し
て、ネットワーク１６に結合される。このインタフェー
ス１４はバスインタフェースまたはクラスタインタフェ
ースである。

【００１２】ネットワーク１６はメッシュ配列された多
数の処理要素ＰＥ00−ＰＥmnを含む。処理要素ＰＥ00−
ＰＥmnの各々は、具体的には、図２に示すように構成さ
れる。ネットワーク１６上においては、処理要素ＰＥ00
−ＰＥmnはトーラスメッシュネットワークとして構成さ
れる。なお、トーラスメッシュネットワークとは、多数
の処理要素をマトリクス状に配置し、行方向の処理要素
を互いに循環的に結合しかつ列方向の処理要素を互いに
循環的に結合する行方向通信線ＲＣおよび列方向通信線
ＣＣによって、任意の処理要素間におけるデータ通信を
可能にする構成を意味する。図１実施例でいえば、第１
行に配列されたｎ個の処理要素ＰＥ00−ＰＥ0nは行方向
通信線ＲＣ0 によって循環的に（リング状に）結合さ
れ、第２行に含まれる処理要素ＰＥ10−ＰＥ1nは行方向
通信線ＲＣ1 によって循環的に結合され、そして第ｍ行
の処理要素ＰＥm0−ＰＥmnは行方向通信線ＲＣm によっ
て循環的に結合される。さらに、第１列に配置されたｍ
個の処理要素ＰＥ00−ＰＥm0は列方向通信線ＣＣ0 によ
って循環的に結合され、第２列に含まれる処理要素ＰＥ
01−ＰＥm1は列方向通信線ＣＣ1 によって循環的に結合
され、そして第ｎ列の処理要素ＰＥ0n−ＰＥmnは列方向
通信線ＣＣn によって循環的に結合される。

【００１３】このトーラスメッシュネットワークにおい
ては、ホスト計算機１２と各処理要素ＰＥ00−ＰＥmnと
の間でデータを通信するために、各列方向通信線ＣＣ0
，ＣＣ1 ，・・・，ＣＣn に、それぞれ、インサータ
として、ネットークインタフェースＮＩＦを挿入する。
図２に示す処理要素ＰＥは、１チップのＬＳＩとして構
成され、基本的には、ネットワーク制御部(Network Con
trol Unit ：ＮＣ) １８とパイプラインリング(Pipelin
e Ring：ＰＲ）２０とを含み、プログラムストレージ(P
rogram StorageUnit ：ＰＳ) ２２，発火制御およびカ
ラー管理部(Firing Control & Color Management Unit
：ＦＣＣＭ) ２４，命令実行部(Execution Unit ：Ｅ
ＸＥ) ２６およびキューメモリ(Queue Memory ：ＱＭ)
２８を含む。このＰＲ２０とＮＣ１８との間で、入力制
御部(Input Control Unit ：ＩＣ) ３０および入力バッ
ファ(Input Buffer ：ＩＢＵＦ) ３２，ならびに出力制
御部(Output Control Unit：ＯＣ) ３４および出力バッ
ファ(Output Buffer：ＯＢＵＦ) ３６を介して、データ
の授受が行われる。

【００１４】ＮＣ１８は、トーラスメッシュネットワー
ク１６（図１）を構築するための４つの双方向通信リン
クないしポート北（Ｎ），東（Ｅ），南（Ｓ）および西
（Ｗ）を有し、ＰＲ２０とＮＣ１８との間のデータの授
受および他の処理要素またはホスト計算機１２とのデー
タの授受を制御する。すなわち、ＮＣ１８は、４つのポ
ートＮ，Ｅ，ＳおよびＷのいずれか１つから入力された
パケットを、ＩＢＵＦ３２に入力するか、あるいは他の
ポートに出力する。さらにまた、ＮＣ１８は、ＰＲ２０
から出力されるパケットを４つのポートＮ，Ｅ，Ｓおよ
びＷのいずれかに出力する。そして、ＮＣ１８は或るポ
ートから入力されたパケットが最短距離で宛先処理要素
に到達するように、その入力パケットを所定のポートに
出力するセルフルーティング機能を有する。

【００１５】ＩＢＵＦ３２は、ＮＣ１８から入力された
パケットを一時的に蓄えることができるように、１パケ
ット分のバッファレジスタで構成され、このＩＢＵＦ３
２に入力されたパケットは、ＩＣ３０によってＰＲ２０
に入力される。このＩＣ３０は、以下に示すコントロー
ルレジスタなどの種々のレジスタを含み、それが含まれ
る処理要素の処理要素番号（ＰＥ番号），ダンプされた
パケットを送るべき宛先ＰＥ番号，処理要素の状態フラ
グなどを記憶する。なお、ＩＣ３０は、必要に応じて、
パケットをベクトル演算制御部(Vector Operation Cont
rol Unit：ＶＣ) ３８に与える。

【００１６】コントロールレジスタは、図３に示すよう
に、外部データメモリ４０のバンクアドレスを含む。パ
ケットのフィールドアドレスは１６ビット（図４）であ
るのに対し、外部データメモリ４０のアドレスは最大２
０ビット（図示せず）である。したがって、４ビットの
バンクアドレスをパケットのフィールドアドレスの上位
ビットとして加えることによって、外部データメモリ４
０の最大アドレスに対してもアクセスできるようにして
いる。また、コントロールレジスタは、処理要素自体の
実行モードを変える動作モードコードを含み、動作モー
ドコードによって、ＦＣＣＭ２４のハッシュアドレスを
コントロールしたり、出力制御部３４を制御したりす
る。さらに、コントロールレジスタは、ＶＣ３８のＡＬ
Ｕの演算モードを設定する演算制御モードコードを含
む。そして、コントロールレジスタの最上位ビットが、
各処理要素が放送許可モードであるか、放送禁止モード
であるかを示すモード設定フラグとなる。モード設定フ
ラグが“１”のときは放送禁止モードとなり、“０”の
ときは放送許可モードとなる。

【００１７】ＱＭ２８はたとえば６４パケット分の容量
を有するＦＩＦＯ(First-In First-Out)メモリとして構
成される。このＱＭ２８は、パケットが入力されたとき
あるいはパケットをコピーするときに生じるＰＲ２０上
におけるパケット数の一時的な増加，およびＰＲ２０上
における種々の処理のための時間のばらつきに起因する
データ流の変動を吸収する。

【００１８】ＰＳ２２は、ＥＤＭ４０に格納されたデー
タ駆動形のプログラム（データフローグラフの接続情報
と各ノードの命令コードなどを列記したテーブル）に基
づき、ノード番号や命令などの制御情報の更新，データ
のコピー，定数の付与などを行う。ＯＣ３４は、ＰＲ２
０上のパケット、あるいはＶＣ３８からのパケットをＯ
ＢＵＦ３６に出力する。このＯＢＵＦ３６は、ＯＣ３４
からの出力パケットを一時的に蓄えることができる、１
パケット分の容量を有する。このＯＢＵＦ３６から、Ｎ
Ｃ１８に出力されたパケットが前述のように、４つのポ
ートＮ，Ｅ，ＳおよびＷのいずれかに出力される。

【００１９】ＦＣＣＭ２４は、命令を実行するための左
右オペランドの待ち合わせ，同期処理のための多数のデ
ータの待ち合わせ，サブルーチンコールの際のカラーの
獲得、あるいはサブルーチンリターンの際のカラーの返
却を実行する。このＦＣＣＭ２４から出力されるパケッ
トがＥＸＥ２６に与えられ、このＥＸＥ２６では３２ビ
ット浮動小数点演算，３２ビット整数演算，メモリアク
セス，ベクトル演算，構造体入出力，条件判定，分岐な
ど種々の命令を実行する。

【００２０】なお、処理要素ＰＥは、たとえば５１２Ｋ
バイトのＳＲＡＭで構成される外部データメモリ(Exter
nal Data Memory ：ＥＤＭ) ４０を有し、プログラム情
報などのデータを格納する。このＥＤＭ４０はまたロー
カルメモリとして使用される。ＶＣ３８は、ＥＤＭ４０
に格納されているベクトルどうしの演算，ベクトルと定
数との演算，ベクトルデータの総和，ベクトルのコピー
などのベクトル演算命令を制御する。ただし、このＶＣ
３８では、通常のメモリアクセス命令も制御される。

【００２１】動作において、まず全ての処理要素を放送
許可モードに設定しておく。そして、ホスト計算機１２
の命令によって、放送禁止モードにすべき処理要素に放
送禁止指定パケットを与える。放送禁止指定パケットの
処理要素間でのパケットフォーマットは、図４に示すよ
うに、１８ビット×４ワードで構成される。このように
４ワードで構成される場合、それぞれ１ビットのフラグ
ＲＱおよびＨＴが付加される。このフラグＲＱはネット
ワーク１６上を転送されるパケットに付加されるもので
あり、ワード順次に交互に“１”または“０”が付与さ
れる。このフラグＲＱは１ワード転送される毎に反転す
るため、このフラグＲＱを参照することによってワード
の存在を認識できる。さらに、ワード毎にフラグＲＱが
反転するので、ＰＲ２０などのデータ転送線路において
そのフラグＲＱがパケットをワード単位で前方へ転送す
るための転送リクエスト信号として機能する。フラグＨ
Ｔはパケット認識フラグであり、１つのパケットを構成
する第１ワードすなわちヘッダおよび最終ワードすなわ
ちテイルには、“１”が設定され、他のワードには
“０”が設定される。また、フラグＲＱおよびフラグＨ
Ｔによって、４ワード構成のパケットのヘッダとテイル
とを識別できる。すなわち、ヘッダの場合にはフラグＲ
ＱおよびＨＴがともに“１”となり、テイルの場合には
フラグＲＱおよびＨＴがそれぞれ“０”および“１”と
なる。

【００２２】また、第１ワードにある“出”コードは１
ビットであり、“１”であればパケットをホスト計算機
１２に送り、“０”であればパケットをネットワーク１
６内に送る。第１ワードにある“実”コードは１ビット
であり、そのパケットが実行パケットか非実行パケット
かのパケットの種類を識別する識別コードである。
“実”が“１”であれば実行パケットであり、“０”で
あれば非実行パケットである。フィールドＳ−ＣＯＤＥ
は４ビットであり、そのパケットに対する処理を規定す
る識別コードである。フィールドＰＥ＃は１０ビットで
あり、最大１０２４台の処理要素を識別するための識別
番号すなわちＰＥ番号を保持する。

【００２３】また、第２ワードにあるフィールドアドレ
スは１６ビットであり、ＦＣＣＭ２４，ＱＭ２８，ＩＣ
３０あるいはＩＤＭ４０などにプログラム情報などのデ
ータをロードしまたはそこからデータをダンプすべきメ
モリアドレスを格納する。さらに、第３ワードおよび第
４ワードには、それぞれ上位１６ビットおよび下位１６
ビットのフィールドデータが格納され、整数演算や浮動
小数点演算などの数値データやプログラム情報を保持す
る。

【００２４】具体的には、放送禁止指定パケットは、非
実行パケットであるので、“実＝０”となる。また、Ｉ
Ｃ３０に含まれるコントロールレジスタのモード設定フ
ラグを書き換えるので、フィールドＳ−ＣＯＤＥは各種
レジスタロードパケットであることを示すたとえば“０
１１１”に設定され、フィールドＰＥ＃には、放送禁止
モードに設定する処理要素のＰＥ番号が設定される。そ
して、第２ワードのフィールドアドレスのたとえば下位
４ビットによって、コントロールレジスタが指定され
る。さらに、第３ワードおよび第４ワードにコントロー
ルアドレスの全データが書き込まれ、その先頭ビットに
放送禁止モードを示す“１”が設定される。この放送禁
止指定パケットを放送禁止モードとすべき処理要素に送
ることによって、全ての処理要素は放送許可モードか放
送禁止モードかのいずれかに設定される。

【００２５】次いで、ホスト計算機１２の命令によっ
て、放送禁止モードに設定された処理要素にはデータを
放送しない（部分放送）放送パケットが生成される。
放送パケットは、図４に示すパケットフォーマットで
生成される。

【００２６】

【表１】

【００２７】放送パケットでは、表１に示すようにフ
ィールドＳ−ＣＯＤＥの最下位ビットが“０”に設定さ
れ、フィールドＰＥ＃にはデータを放送する最初の処理
要素のＰＥ番号が格納される。またフィールドアドレス
には、そのデータを格納すべきメモリやレジスタを指定
するアドレスが格納される。そして、第３ワードおよび
第４ワードには入力すべきデータが格納される。

【００２８】放送パケットは、まず自身が保持するフ
ィールドＰＥ＃の処理要素に向けて転送される。この処
理要素が放送開始の処理要素となる。この放送パケット
が放送許可モードの処理要素のＰＲ２０に入力される
と、ＩＣ３０においてフィールドＰＥ＃を“１”インク
リメントする。そして、その処理要素内において、指定
されたメモリまたはレジスタのアドレスにプログラム情
報などのデータがロードされる。そして、その処理要素
での一連の処理が終了すると、“出”が“１”にセット
され、その処理要素のＮＣ１８を通り、ＯＣ３４におい
て“出”を“０”に再びクリアした後、インクリメント
されたＰＥ番号で識別される処理要素に放送パケット
が送られる。そして、放送禁止モードの処理要素に放送
パケットが送られると、その処理要素ではデータを自
身のメモリやレジスタに格納せずに、ＰＥ番号のインク
リメントのみを行う。そして、その処理要素での一連の
処理が終了すると、“出”が“１”にセットされ、その
処理要素のＮＣ１８を通り、ＯＣ３４において“出”を
“０”に再びクリアした後、インクリメントされたＰＥ
番号で識別される処理要素に放送パケットが送られ
る。これを、処理要素のモードに応じて繰り返すことに
よって、放送許可モードの全ての処理要素にデータを放
送できる。最後の処理要素は放送パケットを消滅させ
る。このように、放送パケットを用いることによっ
て、任意の処理要素にデータを書き込め、データのロー
ド方式を改良できる。

【００２９】また、ホスト計算機１２の命令によって、
放送禁止指定を無視して全ての処理要素にデータを放送
する（全部放送）放送パケットが生成される。放送パ
ケットでは、表１に示すようにフィールドＳ−ＣＯＤ
Ｅの最下位ビットが“１”に設定される。すなわち、放
送パケットと放送パケットとの違いはフィールドＳ
−ＣＯＤＥの最下位ビットであり、放送パケットで
は、フィールドＳ−ＣＯＤＥの最下位ビットは“０”で
あるのに対し、放送パケットでは“１”である。放送
パケットによれば、放送禁止指定を無視して、全ての
処理要素に放送パケットのデータを書き込むことがで
きる。

【００３０】なお、上述の実施例では、まず、全ての処
理要素を放送許可モードに設定しておき、その後、放送
禁止モードとすべき処理要素を指定したが、これに限定
されず、その逆であってもよい。すなわち、まず、全て
の処理要素を放送禁止モードに設定しておき、その後、
放送許可モードとすべき処理要素を指定してもよい。ま
た、フィールドＰＥ＃は、ＩＣ３０でなく、ＯＣ３４で
インクリメントされてもよい。

【図面の簡単な説明】

【図１】この発明の一実施例を示すブロック図である。

【図２】この実施例の処理要素（ＰＥ）の一例を示すブ
ロック図である。

【図３】入力制御部（ＩＣ）に含まれるコントロールレ
ジスタの一例を示す図解図である。

【図４】この実施例で用いられるパケットのフォーマッ
トを示す図解図である。

【符号の説明】

１０ …並列処理計算機１２ …ホスト計算機１６ …ネットワーク２４ …発火制御およびカラー管理部３０ …入力制御部４０ …外部データメモリ

Claims

【特許請求の範囲】

【請求項１】複数の処理要素、前記複数の処理要素を結合してネットワークを構成する
通信線、および前記各処理要素を放送禁止モードおよび
放送許可モードのいずれかに設定する放送モード設定手
段を備え、前記放送許可モードに設定された処理要素のみが放送デ
ータを取り込む、並列処理計算機。