JPH09190421A - 計算機のデータ通信システム - Google Patents
計算機のデータ通信システムInfo
- Publication number
- JPH09190421A JPH09190421A JP9031984A JP3198497A JPH09190421A JP H09190421 A JPH09190421 A JP H09190421A JP 9031984 A JP9031984 A JP 9031984A JP 3198497 A JP3198497 A JP 3198497A JP H09190421 A JPH09190421 A JP H09190421A
- Authority
- JP
- Japan
- Prior art keywords
- data
- input
- communication
- processor
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004891 communication Methods 0.000 title claims abstract description 56
- 238000012545 processing Methods 0.000 claims abstract description 33
- 230000002457 bidirectional effect Effects 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 description 9
- 238000012546 transfer Methods 0.000 description 8
- 238000000034 method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000010304 firing Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 238000007667 floating Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Landscapes
- Multi Processors (AREA)
Abstract
(57)【要約】
【課題】 多数の要素プロセッサを接続したシステムの
構築のために、各要素プロセッサ中での演算処理とプロ
セッサ間通信処理との独立化、並びにプロセッサ間通信
のためのネットワークシステムの最適化を実現すること
が課題である。 【解決手段】 多数のプロセッサPEがトーラス接続さ
れる計算機のデータ通信システムに於て、各プロセッサ
PEは、データ処理を行うデータ処理部と、行方向及び
列方向夫々四方の隣接プロセッサとの結合の為に4個の
双方向の入出力ポートを備えた通信制御部と、を有し、
且つ前記各入出力ポートに1パケット分の情報量のみを
持つ入力レジスタr並びに出力レジスタrと、前記4個
の入力レジスタr及び前記データ処理部の入力側にそれ
ぞれ対応して設けられた5個の合流制御回路部と、前記
4個の出力レジスタr及び前記データ処理部の出力側に
それぞれ対応して設けられた5個の分岐制御回路部と、
を備える。
構築のために、各要素プロセッサ中での演算処理とプロ
セッサ間通信処理との独立化、並びにプロセッサ間通信
のためのネットワークシステムの最適化を実現すること
が課題である。 【解決手段】 多数のプロセッサPEがトーラス接続さ
れる計算機のデータ通信システムに於て、各プロセッサ
PEは、データ処理を行うデータ処理部と、行方向及び
列方向夫々四方の隣接プロセッサとの結合の為に4個の
双方向の入出力ポートを備えた通信制御部と、を有し、
且つ前記各入出力ポートに1パケット分の情報量のみを
持つ入力レジスタr並びに出力レジスタrと、前記4個
の入力レジスタr及び前記データ処理部の入力側にそれ
ぞれ対応して設けられた5個の合流制御回路部と、前記
4個の出力レジスタr及び前記データ処理部の出力側に
それぞれ対応して設けられた5個の分岐制御回路部と、
を備える。
Description
【0001】
【発明の属する技術分野】本発明は、計算機、特にデー
タ駆動計算機のデータ通信システムに関する。
タ駆動計算機のデータ通信システムに関する。
【0002】
【従来の技術】近年、実用的な並列処理計算機の実現に
向けて研究が進められており、本願発明者は、既にデー
タ駆動計算機とその言語処理系ソフトウェアの開発、及
びそれらの評価を終了している。
向けて研究が進められており、本願発明者は、既にデー
タ駆動計算機とその言語処理系ソフトウェアの開発、及
びそれらの評価を終了している。
【0003】[田中他:「データ駆動計算機SPMの試
作」、情報処理学会第36回全国大会講演論文集7B−
5。
作」、情報処理学会第36回全国大会講演論文集7B−
5。
【0004】西川他:「データ駆動計算機SPMのコン
パイラ」、同7B−6。
パイラ」、同7B−6。
【0005】田中他:「データ駆動計算機SPMの性能
評価(1)」情報処理学会第37回全国大会講演論文集
1N−4。
評価(1)」情報処理学会第37回全国大会講演論文集
1N−4。
【0006】岡本他:「データ駆動計算機SPMの性能
評価(2)」同1N−5。] 一般に、データ駆動計算機は、種々の命令がデータの流
れを示すアークによって接続されるデータフローグラフ
をプログラムとして実行するものであり、言い替えれ
ば、「処理可能なデータから処理を実行していく」とい
うような非ノイマン型の思想に従い簡単な実行規則によ
って演算処理が行われる。
評価(2)」同1N−5。] 一般に、データ駆動計算機は、種々の命令がデータの流
れを示すアークによって接続されるデータフローグラフ
をプログラムとして実行するものであり、言い替えれ
ば、「処理可能なデータから処理を実行していく」とい
うような非ノイマン型の思想に従い簡単な実行規則によ
って演算処理が行われる。
【0007】斯様なデータ駆動計算機は、主としてデー
タ対検出機構、演算処理機構、プログラム記憶機構の三
つの構成要素からなり、その実行処理の概略は以下のと
おりである。
タ対検出機構、演算処理機構、プログラム記憶機構の三
つの構成要素からなり、その実行処理の概略は以下のと
おりである。
【0008】まず、データ駆動型計算機ではパケットと
呼ばれる一まとまりのデータ集合を単位として使用して
おり、該パケットは処理対象データ、データフローグラ
フの接続情報(ノード番号)並びに命令コードなどから
構成される。
呼ばれる一まとまりのデータ集合を単位として使用して
おり、該パケットは処理対象データ、データフローグラ
フの接続情報(ノード番号)並びに命令コードなどから
構成される。
【0009】このデータ対検出機構では演算が可能なオ
ペランドパケットの組を検出して出力する。そして検出
されたオペランドパケットの組は演算処理機構で処理さ
れる。この結果、パケットはプログラム記憶機構で新た
なノード番号を付与されデータ対検出機構に送られる。
斯る処理を繰り返し続けることにより一連の処理が実行
される。
ペランドパケットの組を検出して出力する。そして検出
されたオペランドパケットの組は演算処理機構で処理さ
れる。この結果、パケットはプログラム記憶機構で新た
なノード番号を付与されデータ対検出機構に送られる。
斯る処理を繰り返し続けることにより一連の処理が実行
される。
【0010】本願発明者は、現在、上述の如きデータフ
ロー計算機に於て、特にそのプロセッサアーキテクチャ
に種々の改良を加えた高並列データ駆動計算機EDDE
N(Enhanced Data Driven ENgine)の開発を進めてい
る。
ロー計算機に於て、特にそのプロセッサアーキテクチャ
に種々の改良を加えた高並列データ駆動計算機EDDE
N(Enhanced Data Driven ENgine)の開発を進めてい
る。
【0011】このEDDENでは、1チップのCMOS
−LSIによって実現する要素プロセッサを、最大10
24台接続した大規模データ駆動計算機の稼働を目指
し、また、PE数台の小規模システム、PE数十台の中
規模システムなど柔軟な構成がとれるようにし、信号処
理、画像処理、グラフィックス、各種シミュレーショ
ン、CADなどの広範な分野に適応されることが目標と
なっている。
−LSIによって実現する要素プロセッサを、最大10
24台接続した大規模データ駆動計算機の稼働を目指
し、また、PE数台の小規模システム、PE数十台の中
規模システムなど柔軟な構成がとれるようにし、信号処
理、画像処理、グラフィックス、各種シミュレーショ
ン、CADなどの広範な分野に適応されることが目標と
なっている。
【0012】
【発明が解決しようとする課題】上述の如く、多数の要
素プロセッサを接続したシステムの構築のためには、各
要素プロセッサ中での演算処理とプロセッサ間通信処理
との独立化、並びにプロセッサ間通信のためのネットワ
ークシステムの最適化等が要求され、これ等の実現によ
って高性能計算機が得られる。
素プロセッサを接続したシステムの構築のためには、各
要素プロセッサ中での演算処理とプロセッサ間通信処理
との独立化、並びにプロセッサ間通信のためのネットワ
ークシステムの最適化等が要求され、これ等の実現によ
って高性能計算機が得られる。
【0013】
【課題を解決するための手段】本発明の計算機のデータ
通信システムは、多数のプロセッサを行列配置し、各縦
方向のプロセッサ列を循環的に結合する複数の縦通信線
と各横方向のプロセッサ行を循環的に結合する複数の横
通信線とでプロセッサ間のデータ通信を行う計算機のデ
ータ通信システムに於て、各プロセッサは、データ処理
を行うデータ処理部と、行方向及び列方向夫々四方の隣
接プロセッサとの結合の為に4個の双方向の入出力ポー
トを備えた通信制御部と、を有し、且つ前記各入出力ポ
ートに1パケット分の情報量に該当する記憶容量を持つ
入力レジスタ並びに出力レジスタと、前記各入出力ポー
トの出力レジスタ及び前記データ処理部の入力側にそれ
ぞれ対応して設けられた5個の合流制御回路部と、前記
各入出力ポートの入力レジスタ及び前記データ処理部の
出力側にそれぞれ対応して設けられた5個の分岐制御回
路部と、を備え、前記通信制御部は、前記分岐制御回路
部に送られた、入力レジスタから入力された通信データ
又は前記プロセッサから得られる処理データを前記合流
制御回路部に送るように制御し、また前記通信制御部
は、前記合流制御回路部に送られた前記処理データを前
記出力レジスタに、又は前記合流制御回路部に送られた
前記通信データを前記出力レジスタ或いは前記データ処
理部に送るように制御することを特徴とする。
通信システムは、多数のプロセッサを行列配置し、各縦
方向のプロセッサ列を循環的に結合する複数の縦通信線
と各横方向のプロセッサ行を循環的に結合する複数の横
通信線とでプロセッサ間のデータ通信を行う計算機のデ
ータ通信システムに於て、各プロセッサは、データ処理
を行うデータ処理部と、行方向及び列方向夫々四方の隣
接プロセッサとの結合の為に4個の双方向の入出力ポー
トを備えた通信制御部と、を有し、且つ前記各入出力ポ
ートに1パケット分の情報量に該当する記憶容量を持つ
入力レジスタ並びに出力レジスタと、前記各入出力ポー
トの出力レジスタ及び前記データ処理部の入力側にそれ
ぞれ対応して設けられた5個の合流制御回路部と、前記
各入出力ポートの入力レジスタ及び前記データ処理部の
出力側にそれぞれ対応して設けられた5個の分岐制御回
路部と、を備え、前記通信制御部は、前記分岐制御回路
部に送られた、入力レジスタから入力された通信データ
又は前記プロセッサから得られる処理データを前記合流
制御回路部に送るように制御し、また前記通信制御部
は、前記合流制御回路部に送られた前記処理データを前
記出力レジスタに、又は前記合流制御回路部に送られた
前記通信データを前記出力レジスタ或いは前記データ処
理部に送るように制御することを特徴とする。
【0014】特に、前記通信制御部の内部は、自己同期
式で動作することを特徴とする。
式で動作することを特徴とする。
【0015】
【発明の実施の形態】図1に本発明の一実施形態として
の高並列データ駆動計算機のシステムを示し、図2に要
素プロセッサの構成を示す。
の高並列データ駆動計算機のシステムを示し、図2に要
素プロセッサの構成を示す。
【0016】まず、図2の要素プロセッサ(PE)は、
基本的にはプログラム記憶(PS)、発火制御・カラー
管理部(FCCM)、命令実行部(EXE)、及びキュ
ーメモリ(Q)が巡回パイプライン(リング)構造に接
続された構成としている。
基本的にはプログラム記憶(PS)、発火制御・カラー
管理部(FCCM)、命令実行部(EXE)、及びキュ
ーメモリ(Q)が巡回パイプライン(リング)構造に接
続された構成としている。
【0017】プログラム記憶(PS)はノード番号の更
新、定数付与、及び結果のコピーを行う。発火制御・カ
ラー管理部(FCCM)は、2段階の待ち合わせ記憶方
式で発火制御及びカラーの獲得・解放の管理を行う。命
令実行部(EXE)は、浮動小数点・整数演算、条件判
定、分岐、簡易定数発生などの命令、及びそれらの複合
命令を実行する。
新、定数付与、及び結果のコピーを行う。発火制御・カ
ラー管理部(FCCM)は、2段階の待ち合わせ記憶方
式で発火制御及びカラーの獲得・解放の管理を行う。命
令実行部(EXE)は、浮動小数点・整数演算、条件判
定、分岐、簡易定数発生などの命令、及びそれらの複合
命令を実行する。
【0018】キュー(Q)はリング上でのあらゆるデー
タ流変動を吸収する緩衝記憶である。緩衝記憶が必要と
なるのは、コピー、リングへの強制的入力、リン
グからの出力遅延、(FCCM)における待ちリスト
のサーチ、などが生じた時である。本要素プロセッサ
(PE)には、キュー(Q)のデータ滞在量に応じて
〜の動作モードを動的に変更する機能を付加し、これ
によって並列度の制御を行う。
タ流変動を吸収する緩衝記憶である。緩衝記憶が必要と
なるのは、コピー、リングへの強制的入力、リン
グからの出力遅延、(FCCM)における待ちリスト
のサーチ、などが生じた時である。本要素プロセッサ
(PE)には、キュー(Q)のデータ滞在量に応じて
〜の動作モードを動的に変更する機能を付加し、これ
によって並列度の制御を行う。
【0019】また、キュー(Q)がやむなくオーバーフ
ローした時には、外部データメモリ(EDM)上に外部
キューを形成してこれを吸収し、プログラム実行の継続
を図る。
ローした時には、外部データメモリ(EDM)上に外部
キューを形成してこれを吸収し、プログラム実行の継続
を図る。
【0020】ネットワーク制御部(NC)は、東西南北
4系統の通信ポートを保持し、最大1024台のプロセ
ッサ(PE)のトーラス結合網に基づくルーティング制
御を行う。ベクトル演算制御部(VC)は、ベクトル演
算関連命令、及び通常のメモリアクセス命令の実行制御
を行う。前記制御部(VC)と、入力制御部(IC)及
び出力制御部(OC)の間には構造体(ベクトル)通信
用のバイパス線を設ける。外部データメモリ(EDM)
は、構造体等を格納するデータメモリであり、容量は5
12KByte(128K語×32bit)程度とす
る。クロック方式は同期式であるが、上記ネットワーク
制御部(NC)内部は自己同期式で動作するものとす
る。
4系統の通信ポートを保持し、最大1024台のプロセ
ッサ(PE)のトーラス結合網に基づくルーティング制
御を行う。ベクトル演算制御部(VC)は、ベクトル演
算関連命令、及び通常のメモリアクセス命令の実行制御
を行う。前記制御部(VC)と、入力制御部(IC)及
び出力制御部(OC)の間には構造体(ベクトル)通信
用のバイパス線を設ける。外部データメモリ(EDM)
は、構造体等を格納するデータメモリであり、容量は5
12KByte(128K語×32bit)程度とす
る。クロック方式は同期式であるが、上記ネットワーク
制御部(NC)内部は自己同期式で動作するものとす
る。
【0021】斯様な要素プロセッサ(PE)を多数用い
たEDDENの基本的な構成は図1に示すようにn×n
台の要素プロセッサをトーラス結合網で接続することを
基本とする。該トーラス結合網とは、多数のプロセッサ
を行列配置し、各縦方向、即ち南北方向(N <−>
S)のプロセッサ列を循環的に結合する複数の縦通信線
と各横方向、即ち東西方向(W <−> E)のプロセ
ッサ行を循環的に結合する複数の横通信線とで任意のプ
ロセッサ間のデータ通信を可能としたものである。
たEDDENの基本的な構成は図1に示すようにn×n
台の要素プロセッサをトーラス結合網で接続することを
基本とする。該トーラス結合網とは、多数のプロセッサ
を行列配置し、各縦方向、即ち南北方向(N <−>
S)のプロセッサ列を循環的に結合する複数の縦通信線
と各横方向、即ち東西方向(W <−> E)のプロセ
ッサ行を循環的に結合する複数の横通信線とで任意のプ
ロセッサ間のデータ通信を可能としたものである。
【0022】本実施形態システムでは、ネットワークと
のデータのやりとりは、南北方向(N <−> S)の
任意の通信リンクにネットワークインタフェース(NI
F)を挿入することによって行う。前記インタフェース
(NIF)、及び要素プロセッサ16〜64台を1枚の
プロセッサボート上に実装し、トーラス接続リンクをプ
リント基板上に形成する。
のデータのやりとりは、南北方向(N <−> S)の
任意の通信リンクにネットワークインタフェース(NI
F)を挿入することによって行う。前記インタフェース
(NIF)、及び要素プロセッサ16〜64台を1枚の
プロセッサボート上に実装し、トーラス接続リンクをプ
リント基板上に形成する。
【0023】小・中規模システムの構成としては、ホス
ト計算機として汎用のEWSまたはパソコンを用い、そ
れらのバスインタフェースを介してネットワークインタ
フェース(NIF)に接続する。実装形態としては、1
〜4枚のプロセッサボードと1枚のバスインタフェース
ボードを、EWS等のラックに直接挿入することにす
る。
ト計算機として汎用のEWSまたはパソコンを用い、そ
れらのバスインタフェースを介してネットワークインタ
フェース(NIF)に接続する。実装形態としては、1
〜4枚のプロセッサボードと1枚のバスインタフェース
ボードを、EWS等のラックに直接挿入することにす
る。
【0024】大規模システムの構成としては、応用分野
に応じて、次の2種類の構成法が考えられる。
に応じて、次の2種類の構成法が考えられる。
【0025】 クラスタ接続 前述のプロセッサボードを1つのクラスタとして、クラ
スタ間をクラスタインタフェースを介して接続する。ク
ラスタインタフェースは、各クラスタ内のデータの収集
・分配の管理を行う。
スタ間をクラスタインタフェースを介して接続する。ク
ラスタインタフェースは、各クラスタ内のデータの収集
・分配の管理を行う。
【0026】 大型トーラス接続 1024台(32台×32台)の要素プロセッサをトー
ラス結合網で接続する。実装形態としては、1枚のプリ
ント基板に南北(N <−> S)方向の32台の要素
プロセッサとNIFとを実装し、東西(W <−>
E)方向のリンクはマザーボード上に形成する。
ラス結合網で接続する。実装形態としては、1枚のプリ
ント基板に南北(N <−> S)方向の32台の要素
プロセッサとNIFとを実装し、東西(W <−>
E)方向のリンクはマザーボード上に形成する。
【0027】上述の構成のデータ駆動計算機で用いられ
るデータパケットには、大別して、プログラム実行に使
用する実行パケットとプログラム実行以外に使用される
非実行パケットがあり、図4及び図5にその実例を示し
ている。尚、パケット形式は、構造体本体を保持したパ
ケット以外は固定長とし、プロセッサ(PE)内のパイ
プラインリング上では33ビット×2語、ネットワーク
上では18ビット×4語構成を採用している。
るデータパケットには、大別して、プログラム実行に使
用する実行パケットとプログラム実行以外に使用される
非実行パケットがあり、図4及び図5にその実例を示し
ている。尚、パケット形式は、構造体本体を保持したパ
ケット以外は固定長とし、プロセッサ(PE)内のパイ
プラインリング上では33ビット×2語、ネットワーク
上では18ビット×4語構成を採用している。
【0028】以下に、図4及び図5のパケットフォーマ
ットに於ける各フィールドの内容を示す。
ットに於ける各フィールドの内容を示す。
【0029】HD(1bit):2語パケットの際の1
語目(ヘッダ)と2語目(テイル)の識別子。ヘッダの
時「1」。
語目(ヘッダ)と2語目(テイル)の識別子。ヘッダの
時「1」。
【0030】EX(1bit):パイプラインリング上
からPE外部へ出力されるパケットを識別するフラグ。
からPE外部へ出力されるパケットを識別するフラグ。
【0031】MODE(2bit):実行パケット、非
実行パケット等のパケットの種類を識別する識別コー
ド。
実行パケット等のパケットの種類を識別する識別コー
ド。
【0032】S−CODE(3bit):MODEと併
せてパケットに対する処理を規定する識別コード。
せてパケットに対する処理を規定する識別コード。
【0033】OPCODE−M(5bit):メイン命
令コード。命令実行部(EXE)における命令の種類を
規定する。また、nsyncの際に同期処理を行うデー
タの数を保持する。
令コード。命令実行部(EXE)における命令の種類を
規定する。また、nsyncの際に同期処理を行うデー
タの数を保持する。
【0034】OPCODE−S(6bit):サブ命令
コード。メイン命令コードで規定された命令を更に詳細
に規定する。
コード。メイン命令コードで規定された命令を更に詳細
に規定する。
【0035】NODE#(最大11bit):データフ
ローグラフのノード番号。
ローグラフのノード番号。
【0036】COLOR(4bit):カラー識別子。
サブルーチンコールによるプログラム共用、時系別デー
タに対する処理など、同一データフローグラフを多重実
行する際に環境を識別する識別番号。
サブルーチンコールによるプログラム共用、時系別デー
タに対する処理など、同一データフローグラフを多重実
行する際に環境を識別する識別番号。
【0037】PE#(10bit):PE番号。最大1
024台のPEを識別するための識別番号。
024台のPEを識別するための識別番号。
【0038】DATA(32bit):32ビットの整
数あるいは浮動小数点数。
数あるいは浮動小数点数。
【0039】HT(1bit):語数が4語以上のパケ
ットの際に、ヘッダ及びテイルと中間の語とを識別する
フラグヘッダまたはテイルの時に「1」となる。
ットの際に、ヘッダ及びテイルと中間の語とを識別する
フラグヘッダまたはテイルの時に「1」となる。
【0040】RQ(1bit):ネットワーク上を転送
されるパケットに付加するフラグで、ネットワーク上で
1語転送される度に値が反転するため、語の存在を認識
できる。更に、値が反転することが、パケットを前方ヘ
転送するための転送要求信号となる。また、HTフラグ
と合わせて、ヘッダとテイルとを識別できる。
されるパケットに付加するフラグで、ネットワーク上で
1語転送される度に値が反転するため、語の存在を認識
できる。更に、値が反転することが、パケットを前方ヘ
転送するための転送要求信号となる。また、HTフラグ
と合わせて、ヘッダとテイルとを識別できる。
【0041】ADDRESS(16bit):各メモリ
のデータのロード/ダンプなどの際に、メモリアドレス
を格納する。
のデータのロード/ダンプなどの際に、メモリアドレス
を格納する。
【0042】以上の基本構成を持つ本発明実施形態の計
算機の特徴的な構成は、要素プロセッサ(PE)での本
来のデータ処理のための各機構とは独立して動作するネ
ットワーク制御部(NC)にある。
算機の特徴的な構成は、要素プロセッサ(PE)での本
来のデータ処理のための各機構とは独立して動作するネ
ットワーク制御部(NC)にある。
【0043】前記ネットワーク制御部(NC)は図4
(c)及び図5(e)の如きパケットを当該プロセッサ
(PE)から受け取り、又は他のプロセッサ(PE)か
ら受け取って、そのパケットの第1語目にある[PE
#]を検知する。この[PE#]には該パケットが転送
されるべき宛先のプロセッサの行列番号形式の宛先のプ
ロセッサ番号(X,Y)が書き込まれているので、この
値と当該プロセッサの番号(x,y)との比較を行う。
(c)及び図5(e)の如きパケットを当該プロセッサ
(PE)から受け取り、又は他のプロセッサ(PE)か
ら受け取って、そのパケットの第1語目にある[PE
#]を検知する。この[PE#]には該パケットが転送
されるべき宛先のプロセッサの行列番号形式の宛先のプ
ロセッサ番号(X,Y)が書き込まれているので、この
値と当該プロセッサの番号(x,y)との比較を行う。
【0044】この比較処理により、例えば、X=xでな
い限り、パケットを西(W)から東(E)へ、あるいは
東(E)から西(W)へ転送する。
い限り、パケットを西(W)から東(E)へ、あるいは
東(E)から西(W)へ転送する。
【0045】X=xであれば、Y=yでない限りパケッ
トは南(S)から北(N)へ、あるいは北(N)から南
(S)へ転送する。
トは南(S)から北(N)へ、あるいは北(N)から南
(S)へ転送する。
【0046】そして、X=x且つY=yとなった時にこ
のパケットが当該プロセッサ内でのデータ処理に供せら
れるのである。
のパケットが当該プロセッサ内でのデータ処理に供せら
れるのである。
【0047】従って、データパケットはトーラス結合さ
れた多数の行列プロセッサ間を、まず、東西方向に転送
され、その後南北方向に転送される事になり、これによ
って、最短距離転送のセルフルーティングを実現してい
る。
れた多数の行列プロセッサ間を、まず、東西方向に転送
され、その後南北方向に転送される事になり、これによ
って、最短距離転送のセルフルーティングを実現してい
る。
【0048】図3に上述の如きトーラスネットワーク上
でのセルフルーティングを実現する為のネットワーク制
御部(NC)のデータシステムを模式的に示し、同図に
従い、そのルーティングアルゴリズムを示す。尚、図3
に於て、(RNI)(RNO)は北入出力ポートを構成
する入力シフトレジスタ、及び出力シフトレジスタであ
り、4段のレジスタ(r)からなる。同様に(RSI)
(RSO)は南入出力ポート、(RWI)(RWO)は
西入出力ポート、(REI)(REO)は東入出力ポー
トを構成している。又、「○」は合流、「◎」は分岐を
示している。
でのセルフルーティングを実現する為のネットワーク制
御部(NC)のデータシステムを模式的に示し、同図に
従い、そのルーティングアルゴリズムを示す。尚、図3
に於て、(RNI)(RNO)は北入出力ポートを構成
する入力シフトレジスタ、及び出力シフトレジスタであ
り、4段のレジスタ(r)からなる。同様に(RSI)
(RSO)は南入出力ポート、(RWI)(RWO)は
西入出力ポート、(REI)(REO)は東入出力ポー
トを構成している。又、「○」は合流、「◎」は分岐を
示している。
【0049】ルーティングアルゴリズムは以下のとお
り。 I.自分のPE番号を(x,y)、ネットワークをp×
q(p:N −> S方向、q:W −> E方向)のトー
ラス、パケットの行き先PE番号を(X,Y)とし、
り。 I.自分のPE番号を(x,y)、ネットワークをp×
q(p:N −> S方向、q:W −> E方向)のトー
ラス、パケットの行き先PE番号を(X,Y)とし、
【0050】
【数1】
【0051】とする。 II.PE番号は、NからSの方向に順に y=0、1、2、・・・、p WからEの方向に順に x=0、1、2、・・・、q とする。 III.MODEはパケットのタグのMODEフィールド
の値を意味する。(MODE=00はホストへのパケッ
トである。) (1)R1 Δy=0のときパケットをPへ出力 Δy≠0のときパケットをSへ出力 (2)R2 Δx≠0のときパケットをWへ出力 Δx=0かつΔy>0のときパケットをSへ出力 Δx=0かつΔy=0かつMODE≠00のときパケッ
トをPへ出力 Δx=0かつΔy=0かつMODE=00のときパケッ
トをNへ出力 Δx=0かつΔy<0のときパケットをNへ出力 (3)R3 Δx≠0のときパケットをEへ出力 Δx=0かつΔy>0のときパケットをSへ出力 Δx=0かつΔy=0かつMODE≠00のときパケッ
トをPへ出力 Δx=0かつΔy=0かつMODE=00のときパケッ
トをNへ出力 Δx=0かつΔy<0のときパケットをNへ出力 (4)R4 Δy=0かつMODE≠00のときパケットをPへ出力 Δy≠0またはMODE=00のときパケットをNへ出
力 (5)R5 Δx>0のときパケットをEへ出力 Δx=0かつΔy>0のときパケットをSへ出力 Δx=0かつΔy≦0のときパケットをNへ出力 Δx<0のときパケットをWへ出力 IV.パケットのヘッダが到着したときにルーティングを
行い、以降のデータはパケットのテイルが到着するま
で、同じ経路に出力する。 V.PE番号(x,y)とネットワークのサイズは、あ
らかじめ設定できるものとする。ただし、p、qは2の
べき乗に限る。また、Δx、Δyを計算するときに、モ
ジェロをとらないモード(格子状ネットワークに対応)
ことも可能とする。 VI.PEをリング状に接続する場合も、N−Sを結線す
れば、上のルーティングアルゴリズムでルーティングで
きる。
の値を意味する。(MODE=00はホストへのパケッ
トである。) (1)R1 Δy=0のときパケットをPへ出力 Δy≠0のときパケットをSへ出力 (2)R2 Δx≠0のときパケットをWへ出力 Δx=0かつΔy>0のときパケットをSへ出力 Δx=0かつΔy=0かつMODE≠00のときパケッ
トをPへ出力 Δx=0かつΔy=0かつMODE=00のときパケッ
トをNへ出力 Δx=0かつΔy<0のときパケットをNへ出力 (3)R3 Δx≠0のときパケットをEへ出力 Δx=0かつΔy>0のときパケットをSへ出力 Δx=0かつΔy=0かつMODE≠00のときパケッ
トをPへ出力 Δx=0かつΔy=0かつMODE=00のときパケッ
トをNへ出力 Δx=0かつΔy<0のときパケットをNへ出力 (4)R4 Δy=0かつMODE≠00のときパケットをPへ出力 Δy≠0またはMODE=00のときパケットをNへ出
力 (5)R5 Δx>0のときパケットをEへ出力 Δx=0かつΔy>0のときパケットをSへ出力 Δx=0かつΔy≦0のときパケットをNへ出力 Δx<0のときパケットをWへ出力 IV.パケットのヘッダが到着したときにルーティングを
行い、以降のデータはパケットのテイルが到着するま
で、同じ経路に出力する。 V.PE番号(x,y)とネットワークのサイズは、あ
らかじめ設定できるものとする。ただし、p、qは2の
べき乗に限る。また、Δx、Δyを計算するときに、モ
ジェロをとらないモード(格子状ネットワークに対応)
ことも可能とする。 VI.PEをリング状に接続する場合も、N−Sを結線す
れば、上のルーティングアルゴリズムでルーティングで
きる。
【0052】以上がセルフルーティングアルゴリズムの
1例であるが、これに限られるものでない。
1例であるが、これに限られるものでない。
【0053】一方、図3のネットワーク制御部(NC)
の入出力ポートの構成は、図示の如く、4段の各18ビ
ットのシフトレジスタ(r)・・・の入力ポート、同じ
く4段のシフトレジスタ(r)・・・の出力ポートを備
えているので、図4(c)、図5(e)の4語形式のパ
ケットがそのまま全て入力ポート、あるいは出力ポート
に格納できる事になる。この事は、トーラスネットワー
クのように双方向通信が必要な双方向通信路上で、一方
向の前にパケットがつかえている状態でこの方向のパケ
ット転送が停止していても、パケット単位がポート部で
中断して停止すると云うデッドロックの原因の一つを解
消する事になる。即ち、例えば入出力ポートの入力側あ
るいは出力側に1まとまりのパケットが完全に格納され
るので、当該プロセッサで、他のパケットの他の方向へ
の転送が可能となる。
の入出力ポートの構成は、図示の如く、4段の各18ビ
ットのシフトレジスタ(r)・・・の入力ポート、同じ
く4段のシフトレジスタ(r)・・・の出力ポートを備
えているので、図4(c)、図5(e)の4語形式のパ
ケットがそのまま全て入力ポート、あるいは出力ポート
に格納できる事になる。この事は、トーラスネットワー
クのように双方向通信が必要な双方向通信路上で、一方
向の前にパケットがつかえている状態でこの方向のパケ
ット転送が停止していても、パケット単位がポート部で
中断して停止すると云うデッドロックの原因の一つを解
消する事になる。即ち、例えば入出力ポートの入力側あ
るいは出力側に1まとまりのパケットが完全に格納され
るので、当該プロセッサで、他のパケットの他の方向へ
の転送が可能となる。
【0054】本実施形態では、多数のプロセッサがトー
ラス接続されるネットワークシステムを採用すると共
に、各プロセッサに主にプロセッサ間通信のための通信
制御部をデータ処理部とは独立して設けたものであるの
で、プロセッサのLSI化実現の際に、上記トーラス接
続によりピン数削減、一様構造が図れ、上記通信制御部
の独立性を保った形のLSI内蔵により、システム全体
の小型化、低価格化が望める。
ラス接続されるネットワークシステムを採用すると共
に、各プロセッサに主にプロセッサ間通信のための通信
制御部をデータ処理部とは独立して設けたものであるの
で、プロセッサのLSI化実現の際に、上記トーラス接
続によりピン数削減、一様構造が図れ、上記通信制御部
の独立性を保った形のLSI内蔵により、システム全体
の小型化、低価格化が望める。
【0055】また、本実施形態では、行方向及び列方向
夫々四方の隣接プロセッサとの結合の為に4個の双方向
の入出力ポートを備え、各ポートに通信データの基本的
情報量に該当する記憶容量をもつ入力レジスタ並びに出
力レジスタを具備する。
夫々四方の隣接プロセッサとの結合の為に4個の双方向
の入出力ポートを備え、各ポートに通信データの基本的
情報量に該当する記憶容量をもつ入力レジスタ並びに出
力レジスタを具備する。
【0056】このように、本実施形態では、四方の隣接
プロセッサとの入出力を行う4個の入出力ポートに夫々
通信データの基本的情報量、即ち1パケット分の情報量
をもつ入力レジスタと出力レジスタとを一対にして備え
ているので、データ転送毎に必ずパケット単位でプロセ
ッサ間のデータ転送が完了できる。従って、パケット単
位の途中でデータ転送が停滞する事がないので、停滞デ
ータが他のデータの通信を妨げると云ったデッドロック
現象の回避が可能となる。
プロセッサとの入出力を行う4個の入出力ポートに夫々
通信データの基本的情報量、即ち1パケット分の情報量
をもつ入力レジスタと出力レジスタとを一対にして備え
ているので、データ転送毎に必ずパケット単位でプロセ
ッサ間のデータ転送が完了できる。従って、パケット単
位の途中でデータ転送が停滞する事がないので、停滞デ
ータが他のデータの通信を妨げると云ったデッドロック
現象の回避が可能となる。
【0057】更に、本実施形態では、行列番号と対応付
けられて行列結合された複数のデータフロー型のプロセ
ッサ間で通信データの送受信を行うデータ通信方法であ
り、上記通信データには、送信先プロセッサに対応づけ
られた行列番号が送信先行列番号として書き込まれてお
り、上記各プロセッサは、該プロセッサ自身の行列番号
と該プロセッサに転送されて来た通信データの送信先行
列番号とを比較し、両番号が一致する時の通信データを
該プロセッサでデータ処理し、不一致の時の通信データ
を隣接プロセッサに転送するものである。
けられて行列結合された複数のデータフロー型のプロセ
ッサ間で通信データの送受信を行うデータ通信方法であ
り、上記通信データには、送信先プロセッサに対応づけ
られた行列番号が送信先行列番号として書き込まれてお
り、上記各プロセッサは、該プロセッサ自身の行列番号
と該プロセッサに転送されて来た通信データの送信先行
列番号とを比較し、両番号が一致する時の通信データを
該プロセッサでデータ処理し、不一致の時の通信データ
を隣接プロセッサに転送するものである。
【0058】このように、本実施形態では、通信データ
中に送信先プロセッサ番号(対応行列番号)が書き込ま
れているので、各プロセッサでは内部的に発生したデー
タ、あるいは他のプロセッサから転送されて来たデータ
の送信先プロセッサ番号を検知してこのデータを四方の
隣接プロセッサの内、いずれのプロセッサに転送すべき
かがプロセッサ自身で判断できる。従って、データは各
プロセッサの転送動作により、最短ルートで宛先プロセ
ッサに通信できるセルフルーティングを実現できる。
中に送信先プロセッサ番号(対応行列番号)が書き込ま
れているので、各プロセッサでは内部的に発生したデー
タ、あるいは他のプロセッサから転送されて来たデータ
の送信先プロセッサ番号を検知してこのデータを四方の
隣接プロセッサの内、いずれのプロセッサに転送すべき
かがプロセッサ自身で判断できる。従って、データは各
プロセッサの転送動作により、最短ルートで宛先プロセ
ッサに通信できるセルフルーティングを実現できる。
【0059】
【発明の効果】本発明によれば、システム全体の小型
化、低価格化のために、通信制御機構をもPEチップに
内蔵でき、プロセッサの基本的な結合状態により、チッ
プのピン数制限、プロセッサ間距離が小さい、一様構
造、デッドロック回避が可能、実装が容易となるデータ
通信システムを実現する事ができる。
化、低価格化のために、通信制御機構をもPEチップに
内蔵でき、プロセッサの基本的な結合状態により、チッ
プのピン数制限、プロセッサ間距離が小さい、一様構
造、デッドロック回避が可能、実装が容易となるデータ
通信システムを実現する事ができる。
【図1】本発明の一実施形態に係るデータ通信システム
を示すシステム図である。
を示すシステム図である。
【図2】本発明の一実施形態に係るプロセッサの概略構
成を示すブロック図である。
成を示すブロック図である。
【図3】本発明の一実施形態に係るプロセッサの要部ゲ
ート構成の模式図である。
ート構成の模式図である。
【図4】パケット構成図である。
【図5】パケット構成図である。
PE 要素プロセッサ EXE 命令実行部 EDM 外部データメモリ NC ネットワーク制御部
Claims (2)
- 【請求項1】 多数のプロセッサを行列配置し、各縦方
向のプロセッサ列を循環的に結合する複数の縦通信線と
各横方向のプロセッサ行を循環的に結合する複数の横通
信線とでプロセッサ間のデータ通信を行う計算機のデー
タ通信システムに於て、 各プロセッサは、データ処理を行うデータ処理部と、行
方向及び列方向夫々四方の隣接プロセッサとの結合の為
に4個の双方向の入出力ポートを備えた通信制御部と、
を有し、 且つ前記各入出力ポートに1パケット分の情報量に該当
する記憶容量を持つ入力レジスタ並びに出力レジスタ
と、 前記各入出力ポートの出力レジスタ及び前記データ処理
部の入力側にそれぞれ対応して設けられた5個の合流制
御回路部と、 前記各入出力ポートの入力レジスタ及び前記データ処理
部の出力側にそれぞれ対応して設けられた5個の分岐制
御回路部と、を備え、 前記通信制御部は、前記分岐制御回路部に送られた、入
力レジスタから入力された通信データ又は前記プロセッ
サから得られる処理データを前記合流制御回路部に送る
ように制御し、また前記通信制御部は、前記合流制御回
路部に送られた前記処理データを前記出力レジスタに、
又は前記合流制御回路部に送られた前記通信データを前
記出力レジスタ或いは前記データ処理部に送るように制
御することを特徴とする計算機のデータ通信システム。 - 【請求項2】 前記通信制御部の内部は、自己同期式で
動作することを特徴とする請求項1記載の計算機のデー
タ通信システム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9031984A JPH09190421A (ja) | 1997-02-17 | 1997-02-17 | 計算機のデータ通信システム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9031984A JPH09190421A (ja) | 1997-02-17 | 1997-02-17 | 計算機のデータ通信システム |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1063091A Division JP2657090B2 (ja) | 1989-03-14 | 1989-03-14 | 計算機のデータ通信システム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH09190421A true JPH09190421A (ja) | 1997-07-22 |
Family
ID=12346202
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP9031984A Pending JPH09190421A (ja) | 1997-02-17 | 1997-02-17 | 計算機のデータ通信システム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH09190421A (ja) |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6395559A (ja) * | 1986-10-13 | 1988-04-26 | Mitsubishi Electric Corp | 配列計算機用プロセツサ |
-
1997
- 1997-02-17 JP JP9031984A patent/JPH09190421A/ja active Pending
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6395559A (ja) * | 1986-10-13 | 1988-04-26 | Mitsubishi Electric Corp | 配列計算機用プロセツサ |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0460599B1 (en) | Massively parallel processor including queue-based message delivery system | |
| US5617577A (en) | Advanced parallel array processor I/O connection | |
| JP2642039B2 (ja) | アレイ・プロセッサ | |
| US5689719A (en) | Parallel computer system including processing elements | |
| US5594918A (en) | Parallel computer system providing multi-ported intelligent memory | |
| US5689647A (en) | Parallel computing system with processing element number setting mode and shortest route determination with matrix size information | |
| EP0539595A1 (en) | Data processor and data processing method | |
| US5765015A (en) | Slide network for an array processor | |
| JPH09190421A (ja) | 計算機のデータ通信システム | |
| JP2657090B2 (ja) | 計算機のデータ通信システム | |
| JP2549241B2 (ja) | コンピュータ・システム | |
| JP2869100B2 (ja) | 並列計算機の要素プロセッサ | |
| JP2840295B2 (ja) | 計算機のデータ通信システム | |
| CN121501743B (zh) | 人工智能芯片、人工智能处理器核心以及电子设备 | |
| JP2840294B2 (ja) | 並列計算機のデータ通信システム | |
| JP2975722B2 (ja) | 計算機のデータ通信システム | |
| JP2869101B2 (ja) | 並列計算機のデータ通信システム | |
| JP2542922B2 (ja) | デ―タ駆動型デ―タ処理装置 | |
| JPH0696035A (ja) | 処理要素とそれを用いる並列処理計算機 | |
| JP2755769B2 (ja) | データ駆動型データ処理装置 | |
| JP3704367B2 (ja) | スイッチ回路 | |
| JP2625628B2 (ja) | 浮動小数点コンピュータ・システム | |
| JP2834909B2 (ja) | 計算機のデータ通信システム | |
| JP2840325B2 (ja) | データ転送方式 | |
| JPH06103248A (ja) | 並列処理計算機 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| EXPY | Cancellation because of completion of term |