JPH02240765A - 計算機のデータ通信システム - Google Patents
計算機のデータ通信システムInfo
- Publication number
- JPH02240765A JPH02240765A JP1063091A JP6309189A JPH02240765A JP H02240765 A JPH02240765 A JP H02240765A JP 1063091 A JP1063091 A JP 1063091A JP 6309189 A JP6309189 A JP 6309189A JP H02240765 A JPH02240765 A JP H02240765A
- Authority
- JP
- Japan
- Prior art keywords
- data
- processor
- communication
- packet
- processors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004891 communication Methods 0.000 title claims abstract description 62
- 238000012545 processing Methods 0.000 claims abstract description 23
- 238000012546 transfer Methods 0.000 claims abstract description 13
- 239000011159 matrix material Substances 0.000 claims abstract description 7
- 238000000034 method Methods 0.000 claims description 12
- 230000002457 bidirectional effect Effects 0.000 claims description 2
- 230000008878 coupling Effects 0.000 claims 1
- 238000010168 coupling process Methods 0.000 claims 1
- 238000005859 coupling reaction Methods 0.000 claims 1
- 230000007246 mechanism Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000010304 firing Methods 0.000 description 2
- 238000007667 floating Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Landscapes
- Multi Processors (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(イン 産業上の利用分野
本発明は、計算機、特にデータ駆動計算機のデータ通信
システム、該システムに用いるプロセッサ、並びにデー
タ通信方法に関する。
システム、該システムに用いるプロセッサ、並びにデー
タ通信方法に関する。
(ロ)従来の技術
近年、実用的な並列処理計算機の実現に向けて研究が進
められており、本願発明者は、既にデータ駆動計算機と
その言語処理系ソフトウェアの開発、及びそれらの評価
を終了している。
められており、本願発明者は、既にデータ駆動計算機と
その言語処理系ソフトウェアの開発、及びそれらの評価
を終了している。
[田中他: 「データ駆動計算機SPMの試作」、情報
処理学会第36口金国大会講演論文集7 B −5゜ 西用他= 「データ駆動計算機SPMのコンパイラ」、
同7B−6゜ 田中他: 「データ駆動計算機SPMの性能評価(1)
」情報処理学会第37口金国大会講演論文集lN−4゜ 岡本他: 「データ駆動計算機SPMの性能評価(2)
」同lN−5゜〕 一般に、データ駆動計算機は、種々の命令がデータの流
れを示すアークによって接続されるデータ70−グラフ
をプログラムとして実行する6のであり、言い替えれば
、「処理可能なデータから処理を実行していく」という
ような非ノイマン型の思想に従い簡単な実行規則によっ
て演算処理が行なノ)れる。
処理学会第36口金国大会講演論文集7 B −5゜ 西用他= 「データ駆動計算機SPMのコンパイラ」、
同7B−6゜ 田中他: 「データ駆動計算機SPMの性能評価(1)
」情報処理学会第37口金国大会講演論文集lN−4゜ 岡本他: 「データ駆動計算機SPMの性能評価(2)
」同lN−5゜〕 一般に、データ駆動計算機は、種々の命令がデータの流
れを示すアークによって接続されるデータ70−グラフ
をプログラムとして実行する6のであり、言い替えれば
、「処理可能なデータから処理を実行していく」という
ような非ノイマン型の思想に従い簡単な実行規則によっ
て演算処理が行なノ)れる。
斯様なデータ駆動計算機は、主としてデータ対検出機構
、演算処理機構、プログラム記憶機構の三つの構成要素
からなり、その実行処理の概略は以下のとおりである。
、演算処理機構、プログラム記憶機構の三つの構成要素
からなり、その実行処理の概略は以下のとおりである。
まず、データ駆動型計算機ではパケットと呼ばれるーま
とまりのデータ集合を単位として使用しており、該パケ
ットは処理対象データ、データフローグラフの接続情報
(ノード番号)並びに命令コードなどから構成される。
とまりのデータ集合を単位として使用しており、該パケ
ットは処理対象データ、データフローグラフの接続情報
(ノード番号)並びに命令コードなどから構成される。
このデータ対検出機構では演算が可能なオペランドパケ
ットの組を検出して出力する。そして検出されたオペラ
ンドパケットの組は演算処理機構″:′処理される。こ
の結果パケットはプログラム記憶機構で新たなノード番
号を付与されデータ対検出機構に送られる。斯る処理を
繰り返し続けることにより一連の処理が実行される。
ットの組を検出して出力する。そして検出されたオペラ
ンドパケットの組は演算処理機構″:′処理される。こ
の結果パケットはプログラム記憶機構で新たなノード番
号を付与されデータ対検出機構に送られる。斯る処理を
繰り返し続けることにより一連の処理が実行される。
本願発明者は、現在、上述の如きデータフロー計算機に
於て、特にそのプロセッサアーキテクチャに種々の改良
を加えた高並列データ駆動計算機E D D E N
(Enhanced Data Driven ENg
ine)の開発を進めている。このEDDENでは、l
チップのC\105−LSIによって実現する要素プロ
セッサを、最大lT124台接続した大規模データ駆動
計算機の稼働を目指し、また、PE数台の小規模システ
ム、PE数十台の中規模システムなど柔軟な構成がとれ
るようにし、信号処理、画像処理、グラフィックス、各
種シミュレーション、CADなどの広範な分野に適応さ
れることが目標となっている。
於て、特にそのプロセッサアーキテクチャに種々の改良
を加えた高並列データ駆動計算機E D D E N
(Enhanced Data Driven ENg
ine)の開発を進めている。このEDDENでは、l
チップのC\105−LSIによって実現する要素プロ
セッサを、最大lT124台接続した大規模データ駆動
計算機の稼働を目指し、また、PE数台の小規模システ
ム、PE数十台の中規模システムなど柔軟な構成がとれ
るようにし、信号処理、画像処理、グラフィックス、各
種シミュレーション、CADなどの広範な分野に適応さ
れることが目標となっている。
(ハ)発明が解決しようとする課題
−h述の如く、多数の要素プロセッサを接続したシステ
ムの構築のためには、各要素プロセッサ中での演算処理
とプロセッサ間通信処理との独立化、並びにプロセッサ
間通信のためのネットワークシステムの最適化等が要求
され、これ等の実現によって高性能計算機が得られる。
ムの構築のためには、各要素プロセッサ中での演算処理
とプロセッサ間通信処理との独立化、並びにプロセッサ
間通信のためのネットワークシステムの最適化等が要求
され、これ等の実現によって高性能計算機が得られる。
(ニ)課題を解決するための手段
本発明のデータ通信システムは、多数のプロセッサを行
列配置し、各縦方向のプロセッサ列を循環的に結合する
複数の縦通信線と各横方向のプロセッサ行を循環的に結
合する複数の横通信線とでプロセッサ間のデータ通信を
行う計算機のデータ通信システムであり、各プロセッサ
は少なくともデータ処理部と通信制御部とからなり、該
通信制御部が該データ処理部から得られる処理データを
縦方向線、或は横方向線のいずれかの方向のプロセッサ
に選択的に転送する通信制御、並びに、該通信制御部が
隣接プロセッサから縦方向線あるいは横方向線を介して
得られるデータを該プロセッサのデータ処理部に供給す
るか、又は縦方向線あるいは横方向線のいずれかの方向
のプロセッサに選択的に転送する通信制御を司るもので
ある。
列配置し、各縦方向のプロセッサ列を循環的に結合する
複数の縦通信線と各横方向のプロセッサ行を循環的に結
合する複数の横通信線とでプロセッサ間のデータ通信を
行う計算機のデータ通信システムであり、各プロセッサ
は少なくともデータ処理部と通信制御部とからなり、該
通信制御部が該データ処理部から得られる処理データを
縦方向線、或は横方向線のいずれかの方向のプロセッサ
に選択的に転送する通信制御、並びに、該通信制御部が
隣接プロセッサから縦方向線あるいは横方向線を介して
得られるデータを該プロセッサのデータ処理部に供給す
るか、又は縦方向線あるいは横方向線のいずれかの方向
のプロセッサに選択的に転送する通信制御を司るもので
ある。
本発明のデータ通信シテスムのプロセッサは、行方向及
び列方向夫々四方の隣接プロセッサとの結合の為に4個
の双方向の入出力ポートを備え、各ポートに通信データ
の基本的情報量に該当する記憶容量を持つ入力レジスタ
、並びに出力レジスタを具備したものである。
び列方向夫々四方の隣接プロセッサとの結合の為に4個
の双方向の入出力ポートを備え、各ポートに通信データ
の基本的情報量に該当する記憶容量を持つ入力レジスタ
、並びに出力レジスタを具備したものである。
本発明のデータ通信方法は、行列番号と対応付けられて
行列結合された複数のデータフロー型のプロセッサ間で
通信データの送受信を行うデータ通信方法であり、上記
通信データには、送信先プロセッサに対応付けられた列
番号が送信先行列番号として書き込まれており、上記各
プロセッサは、該プロセッサ自身の行列番号と該プロセ
ッサに転送されて来た通信データの送信先行列番号とを
比較し、両番号が一致する時の通信データを該プロセッ
サでデータ処理し、不一致の時の通信データを隣接プロ
セッサに転送するものである。
行列結合された複数のデータフロー型のプロセッサ間で
通信データの送受信を行うデータ通信方法であり、上記
通信データには、送信先プロセッサに対応付けられた列
番号が送信先行列番号として書き込まれており、上記各
プロセッサは、該プロセッサ自身の行列番号と該プロセ
ッサに転送されて来た通信データの送信先行列番号とを
比較し、両番号が一致する時の通信データを該プロセッ
サでデータ処理し、不一致の時の通信データを隣接プロ
セッサに転送するものである。
(ホ)作用
本発明のデータ通信シテスムによれば、多数のプロセッ
サがトーラス接続さノLるネットワークシステムを採用
すると共に、各プロセッサに主にプロセッサ間通信のた
めの通信制御部をデータ処理部とは独立して設けたもの
であるので、プロセッサのLSI化実現の際に、上下ト
ーラス接続によりビン数削限、−様構造が図れ、上記通
信制御部の独立性を保った型のLSI内蔵により、シス
テム全体の小型化、低価格化が望める。
サがトーラス接続さノLるネットワークシステムを採用
すると共に、各プロセッサに主にプロセッサ間通信のた
めの通信制御部をデータ処理部とは独立して設けたもの
であるので、プロセッサのLSI化実現の際に、上下ト
ーラス接続によりビン数削限、−様構造が図れ、上記通
信制御部の独立性を保った型のLSI内蔵により、シス
テム全体の小型化、低価格化が望める。
また、本発明システムのプロセッサは、四方の隣接プロ
セッサとの入出力を行う4個の入出力ポートに夫々通信
データの基本的情報量、即ち1パケット分の情報量を持
つ入力レジスタと出力レジスタとを1対にして備えてい
るので、データ転送毎に必ずパケ・lト単位でプロセッ
サ間のデータ転送が完rできる。従って、パケット単位
の途中でデータ転送が停帯する事がないので、停帯デー
タが他のデータの通信を妨げると云ったデッドロック現
象を回避が可能となる。
セッサとの入出力を行う4個の入出力ポートに夫々通信
データの基本的情報量、即ち1パケット分の情報量を持
つ入力レジスタと出力レジスタとを1対にして備えてい
るので、データ転送毎に必ずパケ・lト単位でプロセッ
サ間のデータ転送が完rできる。従って、パケット単位
の途中でデータ転送が停帯する事がないので、停帯デー
タが他のデータの通信を妨げると云ったデッドロック現
象を回避が可能となる。
さらに、本発明のデータ通信方法によれば、通信データ
中に送信先プロセッサ番号(対応行列番号)が書き込ま
れているので、各プロセッサでは内部的に発生したデー
タ、あるいは他のプロセッサから転送されて来たデータ
の送信先プロセッサ番号を検知してこのデータを四方の
隣接プロセンサの内、いずれのプロセッサに転送すべき
かがプロセッサ自身で判断できる。従って、データは各
プロセッサの転送動作により、最短ルートで宛先プロセ
ッサに通信できるセルフルーティングを実現できる。
中に送信先プロセッサ番号(対応行列番号)が書き込ま
れているので、各プロセッサでは内部的に発生したデー
タ、あるいは他のプロセッサから転送されて来たデータ
の送信先プロセッサ番号を検知してこのデータを四方の
隣接プロセンサの内、いずれのプロセッサに転送すべき
かがプロセッサ自身で判断できる。従って、データは各
プロセッサの転送動作により、最短ルートで宛先プロセ
ッサに通信できるセルフルーティングを実現できる。
(へ)実施例
第1図に本発明実施例としての高並列データ駆動計算機
のシステムを示し、第2図に要素プロセッサの構成を示
す。
のシステムを示し、第2図に要素プロセッサの構成を示
す。
まず第2図の要素プロセッサ(PE)は、基本的にはプ
ログラム記憶(PS)、発火制御・カラー管理部(FC
CM)、命令実行部(EXE)、及びキューメモリ(Q
)が巡回パイプライン(リング)構造に接続された構成
としている。
ログラム記憶(PS)、発火制御・カラー管理部(FC
CM)、命令実行部(EXE)、及びキューメモリ(Q
)が巡回パイプライン(リング)構造に接続された構成
としている。
プログラム記憶(PS)はノード番号の更新、定数付与
、及び結果のコピーを行う。発火制御・カラー管理部(
FCCM)は、前述の2段階の待ち合わせ記憶方式で発
火制御及びカラーの獲得・解放の管理を行う。命令実行
部(EXE)は、浮動小数点・整数演算、条件判定、分
岐、簡易定数発生などの命令、及びそれらの複合命令を
実行する。
、及び結果のコピーを行う。発火制御・カラー管理部(
FCCM)は、前述の2段階の待ち合わせ記憶方式で発
火制御及びカラーの獲得・解放の管理を行う。命令実行
部(EXE)は、浮動小数点・整数演算、条件判定、分
岐、簡易定数発生などの命令、及びそれらの複合命令を
実行する。
キュー(Q)はリング上でのあらゆるデータ流変動を吸
収する緩衝記憶である。緩衝記憶が必要となるのは、■
コピー、■リングへの強制的入力、■リングからの出力
遅延、■(FCCM)における待ちリストのサーチ、な
どが生じた時である。本要素プロセッサ(PE)には、
キュー(Q)のデータ滞在量に応じて■〜■の動作モー
ドを動的に変更する機能を付加し、これによって並列度
の制御を行う。
収する緩衝記憶である。緩衝記憶が必要となるのは、■
コピー、■リングへの強制的入力、■リングからの出力
遅延、■(FCCM)における待ちリストのサーチ、な
どが生じた時である。本要素プロセッサ(PE)には、
キュー(Q)のデータ滞在量に応じて■〜■の動作モー
ドを動的に変更する機能を付加し、これによって並列度
の制御を行う。
また、キュー(Q)がやむなくオーバーフローした時に
は、外部データメモリ(EDM)上に外部キューを形成
してこれを吸収し、プログラム実行の継続を図る。
は、外部データメモリ(EDM)上に外部キューを形成
してこれを吸収し、プログラム実行の継続を図る。
ネットワーク制御部(NC)は、東西南北4系統の通信
ポートを保持し、最大1024プロセツサ(PE)のト
ーラス結合網に基づくルーティング制御を行う。ベクト
ル演算制御部(VC)は、ベクトル演算関連命令、及び
通常のメモリアクセス命令の実行制御を行う。該制御部
(VC)と、入力制御部(IC)及び出力制御部(OC
)の間には構造体(ベクトル)通信用のバイパス線を設
ける。外部データメモリ(EDM)は、構造体等を格納
するデータメモリであり、容量は512KByte(1
28に語X32bit)程度とする。タロツク方式は同
期式であるが、上記ネットワーク制御部(NC)内部は
自己開明式で動作するものとする。
ポートを保持し、最大1024プロセツサ(PE)のト
ーラス結合網に基づくルーティング制御を行う。ベクト
ル演算制御部(VC)は、ベクトル演算関連命令、及び
通常のメモリアクセス命令の実行制御を行う。該制御部
(VC)と、入力制御部(IC)及び出力制御部(OC
)の間には構造体(ベクトル)通信用のバイパス線を設
ける。外部データメモリ(EDM)は、構造体等を格納
するデータメモリであり、容量は512KByte(1
28に語X32bit)程度とする。タロツク方式は同
期式であるが、上記ネットワーク制御部(NC)内部は
自己開明式で動作するものとする。
斯様な要素プロセッサ(1’E)を多数用いたEDDE
Nの基本的な構成は第1図に示すようにnXn台の要素
プロセッサをトーラス結合網で接続することを基本とす
る。該トーラス結合網とは、多数のプロセッサを行列配
置し、各縦方向、即ち南北方向(N−5)のプロセッサ
列を循環的に結合する複数の縦通信線と各横方向、即ち
東西方向(W−E)のプロセッサ行を循環的に結合する
複数の横通信線とで任意のプロセッサ間のデータ通信を
可能としたものである。
Nの基本的な構成は第1図に示すようにnXn台の要素
プロセッサをトーラス結合網で接続することを基本とす
る。該トーラス結合網とは、多数のプロセッサを行列配
置し、各縦方向、即ち南北方向(N−5)のプロセッサ
列を循環的に結合する複数の縦通信線と各横方向、即ち
東西方向(W−E)のプロセッサ行を循環的に結合する
複数の横通信線とで任意のプロセッサ間のデータ通信を
可能としたものである。
本実施例システムでは、ネットワークとのデータのやり
とりは、南北方向(N−5)の任意の通信ノンタにネッ
トワークインタフェース(NIF)を挿入することによ
って行う。該インタフェース(NIF)、及び要素プロ
セッサ16〜64台を1枚のプロセッサポート上に実装
し、トーラス接続リンクをプリント基板上に形成する。
とりは、南北方向(N−5)の任意の通信ノンタにネッ
トワークインタフェース(NIF)を挿入することによ
って行う。該インタフェース(NIF)、及び要素プロ
セッサ16〜64台を1枚のプロセッサポート上に実装
し、トーラス接続リンクをプリント基板上に形成する。
小・中規模システムの構成としては、ホスト計算機とし
て汎用のEWSまたはパソコンを用い、それらのバスイ
ンタフェースを介してネットワークインタフェース(N
IF)に接続する。実装形態としては、1〜4枚のプロ
セッサボードと1枚のバスインタフェースボードを、E
WS等のラックに直接挿入することにする。
て汎用のEWSまたはパソコンを用い、それらのバスイ
ンタフェースを介してネットワークインタフェース(N
IF)に接続する。実装形態としては、1〜4枚のプロ
セッサボードと1枚のバスインタフェースボードを、E
WS等のラックに直接挿入することにする。
大規模システムの構成としては、応用分野に応じて、次
の2種類の構成法が考えられる。
の2種類の構成法が考えられる。
■ クラスタ接続
前述のプロセッサボードを1つのクラスタとして、クラ
スタ間をクラスタインタフェースを介して接続する。ク
ラスタインタフェースは、各クラスタ内のデータの収集
・分配の管理を行う。
スタ間をクラスタインタフェースを介して接続する。ク
ラスタインタフェースは、各クラスタ内のデータの収集
・分配の管理を行う。
■ 大型トーラス接続
1024台(32X32台)の要素プロセッサをトーラ
ス結合網で接続する。実装形態としては、1枚のプリン
ト基板に南北(N−5)方向の32台の要素ブロセ・ノ
サとNIFとを実装し、東西(W−E)方向のリンクは
マザーボード1に形成する。
ス結合網で接続する。実装形態としては、1枚のプリン
ト基板に南北(N−5)方向の32台の要素ブロセ・ノ
サとNIFとを実装し、東西(W−E)方向のリンクは
マザーボード1に形成する。
上述の構成のデータ駆動計算機で用いられるデータパケ
ットには、大別して、プログラム実行に使用する実行パ
ケットとプログラム実行以外に使用される非実行パケッ
トがあり、第4図(a)〜(e)にその実例を示してい
る。尚、パケット形式は、構造体本体を保持したパケッ
ト以外は固定長とし、プロセッサ(PE)内のパイプラ
インリング上では33ビット×2語、ネットワーク上で
は18ビット×4語構成を採用している。
ットには、大別して、プログラム実行に使用する実行パ
ケットとプログラム実行以外に使用される非実行パケッ
トがあり、第4図(a)〜(e)にその実例を示してい
る。尚、パケット形式は、構造体本体を保持したパケッ
ト以外は固定長とし、プロセッサ(PE)内のパイプラ
インリング上では33ビット×2語、ネットワーク上で
は18ビット×4語構成を採用している。
以下に、第4図のパケットフォーマットに於ける各フィ
ールドの内容を示す。
ールドの内容を示す。
HD(lbit月285パケツトの際の1語目(ヘッダ
)と2語目(テイル)の識別子。ヘッダの時 1“EX
(lbit戸パイプラインリング上からPE外部へ出力
されるパケットを識別するフラグ 5IODE(2bit戸実行パケット、非実行パケット
等のパケットの種類を識別する識別コード 5−CODE(3bit):〜l0DEと合わせてパケ
ットに対する処理を規定する識別コード OPCODE−M(5bit):メイン命令コード。命
令実行部(EXE)における命令の種類を規定する。ま
た、n5yncの際に同期処理を行うデータの数を保持
する。
)と2語目(テイル)の識別子。ヘッダの時 1“EX
(lbit戸パイプラインリング上からPE外部へ出力
されるパケットを識別するフラグ 5IODE(2bit戸実行パケット、非実行パケット
等のパケットの種類を識別する識別コード 5−CODE(3bit):〜l0DEと合わせてパケ
ットに対する処理を規定する識別コード OPCODE−M(5bit):メイン命令コード。命
令実行部(EXE)における命令の種類を規定する。ま
た、n5yncの際に同期処理を行うデータの数を保持
する。
0PCODE−5(6bi t):サブ命令コード。メ
イン命令コードで規定された命令を更に詳細に規定する
。
イン命令コードで規定された命令を更に詳細に規定する
。
聞ODE*(最大11bit):データフローグラフの
ノード番号 C0LOR(4bi t):カラー識別子。サブルーチ
ンコールによるプログラム共用、時系別データに対する
処理なと、同一データフローグラフを多重実行する際に
環境を識別する職別番号。
ノード番号 C0LOR(4bi t):カラー識別子。サブルーチ
ンコールによるプログラム共用、時系別データに対する
処理なと、同一データフローグラフを多重実行する際に
環境を識別する職別番号。
PH1(LObit):PE番号。最大1024台のP
Eを識別するための識別番号。
Eを識別するための識別番号。
DATA(32bi t): 32ビツトの整数あるい
は浮動少数点数。
は浮動少数点数。
HT(1bit)二語数が4語以上のパケットの際に、
ヘッダ及びテイルと中間の語とを識別するフラグヘッダ
またはテイルの時に°l となる。
ヘッダ及びテイルと中間の語とを識別するフラグヘッダ
またはテイルの時に°l となる。
RQ(1bit):ネットワーク上を転送3れるパケッ
トに付加するフラグで、ネットワーク上で13!転送さ
れる度に値が反転するため、語の存在を認識できる。更
に、値が反転することが、パケットを前方へ転送するた
めの転送要求信号となる。また、HTフラグと合わせて
、ヘッダとテイルとを識別できる。
トに付加するフラグで、ネットワーク上で13!転送さ
れる度に値が反転するため、語の存在を認識できる。更
に、値が反転することが、パケットを前方へ転送するた
めの転送要求信号となる。また、HTフラグと合わせて
、ヘッダとテイルとを識別できる。
ADDRESS(16bi t ) :各メモリのデー
タのロード/ダンプなどの際に、メモリアドレスを格納
する。
タのロード/ダンプなどの際に、メモリアドレスを格納
する。
以上の基本構成を持つ本発明実施例の計算機の特徴的な
構成は、要素プロセッサ(PE)での本来のデータ処理
のための各機構とは独立して動作するネットワーク制御
部(NC)にある。
構成は、要素プロセッサ(PE)での本来のデータ処理
のための各機構とは独立して動作するネットワーク制御
部(NC)にある。
該ネットワーク制御部(NC)は第4図(c)及び同図
(e)の如きパケットを当該プロセッサ(PE)から受
けとり、又は他のプロセッサ(PE)から受けとって、
そのパケットの第1語口にある(PE@Iを検知する。
(e)の如きパケットを当該プロセッサ(PE)から受
けとり、又は他のプロセッサ(PE)から受けとって、
そのパケットの第1語口にある(PE@Iを検知する。
この[PE番]には該パケットが転送されるべき宛先の
プロセッサの行列番号形式の宛先のプロセッサ番号(x
、y)が書き込まれているので、この値と当該プロセッ
サの番号(x、 y)との比較を行われる。
プロセッサの行列番号形式の宛先のプロセッサ番号(x
、y)が書き込まれているので、この値と当該プロセッ
サの番号(x、 y)との比較を行われる。
この比較処理により、例えば、X=xでない限り、パケ
ットを西(W)から東(W)へ、あるいは束(E)から
西(W)へ転送する。
ットを西(W)から東(W)へ、あるいは束(E)から
西(W)へ転送する。
X=xであれば、y=yでない限りパケットは市(S)
から北(N)へ、あるいは北(N)がら南(S)・\転
送する。
から北(N)へ、あるいは北(N)がら南(S)・\転
送する。
そして、X=x且つY=yとなった時にこのパケットが
当該プロセッサ内でのデータ処理に供せられるのである
。
当該プロセッサ内でのデータ処理に供せられるのである
。
従って、データパケットはトーラス結合された多数の行
列プロセッサ間を、まず、東西方向に転送され、その後
南北方向に転送される事になり、これによって、最低路
離転送のセルフルーティングを実現している。
列プロセッサ間を、まず、東西方向に転送され、その後
南北方向に転送される事になり、これによって、最低路
離転送のセルフルーティングを実現している。
第3図に上述の如きトーラスネットワーク上でのセルフ
ルーティングを実現する為のネットワーク制御部(NC
)のデートシステムを模式的に示し、同図に従い、その
ルーティングアルゴリズムを示す。尚、第3図に於て、
(RNI)(RNO)は孔入出力ホートを構成する入力
シフトレジスタ、及び出力シフトレジスタであり、4段
のレジスタ(r)からなる。同様に(R5I)(R5O
)は重大出力ポート、(RWl)(R^゛0)は四人出
力ポート、(REI)(REO)は東入出力ポートを構
成している。又、「OJは合流、「◎」は分岐を示して
いる。
ルーティングを実現する為のネットワーク制御部(NC
)のデートシステムを模式的に示し、同図に従い、その
ルーティングアルゴリズムを示す。尚、第3図に於て、
(RNI)(RNO)は孔入出力ホートを構成する入力
シフトレジスタ、及び出力シフトレジスタであり、4段
のレジスタ(r)からなる。同様に(R5I)(R5O
)は重大出力ポート、(RWl)(R^゛0)は四人出
力ポート、(REI)(REO)は東入出力ポートを構
成している。又、「OJは合流、「◎」は分岐を示して
いる。
ルーティングアルゴリズムは以下のとおり。
■、自分のPE番号を(x、y)、ネットワークをpX
q(q:N−*S方向、q:W−4E方向)のトーラス
、パケットの行き先PE番号を(x、y)とし、 △Xミ(X −x )mod q l△x1≦q/2
△yミ(Y−1)modp l△y1≦p/2とする
。
q(q:N−*S方向、q:W−4E方向)のトーラス
、パケットの行き先PE番号を(x、y)とし、 △Xミ(X −x )mod q l△x1≦q/2
△yミ(Y−1)modp l△y1≦p/2とする
。
11、PE番号は、NからSの方向に順にy=o、1.
2、・・・ p WからEの方向に順に x=O1l、2、・・・、q とする。
2、・・・ p WからEの方向に順に x=O1l、2、・・・、q とする。
11■、\l0DEはパケットのタグの\l0DEフィ
ールドの値を意味する。(〜l0DE−(10はホスト
へのパケットである。) (1)R1 △y=QのときパケットをPへ出力 Δy≠0.のときパケットをSへ出力 (2)R2 △X≠0のときパケットをWへ出力 △x=Oかつ△y〉0のときパケットをSへ出力 △x=0かつ△y=QかつMODE≠、00のときパケ
ットをPへ出力 Δx = OかつΔy=0がッMODE=00のときパ
ケットをNへ出力 Δx=0かつ△yくOのときパケットをNへ出力 (3)R3 Δx+QのときパケットをEへ出力 Δx=0かつ△y〉0のときパケットをSへ出力 Δx=OかツL y = OかつM OD E≠00の
ときパケットをPへ出力 △X=Oかつ△y=Qかつ!+l0DE=00のときパ
ケットをN・入出力 △x=Oかつ△y〈0のときパケットをNへ出力 (4)R4 Δ〜==0かつMODE≠00のときパケットをPへ出
力 ニ−・≠0またはMODE= 00のときパケットをN
へ出力 (5)R5 △x>OのときパケットをEへ出力 △x=Oかつ△y〉0のときパケットをSへ出力 △x=OかつΔ)r≦OのときパケットをNへ出力 △x<0のときパケットをWへ出力 ■、パケットのヘッダが到着したときにルーティングを
行い、以降のデータはパケットのテイルが到着するまで
、同じ経路に出力する。
ールドの値を意味する。(〜l0DE−(10はホスト
へのパケットである。) (1)R1 △y=QのときパケットをPへ出力 Δy≠0.のときパケットをSへ出力 (2)R2 △X≠0のときパケットをWへ出力 △x=Oかつ△y〉0のときパケットをSへ出力 △x=0かつ△y=QかつMODE≠、00のときパケ
ットをPへ出力 Δx = OかつΔy=0がッMODE=00のときパ
ケットをNへ出力 Δx=0かつ△yくOのときパケットをNへ出力 (3)R3 Δx+QのときパケットをEへ出力 Δx=0かつ△y〉0のときパケットをSへ出力 Δx=OかツL y = OかつM OD E≠00の
ときパケットをPへ出力 △X=Oかつ△y=Qかつ!+l0DE=00のときパ
ケットをN・入出力 △x=Oかつ△y〈0のときパケットをNへ出力 (4)R4 Δ〜==0かつMODE≠00のときパケットをPへ出
力 ニ−・≠0またはMODE= 00のときパケットをN
へ出力 (5)R5 △x>OのときパケットをEへ出力 △x=Oかつ△y〉0のときパケットをSへ出力 △x=OかつΔ)r≦OのときパケットをNへ出力 △x<0のときパケットをWへ出力 ■、パケットのヘッダが到着したときにルーティングを
行い、以降のデータはパケットのテイルが到着するまで
、同じ経路に出力する。
V、P E番号(X、Y)とネットワークのサイズは、
あらかじめ設定できるものとする。ただし、p、(1は
2のべき乗に限る。また、△X、△yを計算するときに
、モジユロをとらないモード(格子状ネットワークに対
応)ことら可能とする。
あらかじめ設定できるものとする。ただし、p、(1は
2のべき乗に限る。また、△X、△yを計算するときに
、モジユロをとらないモード(格子状ネットワークに対
応)ことら可能とする。
Vl 、 I’ Eをリング状に接続する場合ら、N
−Sを結線すれば、上のルーティングアルゴリズムでル
ーティングできる。
−Sを結線すれば、上のルーティングアルゴリズムでル
ーティングできる。
以ヒがセルフルーティングアルゴリズムの1例であるが
、これに限られるものでない。
、これに限られるものでない。
一方、第3図のネットワーク制御部(NC)の入出力ポ
ートの構成は、図示の如く、4段の各18ピントのシフ
トレジスタ(r)・・・の入力ポート、同じく4段のシ
フトレジスタ(r)・・・の出力ポートを備えているの
で、14図(c)、(e)の4語形式のパケットがその
まま全て入力ポート、あるいは出力ポートに格納できる
事になる。この事は、トーラスネットワークのように双
方向通信が必要な双方向通信路上で、一方向の前にパケ
ットがつかえている状態でこの方向のパケット転送が停
止していても、パケット単位がポート部で中断して停止
すると云うデッドロックの原因の一つを解消する事にな
る。即ち、例えば入出力ポートの人出側あるいは出力側
に1まとまりのパケットが完全に格納されるので、当該
プロセッサで、他のパケットの他の方向への転送が可能
となる。
ートの構成は、図示の如く、4段の各18ピントのシフ
トレジスタ(r)・・・の入力ポート、同じく4段のシ
フトレジスタ(r)・・・の出力ポートを備えているの
で、14図(c)、(e)の4語形式のパケットがその
まま全て入力ポート、あるいは出力ポートに格納できる
事になる。この事は、トーラスネットワークのように双
方向通信が必要な双方向通信路上で、一方向の前にパケ
ットがつかえている状態でこの方向のパケット転送が停
止していても、パケット単位がポート部で中断して停止
すると云うデッドロックの原因の一つを解消する事にな
る。即ち、例えば入出力ポートの人出側あるいは出力側
に1まとまりのパケットが完全に格納されるので、当該
プロセッサで、他のパケットの他の方向への転送が可能
となる。
(ト)発明の効果
本発明のよれば、システム全体の小型化、低価格化のた
めに、通信制御機構をもPEチップに内蔵でき、プロセ
ッサの基本的な結合状態により、チップのピン数制限、
プロセッサ間距離が小さい、セルフルーティングが可能
、−棟構造、デッドロック回避が可能、実装が容易とな
るデータ通信システム、その為のプロセッサ、並びにデ
ータ通信方法を実現する事ができる。
めに、通信制御機構をもPEチップに内蔵でき、プロセ
ッサの基本的な結合状態により、チップのピン数制限、
プロセッサ間距離が小さい、セルフルーティングが可能
、−棟構造、デッドロック回避が可能、実装が容易とな
るデータ通信システム、その為のプロセッサ、並びにデ
ータ通信方法を実現する事ができる。
第1図は本発明のデータ通信システムを示すシステム図
、第2図は本発明のプロセッサの蜆略構成を示すブロッ
ク図、第3図は本発明プロセッサの要部ゲート構成の模
式図、第4図(a)乃至(e)はパケット構成図である
。 (PE)・・・要素プロセッサ、(EXE)・・・命令
実行部、(ED〜1)・・・外部データメモリ、(NC
)・・・ネットワーク制911部。
、第2図は本発明のプロセッサの蜆略構成を示すブロッ
ク図、第3図は本発明プロセッサの要部ゲート構成の模
式図、第4図(a)乃至(e)はパケット構成図である
。 (PE)・・・要素プロセッサ、(EXE)・・・命令
実行部、(ED〜1)・・・外部データメモリ、(NC
)・・・ネットワーク制911部。
Claims (3)
- (1)多数のプロセッサを行列配置し、各縦方向のプロ
セッサ列を循環的に結合する複数の縦通信線と各横方向
のプロセッサ行を循環的に結合する複数の横通信線とで
プロセッサ間のデータ通信を行う計算機のデータ通信シ
ステムに於て、各プロセッサは少なくともデータ処理部
と通信制御部とからなり、 該通信制御部が該データ処理部から得られる処理データ
を縦方向線、或は横方向線のいずれかの方向のプロセッ
サに選択的に転送する通信制御、並びに、該通信制御部
が隣接プロセッサから縦方向線あるいは横方向線を介し
て得られるデータを該プロセッサのデータ処理部に供給
するか、又は縦方向線あるいは横方向線のいずれかの方
向のプロセッサに選択的に転送する通信制御を司る事を
特徴とする計算機のデータ通信システム。 - (2)請求項1記載の計算機のデータ通信システムのプ
ロセッサに於て、 行方向及び列方向夫々四方の隣接プロセッサとの結合の
為に4個の双方向の入出力ポートを備え、各ポートに通
信データの基本的情報量に該当する記憶容量を持つ入力
レジスタ、並びに出力レジスタを具備したことを特徴と
するプロセッサ。 - (3)行列番号と対応付けられて行列結合された複数の
データフロー型のプロセッサ間で通信データの送受信を
行うデータ通信方法に於て、上記通信データには、送信
先プロセッサに対応付けられた行列番号が送信先行列番
号として書き込まれており、 上記各プロセッサは、該プロセッサ自身の行列番号と該
プロセッサに転送されて来た通信データの送信先行列番
号とを比較し、両番号が一致する時の通信データを該プ
ロセッサでデータ処理し、不一致の時の通信データを隣
接プロセッサに転送するデータ通信方法。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1063091A JP2657090B2 (ja) | 1989-03-14 | 1989-03-14 | 計算機のデータ通信システム |
| US08/551,694 US5689647A (en) | 1989-03-14 | 1995-11-01 | Parallel computing system with processing element number setting mode and shortest route determination with matrix size information |
| US08/754,870 US5926643A (en) | 1989-03-14 | 1996-11-22 | Data driven processor performing parallel scalar and vector processing |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1063091A JP2657090B2 (ja) | 1989-03-14 | 1989-03-14 | 計算機のデータ通信システム |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP9031984A Division JPH09190421A (ja) | 1997-02-17 | 1997-02-17 | 計算機のデータ通信システム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH02240765A true JPH02240765A (ja) | 1990-09-25 |
| JP2657090B2 JP2657090B2 (ja) | 1997-09-24 |
Family
ID=13219300
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1063091A Expired - Fee Related JP2657090B2 (ja) | 1989-03-14 | 1989-03-14 | 計算機のデータ通信システム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2657090B2 (ja) |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS58181168A (ja) * | 1982-04-17 | 1983-10-22 | Nippon Telegr & Teleph Corp <Ntt> | 自律型プロセツサアレイ方式 |
| JPS6028345A (ja) * | 1983-07-26 | 1985-02-13 | Fujitsu Ltd | 並列計算機における通信方式 |
| JPS60181962A (ja) * | 1984-02-29 | 1985-09-17 | Fujitsu Ltd | 並列計算機における通信方式 |
| JPS63257052A (ja) * | 1987-04-15 | 1988-10-24 | Agency Of Ind Science & Technol | マルチプロセツサシステム |
-
1989
- 1989-03-14 JP JP1063091A patent/JP2657090B2/ja not_active Expired - Fee Related
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS58181168A (ja) * | 1982-04-17 | 1983-10-22 | Nippon Telegr & Teleph Corp <Ntt> | 自律型プロセツサアレイ方式 |
| JPS6028345A (ja) * | 1983-07-26 | 1985-02-13 | Fujitsu Ltd | 並列計算機における通信方式 |
| JPS60181962A (ja) * | 1984-02-29 | 1985-09-17 | Fujitsu Ltd | 並列計算機における通信方式 |
| JPS63257052A (ja) * | 1987-04-15 | 1988-10-24 | Agency Of Ind Science & Technol | マルチプロセツサシステム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2657090B2 (ja) | 1997-09-24 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5617577A (en) | Advanced parallel array processor I/O connection | |
| US8737392B1 (en) | Configuring routing in mesh networks | |
| US9384165B1 (en) | Configuring routing in mesh networks | |
| US6631439B2 (en) | VLIW computer processing architecture with on-chip dynamic RAM | |
| US5119481A (en) | Register bus multiprocessor system with shift | |
| EP0460599B1 (en) | Massively parallel processor including queue-based message delivery system | |
| US5594918A (en) | Parallel computer system providing multi-ported intelligent memory | |
| EP0539595A1 (en) | Data processor and data processing method | |
| HK1044056B (en) | Instruction memory with associative cross-bar switch | |
| JPH05233281A (ja) | 電子計算機 | |
| CN111630505A (zh) | 深度学习加速器系统及其方法 | |
| US7673118B2 (en) | System and method for vector-parallel multiprocessor communication | |
| JP2549241B2 (ja) | コンピュータ・システム | |
| JPH02240765A (ja) | 計算機のデータ通信システム | |
| JPH09190421A (ja) | 計算機のデータ通信システム | |
| EP0570951A2 (en) | Advanced parallel array processor mechanical packaging | |
| JP2840295B2 (ja) | 計算機のデータ通信システム | |
| US7404048B2 (en) | Inter-cluster communication module using the memory access network | |
| JP2869100B2 (ja) | 並列計算機の要素プロセッサ | |
| CN121501743B (zh) | 人工智能芯片、人工智能处理器核心以及电子设备 | |
| JP2869101B2 (ja) | 並列計算機のデータ通信システム | |
| JP2755769B2 (ja) | データ駆動型データ処理装置 | |
| JP2840294B2 (ja) | 並列計算機のデータ通信システム | |
| JP2975722B2 (ja) | 計算機のデータ通信システム | |
| JPH04281583A (ja) | データ駆動型プロセッサ |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |