JPH0818565A - データ処理装置 - Google Patents
データ処理装置Info
- Publication number
- JPH0818565A JPH0818565A JP6145100A JP14510094A JPH0818565A JP H0818565 A JPH0818565 A JP H0818565A JP 6145100 A JP6145100 A JP 6145100A JP 14510094 A JP14510094 A JP 14510094A JP H0818565 A JPH0818565 A JP H0818565A
- Authority
- JP
- Japan
- Prior art keywords
- data
- packet
- buffer
- input port
- request
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
- G06F15/163—Interprocessor communication
- G06F15/173—Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
- G06F15/17356—Indirect interconnection networks
- G06F15/17368—Indirect interconnection networks non hierarchical topologies
- G06F15/17375—One dimensional, e.g. linear array, ring
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
- G06F15/163—Interprocessor communication
- G06F15/17—Interprocessor communication using an input/output type connection, e.g. channel, I/O port
Landscapes
- Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Small-Scale Networks (AREA)
- Multi Processors (AREA)
Abstract
(57)【要約】
【目的】複数パケットで構成される一連のデータを1マ
シンサイクルでセレクタを通過させることによりネット
ワークのスループットを向上させる。 【構成】プロセッサ間あるいはプロセッサとメモリ間の
完全結合網において、2つのバッファ6,7は、それぞ
れ複数のパケットで構成される一連のデータをパケット
単位に入力して保持し、同時に読みだすことが可能であ
る。2つのセレクタ10,11は、バッファ6,7の出
力を同時に通過させることが可能であり、また、一連の
データを構成する複数のパケットの全てがバッファ6,
7に保持されていない時は、他の入力ポートに保持され
ている一連のデータを構成する複数のパケットの一部と
を合わせて通過させる。
シンサイクルでセレクタを通過させることによりネット
ワークのスループットを向上させる。 【構成】プロセッサ間あるいはプロセッサとメモリ間の
完全結合網において、2つのバッファ6,7は、それぞ
れ複数のパケットで構成される一連のデータをパケット
単位に入力して保持し、同時に読みだすことが可能であ
る。2つのセレクタ10,11は、バッファ6,7の出
力を同時に通過させることが可能であり、また、一連の
データを構成する複数のパケットの全てがバッファ6,
7に保持されていない時は、他の入力ポートに保持され
ている一連のデータを構成する複数のパケットの一部と
を合わせて通過させる。
Description
【0001】
【産業上の利用分野】本発明は並列コンピュータシステ
ムにおける、プロセッサとメモリ間のインターコネクシ
ョンネットワークの高速処理方式に関する。
ムにおける、プロセッサとメモリ間のインターコネクシ
ョンネットワークの高速処理方式に関する。
【0002】
【従来の技術】近年、コンピュータシステムの高並列
化、プロセッサの飛躍的な処理能力の向上に伴い、プロ
セッサとメモリをつなぐインターコネクションネットワ
ークにも、高い性能が求められるようになってきた。
化、プロセッサの飛躍的な処理能力の向上に伴い、プロ
セッサとメモリをつなぐインターコネクションネットワ
ークにも、高い性能が求められるようになってきた。
【0003】従来、この種のネットワークの方式とし
て、入力ポート側にポートごとにバッファをもち、各出
力ポートごとに入力ポートに対して優先権を与えるため
の競合調停回路が存在し、その競合調停回路で優先権が
与えられた入力ポートのバッファからデータを取り出
し、出力ポートへデータを送る構成が知られている。
て、入力ポート側にポートごとにバッファをもち、各出
力ポートごとに入力ポートに対して優先権を与えるため
の競合調停回路が存在し、その競合調停回路で優先権が
与えられた入力ポートのバッファからデータを取り出
し、出力ポートへデータを送る構成が知られている。
【0004】図15は、その一例を示すブロック図であ
り、本例では入力ポートが2つ、出力ポートが2つの構
成となっており、各入力ポート44,45からの制御信
号を一時的に保持する制御バッファ48,49と各入力
ポート44,45からの入力データを一時的に保持する
ためのデータバッファ50,51と、どの入力ポートに
優先権を与えるかを決めるリクエスト競合調停回路(ア
ービタ)52,53と、データバッファ50の出力かデ
ータバッファ51の出力かを選択するセレクタ54,5
5とからなる。
り、本例では入力ポートが2つ、出力ポートが2つの構
成となっており、各入力ポート44,45からの制御信
号を一時的に保持する制御バッファ48,49と各入力
ポート44,45からの入力データを一時的に保持する
ためのデータバッファ50,51と、どの入力ポートに
優先権を与えるかを決めるリクエスト競合調停回路(ア
ービタ)52,53と、データバッファ50の出力かデ
ータバッファ51の出力かを選択するセレクタ54,5
5とからなる。
【0005】例えば、データが2パケットで構成されて
いるとすると、アービタ52で優先権があたえられた入
力ポート44のデータバッファ50からデータを取り出
し、セレクタ54を通過させるのに2マシンサイクル必
要になる。これはセレクタが55マシンサイクルでデー
タの1パケット分しか通過させることができないためで
ある。
いるとすると、アービタ52で優先権があたえられた入
力ポート44のデータバッファ50からデータを取り出
し、セレクタ54を通過させるのに2マシンサイクル必
要になる。これはセレクタが55マシンサイクルでデー
タの1パケット分しか通過させることができないためで
ある。
【0006】
【発明が解決しようとする課題】上述した従来のインタ
ーコネクションネットワークでは、複数パケットで構成
されている一連のデータを、1パケットづつクロスバを
通過させるためにパケット数分だけ時間がかかり、前の
リクエストにより、現在、目的とする出力ポートへ行け
なくなる時間(ブロッキングの時間)が長いという欠点
がある。
ーコネクションネットワークでは、複数パケットで構成
されている一連のデータを、1パケットづつクロスバを
通過させるためにパケット数分だけ時間がかかり、前の
リクエストにより、現在、目的とする出力ポートへ行け
なくなる時間(ブロッキングの時間)が長いという欠点
がある。
【0007】
【課題を解決するための手段】本発明のインターコネク
ションネットワークは、並列コンピュータシステムのプ
ロセッサとメモリ間で入力ポート及び出力ポートを介し
て、複数のパケットで構成された一連のデータをパケッ
ト単位に時分割し、連続して転送するインターコネクシ
ョンネットワークにおいて、前記一連のデータをパケッ
ト単位に入力して保持し、1マシンサイクルで全て読み
だすことが可能な前記入力ポートごとのバッファと、前
記バッファの出力を同時に通過させることが可能であ
り、前記一連のデータを構成するパケット群の全てが前
記バッファに保持されていない時は、前記バッファに保
持されているパケットだけで前記セレクタを通過させ、
残りのパケットについては前記バッファに到着次第、そ
のパケットだけを通過させることが可能な前記バッファ
と同数のセレクタと、前記セレクタを通過した一連のデ
ータを構成するパケット群を一時的に保持し、一連のデ
ータを構成するパケット群を前記出力ポートに連続して
出力するための他のバッファとを設けたことを特徴とす
る。
ションネットワークは、並列コンピュータシステムのプ
ロセッサとメモリ間で入力ポート及び出力ポートを介し
て、複数のパケットで構成された一連のデータをパケッ
ト単位に時分割し、連続して転送するインターコネクシ
ョンネットワークにおいて、前記一連のデータをパケッ
ト単位に入力して保持し、1マシンサイクルで全て読み
だすことが可能な前記入力ポートごとのバッファと、前
記バッファの出力を同時に通過させることが可能であ
り、前記一連のデータを構成するパケット群の全てが前
記バッファに保持されていない時は、前記バッファに保
持されているパケットだけで前記セレクタを通過させ、
残りのパケットについては前記バッファに到着次第、そ
のパケットだけを通過させることが可能な前記バッファ
と同数のセレクタと、前記セレクタを通過した一連のデ
ータを構成するパケット群を一時的に保持し、一連のデ
ータを構成するパケット群を前記出力ポートに連続して
出力するための他のバッファとを設けたことを特徴とす
る。
【0008】
【実施例】次に本発明の実施例について図面を参照して
説明する。図2は本発明の対象となるコンピュータシス
テム構成の一例を表した図であり、2つのプロセッサ0
00,100とこの2つのプロセッサ000,100が
共有する2つのメモリ200,300をネットワークを
通じて接続した並列コンピュータシステムを示す。
説明する。図2は本発明の対象となるコンピュータシス
テム構成の一例を表した図であり、2つのプロセッサ0
00,100とこの2つのプロセッサ000,100が
共有する2つのメモリ200,300をネットワークを
通じて接続した並列コンピュータシステムを示す。
【0009】図1は図2に示したインターコネクション
ネットワークの詳細図であり、プロセッサ000に対応
する入力ポート001,プロセッサ100に対応する入
力ポート101,共有メモリ200に対応する出力ポー
ト201,共有メモリ300に対応する出力ポート30
1を有する。また、一連のデータは第1パケットと第2
パケットの2つのパケットで構成されていて、それぞれ
の入力ポートに1マシンサイクルで1パケットが入力さ
れ、データの有効信号と行き先指定はデータの第1パケ
ットに同期して入力される。
ネットワークの詳細図であり、プロセッサ000に対応
する入力ポート001,プロセッサ100に対応する入
力ポート101,共有メモリ200に対応する出力ポー
ト201,共有メモリ300に対応する出力ポート30
1を有する。また、一連のデータは第1パケットと第2
パケットの2つのパケットで構成されていて、それぞれ
の入力ポートに1マシンサイクルで1パケットが入力さ
れ、データの有効信号と行き先指定はデータの第1パケ
ットに同期して入力される。
【0010】図1において、レジスタ0,1は入力ポー
ト001,101からのデータの第1パケットに同期し
て入力される有効信号(V)と行き先を示す信号(ここ
では共有メモリの200と300の別を示し、“0”で
共有メモリ200“1”で共有メモリ300へアクセス
することを意味する。以後この信号をRA(ルーティン
グアドレス)と呼ぶ)を受け取り、レジスタ2,3は入
力ポート001,101からのリクエストデータを受け
取る。
ト001,101からのデータの第1パケットに同期し
て入力される有効信号(V)と行き先を示す信号(ここ
では共有メモリの200と300の別を示し、“0”で
共有メモリ200“1”で共有メモリ300へアクセス
することを意味する。以後この信号をRA(ルーティン
グアドレス)と呼ぶ)を受け取り、レジスタ2,3は入
力ポート001,101からのリクエストデータを受け
取る。
【0011】つまり、レジスタ0に”10”がセットさ
れているタイミングでは、レジスタ2には共有メモリ2
00へアクセスするリクエストデータの第1パケットが
存在し、その次のタイミングではレジスタ2には共有メ
モリ200へアクセスするリクエストデータの第2パケ
ットが存在することになる。また、レジスタ1に”1
1”がセットされているタイミングでは、レジスタ3に
は共有メモリ300ヘアクセスするリクエストデータの
第1パケットが存在し、その次のタイミングではレジス
タ3に共有メモリ300へアクセスするリクエストの第
2パケットが存在する。
れているタイミングでは、レジスタ2には共有メモリ2
00へアクセスするリクエストデータの第1パケットが
存在し、その次のタイミングではレジスタ2には共有メ
モリ200へアクセスするリクエストデータの第2パケ
ットが存在することになる。また、レジスタ1に”1
1”がセットされているタイミングでは、レジスタ3に
は共有メモリ300ヘアクセスするリクエストデータの
第1パケットが存在し、その次のタイミングではレジス
タ3に共有メモリ300へアクセスするリクエストの第
2パケットが存在する。
【0012】次にバッファ4,5はアービタ8(出力ポ
ート201のリクエスト競合調停回路)あるいはアービ
タ9(出力ポート301のリクエスト競合調停回路)で
優先権が与えられなかったときにレジスタ0,1の内容
を一時的に保持するためのバッファである。同じよう
に、バッファ6,7もアービタ8あるいはアービタ9で
優先権が与えられなかったときにリクエストデータを一
時的に保持するためのバッファで、このバッファ6,7
はリクエストデータの第1パケットと第2パケットを同
時に書き込み、さらに任意のタイミングで同時に読み出
すことが可能なバッファである。
ート201のリクエスト競合調停回路)あるいはアービ
タ9(出力ポート301のリクエスト競合調停回路)で
優先権が与えられなかったときにレジスタ0,1の内容
を一時的に保持するためのバッファである。同じよう
に、バッファ6,7もアービタ8あるいはアービタ9で
優先権が与えられなかったときにリクエストデータを一
時的に保持するためのバッファで、このバッファ6,7
はリクエストデータの第1パケットと第2パケットを同
時に書き込み、さらに任意のタイミングで同時に読み出
すことが可能なバッファである。
【0013】アービタ8は図3に詳細を示すように、リ
クエスト有効信号生成回路30とリクエスト競合調停回
路31と2つのフリップフロップ32,33から構成さ
れている。
クエスト有効信号生成回路30とリクエスト競合調停回
路31と2つのフリップフロップ32,33から構成さ
れている。
【0014】リクエスト有効信号生成回路30は図4に
その真理値表を示すとおり、入力ポート001からのリ
クエストに基づくレジスタ0の出力0−0,バッファ4
の出力4−0及び入力ポート101からのリクエストに
基づくレジスタ1の出力1−0,バッファ5の出力が、
出力ポート201に向かう(RA=0)有効な(V=
1)リクエストの場合だけ、リクエスト競合調停回路3
1に送出している。
その真理値表を示すとおり、入力ポート001からのリ
クエストに基づくレジスタ0の出力0−0,バッファ4
の出力4−0及び入力ポート101からのリクエストに
基づくレジスタ1の出力1−0,バッファ5の出力が、
出力ポート201に向かう(RA=0)有効な(V=
1)リクエストの場合だけ、リクエスト競合調停回路3
1に送出している。
【0015】リクエスト競合調停回路31は図5にその
真理値表を示すとおり、入力ポート001と入力ポート
101が競合した場合は、必ず入力ポート001を優先
し、同一入力ポート内では先に入力ポートに到着したリ
クエスト、例えば、レジスタ0に存在するリクエストと
バッファ4に格納されているリクエストではバッファ4
に格納されているリクエストを優先する。また、フリッ
プフロップ32は入力ポート001対応のレジスタ0か
らのリクエストが優先されとときに”1”が点灯する。
真理値表を示すとおり、入力ポート001と入力ポート
101が競合した場合は、必ず入力ポート001を優先
し、同一入力ポート内では先に入力ポートに到着したリ
クエスト、例えば、レジスタ0に存在するリクエストと
バッファ4に格納されているリクエストではバッファ4
に格納されているリクエストを優先する。また、フリッ
プフロップ32は入力ポート001対応のレジスタ0か
らのリクエストが優先されとときに”1”が点灯する。
【0016】この時、同時にレジスタ0をホールドし、
第1パケット目を保持しておく。この構成により、入力
ポート001のリクエストデータの第1パケットだけが
セレクタ10を通過した場合、次のタイミングでレジス
タ2に存在する第2パケットを通過させる際に、レジス
タ0に第1パケット目の情報が残っているので再度入力
ポート001を選択することができる。同様にフリップ
フロップ33も入力ポート101対応のレジスタ1から
のリクエストが優先されたときに”1”が点灯する。こ
の時、同時にレジスタ1をホールドし、第1パケット目
を保持しておく。点灯した次のタイミングでレジスタ3
に存在する第2パケットを通過させる際に、レジスタ1
に第1パケット目の情報が残っているので再度入力ポー
ト101を選択することができる。
第1パケット目を保持しておく。この構成により、入力
ポート001のリクエストデータの第1パケットだけが
セレクタ10を通過した場合、次のタイミングでレジス
タ2に存在する第2パケットを通過させる際に、レジス
タ0に第1パケット目の情報が残っているので再度入力
ポート001を選択することができる。同様にフリップ
フロップ33も入力ポート101対応のレジスタ1から
のリクエストが優先されたときに”1”が点灯する。こ
の時、同時にレジスタ1をホールドし、第1パケット目
を保持しておく。点灯した次のタイミングでレジスタ3
に存在する第2パケットを通過させる際に、レジスタ1
に第1パケット目の情報が残っているので再度入力ポー
ト101を選択することができる。
【0017】アービタ9は図6に詳細を示すように、リ
クエスト有効信号生成回路40とリクエスト競合調停回
路41と2つのフリップフロップ42,43から構成さ
れている。
クエスト有効信号生成回路40とリクエスト競合調停回
路41と2つのフリップフロップ42,43から構成さ
れている。
【0018】リクエスト有効信号生成回路40は図7に
その真理値表を示すとおり、入力ポート001からのリ
クエストに基づくレジスタ0の出力0−0,バッファ4
の出力及び入力ポート101からのリクエストに基づく
レジスタ1の出力1−0,バッファ5の出力5−0が、
出力ポート301に向かう(RA=1)有効な(V=
1)リクエストの場合だけ、リクエスト競合調停回路4
1に送出している。
その真理値表を示すとおり、入力ポート001からのリ
クエストに基づくレジスタ0の出力0−0,バッファ4
の出力及び入力ポート101からのリクエストに基づく
レジスタ1の出力1−0,バッファ5の出力5−0が、
出力ポート301に向かう(RA=1)有効な(V=
1)リクエストの場合だけ、リクエスト競合調停回路4
1に送出している。
【0019】リクエスト競合調停回路41は図8にその
真理値表を示すとおり、アービタ8の制御方式と同じで
ある。また、フリップフロップ42は入力ポート001
対応のレジスタ0からのリクエストが優先されたとき
に”1”が点灯する。この時、同時にレジスタ0をホー
ルドし、第1パケット目を保持しておく。この構成によ
り、入力ポート001のリクエストデータの第1パケッ
トだけがセレクタ11を通過した場合、次のタイミング
でレジスタ2に存在する第2パケットを通過させる際
に、レジスタ0に第1パケット目の情報が残っているの
で再度入力ポート001を選択することができる。同様
にフリップフロップ43も入力ポート1のレジスタ1か
らのリクエストが優先されたときに”1”が点灯する。
この時、同時に入力ポート101対応のレジスタ1をホ
ールドし、第1パケット目を保持しておく。点灯した次
のタイミングでレジスタ3に存在する第2パケットを通
過される際に、レジスタ1に第1パケット目の情報が残
っているので再度入力ポート101を選択することがで
きる。
真理値表を示すとおり、アービタ8の制御方式と同じで
ある。また、フリップフロップ42は入力ポート001
対応のレジスタ0からのリクエストが優先されたとき
に”1”が点灯する。この時、同時にレジスタ0をホー
ルドし、第1パケット目を保持しておく。この構成によ
り、入力ポート001のリクエストデータの第1パケッ
トだけがセレクタ11を通過した場合、次のタイミング
でレジスタ2に存在する第2パケットを通過させる際
に、レジスタ0に第1パケット目の情報が残っているの
で再度入力ポート001を選択することができる。同様
にフリップフロップ43も入力ポート1のレジスタ1か
らのリクエストが優先されたときに”1”が点灯する。
この時、同時に入力ポート101対応のレジスタ1をホ
ールドし、第1パケット目を保持しておく。点灯した次
のタイミングでレジスタ3に存在する第2パケットを通
過される際に、レジスタ1に第1パケット目の情報が残
っているので再度入力ポート101を選択することがで
きる。
【0020】セレクタ10はアービア8の出力であるセ
レクト信号8−1により入力データ2−0,6−0,3
−0,7−0の中から1つを選択するためのセレクタ
で、選択論理は図9の選択論理表に示したとおりであ
る。また、セレクタ11はアービタ9の出力であるセレ
クト信号9−1により入力データ2−0,6−0,3−
0,7−0の中から1つを選択するためのセレクタで、
図10のセレクタ11の選択論理表に示したとおりであ
る。
レクト信号8−1により入力データ2−0,6−0,3
−0,7−0の中から1つを選択するためのセレクタ
で、選択論理は図9の選択論理表に示したとおりであ
る。また、セレクタ11はアービタ9の出力であるセレ
クト信号9−1により入力データ2−0,6−0,3−
0,7−0の中から1つを選択するためのセレクタで、
図10のセレクタ11の選択論理表に示したとおりであ
る。
【0021】セレクタ12はアービタ8の出力であるセ
レクト信号8−2により、10−0か10−1を選択
し、リクエストデータの第2パケットとしてバッファ1
6へ送出する。これは、セレクタ10でレジスタ2かレ
ジスタ3を選択したときに、10−0は1マシンサイク
ル目は第1パケットであるが、2マシンサイクル目は第
2パケットであるため、2マシンサイクル目にセレクタ
12で10−0(第2パケット)を選択するためのセレ
クタである。この選択論理は図11のセレクタ12の選
択論理表に示したとおりである。
レクト信号8−2により、10−0か10−1を選択
し、リクエストデータの第2パケットとしてバッファ1
6へ送出する。これは、セレクタ10でレジスタ2かレ
ジスタ3を選択したときに、10−0は1マシンサイク
ル目は第1パケットであるが、2マシンサイクル目は第
2パケットであるため、2マシンサイクル目にセレクタ
12で10−0(第2パケット)を選択するためのセレ
クタである。この選択論理は図11のセレクタ12の選
択論理表に示したとおりである。
【0022】同様に、セレクタ13はアービタ9の出力
であるセレクト信号9−2により、11−0か11−1
を選択し、リクエストデータの第2パケットとしてバッ
ファ17へ送出する。これは、セレクタ11でレジスタ
2かレジスタ3を選択したときに、11−0は1マシン
サイクル目は第1パケットであるが、2マシンサイクル
目は第2パケットであるため、2マシンサイクル目にセ
レクタ12で11−0(第2パケット)を選択するため
のセレクタである。選択論理は図5のセレクタ13の選
択論理表に示したとおりである。
であるセレクト信号9−2により、11−0か11−1
を選択し、リクエストデータの第2パケットとしてバッ
ファ17へ送出する。これは、セレクタ11でレジスタ
2かレジスタ3を選択したときに、11−0は1マシン
サイクル目は第1パケットであるが、2マシンサイクル
目は第2パケットであるため、2マシンサイクル目にセ
レクタ12で11−0(第2パケット)を選択するため
のセレクタである。選択論理は図5のセレクタ13の選
択論理表に示したとおりである。
【0023】バッファ14、15はそれぞれアービタ
8、9の出力であるリクエスト有効信号Vとメモリから
プロセッサへリプライデータを返すためのリプライルー
ティングアドレス(RRA)である8−0,9−0をデ
ータの第1パケットと同期して出力ポートへ出力するた
めのバッファである。例えば、入力ポート001からメ
モリへアクセスするリクエストの場合、V=1,RRA
=0となり、また、入力ポート101からメモリへアク
セスする場合はV=1,RRA=1となる。これらの情
報はメモリで持ち回ってリプライデータの第1パケット
と同期してプロセッサへ返す時にルーティングアドレス
として用いられる。
8、9の出力であるリクエスト有効信号Vとメモリから
プロセッサへリプライデータを返すためのリプライルー
ティングアドレス(RRA)である8−0,9−0をデ
ータの第1パケットと同期して出力ポートへ出力するた
めのバッファである。例えば、入力ポート001からメ
モリへアクセスするリクエストの場合、V=1,RRA
=0となり、また、入力ポート101からメモリへアク
セスする場合はV=1,RRA=1となる。これらの情
報はメモリで持ち回ってリプライデータの第1パケット
と同期してプロセッサへ返す時にルーティングアドレス
として用いられる。
【0024】バッファ16,17はそれぞれ出力ポート
201,301へ出力するリクエストデータを一時的に
格納しておくためのバッファで、バッファ6,7と同様
にリクエストデータの第1パケットと第2パケットを同
期に書き込むことが可能で、つ、第1パケットだけを書
き込んだ次のタイミングで第1パケットと同じワードに
第1パケットのデータを破壊せずに第2パケットを書き
込むことが可能な構成になっている。
201,301へ出力するリクエストデータを一時的に
格納しておくためのバッファで、バッファ6,7と同様
にリクエストデータの第1パケットと第2パケットを同
期に書き込むことが可能で、つ、第1パケットだけを書
き込んだ次のタイミングで第1パケットと同じワードに
第1パケットのデータを破壊せずに第2パケットを書き
込むことが可能な構成になっている。
【0025】セレクタ22,23はそれぞれ出力ポート
201,301へ出力するデータを第1パケットと第2
パケットから選択するセレクタで選択論理は、図13の
セレクタ22の選択論理表、図14のセレクタ23の選
択論理表に示したとおりである。フリップフロップ1
8,19はそれぞれセレクタ22,23において、リク
エストデータの第1パケットである16−0,17−0
を選択した次のタイミングでリクエストデータの第2パ
ケットである16−1,17−1を選択するための制御
フラグである。バッファ14,15の出力と制御フラグ
18,19の反転出力とをアンドゲート20,21で論
理積をとりセレクタ22,23を制御する。つまり、制
御フラグ18,19が”0”でバッファ14,15の出
力が”1”のときアンドゲート20,21の出力は”
1”になり、リクエストデータの第1パケットである1
6−0,17−0が選択されると同時に制御フラグ1
8,19に”1”がセットされる。次のタイミングでは
制御フラグ18,19の反転出力が”0”なので、バッ
ファ14,15の出力値にかかわらずにアンドゲート2
0,21の出力は”0”になり、セレクタ22,23で
第2パケットである16−1,17−1が選択され、そ
れぞれ出力ポート201,301へ出力される。
201,301へ出力するデータを第1パケットと第2
パケットから選択するセレクタで選択論理は、図13の
セレクタ22の選択論理表、図14のセレクタ23の選
択論理表に示したとおりである。フリップフロップ1
8,19はそれぞれセレクタ22,23において、リク
エストデータの第1パケットである16−0,17−0
を選択した次のタイミングでリクエストデータの第2パ
ケットである16−1,17−1を選択するための制御
フラグである。バッファ14,15の出力と制御フラグ
18,19の反転出力とをアンドゲート20,21で論
理積をとりセレクタ22,23を制御する。つまり、制
御フラグ18,19が”0”でバッファ14,15の出
力が”1”のときアンドゲート20,21の出力は”
1”になり、リクエストデータの第1パケットである1
6−0,17−0が選択されると同時に制御フラグ1
8,19に”1”がセットされる。次のタイミングでは
制御フラグ18,19の反転出力が”0”なので、バッ
ファ14,15の出力値にかかわらずにアンドゲート2
0,21の出力は”0”になり、セレクタ22,23で
第2パケットである16−1,17−1が選択され、そ
れぞれ出力ポート201,301へ出力される。
【0026】以上に説明した実施例は、プロセッサ00
0,100から共有メモリ200,300に向うデータ
についてのネットワーク構成に関するものであるが、共
有メモリ200,300からプロセッサ000,100
へのリプライデータのネットワーク構成は図1となんら
変わりはなく、入力ポート001,101が共有メモリ
200,300に、出力ポート201,301がプロセ
ッサ000,100に制御するだけでよく、その他、制
御方式等も上述の説明内容と同じである。
0,100から共有メモリ200,300に向うデータ
についてのネットワーク構成に関するものであるが、共
有メモリ200,300からプロセッサ000,100
へのリプライデータのネットワーク構成は図1となんら
変わりはなく、入力ポート001,101が共有メモリ
200,300に、出力ポート201,301がプロセ
ッサ000,100に制御するだけでよく、その他、制
御方式等も上述の説明内容と同じである。
【0027】
【発明の効果】一連のデータを複数のパケットに分割し
て転送するインターコネクションネットワークにおい
て、従来は一連のデータがクロスバを通過するのに一連
のデータを構成するパケット数分のマシンサイクルが必
要だったが、本発明によれば、1マシンサイクルで一連
のデータを構成する全パケットを通過させることができ
るため、前のリクエストにより現在の目的とする出力ポ
ートへ行けなくなる時間(ブロッキングの時間)が少な
くなるので、ネットワークの処理速度が向上する。つま
り、優先権を与えられた入力ポートの一連のデータを構
成する全てのパケットがそろっていれば、1マシンサイ
クルでクロスバを通過させてしまうため従来の方式と比
べてパケット数分の1の処理速度になり、ブロッキング
時間もパケット数分の1になるためネットワークの処理
速度も向上する。
て転送するインターコネクションネットワークにおい
て、従来は一連のデータがクロスバを通過するのに一連
のデータを構成するパケット数分のマシンサイクルが必
要だったが、本発明によれば、1マシンサイクルで一連
のデータを構成する全パケットを通過させることができ
るため、前のリクエストにより現在の目的とする出力ポ
ートへ行けなくなる時間(ブロッキングの時間)が少な
くなるので、ネットワークの処理速度が向上する。つま
り、優先権を与えられた入力ポートの一連のデータを構
成する全てのパケットがそろっていれば、1マシンサイ
クルでクロスバを通過させてしまうため従来の方式と比
べてパケット数分の1の処理速度になり、ブロッキング
時間もパケット数分の1になるためネットワークの処理
速度も向上する。
【0028】また、一連のデータを構成する複数のパケ
ットの少なくとも1パケットが入力ポート側の保持手段
に存在する際に、残りのパケットを待つことなく現在入
力ポートの保持手段に存在するパケットだけでクロスバ
を通過させ、残りのパケットについては入力ポートに到
着次第順次クロスバを通過させることにより、データの
先頭パケットがネットワークに入力されてからデータの
最終パケットが出力されるまでの時間を最小限にするこ
とができる。
ットの少なくとも1パケットが入力ポート側の保持手段
に存在する際に、残りのパケットを待つことなく現在入
力ポートの保持手段に存在するパケットだけでクロスバ
を通過させ、残りのパケットについては入力ポートに到
着次第順次クロスバを通過させることにより、データの
先頭パケットがネットワークに入力されてからデータの
最終パケットが出力されるまでの時間を最小限にするこ
とができる。
【図1】本発明の一実施例のブロック図である。
【図2】本発明の対象となるコンピュータシステム構成
図の一例を示す図である。
図の一例を示す図である。
【図3】図1の実施例におけるアービタ8の詳細図であ
る。
る。
【図4】図3のアービス8内のリクエスト有効信号生成
回路30の真理値表を示す図である。
回路30の真理値表を示す図である。
【図5】図3のアービタ8内のリクエスト競合調停回路
31の真理値表を示す図である。
31の真理値表を示す図である。
【図6】図1の実施例におけるアービタ9の詳細図であ
る。
る。
【図7】図6のアービス9内のリクエスト有効信号生成
回路40の真理値表を示す図である。
回路40の真理値表を示す図である。
【図8】図6のアービタ9内のリクエスト競合調停回路
41の真理値表を示す図である。
41の真理値表を示す図である。
【図9】図1の実施例におけるセレクタ10の選択論理
表を示す図である。
表を示す図である。
【図10】図1の実施例におけるセレクタ11の選択論
理表を示す図である。
理表を示す図である。
【図11】図1の実施例におけるセレクタ12の選択論
理表を示す図である。
理表を示す図である。
【図12】図1の実施例におけるセレクタ13の選択論
理表を示す図である。
理表を示す図である。
【図13】図1の実施例におけるセレクタ22の選択論
理表を示す図である。
理表を示す図である。
【図14】図1の実施例におけるセレクタ23の選択論
理表を示す図である。
理表を示す図である。
【図15】従来例を示すブロック図である。
0,1,2,3 レジスタ 4,5,6,7,14,15,16,17 バッファ 8,9 アービタ 10,11,12,13,22,23 セレクタ 18,19 フリップフロップ 20,21 アンドゲート 30 リクエスト有効信号生成回路 31 リクエスト競合調停回路 32,33 フリップフロップ 40 リクエスト有効信号生成回路 41 リクエスト競合調停回路 42,43 フリップフロップ 44,45 入力ポート 46,47 出力ポート 48,49 制御バッファ 50,51 データバッファ 52,53 アービタ 54,55 セレクタ 000,100 プロセッサ 200,300 共有メモリ 001,101 入力ポート 201,301 出力ポート。
Claims (3)
- 【請求項1】 並列コンピュータシステムのプロセッサ
とメモリ間で入力ポート及び出力ポートを介して、複数
のパケットで構成された一連のデータをパケット単位に
時分割し、連続して転送するインターコネクションネッ
トワークにおいて、 前記一連のデータをパケット単位に入力して保持し、1
マシンサイクルで全て読みだすことが可能な前記入力ポ
ートごとのバッファと、 前記バッファの出力を同時に通過させることが可能であ
り、前記一連のデータを構成するパケット群の全てが前
記バッファに保持されていない時は、前記バッファに保
持されているパケットだけで前記セレクタを通過させ、
残りのパケットについては前記バッファに到着次第、そ
のパケットだけを通過させることが可能な前記バッファ
と同数のセレクタと、 前記セレクタを通過した一連のデータを構成するパケッ
ト群を一時的に保持し、一連のデータを構成するパケッ
ト群を前記出力ポートに連続して出力するための他のバ
ッファとを設けたことを特徴とするインターコネクショ
ンネットワーク。 - 【請求項2】 前記入力ポートは前記プロセッサ対応、
前記出力ポートは前記メモリ対応に設けたこと特徴とす
る請求項1記載のインターコネクションネットワーク。 - 【請求項3】 前記入力ポートは前記メモリ対応、前記
出力ポートは前記プロセッサ対応に設けたことを特徴と
する請求項1記載のインターコネクションネットワー
ク。
Priority Applications (6)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6145100A JP2644185B2 (ja) | 1994-06-27 | 1994-06-27 | データ処理装置 |
| EP95109743A EP0690390B1 (en) | 1994-06-27 | 1995-06-22 | Network for transferring consecutive packets between processor and memory with a reduced blocking time |
| DE69519825T DE69519825T2 (de) | 1994-06-27 | 1995-06-22 | Netzwerk zur Übertragung von aufeinanderfolgenden Paketen zwischen Prozessor und Speicher mit einer verkürzten Blockierzeit |
| CA002152637A CA2152637C (en) | 1994-06-27 | 1995-06-26 | Network for transferring consecutive packets between processor and memory with a reduced blocking time |
| BR9502279A BR9502279A (pt) | 1994-06-27 | 1995-06-27 | Rede de interconexao para uso entre uma unidade de processador uma unidade de memória |
| US08/975,682 US5857078A (en) | 1994-06-27 | 1997-11-21 | Network for transferring consecutive packets between processor and memory with a reduced blocking time |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6145100A JP2644185B2 (ja) | 1994-06-27 | 1994-06-27 | データ処理装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH0818565A true JPH0818565A (ja) | 1996-01-19 |
| JP2644185B2 JP2644185B2 (ja) | 1997-08-25 |
Family
ID=15377378
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP6145100A Expired - Fee Related JP2644185B2 (ja) | 1994-06-27 | 1994-06-27 | データ処理装置 |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US5857078A (ja) |
| EP (1) | EP0690390B1 (ja) |
| JP (1) | JP2644185B2 (ja) |
| BR (1) | BR9502279A (ja) |
| CA (1) | CA2152637C (ja) |
| DE (1) | DE69519825T2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012155440A (ja) * | 2011-01-25 | 2012-08-16 | Nec Corp | 相互結合網制御システム、相互結合網制御方法 |
Families Citing this family (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7295563B2 (en) * | 2001-10-01 | 2007-11-13 | Advanced Micro Devices, Inc. | Method and apparatus for routing packets that have ordering requirements |
| US7274692B1 (en) | 2001-10-01 | 2007-09-25 | Advanced Micro Devices, Inc. | Method and apparatus for routing packets that have multiple destinations |
| US7221678B1 (en) * | 2001-10-01 | 2007-05-22 | Advanced Micro Devices, Inc. | Method and apparatus for routing packets |
| US7353317B2 (en) * | 2004-12-28 | 2008-04-01 | Intel Corporation | Method and apparatus for implementing heterogeneous interconnects |
| US9137173B2 (en) * | 2012-06-19 | 2015-09-15 | Advanced Micro Devices, Inc. | Devices and methods for interconnecting server nodes |
| US11275632B2 (en) | 2018-09-14 | 2022-03-15 | Advanced Micro Devices, Inc. | Broadcast command and response |
| CN113010173A (zh) | 2019-12-19 | 2021-06-22 | 超威半导体(上海)有限公司 | 并行处理中矩阵数据广播的方法 |
| CN113094099A (zh) | 2019-12-23 | 2021-07-09 | 超威半导体(上海)有限公司 | 矩阵数据广播架构 |
| US11403221B2 (en) | 2020-09-24 | 2022-08-02 | Advanced Micro Devices, Inc. | Memory access response merging in a memory hierarchy |
Family Cites Families (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4320502A (en) * | 1978-02-22 | 1982-03-16 | International Business Machines Corp. | Distributed priority resolution system |
| US4480307A (en) * | 1982-01-04 | 1984-10-30 | Intel Corporation | Interface for use between a memory and components of a module switching apparatus |
| US4560985B1 (en) * | 1982-05-07 | 1994-04-12 | Digital Equipment Corp | Dual-count, round-robin ditributed arbitration technique for serial buses |
| US4724520A (en) * | 1985-07-01 | 1988-02-09 | United Technologies Corporation | Modular multiport data hub |
| JPH01221042A (ja) * | 1988-02-29 | 1989-09-04 | Toshiba Corp | パケット交換機の輻輳制御方法 |
| US4862454A (en) * | 1988-07-15 | 1989-08-29 | International Business Machines Corporation | Switching method for multistage interconnection networks with hot spot traffic |
| US5053942A (en) * | 1988-11-01 | 1991-10-01 | The Regents Of The University Of California | Bit-sliced cross-connect chip having a tree topology of arbitration cells for connecting memory modules to processors in a multiprocessor system |
| EP0426413B1 (en) * | 1989-11-03 | 1997-05-07 | Compaq Computer Corporation | Multiprocessor arbitration in single processor arbitration schemes |
| JPH077975B2 (ja) * | 1990-08-20 | 1995-01-30 | インターナショナル・ビジネス・マシーンズ・コーポレイション | データ伝送を制御するためのシステムおよび方法 |
| US5251209A (en) * | 1991-03-28 | 1993-10-05 | Sprint International Communications Corp. | Prioritizing attributes in integrated services networks |
| US5313458A (en) * | 1991-06-03 | 1994-05-17 | Fujitsu Limited | Traffic control system |
| US5339313A (en) * | 1991-06-28 | 1994-08-16 | Digital Equipment Corporation | Method and apparatus for traffic congestion control in a communication network bridge device |
| US5467295A (en) * | 1992-04-30 | 1995-11-14 | Intel Corporation | Bus arbitration with master unit controlling bus and locking a slave unit that can relinquish bus for other masters while maintaining lock on slave unit |
| MX9308193A (es) * | 1993-01-29 | 1995-01-31 | Ericsson Telefon Ab L M | Conmutador atm de acceso controlado. |
-
1994
- 1994-06-27 JP JP6145100A patent/JP2644185B2/ja not_active Expired - Fee Related
-
1995
- 1995-06-22 DE DE69519825T patent/DE69519825T2/de not_active Expired - Fee Related
- 1995-06-22 EP EP95109743A patent/EP0690390B1/en not_active Expired - Lifetime
- 1995-06-26 CA CA002152637A patent/CA2152637C/en not_active Expired - Fee Related
- 1995-06-27 BR BR9502279A patent/BR9502279A/pt not_active IP Right Cessation
-
1997
- 1997-11-21 US US08/975,682 patent/US5857078A/en not_active Expired - Fee Related
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012155440A (ja) * | 2011-01-25 | 2012-08-16 | Nec Corp | 相互結合網制御システム、相互結合網制御方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2644185B2 (ja) | 1997-08-25 |
| DE69519825D1 (de) | 2001-02-15 |
| EP0690390A2 (en) | 1996-01-03 |
| DE69519825T2 (de) | 2001-08-02 |
| CA2152637C (en) | 1999-08-17 |
| BR9502279A (pt) | 1996-02-27 |
| CA2152637A1 (en) | 1995-12-28 |
| EP0690390B1 (en) | 2001-01-10 |
| US5857078A (en) | 1999-01-05 |
| EP0690390A3 (ja) | 1996-01-17 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4630258A (en) | Packet switched multiport memory NXM switch node and processing method | |
| US5586299A (en) | Systems and methods for accessing multi-port memories | |
| US6996651B2 (en) | On chip network with memory device address decoding | |
| JP4024875B2 (ja) | 異なるデータ・レートで動作するネットワーク・ポートに関して、共用メモリへのアクセスを調停する方法および装置 | |
| US7139860B2 (en) | On chip network with independent logical and physical layers | |
| US20040017820A1 (en) | On chip network | |
| US20040017807A1 (en) | On chip network that maximizes interconnect utilization between processing elements | |
| US20040024946A1 (en) | Scalable on chip network | |
| Frazier et al. | The design and implementation of a multi-queue buffer for VLSI communication switches. | |
| EP1512078B1 (en) | Programmed access latency in mock multiport memory | |
| JP2003510721A (ja) | マルチプロセッサノードコントローラ回路及び方法 | |
| US6675251B1 (en) | Bridge device for connecting multiple devices to one slot | |
| JPH05242019A (ja) | 先読み優先調停システム及び方法 | |
| JP2644185B2 (ja) | データ処理装置 | |
| US20070136503A1 (en) | Systems for implementing SDRAM controllers, and buses adapted to include advanced high performance bus features | |
| US11730325B2 (en) | Dual mode interconnect | |
| US7796624B2 (en) | Systems and methods for providing single-packet and multi-packet transactions in an integrated circuit | |
| US10990552B1 (en) | Streaming interconnect architecture for data processing engine array | |
| KR20060120272A (ko) | 스케일러블 버스 구조 | |
| CA2117506C (en) | Return address adding mechanism for use in parallel processing system | |
| Dickey et al. | A VLSI combining network for the NYU Ultracomputer | |
| US7031337B2 (en) | Data processing apparatus and slave interface mechanism for controlling access to a slave logic unit by a plurality of master logic units | |
| JP2882304B2 (ja) | マルチプロセッサシステム | |
| JP3031591B2 (ja) | アクセス調停方式 | |
| JP2537526B2 (ja) | マルチプロセッサシステム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19970325 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |