JPH0414371B2 - - Google Patents
Info
- Publication number
- JPH0414371B2 JPH0414371B2 JP60047816A JP4781685A JPH0414371B2 JP H0414371 B2 JPH0414371 B2 JP H0414371B2 JP 60047816 A JP60047816 A JP 60047816A JP 4781685 A JP4781685 A JP 4781685A JP H0414371 B2 JPH0414371 B2 JP H0414371B2
- Authority
- JP
- Japan
- Prior art keywords
- access
- address
- throughput
- register
- source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Multi Processors (AREA)
- Complex Calculations (AREA)
Description
〔概要〕
複数のアクセス元が、主記憶を連続アドレスで
それぞれアクセスする場合、アクセススループツ
トの大きいアクセス元がアクセススループツトの
小さいアクセス元のアドレスに追い付いたときア
クセス競合となり、アクセススループツトが低下
した。そこで、アクセススループツトの小さいア
クセス元のアドレスをとびとびに発生し、アクセ
ススループツトの大きいアクセス元と主記憶領域
の走査速度を見かけ上同等にして、アクセス競合
の機会を小さくしている。 〔産業上の利用分野〕 本発明は、情報処理装置における主記憶制御方
式に関するものであり、特に複数のアクセス元に
より主記憶の連続領域をアクセスする際の効率的
なアクセス制御方式に関する。 〔従来の技術〕 第2図は、本発明が適用される情報処理装置の
1例を締したものである。 図において、1は主記憶装置MSU、2は主記
憶制御ユニツトMCU、3はチヤネルプロセツサ
CHP、4はスカラユニツトSU、5はベクトルユ
ニツトVU、6は拡張メモリ制御ユニツトEMU、
7は拡張メモリ、8−0は上記1〜5よりなるプ
ロセツサエレメントPE、8−1ないし8−nは、
他のプロセツサエレメントPEを表す。 チヤネルプロセツサCHP、スカラユニツト
SU、ベクトルユニツトVU、拡張メモリ制御ユ
ニツトEMUは、それぞれ主記憶制御ユニツト
MCUを介して、主記憶装置MSUをアクセスする
ことができる。 主記憶装置MSUは、アドレスを複数のバンク
にインタリーブした構成をとつており、同時的な
複数バンクに対する並行したアクセスが可能にさ
れている。 また拡張メモリ制御ユニツトEMUは、プロセ
ツサエレメント8−0の主記憶装置MSUと拡張
メモリESUとの間のデータ転送を制御するとと
もに、拡張メモリESUと各プロセツサエレメン
トPEのMCUとの間のデータ転送も制御してい
る。 このため、拡張メモリ制御ユニツトEMU(した
がつて拡張メモリESUでもある)が1つの主記
憶制御ユニツトMCUに対してもつアクセスポー
ト数は、プロセツサエレメントが0〜n個あるの
でベクトルユニツトVUなどにくらべてかなり少
なく、又データBus幅も同様に細くなり、アクセ
ススループツトが小さくなつているのが普通であ
る。 たとえばあるシステム例では、VUとMCUと
の間には1本が4エレメント/1Tのスループツ
トをもつ複数本のロード/ストアパイプラインが
設けられているが、EMUとMCUとの間には1エ
レメント/1Tのスループツトをもつ1本のロー
ド/ストアパイプラインしか設けられていない
(1エレメント=8Byte)。 このような、主記憶装置MSUに対するアクセ
ススループツトの異なる複数のアクセス元が、そ
れぞれ主記憶装置の所定の領域を連続アドレス
(デイスタンスd=1)で昇順にアクセスした場
合、条件により両者の間にバンク競合あるいは
LS(LOGICAL STORAGE)BUSYが生じる。 これを、第3図および第4図の具体例を用いて
説明する。 図示の例は、VUが1マシーンサイクル(1T)
に4LS(LOGICAL STORAGE)つまり4エレメ
ントをアクセスできるが、EMUは、4マシーン
サイクル(4T)ごとに4LSつまり4エレメント
をアクセスできる場合のものである。すなわち両
者のアクセススループツトの比は4対1となつて
いる。 第3図および第4図において、縦軸は時間、横
軸にLS(LOGICAL STORAGE)NOを示してい
る。 1回のアクセス単位は4LSであり、アクセスさ
れると縦方向に線がのびるのは、LS Busy時間
のためであり、この時間中は、他のアクセスが禁
止される。 第3図の例は、9がアクセススループツトの小
さいEMUアクセス、10がアクセススループツ
トの大きいVUアクセス、11も同様にVUアク
セスで10とは別のアクセスパイプラインが同時
に動作している場合を示している。図示の時間領
域では、各アクセス間にLSのアクセス競合が起
らないため、VUアクセスのアクセススループツ
トは低下しない。 しかし、第4図の例では、10のVUアクセス
が19のEMLアクセスLS=iで追い付き、アクセ
ス待ちとなつて、以後10′で示すように、VU
アクセスは各LSごとに先行のEMUアクセス待ち
となり、そのアクセススループツトはEMUアク
セスと同じレベルに低下してしまう。 〔発明が解決しようとする問題点〕 従来の情報処理装置では、アクセススループツ
トの異なる複数のアクセス元が連続アドレスで主
記憶にアクセスした場合、連続したLSで次々と
アクセス競合を生じる可能性があり、アクセスス
ループツトの大きいアクセス元のアクセス効率が
低下して、処理速度が遅くるという問題があつ
た。 〔問題点を解決するための手段〕 本発明は、アクセススループツトの異なる複数
のアクセス元がそれぞれ連続アドレスで主記憶に
アクセスする際、アクセス元同士のアクセスアド
レスが連続してアクセス競合しないよう、すなわ
ちアクセススループツトの小さいアクセス元のア
クセスアドレスが、アクセススループツトの大き
いアクセス元のアクセスアドレスによつて追い付
かれないよう、アクセスススループツトの小さい
アドレス元のアドレス数列から、アクセス元間の
アクセススループツトの比に基づいた間隔でとび
とびにアクセスアドレスを発生し、主記憶のアク
セスを行なうように制御するものである。 そのため、アクセススループツトの小さいアク
セス基の連続するアドレス数列を、アクセススル
ープツトの比nに(nは整数)で区分してグルー
プ化する。次に、各グループからたとえばグルー
プ内最下位のアドレスを順に取り出し、1巡した
ら次に各グループ内で次の順位のアドレスを順に
取り出す。以下、この操作をn巡繰り返せば、元
のアドレス数列全体のアドレスが発生できる。 〔実施例〕 以下に、本発明を第2図に示した情報処理装置
に適用した場合の実施例について説明する。した
がつて、第2図の構成がそのまま援用される。 ベクトルユニツトVUは、複数本のロード/ス
トアパイプラインを持つ。1本のロードストアパ
イプラインは、4エレメント(1エレメント=8
バイト)/1Tのスループツトを持つ。 拡張メモリ制御ユニツトEMUは、1本のロー
ド/ストアパイプラインを持ち、そのスループツ
トは、1エレメント/1Tである。 したがつて、VUはEMUに比べてN=4倍の
スループツトがある。 EMUが、MSUに対して10000番地(HEX)か
ら2KB(2048バイト)のデータを転送する場合に
ついて説明する。 EMUのスループツトは、1エレメント/1Tで
あるが、アクセス効率を向上させるため、4エレ
メント/4Tでアクセスする。2KBのデータは、
32バイトアクセスの64回分に相当する。 表1に、このEMUアクセス例を示す。 10000番地から昇べき順に32バイト(DEC)=
20バイト(HEX)単位で2KB分のアドレス列を
つくる。N=4なので、4アドレスごとにグルー
プをつくり、グループ内NOをつける。 まずグループ内NOのについて、昇べき順で
主記憶に対してアクセスを出す。次に、、
と順に同様にアクセスを発信する。 第5図に、本発明方式を用いた場合のLS
Busyと時間の関係を図示する。これは、第4図
の従来例に対応するものである。 本発明方式により、LS時間グラフ上の傾きが、
VUアクセスとEMUアクセスとで等しくなる。
また、一時的にVUアクセスとEMUアクセスと
がLS Busyコンフリクシヨンを起こしたとして
も、LS Busy時間以内のものであり、スループ
ツトは保証される。 実施例回路 第1図は、本発明方式によるリクエストアドレ
ス発生回路の1実施例構成を示したもである。こ
の回路は、EMU内に設けられてEMUアクセスの
ために使用される。 図において、11はOP CODEレジスタ、12
はSAレジスタ、13はELレジスタ、14は加算
器、15はRAレジスタ、16はコントロールカ
ウンタ、17はEL−UPレジスタ、18はEL−
LWレジスタ、19はREQコントロール回路、2
0はシフトコントロール回路を表わしている。 OP CODEレジスタ11は、ロードあるいはス
トアのオペコードを保持するレジスタである。 SAレジスタ12は、アクセスをスタートする
アドレス(SA)を保持するレジスタである。 ELレジスタ13は、ロードあるいはストアす
るエレメント数(EL)を保持するレジスタであ
る。 加算器14は、現アドレスにデイスタンスを加
算して次のリクエストアドレスを生成する回路で
ある。加算される定数としては、 0 1d=20(HEX) 2d=40(HEX) 3d=60(HEX) Nd=80(HEX) の中の1つが選択される。 RAレジスタ15は現在のリクエストアドレス
を保持するレジスタであり、その出力はMCUへ
転送されると同様に加算器14へ帰還される。 コントロールカウンタ16は4Bitのシフトレジ
スタで構成され、グループの走査シーケンスを制
御する回路である。制御ステージ数は4である。 EL−UPレジスタ17には、EMUアクセスに
設定されているアクセススループツト倍数N=4
でエレメント数(EL)を区分した結果得られる
グループ数がセツトされる。アドレス発生ごとに
1ずつ減算され、0となつたとき再セツトされ
て、4巡で終了する。 EL−LWレジスタ18には、エレメント数
(EL)をN=4で区分した端数がセツトされ、0
でない限りEL−UPレジスタ17の1巡の終りに
1を減算される。 REQコントロール回路19は、MCUに対して
リクエストアドレスが有効であることを知らせる
REQUEST VALIDを出力する。 シフトコントロール回路20は各グループに対
する走査が一巡するごとにコントロールカウンタ
16を1段シフトする。 EMUからMSUへのアクセス発信を行なうとき
は、スカラユニツトSUより、ロード、ストアを
示すオペコード(OP CODE)スタートアドレス
(SA)、エレメント数(EL)等のパラメータが与
えられる。 EMUからMCUに対してアクセスリクエストを
出す場合、上記それぞれのパラメータが、
OPCODEレジスタ11、SAレジスタ12、EL
レジスタ13に、EMU−REQというEMU内部
のコントロール信号によつてセツトされ、オペレ
ーシヨンの終了まで保持される。 SAレジスタ12とRAレジスタ15のアドレ
スに対して加算器14が加算する定数は、SAレ
ジスタ12からRAレジスタヘアアドレスがセツ
トされるときに選択される。これらの値はコント
ロールカウンタ16により指定される。 Nd=80(H)の定数は、RAレジスタ→RAレ
ジスタのパスが選択されたときには必ず選択され
る。 ELレジスタ13よりEL−UPレジスタ17に
は、エレメント数の0〜27BITのみがセツトされ
る。これは、エレメント数が4エレメントバウン
ダリになつているときは“グループNO”を示
し、4エレメントバウンダリとなつていないとき
は、“グループNO−1”を示す。グループNOと
は、エレメント数を4で区切つたグループ数のこ
とである。 EL−UPレジスタ17は、コントロールカウン
タ16の段0、1、2、3にセツトされるタイミ
ングで値をセツトされ、REQコントロール回路
19により1ずつ減算される。 EL−LWレジスタ18は、コントロールカウ
ンタ16の0BIT段がONになつたときに、エレ
メント数の28BITおよび29BITのみをセツトさ
れ、保持する。 EL−UPレジスタ17が0になり、かつEL−
LWレジスタ18が0でないとき、REQコントロ
ール回路19へリクエストを発生し、その後1を
減算する。 シフトコントロール回路20は、コントロール
カウンタ16のシフトを制御する。すなわち
(EL−LWレジスタ=0)・(EL−UPレジスタ=
0)+(EL−LWレジスタ減算)の論理でコント
ロールカンウタ16の減算を行なう。 次に動作例を示す。 EMUスタートアドレス(SA) 1000番地 エレメント数(EL) 256エレメント オペコード STORE として、以下のないしの手順で動作が行なわ
れる。 OP CODEレジスタ=STORE CODE SAレジスタ=10000(HEX) ELレジスタ=100(HEX) がセツトされる。 EMU−REQ信号で、コントロールカウンタ
の0がONとなる。加算器の定数としては、0
が選択され、 RAレジスタ10000がセツトされる。 EL−UP=16(DEC) EL−LW=0がセツトされる。 RAレジスタ→レジスタのパスの選択と定数
=80(HEX)の選択がなされる。 REQ−VALを出したなら、EL−UPの値は、
1ずつ減算する。 RAレジスタには、80(HEX)を加算してい
く。 以上をEL−UPが0になるまでくりかえす。 EL−UPが0になつたらEL−LOWが0なの
で、コントロールカウンタは、0→1へシフト
され、加算器の定数として、1d=20(HEX)を
選択し、SAレジスタ→RAレジスタのパスを
選択し、RAレジスタ=10020をセツトする。
EL−UPには、16(DEC)をセツトする。 RAレジスタ−RAレジスタをパスを選択し、
加算器の定数としては80(HEX)を選択する。
REQ−VALを出したのち、EL−UPは、1ず
つ減算するRAレジスタには、80(HEX)を加
算していき、EL−UPが0になるまでくりかえ
す。 EL−UPが0になつたなら、EL−LOWが0
なので、コントロールカウタは、1→2へシフ
トされ、加算器の定数としては、2d=40
(HEX)を選択する。RAレジスタ=10040をセ
ツトする。EL−UPに16をセツトする。 と同様に行なう。 EL−UPが0になつたなら、EL−LOWが0
なので、コントロールカウタを2→3へシフト
し、加算器の定数としては、3d=60(HEX)を
選択する、RAレジスタに10060をセツトし、
EL−UPに16をセツトする。 と同様に行なう。 〔発明の効果〕 本発明によれば、アクセススループツトの大き
いアクセス元が連続アドレスでアクセスした場
合、アクセススループツトの小さいアクセス元の
アクセスによつては、ほとんど影響されなくなる
ので、システム全体として高いアクセス効率を保
つことができる。
それぞれアクセスする場合、アクセススループツ
トの大きいアクセス元がアクセススループツトの
小さいアクセス元のアドレスに追い付いたときア
クセス競合となり、アクセススループツトが低下
した。そこで、アクセススループツトの小さいア
クセス元のアドレスをとびとびに発生し、アクセ
ススループツトの大きいアクセス元と主記憶領域
の走査速度を見かけ上同等にして、アクセス競合
の機会を小さくしている。 〔産業上の利用分野〕 本発明は、情報処理装置における主記憶制御方
式に関するものであり、特に複数のアクセス元に
より主記憶の連続領域をアクセスする際の効率的
なアクセス制御方式に関する。 〔従来の技術〕 第2図は、本発明が適用される情報処理装置の
1例を締したものである。 図において、1は主記憶装置MSU、2は主記
憶制御ユニツトMCU、3はチヤネルプロセツサ
CHP、4はスカラユニツトSU、5はベクトルユ
ニツトVU、6は拡張メモリ制御ユニツトEMU、
7は拡張メモリ、8−0は上記1〜5よりなるプ
ロセツサエレメントPE、8−1ないし8−nは、
他のプロセツサエレメントPEを表す。 チヤネルプロセツサCHP、スカラユニツト
SU、ベクトルユニツトVU、拡張メモリ制御ユ
ニツトEMUは、それぞれ主記憶制御ユニツト
MCUを介して、主記憶装置MSUをアクセスする
ことができる。 主記憶装置MSUは、アドレスを複数のバンク
にインタリーブした構成をとつており、同時的な
複数バンクに対する並行したアクセスが可能にさ
れている。 また拡張メモリ制御ユニツトEMUは、プロセ
ツサエレメント8−0の主記憶装置MSUと拡張
メモリESUとの間のデータ転送を制御するとと
もに、拡張メモリESUと各プロセツサエレメン
トPEのMCUとの間のデータ転送も制御してい
る。 このため、拡張メモリ制御ユニツトEMU(した
がつて拡張メモリESUでもある)が1つの主記
憶制御ユニツトMCUに対してもつアクセスポー
ト数は、プロセツサエレメントが0〜n個あるの
でベクトルユニツトVUなどにくらべてかなり少
なく、又データBus幅も同様に細くなり、アクセ
ススループツトが小さくなつているのが普通であ
る。 たとえばあるシステム例では、VUとMCUと
の間には1本が4エレメント/1Tのスループツ
トをもつ複数本のロード/ストアパイプラインが
設けられているが、EMUとMCUとの間には1エ
レメント/1Tのスループツトをもつ1本のロー
ド/ストアパイプラインしか設けられていない
(1エレメント=8Byte)。 このような、主記憶装置MSUに対するアクセ
ススループツトの異なる複数のアクセス元が、そ
れぞれ主記憶装置の所定の領域を連続アドレス
(デイスタンスd=1)で昇順にアクセスした場
合、条件により両者の間にバンク競合あるいは
LS(LOGICAL STORAGE)BUSYが生じる。 これを、第3図および第4図の具体例を用いて
説明する。 図示の例は、VUが1マシーンサイクル(1T)
に4LS(LOGICAL STORAGE)つまり4エレメ
ントをアクセスできるが、EMUは、4マシーン
サイクル(4T)ごとに4LSつまり4エレメント
をアクセスできる場合のものである。すなわち両
者のアクセススループツトの比は4対1となつて
いる。 第3図および第4図において、縦軸は時間、横
軸にLS(LOGICAL STORAGE)NOを示してい
る。 1回のアクセス単位は4LSであり、アクセスさ
れると縦方向に線がのびるのは、LS Busy時間
のためであり、この時間中は、他のアクセスが禁
止される。 第3図の例は、9がアクセススループツトの小
さいEMUアクセス、10がアクセススループツ
トの大きいVUアクセス、11も同様にVUアク
セスで10とは別のアクセスパイプラインが同時
に動作している場合を示している。図示の時間領
域では、各アクセス間にLSのアクセス競合が起
らないため、VUアクセスのアクセススループツ
トは低下しない。 しかし、第4図の例では、10のVUアクセス
が19のEMLアクセスLS=iで追い付き、アクセ
ス待ちとなつて、以後10′で示すように、VU
アクセスは各LSごとに先行のEMUアクセス待ち
となり、そのアクセススループツトはEMUアク
セスと同じレベルに低下してしまう。 〔発明が解決しようとする問題点〕 従来の情報処理装置では、アクセススループツ
トの異なる複数のアクセス元が連続アドレスで主
記憶にアクセスした場合、連続したLSで次々と
アクセス競合を生じる可能性があり、アクセスス
ループツトの大きいアクセス元のアクセス効率が
低下して、処理速度が遅くるという問題があつ
た。 〔問題点を解決するための手段〕 本発明は、アクセススループツトの異なる複数
のアクセス元がそれぞれ連続アドレスで主記憶に
アクセスする際、アクセス元同士のアクセスアド
レスが連続してアクセス競合しないよう、すなわ
ちアクセススループツトの小さいアクセス元のア
クセスアドレスが、アクセススループツトの大き
いアクセス元のアクセスアドレスによつて追い付
かれないよう、アクセスススループツトの小さい
アドレス元のアドレス数列から、アクセス元間の
アクセススループツトの比に基づいた間隔でとび
とびにアクセスアドレスを発生し、主記憶のアク
セスを行なうように制御するものである。 そのため、アクセススループツトの小さいアク
セス基の連続するアドレス数列を、アクセススル
ープツトの比nに(nは整数)で区分してグルー
プ化する。次に、各グループからたとえばグルー
プ内最下位のアドレスを順に取り出し、1巡した
ら次に各グループ内で次の順位のアドレスを順に
取り出す。以下、この操作をn巡繰り返せば、元
のアドレス数列全体のアドレスが発生できる。 〔実施例〕 以下に、本発明を第2図に示した情報処理装置
に適用した場合の実施例について説明する。した
がつて、第2図の構成がそのまま援用される。 ベクトルユニツトVUは、複数本のロード/ス
トアパイプラインを持つ。1本のロードストアパ
イプラインは、4エレメント(1エレメント=8
バイト)/1Tのスループツトを持つ。 拡張メモリ制御ユニツトEMUは、1本のロー
ド/ストアパイプラインを持ち、そのスループツ
トは、1エレメント/1Tである。 したがつて、VUはEMUに比べてN=4倍の
スループツトがある。 EMUが、MSUに対して10000番地(HEX)か
ら2KB(2048バイト)のデータを転送する場合に
ついて説明する。 EMUのスループツトは、1エレメント/1Tで
あるが、アクセス効率を向上させるため、4エレ
メント/4Tでアクセスする。2KBのデータは、
32バイトアクセスの64回分に相当する。 表1に、このEMUアクセス例を示す。 10000番地から昇べき順に32バイト(DEC)=
20バイト(HEX)単位で2KB分のアドレス列を
つくる。N=4なので、4アドレスごとにグルー
プをつくり、グループ内NOをつける。 まずグループ内NOのについて、昇べき順で
主記憶に対してアクセスを出す。次に、、
と順に同様にアクセスを発信する。 第5図に、本発明方式を用いた場合のLS
Busyと時間の関係を図示する。これは、第4図
の従来例に対応するものである。 本発明方式により、LS時間グラフ上の傾きが、
VUアクセスとEMUアクセスとで等しくなる。
また、一時的にVUアクセスとEMUアクセスと
がLS Busyコンフリクシヨンを起こしたとして
も、LS Busy時間以内のものであり、スループ
ツトは保証される。 実施例回路 第1図は、本発明方式によるリクエストアドレ
ス発生回路の1実施例構成を示したもである。こ
の回路は、EMU内に設けられてEMUアクセスの
ために使用される。 図において、11はOP CODEレジスタ、12
はSAレジスタ、13はELレジスタ、14は加算
器、15はRAレジスタ、16はコントロールカ
ウンタ、17はEL−UPレジスタ、18はEL−
LWレジスタ、19はREQコントロール回路、2
0はシフトコントロール回路を表わしている。 OP CODEレジスタ11は、ロードあるいはス
トアのオペコードを保持するレジスタである。 SAレジスタ12は、アクセスをスタートする
アドレス(SA)を保持するレジスタである。 ELレジスタ13は、ロードあるいはストアす
るエレメント数(EL)を保持するレジスタであ
る。 加算器14は、現アドレスにデイスタンスを加
算して次のリクエストアドレスを生成する回路で
ある。加算される定数としては、 0 1d=20(HEX) 2d=40(HEX) 3d=60(HEX) Nd=80(HEX) の中の1つが選択される。 RAレジスタ15は現在のリクエストアドレス
を保持するレジスタであり、その出力はMCUへ
転送されると同様に加算器14へ帰還される。 コントロールカウンタ16は4Bitのシフトレジ
スタで構成され、グループの走査シーケンスを制
御する回路である。制御ステージ数は4である。 EL−UPレジスタ17には、EMUアクセスに
設定されているアクセススループツト倍数N=4
でエレメント数(EL)を区分した結果得られる
グループ数がセツトされる。アドレス発生ごとに
1ずつ減算され、0となつたとき再セツトされ
て、4巡で終了する。 EL−LWレジスタ18には、エレメント数
(EL)をN=4で区分した端数がセツトされ、0
でない限りEL−UPレジスタ17の1巡の終りに
1を減算される。 REQコントロール回路19は、MCUに対して
リクエストアドレスが有効であることを知らせる
REQUEST VALIDを出力する。 シフトコントロール回路20は各グループに対
する走査が一巡するごとにコントロールカウンタ
16を1段シフトする。 EMUからMSUへのアクセス発信を行なうとき
は、スカラユニツトSUより、ロード、ストアを
示すオペコード(OP CODE)スタートアドレス
(SA)、エレメント数(EL)等のパラメータが与
えられる。 EMUからMCUに対してアクセスリクエストを
出す場合、上記それぞれのパラメータが、
OPCODEレジスタ11、SAレジスタ12、EL
レジスタ13に、EMU−REQというEMU内部
のコントロール信号によつてセツトされ、オペレ
ーシヨンの終了まで保持される。 SAレジスタ12とRAレジスタ15のアドレ
スに対して加算器14が加算する定数は、SAレ
ジスタ12からRAレジスタヘアアドレスがセツ
トされるときに選択される。これらの値はコント
ロールカウンタ16により指定される。 Nd=80(H)の定数は、RAレジスタ→RAレ
ジスタのパスが選択されたときには必ず選択され
る。 ELレジスタ13よりEL−UPレジスタ17に
は、エレメント数の0〜27BITのみがセツトされ
る。これは、エレメント数が4エレメントバウン
ダリになつているときは“グループNO”を示
し、4エレメントバウンダリとなつていないとき
は、“グループNO−1”を示す。グループNOと
は、エレメント数を4で区切つたグループ数のこ
とである。 EL−UPレジスタ17は、コントロールカウン
タ16の段0、1、2、3にセツトされるタイミ
ングで値をセツトされ、REQコントロール回路
19により1ずつ減算される。 EL−LWレジスタ18は、コントロールカウ
ンタ16の0BIT段がONになつたときに、エレ
メント数の28BITおよび29BITのみをセツトさ
れ、保持する。 EL−UPレジスタ17が0になり、かつEL−
LWレジスタ18が0でないとき、REQコントロ
ール回路19へリクエストを発生し、その後1を
減算する。 シフトコントロール回路20は、コントロール
カウンタ16のシフトを制御する。すなわち
(EL−LWレジスタ=0)・(EL−UPレジスタ=
0)+(EL−LWレジスタ減算)の論理でコント
ロールカンウタ16の減算を行なう。 次に動作例を示す。 EMUスタートアドレス(SA) 1000番地 エレメント数(EL) 256エレメント オペコード STORE として、以下のないしの手順で動作が行なわ
れる。 OP CODEレジスタ=STORE CODE SAレジスタ=10000(HEX) ELレジスタ=100(HEX) がセツトされる。 EMU−REQ信号で、コントロールカウンタ
の0がONとなる。加算器の定数としては、0
が選択され、 RAレジスタ10000がセツトされる。 EL−UP=16(DEC) EL−LW=0がセツトされる。 RAレジスタ→レジスタのパスの選択と定数
=80(HEX)の選択がなされる。 REQ−VALを出したなら、EL−UPの値は、
1ずつ減算する。 RAレジスタには、80(HEX)を加算してい
く。 以上をEL−UPが0になるまでくりかえす。 EL−UPが0になつたらEL−LOWが0なの
で、コントロールカウンタは、0→1へシフト
され、加算器の定数として、1d=20(HEX)を
選択し、SAレジスタ→RAレジスタのパスを
選択し、RAレジスタ=10020をセツトする。
EL−UPには、16(DEC)をセツトする。 RAレジスタ−RAレジスタをパスを選択し、
加算器の定数としては80(HEX)を選択する。
REQ−VALを出したのち、EL−UPは、1ず
つ減算するRAレジスタには、80(HEX)を加
算していき、EL−UPが0になるまでくりかえ
す。 EL−UPが0になつたなら、EL−LOWが0
なので、コントロールカウタは、1→2へシフ
トされ、加算器の定数としては、2d=40
(HEX)を選択する。RAレジスタ=10040をセ
ツトする。EL−UPに16をセツトする。 と同様に行なう。 EL−UPが0になつたなら、EL−LOWが0
なので、コントロールカウタを2→3へシフト
し、加算器の定数としては、3d=60(HEX)を
選択する、RAレジスタに10060をセツトし、
EL−UPに16をセツトする。 と同様に行なう。 〔発明の効果〕 本発明によれば、アクセススループツトの大き
いアクセス元が連続アドレスでアクセスした場
合、アクセススループツトの小さいアクセス元の
アクセスによつては、ほとんど影響されなくなる
ので、システム全体として高いアクセス効率を保
つことができる。
【表】
第1図は本発明方式の1実施例におけるリクエ
ストアドレス発生回路の実施例構成図、第2図は
本発明方式が適用可能な情報処理装置のシステム
構成図、第3図は従来方式によるアクセス例のグ
ラフ、第4図は従来方式による他のアクセス例の
グラフ、第5図は第1図に示す本発明方式の1実
施例によるアクセス例のグラフである。 第1図において、11はOP CODEレジスタ、
12はSAレジスタ、13はELレジスタ、14は
加算器、15はRAレジスタ、16はコントロー
ルカウンタ、17はEL−UPレジスタ、18は
EL−LWレジスタ、19はREQコントロール回
路、20はシフトコントロール回路を示す。
ストアドレス発生回路の実施例構成図、第2図は
本発明方式が適用可能な情報処理装置のシステム
構成図、第3図は従来方式によるアクセス例のグ
ラフ、第4図は従来方式による他のアクセス例の
グラフ、第5図は第1図に示す本発明方式の1実
施例によるアクセス例のグラフである。 第1図において、11はOP CODEレジスタ、
12はSAレジスタ、13はELレジスタ、14は
加算器、15はRAレジスタ、16はコントロー
ルカウンタ、17はEL−UPレジスタ、18は
EL−LWレジスタ、19はREQコントロール回
路、20はシフトコントロール回路を示す。
Claims (1)
- 【特許請求の範囲】 1 メモリアクセススループツトが相違するアク
セス元を含む複数のアクセス元が主記憶のアドレ
スに対して連続するアクセスを主として行うシス
テムにおいて、 ある第1のアクセススループツトを有する第1
のアクセス元と、 前記第1のアクセス元と比較して、前記第1ア
クセススループツトよりもアクセススループツト
が小さく、前記第1アクセススループツトの1/
nの比(nは整数)のアクセススループツトであ
る第2アクセススループツトを有する第2のアク
セス元を有し、 前記第2のアクセス元は、 前記主記憶装置に連続したアドレスのアクセス
をする際に、アクセス単位のn倍のアドレス間隔
で、前記第1のアクセス元のアクセス方向と同じ
方向でアドレスを更新していくアドレス更新制御
手段と、 アクセスのスタートアドレスにアクセス単位の
アドレスを順次加算して、前記アドレス更新制御
手段に与えるアドレス加算手段とを有し、 前記第2のアクセス元は、前記アドレス更新制
御手段とアドレス加算手段とにより自身のアクセ
スアドレスを更新し、その際アクセスアドレスを
アクセス単位ごとに一定の方向に並べ、そのアド
レス数列をnグループに区切り、各グループごと
に同一の番号付けを行い、上記nで区切つた各グ
ループごとに順次の番号のアドレスを選択し、か
つ各番号ごとに各グループ内の同一番号のアドレ
スを横断してアクセスするように、アドレス列を
変更してアクセスアドレスを更新することを特徴
とする主記憶制御方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4781685A JPS61206054A (ja) | 1985-03-11 | 1985-03-11 | 主記憶制御方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4781685A JPS61206054A (ja) | 1985-03-11 | 1985-03-11 | 主記憶制御方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS61206054A JPS61206054A (ja) | 1986-09-12 |
| JPH0414371B2 true JPH0414371B2 (ja) | 1992-03-12 |
Family
ID=12785878
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP4781685A Granted JPS61206054A (ja) | 1985-03-11 | 1985-03-11 | 主記憶制御方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS61206054A (ja) |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS59119996A (ja) * | 1982-12-25 | 1984-07-11 | Fujitsu Ltd | マルチポ−トメモリを用いた時間スイツチ方式 |
-
1985
- 1985-03-11 JP JP4781685A patent/JPS61206054A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS61206054A (ja) | 1986-09-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5134695A (en) | Method and apparatus for constant stride accessing to memories in vector processor | |
| US4827403A (en) | Virtual processor techniques in a SIMD multiprocessor array | |
| Lim et al. | Efficient algorithms for block-cyclic redistribution of arrays | |
| US5155823A (en) | Address generating unit | |
| US6954812B2 (en) | Two-stage round robin arbitration system | |
| KR950012256A (ko) | 벡터 데이타 처리용 컴퓨터 시스템 및 그 방법 | |
| US4757444A (en) | Vector processor capable of performing iterative processing | |
| KR960042420A (ko) | 파라메트릭 곡선 발생 장치 | |
| Seznec et al. | Interleaved parallel schemes: Improving memory throughput on supercomputers | |
| JP4240610B2 (ja) | 計算機システム | |
| JPS638952A (ja) | メモリのアドレス方法およびこの方法を用いたプロセッサ | |
| JPH0414371B2 (ja) | ||
| Honda et al. | A warp-synchronous implementation for multiple-length multiplication on the GPU | |
| JPH0863440A (ja) | 並列処理装置 | |
| JP3223530B2 (ja) | データ転送命令生成処理方法 | |
| JPS61282954A (ja) | アクセス制御方式 | |
| JPS61262971A (ja) | ベクトルレジスタの構成方式 | |
| JPS62174873A (ja) | メモリアクセス制御方式 | |
| KR930003410B1 (ko) | 스택영역의 데이터참조를 고속으로 행하는 데이터처리장치 | |
| del Corral et al. | Reducing inter-vector-conflicts in complex memory systems | |
| Smitley et al. | Comparative analysis of hill climbing mapping algorithms | |
| JP2000259493A (ja) | メモリアクセスシステム | |
| JPS63198144A (ja) | マルチポ−トメモリにおけるダイレクトメモリアクセス制御方式 | |
| JPS62138940A (ja) | レジスタアクセス制御方式 | |
| Souravlas et al. | A message passing strategy for array redistributions in a torus network |