JPS60263268A - Vector processor - Google Patents
Vector processorInfo
- Publication number
- JPS60263268A JPS60263268A JP12014284A JP12014284A JPS60263268A JP S60263268 A JPS60263268 A JP S60263268A JP 12014284 A JP12014284 A JP 12014284A JP 12014284 A JP12014284 A JP 12014284A JP S60263268 A JPS60263268 A JP S60263268A
- Authority
- JP
- Japan
- Prior art keywords
- vector
- register
- mask
- parallel
- elements
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
- G06F15/8053—Vector processors
Landscapes
- Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Complex Calculations (AREA)
Abstract
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明はベクトル処理装置におけるデータ転送制御に関
し、特にそのベクトル圧縮変換制御に関する。DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to data transfer control in a vector processing device, and particularly to vector compression conversion control thereof.
(従来技術)
従来のベクトル処理装置において、オペランドベクトル
レジスタからベクトルエレメントを読出して処理する場
合には各エレメントが順次、1個づつ読出され、リザル
トベクトルレジスタに書込む場合にも各エレメントが順
次、1個づつ書込まれていた。斯かるベクトル処理装置
においては、ベクトルの圧縮変換を行うことは比較的容
易である。(Prior Art) In a conventional vector processing device, when reading vector elements from the operand vector register and processing them, each element is read out one by one in sequence, and when writing to the result vector register, each element is read out one by one in sequence. They were written one by one. In such a vector processing device, it is relatively easy to perform vector compression conversion.
次に、圧縮変換について説明する。第1図は、圧縮変換
の説明図である。k個(k:正の整数)のマスクエレメ
ントを格納できるマスクデータレジスタMSKと、各マ
スクエレメントに対応して同一のベクトルのエレメント
をに個まで格納できるオペランドベクトルレジスタOP
Rと、同様に各マスクエレメントに対応して同一のベク
トルのエレメントをに個まで格納できるリザルトベクト
ルレジスタR8Lとがおる。そこで、マスクデータレジ
スタMSKとオペランドベクトルレジスタOPRとには
、第1図に示すようなエレメントがそれぞれ格納されて
いるとする。このような状態から−IIが格納されてい
るマスクエレメントの↑
1′ 格納位置に対応したオペランドベクトルレジスタ
OPRのエレメントな、その順序管乱すことなく順次、
リザルトベクトルレジスタに格納してゆくことが圧縮変
換でおる。Next, compression conversion will be explained. FIG. 1 is an explanatory diagram of compression conversion. A mask data register MSK that can store k (k: positive integer) mask elements, and an operand vector register OP that can store up to 2 elements of the same vector corresponding to each mask element.
Similarly, there is a result vector register R8L which can store up to two elements of the same vector corresponding to each mask element. Therefore, it is assumed that elements as shown in FIG. 1 are stored in the mask data register MSK and the operand vector register OPR, respectively. From this state, the elements of the operand vector register OPR corresponding to the ↑ 1' storage position of the mask element where -II is stored are sequentially written without disturbing their order.
Compression conversion is performed by storing it in the result vector register.
上に説明した圧縮変換において、高速処理を行う場合に
は複数個のベクトルエンメントを同時に並列処理するこ
とが望ましい。しかし、この場合には制御が複雑になぁ
という欠点がめった。In the above-described compression conversion, it is desirable to process a plurality of vector elements in parallel at the same time in order to perform high-speed processing. However, in this case, the drawback is that the control is complicated.
(発明の目的)
本発明の目的は、比較的簡単な制御手段を使用し、並列
にベクトルの圧縮変換を行って高速処理を実行すること
によって上記欠点を除去し、簡単に制御を行うことがで
き石ように構成したベクトル処理装置を提供することに
ある。(Object of the Invention) An object of the present invention is to eliminate the above-mentioned drawbacks by performing high-speed processing by compressing vectors in parallel using a relatively simple control means, and to easily perform control. The object of the present invention is to provide a vector processing device that is constructed in a simple manner.
(発明の構成)
本発明によるベクトル処理装置は、オペランドベクトル
7972手段と、リザルトベクトルVジスタ手段と、マ
スクデータレジスタ手段と、読出しデータバス手段と、
書込みデータバス手段と。(Structure of the Invention) A vector processing device according to the present invention includes operand vector 7972 means, result vector V register means, mask data register means, read data bus means,
Write data bus means.
アライン回路手段と、積算回路手段と、エンコーダ手段
と、デコーダ手段とを具備し、ベクトル圧縮変換を行う
ように構成したものでおる。The apparatus includes align circuit means, integration circuit means, encoder means, and decoder means, and is configured to perform vector compression conversion.
オペランドベクトルレジスタ手段は、1サイクル中に同
一ベクトルに属する複数個のベクトルエレメントを読出
すだめのものである。The operand vector register means is for reading out a plurality of vector elements belonging to the same vector during one cycle.
リザルトベクトルVジヌタ手段は、1サイクル中に同一
ベクトルに属する上記複数個のベクトルエレメントを書
込むためのものでおる。The result vector V-signuter means is for writing the plurality of vector elements belonging to the same vector during one cycle.
マスクデータ7ジヌタ手段は、オペランドベクトルレジ
スタ手段およびリザルトベクトルレジスタ手段の各要素
に対応し、1サイクル中に上記複数個のマスクエレメン
トを読出すだめのものであ71゜
読出しデータバス手段は、オペランドベクトルレジスタ
手段から上記複数個のベクトルエレメントを読出すため
のものでおる。The mask data 7 signal bus means corresponds to each element of the operand vector register means and the result vector register means, and is used to read out the plurality of mask elements during one cycle. This is for reading out the plurality of vector elements from the vector register means.
書込みデータバス手段は、リザルトベクトルレジスタ手
段に上記複数個のベクトルエンメントを書込むだめのも
のでめる。The write data bus means is provided for writing the plurality of vector elements into the result vector register means.
アライン回路手段は、読出しデータバス手段と書込みデ
ータバス手段とを選択的に接続するだめのものである。The align circuit means is for selectively connecting the read data bus means and the write data bus means.
積算回路手段は、読出しデータバス手段を通して読出さ
れたマスクエレメントの−1#の数を積算するためのも
のである。The accumulation circuit means is for accumulating the -1# number of mask elements read through the read data bus means.
エンコーダ手段は、積算回路手段から得られた積算値と
、上記によ)読出されたマスクエレメントとによシ上記
すザルトベクトルレジスタ手段に対する書込みアドレス
歩進信号を生成するだめのものである。The encoder means is for generating a write address increment signal for the salt vector register means by the summation value obtained from the summation circuit means and the mask element read out (above).
デコーダ手段は、上記により読出されたマスクエレメン
トと上記積算値とによってアライン回路手段への接続制
御信号を生成するだめのものであるO
(実施例)
次に、本発明について図面を参照して詳細に説明する。The decoder means is for generating a connection control signal to the align circuit means based on the mask element read out above and the integrated value. Explain.
第2図は、本発明によるベクトル処理装置の−実施例金
示すブロック図である。第2図において、ベクトル処理
装置は並列ベクトルレジスタ部1と。FIG. 2 is a block diagram showing an embodiment of a vector processing device according to the present invention. In FIG. 2, the vector processing device includes a parallel vector register section 1.
アライン回路2と、圧縮変換制御回路6と、読出しデー
タバス1000と、書込みデータ/<ス2000と、マ
スクデータ読出しバス1300!:。Align circuit 2, compression conversion control circuit 6, read data bus 1000, write data/< bus 2000, and mask data read bus 1300! :.
書込みアドレス歩進制御信号線6000と、アライン回
路接続制御信号線6200とから成立っている。It consists of a write address increment control signal line 6000 and an align circuit connection control signal line 6200.
第8図は、並列ベクトルレジスタ部1の詳細を示すブロ
ック図である。本実施例においては4個(一般にはn個
、n=1t2+8・・・、正の整数、ここではn=4)
の同一構成のベクトルレジスタ部VE−0〜VE−8を
備え、例えばベクトルレジスタ部VE−0はマスクデー
タレジスタMSK−0と、オペランドベクトルレジスタ
0PR−〇と、リザルトベクトルレジスタR8L−0と
から成立っている。一般に、ベクトルレジスタ部vE−
1(i=0,1,2,8)はff7クデ一タレジスタM
SK−i (i=0 、1 、2−8 )と。FIG. 8 is a block diagram showing details of the parallel vector register section 1. In this example, there are four (generally n, n=1t2+8..., a positive integer, here n=4)
For example, the vector register section VE-0 is composed of a mask data register MSK-0, an operand vector register 0PR-0, and a result vector register R8L-0. ing. Generally, the vector register section vE-
1 (i=0, 1, 2, 8) is ff7 data register M
SK-i (i=0, 1, 2-8).
オペランドベクトルレジスタ0PR−i (1=o 。Operand vector register 0PR-i (1=o.
1.2.3)と、リザルトベクトルレジスタR8? L
−i(i=o、1t18)とから成立つ。ここで、オペ
ランドベクトルレジスタ0PR−i(i=o、1,2.
8)ならびにリザルトベクトルレジスタR8L−t(i
=o+1*2p8)として読出し/書込みが可能なレジ
スタを使用すれば、リザルトベクトルVジスタR8L=
とオペランドベクトルレジスタ0PR−i(i=o11
1218)とを同一のレジスタで構成することができる
。1.2.3) and result vector register R8? L
-i (i=o, 1t18). Here, operand vector register 0PR-i (i=o, 1, 2 .
8) and result vector register R8L-t(i
If you use a register that can be read/written as =o+1*2p8), the result vector V register R8L=
and operand vector register 0PR-i (i=o11
1218) can be configured with the same register.
各オペランドベクトルレジスタ0PR−0〜0PR−8
から並列に読出された4個のベクトルエレメントは、4
個のベクトルエレメントを並列に転送するだめの読出し
データバス1000を介してアライン回路2に供給され
る。4個のベクトルエレメントを並列に転送するだめの
書込みデータバス2000を介してアライン回路2から
供給されたベクトルエレメントは、各リザルトベクトル
レジスタR8L−0〜R8L−8に並列に書込むことが
できる。各マスクデータレジスタM8に一〇〜M S
K −8から並列に読出された4個のマスクエレメント
は、マスクデータ読出しノくス1ろ00を介して並列に
圧縮変換制御回路3に転送される。Each operand vector register 0PR-0 to 0PR-8
The four vector elements read in parallel from
The data is supplied to the align circuit 2 via a read data bus 1000 for transferring vector elements in parallel. The vector elements supplied from the align circuit 2 via the write data bus 2000, which is used to transfer four vector elements in parallel, can be written in parallel to each of the result vector registers R8L-0 to R8L-8. 10 to M S in each mask data register M8
The four mask elements read out in parallel from K-8 are transferred in parallel to the compression conversion control circuit 3 via mask data readout nodes 1 and 00.
第4図は、アライン回路2を詳細に示すブロック図であ
る。第4図において、アライン回路2は読出しデータバ
ス1000に接続された4個の入カポ−)20−0〜2
0−3と、書込みデータバス2000に接続された4個
の出力ボート21−〇〜21−3と、各入出力ボート間
を接続するための接続線22とがら成立つ。アライン回
路2には、圧縮変換制御回路3から信号線6200を介
してアライン回路接続制御信号が供給されている。FIG. 4 is a block diagram showing the align circuit 2 in detail. In FIG. 4, the align circuit 2 includes four input ports 20-0 to 2 connected to the read data bus 1000.
0-3, four output ports 21-0 to 21-3 connected to the write data bus 2000, and a connection line 22 for connecting each input/output boat. The align circuit 2 is supplied with an align circuit connection control signal from the compression conversion control circuit 3 via a signal line 6200.
この信号は、n = 4に対応して存在する4個の入カ
ポ−)21−0〜21−3に供給され、この信号によっ
て各入出力ボート間の接続の仕方が制御されている。例
えば、後で説明するような情報ωo=ω1=0(気0,
0〃)、ω2 =1 (’ Or1〃)、ω3−2(気
1,0’)を含む制御信号が信号線6200を介して供
給された場合には、各人出ボートの接続の仕方は次のよ
うになる。情報ω。が供給されている出カポ−)21−
0および情報ω1が供給されている出カポ−)21−1
はω0=ω1 = Oに対応して共に入力ボート2〇−
〇に接続され、情報ω冨が供給されている出カポ−)2
1−2はω2=1に対応して入力ボート20−1に接続
され、情報ω3が供給されている出力ボート21−8は
ω3=2に対応して入力ボート20−2に接続されてい
る。This signal is supplied to four input ports (21-0 to 21-3) corresponding to n=4, and the connection between each input/output port is controlled by this signal. For example, the information ωo=ω1=0 (ki 0,
0〃), ω2 = 1 ('Or1〃), ω3-2 (Ki 1, 0') is supplied via the signal line 6200, the way each boat is connected is as follows. It will look like this: Information ω. Output capo that is supplied with) 21-
0 and information ω1 are supplied) 21-1
corresponds to ω0 = ω1 = O, and both input boats 20−
Output port connected to 〇 and supplied with information ω-)2
1-2 is connected to the input boat 20-1 in response to ω2=1, and the output port 21-8 to which information ω3 is supplied is connected to the input port 20-2 in response to ω3=2. .
第5図は、圧縮変換制御回路6の詳細を示すブロック図
でらる。第5図において、圧縮変換制御回路6はマスク
データ読出しバス1600に接続された4ビツトのマス
クレジスタ61と、加算器621ならびにレジスタ62
2から成る積算回路62と、エンコーダ66と、デコー
ダ641と。FIG. 5 is a block diagram showing details of the compression conversion control circuit 6. In FIG. 5, the compression conversion control circuit 6 includes a 4-bit mask register 61 connected to a mask data readout bus 1600, an adder 621, and a register 62.
2, an integrating circuit 62, an encoder 66, and a decoder 641.
シフタ642とから成立っている。エンコーダ36はマ
スクレジスタ61の出力と積算回路32の積算値Xとを
入力して信号線6100上に書込みアドレス歩進制御信
号を生成し、これを並列ベクトルレジスタ部1に供給し
、てリザルトベクトルレジスタR8L−0〜R8L−8
の書込みアドレスの歩道をそれぞれ制御する。デコーダ
641にはマスクデータが入力され、デコーダ641の
出力はアライン回路接続制御信号線6200上に各2ピ
ントの情報ω0〜ω3として送出され、アライン回路2
に供給されている。It consists of a shifter 642. The encoder 36 inputs the output of the mask register 61 and the integrated value Register R8L-0 to R8L-8
Control the write address of each trail. Mask data is input to the decoder 641, and the output of the decoder 641 is sent out on the align circuit connection control signal line 6200 as information ω0 to ω3 for each 2 pins, and the align circuit 2
is supplied to.
次に、本実施例の動作を詳細に説明する。Next, the operation of this embodiment will be explained in detail.
最初に、並列ベクトルレジヌタ部1の各レジスタは次の
ようにして初期設定されるものとする。First, it is assumed that each register of the parallel vector register unit 1 is initialized as follows.
すなわち、各マスクデータレジスタMSK−0〜MSK
−1には特定のマスクデータの値が設定される。設定の
順番は、例えば次のようにして決定される。すなわち、
マスクデータが第1図に示すように10110100・
・・・・に従って配置されている場合には、マスクデー
タレジスタMSK−0の最初のアドレスにマスクデータ
の最初の一1〃が設定され、マスクデータレジスタMS
K−1の最初のアドレスに次のマスクデータ気0〃が設
定され、以下同様にしてマスクデータレジスタMSK−
8の最初のアドレスに4番目のマスクデーター1〃が設
定される。斯くして、並列ベクトルレジスタ部1の各マ
スクデータレジスタMSK−0〜MSK−8の最初のア
ドレスには、第3図に示すようにマスクデーター101
1 #が設定され、次のアドレスにマスクデータ’01
00’が設定され、以下同様にして各マスクデータレジ
スタMSK−0〜MSK−8に各マスクデータが設定さ
れる。That is, each mask data register MSK-0 to MSK
-1 is set to a specific mask data value. The order of settings is determined, for example, as follows. That is,
The mask data is 10110100 as shown in Figure 1.
..., the first one 1 of the mask data is set to the first address of the mask data register MSK-0, and the mask data register MSK-0 is set to the first address of the mask data register MSK-0.
The next mask data 0 is set at the first address of K-1, and the mask data register MSK-
The fourth mask data 1 is set at the first address of 8. Thus, the first address of each mask data register MSK-0 to MSK-8 of the parallel vector register section 1 contains mask data 101 as shown in FIG.
1 # is set and mask data '01' is placed in the next address.
00' is set, and thereafter each mask data is set in each mask data register MSK-0 to MSK-8 in the same manner.
次に、オペランドベクトルの各エレメントが第1図に示
すようにAo r A1 + A2 ・・・であるとす
る、この場合には第8図に示すように、オペランドベク
トルレジスタ0PR−0の最初のアドレスにベクトルエ
ンメントAOが設定され、オペランドベクトルレジスタ
OP R−1の最初のアドレスに次のベクトルエレメン
トA1が設定され、以下同様にしてオペランドベクトル
レジスタ0PR−8の最初のアドレスにベクトルエレメ
ントA3が設定される。斯くして、並列ベクトルレジス
タ部1の各オペランドベクトルレジスタ0PR−〇〜0
PR−8の最初のアドレスにはベクトルエレメントAo
+A1 *Az +Asがそれぞれ設定される。同様
にして、オペランドベクトルレジスタ0PR−0〜0P
R−8の次のアドレスにはベクトルエレメントA4 e
As r Aa r Atがそれぞれ設定され、以下
同様にしてすべてのオペランドベクトルのベクトルエレ
メントが各オペランドベクトルレジスタ0PR−0〜0
PR−8Kl[次設定される。Next, suppose that each element of the operand vector is Aor A1 + A2 as shown in FIG. 1. In this case, as shown in FIG. 8, the first element of the operand vector register 0PR-0 is The vector element AO is set to the address, the next vector element A1 is set to the first address of the operand vector register OP R-1, and the vector element A3 is set to the first address of the operand vector register 0PR-8 in the same manner. Set. In this way, each operand vector register 0PR-0 to 0 of the parallel vector register section 1
The first address of PR-8 is the vector element Ao.
+A1 *Az +As are set respectively. Similarly, operand vector register 0PR-0~0P
The next address of R-8 is vector element A4 e
As r Aa r At are set respectively, and in the same manner, vector elements of all operand vectors are stored in each operand vector register 0PR-0 to 0.
PR-8Kl [Next setting.
リザルトレジスタR8L−0〜R8L−8には圧縮変換
によシオペランドベクトルレジスタ0PR−0〜0PR
−8のベクトルエンメントAo+AI r AS ・・
・が圧縮されて書込まれるので初期設定をする必要はな
い。したがって、第3図に示すリザルトベクトルレジス
タR8L−0〜R8L−8には以上説明したような初期
値ではなく、後で説明するような圧縮変換後の各ベクト
ルエレメントが設定されている。Result registers R8L-0 to R8L-8 are stored in sioperand vector registers 0PR-0 to 0PR by compression conversion.
-8 vector enement Ao+AI r AS ・・
・ is written compressed, so there is no need to make initial settings. Therefore, the result vector registers R8L-0 to R8L-8 shown in FIG. 3 are set not with the initial values as described above, but with vector elements after compression conversion as will be explained later.
以上の初期設定状態がら圧縮変換が開始嘔れるが、圧縮
変換の第0次サイクルにおいて、並列ベクトルレジスタ
部1のマスクデータレジスタMSK−0〜MSK−8の
最初のアドレスに格納されているマスクデータ’1[1
1”が並列に読出され、マスクデータ読出しバス130
0を介して圧縮変換制御回路6のマスクンジスタロ1に
格納される。Compression conversion starts with the above initial settings, but in the 0th cycle of compression conversion, the mask data stored in the first address of the mask data registers MSK-0 to MSK-8 of parallel vector register section 1 '1[1
1” are read in parallel and the mask data read bus 130
The signal is stored in the masked register 1 of the compression conversion control circuit 6 via the bit 0.
このとき、各オペランドレジスタ0PR−0〜0PR−
8の最初のアドレスに格納されているオペランドベクト
ルの各ベクトルエレメントAo r At pA2 、
Asが読出され、読出しデータバス1000を介してア
ライン回路2の入力ポート20−0〜20−8に出力さ
れる。マスクレジスタ61に格納されているマスクデー
タからデコーダ!+41によってアライン回路接続制御
信号を生成し、これをアライン回路2に供給してアライ
ン回路2の入カポ−)20−0〜20−3と出力ボート
21−〇〜21−8との間の接続を制御する。この制御
は以下のようにして行われる。At this time, each operand register 0PR-0 to 0PR-
Each vector element Aor At pA2 of the operand vector stored at the first address of 8.
As is read and output to input ports 20-0 to 20-8 of align circuit 2 via read data bus 1000. Decoder from the mask data stored in the mask register 61! +41 generates an align circuit connection control signal, supplies this to the align circuit 2, and connects the input ports 20-0 to 20-3 of the align circuit 2 and the output ports 21-0 to 21-8. control. This control is performed as follows.
第6図および第7図は、それぞれ第5図に示したエンコ
ーダ66の回路構成図と論理値とを示す図である。エン
コーダ36の出力はリザルトベクトルレジスタR8L−
0〜RS L −80歩進制制御器として並列ベクトル
レジスタ部1に供給される。第7図に示す論理値はn
= 4とした時の実施例であるが、n−f−4の時にも
以下のように論理値を設定することによシ容易に同様な
エンコーダを構成することができる。すなわち、入力さ
れたマスクデータmQ−mn 1を加算踵加算値によシ
m(1〜m n−1に含まれる気1Nの数をめ、a(、
Ω側から左詰めで一1#を割付け、残シをすべてI’t
□Iとして結果を積算値Xだけサイクリックに右にシフ
ト(ライトローテート)する。このようにして得られた
リザルトベクトルレジスタR8L−0〜R8L’−8の
歩進制御信号は、マスクデータm(、−mlがLS l
#、% Q #%S I 11.% l #であって
、積算値XがOのときに”1110”でめυ、リザルト
ベタトルレジスタR8L−0〜R8L−2の内容が歩進
される。このとき、そのベクトル部にはリザルトベクト
ルのベクトルエレメントが転送されているので、ベクト
ルエレメントAo r A2 r A3のみがリザルト
ベクトルレジスタR8L−0〜RS T、 −2の最初
のアドレスに書込まれて残ることになる。しかし、リザ
ルトベクトルレジスタR8L−3の書込みアドレスは歩
進されないだめ、リザルトベクトルレジスタR8L−3
に転送されるべきデータとしてのベクトルエンメントA
3はリザルトベクトルンジスタR8L゛ −8の最初の
レジスタに書込まれるが、次のサイクルで書換えられて
しまうことになる。したがつて、第8図に示すようにリ
ザルトベクトルレジスタR8L−0〜R8L−2の最初
のアドレスにはベクトルエレメントAo 、As 、A
sが格納される。6 and 7 are diagrams showing a circuit configuration diagram and logical values of the encoder 66 shown in FIG. 5, respectively. The output of the encoder 36 is the result vector register R8L-
0 to RS L -80 is supplied to the parallel vector register unit 1 as a step controller. The logical value shown in Figure 7 is n
= 4, but a similar encoder can be easily constructed even when n-f-4 by setting the logical values as follows. That is, the input mask data mQ-mn1 is added to the heel addition value m(1 to mn-1, and the number of qi1N included in a(,
Assign 1# from the Ω side to the left, and all the remaining numbers are I't.
As □I, the result is cyclically shifted to the right by the integrated value X (write rotation). The step control signals of the result vector registers R8L-0 to R8L'-8 obtained in this way are based on the mask data m(, -ml is LS l
#, % Q #%SI 11. %l#, and when the accumulated value At this time, since the vector element of the result vector has been transferred to that vector section, only the vector element Aor A2 r A3 is written to the first address of the result vector register R8L-0 to RST, -2. It will remain. However, the write address of result vector register R8L-3 is not incremented;
vector element A as data to be transferred to
3 is written to the first register of result vector register R8L-8, but it will be rewritten in the next cycle. Therefore, as shown in FIG. 8, the first addresses of the result vector registers R8L-0 to R8L-2 contain vector elements Ao, As, and A.
s is stored.
第1次サイクルにおいて各オペランドベクトルレジスタ
0PR−0〜0PR−8から次のアドレスのベクトルエ
レメントA4 + As p Am r ATが読出さ
れ、アライン回路2の入力ボート20−0〜20−8に
入力される。この場合には、マスクデータレジスタMS
K−0〜MSK−8からも同様にして次のデータ% 0
100#が読出されてマスクレジスタ61に格納される
。積算回路62のレジスタ622においては前回の積算
値Xが8でおって、マスクデータの値が%0100#で
あるため、信号線6200上のアライン回路接続制御信
号の各成分ω0〜ω3は%8881 #となシ、結果的
にはアライン回路2の出カポ−)21−0〜21−8に
はそれぞれA7 v A7 # AT +ABが出力さ
れる。一方、エンコーダ3るの出力は%Q0011とな
るため、リザルトベクトルレジスタRS L −8のみ
にベクトルエレメントA5が書込まれ、その後に書込み
アドレスが歩進される。このとき、他のリザルトベクト
ルレジスタR8L−〇〜R8L−2にはベクトルエレメ
ントA7*At+A7が書込まれるが、アドレスの歩進
が行われないので次のサイクルで書換えられることにな
る。In the first cycle, the vector element A4 + As p Am r AT of the next address is read from each operand vector register 0PR-0 to 0PR-8, and is input to the input ports 20-0 to 20-8 of the align circuit 2. Ru. In this case, the mask data register MS
Similarly, the next data from K-0 to MSK-8 is % 0
100# is read and stored in mask register 61. In the register 622 of the integration circuit 62, the previous integration value As a result, A7 v A7 # AT +AB is output to the output ports 21-0 to 21-8 of the align circuit 2, respectively. On the other hand, since the output of encoder 3 is %Q0011, vector element A5 is written only to result vector register RS L -8, and then the write address is incremented. At this time, vector element A7*At+A7 is written to the other result vector registers R8L-0 to R8L-2, but since the address is not incremented, it will be rewritten in the next cycle.
第8図は、第5図に示すデコーダ641によって発生す
る情報を示す図でおる。第8図においてXの部分は圧縮
変換の動作では使用しない接続であるため、ハードウェ
アで構成しやすいように設定すればよい。上の説明にお
いて、m・に対応して電0〃の接続情報が割付けられ、
mlに対応して−1〃の接続情報が割付けられ、m2に
対応して気2〃の接続情報が割付けられ、mlに対応し
ても3〃の接続情報が割付けられていた時に、マスクビ
ットmQ t ITII HIn2 r l’nlが′
I′であるような接続情報を左側から詰めて並べて配置
し、積算値に対応してサイクリックに右シフトしたもの
が上記接続の論理である。FIG. 8 is a diagram showing information generated by the decoder 641 shown in FIG. 5. In FIG. 8, the portion indicated by X is a connection that is not used in the compression/conversion operation, so it may be set so as to be easily configured in hardware. In the above explanation, the connection information of electric 0〃 is assigned corresponding to m.
When the connection information of -1 was assigned to ml, the connection information of 2 was assigned to m2, and the connection information of 3 was assigned to ml, the mask bit mQ t ITII HIn2 r l'nl'
The above connection logic is such that the connection information such as I' is arranged side by side from the left side and cyclically shifted to the right in accordance with the integrated value.
第9図はデコーダろ41の構成例を示す回路図であシ、
第9図における気llは定数’ 1 ’を出力すること
を示す。ここで、第8図に示す論理値は第9図に示す回
路構成によって実現される。第9図はn = 4とした
場合の実施例でおって、n≠4の場合においても容易に
構成することができる。FIG. 9 is a circuit diagram showing an example of the configuration of the decoder 41.
QIll in FIG. 9 indicates that a constant '1' is output. Here, the logical values shown in FIG. 8 are realized by the circuit configuration shown in FIG. FIG. 9 shows an embodiment in which n=4, and the structure can be easily constructed even in the case where n≠4.
例えば、n = 2の時にはml)に対応した接続情報
として−Olを割付け、mlに対応した接続情報として
N1Nを割付けてマスクビットmQ、mlの内容が%l
lであるような接続情報を左から並べて配置することに
よシ圧縮変換を行い得るようにアライン回路2の接続情
報を得ることができる。For example, when n = 2, -Ol is assigned as the connection information corresponding to ml, N1N is assigned as the connection information corresponding to ml, and the mask bit mQ and the contents of ml become %l.
By arranging connection information such as 1 from the left, connection information of the align circuit 2 can be obtained so that compression conversion can be performed.
例えば、n=5の時には同様にmQに対応した接続情報
として% OIを割付け、mlに対応した接続情報とし
て亀】lを割付け、m2に対応した接続情報として・2
Nを割付け、mlに対応した接続情報として%8Nを割
付け、m4に対応した接続情報として%4〃を割付けて
同様の操作を行えば、圧縮変換を行い得るデコーダ64
1の論理が得られる。For example, when n=5, %OI is similarly assigned as the connection information corresponding to mQ, turtle]l is assigned as the connection information corresponding to ml, and 2 is assigned as the connection information corresponding to m2.
Decoder 64 that can perform compression conversion by allocating %N as connection information corresponding to ml, and %4〃 as connection information corresponding to m4 and performing the same operation.
1 logic is obtained.
第8図において、積算値Xに対応したシフタ342の出
力信号はデコーダ641からの出力信号(X=0の時の
G+6 + 6’ 1+ ω2 ’ ω* )を積算値
Xだけサイクリックに右へシフト(ライトローテート)
シたものである。この結果、タスクレジスタ31に上記
マスクデータ’ 1011 ’が格納された場合には、
積算値X−0であるため、デコーダ641の出力はωo
−0.ω1=2.ω2=8、ω3=3となってデコーダ
341は−0288’をアライン回路2に供給すること
になる。この結果、アライン回路2の各入力ポート20
−0〜20−3と各出力ボート21−0〜21−3との
間は上記のように接続され、出カポ−)21−0〜21
−8に接続された書込みデータバス2000には結果的
にベクトルエンメン)Ao 、A:; 、Aa+A3が
データとして出力される。In FIG. 8, the output signal of the shifter 342 corresponding to the integrated value Shift (Light Rotate)
It's something new. As a result, when the mask data '1011' is stored in the task register 31,
Since the integrated value is X-0, the output of the decoder 641 is ωo
-0. ω1=2. Since ω2=8 and ω3=3, the decoder 341 supplies -0288' to the align circuit 2. As a result, each input port 20 of the align circuit 2
-0 to 20-3 and each output boat 21-0 to 21-3 are connected as described above.
As a result, the vector elements)Ao, A:;, Aa+A3 are output as data to the write data bus 2000 connected to the write data bus 2000 connected to the write data bus 2000 connected to the write data bus 2000 connected to the write data bus 2000 connected to the write data bus 2000 connected to the write data bus 2000 connected to the write data bus 2000 connected to the write data bus 2000 connected to the write data bus 2000 connected to the write data bus 2000 connected to the write data bus 2000 connected to the write data bus 2000.
以上のサイクルを次々に繰シ返すことによシ、第1図に
示すような圧縮変換が正しく実行筋れることになる。By repeating the above cycle one after another, the compression conversion shown in FIG. 1 can be executed correctly.
なお、本実施例においては同時に並列処理するデータの
数(n)は主として4個として説明したが、これは一実
施例にすぎず、本発明は斯かる実施例に限定されるもの
ではない。In this embodiment, the number (n) of data to be processed in parallel is mainly four, but this is just one example, and the present invention is not limited to this example.
以上のように、本発明を採用するとベクトルデータの圧
縮変換を効率的に行うためのアライン回路および並列ベ
クトルレジスタ部に供給される制御信号を、比較的簡単
なハードウェア構成の圧縮変換制御回路により生成でき
る。As described above, when the present invention is adopted, the control signals supplied to the align circuit and parallel vector register section for efficiently compressing and converting vector data can be controlled by a compression conversion control circuit with a relatively simple hardware configuration. Can be generated.
(発明の効果)
本発明には以上説明したように、複数個のオペランドベ
クトルレジスタと複数個のリザルトベクトルレジスタと
を備えて制御することにより、効率的な圧縮変換を実行
することができるという効果がある。(Effects of the Invention) As explained above, the present invention has the advantage that efficient compression conversion can be performed by providing and controlling a plurality of operand vector registers and a plurality of result vector registers. There is.
第1図は、ベクトルエレメントの圧縮変換を説明するた
めの説明図である。
第2図は、本発明によるベクトル処理装置の一実施例を
示すブロック図である。
第8図は、第2図に示す並列ベクトルレジスタ部の詳細
を示すブロック図でめる。
第4図は、第2図に示すアライン回路の詳細を示すブロ
ック図でちる。
第5図は、第2図に示す圧縮変換制御回路の詳細を示す
ブロック図である。
第6図は、第5図に示すエンコーダの詳細を示す回路図
である。
第7図は、第5図および第6図に示すエンコーダに工っ
て得られたデータを示す図である。
第8図は、第5図に示すデコーダによって得られる情報
を示す図でろる。
第9図は、第8図に示す情報を実現するためのデコーダ
の回路構成例を示す回路図である。
1・・・並列ベクトルレジスタ部
2・・・アライン回路
6・・・圧縮変換制御回路
20−0〜20−3・・・入力ボート
21−0〜21−3・・・出力ボート
31・・・マスクレジスタ
62・・・積X回路
66・・・エンコーダ
641・・・デコーダ
342・・・レジスタ
621・・・加算器
VE−0〜VE−8・・・ベクトルレジスタ部M8に−
0−M5K−、l・・・マスクデータレジスタ
0PR−0〜0PR−1・・・オペランドベクトルレジ
スタ
T?、5L−0〜R8L−3・・・リザルトベクトルレ
ジスタ
22.1000.1300,20()0.ろ000゜6
200・・・・・信号線お工びパヌ
%計出願人 日本電気株式会社
住理人弁理士井ノロ 壽
′)v6図
χ−Oχ=I X=2 X=3
0001 1001) DI θl 00 t Oρ
00100+ θ 1 θ Oθ θ f θ θ 0
0 i 00 171θ 1 θo rooODI θ
0 θ OTODOθ 11 θθo too θ
ρ TOD θθ 10 00 θ 10θ II I
IOD OI Io 011111 T OO+DI
01 1100 (I t IQ θi+I+ 、I
0 (+11 θ θ I III0 θII θ θ
I)ll If)01ρ+I θ I I θ θ
0ITOθ OII I ootIOI OI (Oθ
θ t 1 θ θ 111+1 till θ I
IIlID +117 θ otto o θ II
1001θ III III O0ttL /flll
l I L o ITOt+ 11111 0 lll
1KIII l1lttc+ ++zl 71+11
l7111 II O1111171110OnI
lul+ 11 01++111I丁11111111
1+冨11ス・8図
χ=OX、=I X=2 X=3
me 7ffl till MS +ff# [1m
ul3 1M uJT wi dJ We +i# I
ffz 11 m dr ul y3θooo xにX
¥ XXXX XXXX XXXX600t 3XXX
XJXX XXjX XXXJρ σ TOzxXX
X2xx XX2X XXX2θ (1/I ZJX
X X2 3X XX2.! JXX 20ILり0+
XXXX+XXXXlXXXXl0 l 0 1 1j
y、X XI 3x XX13 JXXIDIto
+2xy+ Xl2X XX12 2xXIOL++
+23X × I23 JXI2 2JX1100 θ
θ X’X% X θ Yx XX(IX XXXX
600t D 3 yv X(IJX xXO33Xy
01 θ t σ ozx X X(12X XX θ
2 ZXx6’Ol t 6?3 X x 1)23
3xoZ 2JXl1MOD (+lXX X0TX
XXOI +XX01 f Ot 01JX Xl)
13 JXI71 13KOIII’0 0+2X X
DT2 2XD+ +ZX01111 0Iz5 5
θ tz 2301 r230才9図FIG. 1 is an explanatory diagram for explaining compression conversion of vector elements. FIG. 2 is a block diagram showing an embodiment of a vector processing device according to the present invention. FIG. 8 is a block diagram showing details of the parallel vector register section shown in FIG. 2. FIG. 4 is a block diagram showing details of the align circuit shown in FIG. 2. FIG. 5 is a block diagram showing details of the compression conversion control circuit shown in FIG. 2. FIG. 6 is a circuit diagram showing details of the encoder shown in FIG. 5. FIG. 7 is a diagram showing data obtained by using the encoder shown in FIGS. 5 and 6. FIG. 8 is a diagram showing information obtained by the decoder shown in FIG. 5. FIG. 9 is a circuit diagram showing an example of a circuit configuration of a decoder for realizing the information shown in FIG. 8. 1... Parallel vector register section 2... Align circuit 6... Compression conversion control circuit 20-0 to 20-3... Input port 21-0 to 21-3... Output port 31... Mask register 62... Product X circuit 66... Encoder 641... Decoder 342... Register 621... Adder VE-0 to VE-8... To vector register section M8
0-M5K-, l...Mask data register 0PR-0 to 0PR-1... Operand vector register T? , 5L-0 to R8L-3... Result vector register 22.1000.1300, 20()0. Ro000゜6
200...Signal line machining PANU% meter Applicant: NEC Co., Ltd. Patent attorney Hisashi Inoro') v6 diagram χ-Oχ=I X=2 X=3 0001 1001) DI θl 00 t Oρ
00100+ θ 1 θ Oθ θ f θ θ 0
0 i 00 171θ 1 θo rooODI θ
0 θ OTODOθ 11 θθo too θ
ρ TOD θθ 10 00 θ 10θ II I
IOD OI Io 011111 T OO+DI
01 1100 (I t IQ θi+I+ , I
0 (+11 θ θ I III0 θII θ θ
I)ll If)01ρ+I θ I I θ θ
0ITOθ OII I ootIOI OI (Oθ
θ t 1 θ θ 111+1 till θ I
IIIID +117 θ otto o θ II
1001θ III III O0ttL /fllll
l I L o ITOt+ 11111 0 lll
1KIII l1lttc+ ++zl 71+11
l7111 II O1111171110OnI
lul+ 11 01++111I-d11111111
1+Full 11th・8Figure χ=OX,=I X=2 X=3 me 7ffl till MS +ff# [1m
ul3 1M uJT wi dJ We +i# I
ffz 11 m dr ul y3θooo x to X
¥ XXXX XXXX XXXX600t 3XXX
XJXX XXjX XXXJρ σ TOzxXX
X2xx XX2X XXX2θ (1/I ZJX
X X2 3X XX2. ! JXX 20IL 0+
XXXX+XXXXlXXXXl0 l 0 1 1j
y, X XI 3x XX13 JXXIDIto
+2xy+ Xl2X XX12 2xXIOL++
+23X × I23 JXI2 2JX1100 θ
θ X'X% X θ Yx XX(IX XXXXX
600t D 3 yv X (IJX xXO33Xy
01 θ t σ ozx X X (12X XX θ
2 ZXx6'Olt 6?3 X x 1) 23
3xoZ 2JXl1MOD (+lXX X0TX
XXOI +XX01 f Ot 01JX Xl)
13 JXI71 13KOIII'0 0+2X X
DT2 2XD+ +ZX01111 0Iz5 5
θ tz 2301 r230 years old 9 figures
Claims (1)
エレメントを読出すためのオペランドベクトル7972
手段と、前記1サイクル中に前記同一ベクトルに属する
前記複数個のベクトルエレメントを書込むためのリザル
トベクトルレジスタ手段と、前記オペランドベクトルレ
ジスタ手段および前記リザルトベクトルレジスタ手段の
各要素に対応し、前記lサイクル中に前記複数個のマス
クエレメントを読出すためのマスクデータレジヌタ手段
と、前記オペランドベクトルレジスタ手段から前記複数
個のベクトルエンメントを読出すための読出しデータバ
ス手段と、前記リザルトベクトルレジスタ手段に前記複
数個のベクトルエレメントを書込むための書込みデータ
バス手段と、前記読出しデータバス手段と前記書込みデ
ータバス手段とを選択的に接続するためのアライン回路
手段と、前記読出しデータバス手段を通して読出された
前記マスクエレメントの−11の数を積算するための積
算回路手段と、前記積算回路手段から得られた積算値と
前記読出されたマスクエレメントとによシ、前記リザル
トベクトルレジスタ手段に対する書込みアドレス歩進信
号を生成するためのエンコーダ手段と、前記読出された
マスクエレメントと前記積算値とによって前記アライン
回路手段への接続制御信号を生成するだめのテコーダ手
段とを具備してベクトル圧縮変換を行うように構成した
ことを特徴とするベクトル処理装置。Operand vector 7972 for reading multiple vector elements belonging to the same vector in one cycle
means, result vector register means for writing the plurality of vector elements belonging to the same vector during one cycle, corresponding to each element of the operand vector register means and the result vector register means, mask data register means for reading said plurality of mask elements during a cycle; read data bus means for reading said plurality of vector elements from said operand vector register means; and said result vector register means. write data bus means for writing said plurality of vector elements to said plurality of vector elements; align circuit means for selectively connecting said read data bus means and said write data bus means; an accumulation circuit means for accumulating -11 of the mask elements that have been read, and a write address for the result vector register means based on the accumulation value obtained from the accumulation circuit means and the read mask element; Vector compression conversion is performed by comprising an encoder means for generating a step signal and a decoder means for generating a connection control signal to the align circuit means based on the read mask element and the integrated value. A vector processing device characterized by being configured as follows.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP12014284A JPS60263268A (en) | 1984-06-12 | 1984-06-12 | Vector processor |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP12014284A JPS60263268A (en) | 1984-06-12 | 1984-06-12 | Vector processor |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS60263268A true JPS60263268A (en) | 1985-12-26 |
| JPH0325822B2 JPH0325822B2 (en) | 1991-04-09 |
Family
ID=14779001
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP12014284A Granted JPS60263268A (en) | 1984-06-12 | 1984-06-12 | Vector processor |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS60263268A (en) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4811213A (en) * | 1985-10-11 | 1989-03-07 | Hitachi, Ltd. | Vector processor with vector registers |
| JPH0330064A (en) * | 1989-06-27 | 1991-02-08 | Koufu Nippon Denki Kk | Vector data processor |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5696369A (en) * | 1979-12-28 | 1981-08-04 | Fujitsu Ltd | Vector element conversion processing system |
| JPS57209570A (en) * | 1981-06-19 | 1982-12-22 | Fujitsu Ltd | Vector processing device |
-
1984
- 1984-06-12 JP JP12014284A patent/JPS60263268A/en active Granted
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5696369A (en) * | 1979-12-28 | 1981-08-04 | Fujitsu Ltd | Vector element conversion processing system |
| JPS57209570A (en) * | 1981-06-19 | 1982-12-22 | Fujitsu Ltd | Vector processing device |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4811213A (en) * | 1985-10-11 | 1989-03-07 | Hitachi, Ltd. | Vector processor with vector registers |
| JPH0330064A (en) * | 1989-06-27 | 1991-02-08 | Koufu Nippon Denki Kk | Vector data processor |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0325822B2 (en) | 1991-04-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US3988717A (en) | General purpose computer or logic chip and system | |
| US5555429A (en) | Multiport RAM based multiprocessor | |
| JPS628817B2 (en) | ||
| US4071905A (en) | Full adder/subtractor circuit employing exclusive OR logic | |
| JPH0877002A (en) | Parallel processor device | |
| US4503511A (en) | Computing system with multifunctional arithmetic logic unit in single integrated circuit | |
| US3997771A (en) | Apparatus and method for performing an arithmetic operation and multibit shift | |
| JPS59226923A (en) | Bus interface apparatus | |
| JPS60136870A (en) | vector processing device | |
| JPS60263268A (en) | Vector processor | |
| JPH08123769A (en) | Parallel processor | |
| US3564227A (en) | Computer and accumulator therefor incorporating push down register | |
| US3604909A (en) | Modular unit for digital arithmetic systems | |
| JPS59114677A (en) | vector processing device | |
| US4723258A (en) | Counter circuit | |
| US3207888A (en) | Electronic circuit for complementing binary coded decimal numbers | |
| US4323978A (en) | Arithmetic element based on the DDA principle | |
| US3395271A (en) | Arithmetic unit for digital computers | |
| SU1399726A1 (en) | Parallel counter-type adder | |
| JP2922963B2 (en) | Sequence controller | |
| SU1300641A1 (en) | Device for converting binary-coded decimal code to binary code | |
| US3674997A (en) | Right shifting system with data stored in polish stack form | |
| JPS6250928A (en) | Series multiplication of fixed coefficient and digital circuit thereof | |
| JPS6083176A (en) | Vector processor | |
| JPH0310138B2 (en) |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |