JPH0256027A - Parallel processing system for digital signal processor - Google Patents

Parallel processing system for digital signal processor

Info

Publication number
JPH0256027A
JPH0256027A JP20677388A JP20677388A JPH0256027A JP H0256027 A JPH0256027 A JP H0256027A JP 20677388 A JP20677388 A JP 20677388A JP 20677388 A JP20677388 A JP 20677388A JP H0256027 A JPH0256027 A JP H0256027A
Authority
JP
Japan
Prior art keywords
data
instruction
transfer
storage
cycles
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP20677388A
Other languages
Japanese (ja)
Inventor
Noboru Kobayashi
登 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP20677388A priority Critical patent/JPH0256027A/en
Publication of JPH0256027A publication Critical patent/JPH0256027A/en
Pending legal-status Critical Current

Links

Landscapes

  • Advance Control (AREA)

Abstract

PURPOSE:To enhance the efficiency of the parallel property, to execute other processing during the waiting time and to improve the throughput of the whole by executing independently a transfer and a control of an arithmetic instruction, while holding the causality of the transfer of data and the arithmetic instruction. CONSTITUTION:In the case of transferring simultaneously a dividing instruction (FDV), and a result of operation to a D register connected to an output of an ALU, an arithmetic instruction of the FDV, and the transfer of a result of operation of the FDV are executed by 27 cycles in an IR21 and by one cycle in an IR18, respectively, and as for the IR21, the instruction is held during the cycle, but as for the IR18, said instruction is held only during one cycle. In the remaining 26 cycles, a transfer instruction which is not related to a result of operation and a value of the operation can be executed. In the case of a conventional example, the transfer instruction which can be compounded with the dividing instruction is only one, but according to this invention, as long as the instruction is ended during 27 cycles, its number is not limited.

Description

【発明の詳細な説明】 〔概 要〕 ディジタルシグナルプロセッサの真速動作を実現する並
列処理方式に関し、 データの転送と演算命令の因果律を保ちつつ、並列性の
効率を上げるディジタルシグナルプロセッサの並列処理
方式を提供することを目的とし、ランダムアクセスメモ
リを有するディジタルシグナルプロセッサのプログラム
シーケンスを制御するシーケンス制御部であって、所定
のプログラム命令を表すデータを入力してデータを−時
記憶し、データをランダムアクセスメモリに記憶するた
めのアドレスを決める第1の記憶回路と、第1の記憶回
路に接続、され、第1の記憶回路に一時記憶したデータ
をデコーダの出力のタイミング信号により読み出し、て
−時記憶する第2の記憶回路と、第1及び第2の記憶回
路に接続され、第1及び第2の記憶回路に一時記憶した
データを読み出して、データの内容を解読し、データの
実行サイクル数を決定するデコーダとを有する回路にお
いて、第1の記憶回路に接続され、第1の記憶回路の出
力の所定のビット数に分割したデータを入力し一時記憶
する第3の記憶手段と、第1及び第3の記憶手段に接続
され、第1及び第3の記憶手段に一時記憶したデータを
読み出して、データの内容を解読し、データの実行サイ
クル数を決定する第2のデコーダとを付加して構成する
[Detailed Description of the Invention] [Summary] Parallel processing of digital signal processors that improves the efficiency of parallelism while maintaining the causality of data transfer and arithmetic instructions, regarding a parallel processing method that realizes true high-speed operation of digital signal processors. A sequence control unit for controlling a program sequence of a digital signal processor having a random access memory, the sequence control unit for controlling a program sequence of a digital signal processor having a random access memory, the sequence control unit inputting data representing a predetermined program instruction, storing the data at times, and A first storage circuit that determines an address to be stored in the random access memory; A second memory circuit is connected to the first and second memory circuits to store the data temporarily, reads the data temporarily stored in the first and second memory circuits, decodes the data contents, and executes the data execution cycle. a decoder for determining the number of bits; a third storage means connected to the first storage circuit for inputting and temporarily storing data obtained by dividing the output of the first storage circuit into a predetermined number of bits; a second decoder that is connected to the first and third storage means, reads out the data temporarily stored in the first and third storage means, decodes the contents of the data, and determines the number of execution cycles of the data; and configure.

〔産業上の利用分野〕[Industrial application field]

本発明は、ディジタルシグナルプロセッサ(以下DSP
と称する)の高速動作を実現する並列処理方式に関する
ものである。
The present invention is a digital signal processor (hereinafter referred to as DSP).
This paper relates to a parallel processing method that realizes high-speed operation.

この際、データの転送と演算命令の因果律を保ちつつ、
並列性の効率を上げるDSPの並列処理方式が要望され
ている。
At this time, while maintaining the causality of data transfer and calculation instructions,
There is a need for a DSP parallel processing method that increases the efficiency of parallelism.

〔従来の技術〕[Conventional technology]

第4図は一例のDSPの構成を示すブロック図である。 FIG. 4 is a block diagram showing the configuration of an example DSP.

第5図は従来例の回路の構成を示すブロック図である。FIG. 5 is a block diagram showing the configuration of a conventional circuit.

第6図は従来例の動作を説明するタイムチャートである
FIG. 6 is a time chart explaining the operation of the conventional example.

第4図に示すように、一般にDSP 6は、入力された
データを記憶するRAM 3、データの演算を行うAL
U 4、データの読み出し/書き込みのアドレスを発生
するアドレス発生部2、データの入出力を行う入出力部
5及びシーケンスを制御するシーケンス制御部1からな
る。
As shown in FIG. 4, the DSP 6 generally includes a RAM 3 for storing input data, and an AL for calculating data.
4, an address generator 2 that generates addresses for reading/writing data, an input/output unit 5 that inputs and outputs data, and a sequence controller 1 that controls sequences.

第5図は第4図に示すシーケンス制御部1を詳細に記述
した図である。同図において、プログラムカウンタ(以
下PCと称する)7により指示されたアドレスを示す信
号がROM 8に入力され、ROM8から対応するアド
レスに記憶したプログラム命令を表すデータが読み出さ
れる。上記データは命令レジスタ(以下IRと称する)
9に一時記憶され、第4図に示すI?AM 3に記憶す
るためのアドレスが予め計算により求められる。(ルッ
クアヘッドデコード)。
FIG. 5 is a diagram illustrating in detail the sequence control section 1 shown in FIG. 4. In the figure, a signal indicating an address designated by a program counter (hereinafter referred to as PC) 7 is input to a ROM 8, and data representing a program instruction stored at a corresponding address is read from the ROM 8. The above data is the instruction register (hereinafter referred to as IR)
9 and is temporarily stored in I?9 as shown in FIG. The address for storing in AM 3 is calculated in advance. (Lookahead decoding).

データはIRQから読み出され、IRIOに入力され一
時記憶されると共に、デコーダ(以下DECと称する)
11にも入力される。DHCIIからのタイミング信号
により、IRIOから読み出されたデータはDEC11
に入力され、DEC11においてIRQ及びIRIOか
らの入力データがそれぞれ別個に解読される。
Data is read from IRQ, input to IRIO, temporarily stored, and decoder (hereinafter referred to as DEC)
11 is also input. The data read from IRIO is transferred to DEC11 by the timing signal from DHCII.
The DEC 11 decodes the input data from IRQ and IRIO separately.

又、命令を表すデータの内容によってサイルク数が変わ
るので、サイクル制御部(以下CYCと称する) 12
により命令データの実行サイクル数を決定する。
In addition, since the number of cycles changes depending on the content of data representing an instruction, the cycle control unit (hereinafter referred to as CYC) 12
The number of execution cycles of instruction data is determined by

第6図に示すPCのある1サイクルにおいて、例えばn
番目のアドレスを示す信号を出力したとすると、IRQ
において次の1サイクルで、ROM 8のn番目のアド
レスに記憶したデータを読み出して一時記憶し、かつ、
RAM 3に記憶するためのアドレスを予め計算により
求める。そして結果をIRIO及びDECIIにそれぞ
れ入力し、いわゆるパイプライン処理を行う。
In one cycle of the PC shown in FIG. 6, for example, n
If a signal indicating the th address is output, IRQ
In the next cycle, the data stored in the nth address of ROM 8 is read out and temporarily stored, and
The address for storing in RAM 3 is calculated in advance. The results are then input to IRIO and DECII, respectively, to perform so-called pipeline processing.

次に続くサイクルでDEC11において、例えば除算(
FDν)の制御命令を解読する。この場合、データの転
送は最後の1サイクルで行われる。
In the next cycle, the DEC 11 performs, for example, division (
FDv) control command is decoded. In this case, data transfer is performed in the last cycle.

〔発明が解決しようとする課題] しかしながら上述の回路において、DSPの命令は転送
(データの単なる移動)と演算命令(A+B、A)kB
などの命令)が同時に行われる。転送、演算命令の大部
分は1サイクルで行われるが、除算命令のように27サ
イクル程度も必要となるものがある。この場合、除算命
令と同時に行われる転送も27サイクル必要であるかの
ように動作する。
[Problems to be Solved by the Invention] However, in the above circuit, the DSP instructions are transfer (mere movement of data) and operation instruction (A+B, A) kB.
commands) are executed at the same time. Most transfer and arithmetic instructions are executed in one cycle, but some, such as division instructions, require as many as 27 cycles. In this case, the transfer performed simultaneously with the division instruction also operates as if it required 27 cycles.

したがって、並列に命令は実行されるもののスループッ
トが大幅に下がってしまうという問題点があった・ したがって本発明の目的は、データの転送と演算命令の
因果律を保ちつつ、並列性の効率を上げるDSPの並列
処理方式を提供することにある。
Therefore, although instructions are executed in parallel, the throughput is significantly reduced. Therefore, the purpose of the present invention is to improve the efficiency of parallelism while maintaining the causality of data transfer and operation instructions. The purpose of this invention is to provide a parallel processing method.

上記問題点は第1図に示す回路構成によって解決される
The above problem is solved by the circuit configuration shown in FIG.

即ち第1図において、ランダムアクセスメモリを有する
ディジタルシグナルプロセッサのプログラムシーケンス
を制御するシーケンス制御部であって、所定めプログラ
ム命令を表すデータを入力してデータを一時記憶し、デ
ータをランダムアクセスメモリに記憶するためのアドレ
スを決める第1の記憶回路と、第1の記憶回路に接続さ
れ、第1の記憶回路に一時記憶したデータをデコーダの
出力のタイミング信号により読み出して一時記憶する第
2の記憶回路と、第1及び第2の記憶回路に接続され、
第1及び第2の記憶回路に一時記憶したデータを読み出
して、データの内容を解読し、データの実行サイクル数
を決定するデコーダとを有する回路において、210は
 第1の記憶回路に接続され、第1の記憶回路の出力の
所定のビット数に分割したデータを入力し一時記憶する
第3の記憶手段である。
That is, in FIG. 1, there is shown a sequence control unit that controls the program sequence of a digital signal processor having a random access memory, which inputs data representing a predetermined program command, temporarily stores the data, and stores the data in the random access memory. a first memory circuit that determines an address for storage; and a second memory that is connected to the first memory circuit and reads out and temporarily stores data temporarily stored in the first memory circuit using a timing signal output from a decoder. connected to the circuit and the first and second storage circuits;
210 is connected to the first storage circuit, and has a decoder that reads data temporarily stored in the first and second storage circuits, decodes the contents of the data, and determines the number of execution cycles of the data; This is a third storage means for inputting and temporarily storing data obtained by dividing the output of the first storage circuit into a predetermined number of bits.

220は第1及び第3の記憶手段に接続され、第1及び
第3の記憶手段に一時記憶したデータを読み出して、デ
ータの内容を解読し、データの実行サイクル数を決定す
る第2のデコーダである。上記210.220を付加し
て構成する。
220 is a second decoder connected to the first and third storage means, which reads out the data temporarily stored in the first and third storage means, decodes the contents of the data, and determines the number of execution cycles of the data. It is. Configure by adding the above 210.220.

〔作 用〕[For production]

第1図において、第3の記憶手段210において第1の
記憶回路の出力の所定のビット数に分割したデータの一
方を入力し一時記憶する。
In FIG. 1, one side of the data divided into a predetermined number of bits of the output of the first storage circuit is input and temporarily stored in the third storage means 210.

第2のデコーダ220において、第1及び第3の記憶手
段に一時記憶したデータを読み出して、データの内容を
解読し、データの実行サイクル数を決定する。そして対
応する制御信号を出力する。
The second decoder 220 reads out the data temporarily stored in the first and third storage means, decodes the contents of the data, and determines the number of execution cycles of the data. Then, a corresponding control signal is output.

一方、第2の記憶回路180において、上記分割したデ
ータの他方を入力し一時記憶する。そしてデコーダ19
0において、第1及び第2の記憶回路に一時記憶したデ
ータを読み出して、データの内容を解読し、データの実
行サイクル数を決定する。
On the other hand, in the second storage circuit 180, the other of the divided data is input and temporarily stored. and decoder 19
0, the data temporarily stored in the first and second storage circuits is read out, the contents of the data are decoded, and the number of execution cycles of the data is determined.

そして対応する制御信号を出力する。Then, a corresponding control signal is output.

そして、例えば除算命令のように27サイクル程度も必
要となる命令を実行する場合、第3の記憶手段210、
第2のデコーダ220において命令の演算を行い、演算
以外の転送等の命令を第2の記憶回路180、デコーダ
190において行うようにする。
For example, when executing an instruction that requires about 27 cycles, such as a division instruction, the third storage means 210,
The second decoder 220 performs calculations of instructions, and the second storage circuit 180 and decoder 190 perform instructions other than calculations, such as transfer.

この結果、データの転送と演算命令の因果律を保ちつつ
転送と演算命令の制御を独立させることにより、スルー
プットを向上させることができる。
As a result, throughput can be improved by making data transfer and control of arithmetic instructions independent while maintaining causality between data transfer and arithmetic instructions.

〔実施例〕〔Example〕

第2図は本発明の実施例の回路の構成を示すブロック図
である。
FIG. 2 is a block diagram showing the configuration of a circuit according to an embodiment of the present invention.

第3図は実施例の動作を説明するタイムチャートである
FIG. 3 is a time chart explaining the operation of the embodiment.

企図を通じて同一符号は同一対象物を示す。The same reference numerals refer to the same objects throughout the design.

第2図に示すように本発明が従来例と異なる点は、従来
例に対してlR21,DEC22及びCYC23を付加
したことにある。
As shown in FIG. 2, the present invention differs from the conventional example in that lR21, DEC22, and CYC23 are added to the conventional example.

第3図は除算命令(FDv)(27サイクル)ト、AL
Uの出力に接続されたDレジスタ(図示しない)への演
算結果の転送を同時に行う場合を示している。
Figure 3 shows the division instruction (FDv) (27 cycles), AL
This shows a case in which calculation results are simultaneously transferred to a D register (not shown) connected to the output of U.

FDVの演算命令はlR21において27サイクル、P
DVの演算結果の転送はlR18においてlサイクルで
行われ、lR21は27サイクルの間命令が保持される
が、lR18は1サイクルのみ保持される。残りの26
サイクルでは、演算結果や演算の値に関係しない転送命
令を実行することができる。
The FDV operation instruction takes 27 cycles in lR21, P
Transfer of the DV operation result is performed in lR18 in l cycles, lR21 holds the instruction for 27 cycles, but lR18 holds only one cycle. remaining 26
In a cycle, a transfer instruction that is not related to the operation result or the value of the operation can be executed.

従来例では除算命令に複合できる転送命令は1つに限ら
れていたが、本発明では27サイクルの間に終了すれば
数の制限はない。(≦27)。
In the conventional example, the number of transfer instructions that can be combined with a division instruction is limited to one, but in the present invention, there is no limit to the number as long as the transfer instruction is completed within 27 cycles. (≦27).

この結果、演算で長いサイクルを必要とする場合、その
待ち時間に行ってもよい転送や他の処理を行うことによ
り、全体のスループントを向上させることができる。
As a result, when a calculation requires a long cycle, the overall throughput can be improved by performing transfer or other processing that may be performed during the waiting time.

〔発明の効果〕〔Effect of the invention〕

以上説明したように本発明によれば、データの転送と演
算命令の因果律を保ちつつ転送と演算命令の制御を独立
させることにより、スルーブツトを向上させることがで
きる。
As described above, according to the present invention, throughput can be improved by making the control of data transfer and arithmetic instructions independent while maintaining the causality between data transfer and arithmetic instructions.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の原理図、 第2図は本発明の実施例の回路の構成を示すブロック図
、 第3図は実施例の動作を説明するタイムチャート、 第4図は一例のospの構成を示すブロック図、第5図
は従来例の回路の構成を示すブロック図、第6図は従来
例の動作を説明するタイムチャートである。 図において 210は第3の記憶手段、220は第2のデコーダ辛ザ
た1月の芙方セづダリの回予6ZL凹1入゛ン示すプロ
・ノフの勇ら  2   図 条仝シ日月(7)原理g 牛 1 日 −45’) (7)T)S F cy:、 *R’にホ
すフ゛ロー/2Q千  4 Z
Fig. 1 is a principle diagram of the present invention, Fig. 2 is a block diagram showing the circuit configuration of an embodiment of the invention, Fig. 3 is a time chart explaining the operation of the embodiment, and Fig. 4 is an example of an OSP. FIG. 5 is a block diagram showing the configuration of a conventional circuit, and FIG. 6 is a time chart illustrating the operation of the conventional example. In the figure, 210 is the third storage means, and 220 is the second decoder. (7) Principle g Cow 1 day - 45') (7) T) SF cy:, *Follow following R'/2Q thousand 4 Z

Claims (1)

【特許請求の範囲】[Claims] ランダムアクセスメモリを有するディジタルシグナルプ
ロセッサのプログラムシーケンスを制御するシーケンス
制御部であって、所定のプログラム命令を表すデータを
入力して該データを一時記憶し、該データをランダムア
クセスメモリに記憶するためのアドレスを決める第1の
記憶回路(170)と、該第1の記憶回路に接続され、
該第1の記憶回路に一時記憶した該データをデコーダ(
190)の出力のタイミング信号により読み出して一時
記憶する第2の記憶回路(180)と、該第1及び第2
の記憶回路に接続され、該第1及び第2の記憶回路に一
時記憶したデータを読み出して、該データの内容を解読
し、該データの実行サイクル数を決定するデコーダ(1
90)とを有する回路において、該第1の記憶回路に接
続され、該第1の記憶回路の出力の所定のビット数に分
割したデータを入力し一時記憶する第3の記憶手段(2
10)と、該第1及び第3の記憶手段に接続され、該第
1及び第3の記憶手段に一時記憶したデータを読み出し
て、該データの内容を解読し、該データの実行サイクル
数を決定する第2のデコーダ(220)とを付加したこ
とを特徴とするディジタルシグナルプロセッサの並列処
理方式。
A sequence control section for controlling a program sequence of a digital signal processor having a random access memory, the sequence control section for inputting data representing a predetermined program instruction, temporarily storing the data, and storing the data in the random access memory. a first memory circuit (170) for determining an address; connected to the first memory circuit;
A decoder (
190), a second storage circuit (180) that reads and temporarily stores the data according to the timing signal of the output of the first and second storage circuits (180);
a decoder (1) connected to the first and second storage circuits, reads the data temporarily stored in the first and second storage circuits, decodes the contents of the data, and determines the number of execution cycles of the data;
90), the third storage means (2) is connected to the first storage circuit and inputs and temporarily stores data obtained by dividing the output of the first storage circuit into a predetermined number of bits.
10) is connected to the first and third storage means, reads out the data temporarily stored in the first and third storage means, decodes the contents of the data, and calculates the number of execution cycles of the data. 1. A parallel processing method for a digital signal processor, characterized in that a second decoder (220) is added.
JP20677388A 1988-08-20 1988-08-20 Parallel processing system for digital signal processor Pending JPH0256027A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20677388A JPH0256027A (en) 1988-08-20 1988-08-20 Parallel processing system for digital signal processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20677388A JPH0256027A (en) 1988-08-20 1988-08-20 Parallel processing system for digital signal processor

Publications (1)

Publication Number Publication Date
JPH0256027A true JPH0256027A (en) 1990-02-26

Family

ID=16528850

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20677388A Pending JPH0256027A (en) 1988-08-20 1988-08-20 Parallel processing system for digital signal processor

Country Status (1)

Country Link
JP (1) JPH0256027A (en)

Similar Documents

Publication Publication Date Title
US4539635A (en) Pipelined digital processor arranged for conditional operation
US4954947A (en) Instruction processor for processing branch instruction at high speed
US5390306A (en) Pipeline processing system and microprocessor using the system
JPH0256027A (en) Parallel processing system for digital signal processor
JPH0218729B2 (en)
JPH0353322A (en) Information processor
JP3124361B2 (en) Memory data loading device
JP2819733B2 (en) Information processing device
JPS6049935B2 (en) Microprogram control method
JP2522563B2 (en) Programmable controller
JP2522564B2 (en) Programmable controller
JPH01147723A (en) Pipe line processing system for information processor
JPS61100836A (en) System for processing comparison and instruction of moving instruction logic
JPH03232019A (en) Information processor
JPH05204638A (en) Pipeline processor
JPS5971542A (en) Arithmetic processor
JPS6028014B2 (en) microprocessor
JPH04353927A (en) Micro processor
JPH05241825A (en) Microprocessor
JPH0319570B2 (en)
JPS62269235A (en) Information processor
JPS63245526A (en) Information processor
JPH02161525A (en) Arithmetic processor
JPH01241644A (en) Microcomputer control circuit
JPS63197233A (en) Information processor