JPH064690A - リニアアレイ型の並列dspプロセッサ - Google Patents
リニアアレイ型の並列dspプロセッサInfo
- Publication number
- JPH064690A JPH064690A JP15936192A JP15936192A JPH064690A JP H064690 A JPH064690 A JP H064690A JP 15936192 A JP15936192 A JP 15936192A JP 15936192 A JP15936192 A JP 15936192A JP H064690 A JPH064690 A JP H064690A
- Authority
- JP
- Japan
- Prior art keywords
- section
- data
- processor
- output
- linear array
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Processing (AREA)
Abstract
(57)【要約】
【目的】 演算処理を高速にすると共に、ハードウェア
は共通部分を節約する。 【構成】 従来の構成のプロセッサの入力SAM部、デ
ータメモリA部、ALUアレイ部、データメモリB部、
出力SAM部の並びを、入力SAM部と出力SAM部を
兼ねた入出力SAM部1と、データメモリA部とデータ
メモリB部を兼ねたデータメモリ部2と、ALUアレイ
部3の3つの部分の構成に変え、そしてALUアレイ部
を下端として並べたものである。
は共通部分を節約する。 【構成】 従来の構成のプロセッサの入力SAM部、デ
ータメモリA部、ALUアレイ部、データメモリB部、
出力SAM部の並びを、入力SAM部と出力SAM部を
兼ねた入出力SAM部1と、データメモリA部とデータ
メモリB部を兼ねたデータメモリ部2と、ALUアレイ
部3の3つの部分の構成に変え、そしてALUアレイ部
を下端として並べたものである。
Description
【0001】
【産業上の利用分野】本発明は、テレビなどの映像信号
をソフトウェアプログラムでディジタル信号処理するた
めの、SIMD制御のプログラマブルなリニアアレイ型
プロセッサの構成に関するもので、特にその処理の冗長
性を省き、フレキシビリティを向上させるための技術に
関するものである。
をソフトウェアプログラムでディジタル信号処理するた
めの、SIMD制御のプログラマブルなリニアアレイ型
プロセッサの構成に関するもので、特にその処理の冗長
性を省き、フレキシビリティを向上させるための技術に
関するものである。
【0002】
【従来の技術】従来技術として、テレビなどの映像信号
のディジタル信号処理をプログラマブルに実現するプロ
セッサの構成として、SIMD制御のリニアアレイ型プ
ロセッサがある(例えば、JIM CHILDERS,et al "SVP:SE
RIAL VIDEO PROCESSSOR" IEEE1990 CUSTOM INTEGRATED
CIRCUITS CONFERENCE 17.3 )。
のディジタル信号処理をプログラマブルに実現するプロ
セッサの構成として、SIMD制御のリニアアレイ型プ
ロセッサがある(例えば、JIM CHILDERS,et al "SVP:SE
RIAL VIDEO PROCESSSOR" IEEE1990 CUSTOM INTEGRATED
CIRCUITS CONFERENCE 17.3 )。
【0003】このプロセッサは、図6のように1ビット
ALUによる演算アレイをVRAMに組み込んだ形にな
っている。以下この図6から説明する。
ALUによる演算アレイをVRAMに組み込んだ形にな
っている。以下この図6から説明する。
【0004】このプロセッサは、大きくは、入力SAM
(シリアルアクセスメモリ)部、データメモリA部、A
LUアレイ部、データメモリB部、出力SAM部、プロ
グラム制御部などに分けられる。
(シリアルアクセスメモリ)部、データメモリA部、A
LUアレイ部、データメモリB部、出力SAM部、プロ
グラム制御部などに分けられる。
【0005】プログラム制御部にはプログラムメモリと
そのシーケンス制御回路がある。また入力SAM部、デ
ータメモリA部、ALUアレイ部、データメモリB部、
出力SAM部は、全体でリニアアレイ(直線配列)型の
多数並列化したプロセッサエレメント群を構成してお
り、プログラム制御部内にある、共通の一つのプログラ
ム制御部により連動してSIMD制御される。
そのシーケンス制御回路がある。また入力SAM部、デ
ータメモリA部、ALUアレイ部、データメモリB部、
出力SAM部は、全体でリニアアレイ(直線配列)型の
多数並列化したプロセッサエレメント群を構成してお
り、プログラム制御部内にある、共通の一つのプログラ
ム制御部により連動してSIMD制御される。
【0006】なお入力SAM部、データメモリA部、デ
ータメモリB部、出力SAM部は、基本的にメモリであ
り、それらのメモリのためのROWアドレスデコード
は、詳細に説明しないが、図6においては、このプログ
ラム制御部に含まれているものとして以下説明する。
ータメモリB部、出力SAM部は、基本的にメモリであ
り、それらのメモリのためのROWアドレスデコード
は、詳細に説明しないが、図6においては、このプログ
ラム制御部に含まれているものとして以下説明する。
【0007】多数並列化されたプロセッサエレメントの
単一エレメントは、図6で斜線で示したような縦の細長
い範囲であり、これが図で横方向に直線配列で並んでい
る。即ち、ひとつのプロセッサエレメントを構成するの
に必要な、ごく一般的な図7のようなプロセッサの構成
を、図6の斜線で示した縦の細長いプロセッサエレメン
トがそれぞれ実現している。
単一エレメントは、図6で斜線で示したような縦の細長
い範囲であり、これが図で横方向に直線配列で並んでい
る。即ち、ひとつのプロセッサエレメントを構成するの
に必要な、ごく一般的な図7のようなプロセッサの構成
を、図6の斜線で示した縦の細長いプロセッサエレメン
トがそれぞれ実現している。
【0008】入力バッファメモリ(IQ)に相当するの
が入力SAM部である。出力バッファメモリ(OQ)に
相当するのが出力SAM部である。第1のデータメモリ
(RFB)に相当するのがデータメモリB部である。第
2のデータメモリ(RFA)に相当するのがデータメモ
リA部である。第1のデータメモリと第2のデータメモ
リのデータを、必要に応じて選んで演算するためのセレ
クタ(SEL)及びALUに相当するのが、ALUアレ
イ部である。
が入力SAM部である。出力バッファメモリ(OQ)に
相当するのが出力SAM部である。第1のデータメモリ
(RFB)に相当するのがデータメモリB部である。第
2のデータメモリ(RFA)に相当するのがデータメモ
リA部である。第1のデータメモリと第2のデータメモ
リのデータを、必要に応じて選んで演算するためのセレ
クタ(SEL)及びALUに相当するのが、ALUアレ
イ部である。
【0009】このプロセッサエレメントの普通のプロセ
ッサとの違いは、普通のプロセッサではそのハードウェ
アはワードプロセッサであり、ワードを単位として処理
するが、このプロセッサの場合はそのハードウェアはビ
ットプロセッサであり、ビットを単位として処理する点
である。ビットプロセッサはハードウェアが小さく、普
通には実現できない程多数の並列数を実現できる。なお
プロセッサエレメントの直線配列の並列数は、映像信号
の一水平走査期間の画素数(H)に一致させる。
ッサとの違いは、普通のプロセッサではそのハードウェ
アはワードプロセッサであり、ワードを単位として処理
するが、このプロセッサの場合はそのハードウェアはビ
ットプロセッサであり、ビットを単位として処理する点
である。ビットプロセッサはハードウェアが小さく、普
通には実現できない程多数の並列数を実現できる。なお
プロセッサエレメントの直線配列の並列数は、映像信号
の一水平走査期間の画素数(H)に一致させる。
【0010】更にこのプロセッサエレメントの構造は、
図8のように概略書くことができる。入力SAM部の一
つのプロセッサエレメント分は、入力ポインタからの制
御を受ける縦に並んだ複数の入力SAMセルである。入
力SAMセルは図6の入力ビット数分(ISB)縦に並
べて用意されるのだが、図8ではそれを省略して一つだ
け代表して表示している。
図8のように概略書くことができる。入力SAM部の一
つのプロセッサエレメント分は、入力ポインタからの制
御を受ける縦に並んだ複数の入力SAMセルである。入
力SAMセルは図6の入力ビット数分(ISB)縦に並
べて用意されるのだが、図8ではそれを省略して一つだ
け代表して表示している。
【0011】データメモリA部の一つのプロセッサエレ
メント分は、図8におけるメモリAセルを、図6のMA
Bのビット数分用意されて縦に並んでいるのだが、図8
ではそれを省略して一つだけ代表して表示している。
メント分は、図8におけるメモリAセルを、図6のMA
Bのビット数分用意されて縦に並んでいるのだが、図8
ではそれを省略して一つだけ代表して表示している。
【0012】ALUアレイ部の一つのプロセッサエレメ
ント分は、図8におけるALUセルである。ここでAL
Uセル中の本当のALU部分は1ビットALUであり、
全加算器(フルアダー)程度のものである。またALU
セル中のセレクタ(SEL)は、1ビットALUの入力
選択のためのものであり、図中の複数のX印で示すバス
との交点のうちの一つのバスからのデータを選択する。
なおFFはフリップフロップ(1ビットレジスタ)であ
る。
ント分は、図8におけるALUセルである。ここでAL
Uセル中の本当のALU部分は1ビットALUであり、
全加算器(フルアダー)程度のものである。またALU
セル中のセレクタ(SEL)は、1ビットALUの入力
選択のためのものであり、図中の複数のX印で示すバス
との交点のうちの一つのバスからのデータを選択する。
なおFFはフリップフロップ(1ビットレジスタ)であ
る。
【0013】データメモリB部の一つのプロセッサエレ
メント分は、図8におけるメモリBセルを、図6のMB
Bのビット数分用意されて縦に並んでいるのだが、図8
ではそれを省略して一つだけ代表して表示している。な
おメモリBセルとメモリAセルは同じもので良い。
メント分は、図8におけるメモリBセルを、図6のMB
Bのビット数分用意されて縦に並んでいるのだが、図8
ではそれを省略して一つだけ代表して表示している。な
おメモリBセルとメモリAセルは同じもので良い。
【0014】出力SAM部の一つのプロセッサエレメン
ト分は、出力ポインタからの制御を受ける縦に並んだ複
数の出力SAMセルからなる。出力SAMセルは図6の
出力ビット数分(OSB)縦に並べて用意されるのだ
が、図8ではそれを省略して一つだけ代表して表示して
いる。なお出力SAMセルは、入力SAMセルと同様の
もので良い。
ト分は、出力ポインタからの制御を受ける縦に並んだ複
数の出力SAMセルからなる。出力SAMセルは図6の
出力ビット数分(OSB)縦に並べて用意されるのだ
が、図8ではそれを省略して一つだけ代表して表示して
いる。なお出力SAMセルは、入力SAMセルと同様の
もので良い。
【0015】入力SAM読みだし信号(IR)、メモリ
アクセス信号(AA及びAB)、出力SAM書き込み信
号(OW)などは、メモリセルのワード線であり、アド
レスデコードがされているものとする。またリードモデ
ィファイライトのために、読み出しのための信号はサイ
クルの前半、書き込みのための信号はサイクルの後半の
タイミングで発生される。
アクセス信号(AA及びAB)、出力SAM書き込み信
号(OW)などは、メモリセルのワード線であり、アド
レスデコードがされているものとする。またリードモデ
ィファイライトのために、読み出しのための信号はサイ
クルの前半、書き込みのための信号はサイクルの後半の
タイミングで発生される。
【0016】なお図8において、セルを縦に通過する接
続線即ちビット線とポインタ信号線は、縦に並ぶ回路要
素を同様に接続しながら通過するものとする。また横方
向の接続線のメモリのワード線および入力データバス
は、横に並ぶ回路要素を同様に接続しながら通過する。
続線即ちビット線とポインタ信号線は、縦に並ぶ回路要
素を同様に接続しながら通過するものとする。また横方
向の接続線のメモリのワード線および入力データバス
は、横に並ぶ回路要素を同様に接続しながら通過する。
【0017】次にこのプロセッサの動作を、図6、図8
を使って説明する。入力信号は入力SAM部に導かれ
る。入力ポインタは一つのプロセッサエレメントにだけ
論理“H”を立てた1ビット信号即ち入力ポインタ信号
(IP)を発生し、“H”で指定されたプロセッサエレ
メントの入力SAMセルに入力データ(IN)が書き込
まれる。入力データバス及び入力SAMセルはそれぞれ
ISBビットだけあるが、図8では1ビット分だけを示
している。
を使って説明する。入力信号は入力SAM部に導かれ
る。入力ポインタは一つのプロセッサエレメントにだけ
論理“H”を立てた1ビット信号即ち入力ポインタ信号
(IP)を発生し、“H”で指定されたプロセッサエレ
メントの入力SAMセルに入力データ(IN)が書き込
まれる。入力データバス及び入力SAMセルはそれぞれ
ISBビットだけあるが、図8では1ビット分だけを示
している。
【0018】入力データは、映像信号の一水平走査期間
ごとに、入力ポインタにより入力SAM部の左端のプロ
セッサエレメントのSAMから順に右方向のプロセッサ
エレメントのSAMに記憶していくことが出来、並んだ
プロセッサエレメント数が映像信号の一水平走査期間の
画素数分(H)であるので、入力映像信号のデータレー
トに合わせたクロックで、一水平走査期間右方向へSA
M書き込みを続け、一水平走査期間分の入力データを入
力SAM部に蓄積できる。このような入力動作は、水平
走査期間毎に繰り返される。
ごとに、入力ポインタにより入力SAM部の左端のプロ
セッサエレメントのSAMから順に右方向のプロセッサ
エレメントのSAMに記憶していくことが出来、並んだ
プロセッサエレメント数が映像信号の一水平走査期間の
画素数分(H)であるので、入力映像信号のデータレー
トに合わせたクロックで、一水平走査期間右方向へSA
M書き込みを続け、一水平走査期間分の入力データを入
力SAM部に蓄積できる。このような入力動作は、水平
走査期間毎に繰り返される。
【0019】プログラム制御部は、入力SAM部、デー
タメモリA部、ALUアレイ部、データメモリB部、出
力SAM部を以下のようにSIMD制御して、処理を実
行する。このプログラム制御は、水平走査期間ごとに繰
り返される。即ち水平走査期間の時間をこのプロセッサ
の命令サイクル周期で割り算したステップ数だけのプロ
グラムが組める。
タメモリA部、ALUアレイ部、データメモリB部、出
力SAM部を以下のようにSIMD制御して、処理を実
行する。このプログラム制御は、水平走査期間ごとに繰
り返される。即ち水平走査期間の時間をこのプロセッサ
の命令サイクル周期で割り算したステップ数だけのプロ
グラムが組める。
【0020】一水平走査期間分の入力SAM部に蓄積さ
れた入力データは、次の一水平走査期間において、必要
に応じてプログラム制御部の制御のもとに入力SAM部
からデータメモリB部へ移され、演算処理に使われる。
この動作はプログラムで入力SAM部の必要なビットの
記憶内容を入力SAM読みだし信号(IR)によりアク
セスしては、転送先のデータメモリB部の所定のメモリ
セルへメモリアクセス信号(AB)を出して書き込んで
いくことにより実現する。
れた入力データは、次の一水平走査期間において、必要
に応じてプログラム制御部の制御のもとに入力SAM部
からデータメモリB部へ移され、演算処理に使われる。
この動作はプログラムで入力SAM部の必要なビットの
記憶内容を入力SAM読みだし信号(IR)によりアク
セスしては、転送先のデータメモリB部の所定のメモリ
セルへメモリアクセス信号(AB)を出して書き込んで
いくことにより実現する。
【0021】ここで入力SAM読みだし信号(IR)と
メモリアクセス信号(AB)はワード線であり、それぞ
れ複数あるが、これらはアドレスデコーダでデコードさ
れている。またこれらワード線はリードモディファイラ
イトのために、読み出しのための信号はサイクルの前
半、書き込みのための信号はサイクルの後半のタイミン
グで発生される。
メモリアクセス信号(AB)はワード線であり、それぞ
れ複数あるが、これらはアドレスデコーダでデコードさ
れている。またこれらワード線はリードモディファイラ
イトのために、読み出しのための信号はサイクルの前
半、書き込みのための信号はサイクルの後半のタイミン
グで発生される。
【0022】このデータ転送は縦方向のビット線を経由
して1サイクルに1ビットづつ行われる。なおこのデー
タ移動に際してALUで処理することは何もないが、A
LUセルを通るようになっており、その際ALU出力制
御信号(BB)が所定のタイミングで発生される。
して1サイクルに1ビットづつ行われる。なおこのデー
タ移動に際してALUで処理することは何もないが、A
LUセルを通るようになっており、その際ALU出力制
御信号(BB)が所定のタイミングで発生される。
【0023】入力SAM部の各入力SAMセルからの読
みだし信号(IR)とデータメモリA部の各メモリセル
へメモリアクセス信号(AA)は同じアドレス空間にあ
り、メモリの同じROWデコーダでデコードされて、ワ
ード線として与えられるものである。
みだし信号(IR)とデータメモリA部の各メモリセル
へメモリアクセス信号(AA)は同じアドレス空間にあ
り、メモリの同じROWデコーダでデコードされて、ワ
ード線として与えられるものである。
【0024】データの演算処理にあたり、その準備とし
て必要に応じてデータメモリA部とデータメモリB部の
間で、所定のメモリセルへメモリアクセス信号(AA、
AB)を出して読み出し或いは書き込みを行い、データ
を移動できる。これも入力SAM部からデータメモリB
部へのデータ転送の場合と同様にリードモディファイラ
イトで、縦方向のビット線を経由して1ビット1ビット
行われる。またこの時もデータ移動に際してALUで処
理することは何もないが、ALUセルを通るようになっ
ており、その際ALU出力制御信号(BA或いはBB)
が所定のタイミングで発生される。
て必要に応じてデータメモリA部とデータメモリB部の
間で、所定のメモリセルへメモリアクセス信号(AA、
AB)を出して読み出し或いは書き込みを行い、データ
を移動できる。これも入力SAM部からデータメモリB
部へのデータ転送の場合と同様にリードモディファイラ
イトで、縦方向のビット線を経由して1ビット1ビット
行われる。またこの時もデータ移動に際してALUで処
理することは何もないが、ALUセルを通るようになっ
ており、その際ALU出力制御信号(BA或いはBB)
が所定のタイミングで発生される。
【0025】よって、データメモリA部とデータメモリ
B部には、過去に上述のようにして書き込まれた入力デ
ータや演算途中のデータが記憶されている。それらのデ
ータ或いはALUセル中の1ビットレジスタ(FF)に
記憶したデータを用いて、必要なALUでのビット演算
処理ができる。
B部には、過去に上述のようにして書き込まれた入力デ
ータや演算途中のデータが記憶されている。それらのデ
ータ或いはALUセル中の1ビットレジスタ(FF)に
記憶したデータを用いて、必要なALUでのビット演算
処理ができる。
【0026】例えばデータメモリA部のあるビットのメ
モリAセルのデータとデータメモリB部のあるビットの
メモリBセルのデータを加算してデータメモリB部の今
読み出したビットのメモリBセルに加算結果を書き込む
場合は以下のようになる。データメモリA部の所定のビ
ットのメモリAセルへ読み出し信号(AA)、またデー
タメモリB部の所定のビットのメモリBセルへは読み出
し信号(AB)をサイクルの前半に出す。
モリAセルのデータとデータメモリB部のあるビットの
メモリBセルのデータを加算してデータメモリB部の今
読み出したビットのメモリBセルに加算結果を書き込む
場合は以下のようになる。データメモリA部の所定のビ
ットのメモリAセルへ読み出し信号(AA)、またデー
タメモリB部の所定のビットのメモリBセルへは読み出
し信号(AB)をサイクルの前半に出す。
【0027】データメモリA部から読み出されたデータ
とデータメモリB部から読み出されたデータは、ALU
アレイ部のALUで演算処理される。ALUからの出力
は、データメモリB部の同じビットのメモリBセルへ書
き込み信号(AB)をサイクルの後半に出してそこに書
き込む。その際にALU出力制御信号(BB)が所定の
タイミングで与えられる。
とデータメモリB部から読み出されたデータは、ALU
アレイ部のALUで演算処理される。ALUからの出力
は、データメモリB部の同じビットのメモリBセルへ書
き込み信号(AB)をサイクルの後半に出してそこに書
き込む。その際にALU出力制御信号(BB)が所定の
タイミングで与えられる。
【0028】このALUセルでの演算動作は、ALU制
御信号(ALU−CONT)によりプログラムから指定
される。ALUセルで演算した結果は、再びデータメモ
リA部或いはデータメモリB部に書き込むか、或いは必
要に応じてALUセル中の1ビットレジスタに記憶する
こともできる。
御信号(ALU−CONT)によりプログラムから指定
される。ALUセルで演算した結果は、再びデータメモ
リA部或いはデータメモリB部に書き込むか、或いは必
要に応じてALUセル中の1ビットレジスタに記憶する
こともできる。
【0029】このようにしてALUセルの上下に存在す
るデータメモリA部とデータメモリB部から、プログラ
ムに応じてデータを読み出しては、ALUアレイ部で必
要な算術演算或いは論理演算を施し、再びデータメモリ
A部或いはデータメモリB部の所定のアドレスに書き込
むことが出来る。この演算処理は全てビット処理であ
り、サイクル当たり1ビットづつ処理を進める。
るデータメモリA部とデータメモリB部から、プログラ
ムに応じてデータを読み出しては、ALUアレイ部で必
要な算術演算或いは論理演算を施し、再びデータメモリ
A部或いはデータメモリB部の所定のアドレスに書き込
むことが出来る。この演算処理は全てビット処理であ
り、サイクル当たり1ビットづつ処理を進める。
【0030】一水平走査期間分の演算処理が終わると、
その水平走査期間のうちに、プログラムの最後の部分で
その水平走査期間分の出力データを出力SAM部に移す
必要がある。今出力すべきデータがデータメモリA部に
あるとする時、所定のメモリセルへメモリアクセス信号
(AA)をサイクルの前半に出して読みだしを行い、ま
た出力SAM部の所定のビットの出力SAMセルにデー
タ転送されるように、その出力SAMセルにサイクルの
後半に書き込み信号(OW)が発生される。
その水平走査期間のうちに、プログラムの最後の部分で
その水平走査期間分の出力データを出力SAM部に移す
必要がある。今出力すべきデータがデータメモリA部に
あるとする時、所定のメモリセルへメモリアクセス信号
(AA)をサイクルの前半に出して読みだしを行い、ま
た出力SAM部の所定のビットの出力SAMセルにデー
タ転送されるように、その出力SAMセルにサイクルの
後半に書き込み信号(OW)が発生される。
【0031】データは縦方向のビット線を経由して1ビ
ット1ビットデータ転送される。またこの時もデータ移
動に際してALUで処理することは何もないが、ALU
セルを通るようになっており、その際ALU出力制御信
号(BB)が所定のタイミングで発生される。
ット1ビットデータ転送される。またこの時もデータ移
動に際してALUで処理することは何もないが、ALU
セルを通るようになっており、その際ALU出力制御信
号(BB)が所定のタイミングで発生される。
【0032】出力SAM部の各出力SAMセルへの書き
込み信号(OW)とデータメモリB部の各メモリセルへ
メモリアクセス信号(AB)は同じアドレス空間にあ
り、メモリの同じROWデコーダでデコードされて、ワ
ード線として与えられるものである。
込み信号(OW)とデータメモリB部の各メモリセルへ
メモリアクセス信号(AB)は同じアドレス空間にあ
り、メモリの同じROWデコーダでデコードされて、ワ
ード線として与えられるものである。
【0033】以上のように、一水平走査期間の時間のう
ちに、入力SAM部に蓄積された入力データの読み出
し、必要な演算処理、必要なデータ移動、そして出力S
AM部への出力データの書き込みまでが、ビットを単位
とするSIMD制御プログラムで制御される。このプロ
グラム処理は水平走査期間を単位として繰り返される。
ちに、入力SAM部に蓄積された入力データの読み出
し、必要な演算処理、必要なデータ移動、そして出力S
AM部への出力データの書き込みまでが、ビットを単位
とするSIMD制御プログラムで制御される。このプロ
グラム処理は水平走査期間を単位として繰り返される。
【0034】このプログラム処理が終わって出力SAM
部に移された出力データは、更に次の水平走査期間に、
以下のように出力SAM部から出力される。出力信号は
出力SAM部から出力データバスへ導かれ、このプロセ
ッサの外へ出力される。
部に移された出力データは、更に次の水平走査期間に、
以下のように出力SAM部から出力される。出力信号は
出力SAM部から出力データバスへ導かれ、このプロセ
ッサの外へ出力される。
【0035】出力ポインタは、一つのプロセッサエレメ
ントについてだけ論理“H”を1つ立てた1ビット信号
即ち出力ポインタ信号(OP)を発生し、その論理
“H”で指定されたプロセッサエレメントの出力SAM
セルから出力データが出力データバスに読み出され、出
力データ(OUT)となる。出力データバス及び出力S
AMセルは、それぞれOSBビットだけあるが、図8で
は1ビット分だけを示している。
ントについてだけ論理“H”を1つ立てた1ビット信号
即ち出力ポインタ信号(OP)を発生し、その論理
“H”で指定されたプロセッサエレメントの出力SAM
セルから出力データが出力データバスに読み出され、出
力データ(OUT)となる。出力データバス及び出力S
AMセルは、それぞれOSBビットだけあるが、図8で
は1ビット分だけを示している。
【0036】出力データは映像信号の一水平走査期間ご
とに、出力ポインタにより、出力SAM部の左端のプロ
セッサエレメントのSAMから順に右方向のプロセッサ
エレメントのSAMへ場所を移しながら読み出していく
ことが出来、並んだプロセッサエレメント数が映像信号
の一水平走査期間の画素数分(H)であるので、出力映
像信号のデータレートに合わせたクロックで、一水平走
査期間分の出力データを出力SAM部から出力できる。
このような出力動作は水平走査期間毎に繰り返される。
とに、出力ポインタにより、出力SAM部の左端のプロ
セッサエレメントのSAMから順に右方向のプロセッサ
エレメントのSAMへ場所を移しながら読み出していく
ことが出来、並んだプロセッサエレメント数が映像信号
の一水平走査期間の画素数分(H)であるので、出力映
像信号のデータレートに合わせたクロックで、一水平走
査期間分の出力データを出力SAM部から出力できる。
このような出力動作は水平走査期間毎に繰り返される。
【0037】1.入力データの入力SAM部への書き込
みによる入力動作。 2.プログラム制御部のSIMD制御による、入力SA
M部からの入力データ移動、データメモリA部、ALU
アレイ部、データメモリB部による演算処理の実行、デ
ータ転送、そして出力SAM部への出力データ移動。 3.出力データの出力SAM部からの読み出しによる出
力動作。 の3つの動作は、映像信号の一水平走査期間を単位とす
るパイプライン動作になっており、ひとつの水平走査期
間の入力データに注目すれば、それぞれの動作は一水平
走査期間の時間づつずれた形で実行されるが、3つの動
作は連続して同時に並行して進行できる。
みによる入力動作。 2.プログラム制御部のSIMD制御による、入力SA
M部からの入力データ移動、データメモリA部、ALU
アレイ部、データメモリB部による演算処理の実行、デ
ータ転送、そして出力SAM部への出力データ移動。 3.出力データの出力SAM部からの読み出しによる出
力動作。 の3つの動作は、映像信号の一水平走査期間を単位とす
るパイプライン動作になっており、ひとつの水平走査期
間の入力データに注目すれば、それぞれの動作は一水平
走査期間の時間づつずれた形で実行されるが、3つの動
作は連続して同時に並行して進行できる。
【0038】図8の各セルの構造は、理解を容易にする
ために非常に一般的なものだとして示している。
ために非常に一般的なものだとして示している。
【0039】
【発明が解決しようとする課題】従来例の構成では、こ
のプロセッサは入力SAM部、データメモリA部、AL
Uアレイ部、データメモリB部、出力SAM部からな
り、このアーキテクチャのプロセッサの処理性能は、例
えば図6の縦方向の長さを長く、即ち、入力SAM部、
データメモリA部、データメモリB部、出力SAM部の
メモリサイズを大きくしても、それぞれのデータメモリ
のアドレス空間が広がるだけで、ワーキングメモリが増
えるだけである。
のプロセッサは入力SAM部、データメモリA部、AL
Uアレイ部、データメモリB部、出力SAM部からな
り、このアーキテクチャのプロセッサの処理性能は、例
えば図6の縦方向の長さを長く、即ち、入力SAM部、
データメモリA部、データメモリB部、出力SAM部の
メモリサイズを大きくしても、それぞれのデータメモリ
のアドレス空間が広がるだけで、ワーキングメモリが増
えるだけである。
【0040】また図6の横方向の長さを長く、即ちプロ
セッサエレメントの並列数を増やしても、このプロセッ
サエレメントの並列数は適用する映像信号の一水平走査
期間の画素数に対応させて使うので意味がない。
セッサエレメントの並列数を増やしても、このプロセッ
サエレメントの並列数は適用する映像信号の一水平走査
期間の画素数に対応させて使うので意味がない。
【0041】このアーキテクチャのプロセッサの処理性
能を向上させるには、命令サイクルを高速化するか、A
LUを並列化するか、或いはプロセッサ全体の並列化に
よるしかない。
能を向上させるには、命令サイクルを高速化するか、A
LUを並列化するか、或いはプロセッサ全体の並列化に
よるしかない。
【0042】命令サイクルの高速化については、入力S
AM部の入力SAMセル、データメモリA部のメモリA
セル、データメモリB部のメモリBセル、出力SAM部
の出力SAMセルの各メモリセルがDRAM構造で作ら
れているとアクセスタイムが遅く、それが高速化のネッ
クになる。しかしDRAMでないと、メモリ面積が大き
くなる。
AM部の入力SAMセル、データメモリA部のメモリA
セル、データメモリB部のメモリBセル、出力SAM部
の出力SAMセルの各メモリセルがDRAM構造で作ら
れているとアクセスタイムが遅く、それが高速化のネッ
クになる。しかしDRAMでないと、メモリ面積が大き
くなる。
【0043】図6の従来例において、ALUを並列化す
るなどにより単純にALUアレイ部のALUセルの演算
性能を上げようとしても、このプロセッサのプロセッサ
エレメントは、メモリセルの横幅分程度の非常に幅狭い
形でできているので、横幅が大きくなってしまったり、
縦の長さが長くなり過ぎたりして、一つのプロセッサエ
レメントの面積のバランスが崩れたり、スペースの無駄
が生じやすい。
るなどにより単純にALUアレイ部のALUセルの演算
性能を上げようとしても、このプロセッサのプロセッサ
エレメントは、メモリセルの横幅分程度の非常に幅狭い
形でできているので、横幅が大きくなってしまったり、
縦の長さが長くなり過ぎたりして、一つのプロセッサエ
レメントの面積のバランスが崩れたり、スペースの無駄
が生じやすい。
【0044】またプロセッサ全体の並列化は、N台並列
化して処理性能がN倍になるとき、ハードウェアもN倍
になってしまう。本件は、このプロセッサにおける処理
性能向上のために、ALUセル内でのALU並列化では
なく、プロセッサ内にALUセルを並列化する。
化して処理性能がN倍になるとき、ハードウェアもN倍
になってしまう。本件は、このプロセッサにおける処理
性能向上のために、ALUセル内でのALU並列化では
なく、プロセッサ内にALUセルを並列化する。
【0045】
【課題を解決するための手段】本発明による第1の手段
は、リニアアレイ型の並列DSPプロセッサにおいて、
少なくともSAM(シリアルアクセスメモリ)部1、デ
ータメモリ部2、ALUアレイ部3よりなり、それらの
配置をSAM部、データメモリ部、ALUアレイ部の順
に並べて配置することを特徴とするリニアアレイ型の並
列DSPプロセッサである。
は、リニアアレイ型の並列DSPプロセッサにおいて、
少なくともSAM(シリアルアクセスメモリ)部1、デ
ータメモリ部2、ALUアレイ部3よりなり、それらの
配置をSAM部、データメモリ部、ALUアレイ部の順
に並べて配置することを特徴とするリニアアレイ型の並
列DSPプロセッサである。
【0046】本発明による第2の手段は、第1の手段記
載のリニアアレイ型の並列DSPプロセッサにおいて、
上記データメモリ部が2ポートメモリであることを特徴
とするリニアアレイ型の並列DSPプロセッサである。
載のリニアアレイ型の並列DSPプロセッサにおいて、
上記データメモリ部が2ポートメモリであることを特徴
とするリニアアレイ型の並列DSPプロセッサである。
【0047】本発明による第3の手段は、第2の手段記
載のリニアアレイ型の並列DSPプロセッサにおいて、
上記SAM部は入出力共用の構成となっていることを特
徴とするリニアアレイ型の並列DSPプロセッサであ
る。
載のリニアアレイ型の並列DSPプロセッサにおいて、
上記SAM部は入出力共用の構成となっていることを特
徴とするリニアアレイ型の並列DSPプロセッサであ
る。
【0048】本発明による第4の手段は、第1の手段記
載のリニアアレイ型の並列DSPプロセッサにおいて、
上記データメモリ部のメモリセルは読み出しと書き込み
を専用の命令サイクルで実行することを特徴とするリニ
アアレイ型の並列DSPプロセッサである。
載のリニアアレイ型の並列DSPプロセッサにおいて、
上記データメモリ部のメモリセルは読み出しと書き込み
を専用の命令サイクルで実行することを特徴とするリニ
アアレイ型の並列DSPプロセッサである。
【0049】本発明による第5の手段は、第4の手段記
載のリニアアレイ型の並列DSPプロセッサにおいて、
上記データメモリ部がマルチポートメモリセルからな
り、その読み出しと書き込みのビット線が別々で、デー
タメモリ部とALUアレイ部の間のデータのやりとりの
読み出しと書き込みが別の命令サイクルで実行されるこ
とを特徴とするリニアアレイ型の並列DSPプロセッサ
である。
載のリニアアレイ型の並列DSPプロセッサにおいて、
上記データメモリ部がマルチポートメモリセルからな
り、その読み出しと書き込みのビット線が別々で、デー
タメモリ部とALUアレイ部の間のデータのやりとりの
読み出しと書き込みが別の命令サイクルで実行されるこ
とを特徴とするリニアアレイ型の並列DSPプロセッサ
である。
【0050】本発明による第6の手段は、第5の手段記
載のリニアアレイ型の並列DSPプロセッサにおいて、
上記データメモリ部の読み出し線をALU部の入力に、
書き込み線をALU部の出力に接続し、データメモリ部
とALUアレイ部の間のデータのやりとりの読み出しと
書き込みが別の命令サイクルで実行されることを特徴と
するリニアアレイ型の並列DSPプロセッサである。
載のリニアアレイ型の並列DSPプロセッサにおいて、
上記データメモリ部の読み出し線をALU部の入力に、
書き込み線をALU部の出力に接続し、データメモリ部
とALUアレイ部の間のデータのやりとりの読み出しと
書き込みが別の命令サイクルで実行されることを特徴と
するリニアアレイ型の並列DSPプロセッサである。
【0051】本発明による第7の手段は、第1の手段、
または第2の手段、または第3の手段、または第4の手
段、または第5の手段、または第6の手段記載のリニア
アレイ型の並列DSPプロセッサにおいて、上記プロセ
ッサは、全てのプロセッサが1つのプログラムにより連
動して動作をするSIMD制御であることを特徴とする
リニアアレイ型の並列DSPプロセッサである。
または第2の手段、または第3の手段、または第4の手
段、または第5の手段、または第6の手段記載のリニア
アレイ型の並列DSPプロセッサにおいて、上記プロセ
ッサは、全てのプロセッサが1つのプログラムにより連
動して動作をするSIMD制御であることを特徴とする
リニアアレイ型の並列DSPプロセッサである。
【0052】本発明による第8の手段は、第7の手段記
載のリニアアレイ型の並列DSPプロセッサにおいて、
上記プロセッサは、映像信号の水平解像度に相当する個
数のプロセッサよりなり、全てのプロセッサが、1期間
において、1水平走査線の情報を処理することを特徴と
するリニアアレイ型の並列DSPプロセッサである。
載のリニアアレイ型の並列DSPプロセッサにおいて、
上記プロセッサは、映像信号の水平解像度に相当する個
数のプロセッサよりなり、全てのプロセッサが、1期間
において、1水平走査線の情報を処理することを特徴と
するリニアアレイ型の並列DSPプロセッサである。
【0053】本発明による第9の手段は、第8の手段記
載のリニアアレイ型の並列DSPプロセッサにおいて、
上記ALU部は、2データが同時書込みが可能であるA
LUセルよりなることを特徴とするリニアアレイ型の並
列DSPプロセッサである。
載のリニアアレイ型の並列DSPプロセッサにおいて、
上記ALU部は、2データが同時書込みが可能であるA
LUセルよりなることを特徴とするリニアアレイ型の並
列DSPプロセッサである。
【0054】本発明による第10の手段は、第8の手段
記載のリニアアレイ型の並列DSPプロセッサにおい
て、上記ALU部は、2データが同時出力可能であるA
LUセルよりなることを特徴とするリニアアレイ型の並
列DSPプロセッサである。
記載のリニアアレイ型の並列DSPプロセッサにおい
て、上記ALU部は、2データが同時出力可能であるA
LUセルよりなることを特徴とするリニアアレイ型の並
列DSPプロセッサである。
【0055】
【作用】これによれば、演算処理は従来より高速にでき
ると共に、ハードウェアは各プロセッサの入出力SAM
部、データメモリ部、そのほかプログラム制御部でプロ
グラムメモリや制御線やデコード回路などの共通部分が
節約できる。
ると共に、ハードウェアは各プロセッサの入出力SAM
部、データメモリ部、そのほかプログラム制御部でプロ
グラムメモリや制御線やデコード回路などの共通部分が
節約できる。
【0056】
【実施例】図1が実施例の構成で、図6に対応するもの
である。簡単に言うとこれは、図6の構成のプロセッサ
の入力SAM部、データメモリA部、ALUアレイ部、
データメモリB部、出力SAM部の並びを、入力SAM
部と出力SAM部を兼ねた入出力SAM部1と、データ
メモリA部とデータメモリB部を兼ねたデータメモリ部
2と、ALUアレイ部3の3つの部分の構成に変え、そ
してALUアレイ部を下端として並べたものである。
である。簡単に言うとこれは、図6の構成のプロセッサ
の入力SAM部、データメモリA部、ALUアレイ部、
データメモリB部、出力SAM部の並びを、入力SAM
部と出力SAM部を兼ねた入出力SAM部1と、データ
メモリA部とデータメモリB部を兼ねたデータメモリ部
2と、ALUアレイ部3の3つの部分の構成に変え、そ
してALUアレイ部を下端として並べたものである。
【0057】この図1の上で特別説明を加えることは少
ない。入出力SAM部の外部とのデータ入出力は、入出
力双方向端子として、左方或いは右方に置いても良い
し、或いはまた、従来と近い形で、入出力を左右別々に
分けても良い。各部分のビットサイズ、即ち縦の長さ
は、それぞれ図1のようにSB、MBである。
ない。入出力SAM部の外部とのデータ入出力は、入出
力双方向端子として、左方或いは右方に置いても良い
し、或いはまた、従来と近い形で、入出力を左右別々に
分けても良い。各部分のビットサイズ、即ち縦の長さ
は、それぞれ図1のようにSB、MBである。
【0058】本実施例の多数並列化されたプロセッサエ
レメントの単一エレメントを、従来例における図7に対
応する一般的なプロセッサの構成の形で書くと、図2の
ようなものであると言える。即ち入出力バッファメモリ
(IOQ)に相当するのが入出力SAM部である。マル
チポートデータメモリ(MPRF)に相当するのがデー
タメモリ部である。
レメントの単一エレメントを、従来例における図7に対
応する一般的なプロセッサの構成の形で書くと、図2の
ようなものであると言える。即ち入出力バッファメモリ
(IOQ)に相当するのが入出力SAM部である。マル
チポートデータメモリ(MPRF)に相当するのがデー
タメモリ部である。
【0059】マルチポートデータメモリの第1のポート
と第2のポートからのデータを、必要に応じて選んで演
算するためのセレクタ(SEL)及びALUに相当する
のが、ALUアレイ部である(この場合メモリがマルチ
ポートで、メモリに区別はないので、セレクタはなくて
も良い)。なおマルチポートデータメモリとは、同時に
アクセスできるポートが複数あるメモリのことである。
よって、基本的に新規なのは入出力SAM部とマルチポ
ートデータメモリ部である。
と第2のポートからのデータを、必要に応じて選んで演
算するためのセレクタ(SEL)及びALUに相当する
のが、ALUアレイ部である(この場合メモリがマルチ
ポートで、メモリに区別はないので、セレクタはなくて
も良い)。なおマルチポートデータメモリとは、同時に
アクセスできるポートが複数あるメモリのことである。
よって、基本的に新規なのは入出力SAM部とマルチポ
ートデータメモリ部である。
【0060】図7と図2を比べた時には、これは図7の
入力バッファメモリと出力バッファメモリが1つのバッ
ファメモリになり、2つのデータメモリが1つのマルチ
ポートメモリになっており、これにより、従来できなか
った入力バッファメモリと出力バッファメモリの間のバ
ッファ量の融通が可能となり、また2つのデータメモリ
の間のメモリ量の融通が可能となっている。また演算処
理やデータ入出力などに際し、どっちのデータメモリに
データがあるかというような心配がいらなくなってい
る。
入力バッファメモリと出力バッファメモリが1つのバッ
ファメモリになり、2つのデータメモリが1つのマルチ
ポートメモリになっており、これにより、従来できなか
った入力バッファメモリと出力バッファメモリの間のバ
ッファ量の融通が可能となり、また2つのデータメモリ
の間のメモリ量の融通が可能となっている。また演算処
理やデータ入出力などに際し、どっちのデータメモリに
データがあるかというような心配がいらなくなってい
る。
【0061】図6に対する図8のモデルに対応した、実
施例における図1に対するモデルを図3に示す。図8と
同じ部分は説明を省略し、異なる部分のみ説明する。こ
こでは主に従来の図8と異なる入出力SAMセルと2ポ
ートメモリセルについて説明する。
施例における図1に対するモデルを図3に示す。図8と
同じ部分は説明を省略し、異なる部分のみ説明する。こ
こでは主に従来の図8と異なる入出力SAMセルと2ポ
ートメモリセルについて説明する。
【0062】入出力SAM部の一つのプロセッサエレメ
ント分は、入力ポインタと出力ポインタから制御される
縦に並んだ複数の入出力SAMセルからなる。入出力S
AMセルは図2の入出力ビット数分(SB)縦に並べて
用意されるのだが、図3ではそれを省略して一つだけ代
表して表示している。なお入力ポインタと出力ポインタ
は従来のものと同じである。また入出力SAMセルは、
入力SAMセルと出力SAMセルを合わた形になってい
る。
ント分は、入力ポインタと出力ポインタから制御される
縦に並んだ複数の入出力SAMセルからなる。入出力S
AMセルは図2の入出力ビット数分(SB)縦に並べて
用意されるのだが、図3ではそれを省略して一つだけ代
表して表示している。なお入力ポインタと出力ポインタ
は従来のものと同じである。また入出力SAMセルは、
入力SAMセルと出力SAMセルを合わた形になってい
る。
【0063】入出力データバスはこの図では別々である
が、入出力SAMセルごと、即ちビットごとに見たとき
は、どちらか片方の目的にしか使わないことが多いか
ら、この入出力データバスは共用でもよい。入出力デー
タバスを別々とするときでも、外部との入出力端子は共
用してもよい。同様な理由でポインタも入出力共用可能
である。共用する場合の入出力ポインタ(b)と入出力
SAMセル(b)を図4に示す。
が、入出力SAMセルごと、即ちビットごとに見たとき
は、どちらか片方の目的にしか使わないことが多いか
ら、この入出力データバスは共用でもよい。入出力デー
タバスを別々とするときでも、外部との入出力端子は共
用してもよい。同様な理由でポインタも入出力共用可能
である。共用する場合の入出力ポインタ(b)と入出力
SAMセル(b)を図4に示す。
【0064】データメモリ部の一つのプロセッサエレメ
ント分は、図3における2ポートメモリセルを、図2の
MBのビット数分用意して縦に並べているのだが、図3
ではそれを省略して一つだけ代表して表示している。こ
の2ポートメモリセルは、従来のメモリセル2つ分で、
しかし記憶素子であるコンデンサを共用している。記憶
素子は共用しているから、メモリ容量は同じでもビット
線が2本あってアクセスポートが2つになっているか
ら、同時に2つのデータ転送が可能である。ALUアレ
イ部は従来と同じである。ただしこの図では、2本のビ
ット線の片方だけに出力できるようになっている(両方
に出してもよい)。
ント分は、図3における2ポートメモリセルを、図2の
MBのビット数分用意して縦に並べているのだが、図3
ではそれを省略して一つだけ代表して表示している。こ
の2ポートメモリセルは、従来のメモリセル2つ分で、
しかし記憶素子であるコンデンサを共用している。記憶
素子は共用しているから、メモリ容量は同じでもビット
線が2本あってアクセスポートが2つになっているか
ら、同時に2つのデータ転送が可能である。ALUアレ
イ部は従来と同じである。ただしこの図では、2本のビ
ット線の片方だけに出力できるようになっている(両方
に出してもよい)。
【0065】入出力SAM読みだし信号(IR)、入出
力SAM書き込み信号(OW)、メモリアクセス信号
(AA及びAB)などは、メモリセルのワード線であ
り、アドレスデコードがされているものとする。ここで
これらのアドレスデコードは、同じメモリ空間に対し
て、2本のビット線それぞれで別のROWデコードがさ
れている。
力SAM書き込み信号(OW)、メモリアクセス信号
(AA及びAB)などは、メモリセルのワード線であ
り、アドレスデコードがされているものとする。ここで
これらのアドレスデコードは、同じメモリ空間に対し
て、2本のビット線それぞれで別のROWデコードがさ
れている。
【0066】即ち入出力SAM読みだし信号(IR)と
メモリアクセス信号(AA)、および入出力SAM書き
込み信号(OW)とメモリアクセス信号(AB)は、そ
れぞれ別のグループとしてROWデコードがされる。よ
ってこれらが構成する2ポートメモリは同時に独立な2
つのアクセスが可能である。これでALUに必要な2つ
の演算入力データの同時独立アクセスができる。またリ
ードモディファイライトのために、読み出しのための信
号はサイクルの前半、書き込みのための信号はサイクル
の後半のタイミングで発生される。
メモリアクセス信号(AA)、および入出力SAM書き
込み信号(OW)とメモリアクセス信号(AB)は、そ
れぞれ別のグループとしてROWデコードがされる。よ
ってこれらが構成する2ポートメモリは同時に独立な2
つのアクセスが可能である。これでALUに必要な2つ
の演算入力データの同時独立アクセスができる。またリ
ードモディファイライトのために、読み出しのための信
号はサイクルの前半、書き込みのための信号はサイクル
の後半のタイミングで発生される。
【0067】また図3において、セルを縦に通過する接
続線、即ちビット線とポインタ信号線は縦に並ぶ回路要
素を同様に接続しながら通過するものとする。また横方
向の接続線のメモリのワード線および入出力データバス
は、横に並ぶ回路要素を同様に接続しながら通過する。
プログラム制御部は、やはり基本的には同じSIMD制
御で構成要素も同じで、入出力SAM部、データメモリ
部、ALUアレイ部を制御して処理を実行する。
続線、即ちビット線とポインタ信号線は縦に並ぶ回路要
素を同様に接続しながら通過するものとする。また横方
向の接続線のメモリのワード線および入出力データバス
は、横に並ぶ回路要素を同様に接続しながら通過する。
プログラム制御部は、やはり基本的には同じSIMD制
御で構成要素も同じで、入出力SAM部、データメモリ
部、ALUアレイ部を制御して処理を実行する。
【0068】次に図1、図3の実施例のプロセッサの動
作を説明する。ここでも従来の図6、図8と同じ部分は
説明を省略し、異なる部分のみ説明する。
作を説明する。ここでも従来の図6、図8と同じ部分は
説明を省略し、異なる部分のみ説明する。
【0069】入力信号は入出力SAM部に導かれる。入
力ポインタは一つのプロセッサエレメントについてのみ
論理“H”を立てた1ビット信号即ち入力ポインタ信号
(IP)を発生し、その論理“H”で指定されたプロセ
ッサエレメントの入出力SAMセルに入力データが書き
込まれる。その際の映像信号の一水平走査期間ごとの単
位入力動作繰り返しは従来と同じである。
力ポインタは一つのプロセッサエレメントについてのみ
論理“H”を立てた1ビット信号即ち入力ポインタ信号
(IP)を発生し、その論理“H”で指定されたプロセ
ッサエレメントの入出力SAMセルに入力データが書き
込まれる。その際の映像信号の一水平走査期間ごとの単
位入力動作繰り返しは従来と同じである。
【0070】一水平走査期間分の入出力SAM部に蓄積
された入力データは、次の一水平走査期間において、必
要に応じてプログラム制御部の制御のもとに入出力SA
M部からデータメモリ部へ移され、演算処理に使われ
る。この動作はプログラムで入出力SAM部の必要なビ
ットの記憶内容を入出力SAM読みだし信号(IR)に
よりアクセスしては、転送先のデータメモリ部の所定の
メモリセルへメモリアクセス信号(AB)を出して書き
込んでいくことにより実現する。
された入力データは、次の一水平走査期間において、必
要に応じてプログラム制御部の制御のもとに入出力SA
M部からデータメモリ部へ移され、演算処理に使われ
る。この動作はプログラムで入出力SAM部の必要なビ
ットの記憶内容を入出力SAM読みだし信号(IR)に
よりアクセスしては、転送先のデータメモリ部の所定の
メモリセルへメモリアクセス信号(AB)を出して書き
込んでいくことにより実現する。
【0071】ここで入出力SAM読みだし信号(IR)
とメモリアクセス信号(AB)はワード線であり、それ
ぞれ複数あるが、これはアドレスデコーダでデコードさ
れている。またこれらワード線はリードモディファイラ
イトのために、読み出しのための信号はサイクルの前
半、書き込みのための信号はサイクルの後半のタイミン
グで発生される。このデータ転送は縦方向のビット線を
経由して1ビット1ビット行われる。なおこのデータ移
動に際してALUで処理することは何もないが、ALU
セルを通るようになっており、その際ALU出力制御信
号(BB)が所定のタイミングで発生されている。
とメモリアクセス信号(AB)はワード線であり、それ
ぞれ複数あるが、これはアドレスデコーダでデコードさ
れている。またこれらワード線はリードモディファイラ
イトのために、読み出しのための信号はサイクルの前
半、書き込みのための信号はサイクルの後半のタイミン
グで発生される。このデータ転送は縦方向のビット線を
経由して1ビット1ビット行われる。なおこのデータ移
動に際してALUで処理することは何もないが、ALU
セルを通るようになっており、その際ALU出力制御信
号(BB)が所定のタイミングで発生されている。
【0072】すなわち、データは入出力SAM部から2
本のビット線のうちの左側のビット線によりALUアレ
イ部に導かれ、ALUを通ってALUアレイ部から右側
のビット線を通ってデータメモリ部へ移される。データ
メモリ部においては、2つの所定のデータメモリセルへ
メモリアクセス信号AAとABを出して2つのデータを
何時でも読み出せるから、データの演算処理にあたって
従来のようにあらかじめデータを移動をしておく必要は
ない。
本のビット線のうちの左側のビット線によりALUアレ
イ部に導かれ、ALUを通ってALUアレイ部から右側
のビット線を通ってデータメモリ部へ移される。データ
メモリ部においては、2つの所定のデータメモリセルへ
メモリアクセス信号AAとABを出して2つのデータを
何時でも読み出せるから、データの演算処理にあたって
従来のようにあらかじめデータを移動をしておく必要は
ない。
【0073】データメモリ部には、過去に上述のように
して書き込まれた入力データや演算途中のデータが記憶
されている。それらのデータ或いはALUセル中の1ビ
ットレジスタ(FF)に記憶したデータを用いて、それ
ぞれのサイクルにおいて必要なALUでのビット演算処
理ができる。このALUセルでの演算動作は、ALU制
御信号(ALU−CONT)によりプログラムから指定
される。ALUセルで演算した結果は、ALUセル中の
1ビットレジスタに記憶されるか、必要に応じて再びデ
ータメモリ部に書き込まれる。
して書き込まれた入力データや演算途中のデータが記憶
されている。それらのデータ或いはALUセル中の1ビ
ットレジスタ(FF)に記憶したデータを用いて、それ
ぞれのサイクルにおいて必要なALUでのビット演算処
理ができる。このALUセルでの演算動作は、ALU制
御信号(ALU−CONT)によりプログラムから指定
される。ALUセルで演算した結果は、ALUセル中の
1ビットレジスタに記憶されるか、必要に応じて再びデ
ータメモリ部に書き込まれる。
【0074】例えばデータメモリ部の2つのビットのメ
モリセルのデータを加算してデータメモリ部の今読み出
した片方のメモリセルに結果を書き込む場合は、以下の
ようになる。データメモリ部の片方の所定のビットのメ
モリセルへ読み出し信号(AA)、またデータメモリ部
の他方の所定のビットのメモリセルへ読み出し信号(A
B)をサイクルの前半に出す。
モリセルのデータを加算してデータメモリ部の今読み出
した片方のメモリセルに結果を書き込む場合は、以下の
ようになる。データメモリ部の片方の所定のビットのメ
モリセルへ読み出し信号(AA)、またデータメモリ部
の他方の所定のビットのメモリセルへ読み出し信号(A
B)をサイクルの前半に出す。
【0075】両データはALUアレイ部のALUで演算
処理され、ALU出力は、データメモリ部の今読み出し
信号(AB)で読み出したメモリセルへ書き込み信号
(AB)をサイクルの後半に出してそこに書き込む。そ
の際にALU出力制御信号(BB)が所定のタイミング
で与えられる。この演算処理は全てビット処理であり、
サイクルごと1ビット1ビット処理を進める。
処理され、ALU出力は、データメモリ部の今読み出し
信号(AB)で読み出したメモリセルへ書き込み信号
(AB)をサイクルの後半に出してそこに書き込む。そ
の際にALU出力制御信号(BB)が所定のタイミング
で与えられる。この演算処理は全てビット処理であり、
サイクルごと1ビット1ビット処理を進める。
【0076】一水平走査期間分の演算処理が終わると、
その水平走査期間のうちに、プログラムの最後の部分で
その水平走査期間分の出力データを入出力SAM部に移
す必要がある。出力すべきビットデータの記憶されたメ
モリセルへメモリアクセス信号(AA)をサイクルの前
半に出して読みだしを行い、また入出力SAM部の所定
のビットの入出力SAMセルにデータ転送されるよう
に、その入出力SAMセルにサイクルの後半に書き込み
信号(OW)が発生される。
その水平走査期間のうちに、プログラムの最後の部分で
その水平走査期間分の出力データを入出力SAM部に移
す必要がある。出力すべきビットデータの記憶されたメ
モリセルへメモリアクセス信号(AA)をサイクルの前
半に出して読みだしを行い、また入出力SAM部の所定
のビットの入出力SAMセルにデータ転送されるよう
に、その入出力SAMセルにサイクルの後半に書き込み
信号(OW)が発生される。
【0077】このデータ転送は、入出力SAM部からデ
ータメモリ部への転送と同様に、縦方向の2本のビット
線を経由して1ビット1ビットデータ転送される。また
この時もデータ移動に際してALUで処理することは何
もないが、ALUセルを通るようになっており、その際
ALU出力制御信号(BB)が所定のタイミングで発生
される。
ータメモリ部への転送と同様に、縦方向の2本のビット
線を経由して1ビット1ビットデータ転送される。また
この時もデータ移動に際してALUで処理することは何
もないが、ALUセルを通るようになっており、その際
ALU出力制御信号(BB)が所定のタイミングで発生
される。
【0078】以上のように、一水平走査期間の時間のう
ちに、入出力SAM部に蓄積された入力データの読み出
し、必要な演算処理、必要なデータ移動、そして入出力
SAM部への出力データの書き込みまでが、ビットを単
位とするSIMD制御プログラムで制御される。このプ
ログラム処理は従来例同様水平走査期間を単位として繰
り返される。
ちに、入出力SAM部に蓄積された入力データの読み出
し、必要な演算処理、必要なデータ移動、そして入出力
SAM部への出力データの書き込みまでが、ビットを単
位とするSIMD制御プログラムで制御される。このプ
ログラム処理は従来例同様水平走査期間を単位として繰
り返される。
【0079】出力信号は入出力SAM部から出力データ
バスへ導かれ、このプロセッサの外へ出力される。出力
ポインタは一つのプロセッサエレメントのみ論理“H”
を立てた1ビット信号即ち出力ポインタ信号(OP)を
発生し、その論理“H”で指定されたプロセッサエレメ
ントの入出力SAMセルから出力データが出力データバ
スに読み出され出力データとなる。
バスへ導かれ、このプロセッサの外へ出力される。出力
ポインタは一つのプロセッサエレメントのみ論理“H”
を立てた1ビット信号即ち出力ポインタ信号(OP)を
発生し、その論理“H”で指定されたプロセッサエレメ
ントの入出力SAMセルから出力データが出力データバ
スに読み出され出力データとなる。
【0080】なお入力データバスの入力データと出力デ
ータバスの出力データの衝突は、例えば入出力端子のと
ころの双方向バッファを目的ごとにその方向をプログラ
ムすることにより回避できる。入出力データバス及び入
出力SAMセルは、それぞれSBビットだけあるが、図
3では1ビット分だけを示している。出力データの水平
走査期間ごとの出力、その他各動作の水平走査期間を単
位とするパイプライン動作は従来例と同様である。
ータバスの出力データの衝突は、例えば入出力端子のと
ころの双方向バッファを目的ごとにその方向をプログラ
ムすることにより回避できる。入出力データバス及び入
出力SAMセルは、それぞれSBビットだけあるが、図
3では1ビット分だけを示している。出力データの水平
走査期間ごとの出力、その他各動作の水平走査期間を単
位とするパイプライン動作は従来例と同様である。
【0081】このように図1、図3の構成によれば、従
来例と同様のことが可能である。
来例と同様のことが可能である。
【0082】2ポートメモリのアクセス競合が問題につ
いては、読み出しの競合は同じデータが読み出されるだ
けで不都合はない。書き込みの競合は、ALUからの出
力が同時に一つしかできない限り問題は生じない。AL
Uからの同時2出力を可能に構成する場合は、プログラ
ム決定時に書き込みアドレス競合がないようにサイクル
をずらすように修正してコンパイル(アセンブル)され
るようにすれば、これを回避できる。同時に2つのメモ
リセルに書き込みが可能なように構成されている場合で
も、その書き込みアドレスがいつも異なることが保証さ
れていればよい。始めから処理毎にアドレス空間を使い
分けるのも方法である。
いては、読み出しの競合は同じデータが読み出されるだ
けで不都合はない。書き込みの競合は、ALUからの出
力が同時に一つしかできない限り問題は生じない。AL
Uからの同時2出力を可能に構成する場合は、プログラ
ム決定時に書き込みアドレス競合がないようにサイクル
をずらすように修正してコンパイル(アセンブル)され
るようにすれば、これを回避できる。同時に2つのメモ
リセルに書き込みが可能なように構成されている場合で
も、その書き込みアドレスがいつも異なることが保証さ
れていればよい。始めから処理毎にアドレス空間を使い
分けるのも方法である。
【0083】基本的にこのようなメモリアドレス競合の
問題は、プログラミングの際に全て把握可能なことであ
り、充分起こりえる競合を回避できる。また、場合によ
っては、プログラム技術者の代わりにコンパイラ或いは
アセンブラにおいて、この競合の問題を自動的に回避さ
せるためのプログラム自動修正も可能である。
問題は、プログラミングの際に全て把握可能なことであ
り、充分起こりえる競合を回避できる。また、場合によ
っては、プログラム技術者の代わりにコンパイラ或いは
アセンブラにおいて、この競合の問題を自動的に回避さ
せるためのプログラム自動修正も可能である。
【0084】図3はもっといろいろなバリエーションが
可能である。図5は別の例である。これも図4のよう
に、図3に対して入出力ポインタと入出力SAMセルを
更に変えたものである。この図5の場合は、図3、図4
において、入出力SAM部の各ビットがそれぞれ入出力
のどちらかにしか使われないという前提があるなら有効
である。入出力SAMセル(c)は入出力どちらにも使
えるが、両方の目的に同時には使えないようになってい
る。
可能である。図5は別の例である。これも図4のよう
に、図3に対して入出力ポインタと入出力SAMセルを
更に変えたものである。この図5の場合は、図3、図4
において、入出力SAM部の各ビットがそれぞれ入出力
のどちらかにしか使われないという前提があるなら有効
である。入出力SAMセル(c)は入出力どちらにも使
えるが、両方の目的に同時には使えないようになってい
る。
【0085】このプロセッサ全体の使い方を決定する際
に、入出力SAM部の各ビットの入出力の配分を決める
ことにより、回路の無駄が省ける。しかも別の使い方に
再プログラムする場合に、各ビットの入出力配分をやり
直すことが可能である。
に、入出力SAM部の各ビットの入出力の配分を決める
ことにより、回路の無駄が省ける。しかも別の使い方に
再プログラムする場合に、各ビットの入出力配分をやり
直すことが可能である。
【0086】従来例の構成では、このプロセッサは入力
SAM部、データメモリA部、ALUアレイ部、データ
メモリB部、出力SAM部からなり、これらの各部分は
配置がその順に並んでおり、入力SAM部の各入力SA
MセルとデータメモリA部の各メモリセルは同じアドレ
ス空間にあり、同じROWデコーダでデコードされてお
り、また出力SAM部の各出力SAMセルとデータメモ
リB部の各メモリセルは同じアドレス空間にあり、同じ
ROWデコーダでデコードされていた。
SAM部、データメモリA部、ALUアレイ部、データ
メモリB部、出力SAM部からなり、これらの各部分は
配置がその順に並んでおり、入力SAM部の各入力SA
MセルとデータメモリA部の各メモリセルは同じアドレ
ス空間にあり、同じROWデコーダでデコードされてお
り、また出力SAM部の各出力SAMセルとデータメモ
リB部の各メモリセルは同じアドレス空間にあり、同じ
ROWデコーダでデコードされていた。
【0087】そのため例えば入力SAM部からデータメ
モリへのデータ転送は、そのデータ転送先がALUアレ
イ部を挟んで反対側のデータメモリB部でなければなら
ないとか、データメモリから出力SAM部へのデータ転
送ではそのデータ転送元がALUアレイ部を挟んで反対
側のデータメモリA部でなければならないというような
制約があったりした。
モリへのデータ転送は、そのデータ転送先がALUアレ
イ部を挟んで反対側のデータメモリB部でなければなら
ないとか、データメモリから出力SAM部へのデータ転
送ではそのデータ転送元がALUアレイ部を挟んで反対
側のデータメモリA部でなければならないというような
制約があったりした。
【0088】また例えば、データメモリA部にある、2
つのデータを演算処理する場合には、あらかじめデータ
メモリA部にある片方のデータをデータメモリB部にデ
ータ転送しておき、それから演算処理を始めなければな
らないというような制約があったりした。
つのデータを演算処理する場合には、あらかじめデータ
メモリA部にある片方のデータをデータメモリB部にデ
ータ転送しておき、それから演算処理を始めなければな
らないというような制約があったりした。
【0089】またデータメモリA部、データメモリB部
には、それぞれMAB、MBBのビット数のメモリセル
があるが、データメモリがALUアレイ部の両側に分か
れているので、例えばあるアプリケーションのある状態
の時に、データメモリA部はほとんどのメモリセルを使
っていてメモリ容量が不足であるのに、その時データメ
モリB部では、そのメモリセルの多くが利用されていな
いというようなことが起こりえて、そのメモリアドレス
空間の効率的利用に問題があった。
には、それぞれMAB、MBBのビット数のメモリセル
があるが、データメモリがALUアレイ部の両側に分か
れているので、例えばあるアプリケーションのある状態
の時に、データメモリA部はほとんどのメモリセルを使
っていてメモリ容量が不足であるのに、その時データメ
モリB部では、そのメモリセルの多くが利用されていな
いというようなことが起こりえて、そのメモリアドレス
空間の効率的利用に問題があった。
【0090】更に、入出力端子とSAMセルは入出力別
々なので、入力端子、入力SAMセルが不足な一方、出
力端子、出力SAMセルは余剰を生じているというよう
なことが起こりえて、その入出力端子と入出力SAMセ
ルが有効に配分されないことがあった。
々なので、入力端子、入力SAMセルが不足な一方、出
力端子、出力SAMセルは余剰を生じているというよう
なことが起こりえて、その入出力端子と入出力SAMセ
ルが有効に配分されないことがあった。
【0091】本件は、まずこのプロセッサのこのような
処理手順の効率の悪さを改善し、更に処理のフレキシビ
リティを向上させる。
処理手順の効率の悪さを改善し、更に処理のフレキシビ
リティを向上させる。
【0092】また従来例の構成では、プログラム制御部
のSIMD制御による入力SAM部、データメモリA
部、ALUアレイ部、データメモリB部、出力SAM部
による演算処理の実行において、ALU入力のデータソ
ース(発生源)は、入力SAMセル、データメモリA
部、データメモリB部、ALUセルの中の1ビットレジ
スタ(FF)のうちの2つである。またALU出力のデ
ータディスティネーション(格納先)は、出力SAMセ
ル、データメモリA部、データメモリB部、ALUセル
の中の1ビットレジスタ(FF)のうちの1つである。
のSIMD制御による入力SAM部、データメモリA
部、ALUアレイ部、データメモリB部、出力SAM部
による演算処理の実行において、ALU入力のデータソ
ース(発生源)は、入力SAMセル、データメモリA
部、データメモリB部、ALUセルの中の1ビットレジ
スタ(FF)のうちの2つである。またALU出力のデ
ータディスティネーション(格納先)は、出力SAMセ
ル、データメモリA部、データメモリB部、ALUセル
の中の1ビットレジスタ(FF)のうちの1つである。
【0093】そしてこのプロセッサにおける命令サイク
ルは、2つのデータソースからデータを読み出してAL
Uで演算処理し、データディスティネーションに書き込
むまでである。すなわち、全ての動作ではデータは基本
的にALUを通ることになっており、また全ての処理サ
イクルはリードモディファイライト動作になっている。
ルは、2つのデータソースからデータを読み出してAL
Uで演算処理し、データディスティネーションに書き込
むまでである。すなわち、全ての動作ではデータは基本
的にALUを通ることになっており、また全ての処理サ
イクルはリードモディファイライト動作になっている。
【0094】一般にこのプロセッサの入力SAMセル、
メモリAセル、メモリBセル、出力SAMセルは、DR
AM構造で作るのでただでさえアクセスタイムが遅い。
その上リードとライトの両動作を1サイクル中に実行す
るリードモディファイライト動作をさせているので、処
理サイクルは遅い動作になっている。
メモリAセル、メモリBセル、出力SAMセルは、DR
AM構造で作るのでただでさえアクセスタイムが遅い。
その上リードとライトの両動作を1サイクル中に実行す
るリードモディファイライト動作をさせているので、処
理サイクルは遅い動作になっている。
【0095】図6のアーキテクチャのプロセッサは、一
水平走査期間を単位としてプログラム処理するので、デ
ータレートの高い映像信号に対しても、リアルタイム処
理で高いプログラマビリティを実現している。それを実
現したのは、処理単位をビット単位として一つのプロセ
ッサエレメントを極端に小型化し、それによって非常に
多数のプロセッサエレメントの並列化をしたからであっ
て、このアーキテクチャのプロセッサの処理性能は、例
えば図6の縦方向の長さを長くする、即ち、入力SAM
部、データメモリA部、データメモリB部、出力SAM
部のメモリサイズを大きくしても、それぞれのデータメ
モリのアドレス空間が広がるだけで、ワーキングメモリ
が増えるだけである。また図6の横方向の長さを長くす
る、即ちプロセッサエレメントの並列数を増やしても、
このプロセッサエレメントの並列数は適用する映像信号
の水平走査期間の画素数に対応させて使うので意味がな
い。
水平走査期間を単位としてプログラム処理するので、デ
ータレートの高い映像信号に対しても、リアルタイム処
理で高いプログラマビリティを実現している。それを実
現したのは、処理単位をビット単位として一つのプロセ
ッサエレメントを極端に小型化し、それによって非常に
多数のプロセッサエレメントの並列化をしたからであっ
て、このアーキテクチャのプロセッサの処理性能は、例
えば図6の縦方向の長さを長くする、即ち、入力SAM
部、データメモリA部、データメモリB部、出力SAM
部のメモリサイズを大きくしても、それぞれのデータメ
モリのアドレス空間が広がるだけで、ワーキングメモリ
が増えるだけである。また図6の横方向の長さを長くす
る、即ちプロセッサエレメントの並列数を増やしても、
このプロセッサエレメントの並列数は適用する映像信号
の水平走査期間の画素数に対応させて使うので意味がな
い。
【0096】このアーキテクチャのプロセッサの処理性
能は、命令サイクルの高速化、或いはALUアレイの並
列化、或いはプロセッサ全体の並列化によるしかない。
本件では、このプロセッサにおける命令サイクルが遅い
という従来の欠点も解決しようとしており、メモリの読
み出し、書き込みを別のサイクルにして命令サイクルの
高速化も計っている
能は、命令サイクルの高速化、或いはALUアレイの並
列化、或いはプロセッサ全体の並列化によるしかない。
本件では、このプロセッサにおける命令サイクルが遅い
という従来の欠点も解決しようとしており、メモリの読
み出し、書き込みを別のサイクルにして命令サイクルの
高速化も計っている
【0097】基本的に新規なのは入出力SAM部とマル
チポートデータメモリ部であり、更にこれらのメモリア
クセスが従来のリードモディファイライト動作でなく
て、リードとライトが別サイクルで、パイプライン動作
が可能になっていることである。
チポートデータメモリ部であり、更にこれらのメモリア
クセスが従来のリードモディファイライト動作でなく
て、リードとライトが別サイクルで、パイプライン動作
が可能になっていることである。
【0098】
【発明の効果】この発明によれば、データの演算処理に
あたって、従来のように2つのデータメモリ構成の場合
によく生じる、2つのデータメモリ部にそれぞれ演算入
力データがなければならないという制約がなくなり、従
来例でしばしば必要になっていた、演算処理の前の2つ
のデータメモリ部間のデータ転送が不要になる。
あたって、従来のように2つのデータメモリ構成の場合
によく生じる、2つのデータメモリ部にそれぞれ演算入
力データがなければならないという制約がなくなり、従
来例でしばしば必要になっていた、演算処理の前の2つ
のデータメモリ部間のデータ転送が不要になる。
【0099】図2のようにデータメモリが一つなので、
このような余分なデータ転送がいらなくなる。従って従
来のような、2つのデータメモリ部であるための、片方
のメモリ容量の不足、余剰の問題が生ぜず、自ずと融通
できて、非常にフレキシブルな構成となっている。
このような余分なデータ転送がいらなくなる。従って従
来のような、2つのデータメモリ部であるための、片方
のメモリ容量の不足、余剰の問題が生ぜず、自ずと融通
できて、非常にフレキシブルな構成となっている。
【0100】本件は従来例に比べて、SAMセルとデー
タメモリセルは複雑化するが、もともと従来例では、こ
れらのメモリセルは、ALUセルと比べてその回路面積
が小さく、図6や図1の1つ縦長のプロセッサエレメン
トの面積配分においてバランスが悪く、実はALUセル
一つの幅とSAMセルやデータメモリセルの幅のアンバ
ランスのことを考慮すると、本件のSAMセルとデータ
メモリセルは複雑化すると言ってもむしろ面積配分のバ
ランスが良くなる。
タメモリセルは複雑化するが、もともと従来例では、こ
れらのメモリセルは、ALUセルと比べてその回路面積
が小さく、図6や図1の1つ縦長のプロセッサエレメン
トの面積配分においてバランスが悪く、実はALUセル
一つの幅とSAMセルやデータメモリセルの幅のアンバ
ランスのことを考慮すると、本件のSAMセルとデータ
メモリセルは複雑化すると言ってもむしろ面積配分のバ
ランスが良くなる。
【0101】本件では更に、ポインタとかSAMセルを
入出力共用にした際に、その冗長性を省くことが可能
で、ハードウェアを節約しながら、目的ごとの入出力端
子の最適配分を可能にしている。即ち、従来例では入力
端子と出力端子はそれぞれ専用であって、それらの間で
融通はとれなかったが、本件ではSAMセルは入出力共
用であるのでどちらにもなる。しかも入力SAMセルと
出力SAMセルの両方のハードウェアの共通部分を削る
ことが可能になっている。
入出力共用にした際に、その冗長性を省くことが可能
で、ハードウェアを節約しながら、目的ごとの入出力端
子の最適配分を可能にしている。即ち、従来例では入力
端子と出力端子はそれぞれ専用であって、それらの間で
融通はとれなかったが、本件ではSAMセルは入出力共
用であるのでどちらにもなる。しかも入力SAMセルと
出力SAMセルの両方のハードウェアの共通部分を削る
ことが可能になっている。
【0102】入出力SAM部はデータメモリ部と同じア
ドレス空間上に割り当てられているし、メモリセルとし
ての本質的な違いはないので、データメモリ部の代わり
に利用することも可能である。また入出力SAM部のデ
ータを直接ALUでの演算入力にしたり、ALU出力を
入出力SAM部へ書き込んだりもできる。本件はこのよ
うに、その処理のフレキシビリティが向上したものとな
っている。
ドレス空間上に割り当てられているし、メモリセルとし
ての本質的な違いはないので、データメモリ部の代わり
に利用することも可能である。また入出力SAM部のデ
ータを直接ALUでの演算入力にしたり、ALU出力を
入出力SAM部へ書き込んだりもできる。本件はこのよ
うに、その処理のフレキシビリティが向上したものとな
っている。
【0103】さらに従来例の構成では、入力SAM部、
データメモリA部、データメモリB部、出力SAM部の
各メモリセルの動作がリードモディファイライト動作で
あったために1サイクルの周期が長かったが、本件の実
施例によれば、リードとライトは別サイクルであり、1
サイクルの周期は短くなる。半分以下にするのは困難だ
が、60〜70%ほどにできて1.5倍以上の高速化が
期待できる。これはそのままプロセッサの処理性能を向
上できることを意味する。
データメモリA部、データメモリB部、出力SAM部の
各メモリセルの動作がリードモディファイライト動作で
あったために1サイクルの周期が長かったが、本件の実
施例によれば、リードとライトは別サイクルであり、1
サイクルの周期は短くなる。半分以下にするのは困難だ
が、60〜70%ほどにできて1.5倍以上の高速化が
期待できる。これはそのままプロセッサの処理性能を向
上できることを意味する。
【0104】この時、1ビットのデータ転送や、1ビッ
トの演算を見ると見かけ上2サイクルかかるように見え
るが、実際にはパイプライン動作ができるので、処理サ
イクルが増えてしまうことはない。
トの演算を見ると見かけ上2サイクルかかるように見え
るが、実際にはパイプライン動作ができるので、処理サ
イクルが増えてしまうことはない。
【図1】本発明によるリニアアレイ型の並列DSPプロ
セッサの一例の構成図である。
セッサの一例の構成図である。
【図2】本発明を一般的なプロセッサ構成との対応を説
明するための図である。
明するための図である。
【図3】本発明のプロセッサエレメントの一例のモデル
図である。
図である。
【図4】本発明のプロセッサエレメントの他の例のモデ
ル図である。
ル図である。
【図5】本発明のプロセッサエレメントのさらに他の例
のモデル図である。
のモデル図である。
【図6】従来のリニアアレイ型の並列DSPプロセッサ
の構成図である。
の構成図である。
【図7】一般的なプロセッサの構成を説明するための図
である。
である。
【図8】従来のプロセッサエレメントのモデル図であ
る。
る。
1 入出力SAM部 2 データメモリ部 3 プロセッサアレイ部
Claims (10)
- 【請求項1】 リニアアレイ型の並列DSPプロセッサ
において、 少なくともSAM(シリアルアクセスメモリ)部、デー
タメモリ部、ALUアレイ部よりなり、 それらの配置をSAM部、データメモリ部、ALUアレ
イ部の順に並べて配置することを特徴とするリニアアレ
イ型の並列DSPプロセッサ。 - 【請求項2】 請求項1記載のリニアアレイ型の並列D
SPプロセッサにおいて、 上記データメモリ部が2ポートメモリであることを特徴
とするリニアアレイ型の並列DSPプロセッサ。 - 【請求項3】 請求項2記載のリニアアレイ型の並列D
SPプロセッサにおいて、 上記SAM部は入出力共用の構成となっていることを特
徴とするリニアアレイ型の並列DSPプロセッサ。 - 【請求項4】 請求項1記載のリニアアレイ型の並列D
SPプロセッサにおいて、 上記データメモリ部のメモリセルは読み出しと書き込み
を専用の命令サイクルで実行することを特徴とするリニ
アアレイ型の並列DSPプロセッサ。 - 【請求項5】 請求項4記載のリニアアレイ型の並列D
SPプロセッサにおいて、 上記データメモリ部がマルチポートメモリセルからな
り、その読み出しと書き込みのビット線が別々で、デー
タメモリ部とALUアレイ部の間のデータのやりとりの
読み出しと書き込みが別の命令サイクルで実行されるこ
とを特徴とするリニアアレイ型の並列DSPプロセッ
サ。 - 【請求項6】 請求項5記載のリニアアレイ型の並列D
SPプロセッサにおいて、 上記データメモリ部の読み出し線をALU部の入力に、
書き込み線をALU部の出力に接続し、データメモリ部
とALUアレイ部の間のデータのやりとりの読み出しと
書き込みが別の命令サイクルで実行されることを特徴と
するリニアアレイ型の並列DSPプロセッサ。 - 【請求項7】 請求項1、または請求項2、または請求
項3、または請求項4、または請求項5、または請求項
6記載のリニアアレイ型の並列DSPプロセッサにおい
て、 上記プロセッサは、全てのプロセッサが1つのプログラ
ムにより連動して動作をするSIMD制御であることを
特徴とするリニアアレイ型の並列DSPプロセッサ。 - 【請求項8】 請求項7記載のリニアアレイ型の並列D
SPプロセッサにおいて、 上記プロセッサは、映像信号の水平解像度に相当する個
数のプロセッサよりなり、全てのプロセッサが、1期間
において、1水平走査線の情報を処理することを特徴と
するリニアアレイ型の並列DSPプロセッサ。 - 【請求項9】 請求項8記載のリニアアレイ型の並列D
SPプロセッサにおいて、 上記ALU部は、2データが同時書込みが可能であるA
LUセルよりなることを特徴とするリニアアレイ型の並
列DSPプロセッサ。 - 【請求項10】 請求項8記載のリニアアレイ型の並列
DSPプロセッサにおいて、 上記ALU部は、2データが同時出力可能であるALU
セルよりなることを特徴とするリニアアレイ型の並列D
SPプロセッサ。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP15936192A JPH064690A (ja) | 1992-06-18 | 1992-06-18 | リニアアレイ型の並列dspプロセッサ |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP15936192A JPH064690A (ja) | 1992-06-18 | 1992-06-18 | リニアアレイ型の並列dspプロセッサ |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH064690A true JPH064690A (ja) | 1994-01-14 |
Family
ID=15692166
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP15936192A Pending JPH064690A (ja) | 1992-06-18 | 1992-06-18 | リニアアレイ型の並列dspプロセッサ |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH064690A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6785800B1 (en) | 1999-09-10 | 2004-08-31 | Ricoh Company, Ltd. | Single instruction stream multiple data stream processor |
-
1992
- 1992-06-18 JP JP15936192A patent/JPH064690A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6785800B1 (en) | 1999-09-10 | 2004-08-31 | Ricoh Company, Ltd. | Single instruction stream multiple data stream processor |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4553203A (en) | Easily schedulable horizontal computer | |
| US6044451A (en) | VLIW processor with write control unit for allowing less write buses than functional units | |
| US5410727A (en) | Input/output system for a massively parallel, single instruction, multiple data (SIMD) computer providing for the simultaneous transfer of data between a host computer input/output system and all SIMD memory devices | |
| JP4511638B2 (ja) | 内部メモリ及び外部メモリコントロールを具備したコンピュータシステムコントローラ | |
| US5781200A (en) | Tile memory mapping for increased throughput in a dual bank access DRAM | |
| US7634621B1 (en) | Register file allocation | |
| KR19980081499A (ko) | 메모리 내장 데이터 처리장치 및 처리시스템 | |
| JPH077260B2 (ja) | 画像データ回転処理装置及びその方法 | |
| JP2001084229A (ja) | Simd型プロセッサ | |
| US7386689B2 (en) | Method and apparatus for connecting a massively parallel processor array to a memory array in a bit serial manner | |
| JPH09106389A (ja) | 信号処理装置 | |
| US7593016B2 (en) | Method and apparatus for high density storage and handling of bit-plane data | |
| JPH06274528A (ja) | ベクトル演算処理装置 | |
| US4811201A (en) | Interconnect circuit | |
| US6052705A (en) | Video signal processor with triple port memory | |
| JPH0282330A (ja) | ムーブアウト・システム | |
| JPH064690A (ja) | リニアアレイ型の並列dspプロセッサ | |
| JP7567133B2 (ja) | 半導体記憶装置及び半導体記憶装置の制御方法 | |
| JPH0697394B2 (ja) | 記憶回路 | |
| US5113487A (en) | Memory circuit with logic functions | |
| JPH064689A (ja) | リニアアレイ型の並列dspプロセッサ | |
| KR100334298B1 (ko) | 기억 소자 | |
| JPH07210545A (ja) | 並列処理プロセッサ | |
| JPH09120371A (ja) | メモリ制御装置 | |
| US5862399A (en) | Write control unit |