JPH05268593A - 差分絶対値和・差分自乗和並列演算装置 - Google Patents
差分絶対値和・差分自乗和並列演算装置Info
- Publication number
- JPH05268593A JPH05268593A JP6472192A JP6472192A JPH05268593A JP H05268593 A JPH05268593 A JP H05268593A JP 6472192 A JP6472192 A JP 6472192A JP 6472192 A JP6472192 A JP 6472192A JP H05268593 A JPH05268593 A JP H05268593A
- Authority
- JP
- Japan
- Prior art keywords
- pixel
- pixels
- memory
- sum
- pixel block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Complex Calculations (AREA)
- Image Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Analysis (AREA)
Abstract
(57)【要約】
【目的】 メモリの出力ポートを低減する。また、個々
の演算回路に送る画素を選択するセレクタ及びメモリか
ら読み出された現画素ブロックの画素を1サイクルごと
にシフトするためのシフトレジスタを不要にする。 【構成】 前フレームから切り出した水平方向に1画素
づつずれた複数の画素ブロックと、現フレームから切り
出した画素ブロックの間のL1もしくはL2ノルムを並
列に計算するL1・L2ノルム並列演算装置において、
連続したアドレスに置かれた複数のデータを一度に読み
出すことができる複数の出力ポートを有するメモリ上
に、前フレームの画素を保持する画素保持し、これから
連続したアドレスを持った複数の画素を一度に読み出し
て、同時に現フレームから画素ブロックの画素を切り出
し、この切出された画素ブロックの画素を前記ポート数
と同じ数の複数の演算器のすべてに放送する手段とを備
える。
の演算回路に送る画素を選択するセレクタ及びメモリか
ら読み出された現画素ブロックの画素を1サイクルごと
にシフトするためのシフトレジスタを不要にする。 【構成】 前フレームから切り出した水平方向に1画素
づつずれた複数の画素ブロックと、現フレームから切り
出した画素ブロックの間のL1もしくはL2ノルムを並
列に計算するL1・L2ノルム並列演算装置において、
連続したアドレスに置かれた複数のデータを一度に読み
出すことができる複数の出力ポートを有するメモリ上
に、前フレームの画素を保持する画素保持し、これから
連続したアドレスを持った複数の画素を一度に読み出し
て、同時に現フレームから画素ブロックの画素を切り出
し、この切出された画素ブロックの画素を前記ポート数
と同じ数の複数の演算器のすべてに放送する手段とを備
える。
Description
【0001】
【産業上の利用分野】本発明は、動画像符号化のアルゴ
リズムの一つである動き補償に必要なブロックマッチン
グの基本となる差分絶対値和(以下、L1ノルムとい
う)もしくは差分自乗演算器(以下、L2ノルムとい
う)計算を並列に行うL1・L2ノルム並列演算装置に
関するものである。
リズムの一つである動き補償に必要なブロックマッチン
グの基本となる差分絶対値和(以下、L1ノルムとい
う)もしくは差分自乗演算器(以下、L2ノルムとい
う)計算を並列に行うL1・L2ノルム並列演算装置に
関するものである。
【0002】
【従来の技術】(1)L1・L2ノルム 図2は、従来のL1・L2ノルム計算の対象となる画素
ブロックの例を説明するための図である。この例では、
画素ブロックは8×8の大きさである。L1・L2ノル
ムは、現フレーム中の画素ブロック1と前フレーム2中
の複数の画素ブロック3〜5の間で次式(1),式
(2)によって計算される。
ブロックの例を説明するための図である。この例では、
画素ブロックは8×8の大きさである。L1・L2ノル
ムは、現フレーム中の画素ブロック1と前フレーム2中
の複数の画素ブロック3〜5の間で次式(1),式
(2)によって計算される。
【0003】
【数1】
【0004】
【数2】
【0005】ここで、Xj(i)は、前フレーム2から
切り出した画素ブロック3〜5中の画素である。また、
Y(i)は、現フレームから切り出した画素ブロック1
中の画素である。jは複数の前画素ブロックにつけられ
た番号を表す。図2の場合、j=3,4,5の画素ブロ
ックは、水平方向に1画素ずれているのみであり、大部
分の画素は共通である。ただし、実際には、L1もしく
はL2ノルム計算の対象となる複数の前画素ブロック間
のずれは水平方向に1画素のみとは限らない。水平もし
くは垂直方向に任意の画素数だけずれている場合があり
うる。L1ノルムとL2ノルムの違いは、2画素の差を
計算した後、絶対値をとるか乗算するかだけであるの
で、以下では、L1ノルムについてのみ説明する。
切り出した画素ブロック3〜5中の画素である。また、
Y(i)は、現フレームから切り出した画素ブロック1
中の画素である。jは複数の前画素ブロックにつけられ
た番号を表す。図2の場合、j=3,4,5の画素ブロ
ックは、水平方向に1画素ずれているのみであり、大部
分の画素は共通である。ただし、実際には、L1もしく
はL2ノルム計算の対象となる複数の前画素ブロック間
のずれは水平方向に1画素のみとは限らない。水平もし
くは垂直方向に任意の画素数だけずれている場合があり
うる。L1ノルムとL2ノルムの違いは、2画素の差を
計算した後、絶対値をとるか乗算するかだけであるの
で、以下では、L1ノルムについてのみ説明する。
【0006】前記L1・L2ノルムに関する技術につて
は、例えば、K.Kikuchi, Y.Nukada,Y.Aoki, T.Kanou,
Y.Endo, T.Nishitani, “A Single-Chip 16-bit 25ns V
ideo/Image Signal Processer” ISSCC Digest Technic
al Paper, pp.170-171, Feb1989.に記載されている。
は、例えば、K.Kikuchi, Y.Nukada,Y.Aoki, T.Kanou,
Y.Endo, T.Nishitani, “A Single-Chip 16-bit 25ns V
ideo/Image Signal Processer” ISSCC Digest Technic
al Paper, pp.170-171, Feb1989.に記載されている。
【0007】(2)従来技術の第1の例 前記L1ノルムの計算対象となる画素ブロックの例を図
3に示す。ここで、簡単のために、画素ブロックの大き
さは4×4としている。図中の破線で囲まれた領域の画
素ブロック6についてL1ノルムを計算する。なお、X
5,X6,X7,X8,X21,X22,……はそれぞ
れ前記式(1)におけるX5(0),X5(1),X5
(2),X5(3),X5(4),X5(5),……に、Y
0,Y1,Y2,Y3,Y4,……はそれぞれY
(0),Y(1),Y(2),Y(3),Y(4),……に
対応する。この画素ブロック6に対するL1ノルムを4
並列で計算する従来技術の第1の例の回路構成を図4に
示す。前フレーム2の画素は4バンク構成のメモリ7-
0〜7-3に置かれている。メモリ7-0〜7-3は、メ
モリ7-0が0番地、メモリ7-1が1番地、メモリ7-
2が2番地、7-3が3番地、メモリ7-0が4番地、メ
モリ7-1が5番地とアドレスが与えられており、連続
した4番地のデータを一度に読み出すことができる。画
素X0は0番地、X1は1番地、X2は2番地、……と
添え字と同じアドレスに置かれている。このメモリ7-
0〜7-3から読み出された4データは、4データロー
テーション回路9によって最下位番地のデータが左端の
差分絶対値演算器11-0に入力するようにシフトされ
る。現画素ブロック1中の画素は、メモリ7-0〜7-3
と同じ構成のメモリ8-0〜8-3上の添え字と同じアド
レスに置かれている。また、4データローテーション回
路9の作用も同じである。従って、図示したように差分
絶対値演算器11-0〜11-3において|X5−Y0
|,|X6−Y1|,|X7−Y2|,|X8−Y3|
を同時に計算することができ、最終的にアキュムレータ
13に前画素ブロック6に対するL1ノルムを得ること
ができる。
3に示す。ここで、簡単のために、画素ブロックの大き
さは4×4としている。図中の破線で囲まれた領域の画
素ブロック6についてL1ノルムを計算する。なお、X
5,X6,X7,X8,X21,X22,……はそれぞ
れ前記式(1)におけるX5(0),X5(1),X5
(2),X5(3),X5(4),X5(5),……に、Y
0,Y1,Y2,Y3,Y4,……はそれぞれY
(0),Y(1),Y(2),Y(3),Y(4),……に
対応する。この画素ブロック6に対するL1ノルムを4
並列で計算する従来技術の第1の例の回路構成を図4に
示す。前フレーム2の画素は4バンク構成のメモリ7-
0〜7-3に置かれている。メモリ7-0〜7-3は、メ
モリ7-0が0番地、メモリ7-1が1番地、メモリ7-
2が2番地、7-3が3番地、メモリ7-0が4番地、メ
モリ7-1が5番地とアドレスが与えられており、連続
した4番地のデータを一度に読み出すことができる。画
素X0は0番地、X1は1番地、X2は2番地、……と
添え字と同じアドレスに置かれている。このメモリ7-
0〜7-3から読み出された4データは、4データロー
テーション回路9によって最下位番地のデータが左端の
差分絶対値演算器11-0に入力するようにシフトされ
る。現画素ブロック1中の画素は、メモリ7-0〜7-3
と同じ構成のメモリ8-0〜8-3上の添え字と同じアド
レスに置かれている。また、4データローテーション回
路9の作用も同じである。従って、図示したように差分
絶対値演算器11-0〜11-3において|X5−Y0
|,|X6−Y1|,|X7−Y2|,|X8−Y3|
を同時に計算することができ、最終的にアキュムレータ
13に前画素ブロック6に対するL1ノルムを得ること
ができる。
【0008】前記従来技術の第1の例に関する技術につ
いては、例えば、南,山内,田代,鈴木,笠井,高橋,
遠藤,浜口著、「ビデオシグナルプロセッサIDSPの
データフロー制御」、1991、信学技法、ICD91-12、pp.2
5-32に記載されている。
いては、例えば、南,山内,田代,鈴木,笠井,高橋,
遠藤,浜口著、「ビデオシグナルプロセッサIDSPの
データフロー制御」、1991、信学技法、ICD91-12、pp.2
5-32に記載されている。
【0009】(3)従来技術の第2の例 前記L1ノルムの計算対象となる画素ブロックの第2の
例を図5に示す。前記第1の例で示した画素ブロック6
の他に、水平方向に1画素づつずれた画素ブロック1
5,16,17が示されている。これらの4画素ブロッ
ク6,15,16,17に対するL1ノルムを4並列で
計算する従来技術の第2の例の回路構成を図6に示す。
前フレーム2の画素は、2出力ポートを持ったメモリ1
8上の添え字と同じアドレスに置かれている。現画素ブ
ロック1中の画素は、メモリ19上の添え字と同じアド
レスに置かれている。メモリ18のポート0からは破線
で囲まれた画素が、ポート1からは、直線で囲まれた画
素が読み出される。セレクタ21-0,21-1,21-
2は、これらの画素からそれぞれ画素ブロック17,1
6,15の画素を選択する。また、レジスタ20-0〜
20-3は、シフトレジスタであり、メモリ19から読
み出された現画素ブロック1の画素を1サイクルごとに
シフトする。従って、差分絶対値演算器22-0〜22-
3でそれぞれ画素ブロック17,16,15,6と現画
素ブロック1の差分絶対値を計算し、アキュムレータ2
3-0〜23-3に画素ブロック17,16,15,6と
現画素ブロック1のL1ノルムを得ることができる。
例を図5に示す。前記第1の例で示した画素ブロック6
の他に、水平方向に1画素づつずれた画素ブロック1
5,16,17が示されている。これらの4画素ブロッ
ク6,15,16,17に対するL1ノルムを4並列で
計算する従来技術の第2の例の回路構成を図6に示す。
前フレーム2の画素は、2出力ポートを持ったメモリ1
8上の添え字と同じアドレスに置かれている。現画素ブ
ロック1中の画素は、メモリ19上の添え字と同じアド
レスに置かれている。メモリ18のポート0からは破線
で囲まれた画素が、ポート1からは、直線で囲まれた画
素が読み出される。セレクタ21-0,21-1,21-
2は、これらの画素からそれぞれ画素ブロック17,1
6,15の画素を選択する。また、レジスタ20-0〜
20-3は、シフトレジスタであり、メモリ19から読
み出された現画素ブロック1の画素を1サイクルごとに
シフトする。従って、差分絶対値演算器22-0〜22-
3でそれぞれ画素ブロック17,16,15,6と現画
素ブロック1の差分絶対値を計算し、アキュムレータ2
3-0〜23-3に画素ブロック17,16,15,6と
現画素ブロック1のL1ノルムを得ることができる。
【0010】従来技術の第2の例に関する技術は、例え
ば、K.Yang M.Sun L.Wu “A FamilyVLSI Design for th
e Motion Compensation Block Algorithm” IEEE Tran
s. on Circuits and Systems, vol.36, pp.137-1325, O
ct. 1989.に記載されている。
ば、K.Yang M.Sun L.Wu “A FamilyVLSI Design for th
e Motion Compensation Block Algorithm” IEEE Tran
s. on Circuits and Systems, vol.36, pp.137-1325, O
ct. 1989.に記載されている。
【0011】
【発明が解決しようとする課題】ところが、従来技術の
第1の例においては、4並列演算の場合、前フレーム2
の画素を読み出すために4ポート、現画素ブロック1の
画素を読み出すために4ポート、計8出力ポート必要で
あり、多数の出力ポートを持ったメモリが必要であると
いう問題がある。また、差分絶対値を累算するために、
加算器12をトリー状に結合するパスが必要であるとい
う問題がある。
第1の例においては、4並列演算の場合、前フレーム2
の画素を読み出すために4ポート、現画素ブロック1の
画素を読み出すために4ポート、計8出力ポート必要で
あり、多数の出力ポートを持ったメモリが必要であると
いう問題がある。また、差分絶対値を累算するために、
加算器12をトリー状に結合するパスが必要であるとい
う問題がある。
【0012】従来技術の第2の例においては、前フレー
ム2の画素を2画素同時に読み出すために2ポートメモ
リ18が必要となり、しかも個々の演算回路に送る画素
を選択するセレクタ21-0〜21-2が必要となるとい
う問題がある。また、メモリ19から読み出された現画
素ブロック1の画素を1サイクルごとにシフトするため
にシフトレジスタ20-0〜20-3が必要になるという
問題がある。
ム2の画素を2画素同時に読み出すために2ポートメモ
リ18が必要となり、しかも個々の演算回路に送る画素
を選択するセレクタ21-0〜21-2が必要となるとい
う問題がある。また、メモリ19から読み出された現画
素ブロック1の画素を1サイクルごとにシフトするため
にシフトレジスタ20-0〜20-3が必要になるという
問題がある。
【0013】本発明は、前記問題点を解決するためにな
されたものであり、本発明の目的は、メモリの出力ポー
トを低減することが可能な技術を提供することにある。
されたものであり、本発明の目的は、メモリの出力ポー
トを低減することが可能な技術を提供することにある。
【0014】本発明の他の目的は、個々の演算回路に送
る画素を選択するセレクタ及びメモリから読み出された
現画素ブロック1の画素を1サイクルごとにシフトする
ためのシフトレジスタを不要にすることが可能な技術を
提供することにある。
る画素を選択するセレクタ及びメモリから読み出された
現画素ブロック1の画素を1サイクルごとにシフトする
ためのシフトレジスタを不要にすることが可能な技術を
提供することにある。
【0015】本発明の前記目的ならびにその他の目的及
び新規な特徴は、本明細書の記述及び添付図面によって
明らかにする。
び新規な特徴は、本明細書の記述及び添付図面によって
明らかにする。
【0016】
【課題を解決するための手段】前記目的を達成するため
に、本発明は、前フレームから切り出した水平方向に1
画素づつずれた複数の画素ブロックと、現フレームから
切り出した画素ブロックの間のL1もしくはL2ノルム
を並列に計算するL1・L2ノルム並列演算装置におい
て、連続したアドレスに置かれた複数のデータを一度に
読み出すことができる複数の出力ポートを有するメモリ
と、該メモリ上に前フレームの画素を保持する画素保持
手段と、該画素保持手段から連続したアドレスを持った
複数の画素を一度に読み出して、同時に現フレームから
画素ブロックの画素を切り出す手段と、該切り出す手段
によって切り出された画素ブロックの画素を前記ポート
数と同じ数の複数の演算器のすべてに放送する手段とを
備えることを特徴とする。
に、本発明は、前フレームから切り出した水平方向に1
画素づつずれた複数の画素ブロックと、現フレームから
切り出した画素ブロックの間のL1もしくはL2ノルム
を並列に計算するL1・L2ノルム並列演算装置におい
て、連続したアドレスに置かれた複数のデータを一度に
読み出すことができる複数の出力ポートを有するメモリ
と、該メモリ上に前フレームの画素を保持する画素保持
手段と、該画素保持手段から連続したアドレスを持った
複数の画素を一度に読み出して、同時に現フレームから
画素ブロックの画素を切り出す手段と、該切り出す手段
によって切り出された画素ブロックの画素を前記ポート
数と同じ数の複数の演算器のすべてに放送する手段とを
備えることを特徴とする。
【0017】前記演算器は、差分絶対値演算器又は差分
自乗演算器と累算器からなることを特徴とする。
自乗演算器と累算器からなることを特徴とする。
【0018】
【作用】前述の手段によれば、従来技術の第1の例で用
いられている複数バンクメモリとデータローテーション
回路によって構成され、連続したアドレスに置かれた複
数のデータを一度に読み出すことができるメモリ上に、
前フレームの画素を保持し、そこから連続したアドレス
を持った複数の画素を一度に読み出して、差分絶対値演
算器もしくは差分自乗演算器と累算器からなる複数の演
算回路に並列に送り、同時に現画素ブロックの画素を前
記演算器すべてに放送するので、個々のメモリから現ブ
ロックの画素を読み出すためのポートが1個で済み、必
要なメモリのポート数は演算並列度+1となり、従来技
術の第1の例に比べて大幅に削減される。また、差分絶
対値を累算するために、加算器をトリー状に結合する必
要もない。
いられている複数バンクメモリとデータローテーション
回路によって構成され、連続したアドレスに置かれた複
数のデータを一度に読み出すことができるメモリ上に、
前フレームの画素を保持し、そこから連続したアドレス
を持った複数の画素を一度に読み出して、差分絶対値演
算器もしくは差分自乗演算器と累算器からなる複数の演
算回路に並列に送り、同時に現画素ブロックの画素を前
記演算器すべてに放送するので、個々のメモリから現ブ
ロックの画素を読み出すためのポートが1個で済み、必
要なメモリのポート数は演算並列度+1となり、従来技
術の第1の例に比べて大幅に削減される。また、差分絶
対値を累算するために、加算器をトリー状に結合する必
要もない。
【0019】また、従来技術の第2の例において必要で
あった個々の演算回路に送る画素を選択するセレクタ及
びメモリから読み出された現画素ブロックの画素を1サ
イクルごとにシフトするためのシフトレジスタが不要と
なる。また、各メモリの出力ポートは1個でも良く、2
ポートメモリという制限はなくなる。
あった個々の演算回路に送る画素を選択するセレクタ及
びメモリから読み出された現画素ブロックの画素を1サ
イクルごとにシフトするためのシフトレジスタが不要と
なる。また、各メモリの出力ポートは1個でも良く、2
ポートメモリという制限はなくなる。
【0020】
【実施例】以下、本発明の実施例を図面を参照して詳細
に説明する。
に説明する。
【0021】図1は、本発明の実施例のL1・L2ノル
ム並列演算装置の構成を示すブロック図である。前述の
従来技術の第2の例の説明と同じく図5に示す水平方向
に1画素づつずれた画素ブロック6,15,16,17
についてL1ノルムを計算する場合を示す。
ム並列演算装置の構成を示すブロック図である。前述の
従来技術の第2の例の説明と同じく図5に示す水平方向
に1画素づつずれた画素ブロック6,15,16,17
についてL1ノルムを計算する場合を示す。
【0022】図1において、7-0〜7-3は4バンク構
成の前フレーム内画素保持用メモリ、9は4データロー
テーション回路、10はレジスタ、12は加算器、14
はL1ノルム書き込み用メモリ、19は現画素ブロック
内画素保持用のメモリ、22-0〜22-3は差分絶対値
演算器、23-0〜23-3はアキュムレータ、24-1
〜24-3,25-1〜25-3は2・1セレクタであ
る。
成の前フレーム内画素保持用メモリ、9は4データロー
テーション回路、10はレジスタ、12は加算器、14
はL1ノルム書き込み用メモリ、19は現画素ブロック
内画素保持用のメモリ、22-0〜22-3は差分絶対値
演算器、23-0〜23-3はアキュムレータ、24-1
〜24-3,25-1〜25-3は2・1セレクタであ
る。
【0023】前記従来技術の第1の例で用いられている
4バンク構成のメモリ7-0〜7-3から最初に4画素X
8,X5,X6,X7が読み出され、同じく従来技術の
第1の例で用いられている4データローテーション回路
9でアドレスの低い順番X5,X6,X7,X8に並べ
直されて差分絶対値演算器22-0〜22-3に送られ
る。
4バンク構成のメモリ7-0〜7-3から最初に4画素X
8,X5,X6,X7が読み出され、同じく従来技術の
第1の例で用いられている4データローテーション回路
9でアドレスの低い順番X5,X6,X7,X8に並べ
直されて差分絶対値演算器22-0〜22-3に送られ
る。
【0024】メモリ19から読み出された現画素ブロッ
ク1の画素Y0は、差分絶対値演算器22-0〜22-3
に放送される。次に、メモリ7-0〜7-3から4画素X
8,X9,X6,X7が読み出され、データローテーシ
ョン回路9でアドレの低い順番X6,X7,X8,X9
に並べ直されて差分絶対値演算器22-0〜22-3に送
られる。メモリ19からは、画素Y1が、差分絶対値演
算器22-0〜22-3に放送される。以下、同様にして
差分絶対値演算器22-0〜22-3でそれぞれ画素ブロ
ック6,15,16,17の画素と現画素ブロック1の
画素の間の差分絶対値が計算され、アキュムレータ23
-0〜23-3にL1ノルムを得ることができる。なお、
途切れなくL1ノルムを計算するためには、図1に示す
ように、アキュムレータ23-1〜23-3を2重化し、
計算済みのL1ノルムをメモリ14に書き込むまで上書
きされないようにする必要がある。
ク1の画素Y0は、差分絶対値演算器22-0〜22-3
に放送される。次に、メモリ7-0〜7-3から4画素X
8,X9,X6,X7が読み出され、データローテーシ
ョン回路9でアドレの低い順番X6,X7,X8,X9
に並べ直されて差分絶対値演算器22-0〜22-3に送
られる。メモリ19からは、画素Y1が、差分絶対値演
算器22-0〜22-3に放送される。以下、同様にして
差分絶対値演算器22-0〜22-3でそれぞれ画素ブロ
ック6,15,16,17の画素と現画素ブロック1の
画素の間の差分絶対値が計算され、アキュムレータ23
-0〜23-3にL1ノルムを得ることができる。なお、
途切れなくL1ノルムを計算するためには、図1に示す
ように、アキュムレータ23-1〜23-3を2重化し、
計算済みのL1ノルムをメモリ14に書き込むまで上書
きされないようにする必要がある。
【0025】以上の説明からわかるように、本実施例に
よれば、個々のメモリ7-0〜7-3から現ブロックの画
素を読み出すためのポートが1個で済み、必要なメモリ
のポート数は、演算並列度+1となり、従来技術の第1
の例に比べて大幅に削減される。また、差分絶対値を累
算するために、加算器12をトリー状に結合する必要も
ない。
よれば、個々のメモリ7-0〜7-3から現ブロックの画
素を読み出すためのポートが1個で済み、必要なメモリ
のポート数は、演算並列度+1となり、従来技術の第1
の例に比べて大幅に削減される。また、差分絶対値を累
算するために、加算器12をトリー状に結合する必要も
ない。
【0026】さらに、従来技術の第2の例において必要
であった個々の演算回路に送る画素を選択するセレクタ
21-0〜21-2、およびメモリ19から読み出された
現画素ブロック1の画素を1サイクルごとにシフトする
ためのシフトレジスタ20-0〜20-3は不要となる。
また、各メモリの出力ポートは1個でも良く、2ポート
メモリという制限はなくなる。
であった個々の演算回路に送る画素を選択するセレクタ
21-0〜21-2、およびメモリ19から読み出された
現画素ブロック1の画素を1サイクルごとにシフトする
ためのシフトレジスタ20-0〜20-3は不要となる。
また、各メモリの出力ポートは1個でも良く、2ポート
メモリという制限はなくなる。
【0027】なお、前述の実施例では簡単のために4×
4画素ブロックに対して4並列演算を行う場合について
のみ説明したが、本発明は任意の並列度、任意の画素ブ
ロックサイズに対して適用できる。
4画素ブロックに対して4並列演算を行う場合について
のみ説明したが、本発明は任意の並列度、任意の画素ブ
ロックサイズに対して適用できる。
【0028】以上、本発明を実施例に基づき具体的に説
明したが、本発明は、前記実施例に限定されるものでは
なく、その要旨を逸脱しない範囲において種々変更し得
ることはいうまでもない。
明したが、本発明は、前記実施例に限定されるものでは
なく、その要旨を逸脱しない範囲において種々変更し得
ることはいうまでもない。
【0029】
【発明の効果】以上、説明したように、本発明によれ
ば、個々のメモリから現ブロックの画素を読み出すため
のポートが1個で済み、必要なメモリのポート数は演算
並列度+1となり、従来技術の第1の例に比べて大幅に
削減される。また、差分絶対値を累算するために、加算
器をトリー状に結合する必要もない。
ば、個々のメモリから現ブロックの画素を読み出すため
のポートが1個で済み、必要なメモリのポート数は演算
並列度+1となり、従来技術の第1の例に比べて大幅に
削減される。また、差分絶対値を累算するために、加算
器をトリー状に結合する必要もない。
【図1】 本発明の実施例の全探索向きL1・L2ノル
ム並列演算装置の構成を示すブロック図、
ム並列演算装置の構成を示すブロック図、
【図2】 L1ノルムとL2ノルムの計算式を説明する
ための前フレーム内の画素ブロックと現ブロックを示す
図、
ための前フレーム内の画素ブロックと現ブロックを示す
図、
【図3】 従来技術の第1の例を説明するための計算の
対象となる画素ブロックを示す図、
対象となる画素ブロックを示す図、
【図4】 従来技術の第1の例を説明するための回路構
成図、
成図、
【図5】 従来技術の第2の例を説明するための計算の
対象となる画素ブロックを示す図、
対象となる画素ブロックを示す図、
【図6】 従来技術の第2の例を説明するための回路構
成図。
成図。
1…現画素ブロック、2…前フレーム、3,4,5,
6,15,16,17…前フレーム内の画素ブロック、
7-0〜7-3…4バンク構成の前フレーム内画素保持用
メモリ、8-0〜8-3…4バンク構成の現画素ブロック
内画素保持用メモリ、9…4データローテーション回
路、10…レジスタ、11-0〜11-3,22-0〜2
2-3…差分絶対値演算器、12…加算器、13,23-
0〜23-3…アキュムレータ、14…L1ノルム書き
込み用メモリ、18…前フレーム内画素保持用の2ポー
トメモリ、19…現画素ブロック内画素保持用のメモ
リ、20−0〜20−3…4シフトレジスタを構成する
レジスタ、21-0〜21-2,24-1〜24-3,25
-1〜25-3…2・1セレクタ。
6,15,16,17…前フレーム内の画素ブロック、
7-0〜7-3…4バンク構成の前フレーム内画素保持用
メモリ、8-0〜8-3…4バンク構成の現画素ブロック
内画素保持用メモリ、9…4データローテーション回
路、10…レジスタ、11-0〜11-3,22-0〜2
2-3…差分絶対値演算器、12…加算器、13,23-
0〜23-3…アキュムレータ、14…L1ノルム書き
込み用メモリ、18…前フレーム内画素保持用の2ポー
トメモリ、19…現画素ブロック内画素保持用のメモ
リ、20−0〜20−3…4シフトレジスタを構成する
レジスタ、21-0〜21-2,24-1〜24-3,25
-1〜25-3…2・1セレクタ。
フロントページの続き (51)Int.Cl.5 識別記号 庁内整理番号 FI 技術表示箇所 G06F 15/70 410 9071−5L
Claims (2)
- 【請求項1】 前フレームから切り出した水平方向に1
画素づつずれた複数の画素ブロックと、現フレームから
切り出した画素ブロックの間の差分絶対値和もしくは差
分自乗和を並列に計算する差分絶対値和・差分自乗和並
列演算装置において、連続したアドレスに置かれた複数
のデータを一度に読み出すことができる複数の出力ポー
トを有するメモリと、該メモリ上に前フレームの画素を
保持する画素保持手段と、該画素保持手段から連続した
アドレスを持った複数の画素を一度に読み出して、同時
に現フレームから画素ブロックの画素を切り出す手段
と、該切り出す手段によって切り出された画素ブロック
の画素を前記ポート数と同じ数の複数の演算器のすべて
に放送する手段とを備えることを特徴とする差分絶対値
和・差分自乗和並列演算装置。 - 【請求項2】 請求項1に記載の差分絶対値和・差分自
乗和並列演算装置において、前記演算器は、差分絶対値
演算器もしくは差分自乗演算器と累算器からなることを
特徴とする差分絶対値和・差分自乗和並列演算装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6472192A JPH05268593A (ja) | 1992-03-23 | 1992-03-23 | 差分絶対値和・差分自乗和並列演算装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6472192A JPH05268593A (ja) | 1992-03-23 | 1992-03-23 | 差分絶対値和・差分自乗和並列演算装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH05268593A true JPH05268593A (ja) | 1993-10-15 |
Family
ID=13266306
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP6472192A Pending JPH05268593A (ja) | 1992-03-23 | 1992-03-23 | 差分絶対値和・差分自乗和並列演算装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH05268593A (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2000043868A1 (fr) * | 1999-01-20 | 2000-07-27 | Hitachi, Ltd. | Processeur de donnees et dispositif d'operation arithmetique |
| US7154950B2 (en) | 2000-06-07 | 2006-12-26 | Intel Corporation | Adaptive early exit techniques in image correlation |
| JP2007088910A (ja) * | 2005-09-22 | 2007-04-05 | Olympus Imaging Corp | 動きベクトル検出装置及び撮像装置 |
| US8804844B2 (en) | 2000-06-07 | 2014-08-12 | Analog Devices, Inc. | Adaptive early exit techniques in image correlation |
-
1992
- 1992-03-23 JP JP6472192A patent/JPH05268593A/ja active Pending
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2000043868A1 (fr) * | 1999-01-20 | 2000-07-27 | Hitachi, Ltd. | Processeur de donnees et dispositif d'operation arithmetique |
| US7154950B2 (en) | 2000-06-07 | 2006-12-26 | Intel Corporation | Adaptive early exit techniques in image correlation |
| US8804844B2 (en) | 2000-06-07 | 2014-08-12 | Analog Devices, Inc. | Adaptive early exit techniques in image correlation |
| JP2007088910A (ja) * | 2005-09-22 | 2007-04-05 | Olympus Imaging Corp | 動きベクトル検出装置及び撮像装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5466211B2 (ja) | 2次元マトリクス処理のためのレジスタ | |
| AU747283B2 (en) | Data processing system for logically adjacent data samples such as image data in a machine vision system | |
| JPH06292178A (ja) | 適応形ビデオ信号演算処理装置 | |
| JPS6053349B2 (ja) | 画像処理プロセツサ | |
| JPS63136167A (ja) | 直交変換プロセッサ | |
| US6452603B1 (en) | Circuit and method for trilinear filtering using texels from only one level of detail | |
| JPH09153029A (ja) | 高速フーリエ変換を行うメモリ分散型並列計算機およびその方法 | |
| JPH01145778A (ja) | 自由な流れのパイプライン・バスを有する像処理装置 | |
| JP2778622B2 (ja) | 2次元dct回路 | |
| JPS6116369A (ja) | 画像処理装置 | |
| JP3401823B2 (ja) | 画像コーデック用プロセッサ | |
| JPH05268593A (ja) | 差分絶対値和・差分自乗和並列演算装置 | |
| JP3305406B2 (ja) | プログラム制御のプロセッサ | |
| JPH05266056A (ja) | 差分絶対値和・差分自乗和並列演算装置 | |
| Ericsson et al. | LIPP-A SIMD multiprocessor architecture for image processing | |
| JP2662501B2 (ja) | 離散的コサイン変換及び逆変換のための集積回路プロセッサ | |
| JPH0435792B2 (ja) | ||
| JPH07210545A (ja) | 並列処理プロセッサ | |
| JPH07121687A (ja) | 画像コーデック用プロセッサおよびアクセスパターン変換方法 | |
| JP2772027B2 (ja) | 画像再構成方式 | |
| US5777688A (en) | Signal processor | |
| JPH05324584A (ja) | ハイパーキューブの割当方法 | |
| JPH07141325A (ja) | 信号処理装置 | |
| JP3781476B2 (ja) | 信号処理装置 | |
| JPH04291681A (ja) | 超高速画像処理システムのフィルタリング処理方式 |