JP5519951B2 - アレイプロセッサ - Google Patents

アレイプロセッサ Download PDF

Info

Publication number
JP5519951B2
JP5519951B2 JP2009094620A JP2009094620A JP5519951B2 JP 5519951 B2 JP5519951 B2 JP 5519951B2 JP 2009094620 A JP2009094620 A JP 2009094620A JP 2009094620 A JP2009094620 A JP 2009094620A JP 5519951 B2 JP5519951 B2 JP 5519951B2
Authority
JP
Japan
Prior art keywords
data
processing
input
register
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009094620A
Other languages
English (en)
Other versions
JP2009289256A (ja
Inventor
セドゥーキン スタニスラフ
敏明 宮崎
研一 黒田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Aizu
Original Assignee
University of Aizu
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Aizu filed Critical University of Aizu
Priority to JP2009094620A priority Critical patent/JP5519951B2/ja
Publication of JP2009289256A publication Critical patent/JP2009289256A/ja
Application granted granted Critical
Publication of JP5519951B2 publication Critical patent/JP5519951B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Complex Calculations (AREA)

Description

本発明は、アレイプロセッサに関し、より詳細には、積和演算処理を行うプロセッシングエレメントを各軸方向に配設して概念的な三次元配置状態に形成し、各プロセッシングエレメントに設けられる入力端子と隣接する他のプロセッシングエレメントに設けられる出力端子とを前記軸方向に対応させてトーラス状に接続させたアレイプロセッサに関する。
従来より、画像を空間座標から周波数座標に変換する処理方式として二次元直交変換処理が知られている。この二次元直交変換処理は、デジタル技術の進んだ今日において大変多く用いられる変換処理であり、例えば、JPEG等の画像圧縮技術や動画圧縮技術等においても多く用いられている。さらに、時間軸を考え三次元のデータに対して周波数座標に変換する三次元直交変換も古くから動画圧縮への応用が考えられている。
次述する式(1)は、一般的な三次元離散直交変換処理に用いられる数式を示している。
Figure 0005519951
ここで、n,n,nは、0以上n−1以下の整数値(つまり、0≦n≦n−1,0≦n≦n−1,0≦n≦n−1)であり、k,k,kは、0以上n−1以下の整数値(つまり、0≦k≦n−1,0≦k≦n−1,0≦k≦n−1)である。また、C(n,k),C(n,k),C(n,k)はサイズがn×nの二次元係数行列を示し、X(n1,n,n)はサイズn×n×nの三次元入力データ行列を示し、Y(k,k,k)はサイズn×n×nの三次元直交変換後のデータを表す行列である。
式(1)に示す数式において、C(n,k),C(n,k),C(n,k)に記録される具体的な値を変更することにより、さまざまな直交変換の方式、例えば、JPEGで採用されている離散コサイン変換(DCT:Discrete Cosine Transform)の他に、ウォルシュ・アダマール変換(WHT:Walsh-Hadamard Transform)、離散フーリエ変換(DFT:Discrete Fourier Transform)、離散サイン変換(DST:Discrete Sine Transform)などの変換処理を実行することが可能となっている。
このような三次元離散直交変換処理をコンピュータを用いて演算する場合には、メモリに格納した係数Cと入力データXとを虫食い的に何度もアクセスする必要があり、膨大なデータアクセスの発生により処理の高速化が困難であるという問題があった。このような問題を回避するために、一次元の離散直交変換専用回路を3つ用い、それぞれを接続して三次元離散直交変換処理を実現する方法が提案されている(例えば、特許文献1参照)。
米国特許第5,126,962号明細書
上述した特許文献1に記載の方法は、(1)式に示した各変数n,n,nの1つのみを変化させながら順番に計算を進める方法に該当する。この方法を用いる場合には、一の軸方向に係る離散直交変換処理が終了した後に次の軸方向において離散直交変換処理を行うために、計算途中のデータや係数データを回路に入力させる順番を調整して各データの掛け合わせ処理を行う必要が生ずる。このため、特許文献1に示す方法を用いる場合には、計算途中のデータや係数データを回路に入力させる順番を調整するための専用回路を設ける必要が生じる(例えば、特許文献1の図5参照。)。このようにデータ調整用の専用回路を設けることによって、離散直交変換処理における処理速度の向上を図ることが可能になる一方で、アレイプロセッサの回路構成が複雑になってしまうという問題が生じていた。
また、複数のプロセッシングエレメントによって構成されるアレイプロセッサを用いて三次元離散直交変換を実行する方法も考えられているが、各次元の計算途中においてプロセッシングエレメントの内部に蓄えられるデータおよび係数行列要素を、各プロセッシングエレメントを互いに接続させた複雑な配線構造を用いて何度も交換し合う必要が生ずるという問題があった。
しかも、行列要素の交換は、隣接するプロセッシングエレメントの間だけに限定されないため、プロセッシングエレメントの間の配線構造に制約がある場合は,幾つかのプロセッシングエレメントを経由してデータの交換作業を行う必要が生じ、演算処理における処理負担が増大してしまうという問題があった。
さらに、このような問題は、式(2)に示す三次元離散直交変換の逆変換処理(三次元逆離散直交変換)においても同様に生じるものであった。
Figure 0005519951
本発明は上記問題に鑑みて成されたものであり、計算途中におけるデータの入替作業を行ったり、その入替作業用の専用回路を設置したりすることなく、三次元直交変換および三次元逆直交変換を迅速に実行することが可能なアレイプロセッサを提供することを課題とする。
上記課題を解決するために、本発明に係るアレイプロセッサは、積和演算機能を備えたプロセッシングエレメントを3つの軸方向にそれぞれn個ずつ配設することにより概念的な三次元配置状態を形成し、各プロセッシングエレメントに対して、前記軸方向に対応付けられた入力端子と出力端子とを各軸方向に対応付けて3組設け、同一軸方向に隣接配置される一のプロセッシングエレメントの当該軸方向における入力端子と他のプロセッシングエレメントの当該軸方向における出力端子とを接続することにより、各プロセッシングエレメントの3組の入力端子および出力端子を軸方向に対応させてそれぞれトーラス状に接続し、各プロセッシングエレメントでは、前記積和演算機能に基づいて積和演算を行った演算結果を、一の軸方向に対応する出力端子より当該一の軸方向に隣接する他のプロセッシングエレメントに出力すると共に、前記積和演算を行う際に用いた演算データを他の軸方向に対応する出力端子より当該他の軸方向に隣接する他のプロセッシングエレメントに出力し、前記演算結果と演算データとをそれぞれ異なる軸方向に隣接する他のプロセッシングエレメントより取得したプロセッシングエレメントでは、取得した前記演算結果と演算データとを用いて積和演算を行い、当該積和演算に基づく演算結果と前記演算データとを、それぞれ取得した入力端子に対応する出力端子よりそれぞれの軸方向に隣接する他のプロセッシングエレメントに対し出力することにより、一の軸方向に対してトーラス状に接続された全てのプロセッシングエレメントにおいて第一周期目のn回の積和演算処理を互いに同期させて実行し、該第一周期目のn回の積和演算処理の後に、各プロセッシングエレメントでは、前記演算結果を出力する出力端子の軸方向を変更すると共に、当該軸方向の変更に対応させて前記演算データを出力する出力端子の軸方向を変更して、第二周期目のn回の積和演算処理を互いに同期させて実行し、該第二周期目のn回の積和演算処理の後に、各プロセッシングエレメントでは、前記演算結果を出力する出力端子の軸方向を、第一周期目および第二周期目と異なる軸方向に変更すると共に、当該軸方向の変更に対応させて前記演算データを出力する出力端子の軸方向を第一周期目および第二周期目と異なる軸方向に変更して、第三周期目のn回の積和演算処理を互いに同期させて実行することによって、三次元直交変換処理を実行することを特徴とする。
このように、本発明に係るアレイプロセッサでは、各プロセッシングエレメントの入出力端子が軸方向に対応されてトーラス状に接続されているため、積和演算処理に伴う演算結果と演算処理に用いる演算データとをそれぞれ異なる軸方向に対して隣接する他のプロセッシングエレメントに順次送り出しながら(リレーのように順次伝搬させながら)、各プロセッシングエレメントにおいて個別に演算処理を行うことができる。従って、軸方向に配設されたn個のプロセッシングエレメントにおいて演算結果の送り出しを行いつつn回の演算処理を行うことにより、n回の積和演算を軸方向に沿って行うことができる。
また、直交変換処理を行うためには、データの掛け合わせの都合により、演算結果や演算データ等の入力順番を調整させて演算処理を行う必要があるが、第一周期目(第一回目)の演算処理が行われた後に、送り出しを行う軸方向を変更させることによって、容易にデータの入力順番の変更を行うことが可能となる。このため、従来のアレイプロセッサのように、データの入力順番を調整するための専用回路を設ける必要がなくなり、また、データの入替作業等を直接的に行うことなく直交変換処理を行うことが可能となる。
特に、本発明に係るアレイプロセッサは、3つの軸方向に対してそれぞれn個ずつ配設されたプロセッシングエレメントにより概念的な三次元配置状態が形成され、各プロセッシングエレメントに対して各軸方向に対応付けられた3組の入出力端子が設けられているため、3回の周期にわたりn回の積和演算処理を行うことができる。このため、上述したデータの入替処理などを直接的に行うことなく、迅速、確実かつ簡易に三次元直交変換処理を行うことが可能となる。
なお、本発明に係るアレイプロセッサでは、各プロセッシングエレメントが概念的な三次元配置状態を形成していればよいため、必ずしも物理的な立体形状を構成する必要はない。例えば、平面状に3つの軸を設けることによって、実際には平面的な配置状態において概念的な三次元配置状態を形成するものであってもよい。
また、前記アレイプロセッサにおいて、前記各プロセッシングエレメントが、前記積和演算に用いられる被演算値を記憶する1つの被演算値記憶手段と、前記入力端子を介して入力された前記演算結果または前記演算データを記憶する3つの入力情報記憶手段と、前記積和演算機能による演算方法に対応して決定される定数値を記憶する3つの定数値記憶手段と、前記演算結果と前記演算データと前記被演算値と前記定数値とのいずれかを用いて積和演算を行う演算処理手段と、前記3つの入力端子のいずれかより入力された情報を前記入力情報記憶手段または前記被演算値記憶手段のいずれかに案内する入力スイッチ手段と、前記演算データおよび前記演算処理手段により積和演算が行われた演算結果を前記3つの出力端子のいずれかよりそれぞれ出力させる出力スイッチ手段と、前記被演算値記憶手段と前記入力情報記憶手段と前記定数値記憶手段とのいずれかより3つのデータを読み出して前記演算処理手段に案内するセレクタ手段と、前記入力スイッチ手段、前記出力スイッチ手段および前記セレクタ手段の制御を行う制御手段とを有し、前記制御手段は、前記演算結果が前記入力端子を介して入力された場合に、前記入力スイッチ手段を制御して当該演算結果を前記入力情報記憶手段のいずれかに案内し、前記セレクタ手段を制御して当該入力情報記憶手段より読み出された演算結果を前記演算処理手段に案内し、一周期においてまだn回の演算処理が行われていない場合には、前記出力スイッチ手段を制御して前記演算処理手段により積和演算が行われた演算結果を、前記演算結果が入力された前記入力端子に対応する軸方向の出力端子より出力し、一周期においてn回目の演算処理が行われた場合には、前記出力スイッチ手段を制御して前記演算処理手段により積和演算が行われた演算結果を、前記演算結果が入力された前記入力端子とは異なる軸方向の出力端子より出力するものであってもよい。
このように、プロセッシングエレメントに対して、入力端子を介して取得されたデータを記録する入力情報記憶手段と被演算値を記憶する被演算値記憶手段とを設けることによって、これらの記憶手段を、n回の積和演算において内容が変更されたデータを記憶するための記憶手段(入力情報記憶手段)と、同一周期の処理では変更されないが、異なる周期において内容が変更されたデータを記録するための記憶手段として利用することが可能となる。従って、制御手段の制御に応じて入力スイッチ手段およびセレクタ手段を制御して、処理過程に応じて適切なデータを記憶手段に記憶(退避)させておくことができ、また、適切なタイミングで記憶(退避)されたデータを積和演算処理に利用させることが可能となる。このため結果として、データの入力順番を調整するための専用回路を設けることなく実質的なデータの入替処理を行うことができ、直交変換処理を迅速かつ容易に実行することが可能となる。
また、演算方法に対応して決定される定数値を記憶する定数値記憶手段が設けられているので、この定数値を演算方法に応じて変更することにより、さまざまな種類の三次元直交変換処理を実行することが可能となる。定数値を適宜変更することにより、例えば、後述する実施の形態において説明する離散コサイン変換の他に、ウォルシュ・アダマール変換、離散フーリエ変換、離散サイン変換等を行うことが可能となる。
さらに、制御手段が、入力スイッチ手段と、セレクタ手段と、出力スイッチ手段とを、積和演算処理に対応させて適宜制御することにより、3回の周期にわたるn回の積和演算処理を適切に行うことができるので、従来のようなデータの入力順番処理などを直接的に行うことなく、迅速、確実かつ簡易に三次元直交変換処理を行うことが可能となる。
本発明に係るアレイプロセッサによれば、各プロセッシングエレメントの入出力端子が軸方向に対応されてトーラス状に接続されているため、積和演算処理に伴う演算結果と演算処理に用いる演算データとをそれぞれ異なる軸方向に対して隣接する他のプロセッシングエレメントに順次送り出しながら(リレーのように順次伝搬させながら)、各プロセッシングエレメントにおいて個別に演算処理を行うことができる。従って、軸方向に配設されたn個のプロセッシングエレメントにおいて演算結果の送り出しを行いつつn回の演算処理を行うことにより、n回の積和演算を軸方向に沿って行うことができる。
また、直交変換処理を行うためには、データの掛け合わせの都合により、演算結果や演算データ等の入力順番を調整させて演算処理を行う必要があるが、第一周期目(第一回目)の演算処理が行われた後に、送り出しを行う軸方向を変更させることによって、第二周期目および第三周期目において、容易にデータの入力順番の変更を行うことが可能となる。このため、従来のアレイプロセッサのように、データの入力順番を調整するための専用回路を設ける必要がなくなり、入替作業等を直接的に行うことなく直交変換処理を行うことが可能となる。
実施の形態1および実施の形態2に係るアレイプロセッサの概略構成を模式的に示した図である。 実施の形態1に係るプロセッシングエレメントの概略構成を示したブロック図である。 実施の形態1に係るアレイプロセッサを用いて三次元離散コサイン変換処理を行う場合におけるレジスタR0〜R6の初期値および各処理ステップにおいて記録される内容を示した表である。 図3に示した表において、各レジスタの内容が変更される状態を処理ステップに応じて矢印で示したものである。 実施の形態1に係るアレイプロセッサを用いて三次元逆離散コサイン変換処理を行う場合におけるレジスタR0〜R6の初期値および各処理ステップにおいて記録される内容を示した表である。 図5に示した表において、各レジスタの内容が変更される状態を処理ステップに応じて矢印で示したものである。 実施の形態2に係るプロセッシングエレメントの概略構成を示したブロック図である。 実施の形態2に係るアレイプロセッサを用いて三次元離散コサイン変換処理を行う場合におけるレジスタR0〜R6の初期値および各処理ステップにおいて記録される内容を示した表である。 図8に示した表において、各レジスタの内容が変更される状態を処理ステップに応じて矢印で示したものである。 実施の形態2に係るアレイプロセッサを用いて三次元逆離散コサイン変換処理を行う場合におけるレジスタR0〜R6の初期値および各処理ステップにおいて記録される内容を示した表である。 図10に示した表において、各レジスタの内容が変更される状態を処理ステップに応じて矢印で示したものである。
以下、本発明に係るアレイプロセッサを、図面を用いて詳細に説明する。なお、後述する実施の形態1および実施の形態2では、三次元離散コサイン変換(3D Discrete Cosine Transform:3D―DCT)と三次元逆離散コサイン変換(3D Inverse Discrete Cosine Transform:3D−IDCT)とを計算するアレイプロセッサについて説明を行うが、本発明に係るアレイプロセッサは、この三次元離散コサイン変換および三次元逆離散コサイン変換の計算に用いるものだけには限定されず、上述した一般的な式(1)のCを適宜変更することによって、他の変換方式に基づく三次元直交変換処理を実行することができる。
[実施の形態1]
図1は、実施の形態1に係るアレイプロセッサを示した図である。アレイプロセッサ1は、8個のプロセッシングエレメントPEを有している。ここでプロセッシングエレメントPEとは、積和演算処理を行う役割を有するアレイプロセッサの演算構成部である。
プロセッシングエレメントPEは、縦方向、横方向、高さ方向(三軸方向)にそれぞれ2個ずつ配置されており、各プロセッシングエレメントPEは、直方体を成すアレイプロセッサ1の各頂点に一つずつ配置される構成となっている。
実施の形態1では、前述した縦方向をi軸方向、前述した横方向をj軸方向、前述した高さ方向をk軸方向とする。また、各プロセッシングエレメントPEは、それぞれを他のプロセッシングエレメントPEと区別するために、i軸、j軸、k軸により構成されるijk空間の座標位置を用いてPE(i,j,k)で特定される。
各プロセッシングエレメントPEは、図1及び図2に示すように、−i軸方向・−j軸方向・k軸方向に設けられる3つの入力端子(i入力端子、j入力端子、k入力端子)と、各入力端子(i入力端子、j入力端子、k入力端子)と対を成してそれぞれi軸方向・j軸方向・−k軸方向に設けられる3つの出力端子(i出力端子、j出力端子、k出力端子)とを有している。
各出力端子は、それぞれの出力端子の設置方向(軸方向)に隣接するプロセッシングエレメントPEの対向する(同軸方向に設けられた)入力端子に接続されている。例えば、PE(1,0,1)において−i軸方向に向けて設けられるi出力端子は、PE(0,0,1)においてi軸方向に向けて設けられるi入力端子と接続される。
また、対向する方向に他のプロセッシングエレメントPEが存在しない場合には、それぞれの軸方向に沿った配設位置の両端部に位置するプロセッシングエレメントPEの入力端子および出力端子を接続させることにより、同軸方向に設けられる入力端子および出力端子同士を接続したトーラス状を構成する。
従って、i軸方向に整列されたプロセッシングエレメントPEは、i出力端子より−i軸方向に隣接する他のプロセッシングエレメントPEのi入力端子に対してデータの出力を行うことが可能となっており、i座標が0となる空間位置に存在するプロセッシングエレメントは、そのi出力端子を、i軸方向の他端部側に位置するプロセッシングエレメントのi入力端子にトーラス状に接続させて、データを出力することが可能となっている。この構造は、それぞれj軸方向およびk軸方向に整列されたプロセッシングエレメントPEにおいても同様である。
このように、三次元空間に配置されたプロセッシングエレメントPEにおいて、それぞれ対応する軸方向に整列された隣接のプロセッシングエレメントPEに対してデータを順次出力することができる。このため、アレイプロセッサ1では、隣接するプロセッシングエレメントPEにおいて演算された算出結果のデータや、演算に用いる所定のデータなどを隣接する他のプロセッシングエレメントPEに順次リレーして、連続的な積和演算処理を、アレイプロセッサ1全体で行うことが可能となっている。
図2は、各プロセッシングエレメントPEの内部構成を示したブロック図である。プロセッシングエレメントPEは、7個のレジスタR0〜R6と、入力スイッチ部4と、セレクタ部5と、演算回路部6と、出力スイッチ部7と、制御回路部8とを有している。
レジスタR0〜R6は、三次元直交変換処理に用いるデータを記録することが可能となっている。レジスタR4、レジスタR5、レジスタR6には、式(1)に示したCのデータが記録される。このCは、実施の形態1に係るアレイプロセッサ1を用いて三次元直交変換処理を行う際に、その演算を行う処理方式に応じて決定される初期値であり、既に説明したように、Cの初期値を変更することによって、例えば、離散コサイン変換(DCT)、ウォルシュ・アダマール変換(WHT)、離散フーリエ変換(DFT)、離散サイン変換(DST)などの演算を行うことが可能となる。
実施の形態1に係るアレイプロセッサ1では、三次元離散コサイン変換(3D―DCT)に適した初期値(DCT係数(固定値))が設定される。具体的には、各プロセッシングエレメントのR4に次述するC(i,k)の値が初期値として記録され、レジスタR5に次述するC(k,j)の値が初期値として記録され、レジスタR6に次述するC(i,j)の値が初期値として記録される。
具体的に説明すると、プロセッシングエレメントPEの配置位置の座標位置(i,j,k)において、i=0であり、かつ、0≦k≦n―1であるプロセッシングエレメントPE(i,j,k)のレジスタR4には、
Figure 0005519951
が記録される。ここで、nは各軸方向に向けて配設されたプロセッシングエレメントPEの個数を示しており、実施の形態1では、i軸方向、j軸方向、k軸方向のそれぞれに対して2個ずつプロセッシングエレメントが配設されているため、以下、nは2(n=2)となる。
次に、1≦i≦n―1であり、かつ、0≦k≦1であるプロセッシングエレメントPE(i,j,k)のレジスタR4には、
Figure 0005519951
が記録される。
また、k=0であり、かつ、0≦j≦n―1であるプロセッシングエレメントPE(i,j,k)のレジスタR5には、
Figure 0005519951
が記録され、また、1≦k≦n−1であり、かつ、0≦j≦n―1であるプロセッシングエレメントPE(i,j,k)のレジスタR5には、
Figure 0005519951
が記録される。
さらに、また、i=0であり、かつ、0≦j≦n―1であるプロセッシングエレメントPE(i,j,k)のレジスタR6には、
Figure 0005519951
が記録され、また、1≦i≦n−1であり、かつ、0≦j≦n―1であるプロセッシングエレメントPE(i,j,k)のレジスタR6には、
Figure 0005519951
が記録される。
なお、レジスタR4〜R6に記録される上述した式(3)〜式(8)の設定値(定数値)は、演算処理が終了するまで変更されることなく同一の値が維持される。
次に、レジスタR1、R2、R3には、初期値として0が記録されている。また、レジスタR0には、三次元離散コサイン変換処理を行う三次元の入力データ、具体的には上述した式(1)のX(i,j,k)の値が記録されている。なお、図2に示すように、レジスタR0〜R3には、入力スイッチ部4を介してデータが案内される場合があり、この場合には各レジスタR0〜R3に新たなデータが上書き保存されてしまうため、演算処理に応じて記録されるデータが変更される可能性が生じる。このため、レジスタR0〜R3は、演算処理の処理経過に応じて演算結果、あるいは、演算に用いられる設定値が順次変更され得る。そして、後述するように、最終的にレジスタR3に対して、アレイプロセッサ1により演算された三次元直交変換処理の演算結果が記録される。
入力スイッチ部4は、3つの入力端子(i入力端子、j入力端子、k入力端子)より入力された情報を、制御回路部8の指示に応じて切り替えて、レジスタR0〜R3のいずれかに案内して記録させる役割を有している。実際に入力端子を介して入力されるデータは、3つの入力端子(i入力端子、j入力端子、k入力端子)のうちのいずれか2つの入力端子を介して入力される。制御回路部8では、入力された情報を入力端子の種類に応じて判断し、入力スイッチ部4を制御して、入力されたデータを、それぞれ該当するレジスタ(レジスタR0〜R3のいずれか)に案内して記録させる。
セレクタ部5は、レジスタR0〜R6のいずれか3つのレジスタより演算回路部6の演算処理に用いられるデータを取得して演算回路部6に出力する。セレクタ部5では、取得した3つのデータを、演算回路部6の演算内容に応じて設けられる3つの入力端子(a入力端子,b入力端子およびc入力端子)に出力する。なお、b入力端子に対して出力されたデータは、b入力端子を介して演算回路部6に入力されると共に、そのまま出力スイッチ部7へと出力される。セレクタ部5において、いずれのレジスタ(レジスタR0〜R6のうち3つのレジスタ)からデータを取得するか、および、取得したデータをa入力端子,b入力端子およびc入力端子のいずれに出力するかという判断処理は、制御回路部8の指示に応じて行われる。
演算回路部6では、a入力端子より取得したデータaと、b入力端子より取得したデータbと、c入力端子より取得したデータcとに基づいて、積和演算を行う。積和演算は、演算結果をdとすると、d=a×b+cによって求められる。演算結果dは、演算回路部6の出力端子10を介して出力スイッチ部7に出力される。
出力スイッチ部7は、セレクタ部5より演算回路部6のb入力端子に対して出力されたデータbと、演算回路部6の出力端子10を介して出力された演算結果dとを取得し、制御回路部8の指示に応じて、3つの出力端子(i出力端子、j出力端子、k出力端子)のいずれかよりデータbおよび演算結果dを出力させる役割を有している。実際に、出力端子を介して出力されるデータは、3つの出力端子(i出力端子、j出力端子、k出力端子)のうちいずれか2つの出力端子のみである。制御回路部8は、入力されたデータを判断し、出力スイッチ部7を制御することによって、データbおよび演算結果dを、それぞれ該当する出力端子(i出力端子、j出力端子、k出力端子のいずれか)に出力する。
制御回路部8は、上述した入力スイッチ部4、セレクタ部5、出力スイッチ部7の操作制御を行う役割を有している。制御回路部8は、入力スイッチ部4,セレクタ部5および出力スイッチ部7に入力されるデータを、その内容や入力された入力端子の種類に応じて判断し、アレイプロセッサ1の処理内容に応じて入力スイッチ部4、セレクタ部5、出力スイッチ部7の制御を行う。
なお、図2には示していないが、各プロセッシングエレメントPEには、レジスタR0に対して三次元離散コサイン変換処理を行うための入力データを入力し、また、レジスタR1〜R3に対して初期値0を入力し、さらに、レジスタR4〜R6に対して初期値C(i,k),C(k,j),C(i,j)を入力するためのデータ入力手段や、最終的な演算結果が記録されるレジスタR3よりデータを取得するためのデータ取得手段などが設けられている。
次に、各プロセッシングエレメントPEの制御回路部8が、入力スイッチ部4,セレクタ部5,および出力スイッチ部7を適宜制御することにより、三次元離散コサイン変換処理(3D―DCT処理)を行う過程を説明する。
図3は、各プロセッシングエレメントPE(i,j,k)における各レジスタR0〜R6の初期値および各処理ステップにおいて記録される内容が利用され、または変更されるレジスタを示した表であり、図4は、図3に示したレジスタの内容が変更される状態を、処理ステップに応じて矢印で示したものである。なお、図4に示した破線による矢印は後述するデータbに該当するデータの出力状態を示しており、実線による矢印は後述する演算結果dに該当するデータの出力状態を示している。
上述したレジスタR0〜R6の初期値の設定が行われた後、各プロセッシングエレメントPEの制御回路部8は、セレクタ部5を制御して、レジスタR4に記録されるデータを演算回路部6のa入力端子に出力させ、レジスタR0に記録されるデータを演算回路部6のb入力端子に出力させ、レジスタR1に記録されるデータを演算回路部6のc入力端子に出力させる処理を実行する。この処理において、図3および図4に示すように、レジスタR4に記録されるデータは、C(i,k)の初期値であり、レジスタR0に記録されるデータは、三次元離散コサイン変換処理を行うための入力データ:X(i,j,k)であり、レジスタR1に記録されるデータは、初期値の0である。
各プロセッシングエレメントPEの演算回路部6では、データaとして入力されたレジスタR4のデータと、データbとして入力されたレジスタR0のデータと、データcとして入力されたレジスタR1のデータとを用いて、積和演算(d=a×b+cの演算)を実行する。
次いで各プロセッシングエレメントPEの制御回路部8は、出力スイッチ部7を制御して演算結果dとデータbとを取得し、演算結果dをk軸方向に隣接するプロセッシングエレメントPEのk入力端子に出力し、また、データb(詳細には、レジスタR0に記録されていたデータ)を−i軸方向に隣接するプロセッシングエレメントPEのi入力端子に出力する。
そして、各プロセッシングエレメントPEの制御回路部8は、入力スイッチ部4を制御して、隣接するプロセッシングエレメントPEよりk入力端子を介して演算結果dを取得し、i入力端子を介してデータb(レジスタR0のデータ)とを取得して、演算結果dをレジスタR1に記録させるとともに、データb(レジスタR0のデータ)をレジスタR0に記録する。
このようにして、各プロセッシングエレメントPEの制御回路部8は、演算結果dおよびデータbを隣接したプロセッシングエレメントPEに対して出力する処理を、各軸方向に配設されるプロセッシングエレメントPEの配置個数に対応する回数、つまりn回(実施の形態1では2回)だけ繰り返し実行して、i入力端子およびi出力端子の接続によりトーラス状に接続された経路と、k入力端子およびk出力端子の接続によりトーラス状に接続された経路とに沿って、演算処理結果および所定のデータを一巡させる。この一巡の処理が第一周期目のn回の積和演算処理に該当する。
このn回の処理の繰り返しにより、各プロセッシングエレメントPEのレジスタR1には、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果が記録されることになる。実施の形態1では、n=2であるため、2回だけ上述の処理が行われる。図3および図4に示した「0」および「1」の処理ステップは、上述したこの2回の処理に該当する処理内容を示している。
続いて、各プロセッシングエレメントPEの制御回路部8は、セレクタ部5を制御して、レジスタR5に記録されるデータを演算回路部6のa入力端子に出力させ、レジスタR1に記録されるデータを演算回路部6のb入力端子に出力させ、レジスタR2に記録されるデータを演算回路部6のc入力端子に出力させる処理を実行する。この処理において、レジスタR5に記録されるデータは、C(k,j)の初期値であり、レジスタR1に記録されるデータは、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果であり、レジスタR2に記録されるデータは、初期値の0である。
各プロセッシングエレメントPEの演算回路部6では、データaとして入力されたレジスタR5のデータと、データbとして入力されたレジスタR1のデータと、データcとして入力されたレジスタR2のデータとを用いて、積和演算(d=a×b+cの演算)を実行する。
次いで各プロセッシングエレメントPEの制御回路部8は、出力スイッチ部7を制御して、演算結果dとデータbとを取得し、演算結果dを−j軸方向に隣接するプロセッシングエレメントPEのj入力端子に出力し、また、データb(詳細には、レジスタR1に記録されていたデータ)をk軸方向に隣接するプロセッシングエレメントPEのk入力端子に出力する。
そして、各プロセッシングエレメントPEの制御回路部8は、入力スイッチ部4を制御して、隣接するプロセッシングエレメントPEよりj入力端子を介して演算結果dを取得し、k入力端子を介してデータb(レジスタR1のデータ)を取得して、演算結果dをレジスタR2に記録させるとともに、データb(レジスタR1のデータ)をレジスタR1に記録する。
このようにして、各プロセッシングエレメントPEの制御回路部8は、演算結果dおよびデータbを隣接したプロセッシングエレメントPEに対して出力する処理を、各軸方向に配設されるプロセッシングエレメントPEの配置個数に対応する回数、つまりn回(実施の形態1では2回)だけ繰り返し実行して、j入力端子およびj出力端子の接続によりトーラス状に接続された経路と、k入力端子およびk出力端子の接続によりトーラス状に接続された経路とに沿って、演算処理結果および所定データを一巡させる。この一巡の処理が第二周期目のn回の積和演算処理に該当する。
このn回の処理の繰り返しにより、各プロセッシングエレメントPEのレジスタR2には、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果(第一周期目のn回の積和演算処理による演算結果)であるレジスタR1に基づいて、j軸方向に配設された全てのプロセッシングエレメントPEで積和演算された演算結果(第二周期目のn回の積和演算処理による演算結果)が記録され、レジスタR1には、k軸方向に配設された全てのプロセッシングエレメントにおいて積和演算された演算結果が記録されることになる。実施の形態1では、n=2であるため、2回だけ上述の処理が行われる。図3および図4に示した「2」および「3」の処理ステップは、上述したこの2回の処理に該当する処理内容を示している。
続いて、各プロセッシングエレメントPEの制御回路部8は、セレクタ部5を制御して、レジスタR6に記録されるデータを演算回路部6のa入力端子に出力させ、レジスタR2に記録されるデータを演算回路部6のb入力端子に出力させ、レジスタR3に記録されるデータを演算回路部6のc入力端子に出力させる処理を実行する。この処理において、レジスタR6に記録されるデータは、C(i,j)の初期値であり、レジスタR2に記録されるデータは、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果(第一周期目のn回の積和演算処理による演算結果)に基づいて、j軸方向に配設された全てのプロセッシングエレメントPEで積和演算された演算結果(第二周期目のn回の積和演算処理による演算結果)であり、レジスタR3に記録されるデータは、初期値の0である。
各プロセッシングエレメントPEの演算回路部6では、データaとして入力されたレジスタR6のデータと、データbとして入力されたレジスタR2のデータと、データcとして入力されたレジスタR3のデータとを用いて、積和演算(d=a×b+cの演算)を行う。
次いで各プロセッシングエレメントPEの制御回路部8は、出力スイッチ部7を制御して、演算結果dとデータbとを取得して、演算結果dを−i軸方向に隣接するプロセッシングエレメントPEのi入力端子に出力し、また、データb(詳細には、レジスタR2に記録されていたデータ)を−j軸方向に隣接するプロセッシングエレメントPEのj入力端子に出力する。
そして、各プロセッシングエレメントPEの制御回路部8は、入力スイッチ部4を制御して、隣接するプロセッシングエレメントPEよりi入力端子を介して演算結果dを取得し、j入力端子を介してデータb(レジスタR2のデータ)を取得して、演算結果dをレジスタR3に記録させるとともに、データb(レジスタR2のデータ)をR2に記録する。
このようにして、各プロセッシングエレメントPEの制御回路部8は、演算結果dおよびデータbを隣接したプロセッシングエレメントPEに対して出力する処理を、各軸方向に配設されるプロセッシングエレメントPEの配置個数に対応する回数、つまりn回(実施の形態1では2回)だけ繰り返し実行して、i入力端子およびi出力端子の接続によりトーラス状に接続された経路と、j入力端子およびj出力端子の接続によりトーラス状に接続された経路とに沿って、演算処理結果および所定データを一巡させる。この一巡の処理が第三周期目のn回の積和演算処理に該当する。
このn回の処理の繰り返しにより、各プロセッシングエレメントPEのレジスタR3には、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果(第一周期目のn回の積和演算処理による演算結果)に基づいて積和演算されたj軸方向に配設される全てのプロセッシングエレメントPEの積和演算結果(第二周期目のn回の積和演算処理による演算結果)を用いて、i軸方向に配設された全てのプロセッシングエレメントPEで演算処理した演算結果(第三周期目のn回の積和演算処理による演算結果)が記録され、レジスタR2には、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果(第一周期目のn回の積和演算処理による演算結果)に基づいて、j軸方向に配設された全てのプロセッシングエレメントPEで積和演算された演算結果(第二周期目のn回の積和演算処理による演算結果)が記録されることになる。実施の形態1では、n=2であるため、2回だけ上述の処理が行われる。図3および図4に示した「4」および「5」の処理ステップは、上述したこの2回の処理に該当する処理内容を示している。
このようにして実施の形態1に係るアレイプロセッサ1では、隣接するプロセッシングエレメントPEに対して、演算結果および積和演算に用いる所定データを順次出力してそれぞれのプロセッシングエレメントPEにおいて積和演算処理を行い、この隣接するプロセッシングエレメントPEへの演算結果の出力処理を、順次k軸方向、j軸方向、i軸方向へと出力方向を変えて処理を進めることにより、各演算回路部6における積和演算結果をレジスタR3に記録させることができる。従って、従来のアレイプロセッサのように、計算途中でデータや係数データの入力順番を調整するための専用回路を設ける必要がなく、回路構成の簡素化を図ることが可能となる。また、演算結果を隣接するプロセッシングエレメントPEに順次出力することによって三次元離散コサイン変換処理(三次元直交変換処理)を行うことが可能であるため、各次元の計算途中においてプロセッシングエレメントPEの内部に蓄えられるデータおよび係数行列要素を、従来のように複雑な配線構造を用いて何度も交換し合う必要がなく、処理の迅速化および簡素化を図ることが可能となる。
このように、実施の形態1に係るアレイプロセッサ1を用いることにより、従来の構成において必須とされていた計算途中におけるデータ同士の入替作業を行うことなくなる。また、複数のプロセッシングエレメントPEを接続させて演算結果処理を順次行うことにより、三次元離散コサイン変換処理(三次元離散直交変換処理)を迅速に実行することができ、さらに回路構成の複雑化を抑制することが可能となる。
次に、上述したアレイプロセッサ1を用いて、三次元逆離散コサイン変換(3D−IDCT)を計算する方法を説明する。なお、図5は、各プロセッシングエレメントPE(i,j,k)における各レジスタR0〜R6の初期値および各処理ステップにおいて記録されるレジスタを示した表であり、図6は、図5に示したレジスタの内容が変更される状態を、処理ステップに応じて矢印で示したものである。なお、図6に示した破線による矢印は、演算処理に用いられるデータbに該当するデータの出力状態を示しており、実線による矢印は演算結果dに該当するデータの出力状態を示している。
三次元逆離散コサイン変換を行う場合には、式(2)において三次元逆離散コサイン変換用の固定値(IDCT係数(固定値))として下記のようなC(k,j),C(i,k)およびC(i,j)が用いられ、それぞれの値がレジスタR4,R5,R6に初期値として記録される。
具体的に説明すると、プロセッシングエレメントPEの配置位置の座標位置(i,j,k)において、k=0であり、かつ、0≦j≦n―1であるプロセッシングエレメントPE(i,j,k)のレジスタR4には、
Figure 0005519951
が記録される。ここで、nは各軸方向に向けて配設されたプロセッシングエレメントPEの個数を示しており、実施の形態1では、以下、n=2となる。
次に、1≦k≦n―1であり、かつ、0≦j≦n−1であるプロセッシングエレメントPE(i,j,k)のレジスタR4には、
Figure 0005519951
が記録される。
また、i=0であり、かつ、0≦k≦n―1であるプロセッシングエレメントPE(i,j,k)のレジスタR5には、
Figure 0005519951
が記録され、また、1≦i≦n−1であり、かつ、0≦k≦n―1であるプロセッシングエレメントPE(i,j,k)のレジスタR5には、
Figure 0005519951
が記録される。
さらに、また、i=0であり、かつ、0≦j≦n―1であるプロセッシングエレメントPE(i,j,k)のレジスタR6には、
Figure 0005519951
が記録され、また、1≦i≦n−1であり、かつ、0≦j≦n―1であるプロセッシングエレメントPE(i,j,k)のレジスタR6には、
Figure 0005519951
が記録される。
また、レジスタR1、R2、R3には、初期値として0が記録されて、レジスタR0には、三次元逆離散コサイン変換処理を行う三次元の入力データ、具体的には上述した式(2)のY(i,j,k)の値が記録されている。
このレジスタR0〜R6の初期値の設定が行われた後、各プロセッシングエレメントPEの制御回路部8は、セレクタ部5を制御して、レジスタR4に記録されるデータを演算回路部6のa入力端子に出力させ、レジスタR0に記録されるデータを演算回路部6のb入力端子に出力させ、レジスタR1に記録されるデータを演算回路部6のc入力端子に出力させる処理を実行する。この処理において、レジスタR4に記録されるデータは、C(k,j)の初期値であり、レジスタR0に記録されるデータは、三次元逆離散コサイン変換処理を行うための入力データY(i,j,k)であり、レジスタR1に記録されるデータは、初期値の0である。
各プロセッシングエレメントPEの演算回路部6では、データaとして入力されたレジスタR4のデータと、データbとして入力されたレジスタR0のデータと、データcとして入力されたレジスタR1のデータとを用いて、積和演算(d=a×b+cの演算)を行う。
次いで各プロセッシングエレメントPEの制御回路部8は、出力スイッチ部7を制御して、演算結果dとデータbとを取得し、演算結果dをk軸方向に隣接するプロセッシングエレメントPEのk入力端子に出力し、また、データb(詳細には、レジスタR0に記録されていたデータ)を−j軸方向に隣接するプロセッシングエレメントPEのj入力端子に出力する。
そして、各プロセッシングエレメントPEの制御回路部8は、入力スイッチ部4を制御して、隣接するプロセッシングエレメントPEよりk入力端子を介して演算結果dを取得し、j入力端子を介してデータb(レジスタR0のデータ)を取得して、演算結果dをレジスタR1に記録させるとともに、データb(レジスタR0のデータ)をレジスタR0に記録する。
このようにして、各プロセッシングエレメントPEの制御回路部8は、演算結果dおよびデータbを隣接したプロセッシングエレメントPEに対して出力する処理を、各軸方向に配設されるプロセッシングエレメントPEの配置個数に対応する回数、つまりn回(実施の形態1では2回)だけ繰り返し実行して、k入力端子およびk出力端子の接続によりトーラス状に接続された経路と、j入力端子およびj出力端子の接続によりトーラス状に接続された経路とに沿って、演算処理結果および所定データを一巡させる。この一巡の処理が第一周期目のn回の積和演算処理に該当する。
このn回の処理の繰り返しにより、各プロセッシングエレメントPEのレジスタR1には、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果(第一周期目のn回の積和演算処理による演算結果)が記録されることになる。実施の形態1では、n=2であるため、2回だけ上述の処理が行われる。図5および図6に示した「0」および「1」の処理ステップは、上述したこの2回の処理に該当する処理内容を示している。
続いて、各プロセッシングエレメントPEの制御回路部8は、セレクタ部5を制御して、レジスタR5に記録されるデータを演算回路部6のa入力端子に出力させ、レジスタR1に記録されるデータを演算回路部6のb入力端子に出力させ、レジスタR2に記録されるデータを演算回路部6のc入力端子に出力させる処理を実行する。この処理において、レジスタR5に記録されるデータは、C(i,k)の初期値であり、レジスタR1に記録されるデータは、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果であり、レジスタR2に記録されるデータは、初期値の0である。
各プロセッシングエレメントPEの演算回路部6では、データaとして入力されたレジスタR5のデータと、データbとして入力されたレジスタR1のデータと、データcとして入力されたレジスタR2のデータとを用いて、積和演算(d=a×b+cの演算)を実行する。
次いで各プロセッシングエレメントPEの制御回路部8は、出力スイッチ部7を制御して、演算結果dとデータbとを取得し、演算結果dを−i軸方向に隣接するプロセッシングエレメントPEのi入力端子に出力し、また、データb(詳細には、レジスタR1に記録されていたデータ)をk軸方向に隣接するプロセッシングエレメントPEのk入力端子に出力する。
そして、各プロセッシングエレメントPEの制御回路部8は、入力スイッチ部4を制御して、隣接するプロセッシングエレメントPEよりi入力端子を介して演算結果dを取得し、k入力端子を介してデータb(レジスタR1のデータ)を取得して、演算結果dをレジスタR2に記録させるとともに、データb(レジスタR1のデータ)をレジスタR1に記録する。
このようにして、各プロセッシングエレメントPEの制御回路部8は、演算結果dおよびデータbを隣接したプロセッシングエレメントPEに対して出力する処理を、各軸方向に配設されるプロセッシングエレメントPEの配置個数に対応する回数、つまりn回(実施の形態1では2回)だけ繰り返し実行して、i入力端子およびi出力端子の接続によりトーラス状に接続された経路と、k入力端子およびk出力端子の接続によりトーラス状に接続された経路とに沿って、演算処理結果および所定データを一巡させる。この一巡の処理が第二周期目のn回の積和演算処理に該当する。
このn回の処理の繰り返しにより、各プロセッシングエレメントPEのレジスタR2には、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果(第一周期目のn回の積和演算処理による演算結果)であるレジスタR1に基づいて、i軸方向に配設された全てのプロセッシングエレメントPEで積和演算された演算結果(第二周期目のn回の積和演算処理による演算結果)が記録され、レジスタR1には、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果が記録されることになる。図5および図6に示した「2」および「3」の処理ステップは、上述したこの2回の処理に該当する処理内容を示している。
続いて、各プロセッシングエレメントPEの制御回路部8は、セレクタ部5を制御して、レジスタR6に記録されるデータを演算回路部6のa入力端子に出力させ、レジスタR2に記録されるデータを演算回路部6のb入力端子に出力させ、レジスタR3に記録されるデータを演算回路部6のc入力端子に出力させる処理を実行する。この処理において、レジスタR6に記録されるデータは、C(i,j)の初期値であり、レジスタR2に記録されるデータは、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果(第一周期目のn回の積和演算処理による演算結果)に基づいて、i軸方向に配設された全てのプロセッシングエレメントPEで積和演算された演算結果(第二周期目のn回の積和演算処理による演算結果)であり、レジスタR3に記録されるデータは、初期値の0である。
各プロセッシングエレメントPEの演算回路部6では、データaとして入力されたレジスタR6のデータと、データbとして入力されたレジスタR2のデータと、データcとして入力されたレジスタR3のデータとを用いて、積和演算(d=a×b+cの演算)を行う。
次いで各プロセッシングエレメントPEの制御回路部8は、出力スイッチ部7を制御して、演算結果dとデータbとを取得して、演算結果dを−j軸方向に隣接するプロセッシングエレメントPEのj入力端子に出力し、また、データb(詳細には、レジスタR2に記録されていたデータ)を−i軸方向に隣接するプロセッシングエレメントPEのi入力端子に出力する。
そして、各プロセッシングエレメントPEの制御回路部8は、入力スイッチ部4を制御して、隣接するプロセッシングエレメントPEよりj入力端子を介して演算結果dを取得し、i入力端子を介してデータb(レジスタR2のデータ)を取得して、演算結果dをレジスタR3に記録させるとともに、データb(レジスタR2のデータ)をレジスタR2に記録する。
このようにして、各プロセッシングエレメントPEの制御回路部8は、演算結果dおよびデータbを隣接したプロセッシングエレメントPEに対して出力する処理を、各軸方向に配設されるプロセッシングエレメントPEの配置個数に対応する回数、つまりn回(実施の形態1では2回)だけ繰り返し実行して、j入力端子およびj出力端子の接続によりトーラス状に接続された経路と、i入力端子およびi出力端子の接続によりトーラス状に接続された経路とに沿って、演算処理結果および所定データを一巡させる。この一巡の処理が第三周期目のn回の積和演算処理に該当する。
このn回の処理の繰り返しにより、各プロセッシングエレメントPEのレジスタR3には、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果(第一周期目のn回の積和演算処理による演算結果)に基づいて積和演算されたi軸方向に配設される全てのプロセッシングエレメントPEの積和演算結果(第二周期目のn回の積和演算処理による演算結果)を用いて、j軸方向に配設された全てのプロセッシングエレメントPEで演算処理した演算結果(第三周期目のn回の積和演算処理による演算結果)が記録され、レジスタR2には、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果(第一周期目のn回の積和演算処理による演算結果)に基づいて、i軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果(第二周期目のn回の積和演算処理による演算結果)が記録されることになる。実施の形態1では、n=2であるため、2回だけ上述の処理が行われる。図5および図6に示した「4」および「5」の処理ステップは、上述したこの2回の処理に該当する処理内容を示している。
このようにして実施の形態1に係るアレイプロセッサ1では、隣接するプロセッシングエレメントPEに対して、演算結果および積和演算に用いる所定データを順次出力してそれぞれのプロセッシングエレメントPEにおいて積和演算処理を行い、この隣接するプロセッシングエレメントPEへの演算結果の出力処理を、順次k軸方向、i軸方向、j軸方向へと出力方向を変えて処理を進めることにより、各演算回路部6における積和演算結果をレジスタR3に記録させることができる。従って、従来のアレイプロセッサ1のように、計算途中でデータや係数データの入力順番を調整するための専用回路を設ける必要がなく、回路構成の簡素化を図ることが可能となる。また、演算結果を隣接するプロセッシングエレメントPEに順次出力することによって三次元逆離散コサイン変換処理(三次元逆直交変換処理)を行うことが可能であるため、各次元の計算途中においてプロセッシングエレメントPEの内部に蓄えられるデータおよび係数行列要素を、従来のように複雑な配線構造を用いて何度も交換し合う必要がなく、処理の迅速化および簡素化を図ることが可能となる。
このように、実施の形態1に係るアレイプロセッサ1を用いることにより、従来の構成において必須とされていた計算途中におけるデータ同士の入替作業を行うことがなくなる。また、複数のプロセッシングエレメントを接続させて演算結果処理を順次行うことにより、三次元逆離散コサイン変換処理(三次元逆離散直交変換処理)を迅速に実行することができ、さらに回路構成の複雑化を抑制することが可能となる。
[実施の形態2]
次に、実施の形態2に係るアレイプロセッサについて説明を行う。実施の形態2に係るアレイプロセッサ1は、図1に示した実施の形態1に係るアレイプロセッサ1を構成するプロセッシングエレメントPEの構成状態(各プロセッシングエレメントPEの接続状態・配置状態)と同様の構成状態であるが、アレイプロセッサを構成するプロセッシングエレメントPEの内部構造が異なっている。
図7は、実施の形態2に係るプロセッシングエレメントPEの概略構成を模式的に示した図である。実施の形態2に係るプロセッシングエレメントPEは、実施の形態1に係るプロセッシングエレメントPE(図2参照)と比較して、セレクタ部15から演算回路部16のa入力端子に対して出力されるデータが、演算回路部16のa入力端子だけでなく出力スイッチ部17にも出力することができるように構成される点で相違する。このため、実施の形態2に係るプロセッシングエレメントPEでは、実施の形態1に係るプロセッシングエレメントPEに比べて、出力スイッチ部17へと延設される出力端子の端子数が1本多いという特徴を有している。
また、実施の形態2に係るアレイプロセッサ1では、追加されたa入力端子からの入出力信号に応じて出力スイッチ部17や他の要素を制御するために、制御回路部18が設けられている。なお、出力スイッチ部17と制御回路部18以外の各要素、すなわち入力スイッチ部14,セレクタ部15,演算回路部16およびレジスタR0〜R6は、実施の形態1に係るプロセッシングエレメントPEと同一構成である。
本構成のアレイプロセッサを用いて三次元離散コサイン変換処理(3D−DCT処理)を行う方法を説明する。
まず、各プロセッシングエレメントPE内のレジスタR4〜R6には、式3〜式8に基づいて求められた値が初期値として設定される。なお、これら値は定数であり、全ての演算が終了するまで変更されることはない。また、レジスタR1〜R3には、初期値として0が記録される。さらに、レジスタR0には、三次元離散コサイン変換処理(3D−DCT処理)を行う三次元の入力データ、具体的には前述した式(1)のX(m,j,k)の値が記録されている。ここで、mは、m=(−i−j+k)mod_nで計算される値であり、mod_nはnのモジュロ演算を表している。なお、mは、(−i−j+k)をnで割った余りであり、nは、三次元の入力データn×n×nのサイズ、すなわち、アレイプロセッサ1のサイズを示している。実施の形態2に係るプロセッシングエレメントPEでは、図1に示すようにn=2である。
さらに、図7に示すように、レジスタR0〜R3には、入力スイッチ部14を介してデータが案内される場合があり、この場合には各レジスタR0〜R3に新たなデータが上書き保存されてしまう。このため、後述するように、レジスタR0〜R3は、演算処理に応じて記録されるデータが変更される可能性があり、演算処理の処理経過に応じて演算結果、あるいは、演算に用いられる設定値が順次変更される。そして、最終的には、アレイプロセッサ1によって演算された三次元離散コサイン変換処理(3D−DCT処理)の演算結果が、レジスタR3に記録されることになる。
入力スイッチ部14は、制御回路部18の指示に応じて、3つの入力端子(i入力端子、j入力端子、k入力端子)を切り替えることにより、3つの入力端子を介して隣接するプロセッシングエレメントPEより入力されたデータを、レジスタR0〜R3のいずれかに案内して記録させる役割を有している。実際に入力端子を介して入力されるデータは、3つの入力端子(i入力端子、j入力端子、k入力端子)のうちのいずれか2つの入力端子を介して入力される。制御回路部18では、入力された情報を入力端子の種類に応じて判断し、入力スイッチ部14を制御して、入力されたデータを、それぞれ該当するレジスタ(レジスタR0〜R3のいずれか)に案内して記録させる。
セレクタ部15は、レジスタR0〜R6のいずれか3つのレジスタより演算回路部16の演算処理に用いられるデータを取得して演算回路部16に出力する。セレクタ部15では、取得した3つのデータを、演算回路部16の演算内容に応じて設けられる3つの入力端子(a入力端子,b入力端子およびc入力端子)に出力する。なお、a入力端子およびb入力端子に対して出力されたデータは、a入力端子およびb入力端子を介して演算回路部16に入力されると共に、そのまま出力スイッチ部17へと出力される。セレクタ部15において、いずれのレジスタ(レジスタR0〜R6のうち3つのレジスタ)からデータを取得するか、および、取得したデータをa入力端子,b入力端子およびc入力端子のいずれに出力するかという判断処理は、制御回路部18の指示に応じて行われる。
演算回路部16では、a入力端子より取得したデータaと、b入力端子より取得したデータbと、c入力端子より取得したデータcとに基づいて、積和演算を行う。積和演算は、演算結果をdとすると、d=a×b+cによって求められる。演算結果dは、演算回路部16の出力端子20を介して出力スイッチ部17に出力される。
出力スイッチ部17は、セレクタ部15より演算回路部16のa入力端子に対して出力され、さらに、出力端子21を介して出力スイッチ部17へ出力されたデータaと、演算回路部16のb入力端子に対して出力され、さらに、出力端子22を介して出力スイッチ部17へ出力されたデータbと、演算回路部16の出力端子20を介して出力スイッチ部17へ出力された演算結果dとを取得し、制御回路部18の指示に応じて、3つの出力端子(i出力端子、j出力端子、k出力端子)のいずれか2つの端子より、データaまたはデータbのいずれか一方と、演算結果dとを出力させる役割を有している。このため、実際に出力端子を介して出力されるデータは、3つの出力端子(i出力端子、j出力端子、k出力端子)のうちいずれか2つの出力端子のみになる。制御回路部18は、入力されたデータを判断し、出力スイッチ部17を制御することによって、データaまたはデータbのいずれか一方と、演算結果dとを、それぞれ該当する出力端子(i出力端子、j出力端子、k出力端子のいずれか)に出力する。
制御回路部18は、上述した入力スイッチ部14、セレクタ部15、出力スイッチ部17の操作制御を行う役割を有している。制御回路部18は、入力スイッチ部14,セレクタ部15および出力スイッチ部17に入力されるデータを、その内容や入力された入力端子の種類に応じて判断し、アレイプロセッサ1の処理内容に応じて入力スイッチ部14、セレクタ部15、出力スイッチ部17の制御を行う。
なお、図7には示していないが、各プロセッシングエレメントPEには、レジスタR0に対して三次元離散コサイン変換処理を行うための入力データを入力し、また、レジスタR1〜R3に対して初期値0を入力し、さらに、レジスタR4〜R6に対して初期値C(i,k),C(k,j),C(i,j)を入力するためのデータ入力手段や、最終的な演算結果が記録されるレジスタR3よりデータを取得するためのデータ取得手段などが設けられている。
次に、各プロセッシングエレメントPEの制御回路部18が、入力スイッチ部14,セレクタ部15,および出力スイッチ部17を適宜制御することにより、三次元直交変換の一つである三次元離散コサイン変換処理(3D―DCT処理)を行う過程を説明する。
図8は、各プロセッシングエレメントPE(i,j,k)における各レジスタR0〜R6の初期値および各処理ステップにおいて記録される内容が利用され、または変更されるレジスタを示した表である。レジスタR0には、X(m,j,k)が設定される。但し、mの値には、m=(−i−j+k)mod_2で求められる値が用いられる。このため、プロセッシングエレメントPE(0,0,0)のレジスタR0にはX(0,0,0)が設定され、プロセッシングエレメントPE(0,1,0)のレジスタR0にはX(1,1,0)が設定される。また、プロセッシングエレメントPE(1,0,0)のレジスタR0にはX(1,0,0)が設定され、プロセッシングエレメントPE(1,1,0)のレジスタR0にはX(0,1,0)が設定される。さらに、プロセッシングエレメントPE(0,0,1)のレジスタR0にはX(1,0,1)が設定され、プロセッシングエレメントPE(0,1,1)のレジスタR0にはX(0,1,1)が設定される。また、プロセッシングエレメントPE(1,0,1)のレジスタR0にはX(0,0,1)が設定され、プロセッシングエレメントPE(1,1,1)のレジスタR0にはX(1,1,1)が設定される。
その他の各レジスタの初期値は、実施の形態1において説明した値と同様とする。図9は、図8に示したレジスタR0〜R6の内容が変更される状態を、処理ステップに応じて矢印で示したものである。なお、図9に示した破線による矢印は、後述するデータaまたはデータbのいずれか一方であって、後述する処理において用いられるデータの出力状態を示している。また、実線による矢印は、後述する演算結果dに該当するデータの出力状態を示している。
上述したレジスタR0〜R6の初期値の設定が行われた後、各プロセッシングエレメントPEの制御回路部18は、セレクタ部15を制御して、レジスタR4に記録されるデータを演算回路部16のa入力端子に出力させ、レジスタR0に記録されるデータを演算回路部16のb入力端子に出力させ、レジスタR1に記録されるデータを演算回路部16のc入力端子に出力させる処理を実行する。この処理において、図8および図9に示すように、レジスタR4に記録されるデータは、C(i,k)の初期値であり、レジスタR0に記録されるデータは、三次元離散コサイン変換処理を行うための入力データ:X(m,j,k)、ただし、m=(−i−j+k)mod_2であり、レジスタR1に記録されるデータは、初期値の0である。
各プロセッシングエレメントPEの演算回路部16では、データaとして入力されたレジスタR4のデータと、データbとして入力されたレジスタR0のデータと、データcとして入力されたレジスタR1のデータとを用いて、積和演算(d=a×b+cの演算)を実行する。
次いで各プロセッシングエレメントPEの制御回路部18は、出力スイッチ部17を制御して演算結果d、データaおよびデータbとを取得し、演算結果dをk軸方向に隣接するプロセッシングエレメントPEのk入力端子に出力し、また、データb(詳細には、レジスタR0に記録されていたデータ)を−i軸方向に隣接するプロセッシングエレメントPEのi入力端子に出力する。なお、取得されたデータaに関しては、隣接するプロセッシングエレメントPEに対して出力されない。
そして、各プロセッシングエレメントPEの制御回路部18は、入力スイッチ部14を制御して、隣接するプロセッシングエレメントPEよりk入力端子を介して演算結果dを取得し、i入力端子を介してデータb(レジスタR0のデータ)とを取得して、演算結果dをレジスタR1に記録させるとともに、データb(レジスタR0のデータ)をレジスタR0に記録する。
このようにして、各プロセッシングエレメントPEの制御回路部18は、演算結果dおよびデータbを隣接したプロセッシングエレメントPEに対して出力する処理を、各軸方向に配設されるプロセッシングエレメントPEの配置個数に対応する回数、つまりn回(実施の形態2では2回)だけ繰り返し実行して、i入力端子およびi出力端子の接続によりトーラス状に接続された経路と、k入力端子およびk出力端子の接続によりトーラス状に接続された経路とに沿って、演算処理結果および所定のデータを一巡させる。この一巡の処理が第一周期目のn回の積和演算処理に該当する。なお、第一周期目のn回の積和演算処理において、出力端子21を介して出力スイッチ部17に入力されたデータaは、隣接するプロセッシングエレメントPEに対して出力されることはない。
このn回の処理の繰り返しにより、各プロセッシングエレメントPEのレジスタR1には、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果が記録されることになる。実施の形態2では、n=2であるため、2回だけ上述の処理が行われる。図8および図9に示した「0」および「1」の処理ステップは、上述したこの2回の処理に該当する処理内容を示している。
続いて、各プロセッシングエレメントPEの制御回路部18は、セレクタ部15を制御して、レジスタR1に記録されるデータを演算回路部16のa入力端子に出力させ、レジスタR5に記録されるデータを演算回路部16のb入力端子に出力させ、レジスタR2に記録されるデータを演算回路部16のc入力端子に出力させる処理を実行する。この処理において、レジスタR5に記録されるデータは、C(k,j)の初期値であり、レジスタR1に記録されるデータは、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果であり、レジスタR2に記録されるデータは、初期値の0である。
各プロセッシングエレメントPEの演算回路部16では、データaとして入力されたレジスタR1のデータと、データbとして入力されたレジスタR5のデータと、データcとして入力されたレジスタR2のデータとを用いて、積和演算(d=a×b+cの演算)を実行する。
次いで各プロセッシングエレメントPEの制御回路部18は、出力スイッチ部17を制御して、演算結果d、データaおよびデータbを取得し、演算結果dを−j軸方向に隣接するプロセッシングエレメントPEのj入力端子に出力し、また、データa(詳細には、レジスタR1に記録されていたデータ)をk軸方向に隣接するプロセッシングエレメントPEのk入力端子に出力する。なお、取得されたデータbに関しては、隣接するプロセッシングエレメントPEに対して出力されない。
そして、各プロセッシングエレメントPEの制御回路部18は、入力スイッチ部14を制御して、隣接するプロセッシングエレメントPEよりj入力端子を介して演算結果dを取得し、k入力端子を介してデータa(レジスタR1のデータ)を取得して、演算結果dをレジスタR2に記録させるとともに、データa(レジスタR1のデータ)をレジスタR1に記録する。
このようにして、各プロセッシングエレメントPEの制御回路部18は、演算結果dおよびデータaを隣接したプロセッシングエレメントPEに対して出力する処理を、各軸方向に配設されるプロセッシングエレメントPEの配置個数に対応する回数、つまりn回(実施の形態2では2回)だけ繰り返し実行して、j入力端子およびj出力端子の接続によりトーラス状に接続された経路と、k入力端子およびk出力端子の接続によりトーラス状に接続された経路とに沿って、演算処理結果および所定データを一巡させる。この一巡の処理が第二周期目のn回の積和演算処理に該当する。なお、第二周期目のn回の積和演算処理において、出力端子22を介して出力スイッチ部17に入力されたデータbは、隣接するプロセッシングエレメントPEに対して出力されることはない。
このn回の処理の繰り返しにより、各プロセッシングエレメントPEのレジスタR2には、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果(第一周期目のn回の積和演算処理による演算結果)であるレジスタR1に基づいて、j軸方向に配設された全てのプロセッシングエレメントPEで積和演算された演算結果(第二周期目のn回の積和演算処理による演算結果)が記録され、レジスタR1には、k軸方向に配設された全てのプロセッシングエレメントにおいて積和演算された演算結果が記録されることになる。実施の形態2では、n=2であるため、2回だけ上述の処理が行われる。図8および図9に示した「2」および「3」の処理ステップは、上述したこの2回の処理に該当する処理内容を示している。
続いて、各プロセッシングエレメントPEの制御回路部18は、セレクタ部15を制御して、レジスタR2に記録されるデータを演算回路部16のa入力端子に出力させ、レジスタR6に記録されるデータを演算回路部16のb入力端子に出力させ、レジスタR3に記録されるデータを演算回路部16のc入力端子に出力させる処理を実行する。この処理において、レジスタR6に記録されるデータは、C(i,j)の初期値であり、レジスタR2に記録されるデータは、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果(第一周期目のn回の積和演算処理による演算結果)に基づいて、j軸方向に配設された全てのプロセッシングエレメントPEで積和演算された演算結果(第二周期目のn回の積和演算処理による演算結果)であり、レジスタR3に記録されるデータは、初期値の0である。
各プロセッシングエレメントPEの演算回路部16では、データaとして入力されたレジスタR2のデータと、データbとして入力されたレジスタR6のデータと、データcとして入力されたレジスタR3のデータとを用いて、積和演算(d=a×b+cの演算)を行う。
次いで各プロセッシングエレメントPEの制御回路部18は、出力スイッチ部17を制御して、演算結果d、データaおよびデータbとを取得して、演算結果dを−i軸方向に隣接するプロセッシングエレメントPEのi入力端子に出力し、また、データa(詳細には、レジスタR2に記録されていたデータ)を−j軸方向に隣接するプロセッシングエレメントPEのj入力端子に出力する。なお、取得されたデータbに関しては、隣接するプロセッシングエレメントPEに対して出力されない。
そして、各プロセッシングエレメントPEの制御回路部18は、入力スイッチ部14を制御して、隣接するプロセッシングエレメントPEよりi入力端子を介して演算結果dを取得し、j入力端子を介してデータa(レジスタR2のデータ)を取得して、演算結果dをレジスタR3に記録させるとともに、データa(レジスタR2のデータ)をレジスタR2に記録する。
このようにして、各プロセッシングエレメントPEの制御回路部18は、演算結果dおよびデータaを隣接したプロセッシングエレメントPEに対して出力する処理を、各軸方向に配設されるプロセッシングエレメントPEの配置個数に対応する回数、つまりn回(実施の形態2では2回)だけ繰り返し実行して、i入力端子およびi出力端子の接続によりトーラス状に接続された経路と、j入力端子およびj出力端子の接続によりトーラス状に接続された経路とに沿って、演算処理結果および所定データを一巡させる。この一巡の処理が第三周期目のn回の積和演算処理に該当する。なお、第三周期目のn回の積和演算処理において、出力端子22を介して出力スイッチ部17に入力されたデータbは、隣接するプロセッシングエレメントPEに対して出力されることはない。
このn回の処理の繰り返しにより、各プロセッシングエレメントPEのレジスタR3には、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果(第一周期目のn回の積和演算処理による演算結果)に基づいて積和演算されたj軸方向に配設される全てのプロセッシングエレメントPEの積和演算結果(第二周期目のn回の積和演算処理による演算結果)を用いて、i軸方向に配設された全てのプロセッシングエレメントPEで演算処理した演算結果(第三周期目のn回の積和演算処理による演算結果)が記録される。これは、すなわち、三次元離散コサイン変換の計算結果である。また、レジスタR2には、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果(第一周期目のn回の積和演算処理による演算結果)に基づいて、j軸方向に配設された全てのプロセッシングエレメントPEで積和演算された演算結果(第二周期目のn回の積和演算処理による演算結果)が記録されることになる。これは、すなわち、i軸方向およびj軸方向で構成される二次元の離散コサイン変換の計算結果である。さらに、レジスタR1には、i軸方向の一次元の離散コサイン変換の計算結果が記録されることになる。実施の形態2では、n=2であるため、2回だけ上述の処理が行われる。図8および図9に示した「4」および「5」の処理ステップは、上述したこの2回の処理に該当する処理内容を示している。
このようにして実施の形態2に係るアレイプロセッサ1では、隣接するプロセッシングエレメントPEに対して、演算結果および積和演算に用いる所定データを順次出力してそれぞれのプロセッシングエレメントPEにおいて積和演算処理を行い、この隣接するプロセッシングエレメントPEへの演算結果の出力処理を、順次k軸方向、j軸方向、i軸方向へと出力方向を変えて処理を進めることにより、各演算回路部16における積和演算結果をレジスタR3に記録させることができる。従って、従来のアレイプロセッサのように、計算途中でデータや係数データの入力順番を調整するための専用回路を設ける必要がなく、回路構成の簡素化を図ることが可能となる。また、演算結果を隣接するプロセッシングエレメントPEに順次出力することによって三次元離散コサイン変換処理(三次元直交変換処理)を行うことが可能であるため、各次元の計算途中においてプロセッシングエレメントPEの内部に蓄えられるデータおよび係数行列要素を、従来のように複雑な配線構造を用いて何度も交換し合う必要がなく、処理の迅速化および簡素化を図ることが可能となる。
このように、実施の形態2に係るアレイプロセッサ1を用いることにより、従来の構成において必須とされていた計算途中におけるデータ同士の入替作業を行うことなくなる。また、複数のプロセッシングエレメントPEを接続させて演算結果処理を順次行うことにより、三次元離散コサイン変換処理(三次元直交変換処理)を迅速に実行することができ、さらに回路構成の複雑化を抑制することが可能となる。
次に、上述したアレイプロセッサ1を用いて、三次元逆離散コサイン変換(3D−IDCT)を計算する方法を説明する。なお、図10は、各プロセッシングエレメントPE(i,j,k)における各レジスタR0〜R6の初期値および各処理ステップにおいて記録されるレジスタを示した表であり、図11は、図10に示したレジスタの内容が変更される状態を、処理ステップに応じて矢印で示したものである。なお、図11に示した破線による矢印は、演算処理に用いられるデータaまたはデータbのいずれか一方であって、後述する処理において用いられるデータの出力状態を示している。また、実線による矢印は、演算結果dに該当するデータの出力状態を示している。
まず始めに、各プロセッシングエレメントPE内のレジスタR0〜R6の初期値を設定する。ここで、レジスタR4、R5、R6には、式9〜式14により求められる値が初期値として設定される。こららは、定数であり、演算終了まで変更されることはない。
また、レジスタR1〜R3には、初期値として0が記録され、レジスタR0には、三次元逆離散コサイン変換処理(3D−IDCT処理)を行う三次元の入力データ、具体的には上述した式(2)のY(i,m,k)の値が記録されている。ここで、mは、m=(−i−j+k)mod_nで計算される値であり、mod_nはnのモジュロ演算を表す。すなわち,mは、(−i−j+k)をnで割った余りである。また、nは、三次元の入力データn×n×nのサイズ、すなわち、アレイプロセッサ1のサイズを示している。実施の形態2に係るプロセッシングエレメントPEでは、図1に示すようにn=2である。
従って、プロセッシングエレメントPE(0,0,0)のレジスタR0にはY(0,0,0)が設定され、プロセッシングエレメントPE(0,1,0)のレジスタR0にはY(0,1,0)が設定される。また、プロセッシングエレメントPE(1,0,0)のレジスタR0にはY(1,1,0)が設定され、プロセッシングエレメントPE(1,1,0)のレジスタR0にはY(1,0,0)が設定される。さらに、プロセッシングエレメントPE(0,0,1)のレジスタR0にはY(0,1,1)が設定され、プロセッシングエレメントPE(0,1,1)のレジスタR0にはY(0,0,1)が設定される。また、プロセッシングエレメントPE(1,0,1)のレジスタR0にはY(1,0,1)が設定され、プロセッシングエレメントPE(1,1,1)のレジスタR0にはY(1,1,1)が設定される。
このレジスタR0〜R6の初期値の設定が行われた後、各プロセッシングエレメントPEの制御回路部18は、セレクタ部15を制御して、レジスタR0に記録されるデータを演算回路部16のa入力端子に出力させ、レジスタR4に記録されるデータを演算回路部16のb入力端子に出力させ、レジスタR1に記録されるデータを演算回路部16のc入力端子に出力させる処理を実行する。この処理において、レジスタR4に記録されるデータは、C(k,j)の初期値であり、レジスタR0に記録されるデータは、三次元逆離散コサイン変換処理(3D−IDCT処理)を行うための入力データY(i,m,k)、ただしm=(−i−j+k)mod_n、であり、レジスタR1に記録されるデータは、初期値の0である。
各プロセッシングエレメントPEの演算回路部16では、データaとして入力されたレジスタR0のデータと、データbとして入力されたレジスタR4のデータと、データcとして入力されたレジスタR1のデータとを用いて、積和演算(d=a×b+cの演算)を行う。
次いで各プロセッシングエレメントPEの制御回路部18は、出力スイッチ部17を制御して、演算結果d、データaおよびデータbを取得し、演算結果dをk軸方向に隣接するプロセッシングエレメントPEのk入力端子に出力し、また、データa(詳細には、レジスタR0に記録されていたデータ)を−j軸方向に隣接するプロセッシングエレメントPEのj入力端子に出力する。なお、取得されたデータbに関しては、隣接するプロセッシングエレメントPEに対して出力されない。
そして、各プロセッシングエレメントPEの制御回路部18は、入力スイッチ部14を制御して、隣接するプロセッシングエレメントPEよりk入力端子を介して演算結果dを取得し、j入力端子を介してデータa(レジスタR0のデータ)を取得して、演算結果dをレジスタR1に記録させるとともに、データa(レジスタR0のデータ)をレジスタR0に記録する。
このようにして、各プロセッシングエレメントPEの制御回路部18は、演算結果dおよびデータaを隣接したプロセッシングエレメントPEに対して出力する処理を、各軸方向に配設されるプロセッシングエレメントPEの配置個数に対応する回数、つまりn回(実施の形態2では2回)だけ繰り返し実行して、k入力端子およびk出力端子の接続によりトーラス状に接続された経路と、j入力端子およびj出力端子の接続によりトーラス状に接続された経路とに沿って、演算処理結果および所定データを一巡させる。この一巡の処理が第一周期目のn回の積和演算処理に該当する。なお、第一周期目のn回の積和演算処理において、出力端子22を介して出力スイッチ部17に入力されたデータbは、隣接するプロセッシングエレメントPEに対して出力されることはない。
このn回の処理の繰り返しにより、各プロセッシングエレメントPEのレジスタR1には、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果(第一周期目のn回の積和演算処理による演算結果)が記録されることになる。実施の形態2では、n=2であるため、2回だけ上述の処理が行われる。図10および図11に示した「0」および「1」の処理ステップは、上述したこの2回の処理に該当する処理内容を示している。
続いて、各プロセッシングエレメントPEの制御回路部18は、セレクタ部15を制御して、レジスタR5に記録されるデータを演算回路部16のa入力端子に出力させ、レジスタR1に記録されるデータを演算回路部16のb入力端子に出力させ、レジスタR2に記録されるデータを演算回路部16のc入力端子に出力させる処理を実行する。この処理において、レジスタR5に記録されるデータは、C(i,k)の初期値であり、レジスタR1に記録されるデータは、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果であり、レジスタR2に記録されるデータは、初期値の0である。
各プロセッシングエレメントPEの演算回路部16では、データaとして入力されたレジスタR5のデータと、データbとして入力されたレジスタR1のデータと、データcとして入力されたレジスタR2のデータとを用いて、積和演算(d=a×b+cの演算)を実行する。
次いで各プロセッシングエレメントPEの制御回路部18は、出力スイッチ部17を制御して、演算結果d、データaおよびデータbを取得し、演算結果dを−i軸方向に隣接するプロセッシングエレメントPEのi入力端子に出力し、また、データb(詳細には、レジスタR1に記録されていたデータ)をk軸方向に隣接するプロセッシングエレメントPEのk入力端子に出力する。なお、取得されたデータaに関しては、隣接するプロセッシングエレメントPEに対して出力されない。
そして、各プロセッシングエレメントPEの制御回路部18は、入力スイッチ部14を制御して、隣接するプロセッシングエレメントPEよりi入力端子を介して演算結果dを取得し、k入力端子を介してデータb(レジスタR1のデータ)を取得して、演算結果dをレジスタR2に記録させるとともに、データb(レジスタR1のデータ)をレジスタR1に記録する。
このようにして、各プロセッシングエレメントPEの制御回路部18は、演算結果dおよびデータbを隣接したプロセッシングエレメントPEに対して出力する処理を、各軸方向に配設されるプロセッシングエレメントPEの配置個数に対応する回数、つまりn回(実施の形態2では2回)だけ繰り返し実行して、i入力端子およびi出力端子の接続によりトーラス状に接続された経路と、k入力端子およびk出力端子の接続によりトーラス状に接続された経路とに沿って、演算処理結果および所定データを一巡させる。この一巡の処理が第二周期目のn回の積和演算処理に該当する。なお、第二周期目のn回の積和演算処理において、出力端子21を介して出力スイッチ部17に入力されたデータaは、隣接するプロセッシングエレメントPEに対して出力されることはない。
このn回の処理の繰り返しにより、各プロセッシングエレメントPEのレジスタR2には、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果(第一周期目のn回の積和演算処理による演算結果)であるレジスタR1に基づいて、i軸方向に配設された全てのプロセッシングエレメントPEで積和演算された演算結果(第二周期目のn回の積和演算処理による演算結果)が記録され、レジスタR1には、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果が記録されることになる。図10および図11に示した「2」および「3」の処理ステップは、上述したこの2回の処理に該当する処理内容を示している。
続いて、各プロセッシングエレメントPEの制御回路部18は、セレクタ部15を制御して、レジスタR6に記録されるデータを演算回路部16のa入力端子に出力させ、レジスタR2に記録されるデータを演算回路部16のb入力端子に出力させ、レジスタR3に記録されるデータを演算回路部16のc入力端子に出力させる処理を実行する。この処理において、レジスタR6に記録されるデータは、C(i,j)の初期値であり、レジスタR2に記録されるデータは、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果(第一周期目のn回の積和演算処理による演算結果)に基づいて、i軸方向に配設された全てのプロセッシングエレメントPEで積和演算された演算結果(第二周期目のn回の積和演算処理による演算結果)であり、レジスタR3に記録されるデータは、初期値の0である。
各プロセッシングエレメントPEの演算回路部16では、データaとして入力されたレジスタR6のデータと、データbとして入力されたレジスタR2のデータと、データcとして入力されたレジスタR3のデータとを用いて、積和演算(d=a×b+cの演算)を行う。
次いで各プロセッシングエレメントPEの制御回路部18は、出力スイッチ部17を制御して、演算結果d、データaおよびデータbとを取得して、演算結果dを−j軸方向に隣接するプロセッシングエレメントPEのj入力端子に出力し、また、データb(詳細には、レジスタR2に記録されていたデータ)を−i軸方向に隣接するプロセッシングエレメントPEのi入力端子に出力する。なお、取得されたデータaに関しては、隣接するプロセッシングエレメントPEに対して出力されない。
そして、各プロセッシングエレメントPEの制御回路部18は、入力スイッチ部14を制御して、隣接するプロセッシングエレメントPEよりj入力端子を介して演算結果dを取得し、i入力端子を介してデータb(レジスタR2のデータ)を取得して、演算結果dをレジスタR3に記録させるとともに、データb(レジスタR2のデータ)をレジスタR2に記録する。
このようにして、各プロセッシングエレメントPEの制御回路部18は、演算結果dおよびデータbを隣接したプロセッシングエレメントPEに対して出力する処理を、各軸方向に配設されるプロセッシングエレメントPEの配置個数に対応する回数、つまりn回(実施の形態2では2回)だけ繰り返し実行して、j入力端子およびj出力端子の接続によりトーラス状に接続された経路と、i入力端子およびi出力端子の接続によりトーラス状に接続された経路とに沿って、演算処理結果および所定データを一巡させる。この一巡の処理が第三周期目のn回の積和演算処理に該当する。なお、第三周期目のn回の積和演算処理において、出力端子21を介して出力スイッチ部17に入力されたデータaは、隣接するプロセッシングエレメントPEに対して出力されることはない。
このn回の処理の繰り返しにより、各プロセッシングエレメントPEのレジスタR3には、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果(第一周期目のn回の積和演算処理による演算結果)に基づいて積和演算されたi軸方向に配設される全てのプロセッシングエレメントPEの積和演算結果(第二周期目のn回の積和演算処理による演算結果)を用いて、j軸方向に配設された全てのプロセッシングエレメントPEで演算処理した演算結果(第三周期目のn回の積和演算処理による演算結果)が記録される。これは、すなわち三次元逆離散コサイン変換処理(3D−IDCT処理)の計算結果である。また、レジスタR2には、k軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果(第一周期目のn回の積和演算処理による演算結果)に基づいて、i軸方向に配設された全てのプロセッシングエレメントPEにおいて積和演算された演算結果(第二周期目のn回の積和演算処理による演算結果)が記録されることになる。これは、すなわち、i軸方向およびk軸方向で構成される二次元の離散逆コサイン変換の計算結果である。さらに、レジスタR1には、i軸方向の一次元の離散逆コサイン変換の計算結果が記録されることになる。実施の形態2では、n=2であるため、2回だけ上述の処理が行われる。図10および図11に示した「4」および「5」の処理ステップは、上述したこの2回の処理に該当する処理内容を示している。
このようにして実施の形態2に係るアレイプロセッサ1では、隣接するプロセッシングエレメントPEに対して、演算結果および積和演算に用いる所定データを順次出力してそれぞれのプロセッシングエレメントPEにおいて積和演算処理を行い、この隣接するプロセッシングエレメントPEへの演算結果の出力処理を、順次k軸方向、i軸方向、j軸方向へと出力方向を変えて処理を進めることにより、各演算回路部16における積和演算結果をレジスタR3に記録させることができる。従って、従来のアレイプロセッサ1のように、計算途中でデータや係数データの入力順番を調整するための専用回路を設ける必要がなく、回路構成の簡素化を図ることが可能となる。また、演算結果を隣接するプロセッシングエレメントPEに順次出力することによって三次元逆離散コサイン変換処理(三次元逆直交変換処理)を行うことが可能であるため、各次元の計算途中においてプロセッシングエレメントPEの内部に蓄えられるデータおよび係数行列要素を、従来のように複雑な配線構造を用いて何度も交換し合う必要がなく、処理の迅速化および簡素化を図ることが可能となる。
このように、実施の形態2に係るアレイプロセッサ1を用いることにより、従来の構成において必須とされていた計算途中におけるデータ同士の入替作業を行うことなくなる。また、複数のプロセッシングエレメントを接続させて演算結果処理を順次行うことにより、三次元逆離散コサイン変換処理(三次元逆直交変換処理)を迅速に実行することができ、さらに回路構成の複雑化を抑制することが可能となる。
以上、本発明に係るアレイプロセッサについて、図面を用いて詳細に説明を行ったが、本発明に係るアレイプロセッサは、上述した構成に限定されるものではなく、当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到しうることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
例えば、実施の形態1および実施の形態2に係るアレイプロセッサ1では、プロセッシングエレメントPEを、i軸方向,j軸方向,k軸方向のそれぞれに対して2個ずつ、合計8個配設した構成を例として用いて説明を行ったが、本発明に係るアレイプロセッサは、各軸方向に対して2個ずつ配設された構造には限定されず、2以上の個数(例えば、n個)ずつ配設した場合であってもよい。このように複数のプロセッシングエレメントを配設した場合であっても、上述した実施の形態1および実施の形態2に示した方法に従って隣接するプロセッシングエレメントPEに演算結果と所定データを出力させて一巡することにより、三次元直交変換処理および三次元逆直交変換処理に関する演算を行うことが可能となる。
また、実施の形態1および実施の形態2に係るアレイプロセッサ1では、説明の便宜上、各プロセッシングエレメントをi軸,j軸,k軸のそれぞれに対応付けた座標位置に配設する構成としたが、現実にプロセッシングエレメントPEを配設する場合には、このように物理的な三次元配設(立体的な配置)により構成する必要はなく、前述したプロセッシングエレメントPEに設けられる3個の入力端子と3個の出力端子とがそれぞれ対応するようにして接続されるものであれば、どのように配設されるものであってもよい。例えば、同一平面状に3つの軸を設定することにより、各プロセッシングエレメントを平面的に配設するものであってもよい。
また、実施の形態1および実施の形態2では、三次元直交変換処理の一例である三次元離散コサイン変換と三次元逆離散コサイン変換との演算を行うアレイプロセッサについて説明を行ったが、本発明に係るアレイプロセッサは、上述した三次元離散コサイン変換と三次元逆離散コサイン変換とに関する三次元直交変換処理等だけに用いられるものではなく、C(i,k),C(k,j),C(i,j)で示された初期値(DCT係数)を適切な係数に変更することにより、他の三次元直交変換であるウォルシュ・アダマール変換(WHT)や離散フーリエ変換(DFT)等の演算処理に利用することが可能である。
さらに、実施の形態1および実施の形態2に示したアレイプロセッサ1では、物理的な専用の演算回路を用いて演算回路部6,16を構成して演算処理を行う場合について説明を行ったが、このよう物理的な回路を用いるのではなく、制御回路部8,18の演算処理機能を利用することによって演算回路部6,16の演算処理に該当する演算を行う構成とし、演算処理を行うための回路を物理的に設けない構成とするものであってもよい。
また、実施の形態1および実施の形態2で示したアレイプロセッサ1を用いる場合において、i軸方向,j軸方向およびk軸方向におけるデータの転送方向や、どの軸方向へ最初にデータを出力するかというデータの処理順番などを自由に設定・変更することが可能である。また各プロセッシングエレメントPEに入力されるデータや初期値(DCT係数)を、各プロセッシングエレメントPE(i,j,k)内におけるレジスタR0からレジスタR6のどこに格納するかを自由に設定・変更することが可能である。このように、データの転送方向や処理順番、さらには、データの格納設定などを変更した場合であっても、実施の形態1および実施の形態2に示した内容と同一の処理結果を得ることが可能であり、また同一の結果を得る方法は、実施の形態1および実施の形態2に示した方法の他、幾通りも考えられる。しかし、これらの変更は、当業者であれば、特許請求の範囲に記載された範疇内において、容易に想到しうることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
1 …アレイプロセッサ
4、14 …入力スイッチ部
5、15 …セレクタ部
6、16 …演算回路部
7、17 …出力スイッチ部
8、18 …制御回路部
10、20 …(演算回路部の)出力端子
21、22 …(セレクト部から出力スイッチ部への)出力端子
PE …プロセッシングエレメント
R0〜R6 …レジスタ

Claims (1)

  1. 積和演算機能を備えたプロセッシングエレメントを3つの軸方向にそれぞれn個ずつ配設することにより概念的な三次元配置状態を形成し、
    各プロセッシングエレメントに対して、前記軸方向に対応付けられた入力端子と出力端子とを各軸方向に対応付けて3組設け、同一軸方向に隣接配置される一のプロセッシングエレメントの当該軸方向における入力端子と他のプロセッシングエレメントの当該軸方向における出力端子とを接続することにより、各プロセッシングエレメントの3組の入力端子および出力端子を軸方向に対応させてそれぞれトーラス状に接続し、
    各プロセッシングエレメントでは、前記積和演算機能に基づいて積和演算を行った演算結果を、一の軸方向に対応する出力端子より当該一の軸方向に隣接する他のプロセッシングエレメントに出力すると共に、前記積和演算を行う際に用いた演算データを他の軸方向に対応する出力端子より当該他の軸方向に隣接する他のプロセッシングエレメントに出力し、
    前記演算結果と演算データとをそれぞれ異なる軸方向に隣接する他のプロセッシングエレメントより取得したプロセッシングエレメントでは、取得した前記演算結果と演算データとを用いて積和演算を行い、当該積和演算に基づく演算結果と前記演算データとを、それぞれ取得した入力端子に対応する出力端子よりそれぞれの軸方向に隣接する他のプロセッシングエレメントに対し出力することにより、一の軸方向に対してトーラス状に接続された全てのプロセッシングエレメントにおいて第一周期目のn回の積和演算処理を互いに同期させて実行し、
    該第一周期目のn回の積和演算処理の後に、各プロセッシングエレメントでは、前記演算結果を出力する出力端子の軸方向を変更すると共に、当該軸方向の変更に対応させて前記演算データを出力する出力端子の軸方向を変更して、第二周期目のn回の積和演算処理を互いに同期させて実行し、
    該第二周期目のn回の積和演算処理の後に、各プロセッシングエレメントでは、前記演算結果を出力する出力端子の軸方向を、第一周期目および第二周期目と異なる軸方向に変更すると共に、当該軸方向の変更に対応させて前記演算データを出力する出力端子の軸方向を第一周期目および第二周期目と異なる軸方向に変更して、第三周期目のn回の積和演算処理を互いに同期させて実行することによって、
    三次元直交変換処理を実行するアレイプロセッサであって、
    前記各プロセッシングエレメントは、
    前記積和演算に用いられる被演算値を記憶する1つの被演算値記憶手段と、
    前記入力端子を介して入力された前記演算結果または前記演算データを記憶する3つの入力情報記憶手段と、
    前記積和演算機能による演算方法に対応して決定される定数値を記憶する3つの定数値記憶手段と、
    前記演算結果と前記演算データと前記被演算値と前記定数値とのいずれかを用いて積和演算を行う演算処理手段と、
    前記3つの入力端子のいずれかより入力された情報を前記入力情報記憶手段または前記被演算値記憶手段のいずれかに案内する入力スイッチ手段と、
    前記演算データおよび前記演算処理手段により積和演算が行われた演算結果を前記3つの出力端子のいずれかよりそれぞれ出力させる出力スイッチ手段と、
    前記被演算値記憶手段と前記入力情報記憶手段と前記定数値記憶手段とのいずれかより3つのデータを読み出して前記演算処理手段に案内するセレクタ手段と、
    前記入力スイッチ手段、前記出力スイッチ手段および前記セレクタ手段の制御を行う制御手段と
    を有し、
    前記制御手段は、前記演算結果が前記入力端子を介して入力された場合に、前記入力スイッチ手段を制御して当該演算結果を前記入力情報記憶手段のいずれかに案内し、前記セレクタ手段を制御して当該入力情報記憶手段より読み出された演算結果を前記演算処理手段に案内し、一周期においてまだn回の演算処理が行われていない場合には、前記出力スイッチ手段を制御して前記演算処理手段により積和演算が行われた演算結果を、前記演算結果が入力された前記入力端子に対応する軸方向の出力端子より出力し、一周期においてn回目の演算処理が行われた場合には、前記出力スイッチ手段を制御して前記演算処理手段により積和演算が行われた演算結果を、前記演算結果が入力された前記入力端子とは異なる軸方向の出力端子より出力する
    ことを特徴とするアレイプロセッサ。
JP2009094620A 2008-05-01 2009-04-09 アレイプロセッサ Expired - Fee Related JP5519951B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009094620A JP5519951B2 (ja) 2008-05-01 2009-04-09 アレイプロセッサ

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2008119884 2008-05-01
JP2008119884 2008-05-01
JP2009094620A JP5519951B2 (ja) 2008-05-01 2009-04-09 アレイプロセッサ

Publications (2)

Publication Number Publication Date
JP2009289256A JP2009289256A (ja) 2009-12-10
JP5519951B2 true JP5519951B2 (ja) 2014-06-11

Family

ID=41458369

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009094620A Expired - Fee Related JP5519951B2 (ja) 2008-05-01 2009-04-09 アレイプロセッサ

Country Status (1)

Country Link
JP (1) JP5519951B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3429990B2 (ja) 1997-11-12 2003-07-28 信越化学工業株式会社 電線被覆用シリコーンゴム組成物

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10185691B2 (en) 2013-07-30 2019-01-22 Hewlett Packard Enterprise Development Lp Two-dimensional torus topology

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4057729B2 (ja) * 1998-12-29 2008-03-05 株式会社日立製作所 フーリエ変換方法およびプログラム記録媒体
JP2005189970A (ja) * 2003-12-24 2005-07-14 Apriori Micro Systems:Kk 多次元配列アクセス方法、多次元配列アクセス装置、メモリ制御装置、およびフーリエ変換装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3429990B2 (ja) 1997-11-12 2003-07-28 信越化学工業株式会社 電線被覆用シリコーンゴム組成物

Also Published As

Publication number Publication date
JP2009289256A (ja) 2009-12-10

Similar Documents

Publication Publication Date Title
US9613669B2 (en) Matrix transposing circuit
JP2690932B2 (ja) ディジタル信号処理プロセッサおよびディシタル信号処理プロセッサシステム
EP2112602A2 (en) Device, system, and method for solving systems of linear equations using parallel processing
US5268853A (en) Orthogonal transformation processor for compressing information
JP2009177802A5 (ja)
CN106485669B (zh) 执行傅立叶变换的装置和方法
CN115706799B (zh) 用于视频编码器中的率失真优化和重构的有效变换和转置
JP5519951B2 (ja) アレイプロセッサ
KR102654862B1 (ko) 영상 처리 방법 및 장치
JP5025658B2 (ja) プラットフォームおよびこのプラットフォームを用いた処理方法
JP2014241585A (ja) ビデオデータ処理時に空間領域と周波数領域との間の変換を実行するためのデータ処理装置および方法
US8902474B2 (en) Image processing apparatus, control method of the same, and program
US5359549A (en) Orthogonal transformation processor for compressing information
CN107623846B (zh) 用于处理三维(3d)图像的方法和装置
KR101395143B1 (ko) 영상처리의 정수변환 방법 및 정수변환 장치
JP5045652B2 (ja) 相関処理装置及びその相関処理装置で読みとり可能な媒体
US9715715B2 (en) Efficient cache preloading
JP2851804B2 (ja) 2次元直交変換装置
US10545328B2 (en) Method and apparatus for processing image
JP3553376B2 (ja) 並列画像処理プロセッサ
JP2001102934A (ja) 離散コサイン変換処理装置、逆離散コサイン変換処理装置及び直交変換処理装置
JP2790911B2 (ja) 直交変換演算装置
JP3977003B2 (ja) 離散コサイン変換・逆離散コサイン変換手法及びその装置
JPH0540776A (ja) 二次元dctマトリクス演算回路
JP2012190389A (ja) プロセッサ装置及びその演算方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120326

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130731

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130813

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130930

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140401

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140404

R150 Certificate of patent or registration of utility model

Ref document number: 5519951

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees