JPH04328636A

JPH04328636A - 並列プロセッサーの命令分配処理装置

Info

Publication number: JPH04328636A
Application number: JP3099131A
Authority: JP
Inventors: Masato Nagamatsu; 永松　正人
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1991-04-30
Filing date: 1991-04-30
Publication date: 1992-11-17
Anticipated expiration: 2012-08-20
Also published as: JP2642529B2; KR960001275B1; KR920020340A; US5621910A

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、ＲＩＳＣ（縮小命令セ
ットコンピュータ）型のマイクロプロセッサーに係り、
特に複数の命令を並列処理するスーパースケーラー（Ｓ
ｕｐｅｒｓｃａｌａｒ　）方式の並列プロセッサーにお
ける並列実行制御のための命令分配供給を行う命令分配
処理装置に関する。

【０００２】

【従来の技術】従来、データプロセッサーの処理方式は
、一命令を順次処理するＳＩＳＤ（Ｓｉｎｇｌｅ　Ｉｎ
ｓｔｒｕｃｔｉｏｎ　Ｓｉｎｇｌｅ　Ｄａｔａ）が主流
であった。そして、プロセッサーの性能向上の要求に対
しては、まずは、取り扱うデータ幅の拡大、動作周波数
の向上により対応し、さらに、処理自体をいくつかのセ
クションに分けて複数のデータを同時に処理するパイプ
ライン方式や、浮動小数点演算などの特殊処理専用のハ
ードウェアの追加により対応してきた。

【０００３】一方、プロセッサーの一層の性能向上に対
する要求に対しては、複数の命令を同時（並列）に実行
するＭＩＭＤ（Ｍｕｌｔｉｐｌｅ−ｉｎｓｔｒｕｃｔｉ
ｏｎ　ｓｔｒｕｃｔｉｏｎ　Ｍｕｌｔｉｐｌｅ−ｄａｔ
ａ　ｓｔｒｅａｍ　）方式が有効である。これは、複数
の演算処理装置を備え、これらを同時に働かす方式であ
り、同一の演算器のアレイを有するアレイプロセッサー
とか、相異なる演算器を複数組有し、複数のパイプライ
ンを持つスーパースケーラー方式の並列プロセッサーな
どがある。

【０００４】前者のアレイプロセッサーは、一般のデー
タ処理への応用が難しいので応用分野が限られる。これ
に対して、スーパースケーラー方式の並列プロセッサー
は、その制御方式が従来のプロセッサーの制御方式の拡
張に相当するものとしてとらえることができるので、一
般のデータ処理への応用が比較的簡単である。

【０００５】スーパースケーラー方式の並列プロセッサ
ーは、複数組の演算器を同時に働かせることにより１ク
ロック（サイクル）の間に複数の命令を並列に実行する
。この場合、命令の処理は、複数の命令を同時にフェッ
チ／デコードし、これを演算器で実行するので、従来の
プロセッサーに比べて高い処理能力を発揮する。

【０００６】このスーパースケーラー方式の並列プロセ
ッサーの具体例としては、２個の整数演算ユニットに１
個の浮動小数点演算ユニットを付加し、整数演算命令（
通常のプロセッサーの命令）２つ、あるいは整数演算命
令１つと浮動小数点演算命令１つとの合計２命令を並列
実行するもの（１９９１　ＩＥＥＥ　ＩＳＳＣＣ　Ｄｉ
ｇｅｓｔ　ｏｆ　ＴＥＣＨＮＩＣＡＬ　Ｐａｐｅｒ　ｐ
ｐ．１００〜１０１　，「Ａ　１００ＭＩＰＳ，６４ｂ
　Ｓｕｐｅｒｓｃａｌａｒ　Ｍｉｃｒｏｐｒｏｃｅｓｓ
ｏｒ　ｗｉｔｈ　ＤＳＰ　Ｅｎｈａｎｃｅｍｅｎｔｓ」
　ｂｙ　Ｒａｎ　Ｔａｌｍｕｄｉ　ｅｔ　ａｌ　）等が
ある。

【０００７】ところで、スーパースケーラー方式の並列
プロセッサーは、同時に演算可能な演算器の数により命
令実行の並列度が制限される。また、従来のプロセッサ
ーにおける演算器は、命令列から１命令づつ順番に処理
したのに対して、スーパースケーラー方式における並列
実行の処理は、命令列からＮ命令づつ順番に処理してい
るだけであり、その制御方式は従来のプロセッサーの制
御方式の拡張に相当し、従来のプロセッサー用のプログ
ラム自体を書換えることなく使用できる。

【０００８】換言すれば、スーパースケーラー方式の並
列プロセッサーは、演算器単位で従来と同様の命令デコ
ーダを用意し、これに並列実行制御機能を付加すること
により実現できる。この並列実行制御機能の役割は、命
令の並列実行の可能性の調査（以下、依存解析と記す）
と、並列実行可能な命令の各演算器への割振りである。この中でも、特に依存解析の結果に基づいて適切な命令
を適切な演算器に分配する命令分配処理機能が肝要であ
る。

【０００９】ここで、命令分配処理機能の必要性につい
て述べておく。スーパースケーラー方式の並列プロセッ
サーにおける並列実行制御方式は、最大Ｎ（Ｎ＞１）個
の命令を並列実行できる場合でも、常にＮ個の命令を並
列実行できるわけではない。即ち、用意された演算器の
種類と命令で使う演算器との不一致があるので、命令に
対して演算器が不足した場合には当然ながら全命令（Ｎ
個）を並列実行することはできない（リソースコンフリ
クトと言う）。

【００１０】また、命令に対して演算器が足りていても
、演算で用いるデータが同時に実行している隣りの命令
によって作られる場合には、データが作られるまでは実
行できない（データコンフリクトと言う）。このデータ
コンフリクトの場合は、リソースコンフリクトの場合と
は異なり、実行前に調べることが難しいので、命令を一
旦供給した後に命令の実行を中止するという制御を行う
。

【００１１】また、ある命令が、リソースコンフリクト
またはデータコンフリクトのいずれかの理由により実行
できなかった場合には、その命令より順序が後であって
、かつ、同時に分配される命令も、同時実行することが
できない。

【００１２】そこで、Ｎ個の命令のうちで同時に実行で
きない命令が存在する場合には、まず、実行できる命令
を全て実行した後に残りの命令を実行するという制御を
行う。即ち、Ｎ個の命令間の依存解析を行い、この結果
、ｉ（ｉ≦Ｎ）番目の命令が同時実行不可能であると、
まず、（ｉ−１）番目の命令まで実行し、この後、残り
の（Ｎ−ｉ＋１）個の命令に対して再び依存解析を行い
、残りの命令を実行する。そして、Ｎ個の命令全ての実
行が終了したら、新たに次のＮ個の命令の実行に移る。

【００１３】

【発明が解決しようとする課題】本発明は上記の事情に
鑑みてなされたもので、簡単な構成で並列実行制御のた
めの命令分配供給を効率的に行い得る並列プロセッサー
の命令分配処理装置を提供することを目的とする。

【００１４】また、本発明は、命令分配開始位置格納動
作およびリソースコンフリクト調査結果から命令分配許
可信号を生成する動作を高速化し得る並列プロセッサー
の命令分配処理装置を提供することを目的とする。

【００１５】

【課題を解決するための手段】本発明は、最大Ｎ（Ｎ＞
１）個の命令を並列実行できるように構成された複数の
パイプラインを持つスーパースケーラー方式の並列プロ
セッサーにおける並列実行制御のための命令分配供給を
行う命令分配処理装置において、前記Ｎ個の命令のうち
のどの命令から分配を開始するかを示す命令分配開始位
置ポインタと、この命令分配開始位置ポインタの内容と
リソースコンフリクトを調べる依存解析の結果に基づい
て命令実行用演算器への命令／供給の可否を決定するた
めの信号を生成する命令分配許可信号生成回路と、上記
命令分配許可信号とデータコンフリクトを調べる依存解
析の結果に基づいて前記Ｎ個の命令のうちのどこまで命
令実行が終了したかを示すためのフラグを生成し、この
フラグの内容に応じて前記命令分配開始位置ポインタの
内容が次回の命令実行に際しての命令開始位置を示すよ
うに更新する更新回路とを具備することを特徴とする。

【００１６】

【作用】上記命令分配処理装置は、命令分配開始位置ポ
インタと、命令分配許可信号生成回路と、更新回路とを
具備する簡単な構成でありながら、並列実行制御のため
の命令分配供給を効率的に行うことができる。

【００１７】なお、命令分配開始位置ポインタを並列実
行できる命令の数だけ揃えてデコード動作の時間を省略
するようにすれば、命令分配開始位置格納動作を高速化
できる。さらに、リソースコンフリクト調査結果から命
令分配許可信号を生成する回路にキャリー信号先見回路
を用いれば、信号生成動作を高速化できる。

【００１８】

【実施例】以下、図面を参照して本発明の一実施例を詳
細に説明する。

【００１９】図１は、スーパースケーラー方式の並列プ
ロセッサーにおける並列実行制御のための命令分配供給
を行う命令分配処理装置の基本構成例を示している。こ
の並列プロセッサーは、相異なる演算器（図示せず）を
複数組有し、演算器単位で命令デコーダ（図示せず）を
有し、命令の並列実行の可能性の調査（依存解析）およ
び並列実行可能な命令の各演算器への割振りを行う並列
実行制御機能を有し、前記各演算器を同時に働かせるこ
とにより１クロックの間に最大Ｎ（Ｎ＞１）個の命令を
並列に実行できるように構成された複数のパイプライン
（図示せず）を持っている。

【００２０】１０は並列に実行する命令数Ｎに対応する
だけのビット幅を持ち、Ｎ個の命令のうちのどの命令か
ら分配を開始するかを示す記憶装置（例えばＮ個の命令
分配開始位置ポインタ用レジスタ、以下、命令ポインタ
と記す）である。１１は上記命令ポインタ１０の内容と
前記命令数に応じた少なくとも１本以上の第１の入力信
号（リソースコンフリクトを調べる依存解析の結果）と
から前記命令数と同数の出力信号（命令実行用演算器へ
の命令の分配／供給の可否を決定するための命令分配許
可信号）を生成し、実際に命令を取り扱うスイッチ回路
（図示せず）へ供給する第１の演算回路（以下、命令分
配許可信号生成回路と記す）である。

【００２１】１２は上記命令分配許可信号と少なくとも
２本以上の第２の入力信号（データコンフリクトを調べ
る依存解析の結果）とから前記Ｎ個の命令のうちのどこ
まで命令実行が終了したかを示すための情報（フラグ）
を生成し、このフラグの内容に応じて前記命令ポインタ
１０の内容が次回の命令実行に際しての命令開始位置を
示すように更新する第２の演算回路（以下、命令ポイン
タ更新回路）である。

【００２２】図２は、図１の命令分配処理装置の一実施
例（Ｎ＝４の場合）を示している。４ビットの命令ポイ
ンタ２０１〜２０４の各ビットは４つの命令に対応して
おり、開始すべき命令に対応するビットに“１”が設定
され、それ以外のビットには“０”が設定されている。従って、この命令ポインタ２０１〜２０４の内容は、（
１，０，０，０　）、（０，１，０，０　）、（０，０
，１，０　）、（０，０，０，１　）の４つの値のいず
れかである。命令分配許可信号生成回路２１１〜２１４
は、命令ポインタ２０１〜２０４の内容（出力信号ｇ０
　〜ｇ３　）とリソースコンフリクト調査（依存解析）
の結果（ｆ０　〜ｆ３　）とに基づいて４つの命令のう
ちのどの命令まで分配するかを決定し、各命令に対する
命令分配許可信号（ｉ０　〜ｉ３　）を生成する。

【００２３】命令ポインタ更新回路２２１〜２２４は、
４つの命令の実行状況を把握する制御回路であり、命令
分配許可信号（ｉ０　〜ｉ３　）とデータコンフリクト
調査（依存解析）の結果（ｈ０　〜ｈ３　）とに基づい
て命令の実行終了状況（前記Ｎ個の命令のうちのどこま
で命令実行が終了したか）を把握し、この実行終了状況
を示す命令実行終了フラグ信号（ｊ０　〜ｊ３　）を生
成して命令ポインタ２０１〜２０４に出力する。

【００２４】上記実施例の命令分配処理は、命令ポイン
タ２０１〜２０４と、命令分配許可信号生成回路２１１
〜２１４と、命令ポインタ更新回路２２１〜２２４とを
具備する簡単な構成でありながら、並列実行制御のため
の命令分配供給を効率的に行うことができる。即ち、あ
る命令が、リソースコンフリクトまたはデータコンフリ
クトのいずれかの理由により実行できなかった場合には
、Ｎ個の命令間の依存解析の結果、ｉ（ｉ≦Ｎ）番目の
命令が同時実行不可能であると、まず、（ｉ−１）番目
の命令まで実行し、この後、残りの（Ｎ−ｉ＋１）個の
命令に対して再び依存解析を行い、残りの命令を実行す
るように制御することが可能になる。

【００２５】データコンフリクトの場合には、命令を一
旦供給した後に命令の実行を中止するように制御するこ
とが可能になる。また、そして、Ｎ個の命令全ての実行
が終了したら、新たに次のＮ個の命令の実行に移るよう
に制御することが可能になる。

【００２６】図３は、図１の命令分配処理装置の他の実
施例（Ｎ＝４の場合）を示している。３０１〜３０４は
命令ポインタ、（ｌ０　〜ｌ３　）はポインタ出力、（
ｋ１　〜ｋ３　）はリソースコンフリクト調査結果、３
１は命令分配許可信号生成回路、（ｍ０　〜ｍ３　）は
命令分配許可信号、（ｎ０　〜ｎ３　）はデータコンフ
リクト調査結果、３２はデータコンフリクト調査結果（
ｎ０　〜ｎ３　）から分配された命令が実行を終了した
のか中断したのかを判定する分配命令実行終了検出回路
である。（ｐ０　〜ｐ３　）はブランチ発生により、実
行する必要がなくなったことを命令分配処理装置に通知
する命令実行禁止信号である。

【００２７】３３は既に実行を終了している命令の情報
を生成する命令ポインタ更新回路であり、上記信号（ｐ
０　〜ｐ３　）を命令の実行終了の通知と同様に取り扱
う。（ｒ０　〜ｒ３　）は前記命令ポインタ３０１〜３０４
の内容を更新するための命令ポインタ更新信号である。

【００２８】３４１〜３４３は命令の実行終了状態を示
す命令実行終了フラグレジスタである。（ｑ０　〜ｑ２
　）は命令の実行終了状態を示す命令実行終了フラグ信
号である。

【００２９】この実施例では、命令ポインタ３０１〜３
０４として、並列実行できる命令の数だけ揃えてデコー
ド動作の時間を省略し、命令分配許可信号（ｍ０　〜ｍ
３　）を速く生成するようにしている。また、命令分配
許可信号生成回路３１として、二入力アンドゲート３１
１〜３１６、二入力オアゲート３１７、三入力オアゲー
ト３１８および四入力オアゲート３１９を図示のように
接続してキャリー信号の先見回路（ＣＬＡ；Ｃａｒｒｙ
　Ｌｏｏｋ　Ａｈｅａｄ）に準じた構成の回路を用いて
おり、リソースコンフリクト調査結果（ｋ１〜ｋ３　）
から命令分配許可信号（ｍ０　〜ｍ３　）を生成する動
作の高速化を図っている。

【００３０】なお、分配命令実行終了検出回路３２にお
いて、３２１〜３２４は各対応してデータコンフリクト
調査結果（ｎ０　〜ｎ３　）が禁止入力、命令分配許可
信号（ｍ０　〜ｍ３　）が各対応してゲート入力となる
二入力ゲートである。また、命令ポインタ更新回路３３
において、３３０〜３３２は三入力オアゲート、３３３
は二入力オアゲート、３３４は三入力ノアゲート、３３
５は二入力ノアゲート、３３６〜３３７は二入力アンド
ゲート、３３８〜３４０は禁止入力を有する二入力ゲー
トである。上記図３の実施例でも、簡単な構成でありな
がら並列実行制御のための命令分配供給を効率的に行う
ことができる。

【００３１】なお、上記各実施例において、命令分配処
理装置を命令実行用演算器と同じ半導体チップ上に搭載
することにより、並列プロセッサーのシステム構成を簡
単化できる。

【００３２】

【発明の効果】上述したように本発明によれば、簡単な
構成で並列実行制御のための命令分配供給を効率的に行
い得る並列プロセッサーの命令分配処理装置を提供でき
る。

【００３３】また、本発明によれば、命令分配開始位置
デコード動作を省略して命令分配開始位置格納動作を高
速化し、リソースコンフリクト調査結果から命令分配許
可信号を生成する動作を高速化し得る並列プロセッサー
の命令分配処理装置を提供できる。

【図面の簡単な説明】

【図１】本発明の並列プロセッサーの命令分配処理装置
の基本構成を示すブロック図。

【図２】図１の命令分配処理装置の一実施例を示すブロ
ック図。

【図３】図１の命令分配処理装置の他の実施例を示す論
理回路図。

【符号の説明】

１０、２０１〜２０４、３０１〜３０４…記憶装置（命
令ポインタ）、１１、２１１〜２１４、３１…第１の演算回路（命令分配許可
信号生成回路）、１２、２２１〜２２４、３３…第２の演算回路（命令ポインタ
更新回路）、３２…分配命令実行終了検出回路、３４１〜３４３…命令実行終了
フラグレジスタ、（ｆ０　〜ｆ３　）、（ｋ０　〜ｋ３　）…リソースコ
ンフリクト調査結果、（ｈ０　〜ｈ３　）、（ｎ０　〜ｎ３　）…データコン
フリクト調査結果、（ｉ０　〜ｉ３　）、（ｍ０　〜ｍ３　）…命令分配許
可信号、（ｐ０　〜ｐ３　）…命令実行禁止信号、（ｊ
０　〜ｊ３　）、（ｑ０　〜ｑ３　）…命令実行終了フ
ラグ信号、（ｒ０　〜ｒ３　）…ポインタ更新信号。

Claims

【特許請求の範囲】

【請求項１】　　最大Ｎ（Ｎ＞１）個の命令を並列実行
できるように構成された複数のパイプラインを持つスー
パースケーラー方式の並列プロセッサーにおける並列実
行制御のための命令分配供給を行う命令分配処理装置に
おいて、並列に実行する命令数に対応するだけのビット
幅を持った記憶装置と、この記憶装置の出力信号と前記
命令数に応じた少なくとも１本以上の第１の入力信号と
から前記命令数と同数の出力信号を生成する第１の演算
回路と、この第１の演算回路の出力信号と少なくとも２
本以上の第２の入力信号とから前記記憶装置の内容を更
新するための信号を生成し、この信号を前記記憶装置に
出力する第２の演算回路とを具備することを特徴とする
並列プロセッサーの命令分配処理装置。
【請求項２】　　請求項１記載の並列プロセッサーの命
令分配処理装置において、前記記憶装置としては、前記
Ｎ個の命令のうちのどの命令から分配を開始するかを示
す命令分配開始位置ポインタ用レジスタが用いられ、前
記第１の演算回路は、上記命令分配開始位置ポインタ用
レジスタの内容とリソースコンフリクトを調べる依存解
析の結果に基づいて命令実行用演算器への命令の分配／
供給の可否を決定するための信号を生成する命令分配許
可信号生成回路が用いられ、前記第２の演算回路は、上
記命令分配許可信号とデータコンフリクトを調べる依存
解析の結果に基づいてＮ個の命令のうちのどこまで命令
実行が終了したかを示すための情報を生成し、この情報
に応じて前記命令分配開始位置ポインタ用レジスタの内
容が次回の命令実行に際しての命令開始位置を示すよう
に更新する更新回路が用いられていることを特徴とする
並列プロセッサーの命令分配処理装置。
【請求項３】　　請求項１または２記載の並列プロセッ
サーの命令分配処理装置において、前記記憶装置は、並
列に実行する命令数と同数設けられていることを特徴と
する並列プロセッサーの命令分配処理装置。
【請求項４】　　請求項１記載の並列プロセッサーの命
令分配処理装置において、前記第２の入力信号は、命令
の中断と命令の実行禁止とを示す二系統の入力信号を持
つことを特徴とする並列プロセッサーの命令分配処理装
置。
【請求項５】　　請求項１乃至４のいずれか１項に記載
の並列プロセッサーの命令分配処理装置において、前記
第１の演算回路は、リソースコンフリクト調査結果から
命令分配許可信号を生成する回路部に先見回路を用いて
いることを特徴とする並列プロセッサーの命令分配処理
装置。
【請求項６】　　請求項１乃至５のいずれか１項に記載
の並列プロセッサーの命令分配処理装置は、前記命令実
行用演算器と同じ半導体チップ上に搭載されていること
を特徴とする並列プロセッサーの命令分配処理装置。