JPH10275078A

JPH10275078A - 命令をディスパッチする方法及びシステム

Info

Publication number: JPH10275078A
Application number: JP10066375A
Authority: JP
Inventors: Kyuu Re Fun; フン・キュー・レ
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1997-03-26
Filing date: 1998-03-17
Publication date: 1998-10-13
Anticipated expiration: 2018-03-17
Also published as: US5963723A; JP3335306B2

Abstract

(57)【要約】【課題】待ち行列内の隣接している命令の選択だけに
限定されない、命令を選択して互いに対にするシステム
及びプロセスを提供すること。【解決手段】スーパースカラ・データ処理システムに
おいて、相互に依存する命令を複数の実行ユニットにデ
ィスパッチするために対にする。ペアリングによって、
必ずしも連続したアドレスにあるとは限らない命令が対
にされる。ペアリングは様々な命令の汎用レジスタ・ソ
ース・ポインタと汎用レジスタ・ターゲット・ポインタ
を比較することによって行うことができる。ペアリング
は、ソース・オペランドのターゲット識別番号をターゲ
ット命令のターゲット識別番号と比較することによって
も行うことができる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、一般にデータ処理
システムに関し、具体的にはプロセッサにおける依存命
令の動的ペアリングに関する。

【０００２】

【従来の技術】スーパスカラ・マイクロプロセッサ設計
では、複数の命令を並列して様々な実行ユニットにディ
スパッチすることができる。しかし、多くの命令は他の
命令の結果の受け取りに依存する。このような依存命令
は、命令フロー内で互いに隣り合って存在していない場
合がある。隣合う命令の対をディスパッチするための従
来技術の設計は、命令フロー内で互いに隣接していない
依存命令をディスパッチするには不十分である。

【０００３】

【発明が解決しようとする課題】したがって、当技術分
野では、待ち行列内の隣接している命令の選択だけに限
定されない、命令を選択して互いに対にするシステム及
びプロセスが必要である。

【０００４】

【課題を解決するための手段】本発明は、連続したアド
レス場所にある場合もない場合もある命令を動的に対に
するシステム及び方法を提供することによって上記の必
要を満たす。

【０００５】本発明は、上記のような命令を対にする１
つまたは複数の並列プロセスを実施することができる。
本発明は、命令待ち行列から実行前待ち行列にディスパ
ッチする命令のグループ内で、より新しい命令の汎用レ
ジスタ（「ＧＰＲ」）ソース・ポインタをより古い命令
のＧＰＲターゲット・ポインタと比較する。一致する場
合、最も若いターゲット命令と最も古い依存命令とを対
にする。ターゲット命令は実行前待ち行列に入れるとき
に、そのＤＰＴＲフィールドを、依存命令を入れる実行
前待ち行列内場所を指すように設定する。

【０００６】実施可能な並列プロセスは、命令待ち行列
から実行前待ち行列に現在ディスパッチ中の命令のＧＰ
Ｒソース・ポインタを、すでに実行前待ち行列内に入っ
ている命令のＧＰＲターゲット・ポインタと比較するプ
ロセスである。一致する場合、ディスパッチする最も古
い依存命令を実行前待ち行列内の最も若いターゲット命
令と対にする。依存命令がどのディスパッチ命令とも対
にされない場合、依存命令を実行前待ち行列に入れると
きに、実行前待ち行列内の場所をターゲット命令のＤＰ
ＴＲフィールドに保管する。これを実施することによっ
て、ＧＰＲにアクセスしてＴＩＤを入手し、比較を行
い、次にＤＰＴＲを計算するサイクル抑止プロセスを回
避することができる。

【０００７】本発明で実施可能な他の並列プロセスは、
ディスパッチされた命令のソース・オペランドのＴＩＤ
を実行前待ち行列内の命令のターゲットＴＩＤと比較す
るプロセスである。

【０００８】

【発明の実施の形態】以下の説明では、本発明を十分に
理解することができるように特定のワード長やバイト長
など多くの特定の詳細を記載する。しかし、本発明はそ
のような特定の詳細がなくても実施することができるこ
とが当業者には明らかであろう。他の場合には、本発明
が無用な詳細によって不明瞭にならないように、周知の
回路はブロック図の形で示している。たいていの場合、
タイミング上の考慮すべき事柄に関する詳細などは、本
発明を十分に理解するために必要ではなく、当業者の技
術の範囲内にあるため、そのような詳細は省いた。

【０００９】図を参照すると、図の要素は必ずしも一定
の縮小率で図示されておらず、いくつかの図面を通して
同様の要素は同じ参照番号で示してある。

【００１０】本発明について、ＰｏｗｅｒＰＣアーキテ
クチャ（ＰｏｗｅｒＰＣはインターナショナル・ビジネ
ス・マシーンズ・コーポレイションの商標である）の固
定小数点ユニットに対応する実施態様に関して説明す
る。同じ方式は、他の実行ユニット及び他のアーキテク
チャに対応するように適応させることができる。

【００１１】典型的な情報処理システムは図１に示す通
りであり、少なくとも１つの中央処理装置（ＣＰＵ）２
を含む。ＣＰＵ２はシステム・バス４を介して、ランダ
ム・アクセス・メモリ（ＲＡＭ）６、読取り専用メモリ
（ＲＯＭ）８、ディスク装置１２やテープ装置１４など
の周辺装置をバス４に接続する入出力（Ｉ／Ｏ）アダプ
タ１０、キーボード１８、マウス２２、スピーカ２４、
マイクロフォン２０またはタッチ・スクリーン装置（図
示せず）などのその他のユーザ・インタフェース装置を
バス４に接続するユーザ・インタフェース・アダプタ１
６、情報処理システムをデータ処理ネットワークに接続
する通信アダプタ２６、バス４を表示装置３０に接続す
るディスプレイ・アダプタ２８と相互接続されている。

【００１２】図２に、命令待ち行列４０と、実行前待ち
行列（ＰＥＱ）４２と、固定小数点ユニット４４と、分
岐ユニット４１と、比較ユニット４３と、ストア・ユニ
ット４５と、浮動小数点ユニット４７とを含むＣＰＵ２
の高水準概要図が図示されている。固定小数点ユニット
４４は、実行ユニット４６、４８、５０、及び５２の４
つから成り、これらはクラスタ０５４とクラスタ１
５６の２つのクラスタに構成されている。各クラスタ５
４、５６は先行実行ユニット４６、５０と後続実行ユニ
ット４８、５２を有する。複数の宛先にデータを転送す
るタイミング上の問題を回避するために、各実行ユニッ
ト４６、４８、５０、５２の結果の転送は、宛先の場所
と、結果が入手可能になった時点とにより一様ではな
い。

【００１３】命令待ち行列内の命令は、命令キャッシュ
またはその他の記憶装置（図示せず）から取り出され
る。命令は、クラスタ５４、５６に送る命令とデータを
保持するＰＥＱ４２に入れられる。命令とデータはＰＥ
Ｑ４２からラッチＬ１５８、Ｌ２６０、Ｌ３６
２、及びＬ４６４に送られる。ラッチから命令とデー
タが実行ユニットに入れられる。たとえば、ラッチ５８
から実行ユニット４６に命令とデータが入れられる。実
行ユニット４６、４８、５０、５２の結果もラッチＬ１
５８、Ｌ２６０、Ｌ３６２、またはＬ４６４に
送ることができ、さらに特定のラッチに関連づけられた
実行ユニットによって処理される。ラッチＬ５６４、
Ｌ６６６、Ｌ７６８、及びＬ８７０が各実行ユニ
ット４６、４８、５０、５２から結果を受け取り、次に
それらの結果をさらに処理するためにＰＥＱ４２に送り
返す。

【００１４】固定小数点クラスタ５４、５６は以下のよ
うな特性を持っている。クラスタ内の先行するユニット
は、結果を同じクラスタ内の後続のユニットに転送して
同じサイクルで使用できるようにすることができる。た
とえば、先行ユニット４６でサイクルｎで実行している
命令が、その結果を同じクラスタ５４内の後続ユニット
４８に転送して、サイクルｎで依存命令が後続ユニット
４８でその結果を使用して実行することができるように
することができる（０サイクル転送）。また、クラスタ
内の後続ユニットは、その結果を同じクラスタ内の先行
ユニットに転送し、それによってその結果が生成された
後のサイクル中に先行ユニットでその結果を実行に使用
できるようにすることができる（クラスタ内の１サイク
ル転送）。たとえば、サイクルｎで後続ユニット４８で
実行している命令が、同じクラスタ５４内の先行ユニッ
ト４６に結果を転送し、それによって依存命令がその結
果をサイクルｎ＋１で先行ユニット４６で使用して実行
できるようにすることができる。

【００１５】クラスタ（ローカル・クラスタ）内の先行
ユニットは他のクラスタ（リモート・クラスタ）内の実
行ユニットに結果を転送し、それによってその結果が生
成された後のサイクル中にリモート・クラスタでその結
果を実行に使用できるようにすることができる。たとえ
ば、サイクルｎでローカル・クラスタ５４の先行ユニッ
ト４６で実行している命令がリモート・クラスタ５６内
の先行ユニット５０または後続ユニット５２に結果を転
送し、それによって依存命令がサイクルｎ＋１でその結
果を先行ユニット５０または後続ユニット５２で使用で
きるようにすることができる。

【００１６】ローカル・クラスタ内の後続ユニットは、
結果が生成された１サイクル後にリモート・クラスタの
実行ユニットにその結果を転送することができる（クラ
スタ間の２サイクル転送）。たとえば、サイクルｎ中に
ローカル・クラスタ５４の後続ユニット４８で実行して
いる命令が遠隔クラスタ５６内の先行ユニット５０また
は後続ユニット５２に結果を転送し、それによって依存
命令がｎ＋２サイクル中に先行ユニット５０または後続
ユニット５２でその結果を使用して実行できるようにす
ることができる。

【００１７】クラスタ内のすべてのユニットは、結果が
生成された１サイクル後にその結果をＧＰＲ（図示せ
ず）及びＰＥＱ４２に転送することができる（２サイク
ル転送）。

【００１８】ロード命令はクラスタ内の後続ユニットで
のみ実行することができる。

【００１９】クラスタ内のすべてのユニットの効率的な
動作を維持するために、命令発行ユニットであるＰＥＱ
４２はクラスタへの命令をスケジュールするときにクラ
スタ内及びクラスタ間で実行ユニットによる結果データ
の一様でない転送を考慮に入れなければならない。さら
に、ＰＥＱ４２は使用可能なオペランドの命令だけをス
ケジュールしなければならない。しかし、アウト・オブ
・オーダー発行が可能である。

【００２０】投機命令がスケジュールされて打ち切られ
た場合、ＰＥＱ４２は迅速な回復方法も講じなければな
らない。たとえば、特定の分岐が特定の経路を取るとい
う仮定のもとに命令がスケジュールされたのに、分岐が
別の経路を取る場合がある。また、スケジュールされた
２つの命令の間に例外が発生する可能性もある。

【００２１】さらに、ＰＥＱ４２は、ロード命令を後続
ユニットに送るなどのように、特定の命令のスケジュー
ルを限定しなければならない。最後に、ＰＥＱ４２はプ
ロセッサのサイクル時間を満たすように簡略化された方
法で上記の機能を実現しなければならない。

【００２２】この命令待ち行列化及び発行機構には以下
のような特徴がある。ＰＥＱ４２は予約ステーション
の役割を果たし、クラスタ５４、５６に対して発行する
命令とそのデータを保持する。優先順位配列を実現する
１組のラッチ（図３、図５、及び図６に示す）がＰＥＱ
４２内の命令の相対エージを追跡する。ＰＥＱ４２内の
１組のビットを使用して、命令のためにオペランドが使
用可能であることを示す。使用可能なオペランドを持つ
命令だけがＰＥＱ４２によって選択され、クラスタ５
４、５６に発行される。

【００２３】ＰＥＱ４２内の他の１組のビットによっ
て、依存命令を「対」にすることができる。すなわち、
命令Ａがロード命令ではなく、命令Ａが命令Ｂが使用す
る結果を生成する場合、命令ＡとＢを対にする。ＰＥＱ
４２は、先行ユニットから後続ユニットへの０サイクル
転送を利用するために、ＡＢの対を一緒に同じクラスタ
（Ａを先行ユニット、Ｂを後続ユニットに）に発行しよ
うとする。

【００２４】ＰＥＱ４２内の他の１組のビットは、結果
が生成される場所を追跡し、それによってその結果を使
用する依存命令が適切なクラスタに発行されるようにす
る。たとえば、命令Ａがクラスタ０５４の後続ユニッ
ト４８で実行されている場合、ＰＥＱ４２はクラスタ内
のデータの１サイクル転送を利用するために、Ａに依存
する命令Ｂをクラスタ０５４に発行しようとする。

【００２５】命令分類方式によって、命令をバケットに
グループ化する。命令選択論理は各バケットに対して並
列に作用する。命令を順次に選択する方式から命令をバ
ケットの中から並列して選択する方式に命令選択プロセ
スが変更されるため、命令選択時間が短縮される。たと
えば、命令Ａがサイクルｎ中にクラスタ０５４内の先
行ユニット４６で実行されるとする。命令Ａに依存する
命令Ｂは、サイクルｎ中にクラスタ０５４内の後続ユ
ニット４８で実行することができる。Ｂはサイクルｎ＋
１またはその後のサイクルに４つのユニット４６、４
８、５０、５２のいずれかで実行することができる。

【００２６】他の例として、命令Ａがサイクルｎ中にク
ラスタ０５４内の後続ユニット４８で実行されている
とする。命令Ａに依存する命令Ｂはサイクルｎ＋１でク
ラスタ０５４のいずれかのユニット４６、４８で実行
することができる。Ｂはサイクルｎ＋２またはその後の
サイクル中に４つのユニット４６、４８、５０、５２の
いずれかで実行することができる。

【００２７】図３に、ＰＥＱ４２を通る命令の流れを示
す。図２に示す命令待ち行列（ＩＱ）４０から命令がデ
ィスパッチされる。命令はマルチプレクサ８０、８２、
８４、８６、８８、９０を通してＰＥＱに入れられる。
命令選択のための制御信号を計算して４つのマルチプレ
クサＣ０Ｅｐｔｒ９２、Ｃ１Ｅｐｔｒ９４、Ｃ０Ｌｐｔ
ｒ９６、及びＣ１Ｌｐｔｒ９８を通してゲートする。Ｐ
ＥＱ４２からの命令は４つのバスＣ０Ｅ１００（クラス
タ０内の先行ユニット４６へ）、Ｃ１Ｅ１０２（クラス
タ１内の先行ユニット５０へ）、Ｃ０Ｌ１０４（クラス
タ０内の後続ユニット４８へ）、及びＣ１Ｌ１０６（ク
ラスタ１内の後続ユニット５２へ）を通ってゲート出力
される。ＰＥＱ４２に命令が入っていない場合は、ディ
スパッチされた命令は、４つのマルチプレクサＢ０Ｅ１
０８、Ｂ１Ｅ１１０、Ｂ０Ｌ１１２、及びＢ１Ｌ１１４
を通して実行ユニット４６、４８、５０、５２に直接バ
イパスすることができる。

【００２８】図４に、ＰＥＱ４２の各項目のフィールド
を示す。各項目は、命令コード及び他の制御信号１２０
と、ＲＡデータ１２２と、ＲＢデータ１２４とから成
る。各ＰＥＱ項目に付随するビットは以下の通りであ
る。・Ｖ１２６：項目が有効かどうかを示す。・Ｌ１２８：命令がロード命令かどうかを示す。・Ｔ１３０：命令が依存対命令のうちの前の方の（タ
ーゲット）命令かどうかを示す。（命令が依存命令の場
合は、ターゲット命令として扱われないことに留意され
たい。しかし、独立命令になった場合、すなわちそのＤ
１３２ビットがリセットされ、Ｔ１３０ビットが設定さ
れた場合は、自動的にターゲット命令になる。）・Ｄ１３２：命令が依存対命令のうちの後の命令（タ
ーゲット命令に依存する命令）かどうかを示す。・ＲＴ（命令ターゲットがＧＰＲ）：Ｕ１３４：フィールドが有効かどうかを示す。ＴＩＤ１３６：命令の送り先であるＧＰＲのターゲット
ＩＤを示す。ＴＩＤ１３６はオペランド・インタロック
として使用されるポインタである。ＴＩＤ１３６は命令
識別子でもある。・ＲＡ（命令ソースがＧＰＲ）：Ｕ１３８：フィールドが有効かどうかを示す。Ｗ１４０：ＲＡフィールドにデータが入れられているか
どうかを示す（ＲＡを使用しない場合、このビットはデ
ィスパッチ時に１に設定される）。Ｃ０１４２、Ｃ１１４４：オペランドがクラスタ内
の後続ユニットで実行される命令に依存するかどうかを
示す(クラスタ０の場合はビット０、クラスタ１の場合
はビット１）。これらのビットは１サイクルの間アクテ
ィブになり、当該命令をデータを持っているユニットに
向けて送る。ＣＤ１４６：１サイクル遅延させたＣ０１４２、Ｃ１
１４４ビット。データが取り消された場合、ＰＥＱ４
２はＣＤ１４６を使用してＷビット１４０をリセットす
る。ＴＩＤ１４８：必要な命令を供給するＧＰＲのターゲッ
トＩＤ。・ＲＢ（命令ソースがＧＰＲ）：Ｕ１５０：フィール
ドが有効かどうかを示す。Ｗ１５２：ＲＢフィールドにデータが入っているかどう
かを示す（ＲＢを使用しない場合、このビットはディス
パッチ時に１に設定される）。Ｃ０１５４、Ｃ１１５６：オペランドがクラスタの
うちの後続ユニットで実行される命令に依存することを
示す（クラスタ０の場合はビット０、クラスタ１の場合
はビット１）。これらのビットは１サイクルの間アクテ
ィブになり、当該命令をデータを持っているユニットに
向けて送る。ＣＤ１５８：１サイクル遅延させたＣ０１５４、Ｃ１
１５６ビット。データが取り消された場合、ＰＥＱ４
２はＣＤ１５８を使用してＷビット１５２をリセットす
る。ＴＩＤ１６０：必要な情報を供給するＧＰＲのターゲッ
トＩＤ。・ＤＰＴＲ１６２：当該命令に依存する命令を含む項
目を指すポインタ。Ｔ１３０ビットがアクティブのとき
に有効である。

【００２９】図４には、ＰＥＱ４２の各項目の状態を指
定する上述の個々のビットの組み合わせである以下のＰ
ＥＱ４２命令状態標識も図示されている。・Ｃｉ（０）１６４：命令が後続ユニット４８で実行
されている命令に依存することを示す。このビットは２
つのオペランドのＣ０ビット１４２、１５４の「ＯＲ」
である。・Ｃｉ（１）１６６：命令が後続ユニット５２で実行
されている命令に依存することを示す。このビットは、
２つのオペランドのＣ１ビット１４４、１５６の「Ｏ
Ｒ」である。・ＲＶ１６８：命令が実行可能状態であることを示
す。このビットは２つのオペランド使用可能ビットＷ１
４０、Ｗ１５２と、待ち行列項目有効ビットＶ１２６
と、２つのＣビット１６４、１６６との組み合わせであ
る（命令は、両方の後続ユニットで生成されるオペラン
ドに依存している場合は実行可能状態ではないことに留
意されたい）。・Ｌｉ１６５：命令がロードであることを示す。・Ｔｉ１６７：命令が依存対命令のターゲット命令で
あり、依存命令ではないことを示す。・Ｄｉ１６９：命令が依存対命令の依存命令であるこ
と示す。

【００３０】古いものから順に（ＩＱ０からＩＱ４の
順）ＩＱ４０からディスパッチされた命令は、ＰＥＱ有
効ビットＶ１２６で示された最下位空き場所に入れられ
る。待ち行列内項目数が６のＰＥＱ４２内のすべての項
目の順序は、図５に示すビット優先順位配列１７０によ
ってマークされる。「ｎｏｍ」という各ビットによ
って、項目ｎが項目ｍより古いことが示される。項目０
１７２は５ビット（００１から００５まで）あり、項
目１１７４は４ビット（１０２から１０５まで）あ
り、以下同様である。

【００３１】命令がディスパッチされると、ＰＥＱ４２
を走査して既存の命令が入っていないか調べ、ＰＥＱ４
２内の他の命令を基準にした命令のエージを示すように
優先順位配列１７０が設定される。

【００３２】ディスパッチされた命令はそれらの命令相
互及びＰＥＱ４２内の既存の命令と照らして照合され、
対にすることができるかどうかを判断する。命令は、そ
のソース・オペランドがディスパッチ済みまたはＰＥＱ
４２に入っているそれより古い命令の結果であり（ＴＩ
Ｄを使用してインタロックを判断する）、より古い命令
がロードでない場合、そのより古い命令と対にすること
ができる。

【００３３】ディスパッチされた命令が前の命令に依存
することがわかった場合、その依存命令のＰＥＱ位置が
ターゲット命令と共に図４のＤＰＴＲ１６２フィールド
に保管される。ターゲット命令のＴビット１３０が設定
され、依存命令のＤビット１３２が設定される。同じタ
ーゲット命令に複数の命令が依存する場合、最も古い依
存命令だけがそのターゲット命令と対にすることができ
る。命令の２つのソースが２つの異なる命令に依存する
場合、依存命令のＲＡソースについてのみ「ペアリン
グ」が行われる。命令の対のターゲットが発行され、依
存命令は発行されない場合（すなわち後続ユニットが使
用可能でない場合）、依存オペランドのＤビット１３２
がリセットされる。これによって、依存命令は次のサイ
クルで独立命令になることができる。

【００３４】ＰＥＱ４２内の各ソース・オペランドはそ
れに付随するＷ（書込み済み）ビット１４０、１５２を
持ち、そのオペランドのデータが使用可能かどうかを示
す。Ｗビット１４０、１５２は、ＧＰＲにデータが入っ
ている場合、命令がソースを必要としない場合、または
ディスパッチするソースがそのサイクル中にブロードキ
ャストされるいずれかのＴＩＤと一致する場合、ディス
パッチ時に設定される。その項目が依存対のうちの依存
命令である場合、依存ソースは実行可能状態としてマー
クされる。

【００３５】最も速い結果バス上に結果が現れる１サイ
クル前に、その結果に付随するＴＩＤがＰＥＱ４２にブ
ロードキャストされる。これはＰＥＱ４２内のすべての
ソースＴＩＤと比較される。一致するものがある場合、
そのソース・フィールドのＷビット１４０、１５２が設
定される。Ｗビット１４０、１５２が設定された場合、
そのビットは新しい項目によって上書きされる（待ち行
列内のより古い命令が発行または取消しされている）ま
で設定されたままになっている。また、Ｗビットは、ユ
ニットによって生成されると思われる対応するデータが
有効でない場合（すなわちキャッシュ・ミス条件）にも
リセットされる。

【００３６】ＰＥＱ項目が有効（Ｖ＝１）であり、異な
るクラスタで実行されている命令に依存せず、依存対の
うちの依存命令ではなく２つのソース・オペランドが使
用可能状態（Ｗ＝１）であるか、または依存対のうちの
依存命令であってその命令の独立ソース・オペランドと
その命令が依存する命令とが実行可能状態である場合、
ＰＥＱ項目は実行ユニット４６、４８、５０、５２のう
ちの１つにディスパッチできる状態にある。これは、Ｄ
ＰＴＲ１６２にそれに依存する命令を指定させておき、
依存ソースのＷビット１４０、１５２を無条件に設定す
ることによって行う。

【００３７】各ソース・オペランドも２ビットのＣフィ
ールド１４２、１４４、または１５４、１５６を持ち、
当該オペランドのためのデータを生成するクラスタ内の
後続ユニットがある場合にそのユニットを示す。Ｃフィ
ールド１４２、１４４、または１５４、１５６は、ソー
ス・オペランドＴＩＤ１４８、１６０と、それに対応す
る後続ユニットからのブロードキャストＴＩＤとの一致
の結果としてＷビット１４０、１５２が設定されると設
定される。

【００３８】図５に示すように、各項目内の命令のＲ
Ｖ、Ｃｉ、Ｌｉ、Ｔｉ、Ｄｉ状態標識を調べることによ
って、ＰＥＱ４２内の実行可能命令が分類されバケット
に入れられる。図７に、様々なバケット・タイプを示
す。バケットは以下の通りである。・タイプＡ１８０（Ｃｉ＝００、Ｌｉ＝０、Ｔｉ＝
０）いずれかのクラスタ内の先行または後続ユニットに送る
ことができ、依存対命令のターゲットではない命令が入
る。・タイプＢ１８２（Ｃｉ＝１０、Ｌｉ＝０、Ｔｉ＝
０）クラスタ０内のみの先行または後続ユニットに送ること
ができ、依存対命令のターゲットではない命令が入る。・タイプＣ１８４（Ｃｉ＝１０、Ｌｉ＝０、Ｔｉ＝
１）クラスタ０内のみの先行または後続ユニットに送ること
ができ、依存対命令のターゲットである命令が入る。・タイプＤ１８Ｇ（Ｃｉ＝０１、Ｌｉ＝０、Ｔｉ＝
０）クラスタ１内のみの先行または後続ユニットに送ること
ができ、依存対命令のターゲットではない命令が入る。・タイプＥ１８８（Ｃｉ＝０１、Ｌｉ＝０、Ｔｉ＝
１）クラスタ１内のみの先行または後続ユニットに送ること
ができ、依存対命令のターゲットである命令が入る。・タイプＦ１９０（Ｃｉ＝００、Ｌｉ＝０、Ｔｉ＝
１）いずれかのクラスタ内の先行または後続ユニットに送る
ことができ、依存対命令のターゲットである命令が入
る。・タイプＧ１９２（Ｃｉ＝００、Ｌｉ＝１、Ｄｉ＝
０）いずれかのクラスタ内の後続ユニットに送ることがで
き、依存対命令の依存命令ではない命令が入る。・タイプＨ１９４（Ｃｉ＝１０、Ｌｉ＝１、Ｄｉ＝
０）クラスタ０内の後続ユニットにのみ送られ、依存対命令
の依存命令ではない命令が入る。・タイプＣ"１９６（Ｃｉ＝ｘ０、Ｌｉ＝ｘ、Ｄｉ＝
１）そのターゲットがグループＣに入っている依存命令が入
る。・タイプＩ１９８（Ｃｉ＝０１、Ｌｉ＝１、Ｄｉ＝
０）クラスタ１内の後続ユニットのみに送られ、依存対命令
の依存命令ではない命令が入る。・タイプＥ'２００（Ｃｉ＝０ｘ、Ｌｉ＝ｘ、Ｄｉ＝
１）そのターゲットがグループＥに入っている依存命令が入
る。・タイプＦ'２０２（Ｃｉ＝００、Ｌｉ＝ｘ、Ｄｉ＝
１）そのターゲットがグループＦに入っている依存命令が入
る。

【００３９】図５及び図６に、ＰＥＱ４２から固定小数
点ユニット４４に発行する命令を選択するプロセスを示
す。このプロセスは以下の３つのステップから成る。・バケット分類１７６：実行可能命令（Ｒｖ＝１）を
適切なバケット１８０〜２０２にグループ化する（図７
参照）。・エージ優先順位づけ１７８：各バケット内の実行可
能命令（ＲＶ＝１）の相対エージを計算する。これは、
優先順位配列ラッチ１７０を調べ、その命令が入ってい
るＰＥＱ項目を指すポインタを生成することによって行
う。たとえば、Ｆバケット内の最も古い実行可能命令が
ＰＥＱ４２の項目番号３に入っている場合、マルチプレ
クサ５００のＦ１入力の値は３になる。・バケット選択１７７、１７９：バケット内の実行可
能命令の数をカウントし、マルチプレクサ５００、５０
２、５０４、５０６に送る選択制御信号を生成する。こ
れは、バケット内の命令数をカウントし、そのカウント
を調べて選択制御信号を生成することによって行う。た
とえば、Ｆバケット内に命令が１つ入っており、Ｅバケ
ット内に命令が少なくとも１つ入っており、Ｇバケット
に命令が２つ入っており、その他のバケットには命令が
入っていない場合、マルチプレクサ５００に送られる制
御信号によって入力Ｆ１が選択され、マルチプレクサ５
０２への制御信号によって入力Ｅが選択され、マルチプ
レクサ５０４への制御信号によって入力Ｇ１が選択さ
れ、マルチプレクサ５０６への制御信号によって入力Ｇ
２が選択される。

【００４０】図７にバケットの分類を示す。各バケット
内のエージ優先順位付けは縦方向（各パケットについて
上から下の順）に示されている。図８に、論理選択表を
示す。各列には、各実行ユニット４６、４８、５０、５
２の候補が入っており、文字は各実行ユニット４６、４
８、５０、５２に割り当てられた命令バケットを示し、
数字は特定のバケット内の命令の相対エージを示す。各
列ごとに１つの命令しか選択できない。選択の優先順位
は左から右、上から下である。たとえば、クラスタ０内
の先行ユニット４６のためにＡ１（この表記はバケット
Ａ内で最も古い命令を指す）が選択された場合、クラス
タ１の先行ユニット５０のためにバケットＡからＡ２し
か選択することができない。

【００４１】各バケット内の最大命令数は実行ユニット
数と一致していることが好ましい。たとえば、バケット
Ａ（図７の１８０）は４つの実行ユニット４６、４８、
５０、５２のいずれかに送ることができる命令を４命令
持っているのに対し、バケットＣ（図７の１８４）は２
命令しか持っていないが、これは２つの実行ユニット４
６、４８しか持っていないクラスタ０に命令を送らなけ
ればならないためである。こうすることによって、本発
明は「深い」ＰＥＱ、すなわち実行ユニット数より多い
項目数を有するＰＥＱの実現を可能にすると同時に、各
バケット内の扱いやすい命令数に合わせて選択プロセス
を制限することができる。

【００４２】命令が発行され実行されるとき、ＰＥＱ４
２内の状態ビットが動的に変化し、異なる相対エージを
持つ異なるバケットに命令が動的に再割当てされること
に留意されたい。これは、発行済み優先順位競合などと
の実行時の命令相互作用（すなわちサイクル３内の命令
１８）、実行中に遅延を引き起こす条件（キャッシュ・
ミス、マルチサイクル演算）、予測誤り分岐命令、また
は割込みによって発生する。また、ストア命令と分岐命
令はそれぞれの待ち行列に対して発行され、ＰＥＱ４２
には入れられないことにも留意されたい。

【００４３】次に図１０を参照すると、ＧＰＲ８０１の
構造が図示されている。ＧＰＲ８０１は３２項目配列で
あり、ＴＩＤ８０２とデータ８０３が入っている。ＴＩ
Ｄ８０２は、ターゲットＧＰＲを設定する命令がＩＱ４
０からディスパッチされる時点で各ターゲットＧＰＲに
割り当てられる固有のタグである。ＴＩＤはディスパッ
チ時にターゲットＧＰＲ項目に書き込まれる。ディスパ
ッチ時に、ＴＩＤ８０２はディスパッチ命令にも割り当
てられ、その命令がＣＰＵを通るときに命令に加えてタ
グ付けされる。ＧＰＲを設定する命令が実行され、デー
タが送り戻されてＧＰＲ配列８０１に書き込まれると、
ターゲットＧＰＲ場所にあるＴＩＤ８０２が命令のＴＩ
Ｄと比較される。２つのＴＩＤが一致する場合、データ
８０３をＧＰＲ配列に書き込むことができる。このプロ
セスによって、ＧＰＲを設定する最も若い命令だけがＧ
ＰＲ場所を更新することができるように保証される。Ｇ
ＰＲを使用するディスパッチ命令は、ＧＰＲ配列８０１
を読み取ってそのＧＰＲのデータ８０３またはＴＩＤ８
０２を入手する。ディスパッチ時にデータ８０３が使用
可能でない場合、ソースＧＰＲのＴＩＤに、データを必
要とする命令によるタグが付けられる。ＧＰＲを設定す
る命令が実行されるとき、その命令はそのＴＩＤをＰＥ
Ｑ４２内の他の命令にブロードキャストする。このブロ
ードキャストされたＴＩＤはＰＥＱ４２内のすべてのソ
ースＴＩＤと比較され、それによって実行中の命令に依
存する命令がデータを獲得して実行ステージに進むこと
ができるようになる。

【００４４】図１０に示す例は、最新の命令のＴＩＤが
ＧＰＲ８０１に書込みを行う様子を示している。たとえ
ば、ＴＩＤ１及びＴＩＤ４を持つ命令が両方ともＧＰＲ
１に書き込むとすると、ＴＩＤ４を持つ命令がディスパ
ッチされた後、ＧＰＲ１に関連づけられたＴＩＤは４で
ある。

【００４５】図９に、ＰＥＱ４２によって１つの依存命
令をターゲット命令と対にするプロセスを示す。これら
のステップは、ディスパッチされる命令ごとに繰り返さ
れる。これらの順次プロセスは例示に過ぎないことに留
意されたい。実際の実施態様ではこれらのステップの１
つまたは複数のステップを並列して行うことができる。
ペアリングは適格な命令に対して行われる。ペアリング
に適格な命令とは、その命令のソース・オペランドの１
つがより古い命令の結果であり、そのより古い命令がロ
ード命令ではなく、そのより古い命令がまだ他の命令と
対にされていない命令である。命令の両方のソースが異
なるターゲット命令に依存する場合、ＲＡソース・オペ
ランドだけを使用してペアリングを決定する。

【００４６】ステップ７０１で、ＩＱ４０からＰＥＱ４
２にディスパッチされた命令のグループ内で、より新し
い命令のＧＰＲソース・ポインタ（ＲＡ、ＲＢＧＰ
Ｒ）をより古い命令のＧＰＲターゲット・ポインタ（Ｒ
ＴＧＰＲ）と比較する。一致する場合（ステップ７０
２）、ステップ７０３で、最も若いターゲット命令が最
も古い依存命令と対にされる。ターゲット命令がＰＥＱ
４２に入れられるとき、そのＤＰＴＲ１６２フィールド
が、依存命令を入れるＰＥＱ４２内場所を指すように設
定され、Ｔビット１３０が設定される。依存命令がＰＥ
Ｑ４２に入れられるとき、その各ソース・オペランドの
Ｄビット３２が設定される。

【００４７】ほぼステップ７０１と同時に、ステップ７
０４を行うことができ、ＩＱ４０からＰＥＱ４２にディ
スパッチされる命令のＧＰＲソース・ポインタ（ＲＡ、
ＲＢＧＰＲ）が、ＰＥＱ４２内にすでに入っている命令
のＧＰＲターゲット・ポインタ（ＲＴＧＰＲ）と比較
される。ステップ７０５で一致するものがある場合、ス
テップ７０６で、ディスパッチされる最も古い命令がＰ
ＥＱ４２内の最も若いターゲット命令と対にされる。依
存命令がディスパッチされたどの命令とも対にされない
場合、依存命令がＰＥＱ４２に入れられるときにそのＰ
ＥＱ４２内場所がターゲット命令のＤＰＴＲ１６２フィ
ールドに保管される。このステップは、ＴＩＤを入手
し、比較を行い、次いでＤＰＴＲを計算するためにＧＰ
Ｒにアクセスするサイクル抑止プロセスを回避するため
に行う。

【００４８】以下の結果として、ステップ７０４で一致
するポインタが複数生じる場合がある。・ＩＱ４０からディスパッチされた複数の命令がＰＥ
Ｑ４２内の同じターゲット命令に依存する。例：ディスパッチ命令：Ａｄｄ１（３）＜−−（１），（２）より古いＡｄｄ２（４）＜−−（１），（６）より若いＰＥＱ４２内の命令：Ａｄｄ０（１）＜−−（７），（８）この例では、「Ａｄｄ１」と「Ａｄｄ２」の両方がＧＰ
Ｒ１を使用する。両方の命令が同じサイクルにディスパ
ッチされ、「Ａｄｄ２」は「Ａｄｄ１」より若い。ＲＥ
Ｑ４２内の「Ａｄｄ０」によってＧＰＲ１が設定され
る。ディスパッチ命令がＰＥＱ４２に入れられるとき
に、「Ａｄｄ０」のＤＰＴＲは、最も古いディスパッチ
命令すなわち「Ａｄｄ１」のＰＥＱポインタが入るよう
に設定される。・ディスパッチされた命令がＰＥＱ４２内の複数のタ
ーゲット命令に依存する。例：ディスパッチ命令：Ａｄｄ２（３）＜−−（１），（６）ＰＥＱ４２内の命令：Ａｄｄ０（１）＜−−（７），（８）より古いＡｄｄ１（１）＜−−（９），（１０）より若いこの例では、「Ａｄｄ０」と「Ａｄｄ１」の両方がＧＰ
Ｒ１を設定する。両方の命令はＰＥＱ４２に入ってお
り、「Ａｄｄ０」は「Ａｄｄ１」より古い。ディスパッ
チされた命令「Ａｄｄ２」はＧＰＲ１を使用する。ステ
ップ７０４で、命令「Ａｄｄ２」について２つのヒット
が発生する。優先順位配列１７０にアクセスしてどちら
のヒットがＰＥＱ４２内の最も若い命令のヒットである
かを判断する。この例ではこれは命令「Ａｄｄ１」であ
る。「Ａｄｄ２」がＰＥＱ４２に入れられるとき、ＰＥ
Ｑ４２内で最も若いヒットすなわち「Ａｄｄ１」のＤＰ
ＴＲは、「Ａｄｄ２」のＰＥＱポインタが入るように設
定される。

【００４９】ステップ７０４と同時に、ステップ７０７
でＧＰＲ配列（図１０を参照）にアクセスしてディスパ
ッチされた命令のソース・オペランドのＴＩＤを入手す
る。これらのＴＩＤを、ＰＥＱ４２内の命令のＴＩＤ
（ＲＴＴＩＤ）と比較する。一致があれば（ステップ
７０８）、上記のステップで入手したＤＰＴＲが正しい
ことが保証される。最も古い依存命令がＰＥＱ４２に入
れられるとき、それに対応するソースＤビット１３２が
設定される。

【００５０】ステップ７０７は、ステップ７０４で一致
が発生したターゲット命令がＣＰＵで最も若いターゲッ
トであるように保証するために必要である。

【００５１】たとえば、以下の３つの命令を考えてみ
る。Ａｄｄ０（１）＜−−（６），（７）最も古いＡｄｄ１（１）＜−−（８），（９）Ａｄｄ２（４）＜−−（１），（６）最も若い

【００５２】「Ａｄｄ０」と「Ａｄｄ１」がディスパッ
チされ、何らかの理由で「Ａｄｄ１」が実行されてＰＥ
Ｑ４２から除去された。「Ａｄｄ０」はＰＥＱ４２内に
残っているのに対し、「Ａｄｄ２」はディスパッチされ
る。ステップ７０４で一致するものがあることが示さ
れ、ステップ７０６でＰＥＱ４２内の「Ａｄｄ２」を指
す「Ａｄｄ０」のＤＰＴＲが生じる。しかし、「Ａｄｄ
２」がディスパッチ時にＧＰＲにアクセスするとき、Ｇ
ＰＲ１に付随するＴＩＤは「Ａｄｄ０」のＴＩＤとは異
なる「Ａｄｄ１」のＴＩＤである。ステップ７０７では
一致は発生せず、したがって「Ａｄｄ０」のＴビットと
「Ａｄｄ２」のＤビットは設定されない。ＴビットとＤ
ビットが設定されないことによって、「Ａｄｄ０」と
「Ａｄｄ２」が命令の対とみなされないようになる。

【００５３】ＤＰＴＲの計算には、タグを比較し、その
比較を使用して優先順位配列にアクセスしてターゲット
命令のエージ（最も若い）を判断する必要がある。その
結果、比較で使用されるタグは（ＧＰＲのＴＩＤではな
く）ＧＰＲポインタ自体である。ＤビットとＴビットの
設定には、最も若いターゲットを見つけるために優先順
位配列にアクセスする必要がない（ＴＩＤ比較の際の一
致によって、一致したターゲット命令が最も若い命令で
あることが保証される。

【００５４】ＰＥＱ４２は発行する命令を選択すると
き、他の制御ビット（図示せず）と共にＤ１３２、Ｔ１
３０、及びＤＰＴＲ１６２ビットを調べて対を選択すべ
きかどうかを判断する。この実施態様のＰＥＱ発行アル
ゴリズムは前述の通りである。

【００５５】ステップ７０５と７０８のいずれでも一致
が発生しない場合、プロセスはステップ７１０に進み、
命令はペアリングに適格ではないことになる。

【００５６】命令のＤ１３２ビットとＴ１３０ビットは
両方ともアクティブとなることができる。ターゲット命
令が発行されるが依存命令は発行されない場合、依存命
令のＤ１３２ビットはリセットされる。Ｄ１３２ビット
とＴ１３０ビットの両方がアクティブな命令の場合、そ
のＤ１３２ビットがリセットされ、次に動的に命令の対
のターゲットになる。このペアリング・アルゴリズム
は、ディスパッチされる命令をそれらの命令相互及びＰ
ＥＱ４２内に残っている命令と照合して対にする。この
アルゴリズムによって、命令を対にするには命令が互い
に隣接または近接していなければならないという制約が
なくなる。

【００５７】まとめとして、本発明の構成に関して以下
の事項を開示する。

【００５８】（１）データ処理システムにおいて命令を
ディスパッチする方法であって、第１の命令が第２の命
令に依存するかどうかを判断するステップと、第１の命
令と第２の命令が連続したアドレスを持っていることも
持っていないことも可能な、ディスパッチのために第１
の命令と第２の命令を対にするステップとを含む方法。（２）判断ステップが、第１の命令のオペランドが第２
の命令の結果に依存するかどうかを判断するステップを
さらに含む、上記（１）に記載の方法。（３）第１の命令と第２の命令が、命令待ち行列から実
行前待ち行列に転送される命令のグループに含まれる、
上記（１）に記載の方法。（４）第１の命令が命令待ち行列から実行前待ち行列に
転送され、第２の命令が実行前待ち行列にすでに入って
いる、上記（１）に記載の方法。（５）判断ステップが、第１の命令の汎用レジスタ・ソ
ース・ポインタを第２の命令の汎用レジスタ・ターゲッ
ト・ポインタと比較するステップをさらに含む、上記
（３）に記載の方法。（６）ソース・ポインタとターゲット・ポインタとの間
に一致がある場合、（１）第２の命令を第１の命令とリ
ンクし、（２）第１の命令をターゲット命令としてマー
クし、（３）第２の命令を依存命令としてマークする、
上記（５）に記載の方法。（７）判断ステップが、第１の命令の汎用レジスタ・ソ
ース・ポインタを第２の命令の汎用レジスタ・ターゲッ
ト・ポインタと比較するステップをさらに含む、上記
（４）に記載の方法。（８）ソース・ポインタとターゲット・ポインタとの間
に一致がある場合、第２の命令を第１の命令とリンクす
る、上記（７）に記載の方法。（９）ソース・ポインタとターゲット・ポインタとの間
に一致がある場合、第１の命令を実行前待ち行列に入れ
るときに第１の命令を第２の命令とリンクするステップ
をさらに含む、上記（７）に記載の方法。（１０）判断ステップが、第１の命令に付随するタグを
第２の命令に付随するタグと比較するステップをさらに
含む、上記（４）に記載の方法。（１１）判断ステップが、第１の命令の汎用レジスタ・
ソース・ポインタを第２の命令の汎用レジスタ・ターゲ
ット・ポインタと比較するステップと、第１の命令に付
随するタグを第２の命令に付随するタグと比較するステ
ップとをさらに含む、上記（４）に記載の方法。（１２）命令待ち行列と、命令待ち行列に結合された実
行前待ち行列と、実行前待ち行列に結合された実行クラ
スタと、第１の命令と第２の命令が命令待ち行列から実
行前待ち行列に転送される命令のグループに含まれる、
第１の命令のオペランドが第２の命令の結果に依存する
かどうかを判断する回路と、第１の命令の汎用レジスタ
・ソース・ポインタが第２の命令の汎用レジスタ・ター
ゲット・ポインタと一致する場合、第１の命令と第２の
命令を実行クラスタにディスパッチするために対にする
回路とを含むプロセッサ。（１３）第１の命令のオペランドが、実行前待ち行列に
すでに入っている第３の命令の結果に依存するかどうか
を判断する回路と、第１の命令の汎用レジスタ・ソース
・ポインタが第３の命令の汎用レジスタ・ターゲット・
ポインタと一致する場合、第１の命令と第３の命令を実
行クラスタにディスパッチするために対にする回路とを
さらに含む、上記（１２）に記載のプロセッサ。（１４）ソース・ポインタとターゲット・ポインタとの
間に一致がある場合、第２の命令を第１の命令とリンク
する、上記（１２）に記載のプロセッサ。（１５）第１の命令が第２の命令と対にされていない場
合、第１の命令を第３の命令と対にする、上記（１３）
に記載のプロセッサ。（１６）ソース・ポインタとターゲット・ポインタとの
間に一致がある場合、第２の命令に付随するフィールド
を第１の命令が入ることになる実行前待ち行列内の場所
を指すように設定する、上記（１３）に記載のプロセッ
サ。（１７）第３の命令がロード命令ではない場合、第１の
命令が第３の命令と対にされる、上記（１５）に記載の
プロセッサ。（１８）バス・システムによって入力装置と出力装置と
メモリ装置とに結合されたプロセッサを含み、前記プロ
セッサが、命令待ち行列と、命令待ち行列に結合された
実行前待ち行列と、実行前待ち行列に結合された実行ク
ラスタと、第１の命令のオペランドが第２の命令の結果
に依存するかどうかを判断する手段と、第１の命令と第
２の命令が連続したアドレスを持っていることも持って
いないこともある、第１の命令と第２の命令を実行クラ
スタにディスパッチするために対にする手段とをさらに
含む、データ処理システム。（１９）第１の命令と第２の命令が命令待ち行列から実
行前待ち行列に転送される命令のグループに含まれる、
上記（１８）に記載のシステム。（２０）第１の命令が命令待ち行列から実行前待ち行列
に転送され、第２の命令がすでに実行前待ち行列に入っ
ている、上記（１８）に記載のシステム。（２１）判断手段が、第１の命令の汎用レジスタ・ソー
ス・ポインタを第２の命令の汎用レジスタ・ターゲット
・ポインタと比較する手段をさらに含む、上記（１９）
に記載のシステム。（２２）ソース・ポインタとターゲット・ポインタとの
間に一致がある場合、第２の命令に付随するフィールド
を、第１の命令が入ることになる実行前待ち行列内の場
所を指すように設定する、上記（２１）に記載のシステ
ム。（２３）判断手段が、第１の命令の汎用レジスタ・ソー
ス・ポインタを第２の命令の汎用レジスタ・ターゲット
・ポインタと比較する手段をさらに含む、上記（２０）
に記載のシステム。（２４）ソース・ポインタとターゲット・ポインタとの
間に一致がある場合、第２の命令に付随するフィールド
を、第１の命令が入ることになる実行前待ち行列内の場
所を指すように設定する、上記（２３）に記載のシステ
ム。（２５）判断手段が、タグが第１の命令と第２の命令に
付随する汎用レジスタを識別する、第１の命令に付随す
るタグを第２の命令に付随するタグと比較する手段をさ
らに含む、上記（２０）に記載のシステム。

【図面の簡単な説明】

【図１】本発明を実施する情報処理システムのブロック
図である。

【図２】命令待ち行列と実行前待ち行列と固定小数点ユ
ニットの高水準図を含む、本発明を実施するシステムの
アーキテクチャを示すブロック図である。

【図３】命令をディスパッチする装置のブロック図であ
る。

【図４】命令とそれに付随する状況ビットを示す図であ
る。

【図５】命令を分類する装置のブロック図である。

【図６】命令を分類する装置のブロック図である。

【図７】図５の装置が行う分類の論理シーケンスを示す
図である。

【図８】図６の論理シーケンスで使用する論理選択表を
示す図である。

【図９】本発明による流れ図である。

【図１０】ＧＰＲの構造を示す図である。

【符号の説明】

２中央処理装置４システム・バス６ランダム・アクセス・メモリ８読取り専用メモリ１０入出力アダプタ１６ユーザ・インタフェース・アダプタ２６通信アダプタ２８ディスプレイ・アダプタ４０命令待ち行列４２実行前待ち行列４４固定小数点ユニット４１分岐ユニット４３比較ユニット４５ストア・ユニット４７浮動小数点ユニット４６実行ユニット５８ラッチ６４ラッチ８０マルチプレクサ９２マルチプレクサ１００バス１０８マルチプレクサ１７０優先順位配列

Claims

【特許請求の範囲】

【請求項１】データ処理システムにおいて命令をディス
パッチする方法であって、第１の命令が第２の命令に依
存するかどうかを判断するステップと、第１の命令と第２の命令が連続したアドレスを持ってい
ることも持っていないことも可能な、ディスパッチのた
めに第１の命令と第２の命令を対にするステップとを含
む方法。
【請求項２】判断ステップが、第１の命令のオペランドが第２の命令の結果に依存する
かどうかを判断するステップをさらに含む、請求項１に
記載の方法。
【請求項３】第１の命令と第２の命令が、命令待ち行列
から実行前待ち行列に転送される命令のグループに含ま
れる、請求項１に記載の方法。
【請求項４】第１の命令が命令待ち行列から実行前待ち
行列に転送され、第２の命令が実行前待ち行列にすでに
入っている、請求項１に記載の方法。
【請求項５】判断ステップが、第１の命令の汎用レジスタ・ソース・ポインタを第２の
命令の汎用レジスタ・ターゲット・ポインタと比較する
ステップをさらに含む、請求項３に記載の方法。
【請求項６】ソース・ポインタとターゲット・ポインタ
との間に一致がある場合、（１）第２の命令を第１の命
令とリンクし、（２）第１の命令をターゲット命令とし
てマークし、（３）第２の命令を依存命令としてマーク
する、請求項５に記載の方法。
【請求項７】判断ステップが、第１の命令の汎用レジスタ・ソース・ポインタを第２の
命令の汎用レジスタ・ターゲット・ポインタと比較する
ステップをさらに含む、請求項４に記載の方法。
【請求項８】ソース・ポインタとターゲット・ポインタ
との間に一致がある場合、第２の命令を第１の命令とリ
ンクする、請求項７に記載の方法。
【請求項９】ソース・ポインタとターゲット・ポインタ
との間に一致がある場合、第１の命令を実行前待ち行列
に入れるときに第１の命令を第２の命令とリンクするス
テップをさらに含む、請求項７に記載の方法。
【請求項１０】判断ステップが、第１の命令に付随するタグを第２の命令に付随するタグ
と比較するステップをさらに含む、請求項４に記載の方
法。
【請求項１１】判断ステップが、第１の命令の汎用レジスタ・ソース・ポインタを第２の
命令の汎用レジスタ・ターゲット・ポインタと比較する
ステップと、第１の命令に付随するタグを第２の命令に付随するタグ
と比較するステップとをさらに含む、請求項４に記載の
方法。
【請求項１２】命令待ち行列と、命令待ち行列に結合された実行前待ち行列と、実行前待ち行列に結合された実行クラスタと、第１の命令と第２の命令が命令待ち行列から実行前待ち
行列に転送される命令のグループに含まれる、第１の命
令のオペランドが第２の命令の結果に依存するかどうか
を判断する回路と、第１の命令の汎用レジスタ・ソース・ポインタが第２の
命令の汎用レジスタ・ターゲット・ポインタと一致する
場合、第１の命令と第２の命令を実行クラスタにディス
パッチするために対にする回路とを含むプロセッサ。
【請求項１３】第１の命令のオペランドが、実行前待ち
行列にすでに入っている第３の命令の結果に依存するか
どうかを判断する回路と、第１の命令の汎用レジスタ・ソース・ポインタが第３の
命令の汎用レジスタ・ターゲット・ポインタと一致する
場合、第１の命令と第３の命令を実行クラスタにディス
パッチするために対にする回路とをさらに含む、請求項
１２に記載のプロセッサ。
【請求項１４】ソース・ポインタとターゲット・ポイン
タとの間に一致がある場合、第２の命令を第１の命令と
リンクする、請求項１２に記載のプロセッサ。
【請求項１５】第１の命令が第２の命令と対にされてい
ない場合、第１の命令を第３の命令と対にする、請求項
１３に記載のプロセッサ。
【請求項１６】ソース・ポインタとターゲット・ポイン
タとの間に一致がある場合、第２の命令に付随するフィ
ールドを第１の命令が入ることになる実行前待ち行列内
の場所を指すように設定する、請求項１３に記載のプロ
セッサ。
【請求項１７】第３の命令がロード命令ではない場合、
第１の命令が第３の命令と対にされる、請求項１５に記
載のプロセッサ。
【請求項１８】バス・システムによって入力装置と出力
装置とメモリ装置とに結合されたプロセッサを含み、前
記プロセッサが、命令待ち行列と、命令待ち行列に結合された実行前待ち行列と、実行前待ち行列に結合された実行クラスタと、第１の命令のオペランドが第２の命令の結果に依存する
かどうかを判断する手段と、第１の命令と第２の命令が連続したアドレスを持ってい
ることも持っていないこともある、第１の命令と第２の
命令を実行クラスタにディスパッチするために対にする
手段とをさらに含む、データ処理システム。
【請求項１９】第１の命令と第２の命令が命令待ち行列
から実行前待ち行列に転送される命令のグループに含ま
れる、請求項１８に記載のシステム。
【請求項２０】第１の命令が命令待ち行列から実行前待
ち行列に転送され、第２の命令がすでに実行前待ち行列
に入っている、請求項１８に記載のシステム。
【請求項２１】判断手段が、第１の命令の汎用レジスタ
・ソース・ポインタを第２の命令の汎用レジスタ・ター
ゲット・ポインタと比較する手段をさらに含む、請求項
１９に記載のシステム。
【請求項２２】ソース・ポインタとターゲット・ポイン
タとの間に一致がある場合、第２の命令に付随するフィ
ールドを、第１の命令が入ることになる実行前待ち行列
内の場所を指すように設定する、請求項２１に記載のシ
ステム。
【請求項２３】判断手段が、第１の命令の汎用レジスタ・ソース・ポインタを第２の
命令の汎用レジスタ・ターゲット・ポインタと比較する
手段をさらに含む、請求項２０に記載のシステム。
【請求項２４】ソース・ポインタとターゲット・ポイン
タとの間に一致がある場合、第２の命令に付随するフィ
ールドを、第１の命令が入ることになる実行前待ち行列
内の場所を指すように設定する、請求項２３に記載のシ
ステム。
【請求項２５】判断手段が、タグが第１の命令と第２の命令に付随する汎用レジスタ
を識別する、第１の命令に付随するタグを第２の命令に
付随するタグと比較する手段をさらに含む、請求項２０
に記載のシステム。