JPH11511579A

JPH11511579A - 浮動小数点処理装置のためのリザベーションステーション

Info

Publication number: JPH11511579A
Application number: JP9513395A
Authority: JP
Inventors: ゴダード，マイケル・ディ; ゴベアス，ケルビン・ディ; ブジャノス，ノーマン
Original assignee: Advanced Micro Devices Inc
Current assignee: Advanced Micro Devices Inc
Priority date: 1995-09-26
Filing date: 1996-07-19
Publication date: 1999-10-05
Also published as: US6122721A; WO1997012317A1; US5878266A; EP0870227A1; KR19990063734A

Abstract

(57)【要約】フォーマット変換論理を備えたリザベーションステーションにより、浮動小数点機能ユニットおよび非浮動小数点機能ユニットの両方を組込んだスーパースカラーコンピュータ処理システムの実現が可能になる。浮動小数点リザベーションステーションにおけるオペランドデータを外部フォーマットから内部浮動小数点フォーマットに変換することにより、このような浮動小数点リザベーションステーションを組込んだシステムは（たとえばリオーダバッファ内、オペランドおよび結果バス上ならびに非浮動小数点機能ユニット内の）浮動小数点算術ユニットの外部にある同一の外部フォーマットのオペランドデータの表記を可能にし、さらに浮動小数点算術ユニット内での特定的な内部表記（内部浮動小数点フォーマット）の使用を可能にする。複数の機能ユニットおよび当該浮動小数点リザベーションステーションを組込んだシステムにより、浮動小数点命令および非浮動小数点命令間の並列性を利用するためのスーパースカラー技術の使用が可能になる。なぜなら、オペランドおよび結果は同一の外部フォーマットで外部的に表記されるからである。浮動小数点リザベーションステーション内の特定の論理によりオペランドフォーマットが変換される。

Description

【発明の詳細な説明】浮動小数点処理装置のためのリザベーションステーション発明の背景発明の分野この発明はスーパースカラープロセッサに関し、特に、複数の機能ユニットを含むスーパースカラープロセッサ内の機能ユニットのためのリザベーションステーションに関する。関連技術の説明技術分野において知られているように、浮動小数点数は指数および仮数として２進フォーマットで表わされ得る。指数は２などの基数が累乗される、べき数を表わし、仮数は基数によって乗算される数である。したがって、浮動小数点数によって表わされる実際の数は、指数によって特定されたべき数まで累乗された基数に等しい量が乗算された仮数である。このように、どのような特定の数も浮動小数点表記ではｆｘＢ^eまたは（ｆ，ｅ）として近似でき、ここでｆはｎ桁の符号付仮数であり、ｅはｍ桁の符号付整数の指数であり、Ｂは基数系である。多くのコンピュータシステムで用いられている基数系はＢ＝２である２進法であるが、システムの中には基数系として１０進法（Ｂ＝１０）または１６進法（Ｂ＝１６）を用いるものもある。浮動小数点数は加算、減算、乗算または除算することができ、２進浮動小数点数にこれらの算術演算を行なうための、計算のための構造は技術分野において周知である。実用的なコンピュータでは、数の仮数部分は無限の「精度」は有さない（すなわち浮動小数点数の仮数に無限の桁数の数字を割当てることはできない）。その代わりに、浮動小数点数は、通常は固定桁数を有するレジスタにおいて処理される。このため、加算、減算、乗算または除算される２つの入力オペランドの各々が正確な表示であっても、演算結果はレジスタの固定桁数よりもより有効桁の多いものとなるだろう。この結果、精度の低い（しかし依然として正確である）結果の表示を、正規化および丸め演算の処理によってレジスタの固定桁数の中に詰め込む必要がある。正規化とは、同じ値を有するすべての浮動小数点数が同じ表示を有することを保証する処理である。典型的に、２進浮動小数点数の正規化は、最上位ビットが１になるまで仮数のビットを左にシフトすることにより行なわれる。仮数と指数のべき数まで累乗された基数との積が一定になるよう指数が減少される。正規化された数の仮数における最上位ビットは常に１であるため、（実際は、精度をさらに１ビット分上げるためれに用いられる１ビット位置を有効に開けるように）浮動小数点表示はこのビットを暗黙に表わすことが多い。明示的または暗黙の最上位ビットを含むにせよ含まないにせよ、これらの有効ビットはともに有効数字として知られている。正規化処理は、この有効数字内で表わされる有効ビット数を最大にする。浮動小数点数の丸め演算とは、数の精度を下げてその数の表示をより小さな数の有効ビットに適合させるようにする処理のことである。浮動小数点数表示には４つの典型的な丸め演算モードがあり、すなわちこれらは切上げ、切捨て、四捨五入および打切りである（Dewar，Microprocessors: A Programmer 's View，McGraw-Hill Publishing Co.，New York，1990，の議論に関する pp.1 40-143を参照）。また指数の桁数が有限であることにより、表わされる得る数の大きさには制限がある。これらの制限を超える算術結果はアンダフローおよびオーバフローとして知られている。算術オーバフローおよびアンダフローには数の２つの範囲がそれぞれ対応する。算術演算の結果が、表わされ得る最も大きな正の値より大きいかまたは表わされ得る最も大きな負の値未満であれば、算術オーバフローが起こる。この一方で、算術演算の結果が小さすぎて表わせない場合には、正または負の算術アンダフローのいずれかが起こっている。典型的には浮動小数点指数はバイアスによって表わされる（すなわちバイアスされた指数は真の指数値とバイアス定数との和に等しい）。バイアス定数は典型的には２^n-1−1、ただしｎは指数ビット数であるが、バイアス定数によりバイアスされた指数が符号なし整数として表わされる。この符号なし表示により２つの浮動小数点数の指数がビットごとに左から右に比較できるようになり、比較論理が簡単になる。最初に異なるビット位置は数を順序づける役割を果たし、真の指数はバイアスされた指数からバイアスを減算することにより決定できる。表わされ得る（最大から最小までの）数の精度および範囲、記憶要件および算術結果の計算に要するサイクルの間での種々のトレードオフを表わす一連の浮動小数点フォーマットが存在する。一般に、長いフォーマットは高い記憶要件を要し、精度および利用できる範囲の増加は（主に乗算および除算演算である）算術演算の速度低下をもたらす。ＡＮＳＩＩＥＥＥ規格７５４は、単精度、倍精度および拡張倍精度を含むいくつかの浮動小数点フォーマットを規定する。図１ａを参照して、３２ビットの単精度浮動小数点数のフォーマットは、１ビットの符号フィールド「Ｓ」と、８ビットのバイアスされた指数フィールド「ｅｘｐ」と、（明示的に表わされてはいないが暗黙のうちに２進小数点１１の１つだけ左にあると想定される）いわゆる「隠れ」ビットと、２３ビットの「有効数字」とに分割される。次に図１ｂを参照して、倍精度浮動小数点数のフォーマットではバイアスされた指数フィールドのサイズが１１ビットに、かつ有効数字のサイズが５２ビットに増大される。隠れビットは、１であると想定されるが倍精度フォーマットにおいては暗黙のうちに設けられる（暗黙に想定される２進小数点１２の１つだけ左）。次に図１ｃを参照して、拡張倍精度（以下拡張精度と呼ぶ）の浮動小数点フォーマットの最小要件が示されている。ＡＮＳＩＩＥＥＥ規格７５４によると、少なくとも６４ビットの有効数字および１５ビットのバイアスされた指数が与えられなければならない。単精度フォーマットおよび倍精度フォーマットとは対照的に、拡張精度浮動小数点フォーマットは有効数字内に暗黙の２進小数点１３を設け、２進小数点の左の桁が明示的に表わされる。「隠れ」ビットは存在せず、その代わり有効数字の（図１ｃに「ｈ」として示される）最上位ビットが拡張精度フォーマットにおいては明示される。ＩＥＥＥ規格では中間結果の計算のための内部フォーマットとして考えられているが、フォーマットは実際には、外部フォーマット（すなわちメモリに表わされかつプログラマがアクセス可能である）として、インテルコーポレイション（Intel Croporation）によるｉ８０３８７（商標）を含む多くの浮動小数点ユニットによって支持されている。計算処理能力を最大にするために、複数の機能ユニットを用いて命令レベルの並列性を可能にするよう多くのスーパースカラー技術が提案されている。命令の並列性とは、複数の機能ユニットを含むプロセッサにおいて１つ以上の命令を同時に（並行して）実行することであると説明できよう。パイプライン化技術は単一の機能ユニット内での命令の並列性の利用にかかわり、スーパースカラー技術は２つ以上の機能ユニットにわたって命令の並列性を利用することにかかわる。スーパースカラー技術によって利用される命令の並列性は、スーパースカラー技術が、別々のオペランドを用いた同一の命令だけではなく、異なった命令を並行して実行できるという点で、データの並列性と対照的であろう。スーパースカラープロセッサ設計の技術分野において公知であるこれらの技術には、命令のアウトオブオーダ（追越し）発行、命令のアウトオブオーダ完了および命令の投機的実行が含まれる。命令のアウトオブオーダ発行は、実行コード内の命令の実際の順とあまり関係なく機能ユニットに命令を発行することに関する。アウトオプオーダ発行を利用するスーパースカラープロセッサは、その命令ディスパッチシーケンスを作成するときには、所与の命令の出力（結果）とその後の命令の入力（オペランド）との間の依存関係によって制約を受けるだけでよい。一方、アウトオブオーダ完了はプログラムシーケンスにおいてそれより先にある命令を完了する前に、所与の命令を完了する（たとえばその結果を記憶する）ことを可能にする技術である。最後に、投機的実行は、（たとえば分岐の）予測結果に基づいて命令のシーケンスを実行することに関する。投機的実行（すなわち分岐が正確に予測されているという仮定のもとでの実行）は、分岐状態が実際に評価されるのを待つことなくプロセッサが命令を実行できるようにする。分岐が正確に予測されることが多く、かつ不正確な予測結果を訂正する適切な有効な方法が利用できると仮定すれば、命令の並列性（すなわち並行実行に利用できる命令数）は典型的には投機的実行によって増加するだろう（Johnson，Superscalar Processor Design，Prentic e-Hall，Inc.，New Jersey，1991の分析に関するpp.63-77を参照）。これらの技術の各々に関連した命令の並列性を利用するための構成設計は、さまざまな論文および文献において提案されている。議論に関してはJohnson の１２７頁から１４６頁（アウトオブオーダ発行）、１０３頁から１２６頁（アウトオブオーダ完了および依存関係）ならびに８７頁から１０２頁（分岐予測誤りのリカバリ）を参照されたい。命令の並列性を利用するためのアーキテクチャ上の試みは、リザベーションステーションおよびリオーダバッファである。本質的にはリザベーションステーションは、複数の機能ユニットを含むプロセッサ内の所与の機能ユニットのための命令およびオペランドバッファであるが、命令およびオペランドのバッファに加えて、リザベーションステーションは他の機能ユニットから結果を直接受取るための手段を提供する。このように、まだオペランドが利用できない命令であっても、そのオペランドがレジスタに記憶されてその後レジスタから取出されるのを待つことなく、所与の機能ユニットに関するリザベーションステーションにディスパッチすることができる。ＩＢＭジャーナル（IBM Journal）１９６７年１月号第１１巻に記載のトマスロ（Tomasulo）による「複数の実行ユニットを利用するための効率的アルゴリズム」（An Efficient Algor ithm for Exploiting Multiple Execution Units）には、各々がリザベーションステーションを有する複数の機能ユニットを含む浮動小数点プロセッサの実現例が開示されている。トマスロは「機能ユニット」ではなく「実行ユニット」という用語を用いているが、この状況では概念は類似する。リオーダバッファは複数の機能ユニットを含むプロセッサにおけるレジスタの投機的（すなわちアウトオブオーダ）状態を維持する、内容アドレス可能記憶装置である。各命令がデコードされると、リオーダバッファエントリが命令の結果を記憶するよう割当てられ、結果を識別するよう一時的な識別子すなわちタグが作成される。通常の命令シーケンスでは所与のレジスタは何度も書込まれ得るため、命令シーケンスの種々の点におけるレジスタの状態に対応して多数のリオーダバッファエントリが割当てられることとなる。オペランドとしてレジスタ値を要する命令がディスパッチされると、最も最近割当てられたリオーダバッファエントリが参照されるか、または必要なレジスタ場所に対応するリオーダバッファエントリがない場合には、レジスタファイルに記憶された値が用いられる。対応するリオーダバッファエントリが割当てられていると仮定すると、オペランド値を計算する命令が完了している場合には所与の命令に必要なオペランド値がリオーダバッファによって与えられ、そうでなければタグが与えられ、結果が利用できるようになれば命令がそれを認識できるようにする。リオーダバッファを組込んだスーパースカラープロセッサ設計はリオーダバッファエントリをリタイアする（すなわちエントリ値をレジスタファイルに記憶するかまたは必要でなくなったエントリを破棄する）ための機構をさらに提供する。リオーダバッファの実現によりレジスタリネーミング、分岐予測誤りの例外処理および命令のアウトオブオーダ完了を含むさまざまなスーパースカラー技術が容易になる。リザベーションステーションおよびリオーダバッファを含むスーパースカラー構成により、リオーダバッファからオペランドを受取りかつリオーダバッファにそれらの結果を記憶する機能ユニット間での命令の並列性の利用がさらに容易になる。浮動小数点ユニットは典型的に、装置の内部にある専用浮動小数点レジスタを有し、かつ拡張精度浮動小数点数に関するＩＥＥＥ７５４の最小要件に一致するかまたはそれをわずかに超える内部浮動小数点フォーマットを用いる、コプロセッサとして実現されている。内部浮動小数点レジスタはレジスタスタック（たとえばインテル社のｉ４８６（商標）Microprocessor Family Programmer's Refer ence Manual のpp.15-1 から15-2までを参照）または一連のアキュムレータ（たとえばタムラ他（Tamura et al．）の米国特許第５，１２８，８８８号の「多数のアキュムレータを有する算術ユニット」（“Arithmetic Unit Having Multipl e Accumulators”）を参照）として実現されることが多い。このような構成はオペランドが内部浮動小数点レジスタにロードされたときに（たとえば単精度、倍精度および拡張精度の浮動小数点である）オペランドデータを外部フォーマットから内部フォーマットに変換する。これらのレジスタに記憶されたデータで演算するその後の浮動小数点命令および（内部フォーマットで表わされる）中間結果は内部レジスタに書き戻される。さらに、結果は外部フォーマットに変換し直され、浮動小数点ユニットの外部にある汎用レジスタに送られる。典型的に、（たとえば分岐テスト、メモリへの記憶およびＩ／Ｏなどの）非浮動小数点演算は汎用レジスタに外部フォーマットで記憶された浮動小数点値で行なう必要がある。複数の機能ユニット、リザベーションステーションおよびリオーダバッファを含む浮動小数点ユニットの設計はJohnson による文献の４４頁から４５頁に示されている。図２は整数ユニット２２を有するこのような浮動小数点ユニット２１を組込んだプロセッサのブロック図である。プロセッサは１対のレジスタファイル（２３および２４）と１対のリオーダバッファ（２５および２６）とを含み、第１のレジスタファイル／リオーダバッファの組合せは整数装置のためのものであり、第２の組合せは浮動小数点ユニットのためのものである。図２に示されるプロセッサの設計は、独立した整数および浮動小数点レジスタ（およびリオーダバッファ）を維持するため、１つの（整数または小数点）演算装置内で計算されかつ他の演算装置におけるオペランドとして必要とされる結果は、その後の計算に用いられるよう第２の装置に伝達される必要がある。発明の概要この発明の利点は、内部フォーマットでデータを表わす浮動小数点機能ユニットと外部フォーマットでデータを表わす他の機能ユニットとを統合することである。浮動小数点ユニットおよび他の機能ユニットの両方によって用いられたオペランドおよび発生した結果に関する単一のデータ記憶装置の使用を可能にすることにより、この発明は浮動小数点機能ユニットおよび他の機能ユニットによって実行される命令間での並列性を利用するためのスーパースカラー技術の使用を可能にする。この発明の別の利点は、整数の算術に浮動小数点算術パイプラインを使用できることである。スーパースカラー技術は浮動小数点機能ユニットによって実行された整数命令および他の機能ユニットによって実行された命令間での並列性を利用するために用いられ得る。これらおよび他の利点はこの発明において実現され、この発明は１つの実施例においては、共通演算コードバス、共通オペランドバスおよび共通結果バスに結合された複数の機能ユニットを有するプロセッサ内の浮動小数点機能ユニットのためのリザベーションステーションである。浮動小数点機能ユニットは算術ユニットを含む。リザベーションステーションは、オペランドデータレジスタ、バスインターフェイス論理および第１のフォーマット変換論理を備えた実行待命令バッファを含む。バスインターフェイス論理は一方では共通オペランドバスと共通結果バスとの間に結合され、他方ではオペランドデータレジスタに結合されて、実行待命令バッファのオペランドデータレジスタにオペランドデータを選択的に受取る。第１のフォーマット変換論理はオペランドデータレジスタと算術ユニットのオペランド入力との間に結合され、外部データフォーマットの組のうちの１つから内部データフォーマットの組のうちの１つに選択的に変換されたオペランドデータを算術ユニットに供給する。別の実施例において、リザベーションステーションは、算術ユニットの結果出力と共通結果バスとの間に結合された第２のフォーマット変換論理をさらに含む。第２のフォーマット変換論理は内部データフォーマットの組のうちの１つにおいて結果データ値を受取り、その結果データ値を外部データフォーマットの組のうちの１つに変換し、変換された結果データ値を共通結果バスに与える。さらに別の実施例において、リザベーションステーションは、高速転送データ経路と、実行待命令バッファにおいてバッファされた命令に必要なオペランドと算術ユニットからの結果値との一致を検出するための手段とをさらに含む。高速転送データ経路は算術ユニットの結果出力と算術ユニットのオペランド入力との間に結合され、算術ユニットに算術結果を選択的に与える。検出手段は実行待命令バッファと高速転送データ経路との間に結合される。一致を検出することにより、検出手段が高速転送データ経路を選択的に能動化する。さらに他の実施例では、浮動小数点機能ユニットは乗算および加算パイプラインなどの複数の算術ユニットを含む。さらなる実施例において、第１のフォーマット変換論理は１６、３２および６４ビットの整数外部フォーマットからの整数オペランドを選択的に変換して、内部拡張精度フォーマットの通常のアライメントにおける正規化されていない浮動小数点値として整数オペランドをエンコードする。整数オペランドを選択的に変換することにより浮動小数点機能ユニットの算術ユニットが整数オペランドで演算できるようになる。さらなる実施例において、リザベーションステーションの第１のフォーマット変換論理は内部フォーマットオペランドを選択的に送り、第２のフォーマット変換論理は内部フォーマット結果を選択的に送り、浮動小数点機能ユニットの外部の浮動小数点レジスタ構成を表わせるようにする。たとえば、外部的に表わされた浮動小数点レジスタ構成はｘ８６浮動小数点スタックであり得、第１および第２のフォーマット変換論理は、内部フォーマットおよび外部フォーマットオペランドが浮動小数点機能ユニットの外部のレジスタファイル／リオーダバッファに表わされるようにする。この発明のさらに別の実施例は複数の機能ユニットを有するスーパースカラーデジタルコンピュータシステムである。コンピュータシステムは演算コードおよびオペランドポインタを与えるための命令デコーダと、第１のデータフォーマットでデータを記憶しそれを取出すためのデータ記憶装置と、第１のデータフォーマットで機能ユニットにオペランドを与えるためのオペランドバスと、第１のデータフォーマットで機能ユニットからの結果を通信するための結果バスと、命令デコーダから受取られた演算コードに応答してオペランドで演算を行なうための第１および第２の機能ユニットとを含む。第１の機能ユニットは第１のタイプの演算コードに応答して演算を行ない、第１のリザベーションステーションと、第２のデータフォーマットのオペランドに算術演算を行ない第２のデータフォーマットで結果を与えるための算術ユニットと、結果を第２のデータフォーマットから第１のデータフォーマットに変換するためのデータフォーマット変換器とを含む。第１のリザベーションステーションは、第１のオペランドバッファと、結果バスから結果を選択的に受取るためのバスインターフェイス論理と、オペランドデータを第１のデータフォーマットから第２のデータフォーマットに変換するためのデータフォーマット変換器とを含む。第２の機能ユニットは第２のタイプの演算コードに応答して演算を行ない、第２のリザベーションステーションと実行装置とを含む。第２のリザベーションステーションはオペランドバッファと、結果バスから結果を選択的に受取るためのバスインターフェイス論理とを含む。図面の簡単な説明この発明ならびにその多くの目的、特徴および利点は添付の図面を参照すると当業者にはよりよく理解され明らかとなるであろう。図面において、図１ａは、単精度浮動小数点数のフォーマットを示す図であり、図１ｂは、倍精度浮動小数点数のフォーマットを示す図であり、図１ｃは、拡張精度浮動小数点数のフォーマットを示す図であり、図２は、リザベーションステーションおよびリオーダバッファを組込んだ先行技術のスーパースカラープロセッサ設計の概略ブロック図であり、図３は、この発明の教示に従って構成されたリザベーションステーションを組込んだ浮動小数点ユニットの概略ブロック図であり、図４は、この発明によって処理された浮動小数点数の内部拡張精度フォーマットを示す図であり、図５は、この発明の教示に従って構成されたリザベーションステーションの概略ブロック図であり、図６は、この発明の教示に従って構成されたフォーマット変換論理の概略ブロック図であり、図７は、この発明の教示に従って構成されたアドレス可能浮動小数点定数記憶装置の概略ブロック図であり、図８は、この発明の教示に従って構成された結果フォーマット変換論理の概略ブロック図である。発明の詳細な説明図３はスーパースカラープロセッサのための浮動小数点算術ユニットＦＰＵ３００を示す。ＦＰＵ３００はリザベーションステーションＦＲＥＳ３１０と、制御論理ＦＣＮＴＬ３６２と、２つの算術ユニット（加算パイプラインＦＡＤＤ３３０および乗算パイプラインＦＭＵＬ３４１）と、丸め演算装置ＦＲＮＤ３５０とを含む。さらに、ＦＰＵ３００は３つの内部バス（内部Ａオペランドバス３７２、内部Ｂオペランドバス３７４および丸め演算バス３７６）と、プリディテクト装置ＦＰＤＥＴ３２０とを含む。リザベーションステーションは、複数の機能ユニットを含むプロセッサアーキテクチャ内の所与の機能ユニットへの命令および／またはデータバッファとして役割を果たすインターフェイスである。リザベーションステーションを組込んだプロセッサは所与の機能ユニットからの結果を、結果を待機している機能ユニットのリザベーションステーションに転送して、オペランドが利用できるようになる前に命令が機能ユニットにディスパッチされるようにするプロトコルを実現する。ここに開示されるリザベーションステーションは、オペランドおよび結果タグを用いることによりこのプロトコルを実現し、結果バス上の値にポストされたタグと所与のリザベーションステーションによって保持されたオペランドタグとが一致すると、結果バス上の値が、未決演算に必要なオペランドとしてリザベーションステーションの中に導かれる必要があることを示す。しかしながら、結果とオペランド位置とを照合するための他のな手段も可能であることを理解されたい。図３は付加的な機能ユニット３０３を示す。機能ユニット３０３は所与のスーパースカラープロセッサ構成に含まれ得る（たとえば整数、分岐、ロード／記憶装置などの）任意のタイプの機能ユニットを表わす。付加的な機能ユニット３０３はまた、ＦＰＵ３００に類似した付加的な浮動小数点ユニットを表わす。付加的な機能ユニット３０３にはリザベーションステーション３０３．１および実行装置３０３．２を組込まれている。機能ユニット３０３は命令デコーディング論理ＩＤＥＣＯＤＥ３０２、レジスタファイル／リオーダバッファＲＦＩＬＥ／ＲＯＢ３０１および他の機能ユニットと、ＦＰＵ３００およびそのリザベーションステーションＦＲＥＳ３１２に関して先に説明した態様で相互作用する。典型的に、スーパースカラープロセッサアーキテクチャにはいくつかの当該装置が含まれ得る。浮動小数点リザベーションステーションＦＲＥＳ３１０は外部バスのグループ３８０を介してＦＰＵの外部にあるソースから演算コード、オペランド、タグおよび結果を受取る。さまざまな周知のバス設計が適するが、非浮動小数点命令のディスパッチおよび実行を含む全体的な命令帯域を最適にするために、各バスタイプ（すなわち演算コード、オペランド、オペランドタグ、結果、結果タグおよび宛先タグバス）を複数例用いてもよい。さらに、固定および浮動小数点機能ユニットの統合を最適にするために多重オペランドバスを介して浮動小数点オペランドの全幅がＦＲＥＳ３１０に送られてもよい。多数の演算コード、オペランド、結果およびタグバスの使用は、引用によって援用される、１９９４年４月２６日に出願されたホワイト他（White et al.）らの発明者による「混合整数／浮動小数点固定ピッチコア」（“Mixed Integer/Floating Polnt Fixed Pitch Core” ）と題された同時係属中の特許出願連続番号第０８／２３３，５６３号〈代理人の事件番号Ｍ−２５１８−ＩＰ〉に、より詳細に記載されている。しかしながら、明瞭化のためにこの明細書では単一論理バスが仮定される。次に図３を参照して、浮動小数点ユニット３００の動作を説明する。各浮動小数点命令に関する演算コードは、演算コードバス３８１を介して命令デコードユニットＩＤＥＣＯＤＥ３０２からＦＰＵ３００のＦＲＥＳ装置３１０にディスパッチされる。ＩＤＥＣＯＤＥ３０２はさらにオペランドポインタを発生し、線３９１を介してこれらのポインタをＲＦＩＬＥ／ＲＯＢ３０１に与える。適切な命令デコードユニットは、引用によって援用される１９９３年１０月２９日に出願されたウィット他（Witt et al．）らの発明者による「スーパースカラー命令デコーダ」（“Superscalar Instruction Decoder”）と題された同時係属中の特許出願連続番号第０８／１４６，３８３〈代理人の事件番号Ｍ−２２８０〉に開示されている。オペランドポインタは、ディスパッチされた命令によってオペランドとして参照される、ＲＦＩＬＥ／ＲＯＢ３０１内のレジスタ場所を特定する役割を果たす。所与の浮動小数点演算に関するオペランドデータおよび／またはタグ（すなわちディスパッチされた演算コードによって参照されるＲＦＩＬＥ／ＲＯＢ３０１の場所に関するオペランドおよび／またはオペランドタグ）は、外部オペランドおよびタグバスを介してＦＰＵ３００のＦＲＥＳ装置３１０に、ＲＦＩＬＥ／ＲＯＢ３０１によって与えられる。図３は外部ＡおよびＢオペランドバス（３８８および３８７）ならびにＡおよびＢオペランドタグバス（３８６および３８５）を示す。オペランドデータが命令ディスパッチに利用できれば（たとえばデータがＲＦＩＬＥ／ＲＯＢにあれば）、データは適切な外部オペランドバスの線（すなわちＡオペランドについては外部Ａオペランドバス３８８であり、Ｂオペランドについては外部Ｂオペランドバス３８７）を介してＲＦＩＬＥ／ＲＯＢ３０１からＦＲＥＳ３１０に送られる。これに代えてオペランドがまだ利用できなければ（すなわち実行待命令の結果を表わしていれば）オペランドタグはＲＦＩＬＥ／ＲＯＢ３０１によってＦＲＥＳ３１０に与えられる。図３の実施例では、このタグは適切なオペランドタグバス（３８６または３８５）を介して与えられる。代替的な実施例（図示せず）では、オペランドタグは（３８８および３８７に類似する）外部ＡおよびＢオペランドバスの線に与えられ、オペランドタグバスは除外される。いずれの実施例でも、タグはＦＲＥＳ３１０が後にオペランドとして実行待演算の結果を受取ることができるようにする。ＡおよびＢオペランドに関しては、一方のオペランドが利用でき、よってそれを適切な外部オペランドバス（３８８または３８７）に送ることができるのと同時に、他方のオペランドは未決演算の結果を表わし、その代わりにオペランドタグを適切なオペランドタグバス（３８６または３８５）を介してディスパッチてきるという点で、両者は互いに独立している。ＦＲＥＳ３１０は、宛先タグバス３８２を介して各浮動小数点命令に関する宛先タグをさらに受取る。ＲＦＩＬＥ／ＲＯＢ３０１によって宛先タグバス３８２に駆動されるこの宛先タグは後に、ＦＲＥＳ３１０によって結果タグとして結果タグバス３８４にポストされる。ＦＲＥＳ３１０は対応する浮動小数点結果を結果バス３８３にさらに駆動する。ＦＲＥＳ３１０は、所与の命令がＦＰＵ３００にディスパッチされたときに実行待であった（したがってそれらの結果は利用できなかった）命令の結果を結果バス３８３を介して受取る。開示したスーパースカラープロセッサアーキテクチャ内の機能ユニット（すなわちＦＰＵ３００および３０３などの付加的な機能ユニット）の各々は、外部バスのグループ３８０上に結果値および特定結果タグをポストする。このような結果タグは結果値として同じバスサイクル中にか、またはバス調停方式がそのように支持するのであれば初期のバスサイクル中にポストされ得る。結果タグバス３８４の結果タグと、ＦＲＥＳレジスタに受取られて一時的に記憶されている未決浮動小数点命令に関するオペランドタグとを比較することにより、ＦＲＥＳ３１０はこれらの未決命令のオペランドに対応する結果を認識する。ＦＲＥＳ３１０はタグが一致すると結果バス３８３に表われる値を受入れる。ＦＲＥＳ３１０は２つの状態が一致するまで各浮動小数点命令とその関連したオペランドとをバッファする。まず、必要な浮動小数点算術ユニットを利用できるようにする必要があり、次にＡおよびＢオペランドの両方を利用可能な状態にする必要がある（すなわちオペランドタグ参照があればそれらを解決する必要がある）。ＦＰＵ３００は少なくとも１つの算術ユニットを含む。ここで開示する実施例では、ＦＰＵ３００には２つの算術ユニット、すなわち加算パイプラインＦＡＤＤ３３０および乗算パイプラインＦＭＵＬ３４１が含まれる。代替的な複数の算術ユニットも可能である。たとえば、除算、平方根、三角関数または超越関数用に構成された算術ユニットが含まれてもよく、正規化または浮動小数点フォーマット変換のための特定的な装置が組込まれてもよく、さらに所与の算術ユニットを複数個設けてもよい。また、複数の浮動小数点ユニット（たとえばＦＰＵ３００および付加的な機能ユニット３０３）を組込んだスーパースカラープロセッサにおいて、個々の浮動小数点ユニットが、類似したまたは異なった複数の算術ユニットを組込んでもよい。図３に示される浮動小数点乗算パイプライン３４１は任意の適切な設計を有する。パイプライン式浮動小数点乗算器は技術分野においては周知であり、多くの文献および論文に記載されている。たとえば HwangおよびBriggsのComputer Arc hitecture and Parallel Processing，McGraw-Hill Book Company，New York，1 984，pp.170-174 を参照されたい。浮動小数点加算パイプラインＦＡＤＤ３３０は浮動小数点加算を行ない、かつ共有されたオペランド正規化論理を与えるよう構成される。適切に構成された加算器および正規化論理は技術分野において周知である。浮動小数点加算を行ない、かつ正規化されていないオペランドを浮動小数点算術ユニットに与える前に正規化するための正規化論理を与えるよう構成された適切な加算パイプラインは、引用によって援用されるガプタ他（Gupta et al.）の「パイプライン型浮動小数点処理ユニットの正規化」（“Normalizing Pipelined Floating Point Process ing Unit）の米国特許第５，０５８，０４８号に記載されている。浮動小数点値は８５ビットの拡張精度フォーマットで内部的に表わされるが、他の内部フォーマットを用いてもよい。図４は内部拡張精度フォーマットを示し、このフォーマットでは、図１ａ、図１ｂおよび図１ｃに示される単精度、倍精度および拡張精度フォーマットと比較すると、指数および有効数字を表わすためのビットが追加されている。１７ビットのバイアス指数、６７ビットの有効数字および１ビットの符号フィールドが設けられている。有効数字内には、明示的な隠れビット（「ｈ」）が設けられ、正規化された浮動小数点値に関する２進小数点は隠れビットと６３ビット部分との間にあるようになっている。（ガードビット「ｇ」、丸めビット「ｒ」およびスティッキービット「ｓｔ」の）３つの付加的なビットにより浮動小数点結果が（ＦＲＮＤ３５０によって）６４ビットの外部拡張精度有効数字に正確に丸め演算され、すなわち内部フォーマットが無限精度を有するかのごとく丸め演算される。ＡおよびＢオペランドはＦＲＥＳ３１０によって（たとえば図１ａ、図１ｂおよび図１ｃの単精度、倍精度および拡張精度フォーマットである）外部浮動小数点フォーマットならびに（たとえば１６ビット、３０ビット、および６４ビットの整数フォーマットである）整数フォーマットから変換され、内部拡張精度フォーマットにおいて内部ＡおよびＢオペランドバス３７２および３７４に駆動される。浮動小数点算術ユニット（ＦＡＤＤ３３０およびＦＭＵＬ３４１）の各々は、バス３７２および３７４からその内部拡張精度オペランドを受取り、内部拡張精度結果を計算し、これを丸め演算バス３７６に駆動する。図３に開示される実施例では、内部ＡおよびＢオペランドバス３７２および３７４には表わされておらず、よって算術ユニット（ＦＡＤＤ３３０およびＦＭＵＬ３４１）またはＦＰＤＥＴ３２０には与えられない。その代わりに各オペランドの符号ビットが１対のライン３７１を介してＦＲＥＳ３１０によってＦＣＮＴＬ３６２に与えられる。ＦＣＮＴＬ３６２は算術結果の符号を決定し、例示的に示される制御バス３７８を介してその結果の符号をＦＲＮＤ３５０に直接与えるか、信号はバス上のすべての装置に与えられる必要はない。符号ビットがＦＲＮＤ３５０に直接与えられるため、丸め演算バス３７６は符号ビットをさらに除外する。丸め演算装置ＦＲＮＤ３５０は丸め演算バス３７６からこれらの結果を受取り、ＡＮＳＩＩＥＥＥ規格７５４によって特定された４つの丸め演算モードのいずれかに従って結果を丸め演算する。開示される実施例では、（一般には比較的静的である）選択された特定的な丸め演算モードがＦＣＮＴＬ３６２によってライン３７８に駆動された制御信号によって示される。ＦＰＵ３００（図示せず）の外部の丸め演算制御レジスタの状態が変化すると、ＩＤＥＣＯＤＥ３０２がその変化に対して浮動小数点命令の発行を直列にする必要がある。しかしながら、たとえば超越関数に関するマイクロコード化された命令シーケンスには丸め演算モードにおける連続したいくつかの変化が必要であるため、丸め演算モードは各マイクロコード命令と関連し、ライン３７１を介してＦＲＥＳ３１０によってＦＣＮＴＬ３６２に与えられる。ＦＲＮＤ３５０は、所望の結果フォーマットおよび選択された丸め演算モードに従って丸め演算された結果をＦＲＥＳ３１０に与える。結果フォーマットは単精度、倍精度および拡張精度浮動小数点ならびに（たとえば１６、３２および６４ビット整数の）さまざまな整数フォーマットを含み得る。丸め演算された結果をＦＲＮＤ３５０によって与えると同時に、浮動小数点制御装置ＦＣＮＴＬ３６２は対応する宛先タグをＦＲＥＳ３１０に与える。ＦＣＮＴＬ３６２はＦＲＥＳ３１０から受取られた宛先タグ（各浮動小数点命令に対し１つの宛先タグ）を記憶し続け、ＦＰＵ内の算術および非算術ユニット（すなわちＦＡＤＤ３３０、ＦＭＵＬ３４１、ＦＰＤＥＴ３２０およびＦＲＮＤ３５０）の内部段に対応する一連のラッチを通してこれらの宛先タグを伝搬する。このように、ラッチを通るタグの伝搬は、装置のさまざまな段におけるオペランドの処理に対応する。ＦＲＥＳ３１０はＦＲＮＤ３５０によって与えられた丸め演算された浮動小数点結果を外部フォーマットに整列させる。ＦＲＥＳ３１０は外部フォーマットの浮動小数点（または整数）結果を結果バス３８３に駆動し、それと同時に、対応する結果タグを結果タグバス３８４に駆動する。ＦＲＥＳ３１０は受取られた宛先タグと次の浮動小数点命令に関するオペランドタグとをさらに比較する。このようにして、次の浮動小数点命令に関するオペランドでもある浮動小数点結果値が特定できる。このような場合、ＦＲＥＳ３１０はＦＲＮＤ３５０から受取られた内部フォーマットの浮動小数点結果を内部オペランドバス（３７２または３７４）の一方に高速転送する。ＦＲＥＳ３１０によって結果バス３８３に駆動された浮動小数点結果値はＲＦＩＬＥ／ＲＯＢ３０１に受取られ、結果タグバス３８４のタグ値に従ったＲＦＩＬＥ／ＲＯＢ場所に記憶される。さらに、結果タグバス３８４の結果タグが機能ユニットのリザベーションステーションの命令に関するオペランドタグに対応する場合には、結果バス３８３に書込まれた浮動小数点結果値は、付加的な機能ユニット３０３などの他の機能ユニットのリザベーションステーションに受入れられる。後の命令に関するオペランドに対応する浮動小数点結果は一般に、先に特定された（かつ以下により詳細に説明する）高速転送データ経路を介して送られるが、場合によっては、ＦＲＥＳ３１０によって結果バス３８３に書込まれた値が結果バス３８３からのオペランドとして浮動小数点リザベーションステーション自体（ＦＲＥＳ３１０）によって受入れられてもよい。このように、１つの浮動小数点命令の結果はまだ未決定のオペランドタグとしてＡおよびＢオペランドの両方が表わされる、後の浮動小数点命令に関するオペランドとしてＦＲＥＳ３１０の中に戻され得る。複数の小数点命令をバッファするこの発明の実施例はまた、結果バス３８３を介してＦＲＥＳ３１０の中に浮動小数点結果を戻し得る。ＦＲＮＤ３５０は、丸め演算演算を行なうことなく、また、結果をＦＲＥＳ３１０に駆動することなく、内部ＡまたはＢオペランドバス（３７２または３７４）のいずれかに、丸め演算バス３７６に表われる内部拡張精度フォーマットの浮動小数点値を駆動し得る。このような演算モードは、算術ユニットを複数回通ること、または複数の算術ユニットを用いて支持される命令のために用いられるが、この命令にはたとえば、ＦＡＤＤ３３０に設けられた正規化回路構成を通して非正規化オペランドの各々をまず通過させ、その後、正規化されたオペランドをＦＭＵＬ３４１に与えて乗算することにより実現される、非正規化浮動小数点数の乗算かある。非正規化値としても知られているまだ正規化されていない値は、非正規化浮動小数点値である。丸め演算装置に関する特定的な演算モードは、制御バス３７８を介してＦＲＮＤ３５０によって受取られたＦＣＮＴＬ３６２からの制御信号によって選択される。プリディテクト装置ＦＰＤＥＴ３２０は内部ＡおよびＢオペランドバス３７２および３７４から内部拡張精度フォーマットのＡおよびＢオペランドをさらに受取る。ＦＰＤＥＴ３２０は０オペランド、無限オペランド、非数（ＮａＮ）オペランドおよび非正規化オペランドとしてこのような状態を検出する。開示される実施例では、（Ａ_exponent＞Ｂ_exponent）および（Ｂ_exponent＞Ａ_exponent）などの付加的な状態がFＡＤＤ３３０で検出されるが、代替的な実施例はこのような状態に関するＦＰＤＥＴ３２０検出論理を組込んでもよい。検出された状態信号は制御バス３７８を介して制御論理ＦＣＮＴＬ３６２に与えられる。さらに、ＦＰＤＥＴ３２０は算術結果を強制的に内部拡張精度フォーマットで丸め演算バス３７６に出力してもよい。算術ユニットをバイパスする論理を有するプリディテクト装置３２０の設計は、本件と同じ日に出願され、かつ引用によって援用される、ゴダード他(“Goddard，et al.”)らの発明者による「強いられた算術結果を有する浮動小数点ユニット」（“Floating Point Unit with Forced Arithm etic Results”）と題された同時係属中の特許出願連続番号第ｘｘ／ｘｘｘ，ｘｘｘ〈代理人の事件番号Ｍ−２５７９〉に記載されている。次に図５を参照して、ＦＲＥＳ３１０は浮動小数点命令および関連データを待ち行列に入れるためのバッファ５１１と、タグ比較論理５１３と、高速転送タグ比較論理５３１と、オペランド選択論理５１２と、オペランドフォーマット変換論理５１４および５１５と、浮動小数点定数記憶装置５１６と、結果フォーマット変換論理５３２と、リザベーションステーション制御論理５３３とを含む。浮動小数点命令およびその関連データ（すなわちＡおよびＢオペランド、宛先タグならびにＡおよびＢオペランドタグ）は外部バスのグループ３８０を介してＦＲＥＳ３１０によって受取られ、バッファ５１１で待ち行列に入れられる。図５の実施例では、バッファ５１１は単一エントリバッファとして編成されるが、他のバッファ設計も可能である。たとえば、バッファ５１１は多重エントリＦＩＦＯバッファかまたは何らかの他の優先順位付待ち行列順序付けを実現するための論理を備えた多重エントリバッファとして実現されてもよい。適切なバッファ設計は技術分野において周知である。バッファ５１１が空であれば浮動小数点命令（すなわち演算コード）およびその関連データは外部バスのグループ３８０を介してＩＤＥＣＯＤＥ３０２によってディスパッチされたときにエントリ５１１．１の中に直接導かれ、もし一杯であれば、信号（ＦＰＴＦＵＬＬ）がリザベーションステーション制御論理ＦＰＵＲＳＣＴＬ５３３によってライン５２２上のＩＤＥＣＯＤＥ３０２に返され、リザベーションステーションが一杯で別の浮動小数点命令がディスパッチされるべきではないことを示す。ＦＰＴＦＵＬＬはバッファエントリが再び利用できるようになるとクリアされる。ＩＤＥＣＯＤＥ３０２によってディスパッチされた各浮動小数点命令に関する演算コードは演算コードバス３８１を介してＦＲＥＳ３１０によって受取られる。各演算コードに関連したデータには、ＡおよびＢオペランドデータバス３８８および３８７から読出された値と、ＡおよびＢオペランドタグバス３８６および３８５から読出されたＡおよびＢオペランドタグと、宛先タグバス３８２から読出された宛先タグとが含まれる。これらのデータはバッファ５１１にある関連した演算コードとともに記憶される。リテラルＡおよびＢオペランド値は演算コードを有して到達し得るが、現在の命令がディスパッチされたときにＡおよび／またはＢオペランドのリテラル値が利用できなければ（すなわち現在の命令がディスパッチされたときにいずれかのまたは両方のオペランド値が、ディスパッチされているがまだ完了していない別の命令の結果に対応するならば）、ＦＲＥＳ３１０は算術ユニット（ＦＡＤＤ３３０またはＦＭＵＬ３４１、ＦＤＩＶ３４２）に命令を発行する前に、結果バス３８３に表われる対応する結果を待機する必要がある。オペランドタグ上にある、またはそれと関連した、タグ有効ビットは、オペランドデータではなく（オペランドタグバス３８６および３８５を介して）ＲＦＩＬＥ／ＲＯＢ３０１から受取られたオペランドタグが有効であることを示す。この場合、ＦＲＥＳ３１０は５１１においてバッファされたオペランドタグ値と結果タグバス３８４にポストされた結果タグとを比較して、オペランドデータとして導かれるべき結果バス３８３上の結果を特定する。タグ比較論理５１３はマルチプレクサ制御信号をオペランド選択論理５１２に駆動する一連の比較器を含む。タグ比較論理５１３はライン５１９．２を介してバッファ５１１の第１のエントリ（５１１．１）に記憶されたＡオペランドタグ（以下ＡＴ₁とする）を読出し、それと結果タグバス３８４から読出された結果タグとを比較する。ＡＴ₁が結果タグと一致すれば、制御ライン５１８．１はマルチプレクサ５１２．１において結果バス入力を選択し、結果バス３８３に表われる値はバッファエントリ５１１．１のＡオペラントルジスタ（Ａ₁）の中に導かれる。同様に、結果タグバス３８４から読出された結果タグと比較され、一致していれば、対応するオペランド選択マルチプレクサ（５１２．２）の結果バス入力が能動化され、結果バス３８３の値は対応するオペランドレジスタ（Ｂ₁）の中に導かれる。多重エントリバッファのタグ比較論理およびオペランド選択論理設計は当業者には明らかであろう。所与の結果タグは複数のオペランドタグと一致し得るため、結果バス３８３の値は１つより多いオペラントルジスタの中に導かれ得る。タグ比較論理５１３は、タグ一致があればそれを示すリザベーションステーション制御バス５３６を介してＦＰＵＲＳＣＴＬ５３３に信号を与える。バス構造として５３６で図５に示したものは単に例示の目的であって、この明細書を通してたとえばポイントツーポイント制御ラインなどの代替的な制御信号経路が考えられることに留意されたい。開示された実施例では、結果タグ値はバスサイクルの段階１（ｆ₂）中に有効になり、結果値は同じサイクルの段階２（ｆ₁）中に有効になる。代替的な実施例は、バッファ５１１に選択的に結果データを受取るための代替的なバスインタフェース論理設計を組込んでもよい。たとえば、別々のバスサイクル中または単一バスサイクルの単一段階中に結果タグおよび結果値を与えることはいずれも可能である。さらに、結果データの特定は代替的なコーディングによって行なわれてもよい。たとえば、結果の特定は結果バス３８３を介して受取られた結果データにエンコーディングされた情報を用いて行なうことができる。ＦＰＵ３００以外のソースから外部ＡおよびＢオペランドバス３８８および３８７または結果バス３８３を介してＦＲＥＳ３１０に到達する浮動小数点オペランドは（たとえば単精度、倍精度または外部拡張精度浮動小数点フォーマットまたは整数フォーマットである）外部フォーマットで表わされる。一方浮動小数点ユニットは、表わされ得る中間結果の範囲（大きさ）を増加するための付加的な指数ビットを含む内部拡張精度フォーマットで、浮動小数点値を内部的に表わす。開示された実施例ては、この内部拡張精度フォーマットは、正確な丸め演算を支持するべく有効数字に付加的なビットをさらに含む、図４において先に示した８５ビットの拡張精度フォーマットである。もちろん代替的なおよび／または付加的な内部および外部フォーマットも可能であり、特に８０ビットより多いビットを与える拡張精度フォーマットも可能である。一般に、ＦＲＥＳ３１０はオペランドを外部フォーマットから内部フォーマットにインライン変換する。しかしながら、ここに開示した実施例では浮動小数点スタックからのオペランド、すなわち浮動小数点スタックのｘ８６アーキテクチャの特徴に対応するＲＦＩＬＥ／ＲＯＢ３０１エントリから外部ＡおよびＢオペランドバス３８８および３８７を介して到達するオペランドは、ＦＰＵ３００の外部に記憶され精度の落とされた内部フォーマットでＦＲＥＳ３１０に到達する。精度の落とされたこの内部フォーマットは、ガード、丸め演算およびスティッキービットが除外された内部拡張精度フォーマットと均等であるが、他の代替も可能である。外部フォーマットまたは精度の落とされた内部フォーマットのいずれかで到達するオペランドはＡＬＩＧＮＡ５１４またはＡＬＩＧＮＢ５１５によって内部フォーマットに変換される。ＦＲＮＤ３５０からＦＲＥＳ３１０に与えられた浮動小数点結果は、所与の命令に関する結果フォーマットに従って丸め演算される。このような丸め演算結果はＡＬＩＧＮＲＥＳ５３２によって結果バス３８３における適切なビット位置に整列され、対応する命令に関する結果フォーマットによって、特定的なリアライメントが決定する。丸め演算されたこのような浮動小数点結果が、バッファエントリ５１１．１において待ち行列に入れられた浮動小数点命令に関するオペランドでもある場合には、リアライメントなしに適切な内部オペランドバス（３７２または３７４）に「高速転送」され得る。浮動小数点フォーマット変換論理ＡＬＩＧＮＡ５１４およびＡＬＩＧＮＢ５１５はＡおよびＢオペランドを外部フォーマットから内部拡張精度フォーマットに変換する。フォーマット変換には、指数のバイアス調整と、ターゲットフォーマットにおける正しい位置にソース有効ビットをシフトすることが必要である。図５の実施例では、演算コードビットは関連したオペランドのフォーマットを示す。したがって演算コードビットはバッファエントリ５１１．１によってＡＬＩＧＮＡ５１４およびＡＬＩＧＮＢ５１５に与えられ、正しい変換を選択するようにする。内部拡張精度フォーマットにおける変換されたＡオペランドデータはライン５１４．３およびラインドライバ５２０を介してＡＬＩＧＮＡ５１４によって内部Ａオペランドバス３７２に駆動される。図５の実施例では、Ｂオペランドデータはオペランドのリテラル値を表わすか、またはこれに代えて、定数記憶装置ＦＣＮＳＴ５１６から浮動小数点定数を選択するためのインデックスを表わし得る。前者の場合では、ラインドライバ５２１は内部拡張精度値を内部Ｂオペランドバス３７４に駆動し、後者の場合にはＢ₁の内容はＦＣＮＳＴ５１６の中を指示されるために用いられ、かくして指示された定数値はライン５１６．２を介してマルチプレクサ５１２．２に与えられ、それはここでインデックスを置換する。１サイクルの遅延を受けたあと、内部拡張精度定数はラインドライバ５２１によって内部Ｂオペランドバス３７４に駆動される。浮動小数点定数は内部拡張精度フォーマットでＦＣＮＳＴ５１６によって与えられるためフォーマット変換は必要でない。変換された２つの単一定数（すなわち精度の低い定数）を１つのＦＣＮＳＴ５１６エントリに記憶し単一インデックスでアクセスすることもできる。開示された実施例では、演算コードビットはＢオペランドデータがＦＣＮＳＴ５１６へのリテラル値またはインデックスを表わすかどうかを示す。これらのビットはＦＰＵＲＳＣＴＬ５５３によって受取られる。定数ルックアップが示されると、ＦＰＵＲＳＣＴＬ５５３はリザベーションステーション制御バス５３６を介して入力選択信号をマルチプレクサ５１２．２に与える。先程と同様に、リザベーションステーション制御バス５３６の使用は例示の目的のものであり、代替的な制御信号経路も考えられる。浮動小数点命令が１対の定数に対して演算されることは滅多にないため、定数は例示的にＢオペランド位置として示される単一のオペランド位置にアドレスされ、あまり発生することがないので２つの命令による等価シーケンスで十分である。ＦＣＮＳＴ５１６はＰＬＡとして実現され、この場合ＦＰＵＲＳＣＴＬ５５３は例示的に示されるリザベーションステーション制御バス５３６およびライン５１６．３を介してＰＬＡプリチャージ信号をさらに与える。ＦＲＥＳ３１０は５１１．１に記憶された演算コード（ＯＰ₁）およびその関連データが有効であることを示す演算コード有効信号（ＦＯＰＶＡＬ）を制御バス３７８を介してＦＣＮＴＬ３６２に駆動する。ＦＯＰＶＡＬ信号に応答して、ＦＣＮＴＬ３６２はＯＰ₁を読出し、その後ＦＰＵの算術および非算術ユニット（ＦＡＤＤ３８０、ＦＭＵＬ３４１、ＦＰＤＥＴ３２０およびＦＲＮＤ３５０）を通るオペランドデータの流れを両方制御する。ＦＣＮＴＬ３６２はバッファエントリ５１１．１からの宛先タグ（ＤＴ₁）をさらに受取り、演算コードおよび任意のパイプラインスケジューリング制約に従って内部ラッチの組を通して宛先タグを伝搬する。適切な算術ユニットの中にオペランドが導かれると、ＦＣＮＴＬ３６２は例示的に示される制御バス３７８を介してオペランド受入信号（ＦＯＰＡＣＣ）をＦＰＵＲＳＣＴＬ５３３に駆動し、このオペランド受入信号は５１１．１の命令がＦＰＵによって受入れられており、バッファエントリ５１１．１の内容が上書きできることを示す。場合によっては（たとえばＦＰＤＥＴ３２０またはＦＲＮＤ３５０などの）別の算術ユニットが内部ＡおよびＢオペランドバス３７２および３７４を駆動できるようにすることが必要である。一例としては非正規化オペランドの乗算が挙げられ、ここでは（例示的に示されるＦＡＤＤ３８０である）算術ユニットが内部ＡおよびＢオペランドバス３７２および／または３７４から受取られた非正規化値を正規化し、結果として生じた正規化されたオペランドを丸め演算バス３７６に駆動する。その後ＦＲＮＤ３５０が、正規化されたオペランドを丸め演算バス３７６から受取り、その正規化されたオペランドを、それが入来した内部オペランドバス（すなわち内部Ａオペランドバス３７２または内部Ｂオペランド３７４のいずれか）に駆動する。このような場合、ＦＣＮＴＬ３６２は例示的に示される制御バス３７８を介して制御信号（ＦＰＳＥＲＩＡＬ）をＦＲＥＳ３１０に駆動し、これによりラインドライバ５２０および５２１が内部ＡおよびＢオペランドバス３７２および３７４へのＦＲＥＳ出力を浮遊状態とする。次に図６を参照して、変換論理ＡＬＩＧＮＡ５１４の機能および構成が示される。ＡＬＩＧＮＢ５１５は類似した設計を有する。指数はバイアスを有して表わされるため、浮動小数点フォーマット間での変換にはバイアス調整が必要である。先に留意したとおり、Ｎビット指数のバイアスは２^N-1−１である（すなわち単精度に関して規定された８ビット指数については７Ｆｈであり、１１ビットの倍精度指数については３ＦＦｈであり、１５ビットの外部拡張精度指数については３ＦＦＦｈである）。外部浮動小数点フォーマットから内部拡張精度フォーマットへの変換時の指数バイアスの正しい調整量は、ターゲットフォーマットのバイアスとソースフォーマットのバイアスとの差である。内部拡張精度の１７ビット指数に関する指数バイアスはＦＦＦＦｈであるため、単精度からの変換にはＦＦ８０ｈのバイアス調整が必要であり、倍精度からの変換にはＦＣ００ｈのバイアス調整が必要であり、外部拡張精度からの変換にはＣ０００ｈのバイアス調整が必要である。バイアス調整論理はバイアス調整された指数を生成するよう１７ビット加算器を用いることができる。しかしながら、バイアス調整定数の構成は特殊でありかつソース指数のビット幅は制限されているため、単一インバータを含む簡単な加算器を設計してもよい。図６はＡＬＩＧＮＡ５１４において３つの簡単なバイアス調整加算器６１４．１、６１４．２および６１４．３を含む実施例を示す。バイアス調整加算器６１４．１の演算は以下の例によって説明される。単精度から内部拡張精度への変換時の、指数に対する正確なバイアス調整は、下記のとおりバイアス値ＦＦ８０ｈを８ビットの単精度バイアス指数に加算することにより行なわれる。ここで指数の低位７ビットは０または１のいずれをも表わし得るため「Ｘ」として示される。上位９ビットは指数が８ビット値（単精度指数）であるため０として示される。ビット７，「？」は最適化された加算器の制御ビットである。指数のうち７ビットは常に１に加算され、バイアス調整定数の次の８つの上位ビットの各々は１に等しいため、和の（すなわち調整された指数の）ビット８から１５まで（“＊”として示される）は指数のビット７の補数に等しく、和のビット１６は指数のビット７に等しい。バイアス調整加算器６１４．１はこの最適化された加算器の実現例を示す。倍精度および外部拡張精度フォーマットへの変換のためのバイアス調整には類似した加算器設計が用いられてもよい。バイアス調整加算器６１４．２はバイアス調整定数ＦＣ００ｈを１１ビットの倍精度指数に加算する実現例を示し、バイアス調整加算器６１４．３はバイアス調整定数Ｃ０００ｈを１５ビットの外部拡張精度指数に加算する実現例を示す。ブロック６１４．５、６１４．６および６１４．７における残りの論理はアライメント論理であり、このアライメント論理は符号および有効ビットを８５ビットの内部拡張精度フォーマット内の位置にシフトし、隠れビットを発生し、各浮動小数点変換に関する有効数字の残りの低位ビットを０で満たす。ブロック６１４．９は内部拡張精度フォーマットを満たす、精度の落とされた内部フォーマットオペランドの変換のための論理を示す。ブロック６１４．９の変換により、浮動小数点スタックをＲＦＩＬＥ／ＲＯＢ３０１においてＦＰＵ３００の外部に示すことができるようになる。整数アライメント論理６１４．８はオペランドデータを整数フォーマットから内部拡張精度フォーマットに変換する（ふたたび図４を参照）。整数アライメント論理６１４．８（図示せず）の設計はブロック６１４．５、６１４．６および６１４．７に示されるアライメント論理のものに類似する。整数アライメントは、（たとえば８、１６、３２または６４ビット整数である）ｎビット整数の低位ｎ−１ビットを小数部の低位ビットにシフトし、小数部の残りの上位ビットを符号拡張し、符号ビット（ビットｎ）を符号位置にシフトし、予め定められた値を指数フィールドに配置して、内部拡張精度フォーマットの通常のアライメント内に、非正規化浮動小数点値としてエンコーディングされた６４ビット整数を生成する。予め定められた指数値は指数バイアスに関して調整された（ターゲットフォーマットにおける）暗黙の２進小数点の右の有効ビット数に等しい。したがって、値は予め定められており、整数ソースフォーマットとは独立である。ターゲットフォーマットが内部拡張精度フォーマットである、開示された実施例では、予め定められた値は１００３Ｅｈ（３Ｆｈ＋ＦＦＦＦｈであり、ここで３Ｆｈは十進法の６３の１６進法表記である）に等しい。また、開示された実施例では、非正規化浮動小数点値としてエンコーディングされた６４ビット整数はＦＡＤＤ３３０に送られて正規化されるが、整数アライメント論理６１４．８において専用の正規化回路構成を有する代替的な実施例（図示せず）が所望に応じて実現されてもよい。図示していない実施例では、ＡＬＩＧＮＢ５１５の設計はＡＬＩＧＮＡ５１４の設計に実質的に類似する。しかしながら、スタック指向の浮動小数点命令セットを支持する図５の実施例では、ＡＬＩＧＮＢ５１５は整数から内部拡張精度への変換論理（６１４．８に相当する）しか含まない。スタック指向命令セットは典型的には、命令ごとに新しいオペランドを１つだけ導入し、よって図５の実施例は、例示的に示されるＡオペランドに関するデータ経路である１つだけのデータ経路に沿って全オペランドフォーマット変換をもたらす。Ａオペランドデータ経路における整数アライメント論理６１４．８に関連して、Ｂオペランド経路における制限された整数アライメント論理は、ＦＭＵＬ３１４などのＦＰＵ３００の算術ユニットが、非正規化内部拡張精度値としてエンコーディングされた整数オペランドでの整数算術に用いられることができるようにする。図８は結果フォーマット変換論理ＡＬＩＧＮＲＥＳ５３２を示す。ＡＬＩＧＮＲＥＳ５３２は、ＡＬＩＧＮＡ５１４の、対応するアライメント論理によって行なわれたビットアライメント変換を逆にする。ＡＬＩＧＮＲＥＳ５３２は８２ビットの丸め演算された結果をＦＲＮＤ３５０から受取り、ライン５５０．１に示された結果フォーマットに対応するビット位置にこれらの８２ビットのうちいくつかをシフトする。単精度結果フォーマットに関するビットシフトは変換経路８３２．１に従って行なわれ、倍精度および外部拡張精度結果フォーマットに関するビットシフトはそれぞれ変換経路８３２．２および８３２．３に従って行なわれる。（ＡＬＩＧＮＡ５１４の整数アライメント論理６１４．８に対応する）変換経路８３２．４は同様に、外部構成の整数−レジスタビットマッピングに従って整数フォーマットを整列する。マルチプレクサ８３２．５は整列された特定的な結果を選択し、ライン５５０．３を介してその丸め演算され、整列された結果を結果バス３８３に与える。当業者には、さまざまな変換経路（すなわち８３２．１、８３２．２、８３２．３および８３２．４）に沿ったアライメント機能の共通性を利用するようＡＬＩＧＮＲＥＳ５３２のアライメントおよび選択論理を最適化できることが認識されるであろう。たとえば、各浮動小数点フォーマットの符号ビットおよび上位８つの指数ビットのアライメントは共通のアライメント論理によって行なうことができる。したがって図８は、適切なアライメント論理のビットの経路を示す。共通性の利用を含む、このような論理の適切な最適化はここに開示される実施例の一部分として考えられる。ライン８３２．６は精度が落とされた内部フォーマット結果（すなわち「ｒ」「ｇ」および「ｓｔ」ビットを有さない内部拡張精度）をＲＦＩＬＥ／ＲＯＢ３０１においてＦＰＵ３００の外部に示される浮動小数点スタックに与えるための無変換経路を表わす。再び図５を参照して、ライン５５０．２にＦＲＮＤ３５０によって与えられた、丸め演算されているが整列されていない結果がラインドライバ５３４および５３５にさらに与えられ、これらのラインドライバは制御バス５３６を介してＦＰＵＲＳＣＴＬ５３３によって与えられた制御用信号に従って、内部Ａオペランドバス３７２または内部Ｂオペランドバス３７４のいずれかに当該結果を再び駆動して戻す。前述のとおり、バス５３６の図は例示的なものであり代替的な実施例も考えられる。このように、外部フォーマットに従って整列された結果は外部結果バス３８３に与えられ、さらに、適切であれば、対応する整列されていない結果が未決浮動小数点命令に関するオペランドとして内部オペランドバスにさらに高速転送され得る。高速転送するための特定的な結果は、ライン５１９．３および５１９．４を介してバッファ５１１から未決命令に関するＡおよびＢオペランドタグを受取り、かつそれらのオペランドタグをライン５６２．２にＦＣＮＴＬ３６２から受取られた宛先タグと比較する、高速転送タグ比較論理５３１によって行なわれる。ＡおよびＢオペランドタグの一致はＦＣＮＴＬ３６２に与えられる。タグ一致は、ライン５５０．２に与えられた結果が実行待命令に必要なオペランドであり、（整列されて結果バス３８３に与えられることに加えて）適切な内部オペランドバス３７２または３７４に直接駆動される必要があることを示す。この高速転送経路により、外部結果バスからの結果の導入に関連し得る余分なバスサイクルの遅延がなくなる。後の命令に関するオペランドに対応する浮動小数点結果は一般に、上述の高速転送データ経路を介して送られるが、場合によってはＦＲＥＳ３１０によって結果バス３８３に書込まれた値が、余分なバスサイクルの遅延にもかかわらず結果バス３８３からオペランドとして導かれてもよい。特に、それに対してＡおよびＢオペランドがいずれもまだ未決定のオペランドタグとして表わされる、後の浮動小数点命令に関するオペランドとして、１つの浮動小数点命令の結果をＦＲＥＳ３１０の中に戻すこともできる。この場合、後に表われる結果／オペランドのみが高速転送経路を介して与えられることとなる。さらに、バッファ５１１内に複数のエントリを含むこの発明の代替的な実施例では、バッファ５１１において待ち行列に入れられた最も優先度の高い（すなわち次の）命令の、未決定のオペランドについては高速転送経路を利用するが、優先度の低い（すなわち後の）命令については浮動小数点結果を結果バス３８３を介してＦＲＥＳ３１０にサイクルバックする。浮動小数点リザベーションステーションＦＲＥＳ３１０に（たとえばＡＬＩＧＮＡ５１４、ＡＬＩＧＮＢ５１５およびＡＬＩＧＮＲＥＳ５３２の）フォーマット変換論理を組込むと、内部および外部フォーマットの両方において、ＲＦＩＬＥ／ＲＯＢ３０１内および結果バス３８３上に、浮動小数点値を維持することができるプロセッサアーキテクチャとなる。ＲＦＩＬＥ／ＲＯＢ３０１に記憶された浮動小数点値は（たとえば単精度、倍精度および外部拡張精度フォーマットならびに整数フォーマットの）外部フォーマットに維持されるため、これらのＲＦＩＬＥ／ＲＯＢ３０１エントリはＦＰＵ３００および非浮動小数点機能ユニットによって共有され得る。付加的な機能ユニット３０３は（たとえば整数、分岐およびロード／記憶装置の）非浮動小数点ユニットを含む任意のタイプの機能ユニットを表わす。典型的には、スーパースカラープロセッサには多くのこれらの実行装置が含まれ得る。ＦＰＵ３００および付加的な機能ユニット３０３によって外部フォーマットで結果バス３８３に駆動された結果値は、浮動小数点および非浮動小数点機能ユニットの両方によって受取られる（すなわちＦＰＵ３００のＦＲＥＳ３１０および付加的な機能ユニット３０３の両方が、タグが一致した時には結果バス３８３から外部フォーマット値を導く）。付加的な機能ユニット３０３は付加的な浮動小数点機能ユニットをさらに表わし得る。オペランド値を外部フォーマットから内部フォーマットに変換して、ＲＦＩＬＥ／ＲＯＢ３０１での共有記憶と、結果バス３８３上での結果値の共用とを可能にすることにより、（たとえばＡＬＩＧＮＡ５１４、ＡＬＩＧＮＢ５１５およびＡＬＩＧＮＲＥＳ５３２を有するＦＲＥＳ３１０の）データフォーマット変換論理を組込んだ浮動小数点リザベーションステーションによりさらに、プロセッサアーキテクチャが（たとえばレジスタリネーミング、分岐予測、アウトオブオーダ発行およびアウトオブオーダ完了の）スーパースカラー技術を用いて浮動小数点命令および非浮動小数点命令間での命令の並列性を利用できるようになる。フォーマット変換論理（ＡＬＩＧＮＡ５１４およびＡＬＩＧＮＢ５１５）内での指数バイアス調整のために、簡単な加算器（６１４．１、６１４．２および６１４．３）を利用すると、ＦＲＥＳ３１０はこれらのフォーマット変換の実行を非常に短い待ち時間および低い複雑性で行なう。変換待ち時間が短いと外部浮動小数点データの演算速度が増し、浮動小数点データはＦＰＵ３１０の外部の、付加的な機能ユニット３０３などの他の機能ユニットに利用できるような、レジスタに維持できるようになり、データの依存性を間接化させるためにスーパースカラー技術を用いることができる。浮動小数点定数は、行なわれる変換が、定数のインデックス値から内部拡張精度表記へのものであるという特定的な場合のオペランドフォーマット変換を表わす。アドレス可能記憶装置から浮動小数点定数を与えることは、引用によって援用され本件と同じ日に出願された、マイケルディー・ゴダード他（Michael D ．Goddard，et al.）らの発明者による「浮動小数点処理装置のためのアドレス可能定数記憶装置を含むリザベーションステーション」(“Reservation Station Including Addressable Constant Store for a Floating Point Processing Un it”)と題された同時係属中の特許出願連続番号第ｘｘ／ｘｘｘ，ｘｘｘ号〈代理人の事件番号Ｍ−３５３２ＵＳ〉に記載されている。図５の実施例では、いくつかの演算コードにより、バッファエントリ５１１．１のレジスタＢ₁に記憶された値がリテラルオペランド値ではなく定数記憶装置ＦＣＮＳＴ５１６へのインデックスを表わすことが示されている。オペランド値が（演算コードエンコーディングではなく）オペランドコーディングとして定数インデックスを表わすことを示すための代替的な手段でも適しているであろう。さらに、代替的な実施例にはＡおよびＢオペランドデータ経路の両方での定数ルックアップ機能が含まれるが、このような機能は各命令に対して１つしか新しいオペランド値が導入されない、スタック中心の命令の組を実現する浮動小数点ユニットにおいては必要ないだろう。ここに開示した実施例では、ＦＣＮＳＴ５１６はライン５１６．１を介してレジスタＢ₁の内容を受取る。ＯＰ₁に記憶された演算コードが、Ｂオペランド値が定数インデックスを表わすことを示せば、ＦＰＵＲＳＣＴＬ５３３はライン５１６．３を介してＰＬＡプリチャージ信号をＦＣＮＳＴ５１６に与え、その後ＦＣＮＳＴ５１６が定数インデックスに従って内部拡張精度定数値を与える。ＦＰＵＲＳＣＴＬ５３３は定数入力を選択するオペランド選択マルチプレクサ５１２．２に制御信号を与え、定数値はＢ₁に記憶されたインデックスを上書きする。代替的な実施例（図示せず）では、インデックスされた定数値は、バッファ５１１を通して送られるのではなく、ＦＣＮＳＴ５１６からＢオペランドバスに直接駆動される。このように直接的に結合された実施例に適する選択論理は当業者には明らかであろう。定数インデックスが決定し浮動小数点値がバッファ５１１のレジスタＢ₁において置換されるとＦＲＥＳ３１０の演算が正常に進行する。しかしながら、（たとえば３８３、３８７または３８８の）外部バスを介してか、またはＦＲＮＤ３５０から到達したオペランドと比較すると、かくして与えられた浮動小数点定数値には（実際には内部拡張精度浮動小数点表記のガード「ｇ」および丸め演算「ｒ」ビット位置にある）２つの付加的な精度ビットが含まれる。この結果、（たとえばバッファ５１１のＢ₁である）ＢオペラントルジスタはＡオペランドレジスタよりもわずかに幅が広い。外部バスを介してかまたはＦＲＮＤ３５０から到達するＢオペランドの対応ビットはＦＲＥＳ３１０によって０で満たされる。図７は浮動小数点定数記憶装置ＦＣＮＳＴ５１６の編成を示す。ＦＣＮＳＴ５１６は内部拡張精度フォーマットで表わされた定数の、アドレス可能記憶装置７１６．１である。開示された実施例では、超越関数の計算のためのπ、ｅおよび多項式級数の定数の表記を含む、２５６個までの浮動小数点値がアドレス可能記憶装置７１６．１に記憶される。図７に開示された実施例では、アドレス可能記憶装置７１６．１は８入力および８４出力のＰＬＡとして実現され、ライン５１６．１の８つのビットインデックスは記憶装置へのアドレスの役割を果たす。（全内部拡張精度フォーマットでありスティッキービットがない）８４ビットの浮動小数点定数値は５１６．２に与えられる。これに代えて、１度のアクセスで２つの低精度単一定数が与えられてもよい。さまざまな実施例を参照してこの発明を説明したが、これらの実施例は例示的なものであってこの発明の範囲はそれらに制限されないことが理解されるであろう。説明した実施例には多くの変更、修正、付加および改良が可能である。たとえば、代替的な組の内部および外部フォーマットが可能である。さらに、重複した組の内部および外部フォーマットも可能であり、所与のデータフォーマットが内部的および外部的に用いられてもよい。このようなフォーマットに表わされたオペランド値には変換は必要ないだろう。さらに、スタック指向および非スタック指向浮動小数点命令の組の両方に関するリザベーションステーションの実現が考えられる。これらおよび他の変更、修正、付与および改良は以下の請求の範囲に規定される本発明の範囲内にあるだろう。

【手続補正書】特許法第１８４条の８第１項【提出日】１９９７年１０月１４日【補正内容】浮動小数点処理装置のためのリザベーションステーション発明の背景発明の分野この発明はスーパースカラープロセッサに関し、特に、複数の機能ユニットを含むスーパースカラープロセッサ内の機能ユニットのためのリザベーションステーションに関する。関連技術の説明ＥＰ−Ａ−０６５１３２１には、本出願人による先行技術のスーパースカラーマイクロプロセッサが開示されている。ＵＳ−Ａ−３９３０２３２には、先行技術の全フォーマット型デジタルコンピュータが開示されている。ＥＰ−Ａ−０２８７１１５には、先行技術のコプロセッサおよびそれを制御するための方法が開示されている。ＥＰ−Ａ−０４５０８０２には、本出願人による先行技術の算術ユニットが開示されている。技術分野において知られているように、浮動小数点数は指数および仮数として２進フォーマットで表わされ得る。指数は２などの基数が累乗される、べき数を表わし、仮数は基数によって乗算される数である。したがって、浮動小数点数によって表わされる実際の数は、指数によって特定されたべき数まで累乗された基数に等しい量が乗算された仮数である。このように、どのような特定の数も浮動小数点表記ではｆｘＢ^eまたは（ｆ，ｅ）として近似でき、ここでｆはｎ桁の符号付仮数であり、ｅはｍ桁の符号付整数の指数であり、Ｂは基数系である。多くのコンピュータシステムで用いられている基数系はＢ＝２である２進法であるが、システムの中には基数系として１０進法（Ｂ＝１０）または１６進法（Ｂ＝１６）を用いるものもある。浮動小数点数は加算、減算、乗算または除算することができ、２進浮動小数点数にこれらの算術演算を行なうための、計算のための構造は技術分野において周知である。実用的なコンピュータでは、数の仮数部分は無限の「精度」は有さない（すなわち浮動小数点数の仮数に無限の桁数の数字を割当てることはできない）。その代わりに、浮動小数点数は、通常は固定桁数を有するレジスタにおいて処理される。このため、加算、減算、乗算または除算される２つの入力オペランドの各々が正確な表示であっても、演算結果はレジスタの固定桁数よりもより有効桁の多いものとなるだろう。この結果、精度の低い（しかし依然として正確である）結果の表示を、正規化および丸め演算の処理によってレジスタの固定桁数の中に詰め込む必要がある。請求の範囲１．互いに結果を転送するように結合された複数の機能ユニット（３００，３０３）を有するプロセッサにおけるリザベーションステーションであって、前記機能ユニットのうちの第１のもの（３００）のための前記リザベーションステーション（３１０）は、オペランドデータレジスタ（５１１．１）を含む未決命令バッファと、第１のフォーマット変換論理（５１４）とを含み、前記第１のフォーマット変換論理は前記実行待命令バッファと前記第１の機能ユニットの算術ユニット（３３０，３４１，３４２）の第１のオペランド入力との間に結合され、前記算術ユニットに、外部データフォーマットの組のうちの１つから内部データフォーマットの組のうちの１つに選択的に変換されたオペランドデータを与え、さらに第２のフォーマット変換論理（５１５）を含み、前記第２のフォーマット変換論理は前記算術ユニットの前記結果出力に結合され、前記機能ユニット（３３０，３０３）のうちの他のものに、前記内部データフォーマットのうちの１つから前記外部データフォーマットのうちの１つに選択的に変換された前記結果データを与え、前記算術ユニットの結果出力と前記算術ユニットの第２のオペランド入力との間に結合され、データフォーマット変換を行なうことなく前記算術ユニットに前記結果データを選択的に与える高速転送データ経路を特徴とする、リザベーションステーション。２．前記第１および第２のオペランド入力が、前記算術ユニットの、同じオペランド入力に対応する、請求項１に記載のリザベーションステーション。３．前記第１および第２のオペランド入力のうち一方が、前記算術ユニットのＡオペランド入力に対応し、前記第１のおよび第２のオペランド入力のうちの他方が、前記算術ユニットのＢオペランド入力に対応する、請求項１に記載のリザベーションステーション。４．前記未決命令バッファ（５１１）と前記高速転送データ経路との間に結合され、前記結果データと前記未決命令バッファにおいてバッファされた命令に関するオペランドとの一致を検出するための第１の検出手段（５３１）をさらに含み、前記一致の検出により前記高速転送データ経路が能動化される、請求項１に記載のリザベーションステーション。５．前記第１のフォーマット変換論理がバイアス調整加算器（６１４）を含み、前記バイアス調整加算器（６１４）は、Ｎビット指数入力と、インバータと、Ｍビット指数出力とを備え、ＭはＮより大きく、前記指数出力のＭ番目のビットは前記指数入力のＮ番目のビットに結合され、前記指数出力のＮ−１から１までのビットは、前記指数入力のＮ−１から１までのビットにそれぞれ結合され、前記インバータは前記指数入力の前記Ｎ番目のビットを反転し、かつ前記指数出力のＭ−１からＮまでのビットとして前記反転されたビットを与えるよう結合される、請求項１に記載のリザベーションステーション。６．Ｍが、所望のバイアス調整定数に従う、請求項５に記載のリザベーションステーション。７．前記外部データフォーマットの組が、単精度浮動小数点フォーマット、倍精度浮動小数点フォーマットおよび外部拡張精度浮動小数点フォーマットを含み、前記内部データフォーマットの組は内部拡張精度フォーマットを含む、請求項１から６のいずれかに記載のリザベーションステーション。８．前記算術ユニットが浮動小数点算術ユニットを備え、前記外部データフォーマットの組は１６、３２および６４ビット整数フォーマットを含み、前記第１のフォーマット変換論理（５１４）は、前記整数フォーマットのうちの１つから整数オペランドを変換し、内部拡張精度フォーマットの通常のアライメント内に、非正規化浮動小数点値として前記整数オペランドをエンコーディングするよう適合され、前記整数オペランドの前記選択的な変換により、前記浮動小数点算術ユニットが前記整数オペランドで演算できるようになる、請求項１から５のいずれかに記載のリザベーションステーション。９．前記浮動小数点レジスタ構成か、ｘ８６浮動小数点スタックを含み、前記第１および第２のフォーマット変換論理は、前記内部フォーマットおよび外部フォーマットデータの両方が、前記浮動小数点機能ユニットの外部にあるリオーダバッファにおいて表わされるようにする、請求項１０に記載のリザベーションステーション。１０．前記実行待命令バッファ（５１１）が、浮動小数点命令に関する演算コードを受取るよう結合された演算コードレジスタをさらに含み、前記第１のフォーマット変換論理は前記演算コードルジスタに結合され、個々の演算コードは、前記第１のフォーマット変換論理によって行なわれる特定的な変換のために選択される、請求項１から５のいずれかに記載のリザベーションステーション。１１．前記浮動小数点機能ユニットが、前記算術ユニットの前記結果出力を前記第２のフォーマット変換論理（５１５）および前記高速転送データ経路に結合する丸め演算装置（３５０）をさらに含む、請求項１に記載のリザベーションステーションを有する浮動小数点機能ユニット。１２．それらの間で結果を転送するよう結合された複数の機能ユニット（３３０，３４１，３４２）を有するプロセッサの第１の機能ユニットにおいてデータを処理するための方法であって、第１の外部フォーマットにおいてオペランドを受取るステップと、前記第１の外部フォーマットから第１の内部フォーマットに前記オペランドを選択的に変換するステップと、前記変換されたオペランドで第１の演算を行なうステップとを含み、前記第１の演算により第２の内部フォーマットにおいて結果が与えられ、さらに前記結果を第２の外部フォーマットに選択的に変換し、かつ前記変換された結果を前記第１の機能ユニットの外部に与えるステップと、前記第２の変換と同時に、変換することなく前記結果を選択的に与え、前記第１の機能ユニットにおいて前記結果で第２の演算を行なうステップとを含む、方法。１３．前記オペランドに関連した第１の演算コードを受取るステップをさらに含み、前記第１の演算コードは前記第１の内部フォーマットおよび前記第１の演算のために選択され、さらに前記第２の演算のために選択される第２の演算コードを受取るステップを含む、請求項１２に記載の方法。１４．前記第１の演算に関連した結果タグを受取るステップと、第２の演算コードおよびそれに関連したオペランドタグを受取るステップとを含み、前記第２の演算コードは前記第２の演算のために選択され、さらに前記結果タグと前記オペランドタグとが一致したときに、前記変換されていない結果を前記第２の演算のオペランドとして与えるステップをさらに含む、請求項１２に記載の方法。１５．前記複数の機能ユニット（３００，３０３）に結合されたリオーダバッファに前記変換された結果を表わすステップをさらに含む、請求項１２に記載の方法。１６．前記第１および第２の内部フォーマットが同じ内部フォーマットである、請求項１２に記載の方法。１７．前記第１および第２の外部フォーマットが同じ外部フォーマットである、請求項１２に記載の方法。１８．浮動小数点機能ユニット（３００）を有するプロセッサにおいて浮動小数点データフォーマット間で変換するためのバイアス調整加算器（６１４）であって、前記バイアス調整加算器は、Ｎビット指数入力と、インバータと、Ｍビット指数出力とを含み、ＭはＮより大きく、前記指数出力のＭ番目のビットは前記指数入力のＮ番目のビットに結合され、前記指数出力のＮ−１から１までのビットは、前記指数入力のＮ−１から１までのビットにそれぞれ結合され、前記インバータは、前記指数入力の前記Ｎ番目のビットを反転し、かつ前記指数出力のＭ−１からＮまでのビットとして前記反転されたビットを与えるよう結合される、バイアス調整加算器。

───────────────────────────────────────────────────── フロントページの続き (72)発明者ゴベアス，ケルビン・ディアメリカ合衆国、78741 テキサス州、オースティン、ハントウィック・ドライブ、 2504、ナンバー・206 (72)発明者ブジャノス，ノーマンアメリカ合衆国、78749 テキサス州、オースティン、ドネガル・ロード、6905 【要約の続き】る。浮動小数点リザベーションステーション内の特定の論理によりオペランドフォーマットが変換される。

Claims

【特許請求の範囲】１．共通演算コードバス、共通オペランドバスおよび共通結果バスに結合された複数の機能ユニットを有するプロセッサにおける、オペランド入力と結果出力とを備えた算術ユニットを有する浮動小数点機能ユニットのためのリザベーションステーションであって、前記リザベーションステーションは、オペランドデータレジスタを含む未決命令バッファと、前記共通オペランドバスと前記オペランドデータレジスタとの間に、かつ前記共通結果バスと前記オペランドデータレジスタとの間に結合されて、前記オペランドデータレジスタの中にオペランドデータを選択的に受取るためのバスインタフェース論理と、前記オペランドデータレジスタと前記算術ユニットの前記オペランド入力との間に結合されて、外部データフォーマットの組のうちの１つから内部データフォーマットの組のうちの１つに選択的に変換されたオペランドデータを前記算術ユニットに与えるための第１のフォーマット変換論理とを備えた、リザベーションステーション。２．前記算術ユニットの結果出力と共通結果バスとの間に結合された第２のフォーマット変換論理をさらに含み、前記第２のフォーマット変換論理は、前記内部データフォーマットの組のうちの１つで結果データ値を受取り、前記結果データ値を前記外部データフォーマットの組のうちの１つに変換し、さらに前記共通結果バスに前記変換された結果データ値を与える、請求項１に記載のリザベーションステーション。３．前記算術ユニットの結果出力と前記算術ユニットのオペランド入力との間に結合された高速転送データ経路をさらに含み、前記高速転送データ経路は前記結果データ値を前記算術ユニットに選択的に与え、さらに前記実行待命令バッファにおいてバッファされた命令に関するオペランドと前記結果データ値との一致を検出するための第１の検出手段を含み、前記第１の検出手段は前記実行待命令バッファと前記高速転送データ経路との間に結合され、一致を検出することにより前記第１の検出手段が前記高速転送データ経路を選択的に能動化するようになる、請求項１に記載のリザベーションステーション。４．前記算術ユニットの結果出力と前記算術ユニットのオペランド入力との間に結合された高速転送データ経路をさらに含み、前記高速転送データ経路は前記結果データ値を前記算術ユニットに選択的に与え、さらに前記未決命令バッファでバッファされた命令と前記結果データ値との一致を検出するための第１の検出手段を含み、前記第１の検出手段は前記実行待命令バッファと前記高速転送データ経路との間に結合され、一致を検出することにより第１の検出手段が前記高速転送データ経路を選択的に能動化するようになる、請求項２に記載のリザベーションステーション。５．前記外部データフォーマットの組が単精度浮動小数点フォーマット、倍精度浮動小数点フォーマットおよび外部拡張精度浮動小数点フォーマットを含み、前記内部データフォーマットの組が内部拡張精度フォーマットを含む、請求項２に記載のリザベーションステーション。６．前記外部データフォーマットの組が１６、３２および６４ビットの整数フォーマットをさらに含む、請求項５に記載のリザベーションステーション。７．前記第１のフォーマット変換論理が、１６、３２および６４ビットの外部整数フォーマットから整数オペランドを選択的に変換して、前記内部拡張精度フォーマットの通常アライメント内に前記整数オペランドを非正規化浮動小数点値としてエンコーディングし、前記整数オペランドを選択的に変換することにより前記浮動小数点機能ユニットの前記算術ユニットが整数オペランドで演算できるようになる、請求項６に記載のリザベーションステーション。８．前記第１のフォーマット変換論理が内部フォーマットオペランドを選択的に通し、前記第２のフォーマット変換論理が内部フォーマット結果を選択的に通し、前記浮動小数点機能ユニットの外部にある浮動小数点レジスタ構成の表記を可能にする、請求項４に記載のリザベーションステーション。９．前記浮動小数点レジスタ構成がｘ８６浮動小数点スタックであり、前記第１および第２のフォーマット変換論理により、前記内部および外部フォーマットオペランドが前記浮動小数点機能ユニットの外部にあるレジスタファイル／リオーダバッファに表記されるようになる、請求項８に記載のリザベーションステーション。１０．前記実行待命令バッファが、前記浮動小数点命令に関する演算コードを受取るための前記共通演算コードバスに結合された演算コートルジスタをさらに含み、前記第１のフォーマット変換論理は前記演算コードレジスタに結合され、個々の前記演算コードは前記オペランドデータフォーマットを示し、かつ前記第１のフォーマット変換論理によって行なわれる特定的な変換を選択する、請求項６に記載のリザベーションステーション。１１．前記実行待命令バッファが単一エントリバッファである、請求項１０に記載のリザベーションステーション。１２．前記実行待命令バッファが複数エントリバッファである、請求項１０に記載のリザベーションステーション。１３．前記実行待命令バッファがＦＩＦＯとして編成される、請求項１２に記載のリザベーションステーション。１４．前記第１のフォーマット変換論理がビットアライメント論理およびバイアス調整加算器を含む、請求項１０に記載のリザベーションステーション。１５．前記バイアス調整加算器が、Ｎビット指数入力、インバータおよびＭビット指数出力を含み、前記Ｎ番目の入力ビットは前記Ｍ番目の出力ビットに結合され、前記Ｎ−１から１までの入力ビットは前記Ｎ−１から１までの出力ビットにそれぞれ結合され、前記インバータは前記Ｎ番目の入力ビットと前記Ｍ−１からＮまでの出力ビットとの間に結合され、ただしＭはＮより大きい、請求項１４に記載のリザベーションステーション。１６．前記第１のフォーマット変換論理が、Ｎビット指数入力、インバータおよびＭビット指数出力を含むバイアス調整加算器を備え、前記Ｎ番目の入力ビットは前記Ｍ番目の出力ビットに結合され、前記Ｎ−１から１までの入力ビットは前記Ｎ−１から１までの出力ビットにそれぞれ結合され、前記インバータは前記Ｎ番目の入力ビットと前記Ｍ−１からＮまでの出力ビットとの間に結合され、ただしＭはＮより大きい、請求項１に記載のリザベーションステーション。１７．前記実行待命令バッファにおいてバッファされた命令に関するオペランドと前記共通結果バスのデータ値との一致を検出するための第２の検出手段をさらに含み、前記第２の検出手段は前記実行待命令バッファと前記バスインタフェース論理との間に結合され、一致を検出することにより、前記第２の検出手段が、前記バスインタフェース論理が前記オペランドデータレジスタへの前記共通結果バスに前記データ値を受取ることができるようにする、請求項４に記載のリザベーションステーション。１８．オペランドタグが前記共通オペランドバスのオペランドに関連し、結果タグが前記共通結果バスの結果に関連し、宛先タグが前記共通演算コードバスの演算コードに関連し、前記実行待命令バッファがオペランドタグレジスタおよび宛先タグレジスタをさらに含み、前記第１および第２の検出手段がタグ整合論理を構成する、請求項１７に記載のリザベーションステーション。１９．内部オペランドバスが前記リザベーションステーションの前記第１のフォーマット変換論理と前記算術ユニットの前記オペランド入力との間に結合され、前記浮動小数点機能ユニットは丸め演算コンプレックスをさらに含み、前記丸め演算コンプレックスは、前記算術ユニットの前記結果出力に結合された丸め演算バスと、前記丸め演算バスに結合された入力と前記第２のフォーマット変換論理に結合された出力とを有する丸め演算装置とを備え、それにより前記丸め演算コンプレックスは前記算術ユニットの前記結果出力を前記第２のフォーマット変換論理に結合する、請求項２に記載のリザベーションステーションを有する浮動小数点機能ユニット。２０．内部オペランドバスが前記リザベーションステーションの前記第１のフォーマット変換論理と前記算術ユニットの前記オペランド入力との間に結合され、前記浮動小数点機能ユニットは丸め演算コンプレックスをさらに含み、前記丸め演算コンプレックスは、前記算術ユニットの前記結果出力に結合された丸め演算バスと、前記丸め演算バスに結合された入力と前記第２のフォーマット変換論理に結合された出力とを有する丸め演算装置とを備え、それにより前記丸め演算コンプレックスは前記算術ユニットの前記結果出力を前記第２のフォーマット変換論理および前記高速転送データ経路に結合する、請求項４に記載のリザベーションステーションを有する浮動小数点機能ユニット。２１．前記浮動小数点機能ユニットが、前記内部オペランドバスに結合されたオペランド入力と前記丸め演算バスに結合された結果出力とを有する付加的な算術ユニットをさらに含む、請求項２０に記載の浮動小数点機能ユニット。２２．前記算術ユニットおよび前記付加的な算術ユニットの各々が、加算パイプライン、乗算パイプライン、除算装置、平方根装置ならびに三角関数、超越関数、正規化および浮動小数点フォーマット変換に関する特定的な装置を含む、算術ユニットの組から選択される、請求項２１に記載の浮動小数点機能ユニット。２３．前記付加的な算術ユニットおよび前記算術ユニットが実質的に類似した装置である、請求項２２に記載の浮動小数点機能ユニット。２４．前記付加的な算術ユニットが乗算パイプラインを含み、前記算術ユニットが加算パイプラインを含む、請求項２１に記載の浮動小数点機能ユニット。２５．複数の第１のデータフォーマットのオペランドデータを機能ユニットに与えるためのオペランドバス、前記機能ユニットに演算コードを与えるための演算コードバスおよび前記第１のデータフォーマットにおいて前記機能ユニットからの結果データを通信するための結果バスを有するプロセッサにおける、第２のデータフォーマットのオペランドデータで演算するための算術ユニットを有する浮動小数点機能ユニットのためのリザベーションステーションであって、前記リザベーションステーションは、レジスタ段のアレイを備え、前記アレイは前記オペランドバスに結合されたオペランド入力、オペランド出力、前記演算コードバスに結合された演算コード入力、および演算コード出力を有し、前記レジスタ段の各々はオペランドデータレジスタおよび演算コートルジスタを備え、さらに前記リザベーションステーションは、前記結果バスからの結果データを前記アレイの前記オペランドデータレジスタに選択的に受取るためのバスインターフェイス論理を備え、前記選択的に受取られたデータは前記アレイの前記演算コードレジスタに記憶された演算コードに関するオペランドであり、さらに前記リザベーションステーションは、前記オペランドデータを前記複数の第１のデータフォーマットから前記第２のデータフォーマットに選択的に変換するためのデータフォーマット変換器を備え、前記データフォーマット変換器は前記アレイの前記オペランド出力に結合されたデータ入力、前記アレイの前記演算コード出力に結合されて、行なわれるフォーマット変換を選択するための制御ポート、および前記算術ユニットに結合されたデータ出力を有する、リザベーションステーション。２６．前記複数の第１のデータフォーマットが単精度浮動小数点フォーマット、倍精度浮動小数点フォーマットおよび外部拡張精度浮動小数点フォーマットを含み、前記第２のデータフォーマットは内部拡張精度浮動小数点フォーマットである、請求項２５に記載のリザベーションステーション。２７．前記複数の第１のデータフォーマットが整数データフォーマットをさらに含む、請求項２６に記載のリザベーションステーション。２８．前記整数データフォーマットが１６ビットの符号付整数フォーマット、３２ビットの符号付整数フォーマットおよび６４ビットの符号付整数フォーマットのうちの１つである、請求項２７に記載のリザベーションステーション。２９．前記アレイレジスタ段が単一段バッファである、請求項２５に記載のリザベーションステーション。３０．前記データフォーマット変換器が、Ｎビット指数入力、インバータおよびＭビット指数出力を備えたバイアス調整加算器を含み、前記Ｎ番目の入力ビットは前記Ｍ番目の出力ビットに結合され、Ｎ−１から１までの入力ビットはＮ−１から１までの出力ビットにそれぞれ結合され、前記インバータは前記Ｎ番目の入力ビットと前記Ｍ−１からＮまでの出力ビットとの間に結合され、ただしＭはＮより大きい、請求項２５に記載のリザベーションステーション。３１．オペランドデータを第１のデータフォーマットから第２のデータフォーマットに選択的に変換するためのデータフォーマット変換器を有するリザベーションステーションにおいて、バイアス調整加算器は、Ｎビット指数入力と、Ｍビット指数入力とを含み、ただしＭはＮより大きく、前記指数入力のＮ番目のビットは前記指数出力のＭ番目のビットに結合され、前記指数入力のＮ−１から１までのビットは前記指数出力のＮ−１から１までのビットにそれぞれ結合され、さらに前記バイアス調整加算器は、前記指数入力のＮ番目のビットと前記指数出力のＭ−１からＮまでのビットとの間に結合されたインバータを含む、バイアス調整加算器。３２．複数の機能ユニットを有するスーパースカラーデジタルコンピュータであって、前記スーパースカラーデジタルコンピュータは、命令データを与えるための第１の出力とオペランドポインタを与えるための第２の出力とを有する命令デコーダと、データ記憶装置とを含み、前記データ記憶装置は、前記データ記憶装置に結果を受取る入力およびオペランドとしての選択されたデータを与える出力を有し、前記データ記憶装置は第１のフォーマットでデータを記憶し、さらに前記スーパースカラーデジタルコンピュータは、前記命令デコーダの前記第２の出力に結合されて前記データ記憶装置からオペランドを選択するオペランド選択ポートと、前記データ記憶装置の前記出力に結合されて第１のフォーマットオペランドを前記機能ユニットに与えるオペランドバスと、前記データ記憶装置の入力に結合されて前記機能ユニットからの第１のフォーマット結果を前記データ記憶装置に通信する結果バスと、前記命令デコーダの前記第１の出力から受取られた第１のタイプの命令に応答してオペランドに演算を行なうための第１の機能ユニットとを備え、前記第１の機能ユニットは、第１のリザベーションステーションを含み、前記第１のリザベーションステーションは、前記オペランドバスに結合されて前記第１のフォーマットオペランドを受取り、かつ前記結果バスに結合されてオペランドとして前記第１のフォーマット結果を選択的に受取る第１のオペランドバッファと、前記第１のオペランドバッファに結合されて前記第１のフォーマットオペランドデータを受取りそれを第２のフォーマットに変換する第１のフォーマット変換論理とを含み、前記第１の機能的ユニットはさらに、前記第１のフォーマット変換論理に結合されてオペランド入力において第２のフォーマットオペランドを受取り、前記第２のフォーマットで算術演算を行なう算術ユニットとを含み、前記算術ユニットは前記第２のフォーマットで結果出力に結果を与え、さらに前記第１の機能的ユニットは、前記算術ユニットの前記結果出力と前記結果バスとの間に結合されて前記第２のフォーマット結果を前記第１のデータフォーマットに変換する第２のフォーマット変換論理を含み、さらに前記スーパースカラーデジタルコンピュータは、前記命令デコーダの前記第１の出力から受取られた第２のタイプの命令に応答してオペランドに対して演算を行なうための第２の機能ユニットを備え、前記第２の機能ユニットは、前記オペランドバスに結合されて前記第１のフォーマットオペランドを受取り、かつ前記結果バスに結合されてオペランドとして前記第１のフォーマット結果を選択的に受取る第２のオペランドバッファを有する第２のリザベーションステーションと、前記第２のオペランドバッファに結合されて前記第１のフォーマットオペランドを受取り、かつ前記第１のフォーマットで演算を行なう実行装置とを含み、前記実行により前記第１のフォーマット結果が前記結果バスに与えられる、スーパースカラーデジタルコンピュータ。３３．前記第１の機能ユニットが浮動小数点機能ユニットであり、前記第１のフォーマットが単精度浮動小数点フォーマットおよび倍精度浮動小数点フォーマットを含み、前記第２のフォーマットは内部拡張精度浮動小数点フォーマットを含み、前記第１のフォーマット変換論理は前記第１のフォーマットのうちの１つから前記第２のフォーマットのうちの１つに選択的に変換し、前記第２のフォーマット変換論理は前記第２のフォーマットのうちの１つから前記第１のフォーマットのうちの１つに選択的に変換する、請求項３２に記載のスーパースカラーデジタルコンピュータシステム。３４．前記第１のリザベーションステーションが、前記第１のオペランドバッファに関連した実行待命令記憶装置をさらに含み、前記実行待命令記憶装置は前記第１のタイプの命令を受取るよう前記命令デコーダに結合され、さらに前記算術ユニットの前記結果出力と前記算術ユニットの前記オペランド入力との間に結合された高速転送データ経路を含み、前記高速転送データ経路は前記第１のフォーマット結果を前記算術ユニットに選択的に与え、さらに前記実行待命令記憶装置においてバッファされた命令に関するオペランドと前記第１のフォーマット結果との一致を検出するための手段を含み、前記検出手段は前記実行待命令記憶装置と前記高速転送データ経路との間に結合され、一致を検出することにより前記検出手段が前記高速転送データ経路を選択的に能動化する、請求項３２に記載のスーパースカラーデジタルコンピュータシステム。３５．前記第１のフォーマットが、１６、３２および６４ビット整数フォーマットをさらに含む、請求項３３に記載のリザベーションステーション。３６．前記第１のフォーマット変換論理が前記１６、３２および６４ビット整数フォーマットから整数オペランドを選択的に変換して、前記内部拡張精度フォーマットの通常のアライメント内の非正規化浮動小数点値として前記整数オペランドをエンコーディングし、前記整数オペランドを選択的に変換することにより前記浮動小数点機能ユニットの前記算術ユニットが前記整数オペランドで演算できるようになる、請求項３５に記載のリザベーションステーション。３７．前記第１のフォーマット変換論理が前記第２のフォーマットオペランドを選択的に通過させ、前記第２のフォーマット変換論理が第２のフォーマット結果を選択的に送って、前記データ記憶装置における浮動小数点レジスタ構成の表記を可能にする、請求項３４に記載のリザベーションステーション。３８．前記データ記憶装置カルジスタファイル／リオーダバッファを備え、前記浮動小数点レジスタ構成はｘ８６浮動小数点スタックを含み、前記第１および第２のフォーマット変換論理により、前記第１および第２のフォーマットオペランドが前記レジスタファイル／リオーダバッファにおける前記浮動小数点機能ユニットの外部に表わされるようになる、請求項３７に記載のリザベーションステーション。３９．複数の機能ユニットを有するプロセッサにおいて、共通オペランドバスから第１のデータフォーマットのオペランドおよびオペランドタグを受取り、かつ共通結果バスに前記第１のデータフォーマットの結果を与える前記複数の機能ユニット間で命令を並行して実行するための方法は、演算コード、前記第１のデータフォーマットにおける演算コード値、および宛先タグを有する第１の命令をディスパッチするステップと、前記第１の機能ユニットの第１のリザベーションステーションに、前記第１の命令ディスパッチステップからの前記第１の命令を記憶するステップと、前記第１の命令を記憶するステップにおいて記憶された前記第１の命令を前記第１のリザベーションステーションから前記第１の機能ユニットの第１の実行装置に発行するステップと、前記第１の命令ディスパッチステップからの前記第１の命令を前記第１の実行装置において実行するステップと、演算コード、オペランドタグおよび宛先タグを有する第２の命令をディスパッチするステップと、第２の機能ユニットの第２のリザベーションステーションに、前記第２の命令ディスパッチステップからの前記第２の命令を記憶するステップと、前記結果バスの結果値に関連したタグと前記第２の命令の前記オペランドタグとの一致を検出するステップと、前記第２のリザベーションステーションにおける前記結果値を前記第２の命令のオペランド値として記憶するステップと、前記結果データ記憶ステップにおいて記憶された前記結果データを含む、前記第２の命令記憶ステップにおいて記憶された前記第２の命令を、前記第２のリザベーションステーションから前記第２の機能ユニットの第２の実行装置に発行するステップと、前記第２の命令発行ステップからの前記第２の命令を前記第２の実行装置において実行するステップとを備え、前記第１の命令実行ステップおよび前記第２の命令実行ステップのうちの一方が、前記第２のデータフォーマットで命令の実行を行なうステップと、前記命令の実行を行なうステップの結果を前記第１のデータフォーマットで前記結果バスに与えるステップとを備える、方法。４０．複数の機能ユニットを有するプロセッサにおいて、第１のデータフォーマットにおいてオペランドを受取り、かつ前記第１のデータフォーマットにおける結果を共通結果バスに与える、前記複数の機能ユニット間で並行して命令を実行するための方法は、第１の機能ユニットに第１の命令をディスパッチするステップを備え、前記第１の命令は演算コードおよびタグを有し、前記第１の機能ユニットは第１のリザベーションステーションおよび第１の実行装置を有し、さらに前記第１の機能ユニットに第１のオペランドを与えるステップを備え、前記第１のオペランドは前記第１の命令に関連し、さらに前記第１のリザベーションステーションに、前記第１の命令ディスパッチステップからの前記第１の命令を記憶するステップと、前記第１のリザベーションステーションに、前記第１のオペランドを与えるステップからの前記第１のオペランドを記憶するステップと、前記第１の実行装置において、前記第１のオペランド記憶ステップにおいて記憶された前記第１のオペランドによって、前記第１の命令記憶ステップにおいて記憶された前記第１の命令を実行するステップと、前記第１の命令実行ステップからの第１の結果を前記結果バスに与えるステップと、前記第１の命令記憶ステップにおいて記憶された前記第１の命令からの前記タグを、前記第１の結果を与えるステップにおいて与えられた前記第１の結果に関連づけるステップと、第２の命令を第２の機能ユニットにディスパッチするステップとを備え、前記第２の命令は演算コードおよびタグを有し、前記第２の機能ユニットは第２のリザベーションステーションおよび第２の実行装置を有し、さらに前記第２の機能ユニットに第２のオペランドを与えるステップを備え、前記第２のオペランドは前記第２の命令に関連し、さらに前記第２のリザベーションステーションに、前記第２の命令ディスパッチステップからの前記第２の命令を記憶するステップと、前記第２のリザベーションステーションに、前記第２のオペランドを与えるステップからの前記第２のオペランドを記憶するステップと、前記第２のオペランドを前記第１のデータフォーマットから第２のデータフォーマットに変換するステップと、前記第２の実行装置において、前記第２のオペランド変換ステップからの前記変換された第２のオペランドによって、前記第２の命令記憶ステップにおいて記憶された前記第２の命令を実行するステップと、前記第２のデータフォーマットから前記第１のデータフォーマットに第２の結果を変換するステップとを備え、前記第２の結果は前記第２の命令実行ステップからのものであり、さらに前記第２の結果変換ステップからの前記変換された第２の結果を前記結果バスに与えるステップと、前記第２の命令記憶ステップにおいて記憶された前記第２の命令からの前記タグを前記変換された第２の結果を与えるステップにおいて与えられた前記変換された第２の結果に関連づけるステップとを備え、前記第１のオペランドを与えるステップおよび前記第２のオペランドを与えるステップのうち一方が、オペランドタグを与えるステップと、前記オペランドタグと前記結果バスの結果に関連したタグとの一致を検出するステップと、前記結果バスからオペランドとして前記結果を受取るステップとを備える、方法。４１．算術ユニットを有する浮動小数点ユニットのためのリザベーションステーションにおいて、複数の第１のデータフォーマットから第２のデータフォーマットに浮動小数点オペランドを変換するための方法であって、前記各第１のデータフォーマットは符号、指数および有効数字を含み、前記第２のデータフォーマットは符号、指数および有効数字を含み、前記方法は、演算コードおよびオペランドを有する命令を受取るステップを備え、前記オペランドは前記複数の第１のデータフォーマットのうちの１つで表わされ、前記演算コードは前記オペランドの前記データフォーマットを示し、さらに前記命令受取ステップにおいて受取られた命令をバッファに記憶するステップと、前記命令記憶ステップにおいて記憶された前記演算コードおよびオペランドを含む前記命令を前記バッファから取出すステップと、前記命令取出しステップにおいて取出された前記演算コードを検査することにより、前記命令取出しステップにおいて取出された前記オペランドのフォーマットを決定するステップと、前記命令取出しステップにおいて取出された前記オペランドを前記第２のデータフォーマットに変換するステップとを備え、前記オペランド変換ステップは、前記命令取出しステップにおいて取出された前記オペランドの符号に等しい符号ビットを与えるステップと、前記命令取出しステップにおいて取出された前記オペランドの指数のバイアスを調整することにより、変換された指数フィールドを与えるステップとを備え、前記バイアス調整は、前記第２のデータフォーマットに関する前記指数バイアスと前記フォーマット決定ステップにおいて決定されたフォーマットに関する指数バイアスとの差に等しく、さらに前記オペランド変換ステップは、前記命令取出しステップにおいて取出された前記オペランドの有効数字を、前記変換された有効フィールドの最上位ビットにシフトし、かつ前記変換された有効フィールドの残りの低位ビットすべてをゼロで満たすことにより、変換された有効フィールドを与えるステップを備え、さらに前記方法は、前記命令取出しステップにおいて取出された前記演算コードおよび前記符号ビット、変換された指数フィールドならびに前記オペランド変換ステップにおいて与えられた前記変換された有効フィールドを含む命令を前記算術ユニットに発行するステップを備える、方法。４２．前記複数の第１のデータフォーマットが、単精度浮動小数点フォーマット、倍精度浮動小数点フォーマットおよび外部拡張精度浮動小数点フォーマットを含み、前記第２のデータフォーマットは内部拡張精度浮動小数点フォーマットである、請求項４１に記載の方法。４３．前記変換された指数フィールドを与えるステップにおけるバイアス調整が、前記命令取出しステップにおいて取出された前記オペランドの指数に、予め定められたバイアス調整定数を加算することにより行なわれ、前記予め定められた定数は、前記第２のデータフォーマットに関する前記指数バイアスと前記フォーマット決定ステップにおいて決定されたフォーマットに関する前記指数バイアスとの差に等しく、前記加算は単一インバータを含む加算器を用いて行なわれる、請求項４１に記載の方法。４４．操作バス、オペランドバス、オペランドタグバス、結果バスおよび結果タグバスを有するプロセッサのための機能ユニットであって、浮動小数点演算コードフィールド、オペランドフィールドおよびオペランドタグフィールドを有するメモリと、前記演算コードバス、前記オペランドバスおよび前記タグバスから、前記メモリの、選択されたフィールドに演算パラメータを制御可能に書込むための書込経路とを備え、前記演算パラメータは第１のタイプの書込事象に関しては前記操作バスからの演算コードと前記オペランドバスからの第１の外部フォーマットのオペランドとを含み、さらに前記メモリからの前記第１の外部フォーマットのオペランドを順に制御可能に発行するための読出経路と、前記読出経路から発行された前記オペランドを前記第１の外部フォーマットから内部フォーマットに変換するための第１のフォーマット変換器と、前記フォーマット変換器からの、内部的にフォーマット化されたオペランドでの演算に基づいた結果を与えるための実行装置とを備え、前記結果は内部フォーマットにあり、さらに前記実行装置からの結果を前記内部フォーマットから第２の外部フォーマットに変換するための第２のフォーマット変換器を備える、機能ユニット。４５．前記メモリが、単一命令に対応する演算パラメータに関する多重フィールドを有する単一エントリメモリである、請求項４４に記載の機能ユニット。４６．前記メモリが多重エントリメモリであり、前記各エントリは単一命令に対応する演算パラメータに関する多重フィールドを有し、前記書込経路は、前記演算コードバス、前記オペランドバスおよび前記タグバスからの演算パラメータを、前記メモリの、選択されたエントリのうちの選択されたフィールドに制御可能に書込む、請求項４４に記載の機能ユニット。４７．前記実行装置が浮動小数点算術ユニットであり、前記第１の外部フォーマットおよび前記第２の外部フォーマットの各々は単一精度浮動小数点フォーマット、倍精度浮動小数点フォーマットおよび外部拡張精度浮動小数点フォーマットを含む外部フォーマットの組から独立して選択され、前記内部フォーマットは内部拡張精度フォーマットである、請求項４４に記載の機能ユニット。４８．前記第１の外部フォーマットおよび前記第２の外部フォーマットが同じフォーマットである、請求項４７に記載の機能ユニット。４９．前記外部フォーマットの組が１６、３２および６４ビット整数フォーマットをさらに含む、請求項４７に記載の機能ユニット。５０．前記第１のフォーマット変換器が、外部１６、３２および６４ビット整数フォーマットから整数オペランドを選択的に変換して、前記内部拡張精度フォーマットの通常のアライメント内の非正規化浮動小数点値として前記整数オペランドをエンコーディングし、前記第２のフォーマット変換器は前記外部１６、３２および６４ビット整数フォーマットのうちの１つに非正規化浮動小数点結果値を選択的に変換し、前記整数オペランドの選択的な変換により、前記算術ユニットが整数オペランドで演算しかつ整数結果を与えることができるようにする、請求項４９に記載の機能ユニット。５１．前記第１のフォーマット変換器が、Ｎビット指数入力、インバータおよびＭビット指数出力を備えたバイアス調整加算器を含み、前記Ｎ番目の入力ビットは前記Ｍ番目の出力ビットに結合され、Ｎ−１から１までの入力ビットはＮ−１から１までの出力ビットにそれぞれ結合され、前記インバータは前記Ｎ番目の入力ビットとＭ−１からＮまでの出力ビットとの間に結合され、ただしＭはＮより大きい、請求項４４に記載のリザベーションステーション。５２．前記演算パラメータは、第２のタイプの書込事象に関しては前記演算コードバスからの演算コードと前記オペランドタグバスからのオペランドタグとを含み、第３のタイプの書込事象に関しては前記結果タグバスからの結果タグと前記結果バスからの結果とを含み、前記機能ユニットはさらに、前記結果タグバスの前記結果タグと前記メモリにおける前記オペランドタグのいずれかとの間の整合を検出するための整合検出回路と、前記整合検出回路に応答して、前記結果バスからの結果を、前記整合するオペランドタグを含む前記メモリエントリのオペランドフィールドに書込むためのメモリ更新経路とを備える、請求項４４に記載の機能ユニット。５３．演算コードバス、第１および第２のオペランドバス、第１および第２のオペランドタグバス、宛先タグバス、結果バスならびに結果タグバスを有するスーパースカラープロセッサのための機能ユニットであって、複数のエントリを有するメモリを備え、前記各エントリは、浮動小数点演算コードフィールド、第１および第２のオペランドフィールド、第１および第２のオペランドタグフィールドならびに宛先タグフィールドを含み、さらに前記演算コードバス、前記第１および第２のオペランドバス、前記第１および第２のタグバスならびに前記宛先タグバスからの演算パラメータを、前記メモリの、選択されたエントリに制御可能に書込むための書込経路とを備え、前記演算パラメータは、第１のタイプの書込事象に関しては、前記演算コードバスからの浮動小数点演算コードと、前記第１および第２のオペランドバスからの外部フォーマットにおける第１および第２の浮動小数点オペランドとを含み、さらに第２のタイプの書込事象に関しては、前記演算コードバスからの演算コードと、前記第１および第２のオペランドタグバスからの第１および第２のオペランドタグとを含み、さらに第３のタイプの書込事象に関しては、前記演算コードバスからの浮動小数点演算コードと、前記第１および第２のオペランドバスのうちの１つからの前記第１および第２の浮動小数点オペランドのうちの１つと、前記第１および第２のオペランドタグバスのうちの１つからの前記第１および第２のオペランドタグバスのうちの１つとを含み、さらに第４のタイプの書込事象に関しては、前記結果タグバスからの結果タグと、前記結果バスからの前記外部フォーマットにおける結果とを含み、さらに前記機能ユニットは、前記外部フォーマットにおける前記メモリからの前記第１および第２のオペランドを順に制御可能に発行するための読出経路と、前記結果タグバスの前記結果タグと前記メモリの前記第１および第２のオペランドタグのうちのいずれかとの間の整合を検出するための整合検出回路と、前記整合検出回路に応答して、前記結果バスからの結果を、前記整合オペランドタグを含む前記メモリエントリの前記オペランドフィールドに書込むためのメモリ更新経路と、前記メモリから発行された前記オペランドを内部フォーマットに変換するための第１のフォーマット変換器と、前記フォーマット変換器からの前記第１および第２の内部的にフォーマット化されたオペランドでの演算に基づいた結果を与えるための算術ユニットと、前記算術ユニットからの結果を前記外部フォーマットに変換するための第２のフォーマット変換器と、前記第１のフォーマット変換器、前記算術ユニットおよび前記第２のフォーマット変換器における発行されたエントリの前記オペランドの処理に並行して、前記メモリの、前記発行されたエントリの前記宛先タグをラッチするための宛先タグラッチ回路と、前記外部フォーマットの結果を前記第２のフォーマット変換器から前記結果バスに駆動するための駆動回路とを備える、機能ユニット。５４．演算コードを送出するための演算コードバス、外部フォーマットにおいてオペランドを送出するためのオペランドバス、オペランドタグを送出するためのオペランドタグバス、宛先タグを送出するための宛先タグバス、前記外部フォーマットで結果を送出するための結果バスおよび結果タグを送出するための結果タグバスを有するスーパースカラープロセッサのための機能ユニットであって、複数のデータエントリを含むＦＩＦＯメモリを備え、前記各データエントリは演算コードフィールド、オペランドフィールド、オペランドタグフィールドおよび宛先タグフィールドを含み、前記メモリは演算コード出力、オペランド出力および宛先タグ出力を含み、さらに前記ＦＩＦＯメモリの前記演算コードフィールドを前記演算コードバスに制御可能に結合する第１の書込経路と、前記ＦＩＦＯメモリの前記オペランドフィールドを前記オペランドバスに制御可能に結合する第２の書込経路と、前記ＦＩＦＯメモリの前記オペランドタグフィールドを前記演算コードタグバスに制御可能に結合する第３の書込経路と、前記ＦＩＦＯメモリの前記結果フィールドを前記結果バスに制御可能に結合する第４の書込経路と、前記結果タグバスおよび前記オペランドタグフィールドに結合された入力と、前記第３の書込経路に結合されて前記ＦＩＦＯメモリの前記結果フィールドのうちの一致するものを前記結果バスに結合することを制御するための制御出力とを有する一致検出回路と、前記メモリのオペランド出力に結合された入力および出力を有する外部−内部フォーマット変換器と、前記外部−内部変換器の出力に結合された入力および出力を有する算術ユニットと、前記算術ユニットの出力に結合された入力および出力を有する内部−外部フォーマット変換器と、前記メモリの前記宛先タグ出力に結合された入力および出力を有する宛先タグラッチ回路と、前記宛先タグパイプラインの出力および前記算術ユニットの出力に結合されたそれぞれの入力および前記結果バスに結合された出力とを有するドライバ回路とを備える、機能ユニット。５５．共通演算コードバス、共通オペランドバスおよび共通結果バスに結合された複数の機能ユニットを有するプロセッサにおいて、前記機能ユニットのうちの１つにおいてデータを処理するための方法は、前記演算コードバスからの演算コードおよび前記オペランドバスからの外部フォーマットのオペランドをメモリに書込むステップと、前記メモリから前記オペランドを発行するステップと、前記第１のオペランド発行ステップからの前記オペランドを第１の内部フォーマットに変換するステップと、前記オペランド変換ステップからの前記オペランドでの演算に基づいた結果を与えるステップとを含み、前記結果は第２の内部フォーマットであり、さらに前記第１の結果を与えるステップからの結果を前記外部フォーマットに変換するステップを含む、方法。５６．前記第１および第２の内部フォーマットが同一である、請求項５５に記載の方法。５７．共通演算コードバス、共通オペランドバス、共通オペランドタグバス、共通結果バスおよび共通結果タグバスに結合された複数の機能ユニットを有するプロセッサにおいて、前記機能ユニットのうちの１つにおいてデータを処理するための方法は、前記演算コードバスからの第１の演算コードおよび前記オペランドバスからの関連したオペランドタグをメモリに書込むステップと、前記第１の演算コードおよびオペランドタグ書込ステップの後に、前記演算コードバスからの第２の演算コードおよび前記オペランドバスからの外部フォーマットの関連したオペランドを前記メモリに書込むステップと、前記結果タグバスの結果タグと前記第１の演算コードに関連した前記メモリにおける前記オペランドタグとの一致を検出するステップと、前記結果バスからの第１の結果を前記メモリに書込むステップとを含み、前記第１の結果は前記第１の演算コードに関連したオペランドであり、さらに前記メモリからの前記第１の演算コードおよび前記第２の演算コードに関連した前記オペランドを順に発行するステップと、前記発行ステップからの前記オペランドを順に内部フォーマットに変換するステップと、前記内部フォーマット変換ステップからの前記オペランドでの演算に基づいた結果を順に与えるステップと、前記与えるステップからの結果を順に前記外部フォーマットに変換するステップとを含む、方法。