JPH11102435A

JPH11102435A - ノンブロッキング・パイプライン・キャッシュ

Info

Publication number: JPH11102435A
Application number: JP10154408A
Authority: JP
Inventors: Joel J Mccormack; ジェイマッコーマックジョエル; Kenneth W Correll; ダブリューコーレルケニス; Barton W Berkowitz; ダブリューバーコウィッツバートン; Christopher C Gianos; シージャーノスクリストファー
Original assignee: Digital Equipment Corp
Current assignee: Digital Equipment Corp
Priority date: 1997-06-05
Filing date: 1998-06-03
Publication date: 1999-04-13
Anticipated expiration: 2018-06-03
Also published as: DE69812223D1; CA2238586A1; EP0883065A2; JP4545242B2; US6085292A; DE69812223T2; EP0883065B1; EP0883065A3

Abstract

(57)【要約】【課題】従来のキャッシュの持つ欠点がなく、テクセ
ル取り出しによって要求される帯域幅を減少できる、グ
ラフィック・システム用のキャッシュを提供する。【解決手段】キャッシュは、メモリ・アドレスを記憶
するためのアドレス・キャッシュを包含する。アドレス
・キューは、アドレス・キャッシュに接続されて、アド
レス・キャッシュがプローブされる順番でミスされたア
ドレスを記憶する。メモリ・コントローラは、アドレス
・キューから、ミスされたアドレスを受け取る。データ
・キューは、メモリ・コントローラから、ミスされたア
ドレスに保存されたデータを受け取る。プローブ結果キ
ューは、データ・キャッシュ・ライン・アドレスとヒッ
ト／ミス情報を記憶するアドレス・キャッシュに接続さ
れている。データ・キャッシュ、データ・キュー、プロ
ーブ結果キューに接続されているマルチプレクサは、ヒ
ット／ミス情報によってデータ・キャッシュまたはデー
タ・キューから出力データを選択する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、コンピュータ・システ
ム・メモリ、より詳細にはグラフィック・コンピュータ
・システムに使われるキャッシュ・メモリに関する。

【０００２】

【従来の技術】グラフィック・コンピュータ・システム
では、テクスチャ・マッピング（すなわち「テクスチャ
リング」）により、システムが生成する３次元（３Ｄ）
イメージの現実性を高めることができる。テクスチャの
例としては、木目、れんが、カーペット、ストーンウォ
ール、草地などが挙げられる。テクスチャは、イメージ
・オブジェクトの表面に、より現実的なレンダリングを
与える。テクスチャリングは、コンピュータ・メモリ内
にテクスチャ・マップとして記憶される一連のテクスチ
ャ・エレメント（テクセル）を使って実行される。テク
スチャ・マップは合成されるか、またはスキャンされた
イメージから得られる。低解像度のテクチャ・マップ
は、６４×６４テクセル含んでいるのに対し、高解像度
のテクスチャ・マップは、４０９６×４０９６テクセル
含んでいる。典型的な場合には、テクセルは、データの
ワードとして記憶され、各ワードのアドレスがテクスチ
ャ・マップの特定の座標を表す。データは、色（ＲＢ
Ｇ）と、おそらく透過性情報も表す。

【０００３】表面がテクスチャ化されたオブジェクトを
含むグラフィック・イメージを表示するには、グラフィ
ック・ソフトウェアとハードウェアがその表面を、表示
可能な画素（ピクセル）に関連するスクリーン座標のア
レーに変換する。ピクセル座標は、テクセル・マップの
対応する該当のテクセルを探し出すのに使われる。対応
するテクセルの色と透過性値は、ピクセルデータに併合
され、表示されたピクセルの色と透過性の最終値を決定
する。表面よりも内側のテクセル座標は、オブジェクト
の頂点に与えられるテクセル座標を補間することにより
得られる。「ポイントサンプリング」と呼ばれる、低品
質のテクスチャ・マッピングでは、イメージのピクセル
それぞれに対し、テクセルが１つだけ使われる。その結
果、ポイントサンプリングでテクスチャ化されたイメー
ジには、そのテクスチャ化された表面に、識別できる不
連続的な形の見苦しいエイリアシングアーティファクト
ができる傾向がある。これは、テクスチャ化される表面
が、ひどく歪められている場合（例えば距離をひき延ば
してある３Ｄイメージの表面）に特にそうである。

【０００４】３線形のテクスチャ・マッピングなどの高
品質のテクスチャリングでは、多重テクセル・マップ、
例えば「Multem In Parvo 」（many in place)マップ、
もしくは、Mipmaps が使われる。例えば、ある特定のテ
クスチャを表すのにMipmapが全部で１１ある場合、テク
スチャの第１の高解像度Mipmapは、１０２４×１０２４
テクセルであり、第２の高解像度Mipmapは、５１２×５
１２テクセルである。その次は、２５６×２５６テクセ
ルで、１番の低解像度のMipmapまで下がると、１×１テ
クセルとなる。ズームを使用して、３次元感覚を与える
ためにオブジェクトのサイズを増減する場合でさえも、
これらの複数マップから、歪められた表面を持つテクス
チャはスムーズに補間される。高品質テクスチャ・マッ
ピングでは、１つのピクセルに対し、８または１６のテ
クセルのマッピングを必要とすることがある。これは、
各ピクセルに対して、システムは、８または１６のメモ
リ・アドレスのテクセル・データにアクセスしなければ
ならないということを意味している。この場合、テクス
チャリングは大量のメモリ・システム帯域幅を消費して
しまうことが明白である。

【０００５】テクスチャ・マッピングで必要とされるメ
モリ帯域幅を減らすことは望ましい。メモリ帯域幅を減
らすことによって、テクスチャ専用のメモリ・チップの
数を減らすことが可能となり、テクスチャを記憶するの
に、より安価な汎用低速ダイナミック・ランダム・アク
セス・メモリ（ＤＲＡＭ）を使用することが可能とな
る。そして、イメージ生成の間は他のデータに使われる
ものと同じメモリ内にテクスチャを記憶することが可能
となる。従来技術でのテクスチャ・マッピング装置の中
には、専用の高速スタティック・ランダム・アクセス・
メモリ（ＳＲＡＭ）内にテクスチャ・マップを記憶する
ものもある。この方法では、連続するデータが同一のア
ドレスから読み出される場合でさえ、テクセル・データ
の読み出し要求ごとにＳＲＡＭにアクセスする。テクス
チャ・マッピング用に特別に設計されたＳＲＡＭは、高
価で、グラフィック・ハードウェアに内蔵されており、
限られた機能しか持たないことが多い。現在のＤＲＡＭ
では、センス・アンプはデータを「キャッシュ」するの
に使用される。キャッシュを行うと、データの空間的、
時間的局所性を有効に利用できる。例えば、一連のテク
セル・アドレスが、すべて同じＤＲＡＭのページにある
場合、データを、センス・アンプから直接アクセスする
ことができる。

【０００６】ＤＲＡＭを使うと、同じメモリ・ページか
ら取り出すためのメモリ帯域幅は、ＳＲＡＭのメモリ帯
域幅に近づくことができる。しかし、現在のぺージのア
ドレスに「ミス」があると、他のページにアクセスする
必要がある。ＤＲＡＭのページ間でスイッチすると、次
のページのデータを取り出し、センス・アンプにラッチ
（保持）する間、いくつかのプロセッサ・サイクルが必
要である。これにより、アクセス待ち時間は増加する。
このような待ち時間は、メモリ・システムの平均帯域幅
がページ取り出しを処理するのに十分である場合は、ア
クセス・パス内で長いパイプラインを使用することによ
り、隠すことができる。メモリ・システムに実際にキャ
ッシュを追加すると、データに良好な空間的時間的局所
性がある場合、必要な帯域幅を減少させることができ
る。しかし、グラフィック装置用のキャッシュ・メモリ
を実施することは困難である。キャッシュが従来通りの
ブロッキング・キャッシュとして構成されている場合、
ミスは、次のアクセスを停止する。何故ならば、そのミ
スが、完全に処理されてからでないと、次のアクセス要
求を受け入れることはできないからである。これは、取
り出されたデータは、次の要求が処理される前にどこか
にラッチされなければならないという事実によるもので
ある。より多くのミスがある場合は、このアクセス停止
のために、メモリ・システムが渡すテクセル取り出し用
帯域幅は、パイプライン・ノンキャッシュ・メモリ・シ
ステムの場合よりも小さくなる。

【０００７】ミス・サービスされたブックキーピング論
理が含まれていると、このキャッシュは、ノンブロッキ
ングになる。しかし、ノンブロッキング・キャッシュ
が、例えば読み出し要求から入手可能なデータまでのパ
イプライン内の段階と同じ数のミスをトラックできなけ
れば、そのキャッシュは障害物となってなってしまう。
待ち時間とキャッシュ・サイズの問題は、メモリがテク
セル・データ、ピクセル・データを記憶するだけでな
く、他の情報も記憶する場合にはさらに難しくなる。メ
モリが汎用低価格ＤＲＡＭから要望通りに構成されてい
る場合、様々に異なる種類のグラフィック情報を記憶で
きる。しかし、この場合、様々なバッファへのアクセス
要求は、ページ“スラッシング”を避けるために、一括
処理されなければならない。アクセスの一括処理によっ
て、テクセル・データに対する要求が遅れ、待ち時間や
トラックの必要があるミスの数が増加する。

【０００８】ダイレクト・マップされたキャッシュは、
使用可能と考えられる。しかし、その場合、キャッシュ
は、アドレスがキャッシュの全体に亘って適当に分布さ
れるように非常に大きいものでなければならないだろ
う。キャッシュが数十ラインの場合、データの一部が性
能を低下させるコンフリクトを頻繁に起こしている間、
他のデータの一部は、かなりの時間使われないままキャ
ッシュの無駄になることがある。キャッシュが大きくな
ると、コストも増大する。ノン・ブロッキング完全連想
型の内容参照可能メモリ（ＣＡＭ）は、データのフル・
アドレスをタグとして使用するが、これはテクスチャ・
マッピングに、より適していることがある。しかし、そ
れでも、完全連想型キャッシュは適切なサイズであるこ
とが必要であり、ミスのある場合の待ち時間が、読み出
し要求が出される時間と、データが使用可能になる時間
との間に大きな遅れを引き起こすことがある。テクスチ
ャ・マッピングの固有性のために、キャッシュがミスを
起こす可能性が増大する。さらに悪いケースでは、各テ
クセルは正確に一度づつ使われ、その結果各アクセスで
ミスが起こることにもなり、このキャッシュには、全く
利点がない。

【０００９】

【発明が解決しようとする課題】したがって、従来のキ
ャッシュの持つ欠点がなく、テクセル取り出しによって
要求される帯域幅を減少できる、グラフィック・システ
ム用のキャッシュを提供することが望まれている。

【００１０】

【課題を解決するための手段】本発明は、広義において
は、本特許請求の範囲の請求項１に限定されているよう
な、データをキャッシュする装置と、請求項１０に限定
されているような、データをキャッシュする方法にあ
る。以下にテクセル・データにアクセスするグラフィッ
ク・プロセッサで使用可能なノンブロッキング・パイプ
ライン・キャッシュについて説明する。ノンブロッキン
グ・パイプライン・キャッシュは、テクセルのアドレス
とデータを、先入れ先出しキューにより相互に接続して
いるアドレスとデータのキャッシュに保存することが好
ましい。アドレスとデータは以下に述べる通り、空間
的、時間的に別個の方法で保存されると効果的である。

【００１１】アドレス・キャッシュには、複数のライン
がある。各ラインは、読み出し要求で指定されたメモリ
・アドレスを記憶できる。各ラインに関連するのは、ラ
イン・アドレスである。第１のキューには、アドレス・
キャッシュに接続された入力と、メモリ・コントローラ
に接続された出力がある。第１のキューは、読み出し要
求ミスによるミス・メモリ・アドレスを記憶する。ミス
・メモリ・アドレスはメモリ・コントローラに送られ
る。メモリ・コントローラに接続された第２のキュー
は、ミス・メモリ・アドレスに保存されたデータを受け
取る。各読み出し要求のためのアドレス・キャッシュに
接続された第３のキューは、ライン・アドレスとヒット
／ミス情報を保存する。ヒット／ミス情報は、特定の要
求されたアドレスがアドレス・キュー内に保存されてい
るかどうかを示す。

【００１２】データ・キャッシュは、第２と第３のキュ
ーの出力に接続されている。データ・キャッシュは、第
２のキューから受け取ったミス・メモリ・アドレスにあ
るデータを保存する。マルチプレクサは、第３のキュー
に保存されたヒット／ミス情報により、出力へのデータ
をデータ・キャッシュまたは第２のキューから選択す
る。

【００１３】

【発明の実施の形態】本発明についてのより詳細な理解
は、以下の好ましい実施態様から、および添付の図を参
照して得られる通りである。図１について、本発明のノ
ンブロッキング・パイプライン・キャッシュの好ましい
実施態様について詳細を説明する。グラフィック表示シ
ステム１００は、メモリ・バス１１５によってメイン・
メモリ１２０に接続されている汎用中央処理装置（ＣＰ
Ｕ）１１０を具備する。ＣＰＵ１１０は、汎用バス１２
５（例えばＰＣＩバスなど）にも接続されている。バス
１２５は、ディスク・サブシステム１３０、入力／出力
（Ｉ／Ｏ）サブシステム１４０、グラフィックジェネレ
ータ２００に接続されることができる。グラフィック・
ジェネレータ２００は、ライン２７０によって、グラフ
ィック・ディスプレイ装置１５０に接続されている。シ
ステム１００は、グラフィック・ワークステーションと
して構成されることができる。

【００１４】ＣＰＵ１１０は、１つ以上の汎用プロセッ
サチップ、例えば米国マサチューセッツ州メイナードの
(Maynard, MA）ディジタル・エキュイプメント・コーポ
レーション(Digital Equipment Corporation）製のALPH
A プロセッサを包含できる。メインメモリ１２０は、シ
ステム１００の動作中に、マシン実行可能な命令とデー
タを記憶するためのものである。ディスク１３０は、フ
ァイル内に命令とデータを永続的に記憶する。命令とデ
ータは、入力／出力（Ｉ／Ｏ）サブシステム１４０を介
して得られることができる。入力／出力（Ｉ／Ｏ）シス
テムは、システム１００の動作を制御するキーボード、
マウス、ジョイスティックなどの入力／出力（Ｉ／Ｏ）
装置（図示していない）にも接続できる。バス１１５と
バス１２５は、アドレス、データ、制御、タイミング信
号を運ぶ。

【００１５】システム１００の動作中に、ソフトウェア
・プログラムの命令がＣＰＵ１１０によって実行され
る。プログラムは、ディスプレイ装置１５０上でグラフ
ィック・イメージを生成するように設計されている。イ
メージ用のデータとイメージをレンダリングする方法に
ついての命令は、バス１１５およびバス１２５を経由し
てグラフィック・ジェネレータ２００に送られる。ジェ
ネレータ２００はデジタルデータを、ディスプレイ装置
１５０が動かすことができるアナログ信号に変換する。
より詳細には、グラフィックジェネレータ２００は、３
次元イメージを高速でレンダリングする。図２に示す通
り、ジェネレータ２００は、図１のバス１２５に接続す
るためのバス・インタフェース205 を包含する。特定目
的グラフィック・プロセッサ２１０は、ランダム・アク
セス・メモリ／デジタル・ツー・アナログ・コンバータ
（ＲＡＭＤＡＣ）２３０に接続される。ＲＡＭＤＡＣ２
３０は、ライン２６０上のデジタル・グラフィック・デ
ータを受け取り、ライン２７０でアナログ・ビデオ信号
を生成する。

【００１６】さらにグラフィック・プロセッサ２１０
は、同期ダイナミック・アクセス・メモリ（ＳＤＲＡ
Ｍ）２２０およびテクセル・キャッシュ３００にも接続
されている。ＳＤＲＡＭ２２０は、マップとバッファ内
にグラフィック・データを記憶する。バッファは、フロ
ント、バック、色、Ｚ、ステンシル、オーバーレイ、フ
ォーマット・バッファを含むことができる。マップは、
テクスチャ・データ（テクセル）を記憶できる。エレメ
ント２０５、２１０、３００は、シングル・セミコンダ
クター・チップ２０１上に配置されることが好ましい。
動作中に、ジェネレータ２００は図１に示すＣＰＵ１１
０からグラフィック・データと命令を受け取る。データ
は、マップおよびバッファとしてＳＤＲＡＭ２２０内に
記憶される。バッファとマップのデータは、グラフィッ
ク・プロセッサ２１０によって結合され、ライン２６０
上にグラフィック・データを生成する。アクセスされる
テクセルが多数あるため、またシステムの性能を良くす
るために、テクセル・キャッシュ３００は、テクセル・
データをキャッシュするために使われる。

【００１７】一つの実施態様では、各テクセル・キャッ
シュ３００のために１つのメモリ・コントローラ３９９
がある。例えば、８個のテクセル・キャッシュ３００が
使われる場合、８個のメモリ・コントローラ３９９があ
ることになる。従来のキャッシュと比較すると、各キャ
ッシュのライン数は、例えば、２、３、４、８、１２な
どの小さい整数である。小さいサイズのキャッシュ３０
０と、長いメモリ待ち時間に対処するためには、キャッ
シュ３００は、パイプラインを使って空間的かつ時間的
にデータ及びそのアドレス・タグを分けるように構成さ
れる。これによって、キャッシュ300 はノンブロッキン
グであることが可能であり、キャッシュ300 内にライン
があるよりも、より多くの“ミスされた”要求を保持す
ることができる。これは、性能を向上させるだけでな
く、設計を単純化する。

【００１８】図３は、より詳細なノンブロッキング・パ
イプライン・テクセル・キャッシュ３００を示す。キャ
ッシュ３００は、アドレス・キャッシュ３１０を包含す
る。アドレス・キャッシュ３１０は、アドレス・タグと
して２２ビット使用する完全連想型の内容参照可能メモ
リ（ＣＡＭ）である。好ましい実施態様では、アドレス
・キャッシュ３１０内のライン数は少なく、例えば８で
ある。さらに、アドレス・キャッシュ３１０は、循環カ
ウンター内に書き込まれた最新の情報も保持している。
最後に書き込まれたラインは、ミスが起こる場合、次の
“犠牲”となる。キャッシュ・ラインは関連するライン
・アドレス（例えば０から７）を持つ。アドレス・キャ
ッシュ３１０は、アドレス・キュー３２０の入力エンド
（テール）に結合されている。アドレス・キュー３２０
は、２２ビット幅の先入れ先出し（ＦＩＦＯ）バッファ
である。アドレス・キュー３２０は、最後にミスされた
アクセスのアドレス（タグ）を記憶する。

【００１９】アドレス・キュー３２０の出力エンド（ヘ
ッド）は、図２のメモリ・コントローラ３９９の一つの
入力に結合されている。メモリコントローラ３９９から
の出力は、データキュー３５０の入力エンド（テール）
に接続されている。データ・キューは、３２ビット幅の
先入れ先出し（ＦＩＦＯ）バッファである。アドレス・
キャッシュ３１０は、ライン３０２と３０３によってプ
ローブ結果キュー３３０の入力エンドにも接続されてい
る。プローブ結果キュー３０３は、Ｎ＋１ビット幅の先
入れ先出し（ＦＩＦＯ）バッファであり、ライン３０３
上のＮビットがアドレス・キャッシュ３１０の特定のラ
インを示すのに使われ、ライン３０２上の１ビットはヒ
ット／ミス情報を示すのに使われる。データ・キャッシ
ュ３６０とマルチプレクサ（ＭＵＸ）３７０は両方共、
プローブ結果キュー３３０のヘッドとデータ・キュー３
５０のヘッドから入力を受け取る。データ・キャッシュ
３６０は、ＳＲＡＭとして、相互接続されたレジスタ・
ファイルとして、もしくはラッチのセットとして実施さ
れうる。ＭＵＸ３７０は、３２ビット幅でライン３０９
上に複数の入力と１つの出力を持つ。ＭＵＸの出力はラ
イン３０２と３０３を経由してプローブ結果キュー３３
０に与えられ、最終的にライン３０４上に出される情報
によって選択される。すなわち、選択にはライン３０２
と３０３上の信号によって時間的遅れが発生する。この
遅れは、その情報がプローブ結果キュー３３０のヘッド
に達する時間である。これは、選択が、プローブ結果キ
ューのヘッド・エントリにある情報にじかに基づいてな
されるということを意味している。

【００２０】動作中に、キャッシュ３００はライン３０
１上の読み出しアクセス要求に結びついている「プロー
ブ」アドレスを受け取る。このプローブ・アドレスは、
アドレス・キャッシュ３１０のすべてのラインを同時に
プローブするのに使われる。ヒットするものがあると、
ライン３０２上のヒット／ミス情報がロジカル「１」
（高）にセットされる。ミスの場合、ライン３０２はロ
ジカル「０」にセットされる。ヒットした場合、ヒット
・ライン・アドレス（Ｎビット）は、ライン３０３上で
表される。ミスの場合は、犠牲となるライン・アドレス
が表される。これは、あるＮ＋１ビット・エントリー
（ライン・アドレス＋ヒット／ミス情報）がヒットかミ
スかとして、各キャッシュ・アクセスのためのプローブ
結果キュー３３０のテールに置かれることを意味してい
る。

【００２１】ミスの場合、プローブ・アドレスはアドレ
ス・キュー３２０に置かれる。アドレス・キュー３２０
は、メモリ・コントローラ３９９を介して待ち時間の長
いＳＤＲＡＭ２２０に対してなされた要求を処理する。
コントローラ３９９からの応答は、ミスしたアドレスの
データである。このデータは、データ・キュー３５０に
置かれる。データ・キャッシュ３６０は、プローブ結果
キュー３３０のエントリを使ってアクセスされる。プロ
ーブ結果キューのヘッドがヒットを示す場合、ライン３
０４上のＮビットはデータ・キャッシュ３６０から要求
されたテクセル・データを読み出すためにキャッシュ・
ライン・アドレスとして使われる。ヒットの場合、ＭＵ
Ｘ３７０は選択されたデータ・キャッシュ・アドレスに
あるデータ・キャッシュ３６０からのデータを、ライン
３０９上の出力として選択するようにさせられる。

【００２２】このプローブ・エントリがミスを示した場
合、データ・キュー３５０の次の先入れ先出し（ＦＩＦ
Ｏ）バッファ・エントリがライン３０４上のプローブ・
キュー・エントリのＮビットで指定されるキャッシュ・
ライン・アドレスのデータ・キャッシュ３６０内に記憶
される。この場合、ＭＵＸ３７０はデータ・キュー３５
０からのデータを、ライン３０９上の出力として選択す
る。ヒットまたはミスのいずれかの場合、データは要求
されたのと同一の順番でライン３０９上に与えられる。
選択には、他の方法も使用される。例えば、選択は、
「透過性のある」ラッチによって実行される。このラッ
チは、サイクルの始めにデータ・キュー３３０からデー
タ・キャッシュ３６０にミスしたデータを「ロード」
し、これによって、サイクル中にデータ・キューからの
データは、ラッチを通って「流れる」ことが可能とな
る。

【００２３】アドレス・キャッシュ３１０にヒットがあ
る場合、またはアドレス・キャッシュ３２０が一杯でな
い場合、新しい読み出し要求が受け付けられる。アドレ
ス・キャッシュにミスがあり、かつ、アドレス・キュー
３２０が一杯である場合、読み出し要求は、スペースが
アドレスキュー３２０において使用しうるようになるま
で停止されねばならない。データ・キャッシュ３６０に
ミスがある場合、またはデータ・キャッシュ３５０が空
でない場合、応答データが利用しうる。データ・キャッ
シュ３６０にミスがあり、さらにデータ・キュー３５０
が空の場合は、その応答はデータがデータ・キュー３５
０内にて利用しうるようになるまで、停止されねばなら
ない。図４の「網掛けされた」２×２ピクセルの正方形
Ｔ０からＴ１５は、１６のテクスチャ・マップ化された
ピクセルがどのようにテクスチャMipmap上でマップ化さ
れ、テクセル取り出し要求を生成するかの例を示す。網
掛けされた正方形はそれぞれ、その正方形が重なってい
る４つのテクセルの取り出しを要求する。ラベルＡＯか
らＪ３のＡからＪは、異なる２２ビット・アドレスを示
す。０、１、２、３の数は、異なるメモリ・コントロー
ラ３９９、したがってテクセル・データがキャッシュさ
れるべき異なるキャッシュを示す。

【００２４】各キャッシュ３００に８ラインある場合、
ヒットとミスの比率は良い。テクセルが適切な方法で取
り出される場合、たとえ、ライン・キャッシュが２つで
あっても、性能は良い。図５の表５００は、メモリ・コ
ントローラ０のテクセル取り出し要求のための動的なヒ
ットとミス情報５２０を示す。図５ではライン・キャッ
シュは８と想定して、縦列５１０がテクセル取り出し要
求番号を、縦列５１５がプローブ要求アドレスを、縦列
５２０がヒットまたはミス情報を、縦列５３０がキャッ
シュ・ライン・アドレスを示す。テクセルをキャッシュ
するためのノンブロッキング・パイプライン・キャッシ
ュの有用性について説明してきた。しかし、同じ設計は
他のグラフィック・アプリケーションでも、より大きい
行先となる四角形上に小さい元となる四角形をタイルす
ることにも使用されることができる。

【００２５】以上は本発明の特有の実施態様を説明した
ものである。しかし、本発明の範囲内で様々な変更を加
えることが可能であることは、当業者にとって明らかで
ある。

【図面の簡単な説明】

【図１】本発明の好ましい実施態様による、ノンブロッ
キング・パイプライン・キャッシュを使うグラフィック
表示システムのブロック図である。

【図２】図１のシステムのグラフィック・ジェネレータ
のブロック図である。

【図３】本発明の好ましい実施態様による、ノンブロッ
キング・パイプライン・キャッシュのブロック図であ
る。

【図４】テクスチャ・マップからのテクセル取り出しの
線図である。

【図５】８ライン・キャッシュに関連するヒット／ミス
情報の表を示す図である。

【符号の説明】

１２０メイン・メモリ１１０中央処理装置（ＣＰＵ）１３０ディスク１４０入力／出力（Ｉ／Ｏ）１５０ディスプレイ２００グラフィック・ジェネレータ２０５バス・インタフェース２１０グラフィック・プロセッサ２２０同期ダイナミック・アクセス・メモリ（ＳＤＲ
ＡＭ）２３０ランダム・アクセス・メモリ／デジタル・ツー
・アナログ・コンバータ（ＲＡＭＤＡＣ）３００テクセル・キャッシュ２２１メモリ・コントローラ３０１読み出し要求３０２ヒット／ミス３０３エントリ／アドレス３０９応答３１０アドレス・キャッシュ３２０アドレス・キュー３３０プローブ結果キュー３５０データ・キュー３６０データ・キャッシュ３７０マルチプレクサ（ＭＵＸ）５１０取り出されたテクセル番号５１５プローブ要求アドレス５２０ヒット／ミス５３０キャッシュ・ライン・アドレス

───────────────────────────────────────────────────── フロントページの続き (72)発明者ケニスダブリューコーレルアメリカ合衆国マサチューセッツ州 01523ランカスターノースメインストリート 2221 (72)発明者バートンダブリューバーコウィッツアメリカ合衆国マサチューセッツ州 01701フレミンガムアンジェリカドライヴ 84 (72)発明者クリストファーシージャーノスアメリカ合衆国マサチューセッツ州 01564スターリングパイクスヒルロード 14

Claims

【特許請求の範囲】

【請求項１】読み出し要求で指定されたメモリ・アド
レスを記憶し関連するライン・アドレスを持つ複数のラ
インを含むアドレス・キャッシュと、該アドレス・キャッシュとメモリ・コントローラに接続
されて、読み出し要求のミスのためにミスされたメモリ
・アドレスを記憶し、該ミスされたメモリ・アドレスを
メモリ・コントローラに送る第１のキューと、前記メモリ・コントローラに接続されて、該メモリ・コ
ントローラから受け取ったミス・メモリ・アドレスにあ
るデータを記憶する第２のキューと、前記アドレス・キャッシュに接続されて、ライン・アド
レス情報を記憶する第３のキューと、前記第２と第３のキューに接続されて、該第２のキュー
から受け取ったミス・メモリ・アドレスにあるデータを
記憶するデータ・キャッシュと、前記第３のキューのヘッド・エントリに記憶されたライ
ン・アドレス情報によって前記データ・キャッシュまた
は前記第２のキューからの出力を選択して、ノンブロ
ッキング・パイプライン・キャッシュを与える手段と、
を備えることを特徴とする、データをキャッシュする装
置。
【請求項２】前記アドレス・キャッシュは完全連想型
の内容参照可能メモリであり、前記メモリ・アドレスは
タグとして記憶される請求項１記載の装置。
【請求項３】前記第３のキューは、さらに、複数のエントリを持ち、各エントリはＮ＋１ビット幅
で、Ｎは固有のライン・アドレスを示し、１ビットはヒ
ット／ミス情報を示す請求項１記載の装置。
【請求項４】前記データ・キャッシュは、相互接続さ
れたレジスタ・ファイルである請求項１に記載の装置。
【請求項５】前記記憶されるデータは、テクセル・デ
ータである、請求項１に記載の装置。
【請求項６】前記データを記憶する同期ダイナミック
・アクセス・メモリを更に備える請求項１に記載の装
置。
【請求項７】前記ミスされたアドレスにあるデータ
は、ミスの順番で応答される、請求項１に記載の装置。
【請求項８】前記複数のラインは、最後に書かれた順
番で保持される、請求項１に記載の装置。
【請求項９】前記第３のキューは、ヒット／ミス情報
を記憶する請求項１に記載の装置。
【請求項１０】関連したライン・アドレスを有する複
数のラインを持つアドレス・キャッシュに読み出し要求
で指定されるメモリ・アドレスを記憶する段階と、前記アドレス・キャッシュとメモリ・コントローラに接
続された第１のキューに、読み出し要求ミスのためにミ
スされたメモリ・アドレスをキューする段階と、前記ミス・メモリ・アドレスを前記メモリ・コントロー
ラに送る段階と、前記メモリ・コントローラに接続された第２のキュー
に、前記メモリ・コントローラから受け取った前記ミス
・メモリ・アドレスにあるデータをキューする段階と、前記アドレスキャッシュに接続された第３のキューに、
前記ライン・アドレスをキューする段階と、前記第２及び第３のキューに接続されたデータ・キャッ
シュに、前記第２のキューから受け取ったミス・メモリ
・アドレスにあるデータを記憶する段階と、前記第３のキューのヘッド・エントリに記憶された情報
により、前記データ・キャッシュまたは前記第２のキュ
ーから出力を選択する段階と、を含むことを特徴とす
る、データをキャッシュする方法。