JPH11272880A

JPH11272880A - 固定小数点ライティング・ユニットを用いたロ―カル・アイ・ベクトルの高速計算方法

Info

Publication number: JPH11272880A
Application number: JP11026162A
Authority: JP
Inventors: Scott R Nelson; スコット・アール・ネルソン; Michael F Deering; マイケル・エフ・ディアリング
Original assignee: Sun Microsystems Inc
Current assignee: Sun Microsystems Inc
Priority date: 1998-02-03
Filing date: 1999-02-03
Publication date: 1999-10-08
Also published as: US6014144A; US6141013A; EP0933729A2; EP0933729A3; KR19990072375A

Abstract

(57)【要約】【課題】固定小数点ライティング・ユニットにおいて
ローカルなアイ・ベクトルを高速計算する方法を提供す
ること。【解決手段】与えられたアイ・ポジションと第１の幾
何学的プリミティブの第１の頂点とに対応するローカル
・アイ・ベクトルを計算する。この方法（６００）は、
第１の頂点に対応する第１の座標空間で表現されている
第１の組の座標を受け取るステップと、第２の座標空間
内にある第２の座標によって表現されている与えられた
アイ・ポジションに対応する逆変換行列を生成するステ
ップと、逆変換行列を用いて第１の組の座標を変換し予
備的なローカル・アイ・ベクトルを生成するステップ
と、を含む。予備的なローカル・アイ・ベクトルは、第
１の頂点に対しライティング計算を実行するのに用い
る。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、３Ｄグラフィクス
・アクセラレータに関する。更に詳しくは、ローカル・
アイ・ベクトルの高速計算を実行する３Ｄグラフィクス
・アクセラレータ内部の固定小数点ライティング・ユニ
ットに関する。

【０００２】

【従来の技術】３Ｄ（三次元）グラフィクス・アクセラ
レータは、ホスト・プロセッサからの３Ｄレンダリング
機能をオフロードしてシステムのパフォーマンスを向上
させるように設計された、コンピュータ・システムのた
めの特別のグラフィクス・レンダリング・サブシステム
である。３Ｄグラフィクス・アクセラレータを備えたシ
ステムでは、コンピュータ・システムのホスト・プロセ
ッサ上で動作しているアプリケーション・プログラム
は、ディスプレイ装置上に出力するための三次元グラフ
ィクス要素を定義する三次元の幾何学的データを生成す
る。アプリケーション・プログラムは、ホスト・プロセ
ッサに、幾何学的データをグラフィクス・アクセラレー
タまで転送させる。グラフィクス・アクセラレータは、
この幾何学的データを受け取り、対応するグラフィクス
要素を、ディスプレイ装置上にレンダリングする。

【０００３】多くのコンピュータ・グラフィクス・シス
テムの目的の１つとして、ユーザに対して現実的である
対象物をレンダリングできることがある。しかし、視覚
的な現実性の問題は、極めて複雑である。「現実の世
界」における対象物は、色や反射や表面の不規則性など
が些細に変化する、非常に大量の詳細な内容を含んでい
る。

【０００４】グラフィクス・システムが視覚的現実性を
向上させようとする際の最も重要な方法の１つとして、
光が物理的な対象物と相互作用する複雑な態様を捕捉す
ることを試みることによるものがある。このための専用
ユニットが、ライティング（lighting）パフォーマンス
を向上させるのに用いられている。これらのライティン
グ・ユニットの設計によって、現実感の向上と、パフォ
ーマンスの維持と、コストの最小化との間のバランスが
実現される。

【０００５】三次元のグラフィクスを表示するアプリケ
ーションは、非常に大きな処理能力を必要とする。例え
ば、あるコンピュータ・システムが滑らかな３Ｄ動画を
生成するには、このコンピュータ・システムは、毎秒２
０から３０フレームのフレーム・レートすなわち更新レ
ートを維持することが要求される。このためには、３Ｄ
コンピュータ・グラフィクス・アクセラレータが、毎秒
１００万個を超える三角形を処理する能力を有している
ことが必要となる。これには、（単なるただ１つの散乱
光ではなく）鏡面（specular）ハイライトを備えた複数
の光源に関係するライティング計算が含まれる。

【０００６】

【発明が解決しようとする課題】従来のライティング・
ユニットに対する制約条件の１つに、浮動小数点演算の
使用がある。浮動小数点算術がライティング・ユニット
において用いられる理由は、ライティング計算に含まれ
るいくつかのパラメータ（例えば、減衰ファクタ）に
は、フルレンジのＩＥＥＥ浮動小数点数が必要となるか
らである。しかし、浮動小数点演算の主な短所として、
必要となるハードウェアが、サイズを考慮すると比較的
高価であることがあげられる。特に、大部分のライティ
ング演算ではフルレンジの浮動小数点演算は必要ないと
いう事実を考えると、これは、パフォーマンスの最大化
を目指す低コストのグラフィクス・システムのライティ
ング・ユニットにとって、問題である。

【０００７】ライティング・ユニットにおいてなされる
別のトレードオフは、無限遠点における（infinite）光
源に対する鏡面ハイライト計算を実行する際に、無限遠
点におけるアイ・ポジションを用いることと関係する。
鏡面反射では（拡散反射とは異なり）、対象物の表面
は、入射光の色に見える。これが、明るい光に照射され
たリンゴの一部が白く見え、他方で、リンゴの残りの部
分が赤く見えることの理由である。鏡面反射を正確にモ
デル化するためには、理想的には、ライティング効果を
計算するには、「ローカル」（局所的）なアイ・ポジシ
ョンが用いられるべきである。アイ・ポジションとは、
レンダリングされている３Ｄシーンまでの見ている者の
距離と方向とを表す世界空間内での位置である。ローカ
ルなアイ・ポジションを用いることにより、鏡面反射の
位置を、与えられた対象物に対して、現実感を維持しな
がらレンダリングすることができる。

【０００８】しかし、鏡面反射値を計算する際には、従
来のグラフィクス・システムでは、無限遠点におけるア
イ・ポジションが用いられる。これが行われる理由は、
ローカルなアイ・ベクトル（ローカルなアイ・ポジショ
ンからライティングされている三角形プリミティブの頂
点までのベクトル）の計算には時間がかかりすぎ、ライ
ティングのパフォーマンスが制限されるからである。無
限遠点における光源に対する鏡面反射を計算する際に無
限遠点におけるアイ・ポジションを用いると良好なライ
ティング効果が生じるのではあるが、理想的なものでは
ない。

【０００９】従って、無限遠点における光源に関する鏡
面ハイライトに対し、ローカルなアイ・ベクトルを高速
に計算することができるライティング・ユニットを有す
ることが望まれる。また、このライティング・ユニット
が、パフォーマンスの低下とコストの上昇とを犠牲にし
て、浮動小数点演算を用いるような制限を受けないこと
が望ましい。

【００１０】

【課題を解決するための手段】本発明は、固定小数点ラ
イティング・ユニットにおいてローカルなアイ・ベクト
ルを計算する高速な方法を提供する。スクリーン空間座
標における与えられたビューポートに射影されるべき与
えられた三角形プリミティブに対しては、ローカルなア
イ・ベクトルは、与えられたアイ・ポジションとこの与
えられた三角形プリミティブの第１の頂点とに対応す
る。異なるローカルなアイ・ベクトルが、与えられた三
角形プリミティブのそれぞれの頂点に対して計算され
る。

【００１１】本発明による方法は、最初に、与えられた
ビューポートの与えられたアイ・ポジションとコーナー
の座標とに対応するビュー・ベクトル行列（view vecto
r matrix）を生成するステップを含む。ビュー・ベクト
ル行列は、スクリーン空間座標を、与えられたビューポ
ートに対応するアイ・ベクトル空間にマップ（写像）す
るのに用いることができる。本発明による方法は、次
に、第１の頂点に対応する（スクリーン空間内の）第１
の組の座標を受け取るステップを含む。この第１の組の
座標は、次に、固定小数点ライティング・ユニットによ
って表現可能である数値範囲にスケーリングされる。次
に、第１の組の座標は、ビュー・ベクトル行列を用いて
変換され、与えられたビューポートに対するアイ・ベク
トル空間内の正規化されていないローカルなアイ・ベク
トルを生じる。この正規化されていないローカルなアイ
・ベクトルは、正規化され、正規化されたローカルなア
イ・ベクトルを形成する。そして、この正規化されたロ
ーカルなアイ・ベクトルは、無限遠点における光源に対
する鏡面反射値の計算など、それ以降のライティング計
算を実行するのに用いられ、無限遠点における光源が用
いられる場合よりも優れた現実性を与えるライティング
効果を生じる。しかし、これらのより現実的なライティ
ング効果は、パフォーマンスの低下をもたらすことはな
い。これは、ローカルなアイ・ベクトルを、この方法を
用いて高速に計算することができるからである。

【００１２】ビュー・ベクトル行列の計算には、現在の
ビューイング（viewing）行列から逆行列を生成するこ
とを含む。現在のビューイング行列は、頂点を、グラフ
ィクス・パイプラインのより初期の段階で、世界空間の
座標からスクリーン空間の座標に変換するのに用いられ
る。次に、世界座標が、逆行列を用いて、与えられたア
イ・ポジションに対して計算される。そして、与えられ
たビューポートのコーナー座標に対する世界空間座標
が、与えられたビューポートの逆行列とクリップ空間座
標とを用いて決定される。次に、与えられたビューポー
トのコーナー座標に対する世界座標が、与えられたアイ
・ポジションに対する世界空間座標と同様に、正規化さ
れる。本発明による方法は、更に、正規化された世界空
間アイ座標から正規化された世界空間コーナー座標への
世界空間座標での複数のベクトルを生成するステップを
含み、それによって、ビュー・ボリュームのコーナーが
形成される。この複数のベクトルは、次に、与えられた
ビューポートの前方クリッピング平面（Ｚ＝１）に正規
化される。次に、複数のベクトルの与えられたビューポ
ートへの射影のサイズが、射影の中心オフセットと共に
決定される。与えられたビューポートのサイズと中心オ
フセットとは、スクリーン空間座標において計算され、
ライティング・ユニットの数値範囲に調整される。

【００１３】射影のサイズと中心オフセットとは、与え
られたビューポートの中心オフセットと共に、正規化さ
れていないビュー・ベクトル行列成分を計算するのに用
いられる。次に、ビュー・ベクトル行列への最大入力値
が計算され、それによって、最大ビュー・ベクトル長の
決定が可能になる。正規化されていないビュー・ベクト
ル行列の成分は、次に、与えられたビューポートに対す
る最大のベクトル長が所定の範囲内に維持されるように
スケーリングされ、よって、最終的なビュー・ベクトル
行列の成分の値が得られる。最後に、この最終的なビュ
ー・ベクトル行列の成分が有効な行列を形成するかどう
かの判断がなされる。

【００１４】

【発明の実施の態様】本発明のよりよい理解は、好適実
施例に関する以下の詳細な説明と添付の図面とを共に考
慮することによって、得られるはずである。図１−コンピュータ・システム図１を参照すると、本発明による三次元（３Ｄ）グラフ
ィクス・アクセラレータを含むコンピュータ・システム
８０が、示されている。示されているように、コンピュ
ータ・システム８０は、システム・ユニット８２と、シ
ステム・ユニット８２に結合されたビデオ・モニタすな
わちディスプレイ装置８４とを備えている。ディスプレ
イ装置８４は、種々のタイプのディスプレイ・モニタま
たは装置の中の任意のものでよい。コンピュータ・シス
テムには、キーボード８６および／またはマウス８８
や、それ以外の入力など、様々な入力装置を接続するこ
とができる。アプリケーション・ソフトウェアがコンピ
ュータ・システム８０によって実行され、ビデオ・モニ
タ８４上に三次元のグラフィクスな対象物（object）を
表示することができる。以下において更に説明するよう
に、コンピュータ・システム８０における３Ｄグラフィ
クス・アクセラレータは、無限遠点における光源に対応
する鏡面ハイライトの計算のために正規化されたローカ
ルなアイ・ベクトルを高速計算するように構成された固
定小数点ユニットを含む。これたのローカルなアイ・ベ
クトルを用いることの結果として、ディスプレイ装置８
４上でレンダリングされるグラフィカルな対象物のより
現実的なライティング効果が得られる。図２−コンピュータ・システムのブロック図次に、図２を参照すると、図１のコンピュータ・システ
ムを図解する簡略化されたブロック図が示されている。
本発明の理解に必要ではないコンピュータ・システムの
構成要素は、便宜上、示されていない。示されているよ
うに、コンピュータ・システム８０は、高速バスすなわ
ちシステム・バス１０４に結合された中央処理装置（Ｃ
ＰＵ）１０２を含む。システム・メモリ１０６もまた、
好ましくは、高速バス１０４に結合されている。

【００１５】ホスト・プロセッサ１０２は、様々なタイ
プのコンピュータ・プロセッサ、マルチプロセッサおよ
びＣＰＵの中の任意のものでよい。システム・メモリ１
０６は、ランダム・アクセス・メモリや大容量記憶装置
を含む様々なタイプのメモリ・サブシステムの中の任意
のものでよい。システム・バスすなわちホスト・バス１
０４は、ホスト・プロセッサ、ＣＰＵおよびメモリ・サ
ブシステム、更には、特別のサブシステムの間の通信の
ための様々なタイプの通信またはホスト・コンピュータ
・バスの中の任意のものでよい。好適実施例では、ホス
ト・バス１０４は、ＵＰＡバスであって、これは、８３
ＭＨｚで動作する６４ビットのバスである。

【００１６】本発明による３Ｄグラフィクス・アクセラ
レータ１１２は、高速メモリ・バス１０４に結合されて
いる。３Ｄグラフィクス・アクセラレータ１１２は、バ
ス１０４に、例えば、クロス・バー・スイッチまたはそ
れ以外のバス接続ロジックによって接続され得る。様々
なそれ以外の周辺装置やそれ以外のバスも、この技術分
野において周知であるように、高速メモリ・バス１０４
に接続することができる。３Ｄグラフィクス・アクセラ
レータは、望むのであれば、様々なバスの任意のものに
接続することが可能である。示されているように、ビデ
オ・モニタすなわちディスプレイ装置８４が、３Ｄグラ
フィクス・アクセラレータ１１２に接続されている。

【００１７】ホスト・プロセッサ１０２は、プログラム
された入出力（Ｉ／Ｏ）プロトコルに従って、ホスト・
バス１０４上を、グラフィクス・アクセラレータ１１２
に対して、そして、グラフィクス・アクセラレータ１１
２から情報を転送する。また、グラフィクス・アクセラ
レータ１１２は、ダイレクト・メモリ・アクセス（ＤＭ
Ａ）プロトコルに従って、または、インテリジェント・
バス・マスタリングを介して、メモリ・サブシステム１
０６にアクセスする。

【００１８】ＯｐｅｎＧＬまたはＸＧＬなどのアプリケ
ーション・プログラマ・インターフェース（ＡＰＩ）に
従うグラフィクス・アプリケーション・プログラムは、
コマンドと、ディスプレイ装置８４上に出力するための
多角形などの幾何学的なプリミティブ（geometrical pr
imitive）を定義するデータとを生成する。これらのプ
リミティブは、やはりアプリケーション・プログラムに
よって定義された属性を有する光源によって照射されて
いるものとして、モデル化される。ホスト・プロセッサ
１０２は、これらのコマンドと属性データとをメモリ・
サブシステム１０６に転送する。その後で、ホスト・プ
ロセッサ１０２は、ホスト・バス１０４上を、データを
グラフィクス・アクセラレータ１１２まで転送するよう
に動作する。また、グラフィクス・アクセラレータ１１
２は、ホスト・バス１０４上のＤＭＡアクセス・サイク
ルを用いて、幾何学的図形の中のデータ・アレイを読み
出す。別の実施例では、グラフィクス・アクセラレータ
１１２は、インテル社によって提唱されているアドバン
スト・グラフィクス・ポート（ＡＧＰ）などの直接ポー
トを介して、システム・メモリ１０６に結合されてい
る。グラフィクス・アクセラレータ１１２は、次に、好
適実施例では、転送されたプリミティブ（変換後のも
の）に対してライティング演算（ローカルなアイ・ベク
トルの計算を含む）を実行し、頂点（vertex）ベースで
カラー値を生成する。それに続くレンダリング演算が、
ライティングされたプリミティブに対して、次に実行さ
れる。図３−グラフィクス・アクセラレータ次に図３を参照すると、本発明の好適実施例によるグラ
フィクス・アクセラレータ１１２を図解しているブロッ
ク図が示されている。示されているように、グラフィク
ス・アクセラレータ１１２は、基本的には、コマンド・
ブロック１４２と、浮動小数点プロセッサ１５２Ａ−１
５２Ｆの組と、ドロー（描画）プロセッサ１７２Ａおよ
び１７２Ｂの組と、３ＤＲＡＭから構成されたフレーム
・バッファ１００と、ランダム・アクセス・メモリ／デ
ジタル・アナログ・コンバータ（ＲＡＭＤＡＣ）１９６
と、から構成されている。

【００１９】示されているように、グラフィクス・アク
セラレータ１１２は、メモリ・バス１０４へのインター
フェースを与えるコマンド・ブロック１４２を含む。コ
マンド・ブロック１４２は、グラフィクス・アクセラレ
ータ１１２からホスト・バス１０４へのインターフェー
スを与え、グラフィクス・アクセラレータ１１２におけ
る他のブロックまたはチップの間のデータ転送を制御す
る。コマンド・ブロック１４２はまた、三角形およびベ
クトル・データを前処理し、幾何データの解凍（decomp
ression）を実行する。

【００２０】コマンド・ブロック１４２は、複数の浮動
小数点ブロック１５２へのインターフェースを与える。
グラフィクス・アクセラレータ１１２は、好ましくは、
示されているように、６つまでの浮動小数点プロセッサ
１５２Ａ−１５２Ｆを含む。浮動小数点プロセッサ１５
２Ａ−１５２Ｆは、ハイ・レベルの描画コマンドを受け
取って、三角形や線などのグラフィクス・プリミティブ
を生成し、スクリーン上に三次元の対象物をレンダリン
グする。浮動小数点プロセッサ１５２Ａ−１５２Ｆは、
受け取った幾何データに対して、変換、クリッピング、
フェース（face）決定、ライティングおよびセットアッ
プ演算を実行する。浮動小数点プロセッサ１５２Ａ−１
５２Ｆは、それぞれが、メモリ１５３Ａ−１５３Ｆに接
続されている。メモリ１５３Ａ−１５３Ｆは、好ましく
は、３２ｋ×３６ビットのＳＲＡＭであり、マイクロコ
ードおよびデータ記憶のために用いられる。

【００２１】浮動小数点ブロック１５２Ａ−１５２Ｆ
は、２つの描画プロセッサ１７２Ａおよび１７２Ｂのそ
れぞれに接続されている。グラフィクス・アクセラレー
タ１１２は、好ましくは、２つの描画プロセッサ１７２
Ａおよび１７２Ｂを含む。ただし、これよりも多くのま
たは少ない数の描画プロセッサを用いてもよい。描画プ
ロセッサ１７２Ａおよび１７２Ｂは、様々なグラフィク
ス・プリミティブのスクリーン・スペース・レンダリン
グを実行し、完成したピクセルを３ＤＲＡＭアレイの中
にシーケンスまたは充填するように動作する。描画プロ
セッサ１７２Ａおよび１７２Ｂはまた、フレーム・バッ
ファ１００に対する３ＤＲＡＭ制御チップとしても機能
する。描画プロセッサ１７２Ａおよび１７２Ｂは、浮動
小数点プロセッサ１５２Ａ−１５２Ｆの中の１つから受
け取った描画パケットに従って、まｗたは、コマンド・
プロセッサ１４２から受け取ったダイレクト・ポート・
パケットに従って、画像（イメージ）をフレーム・バッ
ファ１００の中に同時にレンダリングする。

【００２２】浮動小数点ブロック１５２Ａ−Ｆのそれぞ
れは、好ましくは、同じデータを２つの描画ブロック１
７２Ａおよび１７２Ｂにブロードキャストするように動
作する。換言すると、同じデータが、常に、それぞれの
浮動小数点ブロック１５２からのデータ・ラインの両方
の組の上にある。従って、浮動小数点ブロック１５２Ａ
がデータを転送するときには、浮動小数点ブロック１５
２Ａは、同じデータを、ＦＤバスの両方の部分の上を、
描画プロセッサ１７２Ａおよび１７２Ｂに転送する。

【００２３】描画ブロック１７２Ａおよび１７２Ｂのそ
れぞれは、フレーム・バッファ１００に結合している。
フレーム・バッファ１００は、３ＤＲＡＭメモリ１９２
Ａ−Ｂおよび１９４Ａ−Ｂの４つのバンクから構成され
ている。描画プロセッサ１７２Ａは、２つの３ＤＲＡＭ
バンク１９２Ａおよび１９２Ｂに結合し、描画プロセッ
サ１７２Ｂは、２つの３ＤＲＡＭバンク１９４Ａおよび
１９４Ｂに結合している。それぞれのバンクは、示され
ているように、３つの３ＤＲＡＭを備えている。３ＤＲ
ＡＭメモリまたはバンク１９２Ａ−Ｂおよび１９４Ａ−
Ｂは、集合的に、フレーム・バッファ１００を形成して
いる。フレーム・バッファ１００は、１２８０×１０２
４であり、９６ビットの深度を有する。フレーム・バッ
ファ１００は、描画プロセッサ１７２Ａおよび１７２Ｂ
によってレンダリングされた３Ｄ対象物に対応するピク
セルを記憶する。

【００２４】３ＤＲＡＭメモリ１９２Ａ−Ｂおよび１９
４Ａ−Ｂのそれぞれは、ＲＡＭＤＡＣ（ランダム・アク
セス・メモリ・デジタル・アナログ・コンバータ）１９
６に結合している。ＲＡＭＤＡＣ１９６は、クロス・バ
ー機能と共に、プログラマブルなビデオ・タイミング発
生器とプログラマブルなピクセル・クロック・シンセサ
イザとを備えており、また、伝統的なカラー・ルックア
ップ・テーブルと、トリプル・ビデオＤＡＣ回路とを備
えている。ＲＡＭＤＡＣは、ビデオ・モニタ８４に結合
されている。

【００２５】コマンド・ブロックは、好ましくは、１つ
のチップとして実現される。浮動小数点プロセッサ１５
２のそれぞれは、好ましくは、別個のチップとして実現
される。好適実施例では、６つまでの浮動小数点ブロッ
クまたはチップ１５２Ａ−Ｆを含めることができる。描
画ブロックまたはプロセッサ１７２Ａおよび１７２Ｂの
それぞれは、また、好ましくは、別個のチップを備えて
いる。好適実施例のグラフィクス・アクセラレータ・ア
ーキテクチャの異なる側面に関するこれ以上の情報につ
いては、関連の同時出願中である"Three-Dimensional G
raphics Accelerator With Direct Data Channels for
Improved Performance"と題する米国特許出願第０８／
６７３４９２号と、" Three-Dimensional Graphics Acc
eleratorWhich Implements Multiple Logical Buses Us
ing Common Data Lines for Improved Bus Communicati
on"と題する米国特許出願第０８／６７３４９１号とを
参照のこと。これらの米国出願は、共に、１９９６年６
月１日に出願されたものである。

【００２６】上述のように、コマンド・ブロック１４２
は、ホスト・バス１０４とのインターフェースを与え、
ホストＣＰＵ１０２からのグラフィクス・コマンドおよ
びデータを受け取る。これらのコマンドおよびデータ
（三角形プリミティブと対応するライト・パラメータ・
データとを含む）は、浮動小数点プロセッサ１５２に送
られ、変換、ライティングおよびセットアップ計算が行
われる。ライティング・パフォーマンスが向上するよう
に効果的に構成されているこれらの浮動小数点プロセッ
サ１５２の全体的な動作は、図４を参照して説明され
る。浮動小数点プロセッサ１５２のそれぞれの内部のＬ
コア・ブロックは、この改善されたライティング能力を
提供するのであるが、図５を参照してより詳細に説明さ
れる。図６Ａ、図６Ｂ、図７および図８では、この固定
小数点ライティング・ユニットを用いたローカルなアイ
・ベクトルの計算について記載されている。図４−浮動小数点プロセッサのブロック図次に図４を参照すると、本発明の好適実施例による浮動
小数点プロセッサ１５２の１つを図解しているブロック
図が示されている。浮動小数点プロセッサ１５２Ａ−１
５２Ｆのそれぞれは同一であるから、便宜上、ここで
は、ただ１つだけについて説明する。示されているよう
に、浮動小数点ブロック１５２は、３つの主たる機能ユ
ニットまたはコア・プロセッサを含む。これらは、Ｆコ
ア３５２、Ｌコア３５４、Ｓコア３５６である。Ｆコア
・ブロック３５２は、ＣＦバスを介して、コマンド・ブ
ロック１４２から転送されたデータを受信するように結
合されている。Ｆコア・ブロック３５２は、Ｌコア・ブ
ロック３５４とＳコア・ブロック３５６とのそれぞれに
出力データを提供する。Ｌコア・ブロック３５４は、ま
た、データをＳコア・ブロック３５６に提供する。Ｓコ
ア・ブロック３５６は、ＦＤバスに出力データを提供す
る。

【００２７】Ｆコア・ブロック３５２は、幾何変換、ク
リップ・テスティング、面（face）決定、パースペクテ
ィブ分割およびスクリーン・スペース変換を含む、すべ
ての浮動小数点集中的（intensive）な演算を実行す
る。Ｆコア・ブロック３５２はまた、要求されるときに
は、クリッピングも実行する。好適実施例では、Ｆコア
・ブロック３５２は、３２ｋワードのＳＲＡＭに記憶さ
れた３６ビットのマイクロ命令ワードを用いて、完全に
プログラム可能である。

【００２８】Ｌコア・ブロック３５４は、オンチップの
ＲＡＭベースのマイクロコードを用いて、ほとんどのラ
イティング計算を実行する。従来技術によるライティン
グ・ユニットとは異なり、Ｌコア・ブロック３５４は、
これらの計算を実現するのに、固定小数点演算を用い
る。好適実施例では、Ｌコア・ブロック３５４の数字範
囲は、ｓ１．１４（１サイン・ビット、１整数ビット、
１４小数（fractional）ビット）フォーマットを用い
て、−２．０から＋２．０までである。ライティング計
算の大部分は、これらのタイプの１６ビットのオペラン
ドを用いて、この範囲内で実行される。しかし、ライテ
ィング計算に必要ないくつかのパラメータ（減衰ファク
タなど）はこの範囲を超え、Ｆコア・ブロック３５２で
処理される。

【００２９】Ｌコア・ブロック３５４はまた、より効率
的なライティング計算のための効率的なトリプル・ワー
ド設計を含む。このトリプル・ワードの設計は、１６ビ
ットの固定小数点値を有する４８ビットのデータ・ワー
ドを用いて演算する。従って、１つの命令が、すべての
３つのカラー成分（ＲＧＢ）またはノーマルの（Ｎ_x，
Ｎ_y，Ｎ_z）のすべての３つの成分に対して、同じ機能を
１サイクルで実行することができる。Ｌコア・ブロック
３５４に含まれている数学ユニットは、自動的に、値
を、許容される数字範囲までクランプし、それによっ
て、追加的なブランチを必要としないことになる。

【００３０】Ｓコア・ブロックは、すべてのプリミティ
ブ（primitives）に対するセットアップ計算を実行す
る。これらのセットアップ計算には、ある頂点から別の
頂点までの多次元における距離を計算し、そのエッジに
沿った勾配を計算することが含まれる。三角形では、Ｚ
深度の勾配、カラー、（繊維に対する）ＵＶもまた、走
査線の方向に計算される。

【００３１】示されているように、浮動小数点ブロック
１５２のそれぞれは、ＣＦバスに結合するＣＦバス・イ
ンターフェース・ロジック３６２を含む。浮動小数点ブ
ロック１５２のそれぞれは、ＦＤバスに結合するＦＤバ
ス・インターフェース・ロジック３６６を含む。それぞ
れの浮動小数点ブロック１５２は、ＣＤバスに対する浮
動小数点ブロック１５２を介してのデータ転送経路とし
て機能するバイパス・バスまたはデータ経路３６４を含
む。ＣＤバス上を送られる、すなわち、直接にＦＤバス
に送られるデータは、データ転送バス３６４上を移動
し、従って、浮動小数点ブロック１５２に含まれる浮動
小数点ロジックをバイパスする。

【００３２】一般的に、浮動小数点ブロック１５２に提
供されるデータは、３つの目的地の中の１つを有する。
ただし、３つの目的地とは、Ｆコア・ブロック３５２、
Ｌコア・ブロック３５４、そして、直接にＦＤバスに向
かう場合、すなわち、ＣＤバス転送である。好適実施例
では、Ｆコア・ブロック３５２に向かうデータは、３２
ビットのＩＥＥＥ浮動小数点数とそれ以外の３２ビット
・データとを含む３２ビット・ワードを有する。Ｌコア
・ブロック３５４に向かうデータは、３つの１６ビット
の固定小数点数を含む４８ビット・ワードを有する。

【００３３】示されているように、浮動小数点ブロック
１５２は、コマンド・ブロック１４２によって提供され
たＣＦバスからのデータを受け取る浮動入力バッファ
（ＦＩバッファ）３７２を含む。ＦＩバッファ３７２
は、ダブル・バッファされ、それぞれのバッファにおい
て、３２の３２ビット・エントリを保持する。ＦＩバッ
ファ３７２に記憶された第１のワードであるワード・ゼ
ロは、受け取られた幾何学的プリミティブに対してどの
マイクロコード・ルーチンを与えるべきかをＦコア・ブ
ロック３５２に告知する演算コード（opcode）を有す
る。ヘッダとＸ、ＹおよびＺ座標とだけが、幾何学的プ
リミティブを変換しライティングする際に、このバッフ
ァに提供される。

【００３４】浮動小数点ブロック１５２はまた、Ｆコア
からＬコアへのバッファ（ＦＬバッファ）３７４を含
む。ＦＬバッファ３７４は、ダブル・バッファされ、そ
れぞれのバッファに１６の１６ビット・エントリを保持
する。Ｆコア・ブロック３５２は、３つのＦコア・ワー
ドを、ＦＬバッファ３７４に提供される１つのＬコア・
ワードに書き込む、すなわち、合成する。Ｌコアのパー
スペクティブからは、ＦＬバッファ３７４の中のそれぞ
れのバッファは、５つの４８ビット・エントリとして見
える。ライティング演算の間に、３つのＸ、Ｙ、Ｚ座標
は、Ｆコア・ブロック３５２からＦＬバッファ３７４を
介して、Ｌコア・ブロック３５４に送られる。これらの
３つのＸ、Ｙ、Ｚ座標は、目の方向（eye direction）
を計算するのに用いられる。

【００３５】浮動小数点ブロック１５２は、コマンド・
ブロック１４２から提供されＣＦバスを介して送られた
データを受け取りこのデータをＬコア・ブロック３５４
に提供するＬコア入力バッファ（ＬＩバッファ）３７６
を含む。ＬＩバッファ３７６は、５つのバッファを備え
ており、そのそれぞれが、７つの４８ビット・エントリ
を保持する。これらの７つの４８ビット・エントリは、
３つの頂点法線（vertex normal）と、３つの頂点カラ
ーと、３つのアルファ値を有する１ワードとを有してい
る。ＦＩバッファ３７２とＬＩバッファ３７６とは、集
合的に、浮動小数点ブロック入力バッファを備えてい
る。

【００３６】浮動小数点ブロック１５２はまた、ＦＬＬ
バッファ３７８を含み、このＦＬＬバッファ３７８が、
Ｆコア・ブロック３５２とＬコア・ブロック３５４との
間を接続する。ＦＬＬバッファ３７８は、ライティング
および減衰ファクタを、Ｆコア・ブロック３５２からＬ
コア・ブロック３５４に送るのに用いられるＦＩＦＯで
ある。これらの減衰ファクタは、３つのＸ、Ｙ、Ｚ位置
値、３つの減衰値、３つの周囲のライト値、３つのパッ
クされた値を含む１つの減衰シフト・ワードを含む。ま
た、ＦＬＦバッファ３８０が、Ｆコア・ブロック３５２
とＬコア・ブロック３５４との間に提供される。ＦＬＦ
バッファは、Ｆコアの制御の下に、Ｆコア・ブロック３
５２とＬコア・ブロック３５４との間でデータを通信す
るのに用いられる双方向バッファである。

【００３７】ＬコアからＳコアのバッファ（ＬＳバッフ
ァ）３８６は、Ｌコア・ブロック３５４とＳコア・ブロ
ック３５６との間に結合されている。ＬＳバッファ３８
６は、ダブル・バッファされており、それぞれのバッフ
ァは、４つの４８ビット・ワードを保持している。

【００３８】浮動小数点ブロック１５２はまた、データ
をＦコア・ブロック３５２からＳコア・ブロック３５６
に転送するのに用いられるＦコアからＳコアのバッファ
（ＦＳバッファ）３８４を含む。ＦＳバッファは、５つ
のバッファを備えており、それぞれが、３２の３２ビッ
ト値を保持している。これらの５つのバッファは、Ｌコ
ア・ブロック３５４のパイプライン段を整合させるよう
に設計されているが、これらは、２つのＦＬバッファ、
２つのＬＳバッファ、そして、Ｌコア・ブロック３５４
に記憶され得る１つのプリミティブである。Ｆコア・ブ
ロック３５２からこのバッファを介してＳコア・ブロッ
ク３５６まで転送されたデータは、Ｓコア・ブロック３
５６内でどのマイクロコード手順をランさせるべきかを
指示するディスパッチ・コードを含む。

【００３９】最後に、浮動小数点ブロック１５２は、Ｓ
コア・ブロック３５６とＦＤバス・インターフェース３
６６との間に結合されたＳコア出力バッファ（ＳＯバッ
ファ）１５８を含む。ＳＯバッファ１５８は、ＦＤバス
を介して描画プロセッサ１７２Ａ−１７２Ｂまで送られ
るべきデータを収集する。ＳＯバッファ１５８は、ダブ
ル・バッファされ、それぞれのバッファには３２の３２
ビット・ワードを保持する。ＳＯバッファ１５８は、そ
れぞれの描画プロセッサ１７２Ａ−１７２Ｂが必要とす
る順序で、固定小数点データを有する２つまでのプリミ
ティブを保持する。Ｓコア・ブロック３５６は、固定小
数点データと共に、追加的なステータス情報を、描画プ
ロセッサ１７２に運ぶ。例えば、１ステータス・ビット
が、与えられたプリミティブが関連するプリミティブの
グループの中の最後のものであるかどうかを指示するそ
れぞれのエントリと共に運ばれる。ＳＯバッファ１５８
は、最小数のサイクルを用いてデータをバスを介して転
送するのにいくつのワードが有効であるのかを示す別個
のステータス・レジスタを含む。ＳＯバッファ１５８
は、浮動小数点ブロック出力バッファ１５８を有する。図５−Ｌコア・ブロック図次に図５を参照すると、浮動小数点プロセッサ１５２の
それぞれにおけるＬコア・ブロック３５４を図解するブ
ロック図が示されている。Ｌコア・ブロック３５４は、
ライティング計算を実行する固定小数点計算ユニットを
備えている。示されているように、Ｌコア・ブロック３
５４は、データを、ＬＩバッファ３７６、ＦＬバッファ
３７４、ＦＬＬバッファ３７８、双方向ＦＬＦバッファ
３８０から受け取る。情報は、Ｌコア・ブロック３５４
内部では、ＬＬ（ライト）レジスタ・ファイル４１０、
ＬＣＣ（カラー）レジスタ・ファイル４２０、ＬＲ（汎
用）レジスタ・ファイル４３０に記憶される。オペラン
ドは、レジスタ・ファイル４１０、４２０、４３０から
ＬＡバス、ＬＢバス、ＬＣバスに、そして、ライティン
グ計算のために、乗算・集積（multiply-accumulate）
ブロック４５０に運ばれる。これらの計算は、ＳＲＡＭ
４７２に記憶されているマイクロコードを実行して、命
令制御ロジック・ブロック４７０の制御の下に実行され
る。追加的なライティング計算は、逆平方根（inverse
square root = ISQRT）ブロック４６２とベキ（power）
関数ユニット４６４とにおいて実行される。ライティン
グの結果は、ＬＤバスに、そして、ＬＳバッファ３８６
を介して、Ｓコア・ブロック３５６に送られる。

【００４０】Ｌコア・プロセッサ３５４は、特に、ライ
ティング計算を実行するように設計されている。好適実
施例では、Ｌコア・ブロック３５４は、大部分のライテ
ィング演算（特に、オペランドが、−２．０から＋２．
０までの固定小数点範囲にある場合）を実行する。Ｆコ
ア・ブロック３５２は、ポイントおよびスポット光源な
どの、汎用浮動小数点プロセッサを用いることが必要で
あるようなより複雑な光源に対するライティング計算を
実行する。

【００４１】好適実施例では、Ｌコア・ブロック３５４
でのすべての計算は、一度に３回の、１６ビットの固定
小数点数学を用いて実行される。４８ビット・ワードの
３つの値は、ＸＹＺ、ノーマル、ＲＧＢなどの１つのト
リプルを表すか、または、１つの三角形のそれぞれの３
つの異なる頂点に対する値を表す。Ｌコア３５４によっ
て実行されたライティング計算は、他のライティング属
性のキャッシュされた値を伴う予め乗算されたマテリア
ル・カラーを用いない。これによって、グラフィクス・
アクセラレータが、ＲＧＢ頂点当たり（per-vertex）の
カラー三角形のメッシュを、テクスチャおよびバンプ・
マッピングへの高品質の代替物としてサポートすること
が可能になる。一般に、ほとんどのライティング演算
は、頂点当たりのカラー変更を含むことが予想される。
これには、Ｌコア・ブロック３５４における計算が幾分
向上することが要求されるが、それは、他のユニットに
よって完全にオーバラップされる（すなわち、Ｌコア
は、依然として、ＦコアおよびＳコアのどちらよりも高
速である）。この変更によって、また、ＯｐｅｎＧＬの
セマンティクスをサポートするのが更に容易になる。そ
こでは、カラーは、警告なしに、そして、有効なキャッ
シュ方法なしに、任意の頂点で変化する。

【００４２】Ｌコア３５４は、効率的な１６ビットの関
数ユニットを有し、頂点法線（vertex normal）におい
て、モデル・スペースからワールド・スペースへの変換
を実行する。コマンド・ブロック１４２は、ノーマル・
データを浮動小数点プロセッサ１５２まで、既に正規化
（ノーマライズ）された４８ビットの値（３つの１６ビ
ットの成分）として、送る。Ｌコア・レジスタは、それ
ぞれが３つの４８ビット値として記憶されている、２つ
の３Ｘ３正規変換（normal transformation）行列を含
む。この２つの変換行列は、ステレオ・モードにおける
左右の目の変換を実行するのに用いられる。

【００４３】カラーおよびノーマルは、ＬＩバッファ３
７６によってコマンド・ブロック１４２からＬコア３５
４に変換される。ライティング計算は、マイクロコード
命令がＳＲＡＭ４７２に存在し命令制御ロジック４７０
とＦコア・ブロック３５２から送られたディスパッチ・
ワードとの制御の下でこの命令が実行されることに応答
して、実行される。Ｌコア命令セットは、条件的なブラ
ンチ命令を含まないので、ライティング計算のそれぞれ
のステップは、完了まで動作され、そして、次のステッ
プが次のディスパッチ・ワードの内容に基づいて開始さ
れる。

【００４４】Ｌコア３５４は、入力および出力バッファ
に加えて、３つの異なるレジスタ・ファイルを含む。Ｌ
Ｌレジスタ４１０は、３２までのライトのそれぞれに対
する値を含む。ＬＴレジスタ４４０は、どのライトにア
クセスすべきかを特定するが、この理由は、一度には、
ただ１つのライトにしかアクセスできないからである。
ライト値は、Ｆコア３５２によってロードされ、Ｌコア
３５４によっては修正されない。ＬＲレジスタ４３０
は、ライティング計算からの中間的な値を記憶する汎用
レジスタとして用いられる。ＬＣＣレジスタ４２０は、
プリミティブの頂点に対するマテリアル特性すなわち
「現在のカラー」値を保持する。

【００４５】Ｌコア・ブロック３５４は、４８ビット・
ワードの中の３つの１６ビット値のそれぞれに対する１
つのユニットを含む、乗算・集積ブロック４５０を含ん
でいる。乗算・集積ユニットのそれぞれの標準的な動作
は、４８ビット・イン、４８ビット・アウトである。ド
ット・プロダクト（内積）の計算のためには、僅かに１
６ビットの結果しか存在せず、従って、この結果は、３
つの１６ビットのフィールドのそれぞれの中に複製（re
plicate）される。

【００４６】逆平方根（ＩＳＱＲＴ）ブロック４６２
は、視点（ビューポイント）ベクトルを正規化するのに
用いられる。ＩＳＱＲＴブロック４６２は、内積計算か
ら１６ビットを受け取り、１６ビットの結果を生じさ
せ、４８ビット・ワードにおける３つの値に複製させ
る。更に、Ｌコア３５４はまた、鏡面（スペキュラー）
ハイライトを計算するのに用いられるベキ関数ユニット
４６４を含む。ベキ関数ユニット４６４は、内積計算か
ら１６ビットを取り、１６ビットの結果を生じ、４８ビ
ットのビット・ワードにおける３つの値に複製させる。
ベキ関数ユニット４６４は、２つのテーブル・ルックア
ップを実行し、正確な値を生じさせるためのそれ以外の
計算も実行する。この結果は、０．５パーセントの正確
さを有し、すなわち、８ビット・カラーの最下位ビット
の程度までの正確さを有する。Ｌコア通信バッファＬコア３５４は、チップの他の部分と通信するための５
つの異なるバッファを含む。ＬＩバッファ３７６は、Ｆ
コア・ブロック３５２におけるＦＩバッファ３７２に対
応する。ＬＩバッファ３７６は、ＣＦバスを介してコマ
ンド・ブロック１４２から送られてくる入来データにア
クセスするのに用いられる。ＬＩバッファ３７６は、４
８ビット・レジスタとして見ることができ、３つのカラ
ーと、３つのノーマルと、３つのアルファ値を含む１ワ
ードとを含む。Ｆコア３５２におけるＦＳレジスタ３８
４のように、ＬＩバッファ３７６は、２つのＦＩバッフ
ァ３７２と、２つのＦＬバッファ３７４と、Ｆコア３５
２において処理されている１つのプリミティブとに対応
する５つのバッファを備えている。

【００４７】ＦＬバッファ３７４は、Ｆコア３５２から
ＸＹＺ視点ベクトルを受け取るのに用いられる。ＦＬバ
ッファ３７４は、必要であれば、クリップされたＲＧＢ
カラーとアルファ値とを記憶するのにも用いられる。Ｆ
ＬＬＦＩＦＯ３７８は、ローカルなライトに対する減衰
値を送るのに用いられる。これらの値は、Ｆコア３５２
においてのみ実行される浮動小数点計算を必要とする。
ライティング計算が減衰ファクタがライトのために必要
とされるポイントに至るときには、Ｌコア３５４は、デ
ータがＦＬＬＦＩＦＯ３７８において使用可能になるま
で停止する。

【００４８】ＦＬＦバッファ３８０は、ＬコアとＦコア
との間の通信のためのものであり、通常の動作のための
ものではない。ＦＬＦバッファ３８０の１回のランタイ
ム使用は、クリッピングの間に、ライティング値をＬコ
ア３５４に送り、Ｆコアがスポットライトに用いるため
にＬコア３５４からベキ関数ロジックを借用することで
ある。これをするためには、Ｆコアは、２つのベキ関数
パラメータをＦＬＦバッファ３８０に書き込み、次に、
Ｌコアに割り込みを行って、計算が実行されることを要
求する。計算が完了すると、結果は、ＦＬＦバッファ３
８０に戻され、Ｌコア３５４の動作継続が許可される。
Ｆコア３５２は、次に、ＦＬＦバッファ３８０のその側
面からの結果を読み出す。ＦＬＦバッファ３８０はま
た、診断目的にも用いられる。

【００４９】ＬＳバッファ３８６は、セットアップ計算
のためにデータをＳコア３５６に送るために用いられる
書き込みだけ（ライト・オンリ）の出力レジスタを備え
ている。カラーおよびアルファ値だけが、このインター
フェースを介して送られる。標準的な三角形の場合に
は、３つのカラーと１つのアルファ値（３つの値を含
む）とがＳコア３５６に送られる。好適実施例では、Ｌ
Ｓバッファ３８６は、４つのダブル・バッファ型のエン
トリを備えている。グラフィクス座標システムホストＣＰＵ１０２が幾何学的プリミティブをグラフィ
クス・アクセラレータ１１２に転送するときには、これ
らのプリミティブの頂点は、典型的には、三次元モデル
空間の座標（世界空間座標と称される）によって表現さ
れる。世界空間座標は、表現に適した任意の単位で表す
ことができる（例えば、フィート、マイル、メートル
等）。後続のパイプライン段による処理がなされる前
に、これらの座標には、Ｆコア・ブロック３５２によっ
て実行されるビュー変換が施され、それによって、これ
らの頂点は、スクリーン空間座標に変換される。スクリ
ーン空間は、ピクセル（または、その一部）を用いて測
定され、スクリーンの最大ピクセル座標によって境界が
画定される。

【００５０】Ｆコア・ブロック３５２において実行され
るビュー変換動作は、変換行列（「現在のビューイング
行列」と称される）と入力座標値を表すベクトルとを乗
算することを含む。入力座標ベクトルと変換行列との乗
算は、頂点座標を予め定義されたアイ・ポジション（世
界空間座標における見ている者の位置を示す）にマップ
することを含む様々な効果を有する。変換では、また、
第４の頂点座標Ｗを用いて、プリミティブの全体的な射
影を提供する。

【００５１】Ｆコア・ブロック３５２における変換動作
の別の効果は、ウィンドウからビューポートへの変換で
ある。「ウィンドウ」とは、世界座標の中の領域（典型
的には、矩形）であり、その中に、プリミティブが存在
する位置が定義されている。「ビューポート」とは、ス
クリーン空間座標における対応する領域であり、その中
で、プリミティブが実際にレンダリングされる。ウィン
ドウからビューポートへの変換の結果として、与えられ
たプリミティブに、Ｆコア・ブロック３５２によって、
スケーリングやクリッピング等を行うことができる。既
に説明したように、頂点（スクリーン空間座標におけ
る）は、次に、ＦＬバッファ３７４を介して、ライティ
ング計算のために、Ｌコア・ブロック３５４に送られ
る。

【００５２】ローカルなアイ・ベクトルを計算するため
に、アイ・ポジション（世界空間座標の中にある）と頂
点位置（スクリーン空間座標）との両方を考えられなけ
ればならない。以下で説明するように、ローカルなアイ
・ベクトルは、スクリーン空間における頂点を（世界座
標の中にある）アイ・ベクトル空間に変換するビュー・
ベクトル行列を用いて、計算される。ビュー・ベクトル
行列は、部分的には、頂点座標の世界空間への逆変換を
与える現在のビューイング行列の逆行列から計算され
る。

【００５３】次に図６Ａを参照すると、面５１２上の頂
点（Ｖ）５０２が示されている。アイ・ベクトル５１６
は、頂点５０２からアイ・ポジション５０８まで延長し
ている。ベクトル５１６は、点（Ｓ）５１０において
（世界空間座標における）ｚ＝０を通過する。ディスプ
レイ装置８４のスクリーン５１４は、図６Ａの側面図に
図解されているように、平面ｚ＝０内に存在すると考え
られる。ＸＧＬやＯｐｅｎＧＬなどのグラフィクス標準
では、鏡面反射値などの計算は、アイ・ベクトル５１６
だけでなく、表面法線（surface normal）５０４と、頂
点５０２から光源５０６まで延長するライト方向ベクト
ル５１８とを含む。従来技術によるシステム（浮動小数
点ライティング・ユニットを伴うもの）では、ローカル
なアイ・ベクトルは、頂点５０２の位置をアイ・ポジシ
ョン５０８から減算することによって計算されていた。
しかし、これらの距離は、かなり大きいので、Ｌコア・
ブロック３５４の数値範囲を超えてしまう可能性があ
る。図７−ローカルなアイ・ベクトルの計算次に図７を参照すると、与えられたアイ・ポジション
（例えば、アイ・ポジション５０８）と与えられた頂点
（例えば、頂点５０２）とに対応するローカルなアイ・
ベクトルの高速計算のための方法６００が、示されてい
る。ステップ６１０では、ビュー・ベクトル行列が生成
される。以下で更に詳細に説明されるように、ビュー・
ベクトル行列は、現在のビューイング行列の逆行列と、
頂点５０２がマップされる与えられたビューポートのコ
ーナーのスクリーン空間座標とから生成される。ある実
施例では、ビュー・ベクトル行列は、３行３列の疎（sp
arse）行列である。

【００５４】ステップ６２０では、Ｌコア・ブロック３
５４は、頂点５０２に対するスクリーン空間座標を受け
取る。これらの座標は、ＦＬバッファ３７４を介して転
送されるが、ＦＬバッファ３７４は、また、頂点５０２
がその一部である三角形プリミティブの残りの頂点に対
する座標も含む。好適実施例では、これらの転送された
頂点は、Ｆコア・ブロック３５２からセットアップ動作
のためにＳコア・ブロック３５６に同時に送られ、従っ
て、頂点の座標は、Ｌコア・ブロック３５４に対して排
他的に生成される必要はない。

【００５５】ステップ６３０では、Ｌコア・ブロック３
５４は、頂点５０２に対するスクリーン空間座標を表現
可能な数値範囲にスケーリングする。ある実施例では、
Ｆコア・ブロック３５２は、ｓ１１．２０フォーマット
（１符号ビット、１１整数ビット、２０小数ビット）を
用いてスクリーン空間座標を表す。最大のスクリーン空
間値（Ｘが１２８０．０であり、Ｙが１０２４．０）
は、このようにして表すことができる（保護帯域空間を
考慮するときには、最大範囲は、−４０から１３２０．
０である）。しかし、Ｌコア・ブロック３５４は、−
２．０から＋２．０の数値範囲を有するだけである。こ
のようにして、多くの最下位小数ビットが廃棄され、入
力される頂点座標は、Ｌコア３５４のｓ１．１４フォー
マットで表現されるようにスケーリングされる。Ｆコア
３５２からＬコア３５４への座標の転送の結果は、従っ
て、自動的な１０２４による除算である。そして、座標
の最大数値範囲は、ほぼ、０．０３９から１．２８９に
なる。

【００５６】ステップ６４０においては、正規化されて
いないアイ・ベクトルが、ステップ６１０において生成
されたビュー・ベクトル行列と頂点５０２のスケーリン
グされたスクリーン空間座標を表すベクトルとの行列乗
算を実行することによって、計算される。この動作によ
って、（正規化されていない）アイ・ベクトル５１６の
成分が得られる。この動作が可能であるのは、アイ・ポ
ジションからスクリーン上の点までの角度がその点にマ
ップされるすべての深さに対して一定であるからであ
る。

【００５７】後で説明するように、ビュー・ベクトル行
列はまた、アイ・ベクトル５１６のスケーリングを実行
して、後続の計算を容易にする。状況によっては、アイ
・ポジション５０８は、有効なアイ・ベクトル（Ｌコア
・ブロック３５４の数値範囲をオーバフローしないも
の）の計算ができない。ある実施例では、これらの状況
に対するローカルなアイ・ベクトルの計算は、Ｆコア・
ブロック３５２などの浮動小数点ユニットによって処理
される。好適実施例では、ステップ６４０の変換プロセ
スは、１つのＬコア３５４のマイクロコード乗算・集積
命令によって実行される。

【００５８】ステップ３５０では、ステップ６４０にお
いて計算された正規化されていないアイ・ベクトル５１
６が正規化される（同じ方向の単位長さに変換され
る）。好適実施例では、このプロセスは、３つのＬコア
３５４のマイクロコード命令から構成される。第１に、
正規化されていないアイ・ベクトルが平方される（内積
命令）。次に、内積の結果の逆数をとる（逆平方根命
令）。最後に、逆平方根の結果に、元のビュー・ベクト
ル行列が乗算され（乗算命令）、正しい正規化されたロ
ーカルなアイ・ベクトルが得られる。

【００５９】ステップ６６０では、ステップ６５０で計
算された正規化されたローカルなアイ・ベクトルを用い
て、鏡面反射値などの後続のライティング計算を実行す
る。次に図８Ａ−図８Ｄを参照すると、鏡面計算のいく
つかの例が示される。図８Ａでは、ＸＧＬに対する鏡面
反射計算が示される。ＸＧＬでは、鏡面ハイライトの量
が、ライト・ベクトル６７２Ａと法線ベクトル６７２Ａ
とから反射ベクトル６７６Ａを計算することによって計
算される。そして、反射ベクトル６７６Ａとアイ・ベク
トル６７８Ａとの内積によって、鏡面反射の量が決定さ
れる。図８Ｂでは、ＯｐｅｎＧＬに対する鏡面反射の計
算が示されている。ＯｐｅｎＧＬでは、反射ベクトル６
７６Ｂが、アイ・ベクトル６７８Ｂとライト・ベクトル
６７２Ｂとの中間に計算される。鏡面値は、反射ベクト
ル６７６Ｂと法線ベクトル６７４Ｂとの内積から決定さ
れる。両方の方法共に、長所と短所とを有している。

【００６０】ＯｐｅｎＧＬ方法は、無限遠点におけるア
イ・ポジションと共に用いる際には、１ライト当たりに
１回、反射ベクトルを計算することを可能にし、１頂点
当たり、ただ１回の内積演算を必要とするだけである。
しかし、ローカルなアイ・ポイントでは、反射ベクトル
が、すべての頂点に対して、１ライト当たり１回計算さ
れなければならず、これは、正規化演算が必要になるた
めに、かなりの費用である。

【００６１】ＸＧＬ方法は、僅かに再構成することがで
き、それによって、反射ベクトルを頂点ごとに計算さ
れ、同じ反射ベクトルがそれぞれのライトに対して用い
られる。図８Ｄに示されているように、反射ベクトル６
７６Ｃは、法線ベクトル６７４Ｃとアイ・ベクトル６７
８Ｃとから計算される。法線ベクトル６７４Ｃとアイ・
ベクトル６７８Ｃとの内積によって、法線ベクトル６７
４Ｃへのアイ・ベクトル６７８Ｃの射影の高さが生じ
る。この高さに２を乗算し、結果を法線ベクトル６７４
Ｃと乗算すると、アイ・ベクトル６７８Ｃに加算された
反射ベクトルに等しい法線ベクトル６７４Ｃ上の点が得
られる。平行四辺形を用い、この点からアイ・ベクトル
６７８Ｃを減算すると、実際の反射ベクトル６７６Ｃが
得られる。両方のベクトル共にこの演算前の単位長さに
対して正規化されていたので、結果もまた正規化されて
いる。反射ベクトル６７６Ｃと与えられた頂点に対する
それぞれのライト（例えば、ライト６７２Ｃ）との内積
により、図８Ｃに示されているように、鏡面反射の量が
得られる。図９−ビュー・ベクトル行列の生成次に図９を参照すると、既に説明されたように用いられ
たビュー・ベクトル行列を生成する方法７００が、示さ
れている。ステップ７１０では、現在のビューイング行
列から、逆行列が生成される。現在のビューイング行列
は、グラフィクス・パイプラインのより早い段階におい
て、頂点を、世界空間座標からスクリーン空間座標に変
換するのに用いられる。ステップ７１２では、世界座標
が、逆行列を用いて、与えられたアイ・ポジションに対
して計算される。好適実施例では、与えられたアイ・ポ
ジションに対する世界座標は、単純に、逆行列の第２の
ローの成分である（以下に掲げるリストを参照のこ
と）。ステップ７１４では、与えられたビューポートの
コーナー座標に対する世界空間座標は、ステップ７１０
において計算された逆行列を用いて与えられたビューポ
ートのコーナーのクリップ空間座標を変換することによ
って、決定される。クリップ空間座標では、ビューポー
トの左エッジは、ｘ＝−１．０であり、右エッジは、ｘ
＝＋１．０である。同様にして、ビューポートのトップ
・エッジは、ｙ＝＋１．０であり、ボトム・エッジは、
ｙ＝−１．０である。（ｘ，ｙ）クリップ座標での与え
られたビューポートに対する４つのコーナーは、従っ
て、左上のコーナーに対しては、（−１．０，＋１．
０）であり、右上のコーナーに対しては、（＋１．０，
＋１．０）であり、左下のコーナーに対しては、（−
１．０，−１．０）であり、右下のコーナーに対して
は、（＋１．０，−１．０）である。ｚおよびｗ座標
は、それぞれのコーナーに対して、１．０である。

【００６２】次に、ステップ７１６において、与えられ
たビューポートのコーナー座標に対する世界空間座標
が、与えられたアイ・ポジションに対する世界空間座標
と同様に、正規化される。ステップ７１８では、ステッ
プ７１６から得られた結果的な世界座標を用いて、正規
化されたアイ・ポジションからビューポートのコーナー
までの世界空間における複数のベクトルが生成される。
次に、ステップ７２０では、この複数のベクトルが、平
面Ｚ＝１に正規化される。正規化の後で、サイズと中心
オフセットとが（ｘおよびｙ座標の両方で）、与えられ
たビューポートに対して、ステップ７２２で、決定され
る。同様にして、ステップ７２４において、複数のベク
トルの与えられたビューポート上への射影のサイズが、
射影の中心オフセットと同様に、決定される。与えられ
たビューポートのサイズと中心オフセットとが、スクリ
ーン空間座標において計算され、Ｌコア３５４の数値範
囲に調整される。

【００６３】射影のサイズと中心オフセットとは、ステ
ップ７２６において、与えられたビューポートのサイズ
と中心オフセットと共に用いられ、正規化されていない
ビュー・ベクトル行列成分を計算する。次に、ステップ
７２８において、ビュー・ベクトル行列への最大入力値
が計算され、それによって、ステップ７３０における最
大ビュー・ベクトルの長さの決定が可能になる。ステッ
プ７３２において、正規化されていないビュー・ベクト
ル行列の成分が、最大のベクトルの長さを、与えられた
ビューポートに対する所定の範囲内に維持するようにス
ケーリングされ、最終的なビュー・ベクトル行列の成分
の値が得られる。

【００６４】好適実施例では、与えられたビューポート
に対する所定の範囲は、図６Ｂを参照して説明される。
図６Ｂは、スクリーン５１４内のビューポートを示して
いる。ビュー・ベクトル（アイ・ベクトルの別名）５３
０は、方法６００に関して上述したように計算される。
ビュー・ベクトル５３０は、２つの規準に基づいて、有
効であることが決定される。第１に、アイ・ポジション
５０８からビューポート５２０までの距離は、アイ・ベ
クトル空間（これは、世界座標で表される）において、
少なくとも０．５でなければならない。この距離は、図
６Ｂのライン・セグメント５２２によって示されてい
る。この最小の長さによって、逆平方根演算の間に、正
規化演算がオーバフローすることが防止される。第２
に、アイ・ポジション５０８からビューポート５２０の
最も遠い規定内の点（legal point）マスタ・デバイス
の距離は、演算のそれ以外の部分を範囲内に維持するた
めに、１．０よりも小さくなければならない。これらの
距離は、ライン・セグメント５２４および５２６によっ
て表される。他の実施例では、これらの所定の範囲は、
変動することもある。状況によっては、有効なローカル
なアイ・ベクトルは、計算できない場合もある。ある実
施例では、これらのローカルなアイ・ベクトルは、Ｆコ
ア・ブロック３５２などの浮動小数点ユニットにおいて
計算される。ビュー・ベクトル行列の生成のためのコード・リスティ
ング次に、本発明の好適実施例において実行されるビュー・
ベクトル行列の計算のためのソース・コードを示す。

【００６５】

【表１】

【図面の簡単な説明】

【図１】本発明による三次元（３Ｄ）グラフィクス・ア
クセラレータを含むコンピュータ・システムを図解して
いる。

【図２】図１のコンピュータ・システムの簡略化された
ブロック図である。

【図３】本発明の好適実施例による３Ｄグラフィクス・
アクセラレータを図解するブロック図である。

【図４】本発明の好適実施例の３Ｄグラフィクス・アク
セラレータにおける浮動小数点プロセッサの１つを図解
するブロック図である。

【図５】本発明の好適実施例における固定小数点ライテ
ィング・ユニットを図解するブロック図である。

【図６】図６Ａおよび図６Ｂから構成される。図６Ａ
は、アイ・ベクトルのディスプレイ・スクリーン上の点
Ｓへの頂点に対する関係を図解している。図６Ｂは、ビ
ュー・ベクトルがどのようにディスプレイ・スクリーン
上の与えられたビューポートにマップされるかを示して
いる。

【図７】本発明の好適実施例による、正規化されたロー
カルなアイ・ベクトルを計算する方法を示す流れ図であ
る。

【図８】図８Ａ−図８Ｄから構成され、鏡面反射値を計
算する際のローカルなアイ・ベクトルの使用を示してい
る。

【図９】本発明の好適実施例におけるビュー・ベクトル
行列を計算する方法を示す流れ図である。

─────────────────────────────────────────────────────

【手続補正書】

【提出日】平成１１年４月５日

【手続補正１】

【補正対象書類名】明細書

【補正対象項目名】００６５

【補正方法】変更

【補正内容】

【００６５】

【表１】
─────────────────────────────────────────────────────

【手続補正書】

【提出日】平成１１年４月１６日

【手続補正１】

【補正対象書類名】図面

【補正対象項目名】図６

【補正方法】変更

【補正内容】

【図６】

【手続補正２】

【補正対象書類名】図面

【補正対象項目名】図７

【補正方法】変更

【補正内容】

【図７】

【手続補正３】

【補正対象書類名】図面

【補正対象項目名】図８

【補正方法】変更

【補正内容】

【図８】

【手続補正４】

【補正対象書類名】図面

【補正対象項目名】図９

【補正方法】変更

【補正内容】

【図９】

───────────────────────────────────────────────────── フロントページの続き (71)出願人 597004720 2550 ＧａｒｃｉａＡｖｅｎｕｅ，ＭＳＰＡＬ１−521，ＭｏｕｎｔａｉｎＶｉｅｗ，Ｃａｌｉｆｏｒｎｉａ 94043− 1100，ＵｎｉｔｅｄＳｔａｔｅｓｏｆＡｍｅｒｉｃａ (72)発明者マイケル・エフ・ディアリングアメリカ合衆国カリフォルニア州94024, ロス・アルトス，クウェスタ・ドライブ 657

Claims

【特許請求の範囲】

【請求項１】グラフィクス・サブシステムにおいてロ
ーカル・アイ・ベクトルを計算する方法であって、前記
ローカル・アイ・ベクトルは、与えられたアイ・ポジシ
ョンと第１の幾何学的プリミティブの第１の頂点とに対
応する方法において、前記第１の頂点に対応する第１の組の座標を受け取るス
テップであって、前記第１の組の座標は、第１の座標空
間において表現されているステップと、前記与えられたアイ・ポジションに対応する逆変換行列
を生成するステップであって、前記与えられたアイ・ポ
ジションは、第２の座標空間に位置する第２の組の座標
によって表現されているステップと、前記逆変換行列を用いて、前記第１の組の座標を変換す
るステップであって、前記変換は、予備的なローカル・
アイ・ベクトルを生成するステップと、を含んでおり、前記予備的なローカル・アイ・ベクトル
は、前記第１の頂点に対しライティング計算を実行する
のに用いることができることを特徴とする方法。
【請求項２】請求項１記載の方法において、前記第１
の座標空間はスクリーン空間であり、前記第２の座標空
間は世界空間であることを特徴とする方法。
【請求項３】請求項１記載の方法において、第１の組
の座標を与えられた数値範囲にスケーリングするステッ
プを更に含み、前記スケーリングは、前記変換の前に実
行されることを特徴とする方法。
【請求項４】請求項１記載の方法において、前記予備
的ローカル・アイ・ベクトルを正規化することにより、
正規化されたローカル・アイ・ベクトルを作成するステ
ップを更に含み、前記正規化差あれたローカル・アイ・
ベクトルは、前記第１の頂点に対し前記ライティング計
算を実行するのに用いることができることを特徴とする
方法。
【請求項５】請求項２記載の方法において、前記逆変
換行列は、前記第１の座標空間内の与えられたビューポ
ートに対応することを特徴とする方法。
【請求項６】請求項５記載の方法において、前記逆変換行列を、前記与えられたビューポートの座標
と、現在のビューイング行列の逆行列と、前記与えられ
たアイ・ポジションとから計算するステップを更に含ん
でおり、前記現在のビューイング行列は、前記第２の座
標空間からの座標を前記第１の座標空間に変換するのに
用いることができることを特徴とする方法。
【請求項７】請求項６記載の方法において、前記第２
の座標空間は世界空間であり、前記第１の座標空間はス
クリーン空間であることを特徴とする方法。
【請求項８】請求項１記載の方法において、前記変換
は、所定の数値範囲を有する固定小数点演算を用いて実
行されることを特徴とする方法。
【請求項９】請求項８記載の方法において、前記逆変換行列は、前記所定の数値範囲に対して有効で
あるかどうかを判断するステップと、前記逆変換行列が前記所定の数値範囲に対して無効であ
ると判断される場合には、浮動小数点演算を用いて前記
ローカル・アイ・ベクトルの計算を実行するステップ
と、を更に含むことを特徴とする方法。
【請求項１０】請求項４記載の方法において、前記正規化されたローカル・アイ・ベクトルを用いて、
前記第１の頂点に対するライティング計算を実行するス
テップを更に含むことを特徴とする方法。
【請求項１１】請求項１０記載の方法において、前記
ライティング計算を実行するステップは、無限遠点にお
ける光源に対して鏡面ハイライト値を計算するステップ
を含むことを特徴とする方法。
【請求項１２】ローカル・アイ・ベクトルを計算する
グラフィクス・サブシステムであって、前記ローカル・
アイ・ベクトルは、与えられたアイ・ポジションと与え
られたポジション値とに対応するグラフィクス・サブシ
ステムにおいて、前記与えられたポジション値に対応する第１の組の座標
を受け取るように結合されており、前記第１の組の座標
から第２の組の座標を生成するように構成された座標変
換ユニットであって、前記第１の組の座標は第１の座標
空間内に位置しており、前記第２の組の座標は第２の座
標空間内に位置している、座標変換ユニットと、前記第２の組の座標と前記与えられたアイ・ポジション
に対応する逆変換行列とを受け取るように結合されてお
り、前記逆変換行列を用いて前記第２の組の座標を変換
することによって、予備的なローカル・アイ・ベクトル
を生成するように構成され、更に、前記与えられたポジ
ション値に対してライティング計算を実行する際には前
記予備的なローカル・アイ・ベクトルを用いるように構
成されているライティング・ユニットと、を備えていることを特徴とするグラフィクス・サブシス
テム。
【請求項１３】請求項１２記載のグラフィクス・サブ
システムにおいて、前記第１の座標空間は世界空間であ
り、前記第２の座標空間はスクリーン空間であることを
特徴とするグラフィクス・サブシステム。
【請求項１４】請求項１２記載のグラフィクス・サブ
システムにおいて、前記座標変換ユニットは、浮動小数
点演算を用いて前記第２の組の座標を生成するように構
成されており、前記ライティング・ユニットは、固定小
数点演算を用いて前記予備的ローカル・アイ・ベクトル
を生成するように構成されていることを特徴とするグラ
フィクス・サブシステム。
【請求項１５】請求項１４記載のグラフィクス・サブ
システムにおいて、前記ライティング・ユニットは、前
記予備的ローカル・アイ・ベクトルの生成の前に、前記
第２の組の座標を所定の固定小数点数値範囲にスケーリ
ングするように構成されていることを特徴とするグラフ
ィクス・サブシステム。
【請求項１６】請求項１２記載のグラフィクス・サブ
システムにおいて、前記予備的ローカル・アイ・ベクト
ルは正規化されておらず、前記ライティング・ユニット
は、前記予備的ローカル・アイ・ベクトルを正規化する
ように構成されており、前記正規化されたローカル・ア
イ・ベクトルは、前記与えられたポジション値に対して
ライティング計算を実行するのに用いることができるこ
とを特徴とするグラフィクス・サブシステム。
【請求項１７】請求項１３記載のグラフィクス・サブ
システムにおいて、前記逆変換行列は、スクリーン空間
内の与えられたビューポートに対応することを特徴とす
るグラフィクス・サブシステム。
【請求項１８】請求項１７記載のグラフィクス・サブ
システムにおいて、前記逆変換行列は、前記与えられた
アイ・ポジションと、前記与えられたビューポートの座
標と、現在のビューイング行列の逆行列とを用いて計算
され、前記現在のビューイング行列は、前記第１の座標
空間を前記第２の座標空間に変換するために、前記座標
変換ユニットによって用いることができることを特徴と
するグラフィクス・サブシステム。
【請求項１９】請求項１２記載のグラフィクス・サブ
システムにおいて、前記ライティング・ユニットは、前
記与えられたポジション値に対して鏡面ハイライト値を
計算するように構成され、前記鏡面ハイライト値は、無
限遠点における光源から生じているものとしてモデル化
されることを特徴とするグラフィクス・サブシステム。
【請求項２０】請求項１２記載のグラフィクス・サブ
システムにおいて、前記座標変換ユニットに結合されて
おり、前記ライティング・ユニットと同時に前記第２の
組の座標を受け取るように構成され、更に、前記与えら
れたポジション値を含む幾何学的プリミティブに対する
セットアップ動作を実行するように構成されているセッ
トアップ・ユニットを更に含んでいることを特徴とする
グラフィクス・サブシステム。
【請求項２１】ローカル・アイ・ベクトルを計算する
コンピュータ・システムであって、前記ローカル・アイ
・ベクトルは、与えられたアイ・ポジションと与えられ
たポジション値とに対応するコンピュータ・システムに
おいて、前記与えられたアイ・ポジションに対応する逆変換行列
を生成するように構成されたホストＣＰＵであって、前
記与えられたアイ・ポジションは、第１の座標空間に位
置する座標によって表現されているホストＣＰＵと、前記ホストＣＰＵに結合されたグラフィクス・サブシス
テムであって、前記与えられたポジション値に対応する第１の組の座標
を受け取るように結合されており、前記第１の組の座標
から第２の組の座標を生成するように構成された座標変
換ユニットであって、前記第１の組の座標は第１の座標
空間内に位置しており、前記第２の組の座標は第２の座
標空間内に位置している、座標変換ユニットと、前記第２の組の座標と前記逆変換行列とを受け取るよう
に結合されており、前記逆変換行列を用いて前記第２の
組の座標を変換することによって、予備的なローカル・
アイ・ベクトルを生成するように構成され、更に、前記
与えられたポジション値に対してライティング計算を実
行する際には前記予備的なローカル・アイ・ベクトルを
用いるように構成されているライティング・ユニット
と、を備えているグラフィクス・サブシステムと、を備えていることを特徴とするコンピュータ・システ
ム。
【請求項２２】請求項２１記載のコンピュータ・シス
テムにおいて、前記第１の座標空間は世界空間であり、
前記第２の座標空間はスクリーン空間であることを特徴
とするコンピュータ・システム。
【請求項２３】請求項２２記載のコンピュータ・シス
テムにおいて、前記座標変換ユニットは、浮動小数点演
算を用いて前記第２の組の座標を生成するように構成さ
れており、前記ライティング・ユニットは、固定小数点
演算を用いて前記予備的なローカル・アイ・ベクトルを
生成するように構成されていることを特徴とするコンピ
ュータ・システム。
【請求項２４】請求項２２記載のコンピュータ・シス
テムにおいて、前記逆変換行列はスクリーン空間内の与
えられたビューポートに対応することを特徴とするコン
ピュータ・システム。
【請求項２５】請求項２４記載のコンピュータ・シス
テムにおいて、前記逆変換は、前記与えられたアイ・ポ
ジションと前記与えられたビューポートの座標と、現在
のビューイング行列の逆行列とを用いて計算され、前記
現在のビューイング行列は、座標を前記第１の組の座標
空間から前記第２の座標空間に変換するために前記座標
変換ユニットによって用いることができることを特徴と
するコンピュータ・システム。
【請求項２６】与えられたアイ・ポジションと第１の
幾何学的プリミティブの第１の頂点とに対応するローカ
ル・アイ・ベクトルを計算するシステムでああって、前記第１の頂点に対応する第１の組の座標を受け取る受
け取り手段であって、前記第１の組の座標は、第１の座
標空間において表現されている受け取り手段と、前記与えられたアイ・ポジションに対応する逆変換行列
を生成する生成手段であって、前記与えられたアイ・ポ
ジションは、第２の座標空間に位置する第２の組の座標
によって表現されている生成手段と、前記逆変換行列を用いて、前記第１の組の座標を変換す
る変換手段であって、前記変換は、予備的なローカル・
アイ・ベクトルを生成する変換手段と、を備えており、前記予備的なローカル・アイ・ベクトル
は、前記第１の頂点に対しライティング計算を実行する
のに用いることができることを特徴とするシステム。