JPH10171766A

JPH10171766A - グラフィックアクセラレータ

Info

Publication number: JPH10171766A
Application number: JP8344570A
Authority: JP
Inventors: Akihiro Kotake; 章博小竹
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1996-12-09
Filing date: 1996-12-09
Publication date: 1998-06-26

Abstract

(57)【要約】【課題】複数のグラフィックプロセッサのうち特定の
グラフィックプロセッサに負荷が集中することを回避
し、描画性能の低下を防止することのできるグラフィッ
クアクセラレータを提供する。【解決手段】必要に応じてグラフィックコマンドを加
工するコマンドエンジン３０と、複数のグラフィックプ
ロセッサ４２１〜４２ｎを並列に備えるジオメトリエン
ジン４０と、ピクセルイメージを作成するレンダリング
エンジン５０とを備え、コマンドエンジン３０が、グラ
フィックコマンドを所定のサイズに分割するＧＡコマン
ド分割部３３と、グラフィックコマンドの種類及びサイ
ズに基づき必要に応じてＧＡコマンド分割部３３にグラ
フィックコマンドを分割させると共に、ジオメトリエン
ジン４０の複数のグラフィックプロセッサ４２１〜４２
ｎに分配するＧＡコマンド転送制御部３２とを備える。

Description

【発明の詳細な説明】

【０００１】

【発明が属する技術分野】本発明は、コンピュータシス
テムに搭載され描画処理を実行するグラフィックアクセ
ラレータに関し、特に、複数のグラフィックプロセッサ
を搭載し、グラフィックコマンドを並列に処理するグラ
フィックアクセラレータに関する。

【０００２】

【従来の技術】コンピュータシステムに搭載されて描画
処理を実行するグラフィックアクセラレータには、複数
のグラフィックプロセッサを搭載してグラフィックコマ
ンドを当該複数のグラフィックプロセッサに並列に処理
させることにより、描画処理の高速化を図っているもの
が有る。この種の従来技術としては、例えば、特開昭６
３−８６９３号公報に開示されたグラフィックアクセラ
レータがある。同公報には、グラフィックアクセラレー
タ内に、複数のグラフィックプロセッサと、図形表示装
置の画面上の区画に応じて処理を分担しグラフィックプ
ロセッサとは独立して並列に動作可能な複数のピクセル
プロセッサとを備え、グラフィックプロセッサの出力と
ピクセルプロセッサの入力との間に、行ディストリビュ
ータと列ディストリビュータとを備える。そして、複数
のグラフィックプロセッサが同時に同じピクセルプロセ
ッサの処理を必要とする出力を行った場合、当該出力を
ディストリビュータで一括して受け取ることにより、グ
ラフィックプロセッサがピクセルプロセッサの処理の順
番待ちとなるケースを減少している。

【０００３】しかし、上記従来のグラフィックアクセラ
レータは、特定のグラフィックプロセッサに負荷が集中
した場合、処理の並列度が低下し、全体として描画性能
が低下する場合があった。

【０００４】図９に、図７に示す図形（連続三角形）を
描画する場合における従来のグラフィックアクセラレー
タによるデータの流れを示す。なお、条件として、グラ
フィックプロセッサの数を２個（ＧＰ１、ＧＰ２）、グ
ラフィックプロセッサの入力ＦＩＦＯのサイズをそれぞ
れ３２ワード、連続三角形を描画するための法線データ
及び頂点データのデータ長をそれぞれ３ワードとする。

【０００５】１つのグラフィックプロセッサへは、５つ
の法線データ及び５つの頂点データを転送可能である。
しかし、１つのグラフィックプロセッサのみにデータを
転送するため、図９の第５列に示すように、グラフィッ
クプロセッサＧＰ１の入力ＦＩＦＯの空き待ちの状態が
発生してしまうことになる。この時、グラフィックプロ
セッサＧＰ２がｆｒｅｅとなっており、処理の並列度が
低下し、描画性能が低下してしまう。

【０００６】

【発明が解決しようとする課題】上述したように、従来
の技術は、特定のグラフィックプロセッサに負荷が集中
してしまうと、グラフィックプロセッサ全体の処理効率
が低下し、さらに、ピクセルプロセッサへの入力効率も
低下するため、ピクセルプロセッサによる処理効率も低
下し、描画性能が低下するという欠点があった。

【０００７】本発明は、上記従来の欠点を解決し、特定
のグラフィックプロセッサに負荷が集中することを回避
し、描画性能の低下を防止することのできるグラフィッ
クアクセラレータを提供することを目的とする。

【０００８】

【課題を解決するための手段】上記の目的を達成する本
発明は、ＳＹＳＴＥＭ−ＦＩＦＯを経由してＣＰＵから
転送されたグラフィックコマンドを複数のグラフィック
プロセッサにて並列に処理するグラフィックアクセラレ
ータにおいて、前記ＳＹＳＴＥＭ−ＦＩＦＯから前記グ
ラフィックコマンドを受け取り、必要に応じて加工する
コマンドエンジンと、前記複数のグラフィックプロセッ
サを並列に備えるジオメトリエンジンと、ジオメトリエ
ンジンの出力に基づいてピクセルイメージを作成するレ
ンダリングエンジンとを備え、前記コマンドエンジン
が、前記サイズの大きいグラフィックコマンドを所定の
サイズに分割するコマンド分割手段と、前記ＳＹＳＴＥ
Ｍ−ＦＩＦＯから受け取った前記グラフィックコマンド
の種類及びサイズに基づき必要に応じて前記コマンド分
割手段に前記グラフィックコマンドを分割させると共
に、前記ＳＹＳＴＥＭ−ＦＩＦＯから受け取った前記グ
ラフィックコマンドまたは前記コマンド分割手段に分割
させた前記グラフィックコマンドを前記ジオメトリエン
ジンの複数のグラフィックプロセッサに分配するコマン
ド転送制御手段とを備えることを特徴とする。

【０００９】請求項２の本発明のグラフィックアクセラ
レータは、前記ジオメトリエンジンが、前記複数のグラ
フィックプロセッサの入力側と出力側とにそれぞれＦＩ
ＦＯを備え、前記コマンド分割手段が、前記グラフィッ
クコマンドのサイズが前記グラフィックプロセッサの入
力側に位置する前記ＦＩＦＯの容量よりも大きい場合
に、該グラフィックコマンドを前記ＦＩＦＯの容量より
も小さくなるように分割し、前記グラフィックコマンド
のサイズが前記ＦＩＦＯの容量よりも小さい場合は、該
グラフィックコマンドを分割しないことを特徴とする。

【００１０】請求項３の本発明のグラフィックアクセラ
レータは、前記コマンド転送制御手段が、前記ＳＹＳＴ
ＥＭ−ＦＩＦＯから受け取った前記グラフィックコマン
ドが描画プリミティブである場合に、該グラフィックコ
マンドを前記コマンド分割手段に分割させ、かつ分割し
た前記グラフィックコマンドを前記ジオメトリエンジン
の所定の前記グラフィックプロセッサに分配し、前記Ｓ
ＹＳＴＥＭ−ＦＩＦＯから受け取った前記グラフィック
コマンドが描画プリミティブでない場合に、該グラフィ
ックコマンドを前記ジオメトリエンジンの全ての前記グ
ラフィックプロセッサに転送することを特徴とする。

【００１１】請求項４の本発明グラフィックアクセラレ
ータは、前記コマンド転送制御手段が、前記ＳＹＳＴＥ
Ｍ−ＦＩＦＯから受け取った前記グラフィックコマンド
が描画プリミティブである場合に、該グラフィックコマ
ンドを前記コマンド分割手段に分割させ、かつ分割した
前記グラフィックコマンドを前記ジオメトリエンジンの
所定の前記グラフィックプロセッサに分配し、前記ＳＹ
ＳＴＥＭ−ＦＩＦＯから受け取った前記グラフィックコ
マンドが描画プリミティブでない場合に、該グラフィッ
クコマンドを前記ジオメトリエンジンの全ての前記グラ
フィックプロセッサに転送し、前記コマンド分割手段
が、前記グラフィックコマンドのプリミティブの種類と
属性とに基づいて該グラフィックコマンドの分割サイズ
を決定し分割することを特徴とする。

【００１２】

【発明の実施の形態】以下、本発明の実施例について図
面を参照して詳細に説明する。

【００１３】図１は本発明の１実施例によるグラフィッ
クアクセラレータの構成を示すブロック図である。

【００１４】図示のように、本実施例のグラフィックア
クセラレータ１０は、ＣＰＵにより発行された描画を指
示するＧＡコマンドを受け付けて蓄積するＳＹＳＴＥＭ
−ＦＩＦＯ２０と、ＳＹＳＴＥＭ−ＦＩＦＯ２０に蓄積
されたＧＡコマンドを読み出して加工し分配転送するコ
マンドエンジン３０と、ＧＡコマンドを実行するジオメ
トリエンジン４０と、ジオメトリエンジン４０の出力に
基づいてピクセルイメージを作成するレンダリングエン
ジン５０と、作成されたピクセルイメージを格納するフ
レームバッファ６０とを備える。図１には、本実施例の
特徴的な構成のみを記載し、他の一般的な構成について
は記載を省略してある。

【００１５】コマンドエンジン３０は、ＳＹＳＴＥＭ−
ＦＩＦＯ２０からＧＡコマンドを取得するＧＡコマンド
取得部３１と、ＧＡコマンドをジオメトリエンジン４０
の所定のグラフィックプロセッサに転送するＧＡコマン
ド転送制御部３２と、必要に応じてＧＡコマンドを分割
するＧＡコマンド分割部３３とを備える。

【００１６】ＧＡコマンド取得部３１は、ＳＹＳＴＥＭ
−ＦＩＦＯ２０からＧＡコマンドを取り出し、取り出し
たコマンドをＧＡコマンド転送制御部３２へ渡す。

【００１７】ＧＡコマンド転送制御部３２は、ＧＡコマ
ンド取得部３１からＧＡコマンドを受け取り、ジオメト
リエンジン４０の所定のグラフィックプロセッサに転送
する。また、必要に応じてＧＡコマンドをＧＡコマンド
分割部３３へ送り、分割させる。具体的には、ＧＡコマ
ンドが描画プリミティブである場合は、当該ＧＡコマン
ドをＧＡコマンド分割部３３により分割し、分割したＧ
Ａコマンドをジオメトリエンジン４０の適当なグラフィ
ックプロセッサへ転送する。ＧＡコマンドが描画プリミ
ティブでない場合には、当該ＧＡコマンドを全てのグラ
フィックプロセッサへ転送する。

【００１８】ＧＡコマンド分割部３３は、ＧＡコマンド
が描画プリミティブである場合に、当該ＧＡコマンドを
ＧＡコマンド転送制御部３２から受け取り、ジオメトリ
エンジン４０のグラフィックプロセッサの入力ＦＩＦＯ
のサイズと当該ＧＡコマンドのサイズとに基づいて、当
該ＧＡコマンドを最適な長さに分割する。

【００１９】ジオメトリエンジン４０は、ＧＡコマンド
を並列に実行する複数のグラフィックプロセッサ４２１
〜４２ｎを備え、各グラフィックプロセッサ４２１〜４
２ｎを挟んで前後にそれぞれＦＩＦＯ４１１〜４１ｎ、
４３１〜４３ｎを備える。グラフィックプロセッサ４２
１〜４２ｎは、それぞれＦＩＦＯ４１１〜４１ｎを介し
て受け取ったＧＡコマンドに基づいて、座標変換や光源
等の計算を行い、計算結果をＦＩＦＯ４３１〜４３ｎに
格納する。

【００２０】ＳＹＳＴＥＭ−ＦＩＦＯ２０、レンダリン
グエンジン５０及びフレームバッファ６０は、この種の
グラフィックアクセラレータに従来から用いられている
ものと同様である。

【００２１】次に、図２ないし図６のフローチャートを
参照して本実施例の動作について説明する。図２はＧＡ
コマンド取得部３１の動作を示すフローチャート、図３
ないし図５はＧＡコマンド転送制御部３２の動作を示す
フローチャート、図６はＧＡコマンド分割部３３の動作
を示すフローチャートである。

【００２２】図２に示すように、ＧＡコマンド取得部３
１は、ＳＹＳＴＥＭ−ＦＩＦＯ２０がＥＭＰＴＹなら、
ＳＹＥＴＥＭ−ＦＩＦＯ２０からＧＡコマンドを取り出
し（ステップ３０１、３０２）、取り出したＧＡコマン
ドをＧＡコマンド転送制御部３２へ渡す（ステップ３０
３）。

【００２３】ＧＡコマンド転送制御部３２は、図３に示
すように、まず、カレントグラフィックプロセッサを決
定（例えば、グラフィックプロセッサ４２１）し（ステ
ップ３０１）、ＧＡコマンドをＧＡコマンド取得部３１
から受け取る（ステップ３０２、３０３）。そして、受
け取ったＧＡコマンドが描画プリミティブかどうかを判
定する（ステップ３０４）。ＧＡコマンドが描画プリミ
ティブならば、ＧＡコマンド分割部３４を呼び出し、Ｇ
ＡコマンドをＧＡコマンド１〜ＧＡコマンドｍ（１≦ｍ
≦ｎ，ｎ：グラフィックプロセッサ数）のｍ個のコマン
ドに分割する（ステップ３０５）。そして、分割したｍ
個のＧＡコマンドをジオメトリエンジン４０へ転送して
並列に処理させる（ステップ３０６、３０７、図４参
照）。

【００２４】図４に示すＧＡコマンドの並列処理におい
て、まず、カレントグラフィックプロセッサ４２１の入
力ＦＩＦＯ４１１の空きデータサイズとＧＡコマンドの
サイズとを比較する。そして、ＧＡコマンドのサイズの
方が大きいならば、グラフィックプロセッサ４２１がＦ
ＩＦＯ４１１内コマンドを処理してＦＩＦＯ４１１内の
コマンド量が減るのを待ち合わせる（ステップ４０
１）。

【００２５】一方、ＦＩＦＯ４１１の空きデータサイズ
の方が大きい場合、ＧＡコマンドをカレントグラフィッ
クプロセッサ４２１へ転送する（ステップ４０２）。そ
して、どのグラフィックプロセッサ４２１〜４２ｎがカ
レントグラフィックプロセッサとなっているかを判定
し、グラフィックプロセッサ４２ｎがカレントグラフィ
ックプロセッサであるならば、改めてグラフィックプロ
セッサ４２１をカレントグラフィックプロセッサとして
ステップ３０６へ戻る（ステップ４０３、４０４）。グ
ラフィックプロセッサ４２ｎ以外のグラフィックプロセ
ッサ４２ｈ（１≦ｈ＜ｎ）がカレントグラフィックプロ
セッサであるならば、改めてグラフィックプロセッサ４
２ｈ＋１をカレントグラフィックプロセッサとしてステ
ップ３０６へ戻る。

【００２６】ステップ３０４においてＧＡコマンドが描
画プリミティブでないと判定した場合、当該ＧＡコマン
ドを分割せずにジオメトリエンジン４０へ転送して処理
させる（ステップ３０８、図５参照）。

【００２７】図５に示すＧＡコマンドの処理において、
まず、カレントグラフィックプロセッサをグラフィック
プロセッサ４２１とし（ステップ５０１）、カレントグ
ラフィックプロセッサ４２１の入力ＦＩＦＯ４１１の空
きデータサイズとＧＡコマンドのサイズとを比較する。
そして、ＧＡコマンドのサイズの方が大きいならば、グ
ラフィックプロセッサ４２１がＦＩＦＯ４１１内コマン
ドを処理してＦＩＦＯ４１１内のコマンド量が減るのを
待ち合わせる（ステップ５０３）。

【００２８】以後、ステップ５０４〜５０７において、
図４に示したステップ４０２ないしステップ４０５と同
様の処理が行われた後、ステップ３０２へ戻る（ステッ
プ５０２）。

【００２９】ＧＡコマンド分割部３３は、ＧＡコマンド
転送制御部３２に呼び出された場合に、図６に示すよう
に、まず、カレントグラフィックプロセッサのＦＩＦＯ
サイズとＧＡコマンドのサイズとを比較する（ステップ
６０１）。ＧＡコマンドのサイズの方が大きいならば、
プリミティブの種類と属性情報とに基づいて、最適な分
割サイズを計算し、ＧＡコマンドをＧＡコマンド１、・
・・、ＧＡコマンドｍ（１≦ｍ≦ｎ、ｎ：グラフィック
プロセッサ数）のｍ個のコマンドに分割する（ステップ
６０２）。一方、カレントグラフィックプロセッサのＦ
ＩＦＯのサイズの方が大きい場合は、当該ＧＡコマンド
を分割しない（ステップ６０３）。

【００３０】次に、本実施例によるデータの流れを、具
体的な動作例を参照して説明する。ここでは、図７に示
す図形を描画する場合について説明する。条件として、
グラフィックプロセッサの数を２個（ＧＰ１、ＧＰ２）
とし、グラフィックプロセッサの入力ＦＩＦＯのサイズ
をそれぞれ３２ワードとする。また、１プリミティブの
ＧＡコマンドを図７に示す連続三角形とする。同図に示
す連続三角形では、１４個の頂点が指定され、各頂点に
は法線データが付加される。そして、連続三角形を描画
するための法線データ及び頂点データのデータ長をそれ
ぞれ３ワードとする。

【００３１】本実施例によれば、１４個の頂点データ及
び法線データはグラフィックプロセッサＧＰ１とグラフ
ィックプロセッサＧＰ２とに分割して転送される。これ
により、１個のグラフィックプロセッサ当たりの負荷が
分散され、図９に示した従来技術の場合における第５列
のようなグラフィックプロセッサＧＰ１の入力ＦＩＦＯ
の空き待ちのタイミングがなくなる。このため、グラフ
ィックプロセッサ全体の処理の並列度が高まり、描画性
能が向上することとなる。

【００３２】以上好ましい実施例をあげて本発明を説明
したが、本発明は必ずしも上記実施例に限定されるもの
ではない。

【００３３】

【発明の効果】以上説明したように、本発明は、１プリ
ミティブの描画を行うためのグラフィックコマンドのサ
イズが大きい場合に、当該グラフィックコマンドを適当
に分割し、複数のグラフィックプロセッサに分担して処
理させることにより、特定のグラフィックプロセッサに
負荷が集中することを回避することができる。したがっ
て、グラフィックプロセッサ全体の処理効率を高めるこ
とができ、図形の描画性能を向上させることができると
いう効果がある。

【図面の簡単な説明】

【図１】本発明の１実施例によるグラフィックアクセ
ラレータの構成を示すブロック図である。

【図２】ＧＡコマンド取得部の動作を示すフローチャ
ートである。

【図３】ＧＡコマンド転送制御部の動作を示し、ＧＡ
コマンドの大きさを判定して分割するまでの処理を示す
フローチャートである。

【図４】ＧＡコマンド転送制御部の動作を示し、ＧＡ
コマンドを分割した場合のグラフィックプロセッサへの
コマンド転送処理を示すフローチャートである。

【図５】ＧＡコマンド転送制御部の動作を示し、ＧＡ
コマンドを分割しない場合のグラフィックプロセッサへ
のコマンド転送処理を示すフローチャートである。

【図６】ＧＡコマンド分割部の動作を示すフローチャ
ートである。

【図７】本実施例の具体的な動作例を説明するための
描画図形の例を示す図である。

【図８】図７の図形を描画する場合の本実施例の動作
を示す図である。

【図９】図７の図形を描画する場合の従来技術の動作
を示す図である。

【符号の説明】

１０グラフィックアクセラレータ２０ＳＹＳＴＥＭ−ＦＩＦＯ３０コマンドエンジン３１ＧＡコマンド取得部３２ＧＡコマンド転送制御部３３ＧＡコマンド分割部４０ジオメトリエンジン４１１〜４１ｎ、４３１〜４３ｎＦＩＦＯ４２１〜４２ｎグラフィックプロセッサ５０レンダリングエンジン６０フレームバッファ

Claims

【特許請求の範囲】

【請求項１】ＳＹＳＴＥＭ−ＦＩＦＯを経由してＣＰ
Ｕから転送されたグラフィックコマンドを複数のグラフ
ィックプロセッサにて並列に処理するグラフィックアク
セラレータにおいて、前記ＳＹＳＴＥＭ−ＦＩＦＯから前記グラフィックコマ
ンドを受け取り、必要に応じて加工するコマンドエンジ
ンと、前記複数のグラフィックプロセッサを並列に備えるジオ
メトリエンジンと、ジオメトリエンジンの出力に基づいてピクセルイメージ
を作成するレンダリングエンジンとを備え、前記コマンドエンジンが、前記サイズの大きいグラフィックコマンドを所定のサイ
ズに分割するコマンド分割手段と、前記ＳＹＳＴＥＭ−ＦＩＦＯから受け取った前記グラフ
ィックコマンドの種類及びサイズに基づき必要に応じて
前記コマンド分割手段に前記グラフィックコマンドを分
割させると共に、前記ＳＹＳＴＥＭ−ＦＩＦＯから受け
取った前記グラフィックコマンドまたは前記コマンド分
割手段に分割させた前記グラフィックコマンドを前記ジ
オメトリエンジンの複数のグラフィックプロセッサに分
配するコマンド転送制御手段とを備えることを特徴とす
るグラフィックアクセラレータ。
【請求項２】前記ジオメトリエンジンが、前記複数の
グラフィックプロセッサの入力側と出力側とにそれぞれ
ＦＩＦＯを備え、前記コマンド分割手段が、前記グラフィックコマンドの
サイズが前記グラフィックプロセッサの入力側に位置す
る前記ＦＩＦＯの容量よりも大きい場合に、該グラフィ
ックコマンドを前記ＦＩＦＯの容量よりも小さくなるよ
うに分割し、前記グラフィックコマンドのサイズが前記
ＦＩＦＯの容量よりも小さい場合は、該グラフィックコ
マンドを分割しないことを特徴とする請求項１に記載の
グラフィックアクセラレータ。
【請求項３】前記コマンド転送制御手段が、前記ＳＹＳＴＥＭ−ＦＩＦＯから受け取った前記グラフ
ィックコマンドが描画プリミティブである場合に、該グ
ラフィックコマンドを前記コマンド分割手段に分割さ
せ、かつ分割した前記グラフィックコマンドを前記ジオ
メトリエンジンの所定の前記グラフィックプロセッサに
分配し、前記ＳＹＳＴＥＭ−ＦＩＦＯから受け取った前記グラフ
ィックコマンドが描画プリミティブでない場合に、該グ
ラフィックコマンドを前記ジオメトリエンジンの全ての
前記グラフィックプロセッサに転送することを特徴とす
る請求項１または請求項２に記載のグラフィックアクセ
ラレータ。
【請求項４】前記コマンド転送制御手段が、前記ＳＹＳＴＥＭ−ＦＩＦＯから受け取った前記グラフ
ィックコマンドが描画プリミティブである場合に、該グ
ラフィックコマンドを前記コマンド分割手段に分割さ
せ、かつ分割した前記グラフィックコマンドを前記ジオ
メトリエンジンの所定の前記グラフィックプロセッサに
分配し、前記ＳＹＳＴＥＭ−ＦＩＦＯから受け取った前記グラフ
ィックコマンドが描画プリミティブでない場合に、該グ
ラフィックコマンドを前記ジオメトリエンジンの全ての
前記グラフィックプロセッサに転送し、前記コマンド分割手段が、前記グラフィックコマンドのプリミティブの種類と属性
とに基づいて該グラフィックコマンドの分割サイズを決
定し分割することを特徴とする請求項１または請求項２
に記載のグラフィックアクセラレータ。