JPH10207694A

JPH10207694A - ディジタルべき乗演算装置及びそれを用いたグラフィックスシステム

Info

Publication number: JPH10207694A
Application number: JP724097A
Authority: JP
Inventors: Yuichi Abe; 雄一安部; Makoto Fujita; 良藤田; Katsunori Suzuki; 克徳鈴木; Kazuhisa Takami; 和久高見; Kazunori Oniki; 一徳鬼木
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1997-01-20
Filing date: 1997-01-20
Publication date: 1998-08-07
Anticipated expiration: 2017-01-20
Also published as: JP3884809B2

Abstract

(57)【要約】【課題】本発明は、テーブル参照により高速にべき乗計
算を行うことができ、テーブルの容量を小さく抑えるこ
とのできる方式、及びその装置を提供することを目的と
する。【解決手段】２のべきを底とする対数関数、及び指数関
数の値を保持する対数テーブル、及び指数テーブルと乗
算器、更に対数関数の定義域が前記対数テーブルの入力
値域に含まれない場合に該入力値を適当な整数Ｌだけシ
フトする対数シフト部，対数テーブルで参照した値にシ
フト数を足す対数加算部，指数関数の定義域が前記指数
テーブルの入力値域に含まれない場合に該入力値から適
当な整数Ｌを引く指数減算部，指数テーブルで参照した
値を減算量だけシフトする指数シフト部を有することに
より達成される。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は演算中にべき乗が含
まれる処理を実行する情報処理装置に関する。

【０００２】

【従来の技術】従来、２つのディジタル数値データＸ，
Ｎに対してＸ^Nを求めるべき乗計算については、技術評
論社より平成３年２月２５日に発行された奥村晴彦著、
「Ｃ言語による最新アルゴリズム事典」のｐ１０５−１
０６，ｐ１６２−１６３、及びｐ３０４に記されている
ように、対数関数及び、指数関数をべき級数展開もしく
は、連分数展開することで、対数及び、指数をループ計
算によって求める手法を用い、ソフトウェア的にＸの対
数を計算し、その結果にＮを乗算し、最後にこの乗算結
果の指数を計算するといった方法が取られていた。

【０００３】また別の方法としては、前記２つのディジ
タル数値データＸ，Ｎから直接アドレスを生成してべき
乗テーブル（ＲＯＭ，ＲＡＭ）を参照する方法が取られ
ていた。

【０００４】

【発明が解決しようとする課題】上記のように、従来例
では、前者の場合、ループ計算が発生し処理の高速化が
難しく、後者の場合、テーブルの入力がＸ及びＮの２つ
であるためテーブルの入力値の階調数はＸの階調数とＮ
の階調数の積となりテーブルの容量が大きくなるという
問題があった。

【０００５】本発明の目的は、ループ計算を用いず容量
の小さいテーブルを参照して高速にべき乗計算を行い得
るべき乗演算装置とそれを用いたグラフィックスシステ
ムを提供することにある。

【０００６】

【課題を解決するための手段】本発明の特徴は、入力値
Ｘに対する対数値を対数テーブルを用いて出力する対数
算出部と、対数算出部の出力とべき乗する値Ｎを乗算す
る乗算器と、この乗算器の出力に対する指数値を指数テ
ーブルを用いて出力する指数算出部とからディジタルべ
き乗演算装置を構成し、前記対数算出部により算出され
る対数の底と、前記指数算出部により算出される指数の
底を同一の値にしたことにある。

【０００７】また、更にテーブルの容量を減らすために
本発明では、前記対数算出部に、その入力値が前記対数
テーブルの入力値域に含まれない場合に前記対数算出部
の入力値に適当な整数Ｌに対し２^Lを乗算する対数シフ
ト部と、前記乗算結果を前記対数テーブルの入力とし対
数テーブル参照後、参照値にＬを加算して前記対数算出
部の出力とする対数加算部を設けたものである。

【０００８】また、前記指数算出部に、その入力値が前
記指数テーブルの入力値域に含まれない場合に前記指数
算出部の入力から適当な整数Ｍを減算する指数減算部
と、該減算結果を前記指数テーブルの入力とし指数テー
ブル参照後、該参照値に２^-Mを乗算して前記指数算出部
の出力とする指数シフト部を設けたものである。

【０００９】但し、ここでいう対数，指数テーブルと
は、ＲＡＭ，ＲＯＭだけに留まらず、入力値に対する対
数関数，指数関数の値を一定時間内に算出する回路一般
を指すものである。

【００１０】本発明では、入力値Ｘ，Ｎに対してＸ^Nの
べき乗計算を行う際、対数テーブル参照によってａを底
とする対数ｌｏｇａＸを求め、乗算器でｌｏｇａＸ×Ｎ
を計算し、指数テーブル参照によってａのｌｏｇａＸ×
ＮべきａｌｏｇａＸ×Ｎ＝Ｘ^Nを算出する。本発明では
ループ計算を行わないため、高速計算が可能である。ま
た、対数テーブルと指数テーブルとの２つにテーブルを
分割することで、各テーブルの入力を１つにできて、テ
ーブルの容量を減らすことができる。

【００１１】また、更にテーブルの容量を減らすため
に、前記対数算出部の入力値が前記対数テーブルの入力
値域に含まれない場合に該入力値に適当な整数Ｌに対し
２^Lを乗算し、該乗算結果を前記対数テーブルの入力と
し対数テーブル参照後、該参照値にＬを加算して前記対
数算出部の出力とし、前記指数算出部の入力値が前記指
数テーブルの入力値域に含まれない場合に該入力値から
適当な整数Ｍを減算し、該減算結果を前記指数テーブル
の入力とし指数テーブル参照後、該参照値に２^-Mを乗算
して前記指数算出部の出力とする。これによって、前記
対数算出部，指数算出部の入力値が前記対数，指数テー
ブルの入力値域に含まれない場合もべき乗計算できる。
従って、前記対数，指数テーブルの入力値域を制限する
ことができ、テーブルの容量を減らすことができる。

【００１２】

【発明の実施の形態】以下本発明の実施例を図１〜図９
を用いて説明する。図８に本発明に基づくディジタルべ
き乗演算装置を用いた一実施例であるグラフィックス・
システムの構成を示す。本システムはアプリケーション
ソフト等を実行するＣＰＵ(１０００)，主メモリＭＭ
（３０００）等を制御するメモリ・コントローラＭＣ
(２０００)，システムバスを制御するシステムバス・コ
ントローラ（４０００），システムバス・コントローラ
から受け取ったデータを、座標変換等を行うジオメトリ
プロセッサ（５０００）に送り、またジオメトリプロセ
ッサから帰ってきたデータに対しＦＩ変換，パック，光
源計算等の処理を施すＧＰＩＦ(００００)，ＧＰＩＦ
（００００）から送られたデータを画素情報展開するレ
ンダリングプロセッサ（６０００），レンダリングプロ
セッサ（６０００）が生成した画素情報を記憶するフレ
ームメモリ（７０００）、及びフレームメモリ（７００
０）の内容を表示するＣＲＴ（８０００）からなる。

【００１３】次に、システム全体の動作について説明す
る。ＣＰＵ（１０００）はアップリケーションを実行
し、グラフィックス・コマンドと描画する図形の頂点座
標，法線ベクトル，テクスチャ・データ，材質の各反射
係数，光源の各反射光用の色等のデータを発行し、ＭＣ
（２０００）とシステムバス・コントローラ(４０００)
を介してＧＰＩＦ（００００）に出力する。ＧＰＩＦ
（００００）はシステムバス・コントローラ（４００
０）から送られた前記コマンドとデータをＧＰＩＦ入力
手段（１００）に保持する。

【００１４】ジオメトリプロセッサ（５０００）はＧＰ
ＩＦ入力手段（１００）に保持しているコマンドとデー
タを読み、前記コマンドとデータに従い座標変換等の幾
何計算を行い、頂点座標，法線ベクトル，テクスチャ・
データ等を算出してＧＰＩＦ（００００）に送る。

【００１５】ＧＰＩＦ（００００）はジオメトリプロセ
ッサ（５０００）から送られたデータに対し、前記コマ
ンドとデータに従い必要ならばＦＩ変換，パックを施
し、頂点毎の色を計算する光源計算を行い、連続三角形
描画コマンド，頂点座標，色，テクスチャ・データをレ
ンダリングプロセッサ（６０００）に出力する。

【００１６】レンダリングプロセッサ（６０００）は前
記コマンドとデータから内挿補間により図形の内部の画
素を生成し、ＣＲＴ（８０００）に表示する内容をビッ
トマップ形式でフレームメモリ（７０００）に書き込
み、画像をＣＲＴ(８０００)に表示する。

【００１７】更に、ＧＰＩＦ（００００）の内部構成に
ついて詳細に説明する。

【００１８】ＧＰＩＦ（００００）は前記システムバス
・コントローラ（４０００）から送られたコマンドとデ
ータを保持するバッファであるＧＰＩＦ入力手段(１０
０)と、前記コマンドとデータを読み幾何計算を行うジ
オメトリプロセッサ(５０００)から送られたデータを保
持するバッファであるＬＢｕｆ（２００）と、前記コマ
ンドとデータをＬＢｕｆ（２００）からコマンド解釈手
段（６００）及びＦＩ変換手段（４００）に出力するた
めのレジスタであるＢｕｆＳＷ（３００）と、前記コマ
ンドを解釈するコマンド解釈手段（６００）と、前記コ
マンドに従い必要ならデータのＦＩ変換を行うＦＩ変換
手段（４００）と、前記コマンドに従い必要なら前記Ｆ
Ｉ変換後のデータのパック処理を行うパック手段（５０
０）と、前記ＦＩ変換，パック処理後の光源計算に必要
な光源データを保持する光源テーブル(７００)と、光源
テーブル（７００）の保持する光源データを基に光源計
算を行い色を算出する光源計算手段（０００）と、ジオ
メトリプロセッサ(５０００)，パック手段（５００）及
び光源計算手段（０００）から送られたコマンドとデー
タの順序を制御する制御手段（８００）と、前記コマン
ドとデータを保持するバッファであるＣＢｕｆ（９０
０）と、前記コマンドとデータをレンダリングプロセッ
サ（６０００）に出力するためのレジスタであるＢｕｆ
ＦＬ（９５０）から構成される。

【００１９】前記光源テーブル（７００）及び光源計算
手段（０００）の詳細を図９に示す。

【００２０】光源テーブル（７００）には光源計算に必
要なパラメータが固定小数点数で保持されている。この
パラメータは光源に非依存なものと光源に依存して値の
変化するものとがある。光源テーブル（７００）は光源
に非依存なパラメータの値をそれぞれ１個ずつ、光源に
依存して値の変化するパラメータの値をそれぞれ８個ず
つ（８光源分）保持している。もし、光源数が９個以上
ある場合は既に計算に使われた値から順に新たな光源の
値に一つずつ更新される。

【００２１】光源に非依存なパラメータに対して、この
ような書き込み制御を行うために、８個の値のうち、現
在何番目の値を計算中であるかを示すリードポインタ，
RPNTレジスタが用意されており、ＲＰＮＴ以降の値はロ
ックされ、更新が延期される。

【００２２】光源計算手段(０００)は法線ベクトルとハ
ーフウェイベクトルの内積を計算するＨＮ内積算出部
(０１０)と、該内積のＳＭ乗を計算するべき乗算出部
（００）と、法線ベクトルと光源ベクトルの内積を計算
するＬＮ内積算出部（０２０）と、べき乗算出部（０
０）とＬＮ内積算出部（０２０）の出力を用いて各頂点
毎の色を算出する色算出部（０３０）から構成される。

【００２３】ＨＮ内積算出部（０１０）は法線ベクトル
（Ｎｘ，Ｎｙ，Ｎｚ）とハーフウェイベクトル（Ｈｘ，
Ｈｙ，Ｈｚ）の内積を計算し結果１３bit をべき乗算出
部（００）に出力する。

【００２４】べき乗算出部（００）はＨＮ内積算出部
（０１０）の出力を材質の鏡面指数ＳＭ（１から１２８
までの整数）乗して結果８bit を色算出部（０３０）に
出力する。

【００２５】ＬＮ内積算出部（０２０）は法線ベクトル
（Ｎｘ，Ｎｙ，Ｎｚ）と光源ベクトル（Ｌｘ，Ｌｙ，Ｌ
ｚ）の内積を計算し結果を色算出部（０３０）に出力す
る。色算出部(０３０)はＲＧＢの３色をそれぞれ独立に
計算するため、同様のリソースを３セット有している。
例えばＲについては、環境反射光のＲ成分ＬｃａＲ，拡
散反射光のＲ成分ＬｃｄＲ，鏡面反射光のＲ成分Ｌｃｓ
Ｒ，環境反射係数のＲ成分ＫａＲ，拡散反射係数のＲ成
分ＫｄＲ，鏡面反射係数のＲ成分ＫｓＲ，放射反射光と
全体の環境反射光のＲ成分の和ＫＲ，減衰係数とスポッ
ト光源効果の積ＡｔＳｐ，べき乗算出部（００）の出
力、及びＬＮ内積算出部（０２０）の出力を入力とし、
頂点の色のＲ成分８bit を出力する。

【００２６】図１にべき乗算出部（００）の構成を示
す。説明の都合上、入力はＸ、及びＮとし、出力はＸ^N
とする。つまり、Ｘ、及びＮは上述の説明に於けるＨＮ
内積算出部（０１０）の出力、及び材質の鏡面指数ＳＭ
に対応する。Ｘは１３bit の固定小数点数で範囲は０〜
１、Ｎは８bit の固定小数点数で範囲は０〜１２８、Ｘ
^Nは８bit の固定小数点数で範囲は０〜１である。

【００２７】この回路は入力Ｘに対する対数関数の値を
１５bit の固定小数点数で算出する対数算出部（１
０），該対数算出部（１０）の出力とＮを乗算し、１０
bit の固定小数点数を出力する乗算器（２０），該乗算
器（２０）の出力に対する指数関数の値を８bit の固定
小数点数で算出する指数算出部（３０）からなる。

【００２８】ここで、対数算出部（１０）及び指数算出
部（３０）をそのままテーブルにしてしまうと、対数テ
ーブルは入力レンジが０〜１で１３bit 、出力レンジが
０〜８（厳密には８は含まない）で１５bit 、指数テー
ブルは入力レンジが０〜８（厳密には８は含まない）で
１０bit 、出力レンジが０〜１で８bit となり、メモリ
容量換算でそれぞれ、１２２,８８０bit ，８,１９２bi
t と膨大な容量になってしまう。

【００２９】しかし、対数及び指数のテーブルを縮退、
つまり入出力レンジを制限し、対数算出部（１０）及び
指数算出部（３０）を以下のように構成することによ
り、それぞれのテーブルの容量の大幅な低減（メモリ容
量換算で２４,５７６bit，768bit ）と、縮退以前と同
様の精度での計算が可能となる。

【００３０】即ち、該対数算出部（１０）は入力値を縮
退した対数テーブル（１２）の入力レンジに入るまでＫ
ビット左シフト（２^Kを乗算）し、３bit のシフト量Ｋ
と１１bit のシフト結果を出力する対数シフト部（１
１）と、該シフト結果に対する対数関数の値を１２bit
の固定小数点数として出力する縮退した対数テーブル
（１２）と、該対数テーブル（１２）の出力にＫを加算
して、１５bit の固定小数点数を出力する対数加算部
（１３）からなる。

【００３１】また、指数算出部（３０）は、入力値から
縮退した指数テーブル（３２）の入力レンジに入るまで
Ｍを減じ、３bit の減算量と７bit の減算結果を出力す
る指数減算部（３１）と、該減算結果に対する指数関数
の値を６bit の固定小数点数として出力する縮退した指
数テーブル（３２）と、該指数テーブル(３２)の出力を
Ｍビット右シフトする指数シフト部（３３）から構成さ
れる。

【００３２】図２を使って前記対数算出部（１０）が入
力Ｐｘに対して出力Ｐｙを算出する際（この操作を白貫
矢印で表している）の動作を示す。図２のグラフは底を
２^-1＝０.５とする定義域０〜１（厳密には０は含まな
い）、値域０〜８（厳密には８は含まない）の対数関数
の一部を表わしたものである。ここで、定義域とは入力
値ｘの変域を意味し、値域とはｘの変動に伴う出力値ｙ
の変域を意味する。

【００３３】領域０は定義域０.５〜１（厳密には０.５
は含まない）、値域０〜１（厳密には１は含まない）の
部分である。対数テーブル（１２）はこの範囲の対数関
数を保持している。つまり、グラフ全体の定義域が０〜
１であるのに対して、対数テーブル（１２）が保持して
いる範囲の定義域は０.５〜１と１／２に、またグラフ
全体の値域が０〜８であるのに対して、対数テーブル
（１２）が保持している範囲の値域は０〜１と１／８に
縮対している。

【００３４】領域１は定義域０.２５〜０.５（厳密には
０.２５は含まない）、値域１〜２（厳密には２は含ま
ない）の部分であり、対数関数の性質より領域１は領域
０に対しｘを２^-1倍し、ｙに１を加えたものである。一
般的に領域Ｋ（Ｋは０から７までの整数）は定義域２
^-K-1〜２^-K（厳密には２^-K-1は含まない）、値域Ｋ〜Ｋ
＋１（厳密にはＫ＋１は含まない）の部分であり、対数
関数の性質より領域Ｋは領域０に対しｘを２^-K倍し、ｙ
にＫを加えたものである。対数シフト部（１１）はＰｘ
がどの領域Ｋの定義域に含まれているかによって、Ｐｘ
を２^K倍（Ｋ左シフト）し、領域０の定義域までシフト
する。簡単のためＰｘは領域１の定義域に含まれている
ものとし、Ｐｘを２¹倍（１シフト）した結果をＱｘと
する（この操作を矢印（１）で表している）。Ｑｘは対
数テーブル（１２）の入力値域に含まれているので、対
数テーブル（１２）を参照してＱｙを得る（この操作を
矢印（２）で表している）。最後に対数加算部（１３）
はＱｙにシフト量の１を足してＰｙを算出する（この操
作を矢印（３）で表している）。

【００３５】図３を使って対数シフト部（１１）の動作
を示す。対数シフト部（１１）は領域Ｋの定義域内の入
力値が領域０の定義域に入るまで左シフトさせ、そのと
きのシフト量とシフト結果を出力する。

【００３６】例えば、領域２の定義域は２^-3〜２^-2で１
３bit の固定小数点数で表わすと0.001000000001〜0.01
0000000000であるが、この定義域にある値0.0010100111
01を領域０の定義域0.100000000001〜1.000000000000ま
で左シフトさせる場合のシフト量は、この値0.00101001
1101から0.000000000001を引いた0.001010011100の最上
位にある１が上位から２桁目に来るまで左シフトさせた
際のシフト量と一致する。この場合シフト量は２であ
る。ここで、0.000000000001を引くのは0.010000000000
のように領域内の最大値も例外なく扱うためである。こ
のような場合は0.000000000001を引かずに最上位にある
１が上位から２桁目に来るまでシフトさせると0.100000
000000となり領域０の定義域に含まれなくなる。

【００３７】また、領域０の定義域は０.５〜１（厳密
には０.５は含まない）１３bit であるが、０.５即ち１
３bit の固定小数点数０.100000000001を引いて定義域
を０〜０.５（厳密には０.５は含まない）としておくこ
とで上位２bit は必ず００となる。このことを利用し
て、前記対数テーブル（１２）の入力を１３bit から、
必ず００となる上位２bit を取り去り下位の１１bit と
することで、入力ビット数を２bit 節約できる。従っ
て、シフト結果から１３bit の固定小数点数0.10000000
0001を引いて上位２bit を取り去った１１bit の値を対
数テーブル（１２）への出力とする。

【００３８】但し、シフト量は最大でも７とする。その
理由は７bit 左シフトしても領域０の定義域に含まれな
い値は２^-8より小さく、８bit 精度のべき乗結果には現
われてこないためである。このような場合、１３bit の
固定小数点数0.100000000001を引くと０未満になるた
め、０クランプして出力値は0.000000000000とする。

【００３９】（ａ）の場合、入力値は0.001001110100で
0.000000000001を引いた値は0.001001110011である。こ
の値の最上位にある１は２bit 左シフトすれば上位から
２桁目に来るので、シフト量は２である。従って、入力
値0.001001110100を２bit 左シフトした0.100111010000
がシフト結果となる。出力値はシフト結果0.1001110100
00から0.100000000001を引いた0.000111001111である。

【００４０】（ｂ）の場合、入力値は0.000000100000で
0.000000000001を引いた値は0.000000011111である。こ
の値の最上位にある１は７ビット左シフトすれば上位か
ら２桁目に来るので、シフト量は７である。従って、入
力値0.000000100000を７ビット左シフトした1.00000000
0000がシフト結果となる。出力値はシフト結果1.000000
000000から0.100000000001を引いた0.011111111111であ
る。

【００４１】（ｃ）の場合、入力値は0.000000000101で
0.000000000001を引いた値は0.000000000100である。こ
の値の最上位にある１は７ビット左シフトしても上位か
ら２桁目に来ることはないので、シフト量は最大の７で
ある。従って、入力値0.000000000101を７ビット左シフ
トした0.001010000000がシフト結果となる。シフト結果
1.000000000000から0.100000000001を引くと０未満とな
るので０クランプして出力値は0.000000000000となる。

【００４２】上述のように動作する対数シフト部（１
１）の回路図を図４に示す。

【００４３】対数シフト部（１１）は上述のように入力
値から１３bit の固定小数点数0.000000000001を引いた
値を用いてシフト量を決定するため入力直後にこの引き
算を行う。図４の最上段には該引き算結果の上位８bit
と入力値を並べている。シフトに関する論理は大きく３
段に分かれている。まず、１段目ではＮＯＲ１が該引き
算結果の上位８bit のうち、上位５bit のＮＯＲをとり
この値の０，１に応じて該引き算結果の上位８bit 及び
入力値を４bit 左シフトするか否かを決定する。

【００４４】もしＮＯＲ１の出力が１であれば、該引き
算結果の上位５bit が全て０であり、４bit 左シフトす
る余地があることを意味しているため、該引き算結果の
上位８bit 及び入力値を４bit 左シフトする。また、シ
フト量の最上位を１とする。これは４bit 左シフトした
ことを示す。

【００４５】もし、ＮＯＲ１の出力が０であれば該引き
算結果の上位５bit の中に１が含まれていて、４bit 左
シフトはできないことを意味しているため、該引き算結
果の上位８bit 及び入力値は左シフトしない。また、シ
フト量の最上位を０とする。これは４bit は左シフトで
きなかったことを示す。

【００４６】次に、２段目ではＮＯＲ２が該引き算結果
の１段目におけるシフト結果の上位３bit のＮＯＲをと
り、この値の０，１に応じて該引き算結果及び入力値の
１段目におけるシフト結果を更に２bit 左シフトするか
否かを決定する。

【００４７】もしＮＯＲ２の出力が１であれば、該引き
算結果の１段目におけるシフト結果の上位３bit が全て
０であり、２bit 左シフトする余地があることを意味し
ているため、該引き算結果及び入力値の１段目における
シフト結果を２bit 左シフトする。また、シフト量の第
２桁目を１とする。これは２bit 左シフトしたことを示
す。

【００４８】もしＮＯＲ２の出力が０であれば、該引き
算結果の１段目におけるシフト結果の上位３bit の中に
１が含まれていて、２bit 左シフトはできないことを意
味しているため、該引き算結果及び入力値の１段目にお
けるシフト結果は左シフトしない。また、シフト量の第
２桁目を０とする。これは２bit 左シフトできなかった
ことを示す。

【００４９】次に、３段目ではＮＯＲ３が該引き算結果
の２段目におけるシフト結果の上位２bit のＮＯＲをと
り、この値の０，１に応じて該引き算結果及び入力値の
２段目におけるシフト結果を更に１bit 左シフトするか
否かを決定する。

【００５０】もしＮＯＲ３の出力が１であれば、該引き
算結果の２段目におけるシフト結果の上位２bit が全て
０であり、１bit 左シフトする余地があることを意味し
ているため、該引き算結果及び入力値の２段目における
シフト結果を１bit 左シフトする。また、シフト量の最
下位を１とする。これは１bit 左シフトしたことを示
す。

【００５１】もしＮＯＲ３の出力が０であれば、該引き
算結果の２段目におけるシフト結果の上位２bit の中に
１が含まれていて、１bit 左シフトはできないことを意
味しているため、該引き算結果及び入力値の２段目にお
けるシフト結果は左シフトしない。また、シフト量の最
下位を０とする。これは１bit 左シフトできなかったこ
とを示す。

【００５２】この段階でシフト量３bit は決定される
が、対数テーブルへの出力値は入力値の３段目における
シフト結果から１３bit の固定小数点数0.100000000001
を引き算し更に０クランプした値となる。

【００５３】次に対数テーブル（１２）について説明す
る。対数テーブル（１２）の入力は上述のように入力値
域０〜０.５（厳密には０.５は含まない）の１１bit の
固定小数点数である。また、対数テーブル（１２）の出
力は入力値に１３bit の固定小数点数0.100000000001を
足した値に於ける対数関数の値を１２bit の固定小数点
数で表わしたものであり、出力値域は０〜１（厳密には
１は含まない）である。

【００５４】対数テーブル（１２）はＲＡＭやＲＯＭで
作り、入力値をアドレスに変換して参照するように構成
することもできるが、ここでは、出力論理値を入力論理
値の論理式で表現して論理式に対応する回路で対数テー
ブル（１２）を構成する。

【００５５】対数テーブル（１２）の入力の各bit をａ
０，ａ１，…，ａ１０とし、対数テーブル（１２）の出
力の各bit をｂ０，ｂ１，…，ｂ１１とすると、各ｂ
０，ｂ１，…，ｂ１１はａ０，ａ１，…，ａ１０の積和
の論理式で表わすことができる。更に、この積和の各項
を主項とする方法として、クイーンの方法や、コンセン
サス法が著名である。クイーンの方法や、コンセンサス
法については丸善株式会社が昭和５７年６月３０日に発
行した後藤宗弘著、電気・電子学生のための計算機
工学ｐ４０〜４５に示されている。

【００５６】このような方法で生成された論理式に対応
する回路で対数テーブル（１２）を構成することができ
る。

【００５７】実際に論理合成してみた結果、０.３５μ
ｍのＣＭＯＳで約４ｋゲートを要した。

【００５８】最後に対数加算部（１３）について説明す
る。対数加算部（１３）の入力は対数シフト部（１１）
で算出したシフト量と対数テーブル（１２）の出力であ
る。対数加算部（１３）は対数テーブル（１２）の出力
値に該シフト量を加算して出力する。

【００５９】テーブルの出力値域は０〜１（厳密には１
は含まない）であり、シフト量は整数であるから、対数
加算部（１３）の出力はテーブルの出力値１２bit の上
位にシフト量の３bit を付け足した１５bitの固定小数
点数である。

【００６０】次に前記乗算器（２０）について説明す
る。該乗算器（２０）の入力は前記対数算出部（１０）
の出力と、Ｎである。

【００６１】該乗算器（２０）は前記対数算出部（１
０）の出力１５bitとＮ８bitを乗算して出力値域は０〜
８（厳密には８は含まない）の１０bit の固定小数点数
として出力する。

【００６２】但し、乗算の結果が８以上になった場合は
最大出力値にクランプする。その理由は、２^-1の８以上
のべきは２^-8より小さく、８bit 精度のべき乗結果には
現われてこないためである。

【００６３】図５を使って前記指数算出部（３０）が入
力Ｐｘに対して出力Ｐｙを算出する際（この操作を白貫
矢印で表している）の動作を示す。図５のグラフは底を
２^-1＝０.５とする定義域０〜８（厳密には８は含まな
い）、値域０〜１（厳密には０は含まない）の指数関数
の一部を表わしたものである。領域０は定義域０〜１
（厳密には１は含まない）、値域０.５〜１（厳密には
０.５は含まない）の部分であり、指数テーブル（３
２）はこの範囲の指数関数を保持している。つまり、グ
ラフ全体の定義域が０〜８であるのに対して、指数テー
ブル（３２）が保持している範囲の定義域は０〜１と１
／８に、またグラフ全体の値域が０〜１であるのに対し
て、指数テーブル（３２）が保持している範囲の値域は
０.５〜１と１／２に縮退している。

【００６４】領域１は定義域１〜２（厳密には２は含ま
ない）、値域０.２５〜０.５（厳密には０.２５は含ま
ない）の部分であり、指数関数の性質より領域１は領域
０に対しｘに１を加え、ｙを２^-1倍したものである。

【００６５】一般的に領域Ｍ（Ｍは０から７までの整
数）は定義域Ｍ〜Ｍ＋１（厳密にはＭ＋１は含まな
い）、値域２^-M-1〜２^-M（厳密には２^-M-1は含まない）
の部分であり、指数関数の性質より領域Ｍは領域０に対
しｘにＭを加え、ｙを２^-M倍したものである。

【００６６】指数減算部（３１）はＰｘがどの領域Ｍの
定義域に含まれているかによって、ＰｘからＭを減算
し、領域０の定義域までスライドする。簡単のためＰｘ
は領域１の定義域に含まれているものとし、Ｐｘから１
減算した結果をＱｘとする（この操作を矢印（１）で表
している）。Ｑｘは指数テーブル（３２）の入力値域に
含まれているので、指数テーブル（３２）を参照してＱ
ｙを得る（この操作を矢印（２）で表している）。最後
に指数シフト部（３３）はＱｙに減算量の１だけ右シフ
ト（２^-1を乗算）してＰｙを算出する（この操作を矢印
（３）で表している）。

【００６７】指数減算部の説明をする。指数減算部（３
１）の入力は入力値域０〜８（厳密には８は含まない）
の１０bit の固定小数点数である。上述のように、指数
減算部（３１）はその入力値がどの領域Ｍの定義域に含
まれているかによって、ＰｘからＭを減算し、領域０の
定義域までスライドするが、Ｍは入力値の上位３bitで
あり、入力値からＭを引いた値は入力値の下位７bit で
ある。

【００６８】次に指数テーブル（３２）について説明す
る。指数テーブル（３２）の入力は指数減算部（３１）
の出力であり、入力値域０〜１（厳密には１は含まな
い）の７bit の固定小数点数である。また、領域０の値
域は０.５〜１（厳密には０.５は含まない）であるが、
ｙ方向に−０.５平行移動して値域０〜０.５（厳密には
０.５は含まない）とすることで、指数テーブル（３
２）の出力の上位２bit が００となり、出力bit 数を２
bit 減らすことが出来る。

【００６９】従って、指数テーブル（３２）の出力は入
力値に於ける指数関数の値を８bitの固定小数点数で表
わしたものから０.５即ち８bitの固定小数点数0.100000
1 を引いた６bitの固定小数点数とし、このとき出力レ
ンジは０〜０.５（厳密には０.５は含まない）である。

【００７０】指数テーブル（３２）も前記対数テーブル
（１２）と同様、ＲＡＭやＲＯＭで作り、入力値をアド
レスに変換して参照するように構成することもできる
が、ここでは、出力論理値を入力論理値の論理式で表現
して論理式に対応する回路で指数テーブル（３２）を構
成する。実際に論理合成してみた結果、０.３５μｍの
ＣＭＯＳで約１ｋゲートを要した。

【００７１】最後に図６を使って指数シフト部（３３）
の動作を説明する。指数シフト部（３３）の入力は減算
部の出力である減算数と指数テーブル（３２）の出力で
ある。上述したように、指数テーブル（３２）の出力は
入力値に於ける指数関数の値を８bit の固定小数点数で
表わしたものから０.５即ち８bit の固定小数点数0.10
00001を引いた６bitの固定小数点数であるから、指数シ
フト部（３３）は逆に指数テーブル（３２）の出力に
０.５即ち８bitの固定小数点数0.1000001 を足して、値
域を０.５〜１（厳密には０.５は含まない）に戻す必要
がある。次にその値を減算量だけ右シフトして出力す
る。

【００７２】（ａ）の場合、指数テーブル（３２）の出
力0.01011 に８bit の固定小数点数0.1000001を足し
て、減算量２だけ右シフトすると、出力値0.0010011を
得る。但し、右シフトで上位bit が空いたところには０
が入る。

【００７３】（ｂ）の場合、指数テーブル（３２）の出
力1.01101 に８bit の固定小数点数0.1000001を足し
て、減算量５だけ右シフトすると、出力値0.0000011を
得る。

【００７４】上述のように動作する指数シフト部（３
３）の回路図を図７に示す。指数シフト部の入力は指数
減算部からの出力である減算量３bit と指数テーブル
（３２）からの出力６bit である。指数テーブル（３
２）からの出力に対しては入力直後に８bitの固定小数
点数0.1000001を足し算しておく。該足し算結果は８bit
の固定小数点数である。

【００７５】シフトに関する論理は大きく３段に分かれ
る。まず、１段目では減算数の最下位が１のとき、該足
し算結果を１bit 右シフトし、減算数の最下位が０のと
き、該足し算結果を右シフトしない。

【００７６】次に、２段目では減算数の２桁目が１のと
き、該足し算結果の１段目におけるシフト結果を２bit
右シフトし、減算数の２桁目が０のとき、該足し算結果
の１段目におけるシフト結果を右シフトしない。

【００７７】最後に、３段目では減算数の最上位が１の
とき、該足し算結果の２段目におけるシフト結果を４bi
t 右シフトし、減算数の最上位が０のとき、該足し算結
果の２段目におけるシフト結果を右シフトしない。

【００７８】本実施例ではべき乗計算部全てを０.３５
μｍのＣＭＯＳに実装した場合、約７.５ｋゲートを
要し、約３５nsecで演算が完了する。これによって、光
源計算をＧＰＩＦ（００００）チップの中に埋め込むこ
とが可能となり、ボトルネックになっているジオメトリ
プロセッサ（５０００）の処理を軽減することができた
結果、システムとして約２倍性能を向上することができ
た。

【００７９】

【発明の効果】以上、詳細に説明したように、本発明の
ディジタルべき乗演算装置はテーブル参照によって演算
を行うため、ループ計算より高速に演算結果を得ること
ができる。

【００８０】また、対数テーブルと指数テーブルとの２
つにテーブルを分割することで、各テーブルの入力を１
つにできて、テーブルの容量を減らすことができる。

【００８１】また、前記対数算出部の入力値が前記対数
テーブルの入力値域に含まれない場合に該入力値に適当
な整数Ｌに対し２^Lを乗算し、該乗算結果を前記対数テ
ーブルの入力とし対数テーブル参照後、該参照値にＬを
加算することで更に対数テーブルの容量を減らすことが
でき、前記指数算出部の入力値が前記指数テーブルの入
力値域に含まれない場合に該入力値から適当な整数Ｍを
減算し、該減算結果を前記指数テーブルの入力とし指数
テーブル参照後、該参照値に２^-Mを乗算することで指数
テーブルの容量を減らすことができる。

【図面の簡単な説明】

【図１】ディジタルべき乗演算装置の回路構成を示す
図。

【図２】対数算出部の動作を示す図。

【図３】対数シフト部の動作を示す図。

【図４】対数シフト部の回路構成を示す図。

【図５】指数算出部の動作を示す図。

【図６】指数シフト部の動作を示す図。

【図７】指数シフト部の回路構成を示す図。

【図８】グラフィックス・システムの構成を示す図。

【図９】光源テーブル及び光源計算手段の構成を示す
図。

【符号の説明】

００…べき乗算出部、１０…対数算出部、１１…対数シ
フト部、１２…対数テーブル、１３…対数加算部、２０
…乗算器、３０…指数算出部、３１…指数減算部、３２
…指数テーブル、３３…指数シフト部、０００…光源計
算手段、０１０…ＨＮ内積算出部、０２０…ＬＮ内積算
出部、０３０…色算出部、１００…GPIF入力手段、２０
０…ＬＢｕｆ、３００…ＢｕｆＳＷ、４００…ＦＩ変換
手段、５００…パック手段、６００…コマンド解釈手
段、７００…光源テーブル、800…制御手段、９００…
ＣＢｕｆ、９５０…ＢｕｆＦＬ、００００…ＧＰＩＦ、
１０００…ＣＰＵ、２０００…ＭＣ、３０００…ＭＭ、
４０００…システムバス・コントローラ、５０００…ジ
オメトリプロセッサ、６０００…レンダリングプロセッ
サ、７０００…フレームメモリ、８０００…ＣＲＴ。

───────────────────────────────────────────────────── フロントページの続き (72)発明者高見和久茨城県日立市大みか町七丁目１番１号株式会社日立製作所日立研究所内 (72)発明者鬼木一徳茨城県日立市大みか町五丁目２番１号株式会社日立製作所大みか工場内

Claims

【特許請求の範囲】

【請求項１】入力値Ｘに対してＸの対数値を出力する対
数算出部と、該対数算出部の出力とべき乗する値Ｎを乗算する乗算器
と、該乗算器の出力に対して指数値を出力する指数算出部と
からなり、Ｘ^Nを算出するディジタルべき乗演算装置で
あって、前記対数算出部は対数テーブルを用いて対数を算出し、前記指数算出部は指数テーブルを用いて指数を算出し、前記対数算出部により算出される対数の底と、前記指数
算出部により算出される指数の底は同一の値であること
を特徴とするディジタルべき乗演算装置。
【請求項２】請求項１において、前記対数関数の底及び前記指数関数の底は２^K（Ｋは０
以外の整数）であり、前記対数算出部は、入力値域が正規化された前記対数テーブルと、前記対数算出部への入力値が前記対数テーブルの入力値
域に入るよう、当該入力値に２^L（Ｌは整数）を乗算し
て、前記対数テーブルに出力する対数シフト部と、前記対数テーブルの出力にＬを加算して前記対数算出部
の出力とする対数加算部を有することを特徴とするディ
ジタルべき上演算装置。
【請求項３】請求項２において、前記対数シフト部は、
前記入力値をＬビット左へシフトすることを特徴とする
ディジタルべき乗演算装置。
【請求項４】請求項１において、前記対数関数の底及び前記指数関数の底は２^K（Ｋは０
以外の整数）であり、前記指数算出部は、入力値域が正規化された前記指数テーブルと、前記乗算器からの出力値が前記指数テーブルの入力値域
に入るよう、当該入力値からＭ（Ｍは整数）を減算し、
前記指数テーブルに出力する指数減算部と、前記指数テーブルの出力値に２^-Mを乗算して前記指数算
出部の出力とする指数シフト部を有することを特徴とす
るディジタルべき乗演算装置。
【請求項５】請求項４において、前記指数シフト部は、
前記指数テーブルの出力値をＭビット右へシフトするこ
とを特徴とするディジタルべき乗演算装置。
【請求項６】光源計算を行う光源計算部と、光源計算結
果に基づいて表示すべき図形データを画素情報に展開す
るレンダリングプロセッサと、メモリと、メモリに記憶
された画素情報を表示する表示装置を有するグラフィッ
クスシステムにおいて、前記光源計算部は、少なくとも、入力値Ｘに対する対数
値を対数テーブルを用いて出力する対数算出部と、前記
対数算出部の出力とべき乗する値Ｎを乗算する乗算器
と、前記乗算器の出力に対する指数値を指数テーブルを
用いて出力する指数算出部を備えたことを特徴とするグ
ラフィックスシステム。
【請求項７】請求項６において、前記対数算出部により
算出される対数の底と、前記指数算出部により算出され
る指数の底は同一の値であることを特徴とするグラフィ
ックスシステム。
【請求項８】請求項６において、前記対数関数の底及び前記指数関数の底は２^K（Ｋは０
以外の整数）であり、前記対数算出部は、入力値域が正規化された前記対数テーブルと、前記対数算出部への入力値が前記対数テーブルの入力値
域に入るよう、当該入力値に２^L（Ｌは整数）を乗算し
て、前記対数テーブルに出力する対数シフト部と、前記対数テーブルの出力にＬを加算して前記対数算出部
の出力とする対数加算部を有することを特徴とするグラ
フィックスシステム。
【請求項９】請求項６において、前記対数関数の底及び前記指数関数の底は２^K（Ｋは０
以外の整数）であり、前記指数算出部は、入力値域が正規化された前記指数テーブルと、前記乗算器からの出力値が前記指数テーブルの入力値域
に入るよう、当該入力値からＭ（Ｍは整数）を減算し、
前記指数テーブルに出力する指数減算部と、前記指数テーブルの出力値に２^-Mを乗算して前記指数算
出部の出力とする指数シフト部を有することを特徴とす
るグラフィックスシステム。