JPH1049370A

JPH1049370A - 遅延命令を有するマイクロプロセッサ

Info

Publication number: JPH1049370A
Application number: JP8203675A
Authority: JP
Inventors: Horuman Edogaa; エドガー・ホルマン; Toyohiko Yoshida; 豊彦吉田
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1996-08-01
Filing date: 1996-08-01
Publication date: 1998-02-20
Anticipated expiration: 2016-08-01
Also published as: US5815698A; US20010013095A1; US6851045B2; JP3745039B2

Abstract

(57)【要約】【課題】遅延命令は分岐命令に限られているので、効
果的な命令のスケジューリングができないという課題が
あった。【解決手段】ＡＬＵ３６１、乗算器３６３、ＰＣ制御
部３６５、メモリ制御部３６７およびシフタ３６９は、
遅延命令のデコード結果をレジスタ３６２Ａ，３６４
Ａ，３６６Ａ，３６８Ａ，３７０Ａに格納するととも
に、遅延命令で指定された遅延量に応じたプログラムカ
ウンタ値をレジスタ３６２Ｂ，３６４Ｂ，３６６Ｂ，３
６８Ｂ，３７０Ｂに格納するものである。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、実行時期を遅ら
せて実行される遅延命令を有するマイクロプロセッサに
関するものである。

【０００２】

【従来の技術】図２０は従来のパイプライン制御方式に
よるマイクロプロセッサの処理シーケンスを示すシーケ
ンス図である。図において、３００は分岐命令、３０１
はパイプラインにおける命令フェッチステージ、３０２
はパイプラインにおけるデコードステージ、３０３はパ
イプラインにおける命令実行ステージ、３０４はパイプ
ラインにおけるライトバックステージ、３０５は第１の
遅延スロットにおける命令、３０６は第２の遅延スロッ
トにおける命令、３０７は分岐先で実行される命令を示
す。なお、以下、単に「分岐命令」と表現された場合に
は、それは、プログラムカウンタ（ＰＣ）値にオペラン
ドで示されるオフセット値が加算された値であるアドレ
スに分岐する命令と、オペランドで示されるアドレスに
間接的にまたは直接に分岐する命令とを含む。分岐命令
とジャンプ命令とが、併記された場合には、それらは、
それぞれ、プログラムカウンタ値にオペランドで示され
るオフセット値が加算された値であるアドレスに分岐す
る分岐命令、オペランドで示されるアドレスに間接的に
または直接に分岐するジャンプ命令を意味する。また、
以下、分岐命令およびジャンプ命令は、サブルーチンコ
ール命令を含むものとして説明を進める。

【０００３】次に動作について説明する。分岐命令が実
行されると、図２０に示されたパイプライン制御を行う
マイクロプロセッサは、分岐先アドレスを３番目のステ
ージである命令実行ステージ３０３で得ることができ
る。その時点では、第１の遅延スロットにおける命令３
０５および第２の遅延スロットにおける命令３０６は、
既にデコードステージ３０２または命令フェッチステー
ジ３０１にある。マイクロプロセッサは、それらの命令
を無効なものとして扱わなくてはならず、パイプライン
の無駄が生ずる。

【０００４】パイプラインの無駄を防止するために、
「コンピュータアーキテクチャ：量的アプローチ（Ｃｏ
ｍｐｕｔｅｒＡｒｃｈｉｔｅｃｔｕｒｅ：ＡＱｕａ
ｎｔｉｔａｔｉｖｅＡｐｐｒｏａｃｈ），Ｍｏｒｇａ
ｎＫａｕｆｍａｎｎ社，１９９０年」等の文献で種々
の手法が提案されている。例えば、命令のスケジューリ
ング、または命令のスケジューリングと遅延分岐命令
（ディレイド分岐命令）との組み合わせによって、パイ
プラインの無駄を低減することができる。

【０００５】例えば、特開平６−１３１１８０号公報や
特開平６−２７４３５２号公報に、ディレイド分岐命令
に関する技術が記載されている。一般にディレイド分岐
命令における遅延量はマイクロプロセッサのアーキテク
チャに応じた固定的な値であるが、特開平６−１３１１
８０号公報には任意の遅延スロット数を指定できる命令
が開示されている。指定された遅延スロット数はデクリ
メントカウンタに設定される。デクリメントカウンタの
値は動作クロック信号の入力に従って減り、値が「１」
になると分岐先命令のフェッチが開始される。

【０００６】図２１は２演算を同時に行うマイクロプロ
セッサにおける命令デコーダおよび命令実行部の部分の
一般的な構成を示すブロック図である。図において、３
４１は算術論理演算を実行するＡＬＵ、３４２は乗算を
実行する乗算器、３４３はＰＣ値を計算するＰＣ制御
部、３４４はアドレス計算を行うメモリ制御部、３４５
はシフト演算を実行するシフタ、３４６は１サイクルで
２命令を転送できるバス、３４７は命令をデコードして
命令実行部に制御信号１１，１２を与えるデコーダ、３
４８は汎用レジスタである。

【０００７】図２２はプログラムの一例を示す説明図で
ある。図において、ＡＤＤ，ＳＲＡ，ＳＵＢ，ＭＵＬお
よびＪＭＰは、それぞれ、加算命令、シフト命令、減算
命令、乗算命令およびジャンプ命令を示す。加算命令、
シフト命令、減算命令、乗算命令およびジャンプ命令
は、ぞれぞれ、命令実行部におけるＡＬＵ３４１、シフ
タ３４５、ＡＬＵ３４１、乗算器３４２およびＰＣ制御
部３４３において扱われる。また、例えば、（ｒ３，ｒ
０，６）は、汎用レジスタ３４８中のｒ０レジスタの値
と即値「６」とを対象とした演算結果を汎用レジスタ３
４８中のｒ３レジスタに設定することを示す。

【０００８】図２０に示されたマイクロプロセッサは２
演算命令を扱えるので、命令実行部におけるリソースが
競合しない限り、図２２に示されたプログラムを２演算
命令による各命令に変換したものを扱える。例えば、図
２３に示されるように変換された各命令を実行できる。
図２３において、各行は２演算命令の１命令に対応す
る。すなわち、各行は同時実行される２演算を示す。Ｓ
ＲＡとＳＵＢとは、リソースの競合はないがレジスタ依
存の関係にあるので、同時に実行することはできない。
よって、２行目にＮＯＰが置かれている。このような命
令のスケジューリングは、プログラマまたはコンパイラ
によってなされる。

【０００９】

【発明が解決しようとする課題】従来の遅延命令を有す
るマイクロプロセッサは以上のように構成されているの
で、以下のような課題があった。（１）遅延量が固定的にしか指定できないディレイド分
岐命令を有するマイクロプロセッサでは、効果的な命令
のスケジューリングができない。例えば、図２３におけ
る５行目のＪＭＰを削除して２行目のＮＯＰの位置に遅
延量「２」のディレイドジャンプ命令を置くことは効果
的である。そのようにすれば、図２３の４行目の命令の
フェッチ後に直ちにジャンプ先アドレスＴＧＴの命令の
フェッチが開始され、パイプラインの無駄が生じないか
らである。遅延量「２」しか指定できないマイクロプロ
セッサでは、そのようなディレイド分岐命令を置いた命
令群を実行できる。しかし、例えば遅延量「３」しか指
定できないマイクロプロセッサを使用する場合には、プ
ログラマまたはコンパイラは、そのようなスケジューリ
ングを行うことはできない。（２）指定された遅延量に応じた値をデクリメントカウ
ンタに設定するマイクロプロセッサでは、命令遅延中に
割り込みや新たな分岐が生じた場合に矛盾なく処理を進
めるための構成が複雑になる。例えば、デクリメントカ
ウンタの値は動作クロックに従ってカウントダウンされ
るので、何等の考慮も払わないと、設定された遅延量と
実際の遅延量との間で、割り込み処理等で費やされた動
作クロック数分の狂いが生ずる。（３）ディレイド命令は分岐命令に限られているので、
効果的な命令のスケジューリングができない。

【００１０】この発明は上記のような課題を解決するた
めになされたもので、処理の矛盾を生じさせることなく
任意の遅延量を指定できるディレイド命令を扱えて効果
的な命令のスケジューリングができる環境をプログラマ
に提供でき、その結果、プログラムをより高速に実行し
うるマイクロプロセッサを得ることを目的とする。

【００１１】

【課題を解決するための手段】請求項１記載の発明に係
る遅延命令を有するマイクロプロセッサは、ＰＣ値を制
御するＰＣ制御部が、ディレイド分岐命令の分岐先アド
レスを示す値およびディレイド分岐命令で指定された遅
延量に応じたプログラムカウンタ値を保持する遅延分岐
命令保持手段を有するものである。

【００１２】請求項２記載の発明に係る遅延命令を有す
るマイクロプロセッサは、各演算ユニットが、ディレイ
ド演算命令の内容およびディレイド演算命令の固定のま
たは可変の遅延量に応じた値を保持する遅延命令保持手
段を有するものである。ここで、ディレイド演算命令の
内容とは、ディレイド演算命令のデコード結果であっ
て、いかなる演算を行うかを示す情報である。なお、特
に断らない限り、ディレイド分岐命令は、ディレイド演
算命令に含まれないものとする。

【００１３】請求項３記載の発明に係る遅延命令を有す
るマイクロプロセッサは、任意の遅延量を指定できるデ
ィレイド演算命令で指定された遅延量に応じた値を保持
する遅延命令保持手段を有するものである。

【００１４】請求項４記載の発明に係る遅延命令を有す
るマイクロプロセッサは、各演算ユニットが、ディレイ
ド演算命令で指定された遅延量に応じたＰＣ値を保持す
る遅延命令保持手段を有するものである。

【００１５】請求項５記載の発明に係る遅延命令を有す
るマイクロプロセッサは、各演算ユニットに、複数の遅
延命令保持手段が設けられているものである。

【００１６】請求項６記載の発明に係る遅延命令を有す
るマイクロプロセッサは、上記の各構成を有するととも
に、命令実行部が複数演算を同時に実行するものであ
る。

【００１７】

【発明の実施の形態】以下、この発明の実施の一形態を
説明する。実施の形態１．図１はこの発明の実施の形態１によるマ
イクロプロセッサの構成を示すブロック図である。この
マイクロプロセッサは、３２ビットの内部データバスを
有する３２ビットマイクロプロセッサである。図におい
て、２は命令ＲＡＭ６から６４ビット幅のＩＤバスを介
して入力した命令コードをデコードする処理を行う命令
デコードユニット（命令デコーダ）、３はアドレス計算
を行うメモリユニット（命令実行部）、４は論理演算や
シフト演算を行う整数演算ユニット（命令実行部）、５
は３２ビット×６４ワードの汎用レジスタ、７はデータ
が格納されるデータＲＡＭである。

【００１８】命令デコードユニット２において、８，９
はそれぞれ命令コードをデコードするデコーダ、１０は
プロセッサの状態を示すプロセッサ状態語（Processor
Status Word 、以下、プロセッサ状態語をＰＳＷと呼
ぶ）である。命令デコードユニット２は、さらに、デコ
ーダ８のデコード結果とＰＳＷ１０の内容にもとづいて
制御信号１１を作成し、それをメモリユニット３に与え
る。また、命令デコードユニット２は、デコーダ９のデ
コード結果とＰＳＷ１０の内容にもとづいて制御信号１
２を作成し、それを整数演算ユニット４に与える。

【００１９】メモリユニット３において、１３はジャン
プや分岐を含まない命令を実行するとＰＣ値に８を加え
て次に実行する命令に対するＰＣ値を算出するととも
に、ジャンプや分岐を含む命令の実行時に分岐変位をＰ
Ｃ値に加算したり、演算で指定されたアドレッシングモ
ードに応じた計算を行ってジャンプ先の命令に対するＰ
Ｃ値を計算するＰＣ制御部である。また、ＰＣ制御部１
３は、計算したＰＣ値を３２ビット幅のＩＡバスを介し
て命令ＲＡＭ６に送り、命令ＲＡＭ６から命令コードを
出力させる。１４はオペランドとなるデータのアクセス
を制御するメモリ制御部である。メモリ制御部１４は、
３２ビット幅のＤＡバスを介してアドレスデータをデー
タＲＡＭ７に転送し命令実行に必要なデータを６４ビッ
ト幅のＤＤバスを介してアクセスする。１５は汎用レジ
スタ５から３２ビット幅のＳ１バス、Ｓ２バス、Ｓ３バ
スを介して転送された最大３ワードのデータを用いて算
術論理演算を行い演算結果を３２ビット幅のＤ１バスを
介して汎用レジスタ５に転送するＡＬＵ、１６は汎用レ
ジスタ５からＳ１バス、Ｓ２バス、Ｓ３バスを介して転
送されたデータを用いてシフト演算を行い演算結果をＤ
１バスを介して汎用レジスタ５に転送するシフタであ
る。

【００２０】メモリユニット３に対して、Ｓ１バス、Ｓ
２バス、Ｓ３バス、Ｓ４バスを介して、３２ビット長の
データを一時に４ワード転送することが可能である。従
って、例えば、第１のレジスタの内容と第２のレジスタ
の内容との和でアドレッシングされるメモリの領域に第
３のレジスタの内容をストアするとともに、第３のレジ
スタの内容をストアしたアドレスに所定値を加算して得
られる値でアドレッシングされるメモリの領域に第４の
レジスタの内容をストアする２ワードストア命令を実現
することができる。また、メモリユニット３は、Ｄ１バ
スおよびＤ２バスを介して、メモリユニット３内での２
ワードの演算結果またはデータＲＡＭ７から転送された
２ワードのデータを汎用レジスタ５に転送することがで
きる。

【００２１】整数演算ユニット４において、１７は汎用
レジスタ５から３２ビット幅のＳ４バス、Ｓ５バス、Ｓ
６バスを介して転送された最大３ワードのデータを用い
て乗算を行い演算結果を３２ビット幅のＤ２バス、Ｄ３
バスを介して汎用レジスタ５に転送する乗算器、１８は
乗算の結果を累積加算または累積減算して保持するアキ
ュムレータである。アキュムレータとして、６４ビット
のものが２本ある。１９は汎用レジスタ５からＳ４バ
ス、Ｓ５バス、Ｓ６バスを介して転送された最大３ワー
ドのデータを用いて算術論理演算を行い演算結果をＤ２
バス、Ｄ３バスを介して汎用レジスタ５に転送するＡＬ
Ｕ、２０は汎用レジスタ５からＳ４バス、Ｓ５バス、Ｓ
６バスを介して転送されたデータを用いてシフト演算を
行い演算結果をＤ２バス、Ｄ３バスを介して汎用レジス
タ５に転送するシフタである。

【００２２】このマイクロプロセッサでは、汎用レジス
タ５から、最大６種類のレジスタ値を読み出すことが可
能であって、読み出されたデータは、それぞれ、Ｓ１バ
ス、Ｓ２バス、Ｓ３バス、Ｓ４バス、Ｓ５バス、Ｓ６バ
スに出力される。また、汎用レジスタ５には、Ｄ１バ
ス、Ｄ２バス、Ｄ３バスを介して最大３種類のレジスタ
値を同時に書き込むことが可能である。

【００２３】図２はこのマイクロプロセッサの命令フォ
ーマットを示す説明図である。命令フォーマットとし
て、図２（ａ）に示すような１つの命令コードで２つの
演算（operation ）を指示する２演算命令のフォーマッ
ト１０１と、図２（ｂ）に示すような１つの命令コード
で１つの演算を指示する１演算命令のフォーマット１０
２とがある。２演算命令のフォーマット１０１には、フ
ィールド１０３およびフィールド１０４からなるフォー
マットフィールドと、２つの演算フィールド１０６，１
０７と、各演算フィールド１０６，１０７に付属する各
実行条件フィールド１０５とがある。１演算命令のフォ
ーマット１０２には、フィールド１０３およびフィール
ド１０４からなるフォーマットフィールドと、演算フィ
ールドと、演算フィールドに付属する実行条件フィール
ド１０５とがある。演算フィールドは、フィールド１０
８，１０９，１１０からなる。

【００２４】フォーマットフィールドは、以下のような
意味を示す。コード：フォーマット実行の順番 operation_０ operation_１ＦＭ＝００：２命令第１第１０１：２命令第１第２１０：２命令第２第１１１：１命令第１ …… ここで、ＦＭは、フィールド１０３およびフィールド１
０４からなる２ビットの値である。

【００２５】ＦＭ＝００の場合、この命令は２演算命令
であることを示す。そして、演算フィールド１０６で指
示されたoperation_０の演算と演算フィールド１０７で
指示されたoperation_１の演算とが、デコード直後のク
ロックサイクルで並列に実行される。operation_０の演
算はメモリユニット３で実行され、operation_１の演算
は整数演算ユニット４で実行される。ＦＭ＝０１の場
合、この命令は２演算命令であることを示す。そして、
operation_０の演算が、デコード直後のクロックサイク
ルで実行され、operation_１の演算が、operation_０の
演算に対して、１クロックサイクル遅れて実行される。
ＦＭ＝１０の場合、この命令は２演算命令であることを
示す。そして、operation_１の演算が、デコード直後の
クロックサイクルで実行され、operation_０の演算が、
operation_１の演算に対して、１クロックサイクル遅れ
て実行される。ＦＭ＝１１の場合、この命令は１演算命
令であることを示す。そして、フィールド１０８，１０
９，１１０からなる演算フィールドで指示された１つの
演算がデコード直後のクロックサイクルで実行される。

【００２６】実行条件フィールド１０５は、以下のよう
な意味を持つ。

【００２７】実行条件フィールド１０５は、マイクロプ
ロセッサの実行コントロールフラグＦ０，Ｆ１の値に応
じて、演算フィールド１０６，１０７のoperation_０の
演算やoperation_１の演算、およびフィールド１０８，
１０９，１１０からなる演算フィールドの演算が有効で
あるか無効であるか定める。実行コントロールフラグＦ
０，Ｆ１については後で説明する。演算が有効であると
は、演算結果がレジスタ、メモリおよびフラグに反映さ
れ、その演算による動作の結果が残ることを意味する。
演算が無効であるとは、演算結果がレジスタ、メモリお
よびフラグに反映されず、あたかも無効演算（ＮＯＰ）
が実行されたかのような動作の結果が残ることを意味す
る。

【００２８】実行条件フィールド１０５の値ＣＣ＝００
０のときには、実行コントロールフラグＦ０，Ｆ１の値
にかかわらず常に演算は有効である。ＣＣ＝００１のと
きには、実行コントロールフラグＦ０＝真のときにのみ
演算は有効である。実行コントロールフラグＦ１の状態
はいずれでもよい。ＣＣ＝０１０のときには、実行コン
トロールフラグＦ０＝偽のときにのみ演算は有効であ
る。実行コントロールフラグＦ１の状態はいずれでもよ
い。ＣＣ＝０１１のときには、実行コントロールフラグ
Ｆ１＝真のときにのみ演算は有効である。実行コントロ
ールフラグＦ０の状態はいずれでもよい。ＣＣ＝１００
のときには、実行コントロールフラグＦ１＝偽のときに
のみ演算は有効である。実行コントロールフラグＦ０の
状態はいずれでもよい。ＣＣ＝１０１のときには、実行
コントロールフラグＦ０＝真かつＦ１＝真のときにのみ
演算は有効である。ＣＣ＝１１０のときには、実行コン
トロールフラグＦ０＝真かつＦ１＝偽のときにのみ演算
は有効である。ＣＣ＝１１１のときの動作は未定義であ
り、ユーザは、ＣＣ＝１１１となる命令を用いることは
できない。

【００２９】図３は演算フィールドの詳細な内容を示す
説明図である。フォーマット１１１〜１１７は、それぞ
れ２８ビットで表現される短型の演算フィールド１０６
または演算フィールド１０７によるものである。フォー
マット１１８は、フィールド１０８，１０９，１１０で
構成される長型の演算フィールドによるものである。

【００３０】フォーマット１１１（Ｓｈｏｒｔ＿Ｍ）
は、演算内容を指定するフィールド１２０、レジスタ番
号を指定する２つのフィールド１２１，１２２、レジス
タ番号または６ビット長の即値を指定するフィールド１
２３、およびフィールド１２３がレジスタ番号を示すの
か即値を示すのかを指定するフィールド１２４で構成さ
れる。図３に示すように、フィールド１２４の値Ｘが
「００」、「０１」または「１１」であるときにはフィ
ールド１２３がレジスタ番号を示していることを示し、
「１０」であるときには即値を示していることを示す。
このフォーマット１１１は、レジスタ間接アドレッシン
グのメモリアクセス演算に用いられる。

【００３１】フォーマット１１２（Ｓｈｏｒｔ＿Ａ）
は、演算内容を指定するフィールド１２０、レジスタ番
号を指定する２つのフィールド１２１，１２２、レジス
タ番号または６ビット長の即値を指定するフィールド１
２３、およびフィールド１２３がレジスタ番号を示すの
か即値を示すのかを指定するフィールド１２５で構成さ
れる。図３に示すように、フィールド１２５の値Ｘ’が
「０」であるときにはフィールド１２３がレジスタ番号
を示していることを示し、「１」であるときには即値を
示していることを示す。このフォーマット１１２は、算
術演算、論理演算、シフト演算およびビット演算に用い
られる。

【００３２】フォーマット１１３（Ｓｈｏｒｔ＿Ｂ１）
は、演算内容を指定するフィールド１２０およびレジス
タ番号を指定するフィールド１２６で構成される。この
フォーマット１１３は、レジスタ指定によるジャンプ命
令および分岐命令に用いられる。フォーマット１１４
（Ｓｈｏｒｔ＿Ｂ２）は、演算内容を指定するフィール
ド１２０および１８ビット長のディスプレイスメントの
フィールド１２７で構成される。このフォーマット１１
４は、ジャンプ命令および分岐命令に用いられる。

【００３３】フォーマット１１５（Ｓｈｏｒｔ＿Ｂ３）
は、演算内容を指定するフィールド１２０、レジスタ番
号を指定するフィールド１２１、レジスタ番号または１
２ビット長の即値を指定するフィールド１２８、フィー
ルド１２８がレジスタ番号を示すのか即値を示すのかを
指定するフィールド１２９、およびゼロ判定にもとづい
てフィールド１２１にもとづく条件ジャンプまたは条件
分岐を行うか否か指定するフィールド１３０で構成され
る。このフォーマット１１５は、条件ジャンプ命令およ
び条件分岐命令に使用される。

【００３４】フォーマット１１６（Ｓｈｏｒｔ＿Ｄ１）
は、演算内容を指定するフィールド１２０、レジスタ番
号を指定するフィールド１２１、レジスタ番号または１
２ビット長の即値を指定するフィールド１２８、フィー
ルド１２８がレジスタ番号を示すのか即値を示すのかを
指定するフィールド１２９で構成される。このフォーマ
ット１１６は、条件ジャンプ命令、条件分岐命令および
リピート命令に使用される。フォーマット１１７（Ｓｈ
ｏｒｔ＿Ｄ２）は、演算内容を指定するフィールド１２
０、レジスタ番号または１２ビット長の即値を指定する
フィールド１２８、フィールド１２８がレジスタ番号を
示すのか即値を示すのかを指定するフィールド１２９、
遅延命令（ディレイド命令）に関するフィールド１３１
で構成される。このフォーマット１１７は、ディレイド
ジャンプ命令、ディレイド分岐命令およびリピート命令
に使用される。

【００３５】フォーマット１１８（Ｌｏｎｇ）は、演算
内容を指定するフィールド１２０、レジスタ番号を指定
する２つのフィールド１２１，１２２、３２ビット長の
即値を指定するフィールド１３２で構成される。このフ
ォーマット１１８は、複雑な算術演算、大きな即値を用
いる算術演算、大きなディスプレイスメント付きレジス
タ間接アドレッシングのメモリアクセス演算、大きな変
位の分岐演算および絶対番地へのジャンプ命令などに使
用される。

【００３６】図４はマイクロプロセッサのレジスタ構成
を示す説明図である。このマイクロプロセッサは、図４
（ａ）に示すような６４本の３２ビット長の汎用レジス
タ５、図４（ｂ）に示すような１２本の制御レジスタ１
５０、および図４（ｃ）に示すような２本のアキュムレ
ータ１８を持つ。Ｒ０の汎用レジスタ１４０の内容は常
に０であり、そこへの書き込みは無視される。Ｒ６２の
汎用レジスタは、サブルーチンからの戻り先アドレスが
設定されるリンクレジスタである。Ｒ６３の汎用レジス
タは、スタックポインタであり、ＰＳＷ１０のＳＭフィ
ールドの値に応じてユーザスタックポインタ（ＳＰＵ）
または割り込みスタックポインタ（ＳＰＩ）として動作
する。制御レジスタ１５０には、プログラムカウンタ１
５１、ＰＳＷ１０、および各種の専用レジスタが含まれ
る。図３に示すフォーマット１１２による演算では、６
４本の汎用レジスタ５のそれぞれを上位１６ビットと下
位１６ビットとに分けてアクセスできる。また、２本の
アキュムレータ１８を、上位３２ビットと下位３２ビッ
トとに分けて別々にアクセスできる。

【００３７】図５はＰＳＷ１０の詳細内容を示す説明図
である。ＰＳＷ１０の上位１６ビットには、スタックポ
インタを切り替えるためのＳＭフィールド１７１、セル
フデバッグトラップ（ＳＤＢＴ）の検出を示すＥＡフィ
ールド１７２、ＳＤＢＴの許可を指定するＤＢフィール
ド１７３、割り込み許可を指定するＩＥフィールド１７
４、リピート動作の許可を指定するＲＰフィールド１７
５、モジュロアドレッシングの許可を指定するＭＤフィ
ールド１７６がある。下位１６ビットはフラグフィール
ド１８０である。フラグフィールド１８０には８個のフ
ラグがあり、その中のＦ０フラグ１８１およびＦ１フラ
グ１８２は演算の有効／無効を指定する。各フラグの値
は比較演算や算術演算の結果に応じて変化する。また、
フラグ初期化演算で初期化したり、フラグ値書き込み演
算で任意の値をフラグフィールド１８０に書き込むこと
によって変化する。フラグフィールド１８０の内容は、
フラグ値読み出し演算によって読み出される。

【００３８】各フラグは、以下のような意味を有する。ＳＭ＝０：スタックモード０→ＳＰＩを使用ＳＭ＝１：スタックモード１→ＳＰＵを使用ＥＡ＝０：ＳＤＢＴを未検出ＥＡ＝１：ＳＤＢＴを検出ＤＢ＝０：ＳＤＢＴを非許可ＤＢ＝１：ＳＤＢＴを許可ＩＥ＝０：割り込み非許可ＩＥ＝１：割り込み許可ＲＰ＝０：リピートブロック無効ＲＰ＝１：リピートブロック有効ＭＤ＝０：モジュロアドレッシング無効ＭＤ＝１：モジュロアドレッシング有効Ｆ０：汎用フラグ（実行コントロールフラグ）Ｆ１：汎用フラグ（実行コントロールフラグ）Ｆ２：汎用フラグＦ３：汎用フラグＦ４（Ｓ）：飽和演算フラグＦ５（Ｖ）：オーバーフローフラグＦ６（ＶＡ）：累積オーバーフローフラグＦ７（Ｃ）：キャリー／ボローフラグ

【００３９】以下、このマイクロプロセッサの命令一覧
を示す。Ａ．マイクロプロセッサ機能に関する命令Ａ−１．ロード／ストア命令ＬＤＢ：Load one byte to a register with sign extension ［１バイトロード（符号拡張あり）］ＬＤＢＵ：Load one byte to a register with zero extension ［１バイトロード（ゼロ拡張あり）］ＬＤＨ：Load one half-word to a register with sign extension ［１ハーフワードロード（符号拡張あり）］ＬＤＨＨ：Load one half-word to a register high ［１ハーフワードロード（レジスタ上位へ）］ＬＤＨＵ：Load one half-word to a register with zero extension ［１ハーフワードロード（ゼロ拡張あり）］ＬＤＷ：Load one word to a register ［１ワードロード］ＬＤ２Ｗ：Load two words to registers ［２ワードロード］ＬＤ４ＢＨ：Load four bytes to four half-words in two registers with sign extension ［４バイトロード（２レジスタへ，符号拡張あり）］ＬＤ４ＢＨＵ：Load four bytes to four half-words in two registers with zero extension ［４バイトロード（２レジスタへ，ゼロ拡張あり）］ＬＤ２Ｈ：Load two half-words to two words in two registers with sign extension ［２ハーフワードロード（２レジスタへ，符号拡張あり）］ＳＴＢ：Store one byte from a register ［１バイトストア］ＳＴＨ：Store one half-word from a register ［１ハーフワードストア］ＳＴＨＨ：Store one half-word from a register high ［１ハーフワードストア（レジスタ上位から）］ＳＴＷ：Store one word from a register ［１ワードストア］ＳＴ２Ｗ：Store two words from registers ［２ワードストア］ＳＴ４ＨＢ：Store four bytes from four half-words from two registrers ［４バイトストア（２レジスタの４ハーフワードから）］ＳＴ２Ｈ：Store two half-words from two registrers ［２ハーフワードストア（２レジスタから）］ＭＯＤＤＥＣ：Decrement a register value by a 5-bits immediate value ［即値５ビットのデクリメント］ＭＯＤＩＮＣ：Increment a register value by a 5-bits immediate value ［即値５ビットのインクリメント］

【００４０】Ａ−２．転送命令ＭＶＦＳＹＳ：Move a control register to a general purpose register ［制御レジスタから汎用レジスタへ］ＭＶＴＳＹＳ：Move a general purpose register to a control register ［汎用レジスタから制御レジスタへ］ＭＶＦＡＣＣ：Move a word from an accumulator ［アキュムレータからの１ワード転送］ＭＶＴＡＣＣ：Move two general purpose registers to an accumulator ［２汎用レジスタ内容のアキュムレータへの転送］

【００４１】Ａ−３．比較命令ＣＭＰｃｃ：Compare ［比較］ｃｃ＝ＥＱ（等しい），ＮＥ（不等），ＧＴ（より大），ＧＥ（以上），ＬＴ（未満），ＬＥ（以下），ＰＳ（ともに正），ＮＧ（ともに負）ＣＭＰＵｃｃ：Compare unsigned［比較（符号なし）］ｃｃ＝ＧＴ，ＧＥ，ＬＴ，ＬＥ

【００４２】Ａ−４．最大値／最小値命令 reserved［予約済］

【００４３】Ａ−５．算術演算命令ＡＢＳ：Absolute［絶対値をとる］ＡＤＤ：Add ［加算］ＡＤＤＣ：Add with carry［加算（キャリー付き）］ＡＤＤＨｐｐｐ：Add half-word ［ハーフワード加算］ｐｐｐ＝ＬＬＬ（レジスタ下位，レジスタ下位，レジスタ下位），ＬＬＨ（レジスタ下位，レジスタ下位，レジスタ上位），ＬＨＬ，ＬＨＨ，ＨＬＬ，ＨＬＨ，ＨＨＬ，ＨＨＨＡＤＤＳ：Add register Rb with the sign of the third operand ［レジスタＲｂに符号を付ける］ＡＤＤＳ２Ｈ：Add sign to two half-words ［２ハーフワードに符号を付ける］ＡＤＤ２Ｈ：Add two pairs of half-words ［２ハーフワード同士の加算］ＡＶＧ：Average with rounding towards positive infinity ［平均をとる］ＡＶＧ２Ｈ：Average two pairs of half-words rounding towards positive infinity ［２ハーフワードそれぞれの平均をとる］ＪＯＩＮｐｐ：Join two half-words ［２ハーフワードの結合］ｐｐ＝ＬＬ，ＬＨ，ＨＬ，ＨＨＳＵＢ：Subtract［減算］ＳＵＢＢ：Subtract with borrow［ボロー付き減算］ＳＵＢＨｐｐｐ：Subtract half-word［ハーフワードの減算］ｐｐｐ＝ＬＬＬ，ＬＬＨ，ＬＨＬ，ＬＨＨ，ＨＬＬ，ＨＬＨ，ＨＨＬ，ＨＨＨＳＵＢ２Ｈ：Subtract two pairs of half-words ［２つのハーフワードの減算］

【００４４】Ａ−６．論理演算命令ＡＮＤ：logical AND ［論理積］ＯＲ：logical OR ［論理和］ＮＯＴ：logical NOT ［反転］ＸＯＲ：logical exclusive OR［排他的論理和］ＡＮＤＦＧ：logical AND flags ［フラグの論理積］ＯＲＦＧ：logical OR flags［フラグの論理和］ＮＯＴＦＧ：logical NOT a flag［フラグの反転］ＸＯＲＦＧ：logical exclusive OR flags［フラグの排他的論理和］

【００４５】Ａ−７．シフト演算命令ＳＲＡ：Shift right arithmetic［算術右シフト］ＳＲＡ２Ｈ：Shift right arithmetic two half-words ［２つのハーフワードの算術右シフト］ＳＲＣ：Shift right concatenated registers ［レジスタ連鎖右シフト］ＳＲＬ：Shift right logical ［論理右シフト］ＳＲＬ２Ｈ：Shift right logical two half-words ［２つのハーフワードの論理右シフト］ＲＯＴ：Rotate right［右回転］ＲＯＴ２Ｈ：Rotate right two half-words ［２つのハーフワードの右回転］

【００４６】Ａ−８．ビット操作命令ＢＣＬＲ：Clear a bit ［ビットクリア］ＢＮＯＴ：Invert a bit［ビット反転］ＢＳＥＴ：Set a bit ［ビットセット］ＢＴＳＴ：Test a bit［ビットテスト］

【００４７】Ａ−９．分岐命令ＢＲＡ：Branch［分岐］ＢＲＡＴＺＲ：Branch if zero［ゼロなら分岐］ＢＲＡＴＮＺ：Branch if not zero［ゼロでないなら分岐］ＢＳＲ：Branch to subroutine［サブルーチンへ分岐］ＢＳＲＴＺＲ：Branch to subroutine if zero ［ゼロならサブルーチンへ分岐］ＢＳＲＴＮＺ：Branch to subroutine if not zero ［ゼロでないならサブルーチンへ分岐］ＪＭＰ：Jump［無条件ジャンプ］ＪＭＰＴＺＲ：Jump if zero［ゼロならジャンプ］ＪＭＰＴＮＺ：Jump if not zero［ゼロでないならジャンプ］ＪＳＲ：Jump to subroutine［サブルーチンへジャンプ］ＪＳＲＴＺＲ：Jump to subroutine if zero ［ゼロならサブルーチンへジャンプ］ＪＳＲＴＮＺ：Jump to subroutine if not zero ［ゼロでないならサブルーチンへジャンプ］ＮＯＰ：No Operation［無操作］［ディレイド分岐，ジャンプ命令］ＤＢＲＡ：Delayed branch［ディレイド分岐］ＤＢＲＡＩ：Delayed branch immediate［ディレイド分岐（即値）］ＤＢＳＲ：Ｄｅｌａｙｅｄｂｒａｎｃｈｔｏｓｕｂｒｏｕｔｉｎ
ｅ［ディレイドサブルーチン分岐］ＤＢＳＲＩ：Ｄｅｌａｙｅｄｂｒａｎｃｈｉｍｍｅｄｉａｔｅｔｏ
ｓｕｂｒｏｕｔｉｎｅ［ディレイドサブルーチン分岐（即値）］ＤＪＭＰ：Delayed jump［ディレイドジャンプ］ＤＪＭＰＩ：Delayed jump immediate［ディレイドジャンプ（即値）］ＤＪＳＲ：Delayed jump to subroutine ［ディレイドサブルーチンジャンプ］ＤＪＳＲＩ：Delayed jump immediate to subroutine ［ディレイドサブルーチンジャンプ（即値）］

【００４８】Ａ−１０．ＯＳ関連命令ＴＲＡＰ：Trap［トラップ］ＲＥＩＴ：Return from exception, interrupts and traps ［例外、割り込み、トラップからのリターン］

【００４９】Ｂ．ＤＳＰ機能に関する命令Ｂ−１．算術操作命令ＭＵＬ：Multiply［乗算］ＭＵＬＸ：Multiply with extended precision［倍精度乗算］ＭＵＬＸＳ：Multiply and shift to the right by one with extended precision ［倍精度乗算および１ビット右シフト］ＭＵＬＸ２Ｈ：Multiply two pairs of half-words with extended precision ［２ハーフワードずつの倍精度乗算］ＭＵＬＨＸｐｐ：Multiply two half-words with extended precision ｐｐ＝ＬＬ，ＬＨ，ＨＬ，ＨＨ［２ハーフワードの倍精度乗算］ＭＵＬ２Ｈ：Ｍｕｌｔｉｐｌｙｔｗｏｐａｉｒｓｏｆｈａｌｆ−
ｗｏｒｄｓ［２ハーフワードずつの乗算］ＭＡＣａ：Ｍｕｌｔｉｐｌｙａｎｄａｄｄ［積和演算］ａ（アキュムレータ指定）＝０，１ＭＡＣＳａ：Multiply, shift to the right by one and add ａ＝０，１［１ビット右シフト付き積和演算］ＭＳＵＢａ：Multiply and subtract ［積和（減算）演算］ａ＝０，１ＭＳＵＢＳａ：Multiply, shift to the right by one and subtract ａ＝０，１［１ビット右シフト付き積和（減算）演算］

【００５０】Ｂ−２．リピート命令ＲＥＰＥＡＴ：Repeat a block of instructions ［命令ブロックの繰り返し］ＲＥＰＥＡＴＩ：Repeat a block of instructions immediate ［命令ブロックの繰り返し（即値指定）］

【００５１】図６はマイクロプロセッサの並列２命令実
行時のパイプライン動作を示す説明図である。この動作
は、命令のフォーマットフィールドの値ＦＭ＝００のと
きに実行される。パイプライン１９０，１９５は、命令
フェッチステージ１９１、デコード／アドレス演算ステ
ージ１９２、実行／メモリアクセスステージ１９３およ
びライトバックステージ１９４で構成される。並列２命
令実行時には、メモリユニット３での実行と整数演算ユ
ニット４での実行とが並列に行われる。図７はマイクロ
プロセッサのシーケンシャル命令実行時のパイプライン
動作を示す説明図である。この動作は、命令のフォーマ
ットフィールドの値ＦＭ＝０１，１０，１１のときに実
行される。パイプライン２００は、命令フェッチステー
ジ、デコード／アドレス演算ステージ、実行／メモリア
クセスステージ、およびライトバックステージで構成さ
れるが、この場合には、メモリユニット３での実行と整
数演算ユニット４での実行とのうちのいずれかが、一時
に実行される。なお、図６および図７に示されたパイプ
ライン動作では、２番目のステージであるデコード／ア
ドレス演算ステージ１９２において分岐先アドレスが得
られる。

【００５２】図８はこの発明の実施の形態１によるマイ
クロプロセッサの構成を示すブロック図である。図にお
いて、３６６は分岐命令のデコード値を保持するための
レジスタ１３Ａと分岐命令が実行されるべき時期に対応
したＰＣ値を保持するレジスタ１３Ｂとを含む遅延分岐
命令レジスタ（遅延分岐命令保持手段）である。分岐命
令が実行されるべき時期に対応したＰＣ値とは、マイク
ロプロセッサのＰＣの値がその値になるとディレイド分
岐命令を実行することになる値である。なお、既に定義
したように、単に「分岐命令」と表現した場合には、厳
密な意味での分岐命令とジャンプ命令との双方の概念を
含む。

【００５３】図９はディレイド分岐命令の基本的なフォ
ーマット３２０を示す説明図である。基本的には、ディ
レイド分岐命令のフォーマット３２０は、オペコード３
２１、遅延量を指定するフィールド３２２および分岐先
アドレスを指定するためのオフセットまたはアドレスが
指定されるフィールド３２３を持つ。ディレイド分岐命
令は、例えば、図３に示すフォーマット１１６（Ｓｈｏ
ｒｔ＿Ｄ１）、フォーマット１１７（Ｓｈｏｒｔ＿Ｄ
２）またはフォーマット１１８（Ｌｏｎｇ）で実現され
る。フォーマット１１６（Ｓｈｏｒｔ＿Ｄ１）は、遅延
量としてレジスタ設定値が用いられる場合に使用され
る。フォーマット１１７（Ｓｈｏｒｔ＿Ｄ２）は、遅延
量として即値が用いられる場合に使用される。フォーマ
ット１１８（Ｌｏｎｇ）は、分岐先アドレスを３２ビッ
ト即値で指定する場合に使用される。各フォーマットに
おいて、オペコードはフィールド１２０で指定される。
また、フィールド１２９は、フィールド１２８がレジス
タ番号を示すのか即値を示すのかを指定するために使用
される。フィールド１２１は、ＤＢＲＡ，ＤＢＳＲ，Ｄ
ＪＭＰ，ＤＪＳＲの各命令において遅延量がレジスタで
指定されるときのレジスタ指定領域として使用され、フ
ィールド１３１は、遅延量を指定する即値の領域として
使用される。

【００５４】図１０は幾つかのディレイド分岐命令の例
を示す説明図である。命令３２４は、遅延量を即値で指
定するとともに分岐のオフセットを即値で指定する命令
である。命令３２５は、遅延量をレジスタで指定すると
ともに分岐のオフセットを即値で指定する命令である。
命令３２６は、遅延量を即値で指定するとともに分岐の
オフセットをレジスタで指定する命令である。命令３２
７は、遅延量をレジスタで指定するとともに分岐のオフ
セットをレジスタで指定する命令である。

【００５５】図１１はディレイド分岐命令３３０、ディ
レイドジャンプ命令３３２およびディレイドサブルーチ
ンコール命令３３１，３３３が、同一フォーマットでど
のように実現されるのかを示すための説明図である。

【００５６】次に動作について説明する。命令がディレ
イド分岐命令であったことを命令デコードユニット２の
デコーダ８が認識すると、命令デコードユニット２は、
そのことを示す制御信号１１をメモリユニット３に出力
する。メモリユニット３において、ＰＣ制御部１３は、
制御信号１１によって入力した命令デコード結果をレジ
スタ１３Ａに格納する。従って、レジスタ１３Ａには、
ディレイド分岐命令による分岐先を示す情報等が格納さ
れる。また、ＰＣ制御部１３は、分岐命令が実行される
べき時期に応じたＰＣ値をレジスタ１３Ｂに格納する。

【００５７】ＰＣ制御部１３は、マイクロプロセッサに
おける実際のＰＣ値がレジスタ１３Ｂに格納されている
値と一致したことを検知したら、レジスタ１３Ａに格納
されている分岐先情報にもとづいて分岐命令を実行す
る。すなわち、レジスタ１３Ａに格納されている分岐先
情報が示す値をＰＣに設定する。この結果、レジスタ１
３Ｂに格納されている値に応じた数の命令がフェッチさ
れたら、次のサイクルで、分岐先にある命令がフェッチ
される。

【００５８】図１２はディレイド分岐命令を含むプログ
ラムの一例を示す説明図である。図１２における２行目
のＤＢＲＡ命令は、遅延量「３」を指定するとともに分
岐先としてＴＧＴ１を指定する命令である。命令デコー
ドユニット２において、ＤＢＲＡ命令がデコードされる
と、ＰＣ制御部１３は、分岐先を示すＴＧＴ１に応じた
情報をレジスタ１３Ａに格納する。また、遅延量「３」
に応じたＰＣ値、すなわち、そのときのＰＣの値に３×
８を加算した値をレジスタ１３Ｂに格納する。ＤＢＲＡ
命令の下に記述されている３命令は無条件に処理される
が、３番目の遅延スロットにある命令をフェッチすると
き、マイクロプロセッサのＰＣの値はレジスタ１３Ｂに
格納されているＰＣ値に一致する。そこで、ＰＣ制御部
１３は、ＤＢＲＡ命令による分岐処理を実行する。すな
わち、レジスタ１３Ｂに格納されているＰＣ値をマイク
ロプロセッサにおけるＰＣに設定する処理を行う。

【００５９】図１３はディレイド分岐命令を含むプログ
ラムの他の例を示す説明図である。ここでは、サブルー
チンコール命令であるＤＪＳＲ命令が用いられている。
また、遅延量は、汎用レジスタ５におけるｒ４レジスタ
に設定されている値が用いられる。この場合も、ＰＣ制
御部１３は、分岐先を示すＴＧＴ１に応じた情報をレジ
スタ１３Ａに格納する。また、ＰＣ制御部１３は、ｒ４
レジスタに設定されている値に応じたＰＣ値をレジスタ
１３Ｂに格納する。ｒ４レジスタに設定されている値が
「４」であったとすると、ＤＪＳＲ命令の下に記述され
ている４命令は無条件に処理されるが、４番目の遅延ス
ロットの命令をフェッチするときに、マイクロプロセッ
サのＰＣの値はレジスタ１３Ｂに格納されているＰＣ値
に一致する。そこで、ＰＣ制御部１３は、ＤＪＳＲ命令
によるサブルーチンジャンプを実行する。具体的には、
ＰＣに、レジスタ１３Ｂに格納されているＰＣ値を設定
する。

【００６０】以上のように、この実施の形態１によれ
ば、マイクロプロセッサは、ディレイド分岐命令で指定
された遅延量に応じたＰＣ値を保持するように構成され
ているので、ディレイド分岐命令のデコード時点から実
行時点までの間に割り込み等のＰＣ値を変化させる事象
が生じたとしても、確実に分岐命令が実行される。例え
ば、図１２に示された例において、遅延スロットの命令
の実行時に割り込みが生ずるとマイクロプロセッサのＰ
Ｃの値は変化するとともに、割り込み処理において幾つ
かのサイクルが消費される。従来のマイクロプロセッサ
における処理のようにディレイド分岐命令の実行時期を
カウンタ値として保持していると、割り込み処理におい
て費やされたサイクル数分だけ実行時期がずれてしま
う。しかし、この実施の形態によれば、そのようなこと
はない。また、レジスタ１３Ａ，１３Ｂをアクセスする
命令を備えれば、遅延スロットの命令実行時に起きた割
り込みにともないコンテクストスイッチが必要になった
場合、レジスタ１３Ａに保持された分岐先情報とレジス
タ１３Ｂに保持された分岐発生ＰＣ値とをデータＲＡＭ
７に退避し、異なるコンテクストを実行後、再び割り込
まれたコンテクストに復帰したときにこれらの値を復帰
して遅延分岐を実行することも可能になる。

【００６１】実施の形態２．図１４はこの発明の実施の
形態２によるマイクロプロセッサにおける命令デコード
部分および命令実行部分を示すブロック図である。図に
おいて、３６１は算術論理演算を実行するＡＬＵ（演算
ユニット）、３６３は乗算を実行する乗算器（演算ユニ
ット）、３６５はＰＣ値を計算するＰＣ制御部、３６７
はアドレス計算を行うメモリ制御部（演算ユニット）、
３６９はシフト演算を実行するシフタ（演算ユニッ
ト）、３７１は１サイクルで２命令（２演算指令を含む
命令）を転送できるバス、３７２は命令をデコードして
命令実行部に制御信号１１，１２を与える命令デコー
ダ、３７３は汎用レジスタである。

【００６２】ＡＬＵ３６１において、３６２はディレイ
ド算術論理演算命令のデコード結果を格納するレジスタ
３６２Ａと遅延量に応じた値を格納するレジスタ３６２
Ｂとを有する遅延命令レジスタ（遅延命令保持手段）で
ある。乗算器３６３において、３６４はディレイド乗算
命令のデコード結果を格納するレジスタ３６４Ａと遅延
量に応じた値を格納するレジスタ３６４Ｂとを有する遅
延命令レジスタ（遅延命令保持手段）である。ＰＣ制御
部３６５において、３６６はディレイド分岐命令のデコ
ード結果を格納するレジスタ３６６Ａと遅延量に応じた
値を格納するレジスタ３６６Ｂとを有する遅延命令レジ
スタ（遅延分岐命令保持手段）である。メモリ制御部３
６７において、３６８はディレイドメモリアクセス命令
のデコード結果を格納するレジスタ３６８Ａと遅延量に
応じた値を格納するレジスタ３６８Ｂとを有する遅延命
令レジスタ（遅延命令保持手段）である。シフタ３６９
において、３７０はディレイドシフト命令のデコード結
果を格納するレジスタ３７０Ａと遅延量に応じた値を格
納するレジスタ３７０Ｂとを有する遅延命令レジスタ
（遅延命令保持手段）である。

【００６３】次に動作について説明する。図１５は各行
の２演算を同時に実行する命令配置の一例を示す説明図
である。この配置は、図２２に示されたプログラムをス
ケジューリングした結果である。図２１に示された一般
的な２演算を同時に扱うマイクロプロセッサでは、図２
２に示されたプログラムを実行するために、図２３に示
されたように５サイクルを要していた。ＳＲＡ命令とＳ
ＵＢ命令とはｒ３レジスタ依存の関係にあって同時に実
行できないからである。ところが、この実施の形態によ
るマイクロプロセッサはディレイド分岐命令を扱えるの
で、図１５に示されたように、図２３における２行目の
ＮＯＰを遅延量「２」のＤＪＭＰ命令で置き換えること
ができる。

【００６４】図１５に示されたような命令配置による各
命令を順次入力すると、第１サイクルでは、マイクロプ
ロセッサにおいて、ＡＬＵ３６１とシフタ３６９とが、
１行目のＡＤＤ演算とＳＲＡ演算とをそれぞれ実行す
る。第２サイクルでは、シフタ３６９とＰＣ制御部３６
５とがＳＲＡ演算とＤＪＭＰ演算とを扱う。シフタ３６
９はＳＲＡ演算を直ちに実行するが、ＰＣ制御部３６５
は、実施の形態１の場合と同様に、ＤＪＭＰ演算のデコ
ード結果である分岐先ＴＧＴに関する情報をレジスタ３
６６Ａに格納し、遅延量「２」に応じたＰＣ値をレジス
タ３６６Ｂに格納する。第３サイクルでは、ＡＬＵ３６
１と乗算器３６３とが、３行目のＳＵＢ演算とＭＵＬ演
算とをそれぞれ実行する。第４サイクルでは、ＡＬＵ３
６１と乗算器３６３とが、４行目のＡＤＤ演算とＭＵＬ
演算とをそれぞれ実行する。４行目の命令がフェッチさ
れるとき、マイクロプロセッサのＰＣ（図１４において
図示せず）の値はレジスタ３６６Ｂに格納されているＰ
Ｃ値に一致している。そこで、ＰＣ制御部３６５は、Ｄ
ＪＭＰ演算で指定されたジャンプ命令を実行する。具体
的には、ＰＣに、レジスタ３６６Ｂに格納されているＰ
Ｃ値を設定する。

【００６５】このように、遅延量を任意に指定できる分
岐命令処理する機構を備えていれば、命令のスケジュー
リングをより有効に実行することができる。すなわち、
プログラマまたはコンパイラは、プログラムサイズをよ
り小さくするような命令のスケジューリングを行える。
その結果、ある処理を実行するのに要する時間は短縮さ
れる。しかも、ＰＣ制御部３６５は、分岐命令実行時期
をＰＣ値として保持するので、ディレイド分岐命令は矛
盾なく実行される。

【００６６】この実施の形態によるマイクロプロセッサ
は、ディレイド分岐命令以外のディレイド演算命令を扱
うこともできる。図１６は、プログラムの一例を示す説
明図である。図２１に示された一般的な２演算を同時に
扱うマイクロプロセッサでは、図１６における１行目の
ＡＤＤ演算と２行目のＡＤＤ演算を同時実行することは
できない。１つのＡＬＵ３４１しか持っていないからで
ある。従って、図１６における１行目の命令と２行目の
命令とを同時実行するように命令のスケジューリングを
行うことはできなかった。

【００６７】ところが、この実施の形態によるマイクロ
プロセッサは、図１６に示すプログラムの各命令を図１
７に示すようにスケジューリングした各命令を実行でき
る。図１７に示されたような命令配置による各命令を順
次入力すると、このマイクロプロセッサにおいて、第１
サイクルでは、ＡＬＵ３６１は、ＡＤＤ演算を実行する
とともにＤＡＤＤ（ディレイドＡＤＤ）演算も扱う。す
なわち、ＤＡＤＤのデコード結果をレジスタ３６２Ａに
格納するとともに、遅延値「１」に応じた値をレジスタ
３６２Ｂに格納する。第２サイクルでは、シフタ３６９
と乗算器３６３とは、ＳＲＡ演算とＭＵＬ演算とをそれ
ぞれ実行する。２行目の命令がフェッチされるときに、
ＰＣの値はレジスタ３６２Ｂ内の遅延値「１」に応じた
値に一致する。そこで、ＡＬＵ３６１は、レジスタ３６
２ＡからＤＡＤＤで指定された演算指令内容を取り出
し、その演算を実行する。

【００６８】なお、レジスタ３６２Ｂに格納される遅延
値に応じた値は、動作クロックに応じて値が変化するカ
ウンタ値であってもよいが、ＰＣ値であってもよい。遅
延値に応じた値としてＰＣ値を保持した場合には、デコ
ード時と実行時との間で割り込み等が生じてもそれに対
する対処が容易になる。

【００６９】ここでは、ディレイド演算命令を扱う演算
ユニットとしてＡＬＵ３６１を例にとったが、乗算器３
６３、メモリ制御部３６７およびシフタ３６９も、ＡＬ
Ｕ３６１の処理と同様の処理によってディレイド演算命
令を扱うことができる。また、遅延値「１」の場合を例
に説明したが、もちろん、任意の値を指定できる。任意
の値を指定可能なので、命令のスケジューリングの自由
度をより向上させることができる。なお、固定的な値を
指定するディレイド演算命令しか処理しないマイクロプ
ロセッサであっても、任意の遅延値を指定できるディレ
イド演算命令を処理するマイクロプロセッサに比べると
効果は低減するものの、命令のスケジューリングの自由
度を向上させる効果が期待できる。

【００７０】以上のように、ディレイド演算命令を扱う
機構を有する場合には、プログラムの実行に要するサイ
クル数をさらに少なくでき、その結果、プログラム実行
時間を短縮できる。例えば、図１６に示されたプログラ
ムがあった場合に、図２１に示された一般的な２演算を
同時に扱うマイクロプロセッサでは、２つのＡＤＤ命令
を同時実行できないので、命令のスケジューリングを行
ってもプログラム実行に３サイクルを要する。このマイ
クロプロセッサは、図１７に示された例からわかるよう
に、２サイクルでプログラムを実行できる。また、ルー
プ内でディレイド命令を記述できるような場合に、この
マイクロプロセッサによれば、さらに処理を高速化でき
る。

【００７１】ディレイド命令は、２演算同時実行できる
マイクロプロセッサにおいて、特に有効である。図１５
および図１７に示された例からわかるように、演算を並
列実行する場合のＮＯＰ挿入箇所を削減できるからであ
る。なお、ここでは、２演算同時実行のマイクロプロセ
ッサについて説明したが、リソースであるＡＬＵ３６１
等の演算ユニットを複数個備え、同時実行演算数をさら
に多くしたマイクロプロセッサに、この実施の形態によ
るディレイド演算命令処理機構を設けてもよい。そのよ
うなマイクロプロセッサにおいても、実行サイクル数の
削減および処理の高速化が期待できる。

【００７２】図１８はこの実施の形態２によるマイクロ
プロセッサにおけるＰＳＷの一例を示す説明図である。
このＰＳＷ３８０，３９０は図５に示されたものと同様
のものであるが、この場合には、ＲＰフィールド３８１
がＰＣ制御部３６５の遅延命令レジスタ３６６の動作を
有効にするかどうか決めるビットとして用いられる。ま
た、例えば、Ｅ４フィールド３８２、Ｅ３フィールド３
８３、Ｅ２フィールド３８４およびＥ１フィールド３８
５は、それぞれ、ＡＬＵ３６１の遅延命令レジスタ３６
２、乗算器３６３の遅延命令レジスタ３６４、メモリ制
御部３６７の遅延命令レジスタ３６８およびシフタ３６
９の遅延命令レジスタ３７０の動作を有効にするかどう
か決めるビットとして用いられる。各ビットが無効状態
にセットされた場合には、対応する演算ユニットにおけ
るディレイド命令処理は禁止される。このようなＰＳＷ
３８０，３９０を用意することによって、ディレイド命
令処理の柔軟性を増すことができる。

【００７３】実施の形態３．図１９はこの発明の実施の
形態３によるマイクロプロセッサにおける命令デコード
部分および命令実行部分を示すブロック図である。図に
おいて、４６１は算術論理演算を実行するＡＬＵ（演算
ユニット）、４６３は乗算を実行する乗算器（演算ユニ
ット）、４６５はＰＣ値を計算するＰＣ制御部、４６７
はアドレス計算を行うメモリ制御部（演算ユニット）、
４６９はシフト演算を実行するシフタ（演算ユニッ
ト）、３７１は１サイクルで２命令を転送できるバス、
３７２は命令をデコードして命令実行部に制御信号１
１，１２を与える命令デコーダ、３７３は汎用レジスタ
である。

【００７４】このマイクロプロセッサにおいて、ＡＬＵ
４６１は、２つの遅延命令レジスタ３６２を有する。乗
算器４６３は、２つの遅延命令レジスタ３６４を有す
る。ＰＣ制御部４６５は、２つの遅延命令レジスタ３６
６を有する。メモリ制御部４６７は、２つの遅延命令レ
ジスタ３６８を有する。そして、シフタ４６９は、２つ
の遅延命令レジスタ３７０を有する。

【００７５】次に動作について説明する。各演算ユニッ
トおよびＰＣ制御部４６５において、命令のデコード結
果と遅延量とからなる１セットはキュー管理される。例
えば、ＡＬＵ４６１において、一方の遅延命令レジスタ
３６２のレジスタ３６２Ａにディレイド算術演算命令の
デコード結果が格納されレジスタ３６２Ｂにそれに対応
する遅延量に応じた値が設定されている場合に、さら
に、命令デコーダ３７２から新たなディレイド算術演算
命令のデコード結果が送られてきたとする。すると、新
たなデコード結果および遅延量に応じた値は、他方の遅
延命令レジスタ３６２に格納される。そして、一方のレ
ジスタ３６２Ｂに格納されている遅延量に応じた値とマ
イクロプロセッサのＰＣの値とが一致したときに、一方
のレジスタ３６２Ａに格納されているデコード結果に応
じた演算が実行される。その後、他方のレジスタ３６２
Ｂに格納されている遅延量に応じた値とマイクロプロセ
ッサのＰＣの値とが一致したときに、他方のレジスタ３
６２Ａに格納されているデコード結果に応じた演算が実
行される。

【００７６】そのような構成によれば、あるディレイド
命令の実行時期に到達していない時点でも、別の同種類
のディレイド命令を扱うことができる。例えば、あるデ
ィレイドＡＤＤ命令の実行時期に到達していない時点で
も、ＡＬＵ４６１は、新たなディレイドＡＤＤ命令を受
け入れることができる。従って、命令のスケジューリン
グの自由度をさらに上げることができ、プログラムサイ
ズの減少すなわち命令メモリの容量削減を図ることがで
きる。また、より高速にプログラムを実行することがで
きる。なお、ここでは各演算ユニットにおいて２つの遅
延命令レジスタが設けられている例を示したが、設置数
をさらに多くしてもよい。

【００７７】

【発明の効果】以上のように、請求項１記載の発明によ
れば、遅延命令を有するマイクロプロセッサを、ディレ
イド分岐命令で指定された遅延量に応じたプログラムカ
ウンタ値を保持するように構成したので、ディレイド分
岐命令のデコード時点から実行時点までの間に割り込み
等のＰＣの値を変化させる事象が生じたとしても確実に
分岐命令が実行される効果がある。

【００７８】請求項２記載の発明によれば、遅延命令を
有するマイクロプロセッサを、各演算ユニットがディレ
イド演算命令の固定のまたは可変の遅延量に応じた値を
保持するように構成したので、命令スケジューリングの
自由度を向上させることができる効果がある。

【００７９】請求項３記載の発明によれば、遅延命令を
有するマイクロプロセッサを、各演算ユニットがディレ
イド演算命令で指定された任意の遅延量に応じた値を保
持するように構成したので、プログラムの実行に要する
サイクル数をより少なくでき、その結果、命令メモリの
容量を削減できるとともにプログラム実行時間を短縮で
きる効果がある。

【００８０】請求項４記載の発明によれば、遅延命令を
有するマイクロプロセッサを、各演算ユニットがディレ
イド演算命令で指定された遅延量に応じたＰＣ値を保持
するように構成したので、プログラムの実行に要するサ
イクル数をより少なくできるとともに、ディレイド演算
命令のデコード時点から実行時点までの間に割り込み等
のＰＣの値を変化させる事象が生じたとしても確実に演
算が実行される効果がある。

【００８１】請求項５記載の発明によれば、遅延命令を
有するマイクロプロセッサを、各演算ユニットに複数の
遅延命令保持手段が設けられるように構成したので、命
令のスケジューリングの自由度を上げることができる効
果がある。

【００８２】請求項６記載の発明によれば、遅延命令を
有するマイクロプロセッサを、命令実行部が複数演算を
同時に実行するように構成したので、命令のスケジュー
リングの自由度をさらに上げることができ、その結果、
プログラムの実行に要するサイクル数をさらに少なくで
きる効果がある。

【図面の簡単な説明】

【図１】この発明の実施の形態１によるマイクロプロ
セッサの構成を示すブロック図である。

【図２】マイクロプロセッサの命令フォーマットを示
す説明図である。

【図３】演算フィールドの詳細な内容を示す説明図で
ある。

【図４】マイクロプロセッサのレジスタ構成を示す説
明図である。

【図５】ＰＳＷの詳細内容を示す説明図である。

【図６】マイクロプロセッサの並列２命令実行時のパ
イプライン動作を示す説明図である。

【図７】マイクロプロセッサのシーケンシャル命令実
行時のパイプライン動作を示す説明図である。

【図８】この発明の実施の形態１によるマイクロプロ
セッサの構成を示すブロック図である。

【図９】ディレイド分岐命令の基本的なフォーマット
を示す説明図である。

【図１０】幾つかのディレイド分岐命令の例を示す説
明図である。

【図１１】ディレイド分岐命令、ディレイドジャンプ
命令およびディレイドサブルーチンコール命令が、同一
フォーマットでどのように実現されるのかを示すための
説明図である。

【図１２】ディレイド分岐命令を含むプログラムの一
例を示す説明図である。

【図１３】ディレイド分岐命令を含むプログラムの他
の例を示す説明図である。

【図１４】この発明の実施の形態２によるマイクロプ
ロセッサにおける命令デコード部分および命令実行部分
を示すブロック図である。

【図１５】２演算を同時に実行する命令配置の一例を
示す説明図である。

【図１６】プログラムの一例を示す説明図である。

【図１７】図１６に示された各命令にもとづく２演算
を同時に実行する命令配置を示す説明図である。

【図１８】この発明の実施の形態２によるマイクロプ
ロセッサにおけるＰＳＷの一例を示す説明図である。

【図１９】この発明の実施の形態３によるマイクロプ
ロセッサにおける命令デコード部分および命令実行部分
を示すブロック図である。

【図２０】従来のパイプライン制御方式によるマイク
ロプロセッサの処理シーケンスを示すシーケンス図であ
る。

【図２１】２演算を同時に行うマイクロプロセッサに
おける命令デコーダおよび命令実行部の部分の一般的な
構成を示すブロック図である。

【図２２】プログラムの一例を示す説明図である。

【図２３】命令のスケジューリングの一例を示す説明
図である。

【符号の説明】

２命令デコードユニット（命令デコーダ）、３メモ
リユニット（命令実行部）、４整数演算ユニット（命
令実行部）、１３，３６５，４６５ＰＣ制御部、３６
１，４６１ＡＬＵ（演算ユニット）、３６２，３６
４，３６８，３７０遅延命令レジスタ（遅延命令保持
手段）、３６３，４６３乗算器（演算ユニット）、３
６６遅延分岐命令レジスタ（遅延分岐命令保持手
段）、３６７，４６７メモリ制御部（演算ユニッ
ト）、３６９，４６９シフタ（演算ユニット）。

Claims

【特許請求の範囲】

【請求項１】命令をデコードする命令デコーダと、前
記命令デコーダの出力に従って命令を実行する命令実行
部とを備えた遅延命令を有するマイクロプロセッサにお
いて、前記命令実行部におけるプログラムカウンタ値を
制御するＰＣ制御部は、遅延分岐命令の分岐先を示す値
および遅延分岐命令で指定された遅延量に応じたプログ
ラムカウンタ値を保持する遅延分岐命令保持手段を備え
たことを特徴とする遅延命令を有するマイクロプロセッ
サ。
【請求項２】命令をデコードする命令デコーダと、前
記命令デコーダの出力に従って命令を実行する命令実行
部とを備えた遅延命令を有するマイクロプロセッサにお
いて、前記命令実行部における演算ユニットは、遅延演
算命令による演算内容および遅延演算命令による演算の
実行開始を示す値を保持する遅延命令保持手段を備えた
ことを特徴とする遅延命令を有するマイクロプロセッ
サ。
【請求項３】遅延命令保持手段は、遅延演算命令で指
定された遅延量に応じた値を保持することを特徴とする
請求項２記載の遅延命令を有するマイクロプロセッサ。
【請求項４】遅延命令保持手段は、遅延演算命令で指
定された遅延量に応じたプログラムカウンタ値を保持す
ることを特徴とする請求項３記載の遅延命令を有するマ
イクロプロセッサ。
【請求項５】各演算ユニットは、複数の遅延命令保持
手段を有する請求項３または請求項４記載の遅延命令を
有するマイクロプロセッサ。
【請求項６】命令実行部は、複数演算を同時に実行す
る請求項１から請求項５のうちのいずれか１項記載の遅
延命令を有するマイクロプロセッサ。