JP2000513854A

JP2000513854A - タグビットのスタック・キャッシュを用いて厳密なガーベッジ・コレクションを支援するための装置及びその方法

Info

Publication number: JP2000513854A
Application number: JP10546328A
Authority: JP
Inventors: エイゲセン、オール; ヘラー、スティーブン・ケイ; オコナー、ジェイムス・マイケル; スティール、ガイ・エル・ジュニア; トレンブレイ、マーク
Original assignee: サン・マイクロシステムズ・インク
Priority date: 1997-04-23
Filing date: 1998-04-23
Publication date: 2000-10-17
Also published as: WO1998048354A1; US6101580A; EP0912942B1; EP0912942A1; DE69802056D1

Abstract

(57)【要約】プログラム・スタック内で参照とプリミティブ値を本質的に区別しないコンピュータ・システムにおいて、厳密なガーベッジ・コレクションを支援するための方法及びその装置はプログラム・スタックと関連して動作するスタック・タグ・キャッシュを使用してプロセス・スタックの全てのエントリにタグ項目を供給する。タグ項目の値は、スタック・エントリが別のメモリ・ロケーションへの参照か又はプリミティブ値か、即ち整数か又は浮動小数点数かを表わす。タグ項目の構成と値はプログラム・スタックの変化に相関する。スタック・タグ・キャッシュはトラップ又はコンテクスト・スイッチの発生時にキャッシュ内容を入れ換えるための装備、並びに意図した命令オペランドの種類でタグ値を冗長検査するための手段を含む。

Description

【発明の詳細な説明】タグビットのスタック・キャッシュを用いて厳密なガーベッジ・コレクションを支援するための装置及びその方法関連出願への相互参照本出願は、本出願日と同日に出願され共に譲渡された３件の特許出願の内の１件であり、その３件の残りの２件は、発明者Ole Agesen及びDavid Ungarによる「プログラム・データスタックのライブポインタ・マスクをデルタ符号化するための方法及び装置」と題する米国特許出願第ＸＸ／ＸＸＸ,ＸＸＸ号(訳注：出願番号未送達のため)、及び、発明者Guy L．Steele，Jr.による「スタック内容をサブスタックに分離することで厳密（exact）なガーベッジ・コレクションを支援するための装置及びその方法」と題する米国特許出願第ＸＸ／ＸＸＸ,ＸＸＸ号（訳注：出願番号未送達のため）である。上記同時出願中の特許出願の内容は参照により本願発明に含まれる。発明の分野本願発明はデータ処理システムに関し、更に詳しくは、メモリ管理を支援するための装置及ひその方法に関する。発明の背景データ処理システム内で最も重要な資源の１つが実行中のタスクでの利用に直接使用可能なメモリ量である。そのためメモリの効率的利用とメモリ管理ストラテジには多くの関心が向けられて来た。メモリ管理で重要な概念は、メモリをタスクに割り当て、割り当て解除し、しかるのち再請求する方法である。メモリの割り当て解除と再請求は実行プログラムによって明示されて制御されるか、未使用のメモリを検索して再請求する別の特殊用途プログラムによって実行されるが、明示的に割り当て解除されることはなかった。「ガーベッジ・コレクション(garbage collection)」は、記憶管理とくに自動メモリ再請求を実行するために使用されるアルゴリズムのクラスを表わすために技術文献や関連技術分野で用いられる用語である。参照カウント、マーク−スイープ、世代ガーベッジ・コレクション・アルゴリズムを含め多くの周知のガーベッジ・コレクション・アルゴリズムが存在する。これらの技術とその他のガーベッジ・コレクション技術はRichard Jones及びRaphael Lins著「Garbage Collection，Algorithms For Automatic Dynamic Memory Management」John Wiley & Sons出版社、1996年に詳細に説明されている。残念なことに、ガーベッジ・コレクションについて記述された技術の多くが、以下に説明するように実装上の問題を惹起する特有の条件を有している。本明細書の目的のために「オブジェクト」という言葉は計算機システム（comp uting system）のメモリの中に表現されるデータ構造を表わす。オブジェクトという言葉の用法は、「オブジェクト指向」システムでの「オブジェクト」という言葉の用法とは明らかに違い、オブジェクト指向システムではオブジェクトには関連「メソッド」、即ち関連するコード部分があり、このコードがオブジェクトの参照を介して呼び出される。しかし、本願発明はこうしたオブジェクト指向システムに応用できるものである。オブジェクトは「参照」により、又は、データ構造にアクセスするために使用できる少量の情報によって検索できる。参照を実現する１つの方法としては、「ポインタ」又は多数ビットの情報を使用する「マシン・アドレス」を用いるが、他の実現方法も可能である。汎用プログラミング言語及びその他プログラムされたシステムでは参照を使用してオブジェクトを特定しアクセスすることが多い。こうしたオブジェクトはそれ自体にデータ、例えば整数又は浮動小数点数への参照、及び、更に別のオブジェクトへの参照を含む。このようにして、各々の参照がオブジェクトをポイントし、そのオブジェクトが更に別のオブジェクトをポイントするといった参照の連鎖が作成できる。ガーベッジ・コレクション技術は、直接的手段又はポインタ連鎖経由のどちらかで実行プログラムからデータ構造に到達できなくなる時点を決定する。データ構造に到達できないようになったときに、データ構造が占有しているメモリを再請求しプログラムから明示的に割り当て解除されていなかったとしても再使用できる。有効なものにするには、ガーベッジ・コレクション技術は、第１に実行プログラムへ直接アクセス可能な参照を認識し、第２に、オブジェクトへの参照が与えられたらそのオブジェクト内部に含まれる参照を認識してガーベッジ・コレクタが参照連鎖を一時的にトレースできるようにしなければならない。「再配置」ガーベッジ・コレクタとして知られているガーベッジ・コレクタのサブクラスは実行プログラムによって未だ到達できるデータ構造を再配置する。データ構造の再配置はデータ構造のコピーをメモリの別の領域に作り、次にオリジナルのデータ構造へ到達可能な参照全部を新しいコピーへの参照に置換する。オリジナルのデータ構造によって占有されていたメモリが再請求され再使用される。再配置ガーベッジ・コレクタは実行プログラムによって使用されたメモリを圧縮することでメモリ断片化を減少させる望ましい特性を有している。ガーベッジ・コレクション処理中に再配置ガーベッジ・コレクタは参照を変更するため、参照を認識し、かつガーベッジ・コレクションの目的で変更することのできない非参照情報、例えばデータと区別することが重要である。結果的に完全再配置ガーベッジ・コレクタは「厳密(exact)」ガーベッジ・コレクタとして知られているガーベッジ・コレクション法のサブクラスに属し、メモリ内の任意の情報部分が参照か又はプリミティブ値かの知識を必要とする。本明細書の目的のためには、「プリミティブ値」又は「プリミティブ・データ」は参照として機能しないデータ、例えば整数又は浮動小数点数などと定義する。厳密ガーベッジ・コレクションの使用を容易にするために、ある種の計算機システムでは全てのメモリ・ロケーションについて「タグ付き」表現を用いてデータから参照を明確に区別している。こうしたシステムでは、参照と、例えば整数や浮動小数点数などのプリミティブ・データがメモリ内において常に参照がプリミティブ値とは異なるビットパターンを有するような方法で表現される。これはメモリ・ロケーションを保持するビットに加えてタグビットを各々のメモリ・ロケーションに含めることによって一般に行なわれるものである。参照値を保持するメモリ・ロケーションのタグ・ビットはデータ値を保持するメモリ・ロケーションのタグビットとは必ず異なっている。ＭＩＴＬＩＳＰマシンはガーベッジ・コレクションを用いた最初のアーキテクチャの１つで、明示的にメモリ値にタグを付けた単一のスタックを有していた。これの後継機でマサチューセッツ州ケンブリッジのシンボリクス社（Symbolics，Inc.，Cambridge，ＭＡ）から市販されているシンボリクス3600（Symbolics 3600）も明示的にタグの付いたメモリ値を使用している。シンボリクス3600は36ビット・ワードを用い、そのうちの４ビットをタグ情報に永久に割り当てたことにより、単一スタック内で32ビット参照又は32ビットプリミティブ・データのどちらかに対応することができた。このようにすると、36ビット・ワード内の参照のためのビットパターンはプリミティブ整数又は浮動小数点値のためのビットパターンとは必ず識別することができた。永久に割り当てられたタグビットは、計算データを記憶するために使用することのできるメモリ空間を消費するという欠点を有している。結果的に、多くのコンピュータ・システムではメモリ・ワード全体をデータ値の表現に割くことができる「タグ無し」データ表現を使用している。こうしたシステムでは、同じビットパターンが参照又はプリミティブ値を表わすことがある。その結果、こうしたシステムでは、参照とプリミティブ値の間の区別は、外部的な考察又は表現、例えばデータに対して演算すべき命令、又はオブジェクト内部でのデータ位置などで行なわれることが多い。しかし、この区別を行なうために外部的考察を使用することは全てのシステムで可能であるというものではなかった。例えば、Javaプログラミング言語は本来はタグ無しデータ表現を使用するシステムで用いるように設計されていた。Javaプログラミング言語は、ジェームス・ゴスリング(James Gosling)、ビル・ジョイ(Bill Joy)、ガイ・スティール(Guy Steele)共著「Java言語仕様("The Java Language Specification")」（Addison -Wesley出版社、1996年）と題する書籍に詳細に記述されている。Java言語は、ティム・リンドーム(Tim Lindholm)、フランク・イエリン（Frank Yellin）共著「Java仮想マシン仕様("The Java Virtual Machi ne Specification")」（Addison-Wesley出版社、1996年）に詳細に記述されているJava仮想マシン仕様によって指定される特性を備えた計算機システム上で動作するように設計された。 Java仮想マシン（ＪＶＭ）仕様によれば、32ビット・メモリワードを使用する計算機システムにおいてローカル変数又はスタック・スロットが32ビット整数、 32ビット浮動小数点数、又は32ビット参照のいずれかを含む。結果として、タグ付きデータ表現は全ての場合で使用できるものではなくなる(32ビット・コンピュータでタグ付きデータ表現を使用するプログラミング言語は典型的には整数の大きさを30ビットに制限している)。しかし、Java命令を検証してデータから参照を区別することは、多くの命令が参照とデータに対して無差別に（indiscrimi nately）演算するため、全ての場合において可能であるというものではない。結果的に、ガーベッジ・コレクションの目的のために、タグ付きデータ表現が許されておらず参照とデータを全ての場合で区別できるような命令セットを有していないシステムにおいて参照とデータを区別する必要がある。発明の要約本願発明の原理によれば、タグ情報をプログラム・スタック上に現われる各データ項目に関連付けることによりデータ値から参照値が区別される。タグ情報はスタックが配置されるメモリ領域とは別のメモリ領域に記憶される。プログラム動作中に、タグ情報は各スタック項目に関連付けられプリミティブ・データ値から参照値を識別するために使用できる。１つの実施態様によれば、関連付けは、タグ情報メモリ領域からロードされスタック内に見られるデータ項目の少なくとも幾つかの項目についてのタグ情報を記憶している小さなハードウェアであるスタック・タグキャッシュ・メモリを用いて実行される。次にスタック上の参照値はキャッシュメモリからタグ情報を取り出してスタック項目に関連したタグ情報を検証することによりプリミティブ・データ値から区別することができる。本願発明の１つの観点ではプログラム・スタック内の多ビット項目のセットの各々について追加の（extra）１ビットを記憶するキャッシュメモリを含むスタック・タグキャッシュ機構の使用を想定している。プロセッサがスタック上の多ビット・ワードにアクセスするときは常に、本願発明のスタック・タグキャッシュ機構がスタック・ワードのメモリアドレスを検証して２種類の動作の内の１種類の動作を行う。タグ情報がキャッシュメモリ内に記憶されている項目セット内にスタック・ワードがあることをメモリアドレスが示す場合、本願発明の機構はスタック項目に関連する追加ビットの現在値を供給し、これによってスタック項目が参照か又はプリミティブ値かの区別ができる。本願発明の機構ではキャッシュメモリをこの時点で更新しても良い。これ以外に、本願発明のキャッシュ機構はプロセッサに信号を出してスタック項目のメモリアドレスがタグ情報の記憶されているセット内にはないことを表わすトラップ条件をプロセッサに生成させることができる。これに応じて、プロセッサは主メモリの選択されたメモリ・ロケーションからこの関連付けられたタグ情報を取り出し、このタグ情報をスタック・タグキャッシュ・メモリ内に記憶することができる。別の観点では、本願発明のスタック・タグキャッシュ機構は更に複数ビット・ワードを有するタグキャッシュ・メモリの内容をロードし記憶するためのデータ・パスを提供し、これによってトラップ処理を容易にし、並びに複数制御スレッド間でのコンテクスト・スイッチを行う過程でのタグキャッシュ・メモリの内容の保存及び再生（restore）を促進する。本願発明の更に別の観点では、データ・エントリのプログラム・スタックを有するコンピュータ・システムで使用するためのスタック・タグキャッシュは、複数のタグ項目を記憶するように構成したアドレス可能なメモリを含み、データ・エントリに関連した各々のタグ項目は関連付けられたデータ・エントリが参照又はプリミティブ値を含むかどうか識別する値を有する。スタック・タグキャッシュは更に、スタック・エントリに関連したタグ項目がアドレス可能なメモリ内に存在しているかどうかを決定するように構成された比較論理と、アドレス可能なメモリに供給されたアドレスに応答する出力論理であって、アドレスによって選択されたタグ項目の値を提示するように構成された出力論理も含む。アドレス可能メモリ内に記憶されていないタグビットの値を書き込むように構成された論理、及び少なくとも２個のタグ項目値の同時アドレシングと同時提示を可能にする論理が含まれることもある。本願発明の更なる観点では、第１のメモリ領域内に記憶されたスタック・エントリ内に配置されたデータが参照か又はプリミティブ値かを決定するための方法は、第２のメモリ領域内に複数のタグ項目を保持するステップであって、この各々のタグ項目がスタック・エントリに関連付けられていることを特徴とするステップと、選択したスタック・エントリに対応するタグ項目の１つを取り出すステップと、対応するスタック・エントリ内に含まれるデータが参照又はプリミティブ値かどうかを取り出したタグ項目の値から決定するステップとを含む。本願発明の更に別の観点では、プロセッサとメモリを有するコンピュータ・システムは更にプロセッサに応答して複数のタグ項目を記憶するように構成されたスタック・タグキャッシュを含む。各タグ項目はスタック・エントリ内のデータに関連付けられスタック・エントリ内に含まれるデータが参照又はプリミティブ値かどうかを表わす値を有する。スタック・タグキャッシュは更に選択したスタック・エントリに対応して取り出されたタグ項目がキャッシュ内に常駐しているかどうかを決定するように構成された論理と、メモリアドレスに応答するロジックであって、スタック・タグキャッシュに適用されたアドレスによって選択されたタグ項目の値をキャッシュ出力に提示するように構成された論理とを含む。本願発明の更なる観点では、プロセッサとメモリとを有するコンピュータ・システムで使用するコンピュータ・プログラム製品はコンピュータ・プログラムコードが実現されるメモリであって、コンピュータで使用可能なメモリを含み、このプログラムコードは複数のタグ項目をメモリ内に保持するためのプログラムコードであって、この各タグ項目がスタック・エントリ内のデータに関連付けられていることを特徴とするプログラムコードと、選択したスタック・エントリに対応する複数のタグ項目のうちの１つを取り出すためのプログラムコードと、メモリアドレスに応答するプログラムコードであって、選択したスタック・エントリに関連付けられたタグ項目の値を提示するためのプログラムコードとを含む。図面の簡単な説明本願発明の上記及びその他の特徴、目的、利点は添付の図面との関連で以下の説明を参照することによってより良く理解されよう。図面において、図１Ａは、本願発明で使用するのに適したコンピュータ・アーキテクチャを示す摸式的ブロック図である。図１Ｂは、従来のプログラム・データスタックの概念図である。図１Ｃは、本願発明で使用するのに適した、フレームを含むプログラム・スタックの概念図である。図２は、本願発明の第１の実施態様によるスタック・タグキャッシュの摸式的ブロック図である。図３は、本願発明の第２の実施態様によるスタック・タグキャッシュの摸式的ブロック図である。図４は、スタック項目読み込み動作中にスタック・タグ情報を取り出すための方法を実現する例示的ルーチンのフローチャートである。図５、はスタック項目書き込み動作中にスタック・タグ情報を取り出すための方法を実現する例示的ルーチンのフローチャートである。発明を実施するための最良の形態本願発明は厳密ガーベッジ・コレクション・アルゴリズムの要件に対処する方法並びに装置を提供する。更に詳しくは、本願発明は参照とプリミティブ値が同じサイズとなるようにデータ表現の使用を構造が奨励しているコンピュータ・アーキテクチャでタグ無しデータ表現が名目上使用されているデータスタック内で参照を非参照から区別する要件に対処する。例示の実施態様では、Javaプログラミング言語とJava仮想マシン仕様を実装しているコンピュータ・システムを参照して説明しているが、本願発明は同様の要件を有する他のコンピュータ・システムにも等しく応用可能である。更に詳しくは、本願発明はオブジェクト指向プログラミング・システム及び非オブジェクト指向プログラミング・システムの両方に実装できる。更に、本願発明は単一スレッドと単一のプログラム・スタックを有するシステム、並びに複数の同時的プログラム・スタックを有するマルチスレッド・システムでも実装できる。本願発明を詳細に説明する前に、本願発明を使用するのに適したコンピュータ・システム、プログラム・スタック構造、Java仮想マシン環境に準拠したプログラミング命令の説明を、読者の利便のために提供する。コンピュータ・システムとプログラム・スタック・アーキテクチャ図１Ａは、本願発明を実装できるコンピュータ・システムのシステム・アーキテクチャを示す。図１に例示したコンピュータ・システムは説明のためだけのものである。説明では特定のコンピュータ・システム、例えばＩＢＭＰＳ／２パーソナル・コンピュータなどを説明する際に共通に使用される用語を参照するが、説明並びに概念はネットワーク・コンピュータ、ワークステーション、及びメインフレーム・コンピュータなど図１Ａと異なるアーキテクチャを有するその他のコンピュータ・システムにも等しく適用される。コンピュータ・システム100は、従来のマイクロプロセッサで実現し得る中央演算処理ユニット（ＣＰＵ）105、一時的な情報記憶のためのランダム・アクセス・メモリ（ＲＡＭ）110、永久的な情報記憶のためのリード・オンリー・メモリ（ＲＯＭ）115を含む。メモリ・制御装置120はＲＡＭ110を制御するために提供される。バス130はコンピュータ・システム100の構成要素を相互接続する。バス・コントローラ125はバス130を制御するために提供される。割り込みコントローラ135 はシステム構成要素からの各種割り込み信号を受信し処理するために使用される。大容量記憶はディスケット142、ＣＤ−ＲＯＭ147又はハードディスクドライブ装置152により提供される。データ及びソフトウェアはリムーバブル媒体例えばディスケット142及びＣＤ−ＲＯＭ147経由でコンピュータ・システム100と交換できる。ディスケット142はディスケット・ドライブ装置141に挿入でき、当該装置がコントローラ140によりバス130に接続される。同様に、ＣＤ−ＲＯＭ147はＣＤ−ＲＯＭドライブ装置146に挿入でき、当該装置はコントローラ145によりバス130へ接続される。ハードディスク152は固定ディスクドライブ装置1５1の一部であり、当該装置はコントローラ150によりバス130へ接続される。コンピュータ・システム100へのユーザ入力は多数の装置により提供される。例えば、キーボード156とマウス157はコントローラ155によりバス130へ接続される。オーディオ変換器196はマイクロホン及びスピーカの両方として機能することも可能であり、図示してあるようにオーディオ・コントローラ197によりバス1 30へ接続される。。他の入力装置、例えばペン及び／又はタブロイドなども必要に応じてバス130と適当なコントローラ及びソフトウェアで接続できることは当業者には明らかなはずである。ＤＭＡコントローラ160はシステムＲＡＭ110への直接メモリアクセスを実行するために提供される。視覚的表示はビデオ・コントローラ165によって生成され、当該コントローラがビデオディスプレイ170を制御する。コンピュータ・システム100はバス191及びネットワーク195によって模式的に図示されているローカル・エリア・ネットワーク（ＬＡＮ）又は広域ネットワーク（ＷＡＮ）へシステムを相互接続できるようにする通信アダプタ 190も含む。コンピュータ・システム100の動作はシングルスレッド化又はマルチスレッド化されているオペレーティング・システム・ソフトウェアによって一般に制御され調節されている。オペレーティング・システムはシステム資源の割り当てを制御したり、特にプロセスのスケジューリング、メモリ管理、ネットワーク及びＩ／Ｏサービスなどのタスクを実行する。従来のコンピュータ・システムにおいて、進行中の計算はプロシージャ・コールをサポートするためと中間計算量例えば参照やプリミティブ値を保持するための「スタック」を使用する。スタックは内部メモリの未使用部分を含み、これが一時的記憶に必要とされるレジスタ数を減らしプログラム内で必要とされるステップ数を減少させる一方でプッシュ・ダウン型記憶を容易にする。図１Ｂはシステム・メモリに常駐する従来のプログラム・スタックの構造を概念的に示している。メモリ内の３箇所の重要な位置でスタックを定義する：スタック・ベース、スタックポインタ即ち現在のスタックの最上部、及びスタック・リミットである。典型的にはこれらの位置は３個のマシン・レジスタに保持されているメモリアドレスによって識別される。データをスタック上にプッシュすべき場合、スタックポインタに最も近い未使用のメモリ・ロケーションに格納される。スタックポインタはスタック・リミットに向かって前進する。スタックポインタがスタック・リミットに近付きすぎた場合、スタックは「オーバフローした」といわれ、例えばエラー信号を出すか又はスタックを保持するために更にメモリを割り当てるといった、何らかの特別な動作を取る必要がある。データをスタックからポップすべき場合、スタックポインタはスタック・ベースに向かって後退し、データを保持しているメモリを又未使用メモリと見なせるようにする。スタックポインタがスタック・ベースに近付きすぎると、スタックは「アンダーフローした」と呼ばれ、例えばエラー信号を出すか又は更にスタック・データを保持しているメモリの別の領域にスイッチするなど何らかの特別な動作を取る必要がある。実装によっては、スタック・ベースはスタック・リミットより高いメモリアドレスに常駐することもある。 Javaプログラミング言語においては、スタック上のデータは図１Ｃに図示したように「フレーム」にグループ化されている。各フレームはサブルーチン呼び出し又はメソッド呼び出しの１つのレベルに対応する。どのフレームも３つの領域に分割される：パラメータ、ローカル変数、評価テンポラリである。パラメータはスタック・ベースに最も近く評価テンポラリはスタック・ベースから最も遠い。これら３つの領域の各々はそのフレームに対して実行される特定のサブルーチンによっては空になることがある。サブルーチンを実行すると、評価テンポラリの個数はスタックに項目をプッシュするか又はポップすると変化するが、パラメータとローカル変数の個数は変化しないのが典型である。その結果、異なるフレームが異なるサイズを有することができる。パラメータとローカル変数のアドレシングを単純化するには、典型的にはマシン・レジスタに保持される「フレームポインタ」である追加アドレスで現在のスタック・フレーム内のパラメータ領域の開始を表示する。命令は現在のフレームポインタからのオフセットを指定することにより現在のフレーム内でパラメータ又はローカル変数にアクセスできる。サブルーチン又はメソッドを呼び出すべき場合、評価スタック最上部にある幾つかの項目は新規フレーム内部のパラメータになる。現在のフレームポインタはプログラム・カウンタと一緒にスタック上に保存される。次にフレームポインタに新規フレームのアドレスがロードされ、一方でプログラム・カウンタにサブルーチンのコードのアドレスがロードされる。ある種の計算機システムは「マルチスレッド化」されており、この場合、多数進行する計算プロセスが単一のアドレス空間又はオブジェクトの単一プールを共有している。こうしたプロセスのセットは１つ以上のスタック又は各プロセスに１つのスタックを有するのが代表的である。こうした多数のプロセスは単一の記憶管理ストラテジによって操作することができる。 Javaプログラミング命令 Javaプログラミング言語をサポートするコンピュータ・システムにおいて、スタック上で演算する命令の多くはデータを参照データとするかプリミティブ・データとするかを指定する。例えば、「iadd」命令はスタックから２個のオペランドをポップし、この場合のオペランドは整数でなければならない。これらの和が整数としてスタックにプッシュされる。同様に「aaload」命令は２項目をスタックからポップし、この場合の項目は参照と整数インデックスとからなる配列への参照でなければならない。この命令は配列からの参照をインデックス値で示されたように選択し、選択した参照のコピーをスタックにプッシュする。逆に、Java仮想マシンの幾つかの命令はオペランドが参照又はプリミティブ・データに演算するかどうかを指定しておらず、無差別にどちらの種類のデータでも動作することを想定している。例えば、「pop」命令はスタックから１つの項目をポップし、参照又は32ビット・プリミティブ値のどちらかを破棄するために使用することがある。「dup」命令はスタック最上部にこの項目のコピーをプッシュし、参照又は32ビット・プリミティブ値を複製するために使用できる。「dup2」命令は１個の64ビット・プリミティブ値、２個の32ビット・プリミティブ値、２個の参照、又は１個の参照と１個の32ビット・プリミティブ値をいずれかの順番で複製するために使用できる。こうした「無差別な」使用を許容しているJava仮想マシン命令の完全なリストは次の通りである：全ての命令記述において：ｘ1は命令が実行を開始した時にスタックの一番上にある項目を表わす。ｘ2は命令が実行を開始した時にスタックの一番上から２番目の項目を表わす。ｘ3はスタックの一番上から３番目にある項目を表わす。 x4は命令が実行を開始した時に参照スタックの一番上から４番目にある項目を表わす。 Pop ｘ1をスタックからポップして破棄する。 Pop２ｘ1をスタックからポップして破棄し、次にｘ2をスタックからポップして破棄する。 dup ｘ1のコピーをスタックにプッシュする。 dup２ｘ2のコピーをスタックにプッシュし、次にｘ1のコピーをスタックにプッシュする。 dup＿ｘ1 ｘ1をスタックからポップし、ｘ2をスタックからポップし、ｘ1のコピーをスタックにプッシュし、ｘ2のコピーをスタックにプッシュし、ｘ1のコピーをもう１つスタックにプッシュする。 dup＿ｘ2 ｘ1をスタックからポップし、ｘ2をスタックからポップし、ｘ3をスタックからポップし、ｘ1のコピーをスタックにプッシュし、ｘ2のコピーをスタックにプッシュし、ｘ1のコピーをもう１つスタックにプッシュする。 dup２＿ｘ1 ｘ1をスタックからポップし、ｘ2をスタックからポップし、ｘ3をスタックからポップし、ｘ2のコピーをスタックにプッシュし、ｘ1のコピーをスタックにプッシュし、ｘ3のコピーをスタックにプッシュし、ｘ2のコピーをもう１つスタックにプッシュし、ｘ1のコピーをもう１つスタックにプッシュする。 dup２＿ｘ2 ｘ1をスタックからポップし、ｘ2をスタックからポップし、ｘ3をスタックからポップし、ｘ4をスタックからポップし、ｘ2のコピーをスタックにプッシュし、ｘ1のコピーをスタックにプッシュし、ｘ4のコピーをスタックにプッシュし、ｘ3のコピーをスタックにプッシュし、ｘ2のコピーをもう１つスタックにプッシュし、ｘ1のコピーをもう１つスタックにプッシュする。 swap ｘ1をスタックからポップし、ｘ2をスタックからポップし、ｘ1のコピーをスタックにプッシュし、ｘ2のコピーをスタックにプッシュする。 Java仮想マシンの多くの実装において、命令の実際の実装は作業量を減少するように最適化できる。例えば、「swap」演算は最上部スタック項目２つを読み込んで各々の値を別のスタック・スロットに書き込み、実際にスタックポインタの調整は行なわない。更に、Java仮想マシンの幾つかの実装ではいわゆる「クイック」命令を使用している。クイック命令はインターネット上に送信されるような Javaでコンパイルしたプログラムでは有効でない追加命令コードである。しかし、ＪＶＭ実装は命令が実行される最初の時にリンクを解決し、更に命令をもっと高速な「クイック」バリアント（variant）で置き換えることによって、例えば別のクラスで定義されているフィールドの名前などシンボリック・リンクの解決を必要とする幾つかの遅い命令を処理することが時々ある。時にはこうしたクイック・バリアントか参照とプリミティブ・データの両方を処理するために使用される。こうしたクイック命令には次のようなものが含まれる： getfield＿quick getfield＿quick＿w getstatic＿quick ldc＿quick ldc＿w＿quick putfield＿quick＿w putstatic＿quick これらのクイック命令は「無差別」であり参照データ又はプリミティブ・データに対して使用できる。クイック命令は無差別でない遅い命令に置き換えられる。残念ながら、その特定の命令が必ず参照又はデータを転送するかどうかを表わし遅い命令又はそのオペランドに関連していた情報は、遅い命令が無差別であらかじめ解決されているがそれらは等価なクイック命令によって置き換えられる時に失われる。 Java仮想マシンの実装は「ベリファイア(verifier)」と呼ばれるプロセスを含み、これの目的の１つは、ロードされた時に全てのメソッドのコードを検証して命令シーケンスが何らかの制約にしたがうことを保証することである。更に詳しく説明すると、ベリファイアは、静的に、コードが実行される前に、スタック上の項目が参照であることを命令が想定している場合に、その特定の命令のあらゆる実行で参照であるように保証し、又スタック上の項目がプリミティブ・データであることを命令が想定している場合に、その特定の命令のあらゆる実行で項目が参照であるように保証する。検証処理の一部として、無差別な使用を許容する標準（非クイック）ＪＶＭ命令の特定の発生時に、即ちpop、pop2、dup、dup2、dup＿ｘ1、dup＿ｘ2、dup2＿ｘ1、dup2＿x2、又は、swap命令で、ベリファイアはその命令の何らかの特定のスタックオペランドが必ず参照であるか絶対に参照でないかのどちらかを決定できる。 Java仮想マシンはフレームのベースに対して計算したアドレスを介してアクセスされアドレスが代表的にはフレーム・ポインタ・レジスタに保持されているローカル変数に対して演算する次のようなバイトコード命令を提供する： iload iload＿0 iload＿1 iload＿2 iload＿3 fload fload＿0 fload＿1 fload＿2 fload＿3 lload lload＿0 lload＿1 lload＿2 lload＿3 dload dload＿0 dload＿1 dload＿2 dload＿3 aload aload＿0 aload＿1 aload＿2 aload＿3 istore istore＿0 istore＿1 istore＿2 istore＿3 fstore fstorｅ＿0 fstore＿1 fstore＿2 fstore＿3 lstore lstore＿0 lstore＿1 lstore＿2 lstore＿3 dstore dstore＿0 dstore＿1 dstore＿2 dstore＿3 astore astore＿0 astore＿1 astore＿2 astore＿3 名前に下線（アンダースコア）と整数Ｋか含まれている上記に示したバイトコード命令はフレームのベースからオフセットＫにあるローカル変数にアクセスする。他のバイトコード命令は１つ又は２つ以上の追加命令バイトにオフセットを符号化することによってもっと広い範囲のオフセットが許容できる。名前に「load」が含まれている上記に示したバイトコード命令はスタック上にローカル変数の内容のコピーをプッシュする。名前に「store」が含まれているバイトコード命令はスタックから値をポップしてポップしたデータをローカル変数に記憶する。名前が「ａ」で始まるバイトコード命令は参照値と組み合わせて使用される。それ以外のバイトコード命令はプリミティブ値、即ち整数(integer )、浮動小数点数(float)、ロング(long)、ダブル（double）と組み合わせて使用される。スタック・タグキャッシュ本願発明は、各スタック・ワードについて追加タグビットを含め、通常のメモリ・ワードの幅を越えて各スタック・ワードの幅を効果的に増加させることにより、スタック内の参照とプリミティブ値の間の区別の問題に対処する。追加タグビットはデータを含むプログラム・スタックと相関する方法でプッシュ、ポップ、検証、更新し得るような疑似スタック方式で記憶される。この第２又は疑似スタックはタグキャッシュとしてハードウェア内に実現できる。本願発明の第１の実施態様によるスタック・タグキャッシュ200が図２に図示してある。スタック・タグ200はマルチポート・ランダム・アクセス・メモリ（ＲＡＭ）202とサポート論理204〜224を含む。例示の実施態様において、ＲＡＭ2 02は64×32ビットで、第１と第２の読み出しポート、１つの書き込みポート、及び「フロースルー」機能を有し、同じワードが同一クロックサイクルで読み出しと書き込み両方行なわれる場合にＲＡＭ202から読み出された値はそのクロックサイクルでＲＡＭ202に書き込まれる値と同じであるようにする。タグスタック・ローリミット・レジスタ204Ａとタグスタック・ハイリミット・レジスタ204Ｂは各々長さ30ビットで、タグスタックの各々ローリミット及びハイリミットを記憶するために使用する。中央演算処理ユニットはタグスタック・リミット・レジスタの内容を当業者には理解される方法で読み出し書き込みするための適当なコマンドを実行する。４個の30ビット・コンパレータ206Ａ〜Ｄは各々が１ビットの結果を発生する、即ち、第１の入力（図２ては左手の入力）が第２の入力（図２では右手の入力）より大きい場合には論理値１、それ以外には論理値０を用いてＲＡＭ202の読み出しポートに供給されたアドレスと、ハイ・タグスタック・リミット及びロー・タグスタック・リミットとを比較する。更に詳しく説明すると、タグスタック・ローリミット・レジスタ204Ａの出力がコンパレータ206Ａと206Ｃの第１の入力に供給される。タグスタック・ハイリミット・レジスタ204Ｂの出力はコンパレータ206Ｂと206Ｄの第２の入力に供給される。第１のメモリアドレスr1＿addr はコンパレータ206Ａの第２の入力とコンパレータ206Ｂの第１の入力に供給される。同様に、第２のメモリアドレスr2＿addrはコンパレータ206Cの第２の入力とコンパレータ206Dの第１の入力に供給される。コンパレータ206Ａと206Bの出力は２入力ＯＲゲート222Ａに供給され、その出力か論理値１の場合には第１のメモリアドレスr1＿addrのトラップ・リミットを表わす。同様に、コンパレータ20 6Ｃと206Ｄの出力は２入力ＯＲゲート222Ｂに供給され、その出力が論理値１の場合には第２のメモリアドレスr2＿addrのトラップ・リミットを表わす。第２の読み込みアドレスの11ビット部分（r2＿addr 12：２）は 11ビット・ラッチ212へ供給される。ラッチ212の11ビット出力は書き込みアドレスとしてＲＡＭ202に供給される６ビット部分（ｗ＿ addr 12：７）とデコーダ224へ供給される５ビット部分（ｗ＿addr ６：２）に分割される。第１の１ビット32対１マルチプレクサ214Ａは入力として、図示したように、ＲＡＭ202の第１の読み出しポートの３２ビット出力と、５ビット選択信号として第１の読み出しアドレスの５ビット部分（r1＿addr ６：２）を受信する。第２の１ビット 32対１マルチプレクサ214Ｂは、図示したように、入力としてＲＡＭ202の第２の読み出しポートの32ビット出力と、５ビット選択信号として第２のアドレス（r2 ＿addr ６：２）の５ビット部分を受信する。第１と第２の読み出しアドレスの６ビット部分（r1＿addr 12：７、r2＿addr 12：７）も同様に図示したようにＲＡＭ202へ供給される。マルチプレクサ214Ａの１ビット出力は第１のタグビットとして供用し、一方で、第２のマルチプレクサ214Ｂの１ビット出力は第２のタグビットとして供用し、これら両方がＣＰＵ105によって読み取り可能である。マルチプレクサ214Ａ〜Ｂの１ビット出力は１ビット４対１マルチプレクサ220 にも供給され、図示したようにこのマルチプレクサは入力に論理値０と論理値１も受信する。マルチプレクサ220は図示してあるようにこれの制御入力に２ビット書き込みビット選択信号（ｗ＿bit＿select １：０）を受信する。 32ビット・ラッチ208Ａは図示してあるように32ビット書き込みデータ信号（ｗ＿data 31：０）を受信する。ラッチ208Ａの出力は32ビット２対１マルチプレクサ216の第１の入力に供給される。マルチプレクサ216の32ビット出力は図示したようにＲＡＭ202の書き込みポートへ供給される。マルチプレクサ216は１ビット・ラッチ210Ｂから受信した１ビット制御信号によって制御される。ラッチ210Ｂへの入力は図示したように１ビット書き込みデータ選択信号（ｗ data select）である。ラッチ210Ａの出力は図示したようにＲＡＭ202へ供給される。第２の32ビット・ラッチ208Ｂは入力として、図示したようにRAM202の第２の読み出しポートの32ビット出力（r＿data ３1：０）を受信する。ラッチ208Ｂの出力は図示したように１ビット対１マルチプレクサ218Ａ〜ｎの各々の第１の入力に供給される。各マルチプレクサ218Ａ〜ｎの第２の入力は１ビット・ラッチ210Ｃから受信し、これの入力は図示したようにマルチプレクサ220の出力から受信する。各マルチプレクサ218Ａ〜ｎの出力は図示したようにマルチプレクサ2 16の第２の32ビット入力に供給される。各マルチプレクサ218への制御信号は図示したようにデコーダ224の32本の出力線のうちの１本により供給される。図示した実施態様において、多ビット信号のビットは「リトルエンディアン（ little-endian）」順序で番号が付けてある。例えば、32ビット信号はビット31 ：０（31から０まで、０を含む）として記述でき、ここで、多ビット信号を２進数として見なす場合にはビット31が最上位ビット、又ビット０が最下位ビットである。スタック・タグキャッシュ200の動作について以下で説明する。全てのクロックサイクルで、ＣＰＵ105は多くとも２つのスタック・ロケーションを読み込み多くとも１つのスタック・ロケーションに書き込むものと仮定する。更に、ＣＰＵ105が１つのスタック・ロケーションに書き込み２つのスタック・ロケーションも読み込む場合、読み込まれるスタック・ロケーションの一方は書き込まれるスタック・ロケーションと同じでなければならない。いずれか任意のクロックサイクルで、ＣＰＵ105はスタック・タグキャッシュ200に２つのスタック・ロケーションのメモリアドレスr1＿addrとr2 ＿addrを提示する。これらのアドレスはバイトアドレスされるものと仮定するが、ワード整列されるべきである。従って、アドレスのビット31：２だけをスタック・タグキャッシュ200に提示すれば良い。書き込まれる又は読み書きされるスタック・ロケーションのアドレスはr2＿addrとして提示できる。アドレスr1＿ad drは読み込まれはするが書き込まれないスタック・ロケーションのために使用できる。２つのアドレスは各々タグスタック・ローリミット・レジスタ204Ａ及びタグスタック・ハイリミット・レジスタ204Ｂの内容と比較される。どちらかのアドレスがローリミットより小さいかハイリミットより大きい場合、入力としてそのアドレスを有している４個の30ビット・コンパレータ206Ａ〜Ｄのうちの１つが出力として論理値１を生成し、これに対応する２入力ＯＲゲート222が結果として論理値１を発生する、即ちr1＿addrに対してlimit＿trap＿1又r2＿addrに対してlimit＿trap＿2を発生する。limit＿trap＿1又はlimit＿trap＿2のどちらかが論理値１の場合、スタック・タグキャッシュ200はこのクロックサイクルで意図した演算をうまく完了できない。ＣＰＵ105は現在の命令の実行を終了させてトラップを実行することにより応答し、トラップハンドラ・プロセスが詳細には後述するトラップ・シナリオにアドレスできるようにする。２つのアドレスr1＿addrとr2＿addrはＲＡＭ202から２つのタグビットを抽出するためにも使用される。各アドレスについて、６ビット（ビット１２：７）がＲＡＭ202の読み出しポートの一方の読み出しアドレスとして用いられ、１個の3 2ビット・ワードを読み出して３２対１マルチプレクサ214Ａ〜Ｂの一方に供給する。別の５ビット（ビット６：２）は同じマルチプレクサの制御セレクタとして使用され、これによって１ビットを選択する。このように選択した２つのビットはr1＿addrによって選択されたtag＿bit＿1信号及びr2＿addrによって選択されたtag＿bit＿2信号としてＣＰＵ105で利用できるようになる。ＣＰＵ105は２つのデータスタック・ロケーションから読み出した32ビット・ワード２個を受信し、tag＿bit＿1及びt ag＿bit＿２ビットは各々ＣＰＵ105によって32ビット・データワードに付加され２つの33ビット量を発生する。33番目のビットの値は32ビット・スタック項目が参照か又はプリミティブ値のどちらであるかを表わす。好適実施態様において、 33番目のビットが論理値１だと参照を表わし、33番目のビットが論理値０だとプリミティブ値を表わす。図示した実施態様において、スタック・タグキャッシュ200は全ての32ビット・スタック項目に１追加ビットを提供する。 r1＿addrビット12：７によって選択されＲＡＭ202から読み出された32ビット・ワード全体も又r＿data 31：０としてＣＰＵ105で利用できるようになるので、これによってＲＡＭ202から１つ又は２つ以上のワードを迅速に読み出すためのパスを提供する。同じクロックサイクルで、ＣＰＵ105はスタック・タグキャッシュ200に情報を書き込む適当な信号を生成する。実際の書き込み動作は次のクロックサイクルで行なわれるので、前述したラッチのセットを用いて、現在のクロックサイクルから次のクロックサイクルまでデータ及び制御信号を保持する。ｗ＿enable信号はワードをＲＡＭ202に書き込もうとする場合に論理値１、書き込むべきワードがない場合に論理値０である。後述の信号は書き込み動作に関連する。r2＿addrビット12：２が 11ビット・ラッチ212にラッチされると、r2＿addrのビット12：７を用いて、32 ビット・ワードが書き込まれるＲＡＭ202内部のロケーションにアドレスする。r 2＿addrのビット６：２は１対32デコーダ224に供給される。デコーダ224の32個の出力は32個の１ビット・マルチプレクサ218Ａ〜Ｎを制御するために使用する。これら32個の制御信号のうち、厳密に１つだけが論理値１で、残りは論理値０になる。ＣＰＵ105はｗ＿data信号を含む32ビット・データワードを供給する。ｗ＿data＿select信号が論理値１の場合、ｗ＿data信号としてＣＰＵ105から供給された32ビット・ワードはＲＡＭ202に書き込まれる。ｗ＿data＿select信号が論理値０の場合、ＲＡＭ202へ書き込まれるデータは32個の１ビット・マルチプレクサ218Ａ〜ｎによって発生した32ビット「更新値」である。r2＿ addr ビット1２：７によって指定されたＲＡＭ202ロケーションから読み出されたワードはラッチ208Ｂと32個のマルチプレクサ218Ａ〜ｎの第１の入力へ供給され、この場合、各マルチプレクサへ１ビットづつ供給される。４対１マルチプレクサ22 0の出力である「更新ビット」は32個の２対１マルチプレクサ218Ａ〜ｎの全部の第２の入力へ供給される。その結果、「更新値」はr＿dataに等しくなり厳密にその内のビットの１つが「更新ビット」に置き換えられている。このようにすると32ビット・ワードのリード・モディファイ・ライト方式（読み取り・変更・書き込み方式）で、個々のビットまでアドレスできるかのようにＲＡＭ202を使用できる。「更新ビット」の値は２ビットのｗ＿bit＿select信号によって制御される。ｗ＿bit＿select信号が２進値00を有する場合、更新ビットはtag＿bit＿1に等しい。ｗ＿bit＿selectが２進値01を有する場合、更新ビットはtag＿bit＿2に等しい。ｗ＿bit＿selectが２進値10を有する場合、更新ビットは論理値０に等しい。最後に、ｗ＿bit＿selectが２進値11を有する場合、更新ビットは論理値１に等しい。ＣＰＵ105はlimit＿trap＿1信号とlimit＿trap＿2信号を任意のクロックサイクルで使用して同じクロックサイクルのｗ＿enable信号をゲートできる。このようにすると、トラップが発生した場合ＲＡＭ202への書き込みが抑圧される。例示の実施態様において、ＣＰＵ105がマイクロプロセッサで実現されている場合、本明細書で説明したスタック・タグキャッシュのハードウェアはマイクロプロセッサとして同じ集積回路パッケージ内に実装できる。スタック最上部にある又はその付近の項目を含むハードウェアとしてのスタック・データキャッシュとの関連でスタック・タグキャッシュ200を使用することができる。こうしたハードウェアとしてのスタック・データキャッシュの構成と動作は当業者の範囲内である。スタック・タグキャッシュのエントリ数はスタック・データキャッシュのエントリ数と等しいか異なることがある。別の実施態様において、スタック・データキャッシュ並びにスタック・タグキャッシュはシステム・メモリに常駐できる。こうしたソフトウェアとしてのスタック・タグキャッシュの実装はスタック・タグキャッシュ200の前述の説明と本文書の残りの説明に鑑みて当業者の範囲内であろう。前述の説明から、本願発明がスタック内に記憶された参照とプリミティブ値にタグ付き表現を使用し、一方でヒープのオブジェクト内にある参照及びプリミティブ値にはタグ無し表現を使用する方法と装置を提供することが読者には理解されよう。スタック・ワードに関連したタグビットはＣＰＵ105がスタックに項目をプッシュする命令を実行するか、又はスタックのアクティブ領域内にすでにロケーションを更新している際にＣＰＵ10 5により自動更新される。本願発明において、データスタックは必ずしもメモリの連続した領域を占有しないものと想定している。その代わり、データスタックには連続メモリの初期量が割り当てられる。スタックがオーバフローした場合、連続メモリの追加領域を割り当てる。単一スタックを表わす２つ又は３つ以上のこうした連続領域をリスト状に連鎖できる。現在のスタックのアンダーフローが発生すると現在のスタック領域が放棄され後にリサイクルされる。スタックポインタとフレームポインタはリストの直前の領域を参照するように調節される。メモリの新規な連続領域がスタックに割り当てられる時には、領域は少なくともスタック上にプッシュされようとするフレームを保持するのに充分な大きさでなければならない。ＣＰＵ10 5が１つのスレッド実行から別のスレッドへコンテクスト・スイッチを行なう場合、ＣＰＵはスタックポインタ・レジスタ、フレーム・ポインタ・レジスタ、スタック・データリミット・レジスタ、スタック・データの現在の内容を主メモリに保存するのが典型的である。次にＣＰＵ105は新しい値をスタックポインタ、フレームポインタ、及びスタックリミット・レジスタにロードする。本願発明によれば、ＣＰＵ105はタグスタック・リミット・レジスタ204Ａ〜ＢとＲＡＭ202 の内容も主メモリに保存する。ＣＰＵ105はその後でリミット・レジスタ204Ａ〜Ｂへ新規の値をロードする。スタック・タグキャッシュ200の設計はＲＡＭ202の内容を保存し易くする。更に詳しく説明すると、ＣＰＵ105はr2＿addrとしてアドレスを提示し32ビット信号（r＿data 31：０）としてデータを読み取ることによりＲＡＭ202から一度に32ビットを読み出すことかできる。ＣＰＵ105はr2 ＿addrとしてアドレス、ｗ＿enable、及びｗ＿data＿selectの値、及び３２ビットのデータ（ｗ＿data 31：１）を提示することによってＲＡＭ202へ一度に32 ビット書き込むことができる。一度にＲＡＭへ32ビットを読み書きできる能力でトラップの高速処理が容易になる一方、トラップの頻度を最小限に抑さえ高速なコンテクスト・スイッチングを可能にする。タグビットを保持するのに必要な主メモリ110の量はトラップ又はコンテクスト・スイッチの時点で割り当てることができ、スタック・データを保持するために使用されているメモリの付近に配置できる。Java仮想マシンの典型的な実装において、プログラム・スタックはチャンクとしてまとまった状態（chunk）で割り当てられている。１つのまとまりには５ワードのブックキーピング情報と2000 ワードの実際のスタック・データを含むことができるが数値2000は任意である。本願発明の好適実施態様において、スタックは２キロワード（2048ワード）のまとまりに割り当てられる。これらのワードのうちの５個はブックキーピング情報として使用され、62ワードはスタック・タグビットを保持する（1984タグビットを提供する）ために予約され1981ワードが実際のスタック・データを保持するために使用できる。タグビットのうちの３個は使用されないことに注意する。この実装により、常にスタックフレームのタグビット全部を2048ビットのスタック・タグキャッシュＲＡＭに適合させることができる。スタックのサイズに割り当てられる実際のメモリのサイズは設計要件によって変化し得ることは当業者には明らかであろう。例えば、本願発明は32×32ビットのＲＡＭと4096ワードの主メモリ・スタック・チャンクサイズ又は両方に実装できる。しかし、こうした実施態様においては、必ずスタック・タグキャッシュＲＡＭにスタックフレームのタグビット全部を適合させることはできない。選択したスタック・エントリのアドレスが所定のリミットの外にあって希望するタグ項目がスタック・タグキャッシュ200にないことを表わしていることでトラップが発生する場合、トラップ処理プロシージャは主メモリからキャッシュメモリへタグ情報をコピーすることを含む。特定のシステムによってキャッシュ全体が置き換えられるか、又はキャッシュの一部が置き換えられる。キャッシュ「ミス」を誘発したスタック・タグキャッシュ200のリストアはスタック・タグキャッシュ200の前述の説明と本文書の残りの説明に鑑みて当業者の範囲内である。いずれの場合にも、希望するタグ・エントリを含む最少量の情報を主メモリから取り出してキャッシュメモリに記憶する必要がある。本願発明の前述の説明から、単一のスタックを一緒に増大縮小する２つの協調スタックとして表現できることが理解されよう。32ビット項目がデータスタック上へ論理的にプッシュされる時には、１ビット・タグがスタック・タグキャッシュへ論理的にプッシュされる。32ビット項目をデータスタック内から取り出す場合又はその中で更新する場合には、これに対応する１ビット・タグをスタック・タグキャッシュ内から取り出すか又はその中で更新する。スタック・タグキャッシュの代替実装本願発明の第２の実施態様によるスタック・タグキャッシュ300が図３に図示してある。スタック・タグキャッシュ300の実装と共通するスタック・タグキャッシュ200の全ての構成要素は図３において同様の番号が付けてあり、こうした構成要素の説明及び動作は本明細書ですでに述べた通りである。スタック・タグキャッシュ200とスタック・タグキャッシュ300の違いは、ＲＡＭ202、リミット・レジスタ204Ａ〜Ｂ、コンパレータ206Ａ〜Ｄが完全結合キャッシュ302（fully associative cache 302）に置き換えられていることである。本実施態様において、キャッシュ302は４線式マルチポート完全結合キャッシュを含み、各々の栓は25ビットのアドレスと32ビットのデータ、即ちスタック・エントリのタグ情報で構成される。キャッシュ302は２個の読み出しポートと１個の書き込みポート、及び「フロースルー」機能を有しており同じ32ビット・データワード即ち同じ関連アドレスを有するデータワードについて同じクロックサイクルで読み込みと書き込みの両方が行なわれる場合、キャッシュ302から読み出した値はそのクロックサイクルでキャッシュ302に書き込まれる値と同じである。読み込みアドレスがキャッシュ302に提示されると、これに対応する「ヒット」信号を発生し、キャッシュ線のどれかが現在そのアドレスを含む場合には論理値１である。更に、30ビット・ラッチ312をキャッシュ200の11ビット・ラッチ212の変わりにスタック・タグキャッシュ300で使用する。ラッチ312の構造と機能はラッチ21 2を参照して前述したのと同様であるが、図３に図示してあるようにラッチ312は r2＿addr信号（r2＿addr 31：２）の30ビットを記憶しこれらのビットのうち25 ビット（ｗ＿addr31：７）をキャッシュ302へ、又５ビット（ｗ＿addr ６：２）をデコーダ224へ提供する点で異なっている。更に、２入力ＮＯＴゲート314Ａと314Ｂの対を各々cache＿hit＿1及びcache＿hit＿2線へ接続する。キャッシュ3 02がゲート314Ａへ論理値０の値を提示するとlimit＿trap＿1の値が論理値１にされ、このことはキャッシュ・ミスが発生したのでトラップ・ルーチンを実行しなければならないことを表わす。同様に、キャッシュ302がゲート314Ｂへ論理値０の値を提示すると、 limit＿trap＿2の値が論理値１にされ、キャッシュの「ミス入力」か発生したのでトラップ・ルーチンを実行しなければならないことを表わす。スタック・タグキャッシュ300の動作と機能はスタック・タグキャッシュ200のそれと同様で、主要な相違点はキャッシュ・ミスの管理、キャッシュ302のローディング及びアンローディングである。前述のスタック・タグキャッシュ200を参照して提供した説明に鑑みると、こうした動作上の相違点は当業者の範囲内でありこれ以上詳細には説明しない。典型的な命令実行本願発明の典型的実施態様の動作を更に示すため、Java仮想マシン命令セットに準拠した命令を実装しているマイクロプロセッサ又は中央演算処理ユニットを想定して以下の例を提供する。最大限効率的な命令タイミングの図示の目的で、実施態様ではスタック・データは２個の読み出しポートと１個の書き込みポートを有するマルチポート・キャッシュメモリにも保持されるものと仮定するが、他のデータスタック実装も使用する。 iadd命令「iadd」命令は２つのオペランドをスタックからポップするが、どちらのオペランドも整数でなければならない。次に、これらの和が整数としてスタックにプッシュされる。マイクロプロセッサは２個のスタック・オペランドを読み込み、これらを加算してその和をスタックに書き戻す。スタックポインタもスタックから１項目ポップするように（２回のポップと１回のプッシュで結局１回ポップしたことになる）調整される。スタック・データキャッシュのスタック・データにより、命令は１クロックサイクルで全て実行できる。同様に、ＣＰＵは２個のスタック項目のメモリアドレスを生成する。スタック最上部にある項目のアドレスはr1＿addrとしてＲＡＭ202に提示され、一方でスタック最上部より下にある項目のアドレスはr2＿addrとしてＲＡＭ202に提示される。スタック・タグキャッシュ200はリミット比較を行なって２つのスタック・ロケーションに対応するタグビットが論理的にＲＡＭ202内部にあることを保証する。r1＿addrで示されたスタック・ロケーションのタグビットがキャッシュ内に存在しない場合、limit＿trap＿1信号は論理値１の値を有することになる。 r2＿addrで表わされるスタック・ロケーションのタグビットがキャッシュ内に存在しない場合は、limit＿trap＿2信号が論理値１の値となる。ＲＡＭ202と２個の32対１マルチプレクサ214Ａ〜Ｂが一緒に２つのスタック・ロケーションに対応するタグビットを取り出して、タグビットをtag＿bit＿1及びtag＿bit＿2としてＣＰＵ105に提示する。ＣＰＵ105は冗長エラー検査にタグビットを使用する。エラー検査は、適当なタグビットによって示されるスタック・データの性質とスタック・データに関連する命令との比較を内包する。例えば、プリミティブ値だけで演算する命令は参照としてタグビットによって示されているオペランドで実行することができない。このようにすると、タグビットは厳密ガーベッジ・コレクション技術を支援するだけでなく、スタック・エントリ内部のデータの有効性の検証にも役立つ。iadd命令の例に戻ると、どちらかのビットが論理値１の場合、スタック・ロケーションは参照を含みiadd命令の実行は誤りである。よってＣＰＵ105 は命令実行を中断する。ＣＰＵ105はtag＿bit＿1、tag＿bit＿2、limit＿trap＿ 1、limit＿trap＿2のいずれかが論理値１に等しい場合トラップを実行する。ＣＰＵ105はトラップを行なわない場合にｗ＿enable信号に論理値１の値を提示する。ＣＰＵ105はｗ＿data＿selectに論理値０、ｗ＿bit＿selectに２進値１０を提示する。結果的に、トラップが発生しない場合、その結果についてスタック項目に対応するタグビットは論理値０となるように更新され、結果がプリミティブ値であることを表わす。冗長エラー検査を用いてオペランドかプリミティブ値でない場合にトラップを強行する場合この動作は冗長である。エラー検査が実行されないような実装において、この更新は冗長ではない。 aaload命令「aaload」命令はスタックから２項目をポップする。一番上が整数インデックスで、その下の項目が参照配列への参照である。この命令は、インデックス値で表わされる通りに配列からの参照を選択し選択した参照のコピーをスタックにプッシュする。スタックポインタもスタックから１項目をポップしたように調節される、即ち２回のポップと１回のプッシュで結局１回ポップしたことになる。この命令は主メモリからの読み込みを行なうので、複数クロックサイクルを必要とする。最初のクロックサイクルの間に、ＣＰＵ105は２つのスタック項目のメモリアドレスを生成する。スタック最上部にある項目のアドレスはr1＿addrとして提示され、スタック最上部の下にある項目のアドレスはr2＿addrとして提示される。スタック・タグキャッシュ200はリミット比較を実行して２つのスタック・ロケーションに対応するビットが論理的にキャッシュ内に存在することを保証する。r1＿addrで表わされるスタック・ロケーションのタグビットがキャッシュ内に存在しない場合、limit＿trap＿1信号に論理値１が生成される。r2＿addrで表わされたスタック・ロケーションのビットがキャッシュ内に存在しない場合、limit＿trap＿2信号に論理値１が生成される。ＲＡＭ202と２個の32対１マルチプレクサ214Ａ〜Ｂが一緒に２つのスタック・ロケーションに対応するタグビットを取り出して、タグビットをtag＿bit＿1及びtag＿bit＿2としてＣＰＵ105に提示する。ＣＰＵ105は関連する命令による冗長エラー検査にタグビットを使用する。tag＿bit＿1が論理値１の場合、tag＿bi t＿2が論理値０の場合、又はlimit＿trap＿1又はlimit＿trap＿2のどちらかが論理値１の場合にはトラップを行なうべきである。このクロックサイクルで、ＣＰＵ105はｗ＿enable信号に論理値０を提示する。選択した配列要素が主メモリから到着した後、ＣＰＵ105は後続のクロックサイクルでスタック結果のアドレス、即ち当初は最上部から２番目であったスタック項目と同じアドレスをもう一度r2＿addrとして提示する。ＣＰＵ105はｗ＿ena ble信号について論理値１の値、ｗ＿data＿selectについて論理値０の値、ｗ＿b it＿selectについて２進値11を提示する。結果的に、結果のスタック項目に対応するタグビットは論理値１に更新され、このことが結果が参照値であることを表わす。冗長エラー検査を用いて第１のオペランド即ち最上部から２番目のスタック・エントリが参照値でない場合にトラップを強行する場合こうした更新は冗長である。エラー検査が行なわれない実施態様においてこうした更新は冗長ではない。 iaload命令「iaload」命令の実行は、配列オペランドが整数値の配列であり、スタックにプッシュされる結果が参照ではなく整数値である点を除けば「aaload」命令と全ての面で同一である。更に、直前に説明したクロックサイクルにおいて、aaload 命令への参照内で、ＣＰＵ105はｗ＿bit＿select信号に２進値10を提示する。結果的に、命令結果についてスタック項目に相当するタグビットは論理値０となるように更新され、このことにより、結果がプリミティブ値であることを表わす。この更新は論理値１から論理値０へタグビットを変更するので冗長ではない。 dup命令「dup」命令はスタックの一番上の項目のコピーをスタックにプッシュする。ＣＰＵ105は一番上のスタック項目を読み出してそのすぐ上のスタック・スロットに書き込む。スタック・オーバフローが発生した場合には、スタックポインタも上向きに調節されトラップが行なわれる。ＣＰＵ105は２つのスタック・スロットのメモリアドレスを生成する。スタックの一番上にある項目のアドレスはr1＿addrとして提示されすぐ上のスロットのアドレス、つまり新しく一番上の項目になる項目のアドレスがr2＿addrとして提示される。スタック・タグキャッシュ200はリミット比較を実行して２つのスタック・ロケーションに対応するタグビットが論理的にＲＡＭ202内部に存在することを確認する。r1＿addrで表わされるスタック・ロケーションのタグビットがキャッシュ内部に存在しない場合、limit＿trap＿1信号に論理値１が生成される。r2＿addrで示されたスタック・ロケーションのビットがキャッシュ内部に存在しない場合、limit＿trap＿2信号に論理値１が生成される。limit＿t rap＿1又はlimit＿trap＿２が論理値１の場合トラップが行なわれる。ＲＡＭ202と32対１マルチプレクサ214Ａ〜Ｂが一緒に２つのスタック・ロケーションに対応するタグビットを取り出して、タグビットをtag＿bit＿1及びtag＿ bit＿2としてＣＰＵ105に提示する。「dup」命令を処理する場合に、ＣＰＵ105 がtag＿bit＿2信号を使用することはない。トラップを行わない場合には、ＣＰＵ105はｗ＿enable信号に対して、論理値１の値を提示する。ＣＰＵ105はｗ＿data＿selectに論理値０の値ｗ＿bit＿sele ctに２進値00を提示する。結果的に、トラップが発生しない場合、命令結果についてのスタック項目に対応するタグビットがtag＿bit＿1のコピーとなるように更新される。従って、新規に複製されたスタック項目がもともと一番上であったスタック項目と同じタグビット値を担う。 swap命令「sｗap」命令は一番上のスタック項目を一番上から２番目のスタック項目で交換する。スタックポインタの実質的調節は行なわれない。スタック・データがスタック・データキャッシュに保持されるシステムでは、この命令は２クロックサイクルで実行できる。最初のクロックサイクルで、CPU105は２つのスタック・スロットのメモリアドレスを生成する。スタックの一番上の項目のアドレスはr1＿addrとしてＲＡＭ20 2に提示されスタックの最上部のすぐ下のスロットのアドレスがr2＿addrとして提示される。スタック・タグキャッシュ200はリミット比較を実行して２つのスタック・ロケーションに対応するタグビットが論理的にＲＡＭ202内部に存在することを確認する。r1＿addrで指定されたスタック・ロケーションのタグビットがＲＡＭ202内部に存在しない場合、l imit＿trap＿１信号に論理値１が発生する。r2＿addrで指定されたスタック・ロケーションのタグビットがＲＡＭ202内部に存在しない場合にはlimit＿trap＿2 信号に論理値１が発生する。limit＿trap＿1又はlimit＿trap＿2のどちらかが論理値１の場合トラップが行なわれる。ＲＡＭ202と32対１マルチプレクサ214Ａ〜Ｂが一緒に２つのスタック・ロケーションに対応するタグビットを取り出して、タグビットをtag＿bit＿1及びtag＿bit＿2としてＣＰＵ105に提示する。ＣＰＵ1 05はトラップが行なわれない場合にはｗ＿enable信号に論理値１を提示する。ＣＰＵ105は又ｗ＿data＿select信号に論理値０の値、ｗ＿bit＿selectに２進値00 を提示する。結果的に、トラップが発生しない場合、最上部から２番目のスタック項目に対応するタグビットはtag＿bit＿１のコピーとなるように更新される。ＣＰＵ105はtag＿bit＿２として提示された値も保存する。第２のクロックサイクルで、ＣＰＵ105は一番上のスタック・スロットのメモリアドレスを生成してr2＿addrとして提示する。ＣＰＵ105はｗ＿enable信号に論理値1,又ｗ＿data＿select信号に論理値０を提示する。ＣＰＵ105は直前のクロックサイクルから保存したtag＿bit＿２の値が論理値０の場合にはｗ＿bit＿s elect信号に２進値10を提示する。ＣＰＵ105は保存したtag＿bit＿2の値が論理値１の場合ｗ＿bit＿selectに２進値11を提示する。このようにすると、一番上のスタック項目に対応するタグビットは保存してあるtag＿ bit＿２のコピーとなるように更新される。実質的な効果は２つのスタック項目について２つのタグビットを交換したことである。 dup及びswap命令について、１クロックサイクルでＲＡＭ202内部の１つのビット・ロケーションから別のビット・ロケーションへタグビットの値を直接コピーでき、書き込み動作が実際にはラッチ遅延のため後続のクロックサイクルで完了することが容易に理解される。これ以外に、１つのクロックサイクルでタグビットを読み出して後のクロックサイクルでＲＡＭ202の別のロケーションへの値に保存するためにＣＰＵ105が保存しても良い。上記の説明によると、どのようにすれば命令dup2、dup＿ｘ1、dup＿ｘ2、dup ２＿ｘ1、dup２＿ｘ2にも同様に必要とされるタグビット値のコピーを実行できるかが容易に理解されるであろうから、これらの詳細な説明は本明細書では簡潔にするため提供しない。 iload命令「iload」命令はフレームポインタからのオフセットとしてアドレスが計算される整数スタック項目のコピーをスタックにプッシュする。アドレスは整数メソッド・パラメータ又はローカル変数の値を取り出すために使用される。ＣＰＵ105はスタック項目を読み出して一番上のスタック項目のすぐ上のスタック・スロットにこの項目を書き込む。スタックポインタも上向きに調節される。スタック・オーバフローが発生するとトラップが行なわれる。スタック・データがスタック・データキャッシュに存在する場合、この命令は１クロックサイクルで実行できる。iload命令の動作はdup命令のそれとほとんど似ており、主な相違点はオペランドが整数である必要がある点である。よってtag＿bit ＿1を調べれば論理値０を保証することができ、結果のタグビットは論理値０になる。従ってｗ＿bit＿select信号は２進数00ではなく２進数10になる。フレームがＲＡＭ202より大きいメソッドでは、少なくとも２つのオプションが存在する。第１に、スタック・タグキャッシュ200はオペランドが参照ではないことの冗長エラー検査を先行する。第２に、又これ以外に、トラップを行ない、ＣＰＵ105に命令をエミュレーションさせておく。好適実施態様において、ＣＰＵ105は２つのスタック・スロットのメモリアドレスを生成する。フレームポインタからのオフセットとして計算されたアドレスはr1＿addrとして提示され、スタックの現在の最上部より上のスロット、即ち新しく一番上の項目になろうとする項目のアドレスはr2＿addrとして提示される。スタック・タグキャッシュ200はリミット比較を実行するが、limit＿trap＿1信号が論理値１の場合トラップは行なわれない。その代わり、limit＿trap＿1が論理値０でtag＿bit＿1が論理値１の場合、又はlimit＿trap＿2が論理値１の場合にトラップを行なう。つまり必要なタグビットがスタック・タグキャッシュ200 に存在するかも知れない場合に冗長エラー検査が実行される。それ以外の場合、トラップを行なうのではなく、冗長エラー検査を実行しない。スタックにプッシュしようとするデータは同じサイクル又は後続のサイクルの間に到着する。どちらのサイクルでも実際にはデータは新しくスタック最上部の項目になるスタック・スロットに書き込まれることになるので、ＣＰＵ105はトラップを行なわない場合ｗ＿enable信号に論理値１を提示する。ＣＰＵ105はｗ＿bit＿select信号に２進値10も提示する。結果的に、命令結果についてのスタック項目に対応するタグビットは論理値０になるように更新され、結果がプリミティブ値であることを表わす。 istore命令「istore」命令はスタックから整数をポップして、フレームポインタからのオフセットとしてアドレスが計算されるスタック・スロットに格納する、即ちこの項目を用いて整数メソッド・パラメータ又はローカル変数の値を更新する。ＣＰＵ105は一番上のスタック項目を読み込みアドレスしたスタック・スロットに書き込む。スタックポインタも下向きに調節される。スタック・アンダーフローが発生した場合にはトラップが行なわれる。フレームがＲＡＭ202より大きいメソッドでは、トラップを行なう必要があるが、これは候補スタック記憶スロットに記憶されるタグビットを更新して本願発明の正しい動作を維持する必要があるためである。ＣＰＵ105は更新したスタック・スロットに関連するタグビットの更新を含め、命令の動作をエミュレートする必要がある。ＣＰＵ105は２つのスタック・スロットのメモリアドレスを生成する。フレームポインタからのオフセットとして計算されるアドレスがr2＿addrとして提示され、スタックの現在の最上部のアドレス、即ちポップされることになる項目がr1 ＿addrとしてて維持される。スタック・タグキャッシュ200はリミット比較を実行する。ＲＡＭ202と32対１マルチプレクサ214Ａ〜Ｂが一緒に２つのスタック・ロケーションに対応するタグビットを取り出して、tag＿bit＿1及びtag＿bit＿2 としてＣＰＵ105に提示する。ＣＰＵ105は冗長エラー検査にこれらのタグを使用できるようになる。tag＿bit＿1、limit＿trap＿1、又はlimit＿trap＿2のどれかが論理値１の場合トラップを起こすべきである。tag＿bit＿2信号はＣＰＵ105によるistore命令の処理では使用されない。ＣＰＵ105はトラップを行なわない場合にｗ＿enable信号に論理値１を提示する。ＣＰＵ105はｗ＿bit＿select信号に対して２進値10を提示する。結果的に、命令結果についてのスタック項目に対応するタグビットは論理値０になるように更新され、このことにより結果がプリミティブ値であることを表わす。 limit＿trap＿1又はlimit＿trap＿2が論理値１であるためにトラップが発生した場合、ＣＰＵ105はトラップを誘発した命令、並びにトラップハンドラ・ルーチンによって提供された他の情報を調べて適当な動作を起こさなければならない。命令がtag＿stack＿low＿limit又はtag＿stack＿high＿limitによって示される境界より外側にあるスタック・スロットのタグビットにアクセスする必要がある場合、ＣＰＵ105はＲＡＭ202に必要なタグビットをロードし、これに合わせて tag＿stack＿loｗ＿limit及びtag＿stack＿high＿limitの値を調節することができる。ＲＡＭ202からデータを読み取りＲＡＭ110に格納することによって最初にスタック・タグキャッシュに空きを作る必要がある。クイック命令の考察オブジェクトのフィールドであるオペランドか参照又はプリミティブ値であるかについて無差別な「クイック」命令を使用するJava実装では、本願発明は全ての関連する区別を実行する新規命令の追加を企図している。シンボリック名の解決後に遅い命令をクイック命令で置き換えたJava機構はJa vaインタプリータ又はJITコンピュータとも呼ばれる「ジャストインタイム」コンピュータのどちらか又は両方である。好適実施態様において、２つの考えられるクイック命令の一方を置換命令として選択するようにJavaインタプリータ及び／又はJIＴコンパイラを変更する。この選択は何らかの特定のオブジェクト・フィールド・オペランドが参照かどうかについての情報を失わないように行なう。以下の半標準ＪＶＭクイック命令は常にプリミティブ値に対して演算するように解釈される： getfield＿quick getfield＿quick＿ｗ getstatic＿quick idc＿quick idc＿ｗ＿quick putfield＿quick putfield＿quick＿ｗ putstatic＿quick 本願発明の追加クイック命令はこれに対応する前述した既存の半標準ＪＶＭクイック命令と正確に同じだが、参照値に対して演算を行なうのは次の通りである： agetfield＿quick agetfield＿quick＿ｗ agetstatic＿quick aldc＿quick aputfield＿quick aputfield＿quick＿ｗ aputstatic＿quick 遅い命令であるgetfield、getstatic、ldc、ldc＿ｗ、putfield、putstaticをクイック命令により遅い命令を実行するプロセスの間に置換しようとするときに、シンボリック名解決プロセスでスタックへ又はスタックから転送しようとするデータが参照であると分かった場合、名前が「ａ」で始まっているクイック命令を選択する。それ以外の場合には通常のクイック命令を選択する。例えば、agetfield＿quick命令はgetfield＿quickと機能的に同一であるが、この命令は参照値を転送する点で異なっている。上記で言及した他の７種類のクイック命令についても同様のことがいえる。好適実施態様において、Javaバイトコード命令セット・オプコードは次のように新規命令に割り当てられる： 232 agetfield＿quick 233 agetfield＿quick＿ｗ 234 agetstatic＿quick 235 aldc＿quick 236 aldc＿ｗ＿quick 231 aputfield＿quick 229 aputfield＿quick＿ｗ 230 aputstatic＿quick agetfield＿quick命令「agetfield＿quick」命令はオブジェクトへの参照をスタックからポップして、オブジェクト内のオフセットとしてアドレスを計算した参照値のコピーをスタックにプッシュする。参照はオブジェクトの参照値フィールドの値を取り出すために使用する。agetfield＿quick命令の動作は「aaload」命令と類似しているが、配列参照と整数インデックスの代わりに、単一のオペランドであるオブジェクト参照がスタックからポップされる点で異なっている。本願発明の精神と範囲を維持しつつも本願発明のスタック・タグキャッシュの読み込み及び書き込み動作の正確なタイミングに多少の変動が発生することがあることは当業者には明らかであろう。例えば、ＲＡＭ202へのタグ情報ワードの書き込みは次のクロックではなくＲＡＭ202から情報を読み出すのと同じクロックで行なえる。更に別の実施態様において、本願発明はコンピュータ・システムで使用するコンピュータ・プログラム製品として実装できる。このような実装において、タグ情報はスタック項目を記憶するために使用されるのと同じシステムＲＡＭの第２の領域に記憶される。この実施態様において、タグ情報を取り出してシステムＲＡＭに直接記憶でき、これによってハードウェア・キャッシュ・メモリ202の機能とアドレス・リミット・チェック及びキャッシュ「ミス」を処理するためのトラップ命令の必要性を排除できる。これ以外に、キャッシュメモリ202の機能を別のシステムＲＡＭ装置、例えば高速スタティックＲＡＭの一部など、他の目的でも使用される装置で実現できる。この後者の実施態様において、スタック・タグキャッシュ200又はスタック・タグキャッシュ300内部のハードウェア構成要素によって実行される機能の全部その全体をこれに対応するプロセッサ命令に置き換え、類似の機能を実行して同じ結果を実現するようにできる。この実施態様では、各スタック・エントリについてのタグビット情報かシステムＲＡＭに記憶できる。プロセッサで実行可能な特定の命令でＲＡＭ内部のタグビット情報を読み出し、書き込み、変更する。大半のプロセッサ命令セット、アセンブリ言語やＣプログラミング言語を含めた多数のプログラミング言語がデータワード内の個別のビットの操作を行ない本願発明のこのような完全ソフトウェア実施態様の実現に適した装備を提供している。スタック・タグキャッシュ200及び300を含む論理構成要素の前述の説明に鑑みて、類似の機能を実装するために使用される基本的処理ステップはプログラミング技術の当業者の範囲内にあり図４及び図５に模式的に図示してある。図４は本願発明のハードウェア実施態様又はソフトウェア実施態様によって実行されてプログラム・スタック読み込み中にタグ情報を取り出すためのステップの例示的フローチャートである。この方法はステップ400で始まり、ステップ402 に進み、ここで実装によっては１つ又は２つの読み込みアドレスを生成し記憶する。単一のスタックを処理している場合には、単一のアドレスを使用し、ハードウェア実装に関連して前述したように２つのスタックを同時に処理している場合は第２のアドレスを使用できる。これらのアドレスはスタック項目ロケーションを指定するもので、前述のように、スタック・キャッシュ又はタグ情報が記憶されているシステムＲＡＭの他のロケーションをアドレスするためにも使用される。ステップ404において、ステップ402で記憶したアドレスで指定されたロケーションにあるスタック項目が取り出される。次に、ステップ406において、アドレスをハイトラップ・リミットに対してチェックし、ステップ408において、アドレスをロートラップ・リミットに対してチェックする。アドレスが各々のトラップ・リミットによって定義されたアドレス・インターバルの外にある場合には、すでに議論したように、トラップ処理を開始する。この処理によって、ステップ 412において、要求されたタグ情報がシステムＲＡＭから取り出されることになる。ステップ414において、少なくともシステムＲＡＭから取り出したタグ情報を記憶し、可能なら上記の議論に従ってキャッシュメモリ内に追加タグ情報を記憶することで、キャッシュメモリをリストアする機構が開始される。ステップ416において、取り出されたタグ情報がステップ404で取り出されたスタック項目に追加され、ルーチンはステップ418で終了する。プログラム・スタック書き込み動作中にタグ情報を記憶するのにも同様な方法が用いられる。この方法が図５に図示してありステップ500で始まる。ルーチンはステップ502に進み、ここで書き込みアドレスが記憶され、当該アドレスはスタック項目を書き込もうとするプログラム・スタック・ロケーションに対応する。記憶されたアドレスをステップ504でハイトラップ・リミットと比較し、ステップ506でロートラップ・リミットと比較する。アドレスがトラップ・リミットによって定義されたアドレス・インターバル以内に納まる場合、ルーチンはステップ508に進み、ここでタグ情報がプログラム・スタック書き込みアドレスから求めたロケーションでキャッシュメモリ内に記憶される。これ以外に、ステップ502で記憶したアドレスがステップ504又は506のどちらかで求めたトラップ・リミットの外にある場合、ステップ510でトラップ処理を開始する。前述のように、このトラップ処理は従来のキャッシュメモリ「ミス」処理に従って行なわれる。例えば、当業者には周知の方法で、タグ情報はキャッシュメモリとシステムＲＡＭメモリ・ロケーションの両方に書き込まれるか、又は情報がキャッシュメモリに書き込まれてから後でシステムＲＡＭロケーションへ「フラッシュ」される。ステップ508と510のどちらにおいても、要求されたタグ情報がをキャッシュメモリへ記憶される。ルーチンはステップ512で終了する。ソフトウェアによる実装は、有形媒体例えばコンピュータで読み取り可能な媒体例えば図１Ａのディスケット142、ＣＤ−ＲＯＭ147、ＲＯＭ115 、又は固定ディスク装置152上に固定されるか、又はコンピュータ・システムへ、モデム又はその他のインタフェース装置例えば媒体191上でネットワーク195に接続された通信アダプタ190などを経由して送信可能な、一連のコンピュータ命令を含む。媒体191は光又はアナログ通信線を含みこれに限定されない有形の媒体とするか、又はマイクロ波、赤外線又はその他の伝送技術を含みこれに制限されない無線技術で実現できる。一連のコンピュータ命令は本願発明に関連して本明細書で前述し多機能の全部又は一部を実現する。このようなコンピュータ命令は多くのコンピュータ・アーキテクチャ又はオペレーティング・システムで使用するための多数のプログラム言語で書けることが当業者には理解されよう。更に、こうした命令は半導体、磁気、光又はその他のメモリ装置を含みこれに限定されない現在又は将来のあらゆるメモリ技術を使用して記憶するか、又は光、赤外線、マイクロ波、又はその他の伝送技術を含みこれに限定されない現在又は将来のあらゆる通信技術を使用して伝送できる。この様なコンピュータ・プログラム製品は例えばシュリンクラップ・ソフトウェアなど印刷又は電子文書を添付したリムーバブル媒体として配布する、例えばシステムＲＯＭ又は固定ディスク上でコンピュータ・システムへ導入済みソフトウェアとして、又はインターネット又はワールドワイドウェブなどネットワーク上のサーバ又は電子掲示板から配布することができる。本願発明の典型的な実施態様を開示したが、本願発明の精神と範囲から逸脱することなく本願発明の利点の幾つかを実現する様々な変化及び変更を成し得ることは当業者には明らかであろう。例えば、スタック・タグキャッシュ200及び300 はハードウェア論理構成要素を用いての実施を説明したが、本願発明の方法は適当なプロセッサ命令を使用した完全ソフトウェア実装として、又はハードウェア論理とソフトウェア論理の組み合わせを使用して同じ結果を達成するハイブリッド実装としてのどちらかで実現できる。更に、メモリのサイズ、データ又は信号を表現するために使用されるビット数、データワードのサイズ、命令を実行するのに必要なクロックサイクル数、及び特定の機能を実現するために用いられる論理及び／又は命令の特定の構成などの側面並びに本願発明の概念に対するその他の変更は添付の請求の範囲で包含されることを意図している。

───────────────────────────────────────────────────── フロントページの続き (72)発明者オコナー、ジェイムス・マイケルアメリカ合衆国、カリフォルニア州 94043、マウンテン・ビュー、ルツ・アヴェニュー 345 (72)発明者スティール、ガイ・エル・ジュニアアメリカ合衆国、マサチューセッツ州 02173、レキシントン、ランターン・レーン９ (72)発明者トレンブレイ、マークアメリカ合衆国、カリフォルニア州 94301、パロ・アルト、ウェイバーリー・ストリート 801

Claims

【特許請求の範囲】１．第１のメモリ領域に複数のスタック項目を有するプログラム・データスタックを保持することができ、前記複数のスタック項目の各々は参照又はプリミティブ値のどちらかとして定義可能なデータを含むコンピュータ・システムにおいて、選択したプログラム・スタック項目のデータが参照か又はプリミティブ値かを決定するための方法であって、Ａ．第２のメモリ領域に複数のタグ項目を保持するステップであって、前記複数のタグ項目の各々はスタック項目に関連し、各タグ項目は前記関連するスタック項目が参照か又はプリミティブ値かを表わす値を有することを特徴とするステップと、Ｂ．前記選択したスタック項目に関連する前記複数のタグ項目の１つを取り出すステップと、Ｃ．前記関連するスタック項目内部に含まれるデータが参照か又はプリミティブ値かを前記取り出したタグ項目の値から決定するステップと、を含むことを特徴とする方法。２．前記ステップＡは、Ａ.1．前記プログラム・スタックの少なくとも一部分をエミュレーションする順番に前記複数のタグ項目を構成するステップと、Ａ.2．前記プログラム・スタックの操作に応じてタグ項目を選択的に操作するステップと、を含むことを特徴とする請求の範囲１記載の方法。３．前記ステップＡ.2.は更に、Ａ.2.Ａ．選択したスタック項目の順番の操作に応じて、選択したタグ項目の順番を操作するステップを含むことを特徴とする請求の範囲２記載の方法。４．前記ステップＡ.2.は更に、Ａ.2.Ａ．対応するスタック項目のデータの操作に応じて、タグ項目の値を操作するステップを含むことを特徴とする請求の範囲２記載の方法。５．前記ステップＢは、Ｂ.1．前記選択したスタック項目に対応するタグ項目が前記第２のメモリ領域内に存在するかどうかを決定するステップを含むことを特徴とする請求の範囲１記載の方法。６．前記ステップＢ.1.は更に、Ｂ.２．前記タグ項目が前記第２のメモリ領域内に存在していない場合には第３のメモリ領域から前記タグ項目を取り出して前記第２のメモリ領域へ前記タグ項目を書き込むステップを含むことを特徴とする請求の範囲５記載の方法。７．前記ステップＢは更に、Ｂ.1．前記関連するタグ項目のロケーションに対応するアドレスを前記第２のメモリ領域に提供するステップを含むことを特徴とする請求の範囲１記載の方法。８．前記ステップＣは更に、Ｃ.1．前記第２のメモリ領域の出力に前記取り出したタグ項目の値を提示するステップと、Ｃ.2．前記タグ項目の提示された値とこれに対応するスタック項目のデータとを比較するステップと、を含むことを特徴とする請求の範囲１記載の方法。９．前記ステップＢは更に、Ｂ.1．第２の選択したスタック項目に対応する前記複数のタグ項目の第２の項目を第１のタグ項目と同時に選択するステップと、Ｂ.2．前記関連する第２のスタック項目内部に含まれるデータが参照か又はプリミティブ値かを前記第２の選択したタグ項目の値から決定するステップと、を含むことを特徴とする請求の範囲１記載の方法。１０．複数のスタック・エントリを含むプログラム・データスタックを有するコンピュータ・システムて使用するスタック・タグキャッシュであって、各々のスタック・エントリは、タスクの実行中に前記コンピュータ・システムが使用するデータを含み、Ａ．複数のタグ項目を記憶するように構成されたアドレス可能なメモリであって、各タグ項目は、スタック・エントリに関連しており、かつ、前記関連するスタック・エントリが参照か又はプリミティブ値かを識別する値を有することを特徴とするアドレス可能なメモリと、Ｂ．前記アドレス可能なメモリに接続されており、かつ、、選択したスタック・エントリに関連するタグ項目が前記アドレス可能なメモリ内部に存在するかを決定するように構成された比較論理と、Ｃ．前記アドレス可能なメモリに供給されたアドレスに応答する出力論理であって、前記アドレスによって選択され前記選択したスタック・エントリに関連する前記タグ項目の値を提示するように構成された出力論理と、を含むことを特徴とするスタック・タグキャッシュ。１１．更に、Ｄ．選択したスタック・エントリに関連するタグ項目が前記アドレス可能なメモリ内部に存在しないことを前記比較論理が決定した場合には前記アドレス可能なメモリの外のメモリからタグ項目を取り出すように構成され、かつ、前記取り出したタグ項目を前記アドレス可能なメモリへ書き込むように構成された書き込み論理を含むことを特徴とする請求の範囲１０記載の装置。１２．前記書き込み論理は更に前記第１と第２の選択したスタック・エントリに各々関連する第１と第２のタグ項目が前記アドレス可能なメモリ内部に存在するかどうか決定するように構成されていることを特徴とする請求の範囲１０記載の装置。１３．前記出力論理は、第１と第２のアドレスに応答するようになっており、かつ、第１と第２の選択したスタック・エントリに各々対応する第１と第２のタグ項目の値を提示するように構成されていることを特徴とする請求の範囲10記載の装置。１４．前記アドレス可能なメモリに記憶されている前記複数のタグ項目は前記複数のプログラム・スタック・エントリより少ないことを特徴とする請求の範囲10 記載の装置。１５．プロセッサと、前記プロセッサに接続されたメモリと、前記プロセッサ及び前記メモリに動作的に接続され、かつ、複数のスタック・エントリを記憶してプログラム命令実行中に前記スタック・エントリを操作するように構成されたプログラム・スタック論理であって、各々のスタック・エントリはプログラム命令の実行に有用なデータを収容しデータ部分とタグ部分とを含み、前記タグ部分には複数の予め規定されたオペランド形式のどれを前記データが表わすかを示す情報を含むことを特徴とするプログラム・スタック論理とを含ムコンピュータ・システムであって、各プログラム・スタック・エントリのデータ部分はメモリの第１の領域に格納され、前記データ部分の構成と値は前記プロセッサによる前記プログラム命令の実行中に前記プロセッサにより操作され、前記複数のプログラム・スタック・エントリの各々のタグ部分はメモリの第２領域に格納され、前記タグ部分の構成と値は前記対応するプログラム・スタック・エントリのデータ部分と相関する方法で操作されることを特徴とするコンピュータ・システム。１６．前記プロセッサと前記メモリの第２の部分とに動作的に接続され、かつ、選択した複数のタグ部分を各スタック・エントリのデータ部分とは独立して記憶して前記タグ部分の構成と値を操作するように構成されたスタック・タグキャッシュを更に含むことを特徴とする請求の範囲15記載のコンピュータ・システム。１７．前記スタック・タグキャッシュは更に、プログラム・スタック・エントリのタグ部分が前記スタック・タグキャッシュ内部に存在するかどうか決定するように構成された比較論理を含むことを特徴とする請求の範囲15記載のコンピュータ・システム。１８．前記スタック・タグキャッシュは更に、前記スタック・タグキャッシュに供給されるアドレスに応答し、かつ、前記供給されたアドレスにより選択された値をプログラム・スタック・エントリのタグ部分に対して提示するように構成された出力論理を含むことを特徴とする請求の範囲15記載のコンピュータ・システム。１９．前記スタック・タグキャッシュ内部のタグ部分の個数はスタック・エントリの個数より少ないことを特徴とする請求の範囲15記載のコンピュータ・システム。２０．プロセッサと、第１のメモリ領域に複数のスタック・エントリを記憶してプログラム命令実行中に前記スタック・エントリを操作するように構成されたメモリとプログラム・スタック論理とを有するコンピュータ・システムで使用するためのコンピュータ・プログラム製品であって、各スタック・エントリは参照値又はプリミティブ値のいずれかとして定義可能なデータを収容することができる特徴を有し、コンピュータで使用可能な媒体を含む前記コンピュータ・プログラム製品は、参照又はプリミティブ値のいずれかとしてスタック・エントリの区別を行なえるようにするために前記媒体に実現されたプログラム・コードを有し、前記プログラム・コードは、第２のメモリ領域に、複数のタグ項目を保持するためのプログラム・コードであって、各タグ項目がスタック・エントリに関連していることを特徴とするプログラム・コードと、選択したスタック項目に対応する前記複数のタグ項目の１つを取り出すためのプログラム・コードと、前記取り出すためのプログラム・コードに応答するプログラム・コードであって、前記選択したスタック・エントリに関連するタグ項目の値を提示するためのプログラム・コードと、を含むことを特徴とするコンピュータ・プログラム製品。２１．前記選択するためのプログラム・コードは更に、前記選択したスタック・エントリに対応するタグ項目が前記第２のメモリ領域内に存在するかどうかを決定するためのプログラム・コードを含むことを特徴とする請求の範囲20記載のコンピュータ・プログラム製品。２２．前記選択するためのプログラム・コードは更に、前記第２のメモリ領域内に存在しないタグ項目を取り出すためと前記第２のメモリ領域に前記タグ項目を書き込むためのプログラム・コードを含むことを特徴とする請求の範囲20記載のコンピュータ・プログラム製品。２３．選択した第２のスタック・エントリに対応する前記複数のタグ項目の第２の項目を同時に選択するためのプログラム・コードを更に含むことを特徴とする請求の範囲20記載のコンピュータ・プログラム製品。２４．各タグ項目は前記対応するスタック・エントリ内部に含まれるデータが参照か又はプリミティブ値かを表わす値を有することを特徴とする請求の範囲20記載のコンピュータ・プログラム製品。２５．メモリを有するコンピュータ・システム上でガーベッジ・コレクションを実行するための装置であって、前記メモリ内に複数のスタック・エントリを記憶してプログラム命令実行中に前記スタック・エントリを操作するように構成されたプログラム・スタック論理であって、各スタック・エントリはプログラム命令の実行に有用なデータを収容しデータ部分とタグ部分とを含み、前記タグ部分には複数の予め規定されたオペランド形式のどれを前記データが表わすかを示す情報を含むことを特徴とするプログラム・スタック論理と、第１のメモリ領域に記憶された各プログラム・スタック・エントリのデータ部分を記憶するように構成された第１の記憶要素であって、前記データ部分の構成と値がプログラム命令実行中に操作されることを特徴とする第１の記憶要素と、前記第１のメモリ領域とは異なる第２のメモリ領域に前記複数のプログラム・スタック・エントリの各々のタグ部分を記憶するように構成された第２の記憶要素であって、前記タグ部分の構成と値がこれに対応するプログラム・スタック・エントリの前記データ部分と相関する方法で操作されることを特徴とする第２の記憶要素と、未使用メモリ・ロケーションのアドレスを決定するために、前記第２のメモリ領域を調べて前記未使用メモリ・ロケーションを再請求するように動作可能なガーベッジ・コレクション機構と、を含むことを特徴とする装置。２６．前記第２のメモリ領域は前記メモリとは別のキャッシュメモリであることを特徴とする請求の範囲25記載の装置。２７．前記複数のプログラム・スタック・エントリの各々の前記タグ部分は前記プログラム・スタック・エントリが参照か又はプリミティブ値かを表わすことを特徴とする請求の範囲25記載の装置。２８．前記ガーベッジ・コレクション機構は前記プログラム・スタック・エントリが参照であることを関連タグ部分が表わしている第１のメモリ領域に記憶された各プログラム・スタック・エントリのデータ部分を用いることによって、前記未使用のメモリ・ロケーションのアドレスを決定することを特徴とする請求の範囲26記載の装置。