WO2006112111A1

WO2006112111A1 - キャッシュメモリシステム及びその制御方法

Info

Publication number: WO2006112111A1
Application number: PCT/JP2006/302141
Authority: WO
Inventors: Hazuki Okabayashi; Tetsuya Tanaka; Ryuta Nakanishi; Masaitsu Nakajima; Keisuke Kaneko
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 2005-04-08
Filing date: 2006-02-08
Publication date: 2006-10-26
Anticipated expiration: 2007-10-08
Also published as: CN101151600B; EP1868101A4; TW200702993A; EP1868101B1; CN101151600A; KR20070093452A; US20090100231A1; JP4090497B2; JPWO2006112111A1; DE602006011292D1; US7953935B2; EP1868101A1

Abstract

　ソフトウェアからの制御を積極的に受け入れて処理するキャッシュメモリシステムは、プロセッサ（１）とメモリ（２）との間に設けられるキャッシュメモリ（３）と、前記キャッシュメモリを制御するＴＡＣ（Transfer and Attribute Controller）（４）とを備え、ＴＡＣ（４）はプロセッサ（１）が予め定められた命令を実行することによって、キャッシュデータの転送及び属性操作とその操作の対象を指定するアドレスとを示すコマンドを与えられ、前記アドレスに対する前記コマンドによって示される操作を、前記キャッシュメモリに要求する。

Description

明細書

キャッシュメモリシステム及びその制御方法

技術分野

[0001] 本発明は、キャッシュメモリシステム及びその制御方法に関し、特にキャッシュメモリシステムのソフトウェアによる制御性を向上する技術に関する。

背景技術

[0002] 近年のマイクロプロセッサでは、例えば、 SRAM (Static Random Access Memory) 等力成る小容量で高速なキャッシュメモリをマイクロプロセッサの内部、もしくはその近傍に配置し、データの一部をキャッシュメモリに記憶することによって、マイクロプロセッサのメモリアクセスを高速化させて、る。

[0003] 従来、キャッシュの効率向上（ヒット率向上、キャッシュミスレイテンシ低減）を指向した種々の技術が知られている。そのような技術の一つに、キャッシュミスが発生する前に、近い未来に使用するデータを予めキャッシュにフィルするプリロード (又はプリフエツチ）がある（例えば特許文献 1)。この技術を用いて、プリフェッチ命令により指定したアドレスを含むラインをキャッシュにロードすることにより、キャッシュミスの低減を図ることがでさる。

特許文献 1：特開平 7— 295882号公報

発明の開示

発明が解決しょうとする課題

[0004] しかしながら、上記従来の技術によれば、メモリへのアクセスの状況をハードウェアによって監視し、ハードウェアによって自律的にキャッシュ操作をしょうとすると、正確な予測が困難であるためにかえって無駄な転送が発生することがある。このことは、上記従来の技術に限らず、キャッシュの効率向上を指向した種々の技術において同様である。そのようなハードウェアによる自律的な制御によるキャッシュ効率の限界を打開する一つのアプローチとして、ソフトウェアによる制御を援用することが考えられる。

[0005] 本発明は、上記の問題に鑑みてなされたものであり、ソフトウェア力もの制御を積極的に受け入れて処理を行うための好ましい構成を持ったキャッシュメモリシステムを提供することを目的とする。

課題を解決するための手段

[0006] 上記課題を解決するため、本発明のキャッシュメモリシステムは、プロセッサとメモリとの間に設けられるキャッシュメモリと、前記キャッシュメモリを制御する転送及び属性制御手段とを備え、前記転送及び属性制御手段は、前記プロセッサが予め定められた命令を実行することによって、キャッシュデータの転送及び属性操作とその操作の対象を指定するアドレスとを示すコマンドを与えられるコマンドエントリ部と、前記アドレスに対する前記コマンドによって示される操作を、前記キャッシュメモリに要求する操作要求部とを備える。

[0007] また、前記コマンドエントリ部は、さらに、前記プロセッサから前記コマンドに対応してアドレス範囲を与えられ、前記操作要求部は、前記アドレス範囲に属する複数のァドレスに対する前記操作を、前記キャッシュメモリに逐次要求してもよい。

[0008] この構成によれば、前記予め定められた命令を前記プロセッサに実行させることによって、ソフトウェアから、前記キャッシュデータの転送及び属性操作を要求できるので、ソフトウェア力もの制御を積極的に受け入れて処理を行うための好ましい構成を持ったキャッシュメモリシステムが得られる。

[0009] また、前記キャッシュメモリは、キャッシュデータの管理単位であるキャッシュエントリに対応付けて、そのキャッシュエントリに保持されるキャッシュデータに対応するメモリアドレスの上位部を示すタグを保持するタグ保持部と、そのキャッシュエントリが有効か否かを示すバリッドフラグと、そのキャッシュエントリに書き込み操作があった力否かを示すダーティフラグと、そのキャッシュエントリがアクセスされた時期を他のどのキヤッシュエントリがアクセスされた時期よりも古いとみなすことを示すウィークフラグとを保持するフラグ保持部とを有し、前記転送及び属性制御手段からの要求に応じて、指定されるアドレスにヒットするキャッシュエントリがない場合に、リプレース対象となるキャッシュエントリを選択し、メモリから前記選択されたキャッシュエントリへ前記指定されたアドレスに対応するデータをロードし、タグを設定してノリツドフラグをセットするフィル操作、指定されるアドレスにヒットするキャッシュエントリがない場合に、リプレース対象となるキャッシュエントリを選択し、メモリから前記選択されたキャッシュエントリへデータをロードすることなくタグを設定してノリツドフラグをセットするタツチ操作、指定されるアドレスにヒットするキャッシュエントリがありかつダーティフラグがセットされている場合に、そのキャッシュエントリのデータをメモリへセーブしてダーティフラグをリセットするライトバック操作、指定されるアドレスにヒットするキャッシュエントリがある場合に、そのキャッシュエントリのデータをダーティフラグの状態に応じてメモリへセーブすることなくバリッドフラグをリセットする無効化操作、指定されるアドレスにヒットするキヤッシュエントリがある場合に、ダーティフラグがセットされていればそのキャッシュエントリのデータをメモリへセーブしてダーティフラグ及びバリッドフラグをリセットし、ダーティフラグがリセットされていればそのキャッシュエントリのノリツドフラグのリセットのみを行うライトバック兼無効化操作、及び指定されるアドレスにヒットするキャッシュエントリがある場合に、そのキャッシュエントリのウィークフラグをセットする最古ィ匕操作の中の一つを実行してもよい。

[0010] この構成によれば、前記 6種類の操作は、キャッシュのヒット率の向上、不必要なバストランザクションの削減、及びバストランザクションの平準化（時間的分散）に効果があるので、ソフトウェアからの制御を積極的に受け入れて処理を行うことによってキヤッシュ効率の向上を図る上で好適である。

[0011] また、前記転送及び属性制御手段は、さらに、前記アドレス範囲の先頭及び末尾を、前記キャッシュメモリにおけるキャッシュデータの管理単位であるキャッシュエントリの先頭データを示すように調整するアドレス調整部を有し、前記操作要求部は、前記調整後のアドレス範囲に含まれる複数のアドレスに対する前記操作を、前記キヤッシュメモリに逐次要求してもよ、。

[0012] この構成によれば、前記アドレス調整部が、前記アドレス範囲の先頭及び末尾を、前記キャッシュエントリの先頭データを示すように調整するので、プログラマやコンパイラはキャッシュメモリのライン境界やラインサイズを管理する必要がなぐキャッシュ管理のための負担が軽減される。

[0013] また、前記転送及び属性制御手段は、さらに、複数のコマンドとそれぞれのコマンドに対応するアドレス範囲とを保持するコマンド保持部と、前記保持された複数のコマンドの中から一つを選択するコマンド選択部とを有し、前記操作要求部は、前記選択されたコマンドに関連するアドレス範囲に属する複数のアドレスに対する、そのコマンドによって示される操作を逐次要求してもよ!/、。

[0014] また、好ましくは、前記コマンド選択部は、前記選択されたコマンドにつ、て全ての要求がなされる前に、他のコマンドを選択し、前記操作要求部は、元のコマンドが再び選択された場合にそのコマンドにつ、てまだ要求して!/、な!、アドレスに対する操作を逐次要求してもよい。

[0015] この構成によれば、前記転送及び属性制御手段は複数のコマンドを保持して処理できるので、例えば前記複数のコマンド力例えば前記プロセッサがマルチタスク処理を行う場合の各タスクから与えられる場合に好適である。

[0016] また、前記転送及び属性制御手段は、さらに、次に予定される要求に関して定められる予測アドレスに対して、前記プロセッサによって特定の命令が実行された力否かを判断する実行判断部と、肯定判断がなされると、前記予測アドレスに所定のオフセット値を加算又は減算することによって実効アドレスを生成する実効アドレス生成部とを有し、前記操作要求部は、前記生成された実効アドレスに対する前記操作を要求してちよい。

[0017] また、好ましくは、前記転送及び属性制御手段は、さらに、複数のコマンドとそれぞれのコマンドに関係するアドレス範囲とを保持するコマンド保持部を有し、前記実行判断部は、前記保持された各コマンドについて、そのコマンドに対応する予測アドレスに対して、前記プロセッサによって特定の命令が実行されたか否かを判断し、前記転送及び属性制御手段は、さらに、肯定判断がなされたコマンドの中力一つを選択するコマンド選択部を有し、前記実効アドレス生成部は、前記選択されたコマンドに対応する予測アドレスに所定値を加算又は減算することによって実効アドレスを生成し、前記操作要求部は、前記生成された実効アドレスに対する前記選択されたコマンドによって示される操作を要求してもよ、。

[0018] この構成によれば、前記特定の命令がプリフェッチ付きの命令である場合に特に好適であり、その命令の操作対象に対してその命令の実行に同期して前記操作の要求がなされるので、キャッシュエントリを効率よく操作することができる。 [0019] また、前記転送及び属性制御手段は、さらに、前記キャッシュメモリにおけるキヤッシュデータの管理単位である各キャッシュエントリを指定するアドレスを逐次出力するアドレス出力部を有し、前記操作要求部は、前記出力されたアドレスによって指定されるキャッシュエントリを含む一つ以上のキャッシュエントリに対する逐次操作を前記キャッシュメモリに要求し、前記キャッシュメモリは、前記要求に応じて逐次操作を実行してちょい。

[0020] ここで、前記逐次操作は、ライトバック操作であってもよ!/、。

この構成によれば、バストランザクションの平準化（時間的分散）に効果があることは明らかである。

[0021] また、前記コマンドエントリ部は、単一のアドレスに対する操作を示す単独コマンドと、アドレス範囲に含まれる複数のアドレスに対する操作を前記プロセッサが実行する特定の命令と同期して行うことを示す命令連動コマンドと、アドレス範囲に含まれる複数のアドレスに対する操作を前記プロセッサが実行する特定の命令とは非同期に行うことを示す領域コマンドと、キャッシュデータを逐次ライトバックすることを示すオートクリーナコマンドとを、前記プロセッサから与えられ、前記操作要求部は、各コマンドに応じた操作要求を、予め設定された優先順位に基づいて、前記キャッシュメモリに要求してもよい。

[0022] ここで、前記予め設定された優先順位が、前記コマンドの順であってもよ、。

この構成によれば、各操作の実行モードに応じた好適な順序で操作を要求することができる。

[0023] また、本発明は、このようなキャッシュメモリシステムとして実現することができるだけでなぐそのようなキャッシュメモリシステムが備える特徴的な手段によって実行される処理をステップとするキャッシュメモリシステムの制御方法として実現することもできる

発明の効果

[0024] 本発明のキャッシュメモリシステムによれば、前記予め定められた命令をプロセッサに実行させることによって、ソフトウェアから、キャッシュデータの転送及び属性操作を要求できるので、ソフトウェア力もの制御を積極的に受け入れて処理を行うための好ましい構成を持ったキャッシュメモリシステムが得られる。

[0025] キャッシュ効率の向上を図るために前記操作としてキャッシュ効率の向上に効果がある操作を採用し、ソフトウェアからの積極的な制御下でこれらの操作を行えば、ハ一ドウエアとソフトウェアとの良好な機能分担が可能となり、その結果、自律的な制御によるキャッシュ効率の向上を目指してハードウェアがいたずらに大規模ィ匕する事態を回避することちできる。

図面の簡単な説明

[0026] [図 1]図 1は、本発明の実施の形態に係るプロセッサ、キャッシュメモリ、メモリ、 TAC を含むコンピュータシステムの全体構成例を示すブロック図である。

[図 2]図 2は、キャッシュメモリの構成例を示すブロック図である。

[図 3]図 3は、使用フラグの更新例を示す図である。

[図 4]図 4 (a)はウィークフラグが存在しない場合にキャッシュエントリがリプレースされる様子を示す図であり、図 4 (b)はリプレース処理におけるウィークフラグ Wの役割を示す説明図である。

[図 5]図 5は、キャッシュメモリにおける動作プリミティブ処理の一例を示すフローチヤートである。

[図 6]図 6は、キャッシュメモリにおけるオートクリーナ処理の一例を示すフローチヤ一トである。

[図 7]図 7は、変形例に係るキャッシュエントリの構成例を示す図である。

[図 8]図 8は、キャッシュメモリと TACとの間のインタフェースの一例を示す図である。

[図 9]図 9は、 TACの構成例を示すブロック図である。

[図 10]図 10 (a)は、動作プリミティブレジスタにコマンドを書き込む命令の一例を示す図であり、図 10 (b)は、コマンドの一例を示す図である。

[図 11]図 11 (a)は、スタートアドレスレジスタにスタートアドレスを書き込む命令の一例を示す図であり、図 11 (b)は、サイズレジスタにサイズを書き込む命令の一例を示す図であり、図 11 (c)は、コマンドレジスタにコマンドを書き込む命令の一例を示す図であり、図 11 (d)は、コマンドの一例を示す図である。

[図 12]図 12 (a)は、 TACコントロールレジスタにコマンドを書き込む命令の一例を示す図であり、図 12 (b)は、コマンドの一例を示す図である。

[図 13]図 13は、アドレス調整の内容を説明する概念図である。

[図 14]図 14は、アドレス保持部の構成を示すブロック図である。

[図 15]図 15は、領域コマンド制御部における領域コマンド制御処理の一例を示すフローチャートである。

[図 16]図 16は、命令連動コマンド制御部における命令連動コマンド制御処理の一例を示すフローチャートである。

[図 17]図 17は、オートクリーナ制御部におけるオートクリーナ制御処理の一例を示すフローチャートである。

[図 18]図 18は、操作要求部における操作要求処理の一例を示すフローチャートである。

符号の説明

1 プロセッサ

2 メモリ

3 キャッシュメモリ

4 TAC

20 アドレスレジスタ

21 メモリ IZF

22 デマルチプレクサ

30 デコーダ

31a- -31d ウェイ

32a- -32d 比較器

33a- -33d アンド回路

34 オア回路

35 セレクタ

36 セレクタ

37 デマルチプレクサ 40 コマンドエントリ部

41 領域コマンド制御部

42 命令連動コマンド制御部

43 オートクリーナ制御部

44 操作要求部

401 動作プリミティブレジスタ

402 スタートアドレスレジスタ

403 サイズレジスタ

404 コマンドレジスタ

405 TACコントロールレジスタ

411 アドレス調整部

412 コマンド保持部

413 コマンド選択部

421 アドレス調整部

422 コマンド保持部

423 実行判断部

424 コマンド選択部

425 実効アドレス生成部

431 クリーニングアドレス出力言 1

発明を実施するための最良の形態

[0028] 以下、本発明の実施の形態について、図面を参照しながら説明する。

[0029] く全体構成〉

図 1は、本発明の実施の形態におけるプロセッサ 1、メモリ 2、キャッシュメモリ 3、及び TAC (Transfer and Attribute Controller) 4を含むコンピュータシステムの全体構成を示すブロック図である。この実施の形態におけるキャッシュメモリ 3及び TAC4が本発明のキャッシュメモリシステムに相当する。

[0030] TAC4は、プロセッサ 1が予め定められた命令を実行することによってキャッシュデータの転送及び属性操作とその操作の対象を指定するアドレスとを示すコマンドを与えられ、そのコマンドによって示される操作をキャッシュメモリ 3に要求する。

[0031] キャッシュメモリ 3は、プロセッサ 1からのメモリアクセスに応じて、従来の一般的なキャッシュメモリが行うようにデータのキャッシングを行う。また、プロセッサ 1からのメモリアクセスを処理していないときには、 TAC4からの要求に応じて、 6種類のキャッシュデータの転送及び属性操作、並びにオートクリーナを実行する。この 6種類の操作は動作プリミティブと呼ばれる。動作プリミティブ及びオートクリーナについて、後に詳しく説明する。

[0032] 本発明のキャッシュメモリシステムのこのような構成は、ハードウェアによる自律的な制御によるキャッシュ効率の限界をソフトウェアの援用によって打開しょうとしたときに、ソフトウェア力もの制御を積極的に受け入れるために適して、る。

[0033] くキャッシュメモリの構成 >

以下、キャッシュメモリ 3の具体例として、 4ウェイ 'セット'ァソシエイティブ方式のキヤッシュメモリに本発明を適用した場合の構成について説明する。

[0034] 図 2は、キャッシュメモリ 3の構成例を示すブロック図である。同図のように、キヤッシュメモリ 3は、アドレスレジスタ 20、メモリ I/F21、デマルチプレクサ 22、デコーダ 30、 4つのウェイ 31a〜31d (以下ウェイ 0〜3と略す）、 4つの比較器 32a〜32d、 4つのァンド回路 33a〜33d、オア回路 34、セレクタ 35、 36、デマルチプレクサ 37、制御部 3 8を備える。

[0035] デマルチプレクサ 22は、制御部 38からの制御に応じて、プロセッサ 1から与えられるメモリ 2へのアクセスアドレスを優先的に選択し、プロセッサ 1からのメモリアクセスがな、ときに TAC4から与えられるアドレスを選択する。

[0036] アドレスレジスタ 20は、選択されたアクセスアドレスを保持するレジスタである。このアクセスアドレスは 32ビットであるものとする。同図に示すように、アクセスアドレスは、最上位ビットから順に、 21ビットのタグアドレス、 4ビットのセットインデックス（図中の SI )、 5ビットのワードインデックス（図中の WI)を含む。ここで、タグアドレスはウェイにマッビングされるメモリ中の領域 (そのサイズはセット数 Xブロックである）を指す。この領域のサイズは、タグアドレスよりも下位のアドレスビット (A10〜AO)で定まるサイズつまり 2kバイトであり、 1つのウェイのサイズでもある。セットインデックス（SI)はウェイ 0〜 3に跨る複数セットの 1つを指す。このセット数は、セットインデックス力ビットなので 1 6セットある。タグアドレスおよびセットインデックスで特定されるキャッシュエントリは、リプレース単位であり、キャッシュメモリに格納されている場合はラインデータ又はラインと呼ばれる。ラインデータのサイズは、セットインデックスよりも下位のアドレスビットで定まるサイズつまり 128バイトである。 1ワードを 4バイトとすると、 1ラインデータは 32ヮードである。ワードインデックス (WI)は、ラインデータを構成する複数ワード中の 1ヮードを指す。アドレスレジスタ 20中の最下位 2ビット（Al、 AO)は、ワードアクセス時には無視される。

[0037] メモリ IZF21は、キャッシュメモリ 3からメモリ 2へのデータのライトバックや、メモリ 2 力キャッシュメモリ 3へのデータのロード等、キャッシュメモリ 3からメモリ 2をアクセスするための IZFである。

[0038] デコーダ 30は、セットインデックスの 4ビットをデコードし、 4つのウェイ 0〜3に跨る 1 6セット中の 1つを選択する。

[0039] 4つのウェイ 0〜3は、同じ構成を有数する 4つのウェイであり、 4 X 2kバイトの容量を有する。各ウェイは、 16個のキャッシュエントリを有する。 1つのキャッシュエントリは、ノリツドフラグ V、 21ビットのタグ、 128バイトのラインデータ、ウィークフラグ W、使用フラグ U、及びダーティフラグ Dを有する。

[0040] タグは 21ビットのタグアドレスのコピーである。ラインデータは、タグアドレスおよびセットインデックスにより特定されるブロック中の 128バイトデータのコピーである。

[0041] ノリツドフラグ Vは、当該キャッシュエントリのデータが有効か否かを示す。

[0042] ウィークフラグ Wは、プロセッサからのアクセスに関しては、アクセス頻度の低いァクセスか否かを示し、キャッシュメモリにおけるリプレース制御に関しては、そのキヤッシュエントリのアクセス順序を強制的に最古とする、つまりそのキャッシュエントリがァクセスされた時期が他のどのキャッシュエントリがアクセスされた時期よりも古いとみなすことを示す。ウィークフラグ Wによって、他のキャッシュエントリよりも先に追い出してもょ、最強のリプレース対象が示される。

[0043] 使用フラグ Uは、そのキャッシュエントリにアクセスがあつたか否かを示し、 LRU方式におけるキャッシュエントリ間のアクセス順序データの代わりに用いられる。より正確には、使用フラグ Uの 1は、アクセスがあったことを、 0はないことを意味する。ただし、 1つのセット内の 4つウェイの使用フラグが全て 1になる場合には、セットするウェイ以外は 0にリセットされる。別言すれば、使用フラグ Uは、アクセスされた時期が古いか新しいか 2つの相対的な状態を示す。つまり、使用フラグ Uが 1のキャッシュエントリは、使用フラグが 0のキャッシュエントリよりも新しくアクセスされたことを意味する。

[0044] ダーティフラグ Dは、当該キャッシュエントリにプロセッサから書き込みがあつたか否力つまりライン中にキャッシュされたデータが存在するが書き込みによりメモリ中のデータと異なる可能性があるためメモリに書き戻すことが必要力否かを示す。

[0045] 比較器 32aは、アドレスレジスタ 20中のタグアドレスと、セットインデックスにより選択されたセットに含まれる 4つのタグ中のウェイ 0のタグとがー致する力否かを比較する。比較器 32b〜32cについても、ウェイ 31b〜31dに対応すること以外は同様である。

[0046] アンド回路 33aは、ノリツドフラグと比較器 32aの比較結果とがー致する力否かをァンドする。この比較結果を hOとする。比較結果 hOが 1である場合は、アドレスレジスタ 20中のタグアドレスおよびセットインデックスに対応するラインデータが一致すること、つまりウェイ 0においてヒットしたことを意味する。比較結果 hOが 0である場合は、ミスヒットしたことを意味する。アンド回路 33b〜33dについても、ウェイ 31b〜31dに対応すること以外は同様である。その比較結果 hi〜！ ι3は、ウェイ 1〜3でヒットしたかミスした力を意味する。

[0047] オア回路 34は、比較結果 hO〜！ ι3のオアをとる。このオアの結果を hitとする。 hitは

、キャッシュメモリにヒットしたか否かを示す。

[0048] セレクタ 35は、選択されたセットにおけるウェイ 0〜3のラインデータのうち、ヒットしたウェイのラインデータを選択する。

[0049] セレクタ 36は、セレクタ 35により選択された 32ワードのラインデータにうち、ワードィンデッタスに示される 1ワードを選択する。

[0050] デマルチプレクサ 37は、キャッシュエントリにデータを書き込む際に、ウェイ 0〜3の

1つに書き込みデータを出力する。この書き込みデータはワード単位でよい。

[0051] 制御部 38は、キャッシュメモリ 3の全体の制御を行う。

[0052] <使用フラグ Uの説明 > 図 3は、制御部 38による使用フラグの更新例を示す。同図の上段、中断、下段は、ウェイ 0〜3に跨るセット Nを構成する 4つのキャッシュエントリを示している。 4つのキャッシュエントリ右端の 1又は 0は、それぞれ使用フラグの値である。この 4つの使用フラグ Uを UO〜U3と記す。

[0053] 同図上段では（UO〜U3) = (1、 0、 1、 0)であるので、ウェイ 0、 2のキャッシュェントリはアクセスがあったことを、ウェイ 1、 3のキャッシュエントリはアクセスがないことを意味する。

[0054] この状態で、メモリアクセスがセット N内のウェイ 1のキャッシュエントリにヒットした場合、同図中段に示すように、（UO〜U3) = (1、 1、 1、 0)に更新される。つまり、実線に示すようにウェイ 1の使用フラグ U1が 0から 1に更新される。

[0055] さらに、同図中段の状態で、メモリアクセスがセット N内のウェイ 3のキャッシュェントリにヒットした場合、同図下断に示すように、（UO〜U3) = (0、 0、 0、 1)に更新される。つまり、実線に示すようにウェイ 3の使用フラグ U1が 0から 1に更新される。加えて、破線に示すようにウェイ 3以外の使用フラグ U0〜U2が 1から 0に更新される。これにより、ウェイ 3のキヤシュエントリ力ウェイ 0〜2の各キャッシュエントリよりも新しくァクセスされたことを意味すること〖こなる。

[0056] 制御部 38は、キャッシュミス時に W= 1のキャッシュエントリが存在しなければ、使用フラグに基づいてリプレース対象のキャッシュエントリを決定してリプレースを行う。例えば、制御部 38は、図 3上段では、ウェイ 1とウェイ 3の何れかをリプレース対象と決定し、図 3中段ではウェイ 3をリプレース対象と決定し、図 3下段ではウェイ 0〜2の何れかをリプレース対象と決定する。

[0057] くウィークフラグ Wの説明 >

図 4 (a)ウィークフラグが存在しな、と仮定した場合の比較例であり、キャッシュェントリがリプレースされる様子を示す図である。同図においても、図 3と同様にウェイ 0〜 3に跨るセット Nを構成する 4つのキャッシュエントリを示している。 4つのキャッシュェントリ右端の 1又は 0は、それぞれ使用フラグの値である。また、データ Eのみアクセス頻度の低いデータを、データ A、 B、 C、 Dはアクセス頻度の高いデータとする。

[0058] 図 4 (a)の第 1段目の状態で、プロセッサ 1がデータ Eにアクセスすると、キャッシュミスが発生する。このキャッシュミスにより、例えば、 u=oのキャッシュエントリの中からアクセス頻度の高、データ Cのキャッシュエントリがアクセス頻度の低!、データ Eにリプレースされ、第 2段目の状態となる。

[0059] 第 2段目の状態で、プロセッサ 1がデータ Cにアクセスすると、キャッシュミスが発生する。このキャッシュミスにより、 U = 0のキャッシュエントリであるアクセス頻度の高いデータ Dのキャッシュエントリがアクセス頻度の高いデータ Cにリプレースされ、第 3段目の状態となる。

[0060] 第 3段目の状態で、プロセッサ 1がデータ Dにアクセスすると、キャッシュミスが発生する。このキャッシュミスにより、例えば、アクセス頻度の高いデータ Aのキャッシュェントリがアクセス頻度の高いデータ Dにリプレースされ、第 4段目の状態となる。

[0061] 同様に、第 4段目でも、使用頻度の低いデータ Eはリプレース対象として選択されないで、キャッシュメモリに残っている。

[0062] 第 5段目の状態で、使用頻度の低いデータ Eは最も古い (U=0)であることから、リプレース対象として選択されて、追い出される。

[0063] このように、擬似 LRU方式にお!、て (通常の LRU方式にお!、ても）、アクセス頻度の低、データ Eによって、 4ウェイの場合は最悪 4回のキャッシュミスを誘発する場合がある。

[0064] 図 4 (b)は、リプレース処理におけるウィークフラグ Wの役割を示す説明図である。

[0065] 図 4 (b)の第 1段目の状態（図 4 (a)の第 1段目と同じ)で、プロセッサ 1がデータ Eにアクセスすると、キャッシュミスが発生する。このキャッシュミスにより、例えば、 U = 0のキャッシュエントリの中力もアクセス頻度の高いデータ Cのキャッシュエントリがァクセス頻度の低いデータ Eにリプレースされる。このとき、プロセッサ 1は、データ Eのキヤッシュエントリにウィークフラグ Wを 1に設定するものとする。これにより、次のキャッシュミス時にデータ Eのキャッシュエントリが真っ先に追い出され、第 2段目の状態となる。

[0066] 第 2段目の状態で、プロセッサ 1がデータ Cにアクセスすると、キャッシュミスが発生する。このキャッシュミスにより、 W= lのキャッシュエントリであるアクセス頻度の低いデータ Eのキャッシュエントリがリプレース対象として選択され、アクセス頻度の高ヽデータ Cにリプレースされ、第 3段目の状態となる。 [0067] このように、ウィークフラグ Wを設けることにより、アクセス頻度の低いデータによるキャッシュミスの誘発を低減することができる。

[0068] <動作プリミティブ >

次に、キャッシュメモリ 3が実行する 6種類の動作プリミティブについて説明する。動作プリミティブは、 TAC4から指定される単一のアドレスに対する次のような操作である。

(1)フィル操作:前記アドレスにヒットするキャッシュエントリがない場合に、リプレース対象となるキャッシュエントリを選択し、メモリから前記選択されたキャッシュエントリへ前記指定されたアドレスに対応するデータをロードし、タグを設定してノリツドフラグ V をセットする。この操作は、キャッシュのヒット率の向上に役立つ。

(2)タツチ操作:前記アドレスにヒットするキャッシュエントリがない場合に、リプレース対象となるキャッシュエントリを選択し、メモリから前記選択されたキャッシュエントリへデータをロードすることなくタグを設定してノリツドフラグ Vをセットする。この操作は、キャッシュのヒット率の向上と、不必要なバストランザクションの削減に役立つ。

(3)ライトバック操作:前記アドレスにヒットするキャッシュエントリがありかつダーティフラグ Dがセットされている場合に、そのキャッシュエントリのデータをメモリへセーブしてダーティフラグ Dをリセットする。この操作は、バストランザクションの平準化（時間的分散）に役立つ。

(4)無効化操作:前記アドレスにヒットするキャッシュエントリがある場合に、そのキヤッシュエントリのデータをダーティフラグに応じてメモリへセーブすることなくバリッドフラグ Vをリセットする。この操作は、不必要なバストランザクションの削減に役立つ。

(5)ライトバック兼無効化操作:前記アドレスにヒットするキャッシュエントリがある場合に、ダーティフラグ Dがセットされて!/ヽればそのキャッシュエントリのデータをメモリへセーブしてダーティフラグ D及びバリッドフラグ Vをリセットし、ダーティフラグ Dがリセットされて!/ヽればそのキャッシュエントリのバリッドフラグ Vのリセットのみを行う。この操作は、バストランザクションの平準化（時間的分散）に役立つ。

(6)最古ィ匕操作:前記アドレスにヒットするキャッシュエントリがある場合に、そのキヤッシュエントリのウィークフラグ Wをセットする。この操作は、キャッシュのヒット率の向上に役立つ。

[0069] <動作プリミティブ処理 >

図 5は、キャッシュメモリ 3における動作プリミティブ処理の一例を示すフローチヤ一トである。この動作プリミティブ処理は、 TAC4から動作プリミティブの指定 Iと、操作対象を指定するアドレス Aとを与えられると起動され、指定された動作プリミティブを実行する。

[0070] 制御部 38がプロセッサ 1からのメモリアクセスを処理中なら、その処理が終了するまで待ち（S101 :YES)、そして、プロセッサ 1からのメモリアクセスが行われていない期間に、デマルチプレクサ 22は TAC4から与えられたアドレスを選択する（S102)。

[0071] そのアドレスにヒットするキャッシュエントリがある場合には（S103 : YES)、無効化、最古化、ライトバック、及びライトバック兼無効化のみが、そのヒットしたキャッシュェントリを操作対象として実行される（S104)。指定された動作プリミティブ力 Sライトバック又はライトバック兼無効化であれば、ダーティフラグ Dが 1ならライトバックし (S105〜 S106)、さらに指定された動作プリミティブ力ライトバック兼無効化であればバリッドフラグ Vをリセットする（S107〜S108)。また、指定された動作プリミティブが無効化であればバリッドフラグ Vをリセットし (S110)、最古ィ匕であればウィークフラグ Wをセットする（S109)。

[0072] そのアドレスにヒットするキャッシュエントリがない場合には（S 103 : NO)、フィル及びタツチのみが実行される（S 111)。その場合にはまず、リプレース対象となるキヤッシュエントリを選択し（S112)、そのキャッシュエントリのダーティフラグ Dが 1ならライトノックし（S 113〜S 114)、タグアドレスを設定して（S 115)、さらに指定された動作プリミティブがフィルであればそのキャッシュエントリへメモリからデータをロードし（S117 )、その後、 Vフラグをセットする（S 118)。

[0073] <オートクリーナ >

次に、キャッシュメモリ 3が実行するオートクリーナについて説明する。オートクリーナは、 TAC4から指定される単一のアドレスに対する次のような操作である。

[0074] 前記アドレスで示されるセットの各キャッシュエントリ（図 2を参照して具体的に言えば、前記アドレスに含まれるセットインデックス SIで指し示されるセットに属する 4つのキャッシュエントリ）について、ダーティフラグ D及びウィークフラグ Wが共にセットされていればライトバックする。

[0075] この操作は、バストランザクションの平準化 (時間的分散）に役立つ。

[0076] <オートクリーナ処理 >

図 6は、キャッシュメモリ 3におけるオートクリーナ処理の一例を示すフローチャートである。このオートクリーナ処理は、 TAC4からオートクリーナの指定 Iと、操作対象を指定するアドレス Aとを与えられると起動される。

[0077] 制御部 38がプロセッサ 1からのメモリアクセスを処理中なら、その処理が終了するまで待ち（S201 :YES)、そして、プロセッサ 1からのメモリアクセスが行われていない期間に、デマルチプレクサ 22は TAC4から与えられたアドレスを選択する（S202)。

[0078] そのアドレスに含まれるセットインデックスで指定されるセットに属する各キャッシュエントリ ίこつヽて、以下を繰り返す（S203〜S207)。

[0079] ダーティフラグ Dが 1で、かつウィークフラグ Wが 1なら（S204 :YES)、ライトバックしてダーティフラグ Dをリセットする（S205〜S206)。

[0080] <変形例>

なお、本発明のキャッシュメモリは、上記の実施の形態の構成に限るものではなぐ種々の変形が可能である。以下、変形例のいくつかについて説明する。

(1)上記実施の形態では、 4ウェイ 'セット'ァソシエイティブのキャッシュメモリを例に説明したが、ウェイ数は、いくつでもよい。また、上記実施の形態では、セット数が 16 である例を説明したが、セット数は、くつでもよ、。

(2)上記実施の形態では、セット'ァソシエイティブのキャッシュメモリを例に説明した力フル ·ァソシエイティブ方式やダイレクトマップ方式のキャッシュメモリであってもよい。

(3)上記実施の形態では、ラインをキャッシュデータのリプレース単位であるとして説明したが、ラインを 4つに分割した各部分であるサブラインをリプレース単位としてもよい。その場合、各キャッシュエントリは、 4つのバリッドフラグおよび 4つのダーティフラグをそれぞれ保持する。

[0081] 図 7は、その場合のキャッシュエントリの構成例を示す図である。ラインの 1/4をサブラインとする他に、ラインの 1/2、 1/8、 1/16をサブラインとしてもよい。その場合、各キャッシュエントリは、サブラインと同数のノリツドフラグおよびダーティフラグをそれぞれ保持する。リプレース単位をラインとするかサブラインとするかを、 TAC4からの指示に応じて切り替えてもよ、。

(4)キャッシュメモリとしてのいくつかの機能 (例えばリプレース機能）が制限されるゥェィ (インアクティブウェイ）を設けてもょヽ。各ウェイをそのようなインアクティブウェイとするか、全ての機能が利用可能なアクティブウェイとするかを、 TAC4からの指示に応じて切り替えてもよい。

[0082] <キャッシュメモリ及び TAC間のインタフェースの一例 >

図 8は、キャッシュメモリ 3と TAC4との間のインタフェース（送受信される信号）の一例を示す図である。この例には、上記の変形例が考慮されている。

[0083] 32ビットのアドレスは、操作の対象を指定する。要求、要求受理、及び実行完了は、要求の発行に関するハンドシェイクに用いられる。フィル、タツチ、ライトバック、無効ィ匕、ライトバック兼無効化、最古化、及びオートクリーナは、要求する操作を指定する。 3ビットのアクティブウェイは、ウェイごとにアクティブウェイとする力インアクティブゥェィとするかを指定する。リフィル単位は、リプレース単位をラインとするかサブラインとするかを指定する。

[0084] く TACの構成〉

次に、 TACの構成について説明する。

[0085] 図 9は、 TAC4の構成例を示すブロック図である。 TAC4は、プロセッサ 1から与えられるコマンドに応じた操作をキャッシュメモリ 3へ要求するために、コマンドエントリ部 40、領域コマンド制御部 41、命令連動コマンド制御部 42、オートクリーナ制御部 43 、及び操作要求部 44を備える。

[0086] TAC4がプロセッサ 1から与えられるコマンドには、単一のアドレスに対する操作を示す単独コマンドと、アドレス範囲に含まれる複数のアドレスに対する操作を前記プ口セッサが実行する特定の命令に同期して行うことを示す命令連動コマンドと、ァドレス範囲に含まれる複数のアドレスに操作を前記プロセッサが実行する特定の命令とは非同期に行うことを示す領域コマンドと、キャッシュデータを逐次ライトバックすることを示すオートクリーナコマンドとがある。

[0087] コマンドエントリ部 40は、プロセッサ 1が予め定められた命令を実行することによって、コマンドとアドレスとを書き込まれるレジスタ群であり、動作プリミティブレジスタ 401、スタートアドレスレジスタ 402、サイズレジスタ 403、コマンドレジスタ 404、及び TAC コントロールレジスタ 405を備える。これらのレジスタは、例えば予め定められたメモリアドレスに割り当てられるなどして、プロセッサ 1から直接アクセスが可能であり、プロセッサ 1により書き込まれた内容を保持する。

[0088] 領域コマンド制御部 41は、領域コマンドを最大 4つまで保持し、保持されているコマンドに応じた要求を生成する機能ブロックであり、アドレス調整部 411、コマンド保持部 412、及びコマンド選択部 413を備える。

[0089] 命令連動コマンド制御部 42は、命令連動コマンドを最大 4つまで保持し、保持されているコマンドに応じた要求を、プロセッサ 1が実行する特定の命令と同期して生成する機能ブロックであり、アドレス調整部 421、コマンド保持部 422、実行判断部 423

、コマンド選択部 424、実効アドレス生成部 425を備える。

[0090] オートクリーナ制御部 43は、オートクリーナ要求を生成する機能ブロックであり、タリ一-ングアドレス出力部 431を備える。

[0091] くコマンドエントリ部 >

単独コマンドは、動作プリミティブレジスタ 401に書き込まれ、保持される。

[0092] 図 10 (a)に、動作プリミティブレジスタ 401に単独コマンドを書き込む命令の一例を示す。この命令は、通常の転送命令 (mov命令）であり、ソースオペランドとしてコマンドを、デスティネーションオペランドとして動作プリミティブレジスタ（PR) 401を指定している。

[0093] 図 10 (b)に、コマンドフォーマットの一例を示す。このコマンドフォーマットは、操作対象アドレスと動作プリミティブの指定とからなる。

[0094] コマンドエントリ部 40は、動作プリミティブレジスタ 401に保持された単独コマンドに応じた要求を操作要求部 44へ出力する。

[0095] 領域コマンド及び命令連動コマンドは、スタートアドレスレジスタ 402、サイズレジスタ 403、及びコマンドレジスタ 404に書き込まれる。 [0096] 図 11 (a)に、スタートアドレスレジスタ（SAR) 402にスタートアドレスを書き込む命令の一例を示す。この命令も、図 10 (a)と同様に通常の転送命令である。スタートァドレスは、コマンドの操作対象の先頭アドレスを示す。

[0097] 011 (b)に、サイズレジスタ（SR) 403にサイズを書き込む命令の一例を示す。この命令も、通常の転送命令である。サイズは、前記操作対象の大きさを示す。サイズの単位は、バイト数であっても、ライン数 (キャッシュエントリ数)であってもよぐ予め定められた単位であればょ、。

[0098] 図 11 (c)に、コマンドレジスタ（CR) 404にコマンドを書き込む命令の一例を示す。

この命令も、通常の転送命令である。

[0099] 011 (d)に、コマンドフォーマットの一例を示す。このコマンドフォーマットは、操作の要求を特定の命令の実行に連動させるか否力（つまり、コマンドが命令連動コマンドか領域コマンドか)を指定する命令連動フラグと、動作プリミティブの指定と、指定されたアドレス範囲内で操作対象とする複数のアドレスの間隔を示すインクリメント値とからなる。

[0100] このインクリメント値を、例えばラインのサイズとすれば、アドレス範囲内の全てのキャッシュデータに順次所望の操作を行うことができる。また、前記特定の命令がポストインクリメント付きのロード'ストア命令である場合に、このインクリメント値をその命令のポストインクリメント値とすれば、その命令の操作対象に順次所望の操作を行うことができる。

[0101] コマンドエントリ部 40は、スタートアドレスレジスタ 402、サイズレジスタ 403、及びコマンドレジスタ 404に前述した内容が書き込まれると、そのコマンドが領域コマンドなら領域コマンド制御部 41へ出力し、命令連動コマンドなら命令連動コマンド制御部 4 2へ出力する。

[0102] オートクリーナコマンドは、 TACコントロールレジスタ 405内の予め定められたビット位置にあってオートクリーナを有効とするか無効とするかを示すオートクリーナフラグの値を更新する。

[0103] 図 12 (a)に、オートクリーナフラグを (TACコントロールレジスタ 405全体の内容と共に）更新する命令の一例を示す。この命令も、通常の転送命令である。 [0104] 図 12 (b)に、コマンドフォーマットの一例を示す。このコマンドフォーマットは、 TAC コントロールレジスタのフォーマットに対応し、前記ビット位置にオートクリーナフラグの新しい値を含む。

[0105] コマンドエントリ部 40は、 TACコントロールレジスタ 405に保持されたオートクリーナフラグの値をオートクリーナ制御部 43へ出力する。

[0106] <領域コマンド制御部 >

領域コマンド制御部 41において、アドレス調整部 411は、コマンドエントリ部 40から領域コマンドに関するアドレス範囲を取得し、その両端をそれぞれキャッシュエントリの先頭データを指すように調整し、コマンド保持部 412は、アドレス範囲を調整された後の領域コマンドを最大 4つまで保持し、コマンド選択部 413は、保持されている領域コマンドの一つ (例えば、最も古くから保持されている一つ）を選択して、選択された領域コマンドに応じた要求を生成し、操作要求部 44へ出力する。

[0107] <アドレス調整部 >

ここで、アドレス調整部 411のアドレス調整機能の内容を詳しく説明する。

[0108] アドレス調整部 411は、まずスタートアドレスレジスタ 402に保持されたスタートアドレスとサイズレジスタ 403に保持されたサイズとを加算する。加算結果は、アドレス範囲の終了位置を指すエンドアドレスである。サイズは、前述したように、予め定められた単位で表されて!/ヽればよぐその単位が例えばバイトであればバイトアドレスとして加算し、ラインであればラインアドレスとして加算すればょ、。

[0109] 次に、アドレス調整部 411は、スタートアドレス及びエンドアドレスを調整する。

[0110] 図 13は、その調整の内容を説明する概念図である。同図において、スタートァドレスはライン Nの先頭以外の任意の位置を指す。スタートアドレスは、次のライン (N+ 1 )の先頭を指すようァラインスタートアドレス aに調整される力又はスタートアドレスのデータを含むライン Nの先頭を指すようァラインスタートアドレス bに調整される。ァラインスタートアドレスが指すラインをスタートラインと呼ぶ。

[0111] また、エンドアドレスはライン Mの先頭以外の任意の位置を指す。エンドアドレスは、直前のライン (M— 1)の先頭を指すようァラインエンドアドレス aに調整される力、又はエンドアドレスのデータを含むライン Mの先頭を指すようァラインエンドアドレス bに調整される。ァラインエンドアドレスが指すラインをエンドラインと呼ぶ。

[0112] このように、スタートアドレス及びエンドアドレスは、ライン単位で内側ァラインされるか又は外側ァラインされる。ライン単位の外側ァラインの後、さらに、サブライン単位の外佃 Jァラインと内佃 Jァラインが可會である。

[0113] この調整によりプロセッサ 1はラインサイズ及びライン境界とは無関係に、任意のスタートアドレスと任意の大きさとを指定することができる。

[0114] くコマンド保持部 >

コマンド保持部 412は、アドレス調整部 411からァラインスタートアドレスとァラインェンドアドレスとを取得するとともに、コマンドレジスタ 404から動作プリミティブとインクリメント値とを取得して保持する。

[0115] 図 14は、コマンド保持部 412の構成を示すブロック図である。コマンド保持部 412 は、 4つのレジスタ 4121〜4124から構成され、好ましくは各レジスタの内容を読み出し可能な FIFO (First In First Out)方式のキューであるとしてもよい。各レジスタは、アドレス調整部 411から取得されたァラインスタートアドレス及びァラインエンドアドレス、及びコマンドレジスタ 404から取得されたインクリメント値及び動作プリミティブを保持する。ァラインスタートアドレスは、操作要求部 44からの制御に応じて、要求ごとにインクリメント値を加算することによって次々に更新され、カレントアドレスとして用いられる。

[0116] <コマンド選択部 >

コマンド選択部 413は、コマンド保持部 412に保持されているコマンドの一つ（例えば最も古い一つ、つまり FIFOキューの先頭）を選択し、そのカレントアドレスと動作プリミティブとを示す一つの要求を生成し、操作要求部 44へ出力する。

[0117] <領域コマンド制御処理 >

図 15は、領域コマンド制御部 41における領域コマンド制御処理の一例を示すフロ一チャートである。

[0118] コマンドエントリ部 40に領域コマンドがエントリされると（S301 : YES)、アドレス調整部 411はそのコマンドのアドレスを調整して（S302)、コマンド保持部 412ヘアドレス調整後のコマンドを登録する（S303)。このコマンドは、まだコマンドを保持していないレジスタに登録される力、全てのレジスタがコマンドを保持している場合には、最も古いコマンドを上書きすることによって登録される。なお、カレントアドレスがァラインエンドアドレスを上回った (これは、全ての対象アドレスに対する操作を要求し終えたことを意味する）コマンドに上書きする力、又はそのようなコマンドを予め消去しておいてもよく、また、全てのレジスタがコマンドを保持している場合には、新たなコマンドを登録せずにプロセッサ 1に例外を発生させることも考えられる。

[0119] コマンドが登録されていれば（S304 : YES)、コマンド選択部 413は、最も古いコマンドを選択して、そのカレントアドレスと動作プリミティブとを示す要求を操作要求部 4 4へ出力する（S305)。

[0120] なお、コマンド選択部 413は、最も古いコマンド以外のコマンドを選択してもよい。具体的には、例えば、各コマンドを発行したタスクと、現在プロセッサ 1で実行されているカレントタスクとが知られる構成を設けた上で、カレントタスクから与えられたコマンドを、最も古、コマンドよりも優先して選択することが考えられる。

[0121] この構成は、例えばプロセッサ 1がマルチタスク処理を行う場合に適しており、タスクの切り替えに追従してカレントタスクから与えられたコマンドを優先的に処理できる。し力も、コマンド保持部 412は、コマンドごとにカレントアドレスを保持しているから、ひとたび他のコマンドが選択された後で、元のコマンドが選択された場合でも、元のコマンドにつ、てまだ要求して、な、アドレスに対する操作を要求することができる。

[0122] <命令連動コマンド制御部 >

命令連動コマンド制御部 42において、アドレス調整部 421は、コマンドエントリ部 40 から命令連動コマンドに関するアドレス範囲を取得し、その両端をそれぞれキヤッシュエントリの先頭データを指すように調整し、コマンド保持部 422は、アドレス範囲を調整された後の命令連動コマンドを最大 4つまで保持する。実行判断部 423は、保持されている各コマンドについて定められる予測アドレスに対して、前記プロセッサによって特定の命令が実行された力否かを判断し、コマンド選択部 424は、肯定判断されたコマンドの一つ（例えば、最も古くから保持されている一つ）を選択し、実効アドレス生成部 425によって生成される実効アドレスに対する要求を操作要求部 44へ出力する。 [0123] ここで、アドレス調整部 421及びコマンド保持部 422は、それぞれアドレス調整部 4 11及びコマンド保持部 412と同一であるので、説明を省略する。

[0124] <実行判断部 >

実行判断部 423は、コマンド保持部 422に保持されている各コマンドのカレントアドレスを予測アドレスとして用いて、プロセッサ 1によってその予測アドレスをオペランドとする特定命令 (具体的には、ポストインクリメント付きロード命令、及びポストインクリメント付きストア命令）が実行されたか否かを判断する。このような判断を行うために、例えば、プロセッサ 1は、ポストインクリメント付きロード命令、及びポストインクリメント付きストア命令を実行中であることを示す信号 Cを実行判断部 423に供給し、実行判断部 423は、信号 Cが供給されている期間に、アドレスバスに現れるアドレスをコマンド保持部 422に保持されてヽる各カレントアドレスと比較してもよ!/ヽ。

[0125] <コマンド選択部、及び実効アドレス生成部 >

コマンド選択部 424は、実行判断部 423によって肯定判断されたコマンドの一つ（例えば最も古い一つ）を選択する。実効アドレス生成部 425は、選択されたコマンドがフィル又はタツチを示す場合、そのコマンドのカレントアドレス（前述した予測アドレス）に、 1ライン分のオフセット値を加算することによって、コマンドの操作対象となる実効アドレスを生成する。また、選択されたコマンドがライトバック、無効化、ライトバック兼無効化、又は最古化を示す場合、そのコマンドのカレントアドレスから、 1ライン分のオフセット値を減算することによって、コマンドの操作対象となる実効アドレスを生成する。そして、コマンド選択部 424は、その実効アドレスと動作プリミティブの指定とを示す一つの要求を生成し、操作要求部 44へ出力すると共に、選択されたコマンドに対応するカレントアドレスを、インクリメント値分増加させることによって更新する。

[0126] なお、ここではリプレース単位がラインであるとして 1ライン分のオフセット値を用いることとした力リプレース単位がサブラインである場合には、より小さな (例えば 2サブライン分の）オフセット値を用いてもょ、。

[0127] <命令連動コマンド制御処理 >

図 16は、命令連動コマンド制御部 42における命令連動コマンド制御処理の一例を示すフローチャートである。 [0128] コマンドエントリ部 40に命令連動コマンドがエントリされると（S401 : YES)、アドレス調整部 421はそのコマンドのアドレスを調整して（S402)、コマンド保持部 422へアドレス調整後のコマンドを登録する（S303)。このコマンドは、領域コマンドの場合と同様、まだコマンドを保持していないレジスタに登録される力、全てのレジスタがコマンドを保持している場合には、最も古いコマンドを上書きすることによって登録される。なお、カレントアドレスがァラインエンドアドレスを上回った（つまり、アドレス範囲内の全ての対象アドレスに対する要求を発行し終えた)コマンドに上書きする力、又はそのようなコマンドを予め消去しておいてもよぐまた、全てのレジスタがコマンドを保持している場合には、新たなコマンドを登録せずにプロセッサ 1に例外を発生させることも考えられる。

[0129] コマンドが登録されていれば（S404 : YES)、実行判断部 423は、前記特定命令のオペランドアドレスを各コマンドのカレントアドレスと比較する（S405)。アドレスが一致したコマンドがあれば（S406 : YES)、コマンド選択部 424は、その中で最も古い一つを選択し (S407)、実効アドレス生成部 425は、選択されたコマンドについて実効アドレスを生成して、コマンド選択部 424は、その実効アドレスと動作プリミティブとを示す要求を操作要求部 44へ出力し、選択されたコマンドに対応するカレントアドレスを、インクリメント値分増カロさせることによって更新する（S408)。

[0130] <オートクリーナ制御部 >

オートクリーナ制御部 43において、クリーニングアドレス出力部 431は、キャッシュメモリ 3における各キャッシュエントリを指定するアドレスを逐次出力する。クリーニングアドレス出力部 431は、アドレスを保持して出力する単なるレジスタであってもよい。

[0131] このクリーニングアドレスには、例えば 4ウェイ 'セット'ァソシエイティブ方式のキヤッシュメモリ（図 2を参照）においては、各セットを指定するアドレスを用いればよい。そのようなアドレス ίま、図 2の f列につ!ヽて具体的に言えば、、 ΟχΟΟΟΟΟΟΟΟ力ら 0x0000 0780までの 0x0080 (セットの単位アドレス）おきの 16個のアドレスによって代表される。これらのアドレスにはセットインデックス SIの全ての値が含まれるので、全てのセットの指定が可能である。

[0132] オートクリーナ制御部 43は、 TACコントロールレジスタ 405からオートクリーナが有効であることを示すフラグ値が取得される間、クリーニングアドレス出力部 431から出力されるアドレスに対するオートクリーナ操作の要求を操作要求部 44へ出力する。

[0133] <オートクリーナ制御処理 >

図 17は、オートクリーナ制御部 43におけるオートクリーナ制御処理の一例を示すフローチャートである。

[0134] TACコントロールレジスタ 405からオートクリーナが有効であることを示すフラグ値が得られる場合 (S501 : YES)、オートクリーナ制御部 43は、クリーニングアドレス出力部 431から出力されるアドレスに対するオートクリーナ操作を操作要求部 44へ出力する（S502)。

[0135] <操作要求処理 >

ここまでの説明から、操作要求部 44には、単独コマンドに応じた要求、命令連動コマンドに応じた要求、領域コマンドに応じた要求、及びオートクリーナ操作の要求の最大 4つの要求が与えられる可能性がある。操作要求部 44は、これらの要求が同時に与えられた場合、予め設定された優先順位に基づいて一つの要求を選択し、選択した要求をキャッシュメモリ 3へ転送する。この予め設定された優先順位は、前述したコマンドの順序としてもよ、。

[0136] また、操作要求部 44は、命令連動コマンドに応じた要求、領域コマンドに応じた要求、及びオートクリーナ操作の要求を転送した場合には、その要求の次の操作対象が示されるように、コマンドのカレントアドレス、及びクリーニングアドレスを制御する。

[0137] 図 18は、操作要求部 44における操作要求処理の一例を示すフローチャートである

[0138] 単独コマンドに応じた要求があれば（S601： YES)、その要求をキャッシュメモリ 3に転送する（S602)。単独コマンドに応じた要求を転送した後、操作要求部 44は、動作プリミティブレジスタの内容を消去してもよ、。

[0139] 命令連動コマンドに応じた要求があれば（S603 : YES)、その要求をキャッシュメモリ 3へ転送する（S604)。転送した要求に対応するコマンドのカレントアドレス (コマンド選択部 424にお、てそのコマンドが選択された際にインクリメントされる）がァラインエンドアドレスを上回っている場合には、そのコマンドを消去してもよい。 [0140] 領域コマンドに応じた要求があれば（S606 : YES)、その要求をキャッシュメモリ 3 へ転送し (S607)、その後、領域コマンド制御部 41を介して、その領域コマンドの力レントアドレスを、インクリメント値分増加させることによって更新する（S608)。この更新によって、カレントアドレスがァラインエンドアドレスを上回った場合には、そのコマンドを消去してもよい。

[0141] オートクリーナコマンドに応じた要求があれば（S609 : YES)、その要求をキヤッシュメモリ 3へ転送し (S610)、その後、オートクリーナ制御部 43を制御して、タリーニングアドレス出力部 431から出力されるアドレスを、セットの単位アドレス分増加させる。

[0142] <まとめ >

以上説明したように、 TAC4は、プロセッサ 1が予め定められた命令を実行することによってキャッシュデータの転送及び属性操作に関するコマンドを与えられ、そのコマンドに応じて 6種類の動作プリミティブ及びオートクリーナ操作をキャッシュメモリ 3 に要求し、キャッシュメモリ 3は、プロセッサ 1からのメモリアクセスに応じて従来の一般的なキャッシングを行う合間に、 TAC4からの要求に応じた操作を実行する。

[0143] この 6種類の動作プリミティブ及びオートクリーナ操作は、キャッシュのヒット率の向上、不必要なバストランザクションの削減、及びバストランザクションの平準化（時間的分散）に効果があり、かつ前記予め定められた命令 (例えば、図 10、図 11、図 12を参照）をプロセッサ 1に実行させることでソフトウェア力も要求できる。従って、キヤッシュ効率の向上を図る上でソフトウェアからの積極的な制御下でこれらの操作を行うために、この構成は好適である。

[0144] また、そのような特定の命令は、コンパイラによりプログラム中に挿入してもよい。具体的に、コンパイラは、データの生存期間を判断するなどしてデータが最初にァクセスされるプログラム位置を知ってその前にフィル操作を要求するコマンドを挿入し、また、同様にしてそれ以降データに書き込みがなされないプログラム位置を知ってその後に最古ィ匕を要求するコマンドを挿入すると、つたことが考えられる。

[0145] キャッシュメモリ 3が行う 6種類の動作プリミティブ及びオートクリーナ操作の内容を鑑みれば、プロセッサからのメモリアクセスに応じた一般的なキャッシング操作を行う従来のハードウェアに大規模な追加、修正を施すことなぐキャッシュメモリ 3を実現できる。

[0146] TAC4もまた、プロセッサ 1からのコマンド取得、コマンドのキューイングと選択、複数のアドレスに対する要求の逐次発生、及びキャッシュメモリ 3への要求の転送管理 t ヽつた簡明な機能のみを果たす。

[0147] ハードウェアをこの程度に簡素化しかつソフトウェアからの制御を受け入れるために好ましい構成とすることによって、ハードウェアとソフトウェアとの良好な機能分担が可能となり、その結果、自律的な制御によるキャッシュ効率の向上を目指してハードゥエァがいたずらに大規模ィ匕する事態を回避することができる。

産業上の利用可能性

[0148] 本発明は、ソフトウェアからの制御性を向上するキャッシュメモリに利用可能であり、例えば、オンチップキャッシュメモリ、オフチップキャッシュメモリ、データキャッシュメモリ、命令キャッシュメモリ等に適用できる。

Claims

請求の範囲

[1] プロセッサとメモリとの間に設けられるキャッシュメモリと、

前記キャッシュメモリを制御する転送及び属性制御手段とを備え、

前記転送及び属性制御手段は、

前記プロセッサが予め定められた命令を実行することによって、キャッシュデータの転送及び属性操作とその操作の対象を指定するアドレスとを示すコマンドを与えられるコマンドエントリ部と、

前記アドレスに対する前記コマンドによって示される操作を、前記キャッシュメモリに要求する操作要求部と

を備えることを特徴とするキャッシュメモリシステム。

[2] 前記キャッシュメモリは、キャッシュデータの管理単位であるキャッシュエントリに対応付けて、

そのキャッシュエントリに保持されるキャッシュデータに対応するメモリアドレスの上位部を示すタグを保持するタグ保持部と、

そのキャッシュエントリが有効か否かを示すバリッドフラグと、そのキャッシュエントリに書き込み操作があつたか否かを示すダーティフラグと、そのキャッシュエントリのァクセス順序を強制的に最古とすることを示すウィークフラグとを保持するフラグ保持部と

を有し、

前記転送及び属性制御手段からの要求に応じて、

指定されるアドレスにヒットするキャッシュエントリがない場合に、リプレース対象となるキャッシュエントリを選択し、メモリから前記選択されたキャッシュエントリへ前記指定されたアドレスに対応するデータをロードし、タグを設定してノリツドフラグをセットするフィル操作、

指定されるアドレスにヒットするキャッシュエントリがない場合に、リプレース対象となるキャッシュエントリを選択し、メモリから前記選択されたキャッシュエントリへデータをロードすることなくタグを設定してノリツドフラグをセットするタツチ操作、

指定されるアドレスにヒットするキャッシュエントリがありかつダーティフラグがセットされている場合に、そのキャッシュエントリのデータをメモリへセーブしてダーティフラグをリセットするライトバック操作、

指定されるアドレスにヒットするキャッシュエントリがある場合に、そのキャッシュェントリのデータをダーティフラグの状態に応じてメモリへセーブすることなくバリッドフラグをリセットする無効化操作、

指定されるアドレスにヒットするキャッシュエントリがある場合に、ダーティフラグがセットされていればそのキャッシュエントリのデータをメモリへセーブしてダーティフラグ及びバリッドフラグをリセットし、ダーティフラグがリセットされて、ればそのキャッシュェントリのノリツドフラグのリセットのみを行うライトバック兼無効化操作、及び

指定されるアドレスにヒットするキャッシュエントリがある場合に、そのキャッシュェントリのウィークフラグをセットする最古ィ匕操作

の中の一つを実行する

ことを特徴とする請求項 1に記載のキャッシュメモリシステム。

[3] 前記コマンドエントリ部は、さらに、前記プロセッサから前記コマンドに対応してアドレス範囲を与えられ、

前記操作要求部は、前記アドレス範囲に属する複数のアドレスに対する前記操作を、前記キャッシュメモリに逐次要求する

ことを特徴とする請求項 1または 2に記載のキャッシュメモリシステム。

[4] 前記転送及び属性制御手段は、さらに、

前記アドレス範囲の先頭及び末尾を、前記キャッシュメモリにおけるキャッシュデータの管理単位であるキャッシュエントリの先頭データを示すように調整するアドレス調整部を有し、

前記操作要求部は、前記調整後のアドレス範囲に含まれる複数のアドレスに対する前記操作を、前記キャッシュメモリに逐次要求する

ことを特徴とする請求項 3に記載のキャッシュメモリシステム。

[5] 前記転送及び属性制御手段は、さらに、

複数のコマンドとそれぞれのコマンドに対応するアドレス範囲とを保持するコマンド保持部と、前記保持された複数のコマンドの中から一つを選択するコマンド選択部とを有し、

前記操作要求部は、前記選択されたコマンドに対応するアドレス範囲に属する複数のアドレスに対する、そのコマンドによって示される操作を逐次要求する

ことを特徴とする請求項 3または 4に記載のキャッシュメモリシステム。

[6] 前記コマンド選択部は、前記選択されたコマンドについて全ての要求がなされる前に、他のコマンドを選択し、

前記操作要求部は、元のコマンドが再び選択された場合にそのコマンドについてまだ要求して!/、な、アドレスに対する操作を逐次要求する

ことを特徴とする請求項 5に記載のキャッシュメモリシステム。

[7] 前記転送及び属性制御手段は、さらに、

次に予定される要求に関して定められる予測アドレスに対して、前記プロセッサによつて特定の命令が実行されたか否かを判断する実行判断部と、

肯定判断がなされると、前記予測アドレスに所定のオフセット値を加算又は減算することによって実効アドレスを生成する実効アドレス生成部と

を有し、

前記操作要求部は、前記生成された実効アドレスに対する前記操作を要求することを特徴とする請求項 3に記載のキャッシュメモリシステム。

[8] 前記転送及び属性制御手段は、さらに、

複数のコマンドとそれぞれのコマンドに対応するアドレス範囲とを保持するコマンド保持部を有し、

前記実行判断部は、前記保持された各コマンドについて、そのコマンドに対応する予測アドレスに対して、前記プロセッサによって特定の命令が実行された力否かを判断し、

前記転送及び属性制御手段は、さらに、

肯定判断がなされたコマンドの中力一つを選択するコマンド選択部を有し、前記実効アドレス生成部は、前記選択されたコマンドに対応する予測アドレスに所定値を加算又は減算することによって実効アドレスを生成し、前記操作要求部は、前記生成された実効アドレスに対する前記選択されたコマンドによって示される操作を要求する

ことを特徴とする請求項 7に記載のキャッシュメモリシステム。

[9] 前記転送及び属性制御手段は、さらに、

前記キャッシュメモリにおけるキャッシュデータの管理単位である各キャッシュェントリを指定するアドレスを逐次出力するアドレス出力部を有し、

前記操作要求部は、前記出力されたアドレスによって指定されるキャッシュエントリを含む一つ以上のキャッシュエントリに対する何れかの操作要求を保持する要求保持手段を備え、操作要求を保持している間は自発的に操作要求をし続ける

[10] 前記操作要求部は、前記キャッシュメモリに要求する操作力 Sライトバック操作であり前記キャッシュメモリは、前記要求に応じてライトバック操作を実行する

ことを特徴とする請求項 1または 9に記載のキャッシュメモリシステム。

[11] 前記コマンドエントリ部は、単一のアドレスに対する操作を示す単独コマンドと、アドレス範囲に含まれる複数のアドレスに対する操作を前記プロセッサが実行する特定の命令と同期して行うことを示す命令連動コマンドと、アドレス範囲に含まれる複数のアドレスに対する操作を前記プロセッサが実行する特定の命令とは非同期に行うことを示す領域コマンドと、キャッシュデータを逐次操作することを示す逐次操作コマンドのうちの少なくとも一つを前記プロセッサから与えられ、

前記操作要求部は、各コマンドに応じた操作要求を予め設定された優先順位に基づ、て選択を行、、前記キャッシュメモリに要求する

[12] 前記操作要求部は、各コマンドに応じた操作を、前記コマンドの順に優先して、前記キャッシュメモリに要求する

ことを特徴とする請求項 11に記載のキャッシュメモリシステム。

[13] プロセッサとメモリとの間に設けられるキャッシュメモリを制御する制御方法であって前記プロセッサから、キャッシュデータの転送及び属性操作とその操作の対象を指定するアドレスとを示すコマンドを取得する取得ステップと、

前記アドレスに対する前記コマンドによって示される操作を、前記キャッシュメモリに要求する操作要求ステップと

を含むことを特徴とする制御方法。