JP3348314B2 - 検索装置 - Google Patents
検索装置Info
- Publication number
- JP3348314B2 JP3348314B2 JP22740893A JP22740893A JP3348314B2 JP 3348314 B2 JP3348314 B2 JP 3348314B2 JP 22740893 A JP22740893 A JP 22740893A JP 22740893 A JP22740893 A JP 22740893A JP 3348314 B2 JP3348314 B2 JP 3348314B2
- Authority
- JP
- Japan
- Prior art keywords
- evaluation value
- elements
- search
- storage unit
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【0001】
【産業上の利用分野】本発明は、図形や文字などの認識
のための入力パターンの特徴量とパターン辞書に記憶さ
れたテンプレートとの照合、データベースにおける類似
レコードの検索、知識処理の類推的推論における類似概
念・類似規則の検索など、情報照合および情報検索技術
に関する。
のための入力パターンの特徴量とパターン辞書に記憶さ
れたテンプレートとの照合、データベースにおける類似
レコードの検索、知識処理の類推的推論における類似概
念・類似規則の検索など、情報照合および情報検索技術
に関する。
【0002】
【従来の技術】パターン認識やデータベース検索、知識
ベース検索などの情報照合や情報検索において、あらか
じめ記憶されたパターンのテンプレートやデータベース
のレコード、知識記述などから、入力パターンや検索要
求パターンに完全には一致しなくても、ある選好基準に
従ってもっとも好ましいものを見つけ出したいという要
求が多く存在する。このような情報照合や情報検索を実
現する従来の方法として、好ましさの度合をスカラ量と
して表せる評価関数を定義し、この評価関数を最大とす
るものを照合結果や検索結果とする方法が最も一般的で
ある。この方法によると、評価関数は必然的に、入力パ
ターンや検索要求パターンと、記憶されたテンプレート
やレコードと、ユーザが選好基準を指定するためのパラ
メータとの3つの変量を一つのスカラ量へと写像する関
数となる。ここで、これらの三つの変量はスカラ量には
限定されず、ベクタ量または構造をもった量でもあり得
る。記憶された複数の要素の中から評価関数を最大にす
る要素を見つけ出すことを最適要素検索と呼ぶことにす
る。
ベース検索などの情報照合や情報検索において、あらか
じめ記憶されたパターンのテンプレートやデータベース
のレコード、知識記述などから、入力パターンや検索要
求パターンに完全には一致しなくても、ある選好基準に
従ってもっとも好ましいものを見つけ出したいという要
求が多く存在する。このような情報照合や情報検索を実
現する従来の方法として、好ましさの度合をスカラ量と
して表せる評価関数を定義し、この評価関数を最大とす
るものを照合結果や検索結果とする方法が最も一般的で
ある。この方法によると、評価関数は必然的に、入力パ
ターンや検索要求パターンと、記憶されたテンプレート
やレコードと、ユーザが選好基準を指定するためのパラ
メータとの3つの変量を一つのスカラ量へと写像する関
数となる。ここで、これらの三つの変量はスカラ量には
限定されず、ベクタ量または構造をもった量でもあり得
る。記憶された複数の要素の中から評価関数を最大にす
る要素を見つけ出すことを最適要素検索と呼ぶことにす
る。
【0003】以下、従来技術によるデータベースの類似
レコードの検索を説明する。図3は、要素の記憶形態の
一例のデータベースを示し、N個の要素e〔1〕、e
〔2〕、...、e〔N〕から成る。レコード3011
は、見出し3021 とM個(Mは少なくとも1以上)の
属性に対する実数値で表される重みの並び30
311、...、3031Mから成る。ここで、符号の第1
番目の添字は、要素の番号1、2、...、Nを示し、
重みの並びの符号の第2番目の添字は、重みの番号を示
す。以下では簡単のため、例えばレコード3011 をレ
コード301として、符号の添字を省略して説明を行
う。このデータベースのレコード301の重み303の
並びと同様の重み並びを持つ検索要求パターンに対し、
類似度の最も大きいレコードをデータベースより検索す
ることを考える。ここで類似度は、検索要求パターンの
重み並びと、データベース中のレコード301の重みの
並び303と、ユーザの選好基準を表すパラメータとか
ら計算される実数のスカラ量である。ここでパラメータ
は、データベースの各属性の重要さを属性毎に実数値で
表した重要度の並びである。類似度の一例としては、検
索要求パターンの重み並びを、 Wi =(Wi1,Wi2,...,WiM) (ただしMは重み並びの個数を表す整数)とし、データ
ベースのレコードの重み並びを、 Wj =(Wj1,Wj2,...,WjM) とし、パラメータである重要度の並びを、 X =(X1 ,X2 ,...,XM ) とした場合に、
レコードの検索を説明する。図3は、要素の記憶形態の
一例のデータベースを示し、N個の要素e〔1〕、e
〔2〕、...、e〔N〕から成る。レコード3011
は、見出し3021 とM個(Mは少なくとも1以上)の
属性に対する実数値で表される重みの並び30
311、...、3031Mから成る。ここで、符号の第1
番目の添字は、要素の番号1、2、...、Nを示し、
重みの並びの符号の第2番目の添字は、重みの番号を示
す。以下では簡単のため、例えばレコード3011 をレ
コード301として、符号の添字を省略して説明を行
う。このデータベースのレコード301の重み303の
並びと同様の重み並びを持つ検索要求パターンに対し、
類似度の最も大きいレコードをデータベースより検索す
ることを考える。ここで類似度は、検索要求パターンの
重み並びと、データベース中のレコード301の重みの
並び303と、ユーザの選好基準を表すパラメータとか
ら計算される実数のスカラ量である。ここでパラメータ
は、データベースの各属性の重要さを属性毎に実数値で
表した重要度の並びである。類似度の一例としては、検
索要求パターンの重み並びを、 Wi =(Wi1,Wi2,...,WiM) (ただしMは重み並びの個数を表す整数)とし、データ
ベースのレコードの重み並びを、 Wj =(Wj1,Wj2,...,WjM) とし、パラメータである重要度の並びを、 X =(X1 ,X2 ,...,XM ) とした場合に、
【0004】
【数1】
【0005】で定義される関数R(Wi ,Wj ,X)で
計算される値が考えられる。この関数は一例に過ぎず、
検索要求パターンの重み並びと、データベースのレコー
ド301の重み303並びと、パラメータである重要度
並びの3つを特定できる変量から実数のスカラ量を計算
できる関数であれば、原理的にはどのようなものでも良
い。また、直接に重みの並びではなく見出し302を指
定し、その見出し302に対応するデータベースのレコ
ード301の重み303並びを検索要求パターンやパラ
メータの重要度並びとして用いることも考えられる。
計算される値が考えられる。この関数は一例に過ぎず、
検索要求パターンの重み並びと、データベースのレコー
ド301の重み303並びと、パラメータである重要度
並びの3つを特定できる変量から実数のスカラ量を計算
できる関数であれば、原理的にはどのようなものでも良
い。また、直接に重みの並びではなく見出し302を指
定し、その見出し302に対応するデータベースのレコ
ード301の重み303並びを検索要求パターンやパラ
メータの重要度並びとして用いることも考えられる。
【0006】図7は、このような検索を行う従来の検索
装置のシステム構成を示し、要素記憶部201と、評価
値計算部202と、検索制御部205とから成る。
装置のシステム構成を示し、要素記憶部201と、評価
値計算部202と、検索制御部205とから成る。
【0007】要素記憶部201はデータベースのレコー
ド301を格納する。評価値計算部202はユーザが与
えた検索要求パターンとパラメータとレコードとから上
述の関数Rにより類似度を計算する。
ド301を格納する。評価値計算部202はユーザが与
えた検索要求パターンとパラメータとレコードとから上
述の関数Rにより類似度を計算する。
【0008】検索制御部205は、検索途中における類
似度の最大値を保持する最大評価値格納変数206と、
該類似度の最大値を与えるレコードを保持する最適要素
格納変数207とを有し、検索動作を司る。
似度の最大値を保持する最大評価値格納変数206と、
該類似度の最大値を与えるレコードを保持する最適要素
格納変数207とを有し、検索動作を司る。
【0009】図8は、従来技術による検索制御部205
の動作を説明するフローチャートである。以下、同図に
より従来技術の検索動作を説明する。
の動作を説明するフローチャートである。以下、同図に
より従来技術の検索動作を説明する。
【0010】ステップ801)ユーザからの検索要求パ
ターンとパラメータを入力し、データベースから第1番
目のレコード301を取り出す。
ターンとパラメータを入力し、データベースから第1番
目のレコード301を取り出す。
【0011】ステップ802)評価関数Rを用いて第1
番目のレコード301の類似度を算出する。
番目のレコード301の類似度を算出する。
【0012】ステップ803)算出された類似度、即ち
評価値を最大評価値格納変数206に格納し、第1番目
のレコード301を最適要素格納変数207に格納す
る。
評価値を最大評価値格納変数206に格納し、第1番目
のレコード301を最適要素格納変数207に格納す
る。
【0013】ステップ804)この時点までにデータベ
ースの中から取り出されたことのない別レコードを取り
出す。
ースの中から取り出されたことのない別レコードを取り
出す。
【0014】ステップ805)評価関数Rを用いて別レ
コードの類似度を算出する。
コードの類似度を算出する。
【0015】ステップ806)別レコードの類似度が最
大評価値格納変数206に格納された類似度の最大値よ
り大きくなければステップ808に進む。
大評価値格納変数206に格納された類似度の最大値よ
り大きくなければステップ808に進む。
【0016】ステップ807)別レコードの類似度を最
大評価値格納変数206に格納し、別レコードを最適要
素格納変数207に格納する。
大評価値格納変数206に格納し、別レコードを最適要
素格納変数207に格納する。
【0017】ステップ808)データベース中に未だ取
り出していないレコードが残っている場合にはステップ
804に進む。
り出していないレコードが残っている場合にはステップ
804に進む。
【0018】ステップ809)最適要素格納変数207
に格納されたレコードを検索結果として出力する。
に格納されたレコードを検索結果として出力する。
【0019】上記説明の通り、従来技術による検索装置
の検索制御部205は、すべてのレコードを取り出し、
このレコードの評価関数を計算するような制御を行って
おり、このような検索制御部を持つ検索装置を全走査型
検索装置と呼ぶ。
の検索制御部205は、すべてのレコードを取り出し、
このレコードの評価関数を計算するような制御を行って
おり、このような検索制御部を持つ検索装置を全走査型
検索装置と呼ぶ。
【0020】また、従来、検索要求パターンの要素に完
全に一致する要素を検索する場合には、インデックス付
けやハッシュなどの方法を利用した高速な検索装置が実
現されている。類似度などの評価関数の計算値を最大と
する場合で、かつ、評価関数が検索する際のパラメータ
によって変化する最適要素検索の場合には、上記従来技
術による高速検索装置は利用できない。従って、上述の
データベースの類似レコード検索装置の例に限らず、最
適要素検索を行う従来の検索装置は、すべて全走査型検
索装置である。
全に一致する要素を検索する場合には、インデックス付
けやハッシュなどの方法を利用した高速な検索装置が実
現されている。類似度などの評価関数の計算値を最大と
する場合で、かつ、評価関数が検索する際のパラメータ
によって変化する最適要素検索の場合には、上記従来技
術による高速検索装置は利用できない。従って、上述の
データベースの類似レコード検索装置の例に限らず、最
適要素検索を行う従来の検索装置は、すべて全走査型検
索装置である。
【0021】
【発明が解決しようとする課題】従来技術である全走査
型検索装置は、要素記憶部に格納された要素すべてに対
し評価関数を計算するため、要素記憶部に格納された要
素数に比例して検索時間が増大する。このため、要素記
憶部に格納された要素が多い場合に検索時間が長くかか
るという問題がある。
型検索装置は、要素記憶部に格納された要素すべてに対
し評価関数を計算するため、要素記憶部に格納された要
素数に比例して検索時間が増大する。このため、要素記
憶部に格納された要素が多い場合に検索時間が長くかか
るという問題がある。
【0022】本発明の目的は、上記のように要素数が多
いときに検索時間が長くかかるという問題を解決する高
速な検索装置を提供することにある。
いときに検索時間が長くかかるという問題を解決する高
速な検索装置を提供することにある。
【0023】
【課題を解決するための手段】図1は、本発明の原理構
成図である。
成図である。
【0024】本発明の検索装置は、被検索情報である複
数の要素を格納する要素記憶部101と、二つの要素と
パラメータを入力されて所定の評価関数に従って評価値
を計算する評価値計算部102と、外部より入力された
検索要求の要素と検索要求のパラメータ及び要素記憶部
101よりの要素を評価値計算部102に入力して要素
記憶部の複数の要素のうち検索要求の要素と同じ要素以
外のすべての要素のなかから評価値を最大とする要素を
検索する検索動作を制御する検索制御部105とから構
成される検索装置において、要素記憶部101に格納さ
れた複数の要素のうち二つの要素の組合せに対し、該二
つの要素と所定のパラメータとを用いて計算された評価
値を事前評価値とし、該二つの要素のうち一方の要素毎
に該二つの要素のうちの他方の要素と該事前評価値の組
を該事前評価値の大きい順に所定の個数だけ格納する事
前評価値記憶部103と、事前評価値と、対応する他の
要素と、任意のパラメータとを入力されて、上記所定の
パラメータ値における事前評価値の増加に対して単調増
加である上界関数に従って上界値を計算する有界値計算
部104とから構成され、検索制御部105は、上記外
部よりの検索要求の要素及び検索要求のパラメータを入
力されて、検索要求の要素に対応して事前評価値記憶部
103に格納された要素と事前評価値の組を事前評価値
記憶部103より順次取り出し、検索要求の要素と、事
前評価値記憶部103から取り出された要素と、検索要
求のパラメータとを用いて評価値計算部102により算
出された最大の評価値を最大評価値とし、事前評価値と
検索要求の要素及び検索要求のパラメータとを上記有界
値計算部104に与えて計算された上界値が最大評価値
よりも小さい場合には、上界値に対応する事前評価値よ
りも小さい上記組の事前評価値記憶部からの順次取り出
しを打ち切る。
数の要素を格納する要素記憶部101と、二つの要素と
パラメータを入力されて所定の評価関数に従って評価値
を計算する評価値計算部102と、外部より入力された
検索要求の要素と検索要求のパラメータ及び要素記憶部
101よりの要素を評価値計算部102に入力して要素
記憶部の複数の要素のうち検索要求の要素と同じ要素以
外のすべての要素のなかから評価値を最大とする要素を
検索する検索動作を制御する検索制御部105とから構
成される検索装置において、要素記憶部101に格納さ
れた複数の要素のうち二つの要素の組合せに対し、該二
つの要素と所定のパラメータとを用いて計算された評価
値を事前評価値とし、該二つの要素のうち一方の要素毎
に該二つの要素のうちの他方の要素と該事前評価値の組
を該事前評価値の大きい順に所定の個数だけ格納する事
前評価値記憶部103と、事前評価値と、対応する他の
要素と、任意のパラメータとを入力されて、上記所定の
パラメータ値における事前評価値の増加に対して単調増
加である上界関数に従って上界値を計算する有界値計算
部104とから構成され、検索制御部105は、上記外
部よりの検索要求の要素及び検索要求のパラメータを入
力されて、検索要求の要素に対応して事前評価値記憶部
103に格納された要素と事前評価値の組を事前評価値
記憶部103より順次取り出し、検索要求の要素と、事
前評価値記憶部103から取り出された要素と、検索要
求のパラメータとを用いて評価値計算部102により算
出された最大の評価値を最大評価値とし、事前評価値と
検索要求の要素及び検索要求のパラメータとを上記有界
値計算部104に与えて計算された上界値が最大評価値
よりも小さい場合には、上界値に対応する事前評価値よ
りも小さい上記組の事前評価値記憶部からの順次取り出
しを打ち切る。
【0025】さらに、本発明の検索装置は、被検索情報
である複数の要素を格納する要素記憶部101と、二つ
の要素とパラメータを入力されて所定の評価関数に従っ
て評価値を計算する評価値計算部102と、外部より入
力された検索要求の要素と検索要求のパラメータ及び要
素記憶部101よりの要素を評価値計算部102に入力
して要素記憶部の複数の要素のうち検索要求の要素と同
じ要素以外のすべての要素のなかから評価値を最小とす
る要素を検索する検索動作を制御する検索制御部105
とから構成される検索装置において、要素記憶部101
に格納された複数の要素のうち二つの要素の組合せに対
し、該二つの要素と所定のパラメータとを用いて計算さ
れた評価値を事前評価値とし、該二つの要素のうち一方
の要素毎に該二つの要素のうちの他方の要素と該事前評
価値の組を該事前評価値の大きい順に所定の個数だけ格
納する事前評価値記憶部103と、事前評価値と、対応
する他の要素と、任意のパラメータとを入力されて、上
記所定のパラメータ値における事前評価値の減少に対し
て単調減少である下界関数に従って下界値を計算する有
界値計算部104とから構成され、検索制御部105
は、上記外部よりの検索要求の要素及び検索要求のパラ
メータを入力されて、検索要求の要素に対応して事前評
価値記憶部103に格納された要素と事前評価値の組を
事前評価値記憶部103より順次取り出し、検索要求の
要素と、事前評価値記憶部103から取り出された要素
と、検索要求のパラメータとを用いて評価値計算部10
2により算出された最小の評価値を最小評価値とし、事
前評価値と検索要求の要素及び検索要求のパラメータと
を上記有界値計算部104に与えて計算された下界値が
最小評価値よりも小さい場合には、下界値に対応する事
前評価値よりも小さい上記組の事前評価値記憶部からの
順次取り出しを打ち切る。
である複数の要素を格納する要素記憶部101と、二つ
の要素とパラメータを入力されて所定の評価関数に従っ
て評価値を計算する評価値計算部102と、外部より入
力された検索要求の要素と検索要求のパラメータ及び要
素記憶部101よりの要素を評価値計算部102に入力
して要素記憶部の複数の要素のうち検索要求の要素と同
じ要素以外のすべての要素のなかから評価値を最小とす
る要素を検索する検索動作を制御する検索制御部105
とから構成される検索装置において、要素記憶部101
に格納された複数の要素のうち二つの要素の組合せに対
し、該二つの要素と所定のパラメータとを用いて計算さ
れた評価値を事前評価値とし、該二つの要素のうち一方
の要素毎に該二つの要素のうちの他方の要素と該事前評
価値の組を該事前評価値の大きい順に所定の個数だけ格
納する事前評価値記憶部103と、事前評価値と、対応
する他の要素と、任意のパラメータとを入力されて、上
記所定のパラメータ値における事前評価値の減少に対し
て単調減少である下界関数に従って下界値を計算する有
界値計算部104とから構成され、検索制御部105
は、上記外部よりの検索要求の要素及び検索要求のパラ
メータを入力されて、検索要求の要素に対応して事前評
価値記憶部103に格納された要素と事前評価値の組を
事前評価値記憶部103より順次取り出し、検索要求の
要素と、事前評価値記憶部103から取り出された要素
と、検索要求のパラメータとを用いて評価値計算部10
2により算出された最小の評価値を最小評価値とし、事
前評価値と検索要求の要素及び検索要求のパラメータと
を上記有界値計算部104に与えて計算された下界値が
最小評価値よりも小さい場合には、下界値に対応する事
前評価値よりも小さい上記組の事前評価値記憶部からの
順次取り出しを打ち切る。
【0026】
【作用】検索要求の要素と、要素記憶部101内の検索
要求の要素以外の要素と、検索要求のパラメータとを入
力されて評価値計算部102にて計算された評価値は、
事前評価値と、検索要求の要素と、検索要求のパラメー
タとを入力されて有界値計算部104にて計算された上
界値を越えない。従って、要素記憶部101内の検索要
求の要素以外のある要素に対して事前評価値記憶部10
3に記憶された事前評価値と、検索要求の要素と、検索
要求のパラメータとにより計算された上界値が、探索制
御部105による探索動作中に探索制御部105に保持
される最大評価値よりも小さい場合には、検索要求の要
素と、上記検索要求の要素以外の要素と、検索要求のパ
ラメータとにより計算された評価値は、探索動作中に保
持される最大評価値を越えることがない。また、上界値
は事前評価値の増加に対して単調増加であるため、上記
検索要求の要素以外の要素に対する事前評価値よりも小
さい事前評価値に対する上界値は、上記検索要求の要素
以外の要素に対する上界値より必ず小さい。従って、上
記検索要求の要素以外の要素に対する事前評価値よりも
小さい事前評価値を与える他の要素に対する評価値は、
上記最大評価値を越えないことが保証される。
要求の要素以外の要素と、検索要求のパラメータとを入
力されて評価値計算部102にて計算された評価値は、
事前評価値と、検索要求の要素と、検索要求のパラメー
タとを入力されて有界値計算部104にて計算された上
界値を越えない。従って、要素記憶部101内の検索要
求の要素以外のある要素に対して事前評価値記憶部10
3に記憶された事前評価値と、検索要求の要素と、検索
要求のパラメータとにより計算された上界値が、探索制
御部105による探索動作中に探索制御部105に保持
される最大評価値よりも小さい場合には、検索要求の要
素と、上記検索要求の要素以外の要素と、検索要求のパ
ラメータとにより計算された評価値は、探索動作中に保
持される最大評価値を越えることがない。また、上界値
は事前評価値の増加に対して単調増加であるため、上記
検索要求の要素以外の要素に対する事前評価値よりも小
さい事前評価値に対する上界値は、上記検索要求の要素
以外の要素に対する上界値より必ず小さい。従って、上
記検索要求の要素以外の要素に対する事前評価値よりも
小さい事前評価値を与える他の要素に対する評価値は、
上記最大評価値を越えないことが保証される。
【0027】以上の説明からわかるように、本発明によ
る評価値を最大とする要素を検索する検索装置では、上
界値を計算し最大評価値と比較することにより、最適要
素に成りえない要素を判定し、この最適要素に成りえな
い要素に対する評価値の計算を打ち切ることによって、
高速に検索を行うことを可能としている。
る評価値を最大とする要素を検索する検索装置では、上
界値を計算し最大評価値と比較することにより、最適要
素に成りえない要素を判定し、この最適要素に成りえな
い要素に対する評価値の計算を打ち切ることによって、
高速に検索を行うことを可能としている。
【0028】さらに、本発明による評価値を最小とする
要素を検索する検索装置では、下界値を計算し最小評価
値と比較することにより、最適要素に成りえない要素を
判定し、この最適要素に成りえない要素に対する評価値
の計算を打ち切ることによって、高速に検索を行うこと
を可能としている。
要素を検索する検索装置では、下界値を計算し最小評価
値と比較することにより、最適要素に成りえない要素を
判定し、この最適要素に成りえない要素に対する評価値
の計算を打ち切ることによって、高速に検索を行うこと
を可能としている。
【0029】
【実施例】以下図面と共に、本発明の一実施例を詳細に
説明する。
説明する。
【0030】図2は本発明の一実施例の検索装置の構成
を示し、要素記憶部201と、評価値計算部202と、
事前評価値記憶部203と、上界計算部204と、検索
制御部205とから成る。
を示し、要素記憶部201と、評価値計算部202と、
事前評価値記憶部203と、上界計算部204と、検索
制御部205とから成る。
【0031】要素記憶部201は、被検索情報を表す要
素を格納し、任意の要素を検索制御部205からの要求
に従って取り出すことができる。図3は、本発明の一実
施例による要素記憶部201の記憶形態を説明する図で
あり、N個の要素e〔1〕、e〔2〕、...、e
〔N〕から成る。各要素は、レコード型のデータ構造に
より表され、例えば、要素e〔1〕に対応するレコード
3011 は、見出し302 1 とM個(Mは少なくとも1
以上)の属性に対する実数値で表される重みの並び30
311、...、3031Mから成る。同図において、符号
の第1番目の添字は、要素の番号1、2、...、Nを
示し、重みの並びの符号の第2番目の添字は、重みの番
号を示す。以下では簡単のため、例えばレコード301
1 をレコード301として、符号の添字を省略して説明
を行う。
素を格納し、任意の要素を検索制御部205からの要求
に従って取り出すことができる。図3は、本発明の一実
施例による要素記憶部201の記憶形態を説明する図で
あり、N個の要素e〔1〕、e〔2〕、...、e
〔N〕から成る。各要素は、レコード型のデータ構造に
より表され、例えば、要素e〔1〕に対応するレコード
3011 は、見出し302 1 とM個(Mは少なくとも1
以上)の属性に対する実数値で表される重みの並び30
311、...、3031Mから成る。同図において、符号
の第1番目の添字は、要素の番号1、2、...、Nを
示し、重みの並びの符号の第2番目の添字は、重みの番
号を示す。以下では簡単のため、例えばレコード301
1 をレコード301として、符号の添字を省略して説明
を行う。
【0032】評価値計算部202は、上記レコード型の
二つの要素e〔i〕、e〔j〕(i、jは1からNの任
意の整数)とパラメータpが検索制御部205から与え
られた場合に、所定の評価関数F(e〔i〕,e
〔j〕,p)に従って評価値を計算し検索制御部205
に出力する。本発明の一実施例による評価関数として、
例えば、一方の要素e〔i〕の重み並びを、Wi =(W
i1,Wi2,...,WiM)(ただしMは重み並びの個数
を表す整数)とし、他方の要素e〔j〕の重み並びを、
Wj =(Wj1,Wj2,...,WjM)とし、パラメータ
の重み並びを、X =(X1 ,X2 ,...,XM )と
した場合に、
二つの要素e〔i〕、e〔j〕(i、jは1からNの任
意の整数)とパラメータpが検索制御部205から与え
られた場合に、所定の評価関数F(e〔i〕,e
〔j〕,p)に従って評価値を計算し検索制御部205
に出力する。本発明の一実施例による評価関数として、
例えば、一方の要素e〔i〕の重み並びを、Wi =(W
i1,Wi2,...,WiM)(ただしMは重み並びの個数
を表す整数)とし、他方の要素e〔j〕の重み並びを、
Wj =(Wj1,Wj2,...,WjM)とし、パラメータ
の重み並びを、X =(X1 ,X2 ,...,XM )と
した場合に、
【0033】
【数2】
【0034】で定義される類似度関数R(Wi ,Wj ,
X)を利用する。この評価関数の値、即ち評価値は、0
から1の範囲の実数値である。また、パラメータ個々の
重みX k は、1か1より大きい定数値のいずれかの値を
取るとする。以下の説明では、1より大きい定数値をC
で表すことにする。但し、本発明において利用される評
価関数は、上記類似度関数Rに限定されることはなく、
ある特定のパラメータp 0 のもとでの評価値v0 (i,
j)と、一方の要素e〔i〕と、パラメータpとから上
界値を計算でき、かつ、特定のパラメータ値p0 におけ
る評価値v0 (i,j)の増加に対して単調増加である
ような上界関数S(v0 (i,j),e〔i〕,p)を
求めることが可能であるという性質を有する評価関数で
あればどのような関数でも構わない。
X)を利用する。この評価関数の値、即ち評価値は、0
から1の範囲の実数値である。また、パラメータ個々の
重みX k は、1か1より大きい定数値のいずれかの値を
取るとする。以下の説明では、1より大きい定数値をC
で表すことにする。但し、本発明において利用される評
価関数は、上記類似度関数Rに限定されることはなく、
ある特定のパラメータp 0 のもとでの評価値v0 (i,
j)と、一方の要素e〔i〕と、パラメータpとから上
界値を計算でき、かつ、特定のパラメータ値p0 におけ
る評価値v0 (i,j)の増加に対して単調増加である
ような上界関数S(v0 (i,j),e〔i〕,p)を
求めることが可能であるという性質を有する評価関数で
あればどのような関数でも構わない。
【0035】事前評価値記憶部203は、要素記憶部2
01に格納された個々の要素e〔1〕,e
〔2〕,...,e〔N〕に対して、個々の要素以外の
要素との間で、ある特定のパラメータp0 のもとで評価
関数に従って計算された評価値、即ち事前評価値に基づ
き、事前評価値とこの事前評価値を与える個々の要素以
外の要素の組を事前評価値の大きい順に所定の個数格納
する。図4は、本発明の一実施例による事前評価値記憶
部203における格納形態を示し、要素e〔i〕に対し
て、他の要素e〔j〕との間で特定のパラメータp0 の
もとで計算された事前評価値をv0 (i,j)で表し、
個々の要素e〔1〕,e〔2〕,...,e〔N〕につ
いて、要素40111、...、4011L、...、40
121、...、401 2L、...、401N1、...、
401NLと事前評価値40211、...、40
21L、...、40221、...、4022L、...、
402N1、...、402NLの組が、事前評価値の大き
い順にリスト構造で連なっている。ここで、Nは要素の
個数を表し、Lは上記事前評価値の大きい順の所定の個
数を表す。例えば、同図において最左端に示すリスト構
造は、要素e〔1〕に対して事前評価値の大きい順に要
素と事前評価値の組が上方から下方に連なっている。同
様に左から2番目のリスト構造は、要素e〔2〕に対し
て事前評価値の大きい順に要素と事前評価値の組が連な
っている。尚、事前評価値記憶部203に格納される要
素は、要素記憶部201に格納される要素に対応するの
で、要素の値そのものを格納する代わりに、要素記憶部
201内における要素のアドレスを指し示すポインタを
格納することも可能である。事前評価値記憶部203の
上記説明の構造を利用することにより、特定の要素に対
して、その要素との間で計算された事前評価値の大きい
要素を順次取り出すことが可能である。尚、図4に記述
された要素の番号は説明の便宜上の一例にすぎず、実際
の事前評価値の大小によって変わる。さらに、ここで説
明した事前評価値記憶部203における格納形態は一例
であり、特定の要素に対してその要素との事前評価値が
大きい要素を順次取り出すことが可能であればどのよう
なものでも良い。例えば、リスト構造の代わりに表形式
の格納形態を利用することも可能である。
01に格納された個々の要素e〔1〕,e
〔2〕,...,e〔N〕に対して、個々の要素以外の
要素との間で、ある特定のパラメータp0 のもとで評価
関数に従って計算された評価値、即ち事前評価値に基づ
き、事前評価値とこの事前評価値を与える個々の要素以
外の要素の組を事前評価値の大きい順に所定の個数格納
する。図4は、本発明の一実施例による事前評価値記憶
部203における格納形態を示し、要素e〔i〕に対し
て、他の要素e〔j〕との間で特定のパラメータp0 の
もとで計算された事前評価値をv0 (i,j)で表し、
個々の要素e〔1〕,e〔2〕,...,e〔N〕につ
いて、要素40111、...、4011L、...、40
121、...、401 2L、...、401N1、...、
401NLと事前評価値40211、...、40
21L、...、40221、...、4022L、...、
402N1、...、402NLの組が、事前評価値の大き
い順にリスト構造で連なっている。ここで、Nは要素の
個数を表し、Lは上記事前評価値の大きい順の所定の個
数を表す。例えば、同図において最左端に示すリスト構
造は、要素e〔1〕に対して事前評価値の大きい順に要
素と事前評価値の組が上方から下方に連なっている。同
様に左から2番目のリスト構造は、要素e〔2〕に対し
て事前評価値の大きい順に要素と事前評価値の組が連な
っている。尚、事前評価値記憶部203に格納される要
素は、要素記憶部201に格納される要素に対応するの
で、要素の値そのものを格納する代わりに、要素記憶部
201内における要素のアドレスを指し示すポインタを
格納することも可能である。事前評価値記憶部203の
上記説明の構造を利用することにより、特定の要素に対
して、その要素との間で計算された事前評価値の大きい
要素を順次取り出すことが可能である。尚、図4に記述
された要素の番号は説明の便宜上の一例にすぎず、実際
の事前評価値の大小によって変わる。さらに、ここで説
明した事前評価値記憶部203における格納形態は一例
であり、特定の要素に対してその要素との事前評価値が
大きい要素を順次取り出すことが可能であればどのよう
なものでも良い。例えば、リスト構造の代わりに表形式
の格納形態を利用することも可能である。
【0036】上界計算部204は、検索制御部205よ
り入力される事前評価値v0 (i,j)と、一方の要素
とe〔i〕と、パラメータpとから上界関数S(v
0 (i,j),e〔i〕,p)に従って上界値を計算
し、その結果を検索制御部205に出力する。上界関数
は、評価関数と事前評価値の計算に用いた特定のパラメ
ータp0 によって決定される。但し、同一の評価関数及
び同一の事前評価値計算に用いるパラメータに対して、
複数の上界関数が存在することもあり得る。以下に、本
発明の一実施例による式(1)に示す評価関数Rに対す
る上界関数の導出法を説明する。事前評価値の計算にX
1 =X2 =・・・=XM =1なるパラメータを用いる場
合、事前評価値は、パラメータの要素がすべて1の場合
の類似度であり、これをv0 (i,j)或いは簡単のた
めv0 とすると、v0 は(1)式により、
り入力される事前評価値v0 (i,j)と、一方の要素
とe〔i〕と、パラメータpとから上界関数S(v
0 (i,j),e〔i〕,p)に従って上界値を計算
し、その結果を検索制御部205に出力する。上界関数
は、評価関数と事前評価値の計算に用いた特定のパラメ
ータp0 によって決定される。但し、同一の評価関数及
び同一の事前評価値計算に用いるパラメータに対して、
複数の上界関数が存在することもあり得る。以下に、本
発明の一実施例による式(1)に示す評価関数Rに対す
る上界関数の導出法を説明する。事前評価値の計算にX
1 =X2 =・・・=XM =1なるパラメータを用いる場
合、事前評価値は、パラメータの要素がすべて1の場合
の類似度であり、これをv0 (i,j)或いは簡単のた
めv0 とすると、v0 は(1)式により、
【0037】
【数3】
【0038】と書ける。ここで、任意のパラメータを考
え、値がCである要素の集合をKと書くと、類似度の計
算式は、
え、値がCである要素の集合をKと書くと、類似度の計
算式は、
【0039】
【数4】
【0040】と書き直せる。ここで、
【0041】
【数5】
【0042】
【数6】
【0043】
【数7】
【0044】と書くこととし、またC2 −1をαと書く
と、(3)式は、
と、(3)式は、
【0045】
【数8】
【0046】と書ける。ここで、内積の関係より、
【0047】
【数9】
【0048】なる関係があるので、
【0049】
【数10】
【0050】が成り立つ。類似度と事前評価値の比R
(Wi ,Wj ,X)/v0 をγとし、(9)式の関係を
用いて(7)式を書き換えると、
(Wi ,Wj ,X)/v0 をγとし、(9)式の関係を
用いて(7)式を書き換えると、
【0051】
【数11】
【0052】となる。(10)式から、SijとSiiの変
化に対する極大値を求めることにより上界を得ることが
できる。最初に、Sijに関してγの極大を調べ、次に、
Siiに対する変化を調べると、γの極大値γ' m は、
化に対する極大値を求めることにより上界を得ることが
できる。最初に、Sijに関してγの極大を調べ、次に、
Siiに対する変化を調べると、γの極大値γ' m は、
【0053】
【数12】
【0054】となる。γは、評価値(類似度)と事前評
価値の比であるので、この比が最大の時の評価値(類似
度)、即ち評価値(類似度)の上界関数S(v0 (i,
j),e〔i〕,p)は、
価値の比であるので、この比が最大の時の評価値(類似
度)、即ち評価値(類似度)の上界関数S(v0 (i,
j),e〔i〕,p)は、
【0055】
【数13】
【0056】と計算できる。さらに、(12)式におい
て、v0 (i,j)を増加させた場合、v0 (i,j)
の増加割合に対し、右辺の項、
て、v0 (i,j)を増加させた場合、v0 (i,j)
の増加割合に対し、右辺の項、
【0057】
【数14】
【0058】の増加割合は必ず小さくなるので、上記上
界関数はv0 (i,j)の増加に対して単調増加であ
る。尚、上記上界関数により計算される上界値は、要素
e〔i〕やパラメータpに依存しないが、これは本発明
の一実施例で用いている評価関数に特有の性質であり、
一般に上界関数は事前評価値v0 (i,j)と、一方の
要素e〔i〕と、パラメータpとをすべてその式に含む
形式となる。
界関数はv0 (i,j)の増加に対して単調増加であ
る。尚、上記上界関数により計算される上界値は、要素
e〔i〕やパラメータpに依存しないが、これは本発明
の一実施例で用いている評価関数に特有の性質であり、
一般に上界関数は事前評価値v0 (i,j)と、一方の
要素e〔i〕と、パラメータpとをすべてその式に含む
形式となる。
【0059】検索制御部205は、最大評価値格納変数
206と最適要素格納変数207を有し、外部から与え
られた検索要求の要素に対し、外部から与えられた検索
要求のパラメータのもとで、要素記憶部201の複数の
要素のうち、検索要求の要素と同じ要素以外のすべての
要素のなかから評価値を最大とする要素を検索する検索
動作を制御する。
206と最適要素格納変数207を有し、外部から与え
られた検索要求の要素に対し、外部から与えられた検索
要求のパラメータのもとで、要素記憶部201の複数の
要素のうち、検索要求の要素と同じ要素以外のすべての
要素のなかから評価値を最大とする要素を検索する検索
動作を制御する。
【0060】さらに、本発明の一実施例による検索制御
部205は、あらかじめ、要素記憶部201に格納され
る個々の要素e〔i〕(iは1からNまでの整数)に対
し、特定のパラメータp0 を用いて、あらゆる要素e
〔j〕(jは1からNまでの整数)についての事前評価
値v0 (i,j)=F(e〔i〕,e〔j〕,p0 )を
評価値計算部202において計算させ、次に、要素e
〔j〕と事前評価値v0 (i,j)の組を、事前評価値
の大きい順に一定個数を事前評価値記憶部203に格納
し、外部から検索要求パターンである要素e〔I〕とパ
ラメータpが与えられたときに、事前評価値記憶部20
3から要素e〔j〕と事前評価値v0 (I,j)を取り
出しながら、検索要求要素e〔I〕と事前評価値記憶部
203から取り出した事前評価値v0 (I,j)とパラ
メータpとを上界計算部204に与えて計算させた上界
値を得て、この上界値がそれまで取り出した要素に対す
る評価値のうちの最大値を越えていない場合には、上界
値を与えた要素よりも小さい事前評価値を与える要素の
事前評価値記憶部203からの取り出しを打ち切ること
により検索動作を制御する。
部205は、あらかじめ、要素記憶部201に格納され
る個々の要素e〔i〕(iは1からNまでの整数)に対
し、特定のパラメータp0 を用いて、あらゆる要素e
〔j〕(jは1からNまでの整数)についての事前評価
値v0 (i,j)=F(e〔i〕,e〔j〕,p0 )を
評価値計算部202において計算させ、次に、要素e
〔j〕と事前評価値v0 (i,j)の組を、事前評価値
の大きい順に一定個数を事前評価値記憶部203に格納
し、外部から検索要求パターンである要素e〔I〕とパ
ラメータpが与えられたときに、事前評価値記憶部20
3から要素e〔j〕と事前評価値v0 (I,j)を取り
出しながら、検索要求要素e〔I〕と事前評価値記憶部
203から取り出した事前評価値v0 (I,j)とパラ
メータpとを上界計算部204に与えて計算させた上界
値を得て、この上界値がそれまで取り出した要素に対す
る評価値のうちの最大値を越えていない場合には、上界
値を与えた要素よりも小さい事前評価値を与える要素の
事前評価値記憶部203からの取り出しを打ち切ること
により検索動作を制御する。
【0061】次に、本発明の一実施例により、上界値が
最大評価値よりも小さい要素に対しては、その要素に関
する事前評価値よりも小さい事前評価値を与える要素に
関する評価を打ち切っても正しく検索結果が得られるこ
とを図面と共に説明する。図5は、本発明の一実施例に
よる事前評価値とパラメータを与えた場合の評価値と上
界値との関係の一例を説明する図である。同図の横軸
は、事前評価値記憶部203に格納されている一の要素
に対して、その他の要素との間で計算された事前評価値
の大きい順序を示し、上記一の要素以外のL個の要素が
事前評価値の大きい順に左から並んでいる。同図の縦軸
は、事前評価値及び評価値の値を示し、上方ほど値が大
きい。同図において事前評価値5011 、50
12 、...、502L を●で示し、検索要求の要素と
事前評価値を与える要素と検索要求のパラメータとから
計算される評価値5021 を○で、評価値5022 を◎
で示し、検索要求の要素と検索要求のパラメータと事前
評価値とから計算される上界値503 3 、...、50
3L を−で示す。各符号の添字1、2、...、Lは、
事前評価値の大きさの順序による要素の順番を表してい
る。
最大評価値よりも小さい要素に対しては、その要素に関
する事前評価値よりも小さい事前評価値を与える要素に
関する評価を打ち切っても正しく検索結果が得られるこ
とを図面と共に説明する。図5は、本発明の一実施例に
よる事前評価値とパラメータを与えた場合の評価値と上
界値との関係の一例を説明する図である。同図の横軸
は、事前評価値記憶部203に格納されている一の要素
に対して、その他の要素との間で計算された事前評価値
の大きい順序を示し、上記一の要素以外のL個の要素が
事前評価値の大きい順に左から並んでいる。同図の縦軸
は、事前評価値及び評価値の値を示し、上方ほど値が大
きい。同図において事前評価値5011 、50
12 、...、502L を●で示し、検索要求の要素と
事前評価値を与える要素と検索要求のパラメータとから
計算される評価値5021 を○で、評価値5022 を◎
で示し、検索要求の要素と検索要求のパラメータと事前
評価値とから計算される上界値503 3 、...、50
3L を−で示す。各符号の添字1、2、...、Lは、
事前評価値の大きさの順序による要素の順番を表してい
る。
【0062】図5では、1番目及び2番目に大きい事前
評価値に対して、その評価値を与える要素に関する評価
値を計算した時点での評価値と上界値との関係を示して
いる。この時点での最大評価値は、同図の◎で示される
2番目の事前評価値を与える要素に対するものである。
この時点において、3番目の事前評価値に関する上界値
は、上記最大評価値を越えないので、3番目の事前評価
値を与える要素に対する評価値は、その要素が如何なる
要素であっても、決して上記最大評価値を越えることは
ない。さらに、4番目移行の事前評価値を与える要素に
関する上界値は、上界値の単調性により3番目の事前評
価値に関する上界値さえ越えないので、上記最大評価値
を越えることはあり得ない。このことから、この時点で
得られた上記最大評価値がすべての要素に対する評価値
の中での最大値であることがわかる。従って、3番目以
降の事前評価値を与える要素に対しては、評価値の計算
を打ち切っても、最大評価値を与える要素、即ち検索結
果が正しく得られる。
評価値に対して、その評価値を与える要素に関する評価
値を計算した時点での評価値と上界値との関係を示して
いる。この時点での最大評価値は、同図の◎で示される
2番目の事前評価値を与える要素に対するものである。
この時点において、3番目の事前評価値に関する上界値
は、上記最大評価値を越えないので、3番目の事前評価
値を与える要素に対する評価値は、その要素が如何なる
要素であっても、決して上記最大評価値を越えることは
ない。さらに、4番目移行の事前評価値を与える要素に
関する上界値は、上界値の単調性により3番目の事前評
価値に関する上界値さえ越えないので、上記最大評価値
を越えることはあり得ない。このことから、この時点で
得られた上記最大評価値がすべての要素に対する評価値
の中での最大値であることがわかる。従って、3番目以
降の事前評価値を与える要素に対しては、評価値の計算
を打ち切っても、最大評価値を与える要素、即ち検索結
果が正しく得られる。
【0063】図6は、本発明の一実施例の検索制御部2
05の動作を説明するためのフローチャートである。以
下、検索要求の要素をE1 、検索要求のパラメータをP
とする。
05の動作を説明するためのフローチャートである。以
下、検索要求の要素をE1 、検索要求のパラメータをP
とする。
【0064】ステップ601)外部からの検索要求の要
素E1 と検索要求のパラメータPが入力される。
素E1 と検索要求のパラメータPが入力される。
【0065】ステップ602)最大評価値格納変数20
6を評価値が取り得る最小値以下、本発明の一実施例で
は例えば0とし、最適要素格納変数207を「空」とし
て、最大評価値格納変数206と最適要素格納変数20
7を初期化する。
6を評価値が取り得る最小値以下、本発明の一実施例で
は例えば0とし、最適要素格納変数207を「空」とし
て、最大評価値格納変数206と最適要素格納変数20
7を初期化する。
【0066】ステップ603)事前評価値記憶部203
より検索要求の要素E1 に対する事前評価値が最大の要
素の要素と事前評価値の組を取り出す。また、取り出し
た要素と事前評価値の組には例えば取り出されたことが
識別できる印を付与して、取り出されていない要素と事
前評価値の組と区別できるようにする。
より検索要求の要素E1 に対する事前評価値が最大の要
素の要素と事前評価値の組を取り出す。また、取り出し
た要素と事前評価値の組には例えば取り出されたことが
識別できる印を付与して、取り出されていない要素と事
前評価値の組と区別できるようにする。
【0067】ステップ604)検索要求の要素E1 と検
索要求のパラメータPと事前評価値記憶部203より取
り出した要素とを評価値計算部202に入力して、評価
値計算部202の計算結果の評価値を取り出す。
索要求のパラメータPと事前評価値記憶部203より取
り出した要素とを評価値計算部202に入力して、評価
値計算部202の計算結果の評価値を取り出す。
【0068】ステップ605)上記評価値が最大評価値
格納変数206に格納された値よりも大きくない場合に
は、ステップ607に進む。
格納変数206に格納された値よりも大きくない場合に
は、ステップ607に進む。
【0069】ステップ606)上記評価値を最大評価値
格納変数206に格納し、上記事前評価値記憶部203
より取り出した要素を最適要素格納変数207に格納す
る。ここで、以前に最大評価値格納変数206及び最適
要素格納変数207に格納されていた値は保持されな
い。
格納変数206に格納し、上記事前評価値記憶部203
より取り出した要素を最適要素格納変数207に格納す
る。ここで、以前に最大評価値格納変数206及び最適
要素格納変数207に格納されていた値は保持されな
い。
【0070】ステップ607)事前評価値記憶部203
内に、未だ取り出されていない要素と事前評価値の組が
残っていない場合にはステップ612に進む。
内に、未だ取り出されていない要素と事前評価値の組が
残っていない場合にはステップ612に進む。
【0071】ステップ608)事前評価値記憶部203
から、未だ取り出されていない要素と事前評価値の組の
中で、事前評価値が最も大きい組を取り出し、取り出し
た要素と事前評価値の組には例えば取り出されたことが
識別できる印を付与して、取り出されていない要素と事
前評価値の組と区別できるようにする。
から、未だ取り出されていない要素と事前評価値の組の
中で、事前評価値が最も大きい組を取り出し、取り出し
た要素と事前評価値の組には例えば取り出されたことが
識別できる印を付与して、取り出されていない要素と事
前評価値の組と区別できるようにする。
【0072】ステップ609)検索要求の要素E1 と検
索要求のパラメータPと事前評価値記憶部203より取
り出した事前評価値とを上界計算部204に入力して、
上界計算部204の計算結果を上界値として得る。
索要求のパラメータPと事前評価値記憶部203より取
り出した事前評価値とを上界計算部204に入力して、
上界計算部204の計算結果を上界値として得る。
【0073】ステップ610)最大評価値格納変数20
6に格納された最大評価値と上記上界値を比較し、上界
値が最大評価値よりも大きい場合には、最大評価値より
も大きい評価値を与える要素が存在する可能性があるた
め、ステップ604に進む。
6に格納された最大評価値と上記上界値を比較し、上界
値が最大評価値よりも大きい場合には、最大評価値より
も大きい評価値を与える要素が存在する可能性があるた
め、ステップ604に進む。
【0074】ステップ611)上界値が最大評価値より
も小さい場合には、上界関数が事前評価値の増加に対し
て単調増加するため、事前評価値記憶部203内に残っ
ている未だ取り出されていないすべての事前評価値に対
する上界値は最大評価値よりも小さい。これにより、事
前評価値記憶部203内には、最大評価値よりも大きい
評価値を与える要素が存在しない。従って、検索動作を
終了し、最適要素格納変数207に格納された要素を検
索結果である最適要素として出力する。
も小さい場合には、上界関数が事前評価値の増加に対し
て単調増加するため、事前評価値記憶部203内に残っ
ている未だ取り出されていないすべての事前評価値に対
する上界値は最大評価値よりも小さい。これにより、事
前評価値記憶部203内には、最大評価値よりも大きい
評価値を与える要素が存在しない。従って、検索動作を
終了し、最適要素格納変数207に格納された要素を検
索結果である最適要素として出力する。
【0075】ステップ612)上界値が最大評価値より
も小さくなる検索打切りの判定が成立する前に、事前評
価値記憶部203内のすべての要素と事前評価値の組の
取り出しを終了している場合には、事前評価値記憶部2
03に記憶された要素以外の要素が最大の評価値を与え
る可能性があるため、全走査型探索に切り替える。尚、
本発明の一実施例においては従来技術において説明した
全走査型探索を利用する。
も小さくなる検索打切りの判定が成立する前に、事前評
価値記憶部203内のすべての要素と事前評価値の組の
取り出しを終了している場合には、事前評価値記憶部2
03に記憶された要素以外の要素が最大の評価値を与え
る可能性があるため、全走査型探索に切り替える。尚、
本発明の一実施例においては従来技術において説明した
全走査型探索を利用する。
【0076】上記説明の通り、あらかじめ要素を事前評
価値の大きい順に事前評価値記憶部203に格納し、打
切判定処理(ステップ610)によって検索途中におけ
る最大評価値と上界値との大小関係に基づき、最大評価
値よりも大きい評価値を与える要素が存在しないことが
保証される場合に検索を打ち切ることにより、検索対象
の要素を削減でき高速な検索が実現できる。
価値の大きい順に事前評価値記憶部203に格納し、打
切判定処理(ステップ610)によって検索途中におけ
る最大評価値と上界値との大小関係に基づき、最大評価
値よりも大きい評価値を与える要素が存在しないことが
保証される場合に検索を打ち切ることにより、検索対象
の要素を削減でき高速な検索が実現できる。
【0077】尚、本発明の一実施例では、検索制御部2
05は、最大評価値とこの最大評価値を与える要素を格
納するために最大評価値格納変数206と最適要素格納
変数207とを有しているが、これは本発明により本質
的に規定されるものではなく、検索途中における上記最
大評価値と最大評価値を与える要素を知ることができる
ならばどのような方法でも良い。例えば、事前評価値記
憶部203及び要素記憶部201に格納された要素に識
別フラグを付加し、最大評価値を与える要素の識別フラ
グだけを立てて他の要素と区別できるようにする方法も
考えられる。また、検索制御部205の動作も本発明の
一実施例の動作に規定されるものではなく、事前評価値
記憶部203から事前評価値が大きい順に要素を取り出
しながら最大評価値と最大評価値を与える要素を特定す
ることができ、上界値が最大評価値を越えない要素に対
する検索を打ち切ることができるならばどのような動作
でも良い。
05は、最大評価値とこの最大評価値を与える要素を格
納するために最大評価値格納変数206と最適要素格納
変数207とを有しているが、これは本発明により本質
的に規定されるものではなく、検索途中における上記最
大評価値と最大評価値を与える要素を知ることができる
ならばどのような方法でも良い。例えば、事前評価値記
憶部203及び要素記憶部201に格納された要素に識
別フラグを付加し、最大評価値を与える要素の識別フラ
グだけを立てて他の要素と区別できるようにする方法も
考えられる。また、検索制御部205の動作も本発明の
一実施例の動作に規定されるものではなく、事前評価値
記憶部203から事前評価値が大きい順に要素を取り出
しながら最大評価値と最大評価値を与える要素を特定す
ることができ、上界値が最大評価値を越えない要素に対
する検索を打ち切ることができるならばどのような動作
でも良い。
【0078】以上では、本発明の一実施例では、評価値
を最大とする要素を検索する検索装置により説明を行っ
ているが、例えば、本発明の一実施例の類似度関数Rの
逆数を評価関数とし、類似度関数Rに対応する上界関数
の逆数を下界関数とし、上界関数計算部204を下界関
数を計算する下界関数計算部とし、事前評価値記憶部2
03では事前評価値の大きい順に代わり事前評価値の小
さい順に要素と事前評価値の組を格納し、検索制御部2
05においては、最大評価値を最小評価値とし、上界値
が最大評価値よりも大きい場合ではなく、下界値が最小
評価値よりも小さい場合に検索の打ち切り判定を行うこ
とにより、本発明の第2の実施例による評価値を最小と
する要素を検索する検索装置を実現することができる。
を最大とする要素を検索する検索装置により説明を行っ
ているが、例えば、本発明の一実施例の類似度関数Rの
逆数を評価関数とし、類似度関数Rに対応する上界関数
の逆数を下界関数とし、上界関数計算部204を下界関
数を計算する下界関数計算部とし、事前評価値記憶部2
03では事前評価値の大きい順に代わり事前評価値の小
さい順に要素と事前評価値の組を格納し、検索制御部2
05においては、最大評価値を最小評価値とし、上界値
が最大評価値よりも大きい場合ではなく、下界値が最小
評価値よりも小さい場合に検索の打ち切り判定を行うこ
とにより、本発明の第2の実施例による評価値を最小と
する要素を検索する検索装置を実現することができる。
【0079】さらに、本発明の一実施例による検索シス
テムの構成では、要素記憶部201と、評価値計算部2
02と、事前評価値記憶部203と、限界計算部204
と、検索制御部205とを独立したモジュールとして表
しているが、これらは物理的に独立している必要はな
い。例えば、プロセッサとメモリからなるコンピュータ
を用いて、要素記憶部201と、事前評価値記憶部20
3と、最大評価値格納変数206と、最適要素格納変数
207との各機能をメモリに割り付け、評価値計算部2
02と、上界計算部204と、検索制御部205の各機
能をプロセッサに割り付ける方法などが考えられる。
テムの構成では、要素記憶部201と、評価値計算部2
02と、事前評価値記憶部203と、限界計算部204
と、検索制御部205とを独立したモジュールとして表
しているが、これらは物理的に独立している必要はな
い。例えば、プロセッサとメモリからなるコンピュータ
を用いて、要素記憶部201と、事前評価値記憶部20
3と、最大評価値格納変数206と、最適要素格納変数
207との各機能をメモリに割り付け、評価値計算部2
02と、上界計算部204と、検索制御部205の各機
能をプロセッサに割り付ける方法などが考えられる。
【0080】
【発明の効果】以上説明したように、本発明により外部
から与えられた検索要求の要素と検索要求のパラメータ
に基づき、多数の要素の中から評価関数を最大とする要
素を検索する場合に、事前評価値記憶部から事前評価値
が大きい順に要素を取り出しながら最大評価値を持つ要
素を特定し、上界値を計算して、上界値が最大評価値よ
りも小さい場合には検索を打ち切ることにより、検索対
象となる要素の数を削減できるので、要素の数が多い場
合にも高速な検索が可能となる。また、上界値関数は事
前評価値の変化に対し単調であることを規定しているの
で、本発明における検索打切りの基準で検索を打ち切っ
た場合には、検索を打ち切った時点での最大評価値を与
える要素が、すべての要素のなかで最大の評価値を与え
ることが保証される。
から与えられた検索要求の要素と検索要求のパラメータ
に基づき、多数の要素の中から評価関数を最大とする要
素を検索する場合に、事前評価値記憶部から事前評価値
が大きい順に要素を取り出しながら最大評価値を持つ要
素を特定し、上界値を計算して、上界値が最大評価値よ
りも小さい場合には検索を打ち切ることにより、検索対
象となる要素の数を削減できるので、要素の数が多い場
合にも高速な検索が可能となる。また、上界値関数は事
前評価値の変化に対し単調であることを規定しているの
で、本発明における検索打切りの基準で検索を打ち切っ
た場合には、検索を打ち切った時点での最大評価値を与
える要素が、すべての要素のなかで最大の評価値を与え
ることが保証される。
【0081】さらに、本発明により外部から与えられた
検索要求の要素と検索要求のパラメータに基づき、多数
の要素の中から評価関数を最小とする要素を検索する場
合に、事前評価値記憶部から事前評価値が小さい順に要
素を取り出しながら最小評価値を持つ要素を特定し、下
界値を計算して、下界値が最小評価値よりも大きい場合
には検索を打ち切ることにより、検索対象となる要素の
数を削減できるので、要素の数が多い場合にも高速な検
索が可能となる。また、下界値関数は事前評価値の変化
に対し単調であることを規定しているので、本発明にお
ける検索打切りの基準で検索を打ち切った場合には、検
索を打ち切った時点での最小評価値を与える要素が、す
べての要素のなかで最小の評価値を与えることが保証さ
れる。
検索要求の要素と検索要求のパラメータに基づき、多数
の要素の中から評価関数を最小とする要素を検索する場
合に、事前評価値記憶部から事前評価値が小さい順に要
素を取り出しながら最小評価値を持つ要素を特定し、下
界値を計算して、下界値が最小評価値よりも大きい場合
には検索を打ち切ることにより、検索対象となる要素の
数を削減できるので、要素の数が多い場合にも高速な検
索が可能となる。また、下界値関数は事前評価値の変化
に対し単調であることを規定しているので、本発明にお
ける検索打切りの基準で検索を打ち切った場合には、検
索を打ち切った時点での最小評価値を与える要素が、す
べての要素のなかで最小の評価値を与えることが保証さ
れる。
【0082】すなわち、本発明によれば、要素が多い場
合にも高速で誤差のない検索を行う検索装置が実現でき
る。
合にも高速で誤差のない検索を行う検索装置が実現でき
る。
【図1】本発明の原理構成図である。
【図2】本発明の一実施例の検索装置の構成図である。
【図3】本発明の一実施例の要素記憶部の記憶形態を説
明する図である。
明する図である。
【図4】本発明の一実施例の事前評価値記憶部の記憶形
態を説明する図である。
態を説明する図である。
【図5】本発明の一実施例の評価値と上界値の関係を説
明する図である。
明する図である。
【図6】本発明の一実施例の検索制御部の動作フローチ
ャートである。
ャートである。
【図7】従来技術の検索装置の構成図である。
【図8】従来技術の検索制御部の動作フローチャートで
ある。
ある。
101、201 要素記憶部 102、202 評価値計算部 103、203 事前評価値記憶部 104 有界値計算部 105、205 検索制御部 204 上界計算部 206 最大評価値格納変数 207 最適要素格納変数 3011 、...、301N レコード 3021 、...、302N 見出し 30311、...、303NM 重み 40111、...、401NL 要素 40211、...、402NL、5011 、...、50
1L 事前評価値 5021 、5022 評価値 5033 、...、503L 上限値
1L 事前評価値 5021 、5022 評価値 5033 、...、503L 上限値
フロントページの続き (56)参考文献 特開 平4−81972(JP,A) 特開 平3−123973(JP,A) 特開 平5−158991(JP,A) 特開 昭53−98749(JP,A) 湯川高志、笠原要、松澤和光、石川 勉,アバウト推論:多観点概念ベースに おける類似概念検索の高速化,情報処理 学会学会第47回(平成5年後期)全国大 会講演論文集(3),日本,社団法人情 報処理学会,1993年 9月27日,PP. 57−58 (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 JICSTファイル(JOIS)
Claims (2)
- 【請求項1】 被検索情報である複数の要素を格納する
要素記憶部と、 二つの要素とパラメータを入力されて所定の評価関数に
従って評価値を計算する評価値計算部と、 外部より入力された検索要求の要素と検索要求のパラメ
ータ及び該要素記憶部よりの要素を該評価値計算部に入
力して該要素記憶部の複数の要素のうち該検索要求の要
素と同じ要素以外のすべての要素のなかから評価値を最
大とする要素を検索する検索動作を制御する検索制御部
とから構成される検索装置において、 前記要素記憶部に格納された複数の要素のうち二つの要
素の組合せに対し、該二つの要素と所定のパラメータと
を用いて計算された評価値を事前評価値とし、該二つの
要素のうち一方の要素毎に該二つの要素のうちの他方の
要素と該事前評価値の組を該事前評価値の大きい順に所
定の個数だけ格納する事前評価値記憶部と、 前記事前評価値と、前記対応する他の要素と、任意のパ
ラメータとを入力されて、上記所定のパラメータ値にお
ける事前評価値の増加に対して単調増加である上界関数
に従って上界値を計算する有界値計算部とから構成さ
れ、 前記検索制御部は、上記外部よりの検索要求の要素及び
検索要求のパラメータを入力されて、該検索要求の要素
に対応して前記事前評価値記憶部に格納された要素と事
前評価値の組を前記事前評価値記憶部より順次取り出
し、該検索要求の要素と、前記事前評価値記憶部から取
り出された要素と、該検索要求のパラメータとを用いて
前記評価値計算部により算出された最大の評価値を最大
評価値とし、該事前評価値と該検索要求の要素及び該検
索要求のパラメータとを上記有界値計算部に与えて計算
された上界値が該最大評価値よりも小さい場合には、該
上界値に対応する事前評価値よりも小さい上記組の前記
事前評価値記憶部からの順次取り出しを打ち切ることを
特徴とする、検索装置。 - 【請求項2】 被検索情報である複数の要素を格納する
要素記憶部と、 二つの要素とパラメータを入力されて所定の評価関数に
従って評価値を計算する評価値計算部と、 外部より入力された検索要求の要素と検索要求のパラメ
ータ及び該要素記憶部よりの要素を該評価値計算部に入
力して該要素記憶部の複数の要素のうち該検索要求の要
素と同じ要素以外のすべての要素のなかから評価値を最
小とする要素を検索する検索動作を制御する検索制御部
とから構成される検索装置において、 前記要素記憶部に格納された複数の要素のうち二つの要
素の組合せに対し、該二つの要素と所定のパラメータと
を用いて計算された評価値を事前評価値とし、該二つの
要素のうち一方の要素毎に該二つの要素のうちの他方の
要素と該事前評価値の組を該事前評価値の大きい順に所
定の個数だけ格納する事前評価値記憶部と、 前記事前評価値と、前記対応する他の要素と、任意のパ
ラメータとを入力されて、上記所定のパラメータ値にお
ける事前評価値の減少に対して単調減少である下界関数
に従って下界値を計算する有界値計算部とから構成さ
れ、 前記検索制御部は、上記外部よりの検索要求の要素及び
検索要求のパラメータを入力されて、該検索要求の要素
に対応して前記事前評価値記憶部に格納された要素と事
前評価値の組を前記事前評価値記憶部より順次取り出
し、該検索要求の要素と、前記事前評価値記憶部から取
り出された要素と、該検索要求のパラメータとを用いて
前記評価値計算部により算出された最小の評価値を最小
評価値とし、該事前評価値と該検索要求の要素及び該検
索要求のパラメータとを上記有界値計算部に与えて計算
された下界値が該最小評価値よりも大きい場合には、該
下界値に対応する事前評価値よりも大きい上記組の前記
事前評価値記憶部からの順次取り出しを打ち切ることを
特徴とする、検索装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP22740893A JP3348314B2 (ja) | 1993-09-13 | 1993-09-13 | 検索装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP22740893A JP3348314B2 (ja) | 1993-09-13 | 1993-09-13 | 検索装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH0785068A JPH0785068A (ja) | 1995-03-31 |
| JP3348314B2 true JP3348314B2 (ja) | 2002-11-20 |
Family
ID=16860372
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP22740893A Expired - Fee Related JP3348314B2 (ja) | 1993-09-13 | 1993-09-13 | 検索装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3348314B2 (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3374946B2 (ja) * | 1994-09-09 | 2003-02-10 | 日本電信電話株式会社 | 検索装置 |
| JP3353265B2 (ja) * | 1996-02-15 | 2002-12-03 | 日本電信電話株式会社 | 類似性検索方法及び装置 |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5398749A (en) * | 1977-02-08 | 1978-08-29 | Nec Corp | Information retrieval system |
| JPH03123973A (ja) * | 1989-10-06 | 1991-05-27 | Ricoh Co Ltd | 文書検索方法 |
| JPH0481972A (ja) * | 1990-07-24 | 1992-03-16 | Ricoh Co Ltd | 文書検索装置 |
| JPH05158991A (ja) * | 1991-12-02 | 1993-06-25 | Mitsubishi Electric Corp | 情報検索システム |
-
1993
- 1993-09-13 JP JP22740893A patent/JP3348314B2/ja not_active Expired - Fee Related
Non-Patent Citations (1)
| Title |
|---|
| 湯川高志、笠原要、松澤和光、石川勉,アバウト推論:多観点概念ベースにおける類似概念検索の高速化,情報処理学会学会第47回(平成5年後期)全国大会講演論文集(3),日本,社団法人情報処理学会,1993年 9月27日,PP.57−58 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0785068A (ja) | 1995-03-31 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4388301B2 (ja) | 画像検索装置、画像検索方法、画像検索プログラム及びそのプログラムを記録した記録媒体 | |
| CN117171331B (zh) | 基于大型语言模型的专业领域信息交互方法、装置及设备 | |
| US20050041886A1 (en) | Image search program, information storage medium, image search apparatus and image search method | |
| JPH0981730A (ja) | パターン認識方法及び装置及びコンピュータ制御装置 | |
| US6334129B1 (en) | Data processing apparatus and method | |
| JP3348314B2 (ja) | 検索装置 | |
| JP2000250919A (ja) | 文書処理装置及びそのプログラム記憶媒体 | |
| JPH064584A (ja) | 文章検索装置 | |
| JPH11213004A (ja) | データ処理装置及びその方法、及びそのプログラムを記憶した記憶媒体 | |
| KR970005018B1 (ko) | 퍼지검색장치, 방법 및 멤버십 함수 작성 장치 | |
| JP2001147923A (ja) | 類似文書検索装置、類似文書検索方法及び記録媒体 | |
| JP3374946B2 (ja) | 検索装置 | |
| JPH05314320A (ja) | 認識距離の差と候補順を利用した認識結果の評価方式 | |
| JP3902825B2 (ja) | 文書検索システムおよび方法 | |
| JP3288063B2 (ja) | 可変長データの格納および参照システム | |
| JPH10232871A (ja) | 検索装置 | |
| JP2894305B2 (ja) | 認識装置の候補修正方式 | |
| JP2022093805A (ja) | 帳票データ検索システムと帳票データ検索方法及び帳票データ検索プログラム | |
| JP2762472B2 (ja) | 文字認識方法および文字認識装置 | |
| JP2001134584A (ja) | 類似データの検索方法,検索装置および類似データ検索プログラム記録媒体 | |
| JP4292922B2 (ja) | 文書検索システムおよび方法 | |
| JP3068397B2 (ja) | 文書管理装置 | |
| JP2001325292A (ja) | 複合語の類似度判定システム、類似度判定方法及び記録媒体 | |
| JPH05225248A (ja) | データベース検索システム | |
| JPH07271920A (ja) | 文字認識装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |