JPH08314948A - 情報検索装置 - Google Patents
情報検索装置Info
- Publication number
- JPH08314948A JPH08314948A JP7146898A JP14689895A JPH08314948A JP H08314948 A JPH08314948 A JP H08314948A JP 7146898 A JP7146898 A JP 7146898A JP 14689895 A JP14689895 A JP 14689895A JP H08314948 A JPH08314948 A JP H08314948A
- Authority
- JP
- Japan
- Prior art keywords
- character chain
- data
- character
- delimiter
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】 (修正有)
【目的】 一つの項目に登録された複数のデータを高速
に検索する。 【構成】 項目内のデータが複数のデータから成ると
き、これらのデータを繋げた列の先頭、終端及びデータ
の間に区切りコードを付与する手段3、この列の隣接す
る2文字の組から成る文字連鎖を作成する手段7、文字
連鎖を構成する各文字の出現個数、レコード番号及びデ
ータの番号から成る文字連鎖情報を作成し、文字連鎖と
対応させてメモリに格納して検索ファイルを作成する手
段10、入力されたキーワードに区切りコードを付与する
手段13並びに、区切りコードが付与されたキーワードか
らキーワードの文字連鎖を作成する手段17を備え、検索
ファイルからキーワードの文字連鎖に対応する文字連鎖
情報を読出し、それらを照合してキーワードを含むデー
タを検索する。
に検索する。 【構成】 項目内のデータが複数のデータから成ると
き、これらのデータを繋げた列の先頭、終端及びデータ
の間に区切りコードを付与する手段3、この列の隣接す
る2文字の組から成る文字連鎖を作成する手段7、文字
連鎖を構成する各文字の出現個数、レコード番号及びデ
ータの番号から成る文字連鎖情報を作成し、文字連鎖と
対応させてメモリに格納して検索ファイルを作成する手
段10、入力されたキーワードに区切りコードを付与する
手段13並びに、区切りコードが付与されたキーワードか
らキーワードの文字連鎖を作成する手段17を備え、検索
ファイルからキーワードの文字連鎖に対応する文字連鎖
情報を読出し、それらを照合してキーワードを含むデー
タを検索する。
Description
【0001】
【産業上の利用分野】本発明は、データベースに登録さ
れたデータの中から、入力されたキーワードを含むデー
タを検索する情報検索装置に関し、特に、テーブルなど
のデータベースから該当するデータを的確に検索できる
ようにしたものである。
れたデータの中から、入力されたキーワードを含むデー
タを検索する情報検索装置に関し、特に、テーブルなど
のデータベースから該当するデータを的確に検索できる
ようにしたものである。
【0002】
【従来の技術】近年、情報検索では、利用者が思いつい
た言葉をキーワードとして入力すると、データベースに
登録されたデータを全文検索して、そのキーワードの文
字列を含むデータを自動検索するシステムが注目を集め
ている。特に、リレーショナルデータベース管理システ
ム(RDBMS)などではその製品化が図られており、
多方面での応用が広まっている。
た言葉をキーワードとして入力すると、データベースに
登録されたデータを全文検索して、そのキーワードの文
字列を含むデータを自動検索するシステムが注目を集め
ている。特に、リレーショナルデータベース管理システ
ム(RDBMS)などではその製品化が図られており、
多方面での応用が広まっている。
【0003】リレーショナルデータベースでは、例え
ば、図22に示すように、レコード番号1のレコードが
神奈川県の横浜に関する記録であり、レコード番号2の
レコードが神奈川県の鎌倉に関する記録である場合に、
レコードの属性(県名、都市名、‥)を表す複数の項目
をデータ構造として設け、レコード番号に対応させて各
属性のデータをそれぞれの項目に格納して、テーブルを
構成する。
ば、図22に示すように、レコード番号1のレコードが
神奈川県の横浜に関する記録であり、レコード番号2の
レコードが神奈川県の鎌倉に関する記録である場合に、
レコードの属性(県名、都市名、‥)を表す複数の項目
をデータ構造として設け、レコード番号に対応させて各
属性のデータをそれぞれの項目に格納して、テーブルを
構成する。
【0004】このテーブルのデータベースから、例えば
「鎌倉」のレコードを検索する場合には、図23に示す
ように、先ず、操作者は、情報検索装置に検索対象とな
るテーブルの項目(項目2)と検索対象となるキーワー
ド「鎌倉」とを入力する。これを受けて、情報検索装置
は、図22のテーブルの全てのレコードに関するデータ
を読み込み、検索対象に指定された項目2を照合の対象
に設定して、キーワードと項目2の各データとを照合す
る。この照合によって一致したデータを検出したとき
は、そのデータに対応するレコード番号(番号2)を出
力する。
「鎌倉」のレコードを検索する場合には、図23に示す
ように、先ず、操作者は、情報検索装置に検索対象とな
るテーブルの項目(項目2)と検索対象となるキーワー
ド「鎌倉」とを入力する。これを受けて、情報検索装置
は、図22のテーブルの全てのレコードに関するデータ
を読み込み、検索対象に指定された項目2を照合の対象
に設定して、キーワードと項目2の各データとを照合す
る。この照合によって一致したデータを検出したとき
は、そのデータに対応するレコード番号(番号2)を出
力する。
【0005】こうして従来の情報検索装置では、操作者
の入力した項目とキーワードとを手掛かりに、目的のレ
コードを検索する。
の入力した項目とキーワードとを手掛かりに、目的のレ
コードを検索する。
【0006】
【発明が解決しようとする課題】しかし、従来の情報検
索では、例えば、一方のレコードが「横浜」の「中華
街」に関する記録、他方が「横浜」の「山下公園」に関
する記録である場合に、これらのレコードを区別するた
め、新たに「名所」に関する項目を増設して、「中華
街」及び「山下公園」のデータを各レコードに対応させ
て格納する必要があり、そのため項目数が非常に多くな
るという問題点を有している。また、この場合、横浜の
中華街に関するレコードを検索するときは、「横浜」を
検索する項目と「中華街」を検索する項目との複数項目
を指定する必要があり、操作者はどの項目に必要とする
データが格納されているかを予め知っていなければなら
ず、検索の操作が煩雑になり、検索処理に時間が掛かる
などの問題点がある。
索では、例えば、一方のレコードが「横浜」の「中華
街」に関する記録、他方が「横浜」の「山下公園」に関
する記録である場合に、これらのレコードを区別するた
め、新たに「名所」に関する項目を増設して、「中華
街」及び「山下公園」のデータを各レコードに対応させ
て格納する必要があり、そのため項目数が非常に多くな
るという問題点を有している。また、この場合、横浜の
中華街に関するレコードを検索するときは、「横浜」を
検索する項目と「中華街」を検索する項目との複数項目
を指定する必要があり、操作者はどの項目に必要とする
データが格納されているかを予め知っていなければなら
ず、検索の操作が煩雑になり、検索処理に時間が掛かる
などの問題点がある。
【0007】また、こうした場合、1項目に複数のデー
タを列記する方法もある(先の例では「横浜中華街」
「横浜山下公園」とする)が、このときには、「横浜」
「中華街」「山下公園」はそれぞれ独立のデータとして
存在する訳ではないから、例えば、「横浜」という単独
のデータを有するレコードを検索したいときに、これら
のレコードは検索漏れとなってしまう。このとき、「横
浜」という語を含むデータを全て拾い上げる検索を行な
うならば、これらのレコードも検索漏れを免れることが
できるが、しかし、こうした検索では、検索者の意図に
反したデータ(検索ゴミ)を大量に検出してしまう可能
性がある。
タを列記する方法もある(先の例では「横浜中華街」
「横浜山下公園」とする)が、このときには、「横浜」
「中華街」「山下公園」はそれぞれ独立のデータとして
存在する訳ではないから、例えば、「横浜」という単独
のデータを有するレコードを検索したいときに、これら
のレコードは検索漏れとなってしまう。このとき、「横
浜」という語を含むデータを全て拾い上げる検索を行な
うならば、これらのレコードも検索漏れを免れることが
できるが、しかし、こうした検索では、検索者の意図に
反したデータ(検索ゴミ)を大量に検出してしまう可能
性がある。
【0008】また、このように1項目に複数のデータを
記述した場合には、データの文字列が長くなるので、入
力されたキーワードをデータの先頭から順次照合するの
に時間が掛かる。
記述した場合には、データの文字列が長くなるので、入
力されたキーワードをデータの先頭から順次照合するの
に時間が掛かる。
【0009】また、このキーワードによる検索では、例
えば「横○×」や「○×横」のように、前方に「横」の
付くデータを検索(以下「前方一致検索」と呼ぶ)した
り、後方に「横」の付くデータを検索(以下「後方一致
検索」)したり、前方と後方の両者に指定された文字が
付くデータを検索(以下「完全一致検索」と呼ぶ)する
ことができるが、これらの検索時間も長くなる。
えば「横○×」や「○×横」のように、前方に「横」の
付くデータを検索(以下「前方一致検索」と呼ぶ)した
り、後方に「横」の付くデータを検索(以下「後方一致
検索」)したり、前方と後方の両者に指定された文字が
付くデータを検索(以下「完全一致検索」と呼ぶ)する
ことができるが、これらの検索時間も長くなる。
【0010】本発明は、こうした従来の問題点を解決す
るものであり、テーブルの構成要素として設けた一つの
項目に複数のデータをそれぞれ独立に登録することがで
き、また、項目内のこれらのデータと入力されたキーワ
ードとの照合を高速で行なうことができる情報検索装置
を提供することを目的としている。
るものであり、テーブルの構成要素として設けた一つの
項目に複数のデータをそれぞれ独立に登録することがで
き、また、項目内のこれらのデータと入力されたキーワ
ードとの照合を高速で行なうことができる情報検索装置
を提供することを目的としている。
【0011】
【課題を解決するための手段】そこで、本発明では、複
数の項目を持つレコードデータの項目内におけるデータ
から、入力されたキーワードを含むデータを検索する情
報検索装置において、この項目内のデータが複数のデー
タから成るとき、これらのデータを繋げた列の先頭、終
端及びデータの間に区切りコードを付与する区切り付与
手段と、この列の隣接する2文字の組から成る文字連鎖
を作成する文字連鎖パターン生成手段と、文字連鎖を構
成する各文字のデータにおける出現個数、レコード番
号、データの番号から成る文字連鎖情報を作成し、文字
連鎖と対応させてメモリに格納して検索ファイルを作成
する検索ファイル作成手段と、入力されたキーワードに
区切りコードを付与するキーワード区切り付与手段と、
区切りコードが付与されたキーワードからキーワードの
文字連鎖を作成するキーワード文字連鎖生成手段と、検
索ファイルからキーワードの文字連鎖に対応する文字連
鎖情報を読出し、それらを照合してキーワードを含むデ
ータを検索する照合手段とを設けている。
数の項目を持つレコードデータの項目内におけるデータ
から、入力されたキーワードを含むデータを検索する情
報検索装置において、この項目内のデータが複数のデー
タから成るとき、これらのデータを繋げた列の先頭、終
端及びデータの間に区切りコードを付与する区切り付与
手段と、この列の隣接する2文字の組から成る文字連鎖
を作成する文字連鎖パターン生成手段と、文字連鎖を構
成する各文字のデータにおける出現個数、レコード番
号、データの番号から成る文字連鎖情報を作成し、文字
連鎖と対応させてメモリに格納して検索ファイルを作成
する検索ファイル作成手段と、入力されたキーワードに
区切りコードを付与するキーワード区切り付与手段と、
区切りコードが付与されたキーワードからキーワードの
文字連鎖を作成するキーワード文字連鎖生成手段と、検
索ファイルからキーワードの文字連鎖に対応する文字連
鎖情報を読出し、それらを照合してキーワードを含むデ
ータを検索する照合手段とを設けている。
【0012】また、照合手段に対して、区切りコードを
含むキーワードの文字連鎖に対応する文字連鎖情報の照
合を優先させる優先照合手段を設けている。
含むキーワードの文字連鎖に対応する文字連鎖情報の照
合を優先させる優先照合手段を設けている。
【0013】また、文字連鎖パターン生成手段は、区切
りコードを文字連鎖の中に含めて文字連鎖を作成する。
りコードを文字連鎖の中に含めて文字連鎖を作成する。
【0014】また、このとき検索ファイル作成手段は、
文字連鎖情報における区切りコードの出現個数として、
特定の番号を設定する。
文字連鎖情報における区切りコードの出現個数として、
特定の番号を設定する。
【0015】また、文字連鎖パターン生成手段が、区切
りコードを含めずに文字連鎖を作成し、検索ファイル作
成手段が、文字連鎖の内、区切りコードと隣接する文字
連鎖の文字連鎖情報をそれ以外の文字連鎖情報と区別し
て作成する。
りコードを含めずに文字連鎖を作成し、検索ファイル作
成手段が、文字連鎖の内、区切りコードと隣接する文字
連鎖の文字連鎖情報をそれ以外の文字連鎖情報と区別し
て作成する。
【0016】また、検索ファイル作成手段が、区切りコ
ードと隣接する文字連鎖の文字連鎖情報をメモリに群別
に格納する。
ードと隣接する文字連鎖の文字連鎖情報をメモリに群別
に格納する。
【0017】また、区切り付与手段が、先の列に階層を
表す複数種類の区切りコードを付与し、キーワード区切
り付与手段が、入力されたキーワードに階層を表す区切
りコードを付与する。
表す複数種類の区切りコードを付与し、キーワード区切
り付与手段が、入力されたキーワードに階層を表す区切
りコードを付与する。
【0018】さらに、区切り付与手段が、先の列に順序
を表す複数種類の区切りコードを付与し、キーワード区
切り付与手段が、入力されたキーワードにこの順序を表
す区切りコードを付与する。
を表す複数種類の区切りコードを付与し、キーワード区
切り付与手段が、入力されたキーワードにこの順序を表
す区切りコードを付与する。
【0019】
【作用】そのため、キーワードの文字列に相当する連続
する文字が同一データ内に存在するかどうかを、キーワ
ードの文字連鎖に対応させて読出した文字連鎖情報を照
合することにより、調べることができる。このデータが
1項目内に複数存在する場合でも、各データを区切りコ
ードで区切っているため、各データはそれぞれ独立のデ
ータとして作用する。従って、レコードデータの構成要
素である1項目に対して、複数のデータを繰り返し登録
することができ、入力されたキーワードを含む文字列や
パターンなどのデータを項目内で繰り返し検索すること
が可能である。
する文字が同一データ内に存在するかどうかを、キーワ
ードの文字連鎖に対応させて読出した文字連鎖情報を照
合することにより、調べることができる。このデータが
1項目内に複数存在する場合でも、各データを区切りコ
ードで区切っているため、各データはそれぞれ独立のデ
ータとして作用する。従って、レコードデータの構成要
素である1項目に対して、複数のデータを繰り返し登録
することができ、入力されたキーワードを含む文字列や
パターンなどのデータを項目内で繰り返し検索すること
が可能である。
【0020】また、キーワードの前または後ろに区切り
コードを付与し、この区切りコードを含む文字連鎖に対
応する文字連鎖情報を優先させて照合することにより、
前方一致検索や後方一致検索を高速で行なうことができ
る。
コードを付与し、この区切りコードを含む文字連鎖に対
応する文字連鎖情報を優先させて照合することにより、
前方一致検索や後方一致検索を高速で行なうことができ
る。
【0021】また、区切りコードを文字連鎖の中に含め
ずに、この区切りコードに隣接する文字連鎖をデータの
先端または末端として扱う場合には、文字連鎖情報の数
を減らすことができ、照合回数を削減することができ
る。また、この区切りコードに隣接する文字連鎖の文字
連鎖情報をメモリに群別に格納することにより、メモリ
からの読出しが容易になる。また、前方一致検索、後方
一致検索、完全一致検索に応じて、文字連鎖情報の読出
し順序や照合順序を合わせることができ、これらの検索
を高速で行なうことができる。
ずに、この区切りコードに隣接する文字連鎖をデータの
先端または末端として扱う場合には、文字連鎖情報の数
を減らすことができ、照合回数を削減することができ
る。また、この区切りコードに隣接する文字連鎖の文字
連鎖情報をメモリに群別に格納することにより、メモリ
からの読出しが容易になる。また、前方一致検索、後方
一致検索、完全一致検索に応じて、文字連鎖情報の読出
し順序や照合順序を合わせることができ、これらの検索
を高速で行なうことができる。
【0022】また、階層構造または順序構造を持つデー
タに対しては、階層または順序を示す区切りコードを付
与して検索ファイルを構成し、入力するキーワードにも
階層または順序を指定する区切りコードを付与すること
により、階層関係や順序関係を持った検索を実現するこ
とができる。
タに対しては、階層または順序を示す区切りコードを付
与して検索ファイルを構成し、入力するキーワードにも
階層または順序を指定する区切りコードを付与すること
により、階層関係や順序関係を持った検索を実現するこ
とができる。
【0023】
(第1実施例)実施例の情報検索装置では、図6に示す
用に、レコードの項目内に「あいうあえ、あいあえ、あ
とあし」の3個のデータがある場合に、このデータ中の
区切り「、」に代わって、区切りコード(^W)を付加
し、「^Wあいうあえ^Wあいあえ^Wあとあし^W」というデ
ータに変換する。次に、各データごとの文字出現頻度を
求める。この文字出現頻度は、それぞれの文字が、同一
種別の文字の何回目に出現した文字であるかを表すもの
で、図6(3)に示すようになる。次に、「^Wあいうあ
え^Wあいあえ^Wあとあし^W」の先頭より1文字ずつ移動
しながら隣接する2文字の組から成る文字連鎖パター
ン、即ち、(^W,あ)(あ,い)(い,う)(う,あ)
(あ,え)(え,^W)(^W,あ)(あ,い)(い,あ)
(あ,え)(え,^W)(^W,あ)(あ,と)(と,あ)
(あ,し)(し,^W)を作成し、この文字連鎖パターン
における各文字の文字出現頻度と、データ番号(3個の
データの順番を表す番号)と、レコード番号とを組合せ
て文字連鎖情報を作成する。
用に、レコードの項目内に「あいうあえ、あいあえ、あ
とあし」の3個のデータがある場合に、このデータ中の
区切り「、」に代わって、区切りコード(^W)を付加
し、「^Wあいうあえ^Wあいあえ^Wあとあし^W」というデ
ータに変換する。次に、各データごとの文字出現頻度を
求める。この文字出現頻度は、それぞれの文字が、同一
種別の文字の何回目に出現した文字であるかを表すもの
で、図6(3)に示すようになる。次に、「^Wあいうあ
え^Wあいあえ^Wあとあし^W」の先頭より1文字ずつ移動
しながら隣接する2文字の組から成る文字連鎖パター
ン、即ち、(^W,あ)(あ,い)(い,う)(う,あ)
(あ,え)(え,^W)(^W,あ)(あ,い)(い,あ)
(あ,え)(え,^W)(^W,あ)(あ,と)(と,あ)
(あ,し)(し,^W)を作成し、この文字連鎖パターン
における各文字の文字出現頻度と、データ番号(3個の
データの順番を表す番号)と、レコード番号とを組合せ
て文字連鎖情報を作成する。
【0024】例えば、2番目の文字連鎖パターンである
(あ,い)の文字連鎖情報は、「あ」の文字出現頻度が
1、「い」の文字出現頻度が1、データ番号が1、そし
てレコード番号が1であるから(1,1,1,1)とな
る。また、最後の文字連鎖パターン(し,^W)の文字連
鎖情報は(1,m,3,1)となる。ここでは^Wの文字
出現頻度をmで表している。こうして求めた各文字連鎖
パターンとその文字連鎖情報とを纏めて検索ファイル
(図6(4))を作成する。
(あ,い)の文字連鎖情報は、「あ」の文字出現頻度が
1、「い」の文字出現頻度が1、データ番号が1、そし
てレコード番号が1であるから(1,1,1,1)とな
る。また、最後の文字連鎖パターン(し,^W)の文字連
鎖情報は(1,m,3,1)となる。ここでは^Wの文字
出現頻度をmで表している。こうして求めた各文字連鎖
パターンとその文字連鎖情報とを纏めて検索ファイル
(図6(4))を作成する。
【0025】一方、検索時に、図10に示すように「あ
とあし」というキーワードが入力されたとすると、この
キーワードに区切りコードを付加して「^Wあとあし^W」
を作成し、その文字連鎖パターン(^W,あ)(あ,と)
(と,あ)(あ,し)(し,^W)に対応する文字連鎖情
報を検索ファイルから求める(図10(4))。
とあし」というキーワードが入力されたとすると、この
キーワードに区切りコードを付加して「^Wあとあし^W」
を作成し、その文字連鎖パターン(^W,あ)(あ,と)
(と,あ)(あ,し)(し,^W)に対応する文字連鎖情
報を検索ファイルから求める(図10(4))。
【0026】次いで、この文字連鎖情報から、連続する
「あとあし」という文字列がデータ1〜3の中に存在す
るかどうかを次のように調べる。もしも、その文字列が
データ1〜3の中に存在するならば、前記の各文字連鎖
パターンにおける文字連鎖情報のデータ番号及びレコー
ド番号は一致している筈であるし、また、各文字連鎖パ
ターンにおける文字連鎖情報の2番目の要素の値は、そ
の次の文字連鎖パターンにおける文字連鎖情報の1番目
の要素の値と一致している筈である。検索ファイルから
求めた文字連鎖情報の中に、こうした条件を満たす文字
連鎖情報を検出することができたときには、そのレコー
ド番号を検出結果として出力する。
「あとあし」という文字列がデータ1〜3の中に存在す
るかどうかを次のように調べる。もしも、その文字列が
データ1〜3の中に存在するならば、前記の各文字連鎖
パターンにおける文字連鎖情報のデータ番号及びレコー
ド番号は一致している筈であるし、また、各文字連鎖パ
ターンにおける文字連鎖情報の2番目の要素の値は、そ
の次の文字連鎖パターンにおける文字連鎖情報の1番目
の要素の値と一致している筈である。検索ファイルから
求めた文字連鎖情報の中に、こうした条件を満たす文字
連鎖情報を検出することができたときには、そのレコー
ド番号を検出結果として出力する。
【0027】こうした動作を行なう情報検索装置は、図
1に示すように、複数の項目から構成されるレコードデ
ータが格納されたレコードデータ記憶部2と、格納され
たレコードデータを読み取るレコード読取部1と、読み
取ったレコードデータから各項目毎のデータを切り出
し、データの順番をカウントし、さらにデータの先頭、
間、終端に区切りコードを付加する区切り付加部3と、
区切り付加部3からデータの順番を取得するとともに、
レコードデータ記憶部2からレコード番号を取得する番
号付加部9と、区切りコードの付加された各項目のデー
タにおける文字出現頻度を計算するとともに文字連鎖パ
ターンを作成する文字連鎖パターン生成部7と、区切り
コードを含む文字連鎖パターンを作成する区切り判定部
8と、文字連鎖パターン生成部7及び区切り判定部8か
ら得た文字連鎖パターンと前記番号付加部9から得たデ
ータ番号及びレコード番号とから文字連鎖情報を作成す
る検索ファイル生成部10と、文字連鎖パターン、文字連
鎖情報、区切りコード用の文字種別の各データを記憶す
る検索ファイル記憶部11と、入力されたキーワード及び
部分一致、前方一致、後方一致、完全一致の各検索種別
を読み取るキーワード読取部12と、検索種別に応じてキ
ーワードの前後に区切りコードを付加するキーワード区
切り付加部13と、区切りコードの付加されたキーワード
から文字連鎖パターンを生成するキーワード文字連鎖生
成部17と、キーワードから生成された文字連鎖パターン
に対応する文字連鎖情報を検索ファイル11から引き出し
て照合処理を行ない、キーワードと一致するレコードデ
ータを抽出する照合部18と、検索結果を表示する検索結
果表示部19とを備えるとともに、さらに、区切りコード
を第2要素に含む文字連鎖の文字連鎖情報を検索ファイ
ル記憶部11の優先的に引き出し得る位置に格納するよう
に指示する優先指示部6と、区切りコードを第2要素に
含む文字連鎖の文字連鎖情報を優先的に照合するように
指示する優先照合部16と、1項目に含まれる各データの
末端2文字の文字種組合せに対して区切りコードを付加
する群別区切り付加部4と、入力されたキーワードの末
端2文字の文字種組合せに対して区切りコードを付加す
るキーワード群別区切り付加部14と、レコードデータの
項目に含まれる複数のデータが階層構造を持つときに各
データの末端に階層構造に応じた区切りコードを付加す
る階層・順序別区切り付加部5と、入力されたキーワー
ドに階層を示す区切りコードを付加するキーワード階層
別区切り付加部15とを備えている。
1に示すように、複数の項目から構成されるレコードデ
ータが格納されたレコードデータ記憶部2と、格納され
たレコードデータを読み取るレコード読取部1と、読み
取ったレコードデータから各項目毎のデータを切り出
し、データの順番をカウントし、さらにデータの先頭、
間、終端に区切りコードを付加する区切り付加部3と、
区切り付加部3からデータの順番を取得するとともに、
レコードデータ記憶部2からレコード番号を取得する番
号付加部9と、区切りコードの付加された各項目のデー
タにおける文字出現頻度を計算するとともに文字連鎖パ
ターンを作成する文字連鎖パターン生成部7と、区切り
コードを含む文字連鎖パターンを作成する区切り判定部
8と、文字連鎖パターン生成部7及び区切り判定部8か
ら得た文字連鎖パターンと前記番号付加部9から得たデ
ータ番号及びレコード番号とから文字連鎖情報を作成す
る検索ファイル生成部10と、文字連鎖パターン、文字連
鎖情報、区切りコード用の文字種別の各データを記憶す
る検索ファイル記憶部11と、入力されたキーワード及び
部分一致、前方一致、後方一致、完全一致の各検索種別
を読み取るキーワード読取部12と、検索種別に応じてキ
ーワードの前後に区切りコードを付加するキーワード区
切り付加部13と、区切りコードの付加されたキーワード
から文字連鎖パターンを生成するキーワード文字連鎖生
成部17と、キーワードから生成された文字連鎖パターン
に対応する文字連鎖情報を検索ファイル11から引き出し
て照合処理を行ない、キーワードと一致するレコードデ
ータを抽出する照合部18と、検索結果を表示する検索結
果表示部19とを備えるとともに、さらに、区切りコード
を第2要素に含む文字連鎖の文字連鎖情報を検索ファイ
ル記憶部11の優先的に引き出し得る位置に格納するよう
に指示する優先指示部6と、区切りコードを第2要素に
含む文字連鎖の文字連鎖情報を優先的に照合するように
指示する優先照合部16と、1項目に含まれる各データの
末端2文字の文字種組合せに対して区切りコードを付加
する群別区切り付加部4と、入力されたキーワードの末
端2文字の文字種組合せに対して区切りコードを付加す
るキーワード群別区切り付加部14と、レコードデータの
項目に含まれる複数のデータが階層構造を持つときに各
データの末端に階層構造に応じた区切りコードを付加す
る階層・順序別区切り付加部5と、入力されたキーワー
ドに階層を示す区切りコードを付加するキーワード階層
別区切り付加部15とを備えている。
【0028】第1実施例では、この情報検索装置におけ
る検索ファイル生成の動作及びキーワード検索の動作に
ついて詳しく説明する。この動作では、図1の構成の
内、優先指示部6、優先照合部16、群別区切り付加部
4、キーワード群別区切り付加部14、階層・順序別区切
り付加部5及びキーワード階層別区切り付加部15は使用
しない。
る検索ファイル生成の動作及びキーワード検索の動作に
ついて詳しく説明する。この動作では、図1の構成の
内、優先指示部6、優先照合部16、群別区切り付加部
4、キーワード群別区切り付加部14、階層・順序別区切
り付加部5及びキーワード階層別区切り付加部15は使用
しない。
【0029】コードデータ記憶部2の構造は、図3に示
すように、レコード番号、項目などから構成されてお
り、各項目の中には複数のデータが格納されている(da
ta1,data2,‥)。本実施例では項目2にデータが存在
するものとする。このコードデータ記憶部2に格納され
たレコードデータから検索ファイルを生成するまでの手
順は図2の処理フローに従って行なわれる。
すように、レコード番号、項目などから構成されてお
り、各項目の中には複数のデータが格納されている(da
ta1,data2,‥)。本実施例では項目2にデータが存在
するものとする。このコードデータ記憶部2に格納され
たレコードデータから検索ファイルを生成するまでの手
順は図2の処理フローに従って行なわれる。
【0030】ステップ1:レコード読取部1は、レコー
ドデータ記憶部2からレコードデータを読取り、その最
初のレコードデータを処理すべきレコードデータとして
設定(L=1)し、 ステップ2:このレコードデータの処理すべき項目(こ
こではk番目の項目)を指定する。この指定された項目
には、図6(1)で示すように、「あいうあえ、あいあ
え、あとあし」の3個のデータが区切り「、」で分けら
れているものとする。
ドデータ記憶部2からレコードデータを読取り、その最
初のレコードデータを処理すべきレコードデータとして
設定(L=1)し、 ステップ2:このレコードデータの処理すべき項目(こ
こではk番目の項目)を指定する。この指定された項目
には、図6(1)で示すように、「あいうあえ、あいあ
え、あとあし」の3個のデータが区切り「、」で分けら
れているものとする。
【0031】ステップ3:区切り付加部3は、このデー
タの先頭及び末尾に区切りコード(^W)を追加し、ま
た、データ間の区切り「、」を区切りコードに変える。
図6(2)に区切りコードが付加されたデータを示す。
タの先頭及び末尾に区切りコード(^W)を追加し、ま
た、データ間の区切り「、」を区切りコードに変える。
図6(2)に区切りコードが付加されたデータを示す。
【0032】ステップ4:文字連鎖パターン生成部7
は、項目kの処理すべきデータのデータ番号hを1に設
定し、 ステップ5:このデータ番号1のデータにおける区切り
コードの文字種別に対する出現頻度を特定の番号(ここ
ではm)にセットするとともに、 ステップ6:このデータの各文字について、文字種別ご
との出現頻度を算出する。図6(3)には、第1〜第3
データの全てについて文字種別ごとの出現頻度を算出し
たときに得られる、データ別の文字出現頻度と区切りコ
ード(^W)との関係を示している。
は、項目kの処理すべきデータのデータ番号hを1に設
定し、 ステップ5:このデータ番号1のデータにおける区切り
コードの文字種別に対する出現頻度を特定の番号(ここ
ではm)にセットするとともに、 ステップ6:このデータの各文字について、文字種別ご
との出現頻度を算出する。図6(3)には、第1〜第3
データの全てについて文字種別ごとの出現頻度を算出し
たときに得られる、データ別の文字出現頻度と区切りコ
ード(^W)との関係を示している。
【0033】ステップ7:文字連鎖パターン生成部7
は、次いで、データ番号1のデータにおける文字連鎖
(F(a),F(b))を作成する。このとき区切り判
定部8は、区切りコードを含む文字連鎖パターンを作成
する。
は、次いで、データ番号1のデータにおける文字連鎖
(F(a),F(b))を作成する。このとき区切り判
定部8は、区切りコードを含む文字連鎖パターンを作成
する。
【0034】ステップ8:検索ファイル生成部10は、文
字連鎖パターン生成部7及び区切り判定部8から文字連
鎖パターンとその出現頻度とを得るとともに、番号付加
部9が取得しているデータ番号(h)とレコード番号
(L)とを得て、文字連鎖情報を作成し、検索ファイル
記憶部11に格納する。この文字連鎖情報は、図4に示す
ように、連続する2文字の文字出現頻度、データ番号、
レコード番号から構成される。
字連鎖パターン生成部7及び区切り判定部8から文字連
鎖パターンとその出現頻度とを得るとともに、番号付加
部9が取得しているデータ番号(h)とレコード番号
(L)とを得て、文字連鎖情報を作成し、検索ファイル
記憶部11に格納する。この文字連鎖情報は、図4に示す
ように、連続する2文字の文字出現頻度、データ番号、
レコード番号から構成される。
【0035】ステップ9:こうしてデータ番号hのデー
タの全ての文字連鎖パターンにおける文字連鎖情報を作
成する。
タの全ての文字連鎖パターンにおける文字連鎖情報を作
成する。
【0036】検索ファイル記憶部11は、図5に示すよう
に、文字連鎖情報の種別、文字連鎖パターン、文字連鎖
情報のリストから構成され、文字連鎖情報の種別は、文
字連鎖パターンに区切りコードが含まれているかどう
か、含まれている場合に、それが連続する2文字の前方
であるか後方であるかを区別しており、 ステップ10:F(a)=mであるとき、この文字連鎖の
文字連鎖情報を前方区切りコード付き文字連鎖情報とし
て格納し、 ステップ11:F(b)=mであるとき、この文字連鎖の
文字連鎖情報を後方区切りコード付き文字連鎖情報とし
て格納する。
に、文字連鎖情報の種別、文字連鎖パターン、文字連鎖
情報のリストから構成され、文字連鎖情報の種別は、文
字連鎖パターンに区切りコードが含まれているかどう
か、含まれている場合に、それが連続する2文字の前方
であるか後方であるかを区別しており、 ステップ10:F(a)=mであるとき、この文字連鎖の
文字連鎖情報を前方区切りコード付き文字連鎖情報とし
て格納し、 ステップ11:F(b)=mであるとき、この文字連鎖の
文字連鎖情報を後方区切りコード付き文字連鎖情報とし
て格納する。
【0037】ステップ12:次いで、処理の対象を項目k
における次のデータに移すため、データ番号hをインク
リメントし、 ステップ13:そのhの値が項目k内の最大のデータ番号
に達するまでステップ5以降の手順を繰り返す。
における次のデータに移すため、データ番号hをインク
リメントし、 ステップ13:そのhの値が項目k内の最大のデータ番号
に達するまでステップ5以降の手順を繰り返す。
【0038】図6(4)には、図6(1)のデータから
生成され、検索ファイル記憶部11に格納された検索ファ
イルを示している。
生成され、検索ファイル記憶部11に格納された検索ファ
イルを示している。
【0039】ステップ13において、hの値が項目k内の
最大のデータ番号を超えたときは、 ステップ14:処理の対象を次のレコードデータに移すた
め、レコード番号Lをインクリメントし、 ステップ15:全てのレコードデータについての処理が終
了するまで、ステップ2〜ステップ15の手順を繰り返
す。
最大のデータ番号を超えたときは、 ステップ14:処理の対象を次のレコードデータに移すた
め、レコード番号Lをインクリメントし、 ステップ15:全てのレコードデータについての処理が終
了するまで、ステップ2〜ステップ15の手順を繰り返
す。
【0040】次に、図7の処理フローにより、検索ファ
イルを用いて入力されたキーワードと一致するデータを
検索する処理手順について説明する。このときのキーワ
ードの読込から検索までのデータの流れを図8に示して
いる。キーワード読取部12で読取るデータとして図8
(1)のパターン1「あと?」とパターン2「あいあ
え」とを例として挙げる。「あと?」は、「あとあし」
等のように冒頭に「あと」を含む文字列を調べることを
意味し、「あいあえ」の様に「?」がない場合はキーワ
ードと完全に一致する文字列を調べることを意味する。
イルを用いて入力されたキーワードと一致するデータを
検索する処理手順について説明する。このときのキーワ
ードの読込から検索までのデータの流れを図8に示して
いる。キーワード読取部12で読取るデータとして図8
(1)のパターン1「あと?」とパターン2「あいあ
え」とを例として挙げる。「あと?」は、「あとあし」
等のように冒頭に「あと」を含む文字列を調べることを
意味し、「あいあえ」の様に「?」がない場合はキーワ
ードと完全に一致する文字列を調べることを意味する。
【0041】ステップ1:キーワード読取部12は、入力
されたパターン1やパターン2のキーワードを読み込
み、 ステップ2:操作者から入力された項目kを指定項目と
して設定する。
されたパターン1やパターン2のキーワードを読み込
み、 ステップ2:操作者から入力された項目kを指定項目と
して設定する。
【0042】ステップ3:キーワード区切り付加部13
は、キーワードの文字列における「?」の有無に応じて
検索種別(部分一致、前方一致、後方一致、完全一致)
を判定し、 ステップ4:検索種別に応じてキーワードに区切りコー
ド(^W)を付与する。図8(2)に示すように、キーワ
ードの検索種別が完全一致の場合は、文字列の両端に区
切りコードを付加し、キーワード文字列に「?」が有る
ときは、「?」の無い方の端にだけ区切りコードを付加
する。
は、キーワードの文字列における「?」の有無に応じて
検索種別(部分一致、前方一致、後方一致、完全一致)
を判定し、 ステップ4:検索種別に応じてキーワードに区切りコー
ド(^W)を付与する。図8(2)に示すように、キーワ
ードの検索種別が完全一致の場合は、文字列の両端に区
切りコードを付加し、キーワード文字列に「?」が有る
ときは、「?」の無い方の端にだけ区切りコードを付加
する。
【0043】ステップ5:キーワード文字連鎖生成部17
は、区切りコードが付与されたキーワードに対して文字
連鎖パターン(a,b)を作成する。図8(3)にパタ
ーン1及びパターン2に対応する文字連鎖パターンを示
している。
は、区切りコードが付与されたキーワードに対して文字
連鎖パターン(a,b)を作成する。図8(3)にパタ
ーン1及びパターン2に対応する文字連鎖パターンを示
している。
【0044】ステップ6:次に照合部18は、この文字
連鎖パターンに対応する文字連鎖情報を検索ファイル記
憶部11から引き出して照合を行なう。文字種aが区切り
コードであるときは、 ステップ7:検索ファイルの前方区切りコード付き文字
連鎖情報の中から該当する文字連鎖パターンの文字連鎖
情報を全て引き出し、 ステップ8:文字種bが区切りコードであるときは、 ステップ9:検索ファイルの後方区切りコード付き文字
連鎖情報の中から該当する文字連鎖パターンの文字連鎖
情報を全て引き出し、 ステップ10:それ以外のときは、検索ファイルの区切り
コードなし文字連鎖情報の中から該当する文字連鎖パタ
ーンの文字連鎖情報を全て引き出す。
連鎖パターンに対応する文字連鎖情報を検索ファイル記
憶部11から引き出して照合を行なう。文字種aが区切り
コードであるときは、 ステップ7:検索ファイルの前方区切りコード付き文字
連鎖情報の中から該当する文字連鎖パターンの文字連鎖
情報を全て引き出し、 ステップ8:文字種bが区切りコードであるときは、 ステップ9:検索ファイルの後方区切りコード付き文字
連鎖情報の中から該当する文字連鎖パターンの文字連鎖
情報を全て引き出し、 ステップ10:それ以外のときは、検索ファイルの区切り
コードなし文字連鎖情報の中から該当する文字連鎖パタ
ーンの文字連鎖情報を全て引き出す。
【0045】ステップ11:次いで、キーワードの文字連
鎖の組の数を調べて、 ステップ12:1組であるときは、 ステップ13:引き出した文字連鎖情報を全て該当する文
字連鎖情報とする。
鎖の組の数を調べて、 ステップ12:1組であるときは、 ステップ13:引き出した文字連鎖情報を全て該当する文
字連鎖情報とする。
【0046】ステップ14:2組以上であるときは、 ステップ15:連続する2組の文字連鎖における文字連鎖
情報の間で、1番目の文字連鎖の第2文字の出現頻度と
2番目の文字連鎖の第1文字の出現頻度が一致し、且つ
データ番号が一致するものが在るかどうかを照合し、そ
れらが一致するまで次々と文字連鎖情報を取り替えて照
合を繰り返す。
情報の間で、1番目の文字連鎖の第2文字の出現頻度と
2番目の文字連鎖の第1文字の出現頻度が一致し、且つ
データ番号が一致するものが在るかどうかを照合し、そ
れらが一致するまで次々と文字連鎖情報を取り替えて照
合を繰り返す。
【0047】ステップ16:これらの照合で該当する文字
連鎖情報が存在するときは、 ステップ17:照合部18は、該当するレコード番号と件数
とをレコードデータ記憶部2から抽出し、検索結果表示
部19に表示する。
連鎖情報が存在するときは、 ステップ17:照合部18は、該当するレコード番号と件数
とをレコードデータ記憶部2から抽出し、検索結果表示
部19に表示する。
【0048】このときの照合時のデータの流れを図8
(4)に示している。図8(4)の<パターン1>の場
合には、照合1回目で第1文字連鎖と第2文字連鎖との
照合((A)と(B)とに対する照合)が一致しないので、第
2文字連鎖情報はそのままにして次の第1文字連鎖情報
との照合を行なう(照合2回目)。以下繰り返し、照合
3回目で一致するので、照合部18は、一致した文字連鎖
情報から、項目番号2、データ番号3、レコード番号1
を取得し、その内容をレコードデータ記憶部2から求め
る。もし、全ての文字連鎖パターンに対して一致しない
場合には照合を終了する。
(4)に示している。図8(4)の<パターン1>の場
合には、照合1回目で第1文字連鎖と第2文字連鎖との
照合((A)と(B)とに対する照合)が一致しないので、第
2文字連鎖情報はそのままにして次の第1文字連鎖情報
との照合を行なう(照合2回目)。以下繰り返し、照合
3回目で一致するので、照合部18は、一致した文字連鎖
情報から、項目番号2、データ番号3、レコード番号1
を取得し、その内容をレコードデータ記憶部2から求め
る。もし、全ての文字連鎖パターンに対して一致しない
場合には照合を終了する。
【0049】また、図8(4)の<パターン2>は、5
個の文字連鎖パターンに対する照合の例であり、順番に
(A)と(B)、(C)と(B)、(D)と(B)、(E)と(B)で照合を行な
う過程を示している。また、図8(5)に最終的な検索
結果を示している。
個の文字連鎖パターンに対する照合の例であり、順番に
(A)と(B)、(C)と(B)、(D)と(B)、(E)と(B)で照合を行な
う過程を示している。また、図8(5)に最終的な検索
結果を示している。
【0050】このように実施例の情報検索装置では、デ
ータの先頭、間、終端に区切りコードを付与し、区切り
コードを含めて文字連鎖パターンを形成し、各文字連鎖
パターンの文字連鎖情報を集めて検索ファイルを形成し
ている。そして、入力されたキーワードを区切りコード
を含む文字連鎖に分解し、その文字連鎖に対応する文字
連鎖情報を照合することによって、キーワードの文字列
を含むデータを検出している。
ータの先頭、間、終端に区切りコードを付与し、区切り
コードを含めて文字連鎖パターンを形成し、各文字連鎖
パターンの文字連鎖情報を集めて検索ファイルを形成し
ている。そして、入力されたキーワードを区切りコード
を含む文字連鎖に分解し、その文字連鎖に対応する文字
連鎖情報を照合することによって、キーワードの文字列
を含むデータを検出している。
【0051】このように項目内のデータに区切りコード
を付与しているため、1項目内に複数のデータを持つ場
合でも、それらのデータを、キーワード検索においてそ
れぞれ独立したデータとして作用させることができる。
従って、検索における支障を生じることなく、1項目内
に複数のデータを追加することが可能である。
を付与しているため、1項目内に複数のデータを持つ場
合でも、それらのデータを、キーワード検索においてそ
れぞれ独立したデータとして作用させることができる。
従って、検索における支障を生じることなく、1項目内
に複数のデータを追加することが可能である。
【0052】また、検索時には、キーワードの文字連鎖
に対応する文字連鎖情報だけを検索ファイルから読み出
して照合を行なうので、キーワードの文字列をデータ文
字列の全てと照合する場合に比べて、検索時間を短くす
ることができる。
に対応する文字連鎖情報だけを検索ファイルから読み出
して照合を行なうので、キーワードの文字列をデータ文
字列の全てと照合する場合に比べて、検索時間を短くす
ることができる。
【0053】なお、実施例では、データが文字パターン
である場合について説明したが、○△など予めパターン
化されたデータであれば、何に対しても適用可能であ
る。また、区切りコードには、パターン化されたデータ
以外のものであれば、どのようなものでも用いることが
できる。
である場合について説明したが、○△など予めパターン
化されたデータであれば、何に対しても適用可能であ
る。また、区切りコードには、パターン化されたデータ
以外のものであれば、どのようなものでも用いることが
できる。
【0054】(第2実施例)第2実施例では、後方一致
検索などの便を図るため、入力されたキーワードとの照
合を、キーワード文字列の後ろから行なう場合について
説明する。
検索などの便を図るため、入力されたキーワードとの照
合を、キーワード文字列の後ろから行なう場合について
説明する。
【0055】この動作は、図1の情報検索装置におい
て、第1実施例で使用した各部の他に、区切りコードを
第2文字に含む文字連鎖の文字連鎖情報を優先的な読出
し位置に格納するよう指示する優先指示部6と、区切り
コードを第2文字に含む文字連鎖の文字連鎖情報を優先
的に照合するように指示する優先照合部16とを使って実
行される。
て、第1実施例で使用した各部の他に、区切りコードを
第2文字に含む文字連鎖の文字連鎖情報を優先的な読出
し位置に格納するよう指示する優先指示部6と、区切り
コードを第2文字に含む文字連鎖の文字連鎖情報を優先
的に照合するように指示する優先照合部16とを使って実
行される。
【0056】この装置において、検索ファイルの生成は
第1実施例と同じように行なわれる。但し、区切りコー
ドを第2文字に含む文字連鎖の文字連鎖情報について
は、優先指示部6の指示を受けた検索ファイル生成部10
が、検索ファイル記憶部11の優先的に読出しが可能な位
置に格納する。
第1実施例と同じように行なわれる。但し、区切りコー
ドを第2文字に含む文字連鎖の文字連鎖情報について
は、優先指示部6の指示を受けた検索ファイル生成部10
が、検索ファイル記憶部11の優先的に読出しが可能な位
置に格納する。
【0057】一方、入力されたキーワードとの一致検索
は、図9のフロー図に従って行なわれる。このときのキ
ーワードの読込みから検索までのデータの流れを図10
に示している。入力キーワードは、図10(1)の「あ
とあし」であるとする。
は、図9のフロー図に従って行なわれる。このときのキ
ーワードの読込みから検索までのデータの流れを図10
に示している。入力キーワードは、図10(1)の「あ
とあし」であるとする。
【0058】ステップ1〜ステップ5:キーワード読取
部12は、入力キーワードを読込み、操作者から入力され
た項目kを指定項目として設定する。キーワード区切り
付加部13は、キーワードの文字列に応じて検索種別を判
定し、検索種別に応じてキーワードに区切りコード(^
W)を付与する。キーワード文字連鎖生成部17は、区切
りコードが付与されたキーワードの文字連鎖パターン
(a,b)を作成する。ここまでの手順は第1実施例と
全く同じである。区切りコードが付加されたキーワード
を図10(2)に、また、作成された文字連鎖パターン
を図10(3)に示している。
部12は、入力キーワードを読込み、操作者から入力され
た項目kを指定項目として設定する。キーワード区切り
付加部13は、キーワードの文字列に応じて検索種別を判
定し、検索種別に応じてキーワードに区切りコード(^
W)を付与する。キーワード文字連鎖生成部17は、区切
りコードが付与されたキーワードの文字連鎖パターン
(a,b)を作成する。ここまでの手順は第1実施例と
全く同じである。区切りコードが付加されたキーワード
を図10(2)に、また、作成された文字連鎖パターン
を図10(3)に示している。
【0059】ステップ6:照合部18は、この中の文字種
bが区切りコードである文字連鎖パターン(し,^W)の
文字連鎖情報を検索ファイル記憶部11から優先して引き
出し、次いで、文字種aが区切りコードである文字連鎖
パターン(^W,あ)の文字連鎖情報を引き出し、 ステップ7:次に、その他の文字連鎖パターンの文字連
鎖情報を検索ファイルから引き出す。
bが区切りコードである文字連鎖パターン(し,^W)の
文字連鎖情報を検索ファイル記憶部11から優先して引き
出し、次いで、文字種aが区切りコードである文字連鎖
パターン(^W,あ)の文字連鎖情報を引き出し、 ステップ7:次に、その他の文字連鎖パターンの文字連
鎖情報を検索ファイルから引き出す。
【0060】ステップ8:次いで、キーワードの文字連
鎖の組の数を調べて、 ステップ9:1組であるときは、 ステップ10:引き出した文字連鎖情報を全て該当する文
字連鎖情報とする。
鎖の組の数を調べて、 ステップ9:1組であるときは、 ステップ10:引き出した文字連鎖情報を全て該当する文
字連鎖情報とする。
【0061】ステップ11:2組以上であるときは、 ステップ12:連続する2組の文字連鎖における文字連鎖
情報の間で出現頻度とデータ番号とが一致するかどうか
を照合し、それらが一致するまで次々と文字連鎖情報を
取り替えて照合を繰り返す。
情報の間で出現頻度とデータ番号とが一致するかどうか
を照合し、それらが一致するまで次々と文字連鎖情報を
取り替えて照合を繰り返す。
【0062】ステップ13:これらの照合で一致する文字
連鎖情報が存在するときは、 ステップ14:照合部18は、該当するレコード番号と件数
とをレコードデータ記憶部2から抽出し、検索結果表示
部19に表示する。
連鎖情報が存在するときは、 ステップ14:照合部18は、該当するレコード番号と件数
とをレコードデータ記憶部2から抽出し、検索結果表示
部19に表示する。
【0063】このステップ8〜ステップ14の手順は、第
1実施例におけるステップ11〜ステップ17(図7)の手
順と同じである。但し、ステップ12における照合では、
図10(4)に示すように、第2文字が区切りコードで
ある文字連鎖パターン(し,^W)を優先し、先ず、この
(し,^W)の文字連鎖情報と、その前の(あ,し)の文
字連鎖情報とを照合して、(し,^W)の第1文字の出現
頻度が(あ,し)の第2文字の出現頻度と一致し、且つ
データ番号が一致するかどうかを調べる。これらが一致
したときは、次に(あ,し)と(と,あ)との文字連鎖
情報の照合を行ない、順次、キーワードの後ろから照合
を進めて行く。
1実施例におけるステップ11〜ステップ17(図7)の手
順と同じである。但し、ステップ12における照合では、
図10(4)に示すように、第2文字が区切りコードで
ある文字連鎖パターン(し,^W)を優先し、先ず、この
(し,^W)の文字連鎖情報と、その前の(あ,し)の文
字連鎖情報とを照合して、(し,^W)の第1文字の出現
頻度が(あ,し)の第2文字の出現頻度と一致し、且つ
データ番号が一致するかどうかを調べる。これらが一致
したときは、次に(あ,し)と(と,あ)との文字連鎖
情報の照合を行ない、順次、キーワードの後ろから照合
を進めて行く。
【0064】このように第2実施例の情報検索装置で
は、照合に際して、第2文字に区切りコードを持つ文字
連鎖を優先させることができるため、後方一致検索を高
速で行なうことが可能となる。
は、照合に際して、第2文字に区切りコードを持つ文字
連鎖を優先させることができるため、後方一致検索を高
速で行なうことが可能となる。
【0065】なお、照合に際して、第1文字に区切りコ
ードを持つ文字連鎖を優先させることも可能であり、こ
の場合には、前方一致検索を高速で行なうことができ
る。
ードを持つ文字連鎖を優先させることも可能であり、こ
の場合には、前方一致検索を高速で行なうことができ
る。
【0066】(第3実施例)第3実施例では、区切りコ
ードが付加されたデータの区切りコードの前後に続く2
文字を区切りコード付き文字連鎖として扱うことによ
り、高速での検索を実現する。
ードが付加されたデータの区切りコードの前後に続く2
文字を区切りコード付き文字連鎖として扱うことによ
り、高速での検索を実現する。
【0067】この動作は、図1の情報検索装置におい
て、第1実施例で使用した各部の他に、1項目に含まれ
る各データの両端における2文字の文字種組合せに対し
て区切りコードを付加する群別区切り付加部4と、入力
されたキーワードの両端における2文字の文字種組合せ
に対して区切りコードを付加するキーワード群別区切り
付加部14とを使って実行される。
て、第1実施例で使用した各部の他に、1項目に含まれ
る各データの両端における2文字の文字種組合せに対し
て区切りコードを付加する群別区切り付加部4と、入力
されたキーワードの両端における2文字の文字種組合せ
に対して区切りコードを付加するキーワード群別区切り
付加部14とを使って実行される。
【0068】この場合の検索ファイルの作成は、図11
の処理フローに従って行なわれる。
の処理フローに従って行なわれる。
【0069】ステップ1〜ステップ7:レコードデータ
の処理すべき項目(第k番目)が指定されると、レコー
ド読取部1は、レコードデータ記憶部2からレコードデ
ータを読取り、区切り付加部3は、このデータの先頭及
び末尾に区切りコード(^W)を追加し、また、データ間
の区切り「、」を区切りコードに変える。文字連鎖パタ
ーン生成部7は、項目kの処理すべきデータのデータ番
号hを1に設定し、文字種別が区切りコードのときにそ
の出現頻度を特定番号mに設定し、このデータのその他
の文字について、文字種別ごとの出現頻度を算出し、次
いで、文字連鎖(F(a),F(b))を作成する。
の処理すべき項目(第k番目)が指定されると、レコー
ド読取部1は、レコードデータ記憶部2からレコードデ
ータを読取り、区切り付加部3は、このデータの先頭及
び末尾に区切りコード(^W)を追加し、また、データ間
の区切り「、」を区切りコードに変える。文字連鎖パタ
ーン生成部7は、項目kの処理すべきデータのデータ番
号hを1に設定し、文字種別が区切りコードのときにそ
の出現頻度を特定番号mに設定し、このデータのその他
の文字について、文字種別ごとの出現頻度を算出し、次
いで、文字連鎖(F(a),F(b))を作成する。
【0070】ここまでの動作は、実質的に第1実施例の
場合と同じであるが、但し、文字連鎖パターン生成部7
は、文字連鎖(F(a),F(b))の作成に際して、
群別区切り付加部4の指示に基づいて、区切りコードを
群別の区切りコードとして扱い、この区切りコードを文
字種に含めずに文字連鎖(F(a),F(b))を作成
する。そして、 ステップ8:区切り判定部8は、この文字連鎖の第1文
字または第2文字が区切りコードと隣接しているかどう
かを調べ、 ステップ9:区切りコードと接していないものと、 ステップ10:第1文字が区切りコードと隣接する前方区
切りコード付き文字連鎖と、第2文字が区切りコードと
隣接する後方区切りコード付き文字連鎖とに分別する。
場合と同じであるが、但し、文字連鎖パターン生成部7
は、文字連鎖(F(a),F(b))の作成に際して、
群別区切り付加部4の指示に基づいて、区切りコードを
群別の区切りコードとして扱い、この区切りコードを文
字種に含めずに文字連鎖(F(a),F(b))を作成
する。そして、 ステップ8:区切り判定部8は、この文字連鎖の第1文
字または第2文字が区切りコードと隣接しているかどう
かを調べ、 ステップ9:区切りコードと接していないものと、 ステップ10:第1文字が区切りコードと隣接する前方区
切りコード付き文字連鎖と、第2文字が区切りコードと
隣接する後方区切りコード付き文字連鎖とに分別する。
【0071】ステップ11:検索ファイル生成部10は、こ
れらの分別された文字連鎖パターンの文字連鎖情報を検
索ファイル記憶部11に分別して格納する。この検索ファ
イル記憶部11の構成は図12に示している。
れらの分別された文字連鎖パターンの文字連鎖情報を検
索ファイル記憶部11に分別して格納する。この検索ファ
イル記憶部11の構成は図12に示している。
【0072】これらの動作を、データ番号が項目k内で
最大に達するまで行ない、また、全てのレコードデータ
を対象にして繰り返す。
最大に達するまで行ない、また、全てのレコードデータ
を対象にして繰り返す。
【0073】図13(1)に、レコードデータの文字種
別に応じた出現頻度と、区切りコードに接続する群別文
字連鎖パターンとを示しており、また、図13(2)
に、図13(1)から作成された検索ファイルを示して
いる。この検索ファイルでは、(あ,い)、(あ,と)
は前方区切りコード付き文字連鎖パターンとして格納さ
れるとともに、その第1文字により「あ」の群として区
画される。同様に(あ,え)(あ,し)は後方区切りコ
ード付き文字連鎖パターンとして格納され、「あ」の群
として区画される。
別に応じた出現頻度と、区切りコードに接続する群別文
字連鎖パターンとを示しており、また、図13(2)
に、図13(1)から作成された検索ファイルを示して
いる。この検索ファイルでは、(あ,い)、(あ,と)
は前方区切りコード付き文字連鎖パターンとして格納さ
れるとともに、その第1文字により「あ」の群として区
画される。同様に(あ,え)(あ,し)は後方区切りコ
ード付き文字連鎖パターンとして格納され、「あ」の群
として区画される。
【0074】ここで注目すべきは、(あ,い)、(あ,
と)、(あ,え)(あ,し)が区切りコードなし文字連
鎖情報としては格納されないということである。つま
り、それだけ照合すべき文字連鎖情報が減り、照合を高
速で行なうことが可能になる。
と)、(あ,え)(あ,し)が区切りコードなし文字連
鎖情報としては格納されないということである。つま
り、それだけ照合すべき文字連鎖情報が減り、照合を高
速で行なうことが可能になる。
【0075】次に、検索の処理の流れを図14に示す。
また、検索時のデータの流れを図15に示す。ここで
は、入力キーワードが「あとあし」であるとする。
また、検索時のデータの流れを図15に示す。ここで
は、入力キーワードが「あとあし」であるとする。
【0076】ステップ1〜3:第1実施例と同様に、キ
ーワード読取部12は、キーワードを読み込み、操作者の
入力操作を受けて、指定項目にセットし、検索種別を指
定する。
ーワード読取部12は、キーワードを読み込み、操作者の
入力操作を受けて、指定項目にセットし、検索種別を指
定する。
【0077】ステップ4:キーワード群別区切り付加部
14は、キーワードに群別の区切りを付加し(図15
(2))、キーワード文字連鎖生成部17は、キーワード
を文字パターンに分割して文字連鎖パターンを作成す
る。このとき、図15(3)に示すように、区切りコー
ドに接続する文字連鎖(あ,と)(あ,し)と、区切り
コードに接続しない文字連鎖(と,あ)とが作成され
る。
14は、キーワードに群別の区切りを付加し(図15
(2))、キーワード文字連鎖生成部17は、キーワード
を文字パターンに分割して文字連鎖パターンを作成す
る。このとき、図15(3)に示すように、区切りコー
ドに接続する文字連鎖(あ,と)(あ,し)と、区切り
コードに接続しない文字連鎖(と,あ)とが作成され
る。
【0078】ステップ5:照合部18は、検索種別が前方
一致検索であるときは、 ステップ6:検索ファイルから、前方区切りコード付き
の文字連鎖(あ,と)に該当する前方区切りコード付き
文字連鎖情報を優先して読込み、次いで、後方区切りコ
ード付きの文字連鎖(あ,し)に該当する後方区切りコ
ード付き文字連鎖情報を読込む。
一致検索であるときは、 ステップ6:検索ファイルから、前方区切りコード付き
の文字連鎖(あ,と)に該当する前方区切りコード付き
文字連鎖情報を優先して読込み、次いで、後方区切りコ
ード付きの文字連鎖(あ,し)に該当する後方区切りコ
ード付き文字連鎖情報を読込む。
【0079】ステップ7:また、検索種別が後方一致検
索であるときは、 ステップ8:検索ファイルから、後方区切りコード付き
の文字連鎖(あ,し)に該当する後方区切りコード付き
文字連鎖情報を優先して読込み、次いで、前方区切りコ
ード付きの文字連鎖(あ,と)に該当する前方区切りコ
ード付き文字連鎖情報を読込み、 ステップ9:次いで、区切りコードなしの文字連鎖
(と,あ)に該当する区切りコードなし文字連鎖情報を
読込み、 ステップ10〜ステップ16:第1実施例と同様の手順で照
合を行なう。
索であるときは、 ステップ8:検索ファイルから、後方区切りコード付き
の文字連鎖(あ,し)に該当する後方区切りコード付き
文字連鎖情報を優先して読込み、次いで、前方区切りコ
ード付きの文字連鎖(あ,と)に該当する前方区切りコ
ード付き文字連鎖情報を読込み、 ステップ9:次いで、区切りコードなしの文字連鎖
(と,あ)に該当する区切りコードなし文字連鎖情報を
読込み、 ステップ10〜ステップ16:第1実施例と同様の手順で照
合を行なう。
【0080】この検索ファイルから、前方区切りコード
付き文字連鎖(あ,と)に該当する文字連鎖情報を読込
む場合には、検索ファイル記憶部11の前方区切りコード
付き文字連鎖情報が格納された領域から、文字種別
「あ」を含む群の中の(あ,と)に該当する情報(1,
1,3,1)を容易に取得することができ、また、後方
区切りコード付き文字連鎖(あ,し)の文字連鎖情報を
読込み場合にも、文字種別「あ」を含む群の中の(あ,
し)に該当する文字連鎖情報を容易に取得することがで
きる。
付き文字連鎖(あ,と)に該当する文字連鎖情報を読込
む場合には、検索ファイル記憶部11の前方区切りコード
付き文字連鎖情報が格納された領域から、文字種別
「あ」を含む群の中の(あ,と)に該当する情報(1,
1,3,1)を容易に取得することができ、また、後方
区切りコード付き文字連鎖(あ,し)の文字連鎖情報を
読込み場合にも、文字種別「あ」を含む群の中の(あ,
し)に該当する文字連鎖情報を容易に取得することがで
きる。
【0081】このように第3実施例の情報検索装置で
は、区切りコードを付加したデータから区切りコードを
含めない状態で文字連鎖パターンを作成し、区切りコー
ドに接続する文字連鎖パターンの文字連鎖情報を、その
区切りコードの接続位置に応じて、前方または後方区切
りコード付き文字連鎖情報として扱っている。また、こ
れらの文字連鎖情報は、文字連鎖パターンの第1文字別
に区分するなどして、群別に検索ファイルに格納してい
る。そのため、検索ファイルにおける文字連鎖情報の総
数が減り、検索時の照合回数を削減することが可能にな
る。また、群別に整理されているため、これらの情報を
検索ファイルから読み出すことが容易になる。また、前
方一致検索、後方一致検索、完全一致検索などの検索種
別に応じて、該当する文字連鎖情報の照合を優先させる
ことができるため、各種検索を高速で行なうことができ
る。
は、区切りコードを付加したデータから区切りコードを
含めない状態で文字連鎖パターンを作成し、区切りコー
ドに接続する文字連鎖パターンの文字連鎖情報を、その
区切りコードの接続位置に応じて、前方または後方区切
りコード付き文字連鎖情報として扱っている。また、こ
れらの文字連鎖情報は、文字連鎖パターンの第1文字別
に区分するなどして、群別に検索ファイルに格納してい
る。そのため、検索ファイルにおける文字連鎖情報の総
数が減り、検索時の照合回数を削減することが可能にな
る。また、群別に整理されているため、これらの情報を
検索ファイルから読み出すことが容易になる。また、前
方一致検索、後方一致検索、完全一致検索などの検索種
別に応じて、該当する文字連鎖情報の照合を優先させる
ことができるため、各種検索を高速で行なうことができ
る。
【0082】(第4実施例)第4実施例では、データの
階層または順序構造を意識した検索を行なう。この動作
は、図1の情報検索装置において、第1実施例で使用し
た各部の他に、各データの末端に階層構造に応じた区切
りコードを付加する階層・順序別区切り付加部5と、入
力されたキーワードに階層を示す区切りコードを付加す
るキーワード階層別区切り付加部15とを使って実行され
る。
階層または順序構造を意識した検索を行なう。この動作
は、図1の情報検索装置において、第1実施例で使用し
た各部の他に、各データの末端に階層構造に応じた区切
りコードを付加する階層・順序別区切り付加部5と、入
力されたキーワードに階層を示す区切りコードを付加す
るキーワード階層別区切り付加部15とを使って実行され
る。
【0083】この場合の検索ファイルの作成は、図16
の処理フローに従って行なわれる。
の処理フローに従って行なわれる。
【0084】ステップ1〜ステップ2:レコードデータ
の処理すべき項目(第k番目)が指定されると、レコー
ド読取部1は、レコードデータ記憶部2からレコードデ
ータを読取り、レコード番号をセットする。
の処理すべき項目(第k番目)が指定されると、レコー
ド読取部1は、レコードデータ記憶部2からレコードデ
ータを読取り、レコード番号をセットする。
【0085】ステップ3:階層・順序別区切り付加部5
は、各データの先頭、間、末尾に階層別・順序別区切り
コードを付加する。
は、各データの先頭、間、末尾に階層別・順序別区切り
コードを付加する。
【0086】図18(1)に、1つの項目内に記録され
た複数のデータの例を示している。この各データにはレ
ベルが付けられており、レベルに応じた区切りコードが
階層・順序別区切り付加部5により付けられる。図18
(2)では、レベル1、2、3に対して区切りコードを
^S、^T、^Uに対応させている。
た複数のデータの例を示している。この各データにはレ
ベルが付けられており、レベルに応じた区切りコードが
階層・順序別区切り付加部5により付けられる。図18
(2)では、レベル1、2、3に対して区切りコードを
^S、^T、^Uに対応させている。
【0087】ステップ4〜ステップ16の手順は、実質的
に第1実施例の手順(図2、ステップ4〜ステップ15)
と同じであり、文字連鎖パターン生成部7が、階層・順
序別の区切りコードが付加された文字列における文字種
別ごとの出現頻度を計算し、この文字列から文字連鎖パ
ターンを作成する。このとき区切りコードだけから成る
文字連鎖パターンは削除される(ステップ8)。検索フ
ァイル生成部10は、各種の区切りコードを含んだ文字連
鎖パターンに対応する文字連鎖情報を作成して検索ファ
イル記憶部11に格納し、検索ファイルを作成する。検索
ファイル記憶部11は、図17に示すデータ構造を有し、
ここに、図18(3)に示すように、文字連鎖情報が格
納される。なお、文字連鎖情報は、(第1文字出現頻
度,第2文字出現頻度,デ―タ番号,レコード番号)で
構成され、文字出現頻度は階層区切りコード用番号の場
合もある。ここでは、階層に応じて区切りコードがレベ
ル付けされ、文字連鎖情報がこのレベルで分類されてい
る。図18(3)は図18(1)に対する検索ファイル
の例である。
に第1実施例の手順(図2、ステップ4〜ステップ15)
と同じであり、文字連鎖パターン生成部7が、階層・順
序別の区切りコードが付加された文字列における文字種
別ごとの出現頻度を計算し、この文字列から文字連鎖パ
ターンを作成する。このとき区切りコードだけから成る
文字連鎖パターンは削除される(ステップ8)。検索フ
ァイル生成部10は、各種の区切りコードを含んだ文字連
鎖パターンに対応する文字連鎖情報を作成して検索ファ
イル記憶部11に格納し、検索ファイルを作成する。検索
ファイル記憶部11は、図17に示すデータ構造を有し、
ここに、図18(3)に示すように、文字連鎖情報が格
納される。なお、文字連鎖情報は、(第1文字出現頻
度,第2文字出現頻度,デ―タ番号,レコード番号)で
構成され、文字出現頻度は階層区切りコード用番号の場
合もある。ここでは、階層に応じて区切りコードがレベ
ル付けされ、文字連鎖情報がこのレベルで分類されてい
る。図18(3)は図18(1)に対する検索ファイル
の例である。
【0088】次に、検索の処理の流れを図19により説
明する。図20には検索時のデータの流れを示してい
る。
明する。図20には検索時のデータの流れを示してい
る。
【0089】ステップ1〜ステップ3:第1実施例と同
様に、キーワード読取部12は、入力キーワードを読込
み、指定項目をセットし、検索種別を指定する。ここで
は、図20(1)に示すように、入力キーワードとして
「?渋谷」が入力され、その階層レベルとして「2」が
指定されたとする。
様に、キーワード読取部12は、入力キーワードを読込
み、指定項目をセットし、検索種別を指定する。ここで
は、図20(1)に示すように、入力キーワードとして
「?渋谷」が入力され、その階層レベルとして「2」が
指定されたとする。
【0090】ステップ4:キーワード階層別区切り付加
部15は、指定された階層に対する区切りコードを選択
し、 ステップ5:キーワード区切り付加部13は、選択された
区切りコードを検索種別に応じてキーワードに付加す
る。この時、区切りを付加されたキーワードは「?渋谷
^T」である(図20(2))。
部15は、指定された階層に対する区切りコードを選択
し、 ステップ5:キーワード区切り付加部13は、選択された
区切りコードを検索種別に応じてキーワードに付加す
る。この時、区切りを付加されたキーワードは「?渋谷
^T」である(図20(2))。
【0091】ステップ6:キーワード文字連鎖生成部17
は、この区切りを付加されたキーワードを文字パターン
に分割し文字連鎖パターンを作成する(図20
(3))。
は、この区切りを付加されたキーワードを文字パターン
に分割し文字連鎖パターンを作成する(図20
(3))。
【0092】以下のステップ7〜ステップ18の動作は、
分割された文字連鎖パターンに対して該当する文字連鎖
情報を取得する処理であり、第1実施例または第3実施
例の処理と同様である。
分割された文字連鎖パターンに対して該当する文字連鎖
情報を取得する処理であり、第1実施例または第3実施
例の処理と同様である。
【0093】なお、図21には、データを階層化する代
わりに、データに順序構造を取り入れた場合の例を示し
ている。図21(1)は、そのデータの例、図21
(2)は検索ファイルを作成した結果を示している。検
索ファイル作成及び検索処理の手順は階層化の場合と同
様である。
わりに、データに順序構造を取り入れた場合の例を示し
ている。図21(1)は、そのデータの例、図21
(2)は検索ファイルを作成した結果を示している。検
索ファイル作成及び検索処理の手順は階層化の場合と同
様である。
【0094】このように第4実施例の情報検索装置で
は、項目に含まれる複数のデータが階層または順序構造
を持つ場合に、それらのデータに階層または順序構造に
応じた区切りコードを付与して検索ファイルを作成し、
検索時には、階層または順序を指定して検索を実行す
る。こうすることにより、検索ファイルに格納された文
字連鎖情報の中から指定された階層または順序の情報を
優先して照合することができ、1項目内の複数のデータ
に階層関係や順序関係を意識した検索ができる。
は、項目に含まれる複数のデータが階層または順序構造
を持つ場合に、それらのデータに階層または順序構造に
応じた区切りコードを付与して検索ファイルを作成し、
検索時には、階層または順序を指定して検索を実行す
る。こうすることにより、検索ファイルに格納された文
字連鎖情報の中から指定された階層または順序の情報を
優先して照合することができ、1項目内の複数のデータ
に階層関係や順序関係を意識した検索ができる。
【0095】
【発明の効果】以上の実施例の説明から明らかなよう
に、本発明の情報検索装置は、レコードデータの構成要
素である1項目に対して、複数のデータを繰り返し登録
することができ、入力されたキーワードを含む文字列や
パターンなどのデータを項目内で繰り返し高速で検索す
ることができる。
に、本発明の情報検索装置は、レコードデータの構成要
素である1項目に対して、複数のデータを繰り返し登録
することができ、入力されたキーワードを含む文字列や
パターンなどのデータを項目内で繰り返し高速で検索す
ることができる。
【0096】また、複数のデータが共通の属性を持つ場
合でも、新たに項目数を増やすことなく、1項目内に複
数データを追加することができるので登録が容易であ
る。また、検索時には、1項目のみを検索指定すればよ
いので、検索の操作が簡素化され、かつ検索処理時間を
短縮することができる。
合でも、新たに項目数を増やすことなく、1項目内に複
数データを追加することができるので登録が容易であ
る。また、検索時には、1項目のみを検索指定すればよ
いので、検索の操作が簡素化され、かつ検索処理時間を
短縮することができる。
【0097】また、1項目内のデータは全て区別されて
登録されているので、検索漏れが発生しない。
登録されているので、検索漏れが発生しない。
【0098】また、1項目に追加されるデータの個数に
関係なく項目内の検索が実現できるので高速に検索がで
きる。
関係なく項目内の検索が実現できるので高速に検索がで
きる。
【0099】また、キーワードを含む文字の照合で、区
切りコードを使用した文字連鎖情報(検索ファイル)を
検索するので、前方一致検索、後方一致検索、完全一致
検索、部分一致検索の各種検索が高速にできる。
切りコードを使用した文字連鎖情報(検索ファイル)を
検索するので、前方一致検索、後方一致検索、完全一致
検索、部分一致検索の各種検索が高速にできる。
【0100】また、区切りコードを含む文字連鎖情報を
優先して検索することが可能なので、特に、完全一致検
索など従来時間が掛かっていた検索処理を高速で実施す
ることができる。
優先して検索することが可能なので、特に、完全一致検
索など従来時間が掛かっていた検索処理を高速で実施す
ることができる。
【0101】また、1項目内の複数のデータに階層関係
や順序関係を区切りコードとして持たせることが可能な
ので、1レコード内または1項目内で階層関係や順序関
係の持つデータを登録することが可能であり、階層構造
や順序関係を意識した検索ができる。
や順序関係を区切りコードとして持たせることが可能な
ので、1レコード内または1項目内で階層関係や順序関
係の持つデータを登録することが可能であり、階層構造
や順序関係を意識した検索ができる。
【図1】本発明の実施例における情報検索装置の構成を
示すブロック図、
示すブロック図、
【図2】第1実施例の情報検索装置における検索ファイ
ル生成の処理フロー、
ル生成の処理フロー、
【図3】第1実施例の情報検索装置におけるレコードデ
ータ記憶部のデータ構造、
ータ記憶部のデータ構造、
【図4】第1実施例の情報検索装置における項目jの文
字連鎖情報を示す図、
字連鎖情報を示す図、
【図5】第1実施例の情報検索装置における検索ファイ
ル記憶部のデータ構造、
ル記憶部のデータ構造、
【図6】第1実施例の情報検索装置における検索ファイ
ル作成までのデータフロー、
ル作成までのデータフロー、
【図7】第1実施例の情報検索装置における検索処理フ
ロー、
ロー、
【図8】第1実施例の情報検索装置における検索のデー
タフロー、
タフロー、
【図9】第2実施例の情報検索装置における検索処理フ
ロー、
ロー、
【図10】第2実施例の情報検索装置における検索のデ
ータフロー、
ータフロー、
【図11】第3実施例の情報検索装置における検索ファ
イル生成の処理フロー、
イル生成の処理フロー、
【図12】第3実施例の情報検索装置における検索ファ
イル記憶部のデータ構造、
イル記憶部のデータ構造、
【図13】第3実施例の情報検索装置における検索ファ
イル作成までのデータフロー、
イル作成までのデータフロー、
【図14】第3実施例の情報検索装置における検索処理
フロー、
フロー、
【図15】第3実施例の情報検索装置における検索時の
データフロー、
データフロー、
【図16】第4実施例の情報検索装置における検索ファ
イル生成の処理フロー、
イル生成の処理フロー、
【図17】第4実施例の情報検索装置における検索ファ
イル記憶部のデータ構造、
イル記憶部のデータ構造、
【図18】第4実施例の情報検索装置における検索ファ
イル作成までのデータフロー、
イル作成までのデータフロー、
【図19】第4実施例の情報検索装置における検索処理
フロー、
フロー、
【図20】第4実施例の情報検索装置における検索時の
データフロー、
データフロー、
【図21】第4実施例の情報検索装置における検索ファ
イル作成までのデータフロー、
イル作成までのデータフロー、
【図22】従来の情報検索装置におけるレコードデータ
の構成、
の構成、
【図23】従来の情報検索装置でのデータ検索手順を示
すフロー図である。
すフロー図である。
1 レコード読取部 2 レコードデータ記憶部 3 区切り付加部 4 群別区切り付加部 5 階層・順序別区切り付加部 6 優先指示部 7 文字連鎖パターン生成部 8 区切り判定部 9 番号付加部 10 検索ファイル生成部 11 検索ファイル記憶部 12 キーワード読取部 13 キーワード区切り付加部 14 キーワード群別区切り付加部 15 キーワード階層・順序別区切り付加部 16 優先照合部 17 キーワード文字連鎖生成部 18 照合部 19 検索結果表示部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 菊池 忠一 大阪府門真市大字門真1006番地 松下電器 産業株式会社内
Claims (8)
- 【請求項1】 複数の項目を持つレコードデータの項目
内におけるデータから、入力されたキーワードを含むデ
ータを検索する情報検索装置において、 前記項目内のデータが複数のデータから成るとき、これ
らのデータを繋げた列の先頭、終端及び前記データの間
に区切りコードを付与する区切り付与手段と、 前記列の隣接する2文字の組から成る文字連鎖を作成す
る文字連鎖パターン生成手段と、 前記文字連鎖を構成する各文字の前記データにおける出
現個数、レコード番号、前記データの番号から成る文字
連鎖情報を作成し、前記文字連鎖と対応させてメモリに
格納して検索ファイルを作成する検索ファイル作成手段
と、 入力されたキーワードに前記区切りコードを付与するキ
ーワード区切り付与手段と、 区切りコードが付与されたキーワードからキーワードの
文字連鎖を作成するキーワード文字連鎖生成手段と、 前記検索ファイルから前記キーワードの文字連鎖に対応
する前記文字連鎖情報を読出し、それらを照合してキー
ワードを含む前記データを検索する照合手段とを設けた
ことを特徴とする情報検索装置。 - 【請求項2】 前記照合手段に対して、前記区切りコー
ドを含むキーワードの文字連鎖に対応する文字連鎖情報
の照合を優先させる優先照合手段を設けたことを特徴と
する請求項1に記載の情報検索装置。 - 【請求項3】 前記文字連鎖パターン生成手段が、前記
区切りコードを前記文字連鎖の中に含めることを特徴と
する請求項1に記載の情報検索装置。 - 【請求項4】 前記検索ファイル作成手段が、前記文字
連鎖情報における前記区切りコードの出現個数として、
特定の番号を設定することを特徴とする請求項3に記載
の情報検索装置。 - 【請求項5】 前記文字連鎖パターン生成手段が、前記
区切りコードを含めずに前記文字連鎖を作成し、前記検
索ファイル作成手段が、前記文字連鎖の内、前記区切り
コードと隣接する文字連鎖の文字連鎖情報をそれ以外の
文字連鎖情報と区別して作成することを特徴とする請求
項1に記載の情報検索装置。 - 【請求項6】 前記検索ファイル作成手段が、前記区切
りコードと隣接する文字連鎖の文字連鎖情報を前記メモ
リに群別に格納することを特徴とする請求項5に記載の
情報検索装置。 - 【請求項7】 前記区切り付与手段が、前記列に階層を
表す複数種類の区切りコードを付与し、前記キーワード
区切り付与手段が、入力されたキーワードに前記階層を
表す区切りコードを付与することを特徴とする請求項1
に記載の情報検索装置。 - 【請求項8】 前記区切り付与手段が、前記列に順序を
表す複数種類の区切りコードを付与し、前記キーワード
区切り付与手段が、入力されたキーワードに前記順序を
表す区切りコードを付与することを特徴とする請求項1
に記載の情報検索装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7146898A JP3046221B2 (ja) | 1995-05-23 | 1995-05-23 | 情報検索装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7146898A JP3046221B2 (ja) | 1995-05-23 | 1995-05-23 | 情報検索装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH08314948A true JPH08314948A (ja) | 1996-11-29 |
| JP3046221B2 JP3046221B2 (ja) | 2000-05-29 |
Family
ID=15418073
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP7146898A Expired - Fee Related JP3046221B2 (ja) | 1995-05-23 | 1995-05-23 | 情報検索装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3046221B2 (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7103536B1 (en) | 1998-11-30 | 2006-09-05 | Matsushita Electric Industrial Co., Ltd. | Symbol dictionary compiling method and symbol dictionary retrieving method |
| JP2009289088A (ja) * | 2008-05-29 | 2009-12-10 | Fujitsu Ltd | 連字シーケンスマップ生成プログラム、情報検索プログラム、連字シーケンスマップ生成装置、情報検索装置、連字シーケンスマップ生成方法、および情報検索方法 |
| JP2013161371A (ja) * | 2012-02-07 | 2013-08-19 | Casio Comput Co Ltd | テキスト検索装置及びプログラム |
-
1995
- 1995-05-23 JP JP7146898A patent/JP3046221B2/ja not_active Expired - Fee Related
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7103536B1 (en) | 1998-11-30 | 2006-09-05 | Matsushita Electric Industrial Co., Ltd. | Symbol dictionary compiling method and symbol dictionary retrieving method |
| JP2009289088A (ja) * | 2008-05-29 | 2009-12-10 | Fujitsu Ltd | 連字シーケンスマップ生成プログラム、情報検索プログラム、連字シーケンスマップ生成装置、情報検索装置、連字シーケンスマップ生成方法、および情報検索方法 |
| JP2013161371A (ja) * | 2012-02-07 | 2013-08-19 | Casio Comput Co Ltd | テキスト検索装置及びプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3046221B2 (ja) | 2000-05-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8082266B2 (en) | Index for data retrieval and data structuring | |
| KR100451978B1 (ko) | 정보 검색 방법과 정보 검색 장치 | |
| US6199061B1 (en) | Method and apparatus for providing dynamic help topic titles to a user | |
| KR20080031262A (ko) | 관계 네트워크 | |
| US7024405B2 (en) | Method and apparatus for improved internet searching | |
| WO2019009995A1 (en) | SYSTEM AND METHOD FOR RESEARCHING MUSIC IN NATURAL LANGUAGE | |
| JP2669601B2 (ja) | 情報検索方法及びシステム | |
| JP2693914B2 (ja) | 検索システム | |
| JPH0782504B2 (ja) | 情報検索処理方式および検索ファイル作成装置 | |
| JPH08314948A (ja) | 情報検索装置 | |
| JP2009516252A (ja) | テキストの表現を取得する方法 | |
| JP2005107931A (ja) | 画像検索装置 | |
| JP2519129B2 (ja) | マルチキ―ワ―ド情報検索処理方式および検索ファイル作成装置 | |
| JP2519130B2 (ja) | マルチキ―ワ―ド情報検索処理方式および検索ファイル作成装置 | |
| JPH0561910A (ja) | 全文インデツクス検索方法 | |
| JP3649472B2 (ja) | 情報検索装置 | |
| JP3036246B2 (ja) | 情報検索装置 | |
| JP2002092034A (ja) | 文字列検索結果表示システムおよびそのプログラム記録媒体 | |
| JPH05313971A (ja) | リレーショナル・データベースにおけるキーワード管理方式 | |
| JP2838972B2 (ja) | 自動索引作成装置 | |
| JPH05158984A (ja) | 文字列抽出装置 | |
| JPH11134347A (ja) | 検索ファイル作成方法および情報検索装置 | |
| JPH08241324A (ja) | 文書検索方法 | |
| JP2001060197A (ja) | リレーショナルデータベースにおける検索方法及びそのプログラムを記録した記録媒体 | |
| JPH06250899A (ja) | 検索装置及び検索方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |