JPH04241672A - 文字列検索方式 - Google Patents
文字列検索方式Info
- Publication number
- JPH04241672A JPH04241672A JP3015999A JP1599991A JPH04241672A JP H04241672 A JPH04241672 A JP H04241672A JP 3015999 A JP3015999 A JP 3015999A JP 1599991 A JP1599991 A JP 1599991A JP H04241672 A JPH04241672 A JP H04241672A
- Authority
- JP
- Japan
- Prior art keywords
- data
- character
- search
- distribution data
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 15
- 238000004458 analytical method Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【0001】
【産業上の利用分野】本発明は文字列検索方式に関し、
特にコンピュータシステムにおける文字列検索方式に関
する。
特にコンピュータシステムにおける文字列検索方式に関
する。
【0002】
【従来の技術】従来、この種の文字列検索方式では、フ
ァイルに格納されている被検索データからある検索文字
列に合致する文字列を含むデータを検索するための方式
として、被検索データの先頭から検索文字列の先頭1文
字を順次比較し、被検索文字列の先頭1文字と一致する
文字があれば、それに続く文字列が検索文字列と合致す
るか否かを比較していた。
ァイルに格納されている被検索データからある検索文字
列に合致する文字列を含むデータを検索するための方式
として、被検索データの先頭から検索文字列の先頭1文
字を順次比較し、被検索文字列の先頭1文字と一致する
文字があれば、それに続く文字列が検索文字列と合致す
るか否かを比較していた。
【0003】
【発明が解決しようとする課題】上述した従来の文字列
検索方式では、文字列検索プログラムの実行時間が実行
命令数と実行のときに参照する文字数とに比例するので
、検索文字列の先頭1文字が被検索データに多数ありか
つ検索文字列に合致する文字列が少ない場合には不必要
な命令の実行および文字の参照を頻繁に行うことになり
、このために文字列検索プログラムの実行時間が長くな
るという欠点がある。
検索方式では、文字列検索プログラムの実行時間が実行
命令数と実行のときに参照する文字数とに比例するので
、検索文字列の先頭1文字が被検索データに多数ありか
つ検索文字列に合致する文字列が少ない場合には不必要
な命令の実行および文字の参照を頻繁に行うことになり
、このために文字列検索プログラムの実行時間が長くな
るという欠点がある。
【0004】本発明の目的は、上述の点に鑑み、使用文
字分布データを参照して文字列検索プログラムの実行時
間を短縮できるようにした文字列検索方式を提供するこ
とにある。
字分布データを参照して文字列検索プログラムの実行時
間を短縮できるようにした文字列検索方式を提供するこ
とにある。
【0005】
【課題を解決するための手段】本発明の文字列検索方式
は、被検索データを入力し検索文字列に合致した文字列
を含むデータを検索する文字列検索方式において、あら
かじめ用意されている使用文字分布データ群の中から前
記被検索データに適切な使用文字分布データを選択する
使用文字分布データ選出手段と、この使用文字分布デー
タ選出手段により前記使用文字分布データ群の中に前記
被検索データに適切な使用文字分布データがないとされ
たときに前記被検索データを入力して使用文字の分布を
解析し新使用文字分布データを作成する使用文字分布解
析手段と、前記使用文字分布データ選出手段により選択
された使用文字分布データあるいは前記使用文字分布解
析手段により作成された新使用文字分布データに基づい
て前記被検索データ内にある検索文字列と合致する文字
列を含むデータの検索を行う文字列検索手段とを有する
。
は、被検索データを入力し検索文字列に合致した文字列
を含むデータを検索する文字列検索方式において、あら
かじめ用意されている使用文字分布データ群の中から前
記被検索データに適切な使用文字分布データを選択する
使用文字分布データ選出手段と、この使用文字分布デー
タ選出手段により前記使用文字分布データ群の中に前記
被検索データに適切な使用文字分布データがないとされ
たときに前記被検索データを入力して使用文字の分布を
解析し新使用文字分布データを作成する使用文字分布解
析手段と、前記使用文字分布データ選出手段により選択
された使用文字分布データあるいは前記使用文字分布解
析手段により作成された新使用文字分布データに基づい
て前記被検索データ内にある検索文字列と合致する文字
列を含むデータの検索を行う文字列検索手段とを有する
。
【0006】
【作用】本発明の文字列検索方式では、使用文字分布デ
ータ選出手段があらかじめ用意されている使用文字分布
データ群の中から被検索データに適切な使用文字分布デ
ータを選択し、使用文字分布解析手段が使用文字分布デ
ータ選出手段により使用文字分布データ群の中に被検索
データに適切な使用文字分布データがないとされたとき
に被検索データを入力して使用文字の分布を解析し新使
用文字分布データを作成し、文字列検索手段が使用文字
分布データ選出手段により選択された使用文字分布デー
タあるいは使用文字分布解析手段により作成された新使
用文字分布データに基づいて被検索データ内にある検索
文字列と合致する文字列を含むデータの検索を行う。
ータ選出手段があらかじめ用意されている使用文字分布
データ群の中から被検索データに適切な使用文字分布デ
ータを選択し、使用文字分布解析手段が使用文字分布デ
ータ選出手段により使用文字分布データ群の中に被検索
データに適切な使用文字分布データがないとされたとき
に被検索データを入力して使用文字の分布を解析し新使
用文字分布データを作成し、文字列検索手段が使用文字
分布データ選出手段により選択された使用文字分布デー
タあるいは使用文字分布解析手段により作成された新使
用文字分布データに基づいて被検索データ内にある検索
文字列と合致する文字列を含むデータの検索を行う。
【0007】
【実施例】次に、本発明について図面を参照して詳細に
説明する。
説明する。
【0008】図1は、本発明の一実施例に係る文字列検
索方式の構成を示すブロック図である。本実施例の文字
列検索方式は、使用文字分布データ選出手段1と、使用
文字分布解析手段2と、文字列検索手段3と、被検索デ
ータ100と、複数の使用文字分布データ201からな
る使用文字分布データ群200と、新使用文字分布デー
タ300と、検索文字列400と、検索されたデータ5
00とから、その主要部が構成されている。
索方式の構成を示すブロック図である。本実施例の文字
列検索方式は、使用文字分布データ選出手段1と、使用
文字分布解析手段2と、文字列検索手段3と、被検索デ
ータ100と、複数の使用文字分布データ201からな
る使用文字分布データ群200と、新使用文字分布デー
タ300と、検索文字列400と、検索されたデータ5
00とから、その主要部が構成されている。
【0009】文字列検索手段3は、使用文字分布データ
群200の使用文字分布データ201または新使用文字
分布データ300に基づいて最初に検索すべき1文字を
決定する1文字決定手段30と、1文字決定手段30に
より決定された1文字で被検索データ100を検索する
1文字検索手段31と、1文字検索手段31により検索
された1文字を含むデータと検索文字列400とを比較
してデータに検索文字列400に合致する文字列が含ま
れている場合に検索されたデータ500を出力するデー
タ比較手段32とを含んで構成されている。
群200の使用文字分布データ201または新使用文字
分布データ300に基づいて最初に検索すべき1文字を
決定する1文字決定手段30と、1文字決定手段30に
より決定された1文字で被検索データ100を検索する
1文字検索手段31と、1文字検索手段31により検索
された1文字を含むデータと検索文字列400とを比較
してデータに検索文字列400に合致する文字列が含ま
れている場合に検索されたデータ500を出力するデー
タ比較手段32とを含んで構成されている。
【0010】次に、このように構成された本実施例の文
字列検索方式の動作について説明する。
字列検索方式の動作について説明する。
【0011】まず、使用文字分布データ選出手段1は、
ファイルに格納された被検索データ100を参照してそ
の種類を検査し、対応する種類の使用文字分布データ2
01を見つける。
ファイルに格納された被検索データ100を参照してそ
の種類を検査し、対応する種類の使用文字分布データ2
01を見つける。
【0012】ここで該当する使用文字分布データ201
が見つからなければ、使用文字分布データ選出手段1は
、使用文字分布解析手段2により被検索データ100を
読み込み、これを解析して新使用文字分布データ300
を出力させる。
が見つからなければ、使用文字分布データ選出手段1は
、使用文字分布解析手段2により被検索データ100を
読み込み、これを解析して新使用文字分布データ300
を出力させる。
【0013】使用文字分布データ201または新使用文
字分布データ300には、被検索データ100における
各文字の出現頻度が記録されている。例えば、本実施例
では、文字Aが1%、文字Bが3%、文字Cが5%、…
と記録されているものとする。
字分布データ300には、被検索データ100における
各文字の出現頻度が記録されている。例えば、本実施例
では、文字Aが1%、文字Bが3%、文字Cが5%、…
と記録されているものとする。
【0014】次に、文字列検索手段3の1文字決定手段
30は、使用文字分布データ群200より選ばれた使用
文字分布データ201または新使用文字分布データ30
0に基づいて最も使用頻度の低い1文字を決定する。本
実施例では、例えば検索文字列400が「ABC」のと
きに使用頻度が前記のようであれば、最初の検索文字と
して「A」が決定される。なお、検索文字列400を検
索する際、検索文字列400の1文字でも使用文字分布
データ201または新使用文字分布データ300の中に
ない文字があれば、被検索データ100を検索すること
なしに検索文字列400に合致する文字列を含むデータ
が被検索データ100に存在しないことになる。
30は、使用文字分布データ群200より選ばれた使用
文字分布データ201または新使用文字分布データ30
0に基づいて最も使用頻度の低い1文字を決定する。本
実施例では、例えば検索文字列400が「ABC」のと
きに使用頻度が前記のようであれば、最初の検索文字と
して「A」が決定される。なお、検索文字列400を検
索する際、検索文字列400の1文字でも使用文字分布
データ201または新使用文字分布データ300の中に
ない文字があれば、被検索データ100を検索すること
なしに検索文字列400に合致する文字列を含むデータ
が被検索データ100に存在しないことになる。
【0015】次に、1文字検索手段31は、被検索デー
タ100を読み込み、1文字決定手段30により決定さ
れた最初に検索すべき1文字で検索を行い、検索対象デ
ータを選択する。
タ100を読み込み、1文字決定手段30により決定さ
れた最初に検索すべき1文字で検索を行い、検索対象デ
ータを選択する。
【0016】続いて、データ比較手段32は、1文字検
索手段31により選択された検索対象データと検索文字
列400とを比較し、検索文字列400と合致する文字
列を含む検索対象データを検索されたデータ500とし
てファイルに出力する。
索手段31により選択された検索対象データと検索文字
列400とを比較し、検索文字列400と合致する文字
列を含む検索対象データを検索されたデータ500とし
てファイルに出力する。
【0017】1文字検索手段31およびデータ比較手段
32は、被検索データ100のデータがなくなるまで上
記の処理を繰り返す。
32は、被検索データ100のデータがなくなるまで上
記の処理を繰り返す。
【0018】
【発明の効果】以上説明したように本発明は、使用文字
分布データ選出手段,使用文字分布解析手段および文字
列検索手段を設け、被検索データの使用文字分布データ
を参照して検索文字列に合致する文字列を含むデータの
検索を高速化することにより、文字列検索プログラムの
実行時間を短縮できるという効果がある。
分布データ選出手段,使用文字分布解析手段および文字
列検索手段を設け、被検索データの使用文字分布データ
を参照して検索文字列に合致する文字列を含むデータの
検索を高速化することにより、文字列検索プログラムの
実行時間を短縮できるという効果がある。
【0019】また、使用文字分布データ群をあらかじめ
設けることにより、使用文字分布データを作成する時間
も短縮することができるという効果がある。この効果は
、特に被検索データを複数の検索文字列で検索するよう
な場合に、いちいち使用文字分布データを作成しなくて
もすむので、きわめて有効である。
設けることにより、使用文字分布データを作成する時間
も短縮することができるという効果がある。この効果は
、特に被検索データを複数の検索文字列で検索するよう
な場合に、いちいち使用文字分布データを作成しなくて
もすむので、きわめて有効である。
【図1】本発明の一実施例に係る文字列検索方式の構成
を示すブロック図である。
を示すブロック図である。
【符号の説明】
1 使用文字分布データ選出手段
2 使用文字分布解析手段
3 文字列検索手段
30 1文字決定手段
31 1文字検索手段
32 データ比較手段
100 被検索データ
200 使用文字分布データ群
201 使用文字分布データ
300 新使用文字分布データ
400 検索文字列
500 検索されたデータ
Claims (1)
- 【請求項1】 被検索データを入力し検索文字列に合
致した文字列を含むデータを検索する文字列検索方式に
おいて、あらかじめ用意されている使用文字分布データ
群の中から前記被検索データに適切な使用文字分布デー
タを選択する使用文字分布データ選出手段と、この使用
文字分布データ選出手段により前記使用文字分布データ
群の中に前記被検索データに適切な使用文字分布データ
がないとされたときに前記被検索データを入力して使用
文字の分布を解析し新使用文字分布データを作成する使
用文字分布解析手段と、前記使用文字分布データ選出手
段により選択された使用文字分布データあるいは前記使
用文字分布解析手段により作成された新使用文字分布デ
ータに基づいて前記被検索データ内にある検索文字列と
合致する文字列を含むデータの検索を行う文字列検索手
段とを有することを特徴とする文字列検索方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3015999A JPH04241672A (ja) | 1991-01-14 | 1991-01-14 | 文字列検索方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3015999A JPH04241672A (ja) | 1991-01-14 | 1991-01-14 | 文字列検索方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH04241672A true JPH04241672A (ja) | 1992-08-28 |
Family
ID=11904336
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3015999A Pending JPH04241672A (ja) | 1991-01-14 | 1991-01-14 | 文字列検索方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH04241672A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06168270A (ja) * | 1992-01-27 | 1994-06-14 | Fujitsu Ltd | インデックスを用いた文字列検索システム及びそのインデックスの作成装置 |
-
1991
- 1991-01-14 JP JP3015999A patent/JPH04241672A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06168270A (ja) * | 1992-01-27 | 1994-06-14 | Fujitsu Ltd | インデックスを用いた文字列検索システム及びそのインデックスの作成装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20060004528A1 (en) | Apparatus and method for extracting similar source code | |
| JP4160548B2 (ja) | 文書要約作成システム、方法、及びプログラム | |
| US20030126138A1 (en) | Computer-implemented column mapping system and method | |
| JPS62241026A (ja) | 文字列検索方式 | |
| US7624124B2 (en) | System and method for assisting generation of business specification | |
| JPH04241672A (ja) | 文字列検索方式 | |
| JP2013125429A (ja) | 分析対象決定装置 | |
| JPH07104869B2 (ja) | データ検索加工システム | |
| JPH0750486B2 (ja) | キ−ワ−ド抽出装置 | |
| JPH0423167A (ja) | コマンド検索方式 | |
| JPH02219176A (ja) | 文字列検索方式 | |
| JP2001325292A (ja) | 複合語の類似度判定システム、類似度判定方法及び記録媒体 | |
| JPH05216938A (ja) | 仮想ファイルの検索方式 | |
| JPH04337867A (ja) | データベース検索システム | |
| JPH07281879A (ja) | アプリケーションプログラム編集装置 | |
| JPH0589172A (ja) | 検索装置 | |
| JP2724235B2 (ja) | 変数名称推論装置 | |
| JPH10320403A (ja) | 検索式作成方法、検索式作成装置、及び記録媒体 | |
| JPS63238622A (ja) | 関連検索方式 | |
| JPH0452967A (ja) | 集合ファイルに対する論理積演算処理方式 | |
| JPH0553782A (ja) | 特定部分の動的特性解析情報取得方式 | |
| JPH0338745A (ja) | データ一括処理方式 | |
| JPH11203289A (ja) | 関連検索式検索装置及び関連検索式検索プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
| JPH06119263A (ja) | 処理関数呼出方式 | |
| JPH1091493A (ja) | データベースの構築方法 |