JPH04241672A - 文字列検索方式 - Google Patents

文字列検索方式

Info

Publication number
JPH04241672A
JPH04241672A JP3015999A JP1599991A JPH04241672A JP H04241672 A JPH04241672 A JP H04241672A JP 3015999 A JP3015999 A JP 3015999A JP 1599991 A JP1599991 A JP 1599991A JP H04241672 A JPH04241672 A JP H04241672A
Authority
JP
Japan
Prior art keywords
data
character
search
distribution data
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3015999A
Other languages
English (en)
Inventor
Masaji Munakata
宗像 仁二
Takanori Matsubara
松原 隆徳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
NEC Solution Innovators Ltd
Original Assignee
NEC Corp
NEC Solution Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, NEC Solution Innovators Ltd filed Critical NEC Corp
Priority to JP3015999A priority Critical patent/JPH04241672A/ja
Publication of JPH04241672A publication Critical patent/JPH04241672A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字列検索方式に関し、
特にコンピュータシステムにおける文字列検索方式に関
する。
【0002】
【従来の技術】従来、この種の文字列検索方式では、フ
ァイルに格納されている被検索データからある検索文字
列に合致する文字列を含むデータを検索するための方式
として、被検索データの先頭から検索文字列の先頭1文
字を順次比較し、被検索文字列の先頭1文字と一致する
文字があれば、それに続く文字列が検索文字列と合致す
るか否かを比較していた。
【0003】
【発明が解決しようとする課題】上述した従来の文字列
検索方式では、文字列検索プログラムの実行時間が実行
命令数と実行のときに参照する文字数とに比例するので
、検索文字列の先頭1文字が被検索データに多数ありか
つ検索文字列に合致する文字列が少ない場合には不必要
な命令の実行および文字の参照を頻繁に行うことになり
、このために文字列検索プログラムの実行時間が長くな
るという欠点がある。
【0004】本発明の目的は、上述の点に鑑み、使用文
字分布データを参照して文字列検索プログラムの実行時
間を短縮できるようにした文字列検索方式を提供するこ
とにある。
【0005】
【課題を解決するための手段】本発明の文字列検索方式
は、被検索データを入力し検索文字列に合致した文字列
を含むデータを検索する文字列検索方式において、あら
かじめ用意されている使用文字分布データ群の中から前
記被検索データに適切な使用文字分布データを選択する
使用文字分布データ選出手段と、この使用文字分布デー
タ選出手段により前記使用文字分布データ群の中に前記
被検索データに適切な使用文字分布データがないとされ
たときに前記被検索データを入力して使用文字の分布を
解析し新使用文字分布データを作成する使用文字分布解
析手段と、前記使用文字分布データ選出手段により選択
された使用文字分布データあるいは前記使用文字分布解
析手段により作成された新使用文字分布データに基づい
て前記被検索データ内にある検索文字列と合致する文字
列を含むデータの検索を行う文字列検索手段とを有する
【0006】
【作用】本発明の文字列検索方式では、使用文字分布デ
ータ選出手段があらかじめ用意されている使用文字分布
データ群の中から被検索データに適切な使用文字分布デ
ータを選択し、使用文字分布解析手段が使用文字分布デ
ータ選出手段により使用文字分布データ群の中に被検索
データに適切な使用文字分布データがないとされたとき
に被検索データを入力して使用文字の分布を解析し新使
用文字分布データを作成し、文字列検索手段が使用文字
分布データ選出手段により選択された使用文字分布デー
タあるいは使用文字分布解析手段により作成された新使
用文字分布データに基づいて被検索データ内にある検索
文字列と合致する文字列を含むデータの検索を行う。
【0007】
【実施例】次に、本発明について図面を参照して詳細に
説明する。
【0008】図1は、本発明の一実施例に係る文字列検
索方式の構成を示すブロック図である。本実施例の文字
列検索方式は、使用文字分布データ選出手段1と、使用
文字分布解析手段2と、文字列検索手段3と、被検索デ
ータ100と、複数の使用文字分布データ201からな
る使用文字分布データ群200と、新使用文字分布デー
タ300と、検索文字列400と、検索されたデータ5
00とから、その主要部が構成されている。
【0009】文字列検索手段3は、使用文字分布データ
群200の使用文字分布データ201または新使用文字
分布データ300に基づいて最初に検索すべき1文字を
決定する1文字決定手段30と、1文字決定手段30に
より決定された1文字で被検索データ100を検索する
1文字検索手段31と、1文字検索手段31により検索
された1文字を含むデータと検索文字列400とを比較
してデータに検索文字列400に合致する文字列が含ま
れている場合に検索されたデータ500を出力するデー
タ比較手段32とを含んで構成されている。
【0010】次に、このように構成された本実施例の文
字列検索方式の動作について説明する。
【0011】まず、使用文字分布データ選出手段1は、
ファイルに格納された被検索データ100を参照してそ
の種類を検査し、対応する種類の使用文字分布データ2
01を見つける。
【0012】ここで該当する使用文字分布データ201
が見つからなければ、使用文字分布データ選出手段1は
、使用文字分布解析手段2により被検索データ100を
読み込み、これを解析して新使用文字分布データ300
を出力させる。
【0013】使用文字分布データ201または新使用文
字分布データ300には、被検索データ100における
各文字の出現頻度が記録されている。例えば、本実施例
では、文字Aが1%、文字Bが3%、文字Cが5%、…
と記録されているものとする。
【0014】次に、文字列検索手段3の1文字決定手段
30は、使用文字分布データ群200より選ばれた使用
文字分布データ201または新使用文字分布データ30
0に基づいて最も使用頻度の低い1文字を決定する。本
実施例では、例えば検索文字列400が「ABC」のと
きに使用頻度が前記のようであれば、最初の検索文字と
して「A」が決定される。なお、検索文字列400を検
索する際、検索文字列400の1文字でも使用文字分布
データ201または新使用文字分布データ300の中に
ない文字があれば、被検索データ100を検索すること
なしに検索文字列400に合致する文字列を含むデータ
が被検索データ100に存在しないことになる。
【0015】次に、1文字検索手段31は、被検索デー
タ100を読み込み、1文字決定手段30により決定さ
れた最初に検索すべき1文字で検索を行い、検索対象デ
ータを選択する。
【0016】続いて、データ比較手段32は、1文字検
索手段31により選択された検索対象データと検索文字
列400とを比較し、検索文字列400と合致する文字
列を含む検索対象データを検索されたデータ500とし
てファイルに出力する。
【0017】1文字検索手段31およびデータ比較手段
32は、被検索データ100のデータがなくなるまで上
記の処理を繰り返す。
【0018】
【発明の効果】以上説明したように本発明は、使用文字
分布データ選出手段,使用文字分布解析手段および文字
列検索手段を設け、被検索データの使用文字分布データ
を参照して検索文字列に合致する文字列を含むデータの
検索を高速化することにより、文字列検索プログラムの
実行時間を短縮できるという効果がある。
【0019】また、使用文字分布データ群をあらかじめ
設けることにより、使用文字分布データを作成する時間
も短縮することができるという効果がある。この効果は
、特に被検索データを複数の検索文字列で検索するよう
な場合に、いちいち使用文字分布データを作成しなくて
もすむので、きわめて有効である。
【図面の簡単な説明】
【図1】本発明の一実施例に係る文字列検索方式の構成
を示すブロック図である。
【符号の説明】 1  使用文字分布データ選出手段 2  使用文字分布解析手段 3  文字列検索手段 30  1文字決定手段 31  1文字検索手段 32  データ比較手段 100  被検索データ 200  使用文字分布データ群 201  使用文字分布データ 300  新使用文字分布データ 400  検索文字列 500  検索されたデータ

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】  被検索データを入力し検索文字列に合
    致した文字列を含むデータを検索する文字列検索方式に
    おいて、あらかじめ用意されている使用文字分布データ
    群の中から前記被検索データに適切な使用文字分布デー
    タを選択する使用文字分布データ選出手段と、この使用
    文字分布データ選出手段により前記使用文字分布データ
    群の中に前記被検索データに適切な使用文字分布データ
    がないとされたときに前記被検索データを入力して使用
    文字の分布を解析し新使用文字分布データを作成する使
    用文字分布解析手段と、前記使用文字分布データ選出手
    段により選択された使用文字分布データあるいは前記使
    用文字分布解析手段により作成された新使用文字分布デ
    ータに基づいて前記被検索データ内にある検索文字列と
    合致する文字列を含むデータの検索を行う文字列検索手
    段とを有することを特徴とする文字列検索方式。
JP3015999A 1991-01-14 1991-01-14 文字列検索方式 Pending JPH04241672A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3015999A JPH04241672A (ja) 1991-01-14 1991-01-14 文字列検索方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3015999A JPH04241672A (ja) 1991-01-14 1991-01-14 文字列検索方式

Publications (1)

Publication Number Publication Date
JPH04241672A true JPH04241672A (ja) 1992-08-28

Family

ID=11904336

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3015999A Pending JPH04241672A (ja) 1991-01-14 1991-01-14 文字列検索方式

Country Status (1)

Country Link
JP (1) JPH04241672A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06168270A (ja) * 1992-01-27 1994-06-14 Fujitsu Ltd インデックスを用いた文字列検索システム及びそのインデックスの作成装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06168270A (ja) * 1992-01-27 1994-06-14 Fujitsu Ltd インデックスを用いた文字列検索システム及びそのインデックスの作成装置

Similar Documents

Publication Publication Date Title
US20060004528A1 (en) Apparatus and method for extracting similar source code
JP4160548B2 (ja) 文書要約作成システム、方法、及びプログラム
US20030126138A1 (en) Computer-implemented column mapping system and method
JPS62241026A (ja) 文字列検索方式
US7624124B2 (en) System and method for assisting generation of business specification
JPH04241672A (ja) 文字列検索方式
JP2013125429A (ja) 分析対象決定装置
JPH07104869B2 (ja) データ検索加工システム
JPH0750486B2 (ja) キ−ワ−ド抽出装置
JPH0423167A (ja) コマンド検索方式
JPH02219176A (ja) 文字列検索方式
JP2001325292A (ja) 複合語の類似度判定システム、類似度判定方法及び記録媒体
JPH05216938A (ja) 仮想ファイルの検索方式
JPH04337867A (ja) データベース検索システム
JPH07281879A (ja) アプリケーションプログラム編集装置
JPH0589172A (ja) 検索装置
JP2724235B2 (ja) 変数名称推論装置
JPH10320403A (ja) 検索式作成方法、検索式作成装置、及び記録媒体
JPS63238622A (ja) 関連検索方式
JPH0452967A (ja) 集合ファイルに対する論理積演算処理方式
JPH0553782A (ja) 特定部分の動的特性解析情報取得方式
JPH0338745A (ja) データ一括処理方式
JPH11203289A (ja) 関連検索式検索装置及び関連検索式検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH06119263A (ja) 処理関数呼出方式
JPH1091493A (ja) データベースの構築方法