JPH0782504B2 - 情報検索処理方式および検索ファイル作成装置 - Google Patents
情報検索処理方式および検索ファイル作成装置Info
- Publication number
- JPH0782504B2 JPH0782504B2 JP2338546A JP33854690A JPH0782504B2 JP H0782504 B2 JPH0782504 B2 JP H0782504B2 JP 2338546 A JP2338546 A JP 2338546A JP 33854690 A JP33854690 A JP 33854690A JP H0782504 B2 JPH0782504 B2 JP H0782504B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- character
- position information
- unit
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000003672 processing method Methods 0.000 title claims description 8
- 238000000034 method Methods 0.000 claims description 27
- 239000000470 constituent Substances 0.000 claims description 9
- 230000001174 ascending effect Effects 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 20
- 238000004891 communication Methods 0.000 description 11
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、特に全文検索を行うことに適し、入力された
検索入力と全文との照合回数を大幅に削減して高速に情
報検索を行うことができる情報検索処理方式に関する。
本発明はデータベースシステムにおいて全文検索処理を
行う情報検索処理方式に適する。
の一致照合を行うことにより情報検索を行う情報検索処
理方式において、 検索対象となる文字列を文字ごとに、その文字の属する
検索単位の識別符号、検索単位中での文字位置を示す文
字位置順序符号、検索単位の論理的区分を示す属性符号
とから構成される文字位置情報を生成して文字種ごとに
グループ化した検索ファイルを生成しておき、検索入力
があったときこの検索入力を構成する文字の文字位置情
報を検索ファイルから取り出して照合し、検索単位識別
符号が共通で、検索入力と文字順序が等しくかつ属性符
号が同じ文字列を検索ファイル中から取り出すことによ
り、 全文検索を高速に行うことができるようにするものであ
る。
の文字列照合を行い、検索者が指定する入力文字列と検
索条件に合致する文書を選出する逐次検索方式や全文か
らあらかじめキーワードを抽出して検索ファイルを作成
するインデックス方式が全文検索技術として一般的であ
る。また全文に出現する文字や文字列を表形式にして、
検索入力文字列から分解して作成する文字や文字列の出
現文書を絞り込むプリサーチ方式がある。
文字列との照合を行うため、多量の文字列を有する文書
を検索する場合、多くの時間を要する。このため、多量
文書の検索では、高速な文字列照合を行う専用のプロセ
ッサやLSIが提案されているが、これらの方式では、ハ
ードウエアが限定されるほか、検索処理を行う計算機と
専用プロセッサやLSIとの間での文字列転送に時間がか
かり、システムとして満足できる高速性の実現が課題と
なっている。
列処理機構や文字列照合に専用のハードウエアが必要で
あるほか、登録時に抽出する文字列の精度向上が課題と
なっている。
じ文字列が出現する頻度が低い特徴がある点に着目し、
検索対象文字列を文字種ごとに分類してグループ化した
検索ファイルを作成し、検索時には、検索ファイル中か
ら文字列の連続性を照合することにより検索を高速化す
ることができることを見出した。
索の高速化をソフトウエアだけで実現でき、しかも特定
のハードウエアに限定されず、検索処理を主記憶上で行
うことにより専用プロセッサやLSIとの文字列の転送が
不要であり、文字と文字位置に着目することにより任意
の文字列検索が可能である汎用性に富む情報検索処理方
式を提供することを目的とする。
索を行う単位である複数の検索単位によって構成される
一連の文字列であって、この検索単位にはその論理区分
にしたがった属性が定められている一連の文字列を検索
対象として所定の検索入力文字列に合致する文字列を抽
出する情報検索方式の検索ファイル作成装置において、 上記検索単位が現れるごとに検索単位ごとの昇順の符号
を付与する検索単位識別符号付与手段と、上記検索単位
にその属性にしたがって定められている属性符号を付与
する属性符号付与手段と、検索対象となる文字列を各文
字ごとに検索単位中での位置を示す文字位置順序符号を
付与する文字位置順序符号付与手段と、上記検索単位識
別符号と文字位置順序符号と属性符号とからなる文字位
置情報を作成して、この文字位置情報を文字種ごとの領
域に格納して検索ファイルを作成する手段とを備えたこ
とを特徴とする。
+属性符号 n:最大検索単位文字数 a:最大属性数 なる数字として与えられることが好ましい。
索ファイルを備え、検索入力文字列の構成文字と同じ文
字の文字位置情報を上記検索ファイルから取り出す手段
と、この取り出した各文字の文字位置情報間で、検索単
位識別符号が共通で文字位置順序符号が検索入力の文字
列と等しい順序であり、かつその属性符号が検索入力と
等しい文字位置情報を抽出する手段と、この抽出された
文字位置情報に基づいて検索入力と等しい文字列が属す
る検索単位および文字位置を検索結果として出力する手
段とを備えたことを特徴とする。
は、検索入力文字の出現頻度の小さい文字から順に行う
ことが好ましい。
どに比べると小さい。特に漢字については同一の漢字が
繰り返し現れる頻度は小さい。例えば広辞苑の見出し語
の説明文書は約900万字あるが、その中でJIS第1水準の
漢字の出現頻度を調べると平均出現頻度は1155回であ
る。このため、JIS第1水準2965種の漢字については、
検索入力がn文字の場合、全文から抽出する照合対象は
平均すればn×1155文字となる。一般的に検索入力は数
十文字以下であるため、出現頻度の高い文字列であって
も、全部の文字を逐次照合するものに比べるとその照合
回数は極めて少なくなる。
字列が発生する頻度は極めて小さい。例えば、「通信」
という2つの文字列を使用する用語は多々あるとしても
「通信・・」という4文字からなる文字列は「通信回
線」、「通信装置」のように4文字で同一の文字が発生
する頻度は非常に小さくなる。このため、検索入力文字
列の構成文字で全文との照合を進めていくと、それまで
に得られた検索対象候補の文字列の中から、検索入力文
字列と異なる文字列が削除され、照合する構成文字ごと
に検索対象が絞り込まれていく。特に、検索入力の中の
全文出現頻度の小さい文字から順に照合を行うと一層絞
り込まれて照合一致を取る回数を低減できる。
各文字が文字列中のどの位置にあるかを示す文字位置情
報を文字種ごとにグループ化した検索ファイルを作成
し、この検索ファイルに対して検索入力文字列との照合
一致を行うことにより文字列検索における照合一致処理
回数を大幅に低減することができる。
象文字列が例えば書籍や論文の場合、目次、序文、章ま
たは節等のタイトル、本文、図または表等のタイトル、
参考文献という順序で構成されており、それぞれの構成
部分が論理的に区分されているため、検索単位として構
成できる。そこで書籍または論文を論理的に検索単位に
分け、それぞれの検索単位ごとに出現順序に従って昇順
に識別符号を付与する。このとき本文については複数の
検索単位に分割し、それぞれ他の検索単位とともに一連
の識別符号を付与することもできる。また、この検索単
位について、目次、序文、タイトル、本文のようにその
検索単位の論理的な種別が区分されるので、その論理的
な種別を属性として、その属性を示す属性符号を付与す
る。
に検索単位識別符号と各文字が検索単位中のどの位置に
あるかを示す文字位置順序符号と検索単位の属性符号と
からなる文字位置情報を生成し、文字種ごとに構成され
た領域に格納し、検索対象文字列を構成する文字種別で
グループ化した検索ファイルを作成する。
納された形のファイル構造となり、周知の記憶媒体に記
憶される。
分け、検索ファイル中から検索入力を構成する文字と同
じ文字の文字位置情報を取り出して、検索単位識別符号
が共通しており検索入力文字列と文字順序が等しくかつ
属性符号が同じ文字位置情報を照合して取り出す。
連続性の一致と属性の一致とをみるもので、検索ファイ
ル中の文字位置情報から検索単位識別符号が共通してい
て検索入力の文字位置順序と同一で属性符号が同じ文字
列を取り出すことにより行う。
ファイルにある検索入力と同じ構成文字の文字位置情報
だけの照合一致を行えばよいので、照合回数は逐次照合
に比べるときわめて低減することができる。また、日本
語文書では、同じ文字列の出現頻度が小さく、文字照合
の都度、検索対象が絞り込まれるので、照合回数は低減
していく。
合するとき、検索入力の中の全文出現頻度の小さい文字
から順に行うと検索対象が一層絞り込まれ、照合一致を
とる回数がさらに低減できる。
単位識別符号から抽出すべき検索単位を抽出して、検索
者に検索結果として出力する。
成を示すものである。
判断処理を行うCPU1と、検索処理、検索ファイル作成等
のプログラム、作成されたあるいは検索処理を行うため
の検索ファイル、検索入力等を記憶するメモリ2、キー
ボード4、ディスプレイ5を接続する入出力部3、各種
情報が記憶される外部記憶装置7を接続する外部記憶装
置制御部6、CPU1、メモリ2、入出力部3、外部記憶装
置制御部6を接続する共通バス8とを備える。
検索対象となる文字列について文字種ごとにグループ化
された検索ファイルを作成する検索ファイル作成処理
と、検索ファイルとの照合一致を行って検索入力に合致
する文字列を抽出する検索処理との二つに分けられる。
索ファイル領域確保、各構成文字への文字位置情報の
付与、文字種別ごとにグループ化した文字位置情報の
ファイルへの格納の3つに分けることができる。この各
処理についてそれぞれ説明する。
ド表に記載されている文字種別に出現頻度を計数する。
これにより、検索ファイルを構成する各文字種グループ
に登録される文字位置情報の数がわかるので、全文字種
グループで構成される検索ファイルの領域を確保でき
る。また同時に、各文字種グループに登録される文字位
置情報から、検索ファイル内に連続して格納される文字
種グループの先頭番地もわかる。この文字種グループの
先頭番地をJISコード表の記載順に配列したのが第2図
に示す文字欄アドレス表である。
が属する検索単位の現れる順番を示す検索単位番号と、
検索単位におけるその文字の出現する位置を示す文字位
置番号と、検索単位の論理的な種別を示す属性番号から
なる。
的な書籍は、目次、序文、章または節のタイトル、本
文、図または表のタイトル、参考文献などの部分で構成
されており、ほぼこの順序に従って現れる。この書籍の
内容を検索するとき、検索対象としてこの部分部分を検
索単位に分け、その検索単位ごとに検索して検索出力と
することが便利であるし、また検索目的に合致すること
が多い。すなわち、検索目的によってタイトルのみや本
文のみを検索対象として指定することが実際の検索では
多いからである。
場合に、その書籍を構成する論理的な部分に分けて検索
結果を出力することが好ましい。この検索単位は、検索
対象の文字列の論理的な分類を示すものであるため、こ
の検索単位に論理的区分に従って属性番号を付与する。
例えば、属性番号として、目次に「1」、序文に
「2」、章または節のタイトルに「3」、図または表の
タイトルに「4」、本文に「5」、参考文献に「6」を
付与する。
に番号を付与する。これを検索単位番号とする。なおこ
の際に本文が長文である場合には適当な区分に分けて本
文を複数の検索単位に分け、検索単位ごとに出現する順
位で検索単位番号を付与することもできる。
昇順に番号を付与して文字位置番号を付与する。
番号、属性番号とから検索単位を構成する文字を整数か
らなるコードに変換して文字位置情報を作成する。
の検索単位であるかは事前に区分されている。また、同
様に目次、序文等がどの属性であるかはあらかじめ決め
られている。このため、検索単位番号はこの区分された
どの検索単位が現れたかが識別されることで付与され、
属性番号もそれぞれの区分された検索単位について決め
られた番号が付与されるものである。
性数をaとするとき、 文字位置情報コード={検索単位番号×n+文字位置番
号}×a+属性番号 …(1) からなる式で与えられる整数のコードである。
a=10とし、8番目の検索単位である本文(属性番号=
5)の先頭から第121〜124番目の文字位置に「通信文
書」という文字列があった場合、この「通」、「信」、
「文」、「書」の文字には、それぞれ「801215」、「80
1225」、「801235」、「801245」の文字位置情報が与え
られる。
成すれば、最大10000文字数の検索単位を 264/(n×a)≒4万個 取り扱うことが可能である。
ァイルに登録する。
された順に検索ファイルに格納される。そして文字種別
グループに文字位置情報を登録する。この文字位置情報
の登録は、文字種グループの末尾にそれぞれ文字位置情
報を格納することによって行われる。このため、検索単
位順に登録するとすれば文字種グループ内には文字位置
情報が数値順の昇順に登録されることになる。
録した例を第3図に示す。このとき、各グループ内の文
字位置情報は昇順に格納される。このファイル容量は、
文字位置情報が4バイトであると、 になる。
該当するグループの末尾に新規コードを追加することで
行う。また、削除は削除文書の各文字に該当するグルー
プ内の該当文字位置情報を特殊記号に変更することによ
って行う。これにより追加登録と削除を短時間に行うこ
とができる。
ごとに格納された文字位置情報は、文字欄アドレス表の
文字欄先頭番地をディレクトリとして取り出すことがで
きる。
表を作成し(S11、12)、検索ファイルの領域を確保す
る(S13)。次に検索単位登録順位カウンタをk=1に
初期設定して、検索単位番号を「1」に、最大検索単位
文字数を「n=10000」に、最大属性数をa=10に設定
する(S14)。そして最初の検索単位を取り出す(S1
5)。ここまでが登録の前処理である。ここから検索単
位ごとの登録処理となり、まず、文字位置番号をp=1
に、登録する検索単位の属性番号をaiを設定する(S1
6)。次に、検索単位の先頭文字から順に、文字位置番
号pに該当する文字位置情報を次の(2)式を用いて作
成し(S17)、 D=(k×100000+p)×10+ai …(2) 文字位置番号pにある文字種グループが格納されている
検索ファイルの文字欄を示す文字欄ディレクトリ(文字
欄先頭番地)を文字欄アドレス表から取り出して(S1
8)、文字欄ディレクトリが示す検索ファイルの文字欄
の最後尾の次の行に文字位置情報を格納する(S19)。
そして、p=p+1、l=l−1とし、検索単位内の全
ての文字を処理したところで、次の検索単位の処理に移
る(S23、24)。
索処理について説明する。
報をもとに検索入力の文字列と同じ文字列を文字列照合
して全文検索を行う例で説明する。
なっている。
欄先頭番地を算出する。
べ変える。
ループを検索ファイルから取り出してそこに格納されて
いる文字位置情報から検索入力の文字列の順序と一致す
る文字位置情報を取り出す。
する文字位置情報を取り出す。
出力する。
欄先頭番地の算出 検索ファイルの作成時と同様に、検索入力文字のJISコ
ード表記載順位を算出し、これを文字欄アドレス表にお
ける検索入力文字のアドレスポインタとする。
示す文字欄アドレス表の文字欄先頭番地を参照して、検
索入力文字の出現頻度を調べ、検索入力の文字列を全文
出現頻度の小さいものから順に並び変える。上述のよう
に、文字欄アドレス表内の文字欄先頭番地は、検索ファ
イルに格納されている各文字種グループの先頭番地を示
しており、次に続く文字欄先頭番地との差をとれば、各
文字種グループに格納されている文字位置情報の数か
ら、全文中に出現する文字種別頻度がわかる。
より、検索ファイルに格納された各文字の文字位置情報
との照合回数をきわめて低減できるためである。すなわ
ち文字位置情報を照合して文字列の連続性を調べる場合
に二つの文字種グループ内の文字位置情報中の文字位置
番号を照合するため、その二つの文字種グループ内に格
納されている文字位置情報の文字位置番号数が少なけれ
ばそれだけ照合回数を少なくすることができる。したが
って、文字位置情報の照合を行うときに、出現頻度の小
さい文字から照合を行うことが照合回数を低減させる。
特に検索入力文字が多くなるほど出現頻度の小さい文字
が含まれるため低減効果は大きい。
それぞれの文字種グループに格納されている文字位置情
報を取り出す。そして取り出した文字位置情報をもと
に、出現頻度の小さい文字種グループから、各文字種グ
ループ間で検索単位が等しくかつ文字位置番号の差が検
索入力文字列の文字位置差に等しい文字位置情報を抽出
する。
報)−(検索入力文字列j番目文字種グループ内文字位
置情報)}÷a=i−j …(3) a=最大属性数 となる文字位置情報を抽出すればよい。
現頻度の小さい文字種グループの文字位置情報とそれよ
り出現頻度の大きい文字種グループの文字位置情報との
差を取って文字の連続を照合する。
二つの文字種グループをAとBとし、その文字位置差が
Lであるとし、グループAの文字位置番号をAx、グルー
プBの文字位置番号をByとしたとき Ax+L>ByならByを削除 Ax+L<ByならAxを削除 Ax+L=ByならAx、Byを合致として共に削除 というように照合対象から削除していくことによりその
照合回数を削減させる。
で7回だけですみ、グループ内の全ての文字位置情報を
照合する必要はない。
力と同じ属性番号の文字位置情報を取り出すことによ
り、検索入力で指定した属性に一致する文字位置情報を
抽出できる。
号を検索結果として抽出する。
入力に対しては、先頭文字に該当する文字種グループか
らそれまでに得られた検索単位番号を有する文字位置情
報を取り出し、2文字目以降の処理を行うようにする。
これは第1番目の検索入力で得られた検索結果に対して
2番目以降の検索入力による照合を行うものである。
は「通信文書」が指定されたとする。この場合本文の属
性番号は「5」とする。
<「通」の順であり、照合をこの順序に行うとすると、
まず検索ファイル中の「書」の文字欄から取り出した文
字位置情報と「文」の文字欄から取り出した文字位置情
報とを上記(3)式を使用してその差が「−10」になる
文字位置情報を抽出すると、検索ファイルの「書」内の
文字位置情報の「801245」と「文」内の「801235」とを
連続性ある文字位置情報として抽出することができる。
と、「信」に該当する検索ファイルの文字欄から取り出
した文字位置情報を上記(3)式を使用して、その差が
「−20」になる文字位置情報を抽出すると、「書」内の
文字位置情報の「801245」と「信」内の文字位置情報
「801225」とを連続性ある文字位置情報として抽出する
ことができる。同様にして、「書」内の文字位置情報の
「801245」と「通」内の文字位置情報「801215」とを連
続性ある文字位置情報として抽出することができる。さ
らに、検索条件は「本文」であるから、これまでの文字
列照合で残った文字位置情報の中から、属性番号が
「5」の文字位置情報として、「801215」〜「801245」
を抽出できる。
検索単位と文字位置番号「121〜124」を検索結果として
出力する。
す。
を設定し、検索入力文字の出現頻度を文字欄アドレス表
を参照して調べ出現頻度の小さいものから順に並び変え
る(S41〜S43)。そして検索ファイルから並べ変えた検
索入力文字に該当する文字種グループ(文字欄)に格納
されている文字位置情報を取り出す(S44)。そして、
二つの文字種グループ間で、(出現頻度の小さい文字種
グループの文字位置情報)−(出現頻度の大きい文字種
グループの文字位置情報)=(並べ変えた検索入力の二
つの文字の文字位置番号差)×(最大属性数)であり、
文字位置情報の属性番号がaiである文字位置情報を一致
結果として取り出す(S45)。そして照合が終わったか
否かを判断した後、検索入力に一致した検索単位と文字
位置番号を検索結果として出力する(S48)。
ごとにその文字が属する検索単位識別符号、文字位置順
序符号、検索単位の種別を示す属性番号からなる文字位
置情報を格納した検索ファイルを作成し、この検索ファ
イルを検索入力の文字列を構成する文字種ごとにその文
字位置情報を取り出して、検索入力に合致する文字列を
検索するようにした。このため、 (1)検索処理のための文字列照合回数を低減すること
ができるため、高速照合を行うことができる、 (2)文字と文字位置に着目して検索処理を行うため任
意の文字列検索を行うことができ、プリサーチ方式のよ
うに登録時に文字列抽出を行う必要はない、 (3)専用のハードウエアを用いることなくソフトウエ
アだけで高速検索を実現できるため、汎用の情報処理装
置で全文検索を効率よく行うことができ汎用性に富む、 (4)全文検索のデータベースシステムに利用したと
き、その検索ファイルの作成にキーワード抽出を行う必
要がなく、機械入力された論文などの文字列から自動的
に検索ファイルを作成することができるため、データベ
ースシステムを経済的にかつ効率よく構築することが可
能である優れた効果がある。
構成例。 第2図は実施例の文字欄アドレス表。 第3図は実施例の検索ファイル例。 第4図は実施例の検索ファイル作成処理手順を説明する
フローチャート。 第5図は実施例の検索処理手順を説明するフローチャー
ト。 1…CPU、2…メモリ、3…入出力部、4…キーボー
ド、5…ディスプレイ、6…外部記憶装置制御部、7…
外部記憶装置、8…共通バス。
Claims (4)
- 【請求項1】それぞれが文字列で構成され検索を行う単
位である複数の検索単位によって構成される一連の文字
列であって、この検索単位にはその論理区分にしたがっ
た属性が定められている一連の文字列を検索対象として
所定の検索入力文字列に合致する文字列を抽出する情報
検索方式の検索ファイル作成装置において、 上記検索単位が現れるごとに検索単位ごとの昇順の符号
を付与する検索単位識別符号付与手段と、 上記検索単位にその属性にしたがって定められている属
性符号を付与する属性符号付与手段と、 検索対象となる文字列を各文字ごとに検索単位中での位
置を示す文字位置順序符号を付与する文字位置順序符号
付与手段と、 上記検索単位識別符号と文字位置順序符号と属性符号と
からなる文字位置情報を作成して、この文字位置情報を
文字種ごとの領域に格納して検索ファイルを作成する手
段と を備えた検索ファイル作成装置。 - 【請求項2】文字位置情報は、 {(検索単位識別符号×n)+文字位置順序符号}×a
+属性符号 n:最大検索単位文字数 a:最大属性数 なる数字として与えられる請求項1記載の検索ファイル
作成装置。 - 【請求項3】それぞれが文字列で構成され検索を行う単
位である複数の検索単位によって構成される一連の文字
列であって、この検索単位にはその論理区分にしたがっ
た属性が定められている一連の文字列を検索対象として
所定の検索入力文字列に合致する文字列を抽出する情報
検索方式において、 検索対象となる一連の文字列について、文字列を構成す
る文字ごとに、文字列からなり検索を行う単位である検
索単位に昇順に付された検索単位識別符号と、検索単位
中でのその文字の位置を示す文字位置順序符号と、検索
単位の論理区分を示す属性符号とからなる文字位置情報
を文字種別ごとに格納した検索ファイルを備え、 検索入力文字列の構成文字と同じ文字の文字位置情報を
上記検索ファイルから取り出す手段と、 この取り出した各文字の文字位置情報間で、検索単位識
別符号が共通で文字位置順序符号が検索入力の文字列と
等しい順序であり、かつその属性符号が検索入力と等し
い文字位置情報を抽出する手段と、 この抽出された文字位置情報に基づいて検索入力と等し
い文字列が属する検索単位および文字位置を検索結果と
して出力する手段と を備えた情報検索処理方式。 - 【請求項4】検索入力の文字列と等しい文字位置情報の
抽出は、検索入力文字の出現頻度の小さい文字から順に
行う請求項3記載の情報検索処理方式。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2338546A JPH0782504B2 (ja) | 1990-11-30 | 1990-11-30 | 情報検索処理方式および検索ファイル作成装置 |
| PCT/JP1991/000011 WO1992009960A1 (fr) | 1990-11-30 | 1991-01-10 | Dispositif d'extraction de donnees |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2338546A JPH0782504B2 (ja) | 1990-11-30 | 1990-11-30 | 情報検索処理方式および検索ファイル作成装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH04205560A JPH04205560A (ja) | 1992-07-27 |
| JPH0782504B2 true JPH0782504B2 (ja) | 1995-09-06 |
Family
ID=18319186
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2338546A Expired - Fee Related JPH0782504B2 (ja) | 1990-11-30 | 1990-11-30 | 情報検索処理方式および検索ファイル作成装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0782504B2 (ja) |
Families Citing this family (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3260428B2 (ja) * | 1992-07-30 | 2002-02-25 | 松下電器産業株式会社 | 情報検索処理装置 |
| JP3328334B2 (ja) * | 1992-11-06 | 2002-09-24 | 富士通株式会社 | 全文データベース検索装置 |
| JPH08101848A (ja) * | 1994-09-30 | 1996-04-16 | Canon Inc | 文書処理装置及び検索方法 |
| JPH0916616A (ja) * | 1995-06-30 | 1997-01-17 | Toyo Joho Syst:Kk | 索引データ生成検索装置 |
| JP3475009B2 (ja) * | 1996-05-24 | 2003-12-08 | 富士通株式会社 | 情報検索装置 |
| JP2001249943A (ja) * | 2000-03-03 | 2001-09-14 | Ricoh Co Ltd | 文書検索システム、文書検索方法およびその方法を実施するためのプログラムを記憶した記憶媒体 |
| JP2001249926A (ja) * | 2000-03-03 | 2001-09-14 | Nippon Record Manegement Kk | 文書管理方法 |
| WO2010095179A1 (ja) * | 2009-02-23 | 2010-08-26 | 株式会社エスグランツ | コード列検索装置、検索方法及びプログラム |
| US9009655B2 (en) | 2008-09-28 | 2015-04-14 | KOUSOKUYA, Inc. | Code string search apparatus, search method, and program |
| WO2010035366A1 (ja) * | 2008-09-28 | 2010-04-01 | 株式会社エスグランツ | コード列検索装置、検索方法及びプログラム |
| JP4464459B1 (ja) * | 2009-03-29 | 2010-05-19 | 株式会社エスグランツ | コード列検索装置、検索方法及びプログラム |
| JP4429373B1 (ja) * | 2009-03-18 | 2010-03-10 | 株式会社エスグランツ | コード列検索装置、検索方法及びプログラム |
| JP5587357B2 (ja) * | 2012-02-28 | 2014-09-10 | 株式会社メディカ出版 | 電子端末および書籍閲覧プログラム |
-
1990
- 1990-11-30 JP JP2338546A patent/JPH0782504B2/ja not_active Expired - Fee Related
Non-Patent Citations (1)
| Title |
|---|
| 情報処理学会第39回(平成元年後期)全国大会講演論文集P.1073−1074 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH04205560A (ja) | 1992-07-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3160201B2 (ja) | 情報検索方法、情報検索装置 | |
| KR100451978B1 (ko) | 정보 검색 방법과 정보 검색 장치 | |
| JP3143079B2 (ja) | 辞書索引作成装置と文書検索装置 | |
| US4775956A (en) | Method and system for information storing and retrieval using word stems and derivative pattern codes representing familes of affixes | |
| JP2669601B2 (ja) | 情報検索方法及びシステム | |
| JPH08249354A (ja) | 単語索引および単語索引作成装置および文書検索装置 | |
| JPH096799A (ja) | 文書分類装置及び文書検索装置 | |
| JPH10260968A (ja) | 中国文分節化の方法および中国語誤り検査(cec)システムへのその応用 | |
| JPH0782504B2 (ja) | 情報検索処理方式および検索ファイル作成装置 | |
| US20040122660A1 (en) | Creating taxonomies and training data in multiple languages | |
| JPH05120345A (ja) | キーワード抽出装置 | |
| JP2001175661A (ja) | 全文検索装置及び全文検索方法 | |
| JPH06282587A (ja) | 文書の自動分類方法及び装置並びに分類用の辞書作成方法及び装置 | |
| JP2519129B2 (ja) | マルチキ―ワ―ド情報検索処理方式および検索ファイル作成装置 | |
| JPH06348757A (ja) | 文書検索装置および方法 | |
| JP2519130B2 (ja) | マルチキ―ワ―ド情報検索処理方式および検索ファイル作成装置 | |
| JP3081093B2 (ja) | 索引作成方法およびその装置と文書検索装置 | |
| JP2002183195A (ja) | 概念検索方式 | |
| JPH07109603B2 (ja) | 情報検索処理方式および検索ファイル作成装置 | |
| JP2002189734A (ja) | 検索語抽出装置および検索語抽出方法 | |
| JP2003288366A (ja) | 類似テキスト検索装置 | |
| JP2993539B2 (ja) | データベース検索システムおよびその方法 | |
| WO1992009960A1 (fr) | Dispositif d'extraction de donnees | |
| JP2550022B2 (ja) | 文書情報検索方式 | |
| JPH07296005A (ja) | 日本語テキスト登録・検索装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070906 Year of fee payment: 12 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080906 Year of fee payment: 13 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080906 Year of fee payment: 13 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090906 Year of fee payment: 14 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090906 Year of fee payment: 14 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100906 Year of fee payment: 15 |
|
| LAPS | Cancellation because of no payment of annual fees |