JPH041853A - 文書検索装置 - Google Patents
文書検索装置Info
- Publication number
- JPH041853A JPH041853A JP2103606A JP10360690A JPH041853A JP H041853 A JPH041853 A JP H041853A JP 2103606 A JP2103606 A JP 2103606A JP 10360690 A JP10360690 A JP 10360690A JP H041853 A JPH041853 A JP H041853A
- Authority
- JP
- Japan
- Prior art keywords
- document
- index
- format
- retrieving
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野]
この発明は、蓄積された複数の文書の中からインデック
スを用いて指定された文書を検索する文書検索装置に係
わり、特に書式が予め決まっている文書の検索装置に関
するものである。
スを用いて指定された文書を検索する文書検索装置に係
わり、特に書式が予め決まっている文書の検索装置に関
するものである。
[従来の技術]
計算機システムを用いて文書データベースを構築するに
は、利用目的に応じて、文書内容を適切に表わすキーワ
ードを含むインデックスに作成する必要がある。従来の
文書検索装置においては、一般にインデックスは人手で
作成されており、人間が文書そのものを見て、その文書
の中から書式等に基づき必要なキーワードを見つけ呂し
て1表形式のインデックスに入力することにより作成さ
れていた。従って、文書データベースの構築には、多大
の費用と時間がかかっていた。
は、利用目的に応じて、文書内容を適切に表わすキーワ
ードを含むインデックスに作成する必要がある。従来の
文書検索装置においては、一般にインデックスは人手で
作成されており、人間が文書そのものを見て、その文書
の中から書式等に基づき必要なキーワードを見つけ呂し
て1表形式のインデックスに入力することにより作成さ
れていた。従って、文書データベースの構築には、多大
の費用と時間がかかっていた。
そこで、第11図に示すようなデータベースシステムが
実用化されている。図において、1は文書を入力するワ
ープロ等の文書入力手段、2は入力された文書を格納す
る磁気ディスク装置等の文書記憶手段、3は格納された
文書から自然言語処理機能によりキーワードを自動的に
抽出するキーワード自動抽出手段、4は抽出されたキー
ワードを格納するキーワード記憶手段、5は検索要求と
して検索条件となるキーワード等を入力するキーボード
やデイスプレィ等の検索要求入力手段、6は入力された
キーワードに基づきキーワード記憶手段4を参照して文
書記憶手段2に記憶された文書の中から指定された文書
を検索する検索手段、7はこの検索結果を出力するデイ
スプレィ等の検索結果出力手段である。
実用化されている。図において、1は文書を入力するワ
ープロ等の文書入力手段、2は入力された文書を格納す
る磁気ディスク装置等の文書記憶手段、3は格納された
文書から自然言語処理機能によりキーワードを自動的に
抽出するキーワード自動抽出手段、4は抽出されたキー
ワードを格納するキーワード記憶手段、5は検索要求と
して検索条件となるキーワード等を入力するキーボード
やデイスプレィ等の検索要求入力手段、6は入力された
キーワードに基づきキーワード記憶手段4を参照して文
書記憶手段2に記憶された文書の中から指定された文書
を検索する検索手段、7はこの検索結果を出力するデイ
スプレィ等の検索結果出力手段である。
このシステムにおいては、入力された文書を文法に基づ
き単語毎に分割する分かち書き処理を行った後、分割さ
れた単語を評価して助詞等の不要な用語を除去すること
により、検索時に必要となるキーワードを自動的に抽出
し設定するようにしている。
き単語毎に分割する分かち書き処理を行った後、分割さ
れた単語を評価して助詞等の不要な用語を除去すること
により、検索時に必要となるキーワードを自動的に抽出
し設定するようにしている。
[発明が解決しようとする課題]
従来の文書検索装置は以上のように構成されていたので
、上述したように一般にインデックスを人手で作成しな
ければならず、データベース構築に多大の費用と時間が
かかるという問題点があった。また、自然言語処理機能
により文書中からキーワードを自動抽出するものも実用
化されているが、名詞や動詞等が全てキーワードとなる
ので、抽出されるキーワードが曖昧であったり、不適当
であったりすることが多く、キーワードの抽出、設定に
時間を要したり、検索が効率的に行えないなどの間層点
があった。
、上述したように一般にインデックスを人手で作成しな
ければならず、データベース構築に多大の費用と時間が
かかるという問題点があった。また、自然言語処理機能
により文書中からキーワードを自動抽出するものも実用
化されているが、名詞や動詞等が全てキーワードとなる
ので、抽出されるキーワードが曖昧であったり、不適当
であったりすることが多く、キーワードの抽出、設定に
時間を要したり、検索が効率的に行えないなどの間層点
があった。
この発明は上記のような問題点を解消するためになされ
たものであり、本当に必要なキーワードだけを自動的に
抽出することができ1文書内容の詳細な事項を正確にイ
ンデックスとして自動抽出し、効率よく検索できる文書
検索装置を得ることを目的とする。
たものであり、本当に必要なキーワードだけを自動的に
抽出することができ1文書内容の詳細な事項を正確にイ
ンデックスとして自動抽出し、効率よく検索できる文書
検索装置を得ることを目的とする。
[課題を解決するための手段]
この発明に係る文書検索装置は、検索する文書の書式を
格納する文書書式記憶手段と、検索する文書から上記文
書書式記憶手段に格納された書式を用いてインデックス
に必要なデータを抽出し、インデックスを生成するイン
デックス抽出手段と、検索時に上記文書書式記憶手段に
格納された書式を表示し、これに対して入力された検索
条件に基づき上記インデックスを用いて文書を検索する
検索手段とを備えたものである。
格納する文書書式記憶手段と、検索する文書から上記文
書書式記憶手段に格納された書式を用いてインデックス
に必要なデータを抽出し、インデックスを生成するイン
デックス抽出手段と、検索時に上記文書書式記憶手段に
格納された書式を表示し、これに対して入力された検索
条件に基づき上記インデックスを用いて文書を検索する
検索手段とを備えたものである。
[作用コ
この発明においては、文書が一般に定形の書式に従って
書かれている点に着目し、この文書書式を格納しておき
、検索する文書から上記文書書式を用いてインデックス
に必要なデータを抽出することにより、インデックスを
自動的に生成する。
書かれている点に着目し、この文書書式を格納しておき
、検索する文書から上記文書書式を用いてインデックス
に必要なデータを抽出することにより、インデックスを
自動的に生成する。
このように書式を用いることにより、インデックスの作
成において、文書から抽出するデータを書式によって指
定しているので正確に行え、また、書式を用いて文書構
造の解析が行えるので、文書内容の詳細な事項をインデ
ックスとすることができる。また、検索において、書式
を検索者に提示することができるため、検索者は特別な
検索言語を知らなくても、検索条件を穴埋め式に簡単に
与えることができる。
成において、文書から抽出するデータを書式によって指
定しているので正確に行え、また、書式を用いて文書構
造の解析が行えるので、文書内容の詳細な事項をインデ
ックスとすることができる。また、検索において、書式
を検索者に提示することができるため、検索者は特別な
検索言語を知らなくても、検索条件を穴埋め式に簡単に
与えることができる。
[実施例]
以下、この発明の一実施例を図において説明する。
第1図は実施例の文書検索装置の全体構成を示すブロッ
ク図であり、前記第11図と同−又は相当部分には同一
符号を用いてその説明は省略する。図において、8は検
索する文書に定められた書式を入力するワープロ等の文
書書式入力手段、9は入力された文書書式を格納する磁
気ディスク装置等の文書書式記憶手段、10は文書記憶
手段2に格納された文書から上記文書書式記憶手段9に
格納された書式を用いてインデックスに必要なデータを
抽出し、インデックスを生成するインデックス抽出手段
、11は上記インデックス抽出手段10によって生成さ
れたインデックスが格納される磁気ディスク装置等のイ
ンデックス記憶手段、12は検索時に上記文書書式記憶
手段9に格納された文書書式を検索要求入力手段5のデ
イスプレィに表示し、これに対してキーボードから入力
された検索条件に基づき、インデックス記憶手段ll中
のインデックスを用いて文書記憶手段2内の文書を検索
する検索手段であり、検索結果はデイスプレィ等の検索
結果出力手段7に出力される。なお、上記インデックス
抽出手段10及び検索手段12は、計算機システムを構
成するプロセッサとその上で動作するソフトウェアによ
って実現されている。
ク図であり、前記第11図と同−又は相当部分には同一
符号を用いてその説明は省略する。図において、8は検
索する文書に定められた書式を入力するワープロ等の文
書書式入力手段、9は入力された文書書式を格納する磁
気ディスク装置等の文書書式記憶手段、10は文書記憶
手段2に格納された文書から上記文書書式記憶手段9に
格納された書式を用いてインデックスに必要なデータを
抽出し、インデックスを生成するインデックス抽出手段
、11は上記インデックス抽出手段10によって生成さ
れたインデックスが格納される磁気ディスク装置等のイ
ンデックス記憶手段、12は検索時に上記文書書式記憶
手段9に格納された文書書式を検索要求入力手段5のデ
イスプレィに表示し、これに対してキーボードから入力
された検索条件に基づき、インデックス記憶手段ll中
のインデックスを用いて文書記憶手段2内の文書を検索
する検索手段であり、検索結果はデイスプレィ等の検索
結果出力手段7に出力される。なお、上記インデックス
抽出手段10及び検索手段12は、計算機システムを構
成するプロセッサとその上で動作するソフトウェアによ
って実現されている。
次に動作について説明する。
前述したように、本願は、文書が一般に定形の書式に従
って書かれている点に着目したもので、特に文書データ
ベースの対象となる技術文書、例えば研究報告、規格書
、仕様書等は第2図に示すように、1ページ目の表紙や
2ページ目の目次が罫線の枠で種別や表題を示す各フィ
ールドが区画された共通の書式を有している。なお、本
願で扱う書式としては、上記の他に、文書中の表(例え
ばoOの規格表など)や、明細書のように枠などはなく
ともよい。
って書かれている点に着目したもので、特に文書データ
ベースの対象となる技術文書、例えば研究報告、規格書
、仕様書等は第2図に示すように、1ページ目の表紙や
2ページ目の目次が罫線の枠で種別や表題を示す各フィ
ールドが区画された共通の書式を有している。なお、本
願で扱う書式としては、上記の他に、文書中の表(例え
ばoOの規格表など)や、明細書のように枠などはなく
ともよい。
先ず、文書そのものは、従来と同様に文書入力手段1に
よって入力され、文書記憶手段2に格納される。また本
装置では、その文書の書式が文書書式入力手段8から入
力され、文書書式記憶手段9に格納される。この文書書
式は、書式の同じ文書のみを扱う場合は1種類でよいが
、書式の異なる文書を扱う場合はその種類だけ入力され
、インデックス抽出時や検索時にはその種類が指定され
る。一般に文書は、パラグラフ(ある意味でもってかた
まりとみなせる論理的な単位)の集まりからなる。従っ
て、書式として入力されるデータは、第3図に示すよう
に、文書がどのようなパラグラフから構成されているか
をあられす文書構造(枠、パラグラフタイトル)と、抽
出するデータの位置(斜線部)及び抽出したデータのイ
ンデックスとの対応関係(矢印で示すポインタ)などで
ある。なお、第3図の場合、パラグラフとは罫線で囲ま
れた内部をあられす。
よって入力され、文書記憶手段2に格納される。また本
装置では、その文書の書式が文書書式入力手段8から入
力され、文書書式記憶手段9に格納される。この文書書
式は、書式の同じ文書のみを扱う場合は1種類でよいが
、書式の異なる文書を扱う場合はその種類だけ入力され
、インデックス抽出時や検索時にはその種類が指定され
る。一般に文書は、パラグラフ(ある意味でもってかた
まりとみなせる論理的な単位)の集まりからなる。従っ
て、書式として入力されるデータは、第3図に示すよう
に、文書がどのようなパラグラフから構成されているか
をあられす文書構造(枠、パラグラフタイトル)と、抽
出するデータの位置(斜線部)及び抽出したデータのイ
ンデックスとの対応関係(矢印で示すポインタ)などで
ある。なお、第3図の場合、パラグラフとは罫線で囲ま
れた内部をあられす。
一方、インデックス抽出手段10は、文書入力手段1か
ら文書が入力され文書記憶手段2に格納される度に、第
4図(a)に示す文書構造解析処理(ステップSl)と
抽呂データ決定処理(ステップS2)とインデックス生
成処理(ステップS3)の一連の処理を実行する。第4
図(′b)に各処理ステップでの入力と処理内容と出力
を示し、そのデータの流れを第4図fc)に示す。なお
、同図の文書構造解析では、罫線で囲まれた文書の表紙
からインデックスを生成する例を取り上げたが、文書構
造解析は、第5図(a)に示すようにパラグラフが罫線
で囲まれていなくても、また、第5図(b)に示すよう
にパラグラフの長さが可変長であっても対応できる。
ら文書が入力され文書記憶手段2に格納される度に、第
4図(a)に示す文書構造解析処理(ステップSl)と
抽呂データ決定処理(ステップS2)とインデックス生
成処理(ステップS3)の一連の処理を実行する。第4
図(′b)に各処理ステップでの入力と処理内容と出力
を示し、そのデータの流れを第4図fc)に示す。なお
、同図の文書構造解析では、罫線で囲まれた文書の表紙
からインデックスを生成する例を取り上げたが、文書構
造解析は、第5図(a)に示すようにパラグラフが罫線
で囲まれていなくても、また、第5図(b)に示すよう
にパラグラフの長さが可変長であっても対応できる。
第6図は上記文書構造解析処理を更に詳細に説明するた
めの図であり、文書構造解析処理(ステップSl)は推
論部で行われ、文書記憶手段2から取り出された文書デ
ータを最小構成要素に分解する文書要素解析処理(ステ
ップ511)と、得られた各最小構成要素を文書書式記
憶手段9から取り出された書式データのパラグラフに対
応(いくつかの代替案が可能)させるパラグラフ対応処
理(ステップ512)と、得られたパラグラフの対応の
中から最も可能性の高い対応を選択して出力する構造解
析処理(ステップ513)に分けられ、それぞれ以下に
示すような処理が行われる。
めの図であり、文書構造解析処理(ステップSl)は推
論部で行われ、文書記憶手段2から取り出された文書デ
ータを最小構成要素に分解する文書要素解析処理(ステ
ップ511)と、得られた各最小構成要素を文書書式記
憶手段9から取り出された書式データのパラグラフに対
応(いくつかの代替案が可能)させるパラグラフ対応処
理(ステップ512)と、得られたパラグラフの対応の
中から最も可能性の高い対応を選択して出力する構造解
析処理(ステップ513)に分けられ、それぞれ以下に
示すような処理が行われる。
(1)ステップ511(文書要素解析)ここでは、文書
データの内容を最小構成要素に分解して、それぞれの要
素に順番に番号を付ける。番号を付けた最小構成要素を
要素データと呼ぶ。ここで言う最小構成要素とは、 a)行 b)表の中の行 C)図やグラフ等9文書以外の領域 であり、行とは、改行記号又は表の罫線があるところま
での文字列である。
データの内容を最小構成要素に分解して、それぞれの要
素に順番に番号を付ける。番号を付けた最小構成要素を
要素データと呼ぶ。ここで言う最小構成要素とは、 a)行 b)表の中の行 C)図やグラフ等9文書以外の領域 であり、行とは、改行記号又は表の罫線があるところま
での文字列である。
(2)ステップ512(パラグラフ対応)ここでは、要
素データの先頭を書式データにある各パラグラフのパラ
グラフタイトル(パラグラフを見つけるためのキーワー
ド)とマツチングさせ、各パラグラフの始まりとなる要
素データを選択する(複数選択可)。これらの対応付け
をパラグラフ対応データと呼ぶ。具体的な例を第7図(
a)、(blに示す。同図(al、(blに示したよう
な2つのデータから第8図に示すような5つのパラグラ
フ対応データが得られる。同図に示すパラグラフ対応デ
ータ■と■とは互いに矛盾するデータであるが、この段
階では2つとも候補として保持しておき、次のステップ
513(構造解析)で■と■のどちらかを選ぶ。
素データの先頭を書式データにある各パラグラフのパラ
グラフタイトル(パラグラフを見つけるためのキーワー
ド)とマツチングさせ、各パラグラフの始まりとなる要
素データを選択する(複数選択可)。これらの対応付け
をパラグラフ対応データと呼ぶ。具体的な例を第7図(
a)、(blに示す。同図(al、(blに示したよう
な2つのデータから第8図に示すような5つのパラグラ
フ対応データが得られる。同図に示すパラグラフ対応デ
ータ■と■とは互いに矛盾するデータであるが、この段
階では2つとも候補として保持しておき、次のステップ
513(構造解析)で■と■のどちらかを選ぶ。
(3)ステップ513(構造解析)
上記ステップS12で得られたパラグラフ対応データの
中から最も適当な組み合わせをプロダクション・ルール
セットを用いて選択し、最終的に決定したパラグラフ対
応データの集合をパラグラフ切り分はデータとして確保
する。これによって、各パラグラフの先頭にくる要素デ
ータが決定され、従って各パラグラフを構成する要素デ
ータの集合も決定される。
中から最も適当な組み合わせをプロダクション・ルール
セットを用いて選択し、最終的に決定したパラグラフ対
応データの集合をパラグラフ切り分はデータとして確保
する。これによって、各パラグラフの先頭にくる要素デ
ータが決定され、従って各パラグラフを構成する要素デ
ータの集合も決定される。
プロダクション・ルールセットとしては、パラグラフの
順番の整合性や、パラグラフとしての確からしさなどが
考えられる。以下にプロダクション・ルールセットの例
を示す。
順番の整合性や、パラグラフとしての確からしさなどが
考えられる。以下にプロダクション・ルールセットの例
を示す。
・パラグラフの順番の整合性
a)パラグラフ対応データにおいて、パラグラフidの
並びの昇順を乱す対応付けは候補から除く。
並びの昇順を乱す対応付けは候補から除く。
・パラグラフとしての確からしさ
b)パラグラフタイトルが表題であり、かつ対応する最
小構成要素が40字以上のときは候補から除く。
小構成要素が40字以上のときは候補から除く。
上記のパラグラフ対応データ(第8図)では、31がル
ールセットb)により、2°がルールセットa)により
候補から外される。そして、残りの対応付けが最も適当
な組み合わせとして選択される。
ールセットb)により、2°がルールセットa)により
候補から外される。そして、残りの対応付けが最も適当
な組み合わせとして選択される。
以上のようにして文書構造解析処理(ステップ81)が
終了すると、次の抽出データ決定処理(ステップS2)
では、上記ステップ513(構造解析)で得られた各パ
ラグラフを構成する要素データ集合から、そのパラグラ
フのパラグラフタイトルを除いたものがインデックスと
なるデータとして抽出される(第9図及び前記第4図t
el参照)。
終了すると、次の抽出データ決定処理(ステップS2)
では、上記ステップ513(構造解析)で得られた各パ
ラグラフを構成する要素データ集合から、そのパラグラ
フのパラグラフタイトルを除いたものがインデックスと
なるデータとして抽出される(第9図及び前記第4図t
el参照)。
そして、最後のインデックス生成処理(ステップS3)
において、上記ステップS2(抽出データ決定処理)で
抽出したデータをインデックスデータを格納する表のフ
ィールドに投入することにより(前記第4図(C1参照
)、インデックスをインデックス記憶手段11上に生成
する。
において、上記ステップS2(抽出データ決定処理)で
抽出したデータをインデックスデータを格納する表のフ
ィールドに投入することにより(前記第4図(C1参照
)、インデックスをインデックス記憶手段11上に生成
する。
次に検索時について説明すると、例えば、第10図fa
lに示すようなインデックスデータが上述した自動抽出
によって用意されている場合に、検索者が「゛山口′が
書いた。大要に1ソフトウエア設計′という言葉がある
1研究報告′の大要の部分を見たい」という検索要求を
行うときは、第10図(b)に示すように、検索要求入
力画面に検索手段12が対応する書式の枠組みを表示し
、検索者はシステムが表示したこの書式に必要項目を入
力するだけで、検索条件が検索手段12に与えられる。
lに示すようなインデックスデータが上述した自動抽出
によって用意されている場合に、検索者が「゛山口′が
書いた。大要に1ソフトウエア設計′という言葉がある
1研究報告′の大要の部分を見たい」という検索要求を
行うときは、第10図(b)に示すように、検索要求入
力画面に検索手段12が対応する書式の枠組みを表示し
、検索者はシステムが表示したこの書式に必要項目を入
力するだけで、検索条件が検索手段12に与えられる。
なお、図中の本は周知のワイルドカードであり、これが
与えられたときはテキストサーチを行う。これにより、
検索手段12はインデックスを用いた通常の検索を行い
、検索結果として、第10図telのように、検索要求
を満足する文書の指定した所が出力され、文書が複数あ
る場合はマルチウィンドウで出力される。
与えられたときはテキストサーチを行う。これにより、
検索手段12はインデックスを用いた通常の検索を行い
、検索結果として、第10図telのように、検索要求
を満足する文書の指定した所が出力され、文書が複数あ
る場合はマルチウィンドウで出力される。
[発明の効果]
以上のように、この発明によれば、検索する文書の書式
を格納する文書書式記憶手段と、検索する文書から上記
文書書式記憶手段に格納された書式を用いてインデック
スに必要なデータを抽出し、インデックスを生成するイ
ンデックス抽出手段と、検索時に上記文書書式記憶手段
に格納された書式を表示し、これに対して入力された検
索条件に基づき上記インデックスを用いて文書を検索す
る検索手段とを備えたので、インデックスを自動的に作
成できるとともに、文書から抽出するデータを書式によ
って指定しているので正確に行え、また、書式を用いて
文書構造の解析が行えるので、文書内容の詳細な事項を
インデックスとすることができる。また、検索において
、書式を検索者に提示することができるため、検索者は
特別な検索言語を知らなくても、検索条件を穴埋め式に
簡単に与えることができる。
を格納する文書書式記憶手段と、検索する文書から上記
文書書式記憶手段に格納された書式を用いてインデック
スに必要なデータを抽出し、インデックスを生成するイ
ンデックス抽出手段と、検索時に上記文書書式記憶手段
に格納された書式を表示し、これに対して入力された検
索条件に基づき上記インデックスを用いて文書を検索す
る検索手段とを備えたので、インデックスを自動的に作
成できるとともに、文書から抽出するデータを書式によ
って指定しているので正確に行え、また、書式を用いて
文書構造の解析が行えるので、文書内容の詳細な事項を
インデックスとすることができる。また、検索において
、書式を検索者に提示することができるため、検索者は
特別な検索言語を知らなくても、検索条件を穴埋め式に
簡単に与えることができる。
第1図はこの発明の一実施例による文書検索装置の全体
構成を示すブロック図、第2図は文書書式を説明するた
めの図、第3図は書式として入力されるデータを説明す
るための図、第4図はインデックス抽出手段の作用を説
明するための図、第5図はインデックス抽出が可能な文
書の他の例を示す図、第6図は文書構造解析処理を更に
詳細に説明するための図、第7図はバラグラフ対応の一
例を示す図、第8図はパラグラフ対応データの一例を示
す図、第9図は抽出データの一例を示す図、第10図は
検索手段の作用を説明するための図、第11図は従来例
の構成を示すブロック図である。 1は文書入力手段、2は文書記憶手段、5は検索要求入
力手段、7は検索結果出力手段、8は文書書式入力手段
、9は文書書式記憶手段、10はインデックス抽出手段
、11はインデックス記憶手段、12は検索手段。 なお、図中、同一符号は同一、又は相当部分を示す。
構成を示すブロック図、第2図は文書書式を説明するた
めの図、第3図は書式として入力されるデータを説明す
るための図、第4図はインデックス抽出手段の作用を説
明するための図、第5図はインデックス抽出が可能な文
書の他の例を示す図、第6図は文書構造解析処理を更に
詳細に説明するための図、第7図はバラグラフ対応の一
例を示す図、第8図はパラグラフ対応データの一例を示
す図、第9図は抽出データの一例を示す図、第10図は
検索手段の作用を説明するための図、第11図は従来例
の構成を示すブロック図である。 1は文書入力手段、2は文書記憶手段、5は検索要求入
力手段、7は検索結果出力手段、8は文書書式入力手段
、9は文書書式記憶手段、10はインデックス抽出手段
、11はインデックス記憶手段、12は検索手段。 なお、図中、同一符号は同一、又は相当部分を示す。
Claims (1)
- 【特許請求の範囲】 蓄積された複数の文書の中からインデックスを用いて
指定された文書を検索する文書検索装置であって、 検索する文書の書式を格納する文書書式記憶手段と、検
索する文書から上記文書書式記憶手段に格納された書式
を用いてインデックスに必要なデータを抽出し、インデ
ックスを生成するインデックス抽出手段と、検索時に上
記文書書式記憶手段に格納された書式を表示し、これに
対して入力された検索条件に基づき上記インデックスを
用いて文書を検索する検索手段とを備えたことを特徴と
する文書検索装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2103606A JP2549745B2 (ja) | 1990-04-19 | 1990-04-19 | 文書検索装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2103606A JP2549745B2 (ja) | 1990-04-19 | 1990-04-19 | 文書検索装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH041853A true JPH041853A (ja) | 1992-01-07 |
| JP2549745B2 JP2549745B2 (ja) | 1996-10-30 |
Family
ID=14358433
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2103606A Expired - Fee Related JP2549745B2 (ja) | 1990-04-19 | 1990-04-19 | 文書検索装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2549745B2 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06325087A (ja) * | 1993-05-17 | 1994-11-25 | Hitachi Ltd | 構造化文書のブラウズ装置 |
| JP2003519844A (ja) * | 2000-01-06 | 2003-06-24 | サン・マイクロシステムズ・インコーポレイテッド | スタイルシートに基づいて構造化されたドキュメントのインデックスを作成する方法および装置 |
-
1990
- 1990-04-19 JP JP2103606A patent/JP2549745B2/ja not_active Expired - Fee Related
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06325087A (ja) * | 1993-05-17 | 1994-11-25 | Hitachi Ltd | 構造化文書のブラウズ装置 |
| JP2003519844A (ja) * | 2000-01-06 | 2003-06-24 | サン・マイクロシステムズ・インコーポレイテッド | スタイルシートに基づいて構造化されたドキュメントのインデックスを作成する方法および装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2549745B2 (ja) | 1996-10-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11120059B2 (en) | Conversational query answering system | |
| US6904429B2 (en) | Information retrieval apparatus and information retrieval method | |
| US5940624A (en) | Text management system | |
| US9020811B2 (en) | Method and system for converting text files searchable text and for processing the searchable text | |
| US10747795B2 (en) | Cognitive retrieve and rank search improvements using natural language for product attributes | |
| WO2002039320A1 (en) | Method for structuring and searching information | |
| KR20040077918A (ko) | 데이터베이스 검색 방법, 데이터베이스 검색 시스템 및 컴퓨터 프로그램 | |
| JPH0628403A (ja) | 文書検索装置 | |
| EP1986113A2 (en) | System for retrieving information units | |
| JPH041853A (ja) | 文書検索装置 | |
| JPH0581326A (ja) | データベース検索装置 | |
| JP3222193B2 (ja) | 情報検索装置 | |
| JPH06348756A (ja) | 索引作成装置及び索引利用装置 | |
| JP4384736B2 (ja) | 画像検索装置およびその装置の各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
| JP2005056223A (ja) | テキストデータ検索システム、その方法及びそのプログラム | |
| JPH08305726A (ja) | 情報検索装置 | |
| JPH1185765A (ja) | タグ付文書検索システム | |
| JPH08249341A (ja) | 文書データベースの文書格納・検索装置 | |
| JP4034503B2 (ja) | 文書検索システムおよび文書検索方法 | |
| Sunne | SQL | |
| KR101057997B1 (ko) | 최초 문자를 이용하는 검색 엔진 및 검색 방법 | |
| JP2003263458A (ja) | テキスト分析方法及び装置 | |
| JPH04123264A (ja) | 関連語テーブル作成装置及び文書検索装置 | |
| CN121704730A (zh) | 基于单屏或多屏展示的一体化手册阅览实现方法及系统 | |
| CN121166625A (zh) | 一种基于智能机床的书籍管理系统及方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |