JPH0973460A - 文書検索装置 - Google Patents
文書検索装置Info
- Publication number
- JPH0973460A JPH0973460A JP7228919A JP22891995A JPH0973460A JP H0973460 A JPH0973460 A JP H0973460A JP 7228919 A JP7228919 A JP 7228919A JP 22891995 A JP22891995 A JP 22891995A JP H0973460 A JPH0973460 A JP H0973460A
- Authority
- JP
- Japan
- Prior art keywords
- document
- search
- file
- phrases
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】文書検索装置にて所望の文書を効率よく、かつ
的確に検索する。 【解決手段】この文書検索装置は、ファイル2に保存さ
れた複数の文書中から所望の文書を検索する文書検索装
置であって、単語、語句および品詞情報などが入力され
る入力部1と、単語および語句をそれぞれに品詞情報を
付加してファイル2に保存する保存手段と、文書検索時
に、入力部1より入力されたキーワードおよび品詞情報
と一致する単語および語句をファイル2より検索し、そ
の単語および語句を含む文書を表示部4に表示するCP
U3とを具備する。
的確に検索する。 【解決手段】この文書検索装置は、ファイル2に保存さ
れた複数の文書中から所望の文書を検索する文書検索装
置であって、単語、語句および品詞情報などが入力され
る入力部1と、単語および語句をそれぞれに品詞情報を
付加してファイル2に保存する保存手段と、文書検索時
に、入力部1より入力されたキーワードおよび品詞情報
と一致する単語および語句をファイル2より検索し、そ
の単語および語句を含む文書を表示部4に表示するCP
U3とを具備する。
Description
【0001】
【発明の属する技術分野】本発明は、例えばファイルな
どの保存手段に保存された文書を検索する文書検索装置
に関する。
どの保存手段に保存された文書を検索する文書検索装置
に関する。
【0002】
【従来の技術】従来から、例えばファイルなどに保存さ
れている文書を、あるキーワードを基にフルテキスト検
索する文書検索装置はよく知られているが、上記ファイ
ルに多くの文書を保存可能な今日では、文書検索効率の
向上が望まれている。
れている文書を、あるキーワードを基にフルテキスト検
索する文書検索装置はよく知られているが、上記ファイ
ルに多くの文書を保存可能な今日では、文書検索効率の
向上が望まれている。
【0003】従来の文書検索装置では、通常、ファイル
に多くの文書が登録されていることから、文書検索装置
にある 1つのキーワードだけを入力して、ファイルの中
からそのキーワードと同じ文字および語句などを含む文
書を検索・表示するのには多くの時間が費やされる。
に多くの文書が登録されていることから、文書検索装置
にある 1つのキーワードだけを入力して、ファイルの中
からそのキーワードと同じ文字および語句などを含む文
書を検索・表示するのには多くの時間が費やされる。
【0004】ところで、この文書検索装置では、入力し
たキーワードと同じ文字および語句などをもつ文書がフ
ァイルの中に存在せず、文書検索結果が0件ということ
も多々ある。また入力したキーワードと同じ文字および
語句などをもつ文書がファイルの中に多く在り過ぎて文
書検索をかけた意味がなくなる場合もある。
たキーワードと同じ文字および語句などをもつ文書がフ
ァイルの中に存在せず、文書検索結果が0件ということ
も多々ある。また入力したキーワードと同じ文字および
語句などをもつ文書がファイルの中に多く在り過ぎて文
書検索をかけた意味がなくなる場合もある。
【0005】この場合、せっかく費やした文書検索時間
が無駄になり、ユーザは、前回入力したキーワードと類
似するキーワードを改めて文書検索装置に入力し直し、
新たに文書検索を実行させることになる。
が無駄になり、ユーザは、前回入力したキーワードと類
似するキーワードを改めて文書検索装置に入力し直し、
新たに文書検索を実行させることになる。
【0006】しかしながら、これでは、文書検索効率が
悪いばかりか、入力操作が多くなり業務の停滞を招くこ
とになる。
悪いばかりか、入力操作が多くなり業務の停滞を招くこ
とになる。
【0007】
【発明が解決しようとする課題】上述したように、従来
の文書検索装置では、あるキーワードだけで文書を検索
した場合、そのキーワードと同じ文字および語句などを
もつ文書が存在しなかったり多く、また在り過ぎたりし
て、文書検索を再度やり直すことになり文書検索効率が
悪いという問題があった。
の文書検索装置では、あるキーワードだけで文書を検索
した場合、そのキーワードと同じ文字および語句などを
もつ文書が存在しなかったり多く、また在り過ぎたりし
て、文書検索を再度やり直すことになり文書検索効率が
悪いという問題があった。
【0008】本発明はこのような課題を解決するために
なされたもので、所望の文書を効率よく、かつ的確に検
索できる文書検索装置を提供することを目的としてい
る。
なされたもので、所望の文書を効率よく、かつ的確に検
索できる文書検索装置を提供することを目的としてい
る。
【0009】
【課題を解決するための手段】上記した目的を達成する
ために、請求項1記載の発明の文書検索装置は、ファイ
ルに登録された所望の文書をキーワードによって検索す
る文書検索装置において、文字列が入力される入力手段
と、前記入力手段から入力された文字列を単語および語
句などに形態素解析する形態素解析手段と、前記形態素
解析手段により形態素解析された単語および語句などに
それぞれ品詞情報を付加して前記ファイルに登録する登
録手段と、文書検索時に、前記入力手段よりキーワード
と共に品詞情報が入力されたとき、これらの検索条件を
基に該当する単語および語句を前記ファイルの各文書中
から検索する検索手段と、前記検索手段により検索され
た単語および語句を含む文書を表示する表示手段とを具
備している。
ために、請求項1記載の発明の文書検索装置は、ファイ
ルに登録された所望の文書をキーワードによって検索す
る文書検索装置において、文字列が入力される入力手段
と、前記入力手段から入力された文字列を単語および語
句などに形態素解析する形態素解析手段と、前記形態素
解析手段により形態素解析された単語および語句などに
それぞれ品詞情報を付加して前記ファイルに登録する登
録手段と、文書検索時に、前記入力手段よりキーワード
と共に品詞情報が入力されたとき、これらの検索条件を
基に該当する単語および語句を前記ファイルの各文書中
から検索する検索手段と、前記検索手段により検索され
た単語および語句を含む文書を表示する表示手段とを具
備している。
【0010】この請求項1記載の発明では、形態素解析
手段により形態素解析された単語および語句などには、
それぞれ品詞情報が付加されてファイルに登録される。
手段により形態素解析された単語および語句などには、
それぞれ品詞情報が付加されてファイルに登録される。
【0011】そして文書検索時には、入力手段よりキー
ワードと共に品詞情報が入力されると、これらの検索条
件を基に該当する単語および語句がファイルの各文書中
から検索され、その単語および語句を含む文書が表示さ
れる。すなわち、検索範囲を品詞により限定した中で文
書を検索することができる。
ワードと共に品詞情報が入力されると、これらの検索条
件を基に該当する単語および語句がファイルの各文書中
から検索され、その単語および語句を含む文書が表示さ
れる。すなわち、検索範囲を品詞により限定した中で文
書を検索することができる。
【0012】また請求項2記載の発明の文書検索装置
は、ファイルに登録された所望の文書をキーワードによ
って検索する文書検索装置において、文字列が入力され
る入力手段と、前記入力手段から入力された文字列を単
語および語句などに形態素解析する形態素解析手段と、
前記形態素解析手段により形態素解析された単語および
語句などにそれぞれ品詞情報を付加して前記ファイルに
登録する登録手段と、文書検索時に、前記入力手段より
キーワードと共に品詞情報が入力されたとき、これらの
検索条件を基に該当する単語および語句を前記ファイル
の各文書中から検索する検索手段と、前記検索手段によ
り文書中から単語および語句が検索される度にそれぞれ
がヒットする頻度を計数する計数手段と、前記計数手段
により計数された頻度の値が所定値以上の単語および語
句を含む文書を表示する表示手段とを具備している。
は、ファイルに登録された所望の文書をキーワードによ
って検索する文書検索装置において、文字列が入力され
る入力手段と、前記入力手段から入力された文字列を単
語および語句などに形態素解析する形態素解析手段と、
前記形態素解析手段により形態素解析された単語および
語句などにそれぞれ品詞情報を付加して前記ファイルに
登録する登録手段と、文書検索時に、前記入力手段より
キーワードと共に品詞情報が入力されたとき、これらの
検索条件を基に該当する単語および語句を前記ファイル
の各文書中から検索する検索手段と、前記検索手段によ
り文書中から単語および語句が検索される度にそれぞれ
がヒットする頻度を計数する計数手段と、前記計数手段
により計数された頻度の値が所定値以上の単語および語
句を含む文書を表示する表示手段とを具備している。
【0013】この請求項2記載の発明では、上記同様に
形態素解析された単語および語句などにそれぞれ品詞情
報が付加されてファイルに登録される。
形態素解析された単語および語句などにそれぞれ品詞情
報が付加されてファイルに登録される。
【0014】そして文書検索時には、入力手段よりキー
ワードと共に品詞情報が入力されると、これらの検索条
件を基に該当する単語および語句がファイルの各文書中
から検索される。この際、文書中から単語および語句が
検索される度に、計数手段によりそれぞれがヒットする
頻度が計数され、その頻度の値が所定値以上の単語およ
び語句を含む文書が表示される。すなわち、検索範囲を
品詞と出現頻度によってさらに限定した中で文書を検索
することができる。
ワードと共に品詞情報が入力されると、これらの検索条
件を基に該当する単語および語句がファイルの各文書中
から検索される。この際、文書中から単語および語句が
検索される度に、計数手段によりそれぞれがヒットする
頻度が計数され、その頻度の値が所定値以上の単語およ
び語句を含む文書が表示される。すなわち、検索範囲を
品詞と出現頻度によってさらに限定した中で文書を検索
することができる。
【0015】上記により結果、所望の文書を効率よく、
かつ的確に検索できる。
かつ的確に検索できる。
【0016】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して詳細に説明する。
を参照して詳細に説明する。
【0017】図1は本発明の文書検索装置の一つの実施
形態を示す構成図である。
形態を示す構成図である。
【0018】同図において、1は例えばキーボードおよ
びマウスなどの入力部であり、さまざまな情報、例えば
アスキーコードなどで定められた記号、数字、文字(カ
タカナ、ひらがななどの単語)、文字列(語句、キーワ
ード)および品詞情報(名詞、動詞、形容詞など)が入
力・指示される。2はファイルであり上記さまざまな情
報が形態素解析後、文書として保存される。3はCPU
であり入力された文字列似ついて日本語解析(辞書引き
・形態素解析、構文解析などを含む)を行い、上記さま
ざまな情報を文書としてファイル2に保存・登録すると
共に、入力部1から入力されたキーワード情報を基にフ
ァイル2内の該当する文書を検索し表示部4に表示す
る。
びマウスなどの入力部であり、さまざまな情報、例えば
アスキーコードなどで定められた記号、数字、文字(カ
タカナ、ひらがななどの単語)、文字列(語句、キーワ
ード)および品詞情報(名詞、動詞、形容詞など)が入
力・指示される。2はファイルであり上記さまざまな情
報が形態素解析後、文書として保存される。3はCPU
であり入力された文字列似ついて日本語解析(辞書引き
・形態素解析、構文解析などを含む)を行い、上記さま
ざまな情報を文書としてファイル2に保存・登録すると
共に、入力部1から入力されたキーワード情報を基にフ
ァイル2内の該当する文書を検索し表示部4に表示す
る。
【0019】次に、図2および図4を参照してこの文書
検索装置の動作を説明する。
検索装置の動作を説明する。
【0020】図2はファイル2内の語句−品詞対応テー
ブルを示す図、図3はこの文書検索装置の検索動作を示
すフローチャート、図4は語句が検索される様子を模式
的に示す図である。この文書検索装置はフルテキスト検
索機能を有するものである。この文書検索装置では、入
力部1によって上記さまざまな情報、例えば文字列が入
力されると、CPU3により形態素解析が行われ、文字
列が意味のある文字および語句単位に分割される。そし
てその分割された文字および語句単位に品詞情報が付加
されてファイル2に保存・登録される。
ブルを示す図、図3はこの文書検索装置の検索動作を示
すフローチャート、図4は語句が検索される様子を模式
的に示す図である。この文書検索装置はフルテキスト検
索機能を有するものである。この文書検索装置では、入
力部1によって上記さまざまな情報、例えば文字列が入
力されると、CPU3により形態素解析が行われ、文字
列が意味のある文字および語句単位に分割される。そし
てその分割された文字および語句単位に品詞情報が付加
されてファイル2に保存・登録される。
【0021】この際、CPU3はファイル2内に、図2
に示すように、テーブル(インデックスファイル)20
を作成する。このテーブル20は、形態素解析した文字
および語句21などにそれぞれ品詞情報22を対応付け
たテーブルである。
に示すように、テーブル(インデックスファイル)20
を作成する。このテーブル20は、形態素解析した文字
および語句21などにそれぞれ品詞情報22を対応付け
たテーブルである。
【0022】例えば「文書」、「敬順」「敬忠」という
語句には「名詞」が対応付けられ、「敬」という文字に
は「動詞」が対応付けられ、「恭し」という語句には
「形容詞」が対応付けられる。
語句には「名詞」が対応付けられ、「敬」という文字に
は「動詞」が対応付けられ、「恭し」という語句には
「形容詞」が対応付けられる。
【0023】この文書検索装置では、文書を検索する場
合、入力部1を所定操作することによりCPU3は文書
検索状態となり、表示部4が検索文字列(キーワード)
の入力待機状態となる。
合、入力部1を所定操作することによりCPU3は文書
検索状態となり、表示部4が検索文字列(キーワード)
の入力待機状態となる。
【0024】ここで、検索者が検索キーワードが適切か
否かを調べるために自分が考えている言葉、例えば
「敬」などと品詞、例えば「名詞」などを思い浮かべた
とする。そしてキーワードとして、例えば「敬」と、品
詞情報、例えば「名詞」などが入力部1から入力される
と、CPU3により形態素解析処理および式の処理など
が成された後(図3のステップ301 )、その「敬」と
「名詞」の組み合わせた検索条件で、ファイル2内の文
書を一つ一つに対して文字列のマッチング処理(検索処
理)および品詞情報のマッチング処理が実行される(ス
テップ302 〜ステップ303 )。
否かを調べるために自分が考えている言葉、例えば
「敬」などと品詞、例えば「名詞」などを思い浮かべた
とする。そしてキーワードとして、例えば「敬」と、品
詞情報、例えば「名詞」などが入力部1から入力される
と、CPU3により形態素解析処理および式の処理など
が成された後(図3のステップ301 )、その「敬」と
「名詞」の組み合わせた検索条件で、ファイル2内の文
書を一つ一つに対して文字列のマッチング処理(検索処
理)および品詞情報のマッチング処理が実行される(ス
テップ302 〜ステップ303 )。
【0025】この場合、図4に示すように、テーブル2
0には、「敬」で始まる語句が 3つあるが、そのうち検
索条件41の品詞が「名詞」であるものは「敬順」およ
び「敬忠」の 2つなので、この 2つの語句が抽出され、
これらの語句を含む文書がヒットし、このヒットした文
書がCPU3の出力エリアに格納される(ステップ304
)。その後、その文書はCPU3から表示部4に出力
されて表示される。
0には、「敬」で始まる語句が 3つあるが、そのうち検
索条件41の品詞が「名詞」であるものは「敬順」およ
び「敬忠」の 2つなので、この 2つの語句が抽出され、
これらの語句を含む文書がヒットし、このヒットした文
書がCPU3の出力エリアに格納される(ステップ304
)。その後、その文書はCPU3から表示部4に出力
されて表示される。
【0026】このようにこの実施例の文書検索装置によ
れば、文書登録時に各語句に品詞情報として、例えば名
詞、動詞および形容詞などを付加してファイル2に保存
しておくことにより、文書検索時に、ユーザが所望の文
書を検索するために検索範囲をキーワードと品詞によっ
て限定した中で文書が検索される。
れば、文書登録時に各語句に品詞情報として、例えば名
詞、動詞および形容詞などを付加してファイル2に保存
しておくことにより、文書検索時に、ユーザが所望の文
書を検索するために検索範囲をキーワードと品詞によっ
て限定した中で文書が検索される。
【0027】すなわち、検索者が検索キーワードが適切
か否かを調べるために自分が考えている言葉、例えば
「敬」などと品詞、例えば「名詞」などを入力すれば、
ファイル2に登録された複数の文書の中で「敬」で始ま
る言葉で、かつ名詞である語句を含む文書が列挙される
ので、所望の文書を効率よく、かつ的確に検索すること
ができる。
か否かを調べるために自分が考えている言葉、例えば
「敬」などと品詞、例えば「名詞」などを入力すれば、
ファイル2に登録された複数の文書の中で「敬」で始ま
る言葉で、かつ名詞である語句を含む文書が列挙される
ので、所望の文書を効率よく、かつ的確に検索すること
ができる。
【0028】次に、図5および図7を参照して他の実施
例を説明する。
例を説明する。
【0029】図5はこの他の実施例の文書検索装置によ
りファイルに登録された語句、品詞情報および出現回数
との関係を示す図、図6は図5の文書検索装置の文書検
索動作を示すフローチャート、図7はこの文書検索装置
によって語句が検索される様子を模式的に示す図であ
る。
りファイルに登録された語句、品詞情報および出現回数
との関係を示す図、図6は図5の文書検索装置の文書検
索動作を示すフローチャート、図7はこの文書検索装置
によって語句が検索される様子を模式的に示す図であ
る。
【0030】この実施例の場合、形態素解析後、ファイ
ル2へ文書を登録する際、CPU3により、図5に示す
ように、テーブル(インデックスファイル)50が作成
される。
ル2へ文書を登録する際、CPU3により、図5に示す
ように、テーブル(インデックスファイル)50が作成
される。
【0031】このテーブル50は、形態素解析した文字
および語句などにそれぞれ品詞情報を対応付けたテーブ
ルであるが、これら文字や語句が、文書検索時にヒット
する度に頻度情報51が付加されるようになっている。
この頻度情報51は、ヒットする度に数値が加算される
ものである。
および語句などにそれぞれ品詞情報を対応付けたテーブ
ルであるが、これら文字や語句が、文書検索時にヒット
する度に頻度情報51が付加されるようになっている。
この頻度情報51は、ヒットする度に数値が加算される
ものである。
【0032】この文書検索装置では、文書を検索する場
合、入力部1を所定操作することによりCPU3は文書
検索状態となり、表示部4が検索文字列(キーワード)
の入力待機状態となる。
合、入力部1を所定操作することによりCPU3は文書
検索状態となり、表示部4が検索文字列(キーワード)
の入力待機状態となる。
【0033】ここで、上記実施例同様に、入力部1から
キーワード、例えば「敬」と、品詞情報、例えば「名
詞」などが入力されると、CPU3により形態素解析処
理および式の処理などが成された後(図6のステップ60
1 )、その「敬」と「名詞」の組み合わせた検索条件
で、ファイル2内の文書を一つ一つに対して文字列のマ
ッチング処理(検索処理)、品詞情報のマッチング処理
を行い(ステップ602 〜ステップ603 )、さらにこれら
のマッチング処理により得られた結果に対して頻度情報
のマッチング処理が実行される(ステップ604 )。
キーワード、例えば「敬」と、品詞情報、例えば「名
詞」などが入力されると、CPU3により形態素解析処
理および式の処理などが成された後(図6のステップ60
1 )、その「敬」と「名詞」の組み合わせた検索条件
で、ファイル2内の文書を一つ一つに対して文字列のマ
ッチング処理(検索処理)、品詞情報のマッチング処理
を行い(ステップ602 〜ステップ603 )、さらにこれら
のマッチング処理により得られた結果に対して頻度情報
のマッチング処理が実行される(ステップ604 )。
【0034】この場合、図7に示すように、テーブル5
0には、「敬」で始まる語句の 3つある。そのうち品詞
情報としての「名詞」は「敬順」および「敬忠」の 2つ
である。さらに、「敬順」および「敬忠」の頻度情報
は、それぞれ“16”と“6”である。この場合、検索
条件51に出現回数が10回以上という設定があり、「敬
順」および「敬忠」の中から出現回数が10回以上のも
の、つまり「敬順」 1つだけを含む文書が出力の対象と
なる。したがって「敬順」を含む文書のみがCPU3の
出力エリアに格納される(ステップ605 )。その後、そ
の文書はCPU3から表示部4に出力されて表示され
る。
0には、「敬」で始まる語句の 3つある。そのうち品詞
情報としての「名詞」は「敬順」および「敬忠」の 2つ
である。さらに、「敬順」および「敬忠」の頻度情報
は、それぞれ“16”と“6”である。この場合、検索
条件51に出現回数が10回以上という設定があり、「敬
順」および「敬忠」の中から出現回数が10回以上のも
の、つまり「敬順」 1つだけを含む文書が出力の対象と
なる。したがって「敬順」を含む文書のみがCPU3の
出力エリアに格納される(ステップ605 )。その後、そ
の文書はCPU3から表示部4に出力されて表示され
る。
【0035】このようにこの実施例の文書検索装置によ
れば、文書登録時に各語句に品詞情報として、例えば名
詞、動詞および形容詞などを付加してファイル2に保存
しておき、文書検索時に、ユーザが所望により入力部1
からキーワードと品詞情報を入力すれば、これら情報が
ヒットした頻度(出現回数)が10回以上のものについて
文書が検索されるので、さらに検索範囲を限定した中で
所望の文書を効率よく、かつ的確に検索することができ
る。なおこの文書検索装置では、出現回数を10回以上に
設定したが、この値は初期設定時点で所望により変更可
能である。
れば、文書登録時に各語句に品詞情報として、例えば名
詞、動詞および形容詞などを付加してファイル2に保存
しておき、文書検索時に、ユーザが所望により入力部1
からキーワードと品詞情報を入力すれば、これら情報が
ヒットした頻度(出現回数)が10回以上のものについて
文書が検索されるので、さらに検索範囲を限定した中で
所望の文書を効率よく、かつ的確に検索することができ
る。なおこの文書検索装置では、出現回数を10回以上に
設定したが、この値は初期設定時点で所望により変更可
能である。
【0036】またこの文書検索装置は、上記したフルテ
キスト検索のみに限定されるものではない。例えば入力
部1によって文字および文字列などが順次入力されて文
書を作成しその文書をファイル2に保存登録後、その文
書を呼び出すための任意の文字列、すなわちキーワード
を登録する、いわゆるキーワード検索の場合にも適用す
ることができる。
キスト検索のみに限定されるものではない。例えば入力
部1によって文字および文字列などが順次入力されて文
書を作成しその文書をファイル2に保存登録後、その文
書を呼び出すための任意の文字列、すなわちキーワード
を登録する、いわゆるキーワード検索の場合にも適用す
ることができる。
【0037】この場合、このキーワードとしては、一般
的に作成した文書を代表する意味の語句を登録すること
になるが、文書中に存在しない語句でもよい。この場
合、この語句が入力部2から入力されれば、その文書を
ダイレクトに検索できる。
的に作成した文書を代表する意味の語句を登録すること
になるが、文書中に存在しない語句でもよい。この場
合、この語句が入力部2から入力されれば、その文書を
ダイレクトに検索できる。
【0038】
【発明の効果】以上説明したように請求項1記載の文書
検索装置によれば、文書登録時に文字および語句に品詞
情報を付加して登録しておき、文書検索時にはキーワー
ドと品詞情報で検索範囲を限定した中で文書が検索され
るので、検索範囲を狭めて所望の文書を効率よく、かつ
的確に検索することができる。
検索装置によれば、文書登録時に文字および語句に品詞
情報を付加して登録しておき、文書検索時にはキーワー
ドと品詞情報で検索範囲を限定した中で文書が検索され
るので、検索範囲を狭めて所望の文書を効率よく、かつ
的確に検索することができる。
【0039】また請求項2記載の文書検索装置によれ
ば、文書登録時に文字および語句に品詞情報を付加して
登録しておき、文書検索時にはキーワード、品詞および
これらの情報がヒットした頻度の値で検索範囲をさらに
限定した中で文書を検索するので、検索範囲をさらに狭
めて所望の文書を効率よく、かつ的確に検索することが
できる。
ば、文書登録時に文字および語句に品詞情報を付加して
登録しておき、文書検索時にはキーワード、品詞および
これらの情報がヒットした頻度の値で検索範囲をさらに
限定した中で文書を検索するので、検索範囲をさらに狭
めて所望の文書を効率よく、かつ的確に検索することが
できる。
【図1】本発明に係る文書検索装置の一つの実施形態を
示す図である。
示す図である。
【図2】この文書検索装置によりファイルに登録された
語句と品詞情報との関係を示す図である。
語句と品詞情報との関係を示す図である。
【図3】この文書検索装置の文書検索動作を示すフロー
チャートである。
チャートである。
【図4】この文書検索装置により語句が検索される様子
を模式的に示す図である。
を模式的に示す図である。
【図5】他の実施例の文書検索装置によりファイルに登
録された語句、品詞情報および出現回数(ヒットした頻
度)との関係を示す図である。
録された語句、品詞情報および出現回数(ヒットした頻
度)との関係を示す図である。
【図6】図5の文書検索装置の文書検索動作を示すフロ
ーチャートである。
ーチャートである。
【図7】この文書検索装置により語句が検索される様子
を模式的に示す図である。
を模式的に示す図である。
【符号の説明】 1…入力部、2…ファイル、3…CPU、4…表示部。
Claims (2)
- 【請求項1】 ファイルに登録された所望の文書をキー
ワードによって検索する文書検索装置において、 文字列が入力される入力手段と、 前記入力手段から入力された文字列を単語および語句な
どに形態素解析する形態素解析手段と、 前記形態素解析手段により形態素解析された単語および
語句などにそれぞれ品詞情報を付加して前記ファイルに
登録する登録手段と、 文書検索時に、前記入力手段よりキーワードと共に品詞
情報が入力されたとき、これらの検索条件を基に該当す
る単語および語句を前記ファイルの各文書中から検索す
る検索手段と、 前記検索手段により検索された単語および語句を含む文
書を表示する表示手段とを具備したことを特徴とする文
書検索装置。 - 【請求項2】 ファイルに登録された所望の文書をキー
ワードによって検索する文書検索装置において、 文字列が入力される入力手段と、 前記入力手段から入力された文字列を単語および語句な
どに形態素解析する形態素解析手段と、 前記形態素解析手段により形態素解析された単語および
語句などにそれぞれ品詞情報を付加して前記ファイルに
登録する登録手段と、 文書検索時に、前記入力手段よりキーワードと共に品詞
情報が入力されたとき、これらの検索条件を基に該当す
る単語および語句を前記ファイルの各文書中から検索す
る検索手段と、 前記検索手段により文書中から単語および語句が検索さ
れる度にそれぞれがヒットする頻度を計数する計数手段
と、 前記計数手段により計数された頻度の値が所定値以上の
単語および語句を含む文書を表示する表示手段とを具備
したことを特徴とする文書検索装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7228919A JPH0973460A (ja) | 1995-09-06 | 1995-09-06 | 文書検索装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7228919A JPH0973460A (ja) | 1995-09-06 | 1995-09-06 | 文書検索装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0973460A true JPH0973460A (ja) | 1997-03-18 |
Family
ID=16883917
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP7228919A Withdrawn JPH0973460A (ja) | 1995-09-06 | 1995-09-06 | 文書検索装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0973460A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH1139347A (ja) * | 1997-07-24 | 1999-02-12 | Nec Corp | テキスト検索システム,インデックス作成装置,テキスト検索装置及びコンピュータ読み取り可能な記録媒体 |
-
1995
- 1995-09-06 JP JP7228919A patent/JPH0973460A/ja not_active Withdrawn
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH1139347A (ja) * | 1997-07-24 | 1999-02-12 | Nec Corp | テキスト検索システム,インデックス作成装置,テキスト検索装置及びコンピュータ読み取り可能な記録媒体 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6876998B2 (en) | Method for cross-linguistic document retrieval | |
| US5890103A (en) | Method and apparatus for improved tokenization of natural language text | |
| US4777600A (en) | Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms | |
| WO1997004405A9 (en) | Method and apparatus for automated search and retrieval processing | |
| JPH0418673A (ja) | テキスト情報抽出方法および装置 | |
| JPH03172966A (ja) | 類似文書検索装置 | |
| US6278990B1 (en) | Sort system for text retrieval | |
| JPH09198395A (ja) | 文書検索装置 | |
| JPH0944523A (ja) | 関連語提示装置 | |
| JP3123836B2 (ja) | テキスト型データベース装置 | |
| JPH0973460A (ja) | 文書検索装置 | |
| JP3222193B2 (ja) | 情報検索装置 | |
| JP2519121B2 (ja) | 情報検索装置 | |
| JPH07134720A (ja) | 文章作成システムにおける関連情報提示方法及び装置 | |
| JP2621999B2 (ja) | 文書処理装置 | |
| JPH08249341A (ja) | 文書データベースの文書格納・検索装置 | |
| JP3058275B1 (ja) | 検索装置 | |
| JPH09101951A (ja) | 文書検索装置 | |
| JPS63136264A (ja) | 機械翻訳装置 | |
| JPH0973454A (ja) | 文書作成装置及び文書作成方法 | |
| JPH05233686A (ja) | 日本語処理装置 | |
| JPH01185766A (ja) | かな漢字変換装置 | |
| WO2005098672A1 (ja) | 電子辞書 | |
| JPH0462665A (ja) | データ検索装置 | |
| JPH0462664A (ja) | データ検索装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20021203 |