JPH10198690A - 類似文書検索方法および類似文書検索装置 - Google Patents

類似文書検索方法および類似文書検索装置

Info

Publication number
JPH10198690A
JPH10198690A JP9002747A JP274797A JPH10198690A JP H10198690 A JPH10198690 A JP H10198690A JP 9002747 A JP9002747 A JP 9002747A JP 274797 A JP274797 A JP 274797A JP H10198690 A JPH10198690 A JP H10198690A
Authority
JP
Japan
Prior art keywords
case
search
keyword
document
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9002747A
Other languages
English (en)
Inventor
Naoki Fujita
直毅 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP9002747A priority Critical patent/JPH10198690A/ja
Publication of JPH10198690A publication Critical patent/JPH10198690A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 不要語なキーワードによるノイズを排除して
検索の精度を向上させることができるようにする。ま
た、検索対象を絞り込むことができるようにするによっ
て、検索の能率を向上させる。 【解決手段】 検索質問ベクトルの生成時に、キーワー
ドとしての不要語を指定することができるようにし、そ
の不要語を考慮した類似度を計算して検索を行うことが
できるようにする。また前回の検索結果を絞り込みデー
タとして一時的に保存しておき、次回の検索のとき、絞
り込み指定部によって絞り込みデータの中の上位何件か
を指定することによって検索対象を絞り込む。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、事例としての文書
を格納している事例データベースの中から利用者作成し
たいと思っている文書に類似した文書を検索するための
類似文書検索装置に関し、特に、検索手段としてベクト
ル空間法を用いて類似文書を検索する類似文書検索装置
に関する。
【0002】
【従来の技術】類似した文書を検索する方法としては、
検索対象の文書から抽出したキーワードをそれぞれ異な
るベクトルに対応させ、検索対象の文書をこれらのベク
トルの線形結合によって表現するベクトル空間法が知ら
れている。
【0003】このようなベクトル空間法は、例えば、特
開平6−4584号公報に開示されているように、多数
のキーワードを含む検索質問(ブール検索式)の作成が
困難な全文検索の欠点を解消する方法として提案されて
いる。
【0004】これに関連する技術として、例えば、特開
平8−55136号公報に開示されているように、類似
度の計算をファジー推論として定式化し、これをVLS
Iハードウエアアルゴリズムで実行させる高速化手法
や、特開平7−44570号公報に開示されているよう
に、対象となるベクトルが階層構造をなす場合にも適用
可能とする拡張等が考えられている。
【0005】しかし、上述のような従来の類似文書検索
装置は、適合フィードバックの操作を繰り返し行なうこ
とによって検索式の精錬を行なうのが一般的であり、検
索の結果として得らてた文書の集合を、更に別の検索式
によって絞り込むことができないという問題点を有して
いる。
【0006】また、たとえ絞り込みが可能であったとし
ても、あらかじめ検索されている一つの文書集合を対象
とした絞り込みにおいては、絞り込みの前に必要であっ
たキーワードが、その絞り込みのときにはノイズとなる
ため、検索精度が向上しないという欠点を有している。
【0007】
【発明が解決しようとする課題】上述したように、従来
の類似文書検索装置は、検索結果を絞り込み用のデータ
として一時的に記憶しておく手段がなく、また検索結果
に対して検索対象を指定する手段がないため、検索の結
果として得らてた文書の集合を、更に別の検索式によっ
て絞り込むことができないという問題点を有している。
【0008】また、たとえ絞り込みが可能であったとし
ても、事例文書と検索質問文書との類似度を計算するた
めの検索質問ベクトルを生成する前に不要語の指定がで
きず、従って不要語を考慮して類似度を計算することが
できないため、絞り込みの前に必要であったキーワード
がその絞り込みのときにはノイズとなって、検索精度が
向上しないという欠点を有している。
【0009】本発明の目的は、上述のような従来の類似
文書検索装置の欠点を解消するため、検索質問ベクトル
を生成する不要なキーワードを指定することを可能にし
て、検索精度を向上させることができ、また検索結果を
絞り込みをするときに、検索対象の事例文書を指定する
ことができるようにして、類似文書検索の能率を向上さ
せることができる類似文書検索方法および類似文書検索
装置を提供することにある。
【0010】
【課題を解決するための手段】本発明の類似文書検索方
法は、事例データベースに事例となる文書を格納してお
き、検索のときにキーワードとなる単語およびその同義
語をキーワード辞書に登録しておき、前記事例データベ
ース中の全事例文書における前記キーワードの出現頻度
と前記キーワードの出現する事例文書の頻度とを出現頻
度データとして事例頻度データ部に記憶しておき、前記
事例データベースに格納されている全事例文書のそれぞ
れの事例文書に対して前記キーワード辞書を参照してキ
ーワードを抽出して抽出したキーワードについて前記事
例頻度データ部の出現頻度データからあらかじめ事例ベ
クトルを生成しておき、マウスおよびキーボードおよび
ディスプレイを有する検索質問入力部から入力した検索
質問文書について利用者が不要であると指定したキーワ
ードがある場合はそのキーワードを除外したキーワード
を前記キーワード辞書を参照して抽出して抽出したキー
ワードについて前記事例頻度データ部の出現頻度データ
から検索質問ベクトルを生成し、前記検索質問ベクトル
と前記事例ベクトルとから所定の計算式によって前記事
例データベースの全事例文書のそれぞれの事例文書につ
いて類似度を計算し、前記類似度の計算結果によって前
記類似度の高い順に前記事例文書を並べた検索結果デー
タを生成し、必要に応じて生成した検索結果データを保
存し、次回の検索時に、利用者の指定によって保存して
いる前回の検索結果データの中から上位の任意の数の前
記事例文書を検索対象に指定することができることを含
むものである。
【0011】本発明の類似文書検索装置は、事例として
の文書を格納している事例データベースと、検索のとき
のキーワードとなる単語およびその同義語を登録してい
るキーワード辞書と、前記事例データベース中の全事例
文書における前記キーワードの出現頻度と前記キーワー
ドの出現する事例文書の頻度とを出現頻度データとして
記憶している事例頻度データ部と、前記事例データベー
スに格納されている全事例文書のそれぞれの事例文書に
対して前記キーワード辞書を参照してキーワードを抽出
し、抽出したキーワードについて前記事例頻度データ部
の出現頻度データから事例ベクトルを生成する事例ベク
トル生成部と、マウスおよびキーボードおよびディスプ
レイを有し検索質問文書を入力する検索質問入力部と、
前記検索質問入力部から入力した前記検索質問文書につ
いて不要なキーワードを指定する不要語指定部と、前記
検索質問入力部から入力した前記検索質問文書について
前記キーワード辞書を参照してキーワードを抽出し、抽
出したキーワードから前記不要語指定部が指定したキー
ワードを除外したキーワードについて前記事例頻度デー
タ部の前記出現頻度データから検索質問ベクトルを生成
する検索質問ベクトル生成部と、前記検索質問ベクトル
生成部の生成した前記検索質問ベクトルと前記事例ベク
トル生成部の生成した前記事例ベクトルとの類似度を所
定の計算式によって前記事例データベースの全事例文書
のそれぞれの事例文書について計算する類似度計算部
と、前記類似度計算部の計算結果によって前記類似度の
高い順に前記事例文書を並べた検索結果データを生成し
て保存する検索結果生成部と、次回の検索時に、利用者
の指定によって前記検索結果生成部に保存している前回
の検索結果データの中から上位の任意の数の前記事例文
書を検索対象に指定する絞り込み指定部とを備えるもの
であり、特に、状況に応じて不要語指定部または絞り込
み指定部の装備を省略したしたものである。
【0012】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。
【0013】図1は本発明の一実施形態を示すブロック
図、図2は図1の実施形態の動作を示すフローチャート
である。
【0014】図1の類似文書検索装置は、検索質問入力
部1と、事例データベース2と、キーワード辞書3と、
事例頻度データ部6と、検索質問ベクトル生成部5と、
事例ベクトル生成部7と、類似度計算部11と、検索結
果生成部12と、不要語指定部4と、絞り込み指定部1
3とを備えている。
【0015】検索質問入力部1は、マウスおよびキーボ
ードおよびディスプレイを使用して検索質問文書を入力
し、検索質問ベクトル生成部5に送る。
【0016】事例データベース2は、事例としての文書
(事例文書)を格納している。
【0017】キーワード辞書3は、検索のときのキーワ
ードとなる単語およびその同義語を登録している。
【0018】事例頻度データ部6は、キーワード辞書3
にあるキーワードが、事例データベース2中の全事例文
書に出現する回数(出現頻度)と、そのキーワードの出
現する事例文書の数(事例頻度)とを、出現頻度データ
として記憶する。
【0019】不要語指定部4は、検索質問ベクトル8の
キーワードのうちの不要なキーワードを指定する。
【0020】事例ベクトル生成部7は、事例データベー
ス2の中のすべての事例文書に対してキーワード辞書3
を参照してキーワードを抽出し、抽出したキーワードに
ついて事例頻度データ部6の出現頻度から所定の計算式
(詳細は後述)によって個々の事例文書毎の事例ベクト
ル9をあらかじめ生成しておく。
【0021】検索質問ベクトル生成部5は、検索質問入
力部1から入力した検索質問文書について、キーワード
辞書3を参照してキーワードを抽出し、不要語指定部4
から不要なキーワードの指定があった場合はそのキーワ
ードを除外して、抽出したキーワードについて事例頻度
データ部6の出現頻度データから所定の計算式(詳細は
後述)によって検索質問ベクトル8を生成する。
【0022】類似度計算部11は、検索質問ベクトル生
成部5が生成した検索質問ベクトル8と、事例ベクトル
生成部7が生成した事例ベクトル9との類似度を所定の
計算式(詳細は後述)によって事例文書毎に計算する。
1回の検索で検索質問ベクトルと全事例ベクトルとの比
較を行なう。
【0023】検索結果生成部12は、類似度計算部11
によって得られた結果によって類似度の高い順序に事例
文書を並べ、必要に応じてそれを絞り込みデータ10と
して記憶する。
【0024】絞り込み指定部13は、検索対象の事例文
書を、事例データベース2の中の全事例文書とするか、
または、検索結果生成部12の絞り込みデータ10の上
位数件(件数は任意)の事例文書とするかを指定する。
【0025】次に、上述のように構成した類似文書検索
装置の動作について、図2を参照して説明する。
【0026】類似文書検索装置は、あらかじめ、事例デ
ータベース2から事例文書を1件ずつずつ読み出し、事
例ベクトル生成部7によってキーワード辞書3を参照し
てキーワードを抽出し、抽出したキーワードについて事
例頻度データ部6の出現頻度データから次の式(1)の
計算式によって全事例文書について事例ベクトル9を生
成しておく。
【0027】
【0028】さて、検索質問入力部1により検索質問文
書を入力すると(ステップ21)、不要語指定部4によ
って、検索質問ベクトル8のキーワードのうちの不要な
キーワードを指定し(ステップ22)、検索質問ベクト
ル生成部5は、キーワード辞書3を参照してキーワード
として抽出し(ステップ23)、不要語指定部4によっ
て指定された不要なキーワードを除外して(ステップ2
4)、抽出したキーワードについて事例頻度データ部6
の出現頻度データから式(1)の計算式によって検索質
問ベクトル8を生成する(ステップ25)。
【0029】次に、類似度計算部11により、検索質問
ベクトル8と事例ベクトル9との類似度を次の式(2)
の計算式によって計算する(ステップ26)。
【0030】
【0031】次に、検索結果生成部12により、類似度
計算部11の計算結果から事例文書を類似度の高い順序
に並べ(ステップ27)、上位の事例文書を表示する
(ステップ28)。これによって所望の検索結果が得ら
れた場合は、検索処理を終了する。所望の検索結果が得
られない場合は、更に検索処理を継続する(ステップ2
9)。
【0032】検索処理を継続する場合は、次の2種の方
法を採用することができる。
【0033】第1番目の方法は、検索質問文書を変更す
るか、不要語を変更する方法である。第2番目の方法
は、検索結果の絞り込みを行う方法である。
【0034】第1番目の方法によるときは(ステップ3
0)、検索質問入力部1により検索質問文書を変更する
か、または不要語を変更し(ステップ31)、ステップ
21に戻る。
【0035】第2番目の方法によるときは、ステップ2
1〜ステップ25と同じ動作を行った後(ステップ32
〜ステップ36)、絞り込み指定部13によって、前回
の検索結果の上位の任意の数件を検索対象とするかを指
定し(ステップ37)、ステップ26に移行する。
【0036】
【発明の効果】以上説明したように、本発明の類似文書
検索方法および類似文書検索装置は、検索質問ベクトル
の生成時に、キーワードとしての不要語を指定すること
ができるようにし、その不要語を考慮した類似度を計算
して検索を行うことができるようにすることにより、不
要語なキーワードによるノイズを排除できるため、検索
の精度を向上させることができるという効果がある。ま
た、前回の検索結果を絞り込みデータとして一時的に保
存しておき、次回の検索のとき、絞り込み指定部によっ
て絞り込みデータの中の上位何件かを指定することによ
って検索対象を絞り込むことができるようにすることに
より、検索の能率を向上させることができるという効果
がある。
【図面の簡単な説明】
【図1】本発明の一実施形態を示すブロック図である。
【図2】図1の実施形態の動作を示すフローチャートで
ある。
【符号の説明】
1 検索質問入力部 2 事例データベース 3 キーワード辞書 4 不要語指定部 5 検索質問ベクトル生成部 6 事例頻度データ部 7 事例ベクトル生成部 8 検索質問ベクトル 9 事例ベクトル 10 絞り込みデータ 11 類似度計算部 12 検索結果生成部 13 絞り込み指定部 21〜42 ステップ

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 事例データベースに事例となる文書を格
    納しておき、 検索のときにキーワードとなる単語およびその同義語を
    キーワード辞書に登録しておき、 前記事例データベース中の全事例文書における前記キー
    ワードの出現頻度と前記キーワードの出現する事例文書
    の頻度とを出現頻度データとして事例頻度データ部に記
    憶しておき、 前記事例データベースに格納されている全事例文書のそ
    れぞれの事例文書に対して前記キーワード辞書を参照し
    てキーワードを抽出して抽出したキーワードについて前
    記事例頻度データ部の前記出現頻度データからあらかじ
    め事例ベクトルを生成しておき、 マウスおよびキーボードおよびディスプレイを有する検
    索質問入力部から入力した検索質問文書について利用者
    が不要であると指定したキーワードを除外したキーワー
    ドを前記キーワード辞書を参照して抽出して抽出したキ
    ーワードについて前記事例頻度データ部の出現頻度デー
    タから検索質問ベクトルを生成し、 前記検索質問ベクトルと前記事例ベクトルとから所定の
    計算式によって前記事例データベースの全事例文書のそ
    れぞれの事例文書について類似度を計算し、 前記類似度の計算結果によって前記類似度の高い順に前
    記事例文書を並べた検索結果データを生成することを含
    むことを特徴とする類似文書検索方法。
  2. 【請求項2】 事例データベースに事例となる文書を格
    納しておき、 検索のときにキーワードとなる単語およびその同義語を
    キーワード辞書に登録しておき、 前記事例データベース中の全事例文書における前記キー
    ワードの出現頻度と前記キーワードの出現する事例文書
    の頻度とを出現頻度データとして事例頻度データ部に記
    憶しておき、 前記事例データベースに格納されている全事例文書のそ
    れぞれの事例文書に対して前記キーワード辞書を参照し
    てキーワードを抽出して抽出したキーワードについて前
    記事例頻度データ部の出現頻度データからあらかじめ事
    例ベクトルを生成しておき、 マウスおよびキーボードおよびディスプレイを有する検
    索質問入力部から入力した検索質問文書について前記キ
    ーワード辞書を参照してキーワードを抽出して抽出した
    キーワードについて前記事例頻度データ部の前記出現頻
    度データから検索質問ベクトルを生成し、 前記検索質問ベクトルと前記事例ベクトルとから所定の
    計算式によって前記事例データベースの全事例文書のそ
    れぞれの事例文書について類似度を計算し、 前記類似度の計算結果によって前記類似度の高い順に前
    記事例文書を並べた検索結果データを生成して保存し、 次回の検索時に、利用者の指定によって保存している前
    回の検索結果データの中から上位の任意の数の前記事例
    文書を検索対象に指定することができることを含むこと
    を特徴とする類似文書検索方法。
  3. 【請求項3】 事例データベースに事例となる文書を格
    納しておき、 検索のときにキーワードとなる単語およびその同義語を
    キーワード辞書に登録しておき、 前記事例データベース中の全事例文書における前記キー
    ワードの出現頻度と前記キーワードの出現する事例文書
    の頻度とを出現頻度データとして事例頻度データ部に記
    憶しておき、 前記事例データベースに格納されている全事例文書のそ
    れぞれの事例文書に対して前記キーワード辞書を参照し
    てキーワードを抽出して抽出したキーワードについて前
    記事例頻度データ部の出現頻度データからあらかじめ事
    例ベクトルを生成しておき、 マウスおよびキーボードおよびディスプレイを有する検
    索質問入力部から入力した検索質問文書について利用者
    が不要であると指定したキーワードを除外したキーワー
    ドを前記キーワード辞書を参照して抽出して抽出したキ
    ーワードについて前記事例頻度データ部の出現頻度デー
    タから検索質問ベクトルを生成し、 前記検索質問ベクトルと前記事例ベクトルとから所定の
    計算式によって前記事例データベースの全事例文書のそ
    れぞれの事例文書について類似度を計算し、 前記類似度の計算結果によって前記類似度の高い順に前
    記事例文書を並べた検索結果データを生成して保存し、 次回の検索時に、利用者の指定によって保存している前
    回の検索結果データの中から上位の任意の数の前記事例
    文書を検索対象に指定することができることを含むこと
    を特徴とする類似文書検索方法。
  4. 【請求項4】 事例としての文書を格納している事例デ
    ータベースと、 検索のときのキーワードとなる単語およびその同義語を
    登録しているキーワード辞書と、 前記事例データベース中の全事例文書における前記キー
    ワードの出現頻度と前記キーワードの出現する事例文書
    の頻度とを出現頻度データとして記憶している事例頻度
    データ部と、 前記事例データベースに格納されている全事例文書のそ
    れぞれの事例文書に対して前記キーワード辞書を参照し
    てキーワードを抽出し、抽出したキーワードについて前
    記事例頻度データ部の出現頻度データから事例ベクトル
    を生成する事例ベクトル生成部と、 マウスおよびキーボードおよびディスプレイを有し検索
    質問文書を入力する検索質問入力部と、 前記検索質問入力部から入力した前記検索質問文書につ
    いて不要なキーワードを指定する不要語指定部と、 前記検索質問入力部から入力した前記検索質問文書につ
    いて前記キーワード辞書を参照してキーワードを抽出
    し、抽出したキーワードから前記不要語指定部が指定し
    たキーワードを除外したキーワードについて前記事例頻
    度データ部の前記出現頻度データから検索質問ベクトル
    を生成する検索質問ベクトル生成部と、 前記検索質問ベクトル生成部の生成した前記検索質問ベ
    クトルと前記事例ベクトル生成部の生成した前記事例ベ
    クトルとの類似度を所定の計算式によって前記事例デー
    タベースの全事例文書のそれぞれの事例文書について計
    算する類似度計算部と、 前記類似度計算部の計算結果によって前記類似度の高い
    順に前記事例文書を並べた検索結果データを生成する検
    索結果生成部とを備えることを特徴とする類似文書検索
    装置。
  5. 【請求項5】 事例としての文書を格納している事例デ
    ータベースと、 検索のときのキーワードとなる単語およびその同義語を
    登録しているキーワード辞書と、 前記事例データベース中の全事例文書における前記キー
    ワードの出現頻度と前記キーワードの出現する事例文書
    の頻度とを出現頻度データとして記憶している事例頻度
    データ部と、 前記事例データベースに格納されている全事例文書のそ
    れぞれの事例文書に対して前記キーワード辞書を参照し
    てキーワードを抽出し、抽出したキーワードについて前
    記事例頻度データ部の出現頻度データから事例ベクトル
    を生成する事例ベクトル生成部と、 マウスおよびキーボードおよびディスプレイを有し検索
    質問文書を入力する検索質問入力部と、 前記検索質問入力部から入力した前記検索質問文書につ
    いて前記キーワード辞書を参照してキーワードを抽出
    し、抽出したキーワードについて前記事例頻度データ部
    の前記出現頻度データから検索質問ベクトルを生成する
    検索質問ベクトル生成部と、 前記検索質問ベクトル生成部の生成した前記検索質問ベ
    クトルと前記事例ベクトル生成部の生成した前記事例ベ
    クトルとの類似度を所定の計算式によって前記事例デー
    タベースの全事例文書のそれぞれの事例文書について計
    算する類似度計算部と、 前記類似度計算部の計算結果によって前記類似度の高い
    順に前記事例文書を並べた検索結果データを生成して保
    存する検索結果生成部と、 次回の検索時に、利用者の指定によって前記検索結果生
    成部に保存している前回の検索結果データの中から上位
    の任意の数の前記事例文書を検索対象に指定する絞り込
    み指定部とを備えることを特徴とする類似文書検索装
    置。
  6. 【請求項6】 事例としての文書を格納している事例デ
    ータベースと、 検索のときのキーワードとなる単語およびその同義語を
    登録しているキーワード辞書と、 前記事例データベース中の全事例文書における前記キー
    ワードの出現頻度と前記キーワードの出現する事例文書
    の頻度とを出現頻度データとして記憶している事例頻度
    データ部と、 前記事例データベースに格納されている全事例文書のそ
    れぞれの事例文書に対して前記キーワード辞書を参照し
    てキーワードを抽出し、抽出したキーワードについて前
    記事例頻度データ部の出現頻度データから事例ベクトル
    を生成する事例ベクトル生成部と、 マウスおよびキーボードおよびディスプレイを有し検索
    質問文書を入力する検索質問入力部と、 前記検索質問入力部から入力した前記検索質問文書につ
    いて不要なキーワードを指定する不要語指定部と、 前記検索質問入力部から入力した前記検索質問文書につ
    いて前記キーワード辞書を参照してキーワードを抽出
    し、抽出したキーワードから前記不要語指定部が指定し
    たキーワードを除外したキーワードについて前記事例頻
    度データ部の前記出現頻度データから検索質問ベクトル
    を生成する検索質問ベクトル生成部と、 前記検索質問ベクトル生成部の生成した前記検索質問ベ
    クトルと前記事例ベクトル生成部の生成した前記事例ベ
    クトルとの類似度を所定の計算式によって前記事例デー
    タベースの全事例文書のそれぞれの事例文書について計
    算する類似度計算部と、 前記類似度計算部の計算結果によって前記類似度の高い
    順に前記事例文書を並べた検索結果データを生成して保
    存する検索結果生成部と、 次回の検索時に、利用者の指定によって前記検索結果生
    成部に保存している前回の検索結果データの中から上位
    の任意の数の前記事例文書を検索対象に指定する絞り込
    み指定部とを備えることを特徴とする類似文書検索装
    置。
JP9002747A 1997-01-10 1997-01-10 類似文書検索方法および類似文書検索装置 Pending JPH10198690A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9002747A JPH10198690A (ja) 1997-01-10 1997-01-10 類似文書検索方法および類似文書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9002747A JPH10198690A (ja) 1997-01-10 1997-01-10 類似文書検索方法および類似文書検索装置

Publications (1)

Publication Number Publication Date
JPH10198690A true JPH10198690A (ja) 1998-07-31

Family

ID=11537952

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9002747A Pending JPH10198690A (ja) 1997-01-10 1997-01-10 類似文書検索方法および類似文書検索装置

Country Status (1)

Country Link
JP (1) JPH10198690A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003316810A (ja) * 2002-04-23 2003-11-07 Just Syst Corp 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム
WO2020111329A1 (ko) * 2018-11-29 2020-06-04 주식회사 라이크어로컬 유사 사용자 매칭을 이용한 자동 답변 방법 및 시스템
CN112527971A (zh) * 2020-12-25 2021-03-19 华戎信息产业有限公司 一种相似文章的检索方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6446831A (en) * 1987-08-17 1989-02-21 Nippon Telegraph & Telephone Automatic key word extracting device
JPH0528190A (ja) * 1991-07-19 1993-02-05 Hitachi Ltd 情報検索用端末装置
JPH064584A (ja) * 1992-06-24 1994-01-14 Sharp Corp 文章検索装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6446831A (en) * 1987-08-17 1989-02-21 Nippon Telegraph & Telephone Automatic key word extracting device
JPH0528190A (ja) * 1991-07-19 1993-02-05 Hitachi Ltd 情報検索用端末装置
JPH064584A (ja) * 1992-06-24 1994-01-14 Sharp Corp 文章検索装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003316810A (ja) * 2002-04-23 2003-11-07 Just Syst Corp 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム
WO2020111329A1 (ko) * 2018-11-29 2020-06-04 주식회사 라이크어로컬 유사 사용자 매칭을 이용한 자동 답변 방법 및 시스템
CN112527971A (zh) * 2020-12-25 2021-03-19 华戎信息产业有限公司 一种相似文章的检索方法和系统

Similar Documents

Publication Publication Date Title
US5544049A (en) Method for performing a search of a plurality of documents for similarity to a plurality of query words
JP3225912B2 (ja) 情報検索装置、方法及び記録媒体
JPH07219969A (ja) 画像部品を検索する装置及びその方法
Béchet et al. Discovering linguistic patterns using sequence mining
JP3173411B2 (ja) 関連文書検索装置及び関連文書検索プログラムを記録した記録媒体
CN112612875A (zh) 一种查询词自动扩展方法、装置、设备及存储介质
JP4207438B2 (ja) Xml文書格納/検索装置及びそれに用いるxml文書格納/検索方法並びにそのプログラム
CN112199461A (zh) 基于块索引结构的文档检索方法、装置、介质和设备
JPH06314296A (ja) 情報検索システム
JP3930168B2 (ja) 文書検索方法、装置および文書検索プログラムを記録した記録媒体
JPH0816611A (ja) 自然言語に基づくデータ検索装置
JP6495206B2 (ja) 文書概念ベース生成装置、文書概念検索装置、方法、及びプログラム
JP7127351B2 (ja) 感性検索プログラム,情報処理装置および感性検索方法
JP4227797B2 (ja) 類義語検索装置、それによる類義語検索方法、類義語検索プログラム及び記憶媒体
JPH10198690A (ja) 類似文書検索方法および類似文書検索装置
JPH1145257A (ja) Web文書の検索支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2008197952A (ja) テキストセグメンテーション方法,その装置,そのプログラムおよびコンピュータ読み取り可能な記録媒体
JP3006526B2 (ja) 類似文書検索方法および類似文書検索装置
JPH11213004A (ja) データ処理装置及びその方法、及びそのプログラムを記憶した記憶媒体
JP2005173847A (ja) 情報検索装置、情報検索方法、プログラム及び該プログラムを記録した記録媒体
CN107368525B (zh) 搜索相关词的方法及装置、存储介质和终端设备
JPH06274546A (ja) 情報量一致度計算方式
JP2970443B2 (ja) 文書検索装置
JP2003022275A (ja) 文書検索システムおよび方法
JP3100955B2 (ja) 情報検索方法及び情報検索装置