JPH06215036A - ドキュメントコレクションの探索方法 - Google Patents
ドキュメントコレクションの探索方法Info
- Publication number
- JPH06215036A JPH06215036A JP5162989A JP16298993A JPH06215036A JP H06215036 A JPH06215036 A JP H06215036A JP 5162989 A JP5162989 A JP 5162989A JP 16298993 A JP16298993 A JP 16298993A JP H06215036 A JPH06215036 A JP H06215036A
- Authority
- JP
- Japan
- Prior art keywords
- document
- user
- documents
- collection
- sets
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【目的】 ユーザーが探索ワードを入力せずに、ドキュ
メントコレクションの中から、ユーザーにとって満足の
いくドキュメントセットを探索する。 【構成】 分割あるいはクラスタ化のアルゴリズムを用
いてドキュメントコレクションをドキュメントセットに
分割する(ステップ11)。自動要約アルゴリズムを用
いて、この各ドキュメントセットに対して、要約を作成
する(ステップ13)。ユーザーが、一つもしくはそれ
以上の要約を選択することができ(ステップ15)、選
択した要約に対応するドキュメントセットが新たなドキ
ュメントコレクションを形成する(ステップ20)。ユ
ーザーの満足するドキュメントセットを見つかるまで、
このドキュメントコレクションの分割、要約及び選択の
処理を繰り返して行う。
メントコレクションの中から、ユーザーにとって満足の
いくドキュメントセットを探索する。 【構成】 分割あるいはクラスタ化のアルゴリズムを用
いてドキュメントコレクションをドキュメントセットに
分割する(ステップ11)。自動要約アルゴリズムを用
いて、この各ドキュメントセットに対して、要約を作成
する(ステップ13)。ユーザーが、一つもしくはそれ
以上の要約を選択することができ(ステップ15)、選
択した要約に対応するドキュメントセットが新たなドキ
ュメントコレクションを形成する(ステップ20)。ユ
ーザーの満足するドキュメントセットを見つかるまで、
このドキュメントコレクションの分割、要約及び選択の
処理を繰り返して行う。
Description
【0001】
【産業上の利用分野】本発明は、ドキュメントコレクシ
ョンの探索方法に関し、特にドキュメントの探索、分類
及び探索の改良に関する。
ョンの探索方法に関し、特にドキュメントの探索、分類
及び探索の改良に関する。
【0002】
【従来の技術】ますます多量のドキュメントが出版さ
れ、参考文献として利用できる現在の社会において、ド
キュメントの探索あるいは検索は重要になってきてい
る。このように膨大なドキュメントの中から、ユーザー
の望む特別なドキュメントを探し出すことが難しいこと
が、膨大なドキュメントの抱える問題の一つである。
れ、参考文献として利用できる現在の社会において、ド
キュメントの探索あるいは検索は重要になってきてい
る。このように膨大なドキュメントの中から、ユーザー
の望む特別なドキュメントを探し出すことが難しいこと
が、膨大なドキュメントの抱える問題の一つである。
【0003】ユーザーがキーワードあるいはフレーズ
を、例えば、コンピュータに入力すると、入力したキー
ワードあるいはフレーズを含むドキュメントを、ドキュ
メントの全体(あるいはこのドキュメントの全体から作
られるワードインデクスあるいはルックアップテーブ
ル)の中から探索できる多くのシステムが提案され、ま
た今日稼動している。
を、例えば、コンピュータに入力すると、入力したキー
ワードあるいはフレーズを含むドキュメントを、ドキュ
メントの全体(あるいはこのドキュメントの全体から作
られるワードインデクスあるいはルックアップテーブ
ル)の中から探索できる多くのシステムが提案され、ま
た今日稼動している。
【0004】
【発明が解決しようとする課題】しかしながら、ユーザ
ーが望むドキュメントあるいはドキュメントのセットに
おいて使用されるワードあるいはフレーズが独特のもの
でない限り、数多くのドキュメントが探索され、扱いや
すいヒット数に減らすためにユーザーに追加の入力を要
求することがよくある。
ーが望むドキュメントあるいはドキュメントのセットに
おいて使用されるワードあるいはフレーズが独特のもの
でない限り、数多くのドキュメントが探索され、扱いや
すいヒット数に減らすためにユーザーに追加の入力を要
求することがよくある。
【0005】しかも、記事やドキュメントの著者によっ
ては、異なるワードを同じか似た意味に用いることがよ
くある。ユーザーがさまざまな異なるワードを指定しな
い限り、入力されたワードあるいはフレーズによって
は、関連するドキュメントが探索されないということが
よくあることである。そこで、本発明の目的は、ユーザ
ーが探索ワードを入力せずに、ドキュメントのコレクシ
ョンの中から、ユーザーにとって満足のいくドキュメン
トセットを探索するドキュメント探索方法を提供するこ
とである。
ては、異なるワードを同じか似た意味に用いることがよ
くある。ユーザーがさまざまな異なるワードを指定しな
い限り、入力されたワードあるいはフレーズによって
は、関連するドキュメントが探索されないということが
よくあることである。そこで、本発明の目的は、ユーザ
ーが探索ワードを入力せずに、ドキュメントのコレクシ
ョンの中から、ユーザーにとって満足のいくドキュメン
トセットを探索するドキュメント探索方法を提供するこ
とである。
【0006】本発明の他の目的は、ドキュメント自動分
割及びドキュメント自動要約アルゴリズムを用いて、ユ
ーザーにとって満足のいくドキュメントセットを探索す
るドキュメント探索方法を提供することである。
割及びドキュメント自動要約アルゴリズムを用いて、ユ
ーザーにとって満足のいくドキュメントセットを探索す
るドキュメント探索方法を提供することである。
【0007】
【課題を解決するための手段】上記目的を達成するため
に本発明に係わるドキュメント探索方法は、ユーザが探
索するためのワードを入力することなくユーザが満足で
きるドキュメントのセットをドキュメントコレクション
の中から探索するものであり、(a)上記ドキュメント
コレクションをドキュメントセットに分割し、(b)上
記分割された各ドキュメントセットに対して各要約を作
成し、(c)探索対象の上記ドキュメントコレクション
を限定するために、少なくとも1つの上記要約から探索
したい上記ドキュメントセットを選択して、これら選択
されたドキュメントセットからなる新たなドキュメント
コレクションを定義し、(d)ユーザが満足できるドキ
ュメントセットが作られるまで上記(a)〜(c)を繰
り返すことからなる。
に本発明に係わるドキュメント探索方法は、ユーザが探
索するためのワードを入力することなくユーザが満足で
きるドキュメントのセットをドキュメントコレクション
の中から探索するものであり、(a)上記ドキュメント
コレクションをドキュメントセットに分割し、(b)上
記分割された各ドキュメントセットに対して各要約を作
成し、(c)探索対象の上記ドキュメントコレクション
を限定するために、少なくとも1つの上記要約から探索
したい上記ドキュメントセットを選択して、これら選択
されたドキュメントセットからなる新たなドキュメント
コレクションを定義し、(d)ユーザが満足できるドキ
ュメントセットが作られるまで上記(a)〜(c)を繰
り返すことからなる。
【0008】上記ドキュメントコレクションのドキュメ
ントセットへの分割及びドキュメントセットの要約作成
ステップは、自動ドキュメント分割・要約アルゴリズム
を実施することによって行う。このドキュメント自動分
割アルゴリズムはクラスターアルゴリズムあるいはフラ
クションアルコリズムのような線型分割アルゴリズムを
使用することが出来る。
ントセットへの分割及びドキュメントセットの要約作成
ステップは、自動ドキュメント分割・要約アルゴリズム
を実施することによって行う。このドキュメント自動分
割アルゴリズムはクラスターアルゴリズムあるいはフラ
クションアルコリズムのような線型分割アルゴリズムを
使用することが出来る。
【0009】
【作用】本発明では、ドキュメントコレクションをドキ
ュメントセットに分割して、この分割された各ドキュメ
ントセットに対して各要約を作成して、少なくとも1つ
のこの要約から探索したい上記ドキュメントセットを選
択することによって、ドキュメントコレクションを限定
できる。これら選択されたドキュメントセットに対し
て、上記ドキュメントに分割、要約作成、ドキュメント
セットの選択を繰り返すことによって、ユーザが探索す
るためのワードを入力することなくユーザが満足できる
ドキュメントのセットを探索することが出来る。
ュメントセットに分割して、この分割された各ドキュメ
ントセットに対して各要約を作成して、少なくとも1つ
のこの要約から探索したい上記ドキュメントセットを選
択することによって、ドキュメントコレクションを限定
できる。これら選択されたドキュメントセットに対し
て、上記ドキュメントに分割、要約作成、ドキュメント
セットの選択を繰り返すことによって、ユーザが探索す
るためのワードを入力することなくユーザが満足できる
ドキュメントのセットを探索することが出来る。
【0010】
【実施例】以下、図面を参照して、本発明の実施例を説
明する。本発明では、ドキュメントのコレクションの中
から、ユーザーが望むドキュメントあるいはドキュメン
トセットを識別するためコンピュータを援用する。図1
は、本発明に係わるドキュメント探索方法を示すフロー
チャートである。以下、図1に基づいてドキュメント探
索方法を説明する。ステップ11において、ドキュメン
トコレクションをセットに分割するプログラムあるいは
アルゴリズムを用いて、ドキュメントコレクションをセ
ットに分割する。このプログラムは、例えば、ワードの
頻度、キーワードの存在あるいは他の基準を用いた所定
の基準に従って、自動的にドキュメントを分割するプロ
グラムを使用することが出来る。分割アルゴリズムは、
例えば、公知であるフラクションあるいはクラスタアル
ゴリリズムを使用することが出来る。分割プログラム
は、探索対象のドキュメントコレクションの含まれるド
キュメントの数が膨大になれば、特に線型的であること
が望ましいが、ドキュメントの数に対して、幾何級数的
あるいは指数的に増加するものであっても使用可能であ
る。
明する。本発明では、ドキュメントのコレクションの中
から、ユーザーが望むドキュメントあるいはドキュメン
トセットを識別するためコンピュータを援用する。図1
は、本発明に係わるドキュメント探索方法を示すフロー
チャートである。以下、図1に基づいてドキュメント探
索方法を説明する。ステップ11において、ドキュメン
トコレクションをセットに分割するプログラムあるいは
アルゴリズムを用いて、ドキュメントコレクションをセ
ットに分割する。このプログラムは、例えば、ワードの
頻度、キーワードの存在あるいは他の基準を用いた所定
の基準に従って、自動的にドキュメントを分割するプロ
グラムを使用することが出来る。分割アルゴリズムは、
例えば、公知であるフラクションあるいはクラスタアル
ゴリリズムを使用することが出来る。分割プログラム
は、探索対象のドキュメントコレクションの含まれるド
キュメントの数が膨大になれば、特に線型的であること
が望ましいが、ドキュメントの数に対して、幾何級数的
あるいは指数的に増加するものであっても使用可能であ
る。
【0011】使用可能なクラスタアルゴリズムについて
の論文が、Jonesによる1991年2月発行の”Notes
and reference on early automatic classification wo
rk”の10〜17ページに記載されており、参考のために引
用した。使用できるアルゴリズムの一つの例として、1
985年ACM の197 〜203 ページ、Yu他による”Adapti
ve Document Clustering”記載されており、参考のため
に引用した。階層化ドキュメントクラスタ化の別の一例
が、1988年のInformation Processing & Managemen
t の vol.24 、No.5、577 〜597 ページ、Willett によ
る”Recent Trends in Hierarchic Document Clusterin
g:A Critical Review ”に記載されており、参考のため
に引用した。
の論文が、Jonesによる1991年2月発行の”Notes
and reference on early automatic classification wo
rk”の10〜17ページに記載されており、参考のために引
用した。使用できるアルゴリズムの一つの例として、1
985年ACM の197 〜203 ページ、Yu他による”Adapti
ve Document Clustering”記載されており、参考のため
に引用した。階層化ドキュメントクラスタ化の別の一例
が、1988年のInformation Processing & Managemen
t の vol.24 、No.5、577 〜597 ページ、Willett によ
る”Recent Trends in Hierarchic Document Clusterin
g:A Critical Review ”に記載されており、参考のため
に引用した。
【0012】他にも公知であるドキュメント分割技術が
あり、これらの技術を使用することによってドキュメン
トコレクションをセットに分割することが出来る。いく
ら基準の数があっても、この基準に従って、セットを決
定することが出来る。例えば、上述したInformation Pr
ocessing & Management のvol.24、No.5、577 〜597 ペ
ージ、”Recent Trends in Hierarchic Document Clust
ering:A Critical Review ”において、Peter Willett
は、ドキュメント探索のための階層型凝集クラスタ化方
法の使用について論じている。Willett はそこで、ドキ
ュメント間の類似についての計算及びドキュメントのク
ラスタ化にとって適切なクラスタ化方法を導入し、これ
らの方法を平凡でない大きさのデータベースに実施でき
るようなアルゴリズムについて論じており、ランダムグ
ラフ理論とクラスタ化すべきドキュメントコレクション
の経験的な特徴に基づたテストを行って、ドキュメント
の階層化ができることを確認している。Willett は、階
層化されたドキュメントを探索範囲とすることができる
ことを示している。
あり、これらの技術を使用することによってドキュメン
トコレクションをセットに分割することが出来る。いく
ら基準の数があっても、この基準に従って、セットを決
定することが出来る。例えば、上述したInformation Pr
ocessing & Management のvol.24、No.5、577 〜597 ペ
ージ、”Recent Trends in Hierarchic Document Clust
ering:A Critical Review ”において、Peter Willett
は、ドキュメント探索のための階層型凝集クラスタ化方
法の使用について論じている。Willett はそこで、ドキ
ュメント間の類似についての計算及びドキュメントのク
ラスタ化にとって適切なクラスタ化方法を導入し、これ
らの方法を平凡でない大きさのデータベースに実施でき
るようなアルゴリズムについて論じており、ランダムグ
ラフ理論とクラスタ化すべきドキュメントコレクション
の経験的な特徴に基づたテストを行って、ドキュメント
の階層化ができることを確認している。Willett は、階
層化されたドキュメントを探索範囲とすることができる
ことを示している。
【0013】また、数種類の異なるタイプの階層型凝集
クラスタ化方法を用いて、クラスタ化を行ない、その結
果生じたクラスタを探索すべき範囲として使用した一連
の研究プロジェクトの結果が示されている。また、完全
なリンケージ方法(completelinkage method) 、最も近
接する近接クラスタ方法(nearest neighbor clustermet
hod) 等が論じられている。
クラスタ化方法を用いて、クラスタ化を行ない、その結
果生じたクラスタを探索すべき範囲として使用した一連
の研究プロジェクトの結果が示されている。また、完全
なリンケージ方法(completelinkage method) 、最も近
接する近接クラスタ方法(nearest neighbor clustermet
hod) 等が論じられている。
【0014】また、ドキュメントの内容を識別する他の
例として、1990年6月にニュージャージ州のアトラ
ンタでの第10回パターン認識国際会議において、Tsuj
imoto 他によって発表された、”Understanding Multi-
Articled Document ”がある。この論文は、ドキュメン
トを文字認識してこれによって内容の意味を判別すると
いうやり方によらず、ドキュメントを理解する方法を論
じている。それは、ドキュメントが明らかに幾何的な階
層構造をもっており、少しの規則を用いるだけで、この
幾何的な階層構造をドキュメントのもつ意味を表す論理
構造に変換できることを示している。
例として、1990年6月にニュージャージ州のアトラ
ンタでの第10回パターン認識国際会議において、Tsuj
imoto 他によって発表された、”Understanding Multi-
Articled Document ”がある。この論文は、ドキュメン
トを文字認識してこれによって内容の意味を判別すると
いうやり方によらず、ドキュメントを理解する方法を論
じている。それは、ドキュメントが明らかに幾何的な階
層構造をもっており、少しの規則を用いるだけで、この
幾何的な階層構造をドキュメントのもつ意味を表す論理
構造に変換できることを示している。
【0015】上述したドキュメントコレクションの分割
によって生じるセットの数は所望により調整することが
出来るが、ユーザーに関心のありそうなドキュンメント
を効率的に選択したり、効率的に分離するためにユーザ
ーが簡単にソートできる程度の数が望ましい。セットの
数は15〜20の数が理想的である。ドキュメントがセ
ットに分割されたあと、ステップ13において分割され
た各セットに対して要約が作成される。この要約は、例
えば、公知の自動要約アルゴリズムを用いて作成され
る。
によって生じるセットの数は所望により調整することが
出来るが、ユーザーに関心のありそうなドキュンメント
を効率的に選択したり、効率的に分離するためにユーザ
ーが簡単にソートできる程度の数が望ましい。セットの
数は15〜20の数が理想的である。ドキュメントがセ
ットに分割されたあと、ステップ13において分割され
た各セットに対して要約が作成される。この要約は、例
えば、公知の自動要約アルゴリズムを用いて作成され
る。
【0016】図2は、要約処理を示すフローチャートで
ある。ステップ31において、ドキュメントのなかでそ
の内容を良く表すワードが決定され、ステップ32にお
いてそのワードの使用頻度が決定される。ドキュメント
のなかでその内容を良く表すワードは、例えば、各ドキ
ュメントのなかで最も使用頻度の高いワードを見つけだ
す逆ドキュメント使用頻度法(Inverse Document Frequ
ency(IDF) )を用いて、識別される。ステップ32にお
いて、そのワードを含むドキュメント内の文章が表示さ
れる。
ある。ステップ31において、ドキュメントのなかでそ
の内容を良く表すワードが決定され、ステップ32にお
いてそのワードの使用頻度が決定される。ドキュメント
のなかでその内容を良く表すワードは、例えば、各ドキ
ュメントのなかで最も使用頻度の高いワードを見つけだ
す逆ドキュメント使用頻度法(Inverse Document Frequ
ency(IDF) )を用いて、識別される。ステップ32にお
いて、そのワードを含むドキュメント内の文章が表示さ
れる。
【0017】要約が、例えば、コンピュータモニタ上に
表示される。図1のステップ15において、表示された
要約に対して、例えば、マウス、ジョイスチック等のコ
ンピュータへの入力手段を用いて、1つもしくはそれ以
上の要約を選択することによって、対応した1つもしく
はそれ以上のドキュメントのセットを選択することが出
来る。
表示される。図1のステップ15において、表示された
要約に対して、例えば、マウス、ジョイスチック等のコ
ンピュータへの入力手段を用いて、1つもしくはそれ以
上の要約を選択することによって、対応した1つもしく
はそれ以上のドキュメントのセットを選択することが出
来る。
【0018】ステップ15において、ユーザーは表示さ
れたドキュメントセットが満足するものであるかどうか
を判断する。そのドキュメントセットが満足できる場合
は、ステップ18において、そのセットに含まれるドキ
ュメントの内容が、印刷あるいは、熟読等のために、ユ
ーザーに表示される。一方、選択されたセットに余り多
くのドキュメントが含まれているようだと、選択される
ドキュメントの数を減らすために、以下の処理がされ
る。
れたドキュメントセットが満足するものであるかどうか
を判断する。そのドキュメントセットが満足できる場合
は、ステップ18において、そのセットに含まれるドキ
ュメントの内容が、印刷あるいは、熟読等のために、ユ
ーザーに表示される。一方、選択されたセットに余り多
くのドキュメントが含まれているようだと、選択される
ドキュメントの数を減らすために、以下の処理がされ
る。
【0019】ステップ20において、ユーザーによって
ドキュメントの分割によって作成されたドキュメントの
各セットに対して一つあるいはそれ以上の選択されたセ
ットがドキュメントの新しいコレクションを形成する。
この新しいドキュメントのコレクションが、ステップ1
3において、再度分割され、ステップ15において、再
度要約が作成される。そして、この再度作成された要約
が、ユーザーに表示され、希望する場合は更に再選択さ
れる。この時、分割アルゴリズムは、選択されたドキュ
メントセットのなかでドキュメントの差に基づいてさら
に細かいパーティションを作成するタイプであり、ドキ
ュメントが前に分割されたコレクションにおいて、全ド
キュメントに共通な特別な探索ワード基づいて、分割を
行うものでないことが望ましい。
ドキュメントの分割によって作成されたドキュメントの
各セットに対して一つあるいはそれ以上の選択されたセ
ットがドキュメントの新しいコレクションを形成する。
この新しいドキュメントのコレクションが、ステップ1
3において、再度分割され、ステップ15において、再
度要約が作成される。そして、この再度作成された要約
が、ユーザーに表示され、希望する場合は更に再選択さ
れる。この時、分割アルゴリズムは、選択されたドキュ
メントセットのなかでドキュメントの差に基づいてさら
に細かいパーティションを作成するタイプであり、ドキ
ュメントが前に分割されたコレクションにおいて、全ド
キュメントに共通な特別な探索ワード基づいて、分割を
行うものでないことが望ましい。
【0020】このような処理を繰り返し行なって、ユー
ザーにとって満足できる最終的なセットに分割されるま
で、ドキュメントのセットが小さくされる。このよう
に、分割、要約、セットの選択の各ステップを繰り返し
行うことによって最終的にユーザーの望むセットにドキ
ュメントを分割・選択ができる。発明は、ある程度特別
な場合において説明したが、勿論これに限定されること
なく、その組合せ等を変更して使用することが可能であ
る。
ザーにとって満足できる最終的なセットに分割されるま
で、ドキュメントのセットが小さくされる。このよう
に、分割、要約、セットの選択の各ステップを繰り返し
行うことによって最終的にユーザーの望むセットにドキ
ュメントを分割・選択ができる。発明は、ある程度特別
な場合において説明したが、勿論これに限定されること
なく、その組合せ等を変更して使用することが可能であ
る。
【0021】
【発明の効果】以上説明したように本発明では、ユーザ
ーが探索ワードを入力せずに、ドキュメントのコレクシ
ョンの中から、ユーザーにとって満足のいくドキュメン
トセットを探索することができる。
ーが探索ワードを入力せずに、ドキュメントのコレクシ
ョンの中から、ユーザーにとって満足のいくドキュメン
トセットを探索することができる。
【図1】ドキュメント探索方法を示すフローチャートで
ある。
ある。
【図2】要約処理を示すフローチャートである。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 マイケル ジェイ.バーバリーノ アメリカ合衆国 カリフォルニア州 94038 モス ビーチ ピー.オー.ボッ クス 853
Claims (1)
- 【請求項1】 ユーザが探索するためのワードを入力す
ることなくユーザが満足できるドキュメントのセットを
ドキュメントコレクションの中から探索するドキュメン
トコレクションの探索方法において、 (a)上記ドキュメントコレクションをドキュメントセ
ットに分割し、 (b)上記分割された各ドキュメントセットに対して各
要約を作成し、 (c)探索対象の上記ドキュメントコレクションを限定
するために、少なくとも1つの上記要約から探索したい
上記ドキュメントセットを選択して、これら選択された
ドキュメントセットからなる新たなドキュメントコレク
ションを定義し、 (d)ユーザが満足できるドキュメントセットが作られ
るまで上記(a)〜(c)を繰り返すことからなる、ド
キュメントコレクションの探索方法。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US98853492A | 1992-12-10 | 1992-12-10 | |
| US988534 | 1992-12-10 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH06215036A true JPH06215036A (ja) | 1994-08-05 |
Family
ID=25534225
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP5162989A Withdrawn JPH06215036A (ja) | 1992-12-10 | 1993-06-30 | ドキュメントコレクションの探索方法 |
Country Status (2)
| Country | Link |
|---|---|
| EP (1) | EP0601759A1 (ja) |
| JP (1) | JPH06215036A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6826724B1 (en) | 1998-12-24 | 2004-11-30 | Ricoh Company, Ltd. | Document processor, document classification device, document processing method, document classification method, and computer-readable recording medium for recording programs for executing the methods on a computer |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3282937B2 (ja) * | 1995-01-12 | 2002-05-20 | 日本アイ・ビー・エム株式会社 | 情報検索方法及びシステム |
| JPH11505342A (ja) * | 1995-02-27 | 1999-05-18 | アンフォルマシオン メディカル エ スタティスティーク | 情報オブジェクト、特に文書、を処理しアクセスする方法および該方法を実施するためのシステム |
| EP0820027B1 (en) * | 1996-07-18 | 2002-05-29 | Matsushita Electric Industrial Co., Ltd. | Data retrieval support apparatus |
| EP0883069A1 (en) | 1997-06-06 | 1998-12-09 | Matsushita Electric Industrial Co., Ltd. | A retrieval menu creation device and method, and a recording medium storing a retrieval menu creation program |
| US5995978A (en) * | 1997-09-24 | 1999-11-30 | Ricoh Company, Ltd. | Navigation system for document image database |
| DE10031351A1 (de) | 2000-06-28 | 2002-01-17 | Guru Netservices Gmbh | Verfahren zur automatischen Recherche |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2783558B2 (ja) * | 1988-09-30 | 1998-08-06 | 株式会社東芝 | 要約生成方法および要約生成装置 |
| US5442778A (en) * | 1991-11-12 | 1995-08-15 | Xerox Corporation | Scatter-gather: a cluster-based method and apparatus for browsing large document collections |
-
1993
- 1993-06-30 JP JP5162989A patent/JPH06215036A/ja not_active Withdrawn
- 1993-11-29 EP EP93309504A patent/EP0601759A1/en not_active Withdrawn
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6826724B1 (en) | 1998-12-24 | 2004-11-30 | Ricoh Company, Ltd. | Document processor, document classification device, document processing method, document classification method, and computer-readable recording medium for recording programs for executing the methods on a computer |
Also Published As
| Publication number | Publication date |
|---|---|
| EP0601759A1 (en) | 1994-06-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6826576B2 (en) | Very-large-scale automatic categorizer for web content | |
| US5819258A (en) | Method and apparatus for automatically generating hierarchical categories from large document collections | |
| US5787422A (en) | Method and apparatus for information accesss employing overlapping clusters | |
| CA2248793C (en) | Statistical thesaurus, method of forming same, and use thereof in query expansion in automated text searching | |
| EP1573660B1 (en) | Identifying critical features in ordered scale space | |
| CN100462961C (zh) | 组织多个文档的方法以及显示多个文档的设备 | |
| EP1199647A2 (en) | Methods, apparatus and computer program products for information retrieval and document classification utilizing a multidimensional subspace | |
| US20030126561A1 (en) | Taxonomy generation | |
| Willett | Document clustering using an inverted file approach | |
| Lin et al. | ACIRD: intelligent Internet document organization and retrieval | |
| US20050154713A1 (en) | Systems and methods for determining document relationship and automatic query expansion | |
| Hull | Information retrieval using statistical classification | |
| JPH06215036A (ja) | ドキュメントコレクションの探索方法 | |
| Kostoff et al. | Fractals text mining using bibliometrics and database tomography | |
| JPH06282587A (ja) | 文書の自動分類方法及び装置並びに分類用の辞書作成方法及び装置 | |
| JP2002183175A (ja) | テキストマイニング方法 | |
| JP2005063157A (ja) | 文書クラスタ抽出装置および方法 | |
| Trieschnigg et al. | Hierarchical topic detection in large digital news archives | |
| de Andrade Lopes et al. | Mapping texts through dimensionality reduction and visualization techniques for interactive exploration of document collections | |
| CN1669023A (zh) | 为对象分类的自动确定显著特点的方法和装置 | |
| Antai et al. | The use of latent semantic indexing to cluster documents into their subject areas | |
| Spangler et al. | Interactive methods of taxonomy editing and validation | |
| Benbrahim et al. | Neighbourhood exploitation in hypertext categorization | |
| JP2014130498A (ja) | ファセットを提示する装置及び方法 | |
| Milic-Frayling et al. | CLARIT compound queries and constraint-controlled feedback in TREC-5 Ad-Hoc experiments |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20000905 |