JPH08161348A - 文書フィルタリング方法及び文書処理装置 - Google Patents
文書フィルタリング方法及び文書処理装置Info
- Publication number
- JPH08161348A JPH08161348A JP6298237A JP29823794A JPH08161348A JP H08161348 A JPH08161348 A JP H08161348A JP 6298237 A JP6298237 A JP 6298237A JP 29823794 A JP29823794 A JP 29823794A JP H08161348 A JPH08161348 A JP H08161348A
- Authority
- JP
- Japan
- Prior art keywords
- document
- elapsed time
- received
- identifier
- matching degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【目的】 文書の内容とユーザの関心との合致度だけで
なく、文書の鮮度(新しさ)も考慮してフィルタリング
を行うようにした文書フィルタリング方法及び文書処理
装置を提供することを目的とする。 【構成】 受信した文書をフィルタリングして提示する
文書フィルタリング方法及び文書処理装置において、予
め設定された識別子と受信文書の経過時間とから提示す
べき文書を選別(108)し、該選別された文書を提示
(110)する。前記提示文書の選別では、受信文書の
識別子と前記予め設定された識別子との合致度を計算
(104)し、前記経過時間に応じて設定される閾値と
前記合致度との比較に基づいて、受信文書の提示/非提
示を判定する。または、前記合致度と経過時間とに応じ
て受信文書にスコアを与え、前記スコアと所定の閾値と
の比較に基づいて、受信文書の提示/非提示を判定す
る。ここで、前記経過時間は、前記受信文書の作成から
または受信からのいずれか、又は作成から及び受信から
の双方である。
なく、文書の鮮度(新しさ)も考慮してフィルタリング
を行うようにした文書フィルタリング方法及び文書処理
装置を提供することを目的とする。 【構成】 受信した文書をフィルタリングして提示する
文書フィルタリング方法及び文書処理装置において、予
め設定された識別子と受信文書の経過時間とから提示す
べき文書を選別(108)し、該選別された文書を提示
(110)する。前記提示文書の選別では、受信文書の
識別子と前記予め設定された識別子との合致度を計算
(104)し、前記経過時間に応じて設定される閾値と
前記合致度との比較に基づいて、受信文書の提示/非提
示を判定する。または、前記合致度と経過時間とに応じ
て受信文書にスコアを与え、前記スコアと所定の閾値と
の比較に基づいて、受信文書の提示/非提示を判定す
る。ここで、前記経過時間は、前記受信文書の作成から
または受信からのいずれか、又は作成から及び受信から
の双方である。
Description
【0001】
【産業上の利用分野】本発明は文書処理装置に関し、特
にユーザのもとに入ってくる文書のうちユーザが関心を
持つ文書を選別し、その結果を出力する文書フィルタリ
ング方法及び文書処理装置に関するものである。
にユーザのもとに入ってくる文書のうちユーザが関心を
持つ文書を選別し、その結果を出力する文書フィルタリ
ング方法及び文書処理装置に関するものである。
【0002】
【従来の技術】昨今、記録媒体の大容量化と低価格化、
また、ワードプロセッサの普及などによって、電子化さ
れた文書の量が増大している。さらに、ネットワークの
整備が進み、電子メールや電子ニュースなどのように、
メディアを介して直接ユーザのもとに届く電子化文書の
量も増えている。このため、ユーザが処理できる量を越
えた文書が入ってくるようになり、本当に必要な情報が
不要な情報の中にも埋もれてしまうという、いわゆる
「情報洪水」が問題になってきている。
また、ワードプロセッサの普及などによって、電子化さ
れた文書の量が増大している。さらに、ネットワークの
整備が進み、電子メールや電子ニュースなどのように、
メディアを介して直接ユーザのもとに届く電子化文書の
量も増えている。このため、ユーザが処理できる量を越
えた文書が入ってくるようになり、本当に必要な情報が
不要な情報の中にも埋もれてしまうという、いわゆる
「情報洪水」が問題になってきている。
【0003】この問題への対応策として、ユーザが関心
を持つであろう文書のキーワードを自動的に選別する
「文書フィルタリング」の技術が用いられるようになっ
てきた。「文書フィルタリング」では、予め文書に対す
るユーザの関心をキーワードや文書の内容として設定し
ておき、この設定と送られてきた文書の内容を比較し
て、一致がある場合にはその文書をユーザに見せ、一致
していないときにはその文書をユーザに見せないという
制御をしている。すなわち、「文書フィルタリング」の
技術によって、ユーザは自分にとって関心のないような
文書を最初から見なくてすむようになり、時間を有効に
利用できるようになった。
を持つであろう文書のキーワードを自動的に選別する
「文書フィルタリング」の技術が用いられるようになっ
てきた。「文書フィルタリング」では、予め文書に対す
るユーザの関心をキーワードや文書の内容として設定し
ておき、この設定と送られてきた文書の内容を比較し
て、一致がある場合にはその文書をユーザに見せ、一致
していないときにはその文書をユーザに見せないという
制御をしている。すなわち、「文書フィルタリング」の
技術によって、ユーザは自分にとって関心のないような
文書を最初から見なくてすむようになり、時間を有効に
利用できるようになった。
【0004】
【発明が解決しようとする課題】しかしながら、フィル
タリングされた文書を定期的にユーザが見ている間は問
題ないが、ユーザがしばらく文書を見ることができずに
フイルタリングされた文書が溜まってしまったような場
合、文書数が多くなり、結局重要な情報を見落としてし
まう可能性が出てくる。
タリングされた文書を定期的にユーザが見ている間は問
題ないが、ユーザがしばらく文書を見ることができずに
フイルタリングされた文書が溜まってしまったような場
合、文書数が多くなり、結局重要な情報を見落としてし
まう可能性が出てくる。
【0005】従って、重要な情報を見落とさないための
対策として、フィルタリングされた文書をユーザの関心
のあるキーワードや文書の内容との合致の度合(合致
度)の順に整列して表示し、合致度の高いものから見る
ことができるようにすることも行われるが、この場合
は、最新の必要文書が後に来る等、文書の「鮮度」が考
慮されていないことに問題がある。
対策として、フィルタリングされた文書をユーザの関心
のあるキーワードや文書の内容との合致の度合(合致
度)の順に整列して表示し、合致度の高いものから見る
ことができるようにすることも行われるが、この場合
は、最新の必要文書が後に来る等、文書の「鮮度」が考
慮されていないことに問題がある。
【0006】電子メールのように日々ユーザのもとに届
くような文書については、鮮度が重要で、一般に「新し
い文書ほど情報の価値がある」ということが言える。届
いたときには重要な情報であっても、時間の経過と共に
重要度が下がる文書も多い。しかし、文書フィルタリン
グにおいて単に文書の内容だけを考慮したのでは、こう
したことが反映されない。
くような文書については、鮮度が重要で、一般に「新し
い文書ほど情報の価値がある」ということが言える。届
いたときには重要な情報であっても、時間の経過と共に
重要度が下がる文書も多い。しかし、文書フィルタリン
グにおいて単に文書の内容だけを考慮したのでは、こう
したことが反映されない。
【0007】従来装置には、以上のような種々の問題が
あった。本発明は、上述した従来の課題を解決し、文書
の内容とユーザの関心との合致度だけでなく、文書の鮮
度(新しさ)も考慮してフィルタリングを行うようにし
た文書フィルタリング方法及び文書処理装置を提供する
ことを目的とする。
あった。本発明は、上述した従来の課題を解決し、文書
の内容とユーザの関心との合致度だけでなく、文書の鮮
度(新しさ)も考慮してフィルタリングを行うようにし
た文書フィルタリング方法及び文書処理装置を提供する
ことを目的とする。
【0008】
【課題を解決する為の手段】上述の課題を解決するため
に、本発明の文書フィルタリング方法は、受信した文書
をフィルタリングして提示する文書フィルタリング方法
において、予め設定された識別子と受信文書の経過時間
とから提示すべき文書を選別し、該選別された文書を提
示することを特徴とする。
に、本発明の文書フィルタリング方法は、受信した文書
をフィルタリングして提示する文書フィルタリング方法
において、予め設定された識別子と受信文書の経過時間
とから提示すべき文書を選別し、該選別された文書を提
示することを特徴とする。
【0009】ここで、前記提示文書の選別は、受信文書
の識別子と前記予め設定された識別子との合致度を計算
する工程と、前記経過時間に応じて設定される閾値と前
記合致度との比較に基づいて、受信文書の提示/非提示
を判定する工程とを含む。また、前記閾値は更に文書数
に応じて設定される。また、前記提示文書の選別は、受
信文書の識別子と前記予め設定された識別子との合致度
を計算する工程と、前記合致度と経過時間とに応じて受
信文書にスコアを与える工程と、前記スコアと所定の閾
値との比較に基づいて、受信文書の提示/非提示を判定
する工程とを含む。また、前記識別子は特徴ベクトルで
表わされ、前記合致度は受信文書の特徴ベクトルと前記
予め設定された特徴ベクトルとの内積で表わされる。ま
た、前記特徴ベクトルは、複数のキーワードまたは文か
ら成る。また、前記経過時間は、前記受信文書の作成か
らまたは受信からのいずれか、又は作成から及び受信か
らの双方である。
の識別子と前記予め設定された識別子との合致度を計算
する工程と、前記経過時間に応じて設定される閾値と前
記合致度との比較に基づいて、受信文書の提示/非提示
を判定する工程とを含む。また、前記閾値は更に文書数
に応じて設定される。また、前記提示文書の選別は、受
信文書の識別子と前記予め設定された識別子との合致度
を計算する工程と、前記合致度と経過時間とに応じて受
信文書にスコアを与える工程と、前記スコアと所定の閾
値との比較に基づいて、受信文書の提示/非提示を判定
する工程とを含む。また、前記識別子は特徴ベクトルで
表わされ、前記合致度は受信文書の特徴ベクトルと前記
予め設定された特徴ベクトルとの内積で表わされる。ま
た、前記特徴ベクトルは、複数のキーワードまたは文か
ら成る。また、前記経過時間は、前記受信文書の作成か
らまたは受信からのいずれか、又は作成から及び受信か
らの双方である。
【0010】又、本発明の文書処理装置は、受信した文
書をフィルタリングして提示する文書処理装置におい
て、受信文書を作成からの経過時間及び/又は受信から
の経過時間と共に保持する文書保持手段と、予め設定さ
れた識別子と受信文書の経過時間とから提示すべき文書
を選別する選別手段と、該選別された文書を提示する提
示手段とを備えることを特徴とする。
書をフィルタリングして提示する文書処理装置におい
て、受信文書を作成からの経過時間及び/又は受信から
の経過時間と共に保持する文書保持手段と、予め設定さ
れた識別子と受信文書の経過時間とから提示すべき文書
を選別する選別手段と、該選別された文書を提示する提
示手段とを備えることを特徴とする。
【0011】ここで、前記選別手段は、受信文書の識別
子と前記予め設定された識別子との合致度を計算する合
致度計算手段と、前記経過時間に対応する閾値を設定す
る閾値設定手段と、前記閾値と前記合致度との比較に基
づいて、受信文書の提示/非提示を判定する判定手段と
を含む。また、前記閾値設定手段は、更に文書数にも応
じて閾値を設定する。また、前記選別手段は、受信文書
の識別子と前記予め設定された識別子との合致度を計算
する合致度計算手段と、前記合致度と経過時間とに応じ
て受信文書にスコアを与えるスコア計算手段と、前記ス
コアと所定の閾値との比較に基づいて、受信文書の提示
/非提示を判定する判定手段とを含む。また、前記識別
子は特徴ベクトルで表わされ、前記合致度は受信文書の
特徴ベクトルと前記予め設定された特徴ベクトルとの内
積で表わされる。また、前記特徴ベクトルは、複数のキ
ーワードまたは文から成る。
子と前記予め設定された識別子との合致度を計算する合
致度計算手段と、前記経過時間に対応する閾値を設定す
る閾値設定手段と、前記閾値と前記合致度との比較に基
づいて、受信文書の提示/非提示を判定する判定手段と
を含む。また、前記閾値設定手段は、更に文書数にも応
じて閾値を設定する。また、前記選別手段は、受信文書
の識別子と前記予め設定された識別子との合致度を計算
する合致度計算手段と、前記合致度と経過時間とに応じ
て受信文書にスコアを与えるスコア計算手段と、前記ス
コアと所定の閾値との比較に基づいて、受信文書の提示
/非提示を判定する判定手段とを含む。また、前記識別
子は特徴ベクトルで表わされ、前記合致度は受信文書の
特徴ベクトルと前記予め設定された特徴ベクトルとの内
積で表わされる。また、前記特徴ベクトルは、複数のキ
ーワードまたは文から成る。
【0012】
【作用】以上の構成により、文書フィルタリングの際
に、文書特徴と選別特徴との合致度が、経過時間に応じ
て定まる閾値を越えた場合に、その文書を必要と判断し
てユーザに呈示することにより、文書の鮮度を考慮した
フイルタリングを行うことが可能となる。
に、文書特徴と選別特徴との合致度が、経過時間に応じ
て定まる閾値を越えた場合に、その文書を必要と判断し
てユーザに呈示することにより、文書の鮮度を考慮した
フイルタリングを行うことが可能となる。
【0013】
【実施例】以下、本発明の実施例を添付図面を用いて詳
細に説明する。図1は、本実施例の文書処理装置の処理
の論理構成を示すブロック図である。図1において、1
01は、ユーザの元に入ってきた文書を格納している文
書データベースである。102は、処理対象の文書10
2−1と、その文書特徴102−2と、文書到着時刻1
02−3を保持する文書保持部である。103は、ユー
ザの関心に合う文書の文書特徴(選別特徴)を保持する
選別特徴保持部である。104は、処理対象の文書の文
書特徴と選別特徴との合致度を計算する合致度計算部で
ある。105は、現在の時刻を保持する時刻保持部であ
る。106は、文書が到着してからの経過時間を計算す
る経過時間計算部である。107は、経過時間をもとに
閾値を計算する閾値計算部である。108は、合致度と
閾値の関係によって文書を選択する文書選択部である。
109は、文書選択部108で選ばれた文書を保持する
選別文書保持部である。110は、選別文書保持部10
9に保持された文書を表示する文書表示部である。
細に説明する。図1は、本実施例の文書処理装置の処理
の論理構成を示すブロック図である。図1において、1
01は、ユーザの元に入ってきた文書を格納している文
書データベースである。102は、処理対象の文書10
2−1と、その文書特徴102−2と、文書到着時刻1
02−3を保持する文書保持部である。103は、ユー
ザの関心に合う文書の文書特徴(選別特徴)を保持する
選別特徴保持部である。104は、処理対象の文書の文
書特徴と選別特徴との合致度を計算する合致度計算部で
ある。105は、現在の時刻を保持する時刻保持部であ
る。106は、文書が到着してからの経過時間を計算す
る経過時間計算部である。107は、経過時間をもとに
閾値を計算する閾値計算部である。108は、合致度と
閾値の関係によって文書を選択する文書選択部である。
109は、文書選択部108で選ばれた文書を保持する
選別文書保持部である。110は、選別文書保持部10
9に保持された文書を表示する文書表示部である。
【0014】図2は本実施例の文書処理装置のハードウ
エア構成を示す図である。図2において、201は、図
1及び図4に示す制御手順300を記憶する制御メモリ
である。これはROMであってもよいし、RAMであっ
ても良い。202は、制御メモリ201に記憶されてい
る制御手段に従って処理を行う中央処理装置である。2
03はメモリで、上記文書保持部102,選別特徴保持
部103,選別文書保持部109を有する。なお、時刻
保持部105は現在の時刻を保持するところで、ハード
ウエアであっても良い。204はキーボード、208は
ポインティングデバイスであり、操作者が操作する。2
05はディスクであり、文書データベース101を有す
る。206はディスプレイで、CRTであってもよいし
液晶ディスプレイであってもよい。これは文書を表示す
るのに用いる。207は各構成要素を接続する為のバス
である。209はフロッピーである。
エア構成を示す図である。図2において、201は、図
1及び図4に示す制御手順300を記憶する制御メモリ
である。これはROMであってもよいし、RAMであっ
ても良い。202は、制御メモリ201に記憶されてい
る制御手段に従って処理を行う中央処理装置である。2
03はメモリで、上記文書保持部102,選別特徴保持
部103,選別文書保持部109を有する。なお、時刻
保持部105は現在の時刻を保持するところで、ハード
ウエアであっても良い。204はキーボード、208は
ポインティングデバイスであり、操作者が操作する。2
05はディスクであり、文書データベース101を有す
る。206はディスプレイで、CRTであってもよいし
液晶ディスプレイであってもよい。これは文書を表示す
るのに用いる。207は各構成要素を接続する為のバス
である。209はフロッピーである。
【0015】図3は、図2に示す制御メモリ201の中
にある制御手順300の構成を更に示すものであり、合
致度計算部104と、経過時間計算部106と、閾値計
算部107と、文書選別部108と、文書表示部110
とを含む。図4は図3に示した処理部に対応する動作手
順を示すフローチャートである。図4を参照しながら、
本発明の一実施例の動作を説明する。なお、本実施例で
は文書の特徴の表現方法として、一般に知られているベ
クトル空間モデルを利用する。
にある制御手順300の構成を更に示すものであり、合
致度計算部104と、経過時間計算部106と、閾値計
算部107と、文書選別部108と、文書表示部110
とを含む。図4は図3に示した処理部に対応する動作手
順を示すフローチャートである。図4を参照しながら、
本発明の一実施例の動作を説明する。なお、本実施例で
は文書の特徴の表現方法として、一般に知られているベ
クトル空間モデルを利用する。
【0016】ベクトル空間モデルでは、文書の特徴を表
現するのに、N個のキーワードを用意し、文書毎に各キ
ーワードの重みを設定する。これは、N次元空間のベク
トルとみなすことができる。このベクトルを長さ1に正
規化する。文書の特徴の合致度はそれぞれのベクトルの
内積として表す。まず、ステップS301で、合致度計
算部104において、文書保持部102に保持された文
書特徴102−2と、選別特徴保持部103に保持され
た選別特徴との合致度を計算する。先に述べたように、
合致度は文書特徴を表すベクトル間の内積で表すので、
文書特徴をベクトルd,選別特徴をベクトルsとする
と、合致度は(d・s)になる。
現するのに、N個のキーワードを用意し、文書毎に各キ
ーワードの重みを設定する。これは、N次元空間のベク
トルとみなすことができる。このベクトルを長さ1に正
規化する。文書の特徴の合致度はそれぞれのベクトルの
内積として表す。まず、ステップS301で、合致度計
算部104において、文書保持部102に保持された文
書特徴102−2と、選別特徴保持部103に保持され
た選別特徴との合致度を計算する。先に述べたように、
合致度は文書特徴を表すベクトル間の内積で表すので、
文書特徴をベクトルd,選別特徴をベクトルsとする
と、合致度は(d・s)になる。
【0017】ステップS302では、経過時間計算部1
06において、文書が到着してからの経過時間を計算す
る。これは、時刻保持部105に保持された現在時刻
と、文書保持部102に保持された文書到着時刻102
−3との差分によって求めることができる。ステップS
303では、閾値計算部107において、ステップS3
02で計算した経過時間から閾値を計算する。閾値は経
過時間tに従って決めるが、tの増加と共に増加するよ
うな関数f(t)であればどのような決めかたをしても
構わない。例えば、tを日数(端数切り捨て)で表現
し、f(t)=1−1/(t+2)のようにする。
06において、文書が到着してからの経過時間を計算す
る。これは、時刻保持部105に保持された現在時刻
と、文書保持部102に保持された文書到着時刻102
−3との差分によって求めることができる。ステップS
303では、閾値計算部107において、ステップS3
02で計算した経過時間から閾値を計算する。閾値は経
過時間tに従って決めるが、tの増加と共に増加するよ
うな関数f(t)であればどのような決めかたをしても
構わない。例えば、tを日数(端数切り捨て)で表現
し、f(t)=1−1/(t+2)のようにする。
【0018】ステップS304では、ステップS301
で計算した合致度と、ステップS303で計算した閾値
を比較する。合致度が閾値を越えていない場合はそのま
ま処理を終了する。ステップS304で合致度が閾値を
越えていればステップS305に進み、文書選別部10
8で、この文書を選択して選別文書保持部109に保持
する。そして処理を終了する。
で計算した合致度と、ステップS303で計算した閾値
を比較する。合致度が閾値を越えていない場合はそのま
ま処理を終了する。ステップS304で合致度が閾値を
越えていればステップS305に進み、文書選別部10
8で、この文書を選択して選別文書保持部109に保持
する。そして処理を終了する。
【0019】例えば、ある文書の文書特徴ベクトルと選
別特徴ベクトルの内積pを0.78とする。この文書が
到着してから2日経過した時点ではf(t)=1−1/
(t+2)に代入すると、f(2)=0.75であり、
p>f(2)となって、文書を選択するが、3日経過し
た時点ではf(3)=0.8であり、p<f(3)とな
って、文書を選択しないことになる。
別特徴ベクトルの内積pを0.78とする。この文書が
到着してから2日経過した時点ではf(t)=1−1/
(t+2)に代入すると、f(2)=0.75であり、
p>f(2)となって、文書を選択するが、3日経過し
た時点ではf(3)=0.8であり、p<f(3)とな
って、文書を選択しないことになる。
【0020】次に、文書表示部110により、選択され
た文書を表示する。尚、前記実施例では、文書をユーザ
に呈示する際に合致度と閾値の計算を両方行っている
が、合致度の計算を文書が届いた時点で行ない、その値
を保存しておくようにしておき、次に、文書をユーザに
呈示する際には閾値の計算だけを行うようにする。こう
することによって、文書をユーザに呈示する際の処理時
間を短縮することができる。
た文書を表示する。尚、前記実施例では、文書をユーザ
に呈示する際に合致度と閾値の計算を両方行っている
が、合致度の計算を文書が届いた時点で行ない、その値
を保存しておくようにしておき、次に、文書をユーザに
呈示する際には閾値の計算だけを行うようにする。こう
することによって、文書をユーザに呈示する際の処理時
間を短縮することができる。
【0021】又、前記実施例では、文書の特徴にベクト
ル空間モデルを利用したが、この表現方法に限らない。
すなわち、文書特徴と選別特徴の合致度を計算し、それ
に対する閾値を経過時間tの関数として定義できれば良
い。又、前記実施例では閾値を計算する際に経過時間を
日数で表わしたが、秒・分・時間などどんな単位で表現
しても構わない。また閾値の関数も上記実施例に挙げた
ものに限るものではない。
ル空間モデルを利用したが、この表現方法に限らない。
すなわち、文書特徴と選別特徴の合致度を計算し、それ
に対する閾値を経過時間tの関数として定義できれば良
い。又、前記実施例では閾値を計算する際に経過時間を
日数で表わしたが、秒・分・時間などどんな単位で表現
しても構わない。また閾値の関数も上記実施例に挙げた
ものに限るものではない。
【0022】又、前記実施例では、経過時間tの関数で
定まる閾値を用意して合致度との大小を調べたが、文書
の選別特徴の合致度と経過時間tから定まるスコアの合
計を文書選別のスコアとし、文書選別のスコア自体に文
書特徴の合致度だけでなく、経過時間tも反映するよう
にし、更に、経過時間tの増加でスコアが減少するよう
に定めれば良い。このスコアに対して一定の閾値を設け
て文書を選別するものでもよい。
定まる閾値を用意して合致度との大小を調べたが、文書
の選別特徴の合致度と経過時間tから定まるスコアの合
計を文書選別のスコアとし、文書選別のスコア自体に文
書特徴の合致度だけでなく、経過時間tも反映するよう
にし、更に、経過時間tの増加でスコアが減少するよう
に定めれば良い。このスコアに対して一定の閾値を設け
て文書を選別するものでもよい。
【0023】又、前記実施例では、溜まった文書数を考
慮していない。しかし、閾値を計算する際に文書数も反
映して、文書数が多い場合にはそれだけ閾値を高くする
ようにしても良い。こうすることによって、文書数が多
い場合でも一定の数の文書をユーザに提示することがで
きるようになる。又、前記実施例では、文書が到着して
からの経過時間を用いたが、文書が作成された時刻がわ
かる場合は、作成されてからの経過時間を用いるように
しても良いし、作成と受信とを共に用いてもよい。
慮していない。しかし、閾値を計算する際に文書数も反
映して、文書数が多い場合にはそれだけ閾値を高くする
ようにしても良い。こうすることによって、文書数が多
い場合でも一定の数の文書をユーザに提示することがで
きるようになる。又、前記実施例では、文書が到着して
からの経過時間を用いたが、文書が作成された時刻がわ
かる場合は、作成されてからの経過時間を用いるように
しても良いし、作成と受信とを共に用いてもよい。
【0024】更に、本発明は、複数の機器から構成され
るシステムに適用しても、1つの機器から成る装置に適
用しても良い。また、本発明はシステム或は装置にプロ
グラムを供給することによって達成される場合にも適用
できることはいうまでもない。
るシステムに適用しても、1つの機器から成る装置に適
用しても良い。また、本発明はシステム或は装置にプロ
グラムを供給することによって達成される場合にも適用
できることはいうまでもない。
【0025】
【発明の効果】以上説明したように、本発明によれば、
より新しい情報をより重要なものとして文書フィルタリ
ングを行うようにしたので、限られた時間でユーザが情
報を効率的に利用することができるという効果がある。
より新しい情報をより重要なものとして文書フィルタリ
ングを行うようにしたので、限られた時間でユーザが情
報を効率的に利用することができるという効果がある。
【図1】本実施例の文書処理装置の処理の論理構成を示
すブロック図である。
すブロック図である。
【図2】本実施例の文書処理装置のハードウエア構成を
示す図である。
示す図である。
【図3】本実施例の制御手順の構成を示す図である。
【図4】本実施例に係る動作手順を示すフローチャート
である。
である。
101 文書データベース 102 文書保持部 102−1 処理対象の文書 102−2 文書の特徴 102−3 文書到着時刻 103 選別特徴保持部 104 合致度計算部 105 時刻保持部 106 経過時間計算部 107 閾値計算部 108 文書選別部 109 選別文書保持部 110 文書表示部 201 制御メモリ 202 中央処理装置 203 メモリ 204 キーボード 205 ディスク 206 ディスプレイ 207 バス 208 ポインティングデバイス 209 フロッピー
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 9194−5L 15/40 310 F (72)発明者 柴田 昇吾 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 池田 裕治 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 藤田 稔 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内
Claims (13)
- 【請求項1】 受信した文書をフィルタリングして提示
する文書フィルタリング方法において、 予め設定された識別子と受信文書の経過時間とから提示
すべき文書を選別し、 該選別された文書を提示することを特徴とする文書フィ
ルタリング方法。 - 【請求項2】 前記提示文書の選別は、 受信文書の識別子と前記予め設定された識別子との合致
度を計算する工程と、 前記経過時間に応じて設定される閾値と前記合致度との
比較に基づいて、受信文書の提示/非提示を判定する工
程とを含むことを特徴とする請求項1記載の文書フィル
タリング方法。 - 【請求項3】 前記閾値は更に文書数に応じて設定され
ることを特徴とする請求項2記載の文書フィルタリング
方法。 - 【請求項4】 前記提示文書の選別は、 受信文書の識別子と前記予め設定された識別子との合致
度を計算する工程と、 前記合致度と経過時間とに応じて受信文書にスコアを与
える工程と、 前記スコアと所定の閾値との比較に基づいて、受信文書
の提示/非提示を判定する工程とを含むことを特徴とす
る請求項1記載の文書フィルタリング方法。 - 【請求項5】 前記識別子は特徴ベクトルで表わされ、
前記合致度は受信文書の特徴ベクトルと前記予め設定さ
れた特徴ベクトルとの内積で表わされることを特徴とす
る請求項2または4記載の文書フィルタリング方法。 - 【請求項6】 前記特徴ベクトルは、複数のキーワード
または文から成ることを特徴とする請求項5記載の文書
フィルタリング方法。 - 【請求項7】 前記経過時間は、前記受信文書の作成か
らまたは受信からのいずれか、又は作成から及び受信か
らの双方であることを特徴とする請求項1または2また
は4記載の文書フィルタリング方法。 - 【請求項8】 受信した文書をフィルタリングして提示
する文書処理装置において、 受信文書を作成からの経過時間及び/又は受信からの経
過時間と共に保持する文書保持手段と、 予め設定された識別子と受信文書の経過時間とから提示
すべき文書を選別する選別手段と、 該選別された文書を提示する提示手段とを備えることを
特徴とする文書処理装置。 - 【請求項9】 前記選別手段は、 受信文書の識別子と前記予め設定された識別子との合致
度を計算する合致度計算手段と、 前記経過時間に対応する閾値を設定する閾値設定手段
と、 前記閾値と前記合致度との比較に基づいて、受信文書の
提示/非提示を判定する判定手段とを含むことを特徴と
する請求項8記載の文書処理装置。 - 【請求項10】 前記閾値設定手段は、更に文書数にも
応じて閾値を設定することを特徴とする請求項9記載の
文書処理装置。 - 【請求項11】 前記選別手段は、 受信文書の識別子と前記予め設定された識別子との合致
度を計算する合致度計算手段と、 前記合致度と経過時間とに応じて受信文書にスコアを与
えるスコア計算手段と、 前記スコアと所定の閾値との比較に基づいて、受信文書
の提示/非提示を判定する判定手段とを含むことを特徴
とする請求項8記載の文書処理装置。 - 【請求項12】 前記識別子は特徴ベクトルで表わさ
れ、前記合致度は受信文書の特徴ベクトルと前記予め設
定された特徴ベクトルとの内積で表わされることを特徴
とする請求項9または11記載の文書処理装置。 - 【請求項13】 前記特徴ベクトルは、複数のキーワー
ドまたは文から成ることを特徴とする請求項12記載の
文書処理装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6298237A JPH08161348A (ja) | 1994-12-01 | 1994-12-01 | 文書フィルタリング方法及び文書処理装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6298237A JPH08161348A (ja) | 1994-12-01 | 1994-12-01 | 文書フィルタリング方法及び文書処理装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH08161348A true JPH08161348A (ja) | 1996-06-21 |
Family
ID=17857015
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP6298237A Withdrawn JPH08161348A (ja) | 1994-12-01 | 1994-12-01 | 文書フィルタリング方法及び文書処理装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH08161348A (ja) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH10240762A (ja) * | 1997-02-28 | 1998-09-11 | Matsushita Electric Ind Co Ltd | 情報フィルタ装置とデータベース再構築装置及び情報フィルタリング方法と初期化方法 |
| JP2003016100A (ja) * | 2001-07-04 | 2003-01-17 | Sharp Corp | 情報送受信システム及び情報送受信プログラムを記録した記録媒体 |
| JP2007265259A (ja) * | 2006-03-29 | 2007-10-11 | Matsushita Electric Ind Co Ltd | 画像検索支援装置 |
| US7756868B2 (en) | 2004-02-26 | 2010-07-13 | Nhn Corporation | Method for providing search results list based on importance information and system thereof |
| JP2019120973A (ja) * | 2017-12-28 | 2019-07-22 | コニカミノルタ株式会社 | 文書スコアリング装置、プログラム |
-
1994
- 1994-12-01 JP JP6298237A patent/JPH08161348A/ja not_active Withdrawn
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH10240762A (ja) * | 1997-02-28 | 1998-09-11 | Matsushita Electric Ind Co Ltd | 情報フィルタ装置とデータベース再構築装置及び情報フィルタリング方法と初期化方法 |
| JP2003016100A (ja) * | 2001-07-04 | 2003-01-17 | Sharp Corp | 情報送受信システム及び情報送受信プログラムを記録した記録媒体 |
| US7756868B2 (en) | 2004-02-26 | 2010-07-13 | Nhn Corporation | Method for providing search results list based on importance information and system thereof |
| JP2007265259A (ja) * | 2006-03-29 | 2007-10-11 | Matsushita Electric Ind Co Ltd | 画像検索支援装置 |
| JP2019120973A (ja) * | 2017-12-28 | 2019-07-22 | コニカミノルタ株式会社 | 文書スコアリング装置、プログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6370526B1 (en) | Self-adaptive method and system for providing a user-preferred ranking order of object sets | |
| EP0338961B1 (en) | Method for notifying a terminal user of an asynchronous event occurrence | |
| US5649085A (en) | Method and system for storing and displaying system operation traces with asynchronous event-pairs | |
| GB2277177A (en) | Electronic dealing system. | |
| US20040080531A1 (en) | Method, system and program product for automatically modifying a display view during presentation of a web page | |
| US20050257159A1 (en) | Method and apparatus for identifying attachments in an email message | |
| US6598045B2 (en) | System and method for piecemeal relevance evaluation | |
| JP2001515623A (ja) | コンピュータによるテキストサマリ自動生成方法 | |
| US20030172353A1 (en) | Audio clutter reduction and content identification for web-based screen-readers | |
| WO2000075810A1 (en) | Document sorting method, document sorter, and recorded medium on which document sorting program is recorded | |
| US7181688B1 (en) | Device and method for retrieving documents | |
| CN111274380B (zh) | 基于大数据的咨询投诉信息处理方法及相关装置 | |
| JPH08161348A (ja) | 文書フィルタリング方法及び文書処理装置 | |
| US7831602B2 (en) | Method for comparing search profiles | |
| JPH08335265A (ja) | 文書処理装置および方法 | |
| CN111737555A (zh) | 热点关键词的选取方法、设备和存储介质 | |
| JP3799750B2 (ja) | 情報抽出装置 | |
| JPH08287086A (ja) | 適合度順画像強調表示方法及び装置 | |
| CN112449008A (zh) | 一种基于云计算的数据分析及可视化报告生成系统及方法 | |
| US20060271534A1 (en) | Information-providing apparatus and information-providing method | |
| CN112035512B (zh) | 知识库的检索方法、装置、电子设备及计算机存储介质 | |
| JPWO2001051815A1 (ja) | コンピュータによる遠心式流体機械の選定方法 | |
| JPH09160908A (ja) | 文書処理装置及びその方法、記憶媒体 | |
| JPH08241334A (ja) | 文書処理装置および文書処理方法 | |
| CN114222004A (zh) | 业务数据分发执行方法、装置、计算机设备及存储介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20020205 |