JPH10214268A - 文書検索方法および装置 - Google Patents

文書検索方法および装置

Info

Publication number
JPH10214268A
JPH10214268A JP9015667A JP1566797A JPH10214268A JP H10214268 A JPH10214268 A JP H10214268A JP 9015667 A JP9015667 A JP 9015667A JP 1566797 A JP1566797 A JP 1566797A JP H10214268 A JPH10214268 A JP H10214268A
Authority
JP
Japan
Prior art keywords
document
index
word
registered
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9015667A
Other languages
English (en)
Inventor
Toshihiro Fujinami
稔弘 藤並
Tomoyuki Tada
多田  智之
Hidenobu Kaneoka
秀信 金岡
Shinichi Mukogawa
信一 向川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP9015667A priority Critical patent/JPH10214268A/ja
Publication of JPH10214268A publication Critical patent/JPH10214268A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 文書検索精度への影響を抑えながら登録文書
等を格納する記憶装置の必要容量を大幅に減少させ、か
つユーザに対してより多くの検索情報を提供することが
できるようにした文書検索方法および装置を提供する。 【解決手段】 文書記憶部(60)に登録された文書か
ら自動文書要約部(20)で該文書の要約文を自動生成
し、この自動生成した要約文からインデキシング部(3
0)で、当該文書のインデックスを作成し、このインデ
ックスに基づき文書検索部(50)で所望の検索要求に
対応する文書を検索する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、文書要約を用い
て文書を検索する文書検索方法および装置に関し、特
に、文書検索精度への影響を抑えながら登録文書等を格
納する記憶装置の必要容量を大幅に減少させ、かつユー
ザに対してより多くの検索情報を提供することができる
ようにした文書検索方法および装置に関する。
【0002】
【従来の技術】従来、所望の検索要求に対応して複数の
登録文書から所望の文書を検索する文書検索方法および
装置として種々の手法を採用するものが知られている。
【0003】例えば、各文書に対応してインデックスを
設定し、このインデックスに基づき所望の文書を検索す
るもの、各文書に対応して要約文を作成しこの要約文に
より所望の文書を検索するもの等が知られている。
【0004】また、インデックスを用いるものには、文
字成分方式のインデックスを用いるもの、形態素解析に
よる自動キーワード抽出によるもの等がある。
【0005】
【発明が解決しようとする課題】しかし、その種の従来
の文書検索方法および装置においては、登録文書等を格
納する記憶装置に多くの記憶容量を必要とし、特に、文
書のインデックスを用いて所望の文書を検索する手法を
採用するものにおいては、このインデックスを格納する
ための記憶容量が多大になるという問題がある。
【0006】例えば、文字成分方式のインデックスを用
いる場合は、全文検索が可能になるが、そのインデック
スファイルの大きさは当該文書原文の1.5倍にも達す
る。
【0007】また、形態素解析による自動キーワード抽
出による全文検索でも、そのファイルサイズは当該文書
原文とほぼ同等になる。
【0008】そこで、この発明は、文書検索精度への影
響を抑えながら登録文書等を格納する記憶装置の必要容
量を大幅に減少させ、かつユーザに対してより多くの検
索情報を提供することができるようにした文書検索方法
および装置を提供することを目的とする。
【0009】
【課題を解決するための手段】上記目的を達成するた
め、請求項1の発明は、登録された複数の文書から所望
の検索要求に対応する文書を検索する文書検索方法にお
いて、上記登録された文書から該文書の要約文を自動生
成し、該自動生成した要約文から上記文書のインデック
スを作成し、上記インデックスに基づき上記所望の検索
要求に対応する文書を検索することを特徴とする。
【0010】また、請求項2の発明は、請求項1の発明
において、上記登録された文書の過去のアクセス回数が
一定の期間内に規定の値を越えている場合は、上記登録
された文書の原文から当該文書のインデックスを作成し
て上記インデックスに基づき上記所望の検索要求に対応
する文書を検索することを特徴とする。
【0011】また、請求項3の発明は、請求項1または
2の発明において、上記要約文に含まれる単語に該単語
より語数の少ない同義語若しくは短縮語が存在する場合
は、該単語を上記同義語若しくは短縮語で置換すること
により上記要約文を小型化することを特徴とする。
【0012】また、請求項4の発明は、請求項3の発明
において、上記要約文に含まれる単語より語数の少ない
同義語若しくは短縮語が存在する単語が複数存在する場
合において、該単語を該要約文に最初に現れる単語を除
いて上記同義語若しくは短縮語で置換することを特徴と
する。
【0013】また、請求項5の発明は、登録された複数
の文書から所望の検索要求に対応する文書を検索する文
書検索方法において、上記登録された文書の過去のアク
セス回数が一定の期間内に規定の値を越えている場合
は、上記登録された文書の原文から当該文書の第1のイ
ンデックスを作成して該第1のインデックスに基づき上
記所望の検索要求に対応する文書を検索し、上記登録さ
れた文書の過去のアクセス回数が一定の期間内に規定の
値以下の場合は、上記登録された文書から該文書の要約
文を自動生成するとともに該自動生成した要約文から上
記文書の第2のインデックスを作成して該第2のインデ
ックスに基づき上記所望の検索要求に対応する文書を検
索することを特徴とする。
【0014】また、請求項6の発明は、登録された複数
の文書から所望の検索要求に対応する文書を検索する文
書検索方法において、上記登録された文書を圧縮して圧
縮文書を自動生成し、上記所望の検索要求に対応して上
記圧縮文書を検索し、該検索した圧縮文書を伸長して出
力することを特徴とする。
【0015】また、請求項7の発明は、請求項6の発明
において、上記登録された文書の過去のアクセス回数が
一定の期間内に規定の値を越えている場合は、上記登録
された文書の原文を検索して該検索した文書原文を出力
し、上記登録された文書の過去のアクセス回数が一定の
期間内に規定の値以下の場合は、上記圧縮文書を検索し
て該検索した圧縮文書を伸長して出力することを特徴と
する。
【0016】また、請求項8の発明は、登録された複数
の文書から所望の検索要求に対応する文書を検索する文
書検索方法において、上記登録された文書の過去のアク
セス回数が第1の期間内に第1の規定の値を越えている
場合は、上記登録された文書の原文から当該文書の第1
のインデックスを作成して該第1のインデックスに基づ
き上記登録された文書の原文を検索して該検索した文書
原文を出力し、上記登録された文書の過去のアクセス回
数が上記第1の期間内に上記第1の規定の値以下の場合
は、上記登録された文書の原文から当該文書の第1のイ
ンデックスを作成するとともに上記登録された文書を圧
縮して圧縮文書を自動生成して該第1のインデックスに
基づき上記圧縮文書を検索して該検索した圧縮文書を伸
長して出力し、上記登録された文書の過去のアクセス回
数が上記第1の期間より長い第2の期間内に第2の規定
以下の場合は、上記登録された文書から該文書の要約文
を自動生成するとともに該自動生成した要約文から上記
文書の第2のインデックスを作成して該第2のインデッ
クスに基づき上記圧縮文書を検索して該検索した圧縮文
書を伸長して出力し、上記登録された文書の過去のアク
セス回数が上記第2の期間より長い第3の期間内に零で
ある場合は上記登録された文書を削除して上記要約文の
み保持することを特徴とする。
【0017】また、請求項9の発明は、請求項8の発明
において、上記要約文に含まれる単語に該単語より語数
の少ない同義語若しくは短縮語が存在する場合は、上記
要約文に含まれる上記語数の少ない同義語若しくは短縮
語が存在する単語を上記同義語若しくは短縮語で置換す
ることにより上記要約文を小型化することを特徴とす
る。
【0018】また、請求項10の発明は、請求項9の発
明において、上記要約文に含まれる単語より語数の少な
い同義語若しくは短縮語が存在する単語が複数存在する
場合において、該単語を該要約文に最初に現れる単語を
除いて上記同義語若しくは短縮語で置換することを特徴
とする。
【0019】また、請求項11の発明は、登録された複
数の文書から所望の検索要求に対応する文書を検索する
文書検索装置において、上記登録された文書を格納する
文書記憶手段と、上記検索要求を入力する検索要求入力
手段と、上記文書記憶手段に格納された文書から該文書
の要約文を自動生成する自動文書要約手段と、上記自動
文書要約手段により生成された上記要約文から上記文書
のインデックスを作成するインデックス作成手段と、上
記インデックス作成手段により作成されたインデックス
を格納するインデックス記憶手段と、上記インデックス
記憶手段に格納されたインデックスに基づき上記文書記
憶手段に格納された文書の中から上記所望の検索要求に
対応する文書を検索する文書検索手段と、を具備するこ
とを特徴とする。
【0020】また、請求項12の発明は、請求項11の
発明において、上記要約文に含まれる単語に該単語より
語数の少ない同義語若しくは短縮語が存在する場合は、
該単語を上記同義語若しくは短縮語で置換することによ
り上記要約文を小型化する要約文小型化手段、を更に具
備することを特徴とする。
【0021】また、請求項13の発明は、請求項12の
発明において、上記要約文小型化手段は、上記要約文に
含まれる単語より語数の少ない同義語若しくは短縮語が
存在する単語が複数存在する場合において、該単語を該
要約文に最初に現れる単語を除いて上記同義語若しくは
短縮語で置換することを特徴とする。
【0022】また、請求項14の発明は、登録された複
数の文書から所望の検索要求に対応する文書を検索する
文書検索装置において、上記登録された文書を格納する
文書記憶手段と、上記検索要求を入力するとともに該検
索要求に対応する検索結果を出力する入出力手段と、上
記文書記憶手段に格納された文書原文から該文書の要約
文を自動生成して上記文祖記憶手段に格納する自動文書
要約手段と、上記文書記憶手段に格納された上記文書原
文若しくは上記要約文から上記文書のインデックスを作
成するインデックス作成手段と、上記インデックス作成
手段により作成されたインデックスを格納するインデッ
クス記憶手段と、上記文書記憶手段に格納された上記文
書原文を圧縮して上記文書記憶手段に圧縮文書として格
納するとともに上記文書記憶手段に格納された上記圧縮
文書を伸長する文書圧縮伸長手段と、上記入力手段から
入力された上記検索要求に対応して上記インデックス記
憶手段に格納されたインデックスに基づき上記上記文書
記憶手段に格納された文書原文若しくは上記圧縮文書若
しくは上記要約文を検索して上記入出力手段に出力する
文書検索処理を実行する文書検索手段と、上記文書検索
手段による上記文書検索処理を管理する管理手段と、を
具備することを特徴とする。
【0023】また、請求項15の発明は、請求項14の
発明において、上記要約文に含まれる単語に該単語より
語数の少ない同義語若しくは短縮語が存在する場合は、
該単語を上記同義語若しくは短縮語で置換することによ
り上記要約文を小型化する要約文小型化手段、を更に具
備することを特徴とする。
【0024】また、請求項16の発明は、請求項15の
発明において、上記要約文小型化手段は、上記要約文に
含まれる単語より語数の少ない同義語若しくは短縮語が
存在する単語が複数存在する場合において、該単語を該
要約文に最初に現れる単語を除いて上記同義語若しくは
短縮語で置換することを特徴とする。
【0025】また、請求項17の発明は、請求項14の
発明において、上記検索手段は、上記文書記憶手段に格
納された文書の過去のアクセス回数が第1の期間内に第
1の規定の値を越えている場合は、上記インデックス記
憶手段に格納された上記文書原文から作成された第1の
インデックスに基づき上記文書記憶手段に格納された文
書原文を検索して該検索した文書原文を出力し、上記文
書記憶手段に格納された文書の過去のアクセス回数が上
記第1の期間内に上記第1の規定の値以下の場合は、上
記第1のインデックスに基づき上記圧縮文書を検索して
該検索した圧縮文書を伸長して出力し、上記文書記憶手
段に格納された文書の過去のアクセス回数が上記第1の
期間より長い第2の期間内に第2の規定以下の場合は、
上記インデックス記憶手段に格納された上記要約文から
作成された第2のインデックスに基づき上記圧縮文書を
検索して該検索した圧縮文書を伸長して出力し、上記文
書記憶手段に格納された文書の過去のアクセス回数が上
記第2の期間より長い第3の期間内に零である場合は上
記文書記憶手段に格納された文書を削除して上記要約文
のみ保持することを特徴とする
【0026】
【発明の実施の形態】以下、この発明の実施の形態につ
いて添付図面を参照して詳細に説明する。
【0027】図1は、この発明に係わる文書検索方法お
よび装置を適用して構成した文書検索システムの一実施
の形態を概略ブロック図で示したものである。
【0028】図1において、この文書検索システムは、
文書登録および文書検索要求を行なうとともに文書検索
結果表示を行なう入出力部10、登録文書から要約文を
自動生成する自動文書要約部20、登録文書の原文(以
下、登録原文という)若しくは要約文から当該文書のイ
ンデックスを作成するインデキシング部30、登録原文
を圧縮または伸長する文書圧縮伸長部40、文書インデ
ックスから所望の検索要求を実行する文書検索部50、
登録文書若しくはその要約文若しくは圧縮文書を格納す
る文書記憶部60、登録文書若しくは要約文のインデッ
クスを格納するインデックス記憶部70、文書管理ファ
イルを格納する文書管理ファイル記憶部80、この文書
検索システムの全体動作を統括制御する制御部90を具
備して構成される。
【0029】この文書検索システムにおいて、まず、文
書の登録時には、入出力部10からの文書登録要求を制
御部90で検知し、これにより制御部90は入出力部1
0に対して指定文書(登録文書)の文書記憶部60への
保存を指示する。
【0030】同時に、制御部90は、インデキシング部
30に対して当該文書のインデックスを作成するインデ
キシングの実行を指示する。
【0031】インデキシング部30は、上記制御部90
からのインデキシングの実行の指示により当該文書のイ
ンデックスを生成し、この生成したインデックスをイン
デックス記憶部70に保存する。
【0032】また、このとき制御部90は、文書管理フ
ァイル記憶部80に新規エントリを作成し、その登録日
を記録する。
【0033】文書検索時には、入出力部10からの文書
検索要求を制御部90で検知し、これにより制御部90
は文書検索部50に対して当該文書検索要求に対応する
文書の検索を指示する。
【0034】これにより、文書検索部50は、検索命令
となるキーワードまたは自然言語文にしたがって、イン
デックス記憶部70および文書記憶部60に対する検索
処理を行なう。
【0035】文書検索部50による上記検索処理が完了
すると、制御部90はその検索結果を示す検索結果リス
トを表示する指示を入出力部10に対して行なう。
【0036】これにより文書検索部50による検索結果
が入出力部10に出力されて、検索結果リストが入出力
部10に表示される。
【0037】そして、ユーザは、上記入出力部10に表
示される検索結果リストから所望の文書を見つけた場合
は、入出力部10からその所望の文書のオープン要求を
行ない、この文書のオープン要求は制御部90で検知さ
れ、これにより制御部90は文書検索部50に対して当
該文書を入出力部10に出力する指示を行なう。
【0038】ここで、文書検索部50は、上記所望の文
書が文書記憶部60に原文のまま格納されている場合
は、制御部90の制御により、この文書記憶部60に格
納されている文書をそのまま入出力部10に出力して、
入出力部10における当該文書の表示等がおこなわれ
る。
【0039】また、文書検索部50は、上記所望の文書
が文書記憶部60に圧縮されて格納されている場合は、
制御部90の制御により、この文書記憶部60に格納さ
れている文書を文書圧縮伸長部40で伸長した後に入出
力部10に出力して、入出力部10における当該文書の
表示等がおこなわれる。
【0040】このとき、文書検索部50は、文書管理フ
ァイル記憶部80に格納されている上記オープンを行な
った文書の文書管理ファイルを更新し、当該文書管理フ
ァイルに当該文書のアクセス日時を記録する。
【0041】ところで、この実施の形態の文書検索シス
テムにおいては、文書記憶部60に格納された登録文書
およびインデックス記憶部70に格納されたインデック
スの小型化のために、定期的に、例えば金曜日の午後1
0時等に、バッチ処理により、文書記憶部60に格納さ
れた登録文書およびインデックス記憶部70に格納され
たインデックスの小型化処理が行なわれる。
【0042】ここで、上記文書記憶部60に格納された
登録文書の小型化処理およびインデックス記憶部70に
格納されたインデックスの小型化処理を行なう文書管理
バッチ処理は、当該文書に対するアクセス回数に基づき
行なわれる。
【0043】すなわち、図2に示すように、このバッチ
処理において、当該文書の登録から半年を経過してお
り、この過去半年間に当該文書に対するアクセス回数が
2回以下の場合は、登録文書を圧縮してこの圧縮した圧
縮文書を文書記憶部60に格納し、また、インデックス
記憶部70には圧縮する前の登録原文を作成元としたイ
ンデックスを格納する。
【0044】また、当該文書の登録から1年を経過して
おり、この過去1年間に当該文書に対するアクセス回数
が1回以下の場合は、文書記憶部60には登録文書を圧
縮した圧縮文書が格納されるが、インデックス記憶部7
0には当該文書の要約文を作成元としたインデックスを
格納する。
【0045】また、当該文書の登録から2年を経過して
おり、この過去2年間に当該文書に対するアクセス回数
が0回の場合は、当該文書の圧縮文書も削除する。この
場合、インデックス記憶部70に格納されたインデック
スも削除されることになる。
【0046】なお、上記文書管理バッチ処理でに用いら
れるアクセス回数は当該文書の登録も1回のアクセスと
してカウントする。
【0047】上記文書管理バッチ処理は、文書管理ファ
イル記憶部80に格納されている文書管理ファイルに基
づき行なわれる。
【0048】図3は、上記文書管理ファイル記憶部80
に格納される文書管理ファイルの一例を示したものであ
る。
【0049】この文書管理ファイルは、例えば96年1
0月31日時点において文書管理ファイル記憶部80に
格納されている文書管理ファイルで、文書管理ファイル
においては、各文書の過去3回の文書オープンの履歴が
記録される。ここで、文書登録も1回のアクセスとして
記録されている。
【0050】図3において、「FLAG」は、文書記憶
部60に格納された各文書の状態を示すものである。
【0051】すなわち、「FLAG」が「N」の場合
は、文書記憶部60に格納された文書は非圧縮文書、イ
ンデックス記憶部70に格納されたインデックスは、登
録原文を作成元とするノーマルインデックスであること
を示す。
【0052】また、「FLAG」が「C」の場合は、文
書記憶部60に格納された文書は圧縮文書、インデック
ス記憶部70に格納されたインデックスは、登録原文を
作成元とするノーマルインデックスであることを示す。
【0053】また、「FLAG」が「S」の場合は、文
書記憶部60に格納された文書は圧縮文書、インデック
ス記憶部70に格納されたインデックスは、要約文を作
成元とする要約文インデックスであることを示す。
【0054】また、「FLAG」が「X」の場合は、削
除済みの文書であることを示す。
【0055】また、「DN」は、各文書の文書番号、
「LA1」〜「LA3」は、過去3回のアクセス日を示
す。
【0056】図4乃至図6は上記文書管理バッチ処理を
フローチャートで示したものである。
【0057】図4乃至図6において、この文書管理バッ
チ処理がスタートすると(ステップ101)、まず、初
期化処理が行なわれる(ステップ102)。この初期化
処理は、 1)処理の対照となる文書番号「DN」を「0」にする
(DN=0) 2)「DATE0」として半年前の日付を設定する(D
ATE0=半年前の日付) 3)「DATE1」として1年前の日付を設定する(D
ATE1=1年前の日付) 4)「DATE2」として2年前の日付を設定する(D
ATE2=2年前の日付) ことにより行なわれる。
【0058】次に、文書管理ファイル記憶部80から文
書番号「DN」の文書情報、すなわち「FLAG」、
「LA1」、「LA2」、「LA3」を取得する(ステ
ップ103)。
【0059】そして、「FLAG」は「X」か、すなわ
ち、「FLAG==X」かを調べる(ステップ10
4)。
【0060】ここで、「FLAG==X」である場合は
(ステップ104でYES)、文書番号「DN」を
「1」インクリメントし「DN=DN+1」(ステップ
108)、次に、文書管理ファイルは最後かを調べ「F
ILE END」(ステップ109)、「FILE E
ND」でないと(ステップ109でNO)、ステップ1
03に戻る。
【0061】また、ステップ109で、「FILE E
ND」であると判断されると(ステップ109でYE
S)、この文書管理バッチ処理を終了する(ステップ1
10)。
【0062】また、ステップ104で、「FLAG==
X」でないと判断されると(ステップ104でYE
S)、次に、ステップ103で取得した「LA1」は
「DATE2」より古いかを調べる(ステップ10
5)。
【0063】ここで、「LA1」が「DATE2」より
古いと判断された場合は(ステップ105でYES)、
文書番号DNの文書を削除し(ステップ106)、文書
番号「DN」の「FLAG」を「X」に更新して(ステ
ップ107)、ステップ108に進む。
【0064】また、ステップ105で、「LA1」が
「DATE2」より新しいと判断された場合は(ステッ
プ105でNO)、図5のステップ111に進む。
【0065】ステップ111では、「LA2」にデータ
があるかを調べる。ここで、「LA2」にデータがある
判断されると(ステップ111でYES)、次に、「L
A2」は「DATE1」より古いかを調べる(ステップ
112)。
【0066】ここで、「LA2」が「DATE1」より
古いと判断されると(ステップ112でYES)、次
に、「FLAG」は「S」か、すなわち、「FLAG=
=S」かを調べる(ステップ113)。ここで、「FL
AG==S」であると判断されると(ステップ113で
YES)、図4のステップ108に進む。
【0067】また、ステップ113で、「FLAG==
S」でないと判断されると(ステップ113でNO)、
次に、「FLAG」は「C」か、すなわち、「FLAG
==C」かを調べる(ステップ114)。
【0068】ここで、「FLAG==C」でないと判断
されると(ステップ114でNO)、この文書番号「D
N」の文書を文書記憶部60から読み出し、この文書番
号「DN」の文書を文書圧縮伸長部40で圧縮してこの
圧縮した文書で文書記憶部60に格納されている文書番
号「DN」の文書を更新する圧縮保存を行なう(ステッ
プ115)。
【0069】そして、この文書番号「DN」の文書に対
応する要約文に基づき、この新たなインデックスを作成
し、この新たに作成したインデックスでインデックス記
憶部70にこの文書番号「DN」の文書に対応して格納
されているインデックスを更新し(ステップ116)、
その後、文書番号「DN」の「FLAG」を「S」に更
新して(ステップ117)、図4のステップ108に進
む。
【0070】また、ステップ114で、「FLAG==
C」であると判断された場合は(ステップ114でYE
S)、ステップ115の処理を行なうことなくステップ
116に進む。
【0071】また、ステップ111で、「LA2」にデ
ータがないと判断された場合は(ステップ111でN
O)、次に、「LA1」は「DATE1」より古いかを
調べ(ステップ118)、ここで、「LA1」は「DA
TE1」より古いと判断されると(ステップ118でY
ES)、ステップ113に進むが、「LA1」は「DA
TE1」より新しいと判断されると(ステップ118で
NO)、図6のステップ126に進む。
【0072】また、ステップ112で、「LA2」は
「DATE1」より新しいと判断されると(ステップ1
12でNO)、図6のステップ119に進む。
【0073】ステップ119では、「LA3」にデータ
があるかを調べる。ここで、「LA3」にデータがある
判断されると(ステップ119でYES)、次に、「L
A3」は「DATE0」より古いかを調べる(ステップ
120)。
【0074】ここで、「LA3」が「DATE0」より
古いと判断されると(ステップ120でYES)、次
に、「FLAG」は「C」か、すなわち、「FLAG=
=C」かを調べる(ステップ121)。ここで、「FL
AG==C」であると判断されると(ステップ121で
YES)、図4のステップ108に進む。
【0075】また、ステップ121で、「FLAG==
C」でないと判断されると(ステップ121でNO)、
次に、「FLAG」は「N」か、すなわち、「FLAG
==N」かを調べる(ステップ122)。
【0076】ここで、「FLAG==N」でないと判断
されると(ステップ122でNO)、この文書番号「D
N」のインデックスを本文より作成し(ステップ12
3)、その後、文書番号「DN」の「FLAG」を
「C」に更新して(ステップ125)、図4のステップ
108に進む。
【0077】また、ステップ122で「FLAG==
N」であると判断されると(ステップ122でYE
S)、文書番号「DN」の文書を文書記憶部60に圧縮
保存し(ステップ124)、ステップ123の処理を行
なうことなくステップ125に進むまた、ステップ11
9で、「LA2」にデータがないと判断された場合は
(ステップ119でNO)、次に、「LA2」は「DA
TE0」より古いかを調べ(ステップ127)、ここ
で、「LA2」は「DATE0」より古いと判断される
と(ステップ127でYES)、ステップ121に進む
が、「LA2」は「DATE0」より新しいと判断され
ると(ステップ127でNO)、ステップ128に進
む。
【0078】また、ステップ120で、「LA3」は
「DATE0」より新しい(ステップ120でNO)と
判断された場合はステップ128に進む。
【0079】また、ステップ126では、「LA1」は
「DATE0」より古いかを調べる。ここで、「LA
1」は「DATE0」より古いと判断されると(ステッ
プ126でYES)、ステップ121に進む。
【0080】また、ステップ126で、「LA1」は
「DATE0」より新しいと判断されると(ステップ1
26でNO)、次に、「FLAG」は「N」か、すなわ
ち、「FLAG==N」かを調べる(ステップ12
8)。ここで、「FLAG==N」であると判断される
と(ステップ128でYES)、図4のステップ108
に進む。
【0081】また、ステップ128で、「FLAG==
N」でないと判断されると(ステップ128でNO)、
次に、「FLAG」は「C」か、すなわち、「FLAG
==C」かを調べる(ステップ129)。
【0082】ここで、「FLAG==C」でないと判断
されると(ステップ129でNO)、この文書番号「D
N」のインデックスを本文より作成し(ステップ13
0)、文書番号「DN」の文書を伸長保存し(ステップ
131)、その後、文書番号「DN」の「FLAG」を
「N」に更新して(ステップ132)、図4のステップ
108に進む。
【0083】また、ステップ129で、「FLAG==
C」であると判断されると(ステップ129でYE
S)、ステップ130の処理を行なうことなくステップ
131に進む。
【0084】図7は、上記図4乃至図6の文書管理バッ
チ処理がなされた後の例えば96年11月1日の時点で
文書管理ファイル記憶部80に格納される文書管理ファ
イルの一例を示したものである。
【0085】図3に示した文書管理ファイルと比較する
と明らかになるように、文書番号「DN」が「0000
0002」の文書は、過去2年間のアクセス回数が0回
であるので、「FLAG」が「X」になり削除されたこ
とが示され、また、文書番号「DN」が「000000
03」の文書は、過去半年間のアクセス回数が2回であ
るので、「FLAG」が「C」になり、文書記憶部60
に格納された文書は圧縮文書、インデックス記憶部70
に格納されたインデックスは、登録原文を作成元とする
ノーマルインデックスであることが示され、また、文書
番号「DN」が「00004233」の文書は、過去1
年間のアクセス回数が1回であるので、「FLAG」が
「S」になり、文書記憶部60に格納された文書は圧縮
文書、インデックス記憶部70に格納されたインデック
スは、要約文を作成元とする要約文インデックスである
ことがしめされ、また、文書番号「DN」が「0001
2014」の文書は、過去半年間のアクセス回数が2回
であるので、「FLAG」が「C」になり、文書記憶部
60に格納された文書は圧縮文書、インデックス記憶部
70に格納されたインデックスは、登録原文を作成元と
するノーマルインデックスであることが示される。
【0086】図8は、図1に示した自動文書要約部20
の構成例を示したものである。
【0087】図8において、この自動文書要約部20
は、文書構造解析部21、形態素解析部22、構文解析
部23、重要文判定部24、同義語・短縮語置換部2
5、形態素解析辞書26、同義語・短縮語辞書27を具
備して構成される。
【0088】ここで、文書構造解析部21は、電子化さ
れた入力文書を解析し、タイトル、章や節の見出し、段
落、文などの構造を解析する。
【0089】また、形態素解析部22では、形態素解析
辞書26を用いて品詞の接続規則などから、タイトルや
本文などを単語単位に分割し、文節を切り出すととも
に、各単語の品詞を同定する。
【0090】また、構文解析部23では、主格(「は」
格、「が」格など)などを解析し、各文内の文節の掛か
り受け構造の解析を行なう。
【0091】また、重要文判定部24では、文書構造解
析、形態素解析、構文解析の各結果から、文章に含まれ
る各文が、タイトルや章見出し、文全体に対する段落位
置、段落内での文の位置、文章全体での重要語の抽出と
重要度付け、文に含まれる重要語の重要度、文に含まれ
る重要語の数、文中における重要語の主格・目的格など
の使われ方などから、各文の重要度を判定し、文章の要
約率と文間の照応状況などから、要約文とすべき文を決
定する。
【0092】なお、自動文書要約部20の内、重要文判
定部24までは、本願発明要旨を構成するものではな
く、文書要約システムなどで既に提案されている手法を
利用することで実現することができ、例えば、上記構成
以外に文脈解析や意味解析を含めることもできる。
【0093】同義語・短縮語置換部25では、重要文判
定部24で得られた要約文を先頭文から、同義語・短縮
語辞書27に記載されている単語を検索し、重要文判定
部24で得られた要約文より文字数の少ない同義語また
は短縮語が存在し、かつ、同一単語が2個以上検索され
れば、2個以降の単語をより文字数の少ない同義語また
は短縮語に置換する。
【0094】例えば、図9に示すような短縮語辞書を用
いた場合の例として、重要文判定部24で得られた要約
文が図10に示すものであるときの同義語・短縮語置換
部25で置換された縮小要約文の一例を図11に示す。
【0095】すなわち、図11に示す短縮要約文におい
て、「関西国際空港」という単語は、2回目にでたとき
から「関空」という短縮語に置換され、「新東京国際空
港」という単語は、2回目にでたときから「成田」とい
う短縮語に置換され、結果的に図10に示す要約文は図
11に示すように短縮される。
【0096】なお、1個目の単語検出時に、以降の省略
形を、例えば括弧付きで追加表記を行なうことや、一個
目の単語から省略形に置換することなども可能であり、
一個目の単語検出時に、以降の省略形を、例えば括弧突
きで追加表記を行なう構成をとると、短縮要約文の読み
易さを向上させることができる。
【0097】同義語・短縮語置換部25における同義語
・短縮語の置換処理において、上記同義語・短縮語辞書
27に記載の単語は、全て上記形態素解析辞書26にも
登録されているものとする。
【0098】自動文書要約部20における文書要約時に
行なった形態素解析部22による形態素解析結果を用い
て、各文節の自立語が同義語・短縮語になり得る品詞
(名詞あるいは固有名詞など)の場合は、その単語が同
義語・短縮語辞書27に登録されているかが検出され
る。
【0099】また、その単語が検出される毎に、その単
語の出現が1回目であるか否かを示すフラグを準備して
おく。そして、この単語が検出された場合は、そのフラ
グをチェックし、2回目以降に出現した単語は、同義語
・短縮語辞書27に登録されている語数のより少ない単
語で置換される。
【0100】同義語・短縮語辞書27に記載の単語が形
態素解析辞書26に含まれていない場合は、同義語・短
縮語になり得る品詞(名詞あるいは固有名詞など)が連
続している部分を1つの単語となる可能性があるとし、
連続するものを組み合わせて、検査することにより対応
可能である。
【0101】なお、図1に示した、文書圧縮伸長部40
およびインデキシング部30および文書検索部50自体
は、本願発明要旨を構成するものではなく、この種の文
書検索システムやファイル圧縮伸長システムにすでに実
施されている手法を利用することにより実現できる。
【0102】なお、インデキシング部30におけるイン
デックス作成の手法としては、文字成分方法、形態素解
析によるキーワード自動抽出方式等があるが、本願発明
ではいずれの手法を採用するものでも利用可能である。
【0103】ところで、全文検索を行なうシステムで
は、そのインデックスサイズは、方式によって異なるも
のの、通常登録文書サイズの100%〜150%程度で
あるといわれ、また現在普及している文書圧縮ルールに
より文書を圧縮した場合は、原文を10%のサイズにま
で圧縮することができる。
【0104】また、要約文は原文の10%〜20%程度
の量で、ほぼ原文の主題を掴むことができるといわれて
いる。
【0105】したがって、例えば100Mbyteの登
録文書で10%の要約を行なった場合、上記実施例によ
ると、初期状態で、登録文書サイズは100Mbyt
e、インデックスサイズは100Mbyte、合計20
0Mbyteであったのが、原文圧縮状態では、登録文
書サイズが10Mbyte、インデックスサイズは10
0Mbyte、合計110Mbyteの55%まで文書
量を小型化でき、要約文によるインデックスを用いた状
態では、登録文書サイズが10Mbyte、インデック
スサイズは10Mbyte、合計20Mbyteの10
%まで文書量を小型化できる。
【0106】なお、上記実施形態では日本語を対象にし
た文書検索システムを示したが、本願発明は、他の言語
を対象にする文書検索システムにも同様に適用すること
ができるのは勿論である。
【0107】
【発明の効果】以上説明したようにこの発明によれば、
登録された文書から該文書の要約文を自動生成し、該自
動生成した要約文から上記文書のインデックスを作成
し、上記インデックスに基づき上記所望の検索要求に対
応する文書を検索するように構成したので、文書検索精
度への影響を抑えながら登録文書等を格納する記憶装置
の必要容量を大幅に減少させ、かつユーザに対してより
多くの検索情報を提供することができるという効果を奏
する。
【図面の簡単な説明】
【図1】この発明に係わる文書検索方法および装置を適
用して構成した文書検索システムの一実施の形態を示す
概略ブロック図。
【図2】図1に示した文書記憶部に格納された登録文書
の小型化処理およびインデックス記憶部に格納されたイ
ンデックスの小型化処理を行なう文書管理バッチ処理ト
ランスの概要を説明する図。
【図3】図1に示した文書管理ファイル記憶部に格納さ
れる文書管理ファイルの一例を示した図。
【図4】図2で説明した文書管理バッチ処理の詳細を示
すフローチャート。
【図5】図2で説明した文書管理バッチ処理の詳細を示
すフローチャート。
【図6】図2で説明した文書管理バッチ処理の詳細を示
すフローチャート。
【図7】図4乃至図6の文書管理バッチ処理がなされた
後の文書管理ファイル記憶部に格納される文書管理ファ
イルの一例を示した図。
【図8】図1に示した自動文書要約部の構成例を示した
ブロック図。
【図9】図8に示した自動文書要約部の同義語・短縮語
置換部で使用される短縮語辞書の一例を示した図。
【図10】図8に示した自動文書要約部の重要文判定部
で得られた要約文の一例を示す図。
【図11】図10に示した要約文が図8に示した自動文
書要約部の同義語・短縮語置換部でどのように置換され
るかの一例を示した図。
【符号の説明】
10 入出力部 20 自動文書要約部 30 インデキシング部 40 文書圧縮伸長部 50 文書検索部 60 文書記憶部 70 インデックス記憶部 80 文書管理ファイル記憶部 90 制御部 21 文書構造解析部 22 形態素解析部 23 構文解析部 24 重要文判定部 25 同義語・短縮語置換部 26 形態素解析辞書 27 同義語・短縮語辞書
───────────────────────────────────────────────────── フロントページの続き (72)発明者 向川 信一 京都府京都市右京区花園土堂町10番地 オ ムロン株式会社内

Claims (17)

    【特許請求の範囲】
  1. 【請求項1】 登録された複数の文書から所望の検索要
    求に対応する文書を検索する文書検索方法において、 上記登録された文書から該文書の要約文を自動生成し、 該自動生成した要約文から上記文書のインデックスを作
    成し、 上記インデックスに基づき上記所望の検索要求に対応す
    る文書を検索することを特徴とする文書検索方法。
  2. 【請求項2】 上記登録された文書の過去のアクセス回
    数が一定の期間内に規定の値を越えている場合は、上記
    登録された文書の原文から当該文書のインデックスを作
    成して上記インデックスに基づき上記所望の検索要求に
    対応する文書を検索することを特徴とする請求項1記載
    の文書検索方法。
  3. 【請求項3】 上記要約文に含まれる単語に該単語より
    語数の少ない同義語若しくは短縮語が存在する場合は、
    該単語を上記同義語若しくは短縮語で置換することによ
    り上記要約文を小型化することを特徴とする請求項1ま
    たは2記載の文書検索方法。
  4. 【請求項4】 上記要約文に含まれる単語より語数の少
    ない同義語若しくは短縮語が存在する単語が複数存在す
    る場合において、該単語を該要約文に最初に現れる単語
    を除いて上記同義語若しくは短縮語で置換することを特
    徴とする請求項3記載の文書検索方法。
  5. 【請求項5】 登録された複数の文書から所望の検索要
    求に対応する文書を検索する文書検索方法において、 上記登録された文書の過去のアクセス回数が一定の期間
    内に規定の値を越えている場合は、上記登録された文書
    の原文から当該文書の第1のインデックスを作成して該
    第1のインデックスに基づき上記所望の検索要求に対応
    する文書を検索し、 上記登録された文書の過去のアクセス回数が一定の期間
    内に規定の値以下の場合は、上記登録された文書から該
    文書の要約文を自動生成するとともに該自動生成した要
    約文から上記文書の第2のインデックスを作成して該第
    2のインデックスに基づき上記所望の検索要求に対応す
    る文書を検索することを特徴とする文書検索方法。
  6. 【請求項6】 登録された複数の文書から所望の検索要
    求に対応する文書を検索する文書検索方法において、 上記登録された文書を圧縮して圧縮文書を自動生成し、 上記所望の検索要求に対応して上記圧縮文書を検索し、 該検索した圧縮文書を伸長して出力することを特徴とす
    る文書検索方法。
  7. 【請求項7】 上記登録された文書の過去のアクセス回
    数が一定の期間内に規定の値を越えている場合は、上記
    登録された文書の原文を検索して該検索した文書原文を
    出力し、 上記登録された文書の過去のアクセス回数が一定の期間
    内に規定の値以下の場合は、上記圧縮文書を検索して該
    検索した圧縮文書を伸長して出力することを特徴とする
    請求項6記載の文書検索方法。
  8. 【請求項8】 登録された複数の文書から所望の検索要
    求に対応する文書を検索する文書検索方法において、 上記登録された文書の過去のアクセス回数が第1の期間
    内に第1の規定の値を越えている場合は、上記登録され
    た文書の原文から当該文書の第1のインデックスを作成
    して該第1のインデックスに基づき上記登録された文書
    の原文を検索して該検索した文書原文を出力し、 上記登録された文書の過去のアクセス回数が上記第1の
    期間内に上記第1の規定の値以下の場合は、上記登録さ
    れた文書の原文から当該文書の第1のインデックスを作
    成するとともに上記登録された文書を圧縮して圧縮文書
    を自動生成して該第1のインデックスに基づき上記圧縮
    文書を検索して該検索した圧縮文書を伸長して出力し、 上記登録された文書の過去のアクセス回数が上記第1の
    期間より長い第2の期間内に第2の規定以下の場合は、
    上記登録された文書から該文書の要約文を自動生成する
    とともに該自動生成した要約文から上記文書の第2のイ
    ンデックスを作成して該第2のインデックスに基づき上
    記圧縮文書を検索して該検索した圧縮文書を伸長して出
    力し、 上記登録された文書の過去のアクセス回数が上記第2の
    期間より長い第3の期間内に零である場合は上記登録さ
    れた文書を削除して上記要約文のみ保持することを特徴
    とする文書検索方法。
  9. 【請求項9】 上記要約文に含まれる単語に該単語より
    語数の少ない同義語若しくは短縮語が存在する場合は、
    上記要約文に含まれる上記語数の少ない同義語若しくは
    短縮語が存在する単語を上記同義語若しくは短縮語で置
    換することにより上記要約文を小型化することを特徴と
    する請求項8記載の文書検索方法。
  10. 【請求項10】 上記要約文に含まれる単語より語数の
    少ない同義語若しくは短縮語が存在する単語が複数存在
    する場合において、該単語を該要約文に最初に現れる単
    語を除いて上記同義語若しくは短縮語で置換することを
    特徴とする請求項9記載の文書検索方法。
  11. 【請求項11】 登録された複数の文書から所望の検索
    要求に対応する文書を検索する文書検索装置において、 上記登録された文書を格納する文書記憶手段と、 上記検索要求を入力する検索要求入力手段と、 上記文書記憶手段に格納された文書から該文書の要約文
    を自動生成する自動文書要約手段と、 上記自動文書要約手段により生成された上記要約文から
    上記文書のインデックスを作成するインデックス作成手
    段と、 上記インデックス作成手段により作成されたインデック
    スを格納するインデックス記憶手段と、 上記インデックス記憶手段に格納されたインデックスに
    基づき上記文書記憶手段に格納された文書の中から上記
    所望の検索要求に対応する文書を検索する文書検索手段
    と、 を具備することを特徴とする文書検索装置。
  12. 【請求項12】 上記要約文に含まれる単語に該単語よ
    り語数の少ない同義語若しくは短縮語が存在する場合
    は、該単語を上記同義語若しくは短縮語で置換すること
    により上記要約文を小型化する要約文小型化手段、 を更に具備することを特徴とする請求項11記載の文書
    検索装置。
  13. 【請求項13】 上記要約文小型化手段は、 上記要約文に含まれる単語より語数の少ない同義語若し
    くは短縮語が存在する単語が複数存在する場合におい
    て、該単語を該要約文に最初に現れる単語を除いて上記
    同義語若しくは短縮語で置換することを特徴とする請求
    項12記載の文書検索装置。
  14. 【請求項14】 登録された複数の文書から所望の検索
    要求に対応する文書を検索する文書検索装置において、 上記登録された文書を格納する文書記憶手段と、 上記検索要求を入力するとともに該検索要求に対応する
    検索結果を出力する入出力手段と、 上記文書記憶手段に格納された文書原文から該文書の要
    約文を自動生成して上記文祖記憶手段に格納する自動文
    書要約手段と、 上記文書記憶手段に格納された上記文書原文若しくは上
    記要約文から上記文書のインデックスを作成するインデ
    ックス作成手段と、 上記インデックス作成手段により作成されたインデック
    スを格納するインデックス記憶手段と、 上記文書記憶手段に格納された上記文書原文を圧縮して
    上記文書記憶手段に圧縮文書として格納するとともに上
    記文書記憶手段に格納された上記圧縮文書を伸長する文
    書圧縮伸長手段と、 上記入力手段から入力された上記検索要求に対応して上
    記インデックス記憶手段に格納されたインデックスに基
    づき上記上記文書記憶手段に格納された文書原文若しく
    は上記圧縮文書若しくは上記要約文を検索して上記入出
    力手段に出力する文書検索処理を実行する文書検索手段
    と、 上記文書検索手段による上記文書検索処理を管理する管
    理手段と、 を具備することを特徴とする文書検索装置。
  15. 【請求項15】 上記要約文に含まれる単語に該単語よ
    り語数の少ない同義語若しくは短縮語が存在する場合
    は、該単語を上記同義語若しくは短縮語で置換すること
    により上記要約文を小型化する要約文小型化手段、 を更に具備することを特徴とする請求項14記載の文書
    検索装置。
  16. 【請求項16】 上記要約文小型化手段は、 上記要約文に含まれる単語より語数の少ない同義語若し
    くは短縮語が存在する単語が複数存在する場合におい
    て、該単語を該要約文に最初に現れる単語を除いて上記
    同義語若しくは短縮語で置換することを特徴とする請求
    項15記載の文書検索装置。
  17. 【請求項17】 上記検索手段は、 上記文書記憶手段に格納された文書の過去のアクセス回
    数が第1の期間内に第1の規定の値を越えている場合
    は、上記インデックス記憶手段に格納された上記文書原
    文から作成された第1のインデックスに基づき上記文書
    記憶手段に格納された文書原文を検索して該検索した文
    書原文を出力し、 上記文書記憶手段に格納された文書の過去のアクセス回
    数が上記第1の期間内に上記第1の規定の値以下の場合
    は、上記第1のインデックスに基づき上記圧縮文書を検
    索して該検索した圧縮文書を伸長して出力し、 上記文書記憶手段に格納された文書の過去のアクセス回
    数が上記第1の期間より長い第2の期間内に第2の規定
    以下の場合は、上記インデックス記憶手段に格納された
    上記要約文から作成された第2のインデックスに基づき
    上記圧縮文書を検索して該検索した圧縮文書を伸長して
    出力し、 上記文書記憶手段に格納された文書の過去のアクセス回
    数が上記第2の期間より長い第3の期間内に零である場
    合は上記文書記憶手段に格納された文書を削除して上記
    要約文のみ保持することを特徴とする請求項14記載の
    文書検索装置。
JP9015667A 1997-01-29 1997-01-29 文書検索方法および装置 Pending JPH10214268A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9015667A JPH10214268A (ja) 1997-01-29 1997-01-29 文書検索方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9015667A JPH10214268A (ja) 1997-01-29 1997-01-29 文書検索方法および装置

Publications (1)

Publication Number Publication Date
JPH10214268A true JPH10214268A (ja) 1998-08-11

Family

ID=11895102

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9015667A Pending JPH10214268A (ja) 1997-01-29 1997-01-29 文書検索方法および装置

Country Status (1)

Country Link
JP (1) JPH10214268A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000285134A (ja) * 1999-03-31 2000-10-13 Toshiba Corp 文書管理方法および文書管理装置および記憶媒体
JP2001117934A (ja) * 1999-10-19 2001-04-27 Hitachi Ltd 電子文書管理方法及びシステム並びに記録媒体
WO2008126149A1 (ja) * 2007-03-30 2008-10-23 Fujitsu Limited 文書匿名化装置
JP2015032281A (ja) * 2013-08-07 2015-02-16 富士ゼロックス株式会社 文書管理装置及び文書管理プログラム
WO2019026360A1 (ja) * 2017-07-31 2019-02-07 ソニー株式会社 情報処理装置および情報処理方法
JP2020024598A (ja) * 2018-08-08 2020-02-13 シャープ株式会社 情報処理装置、プログラム及びシステム
US11244000B2 (en) 2019-03-25 2022-02-08 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium storing program for creating index for document retrieval

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07200612A (ja) * 1993-12-28 1995-08-04 Ricoh Co Ltd 電子ファイリング装置
JPH08212228A (ja) * 1995-02-02 1996-08-20 Sanyo Electric Co Ltd 要約文作成装置および要約音声作成装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07200612A (ja) * 1993-12-28 1995-08-04 Ricoh Co Ltd 電子ファイリング装置
JPH08212228A (ja) * 1995-02-02 1996-08-20 Sanyo Electric Co Ltd 要約文作成装置および要約音声作成装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000285134A (ja) * 1999-03-31 2000-10-13 Toshiba Corp 文書管理方法および文書管理装置および記憶媒体
JP2001117934A (ja) * 1999-10-19 2001-04-27 Hitachi Ltd 電子文書管理方法及びシステム並びに記録媒体
WO2008126149A1 (ja) * 2007-03-30 2008-10-23 Fujitsu Limited 文書匿名化装置
JPWO2008126149A1 (ja) * 2007-03-30 2010-07-15 富士通株式会社 文書匿名化装置
JP2015032281A (ja) * 2013-08-07 2015-02-16 富士ゼロックス株式会社 文書管理装置及び文書管理プログラム
WO2019026360A1 (ja) * 2017-07-31 2019-02-07 ソニー株式会社 情報処理装置および情報処理方法
JPWO2019026360A1 (ja) * 2017-07-31 2020-05-28 ソニー株式会社 情報処理装置および情報処理方法
US11250873B2 (en) 2017-07-31 2022-02-15 Sony Corporation Information processing device and information processing method
JP2020024598A (ja) * 2018-08-08 2020-02-13 シャープ株式会社 情報処理装置、プログラム及びシステム
US11244000B2 (en) 2019-03-25 2022-02-08 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium storing program for creating index for document retrieval

Similar Documents

Publication Publication Date Title
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
JP2783558B2 (ja) 要約生成方法および要約生成装置
JP3691844B2 (ja) 文書処理方法
US6424983B1 (en) Spelling and grammar checking system
EP0378848A2 (en) Method for use of morphological information to cross reference keywords used for information retrieval
US20040006456A1 (en) Multi-language document search and retrieval system
US20050203900A1 (en) Associative retrieval system and associative retrieval method
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
JP2007287134A (ja) 情報抽出装置、及び情報抽出方法
US5384700A (en) Method and system for storing multiple, modifiable Yomi and Kanji strings in a structured document
JPH10214268A (ja) 文書検索方法および装置
JPS6170660A (ja) 機械翻訳システムにおける多義表示・選択方法
JP3352799B2 (ja) 機械翻訳方法及び機械翻訳装置
JPH0944523A (ja) 関連語提示装置
JP3851712B2 (ja) 文書管理システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH07325826A (ja) 日本語処理システム
JPH10340271A (ja) 文書抄録作成装置及び文書抄録作成プログラムを記録した記憶媒体
JP3187671B2 (ja) 電子辞書表示装置
JPH0561902A (ja) 機械翻訳システム
JP3329476B2 (ja) かな漢字変換装置
KR20010004090A (ko) 에이치티엠엘 기반 한글 용어/약어 하이퍼링크 생성기
KR20020003701A (ko) 디지털 문서의 키워드를 자동으로 추출하는 방법
JP3389313B2 (ja) 機械翻訳装置
JPH07152778A (ja) 文書検索装置
JPH08235180A (ja) 機械翻訳装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040604