JPH06149889A - 電子ファイリングシステム - Google Patents

電子ファイリングシステム

Info

Publication number
JPH06149889A
JPH06149889A JP4302632A JP30263292A JPH06149889A JP H06149889 A JPH06149889 A JP H06149889A JP 4302632 A JP4302632 A JP 4302632A JP 30263292 A JP30263292 A JP 30263292A JP H06149889 A JPH06149889 A JP H06149889A
Authority
JP
Japan
Prior art keywords
keyword
document
image
reading
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4302632A
Other languages
English (en)
Inventor
Ayako Itsubo
綾子 伊坪
Yasuhiko Murayama
靖彦 村山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP4302632A priority Critical patent/JPH06149889A/ja
Publication of JPH06149889A publication Critical patent/JPH06149889A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

(57)【要約】 【目的】 キーワードの自動抽出が可能な電子ファイリ
ングシステムを提供することを目的とする。 【構成】 文書101のイメージを読み取り装置102
によって読み込む。次にキーワード登録・検索装置10
3では、表示装置105にデータを表示させながら、読
み込んだ文書の定型フォーマットを登録、また定型フォ
ーマット登録済みの場合は文書の種類を指定し、定型フ
ォーマット内の文字認識を行い、認識結果からキーワー
ドを自動抽出し、文書イメージとキーワードを対にして
記憶装置104に登録する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、複数の画像情報とそれ
ぞれに対応するキーワードとを記憶媒体に記憶させ、必
要な画像情報をキーワードにより検索することが可能な
電子ファイリングシステムに関する。
【0002】
【従来の技術】電子ファイリングシステムにおいては、
複数の画像情報とそれぞれに対応するキーワードとを記
憶媒体に記憶させる場合に、画像情報については、その
画像情報の原稿を二次元走査装置にセットすれば、ほぼ
自動的にその画像情報が読み取られて記憶媒体に記憶さ
せることができるのに対し、キーワードについては、画
像情報の原稿を二次元走査装置にセットしたとき、ある
いは、複数の画像情報を記憶させ終わった後に、操作者
がキーボードのキーを操作してキーワードの入力を行わ
なければならない。したがって、画像情報が多くなるほ
ど、キーワード入力のキー操作による作業が煩雑とな
り、時間の掛かる作業となる欠点があった。
【0003】そこで、電子ファイリングシステムにおけ
るキーワード入力の所要時間短縮化を図るために、バー
コード等により表したキーワード情報を画像情報ととも
に読み取り、自動的に抽出・記憶する方法(特開昭61
−65363)や、読み取る文書画像の原稿上で、キー
ワードとなる部分をマーカー等で指定し読み取ることに
より、キーワードを自動的に記憶する方法(特開平1−
269171)が示されている。
【0004】
【発明が解決しようとする課題】このような従来技術で
は、 (1)バーコード等によりキーワード情報を文書画像に
表す手間がいる。
【0005】(2)マーカー等でキーワードを指定する
手間がいる。
【0006】以上のような問題がある。
【0007】ところで、電子ファイリングシステムにフ
ァイルする文書は、キーワードとなる文字列が、例えば
論文、社内文書等のタイトルや概要のように、常に同じ
位置に記載されている定型フォーマットのものが多い。
【0008】本発明はこのような事情のもとに成された
もので、その目的とするところは、読み取り装置で読み
取った文書画像の定型フォーマットとなる部分を指定
し、フォーマット内の文字認識を行うことにより、検索
に用いるキーワードを自動的に抽出・記憶し得るように
した電子ファイリングシステムを提供することにある。
【0009】
【課題を解決するための手段】本発明の電子ファイリン
グシステムは、文書画像の読み取りを行う読み取り手段
と、記憶装置に文書種類とキーとなる部分の位置情報を
登録する定型フォーマット登録手段と、前記読み取り手
段で読み取る文書画像が何れの文書種類にあたるかを指
定する文書種指定手段と、前記文書種類指定手段により
指定された文書種類に応じて、前記読み取り手段で読み
取った文書画像のキーとなる部分の文字認識を行う文字
認識手段と、前記文字認識手段で文字認識された結果か
らキーワードの抽出をする抽出手段と、前記キーワード
抽出手段で抽出したキーワードと前記読み取り手段で読
み取った文書画像とを対応させて、記憶装置に登録する
登録手段とを備えていることを特徴とする。
【0010】
【実施例】以下本発明の一実施例を図面に基づいて説明
する。また、以下の「オペレータ」とは、電子ファイリ
ングシステムの利用者を示す。
【0011】図1は本発明の電子ファイリングシステム
を実行するための制御システムの一実施例、及び処理制
御状態を示す図である。この実施例に係わる制御システ
ムは、文書101を読み取るための読み取り装置102
と、読み取り装置102によって読み取られた文書画像
からキーワードを自動抽出するキーワード登録部や、検
索を行う検索部を備えたキーワード登録・検索装置10
3と、キーワード登録・検索装置103で得られたデー
タを記憶する記憶装置104と、キーワード登録・検索
装置103によってキーワード登録・検索を行う時に、
処理手順や処理結果を表示する表示装置105とから成
る。
【0012】図2はキーワード登録・検索装置103の
構成図である。キーワード登録・検索装置103は読み
取り装置102に接続されて文書画像イメージの読み取
りを行うイメージ読み取り部201と、イメージ読み取
り部201で読み取られた文書のイメージデータが格納
されるイメージメモリ207と、イメージメモリ207
に格納されたデータに対する定型フォーマットデータが
登録済みでない場合に、オペレータに対し、イメージデ
ータ207に格納されたデータの文書種類と定型フォー
マットに関する情報を指定するよう要求し、オペレータ
が指定した文書種類とそれに対応する定型フォーマット
データを記憶装置104に登録する定型フォーマット登
録部202と、イメージメモリ207に格納されたデー
タの定型フォーマットが登録済みの場合に、オペレータ
に対し、イメージメモリ207に格納されたデータの文
書画像の種類を指定するよう要求し、指定された文書種
類に基づいて定型フォーマットデータを引き出す文書種
指定部203と、定型フォーマット登録部202または
文書種指定部203によって決定された定型フォーマッ
トデータに基づいて、イメージメモリ207に格納され
たデータの定型フォーマット内のキー部分の文字認識を
行う文字認識部204と、文字認識部204によって得
られた認識結果を格納する認識結果メモリ208と、認
識結果メモリ208に格納されたデータの中からキーワ
ードを抽出し、イメージメモリ207に格納されたデー
タとキーワードを対にして登録するキーワード登録部2
05と、キーワード登録部によって登録されたキーワー
ドを指定することによって必要な文書の検索を行う検索
部206と、キーワード登録・検索装置103で得られ
たデータ(文書画像のイメージデータ・定型フォーマッ
トデータ等)を記憶する記憶装置104や、キーワード
登録・検索装置103を構成する各部の制御を行う制御
部209とを有している。
【0013】図3は本実施例の画像データ入力の際の処
理の概要を示す流れ図である。始めに301において、
これから読み取る文書画像の定型フォーマットデータが
登録済みであるか否かを、オペレータに指示するよう要
求する。301でフォーマット登録済みと指示された場
合、文書種指定処理302において、文書種指定部20
3はオペレータに対し、読み込む文書の種類が、何れの
文書にあたるかを指定するよう要求し、指定された文書
種類に基づいて定型フォーマットデータを引き出す。そ
して読み取り処理303において、イメージ読み取り部
201は文書画像の読み取りを行いイメージメモリ20
7に格納する。301でフォーマット登録済みでないと
指示された場合は、読み取り処理304において、イメ
ージ読み取り部201は文書画像の読み取りを行いイメ
ージメモリ207に格納し、定型フォーマット登録処理
305において、定型フォーマット登録部202は、イ
メージデータ207に格納されたデータの表示を表示装
置105に行い、オペレータに対し文書種類と定型フォ
ーマット内のキーとなる部分の位置を指定するよう要求
し、オペレータが指定した文書種類とそれに対応する定
型フォーマット内のキーとなる部分の位置情報を定型フ
ォーマットデータとして記憶装置104に登録する。
【0014】次に文字認識処理306において、文字認
識部204は、イメージメモリ207に格納されたイメ
ージデータに対して、302もしくは305によって指
定もしくは登録された定型フォーマットデータを用い
て、定型フォーマットのキーとなる部分の文字認識を行
い、認識結果メモリ208に格納する。なお、文字認識
部204における文字の切り出し、文字認識は公知の方
法を用いて行う。次にキーワード抽出・登録処理307
において、キーワード抽出・登録部205は認識結果メ
モリ208に格納されたデータからキーワードの抽出を
行い、イメージメモリ207に格納されたデータに対応
させて記憶装置104に登録する。
【0015】次に、図3におけるキーワード抽出・登録
処理307の実施方法について説明する。
【0016】図4は図3のキーワード抽出・登録処理3
07の概要を説明する流れ図である。まず誤認識文字訂
正処理401において、認識結果メモリ208に格納さ
れた認識結果データに誤りがあればオペレータが訂正す
る。次にキーワード抽出処理403において、記憶装置
104に格納されているキーワード辞書を参照して、認
識結果メモリ208に格納された認識結果データからキ
ーワード抽出を行う。そして、キーワード確認処理40
3によって、オペレータがキーワード抽出処理402で
抽出されたキーワードを確認し、不要なキーワード、ま
たは誤ったキーワード、付け足すキーワードなどがあれ
ば修正する。最後にキーワード登録処理404によっ
て、キーワード確認処理403で確認されたキーワード
を登録する。なお、文字認識処理306とキーワード抽
出処理402の処理結果に誤りが無い場合、点線で囲ん
だ誤認識文字訂正処理401とキーワード確認処理40
3は、不要な処理となる。
【0017】
【発明の効果】以上説明したように、本発明の電子ファ
イリングシステムによれば、キーワードとなる文字列
が、例えば論文、社内文書等のタイトルや概要のよう
に、常に同じ位置に記載されているような定型フォーマ
ットの文書を取り扱う場合、複数の画像情報とそれぞれ
に対応するキーワードとを記憶媒体に記憶させる時に、
操作者がキーボードにより1文字1文字キーワードの入
力を行うことなく、文書画像のイメージを読み取る際に
文書種類を指定することにより、事前に登録された定型
フォーマットデータを基にキーとなる部分の文字認識を
行い、自動的にキーワード抽出を行う。よって、イメー
ジ読み取り処理によりキーワードの抽出が一括して行わ
れ、ひいては、画像情報と対応するキーワードの登録の
ための操作を軽減し、高速にキーワード登録処理をする
ことができる。
【図面の簡単な説明】
【図1】本発明の電子ファイリングシステムを実行する
ための制御システムの一実施例、及び処理制御状態を示
す図である。
【図2】キーワード登録・検索装置103の構成図であ
る。
【図3】本実施例の処理の概要を示す流れ図である。
【図4】図3のキーワード抽出・登録処理307の概要
を説明する流れ図である。
【符号の説明】
101・・・文書 102・・・読み取り装置 103・・・キーワード登録・検索装置 104・・・記憶装置 105・・・表示装置

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 文書画像の読み取りを行う読み取り手段
    と、記憶装置に文書種類とキーとなる部分の位置情報を
    登録する定型フォーマット登録手段と、前記読み取り手
    段で読み取る文書画像が何れの文書種類にあたるかを指
    定する文書種指定手段と、前記文書種類指定手段により
    指定された文書種類に応じて、前記読み取り手段で読み
    取った文書画像のキーとなる部分の文字認識を行う文字
    認識手段と、前記文字認識手段で文字認識された結果か
    らキーワードの抽出をする抽出手段と、前記キーワード
    抽出手段で抽出したキーワードと前記読み取り手段で読
    み取った文書画像とを対応させて、記憶装置に登録する
    登録手段とを備えていることを特徴とする電子ファイリ
    ングシステム。
JP4302632A 1992-11-12 1992-11-12 電子ファイリングシステム Pending JPH06149889A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4302632A JPH06149889A (ja) 1992-11-12 1992-11-12 電子ファイリングシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4302632A JPH06149889A (ja) 1992-11-12 1992-11-12 電子ファイリングシステム

Publications (1)

Publication Number Publication Date
JPH06149889A true JPH06149889A (ja) 1994-05-31

Family

ID=17911325

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4302632A Pending JPH06149889A (ja) 1992-11-12 1992-11-12 電子ファイリングシステム

Country Status (1)

Country Link
JP (1) JPH06149889A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09204433A (ja) * 1996-01-24 1997-08-05 Fuji Xerox Co Ltd キーワード設定装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09204433A (ja) * 1996-01-24 1997-08-05 Fuji Xerox Co Ltd キーワード設定装置

Similar Documents

Publication Publication Date Title
JPH03161873A (ja) データベース構築機能を有する電子フアイリング装置
JP4332356B2 (ja) 情報検索装置及び方法並びに制御プログラム
JP2005182460A (ja) 情報処理装置、注釈処理方法、情報処理プログラムおよび情報処理プログラムを格納した記録媒体
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JPH08180068A (ja) 電子ファイリング装置
JPH06149889A (ja) 電子ファイリングシステム
JPH06162107A (ja) 電子ファイリングシステム
JPH08153110A (ja) 文書ファイリング装置及び方法
JPS62106574A (ja) 文書画像フアイル登録検索方式
JPH1013642A (ja) 画像情報処理装置
JP3083171B2 (ja) 文字認識装置及び方法
JPH1196148A (ja) 文書管理装置
JP2810491B2 (ja) 文書ファイリング装置
JPH04348475A (ja) 画像情報検索方法及びその装置
JPH1097606A (ja) Ocr装置と連携したファイリングシステム及びファイリング方法
JPH10247237A (ja) 文書画像処理装置および文書画像処理方法および情報記録媒体
JPH05210635A (ja) 入力装置
JPH0757040A (ja) Ocr付きファイリング装置
JPH09160907A (ja) 文書処理装置及び方法
JPS62134765A (ja) 漢和辞書の電子検索方法
JP2000112955A (ja) 画像表示方法および画像ファイリング装置および記録媒体
JPH05298368A (ja) 電子ファイリングシステムの検索語入力方法
JPH08202859A (ja) 電子ファイリング装置及びその方法
JP2601139B2 (ja) 文字列検索装置
JP2829186B2 (ja) 光学的文字読取装置