JPH1097606A - Ocr装置と連携したファイリングシステム及びファイリング方法 - Google Patents

Ocr装置と連携したファイリングシステム及びファイリング方法

Info

Publication number
JPH1097606A
JPH1097606A JP8248334A JP24833496A JPH1097606A JP H1097606 A JPH1097606 A JP H1097606A JP 8248334 A JP8248334 A JP 8248334A JP 24833496 A JP24833496 A JP 24833496A JP H1097606 A JPH1097606 A JP H1097606A
Authority
JP
Japan
Prior art keywords
image
file
filing
registration
text file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8248334A
Other languages
English (en)
Inventor
Minoru Saito
稔 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP8248334A priority Critical patent/JPH1097606A/ja
Publication of JPH1097606A publication Critical patent/JPH1097606A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

(57)【要約】 【課題】帳票等の紙媒体に記録された内容を表すイメー
ジを適当なキーワードを付して簡単にファイリングする
ことを可能にする。 【解決手段】紙媒体に記録された内容をイメージによっ
て読取ってイメージファイルを作成すると共に、イメー
ジ中に含まれる文字について文字認識処理を施してテキ
ストファイルを作成するOCR装置10と、OCR装置
10によって作成されたイメージファイルとテキストフ
ァイルとを読み込んで、体系的にファイリングする機能
を有するファイリングシステム14とを具備する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、帳票等の紙媒体に
記録された内容をイメージデータとして保存するOCR
装置と連携したファイリングシステム及びファイリング
方法に関する。
【0002】
【従来の技術】一般に、ファイリングシステムは、帳票
等の紙媒体に記録された内容をスキャナ等によって読み
込み、読み込んだイメージ(ファイル)に対してキーワ
ードを付して保存する。ファイリングシステムに保存さ
れた多数のイメージから必要なイメージを読み出す場合
には、保存する際に付したキーワードを指定することで
所望するイメージを特定することができる。
【0003】従来のファイリングシステムにおいてキー
ワードは、帳票に記録されている特徴的な文字列、例え
ば帳票番号や表題等の内容を選択して、キーボードの操
作によって入力されている。
【0004】ところで、帳票等の紙媒体に記録された内
容を読み込む装置として、他にOCR装置(光学的文字
読取装置)がある。OCR装置では、帳票等のイメージ
を読み込み、このイメージに対して帳票に記録されてい
る帳票番号や表題等を表す文字を認識して、文字コード
からなるテキストファイルを出力することができる。ま
た、文字認識のために読み込んだイメージそのものを、
イメージファイルとして出力することができる。
【0005】
【発明が解決しようとする課題】しかしながら、従来の
ファイリングシステムでは、大量の帳票等をファイリン
グする場合、帳票を1枚毎にスキャナで読み込み、その
都度、キーボードからキーワードを入力しなければなら
なかった。
【0006】また、OCR装置では、帳票に記録されて
いる帳票番号や表題等を表す文字を文字認識した結果を
テキストファイルとして出力し、帳票に対して読み込ん
だイメージをイメージファイルとして出力するだけであ
って、各ファイルを体系的に保存するものではなかっ
た。従来、OCR装置によって得られたテキストファイ
ルとイメージファイルを体系的に保存するためには、テ
キストファイルとイメージファイルを再度、ファイリン
グシステムに入力する作業が必要であった。
【0007】ファイリングシステムを利用した場合、あ
るいはOCR装置を利用した場合の何れであっても、簡
単な操作によって、イメージファイルに適切なキーワー
ドを付して体系的に保存することができず、操作に非常
に手間がかかっていた。
【0008】本発明は前記のような事情を考慮してなさ
れたもので、帳票等の紙媒体に記録された内容を表すイ
メージを適当なキーワードを付して簡単にファイリング
することが可能なOCR装置と連携したファイリングシ
ステム及びファイリング方法を提供することを目的とす
る。
【0009】
【課題を解決するための手段】本発明は、紙媒体に記録
された内容をイメージによって読取ってイメージファイ
ルを作成すると共に、前記イメージ中に含まれる文字に
ついて文字認識処理を施してテキストファイルを作成す
るOCR装置と、前記OCR装置によって作成された前
記イメージファイルと前記テキストファイルとを読み込
んで、体系的にファイリングするための登録制御を行な
う登録機能を有するホストシステムと、前記ホストシス
テムの登録機能による登録制御により、前記イメージフ
ァイルと前記テキストファイルとをファイリングシステ
ムとをファイリングするファイリングシステムとを具備
したことを特徴とする。
【0010】このような構成により、OCR装置からの
出力ファイルをファイリングシステムに登録することが
できるので、文字認識処理の処理結果(テキストファイ
ル)と帳票等の紙媒体から読み取られたイメージを、体
系的にファイリングしておくことができる。
【0011】また本発明は、紙媒体に記録された内容を
イメージによって読取ってイメージファイルを作成する
と共に、前記イメージ中に含まれる文字について文字認
識処理を施してテキストファイルを作成するOCR装置
と、前記OCR装置によって作成された前記イメージフ
ァイルと前記テキストファイルとを読み込んで、前記テ
キストファイルの内容を利用して紙媒体の1枚毎にキー
ワードを作成し、このキーワードを紙媒体の1枚に対応
する前記イメージファイルと前記テキストファイルとに
付して体系的にファイリングするための登録制御を行な
う登録機能を有するホストシステムと、前記ホストシス
テムの登録機能による登録制御により、前記イメージフ
ァイルと前記テキストファイルとをファイリングシステ
ムとをファイリングするファイリングシステムとを具備
したことを特徴とする。
【0012】このような構成により、複数枚の紙媒体を
1度に読み込んでも、イメージ読み込みと同時に、ファ
イリングシステムにおいて検索対象を特定するためのキ
ーワードが1枚の紙媒体毎に自動作成され、1枚の紙媒
体のイメージファイルとテキストファイルを1書類とし
てファイリングシステムに登録することができるので、
キーワード登録のための操作を行なうことなく、紙媒体
から得られるイメージファイルとテキストファイルを簡
単にファイリングすることができる。
【0013】また本発明は、紙媒体に記録された内容を
イメージによって読取ってイメージファイルを作成する
と共に、前記イメージ中に含まれる文字について文字認
識処理を施してテキストファイルを作成するOCR装置
と、前記OCR装置によって作成された前記イメージフ
ァイルと前記テキストファイルとを読み込んで、前記テ
キストファイルの複数の紙媒体中の先頭の紙媒体の内容
を利用してキーワードを作成し、このキーワードを複数
の紙媒体に対応する前記イメージファイルと前記テキス
トファイルとに付して体系的にファイリングするための
登録制御を行なう登録機能を有するホストシステムと、
前記ホストシステムの登録機能による登録制御により、
前記イメージファイルと前記テキストファイルとをファ
イリングシステムとをファイリングするファイリングシ
ステムとを具備したことを特徴とする。
【0014】このような構成により、複数枚の紙媒体を
1度に読み込んでも、イメージ読み込みと同時に、ファ
イリングシステムにおいて検索対象を特定するためのキ
ーワードがテキストファイルの先頭の紙媒体の内容から
自動作成され、複数枚の紙媒体のイメージファイルとテ
キストファイルを1書類としてファイリングシステムに
登録することができるので、キーワード登録のための操
作を行なうことなく、紙媒体から得られるイメージファ
イルとテキストファイルを簡単にファイリングすること
ができる。
【0015】また本発明は、紙媒体に記録された内容を
イメージによって読取ってイメージファイルを作成する
と共に、前記イメージ中に含まれる文字について文字認
識処理を施してテキストファイルを作成するOCR装置
と、前記OCR装置によって作成された前記イメージフ
ァイルと前記テキストファイルとを読み込んで、前記テ
キストファイルの複数の紙媒体群中の各群の先頭の紙媒
体の内容を利用してキーワードを作成し、このキーワー
ドを対応する紙媒体群に対応する前記イメージファイル
と前記テキストファイルとに付して体系的にファイリン
グするための登録制御を行なう登録機能を有するホスト
システムと、前記ホストシステムの登録機能による登録
制御により、前記イメージファイルと前記テキストファ
イルとをファイリングシステムとをファイリングするフ
ァイリングシステムとを具備したことを特徴とする。
【0016】このような構成により、内容的に関連する
複数の紙媒体からなる紙媒体群が複数含まれる複数枚の
紙媒体を1度に読み込んでも、イメージ読み込みと同時
に、ファイリングシステムにおいて検索対象を特定する
ためのキーワードがテキストファイルの各紙媒体群の先
頭の紙媒体の内容から自動作成され、各紙媒体群毎の複
数枚の紙媒体のイメージファイルとテキストファイルを
1書類としてファイリングシステムに登録することがで
きるので、キーワード登録のための操作を行なうことな
く、紙媒体から得られるイメージファイルとテキストフ
ァイルを簡単にファイリングすることができる。
【0017】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態について説明する。図1は本実施形態に係わる
OCR装置と連携したファイリングシステムの構成を示
すブロック図である。図1に示すように、本実施形態に
おけるOCR装置と連携したファイリングシステムは、
OCR装置10、ホストシステム12、及びファイリン
グシステム14によって構成されている。
【0018】OCR装置10は、帳票、文書、本、新聞
等の紙媒体に記録された内容を読取ってイメージファイ
ルを作成すると共に、イメージ中に含まれる文字につい
て文字認識処理を施してテキストファイル(認識結果フ
ァイル)を作成する。また、OCR装置10は、イメー
ジファイルとテキストファイルとの関係を示すデータを
含むカタログファイルを作成する。
【0019】ホストシステム12は、OCR装置10に
おける処理を制御し、処理結果(イメージファイル、テ
キストファイル、カタログファイル)を保存すると共
に、処理結果をファイリングシステム14において体系
的に登録するための処理を行なう。ホストシステム12
の詳細な構成については後述する。
【0020】ファイリングシステム14は、OCR装置
10によって作成されたイメージファイルとテキストフ
ァイルとをホストシステム12の制御のもとで読み込ん
で、体系的にファイリングするもので、コントローラ3
0、スキャナ32、プリンタ34、ディスプレイ36、
キーボード38、ファイル記憶ユニット39を含んで構
成されている。
【0021】コントローラ30は、ファイリングシステ
ム14の全ての機能を制御するもので、プロセッサシス
テム、画像処理システム、フロッピーディスク装置やハ
ードディスク装置等の外部記憶装置が設けられている。
【0022】スキャナ32は、ファイリングシステム1
4においてファイリングしようとするイメージの読取り
を行なう。プリンタ34は、ファイリングされた各種フ
ァイル(イメージ、テキスト)の内容等を印刷出力す
る。
【0023】ディスプレイ36は、ファイリングされた
各種ファイル(イメージ、テキスト)の内容表示やガイ
ド表示等に使用される。キーボード38は、ファイリン
グシステム14に対する動作制御用の命令の入力や、フ
ァイリングされるイメージに対して付加するキーワード
やファイル検索のためのキーワードの入力等に使用され
る。
【0024】ファイル記憶ユニット39は、例えば光デ
ィスクドライブユニットによって構成され、各種ファイ
ルを記憶するものである。ファイル記憶ユニット39に
ファイリングされたイメージファイル及びテキストファ
イルは、キーワードをもとにして特定され読み出され
る。
【0025】次に、ホストシステム12は、図1に示す
ように、OCR装置制御部20、ファイリングOCR登
録部22、及び記憶部24を含んで構成されている。O
CR装置制御部20は、OCR装置10における処理を
制御すると共に、処理結果を入力して、記憶部24に記
憶させる。
【0026】ファイリングOCR登録部22は、OCR
装置10における処理結果をファイリングシステム14
において体系的に登録するための処理を行なう。ファイ
リングOCR登録部22の詳細な構成については後述す
る(図2)。
【0027】記憶部24は、OCR装置10における処
理結果(各ファイル)や、一時記憶領域24aにおいて
ファイリングOCR登録部22での処理過程における一
時的なデータ等を記憶する。
【0028】次に、ファイリングOCR登録部22は、
図2に示すように、登録方法判別部40、タイトル登録
部42、イメージ登録部44、認識結果ファイル登録部
46、通信部48の各機能が設けられている。
【0029】登録方法判別部40は、OCR装置10に
おける処理結果をファイリングシステム14に登録(フ
ァイリング)する方法を判別するもので、本実施形態で
は3通り方法から選択するものとする。
【0030】3通りの方法には、第1に無条件に1帳票
1書類として登録する方法(1帳票1書類登録)、第2
に無条件に全帳票を1書類として登録する方法(全帳票
1書類登録)、第3にOCR装置10における処理によ
って帳票毎に付されるID番号に応じて登録する方法
(ID番号利用登録)がある。
【0031】タイトル登録部42は、登録方法判別部4
0における判別に応じて、OCR装置10からのテキス
トファイル(認識結果ファイル)をもとに、ファイリン
グシステム14においてキーワードとして用いられるタ
イトルを作成し、通信部48を介してファイリングシス
テム14に登録する。
【0032】イメージ登録部44は、登録方法判別部4
0における判別に応じて、OCR装置10からのイメー
ジファイルを、通信部48を介してファイリングシステ
ム14に登録する。
【0033】認識結果ファイル登録部46は、必要に応
じて、OCR装置10からのテキストファイル(認識結
果ファイル)を、通信部48を介してファイリングシス
テム14に登録する。
【0034】通信部48は、タイトル登録部42、イメ
ージ登録部44、認識結果ファイル登録部46によるフ
ァイリングすべき内容をファイリングシステム14へ送
信する。
【0035】次に、本実施形態におけるファイリングの
概念について説明する。本実施形態におけるファイリン
グシステム14では、図3に示すように、ファイルの最
小単位を頁(1枚の帳票)とし、1帳票1書類登録では
1つの頁(イメージファイル)を1書類として扱い、全
帳票1書類登録では、複数の頁を1書類として扱う。I
D番号利用登録では、各頁に付されるID番号に応じ
て、タイトル登録部42によってタイトルが作成される
頁を含む任意の数の頁を1書類として扱う。図4には、
本実施形態におけるファイリングシステム14に登録
(ファイリング)する形態を示している。さらに、ファ
イリングシステム14では、複数の書類をバインダとし
て、複数のバインダをキャビネットとして管理すること
ができる。
【0036】次に、本実施形態におけるOCR装置と連
携したファイリングシステムのファイリング方法につい
て、図5、図6、図7、図8に示すフローチャートを参
照しながら説明する。
【0037】まず、OCR装置10において、例えば帳
票群に対する文字認識処理が実行される。処理対象とす
る帳票群は、ID番号利用登録を行なう場合には、帳票
群中の各1書類とする束の先頭の頁にタイトルとする文
字列が記録されている条件があるが、1帳票1書類登
録、全帳票1書類登録を行なう場合には、任意に配列さ
れた帳票群を処理対象とすることができる。
【0038】OCR装置10は、帳票群に対する処理結
果として、イメージファイル、テキストファイル(認識
結果ファイル)、カタログファイルを作成して、ホスト
システム12に出力する。ホストシステム12のOCR
装置制御部20は、OCR装置10における処理結果を
記憶部24に記憶させる。
【0039】認識結果ファイルは、ファイリングシステ
ム14においてファイリングする際のキーワードとして
いる文字列の認識結果を含み、例えば図9に示すような
内容を含んでいる。
【0040】すなわち、認識結果ファイルには、複数の
帳票のそれぞれから読み取られた認識結果が1行毎に登
録され、フィールドの区切りがTabによって表されて
いる。本実施形態では、タイトルの構造(タイトル構造
情報)が、先頭からのキー数によって定義される(後述
する)。
【0041】カタログファイルは、図10に示すよう
に、各帳票毎にID番号、イメージデータ数、イメージ
ファイル名が対応づけて登録されている。ID番号は、
ID番号利用登録を行なう際に用いられるもので、OC
R装置10における認識処理の結果を用いて、タイトル
とイメージを登録対象とすることを示す「1」、タイト
ルのみを登録対象とする「2」、イメージのみを登録対
象とする「2」が設定される。
【0042】OCR装置10は、処理対象とする帳票群
に対して、タイトルとすべき文字を認識するためのフォ
ーマットに基づいて認識処理を行ない、正しく認識でき
た場合には、登録すべきタイトルを含む帳票であると判
別して、ID番号を「1」または「2」とする。
【0043】イメージデータ数は、1帳票に含まれるイ
メージの数である。区分された複数のイメージ領域が存
在した場合に、各領域毎にイメージが読み取られる。ホ
ストシステム12のファイリングOCR登録部22は、
OCR装置10における処理結果が記憶部24に記憶さ
れると、ファイリングシステム14にデータを送信する
ため、ファイリングシステム14との間で論理的な通信
経路を設定する(ステップS1)。
【0044】ファイリングOCR登録部22は、通信経
路が確保されると、ファイリングシステム14において
予め設定されているタイトル構造情報を取得する(ステ
ップS3)。ここでは、タイトル構造情報が3、すなわ
ち認識結果ファイル中の先頭から3つめまでのキー数を
タイトルとすることが設定されているものとする。
【0045】ファイリングOCR登録部22は、記憶部
24に記憶されているカタログファイル、認識結果ファ
イルをOPENする(ステップS4)。ここで、ファイ
リングOCR登録部22の登録方法判別部40は、OC
R装置10による処理結果をファイリングシステム14
に登録するための帳票登録方法が3つの方法の何れであ
るかをチェックする(ステップS5)。帳票登録方法
は、OCR装置10における処理を開始する前に予め設
定されていても良いし、処理開始時に任意に指定しても
良い。登録方法判別部40は、帳票登録方法に応じた処
理の実行を、タイトル登録部42、イメージ登録部4
4、認識結果ファイル登録部46に対して指示する。
【0046】帳票登録方法が1帳票1書類登録であった
場合、タイトル登録部42は、記憶部24中のカタログ
ファイルと認識結果ファイルを読み込むと共に、認識結
果ファイルの対象とする帳票についての認識結果を用い
て、タイトル構造情報に応じてタイトルを作成する(ス
テップS6,S9)。タイトル登録部42は、作成した
タイトルを通信部48を介してファイリングシステム1
4へ登録する(ステップS10)。
【0047】一方、イメージ登録部44は、記憶部24
中のイメージファイルを通信部48を介してファイリン
グシステム14へ登録する(ステップS11)。1帳票
に複数のイメージが含まれている場合、イメージ登録部
44は、イメージファイル数分のイメージファイルの登
録を繰り返す。
【0048】ここで、認識結果ファイルの登録の実行が
指示されている場合、認識結果ファイル登録部46は、
記憶部24中の認識結果ファイル(テキストファイル)
を通信部48を介してファイリングシステム14へ登録
する(ステップS12,S13)。認識結果ファイルの
登録の有無は、OCR装置10における処理を開始する
前に予め設定されていても良いし、処理開始時に任意に
指定しても良い。
【0049】以下、同様にして、カタログファイルに登
録されているデータが示す各帳票に対応するイメージフ
ァイルについて同様の処理を実行してファイリングシス
テム14にタイトルとイメージファイルとを、必要に応
じて認識結果ファイルを付加してファイリングする。
【0050】全てのデータに対する処理が終了すると
(ステップS7)、通信部48は、ファイリングシステ
ム14との間の切断処理を行なう(ステップS8)。図
11には1帳票1書類登録を行なう場合の各ファイルの
簡単な具体例を示している。図11に示すように、カタ
ログファイルには、2枚の帳票に対する処理結果(イメ
ージファイル)が存在することを示している。なお、1
帳票1書類登録の場合にはID番号を使用しない。ま
た、認識結果ファイルには、2枚の帳票からそれぞれ認
識されたテキストの内容(テキストデータ)が登録され
ている。
【0051】ファイリング登録結果は、1帳票1書類登
録であるため、2枚の帳票分の各書類毎に、タイトル
と、頁1として1枚の帳票分のイメージファイル、頁2
として認識結果ファイルの内容がファイリングされてい
る。
【0052】次に、ステップS5において、登録方法判
別部40によって、全帳票1書類登録が指定されている
と判別された場合、タイトル登録部42は、記憶部24
中のカタログファイルと認識結果ファイルを読み込むと
共に、認識結果ファイルの対象とする帳票についての認
識結果を用いて、先頭の帳票に対する処理結果について
タイトル構造情報に応じてタイトルを作成する(ステッ
プS14,S16)。タイトル登録部42は、作成した
タイトルを通信部48を介してファイリングシステム1
4へ登録する(ステップS17)。
【0053】一方、イメージ登録部44は、記憶部24
中のイメージファイルを通信部48を介してファイリン
グシステム14へ登録する(ステップS18)。1帳票
に複数のイメージが含まれている場合、イメージ登録部
44は、イメージファイル数分のイメージファイルの登
録を繰り返す。
【0054】先頭の帳票に対する処理が完了すると、2
枚目以降の帳票に対してはタイトル登録部42による処
理を行なわず、イメージ登録部44によるイメージファ
イルの登録が、先頭以外の帳票の処理結果について行わ
れる(ステップS18)。
【0055】以下、同様にして、カタログファイルに登
録されているデータが示す各帳票に対応するイメージフ
ァイルを、同様の処理を実行してファイリングシステム
14にファイリングする。
【0056】全てのデータに対する処理が終了すると
(ステップS15)、認識結果ファイル登録部46は、
認識結果ファイルの登録の実行が指示されているか否か
を判別する(ステップS19)。
【0057】認識結果ファイルの登録の実行が指示され
ている場合、認識結果ファイル登録部46は、記憶部2
4中の認識結果ファイル(テキストファイル)を通信部
48を介してファイリングシステム14へ登録する(ス
テップS20)。
【0058】通信部48は、ファイリングシステム14
との間の切断処理を行なう(ステップS21)。図12
には全帳票1書類登録を行なう場合の各ファイルの簡単
な具体例を示している。図12に示すように、カタログ
ファイルには、2枚の帳票に対する処理結果(イメージ
ファイル)が存在することを示している。なお、全帳票
1書類登録の場合にはID番号を使用しない。また、認
識結果ファイルには、2枚の帳票からそれぞれ認識され
たテキストの内容(テキストデータ)が登録されてい
る。
【0059】ファイリング登録結果は、全帳票1書類登
録であるので、先頭の帳票から得られた認識結果ファイ
ルの内容から作成したタイトルと、頁1、頁2として、
先頭の帳票を含む他の全てのイメージファイル、頁3と
して全ての帳票から得られた認識結果ファイルの内容が
ファイリングされている。
【0060】次に、ステップS5において、登録方法判
別部40によって、ID番号利用登録が指定されている
と判別された場合、タイトル登録部42は、記憶部24
中のカタログファイルを読出し、対象とする帳票につい
てのID番号をもとにして、登録方法をチェックする
(ステップS24)。
【0061】ここで、対象とする帳票に対するID番号
が「1」である場合、タイトルとイメージが登録対象と
なる。認識結果ファイル登録部46は、認識結果ファイ
ルの登録の実行が指示されているか否かを判別し(ステ
ップS25)、この結果、認識結果ファイルの登録の実
行が指示されている場合、記憶部24の一時記憶領域2
4aに記憶されている認識結果Tempファイルをファ
イリングシステム14に登録する。ただし、先頭の帳票
に対する処理の際には、一時記憶領域24aには何も記
憶されておらず実際には登録されない。
【0062】タイトル登録部42は、認識結果ファイル
を読み込み、認識結果ファイルの対象とする帳票につい
ての認識結果を用いて、先頭の帳票に対する処理結果に
ついてタイトル構造情報に応じてタイトルを作成する
(ステップS27)。タイトル登録部42は、作成した
タイトルを通信部48を介してファイリングシステム1
4へ登録する(ステップS28)。
【0063】一方、イメージ登録部44は、記憶部24
中のイメージファイルを通信部48を介してファイリン
グシステム14へ登録する(ステップS29)。1帳票
に複数のイメージが含まれている場合、イメージ登録部
44は、イメージファイル数分のイメージファイルの登
録を繰り返す。
【0064】認識結果ファイル登録部46は、認識結果
ファイルの登録の実行が指示されているか否かを判別し
(ステップS30)、この結果、認識結果ファイルの登
録の実行が指示されている場合、記憶部24中の認識結
果ファイル(テキストファイル)を、記憶部24の一時
記憶領域24aに認識結果Tempファイルとしてして
一時的に書き込む(ステップS31)。
【0065】先頭の帳票に対する処理が完了すると、カ
タログファイルに登録された次の帳票についての処理結
果について、同様にしてID番号をもとにして登録方法
をチェックする(ステップS24)。
【0066】ID番号利用登録を用いる場合、通常、図
4(c)に示すように、1書類とすべきイメージを登録
対象とする帳票がタイトルの登録対象となった帳票に連
続している。ステップS24におけるチェックにおい
て、対象とする帳票に対するID番号が「3」である場
合、イメージが登録対象となる。
【0067】イメージ登録部44は、先にタイトル登録
が実施されているか否かを判別し、この結果、登録され
ていない場合には、ID番号利用登録できる状態となっ
ていないものとして処理を中止する。ファイリングOC
R登録部22は、エラー処理を実行し、通信部48によ
ってファイリングシステム14との間の接続を切断する
(ステップS45,S46)。
【0068】先にタイトル登録が実施されている場合、
イメージ登録部44は、記憶部24中のイメージファイ
ルを通信部48を介してファイリングシステム14へ登
録する(ステップS42)。1帳票に複数のイメージが
含まれている場合、イメージ登録部44は、イメージフ
ァイル数分のイメージファイルの登録を繰り返す。
【0069】認識結果ファイル登録部46は、認識結果
ファイルの登録の実行が指示されているか否かを判別し
(ステップS30)、この結果、認識結果ファイルの登
録の実行が指示されている場合、記憶部24中の認識結
果ファイル(テキストファイル)を、記憶部24の一時
記憶領域24aに認識結果Tempファイルとしてして
一時的に書き込む(ステップS31)。
【0070】以下、イメージを登録対象とする帳票(I
D番号=3)が連続していれば、各イメージファイルに
ついて同様の処理を繰り返す。一方、対象とする帳票に
対するID番号が「2」である場合、タイトルのみが登
録対象となる。
【0071】認識結果ファイル登録部46は、認識結果
ファイルの登録の実行が指示されているか否かを判別し
(ステップS35)、この結果、認識結果ファイルの登
録の実行が指示されている場合、記憶部24の一時記憶
領域24aに記憶されている認識結果Tempファイル
をファイリングシステム14に登録する(ステップS3
6)。
【0072】すなわち、処理対象とする帳票の処理結果
からタイトルを登録するということは、その直前の帳票
までが1書類であるので、その1書類中の各帳票に対応
する認識結果ファイルの内容をさきに登録したタイトル
とイメージファイルに伏して登録する。
【0073】タイトル登録部42は、認識結果ファイル
を読み込み、認識結果ファイルの対象とする帳票につい
ての認識結果を用いて、次の書類用のタイトルをタイト
ル構造情報に応じてタイトルを作成する(ステップS3
7)。タイトル登録部42は、作成したタイトルを通信
部48を介してファイリングシステム14へ登録する
(ステップS38)。
【0074】認識結果ファイル登録部46は、認識結果
ファイルの登録の実行が指示されているか否かを判別し
(ステップS39)、この結果、認識結果ファイルの登
録の実行が指示されている場合、記憶部24中の認識結
果ファイル(テキストファイル)を、記憶部24の一時
記憶領域24aに認識結果Tempファイルとしてして
一時的に書き込む(ステップS40)。
【0075】こうして、全てのデータに対する処理が終
了すると(ステップS23)、認識結果ファイル登録部
46は、認識結果ファイルの登録の実行が指示されてい
るか否かを判別し(ステップS32)、この結果、認識
結果ファイルの登録の実行が指示されている場合、記憶
部24の一時記憶領域24aに記憶されている認識結果
Tempファイルをファイリングシステム14に登録す
る(ステップS33)。
【0076】通信部48は、ファイリングシステム14
との間の切断処理を行なう(ステップS34)。図13
にはID番号利用登録を行なう場合の各ファイルの簡単
な具体例を示している。図13に示すように、カタログ
ファイルには、6枚の帳票に対する処理結果(イメージ
ファイル)が存在することを示している。そして、3枚
毎に1書類を構成するものとする。また、認識結果ファ
イルには、6枚の帳票からそれぞれ認識されたテキスト
の内容(テキストデータ)が登録されている。
【0077】ファイリング登録結果は、ID番号利用登
録であるので、書類1については、先頭の帳票から得ら
れた認識結果ファイルの内容から作成したタイトルと、
頁1、頁2、頁3として、3つのイメージファイル、頁
4として3つの帳票から得られた認識結果ファイルの内
容がファイリングされている。同様にして、書類2つい
ては、4番目の帳票から得られた認識結果ファイルの内
容から作成したタイトルと、頁1、頁2として、タイト
ルのみが登録対象となったイメージファイルを除く2つ
のイメージファイル、頁3として3つの帳票から得られ
た認識結果ファイルの内容がファイリングされている。
【0078】このようにして、OCR装置10における
処理結果である認識結果ファイルの内容を、ファイリン
グシステム14への登録方法に応じたイメージファイル
に対して、ファイリングシステム14におけるキーワー
ドとして付加することができるので、大量の帳票等をフ
ァイリングする場合であっても、キーボードからキーワ
ードを逐次入力する必要がなく作業負担が大幅に軽減さ
れる。
【0079】また、OCR装置10における処理結果で
ある認識結果ファイル(テキストファイル)もイメージ
ファイルと共に体系的にファイリングされるので、テキ
ストファイルについてもキーワードによる検索が可能で
ある。
【0080】なお、前述した実施形態におけるOCR装
置10をFAX−OCRシステムとし、このFAX−O
CRシステムと連携したファイリングシステムとするこ
とで、通信回線を介して受信した内容中の宛先や表題等
を文字認識し、それらをキーワードとしてイメージファ
イルと共にファイルシステムへ自動登録することも可能
である。
【0081】また、実施形態においてファイリングOC
R登録部22によって実行される処理手法は、コンピュ
ータに実行させることのできるプログラムとして、磁気
ディスク(フロッピーディスク、ハードディスク等)、
光ディスク(CD−ROM、DVDなど)、半導体メモ
リなどの記録媒体に格納して提供することができる。コ
ンピュータは、記録媒体に記録されたプログラムを読み
込み、このプログラムによって動作が制御されることに
より、前述した処理を実行する。
【0082】
【発明の効果】以上詳述したように本発明によれば、O
CR装置における処理結果を、ファイリングシステムへ
の登録形態に応じて処理した上でファイリングシステム
に登録することで、帳票等の紙媒体に記録された内容を
表すイメージを適当なキーワードを付して簡単にファイ
リングすることが可能となるものである。
【図面の簡単な説明】
【図1】本発明の実施形態に係わるOCR装置と連携し
たファイリングシステムの構成を示すブロック図。
【図2】図1中に示すファイリングOCR登録部22の
構成を示すブロック図。
【図3】本実施形態におけるファイリングの概念につい
て説明するための図。
【図4】本実施形態におけるファイリングシステム14
に登録(ファイリング)する形態を示す図。
【図5】本実施形態における動作の一部を説明するため
のフローチャート。
【図6】本実施形態における動作の一部を説明するため
のフローチャート。
【図7】本実施形態における動作の一部を説明するため
のフローチャート。
【図8】本実施形態における動作の一部を説明するため
のフローチャート。
【図9】本実施形態における認識結果ファイルを説明す
るための図。
【図10】本実施形態におけるカタログファイルを説明
するための図。
【図11】本実施形態における1帳票1書類登録を行な
う場合の各ファイルの簡単な具体例を示す図。
【図12】本実施形態における全帳票1書類登録を行な
う場合の各ファイルの簡単な具体例を示す図。
【図13】本実施形態におけるID番号利用登録を行な
う場合の各ファイルの簡単な具体例を示す図。
【符号の説明】
10…OCR装置 12…ホストシステム 14…ファイリングシステム 20…OCR装置制御部 22…ファイリングOCR登録部 24…記憶部 24a…一時記憶領域 30…コントローラ 32…スキャナ 34…プリンタ 36…ディスプレイ 38…キーボード 39…ファイル記憶ユニット 40…登録方法判別部 42…タイトル登録部 44…イメージ登録部 46…認識結果ファイル登録部 48…通信部

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 紙媒体に記録された内容をイメージによ
    って読取ってイメージファイルを作成すると共に、前記
    イメージ中に含まれる文字について文字認識処理を施し
    てテキストファイルを作成するOCR装置と、 前記OCR装置によって作成された前記イメージファイ
    ルと前記テキストファイルとを読み込んで、体系的にフ
    ァイリングするための登録制御を行なう登録機能を有す
    るホストシステムと、 前記ホストシステムの登録機能による登録制御により、
    前記イメージファイルと前記テキストファイルとをファ
    イリングシステムとをファイリングするファイリングシ
    ステムとを具備したことを特徴とするOCR装置と連携
    したファイリングシステム。
  2. 【請求項2】 紙媒体に記録された内容をイメージによ
    って読取ってイメージファイルを作成すると共に、前記
    イメージ中に含まれる文字について文字認識処理を施し
    てテキストファイルを作成するOCR装置と、 前記OCR装置によって作成された前記イメージファイ
    ルと前記テキストファイルとを読み込んで、前記テキス
    トファイルの内容を利用して紙媒体の1枚毎にキーワー
    ドを作成し、このキーワードを紙媒体の1枚に対応する
    前記イメージファイルと前記テキストファイルとに付し
    て体系的にファイリングするための登録制御を行なう登
    録機能を有するホストシステムと、 前記ホストシステムの登録機能による登録制御により、
    前記イメージファイルと前記テキストファイルとをファ
    イリングシステムとをファイリングするファイリングシ
    ステムとを具備したことを特徴とするOCR装置と連携
    したファイリングシステム。
  3. 【請求項3】 紙媒体に記録された内容をイメージによ
    って読取ってイメージファイルを作成すると共に、前記
    イメージ中に含まれる文字について文字認識処理を施し
    てテキストファイルを作成するOCR装置と、 前記OCR装置によって作成された前記イメージファイ
    ルと前記テキストファイルとを読み込んで、前記テキス
    トファイルの複数の紙媒体中の先頭の紙媒体の内容を利
    用してキーワードを作成し、このキーワードを複数の紙
    媒体に対応する前記イメージファイルと前記テキストフ
    ァイルとに付して体系的にファイリングするための登録
    制御を行なう登録機能を有するホストシステムと、 前記ホストシステムの登録機能による登録制御により、
    前記イメージファイルと前記テキストファイルとをファ
    イリングシステムとをファイリングするファイリングシ
    ステムとを具備したことを特徴とするOCR装置と連携
    したファイリングシステム。
  4. 【請求項4】 紙媒体に記録された内容をイメージによ
    って読取ってイメージファイルを作成すると共に、前記
    イメージ中に含まれる文字について文字認識処理を施し
    てテキストファイルを作成するOCR装置と、 前記OCR装置によって作成された前記イメージファイ
    ルと前記テキストファイルとを読み込んで、前記テキス
    トファイルの複数の紙媒体群中の各群の先頭の紙媒体の
    内容を利用してキーワードを作成し、このキーワードを
    対応する紙媒体群に対応する前記イメージファイルと前
    記テキストファイルとに付して体系的にファイリングす
    るための登録制御を行なう登録機能を有するホストシス
    テムと、 前記ホストシステムの登録機能による登録制御により、
    前記イメージファイルと前記テキストファイルとをファ
    イリングシステムとをファイリングするファイリングシ
    ステムとを具備したことを特徴とするOCR装置と連携
    したファイリングシステム。
  5. 【請求項5】 OCR装置によって作成された、紙媒体
    に記録された内容が読み取られてたイメージを含むイメ
    ージファイルと、前記イメージ中に含まれる文字につい
    て文字認識処理を施して得られたテキストを含むテキス
    トファイルとを、ファイリングシステムにおいて体系的
    にファイリングするための登録制御を行なうことを特徴
    とするファイリング方法。
  6. 【請求項6】 OCR装置によって作成された、紙媒体
    に記録された内容が読み取られてたイメージを含むイメ
    ージファイルと、前記イメージ中に含まれる文字につい
    て文字認識処理を施して得られたテキストを含むテキス
    トファイルとを読み込み、 前記テキストファイルの内容を利用して紙媒体の1枚毎
    にキーワードを作成し、 このキーワードを紙媒体の1枚に対応する前記イメージ
    ファイルと前記テキストファイルとに付してファイリン
    グシステムにおいて体系的にファイリングするための登
    録制御を行なうことを特徴とするファイリング方法。
  7. 【請求項7】 OCR装置によって作成された、紙媒体
    に記録された内容が読み取られてたイメージを含むイメ
    ージファイルと、前記イメージ中に含まれる文字につい
    て文字認識処理を施して得られたテキストを含むテキス
    トファイルとを読み込み、 前記テキストファイルの複数の紙媒体中の先頭の紙媒体
    の内容を利用してキーワードを作成し、 このキーワードを複数の紙媒体に対応する前記イメージ
    ファイルと前記テキストファイルとに付してファイリン
    グシステムにおいて体系的にファイリングするための登
    録制御を行なうことを特徴とするファイリング方法。
  8. 【請求項8】 OCR装置によって作成された、紙媒体
    に記録された内容が読み取られてたイメージを含むイメ
    ージファイルと、前記イメージ中に含まれる文字につい
    て文字認識処理を施して得られたテキストを含むテキス
    トファイルとを読み込み、 前記テキストファイルの複数の紙媒体群中の各群の先頭
    の紙媒体の内容を利用してキーワードを作成し、 このキーワードを対応する紙媒体群に対応する前記イメ
    ージファイルと前記テキストファイルとに付してファイ
    リングシステムにおいて体系的にファイリングするため
    の登録制御を行なうことを特徴とするファイリング方
    法。
JP8248334A 1996-09-19 1996-09-19 Ocr装置と連携したファイリングシステム及びファイリング方法 Pending JPH1097606A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8248334A JPH1097606A (ja) 1996-09-19 1996-09-19 Ocr装置と連携したファイリングシステム及びファイリング方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8248334A JPH1097606A (ja) 1996-09-19 1996-09-19 Ocr装置と連携したファイリングシステム及びファイリング方法

Publications (1)

Publication Number Publication Date
JPH1097606A true JPH1097606A (ja) 1998-04-14

Family

ID=17176549

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8248334A Pending JPH1097606A (ja) 1996-09-19 1996-09-19 Ocr装置と連携したファイリングシステム及びファイリング方法

Country Status (1)

Country Link
JP (1) JPH1097606A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100707943B1 (ko) 2005-04-27 2007-04-18 최철규 광학문자인식 기능을 활용한 재무제표인식 방법 및 그시스템
JP2009271663A (ja) * 2008-05-02 2009-11-19 Nec Electronics Corp 管理システム、管理装置、管理方法、および管理プログラム
CN115116068A (zh) * 2022-07-05 2022-09-27 江苏永山窍档案管理服务有限公司 一种基于ocr的档案智能归档系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100707943B1 (ko) 2005-04-27 2007-04-18 최철규 광학문자인식 기능을 활용한 재무제표인식 방법 및 그시스템
JP2009271663A (ja) * 2008-05-02 2009-11-19 Nec Electronics Corp 管理システム、管理装置、管理方法、および管理プログラム
CN115116068A (zh) * 2022-07-05 2022-09-27 江苏永山窍档案管理服务有限公司 一种基于ocr的档案智能归档系统
CN115116068B (zh) * 2022-07-05 2024-05-10 江苏永山窍档案管理服务有限公司 一种基于ocr的档案智能归档系统

Similar Documents

Publication Publication Date Title
JPH03161873A (ja) データベース構築機能を有する電子フアイリング装置
US7081975B2 (en) Information input device
US6594650B2 (en) File management system and its method and storage medium
JPH06332953A (ja) デ−タファイル装置
US8416446B2 (en) Image forming apparatus having printing log management function and method thereof
JPH07200631A (ja) 電子ファイリング装置
JPH1097606A (ja) Ocr装置と連携したファイリングシステム及びファイリング方法
JP3458001B2 (ja) 画像ファイル装置
JP2004213304A (ja) データ処理装置およびデータ処理方法および記録媒体およびプログラム
JPH1013642A (ja) 画像情報処理装置
JPH10187388A (ja) ジョブ処理装置
JPS62154847A (ja) 電子フアイルシステム
JPH0236478A (ja) 情報処理システム
JP2004259031A (ja) 文書管理装置
JPH06251083A (ja) 画像データの光ディスク登録方法およびシステム
JPH04153879A (ja) 文書管理情報の自動検索方式
JPH08101842A (ja) 画像ファイリング装置
JPH03263182A (ja) 電子ファイリングシステム
JPH1196148A (ja) 文書管理装置
JP3368108B2 (ja) 画像処理装置
JP2578893B2 (ja) 文書ファイル装置
JPH1055405A (ja) 住所録読み取り装置及び住所録読み取り方法
JPH0937045A (ja) 電子図面情報管理システムとかかるシステムにおける入力図面の表裏認識方法
JPS6395577A (ja) 文書入出力システム
JPH07200722A (ja) 情報記録装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061101

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070105

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070306