JPH03504423A - 光学式文字認識のための書類認識及び自動索引付与 - Google Patents
光学式文字認識のための書類認識及び自動索引付与Info
- Publication number
- JPH03504423A JPH03504423A JP1506309A JP50630989A JPH03504423A JP H03504423 A JPH03504423 A JP H03504423A JP 1506309 A JP1506309 A JP 1506309A JP 50630989 A JP50630989 A JP 50630989A JP H03504423 A JPH03504423 A JP H03504423A
- Authority
- JP
- Japan
- Prior art keywords
- template
- document
- character recognition
- specimen
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/174—Form filling; Merging
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。
Description
【発明の詳細な説明】
光学式文字認識のための書類認識及び自動索引付与発明の背景
発明により解決された問題
光学式文字認識システムは計算機記憶装置における記憶のために書類の内容を自
動的に読み取るのに有効である。イメージセンサが書類を走査して画像データを
発生し、これを光学式文字認識システムが本文に変換する。この本文を表すデー
タは次に直ちに、使用者による即時アクセス及び処理のために計算機記憶装置に
記憶される。
重要な要件は、光学式文字認識システムが本文文字を表す画像データと非本文物
(例えば、印刷線)を表す画像データとを区別することができること、又はさも
なければ、印刷線若しくはその他の非本文物を表すデータが、光学式文字認識シ
ステムによって受は取られる前に、画像データから、削除されることである。
複数の異なった事務用書式を処理するときに、光学式文字認識システムは、本文
文字を含む所与の事務用書式における種々のフィールドの場所を知っているなら
ば、一層効率がよいであろう。例えば、事務用書式が販売注文書式である場合に
は、システムが価格、量、種類、配達あて名などのようなある種の重大な情報の
書式における場所を既に知っているならば、データは一層迅速に使用されるであ
ろう。書式における種々のフイールドの場所を知ることも又システムが書類画像
を記憶装置に正しく配置し、又は一つの書類と次の書類との間の画像データにお
ける境界を決定するのを助ける。
それゆえ、光学式文字認識システムは、最高の効率で動作するべきであるならば
、複数の既知の事務用書式のうちのどれに(到来画像データによって表される)
特定の書類が対応しているかを知ることが必要である。従って、最大効率のため
には、到来書類は光学式文字認識システムによって処理される前にまず事務用書
式の種類に従って群分けされなければならない。各群の書類がシステムに供給さ
れるときに、使用者はどの種類の事務用書式に現在の群が対応しているかをシス
テムに知らせなければならない。分類又は群分は機能は許容不可能なほど大量の
使用者の時間を必要とするであろう。
それゆえ、問題は使用者が到来書類を事務用書式の種類に従って分類すること又
は受は取られようとしている書類の種類を知らせることを必要としないで、光学
式文字認識システムが最大効率で動作することを可能にする方法である。
関係の問題を解決するための従来の試み到来書類の書式の種類(すなわち、事務
用書式に特有の印刷線のすべての場所)を画像処理システムに最初に知らせるこ
との必要性は、モリン(Marin)への米国特許第4020462号において
、画像圧縮/圧縮排除システムの場合に例示されている。モリン特許によれば、
どの書式に到来書類が対応しているかを使用者がシステムに知らせると、システ
ムはその書式における種々の印刷線の既知の場所を使用して本文文字データを選
別する。スズキ(Suzuki)外への米国特許第4504969号は、記憶装
置においてデータとして記憶された書類における方形の図形を、使用者が最初に
その図形を定義している場合にだけではあるが、画像処理システムが認識するこ
とのできる方法を説明している。
このような従来の技法についての問題は、書類に関する情報を画像処理システム
に供給するために使用者の時間及び努力が必要とされることである。
発明の要約
発明の目的
この発明の目的は、複数の所定の事務用書式との対応性がシステムに未知の方法
で完全に確率的である複数の到来書類を光学式文字認識システムが、使用者によ
る書類の事前分類又は使用者による書類を識別するシステムへの情報の供給を必
要としないで、処理することを可能にすることである。明確には、その目的は複
数の事務用書式のうちのどれに各到来書類が対応しているかをシステムが単独で
自動的に決定することを可能にすることである。
問題の解決策
この発明の書類認識システムは光学式文字認識システムの「前置装置(フロント
エンド)」として使用されるように意図されている。到来書類の画像の少なくと
も一部分が画像データに変換された後、この画像データは書類認識システムによ
って走査される。この発明の採択実施例においては、これは線(ライン)ごとに
行われる。書類認識システムは所与の水平走査線における「オン」画素の数(例
えば、白色背景における黒色画素の数)を計数し、そして(望ましくは)この数
を線の幅に対して正規化する。複数のそのような動作の後、書類認識システムは
水平線位置の関数として「オン」画素の密度で表す曲線又は「図表」を記憶装置
において生成する。採択実施例においては、画像データにおける事前印刷水平線
の位置はこの曲線を微分し、微分されたデータにおける結果として生じる不連続
点(正及び負の傾斜間の遷移)の位置に注目することによって決定される。事前
印刷線位置間の間隔の表が記憶装置に記憶される。
各事前印刷線(微分された曲線データにおける各不連続点に対応する)の長さは
第2の表として記憶装置に記憶される。
到来書類に対してこのように構成されたこの対の表は、それぞれがそれ自体の形
態の事前印刷線によって特徴づけられている一組の空白事務用書式から類似の方
法で前に構成された「テンプレート」のライブラリ、すなわち類似の対の表、と
比較される。テンプレートのライブラリが完全であると仮定して、システムによ
り処理される書類のそれぞれはテンプレートの一つの事前印刷線形態と自動的に
同一視される。この形態(又はテンプレート)を光学式文字認識システムに供給
するど、このシステムは使用者による書類の事前分類又は検査を必要とすること
なく最大効率で動作することができる。
この発明の別の実施例においては、前述の処理は水平に線ごとにだけでなく、垂
直に列ごとにも又行われる。代替実施例においては、処理はテンプレート比較基
準として各線の長さく「第2の」表)を除去することによって簡単化されること
ができる。
書類認識システムが現在の書類とライブラリにおけるテンプレートの一つとの間
に正確な「一致」を見いだせないならば、システムはテンプレートのどれが書類
への最も近い相関を持っているかを決定し、そのテンプレートを問題の書類に一
致するものとして宣言する。簡単な書式においては、これはテンプレートの線間
隔と問題の書類の線間隔との間の相互相関を計算することによって行われる。
図面の説明
この発明は以下において添付の諸図面に言及して詳細に説明されるが、この諸図
面中、
図1はこの発明の書類認識システムを図解した線図であり、図2は図1のシステ
ムによって生成された水平線位置の関数としての黒画素密度の例示的図表を図示
しており、図3は図2の例に対応する書類における事前印刷線間隔を図示してお
り、
図4は図1のシステムのテンプレートライブラリ及び対応する比較過程を図解し
た構成図であり、又図5は図1の書類認識システムによって行われる全過程を図
解した流れ図である。
詳細な説明
図1に言及すると、書式が未知である書類を表すデータの各水平「ビデオ」線は
入力接続点100において書類認識システムに入り、バッファ103にセーブさ
れる。計数器101はデータの各線におけるオン又は「黒」画素の数を計数し、
この計数をそのビデオ線における画素の数に対して正規化し、そしてその結果を
線番号によって記憶装置104に記憶する。計数器102はデータの各ビデオ線
における黒画素の最長の連続「ラン」の長さを決定し、この長さを記憶装置10
5に記憶する。
十分な数の水平ビデオ線がこのように処理された後、処理装置106は記憶装置
104に記憶されたデータから、水平線番号の関数として黒画素の線密度を表す
曲線を構成する。そのような曲線の一例が図2に図解されている。所定のしきい
値(破線)を越した図2の曲線におけるピークは図3の画像における事前印刷線
の位置を示している。処理装置106はこれらのピークを精密に確認して、これ
から、そのようにして検出された各事前印刷線の水平位置を導出する。
処理装置106が図2の曲線におけるピークを確認する好適な方法は図2の曲線
を微分することによって新しい曲線を生成することである。これらのピークの位
置は微分されたデータにウドウェアを用いて見いだす。図4に図解されたように
、処理装置106は事前印刷線位置から隣り合った事前印刷水平線間の垂直距離
のりスト200aを構成する。図2及び3の例においては、リスト200aはこ
れらの図に図示された距離a、 b及びCからなっている。多くの場合、事前
印刷線の幅は数ビデオ線のデータであり、従って線位置は事前印刷線画像の中心
に最も近いビデオ線として指定されなければならない。
処理装置106は又リスト200aに記載された線間隔に対応する線長さのりス
ト200b (図4)を構成する。リスト200a、 200bの対は共に、現
在考察中の画像データ又は書類を特徴づける標本テンプレート200を構成する
。処理装置106が記憶装置105に記憶されたラン長データからリスト200
bにおける各線の線長を導出する好適な方法は表200aに記載された各ビデオ
線における最長のラン長を決定することである。
図4に図解されたように、比較器107は標本テンプレートを基準テンプレート
200′の94191月11に記憶された各基準テンプレート(工ないしn)と
比較する。ライブラリ111における各基準テンプレートは複数の事務用書式の
一つの事前印刷線パターンの特徴を示している。比較器107は、基準テンプレ
ート200′のどれが標本テンプレート200に一致しているかを決定するとす
ぐ、下流の光学式文字認識システムに、現在考察中の書類がどの事務用書式に対
応しているかを知らせる。
比較器107は、一つ以上の一致を見いだすか又は一致を見いだすことができな
いならば、どの基準テンプレート200′が標本テンプレート200に最もよく
似ているかを決定するように処理装置108に指令する。ライブラリillにお
ける基準テンプレート200′のどれが標本テンプレート200に最もよく似て
いるかを処理装置108が決定する好適な方法は各基準テンプレートと標本テン
プレートとの間の相互相関を計算することである。
採択実施例においては、二つの相互相関、すなわち一方は各テンプレート(表2
00a、 200’ a)における線間隔データに基づいたもの及び他方は各テ
ンプレート(表200b、 200’ b)における線長データに基づいたもの
、が計算される。この方法に従って、これら二つの相互相関は組み合わされて(
乗算されて)単一の「評点(スコア)」を発生する。このようにして発生された
すべてのそのような評点の比較は「勝者」を生成する。水平線間隔パターンに基
づいてそのような単純な相互相関を計算するための処理技法は技術上周知であり
、この発明では重要でない。
比較器107によって又は処理装置108によって識別された「勝ち」基準テン
プレート200′の記述(すなわち、表200’ a及び200’ b)は下流
の光学式文字認識システム300に送られる。光学式文字認識システムがこの情
報で何をするかはこの発明の範囲を越えている。しかしながら、−例として、光
学式文字認識システムは「勝ち」基準テンプレートの既知の事前印刷線形態を使
用して書類における各フィールドの文字を特定の種類の情報と知能的に関連させ
ることができる(例えば、書式書類における事前印刷の境界線によって定義され
た一つのフィールドは常にある個人的な身元確認データを収容することができる
。)。
この発明の一実施例においては、勝ち基準テンプレート200′の記述(又は印
刷線位置)に関して光学式文字認識システム300に単に知らせる代わりに、処
理装置110が準備されている。処理装置110は勝ち基準テンブレー) 20
0’の表200’ a、200’ bを使用して、そこで指定された事前印刷線
画像をバッファ103に記憶された到来画像データからマスクする。
処理装置110は次に残りの画像データをバッファ103から下流の光学式文字
認識システム300に送る。この方法で、光学式文字認識システム300は、処
理することができない非本文(事前印刷線)データが表面上はない、文字又は本
文データだけを受は取る。
図5はnの基準テンプレート200’ (1ないしn)のライブラリ111を
生成するための過程400a、並びに所与の標本テンプレート200に対して一
致する基準テンプレート200’ を見つけるために比較器107及び処理装置
108によってライブラリ111が使用される過程400bを図解している。
ライブラリを生成するための過程400aが開始されると(箱形402)、使用
者は関心のある事務用書式のすべてをシステムに入力し、それらが(一度に一つ
ずつ)走査されて各書式の画像を表すビデオデータを発生するようにしなければ
ならない。各書式の事前印刷線画像を表すビデオデータは図1のシステムにおけ
る接続点100で受は取られ、そしてこのシステムはこのデータをここで前に説
明された方法で処理して、それから標本テンプレート200を生成する(箱形4
06)。差異は、このようにして生成された標本テンプレートが何物とも比較さ
れず、その代わりに対応する書式の名称と関連づけられて、ライブラリ111に
基準テンブレー) 200’ として(名称と共に)記憶される(箱形408)
。使用者がすべての到来書類と相関させることを求めているnの事務用書式があ
ると仮定して、nの書式の画像データはライブラリ111をnの基準テンブレー
) 200’で満たすように上の方法で処理されなければならない。このマスク
が完了されると、生成され且つ記憶されるべき基準テンプレートがもはやなく
(箱形40Bの「ノー」分岐)、且つ基準テンプレートのライブレート111は
書類認識過程400bにおける使用の準備ができているように記憶装置に記憶さ
れる(箱形410)。
図5の書類認識過程400bはここで図1のシステムの動作に関して既に説明さ
れたが、ここでそれを図5の流れ図に関して要約することは有益である。ライブ
ラリ111を満たすための過程400aが完了されると、到来書類は処理される
ことができる。これは到来書類の画像が画像データに変換されたときに始まる(
箱形412)。このデータの一部分は図4に図示された標本テンプレート200
を発生するように図1に関連して前に説明された方法で処理される(箱形414
)。標本テンプレート200は図4に図示された比較器107に送られるC箱形
416)。比較器107(又は、不明確な比較結果の場合には処理装置108)
は標本テンプレート200をライブラを月11におけるnの基準テンプレートと
比較する(相関させる)(箱形418)。一致が見いだされるとすぐ(箱形42
0の「イエス」分岐)、比較器107(又は処理装置108)は一致する基準テ
ンプレート200′の名称を宣言する(箱形422)。
比較器107及び処理装置lO8が両方共一致を見いだすことができないならば
、これを示す標識が上げられ、そして利用可能ならば、書類の画像データの付加
的な部分が要求される。その場合一致を見いだすことのできる十分な画像データ
が存在するまで過程全体が繰り返される。
だが、この発明の精神及び範囲から外れることなくそれの種々の変形及び変更が
行われ得ることが理解される。
特表千3−504423 (5)
補正書の翻訳文提出書
(特許法第184条の8)
平成 2年11月は日
特許庁長官 植 松 敏 殿 沫1、特許出願の
表示
PCT/US89102037
2、発明の名称
光学式文字認識のための書類認識及び自動索引付与3、特許出願人
住 所 アメリカ合衆国ニューヨーク州14650. ロチニスター市ステ
ート・ストリート 343
名称 イーストマン・コダック・カンパニー4、代理人
住 所 東京都千代田区大手町二丁目2番1号新大手町ビル 2、特許
請求の範囲
■、光学式文字認識システムのための書類画像から非本文事項をマスクするため
の前置処理装置であって、複数の事前印刷書式における事前印刷線間の間隔を指
定する対応する複数の基準テンプレートを記憶するための装置、未知の書式の書
類の画像を表す連続したビデオ線からなる到来ビデオデータを受けるための装置
、
前記の書類の前記の画像における事前印刷線間の間隔を指定した標本テンプレー
トを前記の到来ビデオデータから発生するための装置、
前記の複数の基準テンプレートのどれが前記の標本テンプレートに最もよく似て
いるかを決定するための装置、前記の一つの書類を表すビデオデータを記憶する
ためのバッファ装置、
前記の決定する装置が前記の一つのテンプレートを識別したときに応答して、前
記のバッファ装置からビデオデータを取り出し、このデータから前記の一つの基
準テンプレートにおける事前印刷線間隔及び長さに対応するそれにおける事前印
刷線を表すデータをマスクし、且つこのようにマスクされたデータを前記の光学
式文字認識システムに送り、これにより前記の光学式文字認識システムが非本文
データを受けないようにされるための出力処理装置、
を備えている前記の前置処理装置。
2、前記の複数の基準テンプレート及び前記の標本テンプレートがそれぞれ水平
事前印刷線のビデオ線番号を指定している、請求項1の前置処理装置。
3、標本テンプレートを発生するための前記の装置が、ビデオ線番号の関数とし
て前記のビデオデータにおける「オン」画素の線密度を表す曲線を発生するため
の装置、前記の曲線における所定のしきい値を越えたピークの位置を確認し且つ
前記のピークの位置に注目するための装置、を備えている、請求項2の前置処理
装置。
4、標本テンプレートを発生するための前記の装置が更に、前記のピークの注目
した位置を、前記の画像における連続した水平線間の間隔を表す一連の数に変換
する、請求項3の前置処理装置。
5、前記の曲線におけるピークの位置を確認するための前記の装置が、前記の曲
線の微分を生成し且つ前記の曲線の前記の微分における不連続点の位置に注目す
るための装置からなっている、請求項3の前置処理装置。
6、前記の複数の基準テンプレートのどれが前記の標本テンプ前記の複数の基準
テンプレートのどれが前記の標本テンプレートに正確に一致するかを見いだし且
つこれの一致性に注目するための装置、及び
前記の複数の基準テンプレートのそれぞれと前記の標本テンプレートとの間の相
関を計算し、且つ前記の複数の基準テンプレートのどれが前記の標本テンプレー
トとの最高の相関を持っているかに注目するための装置、
のうちの少なくとも一つを備えている、請求項1の前置処理装置。
7、前記の決定するための装置が、前記の正確な一致を見いだすための装置及び
前記の相関を計算するための装置の両方を含んでおり、且つ前記の決定する装置
が更に、前記の見いだすための装置が正確な一致を見いだすことができないとき
に応答して前記の相関を計算するための前記の装置)活動化することのできるデ
フォルト装置、を備えている、請求項6の前置処理装置。
8、前記のテンプレートのそれぞれが記憶装置に記憶された一対の表からなって
いて、前記の表の一方がその後に生じる事前印刷線間の間隔を記載し且つ前記の
表の他方が対応する事前印刷線の長さを表しており、前記の二つの表のそれぞれ
の内容が前記の画像における対応する事前印刷線の位置の順序に配列されている
、請求項1の前置処理装置。
9、記憶するための前記の装置に記載された前記の複数の基準テンプレートが、
対応する複数の書式の画像データを、到来ビデオデータを受けるための前記の装
置に連続して送ることによって発生され、これにより、標本テンプレートを発生
するための前記の装置が前記の複数の基準テンプレートを含む対応する複数の標
本テンプレートを特徴する請求項1の前置処理装置。
10、光学式文字認識システムのための書類画像から非本文事項をマスクするた
めの事前処理方法であって、複数の事前印刷書式における事前印刷線間の間隔を
指定した対応する複数の基準テンプレートを記憶すること、未知の書式の書類の
画像を表す連続したビデオ線からなる到来ビデオデータを受けること、
前記の書類の前記の画像における事前印刷線間の間隔を指定した標本テンプレー
トを前記の到来ビデオデータから発生すること、
前記の複数の基準テンプレートのどれが前記の標本テンプレートに最もよく似て
いるかを決定すること、前記の一つの書類を表すビデオデータを記憶すること、
前記の決定する装置が前記の一つのテンプレートを識別したときに、前記の記憶
する段階によって記憶されたビデオデータを取り出して、このデータから前記の
一つの基準テンプレートにおける事前印刷線間隔及び長さに対応するそれにおけ
る事前印刷線を表すデータをマスクし、このようにマスクされたデータを前記の
光学式文字認識システムに送り、これにより前記の光学式文字認識システムが非
本文データを受けないようにされること、
を含んでいる前記の方法。
11、前記の複数の基準テンプレート及び前記の標本テンプレートがそれぞれ水
平事前印刷線のビデオ線番号を指定している、請求項10の方法。
12、標本テンプレートを発生する前記の段階が、ビデオ線番号の関数として前
記のビデオデータにおける「オン」画素の線密度を表す曲線を発生すること、前
記の曲線における所定のしきい値を越えたピークの位置を確認し且つ前記のピー
クの位置に注目すること、を含んでいる、請求項11の方法。
13、標本テンプレートを発生する前記の段階が更に、前記のピークの注目した
位置を、前記の画像における連続した水平線間の間隔を表す一連の数に変換する
、請求項12の方法。
14、前記の曲線におけるピークの位置を確認する前記の段階が、前記の曲線の
微分を生成し且つ前記の曲線の前記の微分における不連続点の位置に注目するこ
とを含んでいる、請求項12の方法。
15、前記の複数の基準テンプレートのどれが前記の標本テンプレートに最もよ
く似ているかを決定する前記の段階が、前記の複数の基準テンプレートのどれが
前記の標本テンプレートに正確に一致しているかを見いだし且つそれの一致性に
注目すること、及び
前記の複数の基準テンプレートのそれぞれと前記の標本テンプレートとの間の相
関を計算して、前記の複数の基準テンプレートのどれが前記の標本テンプレート
との最高の相関を持っているかに注目すること、
のうちの少なくとも一つを含んでいる、請求項1Oの方法。
166相関を計算する前記の段階が、前記の見いだす段階が正確な一致を見いだ
すことができないときに行われる、請求項15の方法。
国際調査報告
国際調査報告
LIS 8902037
Claims (30)
- 1.光学式文字認識システムと共に使用可能な書類文字認識システムであって、 複数の事前印刷書式における事前印刷線間の間隔及びそれの長さを指定した対応 する複数の基準テンプレートを記憶するための装置、 未知の書式の書類の画像を表す連続したビデオ線からなる到来ビデオデータを受 けるための装置、 前記の書類の前記の画像における事前印刷線間の間隔及びそれの長さを指定した 標本テンプレートを前記の到来ビデオデータから発生するための装置、並びに 前記の複数の基準テンプレートのどれが前記の標本テンプレートに最もよく似て いるかを決定するための装置、を備えている前記の書類文字認識システム。
- 2.前記の複数の基準テンプレート及び前記の標本テンプレートがそれぞれ水平 事前印刷線のビデオ線番号を指定している、請求項1のシステム。
- 3.標本テンプレートを発生するための前記の装置が、ビデオ線番号の関数とし て前記のビデオデータにおける「オン」画素の線密度を表す曲線を発生するため の装置、前記の曲線における所定のしきい値を越えたピークの位置を確認し且つ 前記のピークの位置に注目するための装置、及び前記のピークのそれぞれに対応 する各ビデオ線における「オン」ビデオ画素の最長のラン長を決定するための装 置、を備えている、請求項2のシステム。
- 4.標本テンプレートを発生するための前記の装置が更に、前記のピークの注目 した位置を、前記の画像における連続した水平線間の間隔を表す一連の数に変換 する、請求項3のシステム。
- 5.前記の曲線におけるピークの位置を確認するための前記の装置が、前記の曲 線の微分を生成し且つ前記の曲線の前記の微分における不連続点の位置に注目す るための装置からなっている、請求項3のシステム。
- 6.前記の複数の基準テンプレートのどれが前記の標本テンプレートに最もよく 似ているかを決定するための前記の装置が、前記の複数の基準テンプレートのど れが前記の標本テンプレートに正確に一致するかを見いだし且つこれの一致性に 注目するための装置、及び 前記の複数の基準テンプレートのそれぞれと前記の標本テンプレートとの間の相 互相関を計算し、且つ前記の複数の基準テンプレートのどれが前記の標本テンプ レートとの最高の相互相関を持っているかに注目するための装置、のうちの少な くとも一つを備えている、請求項1のシステム。
- 7.前記の決定するための装置が、前記の正確な一致を見いだすための装置及び 前記の相互相関を計算するための装置の両方を含んでおり、且つ前記の決定する 装置が更に、前記の見いだすための装置が正確な一致を見いだすことができない ときに応答して前記の相互相関を計算するための前記の装置を活動化することの できるデフォルト装置、を備えている、請求項6のシステム。
- 8.前記の決定する装置により識別された一つのテンプレートの内容を前記の光 学式文字認識システムに送り、且つ前記の一つの書類を表す前記のビデオデータ を前記の光学式文字認識システムに送って、これにより前記の光学式文字認識シ ステムが前記の一つのテンプレートの内容を前記の一つの書類を表すビデオデー タと関連させることができるようにするための装置を更に備えている、請求項1 のシステム。
- 9.前記の決定する装置が前記の一つの基準テンプレートを識別するまで前記の 一つの書類を表すビデオデータを記憶するためのバッファ装置、 前記の決定する装置が前記の一つのテンプレートを識別したときに応答して、前 記のバッファ装置からビデオデータを取り出し、このデータから前記の一つの基 準テンプレートにおける事前印刷線間隔及び長さに対応するそれにおける事前印 刷線を表すデータをマスクし、且つこのようにマスクされたデータを前記の光学 式文字認識システムに送り、これにより前記の光学式文字認識システムが非本文 データを受けることから保護されるようにするための出力処理装置、 を更に備えている、請求項1のシステム。
- 10.前記のテンプレートのそれぞれが記憶装置に記憶された一対の表からなっ ていて、前記の表の一方がその後に生じる事前印刷線間の間隔を記載し且つ前記 の表の他方が対応する事前印刷線の長さを表しており、前記の二つの表のそれぞ れの内容が前記の画像における対応する事前印刷線の位置の順序に配列されてい る、請求項1のシステム。
- 11.記憶するための前記の装置に記憶された前記の複数の基準テンプレートが 、対応する複数の書式の画像データを、到来ビデオデータを受けるための前記の 装置に連続して送ることによって発生され、これにより、標本テンプレートを発 生するための前記の装置が前記の複数の基準テンプレートを含む対応する複数の 標本テンプレートを発生し、これが次に記憶するための前記の装置に記憶され得 る、請求項1のシステム。
- 12.光学式文字認識システムと共に使用可能な書類文字認識システムであって 、 複数の事前印刷書式における事前印刷線間の間隔を指定した対応する複数の基準 テンプレートを記憶するための装置、未知の書式の書類の画像を表す連続したビ デオ線からなる到来ビデオデータを受けるための装置、 前記の書類の前記の画像における事前印刷線間の間隔を指定した標本テンプレー トを前記の到来ビデオデータから発生するための装置、及び 前記の複数の基準テンプレートのどれが前記の標本テンプレートに最もよく似て いるかを決定するための装置、を備えている、前記の書類文字認識システム。
- 13.前記の複数の基準テンプレート及び前記の標本テンプレートがそれぞれ水 平事前印刷線のビデオ線番号を指定している、請求項12のシステム。
- 14.標本テンプレートを発生するための前記の装置が、ビデオ線番号の関数と して前記のビデオデータにおける「オン」画素の線密度を表す曲線を発生するた めの装置、前記の曲線において所定のしきい値を越えたピークの位置を確認し且 つ前記のピークの位置に注目するための装置、を備えている、請求項13のシス テム。
- 15.標本テンプレートを発生するための前記の装置が更に、前記のピークの注 目した位置を、前記の画像における連続した水平線間の間隔を表す一連の数に変 換する、請求項14のシステム。
- 16.前記の曲線におけるピークの位置を確認するための前記の装置が、前記の 曲線の微分を生成し且つ前記の曲線の前記の微分における不連続点の位置に注目 するための装置からなっている、請求項3のシステム。
- 17.前記の複数の基準テンプレートのどれが前記の標本テンプレートに最もよ く似ているかを決定するための前記の装置が、前記の複数の基準テンプレートの どれが前記の標本テンプレートに正確に一致するかを見いだし且つこれの一致性 に注目するための装置、及び 前記の複数の基準テンプレートのそれぞれと前記の標本テンプレートとの間の相 互相関を計算し、且つ前記の複数の基準テンプレートのどれが前記の標本テンプ レートとの最高の相互相関を持っているかに注目するための装置、のうちの少な くとも一つを備えている、請求項12のシステム。
- 18.前記の決定するための装置が、前記の正確な一致を見いだすための装置及 び前記の相互相関を計算するための装置の両方を含んでおり、且つ前記の決定す る装置が更に、前記の見いだすための装置が正確な一致を見いだすことができな いときに応答して前記の相互相関を計算するための前記の装置を活動化すること のできるデフォルト装置、を備えている、請求項17のシステム。
- 19.前記の決定する装置により識別された一つのテンプレートの内容を前記の 光学式文字認識システムに送り、且つ前記の一つの書類を表す前記のビデオデー タを前記の光学式文字認識システムに送って、これにより前記の光学式文字認識 システムが前記の一つのテンプレートの内容を前記の一つの書類を表すビデオデ ータと関連させることができるようにするための装置を更に備えている、請求項 12のシステム。
- 20.前記の決定する装置が前記の一つの基準テンプレートを識別するまで前記 の一つの書類を表すビデオデータを記憶するためのバッファ装置、 前記の決定する装置が前記の一つのテンプレートを識別したときに応答して、前 記のバッファ装置からビデオデータを取り出し、このデータから前記の一つの基 準テンプレートにおける事前印刷線間隔及び長さに対応するそれにおける事前印 刷線を表すデータをマスクし、且つこのようにマスクされたデータを前記の光学 式文字認識システムに送り、これにより前記の光学式文字認識システムが非本文 データを受けることから保護されるようにするための出力処理装置、 を更に備えている、請求項12のシステム。
- 21.前記のテンプレートのそれぞれが記憶装置に記憶された一対の表からなっ ていて、前記の表の一方がその後に生じる事前印刷線間の間隔を記載し且つ前記 の表の他方が対応する事前印刷線の長さを表しており、前記の二つの表のそれぞ れの内容が前記の画像における対応する事前印刷線の位置の順序に配列されてい る、請求項12のシステム。
- 22.前記の記憶するための装置に記憶された前記の複数の基準テンプレートが 、対応する複数の書式の画像データを、到来ビデオデータを受けるための前記の 装置に連続して送ることによって発生され、これにより標本テンプレートを発生 するための前記の装置が前記の複数の基準テンプレートを含む対応する複数の標 本テンプレートを発生し、これが次に前記の記憶するための装置に記憶され得る 、請求項1のシステム。
- 23.光学式文字認識システムと共に使用可能な書類文字認識方法であって、 複数の事前印刷書式における事前印刷線間の間隔及びそれの長さを指定した対応 する複数の基準テンプレートを記憶装置に記憶すること、 未知の書式の書類の画像を表す連続したビデオ線からなる到来ビデオデータを受 けること、 前記の書類の前記の画像における事前印刷線の長さ間の間隔を指定した標本テン プレートを前記の到来ビデオデータから発生すること、並びに 前記の複数の基準テンプレートのどれが前記の標本テンプレートに最もよく似て いるかを決定すること、を含んでいる前記の書類文字認識方法。
- 24.前記の複数の基準テンプレート及び前記の標本テンプレートがそれぞれ水 平印刷線のビデオ線番号を指定している、請求項23の方法。
- 25.前記の発生する段階が、 ビデオ線番号の関数として前記のビデオデータにおける「オン」画素の線密度を 表す曲線を発生すること、前記の曲線における所定のしきい値を越えたピークの 位置を確認し且つ前記のピークの位置に注目すること、及び前記のピークのそれ ぞれに対応する各ビデオ線における「オン」ビデオ画素の最長のラン長を決定す ること、を含んでいる、請求項24の方法。
- 26.前記の標本テンプレートを発生する段階が更に、前記のピークの注目した 位置を、前記の画像における連続した水平線間の間隔を表す一連の数に変換する ことを含んでいる、請求項25の方法。
- 27.前記の複数の基準テンプレートのどれが前記の標本テンプレートに最もよ く似ているかを決定する前記の段階が、前記の複数の基準テンプレートのどれが 前記の標本テンプレートに正確に一致するかを見いだしてそれの一致性に注目す る段階、及び 前記の複数の基準テンプレートのそれぞれと前記の標本テンプレートとの間の相 互相関を計算して、前記の複数の基準テンプレートのどれが前記の標本テンプレ ートとの最高の相互相関を持っているかに注目する段階、 のうちの少なくとも一つを含んでいる、請求項23の方法。
- 28.前記の決定する装置によって識別された一つのテンプレートの内容を前記 の光学式文字認識システムに送り且つ前記の一つの書類を表す前記のビデオデー タを前記の光学式文字認識システムに送り、これにより前記の光学式文字認識シ ステムが前記の一つのテンプレートの内容を、前記の一つの書類を表すビデオデ ータと関連させることができる、請求項23の方法。
- 29.前記の決定する装置が前記の一つの基準テンプレートを識別するまで前記 の一つの書類を表すビデオデータをバッファに記憶すること、 前記の決定する段階が前記の一つのテンプレートを識別したときに、前記のバッ ファからビデオデータを取り出し、このデータから前記の一つの基準テンプレー トにおける事前印刷線間隔及び長さに対応するそれにおける事前印刷線を表すデ ータをマスクし、且つこのようにマスクされたデータを前記の光学式文字認識シ ステムに送り、これにより前記の光学式文字認識システムが非本文データを受け ることから保護されるようにすること、 を更に含んでいる、請求項23の方法。
- 30.前記のテンプレートのそれぞれが記憶装置に記憶された一対の表からなっ ていて、前記の表の一方が続いて生じる事前印刷線間の間隔を記載し且つ前記の 表の他方が対応する事前印刷線の長さを表しており、前記の二つの表のそれぞれ の内容が前記の画像における対応する事前印刷線の位置の順序に配列されている 、請求項23の方法。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US196,513 | 1988-05-20 | ||
| US07/196,513 US4949392A (en) | 1988-05-20 | 1988-05-20 | Document recognition and automatic indexing for optical character recognition |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH03504423A true JPH03504423A (ja) | 1991-09-26 |
Family
ID=22725717
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1506309A Pending JPH03504423A (ja) | 1988-05-20 | 1989-05-15 | 光学式文字認識のための書類認識及び自動索引付与 |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US4949392A (ja) |
| EP (1) | EP0481979B1 (ja) |
| JP (1) | JPH03504423A (ja) |
| WO (1) | WO1989011703A1 (ja) |
Families Citing this family (74)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5553170A (en) * | 1987-07-09 | 1996-09-03 | Ezel, Inc. | High speed image processing system having a preparation portion and a converting portion generating a processed image based on the preparation portion |
| JP2812982B2 (ja) * | 1989-04-05 | 1998-10-22 | 株式会社リコー | 表認識方法 |
| JPH03180968A (ja) * | 1989-12-08 | 1991-08-06 | Hitachi Ltd | データベース検索方法およびこれを用いる書式付き文書出力方法 |
| US5344132A (en) * | 1990-01-16 | 1994-09-06 | Digital Image Systems | Image based document processing and information management system and apparatus |
| US5191525A (en) * | 1990-01-16 | 1993-03-02 | Digital Image Systems, Corporation | System and method for extraction of data from documents for subsequent processing |
| US5052044A (en) * | 1990-02-02 | 1991-09-24 | Eastman Kodak Company | Correlated masking process for deskewing, filtering and recognition of vertically segmented characters |
| US5038392A (en) * | 1990-02-12 | 1991-08-06 | International Business Machines Corporation | Method and apparatus for adaptive image processing by recognizing a characterizing indicium in a captured image of a document |
| US5191612A (en) * | 1990-03-13 | 1993-03-02 | Fujitsu Limited | Character recognition system |
| US5091968A (en) * | 1990-12-28 | 1992-02-25 | Ncr Corporation | Optical character recognition system and method |
| US5566255A (en) * | 1991-03-05 | 1996-10-15 | Ricoh Company, Ltd. | Segmenting a page of a document into areas which are text and areas which are halftone |
| US5222155A (en) * | 1991-03-26 | 1993-06-22 | Massachusetts Institute Of Technology | Computer apparatus and method for fuzzy template shape matching using a scoring function |
| JPH04343190A (ja) * | 1991-05-21 | 1992-11-30 | Hitachi Ltd | 文字データ入力方式 |
| US5293429A (en) * | 1991-08-06 | 1994-03-08 | Ricoh Company, Ltd. | System and method for automatically classifying heterogeneous business forms |
| US5848187A (en) * | 1991-11-18 | 1998-12-08 | Compaq Computer Corporation | Method and apparatus for entering and manipulating spreadsheet cell data |
| US5251273A (en) * | 1992-04-15 | 1993-10-05 | International Business Machines Corporation | Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms |
| US5305396A (en) * | 1992-04-17 | 1994-04-19 | International Business Machines Corporation | Data processing system and method for selecting customized character recognition processes and coded data repair processes for scanned images of document forms |
| US5235654A (en) * | 1992-04-30 | 1993-08-10 | International Business Machines Corporation | Advanced data capture architecture data processing system and method for scanned images of document forms |
| EP0571892B1 (en) * | 1992-05-26 | 1999-10-13 | United Parcel Service Of America, Inc. | Multiple code camera system |
| US5386482A (en) * | 1992-07-16 | 1995-01-31 | Scan-Optics, Inc. | Address block location method and apparatus |
| US5416849A (en) * | 1992-10-21 | 1995-05-16 | International Business Machines Corporation | Data processing system and method for field extraction of scanned images of document forms |
| US6002798A (en) * | 1993-01-19 | 1999-12-14 | Canon Kabushiki Kaisha | Method and apparatus for creating, indexing and viewing abstracted documents |
| JP2764224B2 (ja) * | 1993-03-01 | 1998-06-11 | ユナイテツド パーセル サービス オブ アメリカ インコーポレイテツド | 補足目標の位置を求める方法および装置 |
| GB9305554D0 (en) * | 1993-03-18 | 1993-05-05 | Ncr Int Inc | Method and apparatus for processing decuments |
| GB9313640D0 (en) * | 1993-07-01 | 1993-08-18 | Ncr Int Inc | Document transaction apparatus |
| US5428694A (en) * | 1993-10-14 | 1995-06-27 | International Business Machines Corporation | Data processing system and method for forms definition, recognition and verification of scanned images of document forms |
| US5555325A (en) * | 1993-10-22 | 1996-09-10 | Lockheed Martin Federal Systems, Inc. | Data capture variable priority method and system for managing varying processing capacities |
| US5394487A (en) * | 1993-10-27 | 1995-02-28 | International Business Machines Corporation | Forms recognition management system and method |
| US5521991A (en) * | 1993-10-29 | 1996-05-28 | International Business Machines Corporation | Method and system for fast forms recognition of document form images |
| GB9323709D0 (en) * | 1993-11-15 | 1994-01-05 | Ncr Int Inc | Depository apparatus for envelopes and single sheets |
| DE69432114T2 (de) * | 1993-11-24 | 2003-10-30 | Canon K.K., Tokio/Tokyo | System zum Identifizieren und Verarbeiten von Formularen |
| US5410611A (en) * | 1993-12-17 | 1995-04-25 | Xerox Corporation | Method for identifying word bounding boxes in text |
| JP3445394B2 (ja) * | 1993-12-17 | 2003-09-08 | ゼロックス・コーポレーション | 少なくとも二つのイメージセクションの比較方法 |
| US5748780A (en) * | 1994-04-07 | 1998-05-05 | Stolfo; Salvatore J. | Method and apparatus for imaging, image processing and data compression |
| US5642435A (en) * | 1995-01-25 | 1997-06-24 | Xerox Corporation | Structured document processing with lexical classes as context |
| US5852676A (en) * | 1995-04-11 | 1998-12-22 | Teraform Inc. | Method and apparatus for locating and identifying fields within a document |
| US5867597A (en) * | 1995-09-05 | 1999-02-02 | Ricoh Corporation | High-speed retrieval by example |
| US5936225A (en) * | 1996-04-02 | 1999-08-10 | Strategic Quantitative Solutions, Inc. | Method and apparatus for tabulating data from a plurality of response forms |
| US5937084A (en) * | 1996-05-22 | 1999-08-10 | Ncr Corporation | Knowledge-based document analysis system |
| US5835638A (en) * | 1996-05-30 | 1998-11-10 | Xerox Corporation | Method and apparatus for comparing symbols extracted from binary images of text using topology preserved dilated representations of the symbols |
| US5841905A (en) * | 1996-10-25 | 1998-11-24 | Eastman Kodak Company | Business form image identification using projected profiles of graphical lines and text string lines |
| US6327387B1 (en) | 1996-12-27 | 2001-12-04 | Fujitsu Limited | Apparatus and method for extracting management information from image |
| US6038351A (en) * | 1997-10-28 | 2000-03-14 | Cash Management Solutions | Apparatus and method for multi-entity, mixed document environment document identification and processing |
| US6741737B1 (en) | 1999-03-18 | 2004-05-25 | Choicepoint Asset Company | System and method for the secure data entry from document images |
| US6400845B1 (en) | 1999-04-23 | 2002-06-04 | Computer Services, Inc. | System and method for data extraction from digital images |
| US6357658B1 (en) | 1999-04-28 | 2002-03-19 | Peripheral Dynamics, Inc. | Apparatus and methods for scanning documents including OMR, bar-code, and image data |
| WO2000079469A2 (en) * | 1999-06-22 | 2000-12-28 | Peripheral Dynamics, Inc. | Apparatus and methods for image scanning of variable sized documents having variable orientations |
| US6950553B1 (en) * | 2000-03-23 | 2005-09-27 | Cardiff Software, Inc. | Method and system for searching form features for form identification |
| US7034951B1 (en) * | 2000-05-10 | 2006-04-25 | Hewlett-Packard Development Company, L.P. | Printer collator facility and method |
| US6909805B2 (en) * | 2001-01-31 | 2005-06-21 | Matsushita Electric Industrial Co., Ltd. | Detecting and utilizing add-on information from a scanned document image |
| JP2002324236A (ja) * | 2001-04-25 | 2002-11-08 | Hitachi Ltd | 帳票識別方法及び帳票登録方法 |
| US7283274B2 (en) * | 2001-10-26 | 2007-10-16 | Hewlett-Packard Development Company, L.P. | Method and system for printing user data to form documents |
| CA2375355A1 (en) * | 2002-03-11 | 2003-09-11 | Neo Systems Inc. | Character recognition system and method |
| JP2004151979A (ja) * | 2002-10-30 | 2004-05-27 | Olympus Corp | 電子カタログ用索引自動作成システム |
| CA2460888A1 (en) * | 2004-03-12 | 2005-09-12 | Harpe And Associates Ltd. | Method for image alignment and identification |
| US7787158B2 (en) * | 2005-02-01 | 2010-08-31 | Canon Kabushiki Kaisha | Data processing apparatus, image processing apparatus, data processing method, image processing method, and programs for implementing the methods |
| US7748839B2 (en) * | 2006-05-09 | 2010-07-06 | Lexmark International, Inc. | Handheld printing with reference indicia |
| US7986843B2 (en) * | 2006-11-29 | 2011-07-26 | Google Inc. | Digital image archiving and retrieval in a mobile device system |
| US20080162603A1 (en) * | 2006-12-28 | 2008-07-03 | Google Inc. | Document archiving system |
| US20080162602A1 (en) * | 2006-12-28 | 2008-07-03 | Google Inc. | Document archiving system |
| US8000535B2 (en) * | 2007-06-18 | 2011-08-16 | Sharp Laboratories Of America, Inc. | Methods and systems for refining text segmentation results |
| US8358852B2 (en) * | 2008-03-31 | 2013-01-22 | Lexmark International, Inc. | Automatic forms identification systems and methods |
| US8605982B2 (en) | 2008-08-11 | 2013-12-10 | Hyland Software, Inc. | Check boundary detection by string literal analysis |
| US8155425B1 (en) | 2008-08-11 | 2012-04-10 | Microsystems Technology, Inc. | Automated check detection and image cropping |
| US8249343B2 (en) | 2008-10-15 | 2012-08-21 | Xerox Corporation | Representing documents with runlength histograms |
| US8718367B1 (en) * | 2009-07-10 | 2014-05-06 | Intuit Inc. | Displaying automatically recognized text in proximity to a source image to assist comparibility |
| CN102023966B (zh) * | 2009-09-16 | 2014-03-26 | 鸿富锦精密工业(深圳)有限公司 | 用于合约比较的计算机系统及合约比较方法 |
| JP5556524B2 (ja) * | 2010-09-13 | 2014-07-23 | 株式会社リコー | 帳票処理装置、帳票処理方法、帳票処理プログラム、及びそのプログラムを記録した記録媒体 |
| US9710806B2 (en) | 2013-02-27 | 2017-07-18 | Fiserv, Inc. | Systems and methods for electronic payment instrument repository |
| US20140279303A1 (en) * | 2013-03-15 | 2014-09-18 | Fiserv, Inc. | Image capture and processing for financial transactions |
| US20140304579A1 (en) * | 2013-03-15 | 2014-10-09 | SnapDoc | Understanding Interconnected Documents |
| JP6187323B2 (ja) * | 2014-03-05 | 2017-08-30 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
| US9965679B2 (en) | 2014-11-05 | 2018-05-08 | Accenture Global Services Limited | Capturing specific information based on field information associated with a document class |
| US10395133B1 (en) * | 2015-05-08 | 2019-08-27 | Open Text Corporation | Image box filtering for optical character recognition |
| CN112926313B (zh) * | 2021-03-10 | 2023-08-15 | 新华智云科技有限公司 | 一种槽位信息的提取方法与系统 |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US3846752A (en) * | 1972-10-02 | 1974-11-05 | Hitachi Ltd | Character recognition apparatus |
| US4020462A (en) * | 1975-12-08 | 1977-04-26 | International Business Machines Corporation | Method and apparatus for form removal from contour compressed image data |
| US4208652A (en) * | 1978-09-14 | 1980-06-17 | A. C. Nielsen Company | Method and apparatus for identifying images |
| US4231014A (en) * | 1979-04-17 | 1980-10-28 | Vittorio Ponzio | Process and apparatus for automatically identifying discount coupons and the like by means of electronic comparison |
| JPS57150075A (en) * | 1981-03-12 | 1982-09-16 | Fuji Xerox Co Ltd | Square figure recognizing device |
| JPS59205678A (ja) * | 1983-05-09 | 1984-11-21 | Sharp Corp | 用紙情報入力装置 |
| US4559649A (en) * | 1983-05-24 | 1985-12-24 | Panett Corporation | Urine specimen collection system |
| US4688088A (en) * | 1984-04-20 | 1987-08-18 | Canon Kabushiki Kaisha | Position detecting device and method |
| EP0262462A3 (de) * | 1986-09-30 | 1991-02-27 | Siemens Aktiengesellschaft | Verfahren zum Interpretieren formularhafter Dokumente |
-
1988
- 1988-05-20 US US07/196,513 patent/US4949392A/en not_active Expired - Fee Related
-
1989
- 1989-05-15 EP EP89906581A patent/EP0481979B1/en not_active Expired - Lifetime
- 1989-05-15 JP JP1506309A patent/JPH03504423A/ja active Pending
- 1989-05-15 WO PCT/US1989/002037 patent/WO1989011703A1/en not_active Ceased
Also Published As
| Publication number | Publication date |
|---|---|
| EP0481979B1 (en) | 1993-10-20 |
| EP0481979A1 (en) | 1992-04-29 |
| WO1989011703A1 (en) | 1989-11-30 |
| US4949392A (en) | 1990-08-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH03504423A (ja) | 光学式文字認識のための書類認識及び自動索引付与 | |
| US6694053B1 (en) | Method and apparatus for performing document structure analysis | |
| JP3289968B2 (ja) | 電子的文書処理のための装置および方法 | |
| US6671684B1 (en) | Method and apparatus for simultaneous highlighting of a physical version of a document and an electronic version of a document | |
| US6549913B1 (en) | Method for compiling an image database, an image database system, and an image data storage medium | |
| US6909805B2 (en) | Detecting and utilizing add-on information from a scanned document image | |
| US7801392B2 (en) | Image search system, image search method, and storage medium | |
| CN112800848A (zh) | 票据识别后信息结构化提取方法、装置和设备 | |
| JPH10320525A (ja) | ファイリング・検索装置およびファイリング・検索方法 | |
| GB2378018A (en) | Electronic filing system | |
| US20010043742A1 (en) | Communication document detector | |
| CN110209759B (zh) | 自动识别书页的方法及装置 | |
| Janssen et al. | Receipts2go: the big world of small documents | |
| JP5436040B2 (ja) | 画像入出力装置および監視システム | |
| GB2404471A (en) | Processing a document based on data contained in its image | |
| JP6159022B2 (ja) | スキャンされたハードコピーメディアの分類方法およびシステム | |
| JPH11296676A (ja) | 画像データ分類方法および画像データ登録方法 | |
| JP4480109B2 (ja) | 画像管理装置および画像管理方法 | |
| JP2015201077A (ja) | 画像処理装置、画像処理方法、および画像処理プログラム | |
| US20230102476A1 (en) | Information processing apparatus, non-transitory computer readable medium storing program, and information processing method | |
| JPH0561912A (ja) | 情報フアイリング装置 | |
| KR100544375B1 (ko) | 문서파일로부터 명함정보를 추출하기 위한 장치와 방법,및 상기 방법을 기록한 기록매체 | |
| JP6605165B1 (ja) | ファクシミリ文書管理支援システム | |
| Maderlechner et al. | Finding Captions in PDF-Documents for Semantic Annotations of Images | |
| JP2004110656A (ja) | 電子ファイリング方法 |