JPH0877294A - 文書画像処理装置 - Google Patents

文書画像処理装置

Info

Publication number
JPH0877294A
JPH0877294A JP6212951A JP21295194A JPH0877294A JP H0877294 A JPH0877294 A JP H0877294A JP 6212951 A JP6212951 A JP 6212951A JP 21295194 A JP21295194 A JP 21295194A JP H0877294 A JPH0877294 A JP H0877294A
Authority
JP
Japan
Prior art keywords
feature
input
document
format structure
ruled line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6212951A
Other languages
English (en)
Inventor
Yasuto Ishitani
康人 石谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP6212951A priority Critical patent/JPH0877294A/ja
Publication of JPH0877294A publication Critical patent/JPH0877294A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】本発明は、帳票などの文書フォーマットを正確
に特定でき、効率の良い文字列の抽出、読み取りを可能
にした文書画像処理装置を提供する。 【構成】画像入力部11より生成される帳票の入力画像
に対して、特徴抽出部12より抽出された図形特徴量を
特徴構造化部でグループ化し、それぞれの特徴間の関係
を抽出・管理する。構造化特徴と、書式構造種別同定部
15で予め登録されている処理対象文書の書式構造に関
する情報(書式構造モデル)を用いて入力文書の書式構
造の種別を推定する。書式構造情報照合部16は、推定
された書式構造の種別に対応する書式構造モデルと入力
文書の構造化特徴の間で、詳細な対応関係を抽出する。
未対応・矛盾対応発見修正部18で対応関係の整合を得
た後、文書構造獲得部19でその対応関係に基づき予め
登録されている書式構造モデルに関する情報を入力文書
にコピーすることで入力文書の構造及び関連知識を獲得
する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば帳票などの文書
上に記載された文字の読みとり、データベースへの自動
入力、帳票画像の自動ファイリングに用いられる文書画
像処理装置に関するものである。
【0002】
【従来の技術】近年、書類形態で管理・利用されていた
文書を電子化して計算機に入力し、多用な用途で活用し
ている。様々な業務処理で用いられている文書には、表
形式のものが多く、文書中の特定の位置に記載されてい
る所望の文字列を所望の形式で計算機に効率よく入力
し、管理したいという要求が高まっている。これらの期
待に答えるためにこれまでに光学的文字読みとり装置が
開発され、実用化されてきた。
【0003】このような帳票上の特定の位置に記載され
ている文字列を読み取り対象とする場合、帳票の書式構
造を事前に知る必要がある。帳票のように定型的な書式
構造を持つ文書に対する文字列の読み取り処理では、書
式構造を事前に覚えさせておき、それに基づいて効率良
く文字列領域を特定し、読み取るようにしている。
【0004】このようなアプローチをとるものとして
は、対象文書の書式構造に関する知識とそれを利用する
処理を分離することで書式構造の多用性への拡張性を高
めている。これらのものは書式構造に関する知識として
文書構造の物理情報、例えば位置、大きさ、幾何学的関
係などの情報を用いている。代表的な研究として、文献
「信学論(D)、J71−D、10、pp.2050-2058(1988-1
0)」と文献「信学論(D−II)、J72−D−II、7、p
p.1029-1039(1989-07)」がある。
【0005】一方、最近になって、文書構造に関する物
理情報を用いるだけでは対応できない帳票に対しても文
字列領域の特定を可能にすることが考えられている。こ
の場合、文字領域を空間的な隣接・接続関係に基づいた
論理情報で表現し、識別することを可能にしている。
【0006】このようなアプローチをとるものとして
は、種々の帳票文書の書式構造に関する構成規則を一般
化してメタ知識と表現されたものを用いて対象文書画像
の書式構造を認識している。代表的な研究として文献
「信学論(D−II)、J76−D−II、3、pp.534-545(1
993-03)」がある。
【0007】
【発明が解決しようとする課題】文献「信学論(D)、
J71−D、10、pp.2050-2058(1988-10)」や文献「信学
論(D−II)、J72−D−II、7、pp.1029-1039(1989-
07)」のようなアプローチをとる手法では、物理情報に
依存しているので文書が大幅にずれて入力されたり、拡
大・縮小によるスケール変換を受けている場合には対応
できない。また、文献「信学論(D−II)、J76−D−
II、3、pp.534-545(1993-03)」のようなアプローチを
とる手法では、入力文書は高品質で画像の劣化がないこ
とを前提としているため、処理対象文書の品質が悪く画
像情報が不足している場合には所望の処理結果を得られ
ないという問題がある。
【0008】また、何れの手法においても、以下の
(1)〜(6)の問題がある。
【0009】(1) 表が複数混在している場合には対
応できない。
【0010】(2) 表が分裂している場合には対応で
きない。
【0011】(3) 罫線がかすれていたり、欠落して
いる場合には対応できない。
【0012】(4) 罫線分布が局所的に変動している
場合には対応できない。
【0013】(5) 入力された文書の処理方法を限定
している(左右に90度および180度回転している文
書に対応できない)。
【0014】(6) 種々の書式構造の文書を一括して
読み取らせる場合、適用すべき書式構造モデルの自動同
定ができない。
【0015】本発明は上記事情に鑑みてなされたもの
で、表形式の帳票などの書式構造を正確に認識でき、効
率の良い文字列の領域の特定を可能にした文書画像処理
装置を提供することを目的とする。
【0016】
【課題を解決するための手段】本発明は、文書より入力
画像を生成する画像入力手段と、入力文書の書式構造を
認識するために用いられる処理対象文書の書式構造に関
する情報を登録する際に、正立した処理対象文書の書式
構造に関する情報を複数の所定角度で回転させたものを
発生させ、それぞれに正立したものから何度回転してい
るかに関する情報を付与し、それらすべてを処理対象文
書の書式構造に関する情報として登録する書式構造情報
登録手段と、前記画像入力手段により生成された入力画
像から線分と文字成分に関する図形特徴を抽出し、さら
に前記入力画像における文字成分以外の領域から線分に
関する特徴を罫線を構成する図形特徴とみなして抽出す
る特徴抽出手段と、前記特徴抽出手段より抽出された罫
線に関する図形特徴をグループ化することにより表に関
する特徴を抽出し、各表に関する特徴において罫線が交
差・接続する部分に生じる接合部に関する情報を抽出
し、それぞれの特徴間の関係を抽出・管理する特徴構造
化手段と、前記特徴構造化手段で得られた入力画像の構
造化された画像特徴と、予め前記書式構造情報登録手段
によって登録されている処理対象文書の書式構造に関す
る情報を用いて、類似度を計算し、最も類似度の高い書
式構造モデルあるいは類似度の高いものから順に複数個
の書式構造モデルあるいはある一定値以上の類似度を有
する書式構造モデルを選び、前記入力文書の書式構造の
種別を一つあるいは複数個の候補に絞りこむ書式構造種
別同定手段と、前記特徴構造化手段により得られた入力
文書の表に関する特徴と、前記書式構造情報登録手段に
より登録されている当該書式構造モデルを構成する表に
関する特徴との間い照合処理を行ない、表間対応関係を
獲得する表照合手段と、前記表照合手段により得られた
表の対応関係において入力文書の表を構成する罫線と同
罫線に対応付く書式構造モデルの表を構成する罫線との
間の対応関係を獲得する罫線照合手段と、前記照合処理
結果に基づき特徴間の対応付きの程度を表す照合度を計
算し、正しい対応付けが行なわれているか否かの判断を
行なう照合結果判定手段とにより構成されているモデル
照合手段と、前記モデル照合手段で選択された書式構造
文書と入力文書における構造化特徴間の対応付けにおい
て、不完全な対応付けおよび矛盾した対応付けを解消す
ることにより整合のとれた前記書式構造モデルと入力文
書の構造化された特徴間の対応関係を獲得する未対応・
矛盾対応発見修正手段と、前記モデル照合手段で入力画
像に対応付いた書式構造モデルが所定角度で回転させた
ものである場合には、その回転角度を正立する方向に入
力画像を回転し、正立した当該書式モデルと対応付ける
画像回転手段と、前記書式構造モデルと入力文書の構造
化された特徴間の対応関係に基づいて、予め登録されて
いる当該書式構造モデルに関する情報を入力文書にコピ
ーすることにより入力文書の書式構造と関連情報を獲得
する文書構造獲得手段とを具備し、この文書構造獲得手
段により得られる結果に基づいて入力画像の書式構造を
認識するように構成されている。
【0017】
【作用】この結果、本発明は、入力文書画像から罫線に
関する図形特徴量と文字成分に関する図形特徴量を抽出
し、これらのかかわり合いから文字成分以外の領域で正
確に罫線の特徴量を抽出できる。また、この罫線特徴を
グループ化することにより表に関する特徴量が得られ、
さらに各表において罫線に関する特徴とそれらの交差・
接合により生じる接合部を抽出し、全体−部分関係で記
述・管理することにより図形特徴量に対してより豊富な
情報を付加することができる。それらを効率的に検索す
ることができる。これにより文書内に表が複数個混在し
ていても各々の情報を抽出することができ、また罫線に
関する特徴も表ごとに区別することができる。
【0018】本発明では、入力画像から得られた構造化
された特徴と予め登録されている書式構造モデルの構造
化特徴との間で照合処理を行なうことにより入力文書を
解釈するが、照合処理の前に書式構造モデルの種別を同
定することで登録されているすべての書式構造モデルと
の照合処理を行なうことを避けることができる。この処
理では、文書中に含まれている接合部の数や罫線の数を
用いているので入力文書と書式構造モデルの間で拡大縮
小に伴うスケール変換がなされていたり、表や罫線の構
成要素の大きさが部分的に変動していても安定した結果
を得ることができる。書式構造モデルの種別を同定する
時に唯一の結果を出力するのではなく複数個の候補を出
力することで同定誤りが生じないようにしている。候補
となっている書式構造モデルの構造化特徴と入力文書の
構造化特徴との間で行なわれる照合処理では、もっとも
良く対応付く書式構造モデルを選ぶことができ、得られ
た対応関係が正しく獲得されているか否かの判断を行な
うことにより処理結果の信頼性を高めている。このと
き、照合処理まず表単位に行なわれ、次いで罫線単位に
行なわれる。この結果、局所的にまったく同じ特徴量を
持つ罫線でもそれが所属する表が異なれば誤った対応付
けが行なわれることはない。
【0019】また、本発明では、対応関係に対してどち
らかの構造化特徴の欠落による不完全な対応付きや矛盾
した対応付きの有無およびこの箇所を発見し、それを解
消する。この結果、整合のとれた対応関係を獲得するこ
とができ、安定した処理結果を得ることができる。この
対応関係に基づいて予め登録されている書式構造モデル
に関連する情報を入力文書に複写することにより入力文
書の文書構造を獲得し、読みとるべき文字列の記載位置
を正確に特定することができる。
【0020】
【実施例】以下、図面を参照して本発明の一実施例を説
明する。図1は本実施例に係わる画像処理装置の概略構
成を示すブロック図である。
【0021】本発明は、画像入力部11、特徴抽出部1
2、特徴構造化部13、書式構造情報登録部14、書式
構造種別同定部15、書式構造情報照合部16、未対応
・矛盾対応発見修正部17、照合結果判定部18、及び
文書構造獲得部19の各機能部から構成されている。
【0022】また、処理対象とする帳票は、図2に示す
ように、罫線により文字列領域が規定されているものと
する。
【0023】画像入力部11は、スキャナ装置やTVカ
メラ、FAXデータの入力部などによって構成されるも
のである。画像入力部11は、処理対象である帳票等の
文書の画像を検出してシステム内に取り込む。画像入力
部11によって入力された画像(入力画像)は、特徴抽
出部12に送られる。
【0024】特徴抽出部12は、画像入力部11から得
られた入力画像から、罫線や文字成分に関する幾何学的
な図形特徴量をそれぞれ基本特徴として抽出する。特徴
抽出部12により抽出された基本特徴の集合は特徴構造
化部13に送られる。
【0025】特徴構造化部13は、特徴抽出部12によ
り抽出された基本特徴の集合について、例えば罫線に関
する特徴をグループ化することにより得られる表や、罫
線が交差・接続する部分に生じる接合部などに関する情
報を構造化特徴として抽出し、さらにそれぞれの特徴間
の関係を記述、管理する。
【0026】書式構造情報登録部14は、システムとオ
ペレータとの対話的な入力作業により、処理対象文書に
関する知識の登録を行なう。本実施例では、処理対象文
書の種類ごとに用意された種々の知識の総体をモデルと
呼び、モデルを定義したときに用いた文書をモデル文書
と呼ぶことにする。モデルは例えば、そのモデル文書の
構造化特徴に関する情報などを有している。
【0027】このとき、書式構造情報登録部14は、正
立している構造化特徴から、右に90度回転したもの、
左に90度回転したもの、180度回転したものの3種
類の構造化特徴を発生させ、それぞれが正立したものか
ら何度回転されているものであるかという情報を付与し
て知識ベースとして格納してもよい。
【0028】この他に、例えば罫線により規定されてい
る領域内に含まれる文字列を文字認識装置で認識・コー
ド化させるような場合には、各種情報を構造化特徴に関
連付けて知識ベースとして登録・管理するようにしても
よい。
【0029】各種情報には、例えば、文字認識対象領域
の指定に関する情報、文字認識対象領域の文字列方向の
情報、文字読み取り処理時に拘束条件として働く文字種
情報及び筆記形態情報、文字認識後処理のための項目属
性情報、文字認識結果の対応関係などの情報がある。
【0030】書式構造種別同定部15は、特徴構造化部
13によって抽出された入力画像に対する構造化特徴
と、予め書式構造情報登録部14によって登録されてい
るモデル文書のそれぞれの構造化特徴との間で、類似度
計算を行なうことにより入力文書のフォーマットの種別
を同定する。すなわち類似度値が高いモデルのフォーマ
ットが入力文書のフォーマットである可能性が高いもの
と判別する。書式構造種別同定部15は、該当する構造
化特徴を次段の書式構造情報照合部16に出力する。
【0031】なお、書式構造種別同定部15は、最も類
似度値の高いモデルのみに注目するのではなく、例えば
ある事前に定められたしきい値以上の類似度値を示す全
てのモデル文書の構造化特徴を候補として、書式構造情
報照合部16に入力構造化特徴と共に送り込むようにし
てもよい。
【0032】書式構造情報照合部16は、書式構造種別
同定部15によって候補とされた全てのモデル文書と入
力文書の間で構造化特徴間の対応関係を獲得する。ま
た、書式構造情報照合部16は、入力文書の構造化特徴
と各モデル文書の構造化特徴との対応付け結果に対して
対応付きの度合いを表す尺度(以後、照合度と呼ぶ)を
計算する。書式構造情報照合部16は、構造化特徴間の
対応関係を示す情報、及び照合度を示す情報を照合結果
判定部17に出力する。
【0033】なお、書式構造種別同定部15から複数の
モデル文書の構造化特徴が送られてきた場合には、書式
構造情報照合部16は、さらに最大照合度を示すモデル
文書を選択・出力するようになっていてもよい。
【0034】照合結果判定部17は、書式構造情報照合
部16によって得られた情報に基づいて、最大照合度を
示す文書モデルと入力文書との間で対応関係が取れてい
るか否かを判定する。ここで対応関係が取れていると判
定された場合には、後段の未対応・矛盾対応発見修正部
18に着目入力文書とモデル文書間の対応関係に関する
情報が送られるようにする。対応関係が取れていないと
みなされる場合には、入力文書を棄却して、次の文書を
入力するようにオペレータに促す。
【0035】未対応・矛盾対応発見修正部18は、書式
構造情報照合部16で獲得された入力文書の構造化特徴
とモデル文書の構造化特徴の対応関係において、誤った
特徴の抽出や必要な特徴の欠落のために不完全な対応や
矛盾した対応が生じているか否かを発見する。未対応・
矛盾対応発見修正部18は、不完全な対応や矛盾した対
応を発見した場合には、それらを解消することにより整
合のとれた入力・モデル間の対応関係を獲得した上で、
文書構造獲得部19に出力する。
【0036】文書構造獲得部19は、未対応・矛盾対応
発見修正部18で得られた整合のとれた入力文書とモデ
ル文書の構造化特徴間の対応関係に基づいて、予め書式
構造情報登録部14で登録されているモデル文書に関す
る知識を入力文書にコピーすることにより入力文書の文
書構造及び関連知識を獲得する。
【0037】次に、上述した必須構成要素を含む具体的
な文書画像処理システムについて説明する。ここでは、
図3に示すように、文字認識装置と組み合わせた文書画
像処理システムについて説明する。このシステムは、入
力文書から得られた入力画像において、特定の位置に記
載されている文字列領域を自動的に抽出し、さらにその
文字列画像を認識・コード化して、所望の出力様式で出
力するという動作をするものである。以後、図2に示す
文書(以下、特に断らない限り図2の文書を入力文書と
呼ぶ)を用いて説明する。
【0038】図3に示すように、文書画像処理システム
は、画像入力部21、2値化処理部23、前処理部2
5、特徴抽出部27、特徴構造化部29、モデル登録部
31、フォント種別同定部33、モデル照合部35、照
合結果判定部37、未対応矛盾対応発見修正部39、文
書構造獲得部41、文字列領域抽出部43、文字認識部
45、及び文字認識結果出力部47によって構成されて
いる。
【0039】画像入力部21は、図1において説明した
画像入力部11と同じものとして説明を省略する。
【0040】2値化処理部23は、画像入力部23から
取り込まれた文書画像を、公知である2値化処理により
白と黒の2値の画像データに変換し、前処理部25に出
力する。
【0041】前処理部25は、2値化処理部23から出
力された2値画像について、例えば文献「信学技報、P
RU92−32、1992」に記載されている傾き検出
・補正処理により、傾きのない2値画像に変換する。さ
らに、前処理部25は、傾きが補正された2値画像に対
して、公知である黒連結成分抽出処理により、連結する
黒画素のまとまりを囲む外接矩形枠を生成し、その大き
さ(縦幅と横幅の長さ)や位置座標値を抽出、管理し、
その結果を特徴抽出部27に出力する。
【0042】なお、入力文書の位置座標は左上端を原点
とし、x座標値は右方向に次第に大きくなり、y座標値
は下方向に次第に大きくなるように定義されているもの
とする。本実施例で触れる文書画像は全てこの座標系で
定義されている。この内、縦幅と横幅の長さが、それぞ
れ動的に検出されたしきい値th1 、th2 よりも小さく、
かつ最近傍の他の黒連結成分矩形から距離th3 以上離れ
ているものを、ノイズあるいは網点であるとして除去す
るようにしてもよい。
【0043】以後、画像入力部21から入力された文書
画像に対して、2値化処理部23における2値化処理、
前処理部25における前処理を施して得た画像を入力文
書画像または単に入力画像と呼ぶ。入力画像は、特徴抽
出部27に送られる特徴抽出部27は、前処理部25か
ら得られた入力画像から幾何学的な図形特徴を抽出する
ものであり、図4に示すように、線分抽出部27a、文
字候補矩形抽出部27b、及び罫線特徴抽出部27cに
よって構成されている。特徴抽出部27は、以下に示す
手順で幾何学的な図形特徴を抽出する。
【0044】まず、線分抽出部27aは、例えば、以下
に述べる手順に基づいて入力画像から線分を抽出する。
このとき線分抽出処理は、垂直方向と水平方向の2つの
方向に限定して実施されるようにしてもよい。具体的な
例として、垂直方向の線分を抽出する場合について説明
する。なお、水平方向の線分についても同様の手順によ
り抽出することができる。
【0045】Step1:文書画像を垂直方向に順次走
査し、各走査線において、予め定めた例えば3ドット以
上の長さを持つ連続する黒画素の連なりの集合(BL=
{bli |i=1,2,…,n})を抽出する。
【0046】Step2:BLの要素のうち、水平方向
に隣接しているものを統合してまとめることにより、さ
らに、その集合(BLG={blgj |j=1,2,…
M})を抽出する。
【0047】Step3:BLGの各要素に含まれるB
Lにおいて、垂直方向に最も長い黒画素の連なりblma
x を抽出し、その長さblmax のα(例えばα=0.
3)倍未満の長さを持つbli を削除する。
【0048】Step4:残ったbli を内接する矩形
を抽出し、その集合(RL={rlk |k=1,2,
…,P})を抽出する(このとき、rlk とそれを構成
するbli とを相互に関連づける)。rlk の左上端お
よび右下端のy座標値を検出し、それぞれrlk y1 、
rlk y2 とする。
【0049】Step5:RLの各要素を水平方向(左
から右への方向)に順次走査し、各走査線において最初
に出現するbli のx座標(xis)と最後に出現するb
liのx座標(xie)を保持する。
【0050】Step6:各rlk の各水平走査線にお
いて得られたxisの集まりと、eieの集まりの平均値r
lk x1 ,rlk x2 をそれぞれ計算する。
【0051】Step7:各rlk の左上端および右下
端の座標をそれぞれ(rlk x1 ,rlk y1 )、(r
lk x2 ,rlk y2 )に設定し、それを線分として抽
出する。
【0052】線分抽出部27aにより、入力画像から抽
出された線分の例を図5に示している。図5に示すよう
に、この段階では文字の部分において、文字を構成する
短い線分を検出している。これらを取り除くように以下
の処理を行なってもよい。すなわち、線分抽出部27a
による線分抽出処理に前後して、あるいは同時に黒連結
成分群に対して、文字候補矩形抽出部27bは、以下に
述べる手順により、文字とみなすことのできる黒連結成
分(以後、文字候補矩形と呼ぶ)を選出する。
【0053】Step1:各黒連結成分を内接する矩形
を抽出し、その縦幅chと横幅cwを求める。
【0054】Step2:chとcwの各値に対して出
現頻度を求め、最頻値を抽出する。最頻値を示すchを
入力文書中の文字の平均的な文字高さ(CH)、最頻値
を示すcwを入力文書中の文字の平均的な文字幅(C
W)とみなす。
【0055】Step3:(CW−th)≦cw≦(C
W+th)かつ(CH−th)≦ch≦(CH+th)
を満たす黒連結成分を文字候補矩形として抽出する。
【0056】文字候補矩形抽出部27bにより抽出され
た文字候補矩形の抽出結果例を図6(文字部を外枠矩形
で囲んだ例)に示している。
【0057】なお、文字候補矩形抽出処理を線分抽出処
理より先に行ない、得られた文字候補矩形以外の入力画
像上の部分に対して垂直方向と水平方向の両方向に、以
下に述べるフィルタリング処理を適用して、罫線がかす
れていたり、とぎれているような場合でも線分抽出処理
結果を安定させるようにしてもよい。
【0058】この場合、特徴抽出部27は、図7に示す
ように構成される。すなわち、文字候補矩形抽出部27
bの処理結果がフィルタリング処理部27dに出力され
フィルタリング処理が施される。そして、フィルタリン
グ処理の後に、線分抽出部27aによる線分抽出処理実
行される。
【0059】フィルタリング処理部27dによるフィル
タリング処理は、例えば、2値画像において水平(垂
直)方向の走査線上のある決まった長さ以内で連続する
白画素を全て黒画素に置き換えるという処理で実現され
る。これにより、かすれやとぎれのある罫線部分が補正
されるので、線分抽出処理結果が安定される。
【0060】罫線特徴抽出部27cは、線分抽出部27
aによって抽出された線分群において、図8に示すよう
な文字候補矩形に交差あるいは包含されている線分を除
去し、残った線分を罫線特徴として抽出する。
【0061】この時点では、各罫線特徴は、入力画像に
おける当該画像を囲む外接矩形の左上端と右下端の位置
座標、外接矩形の縦幅及び横幅などの種々の情報で表現
されるようにしてもよい。また、罫線特徴に「対応付い
た罫線特徴の識別番号」を用意しておいて、後段のモデ
ル照合部35で実施される照合処理において、対応付い
た相手の識別番号を格納するようにしてもよい。
【0062】得られた罫線特徴の集合は、さらに水平罫
線と垂直罫線の2種類に分類され、水平罫線特徴の集合
とその要素数、垂直罫線特徴の集合とその要素数が抽出
される。
【0063】入力画像に対する罫線特徴抽出結果の例を
図9に示す。ここで、入力画像から抽出された水平罫線
の集合(水平罫線特徴集合)と垂直罫線の集合(垂直罫
線特徴集合)の各要素に、 IHL=(ihl1 ,ihl2 ,ihl3 ,ihl4
ihl5 ,ihl6 ,ihl7 ), IVL=(ivl1 ,ivl2 ,ivl3 ,ivl4
ivl5 ,ivl6 ,ivl7 ,ivl8 ,ivl9 ) となるように識別番号を付与する。
【0064】また、水平罫線特徴集合の要素数をih-n
um、垂直罫線特徴集合の要素数をiv-numとし、水平罫
線特徴集合と垂直罫線特徴集合をまとめて入力罫線特徴
集合と呼ぶことにする。入力罫線特徴集合は、後段の特
徴構造化部29に送られる。以後の説明において上記記
号を用いることにする。
【0065】特徴構造化部29は、特徴抽出部27から
得られた入力罫線特徴集合から以下に述べる手順で罫線
に関する構造化特徴を抽出するもので、図10に示すよ
うに、罫線グループ化処理部29a、表特徴抽出部29
b、罫線接合部検出部29c、及び特徴間関係記述部2
9dによって構成されている。
【0066】まず、罫線グループ化処理部29aは、交
差・接続する罫線特徴を一まとめにグループ化する。罫
線グループ化処理アルゴリズムは例えば以下のようにな
る。このアルゴリズムは、交差・接続する罫線には同じ
ラベルを与えることにより罫線をグループ化するもので
ある。
【0067】Step1:ラベル番号を初期化する。
【0068】Step2:1本の垂直罫線を選択する。
【0069】Step3:ステップ2で選択された当該
垂直罫線に直交する全ての水平罫線を抽出する。
【0070】Step4:当該垂直罫線か当該水平罫線
のいずれかに既にラベルが付与されている場合には、そ
の中で最小値のラベルを当該罫線の全てに付与する。
【0071】Step5:当該垂直罫線と当該水平罫線
のいずれにもラベルが付与されていない場合には、それ
ら全てに新しいラベル番号を付与し、ラベル番号を更新
する。
【0072】Step6:Step2からStep5を
全ての垂直罫線に適用する。(Step2からStep
6までを手続きAとする) Step7:1本の水平罫線を選択する。
【0073】Step8:当該水平罫線に直交する全て
の垂直罫線を抽出する。
【0074】Step9:当該水平罫線か当該垂直罫線
のいずれかに既にラベルが付与されている場合にはその
中で最小値のラベルを当該罫線の全てに付与する。
【0075】Step10:当該垂直罫線と当該水平罫線
のいずれにもラベルが付与されていない場合には、それ
ら全てに新しいラベル番号を付与し、ラベル番号を更新
する。
【0076】Step11:Step7 からStep10を
全ての垂直罫線に対して適用する(Step7 からSt
ep11までを手続きBとする)。
【0077】Step12:手続きAと手続きBをラベル
番号の更新がなくなるまで繰り返す。
【0078】Step13:同じラベルが付与されている
罫線特徴をグループ化する。
【0079】例えば、図9に示す入力罫線特徴集合に対
して、前述のようなグループ化処理を適用すると以下に
示す2つのグループが得られる。
【0080】Group1:(ihl1 ,ihl2 ,ihl
3 ,ihl4 ,ihl5 ,ivl1,ivl2 ,ivl
3 ,ivl4 ,ivl5 ,ivl6 ), Group2:(ihl6 ,ihl7 ,ivl7 ,ivl8
,ivl9 ) 表特徴抽出部29bは、罫線グループ化処理部29aに
よって得られたグループごとに、グループに含まれる罫
線を内接する矩形(以後、表枠と呼ぶ)を抽出する。さ
らに、表特徴抽出部29bは、表特徴として、例えば左
上端の位置座標、右下端の位置座標、表の縦幅、表の横
幅、重心の位置座標、水平罫線数、当該表に含まれる水
平罫線の集合、垂直罫線数、当該表に含まれる垂直罫線
の集合、当該表に含まれる接合部数、他の表に内接され
ているか否かの情報などを抽出する。この時、水平(垂
直)罫線特徴は、その左上端のy(x)座標値の昇順に
ソートされていてもよい。
【0081】ここで接合部数については、後段の罫線接
合部検出部29cで抽出され、表特徴として格納され
る。例えば、Group1からは、図11に示すように以下
の表特徴it1 が得られる。また、Group2から得られ
る表特徴をit2 とする。
【0082】 表特徴:it1 左上端の位置座標 (it1 x1 ,it1 y1 ) 右下端の位置座標 (it1 x2 ,it1 y2 ) 表の縦幅 it1 height 表の横幅 it1 width 重心の位置座標 (it1 cx,it1 cy) 水平罫線数 ihl1 num 当該表に含まれる水平罫線の集合 IHL1 垂直罫線数 ivl1 num 当該表に含まれる垂直罫線の集合 IVL1 当該表に含まれる接合部数 i1 junc-num 他の表に内接されているか否かの情報 nest flag it1 height=it1 y2 −it1 y1 +1, it1 width =it1 x2 −it1 x1 +1, it1 cx=(it1 x1 +it1 x2 )/2, it1 cy=(it1 y1 +it1 y2 )/2, ihl1 num =5, IHL1 =(ihl1 ,ihl2 ,ihl3 ,ih
4 ,ihl5 ), ivl1 num =6, IVL1 =(ivl1 ,ivl2 ,ivl3 ,iv
4 ,ivl5 ,ivl6), nest flag =0(すなわち他の表に含まれていない) 1枚の入力帳票に複数の表が含まれていることを考慮し
て、さらにページ特徴を抽出、管理する。ページ特徴
は、例えば、表数、表特徴の集合、水平罫線数、垂直罫
線数、及び接合部数によって定義される。
【0083】例えば、図9の入力罫線集合からは、ペー
ジ特徴:IPとして、 表数=2、 表特徴の集合IT=(it1 ,it2 )、 水平罫線数ihl-num=7、垂直罫線数ivl-num=
9、接合部数ijunc-num=28、が得られる。
【0084】次に、罫線接合部検出部29cは、各表に
おいて、そこに含まれる水平罫線と垂直罫線の交差部分
・接続部分(以後、接合部と呼ぶ)を求め、さらに各表
特徴で接合部の個数を管理する。罫線接合部検出部29
cの動作手順は例えば次のようになる。
【0085】Step1:一本の水平罫線を選択する。
【0086】Step2:着目した水平罫線に交差・接
続する全ての垂直罫線を抽出する。
【0087】Step3:当該水平罫線と当該垂直罫線
の交点を求め、水平罫線ごとにその座標値を管理する。
各水平罫線では接合部特徴はx座標値の昇順にソートし
ておく。
【0088】Step4:Step1 からStep3 ま
でを全ての水平罫線に対して実施する。
【0089】Step5:一本の垂直罫線を選択する。
【0090】Step6:着目した垂直罫線に交差・接
続する全ての水平罫線を抽出する。
【0091】Step7:当該垂直罫線と当該水平罫線
の交点を求め、垂直罫線ごとにその座標値を管理する。
各垂直罫線では接合部特徴はy座標値の昇順にソートし
ておく。
【0092】Step8:Step5からStep7ま
でを全ての垂直罫線に対して実施する。
【0093】例えば、表特徴it1 では、水平罫線集合
IHL1 と、垂直罫線集合IVL2から、図12に示す
接合部が得られ、その接合部数「22」を表特徴に加え
る(i1 junc-num=22とする)。
【0094】特徴間関係記述部29dは、以上の処理結
果より得られた情報を、例えば図13のように関係づけ
て管理する。この結果、ページ特徴から表特徴、罫線特
徴、接合特徴と階層的に関連づけられて管理され、特徴
に関する情報を効率的に検索できるようになる。
【0095】以後、これらの特徴を総称して構造化特徴
と呼ぶ。また、入力文書から抽出された構造化特徴を入
力構造化特徴、モデル文書から抽出された構造化特徴を
モデル構造化特徴と呼ぶ。
【0096】一方、処理対象文書に対する処理とは別
に、モデル登録部31は、オペレータによって提示され
た処理対象文書の種類ごとの一例であるサンプル文書を
もとに、オペレータとの間の対話的入力作業によりモデ
ルの登録を行なう。ここでは、モデル登録作業時のモデ
ル登録部31の動作の一例について説明する。
【0097】まず、画像入力部21を介して登録対象の
サンプル文書を入力し、2値化処理部23、前処理部2
5を経て文書画像(以後、モデル画像と呼ぶ)を取得す
る。次いで、特徴抽出部27においてモデル画像から罫
線特徴を抽出する。
【0098】モデル登録部31は、特徴抽出部27にお
ける抽出結果に対して特徴抽出処理の誤りを推定し、そ
れを修正する旨のメッセージを、表示部31aのディス
プレイの画面上に表示して、修正作業をオペレータに指
示する。
【0099】特徴抽出処理の誤りの推定方式は、例え
ば、端点が接合部となっていない罫線を見つけて、その
罫線が正しく抽出されていないとみなすことにより実現
できる。モデル登録部31は、表示部31aに表示され
た指示に従いオペレータによって画面上で修正された罫
線特徴を入力部31bを介して入力する。
【0100】修正作業が完了すると、修正された罫線特
徴は特徴構造化部29に送られ、構造化特徴が抽出され
る。この構造化特徴は、未知入力文書を処理する際に、
フォーマット種別同定部33、モデル照合部35、未対
応・矛盾対応発見修正部39、照合結果判定部37など
で用いられる。
【0101】抽出・修正された罫線特徴は、画面上にモ
デル画像と重ねて表示される。オペレータは、書式構造
情報登録部31が画面上に出力するメッセージに従いな
がら、モデル文書に対応付くべき入力文書画像を処理す
るために必要な知識を構築していく。
【0102】この結果、モデルとして構造化特徴の情
報、文字認識対象領域の指定に関する情報、文字認識対
象領域の文字列方向の情報、文字読み取り処理時に拘束
条件として働く文字種情報、筆記形態情報、文字認識後
処理のための項目属性情報、文字認識結果の対応関係な
どの情報が知識ベース31cに格納される。
【0103】このうち構造化特徴は、正立した画像に対
して作られている。そこで、モデル登録部31は、知識
ベース31cへの登録時に、左に90度回転したものと
右に90度回転したものと180度回転したものをそれ
ぞれ発生させ、さらに何度回転されているかを示す情報
を付加するようにしてもよい。
【0104】これら4方向の構造化特徴と入力構造化特
徴は、後段のモデル照合部35において、それぞれの方
向の特徴と入力画像とを照合させることにより、入力文
書の文書方向が未知であっても、モデルマッチングで最
良マッチングした構造化特徴に付与されている回転角度
を知ることができる。従って、その角度を0度にする方
向に入力画像を回転させれば、必ず正立した入力画像を
得ることができる。
【0105】モデル登録部31は、以上の処理を全ての
モデル文書に対して行なう。ここでは、一例として図1
4と図15に示す2種類の構造化特徴がモデルとして登
録されたものとする(以後、図14をモデル1、図15
をモデル2と呼ぶ)。
【0106】フォーマット種別同定部33は、モデル登
録部31によって予め登録されているモデルから、入力
文書に対応するもの(あるいは対応する可能性のあるも
の)を選出する。
【0107】ここでは、入力文書の構造化特徴と登録さ
れている全てのモデルの構造化特徴との間で類似度計算
を行ない、最も類似度の高いモデルあるいは、ある一定
の値以上の類似度を有するモデルの構造化特徴を後段の
モデル照合部35に送り込む。
【0108】類似度計算に用いる特徴としては、例えば
文書中に含まれる、特徴構造化29によって抽出された
接合部数を用いる。接合部数という特徴は、未知入力文
書が寸法の拡大・縮小、さらには各表が独立してスケー
ル変換されている場合にも、影響を受けない特徴である
ので書式構造種別同定のための類似度計算に適してい
る。
【0109】この他に、文書中に含まれる水平罫線特徴
数や垂直罫線特徴数、表特徴数なども類似度計算のため
の特徴として有効である。ここでモデル文書は適宜に順
序づけがなされているとする。
【0110】また、類似度は以下のようにして求まる。
ここで、モデルの総数:model-num、入力文書中の接合
部数:ijn、k番目のモデル文書中の接合部数:mj
k(ただし1≦k≦model-num )、入力文書とk番目
のモデル文書との類似度:simk (ただし− 100≦s
imk ≦ 100)とすると、類似度は例えば、 ijn>0またはmjnk >0のとき simk = 100− 200×|ijn−mjnk |/(ij
n+mjnk ) ijn=0かつmjnk =0のとき simk =−100 により求まる。
【0111】得られた類似度のうち類似度が最大である
もの、あるいは予め設定されたしきい値th5 以上のもの
を候補のモデルとして入力文書の構造化特徴とともにモ
デル照合部35に送る。このとき、全てのモデルにおい
て類似度がしきい値th5 未満である場合、以後の処理を
中断して、入力文書を棄却してもよいし、また、全ての
モデルの構造化特徴をモデル照合部に送り込むようにし
てもよい。
【0112】例えば、登録されているモデル文書が図1
4と図15の2種類である場合、入力文書とそれら2つ
のモデル文書との類似度計算は以下のようになる。ここ
で入力文書の接合部数:ijn=28、モデル1の接合部
数:mjn1 =31、モデル2の接合部数:mjn2 =26
とし、入力文書とモデル1との類似度をsim1 、入力
文書とモデル2との類似度をsim2 、しきい値:th5
=80とする。
【0113】 sim1 = 100− 200×|28−31|/(28+31) =89.83 sim2 = 100− 200×|28−26|/(28+26) =92.59 以上の計算結果からsim1 とsim2 が共にしきい値
th5 を越えているので、双方とも入力文書に対応付く可
能性のあるモデルとしてそれらの構造化特徴を後段のモ
デル照合部35に送る。
【0114】モデル照合部35は、入力文書から抽出さ
れた構造化特徴(以後、入力構造化特徴と呼ぶ)と、書
式構造種別同定部で選出された一つあるいは複数個のモ
デル文書の構造化特徴(以後、モデル構造化特徴と呼
ぶ)を受け取り、それらの間で以下に述べる照合処理を
行ない、照合度を計算する。
【0115】照合処理は、当該入力構造化特徴と当該モ
デル構造化特徴との間の対応付け処理のことであり、照
合度はその対応付きの程度を表す尺度である。ここで
は、最も高い照合度を示すモデル文書が入力文書に対応
するものであるとし、入力構造化特徴とそのモデル構造
化特徴との間の対応関係に関する情報を、後段の照合結
果判定部に送り込む。最大照合度を示すモデル文書と入
力文書との間の対応関係が獲得されているか否かの最終
的な判断は照合結果判定部で行なわれる。
【0116】特徴構造化部29で得られた構造化特徴
は、図13に示すように、ページ特徴から表特徴へ、さ
らに表特徴から罫線特徴へと全体−部分という階層的な
関係が抽出されて構造化されている。この特質を用いる
場合、照合処理は階層的に実施される。これに対応し
て、モデル照合部35は、さらに図16に示すように、
選択部35a、表照合部35b、罫線照合部35c、照
合度計算部35d、及び照合結果出力部35eによって
構成される。
【0117】まず、選択部35aは、複数個のモデルの
構造化特徴から一つのモデルの構造化特徴を選択し、入
力文書の構造化特徴とともに表照合部35bに送る。
【0118】次いで、表照合部35bは、入力文書の表
特徴の集合(以後、入力表特徴集合と呼ぶ)とモデル文
書の表特徴の集合(以後、モデル表特徴集合と呼ぶ)と
の間で対応付けを行なう。
【0119】表間対応がとれた場合には、さらに罫線照
合部35cは、入力文書の当該表の内部に含まれる罫線
特徴(以後、入力罫線特徴と呼ぶ)とモデル文書の当該
表の内部に含まれる罫線特徴(以後、モデル罫線特徴と
呼ぶ)との間で対応付けを行なう。
【0120】罫線間の対応がとれた場合には、照合度計
算部35dは、(入力文書と当該モデル文書との間の)
照合度を計算する。ここで、表間対応と罫線間対応のど
ちらも得られなかった場合には、照合度に最低値(−10
0 )を代入する。
【0121】照合結果出力部35eは、それまでに計算
されている最も高い照合度を示すモデル文書と入力文書
の組を選び、その構造化特徴間の対応関係に関する情報
を後段の照合結果判定部37に出力する。
【0122】以下では、フォーマット種別同定部33か
ら図14と図15の2種類のモデルと入力文書の構造化
特徴がそれぞれ送られてきた場合のモデル照合部35の
処理動作例について説明する。
【0123】2種類のモデルのうち、選択部35aによ
ってモデル1が選ばれ、入力文書とともにそれぞれの構
造化特徴が表照合部35bに送り込まれたとする。ここ
で、入力文書の表特徴数をit-num=2とし、表特徴集
合をITとすると、IT=(it1 ,it2 )(図9参
照)モデル1の表特徴数をmt1-num =2とし、表特徴
集合をMT1とすると、MT1=(mt11 ,mt
2 )(図14参照)とする。
【0124】表照合部35bは、さらに図17に示すよ
うに、対応可能ペア検出部35b−1、異種対応可能ペ
ア間両立関係判定部35b−2、及び最良マッチング抽
出部35b−3によって構成されており、次のように動
作する。
【0125】まず、対応可能ペア検出部35b−1は、
選択部35aで選択されたモデルの表特徴集合の各要素
に対して、それと対応付く可能性のある入力の表特徴を
すべて検出し、対応可能ペアとして管理する。すなわ
ち、 Step1:任意のMTから任意の一つの表特徴mtk
(着目モデルの表特徴集合のうちk番目の表特徴)を選
ぶ。
【0126】Step2:表特徴mtk の接合部数とI
Tの各表特徴の接合部数との間で類似度を計算をする。
【0127】Step3:例えばmtk とitj (入力
表特徴集合のj番目の表特徴)の類似度simkjが、あ
らかじめ設定したしきい値th6 以上である場合には、対
応可能であるとして、その組(mtk ,itj )を対応
可能ペアとして保持する。
【0128】Step4:Step3を表特徴集合IT
のすべての要素に対して適用する。
【0129】Step5:Step1〜Step4まで
を着目MTのすべての要素に対して適用する。
【0130】ここで、itj の接合部数をijnj 、m
k の接合部数をmjnk とすると、類似度は、例えば
次の式で求まるとする。
【0131】ijnj >0またはmjnj >0のとき、 simkj= 100− 200×|ijnj −mjnk |/(i
jnj +mjnk ) ijnj =0かつmjnk =0のとき、 simkj=−100 上記動作をITとMT1を例として具体的に説明すると
以下のようになる。th6 =75、it1 の接合部数=22、
it2 の接合部数=6、mt11 の接合部数=25、mt
2 の接合部数=6とすると式から、 mt11 とit1 の間の類似度:sim111=86.67 と
なり、sim111>th6 であるから、対応可能であると
して、その組(mt11 ,it1 )を対応可能ペアとし
て保持する。
【0132】mt11 とit2 の間の類似度:sim1
12=−22.58 となり、sim112<th6 であるから、対
応不可能であるとする。
【0133】mt12 とit1 の間の類似度:sim1
21=−14.28 となり、sim121<th6 であるから、対
応可能であるとする。
【0134】mt12 とit2 の間の類似度:sim1
22= 100となり、sim122>th6であるから、その組
(mt12 ,it2 )を対応可能ペアとして保持する。
【0135】以上の結果、対応可能ペアとして、ITと
MT1との間では、p1=(mt11,it1 )とp2=
(mt12 ,it2 )が検出された。
【0136】次に、異種対応可能ペア間両立関係判定部
35b−2は、当該モデル文書と入力文書の間で、対応
可能ペア検出部35b−1で検出された2つの異なる対
応可能ペアが両立するものであるか否かを判定する。
【0137】ここでいう「両立する」ということは、2
つの対応可能ペアが同時に存在することに矛盾が無いこ
とを意味する。ここでの判定条件としては以下のものが
上げられる。判定対象となる対応可能ペアをそれぞれ
(mtk ,itj )、(mt′k ,it′j )とする。
ここで、mtk の左上端の位置座標を(mtk x1 ,m
k y1 )、右下端の位置座標を(mtk x2 ,mtk
y2 )、mt′k の左上端の位置座標を(mt′k x1
,mt′k y1 )、右下端の位置座標を(mt′k x2
,mt′k y2 )、itj の左上端の位置座標を(i
j x1 ,itj y1 )、右下端の位置座標を(itj
x2 ,itj y2 )、it′j の左上端の位置座標を
(it′j x1 ,it′j y1 )、右下端の位置座標を
(it′j x2 ,it′j y2 )とする。
【0138】また、文書画像の座標系(x,y):0<
x≦WIDTH,0<y≦HEIGHTにおいて、図1
8に示すような座標系を定義する。すなわち、図18
(a)中に示す矩形領域T:(左上端の位置座標を(t
x1 ,ty1 )、右下端の位置座標を(tx2 ,ty2
)とする)に対して、図18(b)に示す0<x<t
x1 かつ0<y≦HEIGHTを満たす領域を領域1、
図18(c)に示すtx2<x≦WIDTHかつ0<y
≦HEIGHTを満たす領域を領域2、図18(d)に
示す0<x≦WIDTHかつ0<y<ty1 を満たす領
域を領域3、図18(e)に示す0<x≦WIDTHか
つty2 <y≦HEIGHTを満たす領域を領域4と定
義する。
【0139】また、判定条件として、以下の条件1から
条件3までのすべての条件を満たさない場合のみ、2つ
の対応可能ペアが両立可能であると見なす。
【0140】条件1:mtk =mt′k 、 条件2:itj =it′j 、 条件3:配置関係に逆転があること。条件3は、以下の
条件3−1〜3−4の条件を満たす場合である。すなわ
ち、 条件3−1:itj (it′j )に対して、it′
j (itj )が領域1にあり、mtk (mt′k )に対
して、mt′k (mtk )が領域2にある。
【0141】条件3−2:itj (it′j )に対し
て、it′j (itj )が領域2にあり、mtk (m
t′k )に対して、mt′k (mtk )が領域1にあ
る。
【0142】条件3−3:itj (it′j )に対し
て、it′j (itj )が領域3にあり、mtk (m
t′k )に対して、mt′k (mtk )が領域4にあ
る。
【0143】条件3−4:itj (it′j )に対し
て、it′j (itj )が領域4にあり、mtk (m
t′k )に対して、mt′k (mtk )が領域3にあ
る。
【0144】異種対応可能ペア間両立関係判定部35b
−2の動作を、前述した対応可能ペアp1とp2を用いて具
体的に説明する。ITとMT1の間における2つの異な
る対応可能ペアの組として(p1,p2)がある。このペア
は条件1から条件3までのすべてを満たさないので両立
可能であると判断される。異種対応可能ペア間両立関係
判定部35b−2は、両立可能と判断された対応可能ペ
アを、最良マッチング抽出部35b−3に出力する。
【0145】最良マッチング抽出部35b−3は、異種
対応可能ペア間両立関係判定部35b−2において両立
すると判定された対応可能ペアのうち、すべてが互いに
両立可能な対応可能ペアの最大の集合を求めることによ
り、入力表特徴集合とモデル表特徴集合間の最良マッチ
ングを抽出する。
【0146】最良マッチング抽出部35b−3は、さら
に図19に示すように、連合グラフ作成部35b−3a
と最大クリーク抽出部35b−3bにより構成されてい
る。連合グラフ作成部35b−3aは、異種対応可能ペ
ア間両立関係判定部35b−2の判定結果を受け取り、
その情報をもとに連合グラフを作成する。この連合グラ
フの節点は対応可能ペアを示し、節点間を結ぶ弧は2つ
の対応可能ペアが両立可能であることを示すものであ
り、異種対応可能ペア間両立関係判定部35b−2の判
定結果を表す補助的なデータ構造である。
【0147】具体的には、対応可能ペアp1とp2が連合グ
ラフ作成部35b−3aに送られ、この結果、図20に
示す連合グラフが得られる。上述した「すべてが互いに
両立可能な対応可能ペアの最大の集合」はこの連合グラ
フにおいては全体的に連結した(完全に互いに両立可能
な)最大の節点集合であると捉えることができる。それ
はクリークであり、本実施例ではより大きなクリークは
より良いマッチングを表している。
【0148】最大クリーク検出部35b−3bは、連合
グラフ作成部35b−3aによって作成された連合グラ
フから、節点数が最大である完全連結部分グラフ(最大
クリーク)を抽出する。なお、最大クリーク検出部35
b−3bの動作は、例えば文献「信学論(D),J68-
D,3,pp221-228,1985」に記載されている方式を適用す
ることができる。
【0149】最大クリーク検出部35b−3bによって
抽出されたクリーク、すなわち、「すべてが互いに両立
可能な対応可能ペアの最大の集合」を構成する要素の対
応可能ペアは、入力文書の表特徴集合ITと当該モデル
文書の表特徴集合MT1との間で対応の取れた表の組を
表す。具体的には、最大クリーク:mclique =p1,p2が
得られ、mt11 とit1 、mt12 とit2 の対応が
それぞれ得らたことになる。この対応結果は、後段の罫
線照合部35cに送られる。
【0150】このとき、入力文書とモデル文書の表特徴
集合の各表では、その内部に含まれる罫線特徴の座標値
は、表の左上端の座標値で正規化されている。また、入
力文書の各表の罫線特徴の座標値は、対応付くモデル文
書の表に重ね合わせられるようにスケール変換されてい
る。
【0151】すなわち、入力表の縦幅がit-height 、
横幅がit-width、対応付いたモデル表の縦幅がmt-h
eight 、横幅がmt-widthであるとき、当該入力表の正
規化された罫線特徴の座標値は、さらに、x座標値では
(mt-width/it-width)倍、y座標値では(mt-h
eight /it-height )倍されることによりスケール変
換される。この結果、後段の罫線照合部35cでは同じ
スケールかつ同じ座標系のもとで入力表とモデル表に含
まれる罫線集合間の対応付け処理が可能になる。
【0152】前述した対応可能ペア検出部35b−1の
動作を示すStep3において、simkj<th6 である
場合には、mtk とitj の構造が異なっている他に、
例えば図21(a)に示すように、入力文書の印刷品質
が悪いために表が分離している場合(図中(a−1))
や、隣接する表の間隔が狭いために画像入力時に接触し
てしまったりする場合(図中(b−1))も考えられ
る。
【0153】このような問題点に対応するために対応可
能ペア検出部35b−1は、さらに以下の処理を実施す
るようにしてもよい。
【0154】Step3−1:mjnk >ijnj (m
jnk <ijnj )である場合には、IT(MT1)の
中から以下の条件を満たすitj (mtk )に隣接する
表特徴itl (mtl )を1つ検出し、それらを統合し
て仮想的な表特徴it′j を新たに生成し、その際に生
じる接合部数ijn′j (mjn′k )とmjnk (i
jnj )との類似度siml′kjを計算する。
【0155】類似度:siml′kjがしきい値th6 以上
である場合には、対応可能であるとして、(mtk ,i
t′j )((mt′k ,itj ))を対応可能ペアとし
て保持する。
【0156】条件:itj (mtk )とitl (m
l )の間に他の表が存在しないこと。
【0157】Step3−2:Step3−1で求めた
siml′kjがしきい値th6 に満たない場合、類似度:
siml′kjがしきい値th6 以上となるまで、あるいは
条件を満たす統合すべき表が見つからなくなるまでSt
ep3−1を繰り返す。
【0158】この場合、表照合部35bの最良マッチン
グ部35b−3では、最大クリークを構成する「対応付
き」のすべての組み合わせを出力するようにして、その
後に次の条件を適用することにより候補を絞り込む。そ
れでもなお複数の組み合わせが生じている場合には、そ
れらすべてを後段の罫線照合部35cに送り込み、その
結果に基づいて(それらの中で照合度が最も高くなる組
み合わせを選ぶことにより)最終的に表間対応関係を一
意に決めるようにしてもよい。
【0159】条件:モデル表特徴集合のすべての要素が
入力表特徴集合のいずれかの要素に対応していること。
【0160】次に、罫線照合部35cでは、表照合部3
5bで対応付いた入力表とモデル表にそれぞれ含まれる
罫線集合間で対応付け処理を行なう。このとき水平罫線
集合間の対応付けと垂直罫線集合間の対応付けを独立に
行なうようにしてもよい。そして両者の整合を、各々の
対応付け処理が済んだあとで得るようにしてもよい。こ
の場合の罫線照合部35cは、さらに図22に示すよう
に構成される。すなわち、表対応選択部35c−1、垂
直罫線照合部35c−2、水平罫線照合部35c−3、
及び方向間整合獲得部35c−4によって構成されてい
る。
【0161】まず、表対応選択部35c−1は、表照合
部35bで抽出された表間対応付きの中から任意の対応
を選択する。垂直罫線照合部35c−2は、表対応選択
部35c−1によって選択された入力表とモデル表の垂
直罫線集合間で対応付けを行なう。この対応付けに成功
すれば、さらに水平罫線照合部35c−3は、水平罫線
集合間で対応付けを行なう。方向間整合獲得部35c−
3は、垂直罫線照合部35c−2による対応付けと水平
罫線照合部35c−3による対応付けとの間の整合を獲
得する。
【0162】なお、垂直罫線照合部35c−2と水平罫
線照合部35c−2は、さらに図23に示すように構成
されている。これらの処理動作は、罫線方向の違いを考
慮する以外は、基本的に同じである。
【0163】以下に、具体的な説明として、垂直罫線照
合部35c−2における、mt11の垂直罫線集合M1
VL1 とit1 の垂直罫線集合IVL1 の間の対応付け
処理の動作について説明する。ただし、図14より、 M1 VL1 =(m1 vl1 ,m1 vl2 ,m1 vl3
1 vl4 ,m1 vl5 ,m1 vl6 ,m1 vl7 ,m
1 vl8 )とする。以後、垂直罫線を単に罫線と略して
説明する。
【0164】図23中に示す対応可能罫線特徴ペア検出
部35c−2aは、モデルの罫線集合の各要素に対し
て、要素と対応付く可能性のある入力の罫線特徴をすべ
て検出し、対応可能な罫線特徴のペアとして管理する。
すなわち、以下に説明する手順を実行する。
【0165】Step1:任意のM1 VL1 から任意の
一つの罫線特徴m1 vlk (k番目の罫線特徴を意味す
る)を選ぶ。
【0166】Step2:m1 vlk に対応付く入力罫
線特徴を検出するための探索範囲(areamvl )を設
定する。
【0167】ここで、m1 vlk の罫線特徴の左上端と
右下端の位置座標を(mlx1 ,mly1 )、(mlx
2 ,mly2 )とすると、探索範囲は例えば(mlx1
−th9 ,mly1 )と(mlx2 +th9 ,mly2 )の
座標値で構成される矩形の内部としてもよい。ここで、
しきい値th9 が予め与えられているものとする。
【0168】Step3:Step2で求められた探索
範囲に内包・交差する入力罫線特徴を抽出する。
【0169】この処理は例えば以下のようにして行なわ
れる。すなわち、探索対象となる入力罫線の左上端と右
下端の位置座標値を(ix1 ,iy1 )、(ix2 ,i
y2)とした場合、以下の条件を満たす入力罫線を抽出
する。
【0170】条件:min(mlx2 +th9 ,ix2 )
−max(mlx1 +th9 ,ix1)+1>0でかつm
in(mly2 ,iy2 )−max(mly1 ,iy1
)+1>0である。
【0171】Step4:抽出された入力罫線特徴の一
つを選ぶ(例えば、ivlj (入力罫線特徴集合のj番
目の罫線特徴)を選んだものとする)。
【0172】Step5:m1 vlk の縦幅:ml-hei
ght とivlj の縦幅:il-height との類似度:si
mlkjを計算する。
【0173】ここで、類似度:simlkjは例えば次の
式で求まるとする。
【0174】 ml-height >0またはil-height >0のとき simlkj= 100− 200×|ml-height −il-heigh
t |/(ml-height+il-height ) ml-height =0かつil-height =0のとき simlkj=−100 Step6:類似度:simlkjがあらかじめ設定した
しきい値th10以上である場合には、対応可能であるとし
て、その組(m1 vlk ,ivlj )を対応可能ペアと
して保持する。
【0175】Step7:類似度:simlkjがしきい
値th10未満である場合には、さらに以下の処理を行な
う。
【0176】Step7−1:図24に示すように、1
本であるべき線がかすれたり、途切れたりしているため
に分離している場合に対応するために以下の処理を行な
う。
【0177】Step7−1−1:Step3で抽出さ
れた入力罫線特徴のうち、以下の条件を満たす罫線特徴
のうち最も近接するものを1つ抽出し、それらを図25
に示すように統合した際に生じる縦幅:il-height′と
ml-height との類似度:siml′kjを計算する。た
だし、ivlj の左上端と右下端の位置座標値を、(i
vlj x1 ,ivlj y1 )、(ivlj x2 ,ivl
j y2 )、抽出対象となる入力罫線の左上端と右下端の
位置座標値を(ix1,iy1)、(ix2,iy2)
とする。
【0178】条件:min(ivlj x2 ,ix2 )−
max(ivlj x1 ,ix1 )+1>0、類似度:s
iml′kjがしきい値th10以上である場合には、対応可
能であるとして、その組(m1 vlk ,ivl′j )を
対応可能ペアとして保持する。
【0179】Step7−1−2:Step7−1−1
で求めたsiml′kj<th10である場合、類似度:si
ml′kjがしきい値th10以上となるまで、あるいは条件
を満たす統合すべき罫線が見つからなくなるまでSte
p7−1−1を繰り返す。
【0180】Step7−2:図26に示すようにモデ
ルの複数本の罫線特徴と入力の複数本の罫線特徴とが対
応付くような場合に対応するために以下の処理を行な
う。
【0181】Step7−2−1:ml-height >il
-height (ml-height <il-height )である場合に
は、IVL1 (M1 VL1 )の中から以下の条件を満た
すivlj (m1 vlk )に最も近接する罫線特徴iv
l′j (m1 vl′k )を1つ検出し、それらを統合し
た際に生じる縦幅il-height ′(ml-height ′)と
ml-height(il-height)との類似度:siml′kj
計算する。
【0182】ただし、ivlj の左上端と右下端の位置
座標値を、(ivlj x1′,ivlj y1′)、(i
vlj x2′,ivlj y2′)、予め設定されたしき
い値をth11とする。
【0183】条件:min(ivlj x2+th11,iv
j x2′)−max(ivlj x1−th11,ivlj
x1′)+1>0 類似度:siml′kjがしきい値th10以上である場合に
は、対応可能であるとして、(m1 vlk ,ivlj
と(m1 vlk ,ivl′j )((m1 vlk,ivl
j )と(m1 vl′k ,ivlj ))を対応可能ペアとし
て保持する。
【0184】Step7−2−2:Step7−2−1
で求めたsiml′kj<th10である場合、類似度:si
ml′kjがしきい値th10以上となるまで、あるいは条件
を満たす統合すべき罫線が見つからなくなるまでSte
p7−2−1を繰り返す。
【0185】Step8:Step4〜Step7まで
をStep3で抽出されたすべての入力罫線特徴に対し
て適用する。
【0186】Step9:Step1〜Step8まで
を着目M1 VL1 のすべての要素に対して適用する。
【0187】ここで、min()は()内の2変数の
内、小さい方を出力する関数であり、max()は()
内の2変数の内、大きい方を出力する関数である。
【0188】対応可能罫線特徴ペア検出部35c−2a
の前述した処理動作を、M1 VL1とIVL1 を用いて
具体的に説明する。対応可能罫線特徴ペア検出部35c
−2aにおいて、M1 VL1 の各要素で探索範囲を設け
て、それぞれ対応付く可能性を持つIVL1 の要素を抽
出した結果、以下のような罫線特徴ペアが得られたもの
とする。
【0189】pl1 =(m1 vl1 ,ivl1 )、 pl2 =(m1 vl2 ,ivl2 )、 pl3 =(m1 vl3 ,ivl3 )、 pl4 =(m1 vl4 ,ivl2 )、 pl5 =(m1 vl4 ,ivl4 )、 pl6 =(m1 vl5 ,ivl4 )、 pl7 =(m1 vl6 ,ivl4 )、 pl8 =(m1 vl7 ,ivl5 )、 pl9 =(m1 vl8 ,ivl6 )。
【0190】このうち、pl1 、pl2 、pl3 、pl
4 、pl8 、pl9 は、Step2からStep6まで
の処理(以後、Step2からStep6までの処理で
得られた対応可能特徴ペアのみを1対1対応可能ペアと
呼ぶ)で得られる。
【0191】pl5 は、Step2からStep6まで
の処理で類似度:siml44がしきい値th10未満であっ
たために、Step7−2−1によりivl4 と「m1
vl4 とm1 vl5 を統合したもの」のペアを検出し
た。そして、そのペアをpl5とpl6 の対応可能なペ
アに分けて管理している。pl7 についても同様にSt
ep7−2−1でivl4 と「m1 vl4 とm1 vl6
を統合したもの」のペアを検出していることにより対応
可能なペアとして抽出されている。
【0192】対応可能罫線特徴ペア検出部35c−2a
における処理動作のStep2における探索範囲の設定
は、例えば以下に述べる手順で行なわれてもよい。例え
ば、図27に示すモデル垂直罫線VL1 の探索範囲は、
モデル垂直罫線VL1 に左側で隣接するモデル垂直罫線
VL2 と、右側で隣接するモデル垂直罫線VL3 との距
離に応じて設定するようにしてもよい。
【0193】すなわち、VL1 の左上端の位置座標値を
(VL1 x1 ,VL1 y1 )、右下端の位置座標値を
(VL1 x2 ,VL1 y2 )、VL2 の左上端の位置座
標値を(VL2 x1 ,VL2 y1 )、右下端の位置座標
値を(VL2 x2 ,VL2 y2)、VL3 の左上端の位
置座標値を(VL3 x1 ,VL3 y1 )、右下端の位置
座標値を(VL3 x2 ,VL3 y2 )とすると、VL1
とVL2 の間の距離:dist12と、VL1 とVL3
間の距離:dist13はそれぞれ、 dist12=VL1 x1 −VL2 x2 +1、 dist13=VL3 x1 −VL1 x2 +1、より求まる
こととする。
【0194】そして探索範囲を、((VL1 x1 −dis
t12/2),(VL1 y1 +th9))と、((VL1 x2 +
dist13/2),(VL1 y2 +th9))、の位置座標
値で構成される矩形領域としてもよい。
【0195】ここで、VL1 とその左側で隣接するモデ
ル垂直罫線VL2 は、min(VL1 y2 ,VL2 y2 )−
max(VL1 y1 ,VL2 y1 )+1>th13を満たす、距
離dist12が最小であるモデル垂直罫線を検出するこ
とにより求めることができ、右側で隣接するモデル垂直
罫線VL3 は、min(VL1 y2 ,VL3 y2 )−max(V
1 y1 ,VL3 y1 )+1>th13を満たす、距離di
st13が最小であるモデル垂直罫線を検出することによ
り求めることができる。ここでth13をしきい値とする。
各モデル水平罫線の探索範囲も同様に求めることができ
る。
【0196】この他にも、Step2における探索範囲
を次のようにして設定してもよい。例えばk番目のモデ
ル罫線に着目したとき、探索対象となっている入力罫線
のうちk±α以内の番号を有するものを着目モデル罫線
の探索範囲とするようにしてもよい。また、ある大きさ
のパラメータでスケール変換がなされた状態で、着目モ
デル罫線と同じ長さを持つ全ての入力罫線を探索範囲と
しても良い。
【0197】次に、対応可能罫線特徴ペア間両立性判定
部35c−2bは、対応可能罫線特徴ペア検出部35c
−2aで検出されたすべての2つの異なる対応可能ペア
の組み合わせにおいて、それらが両立するものであるか
否かを判定する。
【0198】ここでの判定条件としては以下のものが上
げられる。判定対象となる対応可能ペアをそれぞれp=
(mlk ,ilj )、p′=(ml′k ,il′j )と
する。
【0199】ここで、mlk の左上端の位置座標を(m
k x1 ,mlk y1 )、右下端の位置座標を(mlk
x2 ,mlk y2 )、ml′k の左上端の位置座標を
(ml′k x1 ,ml′k y1 )、右下端の位置座標を
(ml′k x2 ,ml′k y2)、ilj の左上端の位
置座標を(ilj x1 ,ilj y1 )、右下端の位置座
標を(ilj x2 ,ilj y2 )、il′j の左上端の
位置座標を(il′j x1 ,il′j y1 )、右下端の
位置座標を(il′j x2 ,il′j y2 )とする。
【0200】判定条件は、条件1から条件4までのすべ
ての条件を満たさない場合のみ2つの対応可能ペアが両
立可能であるとみなす。
【0201】条件1:pとp′のどちらかが1対1対応
可能ペアでり、かつmlk =ml′k である。
【0202】条件2:pとp′のどちらかが1対1対応
可能ペアでり、かつilj =il′j である。
【0203】条件3:pとp′のどちらも1対1対応可
能ペアでり、かつ以下の条件3−1,3−2のどちらか
を満たす。
【0204】条件3−1:(min(mlk x2 ,ml′k
x2 )−max(mlk x1 ,ml′kx1 )+1)>0か
つ(min(mlk y2 ,ml′k y2 )−max(mlk y1
,ml′k y1 )+1)>0。
【0205】条件3−2:(min(ilk x2 ,il′k
x2 )−max(ilk x1 ,il′kx1 )+1)>0か
つ(min(ilk y2 ,il′k y2 )−max(ilk y1
,il′k y1 )+1)>0。
【0206】条件4:配置関係に逆転がある。すなわ
ち、以下の4−1〜4−4の状態にある。
【0207】4−1:ilj (il′j )に対して、i
l′j (ilj )が領域1にあり、mlk (ml′k
に対して、ml′k (mlk )が領域2にある。
【0208】4−2:ilj (il′j )に対して、i
l′j (ilj )が領域2にあり、mlk (ml′k
に対して、ml′k (mlk )が領域1にある。
【0209】4−3:ilj (il′j )に対して、i
l′j (ilj )が領域3にあり、mlk (ml′k
に対して、ml′k (mlk )が領域4にある。
【0210】4−4:ilj (il′j )に対して、i
l′j (ilj )が領域4にあり、mlk (ml′k
に対して、ml′k (mlk )が領域3にある。
【0211】対応可能罫線特徴ペア間両立性判定部35
c−2bの動作を、前述した対応可能罫線特徴ペアpl
1 〜pl9 を用いて具体的に説明する。pl1 からpl
9 までの9個の対応可能罫線特徴ペアのすべての組み合
わせは36通りある。
【0212】そのうち上記条件1〜4をすべて満たさな
い組み合わせは、(pl1 ,pl2)、(pl1 ,pl
3 )、(pl1 ,pl4 )、(pl1 ,pl5 )、(p
1,pl6 )、(pl1 ,pl7 )、(pl1 ,pl
8 )、(pl1 ,pl9 )、(pl2 ,pl3 )、(p
2 ,pl5 )、(pl2 ,pl6 )、(pl2 ,pl
7 )、(pl2 ,pl8 )、(pl2 ,pl9 )、(p
3 ,pl5 )、(pl3 ,pl6 )、(pl3 ,pl
7 )、(pl3 ,pl8 )、(pl3 ,pl9)、(p
4 ,pl6 )、(pl4 ,pl7 )、(pl4 ,pl
8 )、(pl4,pl9 )、(pl5 ,pl6 )、(p
5 ,pl7 )、(pl5 ,pl8 )、(pl5 ,pl
9 )、(pl6 ,pl7 )、(pl6 ,pl8 )、(p
6 ,pl9 )、(pl7 ,pl8 )、(pl7 ,pl
9 )、(pl8 ,pl9 )の32通りである。これらの
組み合わせの各々において、それを構成する対応可能罫
線特徴ペアは、両立可能であると判断される。
【0213】次に、最良マッチング抽出部35c−2c
は,対応可能罫線特徴ペア間両立性判定部35c−2b
において両立すると判定されたもののうち、すべてが互
いに両立可能な対応可能ペアの最大の集合を求めること
により、入力表特徴集合とモデル表特徴集合間の最良マ
ッチングを抽出する。
【0214】なお、最良マッチング抽出部35c−2c
は、図17に示す最良マッチング抽出部35b−3と同
一の機能を有している(詳細は図19に示している)。
最良マッチング抽出部35c−2cを構成している連合
グラフ作成部では、対応可能罫線特徴ペア間両立性判定
部35c−2bで得られた結果から連合グラフを作る
か、pl1 からpl9 までの9個の対応可能罫線特徴ペ
アに対しては、図28に示すものが作られる。
【0215】M1 VL1 とIVL1 の間の対応付け処理
に関しては、最良マッチング抽出部35c−2cにおい
て、(m1 vl1 ,ivl1 )、(m1 vl2 ,ivl
2 )、(m1 vl3 ,ivl3 )、(m1 vl5 ,iv
4 )、(m1 vl6 ,ivl4 )、(m1 vl7 ,i
vl5 )、(m1 vl8 ,ivl6 )、の対応が抽出さ
れたものとする。
【0216】mt11 の水平罫線集合:M1 HL1
(m1 hl1 ,m1 hl2 ,m1 hl3 ,m1 hl4
1 hl5 )とit1 の水平罫線集合:IHL1 =(i
hl1,ihl2 ,ihl3 ,ihl4 ,ihl5 )の
間の対応付け処理も、水平罫線照合部35c−3におい
て、同様に、(m1 hl1 ,ihl1 )、(m1
2,ihl2 )、(m1 hl3 ,ihl3 )、(m1
hl4 ,ihl4 )、(m1hl5 ,ihl5 )、の対
応が抽出されたものとする。
【0217】表照合部35bで抽出されたmt12 とi
2 の対応における、罫線集合間の対応付け処理も罫線
照合部35cで同様に行なわれ、mt12 の垂直罫線集
合:M1 VL2 =(m1 vl9 ,m1 vl10,m1 vl
11)とit2 の垂直罫線集合:IVL2 =(ivl7
ivl8 ,ivl9 )の間では、(m1 vl9 ,ivl
7 )、(m1 vl10,ivl8 )、(m1 vl11,iv
9 )、mt12 の水平罫線集合:M1 HL1 =(m1
hl6 ,m1 hl7 )とit2 の水平罫線集合:IHL
2 =(ihl7 ,ihl8 )の間では、(m1 vl6
ivl6 )、(m1 vl7 ,ivl7 )の罫線特徴間の
対応が得られたものとする。
【0218】照合度計算部35dは、罫線照合部35c
によって対応関係が抽出されたモデル文書と入力文書の
間で、当該構造化特徴間の対応付きを数量化することに
よりその度合い(照合度)を計算する。
【0219】照合度は、モデル照合部35に送られてき
たすべてのモデル文書と入力文書との間で計算され、照
合結果出力部35eに出力される。照合度:matching-m
etric は、モデル水平罫線数をsmhl-num、モデル垂直罫
線数をsmvl-num、入力水平罫線のうちモデル水平罫線と
対応付いたものの総数をsmch-num、入力垂直罫線のうち
モデル垂直罫線と対応付いたものの総数をsmcv-numとし
たときに、例えば以下の式で定義される。
【0220】matching-metric = 100− 200×(|smhl
-num−smch-num|+|smvl-num−smcv-num|)/((sm
hl-num−smch-num)+(smvl-num−smcv-num)) 例えば、図9の入力文書と図14のモデル文書との間の
照合度: matching-metric1 は、smhl-num=7,smvl-n
um=11,smch-num=7,smcv-num=10より、 matching-metric1 = 100− 200×(|7−7|+|11
−10|/(7+7)+(11+11))=94.44 、となる。
【0221】また、図9の入力文書と図15のモデル文
書との間の照合度: matching-metric2 は、当該構造化
特徴間の対応関係が抽出可能であったので(−100 )を
設定する。
【0222】照合結果出力部35eは、モデル照合部3
5に送られてきたすべてのモデル構造化特徴と入力構造
化特徴との間の照合度のうち、最大値を示すモデル文書
と入力文書の組み合わせを選び、それらの構造化特徴間
の対応関係と共に照合結果判定部37に出力する。
【0223】照合結果判定部37は、モデル照合部35
で最大照合度を示したモデル文書と入力文書の構造化特
徴間の対応関係(以後、構造化特徴間対応関係と呼ぶ)
が獲得できたか否かを判定する。
【0224】すなわち、モデル照合部35で計算された
最大照合度が予め与えられているしきい値:th7 以上で
ある場合には、構造化特徴間対応関係を獲得できたと判
定する。また、最大照合度がth7 未満である場合には、
構造化特徴間対応関係を獲得できなかったとして、入力
文書を棄却して、次の文書の入力を実施する。
【0225】また、この場合、フォーマット種別同定部
33で選出されなかったモデルのすべてに対して、モデ
ル照合部35で照合処理を行ない、その結果をこの照合
結果判定部37で判定するようにしてもよい。こうする
と、フォーマット種別同定部33における処理誤りを救
済でき、処理結果の精度が高まる。
【0226】具体的に説明すると、例えば、モデル照合
部35で図9の入力構造化特徴と図14のモデル構造化
特徴との間で最大照合度が計算されたとすると、その
値:max-sim は matching-metric1 より、max-sim =9
4.44 であり、 th7=60とするとth7<max-sim より、当
該構造化特徴間の対応関係は獲得されたと見なされる。
【0227】構造化特徴間の対応関係は、例えば次のよ
うな形式により保持される。すなわち、入力罫線特徴モ
デル罫線特徴の各対応付きにおいて、入力罫線特徴のim
ageに、それに対応するモデル罫線特徴の識別子を格納
し、モデル罫線特徴のimageに、それに対応付くモデル
罫線の識別子を格納する。予め、それぞれの罫線集合の
各罫線特徴のimage に−1をセットしておけば、対応付
かない罫線特徴のimage には常に−1が設定されている
ことになる。
【0228】モデル照合部35と照合結果判定部37を
経て獲得された構造化特徴対応関係のうちで最も重要な
ものは、入力文書の罫線集合とモデル文書の罫線集合の
間の対応関係(以後、罫線特徴間対応関係と呼ぶ)であ
る。後段の文字列領域抽出部43は、この対応関係に基
づいて入力画像から文字列領域を切り出す。
【0229】このとき罫線間対応関係が、どちらかの構
造化特徴の欠落のため不完全であったり、矛盾を含んで
いる場合には、処理不能となってしまう。このような問
題点を解決するために、未対応・矛盾対応発見修正部4
1は、文字列領域抽出部43による処理の前に、罫線間
対応関係に対する未対応・矛盾対応を修正する。
【0230】未対応・矛盾対応発見修正部41は、以下
の処理(1)(2)を実施する。
【0231】(1)モデルの罫線集合を構成する罫線特
徴のうち入力罫線に対応付いてないものを検出し、すで
に対応付いている他の対応関係を利用し、入力罫線集合
において対応付くものを発見するか、対応付くべきもの
を仮想入力罫線として自動的に発生させて、新たに入力
罫線集合に加える。
【0232】(2)上記(1)の処理を行なうと図29
に示すような矛盾が生じてしまう場合には、それを解消
し、無矛盾な対応関係を生みだすようにする。
【0233】このような未対応・矛盾対応発見修正部3
9の動作は、例えば図30に示すフローチャートに従
う。図30に示すフローチャートの各ステップの処理動
作は以下のようになる。ただし、この時点でも入力罫線
集合の各要素は対応付いているモデル罫線集合の座標系
に変換されたままであるものとする。
【0234】f1:当該モデル罫線集合の要素のうち、
特徴のimage に−1が付与されているものを検出する。
【0235】f2:着目モデル罫線特徴の左上端の座標
値(mx1 ,my1 )と右下端の座標値(mx2 ,my
2 )に対して、それぞれ以下のように探索範囲を設け
る。ここで、しきい値th8 が予め設定されているものと
する。
【0236】lim-x1 =mx1 −th8 lim-y1 =my1 −th8 lim-x2 =mx2 +th8 lim-y2 =my2 +th8 この探索範囲に含まれる入力罫線特徴のうち、着目モデ
ル罫線に最も近いものを検出する。この時、近さの尺度
を表す距離値は、例えば罫線特徴の重心間のユークリッ
ド距離で定義されてもよい。
【0237】f3:仮想入力罫線として、以下の特徴
(罫線特徴)を有するものを生成する。罫線特徴は、左
上端の位置座標(kx1 ,ky1 )、右下端の位置座標
(kx2 ,ky2 )、縦幅(k−height)、横幅(k−
width )、重心の位置座標(kcx,kcy)を含む。
【0238】f4:着目モデル罫線が、 1.水平罫線の場合、着目モデル罫線の両端に接続する
垂直モデル罫線をそれぞれ検出する。これらの垂直モデ
ル罫線が、(a) 存在し、かつそれに対応付く入力罫線が
存在する場合には、その垂直入力罫線特徴の左上端と右
下端の位置座標のうちx座標値のみを、それぞれkx1
とkx2 に格納する。
【0239】(b) 存在しない場合、もしくは垂直モデル
罫線が存在してもそれに対応付く入力罫線が存在しない
場合には、着目水平モデル罫線の位置座標値であるmx
1 とmx2 をそれぞれkx1 とkx2 に格納する。
【0240】2.垂直罫線の場合、着目モデル罫線の位
置座標値であるmx1 とmx2 をそれぞれkx1 とkx
2 に格納する。
【0241】f5:着目モデル罫線が、 1.垂直罫線の場合、着目モデル罫線の両端に接続する
水平モデル罫線をそれぞれ検出する。これらの水平モデ
ル罫線が、(a) 存在し、かつそれに対応付く入力罫線が
存在する場合には、その垂直入力罫線特徴の左上端と右
下端の位置座標のうちy座標値のみを、それぞれky1
とky2 に格納する。
【0242】(b) 存在しない場合、もしくは水平モデル
罫線が存在してもそれに対応付く入力罫線が存在しない
場合には、着目垂直モデル罫線の位置座標値であるmy
1 とmy2 をそれぞれky1 とky2 に格納する。
【0243】2.水平罫線の場合、着目モデル罫線の位
置座標値であるmy1 とmy2 をそれぞれky1 とky
2 に格納する。
【0244】f6:f2で検出モデル罫線特徴のimage
を調べる。image に−1がセットされている場合には、
図30のフローチャートでNOの方向に、−1以外の値
がセットされている場合にはYESの方向に処理を進め
る。
【0245】f7:着目モデル罫線が水平罫線の場合、
着目モデル罫線の両端に接続する垂直モデル罫線をそれ
ぞれ検出する。これらの垂直モデル罫線が、 1.存在し、かつそれら対応付く入力罫線が存在する場
合には、その垂直入力罫線特徴の左上端と右下端の位置
座標のうちx座標値のみをそれぞれ着目水平入力罫線の
左上端と右下端のx座標値に格納する。
【0246】2.存在しない場合、もしくは垂直モデル
罫線が存在してもそれに対応付く入力罫線が存在しない
場合には、着目水平モデル罫線の位置座標値であるmx
1とmx2 をそれぞれ着目水平入力罫線の左上端と右下
端のx座標値に格納する。
【0247】f8:着目モデル罫線が垂直罫線の場合、
着目モデル罫線の両端に接続する水平モデル罫線をそれ
ぞれ検出する。これらの水平モデル罫線が、 1.存在し、かつそれに対応付く入力罫線が存在する場
合には、その水平入力罫線特徴の左上端と右下端の位置
座標のうちy座標値のみをそれぞれ着目水平入力罫線の
左上端と右下端のy座標値に格納する。
【0248】2.存在しない場合、もしくは水平モデル
罫線が存在してもそれに対応付く入力罫線が存在しない
場合には、着目垂直モデル罫線の位置座標値であるmy
1とmy2 をそれぞれ着目垂直入力罫線の左上端と右下
端のy座標値に格納する。
【0249】図30に示すフローチャートの具体的な動
作を図9に示す入力構造化特徴と図14に示すモデル構
造化特徴を用いて説明する。当該モデル罫線特徴集合の
うちm1 vl4 のみ、対応付く入力罫線が存在しない。
従って、図30のフローチャートのステップf1でm1
vl4 が検出される。次いで、ステップf2において、
1 vl4 の探索範囲に含まれるivl4 を検出し、さ
らにステップf6でivl4 に対応付くモデル罫線とし
てm1 vl5 とm1 vl6 を検出する。このうち、m1
vl6 とm1 vl4 は共存できる(同時に存在できる)
が、m1 vl4とm1 vl5 の両立性は矛盾する。そこ
で、ステップf9でm1 vl4 とm1 vl5 のどちらが
当該入力罫線に近いかが判断され、その結果、m1 vl
4 の方が近いことが分かる。これによりステップf10
でivl4 とm1 vl5 の対応関係が無効とされ、ステ
ップf11,f12において、m1 vl4 とivl4
対応が新たに生成され、これにより生じる座標値の変更
がステップf7,f8で行なわれる。
【0250】ステップf10で対応関係を無効とされた
ことにより、m1 vl5 に対応付く入力罫線が存在しな
くなった。これをステップf14で検知したあと、m1
vl5 に対応付く入力罫線の発見・設定処理が行なわれ
る。まず、ステップf2でm1 vl5 の探索範囲でiv
4 を発見し、ステップf6でivl4 に対応付くモデ
ル罫線としてm1 vl4 とm1 vl6 を検出する。この
うち、m1 vl6 とm1 vl5 は共存できる(同時に存
在できる)が、m1 vl4 とm1 vl5 の両立性は矛盾
することがわかっており、さらにm1 vl4 の方がm1
vl5 より近いことが分かっているので、m1 vl5
対応する入力罫線は当該入力罫線集合では見つからなか
ったとして、ステップf3で仮想入力罫線を生成させ、
その位置座標をステップf4とf5で設定し、ステップ
f13で当該罫線集合に加える。この結果、当該モデル
罫線集合に未対応モデル罫線がなくなり、未対応・矛盾
対応発見修正手段39における処理は終了となる。
【0251】以上の処理結果により得られた罫線マッチ
ングに対して、以下の手順によって示されるマッチング
後処理を適用することによって、さらにマッチング結果
の精度を上げることができる。あるモデル罫線に対応付
くべき入力罫線の付近に当該モデル罫線との間の類似度
が高い線分(例えば取り消し線)が存在する場合、誤っ
てそれに対応づけてしまうことがある。以下の処理は、
このような誤りを解消するものである。
【0252】Step1:モデル罫線(ml)を1つ抽
出する。
【0253】Step2:その探索範囲(上述したar
eaml)内に存在する入力罫線(il)を抽出し、モデ
ルとの類似度(lsimml)を計算する。ここで、ml
h:mlの縦幅、mlw:mlの横幅、ilh:ilの
縦幅、ilw:ilの横幅とすると、mlが水平罫線の
場合には、 lsimml= 100− 200×|mlw−ilw|/(ml
w+ilw)とし、垂直罫線の場合には、 lsimml= 100− 200×|mlh−ilh|/(ml
h+ilh)とする。
【0254】Step3:lsimml≧th10である入力
罫線(il′)をすべて抽出する。
【0255】Step4:当該モデル罫線と対応づいて
いた入力罫線とil′の中で最も距離ddmlが近い罫線
を選び、あらためてそれを当該モデルに対応づける。こ
こで、mlの左上端と右下端の座標をそれぞれ(mlx
1 ,mly1 )、(mlx2,mly2 )、il′の左
上端と右下端をそれぞれ(il′x1 ,il′y1 )、
(il′x2 ,il′y2 )とすると、mlが水平罫線
の場合には、 ddml= min(mly1 ,il′y1 )− max(mly
2 ,il′y2 )+1 とし、垂直罫線の場合には、 ddml= min(mlx1 ,il′x1 )− max(mlx
2 ,il′x2 )+1 とする。
【0256】以上の結果、入力構造化とモデル構造化特
徴間の対応付け処理は終了したことになり、入力文書の
すべての罫線特徴の座標系を元に戻すようにする。
【0257】未対応・矛盾対応発見修正手段39により
整合の得られた入力構造化特徴とモデル構造化特徴の対
応関係を用いて、入力文書の罫線特徴集合に対して、以
下に述べる罫線成形処理を施すことによって以後の処理
が安定に行なわれるようにしてもよい。
【0258】例えば、図31に示すように、罫線特徴
(図中L1)の端点(図中E)がそれに直交する他の罫
線特徴(図中L2)に接していない場合には、L1の端
点の位置座標を変更して、L2に接するようにすること
で罫線特徴を成形する。この成形処理は、入力画像の水
平罫線集合と垂直罫線集合の両方に適用される。
【0259】水平罫線集合に対する罫線成形処理部の動
作は、例えば次のようになる。ここでL1の左上端の座
標値を(L1 x1 ,L1 y1 )、右下端の座標値を(L
1 x2 ,L1 y2 )、L2の左上端の座標値を(L2
1 ,L2 y1 )、右下端の座標値を(L2 x2 ,L2
2 )とする。
【0260】Step1:入力画像に対応するモデル文
書の水平罫線特徴集合の任意の罫線特徴を選択する。
【0261】Step2:着目水平罫線の両端に接する
モデル垂直罫線を検出する。
【0262】例えば、図31のL1の左端(点E)に接
するべき垂直罫線L2は、次のようにして検出される。
まず、探索領域を設定する。予め設定してあるしきい値
をth12とすると、探索領域は例えば、(L1 x1 −th1
2,(L1 y1 +L1 y2 )/2−th12)、(L1 x1
+th12,(L1 y1 +L1 y2 )/2+th12)で示され
る矩形(図31中の破線で示されている矩形)の内部と
する。
【0263】次に、探索領域に交差する垂直罫線のうち
以下に定義する距離:distが最小のものを抽出す
る。
【0264】 dist=|L1 x1 −(L2 x1 +L2 x2 )/2| Step3:着目モデル水平罫線に対応付いている入力
垂直罫線を抽出する。ここで、着目入力水平罫線の左上
端の位置座標値を(ix1 ,iy1 )、右下端の位置座
標値を(ix2 ,iy2 )とする。
【0265】Step4:着目モデル水平罫線の左端に
接するモデル垂直罫線に対応付いている入力垂直罫線を
抽出する。ここで、その左上端の位置座標値を(lx1
,ly1 )、右下端の位置座標値を(lx2 ,ly2
)とする。
【0266】Step5:着目モデル水平罫線の右端に
接するモデル垂直罫線に対応付いている入力垂直罫線を
抽出する。ここで、その左上端の位置座標値を(rx1
,ry1 )、右下端の位置座標値を(rx2 ,ry2
)とする。
【0267】Step6:着目入力水平罫線の左上端の
位置座標を((lx1 +lx2 )/2,iy1 )に変更
する。
【0268】Step7:着目入力水平罫線の右下端の
位置座標を((rx1 +rx2 )/2,iy2 )に変更
する。
【0269】Step8:Step2からStep7ま
での処理を、すべてのモデル水平罫線特徴に対して行な
う。
【0270】文書構造獲得部41は、入力文書とモデル
文書との間で矛盾のない構造化特徴間対応関係が得られ
た場合には、以下に示す処理を行なうことにより入力文
書の構造を獲得する。すなわち、モデル登録部31で予
め登録されている当該モデル文書の知識を、構造化特徴
間対応関係に基づいて入力文書にコピーすることによ
り、入力文書の構造を獲得したものと見なす。
【0271】具体的に説明すると、まず、モデル文書の
各罫線特徴に付与されている識別番号(以後、idと呼
ぶ)を罫線対応関係に基づいて、それに対応付いている
入力文書の罫線特徴に付与する。
【0272】次いで、モデル文書に対して定義されてい
る種々の知識を入力文書に対して用意されている、知識
を格納するためのメモリ43bの所定の領域にコピーす
る。後段の文字列領域抽出部43、文字認識部45、文
字認識結果出力部47は、メモリ43bの所定の領域に
コピーされた知識に基づいて動作する。
【0273】文字列領域抽出部43は、文書構造獲得部
41で得られた当該文書に関する知識を用いて、認識対
象文字列領域として定義されている領域のみを入力画像
から切り出す。認識対象文字列領域は、例えば領域を囲
んでいる上下左右の罫線のそれぞれの識別番号で定義さ
れていてもよい。この場合、文字列領域抽出部43で
は、入力文書画像中に位置するそれらの罫線の内側の部
分を入力画像から切り出すことにより文字列領域を抽出
する。
【0274】文字認識部45は、文字列領域抽出部43
において抽出された文字列画像を、その文字列領域につ
いて定義されている知識を制約条件として用いて、例え
ば文献「信学技報、PRU93−47、1993」に記
載されている方式に基づいた処理により、文字切り出し
/認識処理を行ない、コードデータに変換する。
【0275】このとき、各文字認識結果は類似度の降順
にソートされており、上位N位まで保持されているよう
にしてもよい。また、認識結果はオペレータとシステム
との対話的な修正作業により修正されるようになってい
てもよい。
【0276】文字認識結果出力部47は、文字認識部4
5による文字認識結果に対して、文字単位で修正が済ん
だ文字コードデータに応じて、入力文書に対応付いたモ
デルに関して予め指定されている出力形態に基づき、デ
ィスプレイあるいはファイルに出力する。
【0277】このようにして、本発明では、入力画像か
ら抽出した罫線特徴を、特徴構造化部29において構造
化して、さらに表特徴、接合部に関する特徴などを抽出
し、それらの関係を抽出・管理する。これらの情報を用
いて、モデル登録部31によって予め登録されているモ
デル文書のフォーマットに関する構造化特徴間で対応付
け処理を行なう。このとき、モデル照合部35によっ
て、入力文書とモデル文書の間で表特徴集合間の照合処
理を行ない、さらにその中に含まれる罫線特徴集合間で
照合処理を行なうことにより、以下のような効果が得ら
れる。
【0278】1.階層的な照合処理を行なうので計算量
を少なくすることができる。
【0279】2.表が複数混在している場合も取り扱う
ことができる。
【0280】3.表単位の照合処理を行なうことにより
全体的な配置関係を考慮することができ、局所的に見て
同じ特徴量を有する場合でも対応付け誤りが生じない。
【0281】4.表間対応ごとに大きさの倍率に関する
パラメータを求めることができ、モデル表に対応する入
力表の大きさに関するパラメータがそれぞれ独立した値
を持つような文書を取り扱うことができる。
【0282】5.表が印刷品質の劣化などにより分裂し
ている場合も取り扱うことができる。
【0283】6.入力文書とモデル文書の間で罫線間の
対応関係を求めるので、罫線がかすれていたり、途切れ
ていたり、欠落している場合や余分な特徴抽出結果があ
る場合にも対応できる。
【0284】7.罫線単位で対応付け処理を行なうとき
に、複数対複数の対応を許しているので、罫線分布が局
所的に変動している場合にも対応できる。
【0285】照合処理結果に対しては、照合結果判定部
37によって、照合度を用いてその妥当性を評価するこ
とにより、正しい対応付け結果のみを採用することがで
きる。
【0286】さらに、照合処理結果に対して、未対応・
矛盾対応発見修正部39によって、不完全な対応結果を
発見し、修正するので以下のような効果が得られる。
【0287】1.印刷の品質の悪い文書にも対応でき
る。
【0288】2.特徴抽出結果が不完全である場合にも
対応できる。
【0289】3.対応関係に基づいている後段の処理で
処理不能となることがない。
【0290】4.未対応箇所に対して、特徴抽出時のパ
ラメータを調整して未検出な画像特徴の抽出が可能とな
る。
【0291】また、本発明ではモデル照合処理の前に、
フォーマット種別同定部33によって、入力文書の書式
構造種別の同定処理を行なうことにより、照合処理で適
用すべきモデルの種類を絞りこむので、無駄な照合処理
を行なわないため、以下のような効果がある。
【0292】1.計算量が少ない。
【0293】2.構造のかけ離れたものにむりやり対応
付けることがないため高精度な処理結果が得られる。
【0294】3.オペレータが対象文書ごとにモデルを
手動で与える必要がないので、システムの自動運転が可
能となる。
【0295】4.モデル登録時に正立したモデルフォー
マットから、左および右に90度回転させたもの、18
0度回転させたものの4種類を登録し、モデル照合時に
これらと対応付け処理を行なうことにより、文書の入力
方向を限定しなくてもよい。
【0296】
【発明の効果】以上詳述したように本発明によれば、表
形式の帳票などの書式構造を正確に認識でき、効率の良
い文字列の領域の特定が可能となるものである。
【図面の簡単な説明】
【図1】本発明の一実施例に係わる画像処理装置の概略
構成を示すブロック図。
【図2】本実施例における処理対象文書の一例を示す
図。
【図3】本発明の一実施例である文字認識装置と組み合
わせた文書画像処理システムの概略構成を示すブロック
図。
【図4】本実施例における特徴抽出部27の構成を示す
ブロック図。
【図5】入力画像から抽出された線分素の例を示す図。
【図6】入力画像から抽出された文字候補矩形の例を示
す図。
【図7】本実施例における特徴抽出部27の他の構成を
示すブロック図。
【図8】文字候補矩形に交差・内包する線分素の例を示
す図。
【図9】入力画像から抽出された罫線特徴の例を示す
図。
【図10】本実施例における特徴構造化部29の構成を
示すブロック図。
【図11】入力画像から抽出された表特徴の例を示す
図。
【図12】入力画像から抽出された接合部特徴の例を示
す図。
【図13】階層的に関連づけられて管理される特徴に関
する情報の一例を示す図。
【図14】モデル文書の一例を示す図。
【図15】モデル文書の一例を示す図。
【図16】本実施例におけるモデル照合部35の構成を
示すブロック図。
【図17】本実施例における表照合部35bの構成を示
すブロック図。
【図18】任意の矩形領域の周辺に関する領域を定義す
るための説明に用いる図。
【図19】本実施例における最良マッチング抽出部35
b−3の構成を示すブロック図。
【図20】連合グラフの一例を示す図。
【図21】表特徴の分裂および接触の例を示す図。
【図22】本実施例における罫線照合部35cの構成を
示すブロック図。
【図23】本実施例における垂直罫線照合部35c−2
および水平罫線照合部35c−3の構成を示すブロック
図。
【図24】1本の罫線が分離している場合の例を示す
図。
【図25】分離している罫線を統合した例を示す図。
【図26】複数のモデル罫線と複数の入力罫線が対応付
く例を示す図。
【図27】任意の1本のモデル罫線特徴に対応付く可能
性のある入力罫線特徴を抽出するための探索範囲の例を
示す図。
【図28】連合グラフの一例を示す図。
【図29】未対応・矛盾対応発見抽出処理により矛盾し
た対応が生じてしまう例を示す図。
【図30】未対応・矛盾対応発見抽出処理の流れ示すフ
ローチャートの例を表す図。
【図31】罫線特徴の端点がそれに直交する他の罫線特
徴に接していない例を示す図。
【符号の説明】
11,21…画像入力部、12…特徴抽出部、13…特
徴構造化部、14…書式構造情報登録部、15…書式構
造種別同定部、16…書式構造情報照合部、17…未対
応・矛盾対応発見修正部、18…照合結果判定部、19
…文書構造獲得部、23…2値化処理部、25…前処理
部、27…特徴抽出部、27a…線分抽出部、27b…
文字候補矩形抽出部、27c…罫線特徴抽出部、27d
…フィルタリング処理部、29…特徴構造化部、29a
…罫線グループ化処理部、29b…表特徴抽出部、29
c…罫線接合部検出部、29d…特徴間関係記述部、3
1…モデル登録部、33…フォント種別同定部、35…
モデル照合部、35a…選択部、35b…表照合部、3
5b−1…対応可能ペア検出部、35b−2…異種対応
可能ペア間両立関係判定部、35b−3…最良マッチン
グ抽出部、35b−3a…連合グラフ作成部,35b−
3b…最大クリーク抽出部、35c…罫線照合部、35
c−1…表対応選択部、35c−2…垂直罫線照合部、
35c−2a…対応可能罫線特徴ペア検出部、35c−
2b…対応可能罫線特徴ペア間両立性判定部、35c−
2c…最良マッチング抽出部、35c−3…水平罫線照
合部、35c−4…方向間整合獲得部、35d…照合度
計算部、35e…照合結果出力部、37…照合結果判定
部、39…未対応矛盾対応発見修正部、41…文書構造
獲得部、43…文字列領域抽出部、45…文字認識部、
47…文字認識結果出力部。

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 文書より入力画像を生成する画像入力手
    段と、 入力画像の書式構造を認識するために用いられる処理対
    象文書の書式構造に関する情報(書式構造モデル)を予
    め登録する書式構造情報登録手段と、 前記画像入力手段により生成された入力画像から幾何学
    的な図形特徴量を抽出する特徴抽出手段と、 前記特徴抽出手段より抽出された図形特徴量をグループ
    化して画像特徴を生成し、それぞれの画像特徴間の関係
    を抽出・管理する特徴構造化手段と、 前記特徴構造化手段で得られた入力画像の画像特徴と、
    前記書式構造情報登録手段によって予め登録されている
    処理対象文書の書式構造に関する情報を用いて、入力文
    書の書式構造の種別の候補を絞りこむ書式構造種別同定
    手段と、 前記書式構造同定手段で候補となったすべての書式構造
    モデルと前記特徴構造化手段で構造化された入力文書の
    特徴との間で対応付けを行ない、最も良く対応づいた書
    式構造モデルと入力文書の組を選択し、その対応関係を
    獲得する書式構造情報照合手段と、 前記書式構造情報照合手段で選択された書式構造文書と
    入力文書における構造化特徴間の対応付けにおいて、不
    完全な対応付けおよび矛盾した対応付けを解消すること
    により整合のとれた前記書式構造モデルと入力文書の構
    造化された特徴間の対応関係を獲得する未対応・矛盾対
    応発見修正手段と、 前記未対応・矛盾対応発見修正手段によって得られた前
    記書式構造モデルと入力文書の構造化された特徴間の対
    応関係に基づいて、予め登録されている当該書式構造モ
    デルに関する情報を入力文書にコピーすることにより入
    力文書の書式構造と関連情報を獲得する文書構造獲得手
    段と、 を具備することを特徴とする文書画像処理装置。
  2. 【請求項2】 文書より入力画像を生成する画像入力手
    段と、 前記画像入力手段により生成された入力画像から線分と
    文字成分に関する図形特徴を抽出し、さらに前記入力画
    像における文字成分以外の領域から線分に関する特徴を
    罫線を構成する図形特徴とみなして抽出する特徴抽出手
    段と、 前記特徴抽出手段より抽出された罫線に関する図形特徴
    をグループ化することにより表に関する特徴を抽出し、
    各表に関する特徴において罫線が交差・接続する部分に
    生じる接合部に関する情報を抽出し、それぞれの特徴間
    の関係を抽出・管理する特徴構造化手段と、 を具備することを特徴とする文書画像処理装置。
  3. 【請求項3】 文書より入力画像を生成する画像入力手
    段と、 前記画像入力手段により生成された入力画像から線分と
    文字成分に関する図形特徴を抽出し、さらに前記入力画
    像における文字成分以外の領域から線分に関する特徴を
    罫線を構成する図形特徴とみなして抽出する罫線特徴抽
    出手段と、 前記罫線特徴抽出手段より抽出された罫線に関する図形
    特徴の集合に対して、交差・接続する罫線を同じグルー
    プにまとめることにより表に関する特徴を抽出する表特
    徴抽出手段と、 を具備することを特徴とする文書画像処理装置。
  4. 【請求項4】 文書より入力画像を生成する画像入力手
    段と、 入力画像の書式構造を認識するために用いられる処理対
    象文書の書式構造に関する情報(書式構造モデル)を予
    め登録する書式構造情報登録手段と、 前記画像入力手段によって生成された入力画像から線分
    と文字成分に関する図形特徴を抽出し、さらに入力画像
    における文字成分以外の領域から線分に関する特徴を罫
    線に関する図形特徴とみなして抽出する特徴抽出手段
    と、 前記特徴抽出手段より抽出された罫線に関する図形特徴
    をグループ化することにより表に関する特徴を抽出し、
    各表に関する特徴において罫線が交差・接続する部分に
    生じる接合部に関する情報を抽出し、それぞれの特徴間
    の関係を抽出・管理する特徴構造化手段と、 前記特徴構造化手段により得られた前記入力文書の表に
    関する特徴と、予め前記書式構造情報登録手段により登
    録されている書式構造モデルを構成する表に関する特徴
    との間で照合処理を行い、表間対応関係を獲得する表照
    合手段と、 前記表照合手段により得られた表の対応関係において入
    力文書の表を構成する罫線と、同罫線に対応付く書式構
    造モデルの表を構成する罫線との間の対応関係を獲得す
    る罫線照合手段と、 前記照合処理結果に基づき特徴間の対応付きの程度を表
    す照合度を計算し、正しい対応付けが行なわれているか
    否かの判断を行なう照合結果判定手段と、 を具備することを特徴とする文書画像処理装置。
  5. 【請求項5】 文書より入力画像を生成する画像入力手
    段と、 入力画像の書式構造を認識するために用いられる処理対
    象文書の書式構造に関する情報(書式構造モデル)を予
    め登録する書式構造情報登録手段と、 前記画像入力手段によって生成された入力画像から幾何
    学的な図形特徴量を抽出する特徴抽出手段と、 前記特徴抽出手段より抽出された図形特徴量をグループ
    化して画像特徴を生成し、それぞれの特徴間の関係を抽
    出・管理する特徴構造化手段と、 前記特徴構造化手段で得られた入力画像の構造化された
    画像特徴と、予め前記書式構造情報登録手段によって登
    録されている処理対象文書の書式構造に関する情報を用
    いて、類似度を計算し、最も類似度の高い書式構造モデ
    ルあるいは類似度の高いものから順に複数個の書式構造
    モデルあるいはある一定値以上の類似度を有する書式構
    造モデルを選び、前記入力文書の書式構造の種別を一つ
    あるいは複数個の候補に絞りこむ書式構造種別同定手段
    と、 を具備することを特徴とする文書画像処理装置。
  6. 【請求項6】 文書より入力画像を生成する画像入力手
    段と、 入力画像の書式構造を認識するために用いられる処理対
    象文書の書式構造に関する情報(書式構造モデル)を予
    め登録する書式構造情報登録手段と、 前記画像入力手段により得られた入力画像から線分と文
    字成分に関する図形特徴を抽出し、さらに入力画像にお
    ける文字成分以外の領域から線分に関する特徴を罫線に
    関する図形特徴とみなして抽出する特徴抽出手段と、 前記特徴抽出手段より抽出された罫線に関する図形特徴
    をグループ化することにより表に関する特徴を抽出し、
    各表に関する特徴において罫線が交差・接続する部分に
    生じる接合部に関する情報を抽出し、それぞれの特徴間
    の関係を抽出・管理する特徴構造化手段と、 前記特徴構造化手段で得られた入力画像の構造化された
    特徴と、予め前記書式構造情報登録手段によって登録さ
    れている処理対象文書の書式構造に関する情報を用い
    て、類似度を計算し、最も類似度の高い書式構造モデル
    あるいは類似度の高いものから順に複数個の書式構造モ
    デルあるいはある一定値以上の類似度を有する書式構造
    モデルを選び、入力文書の書式構造の種別を一つあるい
    は複数個の候補に絞りこむ書式構造種別同定手段と、 前記書式構造種別同定手段により選択されたそれぞれの
    書式構造モデルに対して、 前記特徴構造化手段により得られた入力文書の表に関す
    る特徴と、前記書式構造情報登録手段により登録されて
    いる当該書式構造モデルを構成する表に関する特徴との
    間い照合処理を行ない、表間対応関係を獲得する表照合
    手段と、 前記表照合手段により得られた表の対応関係において入
    力文書の表を構成する罫線と同罫線に対応付く書式構造
    モデルの表を構成する罫線との間の対応関係を獲得する
    罫線照合手段と、 前記罫線照合手段により得られた対応関係に対して、特
    徴間の対応付きの程度を表す照合度を計算する照合度計
    算手段と、 前記照合度計算手段で計算されたそれぞれの書式構造モ
    デルの照合度の中から最大照合度を示す書式構造モデル
    を抽出する照合結果出力手段と、 前記照合結果出力手段によって抽出された書式構造モデ
    ルの最大照合度を用いて、入力文書と当該書式構造モデ
    ルの構造化特徴間で正しい対応付けが行われているか否
    かの判定を行なう照合結果判定手段と、 を具備することを特徴とする文書画像処理装置。
  7. 【請求項7】 前記書式構造情報登録手段は、 入力文書の書式構造を認識するために用いられる処理対
    象文書の書式構造に関する情報を登録する際に、正立し
    た処理対象文書の書式構造に関する情報を複数の所定角
    度で回転させたものを発生させ、それぞれに正立したも
    のから何度回転しているかに関する情報を付与し、それ
    らすべてを処理対象文書の書式構造に関する情報として
    登録することを特徴とする請求項1または請求項4また
    は請求項5または請求項6記載の文書画像処理装置。
  8. 【請求項8】 文書より入力画像を生成する画像入力手
    段と、 入力文書の書式構造を認識するために用いられる処理対
    象文書の書式構造に関する情報を登録する際に、正立し
    た処理対象文書の書式構造に関する情報を複数の所定角
    度で回転させたものを発生させ、それぞれに正立したも
    のから何度回転しているかに関する情報を付与し、それ
    らすべてを処理対象文書の書式構造に関する情報として
    登録する書式構造情報登録手段と、 前記画像入力手段により生成された入力画像から幾何学
    的な図形特徴量を抽出する特徴抽出手段と、 前記特徴抽出手段より抽出された図形特徴量をグループ
    化することで画像特徴を生成し、それぞれの特徴間の関
    係を抽出・管理する特徴構造化手段と、 前記特徴構造化手段で得られた入力画像の構造化された
    画像特徴と、前記書式構造情報登録手段によって予め登
    録されている処理対象文書の書式構造に関する情報を用
    いて、入力文書の書式構造の種別を一つあるいは複数個
    の候補に絞りこむ書式構造種別同定手段と、 前記書式構造種別同定手段で候補となったすべての書式
    構造モデルと入力文書の前記特徴構造化手段で構造化さ
    れた特徴との間で対応付けを行ない、最も良く対応づい
    た書式構造モデルと入力文書の組を選択し、その対応関
    係を獲得するモデル照合手段と、 前記モデル照合手段で選択された書式構造文書と入力文
    書における構造化特徴間の対応付けにおいて、不完全な
    対応付けおよび矛盾した対応付けがなされているか否か
    を発見し、それらを解消することにより整合のとれた前
    記書式構造モデルと入力文書の構造化された特徴間の対
    応関係を獲得する未対応、矛盾対応発見・修正手段と、 前記モデル照合手段で入力画像に対応付いた書式構造モ
    デルが所定角度で回転させたものである場合には、その
    回転角度を正立する方向に入力画像を回転し、正立した
    当該書式モデルと対応付ける画像回転手段と、 前記書式構造モデルと入力文書の構造化された特徴間の
    対応関係に基づいて、予め登録されている当該書式構造
    モデルに関する情報を入力文書にコピーすることにより
    入力文書の書式構造と関連情報を獲得する文書構造獲得
    手段と、 を具備することを特徴とする文書画像処理装置。
  9. 【請求項9】 文書より入力画像を生成する画像入力手
    段と、 入力画像の書式構造を認識するために用いられる処理対
    象文書の書式構造に関する情報(書式構造モデル)を予
    め登録する書式構造情報登録手段と、 前記画像入力手段によって生成された入力画像から線分
    と文字成分に関する図形特徴を抽出し、さらに入力画像
    における文字成分以外の領域から線分に関する特徴を罫
    線に関する図形特徴(罫線特徴)とみなして抽出する特
    徴抽出手段と、 前記特徴抽出手段より抽出された罫線特徴をグループ化
    することにより表に関する特徴(表特徴)を抽出し、各
    表特徴において罫線が交差・接続する部分に生じる接合
    部に関する情報を抽出し、それぞれの特徴間の関係を抽
    出・管理する特徴構造化手段と、 前記特徴構造化手段により得られた入力文書の表特徴
    と、予め前記書式構造情報登録手段により登録されてい
    る書式構造モデルを構成する表特徴との間で照合処理を
    行い、表間対応関係を獲得する表照合手段と、 前記表照合手段により得られた表の対応関係において入
    力文書の表を構成する罫線特徴とそれに対応付く書式構
    造モデルの表を構成する罫線との間の対応関係を獲得す
    る罫線照合手段と、 前記罫線照合手段により獲得された対応関係に対し、特
    徴間の対応付きの程度を表す照合度を計算し、正しい対
    応付けが行なわれているか否かの判定を行なう照合結果
    判定手段と、 前記照合結果判定手段によって正して対応付けが行われ
    ていると判定された入力文書と書式構造モデルの罫線特
    徴間の対応関係において、入力文書の罫線特徴(入力罫
    線特徴)に対応付いていない書式構造モデルの罫線特徴
    (未対応モデル罫線特徴)を抽出する手段と、 前記未対応モデル罫線特徴に対応付くべき入力罫線特徴
    が他のモデル罫線特徴に対応付いている場合には、その
    対応関係を解消し、未対応モデル罫線特徴とその入力罫
    線特徴を対応付ける手段と、 前記未対応モデル罫線特徴に対応付くべき欠損した未対
    応の入力罫線特徴がある場合には、未対応モデル罫線特
    徴と当該入力罫線特徴を対応付ける手段と、 前記未対応モデル罫線特徴に対応付くべき入力罫線特徴
    が見つからない場合には、対応付くべき入力罫線特徴を
    新たに発生させ、未対応モデル罫線特徴と新たに発生さ
    せた入力罫線特徴を対応付ける手段によって未対応およ
    び矛盾対応を修正する手段と、 を具備することを特徴とする文書画像処理装置。
  10. 【請求項10】 文書より入力画像を生成する画像入力
    手段と、 入力画像の書式構造を認識するために用いられる処理対
    象文書の書式構造に関する情報(書式構造モデル)を予
    め登録する書式構造情報登録手段と、 前記画像入力手段により生成された入力画像から線分と
    文字成分に関する図形特徴を抽出し、さらに入力画像に
    おける文字成分以外の領域から線分に関する特徴を罫線
    に関する図形特徴(罫線特徴)とみなして抽出する特徴
    抽出手段と、 前記特徴抽出手段より抽出された罫線特徴をグループ化
    することにより表に関する特徴(表特徴)を抽出し、各
    表特徴において罫線が交差・接続する部分に生じる接合
    部に関する情報を抽出し、それぞれの特徴間の関係を抽
    出・管理する特徴構造化手段と、 前記特徴構造化手段により得られた入力文書の表特徴
    と、予め書式構造情報登録手段により登録されている書
    式構造モデルを構成する表特徴との間で照合処理を行
    い、表間対応関係を獲得する表照合手段と、 前記表照合手段により得られた表の対応関係において入
    力文書の表を構成する罫線特徴とそれに対応付く書式構
    造モデルの表を構成する罫線特徴との間の対応関係を獲
    得する罫線照合手段と、 前記罫線照合手段で獲得された罫線特徴間の対応関係に
    おいて、当該書式構造モデルの罫線特徴集合における罫
    線間の接続関係に基づいて、対応する入力文書の罫線特
    徴集合における罫線間の接続関係を修正する罫線照合後
    処理手段と、 を具備することを特徴とする文書画像処理装置。
JP6212951A 1994-09-06 1994-09-06 文書画像処理装置 Pending JPH0877294A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6212951A JPH0877294A (ja) 1994-09-06 1994-09-06 文書画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6212951A JPH0877294A (ja) 1994-09-06 1994-09-06 文書画像処理装置

Publications (1)

Publication Number Publication Date
JPH0877294A true JPH0877294A (ja) 1996-03-22

Family

ID=16631002

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6212951A Pending JPH0877294A (ja) 1994-09-06 1994-09-06 文書画像処理装置

Country Status (1)

Country Link
JP (1) JPH0877294A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6111984A (en) * 1997-06-10 2000-08-29 Fujitsu Limited Method for matching input image with reference image, apparatus for the same, and storage medium storing program for implementing the method
JP2001325563A (ja) * 2000-03-10 2001-11-22 Fujitsu Ltd 画像照合装置、画像照合方法、及び画像照合プログラム
JP2003030583A (ja) * 2001-07-11 2003-01-31 Oki Electric Ind Co Ltd 表種別識別方法および表種別識別装置、フォーマット種別識別方法およびフォーマット種別識別装置
US6917706B2 (en) 1996-12-20 2005-07-12 Fujitsu Limited Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JP2008083846A (ja) * 2006-09-26 2008-04-10 Oki Electric Ind Co Ltd 認識対象領域決定方法及び装置
KR20150017755A (ko) * 2012-07-24 2015-02-17 알리바바 그룹 홀딩 리미티드 형태 인식 방법 및 디바이스
JP2021005234A (ja) * 2019-06-26 2021-01-14 日立オムロンターミナルソリューションズ株式会社 帳票認識装置、帳票認識方法、及び帳票認識システム
JP2023502584A (ja) * 2019-10-29 2023-01-25 ウーリー ラブス インコーポレイテッド ディービーエー ヴァウチト 文書の認証のためのシステム及び方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6917706B2 (en) 1996-12-20 2005-07-12 Fujitsu Limited Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US6928188B2 (en) 1996-12-20 2005-08-09 Fujitsu Limited Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US6975762B2 (en) 1996-12-20 2005-12-13 Fujitsu Limited Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US7039235B1 (en) 1996-12-20 2006-05-02 Fujitsu Limited Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US6111984A (en) * 1997-06-10 2000-08-29 Fujitsu Limited Method for matching input image with reference image, apparatus for the same, and storage medium storing program for implementing the method
JP2001325563A (ja) * 2000-03-10 2001-11-22 Fujitsu Ltd 画像照合装置、画像照合方法、及び画像照合プログラム
JP2003030583A (ja) * 2001-07-11 2003-01-31 Oki Electric Ind Co Ltd 表種別識別方法および表種別識別装置、フォーマット種別識別方法およびフォーマット種別識別装置
JP2008083846A (ja) * 2006-09-26 2008-04-10 Oki Electric Ind Co Ltd 認識対象領域決定方法及び装置
KR20150017755A (ko) * 2012-07-24 2015-02-17 알리바바 그룹 홀딩 리미티드 형태 인식 방법 및 디바이스
JP2015528960A (ja) * 2012-07-24 2015-10-01 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited フォーム認識方法及びフォーム認識装置
JP2021005234A (ja) * 2019-06-26 2021-01-14 日立オムロンターミナルソリューションズ株式会社 帳票認識装置、帳票認識方法、及び帳票認識システム
JP2023502584A (ja) * 2019-10-29 2023-01-25 ウーリー ラブス インコーポレイテッド ディービーエー ヴァウチト 文書の認証のためのシステム及び方法

Similar Documents

Publication Publication Date Title
CN113343740B (zh) 表格检测方法、装置、设备和存储介质
US8792715B2 (en) System and method for forms classification by line-art alignment
KR0147318B1 (ko) 화상추출시스템
US6408105B1 (en) Method for detecting slope of image data utilizing hough-transform
US8781229B2 (en) System and method for localizing data fields on structured and semi-structured forms
JP6187323B2 (ja) 画像処理装置及び画像処理プログラム
JP2018067120A (ja) 指紋処理装置、指紋処理方法、プログラム、指紋処理回路
Seo et al. Junction-based table detection in camera-captured document images
Luft et al. Automatic content‐based georeferencing of historical topographic maps
Kushnir et al. Epipolar geometry estimation for urban scenes with repetitive structures
CN101261638A (zh) 图像搜索的方法、装置及程序
JPH0877294A (ja) 文書画像処理装置
JPH11232306A (ja) ドキュメント突合せ方法およびシステム
Guo et al. Exploring GIS knowledge to improve building extraction and change detection from VHR imagery in urban areas
CN112287763A (zh) 图像处理方法、装置、设备及介质
JPH09319824A (ja) 帳票認識方法
Heitzler et al. A modular process to improve the georeferencing of the Siegfried map
US20030210818A1 (en) Knowledge-based hierarchical method for detecting regions of interest
Chiang et al. Extracting road vector data from raster maps
CN111435537B (zh) 模型训练方法、装置及基于拼接图的位姿优化方法、装置
JPH08210811A (ja) 円ないし楕円の検出方法およびその装置
JPH1021412A (ja) 部品画像のエッジ検出方法および部品形状認識装置
Chiang Harvesting geographic features from heterogeneous raster maps
JP6171786B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
JP2014182617A (ja) 画像処理装置、方法及びプログラム