JP2000285190A - 帳票識別方法および帳票識別装置および記憶媒体 - Google Patents
帳票識別方法および帳票識別装置および記憶媒体Info
- Publication number
- JP2000285190A JP2000285190A JP11093762A JP9376299A JP2000285190A JP 2000285190 A JP2000285190 A JP 2000285190A JP 11093762 A JP11093762 A JP 11093762A JP 9376299 A JP9376299 A JP 9376299A JP 2000285190 A JP2000285190 A JP 2000285190A
- Authority
- JP
- Japan
- Prior art keywords
- identified
- registered
- feature amount
- image
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
Abstract
く、色情報、キーワード認識結果など、複数の特徴を用
いて性能のよい帳票識別を可能にする。 【解決手段】入力された識別対象の帳票の画像から複数
の特徴量を抽出し、そのうちの1つと登録帳票の特徴量
とを比較して該識別対象の帳票の種別が識別できなかっ
たとき、前記複数の特徴量のうちの他の特徴量と前記登
録帳票の特徴量とを比較して該識別対象の帳票の種別を
識別することを特徴とする。
Description
よく識別、分類するための帳票識別方法に関する。
特開昭61−75477号には、格納すべき対象文書の
見本文書(複数個)の画像あるいはその特徴パターンを
あらかじめ記憶しておき,格納すべき対象文書の画像か
ら特徴パターンを抽出して、上記見本文書の特徴パター
ンと比較し同一であると判定した見本文書の分類コード
を入力文書に付与することによって、自動的に分類コー
ドの決定を行う方法が提案されている。
では、画像の水平・垂直線分の積分値(水平・垂直方向
への長い線分の画素数の加算)を用いていることから、
異なる文書が同一の直線部を有している場合には区別が
できない他、画像が傾いていたり、位置づれがある場合
には、画像レベルでの位置合わせや傾き補正が難しいと
いう問題があった。
平08−255236号では、帳票画像から抽出した罫
線枠の情報をハッシュテーブルを利用し、帳票間で照合
することで識別を行う処理を提案している。これは、登
録帳票に対して帳票画像から抽出した罫線枠の連結性を
検査し、その連結罫線枠の外接長方形により正規化し、
各罫線枠の中心座標をハッシュテーブルに登録する。一
方、識別対象の帳票に対しても同様に、帳票画像から罫
線枠を抽出し、連結罫線枠より正規化する。最後に、各
罫線枠の中心座標で登録しておいたハッシュテーブルを
検索し、最もヒットした登録帳票の種別を該当する帳票
とするという手法である。
扱うにつれ、罫線枠の物理的な構造にのみに基づいてい
る手法では、同じ構造をもっていても異なる種類の帳票
として分類したい場合、例えば、枠情報が一致していて
もプレ印字文字のみが違うもの、色情報のみが違うもの
などでは、認識性能に限界がでてきた。
造のみに限定することなく、色情報、キーワード認識結
果など、複数の特徴を用いて性能のよい帳票識別を可能
にする帳票識別方法およびそれを用いた帳票識別装置を
提供することを目的とする。
は、入力された識別対象の帳票の画像から複数の特徴量
を抽出し、そのうちの1つと登録帳票の特徴量とを比較
して該識別対象の帳票の種別が識別できなかったとき、
前記複数の特徴量のうちの他の特徴量と前記登録帳票の
特徴量とを比較して該識別対象の帳票の種別を識別する
ことにより、罫線枠等の物理的な構造のみに限定するこ
となく、色情報、キーワード認識結果など、複数の特徴
を用いて性能のよい帳票識別を可能にする。
の画像から帳票の種別を特定するための色および罫線お
よび文字列のうちの少なくとも1つを特徴量として抽出
し、複数の登録帳票をこれらに共通する前記特徴量で予
め分類しておき、入力された識別対象の帳票の画像から
抽出された前記特徴量のうち、該識別対象の帳票の種別
を識別する際に用いる特徴量を選択し、この選択された
特徴量で分類された登録帳票の特徴量に基づき該識別対
象の帳票の種別を識別することにより、検索範囲を絞り
ながら、大量・多品種の帳票の識別を可能にし、性能の
よい帳票識別結果を得ることができる。
画像の種別に応じて、該帳票の画像から抽出する特徴量
を選択する。
ら抽出された特徴量に一致する帳票が登録されていない
とき、該特徴量に最も類似する登録帳票の特徴量を用い
て該帳票を登録する。
する際、各画素の色を周辺画素の色を基に判定する。
対象の帳票の画像から複数の特徴量を抽出する抽出手段
と、この抽出手段で抽出された複数の特徴量のうちの1
つと登録帳票の特徴量とを比較して該識別対象の帳票の
種別を識別する第1の識別手段と、この第1の識別手段
で前記識別対象の帳票の種別が識別できなかったとき、
前記複数の特徴量のうちの他の特徴量と前記登録帳票の
特徴量とを比較して該識別対象の帳票の種別を識別する
第2の識別手段とを具備したことにより、罫線枠等の物
理的な構造のみに限定することなく、色情報、キーワー
ド認識結果など、複数の特徴を用いて性能のよい帳票識
別を可能にする。
の画像から帳票の種別を特定するための色および罫線お
よび文字列のうちの少なくとも1つを特徴量として抽出
する抽出手段と、複数の登録帳票をこれらに共通する前
記特徴量で分類する分類手段と、入力された識別対象の
帳票の画像から抽出された前記特徴量のうち、該識別対
象の帳票の種別を識別する際に用いる特徴量を選択し、
この選択された特徴量で分類された登録帳票の特徴量に
基づき該識別対象の帳票の種別を識別する識別手段とを
具備したことにより、検索範囲を絞りながら、大量・多
品種の帳票の識別を可能にし、性能のよい帳票識別結果
を得ることができる。
画像の種別に応じて、該帳票の画像から抽出する特徴量
を選択する。
ら抽出された特徴量に一致する帳票が登録されていない
とき、該特徴量に最も類似する登録帳票の特徴量を用い
て該帳票を登録する。
図面を参照して説明する。
別するための帳票識別装置の構成例を示したもので、画
像入力部1とディスプレイ装置6と入力デバイス7と各
種記憶手段(入力データメモリ3、保存部8、フォーマ
ット情報記憶部4)をバスに接続して構成されている。
ハードウエア資源として示しているが、画像入力部1と
ディスプレイ装置6と入力デバイス7と各種記憶手段
(入力データメモリ3、保存部8、フォーマット情報記
憶部4)とCPUとを有したコンピュータに実行させる
ことのできるプログラムとしてフロッピーディスク、C
D−ROM等の記憶媒体に記録して頒布することもでき
る。
ドと帳票識別モードの2種類のモードを有し、帳票登録
モードにおいては、以下のように動作する。すなわち、
画像入力部1は登録する帳票(登録帳票)をスキャンし
て、得られた画像を帳票登録部2に与える。入力データ
メモリ3は入力された画像を記憶しておくものである。
帳票登録部2は入力された画像にカラー分離、線分抽
出、文字枠抽出、文字認識、枠抽出などの認識処理を施
し、認識結果をディスプレイ装置6に表示してユーザに
提示し、ユーザとの対話的な処理によって、登録帳票の
各種構成要素を抽出して、フォーマット情報を生成して
フォーマット情報記憶部4に登録する。
作する。すなわち、画像入力部1はファイリングすべき
各々の帳票をスキャンして、得られた画像を帳票識別部
5に与える。帳票識別部5はフォーマット情報記憶部4
に登録された複数のフォーマット情報をもとにして、フ
ァイリングすべき帳票が、登録された帳票のうちのどれ
と一致しているかを基に識別する。そしてその結果をデ
ィスプレイ装置6に表示することによって、得られた識
別結果をユーザに提示し、ユーザとの対話的な処理によ
って確認を行ったのち、例えばマウス、キーボード、電
子ペン等の入力装置から構成される指示デバイス7を用
いてユーザにより処理が指示される。最後に、帳票登録
部2で登録された登録帳票のフォーマット情報と帳票識
別部5で得られた帳票のフォーマット情報とに基づき、
入力画像を保存部8にファイリングする。ただし、この
対話処理を省略し、自動保存を行い、複数枚を保存した
後に確認作業を行うことも可能である。
理を、より詳細に説明する。まず、帳票登録モードにつ
いて説明する。
を説明するためのフローチャートである。まず、スキャ
ナによって入力された登録帳票の画像がディスプレイ装
置6上に表示される(ステップS1)。そして、この入
力画像に対し、帳票登録部2では、カラー分離処理を行
って、背景画像、罫線およびプレ印字部抽出を行う(ス
テップS2)。次に罫線・プレ印字部として得られたデ
ータに対しては、色解析処理(ステップS3)、2値化
処理(ステップS4)が実行される。さらに、要素抽出
処理(ステップS5)が施され、罫線、文字枠、文字コ
ードなどの帳票の種別を識別する際に用いる特徴的な要
素(特徴量)の抽出を行う。最後に、追加・修正処理
(ステップS6)によって、ユーザからの指示に従っ
て、データを編集し、最終的にフォーマット情報を作成
して、フォーマット情報記録部4に登録する(ステップ
S7)。
ける背景画像検出およびその除去処理について説明す
る。
をHSV(色相、彩度、明度)に変換する。この値か
ら、ヒストグラムをとって、もっとも値の多い値を背景
色値とする。背景色が決定されたら、背景部分を全体画
像から除去する。もちろん、背景色の検出は他の方法を
用いてもよい。
分が存在すると考えることができるので、背景画像が除
去された時点で残された画像は、罫線・プレ印字文字部
と考えられる。したがって、これらの画像について2値
化した後(ステップS4)、また、色解析を行い、色特
徴の抽出を行った後(ステップS3)、画像から図形特
徴や文字コード等の各種要素を抽出する(ステップS
4)。
ば、ステップS2のカラー分離処理によって背景部分が
削除されているので、残った画像は、罫線、プレ印字文
字、手書き文字などの要素になると考えてよいので、背
景以外のデータが黒になるように2値化できればよい。
法で行う。すでに、入力画像の中から、背景部分が削除
されているので、色部分についてのみ処理を行う。色部
分についてのみ、RGB空間もしくはH(色相)−S
(彩度)空間に投票し、クラスタリングにより帳票に存
在する色を判定する。たとえば、図3に示したように、
あらかじめ、帳票に使われるような罫線の色成分に相当
する投票箱をH−Sの色空間に配置しておいて、抽出さ
れた画素に対して色成分を計算して、投票箱に投票して
いく方法をとる。たとえば、赤に相当する投票箱(領
域)R1、青に相当する投票箱(領域)R5を設けて、
各画素の色成分で投票を行い、最終的に投票数や投票画
素全体に対して占める割合を算出して、当選か落選かを
決定する。この方法によって対象帳票の代表色を記録す
る。色種だけではなく、帳票内で用いられている色の割
合も保存しておいてもよい。色の特徴を解析する方法
は、従来より提唱されているほかの手法をもちいてもか
まわない。
線、文字枠)、文字コードなどを抽出する。罫線の抽出
はたとえば以下の方法で行う。すなわち、ここでは、罫
線は4点から構成される枠情報であると考え、抽出を行
う。まず、入力データをラスタスキャンしてその追跡開
始点を検出した後、その追跡開始点から時計周りあるい
は反時計周りに図形境界がつくる閉曲線を追跡すること
によって輪郭線抽出が行なわれる。このような閉曲線追
跡により抽出された輪郭の情報は座標点列、あるいは方
向コードの列であるチェインコードとして保存される。
この輪郭抽出処理については、従来より種々提唱されて
いる他の輪郭抽出の手法を用いても良いことは言うまで
もない。
部や角点という特徴点を抽出する。これは、例えば輪郭
点列から凸点列を検出し、それに対応付く凹点列を抽出
する。この特徴点抽出は例えば曲率算出処理によって求
められた曲率kを所定の閾値K0、K1と比較し、k≦
K0 なる点列を凹点列、k≧K1 となる点を凸点列
とすることにより実現される。
処理や芯線化処理によって実現してもよい。例えば、細
線化データでは線分の端点には凸部が存在し、細線の交
差点には凹点が存在することから、特徴抽出が可能とな
る。
する。枠の抽出は、例えば注目点近郊にある4点の座標
の組合せから、図形が長方形または平行四辺形をなすか
どうかを判断することにより容易に枠領域が抽出可能で
ある。このとき、枠抽出は他の手法を用いてもよいこと
はいうまでもない。
う。画像を連結領域ごとにラベル付けし、外接図形を求
める。次に隣接する外接図形がある閾値内の距離にある
場合には併合してみる。併合を行なった場合に再度外接
図形を計算し、下線の方向(傾き)の変動がある閾値以
内の場合には同一文字列であるとする。なお、文字枠抽
出方法は従来より種々提唱されている手法など他の方法
を用いてもよい。
画像を連結領域ごとにラベル付けし、外接図形を求め
る。外接図形の大きさがある閾値内である場合には文字
候補として文字認識を行なう。なお、文字抽出方法は従
来より種々提唱されている手法など他の方法を用いても
よい。
ステップS6において、追加・修正が行われる。
から抽出された各種要素は、例えば、ステップS1で入
力された登録帳票の画像の上に重畳表示されて、ユーザ
によりデータ修正が行なわれるようになっている。修正
方法は、従来利用している図形作成ツールなどと同様に
行うことが可能である。
成されたフォーマット情報がフォーマット情報記憶部4
に登録される(ステップS7)。その際、フォーマット
情報にはキーワードまたはファイル名を付与し、保存す
る。
徴を説明する。帳票には、その構成要素として、罫線
枠、罫線色、予め印字されている文字列(プレ印字文字
列)領域R1、R2があげられる。
情報(ここでは、そのイメージを示している)の4つの
例であり、各登録帳票からは、色情報の違いも含めて特
徴量となる構成要素(罫線枠、文字列(プレ印字文
字))が抽出されている。
プレ印字の一部が共通のもの、罫線枠の一部が共通のも
の等が存在する。
は、登録帳票と識別対象の帳票とで最初に照合すべきも
の(第1の特徴量)を色情報とする。すなわち、図6に
示すように、第1の特徴量として罫線色とすると、登録
帳票AとB、CとDは、同じフォーマット群として分類
される。また、帳票の先頭にあるプレ印字#1を第2の
特徴量として、これを基に分類すると、帳票見本CとD
とが同じフォーマット郡として分類される。さらに、帳
票の右下にあるプレ印字#2を第3の特徴量として、こ
れを基に分類すると帳票見本A〜Cが同じフォーマット
として分類される。
録帳票のフォーマット情報には、罫線枠の構造のみが一
致していて、プレ印字のある場所やその文字列(文字コ
ード)、罫線色のみが違うものなど、多種存在すること
から、できるだけ登録帳票を分離しやすい観点から分類
することが望ましい。
する。
説明するためのフローチャートである。まず、スキャナ
によって入力された識別対象の帳票の画像がディスプレ
イ装置6上に表示される(ステップS11)。そして、
この入力画像に対し、帳票識別部5は画像分離処理を施
し(ステップS12)、背景画像、黒領域(文字列部
分)、罫線およびプレ印字部を抽出する。
対しては、色解析処理(ステップS13)、2値化処理
(ステップS14)が施される。さらに、要素抽出処理
(ステップS15)が施され、罫線、文字枠、文字コー
ドなどの要素抽出を行う。
罫線、文字枠、文字コードなどの要素抽出処理、2値化
処理については、帳票登録時と同様であるので説明を省
く。なお、ここでは、必ずしも文字認識処理を行う必要
はない。文字認識処理は、必要に応じて、後述するステ
ップS19にて行うようにしてもよい。
は、たとえば以下の方法で行う。黒領域は、画素ごとに
RGBの値をHSV(色相、彩度、明度)に変換した場
合、明度Vや彩度Sが小さくなる。したがって、しきい
値処理によって黒画素部分を抽出することが可能にな
る。もちろん、黒画素領域の抽出は他の方法を用いても
よい。もちろん、帳票の罫線やプレ印字文字に黒が用い
られている場合は、黒領域も罫線・プレ印字部と同様に
取り扱ってもよい。
られたデータから、登録帳票と識別対象の帳票とで最初
に照合すべきもの(第1の特徴量)を選択する(ステッ
プS16)。そして、帳票識別を行う(ステップS1
7)。
シュテーブルを用いて帳票識別を行う場合について説明
する。なお、この手法について特開平08−25523
6号に開示されており、登録帳票から抽出された特徴量
からハッシュテーブルを作成する前処理と、入力画像か
ら特徴を抽出し、投票を行い認識する認識処理とに分け
ることができる。
際には、複数の登録帳票を分類した結果を1つの登録帳
票として扱っていてもよい。この場合も以下の説明がそ
のまま当てはまる。
作成処理について説明する。図2を参照して説明したよ
うに、帳票を登録する際には、その帳票の画像の入力
(ステップS31)、帳票の各構成要素の抽出(ステッ
プS32)を行う。そこで、ハッシュテーブルを作成す
るために、既にフォーマット情報記憶部4に記憶されて
いるフォーマット情報を基に、罫線枠の中心座標、文字
列枠の中心座標、連結枠情報などの特徴量を抽出し、こ
れらの値を規格化する。例えば、最大値を「1」とした
場合の相対的な値を算出する(ステップS33)。
線枠の中心座標、文字列枠の中心座標といった各特徴量
毎にハッシュテーブルテーブルを作成する。
を用いた場合のハッシュテーブルの一例を示す。全ての
登録帳票(A〜F)の罫線枠の中心座標をハッシュテー
ブル上に埋め込んだ場合を示している。傾きに関しては
直線データをもとに傾き補正してあることを前提として
いるので、罫線枠は水平・垂直線分のみから構成されて
いると考えてよい。ここでは、ハッシュテーブルを作成
するときの基底(規格化する特徴量のパラメータ)のと
り方は、水平・垂直線分上に位置する点で表現する。特
に、帳票の場合には連結する長方形枠が多く存在するこ
とから、基底には、連結長方形枠の外接図形の幅と高さ
情報を用いる。規定には、帳票そのものののサイズを用
いてもよいし、基準になるものが統一されていればよ
い。
して、ハッシュテーブルを用いた帳票識別処理動作につ
いて説明する。図7を参照して説明したように、帳票の
識別を行う際には、識別対象の帳票の画像の入力(ステ
ップS41)、罫線、文字枠などの特徴量の抽出を行う
(ステップS42)。
心座標、文字列枠の中心座標、連結枠情報などの特徴量
を抽出し、これらの値を規格化する(ステップS4
3)。
てハッシュテーブル上の当該特徴量に該当する特徴点の
エリアを検索する(ステップS44)。このエリアは予
め定められた範囲の検索エリアで、そのエリア内に登録
帳票の特徴点があれば、その登録帳票に投票する(ステ
ップS45)。具体的には、登録された登録帳票名(フ
ォーマット番号)ごとにヒストグラムを作成しておい
て、検索したエリア内の登録帳票名(フォーマット番
号)ごとに投票を行う。これらの処理を識別対象の帳票
の有する特徴点の数だけ繰り返し(ステップS46)、
ヒストグラムの最も大きい登録帳票との類似度を計算
し、識別結果として出力する(ステップS47、ステッ
プS48)。
座標にるハッシュテーブルにおいて、登録帳票が6枚あ
るとして、識別対象の帳票として、フォーマット番号
「A」の帳票(サンプル帳票)を識別する場合について
説明する。当該サンプル帳票には特徴点が9点あり、図
11のハッシュテーブル上のハッチング部分は各特徴点
に対応する予め定めれた範囲の検索エリアである。この
場合、図12に示すように、サンプル帳票の特徴点に対
応する各検索エリアに存在する登録帳票の特徴点を基に
各登録帳票に投票した結果、フォーマット番号「A」の
登録帳票の投票数は「8」と最も大きく、次に、フォー
マット番号「D」の登録帳票の投票数「2」、フォーマ
ット番号「E」の登録帳票の投票数「1」、フォーマッ
ト番号「F」の登録帳票の投票数「1」と続いている。
求めることにする。類似度は、例えば次式(1)で定義
されるものであるとする。すなわち、各登録帳票tの投
票数をNt、識別対象の帳票の長方形枠数をk、登録帳
票tの長方形枠数をRtとすると、類似度Sは、 S = (Nt×2×100)/(k+Rt) …(1) と表すことができる。
図12に示す。
いるのは、類似度が最も高いフォーマット番号「A」の
登録帳票であることが分かる。
別方法について説明したが、この場合に限らず、他の識
別方法を用いてもよい。
ついて第2の特徴量を用いた詳細調査を行うことを考え
る。この時点で、フォーマット番号「A」の登録帳票が
1つの登録帳票のみであれば、それを識別結果として出
力すればよく(ステップS26)、第2の特徴量を用い
た詳細調査は省略できる。
ト番号「A」という登録帳票には、(a)図、(b)図
に示すような2種類の登録帳票が含まれているとする。
これらの2つの登録帳票は、罫線枠、罫線枠の色がとも
に同一であり、異なる部分は、プレ印字されている文字
列である。したがって、この2つの登録帳票のフォーマ
ット情報には、識別に必要な文字枠(文字領域)と文字
列とが含まれている。
(a)、(b)に示した各登録帳票のフォーマット情報
は、文字識別すべき2カ所のプレ印字領域R1、R2が
登録されている。詳細調査が必要な場合は、識別対象の
帳票(サンプル帳票)に対し、この2カ所に記載されて
いる文字列を順次抽出し、文字認識を行う(ステップS
18〜ステップS19)。1カ所の文字認識で1つの登
録帳票に確定できなかったときは、確定できるまで文字
認識を繰り返す(ステップS18〜ステップS19)。
方法を用いればよい。ここで認識された文字列が図13
(a)、(b)のどちらか一方の帳票に一致するか、ま
たは、一致度が高いかによって、詳細識別結果とする。
細調査が必要なくなれば、識別対象の帳票がある1つの
登録帳票に一致したことになり(ステップS18)、そ
の識別結果を出力または保存する(ステップS26)。
字認識すれば、どちらの帳票であるか確定できるが、こ
こで確定できない場合は、さらに、プレ印字領域R2を
文字認識する、他の特徴量を用いて、さらに詳細調査を
繰り返す。ここでは、帳票が確定できるまで特徴量をか
えて識別を行うか、またはもっとも類似しているものを
提示してもよい。該当帳票がない場合には新しく登録追
加することも可能である。
る登録帳票の分類について、より詳細に説明する。
のフォーマット情報をイメージ的に示してものである。
図15において、登録帳票AとBとC、DとEは、それ
ぞれ罫線構造としては共通のものを持ち登録帳票AとB
とE、CとDは、用いられる色としては共通である。こ
のように、各特徴(色、罫線、プレ印字#1、プレ印字
#2)による分類を行うと、図16のように、それぞれ
の特徴について2つのグループに分類できる。
ステップS16で選定される第1の特徴量が色情報であ
るとすると、この段階で絞り込まれた登録帳票に対し、
さらに第2の特徴量として罫線を用いて、前述したよう
に、ハッシュテーブルを用いて帳票の識別を行う。この
様に、帳票登録時に識別に用いられる特徴量を想定し、
登録帳票を分類しておくことによって、識別作業の効率
化および識別誤りの削減ができる。
の画像のタイプによって識別に用いる特徴量を選択する
場合について、図17に示すフローチャートを参照して
説明する。
象の帳票の画像がディスプレイ装置6上に表示される
(ステップS51)。そして、この入力画像がどの画像
タイプ(2値画像、濃淡画像、カラー画像)に属するか
を判断する(ステップS52)。画像タイプの判断に
は、ユーザがいずれの画像タイプであるかを指示するこ
とにより判断するようにしてもよい。
量が異なる。すなわち、例えば、2値画像の場合は、罫
線枠、プレ印字文字(ステップS54)、濃淡画像の場
合は、濃淡の濃度分布、罫線枠、プレ印字文字(ステッ
プS55)、カラー画像の場合は、罫線色、罫線枠、プ
レ印字文字(ステップS56)が特徴量としてあげられ
る。最後に各特徴量のうちで、第1の特徴量を選定する
(ステップS57)。
量として罫線枠を選定する。同様に、濃淡画像の場合に
は濃度分布、カラー画像の場合には罫線色を第1の特徴
量として選定する。その後は、各画像タイプに対応した
特徴量の抽出処理のみを行って、前述したようなハッシ
ュテーブルを用いた帳票識別、プレ印字文字の照合等を
行えばよい。
べき特徴量が限定されるので、帳票識別結果を得るまで
の時間が短縮できる。
に限らず、他の特徴量を用いてもよい。同様に、画像タ
イプによって、識別に用いる特徴量は、第1の特徴量に
限らず、第2、第3の特徴量を併用してもよい。
果、該当する帳票が得られなかった場合、すなわち、未
登録の帳票の識別を行ってしまった場合の処理動作につ
いて、図18に示すフローチャートを参照して説明す
る。
61、ステップS62)、識別対象の帳票と同一の登録
帳票が存在したときは、それを帳票識別結果として出力
する(ステップS63、ステップS64)。以上の詳細
な処理は、図7に示したフローチャートと同様である。
一方、識別対象の帳票と同一の登録帳票が存在しなかっ
たとき(ステップS63)、類似帳票があるかどうかを
判断する(ステップS65)。類似帳票であるかどうか
は、検索時に用いた類似度など帳票の類似性を評価でき
るものを用いて、評価する。そして、類似度が所定の閾
値以上のものを提示してもよいし、もっとも類似度が高
いものを提示してもよい。ここで類似する帳票が存在し
ない場合は、現在識別しようとしている入力された帳票
を図2に示したように新規登録する(ステップS6
6)。
フォーマット情報を流用して、現在識別しようとしてい
る帳票の追加登録を行う(ステップS67)。
マット情報の登録帳票が既に登録されていて、現在識別
しようとしている入力された帳票が図19(b)である
とする。そして、この入力帳票に最も類似するものが図
19(a)に示した登録帳票であるとする。
示す帳票とは、プレ印字文字のみしか違わないので、改
めて登録するには、登録の手間がかかる他、フォーマッ
ト情報記憶部4における登録帳票のフォーマット情報の
容量も必要になるので、ここでは、図19(a)に示す
登録帳票の変形として、図19(b)に示す帳票中の異
なる部分、すなわち、プレ印字文字のみを追加登録し
て、新たな登録帳票の登録を行うものである。
報を流用した登録帳票の登録方法としては、例えば、図
20に示したように、罫線タイプと色、プレ印字文字を
別々に部品登録し、各登録帳票は、そのフォーマット番
号に対応させて、例えば、図21に示すように、図20
に示した部品の組み合わせで表現する。
て、それらを組み合わせて1つの登録帳票のフォーマッ
ト情報を作成することにより、部分的に一致する複数の
登録帳票を登録する場合、登録の手間を最小限にし、ま
た、登録データ容量も減らすことが可能になる。
同様に行える。
識別モードに共通して言えることだが、例えば、図2の
ステップS3における色解析処理、図7のステップS1
3における色解析処理において、入力された帳票画像の
各画素に対して、その画素の持つ色の情報が抽出すべき
色であるかどうかを判断する過程における処理について
説明する。すなわち、抽出すべき色とそれ以外の取り除
くべき色または背景色が存在する状態から、抽出すべき
色を抽出するか、または、不要なものを取り除く操作を
行う時に、抽出すべきものと、それ以外の両者の中間的
な状態である中間色であると判断された画素の周囲の画
素の色の判定状態を調べ、これによって、その画素が抽
出すべき色を持つかどうかを判断する。
以上述べたような色判断処理動作について説明する。
る。図23(a)は、原画像である。ここで、領域x1
は黒線、領域x2、x3は色付きの線である。図23
(a)に示した原図ををスキャンした直後の画像データ
を図23(b)に示す。図23(b)において、領域x
5は、黒と判断される部分、領域x4、x6は、色付き
と判断される部分である。スキャナでは、このように、
黒の領域における色付きの領域との境界上が色付きとな
ることがある。 そこで、まず、図23(b)に示した
ようなデータから黒の領域x5のみを抽出する(ステッ
プS71)。次に、図23(c)に示すように、この黒
の領域x5の周辺領域はx4、x6であるが、この領域
x4、x6の色を調べる(ステップS72)。領域x
4、x6の色が白でない、すなわち、中間色であるとき
は、この領域を黒と判定する(ステップS73、ステッ
プS74)。そして、このとき黒と判定された領域x
4、x6と、もともと黒と判定されている領域x5とを
合わせて図23(d)に示すように、黒領域と定める。
の逆を行う。まず、色付きと判断される領域x4、x6
を抽出し、これと接しているとともに、黒領域と判断さ
れる領域x5に接していない領域、すなわち領域x2、
x3に相当する部分を抽出し、これを色付き領域と判定
する。
域x13の左側境界部分x12が色付きになっていない
場合には、上記の方法では、領域x12が色付きとは見
なされずに抽出からもれてしまう。そこで、次のような
処理を行う。
判断される領域x13に接していない領域、すなわち、
領域x11を抽出し、それとは別の黒領域x13と接し
ている色付きの領域x12、x14を抽出する。領域x
12、x14のうち、色付きと判断された領域、すなわ
ち、領域x11に接している部分を色付きと判断する。
こうすることによって、領域x11、x12を色付きと
して抽出される。
で説明しているが、色については何を対象にしてもよ
い。一般に抽出すべき色(複数の色でもよく、以下同様
に「色」といった場合に必ずしも単色を意味するもので
はない。また、色には、白や黒、灰色なども含めて考え
る)に対して、それ以外の色または背景色が存在する状
態から、抽出すべき色を抽出するか、または不要なもの
を取り除く操作を行うときに、両者の中間色の考え方を
導入し、この中間色であると判断された画素の周囲の画
素の状態、すなわち、抽出すべき色かそうでないか、ま
た、中間色であるなどの状態によって、最終的にその画
素を抽出すべきか否かを判断する。
背景になる色の平均として定義される色と定義してもよ
い。
態によれば、色情報または罫線情報またはプレ印字文字
の認識結果など、複数の特徴を有する登録帳票を共通の
特徴で予め分類しておくことにより、検索範囲を絞りな
がら、大量・多品種の帳票の識別を可能にし、性能のよ
い帳票識別結果を得ることができる。
素の組み合わせとして管理することによって、効率よい
帳票登録が可能になる。
複数の特徴を有する大量・多品種の帳票の識別を可能に
し、性能のよい帳票識別結果を得ることができる。
の構成例を示した図。
ーチャート。
図。
ーチャート。
のフローチャート。
具体例を示した図。
を説明するためのフローチャート。
示した図。
果の一例を示した図。
示した図。
示した図。
た結果の一例を示した図。
に用いる特徴量を選択する場合の処理動作を説明するた
めのフローチャート。
ローチャート。
例を示した図。
品の登録例を示した図。
表現した場合の帳票の登録例を示した図。
ート。
Claims (10)
- 【請求項1】 入力された識別対象の帳票の画像から複
数の特徴量を抽出し、そのうちの1つと登録帳票の特徴
量とを比較して該識別対象の帳票の種別が識別できなか
ったとき、前記複数の特徴量のうちの他の特徴量と前記
登録帳票の特徴量とを比較して該識別対象の帳票の種別
を識別することを特徴とする帳票識別方法。 - 【請求項2】 入力された帳票の画像から帳票の種別を
特定するための色および罫線および文字列のうちの少な
くとも1つを特徴量として抽出し、複数の登録帳票をこ
れらに共通する前記特徴量で予め分類しておき、入力さ
れた識別対象の帳票の画像から抽出された前記特徴量の
うち、該識別対象の帳票の種別を識別する際に用いる特
徴量を選択し、この選択された特徴量で分類された登録
帳票の特徴量に基づき該識別対象の帳票の種別を識別す
ることを特徴とする帳票識別方法。 - 【請求項3】 入力された識別対象の帳票の画像の種別
に応じて、該帳票の画像から抽出する特徴量を選択する
ことを特徴とする請求項2記載の帳票識別方法。 - 【請求項4】 前記識別対象の帳票の画像から抽出され
た特徴量に一致する帳票が登録されていないとき、該特
徴量に最も類似する登録帳票の特徴量を用いて該帳票を
登録することを特徴とする請求項2記載の帳票識別方
法。 - 【請求項5】 帳票の特徴量として色を抽出する際、各
画素の色を周辺画素の色を基に判定することを特徴とす
る請求項2記載の帳票識別方法。 - 【請求項6】 入力された識別対象の帳票の画像から複
数の特徴量を抽出する抽出手段と、 この抽出手段で抽出された複数の特徴量のうちの1つと
登録帳票の特徴量とを比較して該識別対象の帳票の種別
を識別する第1の識別手段と、 この第1の識別手段で前記識別対象の帳票の種別が識別
できなかったとき、前記複数の特徴量のうちの他の特徴
量と前記登録帳票の特徴量とを比較して該識別対象の帳
票の種別を識別する第2の識別手段と、 を具備したことを特徴とする帳票識別装置。 - 【請求項7】 入力された帳票の画像から帳票の種別を
特定するための色および罫線および文字列のうちの少な
くとも1つを特徴量として抽出する抽出手段と、 複数の登録帳票をこれらに共通する前記特徴量で分類す
る分類手段と、 入力された識別対象の帳票の画像から抽出された前記特
徴量のうち、該識別対象の帳票の種別を識別する際に用
いる特徴量を選択し、この選択された特徴量で分類され
た登録帳票の特徴量に基づき該識別対象の帳票の種別を
識別する識別手段と、 を具備することを特徴とする帳票識別装置。 - 【請求項8】 入力された識別対象の帳票の画像の種別
に応じて、該帳票の画像から抽出する特徴量を選択する
ことを特徴とする請求項7記載の帳票識別装置。 - 【請求項9】 前記識別対象の帳票の画像から抽出され
た特徴量に一致する帳票が登録されていないとき、該特
徴量に最も類似する登録帳票の特徴量を用いて該帳票を
登録することを特徴とする請求項7記載の帳票識別装
置。 - 【請求項10】 入力された帳票の画像から帳票の種別
を特定するための色および罫線および文字列のうちの少
なくとも1つを特徴量として抽出させる抽出手段と、 複数の登録帳票をこれらに共通する前記特徴量で分類さ
せる分類手段と、 入力された識別対象の帳票の画像から抽出された前記特
徴量のうち、該識別対象の帳票の種別を識別する際に用
いる特徴量を選択し、この選択された特徴量で分類され
た登録帳票の特徴量に基づき該識別対象の帳票の種別を
識別させる識別手段と、 を実行するプログラムを記録した機械読み取り可能な記
憶媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP09376299A JP3851742B2 (ja) | 1999-03-31 | 1999-03-31 | 帳票処理方法及び装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP09376299A JP3851742B2 (ja) | 1999-03-31 | 1999-03-31 | 帳票処理方法及び装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2000285190A true JP2000285190A (ja) | 2000-10-13 |
| JP3851742B2 JP3851742B2 (ja) | 2006-11-29 |
Family
ID=14091455
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP09376299A Expired - Fee Related JP3851742B2 (ja) | 1999-03-31 | 1999-03-31 | 帳票処理方法及び装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3851742B2 (ja) |
Cited By (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2008026414A1 (fr) * | 2006-08-31 | 2008-03-06 | Osaka Prefecture University Public Corporation | Procédé de reconnaissance d'image, dispositif de reconnaissance d'image et programme de reconnaissance d'image |
| WO2008107997A1 (ja) * | 2007-03-08 | 2008-09-12 | Fujitsu Limited | 帳票種識別プログラム、帳票種識別方法および帳票種識別装置 |
| US7508986B2 (en) | 2003-11-28 | 2009-03-24 | Canon Kabushiki Kaisha | Document recognition device, document recognition method and program, and storage medium |
| JP2009069991A (ja) * | 2007-09-11 | 2009-04-02 | Ricoh Co Ltd | 情報処理装置,プログラム,および記録媒体 |
| JP2011123598A (ja) * | 2009-12-09 | 2011-06-23 | Canon Inc | 原稿判別装置、原稿判別方法及びプログラム |
| US8045229B2 (en) | 2007-08-21 | 2011-10-25 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method and medium |
| WO2012035789A1 (ja) * | 2010-09-13 | 2012-03-22 | 三菱電機株式会社 | 空調制御装置、空調制御方法、及び、プログラム |
| JP2012198684A (ja) * | 2011-03-18 | 2012-10-18 | Pfu Ltd | 情報処理装置、帳票種別推定方法および帳票種別推定用プログラム |
| US8418050B2 (en) | 2007-11-09 | 2013-04-09 | Fujitsu Limited | Computer readable recording medium on which form data extracting program is recorded, form data extracting apparatus, and form data extracting method |
| US8589416B2 (en) | 2010-01-20 | 2013-11-19 | Fuji Xerox Co., Ltd. | System and method of performing data processing on similar forms |
| JP2017175524A (ja) * | 2016-03-25 | 2017-09-28 | 株式会社日立ドキュメントソリューションズ | 文書管理システムおよびイメージデータ管理方法 |
| JP2017199086A (ja) * | 2016-04-25 | 2017-11-02 | 富士通株式会社 | 帳票認識方法、帳票認識装置、帳票認識プログラム、及び帳票認識用辞書データ |
| JP2019169025A (ja) * | 2018-03-26 | 2019-10-03 | 株式会社Pfu | 情報処理装置、文字認識エンジン選択方法及びプログラム |
| JP2021033743A (ja) * | 2019-08-27 | 2021-03-01 | 株式会社日立製作所 | 情報処理装置、文書識別方法、及び情報処理システム |
| JP2021131659A (ja) * | 2020-02-19 | 2021-09-09 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、制御方法、及びプログラム |
| US11354496B2 (en) | 2020-02-28 | 2022-06-07 | Fujifilm Business Innovation Corp. | Information processing apparatus and non-transitory computer readable medium storing program |
| JP2022543052A (ja) * | 2020-06-29 | 2022-10-07 | 北京市商▲湯▼科技▲開▼▲發▼有限公司 | 文書処理方法、文書処理装置、文書処理機器、コンピュータ可読記憶媒体及びコンピュータプログラム |
-
1999
- 1999-03-31 JP JP09376299A patent/JP3851742B2/ja not_active Expired - Fee Related
Cited By (28)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7508986B2 (en) | 2003-11-28 | 2009-03-24 | Canon Kabushiki Kaisha | Document recognition device, document recognition method and program, and storage medium |
| US8199973B2 (en) | 2006-08-31 | 2012-06-12 | Osaka Prefecture University Public Corporation | Image recognition method, image recognition device, and image recognition program |
| WO2008026414A1 (fr) * | 2006-08-31 | 2008-03-06 | Osaka Prefecture University Public Corporation | Procédé de reconnaissance d'image, dispositif de reconnaissance d'image et programme de reconnaissance d'image |
| JP4883649B2 (ja) * | 2006-08-31 | 2012-02-22 | 公立大学法人大阪府立大学 | 画像認識方法、画像認識装置および画像認識プログラム |
| WO2008107997A1 (ja) * | 2007-03-08 | 2008-09-12 | Fujitsu Limited | 帳票種識別プログラム、帳票種識別方法および帳票種識別装置 |
| JPWO2008107997A1 (ja) * | 2007-03-08 | 2010-06-10 | 富士通株式会社 | 帳票種識別プログラム、帳票種識別方法および帳票種識別装置 |
| US8275792B2 (en) | 2007-03-08 | 2012-09-25 | Fujitsu Limited | Document type identifying method and document type identifying apparatus |
| CN101622632B (zh) * | 2007-03-08 | 2011-12-21 | 富士通株式会社 | 账票种类识别程序、账票种类识别方法以及账票种类识别装置 |
| US8045229B2 (en) | 2007-08-21 | 2011-10-25 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method and medium |
| JP2009069991A (ja) * | 2007-09-11 | 2009-04-02 | Ricoh Co Ltd | 情報処理装置,プログラム,および記録媒体 |
| US8418050B2 (en) | 2007-11-09 | 2013-04-09 | Fujitsu Limited | Computer readable recording medium on which form data extracting program is recorded, form data extracting apparatus, and form data extracting method |
| JP2011123598A (ja) * | 2009-12-09 | 2011-06-23 | Canon Inc | 原稿判別装置、原稿判別方法及びプログラム |
| US8589416B2 (en) | 2010-01-20 | 2013-11-19 | Fuji Xerox Co., Ltd. | System and method of performing data processing on similar forms |
| CN103097826A (zh) * | 2010-09-13 | 2013-05-08 | 三菱电机株式会社 | 空气调节控制装置、空气调节控制方法以及程序 |
| EP2618069A4 (en) * | 2010-09-13 | 2018-03-21 | Mitsubishi Electric Corporation | Air conditioning control device, air conditioning control method and program |
| WO2012035789A1 (ja) * | 2010-09-13 | 2012-03-22 | 三菱電機株式会社 | 空調制御装置、空調制御方法、及び、プログラム |
| JP5595507B2 (ja) * | 2010-09-13 | 2014-09-24 | 三菱電機株式会社 | 空調制御装置、空調制御方法、及び、プログラム |
| CN103097826B (zh) * | 2010-09-13 | 2015-08-05 | 三菱电机株式会社 | 空气调节控制装置以及空气调节控制方法 |
| US9194601B2 (en) | 2010-09-13 | 2015-11-24 | Mitsubishi Electric Corporation | Air conditioning control device, air conditioning control method and program |
| JP2012198684A (ja) * | 2011-03-18 | 2012-10-18 | Pfu Ltd | 情報処理装置、帳票種別推定方法および帳票種別推定用プログラム |
| JP2017175524A (ja) * | 2016-03-25 | 2017-09-28 | 株式会社日立ドキュメントソリューションズ | 文書管理システムおよびイメージデータ管理方法 |
| JP2017199086A (ja) * | 2016-04-25 | 2017-11-02 | 富士通株式会社 | 帳票認識方法、帳票認識装置、帳票認識プログラム、及び帳票認識用辞書データ |
| JP2019169025A (ja) * | 2018-03-26 | 2019-10-03 | 株式会社Pfu | 情報処理装置、文字認識エンジン選択方法及びプログラム |
| JP2021033743A (ja) * | 2019-08-27 | 2021-03-01 | 株式会社日立製作所 | 情報処理装置、文書識別方法、及び情報処理システム |
| JP7312646B2 (ja) | 2019-08-27 | 2023-07-21 | 株式会社日立製作所 | 情報処理装置、文書識別方法、及び情報処理システム |
| JP2021131659A (ja) * | 2020-02-19 | 2021-09-09 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、制御方法、及びプログラム |
| US11354496B2 (en) | 2020-02-28 | 2022-06-07 | Fujifilm Business Innovation Corp. | Information processing apparatus and non-transitory computer readable medium storing program |
| JP2022543052A (ja) * | 2020-06-29 | 2022-10-07 | 北京市商▲湯▼科技▲開▼▲發▼有限公司 | 文書処理方法、文書処理装置、文書処理機器、コンピュータ可読記憶媒体及びコンピュータプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3851742B2 (ja) | 2006-11-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6996295B2 (en) | Automatic document reading system for technical drawings | |
| US8059868B2 (en) | License plate recognition apparatus, license plate recognition method, and computer-readable storage medium | |
| US6687401B2 (en) | Pattern recognizing apparatus and method | |
| JP3851742B2 (ja) | 帳票処理方法及び装置 | |
| US7519226B2 (en) | Form search apparatus and method | |
| JP2951814B2 (ja) | 画像抽出方式 | |
| US8059896B2 (en) | Character recognition processing system and computer readable medium storing program for character recognition processing | |
| US9171224B2 (en) | Method of improving contrast for text extraction and recognition applications | |
| JPH1011531A (ja) | 帳票読取装置 | |
| US8036461B2 (en) | Method of graphical objects recognition using the integrity principle | |
| CN111814576A (zh) | 一种基于深度学习的购物小票图片识别方法 | |
| JPWO2000062243A1 (ja) | 文書画像中の基本成分に基づく文字列抽出装置および方法 | |
| JPH09319824A (ja) | 帳票認識方法 | |
| KR101937398B1 (ko) | 고문서의 이미지 데이터에서의 문자 추출 시스템 및 이를 이용한 문자 추출 방법 | |
| Van Phan et al. | Collecting handwritten nom character patterns from historical document pages | |
| JP2001126010A (ja) | 帳票処理装置、帳票定義作成方法、領域抽出方法及び記憶媒体 | |
| JP2005250786A (ja) | 画像認識方法 | |
| JP3090070B2 (ja) | 帳票識別方法及び装置 | |
| JP3476595B2 (ja) | 画像領域分割方法、および画像2値化方法 | |
| Aparna et al. | A complete OCR system development of Tamil magazine documents | |
| JP4194309B2 (ja) | 文書方向推定方法および文書方向推定プログラム | |
| JP3276555B2 (ja) | フォーマット認識装置及び文字読取り装置 | |
| US20060194187A1 (en) | Material processing apparatus, material processing method, and program product | |
| JP3957471B2 (ja) | 分離文字列統合装置 | |
| KR20090123523A (ko) | 광학 문자 인식 시스템 및 방법 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050311 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060613 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060814 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060829 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060904 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090908 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100908 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100908 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110908 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120908 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120908 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130908 Year of fee payment: 7 |
|
| LAPS | Cancellation because of no payment of annual fees |