JP2012181743A - 画像処理装置及び画像処理方法 - Google Patents

画像処理装置及び画像処理方法 Download PDF

Info

Publication number
JP2012181743A
JP2012181743A JP2011045113A JP2011045113A JP2012181743A JP 2012181743 A JP2012181743 A JP 2012181743A JP 2011045113 A JP2011045113 A JP 2011045113A JP 2011045113 A JP2011045113 A JP 2011045113A JP 2012181743 A JP2012181743 A JP 2012181743A
Authority
JP
Japan
Prior art keywords
area
region
image
black
white
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011045113A
Other languages
English (en)
Inventor
Masaru Sekiguchi
優 関口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2011045113A priority Critical patent/JP2012181743A/ja
Publication of JP2012181743A publication Critical patent/JP2012181743A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

【課題】画像データの指定した領域で罫線などの余分な要素を含むことなく高い認識精度で文字などの画像を認識することができる画像処理装置を提供する。
【解決手段】ユーザに画像データ中から指定領域を指定させる指定領域入力部204と、前記画像データを白黒画素からなる二値画像とし、該二値画像における黒画素と白画素の分布状態から前記指定領域の外周領域における境界線を決定し、前記指定領域を含めて該境界線に囲まれる領域を一次領域とする一次領域設定部205と、前記一次領域における画像データから罫線を抽出し除外する二次領域設定部210と、罫線除外後領域データD2について前記指定領域に基づいて目的の画像を切り出すための矩形抽出処理を行いその外接領域を抽出する外接領域抽出処理部215aと、前記外接領域を除外領域と包含領域に選別する除外/包含処理部215bと、前記包含領域をマージする統合処理部215cと、を備える。
【選択図】図4

Description

本発明は、文書画像内の指定された領域を自動的に判定して抽出する画像処理を行う画像処理装置及び画像処理方法に関するものである。
帳票認識処理において、文書画像中の特定箇所の文字を切り出して、その箇所を確認表示したり、文字認識したり、切り出された箇所を再利用したりするという場面がある。
例えば特許文献1では、表中の文字列などの要素を矩形・線・フリーバンドで大まかに指定すると、自動でその範囲内にある文字部分だけを抽出して表示するという目的で、指定された線を構成する座標データのうちの任意の基準点に基づいて、ヒストグラム測定及びブロック単位測定の少なくとも1つが行われる測定範囲を決定する測定範囲決定手段と、決定した測定範囲内の画素に対してヒストグラム測定及びブロック単位測定の少なくとも1つを行う測定手段と、その測定結果に基づいて除外領域及び包含領域を決定する第1の除外包含手段と、決定した包含領域をマージした判定後領域の外接領域を抽出する外接領域抽出手段と、抽出した外接領域について除外領域及び包含領域を決定する第2の除外包含手段と、決定した包含領域をマージして統合領域とする統合領域決定手段とを備える構成が開示されている。
しかしながら、例えば、手書き文字の場合、「撥ね」や「伸ばし」に癖がある字体になっており、「撥ね」や「伸ばし」が罫線の線に接触して書かれていることが多い(図6(a),(b)参照)。また、活字であっても、印字時のズレで、文字が罫線の線に接触することがある(図6(c),(d)参照)。特許文献1記載の発明では、そのようなケースには対応できておらず、文字に接触している線までが一緒に抽出されるという問題があった。
また、特許文献2では、図1のように文字列の下に線が引かれているものに対して、文字切り出しをするという目的で、文書画像から抽出された行を黒画素群の外接矩形に切り分ける外接矩形抽出処理部と、当該外接矩形抽出処理部により切り分けられた外接矩形内で、黒画素の連続である黒ランが所定の長さ以上に亘っている部分を探索する黒ラン探索処理部と、当該黒ラン探索処理部により探索された黒ランから外接矩形の内側にある図形と前記黒ランとの間の間隙を探索する間隙探索処理部と、当該間隙探索処理部により探索された外接矩形内の画像から前記間隙よりも黒ラン側の画像を除去する線図形消去処理部と、当該線図形消去処理部で加工された画像に対し、再度外接矩形抽出処理を行なう外接矩形再抽出処理部とを備える構成が開示されている。
しかしながら、下線だけを対象としており、図2に示すようなパターンの下線は想定されていないため、そのようなパターンの下線が文字と一緒に切り出されてしまうという問題があった。
本発明は、以上の従来技術における課題に鑑みてなされたものであり、画像データの指定した領域において、罫線などの余分な要素を含むことなく高い認識精度で文字などの目的の画像種類の画像(目標画像)を認識することができる画像処理装置及び画像処理方法を提供することを目的とする。
前記課題を解決するために提供する本発明は、以下の通りである。なお、カッコ内に本発明を実施するための形態において対応する部位及び符号等を示す。
〔1〕 ユーザに対して、画像データ中から抽出する箇所を指定領域(指定領域A0)として指定させる抽出対象領域指定手段(指定領域入力部204)と、前記画像データを白黒画素からなる二値画像とし、該二値画像における黒画素と白画素の分布状態(黒画素と白画素の分布状態dh)から前記指定領域の所定の外周領域における境界線を決定し、前記指定領域を含めて該境界線に囲まれる領域を一次領域(判定後領域A1)とする一次領域設定手段(一次領域設定部205)と、前記一次領域における画像データから直線成分データ(罫線Lk)を抽出し除外する直線成分除外手段(二次領域設定部210)と、前記直線成分除外後の前記画像データ(罫線除外後領域データD2)について前記指定領域に基づいて目的の画像種類の画像を切り出すための矩形抽出処理を行いその外接領域を抽出する外接領域抽出手段(外接領域抽出処理部215a)と、前記外接領域について除外領域と包含領域(包含領域Ac)に選別する除外包含手段(外接領域の除外/包含処理部215b)と、前記包含領域をマージして統合領域(統合領域A3)とする統合処理手段(外接領域の統合処理部215c)と、を備えることを特徴とする画像処理装置(画像処理装置100、図3,図4)。
〔2〕 前記抽出対象領域指定手段は、ユーザに複数の点、直線、自由曲線のいずれかを用いて前記指定領域を指定させることを特徴とする前記〔1〕に記載の画像処理装置。
〔3〕 前記一次領域設定手段は、前記画像データの画素データが白黒ではない二値画像あるいは少なくとも3色以上の画像データであるときは、該画素データを白黒二値に減色する二値化処理手段(二値化処理部205a)と、前記指定領域の外辺を基準とし、該基準に基づいて前記指定領域の所定の外周領域をヒストグラム測定の測定範囲(測定範囲Am)として決定する測定範囲決定手段(ヒストグラム測定範囲決定部205b)と、前記測定範囲決定手段が決定した測定範囲において前記二値化処理手段により得られた二値画像の画素に対して、黒画素及び白画素のヒストグラム測定を行う測定手段(ヒストグラム測定部205c)と、前記測定手段が測定した結果に基づいて、黒画素と白画素の分布状態(黒画素と白画素の分布状態dh)から前記外周領域における境界線を決定し、前記指定領域を含めて該境界線に囲まれる領域を一次領域(判定後領域A1)とする領域判定手段(ヒスト頻度による境界線処理部205d)と、からなることを特徴とする前記〔1〕または〔2〕に記載の画像処理装置(図4)。
〔4〕 前記測定手段は、前記測定範囲内において、所定方向における黒画素を示す黒領域が連続して生起する回数を計数し、その計数を前記所定方向に直交する方向に位置を変えて繰り返して行う黒画素探索と、所定方向における白画素を示す白領域が連続して生起する回数を計数し、その計数を前記所定方向に直交する方向に位置を変えて繰り返して行う白画素探索と、を行い(図9)、前記領域判定手段は、前記測定手段による黒画素探索及び白画素探索により計数された前記黒領域が連続して生起する回数と白領域が連続して生起する回数の関係を前記所定方向に直交する方向の測定位置ごとに所定の閾値と比較し、該比較結果に基づいて前記外周領域における境界線を決定する(図10)ことを特徴とする前記〔3〕に記載の画像処理装置。
〔5〕 前記直線成分除外手段は、前記一次領域における画像データから少なくとも1本の罫線データを抽出することを特徴とする前記〔1〕〜〔4〕のいずれかに記載の画像処理装置。
〔6〕 前記除外包含手段は、前記外接領域抽出手段により抽出された複数の外接領域それぞれの外接領域内の黒画素または白画素の頻度、黒画素または白画素が連続する大きさ、領域の属性と目的の画像種類の画像との関係から判断して、除外領域と包含領域とに選別することを特徴とする前記〔1〕〜〔5〕のいずれかに記載の画像処理装置。
〔7〕 ユーザに対して、画像データ中から抽出する箇所を指定領域(指定領域A0)として指定させる抽出対象領域指定工程(ステップS102)と、前記画像データを白黒画素からなる二値画像とし、該二値画像における黒画素と白画素の分布状態(黒画素と白画素の分布状態dh)から前記指定領域の所定の外周領域における境界線を決定し、前記指定領域を含めて該境界線に囲まれる領域を一次領域(判定後領域A1)とする一次領域設定工程(ステップS103〜S107)と、前記一次領域における画像データ(判定後領域データD1)から直線成分データ(罫線Lk)を抽出し除外する直線成分除外工程(ステップS108〜S110)と、前記直線成分除外後の前記画像データ(罫線除外後領域データD2)について前記指定領域に基づいて目的の画像種類の画像を切り出すための矩形抽出処理を行いその外接領域を抽出する外接領域抽出工程(ステップS111)と、前記外接領域について除外領域と包含領域(包含領域Ac)に選別する除外包含工程(ステップS112)と、前記包含領域をマージして統合領域(統合領域A3)とする統合処理工程(ステップS113,S114)と、を備えることを特徴とする画像処理方法(図5)。
〔8〕 前記抽出対象領域指定工程は、ユーザに複数の点、直線、自由曲線のいずれかを用いて前記指定領域を指定させるものであることを特徴とする前記〔7〕に記載の画像処理方法。
〔9〕 前記一次領域設定工程は、前記画像データの画素データが白黒ではない二値画像あるいは少なくとも3色以上の画像データであるときは、該画素データを白黒二値に減色する二値化処理工程(ステップS103)と、前記指定領域の外辺を基準とし、該基準に基づいて前記指定領域の所定の外周領域をヒストグラム測定の測定範囲(測定範囲Am)として決定する測定範囲決定工程(ステップS104)と、前記測定範囲決定工程で決定された測定範囲において前記二値化処理工程で得られた二値画像の画素に対して、黒画素及び白画素のヒストグラム測定を行う測定工程(ステップS105)と、前記測定工程で測定された結果に基づいて、黒画素と白画素の分布状態(黒画素と白画素の分布状態dh)から前記外周領域における境界線を決定し(ステップS106)、前記指定領域を含めて該境界線に囲まれる領域を一次領域(判定後領域A1)とする領域判定工程(ステップS107)と、からなることを特徴とする前記〔7〕または〔8〕に記載の画像処理方法(図5)。
〔10〕 前記測定工程は、前記測定範囲内において、所定方向における黒画素を示す黒領域が連続して生起する回数を計数し、その計数を前記所定方向に直交する方向に位置を変えて繰り返して行う黒画素探索と、所定方向における白画素を示す白領域が連続して生起する回数を計数し、その計数を前記所定方向に直交する方向に位置を変えて繰り返して行う白画素探索と、を行うものであり(図9)、前記領域判定工程は、前記測定工程における黒画素探索及び白画素探索により計数された前記黒領域が連続して生起する回数と白領域が連続して生起する回数の関係を前記所定方向に直交する方向の測定位置ごとに所定の閾値と比較し、該比較結果に基づいて前記外周領域における境界線を決定するものである(図10)ことを特徴とする前記〔9〕に記載の画像処理方法。
〔11〕 前記直線成分除外工程は、前記一次領域における画像データから少なくとも1本の罫線データを抽出するものであることを特徴とする前記〔7〕〜〔10〕のいずれかに記載の画像処理方法。
〔12〕 前記除外包含工程は、前記外接領域抽出工程で抽出された複数の外接領域それぞれの外接領域内の黒画素または白画素の頻度、黒画素または白画素が連続する大きさ、領域の属性と目的の画像種類の画像との関係から判断して、除外領域と包含領域とに選別するものであることを特徴とする前記〔7〕〜〔11〕のいずれかに記載の画像処理方法。
本発明の画像処理装置及び画像処理方法によれば、指定された領域に対して、罫線などの不要な要素である直線成分を除外した上で、目標画像の外接領域を切り出すことによって、目標画像の認識精度を高めることができる。例えば、帳票認識処理の過程で、文書画像中の特定箇所の文字を切り出して、その箇所を確認表示したり、文字認識したり、切り出された箇所を再利用したりするという場面において、オペレータが表中の文字列などの要素をフリーバンドで大まかに指定すると、自動でその範囲内にある文字部分だけを抽出して表示することが可能である。特に、画像データの指定領域の範囲内で文字が罫線に接触している場合、罫線を示す線を抽出し、その線を消去した上で、文字部分を示す画素を抽出するので、線に接触している文字に対して、罫線などの余分な要素を抽出せずに済む。また、外接領域について除外領域と包含領域に選別することにより、様々なパターンの下線を余分な要素として除外することが可能になる。
文字列の例(1)を示す図である。 文字列の例(2)を示す図である。 本発明に係る画像処理装置の基本構成を示すブロック図である。 本発明に係る画像処理装置の要部構成を示すブロック図である。 図4の画像処理装置における画像処理方法の手順を示すフローチャートである。 罫線に接触している文字列の例を示す図である。 図6の文字列について領域を指定するときの操作パネル部上のイメージを示す図である。 指定領域に対するヒストグラム測定範囲を示す概念図である。 図8のヒストグラム測定範囲におけるヒストグラム測定の様子を示す概念図である。 ヒストグラム測定結果に基づく境界線の決定方法を示す概念図である。 図9のヒストグラム測定結果に基づいて設定される一次領域を示す概念図である。 図11の一次領域における罫線抽出結果を示す概念図である。 図11の一次領域において罫線を削除して得られる画像データを示す概念図である。 図13の画像データにおいて得られる包含される外接領域とその統合の様子を示す概念図である。 図6の文字列について本発明の画像処理方法を適用して得られた統合領域を示す概念図である。
以下に、本発明に係る画像処理装置及び画像処理方法の構成について説明する。
なお、本発明における用語はつぎのように定義する。
「接触文字」とは、罫線等の直線成分に接触している文字のことである。接触している線の方向は、上下左右問わないものとする。また、接触している文字の字形は活字、手書きともに問わないものとする。
「指定領域」とは、オペレータなどが矩形領域または、フリーバンドで指定した領域のことをいう。
「判定後領域」とは、ヒストグラム測定した結果に基づいて判定した結果の領域データのことをいう。
[画像処理装置]
図3は、本発明に係る画像処理装置の基本構成を示すブロック図である。
図3に示すように、画像処理装置100は、全体の制御などを行うCPU101、原稿などを読み取り、画像データを取得するスキャナ部102、画像データや画像処理部108で行われた画像処理の結果を示す情報などを記憶する、CD/DVD/メモリカードなどの記録媒体111やハードディスク112からなる外部記憶部103、入力した画像データを記憶する入力画像メモリ部104、入力した画像データをプレビュー表示などの表示を行う表示部105、ユーザにより操作が行なわれるとともに、ユーザが画像データの領域を指定するための操作パネル部106、操作パネル部106において指定された領域を示す領域情報を格納する領域情報格納部107、二値化処理、ヒストグラム測定、矩形抽出処理などの画像処理を行う画像処理部108、ネットワーク網110から画像データを取り寄せたり、画像処理の結果を示す情報を配達したりする通信制御部109、を有する。
つぎに、画像処理装置100において本発明の画像処理方法に関わる要部構成について説明する。
図2は、本発明に係る画像処理装置の要部構成を示すブロック図である。図中、矩形は機能ブロック、円柱はデータベース、平行四辺形はデータを意味する。
画像処理装置100は、スキャナ部102での読み取り、外部記憶部103からのファイル読み出し、ネットワーク網110経由、デジタルカメラで撮影したもの等で画像データを取得する画像入力部201と、実際に画像データを蓄積しているデータディスク203などにアクセスするためのデータアクセス部202と、画像データの特定の箇所に領域を指定し、前記画像データにこの指定された領域データ(指定領域A0)を付加した指定領域データD0を出力する指定領域入力部204と、指定領域データD0に対して白黒二値化処理を行う二値化処理部205a,ヒストグラム測定のための範囲を決定するヒストグラム測定範囲決定部205b,黒画素及び/又は白画素のヒストグラムを測定するヒストグラム測定部205c,ヒストグラム測定結果による、ヒストグラム頻度を見て境界線を決定し、指定領域データD0から判定後領域データ(一次領域データ)D1に変更するヒスト頻度による境界線処理部205dからなる一次領域設定部205と、判定後領域データD1について罫線等の直線成分を抽出する直線成分抽出部である罫線抽出部210a、判定後領域データD1から抽出された罫線等の直線成分を除外し、罫線(直線成分)除外後の画像データ(二次領域データ)D2を得る罫線除外部(直線成分除外部)210bからなる直線成分除外手段である二次領域設定部210と、罫線(直線成分)除外後の画像データD2について指定領域A0に基づいて外接領域を抽出する外接領域抽出処理部215a,抽出された外接領域データを除外領域と包含領域に選別する外接領域の除外/包含処理部215b,包含領域である外接領域データを統合して統合領域データD3を得る外接領域の統合処理部215cからなる統合領域設定部215と、統合領域データD3を出力する結果出力部217と、画像入力部201、データアクセス部202、指定領域入力部204、一次領域設定部205、二次領域設定部210、統合領域設定部215、結果出力部217を制御するCPU101と、から構成されている。
[画像処理方法]
図5は、本発明の画像処理方法の手順を示すフローチャートである。
本発明の画像処理方法は、画像処理装置100を用いて、つぎの手順で行われる。なお、以下に説明する処理動作を本発明の画像処理装置に実行させるための画像処理プログラムは、図3,図4に図示しないプログラム記憶部、あるいは、外部記憶部103やネットワーク網110から画像処理装置に読み込まれ、画像処理装置100の動作を制御する。本発明の画像処理装置は、この画像処理プログラムの制御により以下の処理動作を実行する。
(抽出対象領域指定工程)
(S101) まず画像入力部201から画像データを入力する。入力するための画像データの取得は、スキャナ部102で原稿をスキャンしての読み取り、データアクセス部202によるデータディスク203からのファイル読み出し、ネットワーク網110経由、デジタルカメラで撮影したデータ等のいずれでもよい。図6に画像データの例を示す。
(S102) 入力された画像データを操作パネル部106の画面に表示して、ユーザが指定領域入力部204により画像データ中から抽出する箇所を指定して指定領域A0とする。例えば、図7に示すように、ユーザは操作パネル部106の画面上でマウス操作やタッチパネル操作等により、複数の点、直線、自由曲線のいずれかを用いて対象の領域(例えば、図7(b)であれば「理光 太郎」の文字領域)の少なくとも一部を含むようにフリーハンドで囲いAdを描画する。指定領域入力部204は囲いAdに基づいて画像データにおいて矩形の指定領域A0を設定し、指定領域データD0とする(図8参照)。ここでは、入力された画像データはある程度の大きさの矩形ブロックに分割されており、囲いAdの線が通過する矩形ブロックで囲まれる領域が指定領域A0となっている。
以下、図7(b)の画像データを例に処理動作を説明する。
(一次領域設定工程)
(S103) つぎに、二値化処理部205aは、入力された画像データ(指定領域データD0)について白黒画素からなる画像データとする二値化処理を行う。例えば、画素データが白黒ではない二値画像あるいは少なくとも3色以上の画像データであるときは、二値化処理部205aは該画素データを白黒二値に減色する処理を行う。
(S104) ヒストグラム測定範囲決定部205bは、指定領域データD0について、指定領域A0に基づいてヒストグラム測定のための範囲(測定範囲)Amを決定する(図8)。例えば、指定領域A0の外辺(図8において矩形の四辺それぞれ)を基準とし、該基準に基づいて指定領域A0の所定の外周領域をヒストグラム測定の測定範囲Amとして決定する。このとき、測定範囲Amの決定は以下のルールのいずれかで行う。なお、図8ではルール1に基づいた測定範囲Amを示している。
(ルール1)指定領域A0の外辺(左辺、右辺、上辺、下辺)からその外辺に直交する方向の画像データの端部までの領域(矩形の領域)を測定領域Amとする。
(ルール2)指定領域A0の外辺(左辺、右辺、上辺、下辺)から、その外辺に直交する方向に所定の距離まで移動した位置までを測定領域Amとする。ここでいう所定の距離は、例えば指定領域A0の上辺、下辺についての測定領域Amの場合、指定領域A0の幅に係数を乗算した値であり、指定領域A0の左辺、右辺についての測定領域Amの場合、指定領域A0の高さに係数を乗算した値である。
(S105) ヒストグラム測定部205cは、測定範囲Amにおいて二値化処理部205aにより得られた二値画像の画素に対して、黒画素及び白画素のヒストグラム測定を行う(図9)。ヒストグラム測定は、測定範囲Am内において、所定方向にラインスキャンして黒画素を示す黒領域が連続して生起する回数を計数し、その計数を前記所定方向に直交する方向に位置を変えて繰り返して行う黒画素探索と、所定方向における白画素を示す白領域が連続して生起する回数を計数し、その計数を前記所定方向に直交する方向に位置を変えて繰り返して行う白画素探索と、を行う。図9では、前記所定方向とは、指定領域A0の上辺、下辺に対応する測定領域Am(図中上下の測定領域Am)では左右方向、指定領域A0の左辺、右辺に対応する測定領域Am(図中左右の測定領域Am)では上下方向である。あるいは、指定領域A0を図9のように矩形とした場合、指定領域A0の座標が左上角(Xs,Ys)と右下角(Xe,Ye)からなる矩形で構成され、図中上側の測定領域Amについては指定領域A0の上辺を起点(Y=Ys)に、行単位で(図中左右方向にスキャンして)計数しながら図中上方向へヒストグラム測定を行う。他の方向も、同様の要領で測定する。これにより、測定範囲Amごとに黒画素探索結果hbと白画素探索結果hwから黒画素と白画素の分布状態dhが分かる。
(S106) ヒスト頻度による境界線処理部205dは、黒画素と白画素の分布状態dhからヒストグラム頻度(ヒスト頻度と略すことがある)による境界線を決定する処理を行い、指定領域A0の所定の外周領域(すなわち測定領域Am)における境界線を決定する。すなわち、ヒストグラム測定部205cによる黒画素探索及び白画素探索により計数された前記黒領域が連続して生起する回数と白領域が連続して生起する回数の関係を前記所定方向に直交する方向の測定位置ごとに所定の閾値と比較し、該比較結果に基づいて前記外周領域(測定範囲Am)における境界線を決定するものである。
ここで、ヒストグラム頻度による境界線を決定する処理とは、例えば図10に示すように、図10(a)の文字列データについてヒストグラム測定を行った結果(図10(b)の黒画素と白画素の分布状態dh)において、字間や行間と見なせるような所定の間隔をもつ空白箇所が連続する領域Asを識別し、領域Asに境界線が存在すると決定するものである。
このとき、空白の間隔を決定するための値は、以下の条件で決定される。
(条件1)二値化にした画像の黒画素の個数が少なくとも1つ以上あること。
(条件2)黒画素の個数が1つもない(行/列が空白である)空白の間隔が一定値(st)以下であること。
この空白の間隔stは、次式(1)のように画像データの解像度に比例するものとして、様々な解像度に対応できるようにする。具体的には、解像度が100dpiのときは1、200dpiのときは2、・・・600dpiのときは6となり、その値にユーザが指定した係数nで乗算した値が、空白の間隔の一定値(st)となる。
※(解像度/100)の解で小数点以下は切り捨てせず四捨五入する。
※係数nは0以上の正の整数である。
(S107) ついで、ヒスト頻度による境界線処理部205dは、指定領域A0を含めて境界線に囲まれる領域を判定後領域(一次領域)A1とし、判定後領域(一次領域)A1を含む画像データを判定後領域データ(一次領域データ)D1として出力する。すなわち、ステップS106で決定された境界線の結果から、指定領域A0を含めて境界線に囲まれる領域を抽出対象となる領域として判定する。その判定後領域データ(一次領域データ)D1の例を図11に示す。ここでは、目的の文字が罫線等の直線成分に接触しているため、ヒストグラム測定において境界線が罫線(直線成分)及び目的以外の文字の影響を受けて適正な領域よりも広げられる結果となっている。そこで、本発明では、判定後領域データ(一次領域データ)D1について罫線などの不要な要素を除外する処理を行う。なお、ここでいう「不要な要素」とは、文字列の並びに沿うように付帯している罫線や下線などの様々なパターン(直線、ドット、点線、鎖線、二重線など)の直線状の線成分(直線成分)である。
(罫線除外工程)
(S108) 罫線抽出部210aは、判定後領域データD1を基に、罫線抽出処理(直線成分抽出処理ともいう)を行う(図12)。罫線抽出処理は従来公知の方法によればよく、例えば、電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 106(605), 67-72, 2007-03-08(テクスチャ領域を含む帳票画像からの罫線抽出(テーマセッション 2(文字画像処理1),文字・文書の認識・理解))に記載されている技術を利用する。
具体的には、画像中の黒画素の連結性をもとに連続した黒画素に同じラベルを付与する。ラベリングされたラベル値が同一で、主走査方向又は副走査方向に連結していて、かつ妥当な長さおよび幅を持っているとき、罫線矩形データとして抽出する。抽出された少なくとも一つ以上の罫線矩形データ同士が交差している罫線矩形データを連結することにより、表単位の罫線を抽出することができる。
その結果、罫線が存在すれば、図12に示すように、判定後領域A1において罫線Lkが抽出される。
(S109) 罫線除外部210bは、ステップS108の抽出結果の罫線の有無を判定する。罫線がないと判定されるとき(ステップS109のNO)、罫線除外部210bは、判定後領域データD1をそのまま罫線除外後領域データD2として出力し、ステップS111に進む。
(S110) 罫線があると判定されるとき(ステップS109のYES)、判定後領域データD1において罫線を示す箇所のデータを除外し、罫線除外後領域データD2として出力する(図13)。
(統合領域設定工程)
(S111) 外接領域抽出処理部215aは、罫線除外後の画像データである罫線除外後領域データD2について指定領域A0に基づいて目的の画像種類の画像を切り出すための矩形抽出処理を行いその外接領域を抽出する。矩形抽出処理は、従来公知の技術でよく、例えば特許第2948840号公報に記載の処理を適用すればよい。なお、目的の画像種類の画像とは、例えばユーザが切り出しを希望する文字列の画像である。
具体的には、画像中の黒画素の連結したランを一つの矩形として切り出して、少なくとも一つ以上の矩形を求める(A)。複数の矩形から、矩形の幅・高さや、矩形の面積、2つ以上の矩形同士の間隔などの要件を統計的に算出して複数の矩形を連結する(B)。
例えば「い」という文字を抽出する場合、(A)の段階では、「い」を構成する左側の線要素と右側の線要素がそれぞれ「(」、「ヽ」を含む矩形として切り出される。ついで、(B)の段階で、それぞれの矩形の幅・高さや、矩形の面積、2つ以上の矩形同士の間隔などの要件を統計的に算出することにより、それぞれの矩形が連結されて、「い」という矩形となる。
(S112) 外接領域の除外/包含処理部215bは、抽出された外接領域について除外する外接領域(除外領域)と包含する外接領域(包含領域)Acに選別する。詳しくは、外接領域の除外/包含処理部215bは、ステップS111で抽出された複数の外接領域それぞれの外接領域内の黒画素または白画素の頻度、黒画素または白画素が連続する大きさ、領域の属性と目的の画像種類の画像との関係から判断して、除外領域と包含領域とに選別する。例えば、目的の画像種類の画像が文字だけの画像である場合、線を示す細長い傍線を示す外接領域を除外し、それ以外は包含するようにするなどの選別が挙げられる。逆に、このような傍線を除外したくないケースも考えられるので、パラメータで調整できるようにするとよい。
なお、対象の外接領域の短い方の辺と長い方の辺がそれぞれ次式(2),(3)で算出されるL1,L2よりも大である場合に、対象の外接領域が文字以外の細長い外接領域(傍線)であるとして検出する。
※n,αの値は正の整数であり、ユーザが指定する。なお、式(1)と式(2)のnは同一である。また、width/heightは目的の画像種類の画像である文字の幅と高さの比率である。
この処理によれば様々なパターンの下線(図1及び図2)などの直線成分を抽出し、除外することが可能である。例えば点線の下線を検出するためには、ステップS108の罫線抽出処理と、ステップS111の文字抽出処理を用いて、それぞれ罫線と文字を抽出し、罫線抽出で得られた罫線領域データを下線として見なすものとする。この処理手順は、一点鎖線の下線や二重線の下線の場合にも同様である。
(S113) 外接領域の統合処理部215cは、ステップS112で選別された包含領域Acを1つの領域にマージ(統合)して統合領域A3とする(図14)。
(S114) 統合領域A3を含む画像データを統合領域データD3として結果出力部217に出力し、終了する。
図15は、図6の画像データについて本発明を適用して出力される統合領域データの例である。
画像処理装置100において、それぞれの画像データについてユーザが目的の画像種類の画像として所定の文字列を指定するように囲いAdを描画すると、前述した画像処理方法の手順に従い動作処理が行われ、指定された文字列に対して、罫線などの不要な要素は除外された上で、目標の文字列が精度よく認識された統合領域A3が確定した統合領域データD3が出力されている。
なお、これまで本発明を図面に示した実施形態をもって説明してきたが、本発明は図面に示した実施形態に限定されるものではなく、他の実施形態、追加、変更、削除など、当業者が想到することができる範囲内で変更することができ、いずれの態様においても本発明の作用・効果を奏する限り、本発明の範囲に含まれるものである。
例えば、上述した画像処理装置における制御動作は、ハードウェア、または、ソフトウェア、あるいは、両者の複合構成によって実行することも可能である。なお、ソフトウェアによる処理を実行する場合には、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれているコンピュータ(図3のCPU101など)内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。
また例えば、プログラムは、記録媒体としてのハードディスクやROM(Read Only Memory)に予め記録しておくことが可能である。あるいは、プログラムは、フロッピー(登録商標)ディスク、CD−ROM(Compact Disc Read Only Memory),MO(Magneto optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体に、一時的、あるいは、永続的に格納(記録)しておくことが可能である。このようなリムーバブル記録媒体は、いわゆるパッケージソフトウエアとして提供することが可能である。
なお、プログラムは、上述したようなリムーバブル記録媒体からコンピュータにインストールする他、ダウンロードサイトから、コンピュータに無線転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送したりし、コンピュータでは、転送されてきたプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることが可能である。
また、本実施形態で説明した本発明の画像処理装置の処理動作に従って時系列的に実行されるのみならず、処理を実行する装置の処理能力、あるいは、必要に応じて並列的にあるいは個別に実行するように構築することも可能である。
また、本実施形態で説明した本発明の画像処理装置は、複数の装置の論理的集合構成にしたり、各装置の機能を混在させたりするように構築することも可能である。
本発明は、画像中の所定の領域を抽出する画像処理を実行する画像処理装置を含む据え置き型コンピュータ、複写機、組み込み端末、電子計算機、画像データベースなどの装置・機器、システム、方法、プログラムなどに適用できる。
100 画像処理装置
101 CPU
102 スキャナ部
103 外部記憶部
104 入力画像メモリ部
105 表示部
106 操作パネル部
107 領域情報格納部
108 画像処理部
109 通信制御部
110 ネットワーク網
111 記録媒体
112 ハードディスク
201 画像入力部
202 データアクセス部
203 データディスク
204 指定領域入力部
205 一次領域設定部
205a 二値化処理部
205b ヒストグラム測定範囲決定部
205c ヒストグラム測定部
205d ヒスト頻度による境界線処理部
210 二次領域設定部
210a 罫線抽出部
210b 罫線除外部
215 統合領域設定部
215a 外接領域抽出処理部
215b 外接領域の除外/包含処理部
215c 外接領域の統合処理部
217 結果出力部
Ac 包含領域
Ad 囲い
Am 測定範囲
As 領域
A0 指定領域
A1 判定後領域(一次領域)
A3 統合領域
dh 黒画素と白画素の分布状態(ヒストグラムデータ)
D0 指定領域データ
D1 判定後領域データ(一次領域データ)
D2 罫線除外後領域データ
D3 統合領域データ
hb 黒画素探索結果
hw 白画素探索結果
Lk 罫線
特開2009−064219号公報 特許第3190794号公報

Claims (12)

  1. ユーザに対して、画像データ中から抽出する箇所を指定領域として指定させる抽出対象領域指定手段と、
    前記画像データを白黒画素からなる二値画像とし、該二値画像における黒画素と白画素の分布状態から前記指定領域の所定の外周領域における境界線を決定し、前記指定領域を含めて該境界線に囲まれる領域を一次領域とする一次領域設定手段と、
    前記一次領域における画像データから直線成分データを抽出し除外する直線成分除外手段と、
    前記直線成分除外後の前記画像データについて前記指定領域に基づいて目的の画像種類の画像を切り出すための矩形抽出処理を行いその外接領域を抽出する外接領域抽出手段と、
    前記外接領域について除外領域と包含領域に選別する除外包含手段と、
    前記包含領域をマージして統合領域とする統合処理手段と、
    を備えることを特徴とする画像処理装置。
  2. 前記抽出対象領域指定手段は、ユーザに複数の点、直線、自由曲線のいずれかを用いて前記指定領域を指定させることを特徴とする請求項1に記載の画像処理装置。
  3. 前記一次領域設定手段は、前記画像データの画素データが白黒ではない二値画像あるいは少なくとも3色以上の画像データであるときは、該画素データを白黒二値に減色する二値化処理手段と、前記指定領域の外辺を基準とし、該基準に基づいて前記指定領域の所定の外周領域をヒストグラム測定の測定範囲として決定する測定範囲決定手段と、前記測定範囲決定手段が決定した測定範囲において前記二値化処理手段により得られた二値画像の画素に対して、黒画素及び白画素のヒストグラム測定を行う測定手段と、前記測定手段が測定した結果に基づいて、黒画素と白画素の分布状態から前記外周領域における境界線を決定し、前記指定領域を含めて該境界線に囲まれる領域を一次領域とする領域判定手段と、からなることを特徴とする請求項1または2に記載の画像処理装置。
  4. 前記測定手段は、前記測定範囲内において、所定方向における黒画素を示す黒領域が連続して生起する回数を計数し、その計数を前記所定方向に直交する方向に位置を変えて繰り返して行う黒画素探索と、所定方向における白画素を示す白領域が連続して生起する回数を計数し、その計数を前記所定方向に直交する方向に位置を変えて繰り返して行う白画素探索と、を行い、前記領域判定手段は、前記測定手段による黒画素探索及び白画素探索により計数された前記黒領域が連続して生起する回数と白領域が連続して生起する回数の関係を前記所定方向に直交する方向の測定位置ごとに所定の閾値と比較し、該比較結果に基づいて前記外周領域における境界線を決定することを特徴とする請求項3に記載の画像処理装置。
  5. 前記直線成分除外手段は、前記一次領域における画像データから少なくとも1本の罫線データを抽出することを特徴とする請求項1〜4のいずれかに記載の画像処理装置。
  6. 前記除外包含手段は、前記外接領域抽出手段により抽出された複数の外接領域それぞれの外接領域内の黒画素または白画素の頻度、黒画素または白画素が連続する大きさ、領域の属性と目的の画像種類の画像との関係から判断して、除外領域と包含領域とに選別することを特徴とする請求項1〜5のいずれかに記載の画像処理装置。
  7. ユーザに対して、画像データ中から抽出する箇所を指定領域として指定させる抽出対象領域指定工程と、
    前記画像データを白黒画素からなる二値画像とし、該二値画像における黒画素と白画素の分布状態から前記指定領域の所定の外周領域における境界線を決定し、前記指定領域を含めて該境界線に囲まれる領域を一次領域とする一次領域設定工程と、
    前記一次領域における画像データから直線成分データを抽出し除外する直線成分除外工程と、
    前記直線成分除外後の前記画像データについて前記指定領域に基づいて目的の画像種類の画像を切り出すための矩形抽出処理を行いその外接領域を抽出する外接領域抽出工程と、
    前記外接領域について除外領域と包含領域に選別する除外包含工程と、
    前記包含領域をマージして統合領域とする統合処理工程と、
    を備えることを特徴とする画像処理方法。
  8. 前記抽出対象領域指定工程は、ユーザに複数の点、直線、自由曲線のいずれかを用いて前記指定領域を指定させるものであることを特徴とする請求項7に記載の画像処理方法。
  9. 前記一次領域設定工程は、前記画像データの画素データが白黒ではない二値画像あるいは少なくとも3色以上の画像データであるときは、該画素データを白黒二値に減色する二値化処理工程と、前記指定領域の外辺を基準とし、該基準に基づいて前記指定領域の所定の外周領域をヒストグラム測定の測定範囲として決定する測定範囲決定工程と、前記測定範囲決定工程で決定された測定範囲において前記二値化処理工程で得られた二値画像の画素に対して、黒画素及び白画素のヒストグラム測定を行う測定工程と、前記測定工程で測定された結果に基づいて、黒画素と白画素の分布状態から前記外周領域における境界線を決定し、前記指定領域を含めて該境界線に囲まれる領域を一次領域とする領域判定工程と、からなることを特徴とする請求項7または8に記載の画像処理方法。
  10. 前記測定工程は、前記測定範囲内において、所定方向における黒画素を示す黒領域が連続して生起する回数を計数し、その計数を前記所定方向に直交する方向に位置を変えて繰り返して行う黒画素探索と、所定方向における白画素を示す白領域が連続して生起する回数を計数し、その計数を前記所定方向に直交する方向に位置を変えて繰り返して行う白画素探索と、を行うものであり、前記領域判定工程は、前記測定工程における黒画素探索及び白画素探索により計数された前記黒領域が連続して生起する回数と白領域が連続して生起する回数の関係を前記所定方向に直交する方向の測定位置ごとに所定の閾値と比較し、該比較結果に基づいて前記外周領域における境界線を決定するものであることを特徴とする請求項9に記載の画像処理方法。
  11. 前記直線成分除外工程は、前記一次領域における画像データから少なくとも1本の罫線データを抽出するものであることを特徴とする請求項7〜10のいずれかに記載の画像処理方法。
  12. 前記除外包含工程は、前記外接領域抽出工程で抽出された複数の外接領域それぞれの外接領域内の黒画素または白画素の頻度、黒画素または白画素が連続する大きさ、領域の属性と目的の画像種類の画像との関係から判断して、除外領域と包含領域とに選別するものであることを特徴とする請求項7〜11のいずれかに記載の画像処理方法。
JP2011045113A 2011-03-02 2011-03-02 画像処理装置及び画像処理方法 Withdrawn JP2012181743A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011045113A JP2012181743A (ja) 2011-03-02 2011-03-02 画像処理装置及び画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011045113A JP2012181743A (ja) 2011-03-02 2011-03-02 画像処理装置及び画像処理方法

Publications (1)

Publication Number Publication Date
JP2012181743A true JP2012181743A (ja) 2012-09-20

Family

ID=47012876

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011045113A Withdrawn JP2012181743A (ja) 2011-03-02 2011-03-02 画像処理装置及び画像処理方法

Country Status (1)

Country Link
JP (1) JP2012181743A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112330688A (zh) * 2020-11-02 2021-02-05 腾讯科技(深圳)有限公司 基于人工智能的图像处理方法、装置和计算机设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112330688A (zh) * 2020-11-02 2021-02-05 腾讯科技(深圳)有限公司 基于人工智能的图像处理方法、装置和计算机设备
US12354318B2 (en) 2020-11-02 2025-07-08 Tencent Technology (Shenzhen) Company Limited Artificial intelligence-based image processing method and apparatus, computer device and storage medium

Similar Documents

Publication Publication Date Title
JP4821869B2 (ja) 文字認識装置、画像読取装置、およびプログラム
CN100474340C (zh) 图像处理方法和图像处理装置
JP5538812B2 (ja) 画像処理装置、画像処理方法及びプログラム
CN104809099B (zh) 文档文件生成装置及文档文件生成方法
US10984277B2 (en) Image analysis apparatus, image analysis method, and non-transitory computer readable medium
JP5906788B2 (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
JPH08287184A (ja) 画像切り出し装置及び文字認識装置
JP5171421B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP3728224B2 (ja) 文書処理装置及び方法
JP5335581B2 (ja) 画像処理装置、画像処理方法及びプログラム
JPH1031716A (ja) 文字行抽出方法および装置
JP2012181743A (ja) 画像処理装置及び画像処理方法
JP7006009B2 (ja) 画像識別装置及び画像形成プログラム
JP5217960B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP7599640B2 (ja) 帳票の特定フィールド認識方法および特定フィールド読取り装置
JP5549286B2 (ja) 画像処理装置及び画像処理プログラム
JPH07230526A (ja) 文字読取装置
JP4159071B2 (ja) 画像処理方法,画像処理装置および該処理方法を実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2009272714A (ja) 画像処理装置、画像処理方法、プログラム及びプログラムを記録した記録媒体
JP5402417B2 (ja) 画像処理装置
JP2013250927A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP4810995B2 (ja) 画像処理装置、方法及びプログラム
JP2003016385A (ja) 画像処理装置、方法、プログラム、及び記憶媒体
JP2003271973A (ja) 画像処理方法および画像処理プログラム
JPH07120392B2 (ja) 文字パターン切り出し装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20140513