JP2006146741A - 印字データ読取り方法 - Google Patents
印字データ読取り方法 Download PDFInfo
- Publication number
- JP2006146741A JP2006146741A JP2004338345A JP2004338345A JP2006146741A JP 2006146741 A JP2006146741 A JP 2006146741A JP 2004338345 A JP2004338345 A JP 2004338345A JP 2004338345 A JP2004338345 A JP 2004338345A JP 2006146741 A JP2006146741 A JP 2006146741A
- Authority
- JP
- Japan
- Prior art keywords
- data
- frame
- reading
- print data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 100
- 238000012545 processing Methods 0.000 claims abstract description 83
- 238000001514 detection method Methods 0.000 claims abstract description 14
- 238000000605 extraction Methods 0.000 claims description 25
- 238000013479 data entry Methods 0.000 claims description 16
- 238000012937 correction Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 238000012790 confirmation Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000006073 displacement reaction Methods 0.000 description 3
- 239000003086 colorant Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000005859 cell recognition Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Landscapes
- Character Input (AREA)
Abstract
【解決手段】2値画像処理により印字ずれのある枠を検出し、検出された枠周辺にのみカラー画像処理を行うことで、処理時間を抑えつつ印字データと枠線を高精度に分離する。そして、データが印字されない領域に混入した印字ずれデータの検出と、枠の領域と印字ずれデータの外接矩形の重なり度を算出と、2つの枠を仕切る枠線の位置と重なった文字の位置と枠の中心位置との関係と、印字ずれデータの外接矩形の大きさと枠の大きさと、大局的な印字ずれ方向とを利用することで、印字ずれデータがどの枠からはみ出した印字データであるかを判別する。
【選択図】図1
Description
前記画像から罫線を抽出する罫線抽出手段と、
前記抽出された罫線から枠を抽出する枠抽出手段と、
抽出した複数の枠の中から、印字データの読取りを行う枠を抽出する読取りフィールド抽出手段と、
印字データが枠からはみ出している可能性があるすべての枠を検出する印字ずれフィールド検出手段と、
枠線と印字データを分離し、はみ出した印字データを印字ずれデータとする印字ずれデータの確定手段と、
印字ずれデータがどの枠からはみ出した印字データであるかを判別する読取りフィールドへの印字データ割り当て手段と、
印字データの読取りを行う文字列読取り手段と、
を有することを特徴とする印字データ読取り方法を提供する。
データが印字されない領域に混入した印字ずれデータを検出し、検出された印字データのずれの方向を判別し、その方向を利用して他の印字ずれデータを読取りフィールドへ割り当てる非データ記入領域からの伝播型データ割り当て手段と、
枠の領域と印字ずれデータの外接矩形の重なり度を算出し、その重なり度を利用して印字ずれデータが注目する枠からのはみ出した印字データであるか、隣接する枠から混入した印字データなのかを判別する注目枠と矩形の重なり度による判別手段と、
水平方向に繋がる2つの枠にまたがった文字に対し、
その2つの枠を仕切る枠線の位置と、
重なった文字の位置と、
左の枠内にある文字或いは左の枠の中心位置と、
右の枠内にある文字或いは右の枠の中心位置と、
の関係を利用して、枠線と重なった文字を左右どちらの枠に割り当てる水平方向に隣接する枠内文字の判別手段と、
印字ずれデータの外接矩形の高さが枠の高さよりも大きい印字ずれデータと、
印字ずれデータの外接矩形の幅が枠の幅よりも大きい印字ずれデータを他の枠から混入した印字ずれデータと判別する矩形サイズによる判別手段と、
前記非データ記入領域からの伝播型データ割り当て手段と
前記矩形の重なり度による判別手段と
前記水平方向に隣接する枠内文字の判別手段と
前記矩形サイズによる判別手段とによって確定した印字ずれデータのずれの方向を利用して、読取りフィールドへ印字ずれデータを割り当てる大局的な印字ずれ方向による判別手段と
を有することをさらに特徴としている。
図4は、帳票画像(0301)に対して罫線抽出処理(0102)と枠抽出処理(0103)を実行した結果を図示したもの(0401)である。罫線抽出処理(0102)では、水平、垂直方向への連続する黒画素を抽出することで罫線を抽出し、枠抽出処理(0103)では、罫線の交点を見つけそれらの位置関係から1つ1つの枠位置が抽出する。この方法には、(非特許文献1:Hiroshi Shinjo、 Eiichi Hadano、 Katsumi Marukawa、 Yoshihiro Shima、 Hiroshi Sako: A Recursive Analysis for Form Cell Recognition. ICDAR 2001: 694-698)など様々な方法がある。
本処理は嶋等の方法をベースとしたが、他の様々なカラードロップアウトの手法を用いても良い。
Claims (6)
- 帳票などの枠線を含む文書をスキャナで電子化した画像中の印字データを読取る方法において、
前記画像から罫線を抽出する罫線抽出ステップと、
前記抽出された罫線から枠を抽出する枠抽出ステップと、
予め記憶される帳票定義知識を参照して、前記抽出した複数の枠の中から、印字データの読取りを行う枠を抽出する読取りフィールド抽出ステップと、
前記印字データが枠からはみ出している可能性がある枠を検出する印字ずれフィールド検出ステップと、
枠線と印字データを分離し、枠線と接触すると判定される印字データを印字ずれデータとする印字ずれデータの確定ステップと、
印字ずれデータがどの枠からはみ出した印字データであるかを判別する読取りフィールドへの印字データ割り当てステップと、
印字データの読取りを行う文字列読取りステップと、
を有することを特徴とする印字データ読取り方法。 - 前記読取りフィールドへの印字データ割り当てステップにおいて、
データが印字されない領域に混入した印字ずれデータを検出し、検出された印字データのずれの方向を判別し、その方向を利用して他の印字ずれデータを読取りフィールドへ割り当てる非データ記入領域からの伝播型データ割り当てステップと、
枠の領域と印字ずれデータの外接矩形の重なり度を算出し、その重なり度を利用して印字ずれデータが注目する枠からのはみ出した印字データであるか、隣接する枠から混入した印字データなのかを判別する注目枠と矩形の重なり度による判別ステップと、
水平方向に繋がる2つの枠にまたがる文字に対し、
その2つの枠を仕切る枠線の位置と、
重なった文字の位置と、
左の枠内にある文字或いは左の枠の中心位置と、
右の枠内にある文字或いは右の枠の中心位置と、
の関係を利用して、枠線と重なった文字を左右どちらの枠に割り当てる水平方向に隣接する枠内文字の判別ステップと、
印字ずれデータの外接矩形の高さが枠の高さよりも大きい印字ずれデータと、
印字ずれデータの外接矩形の幅が枠の幅よりも大きい印字ずれデータを他の枠から混入した印字ずれデータと判別する矩形サイズによる判別ステップと、
前記非データ記入領域からの伝播型データ割り当てステップと
前記矩形の重なり度による判別ステップと
前記水平方向に隣接する枠内文字の判別ステップと
前記矩形サイズによる判別ステップとによって確定した印字ずれデータのずれの方向を利用して、読取りフィールドへ印字ずれデータを割り当てる大局的な印字ずれ方向による判別ステップと
を有することをさらに特徴とする請求項1に記載の印字データ読取り方法。 - 前記読み取りフィールドへの印字データ割り当てステップは、
複数の読み取りフィールドと複数の印字ずれデータとの位置関係に基づいて、各印字ずれデータがどの読み取りフィールドからはみ出した印字データであるかを判断することを特徴とする請求項1記載の印字データ読み取り方法。 - 前記印字ずれフィールド検出ステップにおいて、2値画像処理を用いて印字データがはみ出している可能性があるすべての枠を検出し、前記印字ずれデータの確定処理において、前記検出されて枠の周辺のみのカラー画像処理を行うことを更に特徴とする請求項1に記載の印字データ読取り方法。
- 印字データ読取装置であって、
帳票などの枠線を含む文書をスキャナで電子化した画像を入力する画像入力部と、帳票定義知識を含む辞書データを格納するメモリ装置と、演算装置とを有し、
該演算装置は、
前記画像から罫線を抽出し、
前記抽出された罫線から枠を抽出し、
前記メモリ装置に格納される帳票定義知識を参照して、前記抽出した複数の枠の中から、印字データの読取りを行う枠を抽出し、
前記印字データが枠からはみ出している可能性がある枠を検出し、
枠線と印字データを分離し、枠線と接触すると判定される印字データを印字ずれデータと分類し、
印字ずれデータがどの枠からはみ出した印字データであるかを判別し、
印字データの読取りを行うことを特徴とする印字データ読取り装置。 - 印字データ読取りプログラムであって、帳票などの枠線を含む文書をスキャナで電子化した画像を入力する画像入力部と、帳票定義知識を含む辞書データを格納するメモリ装置と、演算装置とを有する印字データ読み取り装置の演算装置に、
前記画像から罫線を抽出する罫線抽出ステップと、
前記抽出された罫線から枠を抽出する枠抽出ステップと、
前記メモリ装置に格納される帳票定義知識を参照して、前記抽出した複数の枠の中から、印字データの読取りを行う枠を抽出する読取りフィールド抽出ステップと、
前記印字データが枠からはみ出している可能性がある枠を検出する印字ずれフィールド検出ステップと、
枠線と印字データを分離し、枠線と接触すると判定される印字データを印字ずれデータとする印字ずれデータの確定ステップと、
印字ずれデータがどの枠からはみ出した印字データであるかを判別する読取りフィールドへの印字データ割り当てステップと、
印字データの読取りを行う文字列読取りステップとを実行させることを特徴とする印字データ読取りプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004338345A JP4585837B2 (ja) | 2004-11-24 | 2004-11-24 | 印字データ読取り方法、印字データ読み取り装置、印字データ読み取りプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004338345A JP4585837B2 (ja) | 2004-11-24 | 2004-11-24 | 印字データ読取り方法、印字データ読み取り装置、印字データ読み取りプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2006146741A true JP2006146741A (ja) | 2006-06-08 |
| JP4585837B2 JP4585837B2 (ja) | 2010-11-24 |
Family
ID=36626324
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2004338345A Expired - Lifetime JP4585837B2 (ja) | 2004-11-24 | 2004-11-24 | 印字データ読取り方法、印字データ読み取り装置、印字データ読み取りプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4585837B2 (ja) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014085841A (ja) * | 2012-10-24 | 2014-05-12 | Glory Ltd | 文字切出装置及び文字切出方法並びに文字認識装置 |
| JP2014191719A (ja) * | 2013-03-28 | 2014-10-06 | Brother Ind Ltd | 画像処理装置、および、コンピュータプログラム |
| JP2016053989A (ja) * | 2011-04-20 | 2016-04-14 | 日本電気株式会社 | 10指指紋カード入力装置、10指指紋カード入力方法、及び記憶媒体 |
| JP2017091419A (ja) * | 2015-11-16 | 2017-05-25 | 富士ゼロックス株式会社 | 情報処理装置、画像読み取り装置及びプログラム |
| CN110705362A (zh) * | 2019-09-06 | 2020-01-17 | 航天新长征大道科技有限公司 | 一种字印分析方法和装置 |
Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS61296484A (ja) * | 1985-06-26 | 1986-12-27 | Hitachi Ltd | 光学文字読取方法 |
| JPS6419488A (en) * | 1987-07-15 | 1989-01-23 | Nec Corp | Type recognizing device |
| JPH03269690A (ja) * | 1990-03-19 | 1991-12-02 | Nec Corp | 文字切出装置 |
| JPH08212296A (ja) * | 1995-02-08 | 1996-08-20 | Oki Electric Ind Co Ltd | 光学式文字読取装置 |
| JPH09282414A (ja) * | 1996-04-10 | 1997-10-31 | Fujitsu Ltd | パターン抽出装置 |
| JPH10134143A (ja) * | 1996-10-30 | 1998-05-22 | Fujitsu Ltd | 文字抽出装置 |
| JP2003196592A (ja) * | 2001-12-27 | 2003-07-11 | Hitachi Ltd | 画像処理プログラム及び画像処理装置 |
-
2004
- 2004-11-24 JP JP2004338345A patent/JP4585837B2/ja not_active Expired - Lifetime
Patent Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS61296484A (ja) * | 1985-06-26 | 1986-12-27 | Hitachi Ltd | 光学文字読取方法 |
| JPS6419488A (en) * | 1987-07-15 | 1989-01-23 | Nec Corp | Type recognizing device |
| JPH03269690A (ja) * | 1990-03-19 | 1991-12-02 | Nec Corp | 文字切出装置 |
| JPH08212296A (ja) * | 1995-02-08 | 1996-08-20 | Oki Electric Ind Co Ltd | 光学式文字読取装置 |
| JPH09282414A (ja) * | 1996-04-10 | 1997-10-31 | Fujitsu Ltd | パターン抽出装置 |
| JPH10134143A (ja) * | 1996-10-30 | 1998-05-22 | Fujitsu Ltd | 文字抽出装置 |
| JP2003196592A (ja) * | 2001-12-27 | 2003-07-11 | Hitachi Ltd | 画像処理プログラム及び画像処理装置 |
Cited By (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2016053989A (ja) * | 2011-04-20 | 2016-04-14 | 日本電気株式会社 | 10指指紋カード入力装置、10指指紋カード入力方法、及び記憶媒体 |
| JP2018139123A (ja) * | 2011-04-20 | 2018-09-06 | 日本電気株式会社 | 10指指紋カード入力装置、10指指紋カード入力方法、及び記憶媒体 |
| US10586091B2 (en) | 2011-04-20 | 2020-03-10 | Nec Corporation | Tenprint card input device, tenprint card input method and storage medium |
| US11417145B2 (en) | 2011-04-20 | 2022-08-16 | Nec Corporation | Tenrprint card input device, tenrprint card input method and storage medium |
| US11600105B2 (en) | 2011-04-20 | 2023-03-07 | Nec Corporation | Tenrprint card input device, tenrprint card input method and storage medium |
| US11935265B2 (en) | 2011-04-20 | 2024-03-19 | Nec Corporation | Tenprint card input device, tenprint card input method and storage medium |
| US12493984B2 (en) | 2011-04-20 | 2025-12-09 | Nec Corporation | Tenprint card input device, tenprint card input method and storage medium |
| JP2014085841A (ja) * | 2012-10-24 | 2014-05-12 | Glory Ltd | 文字切出装置及び文字切出方法並びに文字認識装置 |
| JP2014191719A (ja) * | 2013-03-28 | 2014-10-06 | Brother Ind Ltd | 画像処理装置、および、コンピュータプログラム |
| JP2017091419A (ja) * | 2015-11-16 | 2017-05-25 | 富士ゼロックス株式会社 | 情報処理装置、画像読み取り装置及びプログラム |
| CN110705362A (zh) * | 2019-09-06 | 2020-01-17 | 航天新长征大道科技有限公司 | 一种字印分析方法和装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP4585837B2 (ja) | 2010-11-24 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6335986B1 (en) | Pattern recognizing apparatus and method | |
| CA1160347A (en) | Method for recognizing a machine encoded character | |
| US20070168382A1 (en) | Document analysis system for integration of paper records into a searchable electronic database | |
| CN103577820B (zh) | 字符识别方法、字符识别装置及金融设备 | |
| US5428692A (en) | Character recognition system | |
| US6549662B1 (en) | Method of recognizing characters | |
| JP4585837B2 (ja) | 印字データ読取り方法、印字データ読み取り装置、印字データ読み取りプログラム | |
| US7149352B2 (en) | Image processing device, program product and system | |
| JP2000339406A (ja) | 帳票認識方法 | |
| JP5601027B2 (ja) | 画像処理装置及び画像処理プログラム | |
| JP3268552B2 (ja) | 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置 | |
| JP2005250786A (ja) | 画像認識方法 | |
| JP5041775B2 (ja) | 文字切出方法及び文字認識装置 | |
| JP4244692B2 (ja) | 文字認識装置及び文字認識プログラム | |
| JP2008108114A (ja) | 文書処理装置および文書処理方法 | |
| JPS6245581B2 (ja) | ||
| JP2022184331A (ja) | 帳票の特定フィールド認識方法および特定フィールド読取り装置 | |
| JPH0652358A (ja) | 文字認識方法 | |
| JP2578768B2 (ja) | 画像処理方法 | |
| JP3696152B2 (ja) | 帳票識別装置および帳票識別方法 | |
| JP2578767B2 (ja) | 画像処理方法 | |
| JP3517077B2 (ja) | パターン抽出装置及びパターン領域の切り出し方法 | |
| CN120748002A (zh) | 工程图纸的内容差异识别方法、装置、设备及存储介质 | |
| CN121170490A (zh) | 一种基于深度学习的行李标签识别方法及系统 | |
| CN121617118A (zh) | 一种专利附图智能识别及标引方法、装置、设备及介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060509 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070613 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070613 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100513 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100525 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100616 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100831 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100906 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 4585837 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130910 Year of fee payment: 3 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| EXPY | Cancellation because of completion of term |