JP7292984B2 - 行分割装置および方法、ならびにプログラム - Google Patents
行分割装置および方法、ならびにプログラム Download PDFInfo
- Publication number
- JP7292984B2 JP7292984B2 JP2019110205A JP2019110205A JP7292984B2 JP 7292984 B2 JP7292984 B2 JP 7292984B2 JP 2019110205 A JP2019110205 A JP 2019110205A JP 2019110205 A JP2019110205 A JP 2019110205A JP 7292984 B2 JP7292984 B2 JP 7292984B2
- Authority
- JP
- Japan
- Prior art keywords
- line
- character
- height
- information
- dividing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00326—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
- H04N1/00328—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
- H04N1/00331—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00681—Detecting the presence, position or size of a sheet or correcting its position before scanning
- H04N1/00729—Detection means
- H04N1/00734—Optical detectors
- H04N1/00737—Optical detectors using the scanning elements as detectors
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Character Input (AREA)
Description
図1は、本実施形態に係る情報処理システムの概略構成例を示す図である。情報処理システムは、複写機100と、情報処理装置110とを有する。複写機100は、スキャナ101と、プリンタ102と、複写機側通信部103とを有する。スキャナ101は、原稿を光学的に読み取るスキャンを行って得たスキャン画像を生成する。プリンタ102は、紙などの記録媒体に画像を形成する。複写機側通信部103は、ネットワークを介して外部装置と通信処理を行う。複写機側通信部103は、例えば、後述の情報処理装置110の通信部117との通信処理を行う。
本実施形態については、実施形態1との差分のみの説明とし、特に明記しない部分については実施形態1と同じ構成および手順となる。図2に示す行分割処理のS201からS208、S210の処理は、実施形態1の場合と同じであり、その説明を省略する。
本実施形態については、実施形態1、2との差分のみの説明とし、特に明記しない部分については実施形態1、2と同じ構成および手順となる。図2に示す行分割処理のS201からS207、S210の処理は、実施形態1の場合と同じであり、その説明を省略する。
本実施形態については、実施形態1との差分のみの説明とし、特に明記しない部分については実施形態1と同じ構成および手順となる。
本実施形態については、実施形態1との差分のみの説明とし、特に明記しない部分については実施形態1と同じ構成および手順となる。
上記では、行接触行の行上端位置より文字高さ最頻値だけ下へ進めた位置を基準点と決定し、基準点の周辺で行分割したときの分割位置の下側の領域の高さなどにて所定の条件を満たすときに基準点の周辺から基準に分割位置を特定する手法について説明した。分割位置の特定手法は、これに限定されない。行接触行の行下端位置より文字高さ最頻値だけ上へ進めた位置を基準点と決定し、基準点の周辺で行分割したときの分割位置の上側の領域の高さなどにて所定の条件を満たすときに基準点の周辺から基準に分割位置を特定する手法としてもよい。この場合、実施形態1、2、4の説明の上側を下側に変更するなど、上下方向を逆に読み替えて設定すればよい。
110 ・・・情報処理装置
801 ・・・射影画像(行方向の射影結果)
802 ・・・平均黒画素数
Claims (20)
- 原稿を光学的に読み取ったスキャン画像を二値化して得た二値画像内における行単位の大きさと位置を示す行情報と、前記二値画像内の行における文字単位の大きさと位置を示す文字情報とを取得する取得手段と、
前記文字情報から文字の高さを示す文字高さ情報を抽出する抽出手段と、
前記文字高さ情報に基づき、文字が高さ方向で他の文字と接触するかどうかを判定する第1の判定手段と、
前記行情報と前記第1の判定手段による判定結果に基づいて、前記原稿における行のうち注目する行が高さ方向で他の行と接触するかどうかを判定する第2の判定手段と、
前記第2の判定手段により他の行と接触すると判定された注目する行において、当該注目する行における幅方向にて、黒画素の数をカウントしたカウント値を導出する導出手段と、
前記第2の判定手段により他の行と接触すると判定された前記注目する行に対し、前記行情報で示される行の位置と前記文字高さ情報とから導出される基準点の周辺にて、前記カウント値において前記注目する行の高さ方向で最少となる第1の位置を行分割位置として行分割を実行する行分割手段と、
を有する、ことを特徴とする行分割装置。 - 前記行分割手段は、前記カウント値の最少値が前記カウント値の合計値から導出した平均値より小さい、かつ、前記第1の位置で分割されときの前記第1の位置の下側または上側の行の高さが、前記文字高さ情報から導出された文字の高さより大きいときに、前記第1の位置を前記行分割位置として行分割を実行する
ことを特徴とする請求項1に記載の行分割装置。 - 前記行分割手段は、前記カウント値の最少値が前記カウント値の合計値から導出した平均値以上であるときに、前記基準点および前記文字高さ情報から導出された第2の基準点の周りにて、前記カウント値が最少となる第2の位置を前記行分割位置として行分割を実行する
ことを特徴とする請求項2に記載の行分割装置。 - 前記行分割手段は、前記カウント値の最少値が前記カウント値の合計値から導出した平均値以上であり、かつ、前記基準点および前記文字高さ情報から導出された第2の基準点の周りにて、前記カウント値が最少となる第2の位置のカウント値が前記平均値より小さいときに、前記第2の位置を前記行分割位置として行分割を実行する
ことを特徴とする請求項2に記載の行分割装置。 - 前記行分割手段は、前記カウント値の最少値が前記カウント値の計値から導出した平均値以上であり、前記基準点および前記文字高さ情報から導出された第2の基準点の周りにて、前記カウント値が最少となる第2の位置のカウント値が前記平均値より小さい、かつ、前記第2の位置で分割されときの当該第2の位置の下側または上側の行の高さが前記文字高さ情報から導出された文字の高さより大きいときに、前記第2の位置を前記行分割位置として行分割を実行する
ことを特徴とする請求項2に記載の行分割装置。 - 前記抽出手段は、前記文字高さ情報から文字高さの最頻値を抽出し、
前記第1の判定手段は、前記文字情報で示される各文字の高さが前記最頻値と同じであるときに、前記文字が通常文字であると判定し、
前記第2の判定手段は、前記第1の判定手段により前記通常文字と判定された文字が前記注目する行に存在しないときに、前記注目する行が行接触行であると判定し、
前記行分割手段は、前記注目する行に対し、前記第1の位置を前記行分割位置として行分割を実行する
ことを特徴とする請求項2から5の何れか一項に記載の行分割装置。 - 前記第2の判定手段は、前記第1の判定手段により前記通常文字と判定された文字が前記注目する行に存在しない、かつ、前記注目する行の高さが前記最頻値と異なるときに、前記注目する行が行接触行であると判定する
ことを特徴とする請求項6に記載の行分割装置。 - 前記第1の判定手段は、前記文字情報で示される各文字の高さが前記最頻値と異なるときに、前記文字が行接触文字であると判定し、
前記第2の判定手段は、前記第1の判定手段により前記通常文字と判定された文字が前記注目する行に存在しない、前記注目する行の高さが前記最頻値と異なる、かつ、前記第1の判定手段により前記行接触文字と判定された文字が前記注目する行に存在するときに、前記注目する行が行接触行であると判定する
ことを特徴とする請求項7に記載の行分割装置。 - 前記第1の判定手段は、前記文字情報で示される各文字の高さが前記最頻値と異なる、かつ、前記文字情報で示される各文字の信頼度が所定の閾値未満であるときに、前記文字が行接触文字であると判定する
ことを特徴とする請求項8に記載の行分割装置。 - 前記第1の判定手段は、前記文字情報で示される各文字の高さが前記最頻値と異なる、前記文字情報で示される各文字の信頼度が所定の閾値未満である、かつ、前記文字情報で示される各文字の高さが前記最頻値の2以上の整数倍と同じであるときに、前記文字が行接触文字であると判定する
ことを特徴とする請求項8または9に記載の行分割装置。 - 前記第1の判定手段は、前記文字情報で示される各文字の高さが前記最頻値と異なる、前記文字情報で示される各文字の信頼度が所定の閾値未満である、前記文字情報で示される各文字の高さが前記最頻値の2以上の整数倍と同じである、かつ、前記文字のアスペクト比が2であるときに、前記文字が縦倍角文字であると判定し、
前記行分割手段は、前記第1の判定手段により前記縦倍角文字と判定された文字が前記注目する行に存在するときに、前記縦倍角文字の最下位置を前記行分割位置として行分割を実行する
ことを特徴とする請求項6から10の何れか一項に記載の行分割装置。 - 前記行分割手段は、前記行情報で示される行上端位置から前記文字高さ情報に基づき導出された前記最頻値だけ下へ進めた位置を前記基準点としたときの前記行分割位置にて行分割を実行する
ことを特徴とする請求項6から11の何れか一項に記載の行分割装置。 - 前記行分割手段は、前記行情報で示される行下端位置から前記文字高さ情報に基づき導出された前記最頻値だけ上へ進めた位置を前記基準点としたときの前記行分割位置にて行分割を実行する
ことを特徴とする請求項6から11の何れか一項に記載の行分割装置。 - 前記行分割手段は、
前記行情報で示される行上端位置から前記文字高さ情報に基づき導出された前記最頻値だけ下へ進めた位置を前記基準点としたときの前記行分割位置にて行分割を実行する第一の行分割手段と、
前記行情報で示される行下端位置から前記文字高さ情報に基づき導出された前記最頻値だけ上へ進めた位置を前記基準点としたときの前記行分割位置にて行分割を実行する第二の行分割手段と、
を有し、
前記第一の行分割手段による前記行分割位置と、前記第二の行分割手段による前記行分割位置とに基づき、前記第一の行分割手段による行分割結果を採用するか、または前記第二の行分割手段による行分割結果を採用するかを決定する決定手段をさらに有する
ことを特徴とする請求項6から11の何れか一項に記載の行分割装置。 - 前記決定手段は、前記第一の行分割手段による前記行分割位置と、前記第二の行分割手段による前記行分割位置が同じであるときに、前記第一の行分割手段による行分割結果、または前記第二の行分割手段による行分割結果のどちらかを採用すると決定する
ことを特徴とする請求項14に記載の行分割装置。 - 前記決定手段は、前記第一の行分割手段による前記行分割位置と、前記第二の行分割手段による前記行分割位置が異なるときに、前記第一の行分割手段および前記第二の行分割手段により得られた行分割結果に対してOCR処理を行い、前記OCR処理により認識した文字の信頼度に基づき採用する行分割結果を決定する
ことを特徴とする請求項14または15に記載の行分割装置。 - 前記二値画像から罫線を除去する第一の除去手段を有し、
前記取得手段は、前記第一の除去手段により前記罫線を除去した前記二値画像から前記行情報および前記文字情報を取得する
ことを特徴とする請求項1から16の何れか一項に記載の行分割装置。 - 前記二値画像からノイズを除去する第二の除去手段を有し、
前記取得手段は、前記第二の除去手段により前記ノイズを除去した前記二値画像から前記行情報および前記文字情報を取得する
ことを特徴とする請求項17に記載の行分割装置。 - 原稿を光学的に読み取ったスキャン画像を二値化して得た二値画像内における行単位の大きさと位置を示す行情報と、前記二値画像内の行における文字単位の大きさと位置を示す文字情報を取得する取得ステップと、
前記文字情報から文字の高さを示す文字高さ情報を抽出する抽出ステップと、
前記文字高さ情報に基づき、文字の高さ方向で他の文字と接触するかどうかを判定する第1の判定ステップと、
前記行情報と前記第1の判定ステップによる判定結果に基づいて、前記原稿における行のうち注目する行が高さ方向で他の行と接触するかどうかを判定する第2の判定ステップと、
前記第2の判定ステップにて他の行と接触すると判定された前記注目する行において、当該注目する行における幅方向にて、黒画素の数をカウントしたカウント値を導出する導出ステップと、
前記第2の判定ステップにて他の行と接触すると判定された前記注目する行に対し、前記行情報で示される行の位置と前記文字高さ情報とから導出される基準点の周辺にて、前記カウント値において前記注目する行の高さ方向で最少となる第1の位置を行分割位置として行分割を実行する行分割ステップと、
を有する、ことを特徴とする行分割方法。 - コンピュータに、請求項1から18の何れか一項に記載の行分割装置の各手段として機能させるためのプログラム。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019110205A JP7292984B2 (ja) | 2019-06-13 | 2019-06-13 | 行分割装置および方法、ならびにプログラム |
| US16/892,704 US11140282B2 (en) | 2019-06-13 | 2020-06-04 | Character line division apparatus and method, and storage medium |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019110205A JP7292984B2 (ja) | 2019-06-13 | 2019-06-13 | 行分割装置および方法、ならびにプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2020201864A JP2020201864A (ja) | 2020-12-17 |
| JP7292984B2 true JP7292984B2 (ja) | 2023-06-19 |
Family
ID=73742680
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019110205A Active JP7292984B2 (ja) | 2019-06-13 | 2019-06-13 | 行分割装置および方法、ならびにプログラム |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US11140282B2 (ja) |
| JP (1) | JP7292984B2 (ja) |
Family Cites Families (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH05182024A (ja) * | 1992-01-06 | 1993-07-23 | Omron Corp | 文字認識装置 |
| JP3019897B2 (ja) | 1993-01-21 | 2000-03-13 | 沖電気工業株式会社 | 行切出し方法 |
| JPH0713994A (ja) * | 1993-02-19 | 1995-01-17 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
| JP2861860B2 (ja) * | 1995-04-28 | 1999-02-24 | 日本電気株式会社 | 宛名行抽出装置 |
| JP4165706B2 (ja) * | 2004-01-26 | 2008-10-15 | 株式会社リコー | 原稿読み取り装置および画像形成装置 |
| JP2010103862A (ja) * | 2008-10-24 | 2010-05-06 | Canon Inc | 文書処理装置および文書処理方法 |
-
2019
- 2019-06-13 JP JP2019110205A patent/JP7292984B2/ja active Active
-
2020
- 2020-06-04 US US16/892,704 patent/US11140282B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| US11140282B2 (en) | 2021-10-05 |
| US20200396346A1 (en) | 2020-12-17 |
| JP2020201864A (ja) | 2020-12-17 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102403964B1 (ko) | 화상 처리 장치, 화상 처리 방법, 및 저장 매체 | |
| JP3259993B2 (ja) | 語形測定方法及び画像信号処理方法 | |
| JP6878034B2 (ja) | 情報処理装置、制御方法、およびプログラム | |
| US11281897B2 (en) | Gesture shaking recognition method and apparatus, and gesture recognition method | |
| KR102940107B1 (ko) | 화상 처리 장치, 저장 매체, 및 화상 처리 방법 | |
| JP7387363B2 (ja) | データ入力支援装置、データ入力支援方法及びプログラム | |
| JP2018055255A (ja) | 情報処理装置、情報処理方法及びプログラム | |
| JP6739937B2 (ja) | 情報処理装置、情報処理装置の制御方法、及びプログラム | |
| US20110019928A1 (en) | Image processing method, image processing apparatus, and program | |
| CN107346580A (zh) | 票据信息识别方法及装置 | |
| US20190057276A1 (en) | Image analysis apparatus, image analysis method, and non-transitory computer readable medium | |
| JP5171421B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
| US12423350B2 (en) | Image processing apparatus deriving condition for estimating text block, image processing method, and storage medium | |
| CN113378839A (zh) | 信息处理装置、信息处理方法及计算机可读介质 | |
| JP7292984B2 (ja) | 行分割装置および方法、ならびにプログラム | |
| JP6700705B2 (ja) | 振り分けシステム、情報処理方法、及びプログラム | |
| KR101903617B1 (ko) | 복수 개의 객체 이미지를 포함한 정적인 디지털 결합 이미지의 편집 방법 | |
| JP5794154B2 (ja) | 画像処理プログラム、画像処理方法、及び画像処理装置 | |
| JP5742367B2 (ja) | 画像処理装置及び画像処理プログラム | |
| JP2018055256A (ja) | 情報処理装置、情報処理方法及びプログラム | |
| JP2021099688A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
| JP2020047138A (ja) | 情報処理装置 | |
| US11288536B2 (en) | Image processing apparatus, image processing method, and non-transitory computer-readable storage medium | |
| JP2023046687A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
| JP4381455B2 (ja) | 文字サイズ推定方法、装置および記録媒体 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220610 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230424 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230509 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230607 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 7292984 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |