JP2009123206A - 画像からテキストを抽出する方法及び装置 - Google Patents
画像からテキストを抽出する方法及び装置 Download PDFInfo
- Publication number
- JP2009123206A JP2009123206A JP2008284748A JP2008284748A JP2009123206A JP 2009123206 A JP2009123206 A JP 2009123206A JP 2008284748 A JP2008284748 A JP 2008284748A JP 2008284748 A JP2008284748 A JP 2008284748A JP 2009123206 A JP2009123206 A JP 2009123206A
- Authority
- JP
- Japan
- Prior art keywords
- edge
- image
- connected components
- generating
- edge image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
【解決手段】画像上でエッジを検出することによりエッジ画像を生成するステップと、前記エッジ画像上で連結成分を見つけるステップと、見つけた連結成分から所定の条件を満たす連結成分を除去するステップと、除去後に残される連結成分から同一直線上に存在する連結成分を1つにグループ化するステップと、グループ化された連結成分に基づいてテキストストリングを生成するステップとから成る。
【選択図】なし
Description
C. M. Lee, and A. Kankanhalli, Automatic Extraction of Characters in Complex Images, International Journal of Pattern Recognition Artificial Intelligence, 9 (1) (1995) 67-82. Yu Zhong, Kalle Karu, and Anil K. Jain, Locating Text In Complex Color Images, Pattern Recognition, 28 (10) (1995) 1523-1535. V. Wu, R. Manmatha, and E. M, Riseman, TextFinder: An Automatic System to Detect and Recognize Text in Images, IEEE Transactions on Pattern Analysis and Machine Intelligence, 21 (11) (1999) 1224-1229.
式中、G0は画素の勾配であり、I0は画素のグレー値であり、Inは隣接画素のグレー値である。隣接画素は8個であってもよく、又は4個であってもよい。
Claims (14)
- 画像からテキストストリングを生成する方法であって、
前記画像上でエッジを検出することによりエッジ画像を生成するステップと、
前記エッジ画像上で連結成分を見つけるステップと、
見つけられた前記連結成分から所定の条件を満たす連結成分を除去するステップと、
前記除去の後に残される前記連結成分から、同一直線上に存在する連結成分を1つにグループ化するステップと、
前記グループ化された連結成分に基づいてテキストストリングを生成するステップと、を有することを特徴とする方法。 - 暗いエッジ画像及び明るいエッジ画像の2種類のエッジ画像が生成されることを特徴とする請求項1に記載の方法。
- 前記見つけるステップ、前記除去するステップ、前記グループ化するステップ及び前記テキストストリングを生成するステップは、各種類のエッジ画像に対して実行されることを特徴とする請求項2に記載の方法。
- 前記画像上でエッジを検出する検出ステップは、
G0が画素の勾配であり、I0が前記画素のグレー値であり且つInが隣接画素のグレー値であって、前記隣接画素の数が4又は8である場合、式G0 = max(|I0−In|)により各画素の勾配を算出するステップと、
閾値が判定される基準となる前記勾配のヒストグラムを算出するステップと、
前記閾値より大きい勾配を有する前記画素をエッジとして設定するステップと、
により、前記エッジを暗いエッジ及び明るいエッジの2種類に分類するステップと、
暗いエッジ画像及び明るいエッジ画像の2つのエッジ画像を生成するステップと、を更に有することを特徴とする請求項2に記載の方法。 - 前記所定の条件は、連結成分のサイズと、所定領域内の連結成分の数と、及び、前記エッジ画像上のある特定の色の画素数と前記エッジ画像上の全画素数との比と、のうちの少なくとも1つを含むことを特徴とする請求項1に記載の方法。
- 前記グループ化するステップは、
ハフ変換を使用して連結成分の中心点をパラメータ空間に変換し、ストリングを通る線を検出するために、前記パラメータ空間上で極大点を検出するステップと、
中心点が同一線上にあるか又は同一線に近接する連結成分を1つにグループ化するステップと、を更に有することを特徴とする請求項1に記載の方法。 - 前記テキストストリングを生成するステップは、
グループ内の前記連結成分の高さから前記ストリングにおけるテキストの平均の高さを決定するステップと、
高さが前記平均の高さから所定の程度異なる連結成分を除去するステップと、
隣接する連結成分を連結するステップと、を更に有することを特徴とする請求項1に記載の方法。 - 画像からテキストストリングを生成する装置であって、
前記画像上でエッジを検出し、エッジ画像を生成する検出手段と、
前記エッジ画像上で連結成分を見つける手段と、
見つけられた前記連結成分から所定の条件を満たす連結成分を除去する除去手段と、
前記除去の後に残される前記連結成分から、同一直線上に存在する連結成分を1つにグループ化するグループ化手段と、
前記グループ化された連結成分に基づいてテキストストリングを生成する生成手段と、を備えることを特徴とする装置。 - 暗いエッジ画像及び明るいエッジ画像の2種類のエッジ画像が生成されることを特徴とする請求項8記載の装置。
- 前記見つける手段、前記除去手段、前記グループ化手段及び前記生成手段は、各種類のエッジ画像に対して実行されることを特徴とする請求項9に記載の装置。
- 前記検出手段は、更に、
G0が画素の勾配であり、I0が前記画素のグレー値であり且つInが隣接画素のグレー値であって、前記隣接画素の数が4又は8である場合、式G0 = max(|I0−In|)により各画素の勾配を算出し、
閾値が判定される基準となる前記勾配のヒストグラムを算出し、
前記閾値より大きい勾配を有する前記画素をエッジとして設定し、
により、前記エッジを暗いエッジ及び明るいエッジの2種類に分類し、
暗いエッジ画像及び明るいエッジ画像の2つのエッジ画像を生成することを特徴とする請求項9に記載の装置。 - 前記所定の条件は、連結成分のサイズと、所定領域内の連結成分の数と、及び、前記エッジ画像上のある特定の色の画素数と前記エッジ画像上の全画素数との比と、のうちの少なくとも1つを含むことを特徴とする請求項8に記載の装置。
- 前記グループ化手段は、更に、
ハフ変換を使用して連結成分の中心点をパラメータ空間に変換し、ストリングを通る線を検出するために、前記パラメータ空間上で極大点を検出し、
中心点が同一線上にあるか又は同一線に近接する連結成分を1つにグループ化することを特徴とする請求項8に記載の装置。 - 前記テキストストリングを生成する生成手段は、更に、
グループ内の前記連結成分の高さから前記ストリング内のテキストの平均の高さを決定し、
高さが前記平均の高さから所定の程度異なる連結成分を除去し、
隣接する連結成分を連結することを特徴とする請求項8に記載の装置。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN200710186396.3 | 2007-11-14 | ||
| CN200710186396A CN101436248B (zh) | 2007-11-14 | 2007-11-14 | 用于根据图像生成文本字符串的方法和设备 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2009123206A true JP2009123206A (ja) | 2009-06-04 |
| JP4904330B2 JP4904330B2 (ja) | 2012-03-28 |
Family
ID=40710682
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2008284748A Expired - Fee Related JP4904330B2 (ja) | 2007-11-14 | 2008-11-05 | 画像からテキストを抽出する方法及び装置 |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP4904330B2 (ja) |
| CN (1) | CN101436248B (ja) |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2013257866A (ja) * | 2012-06-12 | 2013-12-26 | Xerox Corp | 自然風景の中のテキストの発見 |
| US8792719B2 (en) | 2011-07-29 | 2014-07-29 | Brother Kogyo Kabushiki Kaisha | Image processing device determining attributes of regions |
| US8830529B2 (en) | 2011-07-29 | 2014-09-09 | Brother Kogyo Kabushiki Kaisha | Image processing device for accurately identifying region in image without increase in memory requirement |
| US8837836B2 (en) | 2011-07-29 | 2014-09-16 | Brother Kogyo Kabushiki Kaisha | Image processing device identifying attribute of region included in image |
| US8929663B2 (en) | 2011-07-29 | 2015-01-06 | Brother Kogyo Kabushiki Kaisha | Image processing device identifying region in image as one of uniform region and nonuniform region |
| US9245357B2 (en) | 2011-08-08 | 2016-01-26 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and storage medium |
| US9305239B2 (en) | 2014-05-13 | 2016-04-05 | Samsung Electronics Co., Ltd. | Detecting and processing small text in digital media |
| JPWO2021112179A1 (ja) * | 2019-12-04 | 2021-06-10 |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106503634B (zh) * | 2016-10-11 | 2020-02-14 | 讯飞智元信息科技有限公司 | 一种图像对齐方法及装置 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000090194A (ja) * | 1998-09-10 | 2000-03-31 | Fuji Xerox Co Ltd | 画像処理方法および画像処理装置 |
| JP2000181992A (ja) * | 1998-12-11 | 2000-06-30 | Fujitsu Ltd | カラー文書画像認識装置 |
| WO2000062243A1 (en) * | 1999-04-14 | 2000-10-19 | Fujitsu Limited | Character string extracting device and method based on basic component in document image |
| JP2005285006A (ja) * | 2004-03-30 | 2005-10-13 | Toshiba Solutions Corp | 画像処理装置および画像処理方法 |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN1025764C (zh) * | 1992-05-12 | 1994-08-24 | 浙江大学 | 字符识别方法 |
| CN1312625C (zh) * | 2004-07-02 | 2007-04-25 | 清华大学 | 基于游程邻接图的复杂背景彩色图像中字符提取方法 |
-
2007
- 2007-11-14 CN CN200710186396A patent/CN101436248B/zh not_active Expired - Fee Related
-
2008
- 2008-11-05 JP JP2008284748A patent/JP4904330B2/ja not_active Expired - Fee Related
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000090194A (ja) * | 1998-09-10 | 2000-03-31 | Fuji Xerox Co Ltd | 画像処理方法および画像処理装置 |
| JP2000181992A (ja) * | 1998-12-11 | 2000-06-30 | Fujitsu Ltd | カラー文書画像認識装置 |
| WO2000062243A1 (en) * | 1999-04-14 | 2000-10-19 | Fujitsu Limited | Character string extracting device and method based on basic component in document image |
| JP2005285006A (ja) * | 2004-03-30 | 2005-10-13 | Toshiba Solutions Corp | 画像処理装置および画像処理方法 |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8792719B2 (en) | 2011-07-29 | 2014-07-29 | Brother Kogyo Kabushiki Kaisha | Image processing device determining attributes of regions |
| US8830529B2 (en) | 2011-07-29 | 2014-09-09 | Brother Kogyo Kabushiki Kaisha | Image processing device for accurately identifying region in image without increase in memory requirement |
| US8837836B2 (en) | 2011-07-29 | 2014-09-16 | Brother Kogyo Kabushiki Kaisha | Image processing device identifying attribute of region included in image |
| US8929663B2 (en) | 2011-07-29 | 2015-01-06 | Brother Kogyo Kabushiki Kaisha | Image processing device identifying region in image as one of uniform region and nonuniform region |
| US9245357B2 (en) | 2011-08-08 | 2016-01-26 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and storage medium |
| JP2013257866A (ja) * | 2012-06-12 | 2013-12-26 | Xerox Corp | 自然風景の中のテキストの発見 |
| US9305239B2 (en) | 2014-05-13 | 2016-04-05 | Samsung Electronics Co., Ltd. | Detecting and processing small text in digital media |
| JPWO2021112179A1 (ja) * | 2019-12-04 | 2021-06-10 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN101436248B (zh) | 2012-10-24 |
| JP4904330B2 (ja) | 2012-03-28 |
| CN101436248A (zh) | 2009-05-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4904330B2 (ja) | 画像からテキストを抽出する方法及び装置 | |
| Yi et al. | Text string detection from natural scenes by structure-based partition and grouping | |
| US6263113B1 (en) | Method for detecting a face in a digital image | |
| US8611662B2 (en) | Text detection using multi-layer connected components with histograms | |
| JP6080259B2 (ja) | 文字切り出し装置及び文字切り出し方法 | |
| US7813554B2 (en) | Method and apparatus of extracting text from document image with complex background, computer program and storage medium thereof | |
| CN103336961B (zh) | 一种交互式的自然场景文本检测方法 | |
| Cohen et al. | Robust text and drawing segmentation algorithm for historical documents | |
| TW201437925A (zh) | 物體識別裝置、方法及電腦程式產品 | |
| US9679354B2 (en) | Duplicate check image resolution | |
| KR102940107B1 (ko) | 화상 처리 장치, 저장 매체, 및 화상 처리 방법 | |
| JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
| CN105303156A (zh) | 字符检测装置、方法及程序 | |
| CN105450900A (zh) | 用于文档图像的畸变校正方法和设备 | |
| US20120082372A1 (en) | Automatic document image extraction and comparison | |
| CN113011426A (zh) | 一种识别证件的方法和装置 | |
| TW200529093A (en) | Face image detection method, face image detection system, and face image detection program | |
| CN105975955B (zh) | 一种图像中文本区域的检测方法 | |
| CN105225218A (zh) | 用于文档图像的畸变校正方法和设备 | |
| Rahman et al. | Text Information Extraction from Digital Image Documents Using Optical Character Recognition | |
| Phan et al. | Text detection in natural scenes using gradient vector flow-guided symmetry | |
| Bhaskar et al. | Implementing optical character recognition on the android operating system for business cards | |
| JP6688091B2 (ja) | 車両距離導出装置および車両距離導出方法 | |
| JP2012222581A (ja) | 画像処理装置、画像処理方法、プログラム、及び記憶媒体 | |
| CN111242121B (zh) | 一种基于svm的对联智能分拣方法及存储介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110912 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111110 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111209 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120106 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 4904330 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150113 Year of fee payment: 3 |
|
| LAPS | Cancellation because of no payment of annual fees |