JPH11175663A - 文字認識用の学習データ作成方法および記録媒体 - Google Patents
文字認識用の学習データ作成方法および記録媒体Info
- Publication number
- JPH11175663A JPH11175663A JP9340917A JP34091797A JPH11175663A JP H11175663 A JPH11175663 A JP H11175663A JP 9340917 A JP9340917 A JP 9340917A JP 34091797 A JP34091797 A JP 34091797A JP H11175663 A JPH11175663 A JP H11175663A
- Authority
- JP
- Japan
- Prior art keywords
- image
- character
- character image
- learning data
- binarized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
の文字画像を作成する。 【解決手段】 学習画像作成部3は、かすれ画像作成閾
値4と、つぶれ画像作成閾値5の間にn個の2値化閾値
を設定する。多値文字画像をn個の2値化閾値で2値化
したn個の画像と、多値文字画像を最適2値化閾値6で
2値化した最適2値化画像7との大きさを比較し、大き
さが大きく異ならないとき学習画像として採用する。ノ
イズ除去部8は学習画像と最適2値化画像とを比較し、
学習画像中のノイズを除いて学習用画像をメモリ9に出
力する。
Description
タから文字認識用の学習データを作成する方法および該
作成方法を実行するプログラムを記録した記録媒体に関
する。
値を求める方法がいくつか提案されている。例えば、多
値画像を複数の閾値で2値化したとき、各閾値における
(総輪郭数)2/(黒画素数)を求め、該値が最も大き
い閾値を基に認識に最適な閾値を決定する最適2値化方
法がある(特開平2−24787号公報を参照)。ある
いは、多値画像データを複数の閾値で2値化した際の各
閾値に対する平均線幅を求め、最適な線幅設定値に最も
近い平均線幅の一つを選択し、その平均線幅を基に2値
化閾値を決定する画像データの2値化装置もある(特開
平5−282494号公報を参照)。
は、品質の良い2値文字画像を得るための2値化閾値を
算出するものである。ところで、文字認識(OCR)用
の学習データを作成する際に、低品質な原稿の認識に対
する頑強性を向上させるためには、学習データ中に認識
対象とする低品質な文字画像が含まれている必要があ
る。前述したように、これまでOCRの認識対象画像に
ついて、品質の良い文字画像を得るための多くの手法が
提案されているが、学習画像として用いる低品質な文字
画像を得るための手法については提案されていない。
人間が見ても判別不可能な文字画像については、学習デ
ータとして用いるのは好ましくない。また、人間が見て
識別可能であるか否かを判断するのは個人差などもあり
極めて困難な問題であるが、前掲した前者の公報に示す
ような線分の状態を示すパラメータ((総輪郭数)2/
(黒画素数))を用いることによって、それに近い処理
を行うことが可能である。
ので、本発明の目的は、人間が見て識別可能な範囲で低
品質な学習用の文字画像を作成する文字認識用の学習デ
ータ作成方法および記録媒体を提供することにある。
に、請求項1記載の発明では、多値文字画像から2値化
された文字認識用の学習データを作成する方法であっ
て、前記多値文字画像を複数の2値化閾値で2値化し、
2値化された複数の文字画像を文字認識用の学習データ
とすることを特徴としている。
化閾値は、2値化閾値に対する文字画像の所定のパラメ
ータ変化を求め、該パラメータが所定値をとる、かすれ
画像作成の2値化閾値およびつぶれ画像作成の2値化閾
値を基に算出することを特徴としている。
作成の2値化閾値は、前記文字画像の(輪郭長)2/
(黒画素数)の値が最大となる2値化閾値を基に算出す
ることを特徴としている。
作成の2値化閾値は、前記文字画像の(輪郭長)2/
(黒画素数)の値が最小となる2値化閾値を基に算出す
ることを特徴としている。
化閾値で2値化された複数の文字画像の大きさと、最適
2値化された文字画像の大きさとを比較し、前記複数の
文字画像の内、大きさの相違が所定の条件を満たす文字
画像を文字認識用の学習データとすることを特徴として
いる。
を満たす文字画像と前記最適2値化された文字画像とを
比較し、最適2値化された文字画像中に存在しない黒画
素を、前記文字画像中から削除して文字認識用の学習デ
ータとすることを特徴としている。
ら2値化された文字認識用の学習データを作成する機能
をコンピュータに実現させるためのプログラムを記録し
たコンピュータ読み取り可能な記録媒体であって、前記
多値文字画像を複数の2値化閾値で2値化する機能と、
前記複数の2値化閾値で2値化された複数の文字画像の
大きさと、最適2値化された文字画像の大きさとを比較
し、前記複数の文字画像の内、大きさの相違が所定の条
件を満たす文字画像を選択する機能と、前記選択された
文字画像と前記最適2値化された文字画像とを比較し、
最適2値化された文字画像中に存在しない黒画素を前記
文字画像中から削除して文字認識用の学習データを作成
する機能をコンピュータに実現させるためのプログラム
を記録したコンピュータ読み取り可能な記録媒体である
ことを特徴としている。
用いて具体的に説明する。図1は、本発明の実施例の構
成を示す。図において、1はスキャナなどの画像入力
部、2は読み込まれた多値文字画像を格納するメモリ、
3は学習画像を作成する学習画像作成部、4はかすれ画
像作成閾値算出部、5はつぶれ画像作成閾値算出部、6
は最適2値化閾値算出部、7は最適2値化閾値で2値化
処理した画像を格納する最適2値化画像メモリ、8は採
用された学習画像からノイズを除去するノイズ除去部、
9はノイズ除去された学習画像を格納する学習画像メモ
リである。また、図2は、本発明の学習用画像の作成処
理フローチャートである。
などを読み取り、多値(16階調、256階調など)の
文字画像を入力する(ステップ101)。次いで、かす
れ画像作成閾値算出部4は、かすれ画像を作成する閾値
を算出する(ステップ102)。ここで、かすれ画像作
成閾値とは、2値化閾値に対する(輪郭長)2/(黒画
素数)の値が局所最大となる2値化閾値で、後述する最
適2値化閾値よりも大きく、なおかつ最適2値化閾値と
の差が最も小さいものを、かすれ画像作成閾値とする。
なお、本発明の「輪郭長」は、前掲した特開平2−24
787号公報に記載の「総輪郭数」に同義であり、また
(輪郭長)2/(黒画素数)=(総輪郭数)2/(黒画素
数)である。例えば、図6の場合、黒画素数は3であ
り、白画素と黒画素が隣接している画素部分の総数(輪
郭長さ)は8である。
長)2/(黒画素数)の変化と、文字画像の変化を示
す。また、「量」の文字画像は輪郭によって図示されて
いる。そして、(輪郭長)2/(黒画素数)の値が最大
(max)となる閾値(THmax)が、かすれ2値化
閾値である。
像を作成する閾値を算出する(ステップ103)。ここ
で、つぶれ画像作成閾値とは、2値化閾値に対する(輪
郭長)2/(黒画素数)の値が局所最小となる2値化閾
値で、後述する最適2値化閾値よりも小さく、なおかつ
最適2値化閾値との差が最も小さいものを、つぶれ画像
作成閾値とする。図3に示す、(輪郭長)2/(黒画素
数)の値が最小(min)となる閾値(THmin)
が、つぶれ2値化閾値である。
作成閾値(THmax)とつぶれ画像作成閾値(THm
in)の間にn個の2値化閾値を設定する(ステップ1
04)。例えば、m(0,1,・・・,n−1)番目の
2値化閾値TH(m)は以下のように求める。
n)/(n−1) 最適2値化閾値算出部6は、最適2値化閾値を算出する
(ステップ105)。最適2値化閾値の算出は以下の手
順で求める。すなわち、(1)多値文字画像中から濃度
勾配が局所最大となる画素を求める。(2)濃度勾配が
局所最大となる画素の画素値の平均値を求め、これを最
適2値化閾値とする。
2値化閾値で2値化処理を行なった画像を、最適2値化
画像として最適2値化画像メモリ7に保存する(ステッ
プ106)。次いで、ステップ104で設定されたn個
の閾値で2値化された各画像と最適2値化画像の大きさ
を比較し、大きさが大きく異ならない場合には学習画像
として採用し(ステップ107でNo)、大きく異なる
場合は採用しない(ステップ107でYes)。
座標が(×ss,Yss),右下座標が(Xse,Ys
e)であり、TH(m)で2値化された画像の左上座標
が(Xrs,Yrs)、右下座標が(Xre,Yre)
のとき、以下の判定式を全て満たす場合に学習画像とし
て採用する。図4は、最適2値化画像との大きさの比較
を説明する図である。
について、最適2値画像との比較を行ない、ノイズを除
去する(ステップ108)。図5は、ノイズ除去を説明
する図であり、具体的には、TH(m)での2値化画像
中に、最適2値化画像が全く含まない黒画素の連結成分
を除去する。
イズ除去の終了した複数の画像を学習用画像としてメモ
リ9に出力する(ステップ109)。出力された複数の
学習用2値文字画像はパターン辞書の作成に用いられ
る。
フトウエアによっても実現することができる。本発明を
ソフトウエアによって実現する場合には、図7に示すよ
うに、CPU、メモリ、表示装置、ハードディスク、キ
ーボード、CD‐ROMドライブ、マウスなどからなる
コンピュータシステムを用意する。CD−ROMなどの
コンピュータ読み取り可能な記録媒体には、本発明の学
習データ作成機能や処理手順を実現するプログラムなど
が記録されている。また、多値文字画像は例えばハード
ディスクなどに格納されている。そして、CPUは、記
録媒体から上記した処理機能、処理手順を実現するプロ
グラムを読み出し、ハードディスクなどから読み込まれ
た多値文字画像から学習用の2値文字画像を作成し、ハ
ードディスクなどに書き出す。
ば、かすれ画像作成の2値化閾値およびつぶれ画像作成
の2値化閾値を考慮した複数の2値化閾値を用いて、多
値文字画像から複数の学習用文字画像デー夕を作成して
いるので、認識対象画像が、かすれやつぶれがある低品
質な文字画像であっても、精度良く認識することができ
る。
である。
画素数)の変化と、文字画像の変化を示す。
である。
構成例を示す。
Claims (7)
- 【請求項1】 多値文字画像から2値化された文字認識
用の学習データを作成する方法であって、前記多値文字
画像を複数の2値化閾値で2値化し、2値化された複数
の文字画像を文字認識用の学習データとすることを特徴
とする文字認識用の学習データ作成方法。 - 【請求項2】 前記複数の2値化閾値は、2値化閾値に
対する文字画像の所定のパラメータ変化を求め、該パラ
メータが所定値をとる、かすれ画像作成の2値化閾値お
よびつぶれ画像作成の2値化閾値を基に算出することを
特徴とする請求項1記載の文字認識用の学習データ作成
方法。 - 【請求項3】 前記かすれ画像作成の2値化閾値は、前
記文字画像の(輪郭長)2/(黒画素数)の値が最大と
なる2値化閾値を基に算出することを特徴とする請求項
2記載の文字認識用の学習データ作成方法。 - 【請求項4】 前記つぶれ画像作成の2値化閾値は、前
記文字画像の(輪郭長)2/(黒画素数)の値が最小と
なる2値化閾値を基に算出することを特徴とする請求項
2記載の文字認識用の学習データ作成方法。 - 【請求項5】 前記複数の2値化閾値で2値化された複
数の文字画像の大きさと、最適2値化された文字画像の
大きさとを比較し、前記複数の文字画像の内、大きさの
相違が所定の条件を満たす文字画像を文字認識用の学習
データとすることを特徴とする請求項1記載の文字認識
用の学習データ作成方法。 - 【請求項6】 前記所定の条件を満たす文字画像と前記
最適2値化された文字画像とを比較し、最適2値化され
た文字画像中に存在しない黒画素を、前記文字画像中か
ら削除して文字認識用の学習データとすることを特徴と
する請求項5記載の文字認識用の学習データ作成方法。 - 【請求項7】 多値文字画像から2値化された文字認識
用の学習データを作成する機能をコンピュータに実現さ
せるためのプログラムを記録したコンピュータ読み取り
可能な記録媒体であって、前記多値文字画像を複数の2
値化閾値で2値化する機能と、前記複数の2値化閾値で
2値化された複数の文字画像の大きさと、最適2値化さ
れた文字画像の大きさとを比較し、前記複数の文字画像
の内、大きさの相違が所定の条件を満たす文字画像を選
択する機能と、前記選択された文字画像と前記最適2値
化された文字画像とを比較し、最適2値化された文字画
像中に存在しない黒画素を前記文字画像中から削除して
文字認識用の学習データを作成する機能をコンピュータ
に実現させるためのプログラムを記録したコンピュータ
読み取り可能な記録媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP34091797A JP3763954B2 (ja) | 1997-12-11 | 1997-12-11 | 文字認識用の学習データ作成方法および記録媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP34091797A JP3763954B2 (ja) | 1997-12-11 | 1997-12-11 | 文字認識用の学習データ作成方法および記録媒体 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH11175663A true JPH11175663A (ja) | 1999-07-02 |
| JP3763954B2 JP3763954B2 (ja) | 2006-04-05 |
Family
ID=18341499
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP34091797A Expired - Lifetime JP3763954B2 (ja) | 1997-12-11 | 1997-12-11 | 文字認識用の学習データ作成方法および記録媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3763954B2 (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008077621A (ja) * | 2006-09-23 | 2008-04-03 | Koji Miyake | 文字認識システムの学習文字サンプルの不足を補う方法 |
| JP2009032273A (ja) * | 2008-08-29 | 2009-02-12 | Olympus Corp | 分類装置 |
| JP2010219932A (ja) * | 2009-03-17 | 2010-09-30 | Nippon Hoso Kyokai <Nhk> | 画像処理装置及び画像処理プログラム |
| JP6968962B1 (ja) * | 2020-09-25 | 2021-11-24 | 株式会社日本経済新聞社 | 手書き文字認識用正解データ生成装置、方法、およびプログラム |
-
1997
- 1997-12-11 JP JP34091797A patent/JP3763954B2/ja not_active Expired - Lifetime
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008077621A (ja) * | 2006-09-23 | 2008-04-03 | Koji Miyake | 文字認識システムの学習文字サンプルの不足を補う方法 |
| JP2009032273A (ja) * | 2008-08-29 | 2009-02-12 | Olympus Corp | 分類装置 |
| JP2010219932A (ja) * | 2009-03-17 | 2010-09-30 | Nippon Hoso Kyokai <Nhk> | 画像処理装置及び画像処理プログラム |
| JP6968962B1 (ja) * | 2020-09-25 | 2021-11-24 | 株式会社日本経済新聞社 | 手書き文字認識用正解データ生成装置、方法、およびプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3763954B2 (ja) | 2006-04-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
| CN100585621C (zh) | 图像处理装置和图像处理方法 | |
| JP4072448B2 (ja) | 電子透かし抽出方法及び装置及びプログラム及び記憶媒体 | |
| JP4366003B2 (ja) | 画像処理装置及び画像処理方法 | |
| JP4049560B2 (ja) | 網点除去方法及びシステム | |
| JP3763954B2 (ja) | 文字認識用の学習データ作成方法および記録媒体 | |
| JP4259949B2 (ja) | 画像作成装置、画像作成プログラムおよび記録媒体 | |
| JP4441300B2 (ja) | 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体 | |
| JP3985928B2 (ja) | 画像処理方法、画像処理装置、文字認識装置及び記憶媒体 | |
| JP2871601B2 (ja) | 文字列検出装置及び方法 | |
| JP4259950B2 (ja) | 画像認識装置、画像認識プログラムおよび記録媒体 | |
| JP4324058B2 (ja) | 画像処理装置及びその方法 | |
| JP4324532B2 (ja) | 画像処理装置および記憶媒体 | |
| JP4035696B2 (ja) | 線分検出装置及び画像処理装置 | |
| JP2008225654A (ja) | 画像処理方法、画像処理装置、及び、プログラム、プログラム記憶媒体 | |
| JP3733154B2 (ja) | 画像処理装置及びその方法 | |
| US7599556B2 (en) | Apparatus, system, and method for scanning segmentation | |
| JPH08221512A (ja) | 画像処理装置及びその方法 | |
| JP2001160903A (ja) | 画像補正方法及び装置及びその方法を実行するプログラムを記録した記録媒体 | |
| JP2004110434A (ja) | 画像処理方法および画像処理装置 | |
| JP3989647B2 (ja) | 画像処理方法,装置および記録媒体 | |
| JP3103387B2 (ja) | 濃淡画像の適応2値化方法 | |
| JP3639470B2 (ja) | 画像処理装置及び方法並びにプログラム記録媒体 | |
| JP2001291056A (ja) | 文書画像認識装置及び記録媒体 | |
| JP2000040153A (ja) | 画像処理方法、画像処理プログラムを記録した媒体及び画像処理装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050721 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050726 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050920 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060117 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060118 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100127 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110127 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120127 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130127 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140127 Year of fee payment: 8 |
|
| EXPY | Cancellation because of completion of term |