JPH11175663A - 文字認識用の学習データ作成方法および記録媒体 - Google Patents

文字認識用の学習データ作成方法および記録媒体

Info

Publication number
JPH11175663A
JPH11175663A JP9340917A JP34091797A JPH11175663A JP H11175663 A JPH11175663 A JP H11175663A JP 9340917 A JP9340917 A JP 9340917A JP 34091797 A JP34091797 A JP 34091797A JP H11175663 A JPH11175663 A JP H11175663A
Authority
JP
Japan
Prior art keywords
image
character
character image
learning data
binarized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9340917A
Other languages
English (en)
Other versions
JP3763954B2 (ja
Inventor
Hideaki Yamagata
秀明 山形
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP34091797A priority Critical patent/JP3763954B2/ja
Publication of JPH11175663A publication Critical patent/JPH11175663A/ja
Application granted granted Critical
Publication of JP3763954B2 publication Critical patent/JP3763954B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 人間が見て識別可能な範囲で低品質な学習用
の文字画像を作成する。 【解決手段】 学習画像作成部3は、かすれ画像作成閾
値4と、つぶれ画像作成閾値5の間にn個の2値化閾値
を設定する。多値文字画像をn個の2値化閾値で2値化
したn個の画像と、多値文字画像を最適2値化閾値6で
2値化した最適2値化画像7との大きさを比較し、大き
さが大きく異ならないとき学習画像として採用する。ノ
イズ除去部8は学習画像と最適2値化画像とを比較し、
学習画像中のノイズを除いて学習用画像をメモリ9に出
力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、多値文字画像デー
タから文字認識用の学習データを作成する方法および該
作成方法を実行するプログラムを記録した記録媒体に関
する。
【0002】
【従来の技術】多値文字画像に対する最適2値化しきい
値を求める方法がいくつか提案されている。例えば、多
値画像を複数の閾値で2値化したとき、各閾値における
(総輪郭数)2/(黒画素数)を求め、該値が最も大き
い閾値を基に認識に最適な閾値を決定する最適2値化方
法がある(特開平2−24787号公報を参照)。ある
いは、多値画像データを複数の閾値で2値化した際の各
閾値に対する平均線幅を求め、最適な線幅設定値に最も
近い平均線幅の一つを選択し、その平均線幅を基に2値
化閾値を決定する画像データの2値化装置もある(特開
平5−282494号公報を参照)。
【0003】
【発明が解決しようとする課題】上記した従来の手法
は、品質の良い2値文字画像を得るための2値化閾値を
算出するものである。ところで、文字認識(OCR)用
の学習データを作成する際に、低品質な原稿の認識に対
する頑強性を向上させるためには、学習データ中に認識
対象とする低品質な文字画像が含まれている必要があ
る。前述したように、これまでOCRの認識対象画像に
ついて、品質の良い文字画像を得るための多くの手法が
提案されているが、学習画像として用いる低品質な文字
画像を得るための手法については提案されていない。
【0004】低品質の画像といっても、極めて低品質で
人間が見ても判別不可能な文字画像については、学習デ
ータとして用いるのは好ましくない。また、人間が見て
識別可能であるか否かを判断するのは個人差などもあり
極めて困難な問題であるが、前掲した前者の公報に示す
ような線分の状態を示すパラメータ((総輪郭数)2
(黒画素数))を用いることによって、それに近い処理
を行うことが可能である。
【0005】本発明は上記した事情を背景になされたも
ので、本発明の目的は、人間が見て識別可能な範囲で低
品質な学習用の文字画像を作成する文字認識用の学習デ
ータ作成方法および記録媒体を提供することにある。
【0006】
【課題を解決するための手段】前記目的を達成するため
に、請求項1記載の発明では、多値文字画像から2値化
された文字認識用の学習データを作成する方法であっ
て、前記多値文字画像を複数の2値化閾値で2値化し、
2値化された複数の文字画像を文字認識用の学習データ
とすることを特徴としている。
【0007】請求項2記載の発明では、前記複数の2値
化閾値は、2値化閾値に対する文字画像の所定のパラメ
ータ変化を求め、該パラメータが所定値をとる、かすれ
画像作成の2値化閾値およびつぶれ画像作成の2値化閾
値を基に算出することを特徴としている。
【0008】請求項3記載の発明では、前記かすれ画像
作成の2値化閾値は、前記文字画像の(輪郭長)2
(黒画素数)の値が最大となる2値化閾値を基に算出す
ることを特徴としている。
【0009】請求項4記載の発明では、前記つぶれ画像
作成の2値化閾値は、前記文字画像の(輪郭長)2
(黒画素数)の値が最小となる2値化閾値を基に算出す
ることを特徴としている。
【0010】請求項5記載の発明では、前記複数の2値
化閾値で2値化された複数の文字画像の大きさと、最適
2値化された文字画像の大きさとを比較し、前記複数の
文字画像の内、大きさの相違が所定の条件を満たす文字
画像を文字認識用の学習データとすることを特徴として
いる。
【0011】請求項6記載の発明では、前記所定の条件
を満たす文字画像と前記最適2値化された文字画像とを
比較し、最適2値化された文字画像中に存在しない黒画
素を、前記文字画像中から削除して文字認識用の学習デ
ータとすることを特徴としている。
【0012】請求項7記載の発明では、多値文字画像か
ら2値化された文字認識用の学習データを作成する機能
をコンピュータに実現させるためのプログラムを記録し
たコンピュータ読み取り可能な記録媒体であって、前記
多値文字画像を複数の2値化閾値で2値化する機能と、
前記複数の2値化閾値で2値化された複数の文字画像の
大きさと、最適2値化された文字画像の大きさとを比較
し、前記複数の文字画像の内、大きさの相違が所定の条
件を満たす文字画像を選択する機能と、前記選択された
文字画像と前記最適2値化された文字画像とを比較し、
最適2値化された文字画像中に存在しない黒画素を前記
文字画像中から削除して文字認識用の学習データを作成
する機能をコンピュータに実現させるためのプログラム
を記録したコンピュータ読み取り可能な記録媒体である
ことを特徴としている。
【0013】
【発明の実施の形態】以下、本発明の一実施例を図面を
用いて具体的に説明する。図1は、本発明の実施例の構
成を示す。図において、1はスキャナなどの画像入力
部、2は読み込まれた多値文字画像を格納するメモリ、
3は学習画像を作成する学習画像作成部、4はかすれ画
像作成閾値算出部、5はつぶれ画像作成閾値算出部、6
は最適2値化閾値算出部、7は最適2値化閾値で2値化
処理した画像を格納する最適2値化画像メモリ、8は採
用された学習画像からノイズを除去するノイズ除去部、
9はノイズ除去された学習画像を格納する学習画像メモ
リである。また、図2は、本発明の学習用画像の作成処
理フローチャートである。
【0014】スキャナなどの画像入力部1によって原稿
などを読み取り、多値(16階調、256階調など)の
文字画像を入力する(ステップ101)。次いで、かす
れ画像作成閾値算出部4は、かすれ画像を作成する閾値
を算出する(ステップ102)。ここで、かすれ画像作
成閾値とは、2値化閾値に対する(輪郭長)2/(黒画
素数)の値が局所最大となる2値化閾値で、後述する最
適2値化閾値よりも大きく、なおかつ最適2値化閾値と
の差が最も小さいものを、かすれ画像作成閾値とする。
なお、本発明の「輪郭長」は、前掲した特開平2−24
787号公報に記載の「総輪郭数」に同義であり、また
(輪郭長)2/(黒画素数)=(総輪郭数)2/(黒画素
数)である。例えば、図6の場合、黒画素数は3であ
り、白画素と黒画素が隣接している画素部分の総数(輪
郭長さ)は8である。
【0015】図3は、文字「量」の閾値に対する(輪郭
長)2/(黒画素数)の変化と、文字画像の変化を示
す。また、「量」の文字画像は輪郭によって図示されて
いる。そして、(輪郭長)2/(黒画素数)の値が最大
(max)となる閾値(THmax)が、かすれ2値化
閾値である。
【0016】つぶれ画像作成閾値算出部5は、つぶれ画
像を作成する閾値を算出する(ステップ103)。ここ
で、つぶれ画像作成閾値とは、2値化閾値に対する(輪
郭長)2/(黒画素数)の値が局所最小となる2値化閾
値で、後述する最適2値化閾値よりも小さく、なおかつ
最適2値化閾値との差が最も小さいものを、つぶれ画像
作成閾値とする。図3に示す、(輪郭長)2/(黒画素
数)の値が最小(min)となる閾値(THmin)
が、つぶれ2値化閾値である。
【0017】続いて、学習画像作成部3は、かすれ画像
作成閾値(THmax)とつぶれ画像作成閾値(THm
in)の間にn個の2値化閾値を設定する(ステップ1
04)。例えば、m(0,1,・・・,n−1)番目の
2値化閾値TH(m)は以下のように求める。
【0018】TH(m)=m(THmax−THmi
n)/(n−1) 最適2値化閾値算出部6は、最適2値化閾値を算出する
(ステップ105)。最適2値化閾値の算出は以下の手
順で求める。すなわち、(1)多値文字画像中から濃度
勾配が局所最大となる画素を求める。(2)濃度勾配が
局所最大となる画素の画素値の平均値を求め、これを最
適2値化閾値とする。
【0019】学習画像作成部3は、多値文字画像を最適
2値化閾値で2値化処理を行なった画像を、最適2値化
画像として最適2値化画像メモリ7に保存する(ステッ
プ106)。次いで、ステップ104で設定されたn個
の閾値で2値化された各画像と最適2値化画像の大きさ
を比較し、大きさが大きく異ならない場合には学習画像
として採用し(ステップ107でNo)、大きく異なる
場合は採用しない(ステップ107でYes)。
【0020】例えば、最適2値化画像の外接矩形の左上
座標が(×ss,Yss),右下座標が(Xse,Ys
e)であり、TH(m)で2値化された画像の左上座標
が(Xrs,Yrs)、右下座標が(Xre,Yre)
のとき、以下の判定式を全て満たす場合に学習画像とし
て採用する。図4は、最適2値化画像との大きさの比較
を説明する図である。
【0021】|Xss−Xrs|<Ts |Xse−Xre|<Ts |Yss−Yrs|<Ts |Yse−Yre|<Ts ノイズ除去部8は、学習画像として採用された2値画像
について、最適2値画像との比較を行ない、ノイズを除
去する(ステップ108)。図5は、ノイズ除去を説明
する図であり、具体的には、TH(m)での2値化画像
中に、最適2値化画像が全く含まない黒画素の連結成分
を除去する。
【0022】そして、最後に、学習画像作成部3は、ノ
イズ除去の終了した複数の画像を学習用画像としてメモ
リ9に出力する(ステップ109)。出力された複数の
学習用2値文字画像はパターン辞書の作成に用いられ
る。
【0023】本発明は上記した実施例に限定されず、ソ
フトウエアによっても実現することができる。本発明を
ソフトウエアによって実現する場合には、図7に示すよ
うに、CPU、メモリ、表示装置、ハードディスク、キ
ーボード、CD‐ROMドライブ、マウスなどからなる
コンピュータシステムを用意する。CD−ROMなどの
コンピュータ読み取り可能な記録媒体には、本発明の学
習データ作成機能や処理手順を実現するプログラムなど
が記録されている。また、多値文字画像は例えばハード
ディスクなどに格納されている。そして、CPUは、記
録媒体から上記した処理機能、処理手順を実現するプロ
グラムを読み出し、ハードディスクなどから読み込まれ
た多値文字画像から学習用の2値文字画像を作成し、ハ
ードディスクなどに書き出す。
【0024】
【発明の効果】以上、説明したように、本発明によれ
ば、かすれ画像作成の2値化閾値およびつぶれ画像作成
の2値化閾値を考慮した複数の2値化閾値を用いて、多
値文字画像から複数の学習用文字画像デー夕を作成して
いるので、認識対象画像が、かすれやつぶれがある低品
質な文字画像であっても、精度良く認識することができ
る。
【図面の簡単な説明】
【図1】本発明の実施例の構成を示す。
【図2】本発明の学習用画像の作成処理フローチャート
である。
【図3】文字「量」の閾値に対する(輪郭長)2/(黒
画素数)の変化と、文字画像の変化を示す。
【図4】最適2値化画像との大きさの比較を説明する図
である。
【図5】ノイズ除去を説明する図である。
【図6】黒画素数と輪郭長を説明する図である。
【図7】本発明をソフトウェアによって実現する場合の
構成例を示す。
【符号の説明】
1 画像入力部 2 多値文字画像メモリ 3 学習画像作成部 4 かすれ画像作成閾値算出部 5 つぶれ画像作成閾値算出部 6 最適2値化閾値算出部 7 最適2値化画像メモリ 8 ノイズ除去部 9 学習画像メモリ

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 多値文字画像から2値化された文字認識
    用の学習データを作成する方法であって、前記多値文字
    画像を複数の2値化閾値で2値化し、2値化された複数
    の文字画像を文字認識用の学習データとすることを特徴
    とする文字認識用の学習データ作成方法。
  2. 【請求項2】 前記複数の2値化閾値は、2値化閾値に
    対する文字画像の所定のパラメータ変化を求め、該パラ
    メータが所定値をとる、かすれ画像作成の2値化閾値お
    よびつぶれ画像作成の2値化閾値を基に算出することを
    特徴とする請求項1記載の文字認識用の学習データ作成
    方法。
  3. 【請求項3】 前記かすれ画像作成の2値化閾値は、前
    記文字画像の(輪郭長)2/(黒画素数)の値が最大と
    なる2値化閾値を基に算出することを特徴とする請求項
    2記載の文字認識用の学習データ作成方法。
  4. 【請求項4】 前記つぶれ画像作成の2値化閾値は、前
    記文字画像の(輪郭長)2/(黒画素数)の値が最小と
    なる2値化閾値を基に算出することを特徴とする請求項
    2記載の文字認識用の学習データ作成方法。
  5. 【請求項5】 前記複数の2値化閾値で2値化された複
    数の文字画像の大きさと、最適2値化された文字画像の
    大きさとを比較し、前記複数の文字画像の内、大きさの
    相違が所定の条件を満たす文字画像を文字認識用の学習
    データとすることを特徴とする請求項1記載の文字認識
    用の学習データ作成方法。
  6. 【請求項6】 前記所定の条件を満たす文字画像と前記
    最適2値化された文字画像とを比較し、最適2値化され
    た文字画像中に存在しない黒画素を、前記文字画像中か
    ら削除して文字認識用の学習データとすることを特徴と
    する請求項5記載の文字認識用の学習データ作成方法。
  7. 【請求項7】 多値文字画像から2値化された文字認識
    用の学習データを作成する機能をコンピュータに実現さ
    せるためのプログラムを記録したコンピュータ読み取り
    可能な記録媒体であって、前記多値文字画像を複数の2
    値化閾値で2値化する機能と、前記複数の2値化閾値で
    2値化された複数の文字画像の大きさと、最適2値化さ
    れた文字画像の大きさとを比較し、前記複数の文字画像
    の内、大きさの相違が所定の条件を満たす文字画像を選
    択する機能と、前記選択された文字画像と前記最適2値
    化された文字画像とを比較し、最適2値化された文字画
    像中に存在しない黒画素を前記文字画像中から削除して
    文字認識用の学習データを作成する機能をコンピュータ
    に実現させるためのプログラムを記録したコンピュータ
    読み取り可能な記録媒体。
JP34091797A 1997-12-11 1997-12-11 文字認識用の学習データ作成方法および記録媒体 Expired - Lifetime JP3763954B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34091797A JP3763954B2 (ja) 1997-12-11 1997-12-11 文字認識用の学習データ作成方法および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34091797A JP3763954B2 (ja) 1997-12-11 1997-12-11 文字認識用の学習データ作成方法および記録媒体

Publications (2)

Publication Number Publication Date
JPH11175663A true JPH11175663A (ja) 1999-07-02
JP3763954B2 JP3763954B2 (ja) 2006-04-05

Family

ID=18341499

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34091797A Expired - Lifetime JP3763954B2 (ja) 1997-12-11 1997-12-11 文字認識用の学習データ作成方法および記録媒体

Country Status (1)

Country Link
JP (1) JP3763954B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008077621A (ja) * 2006-09-23 2008-04-03 Koji Miyake 文字認識システムの学習文字サンプルの不足を補う方法
JP2009032273A (ja) * 2008-08-29 2009-02-12 Olympus Corp 分類装置
JP2010219932A (ja) * 2009-03-17 2010-09-30 Nippon Hoso Kyokai <Nhk> 画像処理装置及び画像処理プログラム
JP6968962B1 (ja) * 2020-09-25 2021-11-24 株式会社日本経済新聞社 手書き文字認識用正解データ生成装置、方法、およびプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008077621A (ja) * 2006-09-23 2008-04-03 Koji Miyake 文字認識システムの学習文字サンプルの不足を補う方法
JP2009032273A (ja) * 2008-08-29 2009-02-12 Olympus Corp 分類装置
JP2010219932A (ja) * 2009-03-17 2010-09-30 Nippon Hoso Kyokai <Nhk> 画像処理装置及び画像処理プログラム
JP6968962B1 (ja) * 2020-09-25 2021-11-24 株式会社日本経済新聞社 手書き文字認識用正解データ生成装置、方法、およびプログラム

Also Published As

Publication number Publication date
JP3763954B2 (ja) 2006-04-05

Similar Documents

Publication Publication Date Title
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
CN100585621C (zh) 图像处理装置和图像处理方法
JP4072448B2 (ja) 電子透かし抽出方法及び装置及びプログラム及び記憶媒体
JP4366003B2 (ja) 画像処理装置及び画像処理方法
JP4049560B2 (ja) 網点除去方法及びシステム
JP3763954B2 (ja) 文字認識用の学習データ作成方法および記録媒体
JP4259949B2 (ja) 画像作成装置、画像作成プログラムおよび記録媒体
JP4441300B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP3985928B2 (ja) 画像処理方法、画像処理装置、文字認識装置及び記憶媒体
JP2871601B2 (ja) 文字列検出装置及び方法
JP4259950B2 (ja) 画像認識装置、画像認識プログラムおよび記録媒体
JP4324058B2 (ja) 画像処理装置及びその方法
JP4324532B2 (ja) 画像処理装置および記憶媒体
JP4035696B2 (ja) 線分検出装置及び画像処理装置
JP2008225654A (ja) 画像処理方法、画像処理装置、及び、プログラム、プログラム記憶媒体
JP3733154B2 (ja) 画像処理装置及びその方法
US7599556B2 (en) Apparatus, system, and method for scanning segmentation
JPH08221512A (ja) 画像処理装置及びその方法
JP2001160903A (ja) 画像補正方法及び装置及びその方法を実行するプログラムを記録した記録媒体
JP2004110434A (ja) 画像処理方法および画像処理装置
JP3989647B2 (ja) 画像処理方法,装置および記録媒体
JP3103387B2 (ja) 濃淡画像の適応2値化方法
JP3639470B2 (ja) 画像処理装置及び方法並びにプログラム記録媒体
JP2001291056A (ja) 文書画像認識装置及び記録媒体
JP2000040153A (ja) 画像処理方法、画像処理プログラムを記録した媒体及び画像処理装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050920

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060118

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100127

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110127

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120127

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130127

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140127

Year of fee payment: 8

EXPY Cancellation because of completion of term