JPH07192097A - 文字認識装置およびその方法 - Google Patents
文字認識装置およびその方法Info
- Publication number
- JPH07192097A JPH07192097A JP5333482A JP33348293A JPH07192097A JP H07192097 A JPH07192097 A JP H07192097A JP 5333482 A JP5333482 A JP 5333482A JP 33348293 A JP33348293 A JP 33348293A JP H07192097 A JPH07192097 A JP H07192097A
- Authority
- JP
- Japan
- Prior art keywords
- character
- data
- recognition
- outputting
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 4
- 230000002093 peripheral effect Effects 0.000 claims abstract description 14
- 230000001537 neural effect Effects 0.000 claims abstract description 11
- 238000006243 chemical reaction Methods 0.000 claims abstract description 8
- 238000013528 artificial neural network Methods 0.000 claims description 19
- 238000010586 diagram Methods 0.000 description 7
- 230000000295 complement effect Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
(57)【要約】
【目的】文字のずれに影響されない文字認識をすること
ができる。 【構成】この文字認識装置は、認識対象文字画像を撮像
する光電変換スキャナ1の出力映像信号aをデジタル変
換してデジタル画像bを出力するA/D変換回路2と、
デジタル画像bを一時記憶する画像メモリ3の出力画像
データcから文字領域と文字周辺領域とを切り出す文字
周辺領域切り出し回路4の出力文字データdをニューラ
ルネット認識入力パターンである格子分割データeとし
て出力する文字データ格子分割回路5とを備える。ま
た、格子分割データeを上下左右斜め8方向にずらした
データとずらさないデータとを合わせて作成する文字デ
ータずらし回路6の出力ずらしデータfをニューラルネ
ットを用いて文字認識して判定出力値gを出力するニュ
ーラルネット文字認識回路7と、ニューラルネット判定
出力値gが最大になる文字を認識文字hとする認識結果
判定回路とを備える。
ができる。 【構成】この文字認識装置は、認識対象文字画像を撮像
する光電変換スキャナ1の出力映像信号aをデジタル変
換してデジタル画像bを出力するA/D変換回路2と、
デジタル画像bを一時記憶する画像メモリ3の出力画像
データcから文字領域と文字周辺領域とを切り出す文字
周辺領域切り出し回路4の出力文字データdをニューラ
ルネット認識入力パターンである格子分割データeとし
て出力する文字データ格子分割回路5とを備える。ま
た、格子分割データeを上下左右斜め8方向にずらした
データとずらさないデータとを合わせて作成する文字デ
ータずらし回路6の出力ずらしデータfをニューラルネ
ットを用いて文字認識して判定出力値gを出力するニュ
ーラルネット文字認識回路7と、ニューラルネット判定
出力値gが最大になる文字を認識文字hとする認識結果
判定回路とを備える。
Description
【0001】
【産業上の利用分野】本発明は文字認識装置およびその
方法に関し、特にノイズなどが入り文字がずれて切り出
される場合でもノイズの影響をうけず高認識率を得る文
字認識装置およびその方法に関する。
方法に関し、特にノイズなどが入り文字がずれて切り出
される場合でもノイズの影響をうけず高認識率を得る文
字認識装置およびその方法に関する。
【0002】
【従来の技術】従来、この種の文字認識装置は、文字の
学習時にあらかじめずらした文字データも学習させてお
き、認識時にはずれたままの文字データを認識するなど
の対処をしている。図5の文字のように認識対象文字に
ノイズが入りずれて切り出された場合でもずれたまま認
識している。
学習時にあらかじめずらした文字データも学習させてお
き、認識時にはずれたままの文字データを認識するなど
の対処をしている。図5の文字のように認識対象文字に
ノイズが入りずれて切り出された場合でもずれたまま認
識している。
【0003】
【発明が解決しようとする課題】この従来の文字認識装
置は、ずれて切り出された文字データの場合もそのまま
認識するため、図5のように「E」が下にずれた場合な
どは「E」が下にずれたのか「F」が下にずれたのか識
別できず、「F」と誤認識される可能性があるなど認識
率低下の原因となっている。
置は、ずれて切り出された文字データの場合もそのまま
認識するため、図5のように「E」が下にずれた場合な
どは「E」が下にずれたのか「F」が下にずれたのか識
別できず、「F」と誤認識される可能性があるなど認識
率低下の原因となっている。
【0004】
【課題を解決するための手段】本発明の文字認識装置
は、認識対象文字の画像を撮像して映像信号を出力する
撮像手段と、前記映像信号をデジタル変換してデジタル
画像を出力するA/D変換手段と、前記デジタル画像を
一時記憶して画像データとして出力する画像記憶手段
と、前記画像データから文字領域と文字周辺領域とを切
り出して切り出し文字データとして出力する文字周辺領
域切り出し手段と、前記切り出し文字データをニューラ
ルネット認識入力パターンである格子分割データとして
出力する文字データ格子分割手段と、前記格子分割デー
タから上下左右ななめ8方向にずらしたデータとずらさ
ないデータとを合わせた9データを作成する文字データ
ずらし手段と、前記9データをそれぞれニューラルネッ
トを用いて文字認識してニューラルネット判定出力値を
出力するニューラルネット文字認識手段と、前記ニュー
ラルネット判定出力値が最大になる文字を認識文字とす
る認識結果判定手段とを備える。
は、認識対象文字の画像を撮像して映像信号を出力する
撮像手段と、前記映像信号をデジタル変換してデジタル
画像を出力するA/D変換手段と、前記デジタル画像を
一時記憶して画像データとして出力する画像記憶手段
と、前記画像データから文字領域と文字周辺領域とを切
り出して切り出し文字データとして出力する文字周辺領
域切り出し手段と、前記切り出し文字データをニューラ
ルネット認識入力パターンである格子分割データとして
出力する文字データ格子分割手段と、前記格子分割デー
タから上下左右ななめ8方向にずらしたデータとずらさ
ないデータとを合わせた9データを作成する文字データ
ずらし手段と、前記9データをそれぞれニューラルネッ
トを用いて文字認識してニューラルネット判定出力値を
出力するニューラルネット文字認識手段と、前記ニュー
ラルネット判定出力値が最大になる文字を認識文字とす
る認識結果判定手段とを備える。
【0005】
【実施例】次に、本発明について図面を参照して説明す
る。
る。
【0006】本発明の一実施例をブロックで示す図1を
参照すると、この実施例の文字認識装置は、認識対象文
字の画像を撮像して映像信号aを出力する光電変換スキ
ャナ1と、映像信号aをデジタル変換してデジタル画像
bを出力するA/D変換回路2と、デジタル画像bを一
時記憶して画像データcとして出力する画像メモリ3
と、画像データcから文字領域と文字周辺領域とを切り
出して切り出し文字データdとして出力する文字周辺領
域切り出し回路4と、切り出し文字データdをニューラ
ルネット認識入力パターンである格子分割データeとし
て出力する文字データ格子分割回路5と、格子分割デー
タeを上下左右ななめ8方向にずらしたデータとずらさ
ないデータとを合わせた9データをずらしデータfとし
て作成する文字データずらし回路6と、ずらしデータf
をそれぞれニューラルネットを用いて文字認識してニュ
ーラルネット判定出力値gを出力するニューラルネット
文字認識回路7と、ニューラルネット判定出力値gが最
大になる文字を認識文字hとする認識結果判定回路とか
ら構成される。
参照すると、この実施例の文字認識装置は、認識対象文
字の画像を撮像して映像信号aを出力する光電変換スキ
ャナ1と、映像信号aをデジタル変換してデジタル画像
bを出力するA/D変換回路2と、デジタル画像bを一
時記憶して画像データcとして出力する画像メモリ3
と、画像データcから文字領域と文字周辺領域とを切り
出して切り出し文字データdとして出力する文字周辺領
域切り出し回路4と、切り出し文字データdをニューラ
ルネット認識入力パターンである格子分割データeとし
て出力する文字データ格子分割回路5と、格子分割デー
タeを上下左右ななめ8方向にずらしたデータとずらさ
ないデータとを合わせた9データをずらしデータfとし
て作成する文字データずらし回路6と、ずらしデータf
をそれぞれニューラルネットを用いて文字認識してニュ
ーラルネット判定出力値gを出力するニューラルネット
文字認識回路7と、ニューラルネット判定出力値gが最
大になる文字を認識文字hとする認識結果判定回路とか
ら構成される。
【0007】図2は、画像データcを文字周辺領域切り
出し回路4で切り出した切り出し文字データdの一例を
示す図である。図2における切り出し文字データdは、
ノイズがついた「E」という文字の文字領域22を後の
ずらしを考慮してニューラルネット認識入力パターンで
ある格子に分割するときの1格子分だけ上下左右に拡大
することにより文字周辺領域21を切り出した画像デー
タである。
出し回路4で切り出した切り出し文字データdの一例を
示す図である。図2における切り出し文字データdは、
ノイズがついた「E」という文字の文字領域22を後の
ずらしを考慮してニューラルネット認識入力パターンで
ある格子に分割するときの1格子分だけ上下左右に拡大
することにより文字周辺領域21を切り出した画像デー
タである。
【0008】図3は、図2の切り出し文字データdを文
字データ格子分割回路5で分割した格子分割データeの
一例を示す。図3における格子分割データeは、ニュー
ラルネット認識入力パターンとしては9×11の格子に
分割するが、ここでは上下左右に1格子分多くとり11
×13とする。この格子分割データeは、1格子内に文
字部分(黒い部分)がどれだけ入っているかということ
を白マスの中の黒い正方形の大きさでデータの大きさを
表している。
字データ格子分割回路5で分割した格子分割データeの
一例を示す。図3における格子分割データeは、ニュー
ラルネット認識入力パターンとしては9×11の格子に
分割するが、ここでは上下左右に1格子分多くとり11
×13とする。この格子分割データeは、1格子内に文
字部分(黒い部分)がどれだけ入っているかということ
を白マスの中の黒い正方形の大きさでデータの大きさを
表している。
【0009】図4は、文字ずらし回路6で作成するずら
しデータfの一例を示す。文字データずらし回路6は、
格子分割データeを上下左右ななめ8方向に1格子分ず
らしたデータ41〜48とずらしなしデータ40とを合
わせた9データを作成してずらしデータfとして出力す
る。
しデータfの一例を示す。文字データずらし回路6は、
格子分割データeを上下左右ななめ8方向に1格子分ず
らしたデータ41〜48とずらしなしデータ40とを合
わせた9データを作成してずらしデータfとして出力す
る。
【0010】ニューラルネット文字認識回路7は、9デ
ータ40〜48のずらしデータfをそれぞれニューラル
ネットを用いて文字認識し、0〜1.0までの値で認識
された文字の確からしさを示す判定出力値gを出力す
る。図4のずらしなしデータ40の場合の判定出力値g
は、第1候補が文字‘F’の0.312となり、第2候
補が文字‘E’の0.207となる。また、上ずらしデ
ータ41の場合の判定出力値gは、第1候補が文字
‘E’の0.987となり、第2候補が文字‘3’の
0.010となる。これら9データ40〜48のずらし
データfの中では上ずらしデータ41が本来切り出され
るべきデーダに最も近いので‘E’の判定出力値gが高
くなり、他の8データは第1項補の出力値もそれ程高く
ならない。
ータ40〜48のずらしデータfをそれぞれニューラル
ネットを用いて文字認識し、0〜1.0までの値で認識
された文字の確からしさを示す判定出力値gを出力す
る。図4のずらしなしデータ40の場合の判定出力値g
は、第1候補が文字‘F’の0.312となり、第2候
補が文字‘E’の0.207となる。また、上ずらしデ
ータ41の場合の判定出力値gは、第1候補が文字
‘E’の0.987となり、第2候補が文字‘3’の
0.010となる。これら9データ40〜48のずらし
データfの中では上ずらしデータ41が本来切り出され
るべきデーダに最も近いので‘E’の判定出力値gが高
くなり、他の8データは第1項補の出力値もそれ程高く
ならない。
【0011】認識結果判定回路8は、9データ40〜4
8のずらしデータfの判定出力値gの中から出力値が最
大の文字を認識文字hと判定し、認識文字hとして
‘E’を出力する。
8のずらしデータfの判定出力値gの中から出力値が最
大の文字を認識文字hと判定し、認識文字hとして
‘E’を出力する。
【0012】
【発明の効果】以上説明したように、本発明によれば、
画像データから文字領域と文字の周辺領域とを切り出し
てニューラルネット認識入力パターンである格子分割デ
ータとして出力し、この格子分割データから上下左右な
なめ8方向にずらしたデータとずらさないデータとを合
わせた9データを作成し、この9データをそれぞれニュ
ーラルネットを用いて文字認識してニューラルネット判
定出力値が最大になる文字を認識文字とすることによ
り、文字のずれに影響されない文字認識をすることがで
きる。
画像データから文字領域と文字の周辺領域とを切り出し
てニューラルネット認識入力パターンである格子分割デ
ータとして出力し、この格子分割データから上下左右な
なめ8方向にずらしたデータとずらさないデータとを合
わせた9データを作成し、この9データをそれぞれニュ
ーラルネットを用いて文字認識してニューラルネット判
定出力値が最大になる文字を認識文字とすることによ
り、文字のずれに影響されない文字認識をすることがで
きる。
【図1】本発明の一実施例の構成を示すブロック図であ
る。
る。
【図2】この実施例の切り出し文字データの一例を示す
図である。
図である。
【図3】この実施例の格子分割データの一例を示す図で
ある。
ある。
【図4】この実施例のずらしデータの一例を示す図であ
る。
る。
【図5】認識対象文字にノイズが入りずれて切り出され
た場合を示す図である。
た場合を示す図である。
1 光電変換スキャナ 2 A/D変換回路 3 画像メモリ 4 文字周辺領域切り出し回路 5 文字データ格子分割回路 6 文字データずらし回路 7 ニューラルネット文字認識回路 8 認識結果判定回路 21 文字周辺領域 22 文字領域 a 映像信号 b デジタル画像 c 画像データ d 切り出し文字データ e 格子分割データ f ずらしデータ g 判定出力値 h 認識文字
Claims (2)
- 【請求項1】 認識対象文字の画像を撮像して映像信号
を出力する撮像手段と、前記映像信号をデジタル変換し
てデジタル画像を出力するA/D変換手段と、前記デジ
タル画像を一時記憶して画像データとして出力する画像
記憶手段と、前記画像データから文字領域と文字周辺領
域とを切り出して切り出し文字データとして出力する文
字周辺領域切り出し手段と、前記切り出し文字データを
ニューラルネット認識入力パターンである格子分割デー
タとして出力する文字データ格子分割手段と、前記格子
分割データから上下左右ななめ8方向にずらしたデータ
とずらさないデータとを合わせた9データを作成する文
字データずらし手段と、前記9データをそれぞれニュー
ラルネットを用いて文字認識してニューラルネット判定
出力値を出力するニューラルネット文字認識手段と、前
記ニューラルネット判定出力値が最大になる文字を認識
文字とする認識結果判定手段とを備えることを特徴とす
る文字認識装置。 - 【請求項2】 認識対象文字の画像を撮像して映像信号
を出力し、前記映像信号をデジタル画像にデジタル変換
し、前記デジタル画像を一時記憶して画像データとして
出力し、前記画像データから文字領域と文字の周辺領域
とを切り出して切り出し文字データとして出力し、前記
切り出し文字データをニューラルネット認識入力パター
ンである格子分割データとして出力し、前記格子分割デ
ータから上下左右ななめ8方向にずらしたデータとずら
さないデータとを合わせた9データを作成し、前記9デ
ータをそれぞれニューラルネットを用いて文字認識して
ニューラルネット判定出力値を出力し、前記ニューラル
ネット判定出力値が最大になる文字を認識文字とするこ
とを特徴とする文字認識方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5333482A JPH07192097A (ja) | 1993-12-27 | 1993-12-27 | 文字認識装置およびその方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5333482A JPH07192097A (ja) | 1993-12-27 | 1993-12-27 | 文字認識装置およびその方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH07192097A true JPH07192097A (ja) | 1995-07-28 |
Family
ID=18266560
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP5333482A Pending JPH07192097A (ja) | 1993-12-27 | 1993-12-27 | 文字認識装置およびその方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH07192097A (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6731788B1 (en) | 1999-01-28 | 2004-05-04 | Koninklijke Philips Electronics N.V. | Symbol Classification with shape features applied to neural network |
| JP2007047965A (ja) * | 2005-08-09 | 2007-02-22 | Fujifilm Corp | デジタル画像の対象物検出方法および装置並びにプログラム |
| JP2013145434A (ja) * | 2012-01-13 | 2013-07-25 | Nippon Syst Wear Kk | ジェスチャー認識装置におけるスイッチ押下判定システム、方法、プログラム、および該プログラムを格納したコンピュータ可読媒体 |
| US10015591B2 (en) | 2014-06-19 | 2018-07-03 | Huawei Technologies Co., Ltd. | Pickup apparatus and pickup method |
-
1993
- 1993-12-27 JP JP5333482A patent/JPH07192097A/ja active Pending
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6731788B1 (en) | 1999-01-28 | 2004-05-04 | Koninklijke Philips Electronics N.V. | Symbol Classification with shape features applied to neural network |
| JP2007047965A (ja) * | 2005-08-09 | 2007-02-22 | Fujifilm Corp | デジタル画像の対象物検出方法および装置並びにプログラム |
| JP2013145434A (ja) * | 2012-01-13 | 2013-07-25 | Nippon Syst Wear Kk | ジェスチャー認識装置におけるスイッチ押下判定システム、方法、プログラム、および該プログラムを格納したコンピュータ可読媒体 |
| US10015591B2 (en) | 2014-06-19 | 2018-07-03 | Huawei Technologies Co., Ltd. | Pickup apparatus and pickup method |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR930010845B1 (ko) | 화상정보의 그림/문자 자동분리방법 | |
| US7454060B2 (en) | Image processor for character recognition | |
| JP3088010B2 (ja) | 線画分離方法および装置 | |
| US6269186B1 (en) | Image processing apparatus and method | |
| JPH07192097A (ja) | 文字認識装置およびその方法 | |
| JPH11284846A (ja) | 画像処理装置 | |
| JPH04248766A (ja) | 像域分離装置 | |
| JPH03201772A (ja) | イメージスキャナ | |
| JPH10232926A (ja) | 画像処理装置及びその方法 | |
| JP3020293B2 (ja) | 属性判別方法 | |
| JP4122703B2 (ja) | 画像処理装置 | |
| JP3226580B2 (ja) | 画像処理装置 | |
| JP3466655B2 (ja) | 画像処理装置 | |
| JPS61289476A (ja) | 文字読取装置のフオ−マツト生成方式 | |
| JPH05266257A (ja) | ニューラルネット用学習データ作成装置 | |
| JP3019522B2 (ja) | 画像の読取り装置 | |
| KR940000934B1 (ko) | 팩시밀리의 화상 이진화 처리방법 | |
| JP2926842B2 (ja) | 文字切出し回路 | |
| JP3019521B2 (ja) | 画像の読取り装置 | |
| JP3019518B2 (ja) | 画像の読取り装置 | |
| JPH02153487A (ja) | 文字・写真領域判定装置およびそれを用いた画像入力装置ならびに光学文字認識装置 | |
| JPH0728953A (ja) | 文字検出装置 | |
| JPH04372085A (ja) | 文字読取方法 | |
| JPH11161739A (ja) | 文字認識装置 | |
| JPH0520487A (ja) | 2値画像変換装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 19980506 |