JPH0418352B2 - - Google Patents
Info
- Publication number
- JPH0418352B2 JPH0418352B2 JP57073006A JP7300682A JPH0418352B2 JP H0418352 B2 JPH0418352 B2 JP H0418352B2 JP 57073006 A JP57073006 A JP 57073006A JP 7300682 A JP7300682 A JP 7300682A JP H0418352 B2 JPH0418352 B2 JP H0418352B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- frame
- character
- center
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/166—Normalisation of pattern dimensions
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Description
【発明の詳細な説明】
(1) 発明の技術分野
本発明は入力パターンの部分線形的変形処理に
基づいて紙面上の汚れ等によるノイズの影響を少
なくしかつ必要な文字部分を正規化する文字認識
方式に関するものである。
基づいて紙面上の汚れ等によるノイズの影響を少
なくしかつ必要な文字部分を正規化する文字認識
方式に関するものである。
(2) 従来技術と問題点
従来の文字認識装置における文字正規化回路
は、第1図aの枠1内の文字2に対応し、同図b
に示すように入力パターンのある範囲を枠取り
し、定められた大きさ1′に伸縮する方式と、同
図cに示すように、入力パターンの重心3を中心
とした入力パターンの広がりに従つて枠取りし、
定められた大きさ1′に伸縮する方式がある。し
かし、前者方式では同図aに示すように、ノイズ
4を含めて枠取りしてしまうため、正規化パター
ンにおいて文字部分2′が極端に左に寄り小さく
なつており、ノイズ4′も含んでいる。このよう
にノイズの影響を受けやすいという欠点がある。
後者方式では同図bに示すように、重心3を中心
に入力パターン2の広がりに従い枠取りするた
め、たとえば入力文字2の頭の点が正規化パター
ン2″からは削除されてしまうようなことが起り
やすい。
は、第1図aの枠1内の文字2に対応し、同図b
に示すように入力パターンのある範囲を枠取り
し、定められた大きさ1′に伸縮する方式と、同
図cに示すように、入力パターンの重心3を中心
とした入力パターンの広がりに従つて枠取りし、
定められた大きさ1′に伸縮する方式がある。し
かし、前者方式では同図aに示すように、ノイズ
4を含めて枠取りしてしまうため、正規化パター
ンにおいて文字部分2′が極端に左に寄り小さく
なつており、ノイズ4′も含んでいる。このよう
にノイズの影響を受けやすいという欠点がある。
後者方式では同図bに示すように、重心3を中心
に入力パターン2の広がりに従い枠取りするた
め、たとえば入力文字2の頭の点が正規化パター
ン2″からは削除されてしまうようなことが起り
やすい。
(3) 発明の目的
本発明の目的は入力パターンの枠取りを行ない
枠の縦横をあらかじめ定められた値に伸縮する方
式で、ノイズの影響を受けることなくかつ必要な
文字部分を削除することのない文字認識装置を提
供することである。
枠の縦横をあらかじめ定められた値に伸縮する方
式で、ノイズの影響を受けることなくかつ必要な
文字部分を削除することのない文字認識装置を提
供することである。
(4) 発明の構成
前記目的を達成するため、本発明の文字認識装
置は入力パターンの枠取りを行ない枠の縦横をあ
らかじめ定められた値に伸縮する枠取り正規化部
と、入力パターンの重心に対応する点を枠の中心
に移動させるように入力パターンを部分線形的に
変形する部分線形変形部より成る文字正規化回路
と、正規化された入力パターンに対して特徴を抽
出する特徴抽出回路と、そこで得られた特徴を同
様にして抽出された文字特徴により構成された辞
書にマツチングさせるマツチング回路を具えたこ
とを特徴とするものである。
置は入力パターンの枠取りを行ない枠の縦横をあ
らかじめ定められた値に伸縮する枠取り正規化部
と、入力パターンの重心に対応する点を枠の中心
に移動させるように入力パターンを部分線形的に
変形する部分線形変形部より成る文字正規化回路
と、正規化された入力パターンに対して特徴を抽
出する特徴抽出回路と、そこで得られた特徴を同
様にして抽出された文字特徴により構成された辞
書にマツチングさせるマツチング回路を具えたこ
とを特徴とするものである。
(5) 発明の実施例
本発明は、手書き文字の記入バラツキを考慮
し、文字が記入される記入枠よりやや大きめの枠
を所定のフオーマツトで読取ることにより入力パ
ターンを枠取りした際に、ノイズが存在しており
文字部分の枠の中で片寄つてしまう場合、入力パ
ターンの重心が枠の中心から大きく外れてしまう
ことがある。これを是正するため、入力パターン
の重心を中心に移動させるように、入力パターン
を部分線形的に変形するものである。これによ
り、入力文字正規化パターンにおいて必要な文字
部分を削除せず、かつノイズの影響を少なくする
ようにしたものである。
し、文字が記入される記入枠よりやや大きめの枠
を所定のフオーマツトで読取ることにより入力パ
ターンを枠取りした際に、ノイズが存在しており
文字部分の枠の中で片寄つてしまう場合、入力パ
ターンの重心が枠の中心から大きく外れてしまう
ことがある。これを是正するため、入力パターン
の重心を中心に移動させるように、入力パターン
を部分線形的に変形するものである。これによ
り、入力文字正規化パターンにおいて必要な文字
部分を削除せず、かつノイズの影響を少なくする
ようにしたものである。
第2図a〜cは本発明の原理説明図である。
同図aの枠1内の入力パターン2を前述のごと
く記入枠よりやや大きめの枠を設定して枠取りし
た後、定められた大きさ1′に伸縮することによ
り同図bのパターン5′を作る。同図bのパター
ン5′においては重心3を求め、重心3から水平
線、垂直線を引くことによつてパターン5′を4
つの長方形イ,ロ,ハ,ニに分ける。次に同図c
に示すように、長方形イ,ロ,ハ,ニを線形に変
形することによつてイ,ロ,ハ,ニの重心3が枠
の中心にくるようにしてパターン5″を作る。こ
のパターン5″が文字正規化パターンである。
く記入枠よりやや大きめの枠を設定して枠取りし
た後、定められた大きさ1′に伸縮することによ
り同図bのパターン5′を作る。同図bのパター
ン5′においては重心3を求め、重心3から水平
線、垂直線を引くことによつてパターン5′を4
つの長方形イ,ロ,ハ,ニに分ける。次に同図c
に示すように、長方形イ,ロ,ハ,ニを線形に変
形することによつてイ,ロ,ハ,ニの重心3が枠
の中心にくるようにしてパターン5″を作る。こ
のパターン5″が文字正規化パターンである。
上記枠取りにおいて、文字部分の周辺にノイズ
があつた場合、枠取りだけでは、文字部分は片寄
つて小さくなつてしまい、認識処理に悪影響を及
ぼす(第1図b,第2図b)。そこで、本発明で
は、さらに入力パターンの重心を枠の中央へ移動
させるように部分線形変形をする。このことによ
り、ノイズは微少な黒部分であり入力パターンの
重心に少ない影響しかもたないので、文字の重心
が枠のほぼ中央へ移動し、枠に対する文字の相対
的大きさは、ノイズの無い場合とほぼ同じとなる
(第2図c)。従つて、たとえノイズがあつても認
識処理に対する悪い影響を小さくおさえることが
できる。また、同時に文字の拡大される部分にノ
イズがあつても、もともと微小なノイズであるた
めに、拡大されても認識処理に小さい影響しかも
たない場合がほとんどである。そうでなく、ノイ
ズがもともと大きい場合には、どんな方法を使つ
てもノイズの悪影響を小さくすることはできな
い。
があつた場合、枠取りだけでは、文字部分は片寄
つて小さくなつてしまい、認識処理に悪影響を及
ぼす(第1図b,第2図b)。そこで、本発明で
は、さらに入力パターンの重心を枠の中央へ移動
させるように部分線形変形をする。このことによ
り、ノイズは微少な黒部分であり入力パターンの
重心に少ない影響しかもたないので、文字の重心
が枠のほぼ中央へ移動し、枠に対する文字の相対
的大きさは、ノイズの無い場合とほぼ同じとなる
(第2図c)。従つて、たとえノイズがあつても認
識処理に対する悪い影響を小さくおさえることが
できる。また、同時に文字の拡大される部分にノ
イズがあつても、もともと微小なノイズであるた
めに、拡大されても認識処理に小さい影響しかも
たない場合がほとんどである。そうでなく、ノイ
ズがもともと大きい場合には、どんな方法を使つ
てもノイズの悪影響を小さくすることはできな
い。
第3図は本発明の実施例の構成説明図である。
同図において紙に書かれた入力文字は観測部10
で電気的信号である2値ビデオの入力文字パター
ンに変換される。入力文字パターンは破線内
の文字正規化回路11内の枠取り正規化回路12
により、枠取られた大きさが一定になるように線
形に伸縮された入力文字枠取り正規化パターン
に変換される。入力文字枠取り正規化パターン
は重心中心化パターン部分線形変形回路13によ
り、正規化パターンの重心に対応する点が枠の
中心に来るように部分線形的に変形された正規化
パターンに変換される。正規化パターンはパ
ターンスムージング回路14を通すことにより、
正規化の際に生じた境界の凹凸がなめらかに是正
される。こうして得られた正規化パターンから
特徴値抽出回路15により、入力文字特徴が抽
出される。次いで、入力文字特徴をマツチング
回路16に送り、辞書部17からの各カテゴリの
特徴値との距離が計算され、最も短い距離を与
えるカテゴリが認識結果として出力される。
同図において紙に書かれた入力文字は観測部10
で電気的信号である2値ビデオの入力文字パター
ンに変換される。入力文字パターンは破線内
の文字正規化回路11内の枠取り正規化回路12
により、枠取られた大きさが一定になるように線
形に伸縮された入力文字枠取り正規化パターン
に変換される。入力文字枠取り正規化パターン
は重心中心化パターン部分線形変形回路13によ
り、正規化パターンの重心に対応する点が枠の
中心に来るように部分線形的に変形された正規化
パターンに変換される。正規化パターンはパ
ターンスムージング回路14を通すことにより、
正規化の際に生じた境界の凹凸がなめらかに是正
される。こうして得られた正規化パターンから
特徴値抽出回路15により、入力文字特徴が抽
出される。次いで、入力文字特徴をマツチング
回路16に送り、辞書部17からの各カテゴリの
特徴値との距離が計算され、最も短い距離を与
えるカテゴリが認識結果として出力される。
本発明の一変形例として、入力パターンを枠取
りした後、あらかじめ定められた大きさになるよ
うに線形に伸縮し、そのパターンの重心を求め、
その点から水平線、垂直線を引いてできる4つの
長方形を線形に伸縮し、得られるパターン自身の
重心が同時に枠の中心に一致するように正規化す
る方式がある。
りした後、あらかじめ定められた大きさになるよ
うに線形に伸縮し、そのパターンの重心を求め、
その点から水平線、垂直線を引いてできる4つの
長方形を線形に伸縮し、得られるパターン自身の
重心が同時に枠の中心に一致するように正規化す
る方式がある。
この変形方式によれば、重心位置が全て中心に
なり、実施例方式よりもさらにカテゴリ毎に文字
が一様になるため、さらに認識率が向上する効果
がある。
なり、実施例方式よりもさらにカテゴリ毎に文字
が一様になるため、さらに認識率が向上する効果
がある。
(6) 発明の効果
以上説明したように、本発明によれば、枠取り
を行ない伸縮した後、入力パターンの重心を枠の
中心に移動させるように入力パターンを部分線形
的に変形し正規化するものである。これにより、
紙面上の汚れ等によるノイズの影響を少なくし、
かつ必要な文字部分を削除しないで入力文字パタ
ーンの正規化を行なうことができるため、認識率
を向上させることができる。
を行ない伸縮した後、入力パターンの重心を枠の
中心に移動させるように入力パターンを部分線形
的に変形し正規化するものである。これにより、
紙面上の汚れ等によるノイズの影響を少なくし、
かつ必要な文字部分を削除しないで入力文字パタ
ーンの正規化を行なうことができるため、認識率
を向上させることができる。
第1図a〜cは従来例の欠点の説明図、第2図
a〜cは本発明の原理説明図、第3図は本発明の
実施例の構成説明図であり、図中、1,1′は枠、
2は入力パターン、3は重心、4はノイズ、5′
は伸縮したパターン、5″は正規化パターン、1
0は観測部、11は文字正規化回路、12は枠取
り正規化回路、13は重心中心化パターン部分線
形変形回路、14はパターンスムージング回路、
15は特徴値抽出回路、16はマツチング回路、
17は辞書部を示す。
a〜cは本発明の原理説明図、第3図は本発明の
実施例の構成説明図であり、図中、1,1′は枠、
2は入力パターン、3は重心、4はノイズ、5′
は伸縮したパターン、5″は正規化パターン、1
0は観測部、11は文字正規化回路、12は枠取
り正規化回路、13は重心中心化パターン部分線
形変形回路、14はパターンスムージング回路、
15は特徴値抽出回路、16はマツチング回路、
17は辞書部を示す。
Claims (1)
- 1 入力パターンの枠取りを行ない枠の縦横をあ
らかじめ定められた値に伸縮する枠取り正規化部
と、入力パターンの重心に対応する点を枠の中心
に移動させるように入力パターンを部分線形的に
変形する部分線形変形部より成る文字正規化回路
と、正規化された入力パターンに対して特徴を抽
出する特徴抽出回路と、そこで得られた特徴を同
様にして抽出された文字特徴により構成された辞
書にマツチングさせるマツチング回路を具えたこ
とを特徴とする文字認識回路。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57073006A JPS58191082A (ja) | 1982-04-30 | 1982-04-30 | 文字認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57073006A JPS58191082A (ja) | 1982-04-30 | 1982-04-30 | 文字認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS58191082A JPS58191082A (ja) | 1983-11-08 |
| JPH0418352B2 true JPH0418352B2 (ja) | 1992-03-27 |
Family
ID=13505823
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57073006A Granted JPS58191082A (ja) | 1982-04-30 | 1982-04-30 | 文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS58191082A (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0623983B2 (ja) * | 1985-04-30 | 1994-03-30 | 富士通株式会社 | 歪補正装置 |
-
1982
- 1982-04-30 JP JP57073006A patent/JPS58191082A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS58191082A (ja) | 1983-11-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH0418352B2 (ja) | ||
| JP2000067164A (ja) | パターン認識方法及び装置並びにテンプレート作成プログラムを記録した記録媒体 | |
| JPS5991588A (ja) | 文字入力方式 | |
| CN113869313B (zh) | 一种图像背景过滤的信息识别方法及系统 | |
| JP2751865B2 (ja) | 文字列認識装置 | |
| JP2846486B2 (ja) | 画像入力装置 | |
| US12548302B1 (en) | Method for generating training data to be used for training machine learning model and training data generating device using the same | |
| JP2703559B2 (ja) | 文字認識支援装置 | |
| JP3140079B2 (ja) | 罫線認識方法及び表処理方法 | |
| JPH024033B2 (ja) | ||
| JPS62257583A (ja) | 文字認識方式 | |
| JP3157534B2 (ja) | 表認識方法 | |
| CN112364718B (zh) | 一种指读方法、装置、机器人、终端及计算机存储介质 | |
| JP2931041B2 (ja) | 表内文字認識方法 | |
| JPH05159062A (ja) | 文書認識装置 | |
| JP2985243B2 (ja) | 文字認識方法 | |
| JP4011859B2 (ja) | 単語画像正規化装置,単語画像正規化プログラム記録媒体および単語画像正規化プログラム | |
| JP3031565B2 (ja) | 表領域判定方法 | |
| JP2026049165A (ja) | 文字情報の抽出方法 | |
| JPH0142433B2 (ja) | ||
| JP2935331B2 (ja) | 図形認識装置 | |
| JPH07160820A (ja) | 文字認識方法 | |
| JP2975718B2 (ja) | パターン認識装置及びパターン認識方法 | |
| JPH1049602A (ja) | 帳票認識方法 | |
| JPH03198177A (ja) | 行切出し方法 |