JPH0418352B2 - - Google Patents

Info

Publication number
JPH0418352B2
JPH0418352B2 JP57073006A JP7300682A JPH0418352B2 JP H0418352 B2 JPH0418352 B2 JP H0418352B2 JP 57073006 A JP57073006 A JP 57073006A JP 7300682 A JP7300682 A JP 7300682A JP H0418352 B2 JPH0418352 B2 JP H0418352B2
Authority
JP
Japan
Prior art keywords
pattern
frame
character
center
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57073006A
Other languages
English (en)
Other versions
JPS58191082A (ja
Inventor
Hiroshi Kamata
Tozen Hai
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57073006A priority Critical patent/JPS58191082A/ja
Publication of JPS58191082A publication Critical patent/JPS58191082A/ja
Publication of JPH0418352B2 publication Critical patent/JPH0418352B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/166Normalisation of pattern dimensions
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】 (1) 発明の技術分野 本発明は入力パターンの部分線形的変形処理に
基づいて紙面上の汚れ等によるノイズの影響を少
なくしかつ必要な文字部分を正規化する文字認識
方式に関するものである。
(2) 従来技術と問題点 従来の文字認識装置における文字正規化回路
は、第1図aの枠1内の文字2に対応し、同図b
に示すように入力パターンのある範囲を枠取り
し、定められた大きさ1′に伸縮する方式と、同
図cに示すように、入力パターンの重心3を中心
とした入力パターンの広がりに従つて枠取りし、
定められた大きさ1′に伸縮する方式がある。し
かし、前者方式では同図aに示すように、ノイズ
4を含めて枠取りしてしまうため、正規化パター
ンにおいて文字部分2′が極端に左に寄り小さく
なつており、ノイズ4′も含んでいる。このよう
にノイズの影響を受けやすいという欠点がある。
後者方式では同図bに示すように、重心3を中心
に入力パターン2の広がりに従い枠取りするた
め、たとえば入力文字2の頭の点が正規化パター
ン2″からは削除されてしまうようなことが起り
やすい。
(3) 発明の目的 本発明の目的は入力パターンの枠取りを行ない
枠の縦横をあらかじめ定められた値に伸縮する方
式で、ノイズの影響を受けることなくかつ必要な
文字部分を削除することのない文字認識装置を提
供することである。
(4) 発明の構成 前記目的を達成するため、本発明の文字認識装
置は入力パターンの枠取りを行ない枠の縦横をあ
らかじめ定められた値に伸縮する枠取り正規化部
と、入力パターンの重心に対応する点を枠の中心
に移動させるように入力パターンを部分線形的に
変形する部分線形変形部より成る文字正規化回路
と、正規化された入力パターンに対して特徴を抽
出する特徴抽出回路と、そこで得られた特徴を同
様にして抽出された文字特徴により構成された辞
書にマツチングさせるマツチング回路を具えたこ
とを特徴とするものである。
(5) 発明の実施例 本発明は、手書き文字の記入バラツキを考慮
し、文字が記入される記入枠よりやや大きめの枠
を所定のフオーマツトで読取ることにより入力パ
ターンを枠取りした際に、ノイズが存在しており
文字部分の枠の中で片寄つてしまう場合、入力パ
ターンの重心が枠の中心から大きく外れてしまう
ことがある。これを是正するため、入力パターン
の重心を中心に移動させるように、入力パターン
を部分線形的に変形するものである。これによ
り、入力文字正規化パターンにおいて必要な文字
部分を削除せず、かつノイズの影響を少なくする
ようにしたものである。
第2図a〜cは本発明の原理説明図である。
同図aの枠1内の入力パターン2を前述のごと
く記入枠よりやや大きめの枠を設定して枠取りし
た後、定められた大きさ1′に伸縮することによ
り同図bのパターン5′を作る。同図bのパター
ン5′においては重心3を求め、重心3から水平
線、垂直線を引くことによつてパターン5′を4
つの長方形イ,ロ,ハ,ニに分ける。次に同図c
に示すように、長方形イ,ロ,ハ,ニを線形に変
形することによつてイ,ロ,ハ,ニの重心3が枠
の中心にくるようにしてパターン5″を作る。こ
のパターン5″が文字正規化パターンである。
上記枠取りにおいて、文字部分の周辺にノイズ
があつた場合、枠取りだけでは、文字部分は片寄
つて小さくなつてしまい、認識処理に悪影響を及
ぼす(第1図b,第2図b)。そこで、本発明で
は、さらに入力パターンの重心を枠の中央へ移動
させるように部分線形変形をする。このことによ
り、ノイズは微少な黒部分であり入力パターンの
重心に少ない影響しかもたないので、文字の重心
が枠のほぼ中央へ移動し、枠に対する文字の相対
的大きさは、ノイズの無い場合とほぼ同じとなる
(第2図c)。従つて、たとえノイズがあつても認
識処理に対する悪い影響を小さくおさえることが
できる。また、同時に文字の拡大される部分にノ
イズがあつても、もともと微小なノイズであるた
めに、拡大されても認識処理に小さい影響しかも
たない場合がほとんどである。そうでなく、ノイ
ズがもともと大きい場合には、どんな方法を使つ
てもノイズの悪影響を小さくすることはできな
い。
第3図は本発明の実施例の構成説明図である。
同図において紙に書かれた入力文字は観測部10
で電気的信号である2値ビデオの入力文字パター
ンに変換される。入力文字パターンは破線内
の文字正規化回路11内の枠取り正規化回路12
により、枠取られた大きさが一定になるように線
形に伸縮された入力文字枠取り正規化パターン
に変換される。入力文字枠取り正規化パターン
は重心中心化パターン部分線形変形回路13によ
り、正規化パターンの重心に対応する点が枠の
中心に来るように部分線形的に変形された正規化
パターンに変換される。正規化パターンはパ
ターンスムージング回路14を通すことにより、
正規化の際に生じた境界の凹凸がなめらかに是正
される。こうして得られた正規化パターンから
特徴値抽出回路15により、入力文字特徴が抽
出される。次いで、入力文字特徴をマツチング
回路16に送り、辞書部17からの各カテゴリの
特徴値との距離が計算され、最も短い距離を与
えるカテゴリが認識結果として出力される。
本発明の一変形例として、入力パターンを枠取
りした後、あらかじめ定められた大きさになるよ
うに線形に伸縮し、そのパターンの重心を求め、
その点から水平線、垂直線を引いてできる4つの
長方形を線形に伸縮し、得られるパターン自身の
重心が同時に枠の中心に一致するように正規化す
る方式がある。
この変形方式によれば、重心位置が全て中心に
なり、実施例方式よりもさらにカテゴリ毎に文字
が一様になるため、さらに認識率が向上する効果
がある。
(6) 発明の効果 以上説明したように、本発明によれば、枠取り
を行ない伸縮した後、入力パターンの重心を枠の
中心に移動させるように入力パターンを部分線形
的に変形し正規化するものである。これにより、
紙面上の汚れ等によるノイズの影響を少なくし、
かつ必要な文字部分を削除しないで入力文字パタ
ーンの正規化を行なうことができるため、認識率
を向上させることができる。
【図面の簡単な説明】
第1図a〜cは従来例の欠点の説明図、第2図
a〜cは本発明の原理説明図、第3図は本発明の
実施例の構成説明図であり、図中、1,1′は枠、
2は入力パターン、3は重心、4はノイズ、5′
は伸縮したパターン、5″は正規化パターン、1
0は観測部、11は文字正規化回路、12は枠取
り正規化回路、13は重心中心化パターン部分線
形変形回路、14はパターンスムージング回路、
15は特徴値抽出回路、16はマツチング回路、
17は辞書部を示す。

Claims (1)

    【特許請求の範囲】
  1. 1 入力パターンの枠取りを行ない枠の縦横をあ
    らかじめ定められた値に伸縮する枠取り正規化部
    と、入力パターンの重心に対応する点を枠の中心
    に移動させるように入力パターンを部分線形的に
    変形する部分線形変形部より成る文字正規化回路
    と、正規化された入力パターンに対して特徴を抽
    出する特徴抽出回路と、そこで得られた特徴を同
    様にして抽出された文字特徴により構成された辞
    書にマツチングさせるマツチング回路を具えたこ
    とを特徴とする文字認識回路。
JP57073006A 1982-04-30 1982-04-30 文字認識装置 Granted JPS58191082A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57073006A JPS58191082A (ja) 1982-04-30 1982-04-30 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57073006A JPS58191082A (ja) 1982-04-30 1982-04-30 文字認識装置

Publications (2)

Publication Number Publication Date
JPS58191082A JPS58191082A (ja) 1983-11-08
JPH0418352B2 true JPH0418352B2 (ja) 1992-03-27

Family

ID=13505823

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57073006A Granted JPS58191082A (ja) 1982-04-30 1982-04-30 文字認識装置

Country Status (1)

Country Link
JP (1) JPS58191082A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0623983B2 (ja) * 1985-04-30 1994-03-30 富士通株式会社 歪補正装置

Also Published As

Publication number Publication date
JPS58191082A (ja) 1983-11-08

Similar Documents

Publication Publication Date Title
JPH0418352B2 (ja)
JP2000067164A (ja) パターン認識方法及び装置並びにテンプレート作成プログラムを記録した記録媒体
JPS5991588A (ja) 文字入力方式
CN113869313B (zh) 一种图像背景过滤的信息识别方法及系统
JP2751865B2 (ja) 文字列認識装置
JP2846486B2 (ja) 画像入力装置
US12548302B1 (en) Method for generating training data to be used for training machine learning model and training data generating device using the same
JP2703559B2 (ja) 文字認識支援装置
JP3140079B2 (ja) 罫線認識方法及び表処理方法
JPH024033B2 (ja)
JPS62257583A (ja) 文字認識方式
JP3157534B2 (ja) 表認識方法
CN112364718B (zh) 一种指读方法、装置、机器人、终端及计算机存储介质
JP2931041B2 (ja) 表内文字認識方法
JPH05159062A (ja) 文書認識装置
JP2985243B2 (ja) 文字認識方法
JP4011859B2 (ja) 単語画像正規化装置,単語画像正規化プログラム記録媒体および単語画像正規化プログラム
JP3031565B2 (ja) 表領域判定方法
JP2026049165A (ja) 文字情報の抽出方法
JPH0142433B2 (ja)
JP2935331B2 (ja) 図形認識装置
JPH07160820A (ja) 文字認識方法
JP2975718B2 (ja) パターン認識装置及びパターン認識方法
JPH1049602A (ja) 帳票認識方法
JPH03198177A (ja) 行切出し方法