JPS6047635B2 - 文字認識方式 - Google Patents

文字認識方式

Info

Publication number
JPS6047635B2
JPS6047635B2 JP55120477A JP12047780A JPS6047635B2 JP S6047635 B2 JPS6047635 B2 JP S6047635B2 JP 55120477 A JP55120477 A JP 55120477A JP 12047780 A JP12047780 A JP 12047780A JP S6047635 B2 JPS6047635 B2 JP S6047635B2
Authority
JP
Japan
Prior art keywords
character
recognized
intersections
effective area
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55120477A
Other languages
English (en)
Other versions
JPS5745682A (en
Inventor
昌明 石亀
光善 小口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic System Solutions Japan Co Ltd
Original Assignee
Matsushita Graphic Communication Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Graphic Communication Systems Inc filed Critical Matsushita Graphic Communication Systems Inc
Priority to JP55120477A priority Critical patent/JPS6047635B2/ja
Publication of JPS5745682A publication Critical patent/JPS5745682A/ja
Publication of JPS6047635B2 publication Critical patent/JPS6047635B2/ja
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/184Extraction of features or characteristics of the image by analysing segments intersecting the pattern
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 本発明は類似度法による文字認識方式、特に手書き文
字の認識に好適な文字認識方式に関する。
従来、一般に手書き文字の認識には、類似度法による
文字認識方式は不適とされ、特徴整合法や構造解析法に
よる文字認識方式が採用されていた。 しかし、従来の
特徴整合法や構造解析法等による文字認識方式は、変形
パターンを含めた多くの標準パターンを用意しなければ
ならないとともに、文字の大きさや位置等が認識率に影
響を及ぼす等の欠点を有していた。
本発明は前記従来の欠点を解消するべくなされたもの
で、被認識文字の大きさや位置が認識率に影響を及ぼす
ことがなく、かつ手書き文字を認識できる、類似度法に
よる文字認識方式を提供するものである。
以下本発明の一実施例を図滅に基づいて説明する。
まず被認識文字を仮想空間に投影し、この仮想空間上に
おいて、互いに直交するX,yの2方向(便宜上、X方
向は上下方向、y方向は左右方向とする)に被認識文字
を走査し、被認識文字の有効領域Aを求める。ここでは
、該有効領域Aは被認識文字が前記仮想空間上において
X,y両方向にそれぞれ占める最大幅て囲まれる領域を
指す。このようにして有効領域Aが求められると、次に
第1図のように(第1図において被認識文字はアラビア
数字の5とされている)、その有効領域AをX方向の等
間較な9本の走査線Xi(1=1,2,・・9)および
y方向の等間隔な9本の走査線Yi(1=1,2,・・
9)ぜ走査する。
なお、各走査線XiおよびYiのうち、両端に位置する
Xl,X9,ylおよびY9は有効領域Aの4辺をなす
ようにする。そして有効領域Aを、第2図(a)に示す
ように、該有効領域Aをx方向の線分で2等分してなる
y(左)領域Yfおよびy(右)領域Yrと、第2図(
b)に示すように、該有効領域Aをy方向線分で2当分
してなるx(上)領域およびX(下)領域Xeとの4つ
の領域に分割し、領域Y1およびYrにおいては各走査
線Yiと被認識文字との交点数を求めるとともに、領域
XuおよびXfにおいては各走査線Xiと被認識文字と
の交点数を求めることにより、各領域毎に被認識文字の
特徴パターンを抽出する。
なお第1図において前記交点はOで示されている。ここ
で、前記領域毎の特徴パターンは、第3図のように、各
走査線XiまたはYiにブロックBiを対.応させ、有
効領域Aの4辺をなす走査線Xl,ylおよびX9,y
9に対応するブロックB1およびB9には1ビットを割
り付け、残りのブロックB2,B3・・・B8にはそれ
ぞれ2ビットを割り付けかつ各ブロックBiに対応する
走査線Xiまたは±iと被認識ζ文字との交点数を第1
表のようにグレイコード形式で設定することによりそれ
ぞれ9ブロック16ビットパターンで構成する。
なお、ブロックB1およびB9には、1ビットしか割り
付けないのは、被認識文字の対象を数字、カナ文字等に
限定すること、有効領域Aの4辺をなす走査線Xl,y
l,X9およびY9と被認識文字との交点数はOまたは
1に限られるからである。
また、文字端点並び走査線Xl,yl,X9およびY9
に・おける交点数が不安定であることから、前記のよう
に交点数をグレイコード形式で設定すれば、バイナリ−
コード形式で設定するより認識率を高めることができる
。このようにして抽出された各領域Y′,Yr,・Xu
,xeにおける被認識文字の特徴パターンを、以下それ
ぞれy(左)軸特徴パターン、y(右)軸特徴パターン
、x(上)軸特徴パターン、x(下)軸特徴パターンと
称することとし、これらの特徴パターンを第1図(a)
,Yb)の有効領域Aの周囲に示す。
次に、このようにして得られた各軸特徴パターンをあら
かじめ用意されたすべてのカテゴリーの標準パターンと
対比し、類似度を求める。
ここで各カテゴリーの標準パターンは、多くの被験者デ
ータを統計的に解析し、各ビットの重み量として求め、
これをテーブル化したものとする。第4図は一例として
アラビア数字の場合における各特徴軸の前記各ビットの
重み量を示したものである。
第4図において、各ビットの重み量は絶対値で示され、
各特徴軸を示す線が重み量0を意味する。なお、各ビッ
トの重み量は後述するように規格化されているため、最
大値は1である。また第5図は標準パターンのメモリー
マップ、の一例を示す。類似度は次式で定義する。
””UJここ
で、Skは被認識文字、Seは推定文字をそれぞれ示す
また、Rn(Sk,Se)は任意パターンのn軸に対す
る類似度を示し、次式で定義する。(2)式中のUni
(Sk,Sl)は次式で表わされる。
(3)式中のXni(Sk)は、被認識文字をn軸上で
16ビット表示された特徴パターンのiビット目を示す
。またWni(Se)はで示されるもので、多数の被験
者データから求めた各ビットの重み量である。
(4)式中のNnilはm人による推定文字Sfのn軸
上でのiビットが1である数、NniOはm人による推
定文字SfOn軸上でのfビット目がOである数である
また(2)式中のWn(Sf)はn軸特徴パターンの各
ビットの重み量の絶対値の総和でである。
本方式では、前記各式に従つて全てのカテゴリーについ
ての類似度を求め、そのうちの最大類似度と次大類似度
との差があらかじめ設定した閾値以上ならば、被認識文
字は前記最大類似度を示すカテゴリーに属すると判定す
る。
また、最大類似度と次大類似度との差が前記閾値より小
さいならば、判定不能とする。
前記閾値の適切な値は実験的に求めることがてきる。な
お、数字“1゛および負号゛−゛を認識する場合は、有
効領域A(7)x方向またはy方向の幅がある閾値であ
ることを測定することにより、前記のように類似度を求
めることなく、直ちに“゜1゛またば−゛と判定するこ
とができる。第6図は以上の被認識手順をフローチャー
トで示したものである。
第7図は本方式を実施するための装置の実施例を示す。
光電変換装置1は被認識文字を2次元に走査して読み取
り、該被認識文字を電気信号に変換するとともに、有効
領域Aを求め、これらを被認識文字格納レジスタ2へ出
力する。該レジスタ2に格納さぇた有効領域Aは走査線
Xi,yi(1=1,2・・・9)でX,y方向に走査
され、これにより得られたy(左)軸、y(右)軸x(
上)軸およびx(下)軸特徴パクーンは特徴パターン格
納レジスタ3に格納される。一方、各カテゴリーの標準
パターンは標準パターン記憶装置4にあらかじめ記憶さ
れており、類似度演算回路5は特徴パターン格納レジス
タ3から引き出される各軸特徴パターンおよび標準パタ
ーン記憶装置4から引き出される標準パターンにより、
類似度を算出する。
算出された類似度は類似度格納レジスタ26に格納され
るが、アドレスレジスタ7は1つのカテゴリーについて
の類似度が算出ざれる毎に標準パターン記憶装置4に指
示を与えて次のカテゴリーの標準パターンを類似度演算
回路5へ出力させ、すべてのカテゴリーについて類似度
が算出されるようにする。
このようにして、すべてのカテゴリーについて類似度が
求められると、そのうちの最大類似度および次大類似度
が最大・次大類似度格納レジスタ8によつて格納される
判定演算回路9は、前記最大類似度と次大類似度との差
が設定された閾値以上であるならば、被認識文字は最大
類似度を示すカテゴリーに属すると判定し、最大類似度
と次大類似度との差が閾値より小さい場合は判定不能と
する。
以上本発明による被認識文字方式は、類似度法lに特徴
パターンを抽出するので、被認識文字の大きさや位置が
認識率に影響を及ぼすことがなく、かつ手書き文字の認
識を行なうことができるという優れた効果を得られる利
点を有する。
【図面の簡単な説明】
″ 図面は本発明の一実施例を示し、第1図は有効領域
、走査線および各軸特徴パターンを示す説明図、第2図
は第1図におけるy(左)、y(右)、x(上)、x(
下)領域を示す説明図、第3図は第1図における各軸特
徴パターン構成法を示す説フ明図、第4図は数字パター
ンを例として各軸特徴パターンの各ビットの重み量を示
す説明図、第5図は数字パターンを例とした標準パター
ンの構成例を示す説明図、第6図はそのフローチャート
、第7図は前記実施例を実行する装置ブロック図である
。 (4)・・・・・・有効領域、(Xu)・・・・・・x
(上)領域、(Xe)・・・・・・x(下)領域、(Y
e)・・・・・・y(左)領域、(Yr)・・・・・・
y(右)領域、(Xi)・・・・・・x方向走査線、(
Yi)・・・・・・y方向走査線、1・・・・・・光電
変換装置、2・・・・・被認識文字格納レジスタ、3・
・・・・・特徴パターン格納レジスタ、4・・・・・・
標準パターン記憶装置、5・・・・・類似度演算回路、
6・・・・・類似度格納レジスタ、8・・・・・・最大
・次大類似度カテゴリー格納レジスタ、9・・・・・・
判定演算回路。

Claims (1)

  1. 【特許請求の範囲】 1 光電変換素子で二次元的に走査した被認識文字を格
    納する被認識文字格納手段と、この被認識文字格納手段
    に格納された被認識文字の有効領域をx方向のn本(但
    しnは整数)の走査線および前記x方向に直交するy方
    向のn本の走査線で走査し、前記有効領域をx方向の線
    分で2分してなる2つの領域における前記被認識文字と
    前記y方向の各走査線との交点数、および前記有効領域
    をy方向の線分で2分割してなる2つの領域における前
    記被認識文字と前記x方向の各走査線との交点数をそれ
    ぞれ求め、前記x、y両方向の各n本の走査線のうちの
    前記有効領域の端を通過する両端の2本の走査線におけ
    る前記各交点数に対しては1ビットを割り付けられると
    ともに、残りの走査線における前記各交点数に対しては
    2ビットを割り付けた上、前記分割された4つの領域毎
    に前記各交点数をコード化して得た4次元の特徴パター
    ンをそれぞれnブロック2n−2)ビットのデータとし
    て格納する特徴パターン格納手段と、各文字毎に予め設
    定された複数の標準パターンを記憶する標準パターン記
    憶手段とを具備し、前記特徴パターン格納手段と前記標
    準パターン記憶手段との出力とにより前記特徴パターン
    と前記複数の標準パターンとの最大類似度と次最大類似
    度とを求め、前記最大類似度と次最大類似度との差が所
    定の閾値以上である場合に前記被認識文字は前記最大類
    似度を示すカテゴリーに属すると判定する文字認識方式
    。 2 分割された4つの領域毎に各交点数をコード化する
    ためのコードをグレイコードとしたことを特徴とする特
    許請求の範囲第1項記載の文字認識方式。
JP55120477A 1980-08-29 1980-08-29 文字認識方式 Expired JPS6047635B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP55120477A JPS6047635B2 (ja) 1980-08-29 1980-08-29 文字認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP55120477A JPS6047635B2 (ja) 1980-08-29 1980-08-29 文字認識方式

Publications (2)

Publication Number Publication Date
JPS5745682A JPS5745682A (en) 1982-03-15
JPS6047635B2 true JPS6047635B2 (ja) 1985-10-22

Family

ID=14787138

Family Applications (1)

Application Number Title Priority Date Filing Date
JP55120477A Expired JPS6047635B2 (ja) 1980-08-29 1980-08-29 文字認識方式

Country Status (1)

Country Link
JP (1) JPS6047635B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62281090A (ja) * 1986-05-30 1987-12-05 Canon Inc パタ−ン情報認識方法
JP2578768B2 (ja) * 1986-05-30 1997-02-05 キヤノン株式会社 画像処理方法
JP2578767B2 (ja) * 1986-05-30 1997-02-05 キヤノン株式会社 画像処理方法

Also Published As

Publication number Publication date
JPS5745682A (en) 1982-03-15

Similar Documents

Publication Publication Date Title
CN110543877A (zh) 标识识别方法及其模型的训练方法、装置和电子系统
JPS6047635B2 (ja) 文字認識方式
JPH10124662A (ja) 図形整形装置および図形整形方法
JPH0147829B2 (ja)
JPS62175886A (ja) 文字パターン整形装置
JP2988697B2 (ja) 図形認識方式
JPH03126188A (ja) 文字認識装置
JP2616994B2 (ja) 特徴抽出装置
JP2507949B2 (ja) 文字/図形領域判定装置
JP2739011B2 (ja) セキュリティシステム
JPS5814709B2 (ja) 閉図形の形状認識方式
JPS6316791B2 (ja)
JPH0147835B2 (ja)
JPS63238686A (ja) 特徴抽出方式
JPS6245582B2 (ja)
JPS60120479A (ja) 交差点屈折点抽出装置
JPH0475553B2 (ja)
JPH01116779A (ja) 情報認識装置
JPH04148488A (ja) 文字認識装置
JPH0714011A (ja) 文字認識装置および文字認識方法
JPH04587A (ja) 文字認識方法
JPH0147832B2 (ja)
JPH04239391A (ja) パターン正規化方式
JPH02287894A (ja) 文字認識装置
JPH0310389A (ja) 文字認識装置