JPS6024513B2 - 文字認識方式 - Google Patents

文字認識方式

Info

Publication number
JPS6024513B2
JPS6024513B2 JP55105127A JP10512780A JPS6024513B2 JP S6024513 B2 JPS6024513 B2 JP S6024513B2 JP 55105127 A JP55105127 A JP 55105127A JP 10512780 A JP10512780 A JP 10512780A JP S6024513 B2 JPS6024513 B2 JP S6024513B2
Authority
JP
Japan
Prior art keywords
character
pattern
character frame
dividing
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55105127A
Other languages
English (en)
Other versions
JPS5731088A (en
Inventor
義征 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP55105127A priority Critical patent/JPS6024513B2/ja
Publication of JPS5731088A publication Critical patent/JPS5731088A/ja
Publication of JPS6024513B2 publication Critical patent/JPS6024513B2/ja
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 本発明は高速で安定な文字認識方式に関するものである
従釆、文字図形認識装置に於ては文字図形パターンより
ストロークを抽出し、それら抽出されたストロークの位
置、長さ、ストロ−ク間の相互関係等を用いて認識する
方式が多く採用されている。
その手法は{1} 文字図形の輪郭を追跡することによ
り検出された輪郭点系列について曲率を計算し、その曲
率の大きさ値の点を分割点として輪郭系列を分割し、分
割された系列を組合わせることによりストロークを抽出
するか、【2’文字図形パターンに細線化処理を行なっ
て骨格化し、その骨格パターンの連結性及び骨格パター
ンを追跡し急激な角度の変化点等を検出してストローク
を抽出し、前記【1},【2)より抽出されたストロー
クについて幾何学的な特徴等を抽出して識別を行なつい
てた。しかしながら【1}の方法は文字図形パターンが
大きくなり、又文字図形パターンが複雑化すると、その
処理量が増大し処理速度の低下を招していた。又{21
の方法は文字図形パターンを細線化する必要があり、又
その細線化によるパターンのひずみヒゲの発生等の問題
がありその後の処理を複雑なものとしていた。前記‘1
’,■の欠点を除去する方法として文字図形パターンよ
りサブパターンすなわち垂直方向ストローク成分を表わ
す垂直サブパターン等を抽出し、文字枠内を(N×M)
の領域(N,Mは定数)に分割して各領域の文字線量を
表わす特徴量を計算して識別を行なう方法が提案されて
いる。しかし、第1図の8,Cの様に正しくは第1図の
Aの場所にある文字線の位置が傾斜又は位置変動により
変化した場合、分割によりサブパターンがその文字線の
方向に分割されることになり、すなわち抽出する特徴が
不安定となりその識別の為には文字の変形を吸収すると
いう意味で辞書の増加が必要でありひいては処理速度の
低下を招いていた。従って本発明は従釆の技術の上記欠
点を改善するもので、その目的は高速で安定した文字認
識方式を提供することにあり、その特徴は、文字パター
ンより抽出したサブパターンについて文字枠内を(N×
M)の領域に分割する際に、文字枠から計算した分割点
の近傍の黒V点分布により分割点を決定して抽出した特
徴マトリクスと辞書を照合するごとき文字認識方式にあ
る。
以下図面により実施例を説明する。第3図は本発明の文
字認識装置に於ける実施例であり、1は光信号入力、2
は光電変換部、3はパターンレジスタ、4は線幅計算部
、5は文字枠検出部、6,7,8,9はサブバターン抽
出部、1川ま文字枠分割決定部、11は特徴マトリクス
抽出部、12は識別部、13は文字名出力である。
本発明の実施例の動作は次のとおりである。
光信号入力1は光電変換部2は於て2値の量子化された
電気信号に変換されパターンレジスタ3に格納される。
それと同時に線幅計算部4に於て入力パターンの線幅の
が計算される。垂直サプパターン抽出部6はパターンレ
ジスタについて垂直スキャンを全面行なって、黒点(文
字線部を黒点、文字背景部を白点とする)の連続の長さ
と線幅計算部4に於て計算された線幅との関係より垂直
サブパターン(VSP)を抽出する。同様に水平サプパ
ターン抽出部7は水平スキャンにより水平サブバターン
(HSP)を、右斜めサプパターン抽出部8は右斜め(
45o)スキャンにより右斜めサブパターン(RSP)
を、左斜めサブパターン抽出部9は左斜め(45o)ス
キャンにより、左斜めサブパタ‐ン(山P)を抽出する
。第2図に原パターンとサブパターンの例を示す。第2
図のAが原パターンBがVSP、CがHSP、DがRS
P、EがLSPである。文字枠検出部5はパターンレジ
スタ内の文字パターンに外接する文字枠を検出しその位
置を文字枠分割決定部へ送る。文字枠分割決定部10は
文字枠検出部より検出された文字枠内を(N×M)の領
域(N,Mは定数、本実施例ではN=M=5)に分割す
る為の×軸、Y軸(文字枠の水平方向をX軸、垂直方向
をY軸とする)上の分割点座標を決定する。その動作は
まず文字枠のX軸辺及びY軸辺をそれぞれN等分、M等
分して仮の分割点を決定する。次にX方向の分割点決定
は、前記計算により出された仮の分割点の近傍すなわち
仮の分割点を中心に△X/Kの範囲(文字枠のx方向の
長さを△×、y方向の長さをY、Kは定数、本実施例で
はK=6)について垂直サブパターン(VSP)につい
て×軸に黒V点数の投影を作成する。そして前記作成さ
れた黒V点数の分布について黒点の投影量が最小の値を
与える点で分割点に一番近い座標点(但し仮の分割点の
両側に、黒V点数が同一で仮の分割点との距離が同一の
点が存在する場合は座標の値が大きい方とする)を分割
点と決定する。第4図を例にとって説明すると、点A′
が仮の分割点であり第4図のBが黒点数の投影である。
この図より点Aが黒点数の投影量が最小で、仮の分割点
A′との距離が最小であるので点Aを分割点と決定する
。同様に各B′,C′,D′の仮の分割点について同様
の処理を行ない×鞠上の分割点座標を決定する。Y軸上
の分割点決定は×軸上の処理と同様であるが黒V点数の
投影は水平サブパタ−ン(HSP)についてY軸につい
て行ない、仮の分割点の近傍の範囲は△Y/L(Lは定
数、本実施例ではL=6)とする。特徴マトリクス抽出
部11は文字枠分割決定部10により決定された文字枠
内領域を(N×M)個の部分領域に分割するための各分
割単位を定義するための分割点座標と、各サブパターン
抽出部6,7,8,9で抽出されたVSP,HSP,R
SP,LSPの4種のサブパターンと、線幅計算部4で
算出された線幅のとを受けて、各サプパターンを前記分
割点から決まる複数の分割単位領域に分割して各分割単
位領域毎の黒点数Bn,m(但し、n=1.2,…N:
m=1.2,・・・,M)の計数を各サブパターン毎に
行い、線幅のを使用して式(f肌=昼こ)により文字線
量の分布を表わす線長マトリクスを各サブパターン毎に
作成した後に、下記式により文字の大きさで正規化した
(N×M)×4次元の特徴マトリクスFam,m(但し
a=VS,HS,RS,瓜であり前記4種のサプパター
ンに対応する)を作成する。FMm−学ヂXC F胸血=雫FXC fRsnm FR3皿m−〉(△Xア十(△Y)2XCfLsnm FLs,n,m−ゾ(△Xア十(△Y)2XC上式中f
vs,n,m、fHs,n,m、fRs,n,m、fL
s,n,mはそれぞれ垂直サブパターン(VSP)、水
平サブパターン(HSP)、右斜めサブパターン(RS
P)、左斜めサブパターン(偽P)から作成した前記文
字線量の分布を表わす線長マトリクスであり、Cは特徴
マトリクスを整数化するための定数であり、本実施例で
はC=50とした。
識別部12は標準文字マスクFMa,肌と特徴マトリク
ス抽出部11において抽出された特徴マトリクスFa,
n,mとの間に周知の下式の距離Dを適用して○が最小
の値を与える標準文字マスクのカテゴリ名を文字名出力
13に出力する。D=ノヱ(FMa,n肌−Fa,n,
m)2以上説明した様に、本実施例では文字枠分割を黒
点数分布により決定しているので第4図のa,bの例の
様な文字線がその文字線の方向に分割されることが無く
、又特徴を文字の大きさに正規化しているので文字の大
きさの変動を吸収しており、文字線の位置変動・文字の
大きさの変動に対して安定な特徴抽出ができる利点があ
る。
より具体的に言えば、本発明は文字線の位置変動(頭斜
も含む)に分割点の位置を追従させることにある。つま
り第4図のA′点、〇点がそれぞれA点、D点というよ
うにストロークをそのストロークの方向に分断しないよ
うに分割点が文字線の位置変動に追従して決定されるの
で、特に手書文字に特有な筆記者の違いによる文字線の
変動位置を吸収して安定な特徴マトリクスを抽出するこ
とを可能としている。ここで本発明において、2種のサ
ブパターンについて黒点数の投影をそれぞれストローク
と平行な方向に行っているが、これらの投影には、第1
図のB,Cの例の様にストロークをそのストロークの方
向に分断することを避けるために必要なストロークの位
置変動の情報が他の方向のストローク成分の位置変動の
影響を無視して保存されるという基本的な性質がある。
この性質はパターンの投影には投影方向と垂直な方向へ
のストロークの位置変動が保存されるという一般的に知
られている性質に基づいている。また、文字の大きさの
変動(これは手書文字においては、筆記者の違いに起因
することが多い)は、文字線量の分布を表わす線長マト
リクスを文字枠の大きさで正規化して特徴マトリクスと
する処理により吸収している。
以上説明したごと〈、本発明は文字パターンより抽出し
たサブパターンの文字枠内を(N×M)の領域に分割す
る時に、文字線の位置変動等を考慮して分割する処理に
より安定な特徴の抽出を実現しているので、辞書が簡単
となり、高速で安定な文字認識装置が実現できる。
【図面の簡単な説明】
第1図A〜Cは従釆の文字認識方法の説明図、第2図A
〜E‘まサブパターンの抽出例、第3図は本発明の実施
例に於ける構成図、第4図A及びBは文字枠分割の説明
図である。 1・・・光信号入力、2・・・光電変換部、3・・・パ
ターンレジスタ、4…線幅計算部、5・・・文字枠検出
部、6・・・垂直サブパターン抽出部、7・・・水平サ
ブパターン抽出部、8…右斜めサブパターン抽出部、9
・・・左斜めサブパターン抽出部、10・・・文字枠分
割決定部、11・・・特徴マトリクス抽出部、12…識
別部、13・・・文字名出力。 第1図 第2図 図 の 船 第4図

Claims (1)

    【特許請求の範囲】
  1. 1 (a) 文字図形パターンの各セルの明るさを2値
    の原パターン情報に変換する光電変換部と、(b) 該
    原パターン情報の線幅を計算する線幅計算部と、(c)
    前記原パターン情報を格納するパターンレジスタと、
    (d) 当該パターンレジスタに格納された前記原パタ
    ーン情報と前記線幅により少くとも垂直ストローク成分
    及び水平ストローク成分を含む複数のストローク成分を
    あらわす複数のサブパターンを抽出する複数のサブパタ
    ーン抽出部と、(e) 前記パターンレジスタに格納さ
    れた前記原パターン情報の文字枠を検出する文字枠検出
    部と、(f) 検出された前記文字枠内を垂直方向、水
    平方向に格子状に分割するための分割点座標を決定する
    文字枠分割決定部と、(g) 前記文字枠内の格子状に
    分割された各領域内の文字線長をあらわすサブパターン
    毎の特徴量をセルを単位として計算し、当該特徴量を文
    字の大きさで正規して特徴マトリクスを抽出する特徴マ
    トリクス抽出部と、(h) 当該特徴マトリクスを予め
    用意された複数の標準文字マスクと照合して文字を識別
    する識別部とを備え、(i) 前記文字枠分割決定部は
    、水平ストローク成分及び垂直ストローク成分をあらわ
    す2つの前記サブパターンに対しそれぞれ水平方向及び
    垂直方向に黒点数の分布を算出し、前記文字枠を格子状
    に分割する際に文字枠を所定の間隔で分割する仮の分割
    点を算出した後、当該仮の分割点近傍の前記黒点数の分
    布に従つて実際の分割点を決定することを特徴とする文
    字認識方式。
JP55105127A 1980-08-01 1980-08-01 文字認識方式 Expired JPS6024513B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP55105127A JPS6024513B2 (ja) 1980-08-01 1980-08-01 文字認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP55105127A JPS6024513B2 (ja) 1980-08-01 1980-08-01 文字認識方式

Publications (2)

Publication Number Publication Date
JPS5731088A JPS5731088A (en) 1982-02-19
JPS6024513B2 true JPS6024513B2 (ja) 1985-06-13

Family

ID=14399108

Family Applications (1)

Application Number Title Priority Date Filing Date
JP55105127A Expired JPS6024513B2 (ja) 1980-08-01 1980-08-01 文字認識方式

Country Status (1)

Country Link
JP (1) JPS6024513B2 (ja)

Also Published As

Publication number Publication date
JPS5731088A (en) 1982-02-19

Similar Documents

Publication Publication Date Title
JPS6024513B2 (ja) 文字認識方式
JPS603078A (ja) 文字認識方法
JPS5894067A (ja) 文字認識方法
JPS5837780A (ja) 文字認識方式
JPH0545991B2 (ja)
JPH0632080B2 (ja) 文字認識方式
JPS62125485A (ja) 文字認識方式
JPH0266681A (ja) 図面処理装置
JPS6318787B2 (ja)
JPS62154079A (ja) 文字認識方式
JPS6262393B2 (ja)
JP2941322B2 (ja) 図面処理装置
JPH0632081B2 (ja) 文字認識方式
JPS6019287A (ja) 文字認識方法
JPH0580711B2 (ja)
JPS62164182A (ja) 文字図形パタ−ン認識方式
JPS5894064A (ja) 手書文字認識装置
JPS63233486A (ja) 特徴抽出方式
JP2732753B2 (ja) ファジィパターン認識装置
JPH0475553B2 (ja)
JPH0547871B2 (ja)
JPH03670B2 (ja)
JPS6038756B2 (ja) 文字認識方式
JPS5822776B2 (ja) ストロ−ク抽出方法
JPS6262392B2 (ja)