JPS603071A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPS603071A
JPS603071A JP58109188A JP10918883A JPS603071A JP S603071 A JPS603071 A JP S603071A JP 58109188 A JP58109188 A JP 58109188A JP 10918883 A JP10918883 A JP 10918883A JP S603071 A JPS603071 A JP S603071A
Authority
JP
Japan
Prior art keywords
character
pattern
subpattern
scanning
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58109188A
Other languages
English (en)
Other versions
JPH0545990B2 (ja
Inventor
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP58109188A priority Critical patent/JPS603071A/ja
Publication of JPS603071A publication Critical patent/JPS603071A/ja
Publication of JPH0545990B2 publication Critical patent/JPH0545990B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (技術分野) 本発明にL高速て精度の良い特徴抽出方式に関1″ろも
のである。
(背景技術) 従来文字図形認識装置に於ては、文字□□□形ノ々ター
ンよりストロークを抽出し、それし抽出されたストロー
クの位置、長さ、ストローク間の相互関係等を用いて認
識する方式が多べ採用されている。
この棟の装置においては、(1)文字図形の輪郭を追跡
することにより検出された輪郭点系列について曲率を計
算し、その曲率の大きな値の点を分岐点として輪郭系列
を分割し、分割された系列を組合わせることによりスト
ロークを抽出するか、又は(2)文字図形パターンに細
線化処理を行なって骨格化し、その骨格パターンの連結
性及び骨格パターンを追跡し急激な角度の変化点等を検
出し一〇゛ストロークを抽出し、該抽出されたストロー
クについて幾伺学的な肋徴等を抽出し文字図形の認別な
行なっていた。しかしながら、(11の方法(・コ1、
文字(図形パターンが大きくなり又文字図形パターンか
複動6化すると、その処理量か増太しそのため処理速度
の低下を招き、(2)の方法は、文字図形パターンを細
線化する必要があり又その細線化によるパターンのひず
み、ヒゲ等の問題かあり、その後の処理が複雑なものと
なる欠点がある。
(発明の課題) 本発明の目的はこれらの欠点を改善1−ろもので、文字
図形パターンの所望の方向のストローク成分を表わすサ
ブパターンを抽出し、サブパターンについ−C文字外接
枠の辺上の点から走査して走査線上のすベーこり文字線
の位置を検出し、走査開始点と文字線との距ぬ(1を1
3iJ記走査方向の文字外接枠の大きさで正規化し−C
l’lll tlj ′1−るN乗和の辺単位の配列を
分割して!l−1IG(−\りトル群を抽出づ−ること
を肋徴とし、その11的ばif7+速て安定な文字認識
装置を提供′fろことにJ’Iイ)。
(発明の構成J・5よσ作J−11) 第1図は本発明の文字認識装置におけろ実施例、第21
はサノバクーン例、第3図は勃徴抽Lfj例を示−J−
第1図中1(佳光届1俊換1711(,2はパターンレ
ジスタ、;うは線幅言口″+1部、・ロ土ザブパターン
抽In Bti、5(佳文字枠倹1゜旧′1シ、6(1
、辺距離計算部、7(」、重機マトリクス仙II届’i
ll、)N、l:識別i′if)、0は文字名出力−〇
−ある。
本実施例の動作は、読取機構にセットされた帳閉上の文
字は光電変換>xl+ +において2値の量子化された
ティジクル電気・箭号に変換され、パターンレジスタ2
に格納される。それと同時に、線幅計算部3に46いて
入カバターンの線幅(W)が計算される。サブパターン
抽出部4(・土、パターンレジスタについて垂直スキャ
ンを全面1j−なって、黒ヒントの連続長さと線幅割算
部;3におい℃計碧された線幅との関係より垂直サブパ
ターン(〜1S11J)を抽出する。同様に、水平スキ
ャンにより水平ザブパターン(H4F )を、右斜め・
15°スキヤンにより右斜めサブパターン(l(、SP
 )を、左斜め45°スキヤンにより左心1めザブパタ
ーン(L、’−Ef) )を抽出1−ろ。
第2図は原パターンと各ザブパターンの例で(21)は
原パターン、(1))は垂直ザブパターン(VSI’)
、(C)は水平サブパターン(ll5P )、((1)
は右斜めザブパターン(R8P ) 、(clは左斜め
サブパクー:、’ (LSP)である。文字枠検出部5
は、パターンレジスタ内の文字図形パターンに外接1−
ろ方形の枠(以後文字枠と称する)を検出し、パターン
レジスタで定義される2次元平面における前記文字枠を
規定′1−る為の位置座標を特徴抽出部6へ送出する。
以後の説明においては文字枠の左−トを原点とし、水平
方向をX軸、垂直方向をY軸とする座標系を使用する。
特徴抽出部6ば、まず垂直サブパターンにつt・て、文
字枠を構成する4辺のうち垂直な辺である左辺−1−の
点P(0,y)から水平査定を開始し、白点から黒点へ
の変化点を1−べて検出し、検出した変11点と前記走
査を開始した垂直辺」二の点1ゝとの間の距1々[Lず
なわしX座標の差を文字枠のX方向の長さを正規化定数
どして正規化した仙のN乗(Nは定数、本実施例て゛は
N−2)の値の割算を1)IJ記検出したーJ−八での
変化点について行な(・、その総和を配列■p、(y)
に格納″1−る。但し前記内点とは文字背jIt部を表
わし、黒点とは文字′に9.都を表わす。また式(1)
は前記のVパy)を式て表わしたもθうであり△XAば
それぞれσ)変化点と文字枠辺上の走査開始点との距前
な示し、〃−1,・・、1\、1(は検出された変化点
個数を表わづ−。又、式(1)中のΔXは文字枠の水s
(1方向の長さでk)す、Cは整数化定数でk)り本実
施例において(1、C=5(+とした。
上n(2の様な処理を文字枠の2つの垂直辺上のづ−ベ
ての点を開始点として行ない、垂直ザブパターンについ
て、文字枠の左辺上の点から水平走査を開始して作成す
る配列V、(i)、文字枠の右辺」−の点から水平走査
を開始して作成1−ろ配列Vr(i)を抽出づ−ろ。但
し1−09 ・、YT;YT&j、文字枠上辺のY座標
である。同様な処理により、水31zザブパターン、右
斜めザブパターン、左斜めサブパターンにすし・では文
字枠の2個の水平辺土の1−べての点から垂直走査を行
なって、水平ザブパターンについて配列”h(j)、i
+ズ(」)、右斜めサブパターンにつ℃・ての配列R,
!、(j)、HバJ)、左斜めザブパターンについての
配列Lh(J)、以(1)を抽1゛j」する。
世しJ−0,・・・、Xlt、 X+(、は文字枠右辺
のX座標である。前記水平サブパターン、右斜めザフィ
々り一ン、左斜めザブパターンについ−C抽出1−ろ配
列の添字りは文字枠の水平な下辺上の点を開始点とした
ものを表わし又は水平な上辺上の点を開始点としたもの
を表わす。又、11h (] ) 、1. lス(jL
lもh(J)、Hソ、(j)。
Ll、 fj) 、Lx(j)を抽出する際における走
査15トj始点と前記変化点との距離の正規化定数とし
ては文字枠の垂直方向の長さ△Yを使用した。文字マ1
. IJクス抽出部7は!時機抽出’*’rlS 6に
おいて抽出された8河Iの配列を使用し、各配列をM個
(へ4は定数、本実施例でむ1、へ4−7)に分割し、
分割された配列の同一分割71j位内の配列の値の平均
値をJ1算することによりへ・1×8次元の6徴マトリ
クスP CIn・1])を抽出する7、但いn =、 
、1 、・・、へ4.n=l、・・−28識別>511
8は重機マトリクス抽出部7で抽出された重機マトリク
スと、同形式で記述された標準文字マスクf (m 、
 n )どの間の式(2)で示される距離(1))をM
’l算しその距ν11(か1股も小さい値をiiえろ標
準文字マスクのカテゴリ名を文字名出力()−\出力す
る。
D−〜t’7TTT席、1〕)−′(m匹)(2)(発
jllJの効果) J以−L説明した様に、本実施例の4)徴マl−1)ク
ス抽出部において抽出された特徴マ) l)クスは、文
字図形パターンのストロークの位置、長さ、方向等を表
わすものて、文字71当有な性質を表現している。又、
図3に2独り形が類似した文学パターンと特徴抽出部で
抽出1−ろ配列を図形的に表現した例において観察され
るように、文字の局ni的な違いが前記配列に充分に反
映されるので認識I?4度の向」二を図ることができろ
。又、特徴抽出部において各配列を作成する際に、走査
を開始した文字枠辺上の点と文学線との距離を文字枠の
当該走査方向の大きさで正規化して見゛るりで手摺文字
に46いて特有な筆者の違いによる文字の大きさの変動
的を吸収することかてきろのて’11’j 1隻の良い
認)撮か用能である。又、文字図形パターンからの特徴
抽出を単純な走査といつ処理により実現しているので高
度な認識かDJ能であり、装置の小、!11!!化を図
ることもできる利点かある。
本発明は、文字図形パターンか1:)各方向のストロー
ク成分を抽出したザブパターンを垂直又は水平に走査し
、文字枠辺と文字線との距1カ[1を当該走査方向の文
字枠の大きさで正規化した値のN乗和を44.徴として
いるので、複雑な処理を必要とせす又、手書文字の変形
に追従して安定に市徴を抽出しているので高速で精度の
良い文字認識装置に利用することかできろ。
【図面の簡単な説明】
第1図に1本発明の文字1;、り識装置にオ6けろ実施
例、i′J2図C’) 〜(c)&:L−リフパターン
例を示1−1図、第:3図は特徴・例をン」ミ″づ図て
あろ、。 ]・・・光重重変換部 2・・パターンレジスタ;3 
線幅泪鏝部 ・1・・・ザブパターン抽出部5・・文字
枠構i、L′lj′tB (i・・・特徴抽出部7・・
・71力徴マトリクス油出riB 8・・・識別部9・
・・文字名出力 !時d71出力須人 沖TU:気工業株式会社 特671出1如代」![1人 弁 埋士 山 木 恵 − 券/ 図 襄2 図 < o、 ) < bノ にり (d) <e)

Claims (1)

    【特許請求の範囲】
  1. 文字図形パターンを所望の方向に走査して、当該走査方
    向におけろ文字線の断面を検出し、断面長が前記文字図
    形パターンの文字線幅より十分長い断面を抽出すること
    により行なうザブパターンの抽出を複数の方向について
    行ない、抽出したそれぞれのサブパターンについて、m
    l」記文牢図形パターンの文字外接枠の辺土の点を開始
    点として所定の方向へ走査し、走査線上におけるすべて
    の文字線の位置を検出し、走査を開始した辺上の点と、
    前記検出した文字線との距離をAil記文字外接枠の前
    記所定の方向の大きさで正規化した値のへ乗和(Nは定
    数)を抽出する処理を、前記ザブパターン毎に、又前記
    文字外接枠の4辺のうち少なくとも2辺以上の辺上のす
    べての点を開始点として、走査線を単位として行なって
    、各サブパターン毎に文字外接枠の辺を単位とした前記
    走査線毎のN乗和の配列を1lll L13 L、抽出
    した前記N乗和の配列をそれぞれM個(Mは定数)に分
    割し、各分割部位内の前記N乗和の平均値を計算したも
    のを、それぞれの配列からM次元の特徴ベクトルとして
    抽出1″ろことにより、前記文字図形ノ(ターンにつ(
    ・ての特徴ベクトル群を抽出し、抽出したil#徴ベト
    ル群と同形式で表現された辞書と照合1−ろことにより
    文字を認識1−ることを特徴とする文字認識方式。
JP58109188A 1983-06-20 1983-06-20 文字認識方法 Granted JPS603071A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58109188A JPS603071A (ja) 1983-06-20 1983-06-20 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58109188A JPS603071A (ja) 1983-06-20 1983-06-20 文字認識方法

Publications (2)

Publication Number Publication Date
JPS603071A true JPS603071A (ja) 1985-01-09
JPH0545990B2 JPH0545990B2 (ja) 1993-07-12

Family

ID=14503864

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58109188A Granted JPS603071A (ja) 1983-06-20 1983-06-20 文字認識方法

Country Status (1)

Country Link
JP (1) JPS603071A (ja)

Also Published As

Publication number Publication date
JPH0545990B2 (ja) 1993-07-12

Similar Documents

Publication Publication Date Title
Sahu et al. A study on optical character recognition techniques
Yadav et al. A robust approach for offline English character recognition
CN102663377A (zh) 一种基于模板匹配的字符识别方法
Patel et al. Handwritten character recognition using multiresolution technique and euclidean distance metric
Naz et al. Zoning features and 2DLSTM for Urdu text-line recognition
Sanjrani et al. Handwritten optical character recognition system for Sindhi numerals
Assabie et al. Offline handwritten Amharic word recognition
Pradeep et al. An investigation on the performance of hybrid features for feed forward neural network based English handwritten character recognition system
JPS603071A (ja) 文字認識方法
Saon Cursive word recognition using a random field based hidden Markov model
Sagar et al. Character segmentation algorithms for Kannada optical character recognition
Zaw et al. Character segmentation and recognition for Myanmar warning signboard images
Bhatt et al. Template-based thinning method for handwritten gujarati character’s strokes and its classification for writer-dependent gujarati font synthesis
Kaur et al. Urdu ligature recognition techniques-A review
Zaw et al. Y-position based Myanmar touching character segmentation and sub-components based character classification
Zaw et al. Segmentation Method for Myanmar Character Recognition Using Block based Pixel Count and Aspect Ratio
Khaled et al. Braille character recognition using associative memories
Parker et al. Vector templates for symbol recognition
Kumar A three tier scheme for devanagari hand-printed character recognition
Alqudah et al. Shift and scale invariant recognition of printed numerals
Ravikumar et al. Segmentation of handwritten characters from answer scripts
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JPS6222186A (ja) 図面読取り装置
JPS62125485A (ja) 文字認識方式
JPS6019287A (ja) 文字認識方法