JPS603072A - 特徴抽出方法 - Google Patents

特徴抽出方法

Info

Publication number
JPS603072A
JPS603072A JP58110211A JP11021183A JPS603072A JP S603072 A JPS603072 A JP S603072A JP 58110211 A JP58110211 A JP 58110211A JP 11021183 A JP11021183 A JP 11021183A JP S603072 A JPS603072 A JP S603072A
Authority
JP
Japan
Prior art keywords
character
pattern
extracted
subpattern
scan
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58110211A
Other languages
English (en)
Other versions
JPH0545993B2 (ja
Inventor
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP58110211A priority Critical patent/JPS603072A/ja
Publication of JPS603072A publication Critical patent/JPS603072A/ja
Publication of JPH0545993B2 publication Critical patent/JPH0545993B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (技術分野) 本発明は、高速で精度の良い文字図形認識における特徴
抽出方式に関するものである。
(背景技術) 従来、文字図形認識装置に於ては、文字図形・?ターン
よりストローりを抽出し1.それら抽出されたストロー
ク間 関係等を用いて認識する方式か多く採用されている。こ
のオIFの装置t5においては、(J)文字図形の輪郭
を追跡することにより検出された輪郭点系列について曲
率を計算し、その曲率の犬さな値の点を分割点として輪
郭系列を分割し、分割された系列を組合わせることによ
りストロークを抽出するが、又は(2)文字図形パター
ンに細線化処理を行なって骨格化し、その骨格パターン
の連結性及び骨格・ぐターン全追跡し急激な角度の変化
点等を検出してストロークを抽出し、該抽出されたスト
ロークについて幾何学的な特徴等を抽出し文字図形の識
別を行なっていた。しかしながら、(1)の方法は、文
字図形パターンか大きくなり又文字図形・ぐターンが複
雑化すると、その処理量が増太しそのため処理速度の低
下を招き、(2)の方法は、文字図形パターンを細線化
する必要があり又その細線化にょるパターンのひずみ、
ヒケ宿・の問題があり、その後の処理が複雑なものとな
る欠点がある。
(発明の目的) 本発明はこれらの欠点を改善するもので、文字図形・ぐ
ターンを所望の方向に走査し、当該走査方向のストロー
ク成分を表わすサブ7gターンを抽出し、サブ・やター
ンについて文字枠の複数の辺上の各点から走査してすべ
ての文字線との交点を検出し、走査を開始した辺上の点
と前記文字線との交点間の距離のN乗和を抽出し、もっ
て文字図形がターンの特徴抽出をなすことを特徴とし、
その目的は文字図形パターンからの特徴抽出処理か複雑
でなく、高速でなしうるごとき特徴抽出方式を提供する
ことにある。
(発明の構成及び作用) 第1図は大発明の一実施例を示す図である。同図におい
て、■は光電変換部、2ば・ξターンレノスタ、3は線
幅計算部、4はザブ・Qターン抽出部、5は文字枠検出
部、6は辺距離計算部、7は特徴マトリクス抽出部、8
は識別部、9は文字名出力である。
本実施例の動作は、次のとおシである。まず、読取機構
にセットされた帳票上の文字は、光電変換部1において
2値の量子化されたディノタル電気信号に変換さオへパ
ターンレノスフ2に格納される。それと同時に、線幅計
算部3において人カバターンの線幅(W)が計算される
。サブ・ぐターン抽出部4は、パターンレノスフについ
て垂直スキャンを全同行なって、黒ビットの連続長さと
線幅計算部:3において計算された線幅との関係より垂
直ザブ・モターン(VSP )を抽出する。同様に、水
平スキャンに」:り水平サブ・ぐターン(HSP )を
、右斜め45°スキヤンに」:り右斜めサブ7gターン
(HSP )を、左余1め45°スキヤンによシ左余1
めザブ・ぐり−ン(LSP >’を抽出する。第2図は
原パターンと各ザプノやターンの例で(、)は原パター
ン、(b)は垂直ザブパターン(vsp ) 、(c)
は水平ザブパターン(I(SP)、(d)は右斜めザブ
パターン(HSP )、(e)は左余Iめザブパターン
(LSP )である。
文字枠検出部5は・ぐクーンレジスク内の文字図形・ぐ
ターンに外接する方形の枠(以後文字枠と称する)を検
出し、パターンレノスフで定義される2次元平面におけ
る前記文字枠を規定する為の位置座標全特徴抽出部6へ
送出する。以後の説明においては文字枠の左下を原魚と
し、水平方向をX軸、厘直方向をY軸とする座標系を使
用する。特徴抽出部6はまず垂直サブパターンについて
、文字枠を構成する4辺のうち垂直な辺である左辺上の
点P(0,y)から水平走査全開始し、白点から黒点へ
の変化点勿すへて検出し、検出した変化点と前記走査を
開始した垂直辺上の点Pとの間の距離、すなわちX座標
の差のN乗(Nは定欽、本実施例ではN−2)の値の計
算を前記検出したすべての変化点について行ない、それ
ぞれの変化点についての垂直辺との距離のN乗の総イl
」を配列Vt(y)に格納する。但し、前記白点とは文
字背景部を表わし、黒点は文字線部を表わす。また式(
1)は前記のVt(y)を岱で表わしたものであシ、式
中のΔXkはそれぞれの変化点と文字枠辺との距離を表
わす。
■を優)−Σ(ΔXk) ・・・・・・ (1)上記の
様な処理を文字枠の2つの垂直辺上のすべての点を開始
点として行ない、垂直ザブ・ぐターンについて、文字枠
の左辺上の点がら゛水平走査を開始して作成する配列V
z(i)、文字枠の右辺上の点から水平走査を開始して
作成する配列Vr(i)を抽出する・佑い−O9・・・
、 YT 、 YTは文字枠上辺のY座標である。同様
な処理により、水平ザブ・ぐターン、右♀1めザブ・ぐ
ターン左斜めサブ7ターンニついては文字枠の2個の水
平辺上のすべての点から垂直走査を行なって、水平ザブ
・やターンについて配列Hb(、i) 、HH’(j)
、右斜めサブ・ぐターンについての配列1tb(J)、
Rt(j)、左斜めサブ・母ターンについての配列Lb
(J)、Lt(j)を抽出する。但しJ ”” Or・
・・。
XR、XRは文字枠右辺のX座標である。
特徴マトリクス抽出部7は、特徴抽出部6において抽出
された8種の配列を使用し、各配列をM佃に分割し、分
割された配列の同−分割単位内の配列の値の平均値を計
算することにょシ、M×8次元の特徴マトリクスF (
m r n )を抽出する。
但しm=1 、=−、M、n=11−18である。
識別部8は特徴マトリクス抽出部7て抽出された特徴マ
トリクスと、同形式で記述された標準文字マスクf(m
、n )との間の式(2)で示される距離■)を計算し
、その距離が最も小さい値全局える標準文字マスクのカ
テコ゛り名を文字名出力9へ出力する。
以上説明した様に本実施例では、特徴マトリクス抽出部
において抽出された特徴マトリクスは、文字図形パター
ンのストロークの位置、長さ、方向等を表わすもので、
文字特有の性質を表現している。例えば第3図に示すよ
うに、2才重の形が類似した文字図形・ぐターンと特徴
マトリクス抽出部で抽出する配列を図形的に表現した例
において観察されるように、文字の局所的な違いが1)
II記配列に充分に反映されているので、認識精度の向
上を図ることができる。
(発明の効果) 以」二説明し/ζ様に、本発明は文字図形パターンから
各方向のストローク成分を抽出したザブパターンを垂i
i<4.又にL水平走査を行なって文字枠辺と文字線と
の距p111のN乗和を2つの辺から作成したものを4
1徴としているので、複!Aな処理を必要とせず、又、
文字の局所的な特徴を充分に反映できる利点があり、高
速で安定な文字認識装置に利用することができる。
【図面の簡単な説明】
第1図は本発明の一実施例を示す図、第2図(a)及び
(b)ないしく、)はそれぞれ原・Qターン及びサブパ
ターンの例を示す図、及び第3図は本発明を具体例に適
用1した場合における文字図形・ぐターンと特徴抽出結
果を示す図である。 1・・・光電変換FSB 、2・・・・ぐターンレノス
タ、3・・線幅計算部、4・・・ザブパターン抽出部、
5・・・文7枠検出部、6・・・特徴抽出部、7・・・
特徴マl−1)クス抽出部、8・・・識別部、9・・・
文字名出力。 第1図 第2図 (a) (b) (cン (cl) (e)

Claims (1)

    【特許請求の範囲】
  1. 文字図形・ぞターンを予め定めた方向に走査して、該走
    査方向における文字7腺の断面を検出し、断面長が前記
    文字図形パターンの文字線幅より十分長い断面を抽出す
    るととによりザブパターンを抽出し、該ザブパターンに
    ついて前記文字図形パターンの方形の文字外接枠の4辺
    のうち、少なくとも2辺の辺上の各点から所定の方向へ
    走査して走査B−上におけるすべての文字線の位置を検
    出し、走査を開始した辺上の点と前記検出した文字1線
    との距離のN乗和(N:定数)を抽出することによシ、
    文字図形・Qターンの特徴抽出を行なうことを特徴とす
    る特徴抽出方式。
JP58110211A 1983-06-21 1983-06-21 特徴抽出方法 Granted JPS603072A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58110211A JPS603072A (ja) 1983-06-21 1983-06-21 特徴抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58110211A JPS603072A (ja) 1983-06-21 1983-06-21 特徴抽出方法

Publications (2)

Publication Number Publication Date
JPS603072A true JPS603072A (ja) 1985-01-09
JPH0545993B2 JPH0545993B2 (ja) 1993-07-12

Family

ID=14529871

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58110211A Granted JPS603072A (ja) 1983-06-21 1983-06-21 特徴抽出方法

Country Status (1)

Country Link
JP (1) JPS603072A (ja)

Also Published As

Publication number Publication date
JPH0545993B2 (ja) 1993-07-12

Similar Documents

Publication Publication Date Title
Das et al. A fast algorithm for skew detection of document images using morphology
JPS603072A (ja) 特徴抽出方法
JPH0545991B2 (ja)
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JPH0545990B2 (ja)
JPS6318787B2 (ja)
JPH0475553B2 (ja)
JPS6363952B2 (ja)
JPS5837780A (ja) 文字認識方式
JPS6019287A (ja) 文字認識方法
JPS603078A (ja) 文字認識方法
JP2941322B2 (ja) 図面処理装置
JPH01152586A (ja) 文字図形認識方法
JPH0632080B2 (ja) 文字認識方式
JP2651008B2 (ja) パターン認識方法
JPH0145669B2 (ja)
JPS62154079A (ja) 文字認識方式
JPH06131496A (ja) パターン正規化処理方法
JPS6262392B2 (ja)
JPS6262393B2 (ja)
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JPH02242391A (ja) 文字認識方式
JPS634231B2 (ja)
JPH01152585A (ja) 特徴抽出方法
JPS59194269A (ja) オンライン文字認識方式