JPH0545993B2 - - Google Patents

Info

Publication number
JPH0545993B2
JPH0545993B2 JP58110211A JP11021183A JPH0545993B2 JP H0545993 B2 JPH0545993 B2 JP H0545993B2 JP 58110211 A JP58110211 A JP 58110211A JP 11021183 A JP11021183 A JP 11021183A JP H0545993 B2 JPH0545993 B2 JP H0545993B2
Authority
JP
Japan
Prior art keywords
character
pattern
scanning
sub
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58110211A
Other languages
English (en)
Other versions
JPS603072A (ja
Inventor
Yoshuki Yamashita
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP58110211A priority Critical patent/JPS603072A/ja
Publication of JPS603072A publication Critical patent/JPS603072A/ja
Publication of JPH0545993B2 publication Critical patent/JPH0545993B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (技術分野) 本発明は、高速で精度の良い文字図形認識にお
ける特徴抽出方法に関するものである。
(背景技術) 従来、文字図形認識装置に於ては、文字図形パ
ターンよりストロークを抽出し、それら抽出され
たストロークの位置、長さ、ストローク間の相互
関係等を用いて認識する方式が多く採用されてい
る。この種の装置においては、(1)文字図形の輪郭
を追跡することにより検出された輪郭点系列につ
いて曲率を計算し、その曲率の大きな値の点を分
割点として輪郭系列を分割し、分割された系列を
組合わせることによりストロークを抽出するか、
又は(2)文字図形パターンに細線化処理を行なつて
骨格化し、その骨格パターンの連結性及び骨格パ
ターンを追跡し急激な角度の変化点等を検出して
ストロークを抽出し、該抽出されたストロークに
ついて幾何学的な特徴等を抽出し文字図形の識別
を行なつていた。しかしながら、(1)の方法は、文
字図形パターンが大きくなり又文字図形パターン
が複雑化すると、その処理量が増大しそのため処
理速度の低下を招き、(2)の方法は、文字図形パタ
ーンを細線化する必要があり又その細線化による
パターンのひずみ、ヒゲ等の問題があり、その後
の処理が複雑なものとなる欠点がある。
(発明の目的) 本発明はこれらの欠点を改善するもので、文字
図形パターンを所望の方向に走査し、当該走査方
向のストローク成分を表わすサブパターンを抽出
し、サブパターンについて文字枠の複数の辺上の
各点から走査してすべての文字線との交点を検出
し、走査を開始した辺上の点と前記文字線との交
点間の距離のN乗和を抽出し、もつて文字図形パ
ターンの特徴抽出をなすことを特徴とし、その目
的は文字図形パターンからの特徴抽出処理が複雑
でなく、高速でなしうるごとき文字抽出方法を提
供することにある。
(発明の構成及び作用) 第1図は本発明の一実施例を示す図である。同
図において、1は光電変換部、2はパターンレジ
スタ、3は線幅計算部、4はサブパターン抽出
部、5は文字枠検出部、6は特徴抽出部、7は特
徴マトリクス抽出部、8は識別部、9は文字名出
力である。
本実施例の動作は、次のとおりである。まず、
読取機構にセツトされた帳票上の文字は、光電変
換部1において2値の量子化されたデイジタル電
気信号に変換され、パターンレジスタ2に格納さ
れる。それと同時に、線幅計算部3において入力
パターンの線幅(W)が計算される。サブパター
ン抽出部4は、パターンレジスタについて垂直ス
キヤンを全面行なつて、黒ビツトの連続長さと線
幅計算部3において計算された線幅との関係より
垂直サブパターン(VSP)を抽出する。同様に、
水平スキヤンにより水平サブパターン(HSP)
を、右斜め45°スキヤンにより右斜めサブパター
ン(RSP)を、左斜め45°スキヤンにより左斜め
サブパターン(LSP)を抽出する。第2図は原パ
ターンと各サブパターンの例でaは原パターン、
bは垂直サブパターン(VSP)、cは水平サブパ
ターン(HSP)、dは右斜めサブパターン
(RSP)、eは左斜めサブパターン(LSP)であ
る。
文字枠検出部5はパターンレジスタ内の文字図
形パターンに外接する方形の枠(以後文字枠と称
する)を検出し、パターンレジスタで定義される
2次元平面における前記文字枠を規定する為の位
置座標を特徴抽出部6へ送出する。以後の説明に
おいては文字枠の左下を原点とし、水平方向をX
軸、垂直方向をY軸とする座標系を使用する。特
徴抽出部6はまず垂直サブパターンについて、文
字枠を構成する4辺のうち垂直な辺である左辺上
の点P(0,y)から水平走査を開始し、白点か
ら黒点への変化点をすべて検出し、検出した変化
点と前記走査を開始した垂直辺上の点Pとの間の
距離,すなわちX座標の差のN乗(Nは定数、本
実施例ではN=2)の値の計算を前記検出したす
べての変化点について行ない、それぞれの変化点
についての垂直辺との距離のN乗の総和を配列Vl
(y)に格納する。但し、前記白点とは文字背景
部を表わし、黒点は文字線部を表わす。また式(1)
は前記のVl(y)を式で表わしたものであり、式
中のΔXkはそれぞれの変化点と文字枠辺との距離
を表わす。
Vl(y)=Σ(ΔXk2 ……(1) 上記の様な処理を文字枠の2つの垂直辺上のす
べての点を開始点として行ない、垂直サブパター
ンについて、文字枠の左辺上の点から水平走査を
開始して作成する配列Vl(i)、文字枠の右辺上の
点から水平走査を開始して作成する配列Vr(i)
を抽出する。但しi=0,……,YT,YTは文
字枠上辺のY座標である。同様な処理により、水
平サブパターン、右斜めサブパターン左斜めサブ
パターンについては文字枠の2個の水平辺上のす
べての点から垂直走査を行なつて、水平サブパタ
ーンについて配列Hb(j),Ht(j)、右斜めサブ
パターンについての配列Rb(j),Rt(j)、左斜
めサブパターンについての配列Lb(j),Lt(j)
を抽出する。但しj=0,……,XR,XRは文
字枠右辺のX座標である。
特徴マトリクス抽出部7は、特徴抽出部6にお
いて抽出された8種の配列を使用し、各配列をM
個(Mは定数、本実施例ではM=7)に分割し、
分割された配列の同一分割単位内の配列の値に平
均値を計算することにより、M×8次元の特徴マ
トリクスF(m,n)を抽出する。但しm=1,
……,M,n=1,……,8である。
識別部8は特徴マトリクス抽出部7で抽出され
た特徴マトリクスと、同形式で記述された標準文
字マスクf(m,n)との間の式(2)で示される距
離Dを計算し、その距離が最も小さい値を与える
標準文字マスクのカテゴリ名を文字名出力9へ出
力する。
D=√{(,)−(,)}2 ……(2) 以上説明した様に本実施例では、特徴マトリク
ス抽出部において抽出された特徴マトリクスは、
文字図形パターンのストロークの位置、長さ、方
向等を表わすもので、文字特有の性質を表現して
いる。例えば第3図に示すように、2種の形が類
似した文字図形パターンと特徴マトリクス抽出部
で抽出する配列を図形的に表現した例において観
察されるように、文字の局所的な違いが前記配列
に充分に反映されているので、認識精度の向上を
図ることができる。
(発明の効果) 以上説明した様に、本発明は文字図形パターン
から各方向のストローク成分を抽出したサブパタ
ーンを垂直又は水平走査を行なつて文字枠辺と文
字線との距離のN乗和を2つの辺から作成したも
のを特徴としているので、複雑な処理を必要とせ
ず、又、文字の局所的な特徴を充分に反映できる
利点があり、高速で安定な文字認識装置に利用す
ることができる。
【図面の簡単な説明】
第1図は本発明の一実施例を示す図、第2図a
及びbないしeはそれぞれ原パターン及びサブパ
ターンの例を示す図、及び第3図は本発明を具体
的に適用した場合における文字図形パターンと特
徴抽出結果を示す図である。 1……光電変換部、2……パターンレジスタ、
3……線幅計算部、4……サブパターン抽出部、
5……文字枠検出部、6……特徴抽出部、7……
特徴マトリクス抽出部、8……識別部、9……文
字名出力。

Claims (1)

    【特許請求の範囲】
  1. 1 文字図形パターンを予め定めた方向に走査し
    て、該走査方向における文字線の断面を検出し、
    断面長が前記文字図形パターンの文字線幅より十
    分長い断面を抽出することによりサブパターンを
    抽出し、該サブパターンについて前記文字図形パ
    ターンの方形の文字外接枠の4辺のうち、少なく
    とも2辺の辺上の各点から所定の方向へ走査して
    走査線上におけるすべての文字線の位置を検出
    し、走査を開始した辺上の点と前記検出した文字
    線との距離のN乗和(N:定数)を抽出すること
    により、文字図形パターンの特徴抽出を行なうこ
    とを特徴とする特徴抽出方法。
JP58110211A 1983-06-21 1983-06-21 特徴抽出方法 Granted JPS603072A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58110211A JPS603072A (ja) 1983-06-21 1983-06-21 特徴抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58110211A JPS603072A (ja) 1983-06-21 1983-06-21 特徴抽出方法

Publications (2)

Publication Number Publication Date
JPS603072A JPS603072A (ja) 1985-01-09
JPH0545993B2 true JPH0545993B2 (ja) 1993-07-12

Family

ID=14529871

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58110211A Granted JPS603072A (ja) 1983-06-21 1983-06-21 特徴抽出方法

Country Status (1)

Country Link
JP (1) JPS603072A (ja)

Also Published As

Publication number Publication date
JPS603072A (ja) 1985-01-09

Similar Documents

Publication Publication Date Title
JPH0545993B2 (ja)
JPH0545991B2 (ja)
JPH0545990B2 (ja)
JPS6318787B2 (ja)
JPH0475553B2 (ja)
JPS6262392B2 (ja)
JPS5837780A (ja) 文字認識方式
JPS6363952B2 (ja)
JPH0545992B2 (ja)
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JPH0420228B2 (ja)
JPS6038755B2 (ja) 特徴抽出方式
JPS6262393B2 (ja)
JPS62125485A (ja) 文字認識方式
JPH0632080B2 (ja) 文字認識方式
JPS62154079A (ja) 文字認識方式
JPH01152586A (ja) 文字図形認識方法
JP2708604B2 (ja) 文字認識方法
JPH0833908B2 (ja) 特徴抽出方法
JPH0547871B2 (ja)
JPS62125484A (ja) 文字認識方式
JPH035630B2 (ja)
JPH0420221B2 (ja)
JPS622382A (ja) 画像処理方法
JPS62157983A (ja) 文字認識方式