JPH04591A - 特徴抽出方法 - Google Patents

特徴抽出方法

Info

Publication number
JPH04591A
JPH04591A JP2100832A JP10083290A JPH04591A JP H04591 A JPH04591 A JP H04591A JP 2100832 A JP2100832 A JP 2100832A JP 10083290 A JP10083290 A JP 10083290A JP H04591 A JPH04591 A JP H04591A
Authority
JP
Japan
Prior art keywords
pattern
character
sub
inclination
subpattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2100832A
Other languages
English (en)
Inventor
Koichi Higuchi
浩一 樋口
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2100832A priority Critical patent/JPH04591A/ja
Publication of JPH04591A publication Critical patent/JPH04591A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、媒体上の文字を光電変換して得られる文字パ
タンを、複数方向に走査して該文字パタンから特徴を抽
出する特徴抽出方法、特に高速で、安定な特徴抽出方法
に関するものである。
(従来の技術) 従来、この種の特徴抽出方法としては、特開昭57−2
3185号公報(文献1〉、及び特公昭38−5555
1号公報(文献2〉に記載されるものがあった。
文献1の技術では、媒体上の文字を光電変換して得られ
た文字パタンより、各方向の線素成分(ストローク成分
)を表わすサブパタンを抽出する。そして、該サブパタ
ンを複数の領域に分割してその分割された各領域毎に、
前記サブパタンの線素の量を表わす特徴を抽出して特徴
マトリクスを生成する。その後、該特徴マトリクスと、
予め用意した辞書とを、照合して前記文字を認識するも
のであった。
また、文献2の技術では、文字パタンの走査により、走
査線とストロークの交差数を特徴量として抽出するもの
であった。
(発明が解決しようとする課題) しかしなから、上記の特徴抽出方法では、次のような課
題があった。
(i)  第2図は、印刷文字の斜体字の例を示す図で
ある。この図における数字゛○゛を模式化した図を第3
図(a)〜(d)に示す。即ち、第3図(a)は斜体で
ない文字パタン′○゛の例、同図(b)は斜体字“0°
の例、同図(C)は前記文献1の方法を用いて同図(a
)の文字パタンから抽出した垂直サブパタン、及び同図
(d)は前記文献1の方法を用いて同図(b)の文字パ
タンから抽出した垂直サブバタンである。
前記文献1の特徴抽出方法を用いて第3図(a>の文字
パタンの垂直サブパタンを抽出すると、第3図(C)の
ように、垂直成分を忠実に抽出できる。
しかし、第3図(b)の斜体字に対して垂直サブパタン
を抽出すると、第3図(d)に示すように、線素成分が
傾く。その上、第3図(d)の破線で示すような線素成
分が抽出されるべきところが、傾いた線素に対して垂直
に走査しているため、線素の両端部が欠けてしまう。そ
のなめ、同し字形“0°でありなから、抽出される特徴
が異なる(つまり、抽出される特徴が不安定となる)と
いう問題があった。また、手書文字の変形としては、一
般に右上がりのものが多く、水平線素が傾いているため
、前記と同様に、抽出される特徴が不安定となるという
問題があった。
従って、特徴抽出後、辞書と照合して文字認識を行う場
合、文字傾斜の変形に対応した多数の辞書を用意しなけ
ればならない。そのため、辞書容量が増大し、照合の長
時間化による処理速度の低下と、ハード規模(装置規模
)の増大を招くという不都合があった。
(ii)  前記文献2の技術では、走査線と線素の交
差数を特徴量としているので、第3図(b)のように線
素に傾斜があると、走査方向を固定したとき、抽出され
る交差数(特徴量)が大きく変動し、前記(i)と同様
の問題が生じる。
本発明は前記従来技術が持っていた課題として、抽出さ
れる特徴が不安定となる点と、処理速度の低下及び装置
の大型化の点について解決した特徴抽出方法を提供する
ものである。
(課題を解決するための手段) 前記課題を解決するために、第1の発明は、媒体上の文
字を光電変換して得られる文字パタンを、複数の方向に
走査して該文字パタンから特徴を抽出する特徴抽出方法
において、次のような手段を講じたものである。
即ち、前記文字パタンを垂直方向及び水平方向の双方又
はいずれか一方の方向に走査し、該走査方向の黒画素の
連続数と前記文字パタンの線幅との関係により、該走査
方向の線素成分を表わす補助サブパタンを抽出し、前記
補助サブパタンに含まれる線素の傾斜より、前記補助サ
ブパタンの傾斜を抽出した後、前記補助サブパタンの傾
斜に基づき、前記文字パタンを複数の方向に走査して前
記文字パタンから特徴を抽出するようにしている。
第2の発明では、媒体上の文字を光電変換して得られる
文字パタンを複数の方向に走査し、該走査方向の黒画素
の連続数と線幅との関係により、該走査方向の線素成分
を表わすサブパタンを抽出した後、耐記サブパタンを複
数の領域に分割してその分割された領域毎に、前記サブ
パタンの線素量を表わす特徴を抽出する特徴抽出方法に
おいて、次のような手段を講したものである。
即ち、前記文字バタンを垂直方向及び水平方向の双方又
はいずれか一方の方向に走査し、該走査方向の黒画素の
連続数と前記文字パタンの線幅との関係により、該走査
方向の線素成分を表わす補助サブバタンを抽出し、前記
補助サブパタンに含まれる線素の傾斜より、前記補助サ
ブパタンの傾斜を抽出した後、前記補助サブパタンの傾
斜に基づき、前記サブバタンを抽出するようにしている
(作用) 第1及び第2の発明によれば、以上のように特徴抽出方
法を構成しなので、文字パタンが入力されると、その文
字パタンを垂直方向及び水平方向の双方又はいずれか一
方の方向を走査し、該走査方向の線素成分を表わす補助
サブパタンを抽出した後、その補助サブパタンの傾斜を
抽出する。
そして第1の発明では、抽出された傾斜に従って前記文
字パタンを走査し、走査線とストロークの交差数等とい
った特徴量を抽出する。
また第2の発明では、抽出された傾斜に従ってサブパタ
ンを抽出し、その後、そのサブパタンを複数の領域に分
割してその分割された領域毎に前記サブパタンの特徴を
抽出する。
これにより、手書文字や印刷文字において傾斜がある文
字パタンについても、抽出される特徴が安定となり、前
記課題を解決できるのである。
(実施例) 第1図は、本発明の実施例を示す特徴抽出方法を用いた
文字認識装置の機能ブロック図である。
この文字認識装置は、帳票等の媒体上の文字画像の光信
号INを量子化された電気信号(ディジタル信号)に変
換する光電変換部1を有し、その出力側には、行バッフ
ァ2が接続されている。行バッファ2は、例えば福20
48x高さ128ビツトの大きさを有し、1行分の文字
画像のディジタル信号を格納する構成になっており、そ
の出力側には、文字切出部3を介してバタンレジスタ4
が接続されている。文字切出部3は、メモリを有し、行
バッファ2の出力から1文字分のディジタル信号(これ
を、1文字パタン」という)をバタンレジスタ4に格納
する機能を有している。
バタンレジスタ4は、例えば64x64ビツトの記憶容
量を有し、その出力側には、線幅測定部ヲ及び第1のサ
ブバタン抽出部6が接続されている。第1のサブバタン
抽出部6の出力側には、文字傾斜抽出部7が接続されて
いる。また、バタンレジスタ4の出力側には、文字枠検
出部8を介して分割点決定部9が接続されると共に、第
2のサブバタン抽出部10が接続されている。分割点決
定部9及び第2のサブバタン抽出部10の出力側には、
特徴マトリクス抽出部11が接続され、その出力側に、
識別部12が接続されている。
線幅測定部5は、バタンレジスタ4の出力に対する線幅
を測定し、その測定結果を第1および第2のサブバタン
抽出部6.10に与える機能を有している。第1のサブ
バタン抽出部6は、バタンレジスタ4を垂直及び水平方
向に走査して第1の垂直サブバタン(補助垂直サブバタ
ン)及び第1の水平サブパタン(補助水平サブバタン)
を抽出するもので、垂直サブバタン抽出部6a及び水平
サブバタン抽出部6bより構成されている。各抽出部6
+a、6bは、それぞれバタン格納用のメモリを有して
いる。
文字傾斜抽出部7は、第1のサブバタン抽出部6で抽出
された第1の垂直サブバタン及び第1の水平サブバタン
について傾斜を抽出し、その抽出結果を第2のサブバタ
ン抽出部10及び特徴マトリクス抽出部11へ出力する
機能を有している。
文字枠検出部8は、バタンレジスタ4内の文字パタンを
走査して外接枠、つまり文字枠を検出し、その検出結果
を分割点検出部9に与える機能を有している。分割点決
定部9は、外接枠内を複数の部分領域に分割するための
分割点座標を決定し、その決定結果を特徴マトリクス抽
出部11へ出力する機能を有している。
第2のサブバタン抽出部10は、文字傾斜抽出部7で抽
出された傾斜に基づき、バタンレジスタ4を複数方向に
走査して第2の垂直サブバタン及び第2の水平サブパタ
ンを抽出すると共に、右斜めサブパタン及び左斜めサブ
バタンを抽出するもので、垂直サブバタン抽出部10a
、水平サブバタン抽出部10b、右斜めサブバタン抽出
部10C5及び左斜めサブバタン抽出部10dより構成
されている。各抽出部10a〜10dは、それぞれバタ
ン格納用のメモリを有している。
特徴マトリクス抽出部11は、サブバタン抽出部10か
ら出力される垂直、水平、右斜め、及び左斜めサブパタ
ンの各バタンから、特徴量を抽出して特徴マトリクスを
作成し、それを識別部12へ与える機能を有している。
識別部12は、標準文字の特徴マトリクス(標準文字マ
スク)G(k)と、この特徴マトリクスG(k>を有す
る標準文字の文字名とを、格納する辞書メモリを有して
いる。そして、特徴マトリクス抽出部11で抽出された
特徴マトリクスF (k)と、辞書メモリの特徴マトリ
クスG (k>とを、照合することにより、該特徴マト
リクスF (k>を得た外接枠内領域の文字図形の認識
を行い、文字名OUTを出力する機能を有している。
次に、以上のように構成される文字認識装置を用いた特
徴抽出方法と、その抽出結果から文字認識を行う方法に
ついて、各機能ブロックの処理(I)〜(X)について
説明する。
(I>  文字バタン生成処理 根票上に記入された文字画像の光信号INが光電変換部
1に入力されると、光電変換部1では、光信号INを2
値のデジタル信号、つまり文字線部を“1° (これを
「黒ビット」という)、背景部をO゛ (これを「白ビ
ットJという)に変換する。光電変換部1で変換された
1行分の文字画像のデジタル信号は、行バッファ2に格
納される。
文字切出部3では、行バッファ2に格納された文字画像
のデジタル信号から、1文字分のデジタル信号(文字バ
タン)を切出し、バタンレジスタ4に格納する。本実施
例では、帳票フォーマットが予め指定されており、文字
切出部3のメモリに、行バツフア2内の文字位置を示す
アドレスが格納されている。そのため、文字切出し動作
は、該アドレスで指定さhf:行バッファ2の内容を読
み出すことにより実行される。
(II)  線幅測定処理 線幅測定部5は、バタンレジスタ4からのディジタル信
号を入力し、例えば2×2の窓の全ての点が黒ビットと
なる状態の個数Qと、全黒ビットの個数Aとを計数し、
従来周知の(1)式に従って線幅WLを算出する。
WL=A/(A−Q>     ・・・・・・(1)(
I[I)  第1のサブバタン抽出処理第1のサブバタ
ン抽出部6では、次のような処理を行う。
垂直サブバタン抽出部6aでは、垂直方向を主走査方向
としてバタンレジスタ4を全面走査し、垂直方向の走査
線上で連続する黒ビット(黒ラン)を検出する。そして
、検出した黒ランの中から、次式(2)を満足する長さ
pの黒ランを抽出する。
1≧N、WL ・・・・・・(2〉 但し、9;主走査方向における黒ラ ンの長さ N:各サブパタンに対する任 意定数(例えば、2) 垂直サブバタン抽出部6aは、(2)式を満足する黒ラ
ンを、サブパタンを構成する黒ランとみなして、内部に
設けられた垂直サブバタンメモリに格納する。(2)式
を満足しない黒ランは、白ビットとみなす。
また、水平サブバタン抽出部6bでは、垂直サブバタン
抽出部6aと同様の動作により、水平方向を主走査方向
としてバタンレジスタ4を走査し、水平方向の走査線上
の黒ランのなかから(2〉式を満足する黒ランを抽出す
る。そして、抽出した黒ランを、サブパタンを構成する
黒ランとみなして、内部に設けられた水平サブバタンメ
モリに格納する。
(1v〉  文字傾斜抽出処理 文字傾斜抽出部7は、サブバタン抽出部6より得られる
第1の垂直サブバタン(補助垂直サブバタン)及び第1
の水平サブバタン(補助水平サブバタン)のそれぞれに
ついて、該サブバタンの文字線素成分(これを「ストロ
ークjという)を抽出する。次に、抽出した各ストロー
クの両端の座標値より、各ストロークの傾きを計算し、
それらを平均して、第1の垂直サブバタンからは垂直ス
トロークの平均傾斜θV、第1の水平サブバタンからは
水平ストロークの平均傾斜θhを、それぞれ抽出する。
次に、この平均傾斜θV、θhの具体的な抽出方法につ
いて説明する。
まず、第1の垂直サブバタンについて、水平走査を全面
について行い、白ビットから黒ビ・ソト、及び黒ビット
から白ビットへの変化点を検出する。
そして、1ライン前の走査線と、現在の走査線における
変化点座標との関係より、ストロークの両端座標を抽出
する。
抽出したストロークの両端座標を(VXSi。
VYSi)と(VXE i 、 VYE i )とした
とき、(3)式を用いて垂直ストロークの平均傾斜θ■
を計算する。但し、i−1,・・・・・・、Pv、Pv
は第1の垂直サブバタンより抽出したストローク数、ま
たVYSi<VYEiである。
θ■= =1 ・・・・・・(3) ここで、VLGiは次式(4)より求められる。
VLGi= HAX  I、 j VXEi−VXSi  1.  
、: VYEi−VYSi  i)トローク数、またH
XSj<HXEjである。
θh= この(4)式は、2点間の距離を、その2点間の水平及
び垂直座標差のうちで小さい方の1/2と他の一方との
和とする近似式である。
また、第1の水平サブバタンより水平ストロークの平均
傾斜θhを、次のようにして抽出する。
第1の水平サブバタンについて垂直走査を行い、水平ス
トロークの両端座標を抽出する。その両端座標を、(H
XSj、HYSj )と(HXEj。
HYEj)としたとき、水平ストロークの平均座標θh
を(ヲ)式で計算する。但し、j=1.・・・・・・、
Ph、Phは水平サブバタンより抽出したスここで、H
LGjは次式(6)より求められる。
)ILGj= MAX  I I HXEJ−HXSJHvEj−hv
sj口 なお、ストローク数がOのときは、傾斜を0とする。即
ち、Pv=OのときはθV=O1ph=Oのときはθh
=○とする。
(V)  文字枠検出処理 文字枠検出部8では、バタンレジスタ4のパタンを走査
してそのパタンの左端座標χM、右端座標Xr、上端座
標Yt及び下端座標Ybを検出する。外接枠、つまり文
字枠は(xfJ、yt>、(X、Q 、 Yb)、(X
r、Yt)、(Xr、Yb)の4点を結ぶ矩形枠となる
また、文字枠検出後は、特徴量の正規化を行うために、
必要な文字枠の大きさを算出する。即ち、バタンレジス
タ4のX軸に対し、平行な方向(水平方向〉の文字枠の
大きさをWPhとしてwph=Xr−XJI↑1を、垂
直な方向く垂直方向)の文字枠の大きさをWPvとして
WPv=Yt−Yb+1を、それぞれ算出する。さらに
、右斜め及び左斜め45°方向の文字枠の大きさをWP
r及びWPJIとして WPh−i−WPv WPr=WPjl = を算出する。これらの算出結果は、分割点決定部9に与
えられる。
(VI)  分割点決定処理 分割点決定部9は、外接文字枠内をNXxNY個の部分
領域に分割するためのX軸上及びY軸上の分割点座標を
、各外接枠毎に決定する。但し、NXはX軸方向におけ
る分割数、及びNYはX軸方向における分割数である。
分割数NX及びNYは、文字の複雑さに応して任意好適
な値に設定するのが好ましい。例えば、漢字・カタカナ
等の画数の少ない文字を認識対象とする場合は、(2X
2)〜(3X3)程度の少ない数の部分領域に、外接枠
内領域を分割する。
漢字が認識対象となる場合には、(4X4)〜(8X8
)程度の部分領域に、外接枠内領域を分割することが多
い。しかし、本実施例では、認識対象の複雑さにかかわ
らず、外接枠内領域を等分割、例えば(4x4)個に分
割するようにした。
X軸上の分割座標DX(n)、及びY軸上の分割座標D
Y(n)は、次式(7)、(8)で決定される。
DX (n> NX ・・・・・・(7) DY (m) 但し、n=1.2.=・=−、NX−lm=1.2.・
・・・・・、NY−1 本実施例では、例えば NX=NY=4 F)  サブバタン抽出処理 第4図(a)、(b)は、サブパタンの抽出方法を示す
図であり、同図(a>は文字パタンの例、及び同図(b
)は垂直サブパタンの例である。第4図(a)中の矢印
Pは、垂直サブバタン抽出時の走査経路を示す。
第2のサブバタン抽出部10では、文字傾斜抽出部7で
得られた平均傾斜θ■、θhに基づき、垂直サブバタン
抽出部10a、水平サブバタン抽山部10b、右斜めサ
ブバタン抽出部10c及び左斜めサブバタン抽出部10
dにより、文字傾斜抽出部7で得られた傾斜に対応して
、それぞれバタンレジスタ4上に設定したX軸方向にほ
ぼ垂直な方向(垂直方向)及びほぼ平行な方向(水平方
向)と、X軸から反時計方向45°の方向(右斜め45
°方向)及び時計方向45°の方向(左斜め45°方向
)とを、主走査方向としてバタンレジスタ4を走査し、
各主走査方向に対応する第2の垂直サブバタン、第2の
水平サブバタン、右斜めサブパタン、及び左斜めサブバ
タンを抽出する。
まず、垂直サブバタン抽出部10aの動作を説明する。
この垂直サブバタン抽出部10aでは、文字傾斜抽出部
7で得られた平均傾斜θVに基づき、第4図(a)の文
字パタンを走査し、走査線上で連続する黒ビット(黒ラ
ン〉を検出する。そして、検出した黒ランのなかから次
式(9)を満足する長さ9の黒ランを抽出する。
p≧N・WL ・・・・・(9) 但し、g;主走査方向における黒ラ ンの長さ N;各サブパタンに対する任 意定数(例えば、2) 走査経路Pは次のとおりである。垂直走査は上辺から走
査を開始する。走査開始アドレス(XaYT>からの走
査経路Pの座標(x−、y・)は、次式(10)で表わ
すことができる。
xl=xa yl=YT x j=Xa−i−θv x (y iY T )’j
i=’5’j 1;1 ・・・・・・(10) 但し、θVは実数、θvx (y 1−YT)の結果は
小数点以下切捨て、座標は全て整数である。
垂直サブバタン抽出部10aは、(9)式を満足する黒
ランを、第2の垂直サブバタンを構成する黒ランとみな
して図示しない垂直サブバタンメモリに格納する。(9
)式を満足しない黒ランは白ビットとみなす。
また、水平サブバタン抽出部10bは、文字傾斜抽出部
7で得られた平均傾斜θhを用い、垂直サブバタン抽出
部10aと同様の動作により、第2の水平サブバタンを
抽出する。同様に、右斜め及び左斜めサブバタン抽出部
10c、10dは、右斜め及び左斜め方向を主走査方向
として原パタンを走査し、それぞれの主走査方向の走査
線上の黒ランのなかから、(9)式を満足する黒ランを
抽出し、抽出した黒ランを、サブパタンを構成する黒ラ
ンとみなして図示しない右斜め及び左斜めサブバタンメ
モリに格納する。
本実施例では、右斜め、及び左斜めサブパタンの抽出時
には、文字の傾きは考慮しない。
(■) 特徴マトリクス抽出処理 文字枠検出部8が文字バタンの外接枠を規定する座標X
j 、Xr、’r’t、Ybを検出し、さらに分割点決
定部9が文字パタンについて対象分割点座標を検出する
と、特徴マトリクス抽出部11では、垂直、水平、右斜
め、及び左斜めサブパタンの各バタンから特徴量を抽出
し、特徴マトリクスを作成する。
即ち、特徴マトリクス抽出部11は、一つの外接枠内領
域を、対象分割点座標と座標XJ)、Xr。
Yt、YbとによってNXXNY個の部分領域に分割し
、各部分領域内のサブパタンの文字線量を表す特徴量を
抽出する。そして、一つの外接枠領域内の各サブパタン
から抽出したNXxNYx4個の特徴量から成る特徴マ
トリクスを、当該外接枠内領域の特徴量マトリクスとし
て抽出する。
まず、水平サブバタン(H3P>からの特徴量抽出につ
き説明する。
特徴マトリクス抽出部11は、対象分割点座標と座標X
、Q 、Xr、Yt、Ybとに基づき、外接枠内領域を
NXxNY個の部分領域に分割しく対象分割点座標及び
座標XI 、Xr、Yt、Ybは分割点座標である)、
各部分領域毎に部分領域内の水平サブパタン)(SPの
黒ビット数BH(i。
j〉を計数する。
分割点座標から分割領域の決定は、次のように行う。ま
ず、X軸上の分割点座標DX (n>を、文字パタンの
外接枠の上端と下端の中点を通りX軸に平行な直線上に
設定する。この座標を起点として、次式(11)〜(1
3)で求められる座標系列の左側を、第4図(b)に示
すような分割境界Sとする。
x o = Dχ(n) y () = (Y T 了Y B ) / 2・・・
・・・(11) (x□、y□)から、下方への座標系列は、x 、=D
X (n) TI NT (θ■べ(y i−y○)=0.5)yi
=yi 171 ・・・・・・(12) 但し、i=1.2,3.・・・・・ < (YT−YB)/2−YT) (x o 、 y o )から、上方への座標系列は、
x−=DX (n> 」 −INT(θv×(y Oy J ) 十〇 −5)y
j=yj士1−1 ・・・・・・(13) 但し、j=−1,−2,−3,・・・・・・(YB−(
YT−YB)、/2) で求める。但し、IN”IN  +は、その()内の演
算を実数値を用いて行い、結果の小数点以下を切捨てて
、整数値とすることを表す。
水平方向の分割境界Sも同様に、DY (m)とθhを
用いて設定する。
以上のように分割された分割領域毎に、水平サブパタン
H8Pの黒ビット数BH(i、j>を計数する。このB
H(i、j)は、一つの外接枠内領域に関する第i行第
j列の部分領域の黒ビット数である。次に、(14)式
に従って第i行第j列の部分領域に関する特徴量FH(
i、j>を計算する。
BH(i、j) FH(i、 j>= wt、、−wph・・・・・・(
14) 但し、i=1.2.・・・・・・、NXj=1.2.・
・・・・・、NY WL;線幅 wph、文字幅(=Xr−XJI −i−1)さらに、
H8Pの場合と同様にして、第i行第j列の部分領域の
VSP、R8P、LSPの黒ビット数BV(i、j)、
BR(i、j)、BL(i、j)を計数し、次式(15
)〜(17)に従って第i行第j列の部分領域に関する
vsp。
R3P、LSPの特徴量FV(i、j)、FR<i、j
>、FL(i、j)を算出する。
FL(i、j)= WL −WPJ ・・・・・・(17) 但し、 WPv:文字高さ(=Yb−Yt下1)WPr=WP、
l! = (WPv+WPh>/2以上のようにして、
外接枠内領域の各部分領域毎にVSP、H3P、H3P
、LSPの特徴量を抽出し、これらNXxNYx4個の
特徴量から成る特徴マトリクスF (k>(k=1.2
.・・・・・NXXNYX4)を得る。特徴マトリクス
抽出部11は、特徴マトリクスF (k)を各外接枠領
域毎に抽出し、その抽出結果を識別部12へ送る。
(IX)  識別処理 識別部12は、抽出された特徴マトリクスF(k)と、
内部に設けられた辞書メモリ内の特徴マトリクスG(k
>とを、照合することにより、該特徴マトリクスF (
k)を得た外接枠内領域の文字図形の認識を行う。この
認識では、次式(18)に従って特徴マトリクスF (
k)とG (k)間の距離りを求め、距離りが最小とな
る特徴マトリクスG(k>の標準文字の文字名(例えば
、JIS規格に定められた文字コード>OUTを認識結
果として出力する。
以上のように、本実施例では、次のような利点を有して
いる。
本実施例では、バタンレジスタ4内の文字パタンについ
て、第1のサブバタン抽出部6により、垂直方向及び水
平方向の双方の走査を行い、その走査線上の黒ビットの
連続と該文字パタンの線幅との関係により、当該走査方
向の線素成分を表わすサブパタンを抽出する。さらに、
文字傾斜抽出部7により、前記サブパタンに含まれる線
素の傾斜より、該サブパタンの傾斜θV、θhを求める
そして、第2のサブバタン抽出部10で、該傾斜θV、
θhに基づき前記文字パタンを各方向に走査してサブパ
タンを抽出した後、特徴を抽出している。そのため、傾
斜を有する文字パタンについても、抽出される特徴が安
定となる。従って、文字傾斜の変形に対応した辞書を識
別部12内に用意する必要がなく、辞書容量の減少によ
り、照合時間の短縮と、それによる処理速度の高速化が
図れると共に、ハード規模が小さく、認識精度の良い文
字認識が可能となる。
なお、本発明は、上記実施例に限定されず、種々の変形
が可能ある。その変形例としては、例えば次のようなも
のがある。
(i) 本実施例では、水平、垂直の両方向について、
ストロークの傾斜を抽出する場合について説明した。し
かし、手書文字については、一般に右上がりの文字が多
いので、水平ストロークの傾斜抽出のみで十分である。
また、印刷文字の斜体字を対象とする場合は、垂直スト
ロークの傾斜抽出を行えば良い。このように、読取り対
象により、適宜、傾斜抽出方向を選択し、構成の簡略化
を図ることが可能である。
(ii)  上記実施例の特徴抽出方法は、例えば前記
文献2に記載されたような、文字パタンの走査により特
徴の抽出を行う方法にも適用できる。例えば、前記文献
2の方法では、走査線とストロークの交差数を特徴量と
しているので、ストロークに傾斜があると、走査方向を
固定したとき、抽出される交差数が大きく変動する。そ
こで、上記実施例の方法によって傾斜を抽出し、該傾斜
に従って特徴抽出を行えば、上記実施例とほぼ同様の効
果が得られる。
(iii )  第1図の機能ブロックを、個別回路で
構成する以外に、コンピュータを用いたプログラム制御
等で実行する構成にしてもよい。
(発明の効果) 以上詳細に説明したように、第1の発明によれば、文字
パタンについて垂直方向及び水平方向の双方又はいずれ
か一方の方向の走査を行って、走査線上の黒ビットの連
続と該文字パタンの線幅との関係により、該走査方向の
線素成分を表わす補助サブパタンを抽出する。そして、
該サブパタンに含ま1する線素の傾斜より、該サブパタ
ンの傾斜を求める。次に、その傾斜に従って文字パタン
を各方向に走査し、該文字バタンから、走査線とストロ
ークの交差数等といった特徴を抽出するようにしている
。そのため、手書文字のように水平線素が右上がりに傾
いた文字や、印刷文字のように垂直線素が右に傾いた斜
体字等を対象とする場合でも、安定な特徴を抽出するこ
とができる。従って、文字傾斜の変形に対応した辞書を
用意する必要がなく、処理速度が速く、小さなハード規
模で、認識精度の良い文字認識が可能となる。
第2の発明では、抽出された傾斜に従ってサブバタンを
抽出し、その後、そのサブパタンの特徴を抽出している
ので、前記第1の発明とほぼ同様の効果が得られる。
【図面の簡単な説明】
第1図は本発明の実施例を示す特徴抽出方法を用いた文
字認識装置の機能ブロック図、第2図は斜体字の例を示
す図、第3図(a)〜(d)は従来の特徴抽出方法を説
明するための図、第4図(a)、(b)はサブバタン抽
出方法を説明するための図である。 1・・・・・・光電変換部、2・・・・・・行バッファ
、3・・・・・文字切出部、4・・・・・・バタンレジ
スタ、5・・・・・・線幅測定部、6・・・・・・第1
のサブバタン抽出部、7・・・・・・文字傾斜抽出部、
8・・・・・・文字枠検出部、9・・・・・・分割点決
定部、10・・・・・・第2のサブバタン抽出部、11
・・・・・・特徴マトリクス抽出部、12・・曲識別部

Claims (1)

  1. 【特許請求の範囲】 1、媒体上の文字を光電変換して得られる文字パタンを
    、複数の方向に走査して該文字パタンから特徴を抽出す
    る特徴抽出方法において、 前記文字パタンを垂直方向及び水平方向の双方又はいず
    れか一方の方向に走査し、該走査方向の黒画素の連続数
    と前記文字パタンの線幅との関係により、該走査方向の
    線素成分を表わす補助サブパタンを抽出し、 前記補助サブパタンに含まれる線素の傾斜より、前記補
    助サブパタンの傾斜を抽出した後、 前記補助サブパタンの傾斜に基づき、前記文字パタンを
    複数の方向に走査して前記文字パタンから特徴を抽出す
    ることを特徴とする特徴抽出方法。 2、媒体上の文字を光電変換して得られる文字パタンを
    複数の方向に走査し、該走査方向の黒画素の連続数と線
    幅との関係により、該走査方向の線素成分を表わすサブ
    パタンを抽出した後、 前記サブパタンを複数の領域に分割してその分割された
    領域毎に、前記サブパタンの線素量を表わす特徴を抽出
    する特徴抽出方法において、前記文字パタンを垂直方向
    及び水平方向の双方又はいずれか一方の方向に走査し、
    該走査方向の黒画素の連続数と前記文字パタンの線幅と
    の関係により、該走査方向の線素成分を表わす補助サブ
    パタンを抽出し、 前記補助サブパタンに含まれる線素の傾斜より、前記補
    助サブパタンの傾斜を抽出した後、 前記補助サブパタンの傾斜に基づき、前記サブパタンを
    抽出することを特徴とする特徴抽出方法。
JP2100832A 1990-04-17 1990-04-17 特徴抽出方法 Pending JPH04591A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2100832A JPH04591A (ja) 1990-04-17 1990-04-17 特徴抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2100832A JPH04591A (ja) 1990-04-17 1990-04-17 特徴抽出方法

Publications (1)

Publication Number Publication Date
JPH04591A true JPH04591A (ja) 1992-01-06

Family

ID=14284293

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2100832A Pending JPH04591A (ja) 1990-04-17 1990-04-17 特徴抽出方法

Country Status (1)

Country Link
JP (1) JPH04591A (ja)

Similar Documents

Publication Publication Date Title
JPH03122773A (ja) 画像形成装置
JPH05242292A (ja) 分離方法
Jung et al. Multifont classification using typographical attributes
JPH05501776A (ja) 光学式文字認識のための自動中心配置式文字字画太線化
JPH04591A (ja) 特徴抽出方法
KR100315428B1 (ko) 다국어 인쇄체 문서인식을 위한 문자 특징 추출 장치 및그 방법
JP2749947B2 (ja) 文字認識方法
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JP2749946B2 (ja) 文字認識方法
JPS62121589A (ja) 文字切出し方法
JPH04590A (ja) 文字認識方法
JP2747136B2 (ja) 文字認識装置
JPH03126188A (ja) 文字認識装置
JP2001314820A (ja) 宛名領域検出装置
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JPH01152586A (ja) 文字図形認識方法
JP2708604B2 (ja) 文字認識方法
JP3084833B2 (ja) 特徴抽出装置
JPH04589A (ja) 特徴抽出方法
JPH03246779A (ja) 文字認識装置
JP2616995B2 (ja) 文字認識装置
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JPH0433074B2 (ja)
JPH01152587A (ja) 文字図形認識方法
JPH0991378A (ja) 文字認識方式