JPH04591A

JPH04591A - 特徴抽出方法

Info

Publication number: JPH04591A
Application number: JP2100832A
Authority: JP
Inventors: Koichi Higuchi; 浩一樋口; Yoshiyuki Yamashita; 山下　義征
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1990-04-17
Filing date: 1990-04-17
Publication date: 1992-01-06

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）本発明は、媒体上の文字を光電変換して得られる文字パ
タンを、複数方向に走査して該文字パタンから特徴を抽
出する特徴抽出方法、特に高速で、安定な特徴抽出方法
に関するものである。

（従来の技術）従来、この種の特徴抽出方法としては、特開昭５７−２
３１８５号公報（文献１〉、及び特公昭３８−５５５５
１号公報（文献２〉に記載されるものがあった。

文献１の技術では、媒体上の文字を光電変換して得られ
た文字パタンより、各方向の線素成分（ストローク成分
）を表わすサブパタンを抽出する。そして、該サブパタ
ンを複数の領域に分割してその分割された各領域毎に、
前記サブパタンの線素の量を表わす特徴を抽出して特徴
マトリクスを生成する。その後、該特徴マトリクスと、
予め用意した辞書とを、照合して前記文字を認識するも
のであった。

また、文献２の技術では、文字パタンの走査により、走
査線とストロークの交差数を特徴量として抽出するもの
であった。

（発明が解決しようとする課題）しかしなから、上記の特徴抽出方法では、次のような課
題があった。

（ｉ）　　第２図は、印刷文字の斜体字の例を示す図で
ある。この図における数字゛○゛を模式化した図を第３
図（ａ）〜（ｄ）に示す。即ち、第３図（ａ）は斜体で
ない文字パタン′○゛の例、同図（ｂ）は斜体字“０°
の例、同図（Ｃ）は前記文献１の方法を用いて同図（ａ
）の文字パタンから抽出した垂直サブパタン、及び同図
（ｄ）は前記文献１の方法を用いて同図（ｂ）の文字パ
タンから抽出した垂直サブバタンである。

前記文献１の特徴抽出方法を用いて第３図（ａ＞の文字
パタンの垂直サブパタンを抽出すると、第３図（Ｃ）の
ように、垂直成分を忠実に抽出できる。

しかし、第３図（ｂ）の斜体字に対して垂直サブパタン
を抽出すると、第３図（ｄ）に示すように、線素成分が
傾く。その上、第３図（ｄ）の破線で示すような線素成
分が抽出されるべきところが、傾いた線素に対して垂直
に走査しているため、線素の両端部が欠けてしまう。そ
のなめ、同し字形“０°でありなから、抽出される特徴
が異なる（つまり、抽出される特徴が不安定となる）と
いう問題があった。また、手書文字の変形としては、一
般に右上がりのものが多く、水平線素が傾いているため
、前記と同様に、抽出される特徴が不安定となるという
問題があった。

従って、特徴抽出後、辞書と照合して文字認識を行う場
合、文字傾斜の変形に対応した多数の辞書を用意しなけ
ればならない。そのため、辞書容量が増大し、照合の長
時間化による処理速度の低下と、ハード規模（装置規模
）の増大を招くという不都合があった。

（ｉｉ）　　前記文献２の技術では、走査線と線素の交
差数を特徴量としているので、第３図（ｂ）のように線
素に傾斜があると、走査方向を固定したとき、抽出され
る交差数（特徴量）が大きく変動し、前記（ｉ）と同様
の問題が生じる。

本発明は前記従来技術が持っていた課題として、抽出さ
れる特徴が不安定となる点と、処理速度の低下及び装置
の大型化の点について解決した特徴抽出方法を提供する
ものである。

（課題を解決するための手段）前記課題を解決するために、第１の発明は、媒体上の文
字を光電変換して得られる文字パタンを、複数の方向に
走査して該文字パタンから特徴を抽出する特徴抽出方法
において、次のような手段を講じたものである。

即ち、前記文字パタンを垂直方向及び水平方向の双方又
はいずれか一方の方向に走査し、該走査方向の黒画素の
連続数と前記文字パタンの線幅との関係により、該走査
方向の線素成分を表わす補助サブパタンを抽出し、前記
補助サブパタンに含まれる線素の傾斜より、前記補助サ
ブパタンの傾斜を抽出した後、前記補助サブパタンの傾
斜に基づき、前記文字パタンを複数の方向に走査して前
記文字パタンから特徴を抽出するようにしている。

第２の発明では、媒体上の文字を光電変換して得られる
文字パタンを複数の方向に走査し、該走査方向の黒画素
の連続数と線幅との関係により、該走査方向の線素成分
を表わすサブパタンを抽出した後、耐記サブパタンを複
数の領域に分割してその分割された領域毎に、前記サブ
パタンの線素量を表わす特徴を抽出する特徴抽出方法に
おいて、次のような手段を講したものである。

即ち、前記文字バタンを垂直方向及び水平方向の双方又
はいずれか一方の方向に走査し、該走査方向の黒画素の
連続数と前記文字パタンの線幅との関係により、該走査
方向の線素成分を表わす補助サブバタンを抽出し、前記
補助サブパタンに含まれる線素の傾斜より、前記補助サ
ブパタンの傾斜を抽出した後、前記補助サブパタンの傾
斜に基づき、前記サブバタンを抽出するようにしている
。

（作用）第１及び第２の発明によれば、以上のように特徴抽出方
法を構成しなので、文字パタンが入力されると、その文
字パタンを垂直方向及び水平方向の双方又はいずれか一
方の方向を走査し、該走査方向の線素成分を表わす補助
サブパタンを抽出した後、その補助サブパタンの傾斜を
抽出する。

そして第１の発明では、抽出された傾斜に従って前記文
字パタンを走査し、走査線とストロークの交差数等とい
った特徴量を抽出する。

また第２の発明では、抽出された傾斜に従ってサブパタ
ンを抽出し、その後、そのサブパタンを複数の領域に分
割してその分割された領域毎に前記サブパタンの特徴を
抽出する。

これにより、手書文字や印刷文字において傾斜がある文
字パタンについても、抽出される特徴が安定となり、前
記課題を解決できるのである。

（実施例）第１図は、本発明の実施例を示す特徴抽出方法を用いた
文字認識装置の機能ブロック図である。

この文字認識装置は、帳票等の媒体上の文字画像の光信
号ＩＮを量子化された電気信号（ディジタル信号）に変
換する光電変換部１を有し、その出力側には、行バッフ
ァ２が接続されている。行バッファ２は、例えば福２０
４８ｘ高さ１２８ビツトの大きさを有し、１行分の文字
画像のディジタル信号を格納する構成になっており、そ
の出力側には、文字切出部３を介してバタンレジスタ４
が接続されている。文字切出部３は、メモリを有し、行
バッファ２の出力から１文字分のディジタル信号（これ
を、１文字パタン」という）をバタンレジスタ４に格納
する機能を有している。

バタンレジスタ４は、例えば６４ｘ６４ビツトの記憶容
量を有し、その出力側には、線幅測定部ヲ及び第１のサ
ブバタン抽出部６が接続されている。第１のサブバタン
抽出部６の出力側には、文字傾斜抽出部７が接続されて
いる。また、バタンレジスタ４の出力側には、文字枠検
出部８を介して分割点決定部９が接続されると共に、第
２のサブバタン抽出部１０が接続されている。分割点決
定部９及び第２のサブバタン抽出部１０の出力側には、
特徴マトリクス抽出部１１が接続され、その出力側に、
識別部１２が接続されている。

線幅測定部５は、バタンレジスタ４の出力に対する線幅
を測定し、その測定結果を第１および第２のサブバタン
抽出部６．１０に与える機能を有している。第１のサブ
バタン抽出部６は、バタンレジスタ４を垂直及び水平方
向に走査して第１の垂直サブバタン（補助垂直サブバタ
ン）及び第１の水平サブパタン（補助水平サブバタン）
を抽出するもので、垂直サブバタン抽出部６ａ及び水平
サブバタン抽出部６ｂより構成されている。各抽出部６
＋ａ、６ｂは、それぞれバタン格納用のメモリを有して
いる。

文字傾斜抽出部７は、第１のサブバタン抽出部６で抽出
された第１の垂直サブバタン及び第１の水平サブバタン
について傾斜を抽出し、その抽出結果を第２のサブバタ
ン抽出部１０及び特徴マトリクス抽出部１１へ出力する
機能を有している。

文字枠検出部８は、バタンレジスタ４内の文字パタンを
走査して外接枠、つまり文字枠を検出し、その検出結果
を分割点検出部９に与える機能を有している。分割点決
定部９は、外接枠内を複数の部分領域に分割するための
分割点座標を決定し、その決定結果を特徴マトリクス抽
出部１１へ出力する機能を有している。

第２のサブバタン抽出部１０は、文字傾斜抽出部７で抽
出された傾斜に基づき、バタンレジスタ４を複数方向に
走査して第２の垂直サブバタン及び第２の水平サブパタ
ンを抽出すると共に、右斜めサブパタン及び左斜めサブ
バタンを抽出するもので、垂直サブバタン抽出部１０ａ
、水平サブバタン抽出部１０ｂ、右斜めサブバタン抽出
部１０Ｃ５及び左斜めサブバタン抽出部１０ｄより構成
されている。各抽出部１０ａ〜１０ｄは、それぞれバタ
ン格納用のメモリを有している。

特徴マトリクス抽出部１１は、サブバタン抽出部１０か
ら出力される垂直、水平、右斜め、及び左斜めサブパタ
ンの各バタンから、特徴量を抽出して特徴マトリクスを
作成し、それを識別部１２へ与える機能を有している。

識別部１２は、標準文字の特徴マトリクス（標準文字マ
スク）Ｇ（ｋ）と、この特徴マトリクスＧ（ｋ＞を有す
る標準文字の文字名とを、格納する辞書メモリを有して
いる。そして、特徴マトリクス抽出部１１で抽出された
特徴マトリクスＦ　（ｋ）と、辞書メモリの特徴マトリ
クスＧ　（ｋ＞とを、照合することにより、該特徴マト
リクスＦ　（ｋ＞を得た外接枠内領域の文字図形の認識
を行い、文字名ＯＵＴを出力する機能を有している。

次に、以上のように構成される文字認識装置を用いた特
徴抽出方法と、その抽出結果から文字認識を行う方法に
ついて、各機能ブロックの処理（Ｉ）〜（Ｘ）について
説明する。

（Ｉ＞　　文字バタン生成処理根票上に記入された文字画像の光信号ＩＮが光電変換部
１に入力されると、光電変換部１では、光信号ＩＮを２
値のデジタル信号、つまり文字線部を“１°　（これを
「黒ビット」という）、背景部をＯ゛　（これを「白ビ
ットＪという）に変換する。光電変換部１で変換された
１行分の文字画像のデジタル信号は、行バッファ２に格
納される。

文字切出部３では、行バッファ２に格納された文字画像
のデジタル信号から、１文字分のデジタル信号（文字バ
タン）を切出し、バタンレジスタ４に格納する。本実施
例では、帳票フォーマットが予め指定されており、文字
切出部３のメモリに、行バツフア２内の文字位置を示す
アドレスが格納されている。そのため、文字切出し動作
は、該アドレスで指定さｈｆ：行バッファ２の内容を読
み出すことにより実行される。

（ＩＩ）　　線幅測定処理線幅測定部５は、バタンレジスタ４からのディジタル信
号を入力し、例えば２×２の窓の全ての点が黒ビットと
なる状態の個数Ｑと、全黒ビットの個数Ａとを計数し、
従来周知の（１）式に従って線幅ＷＬを算出する。

ＷＬ＝Ａ／（Ａ−Ｑ＞　　　　　・・・・・・（１）（
Ｉ［Ｉ）　　第１のサブバタン抽出処理第１のサブバタ
ン抽出部６では、次のような処理を行う。

垂直サブバタン抽出部６ａでは、垂直方向を主走査方向
としてバタンレジスタ４を全面走査し、垂直方向の走査
線上で連続する黒ビット（黒ラン）を検出する。そして
、検出した黒ランの中から、次式（２）を満足する長さ
ｐの黒ランを抽出する。

１≧Ｎ、ＷＬ・・・・・・（２〉但し、９；主走査方向における黒ランの長さＮ：各サブパタンに対する任意定数（例えば、２）垂直サブバタン抽出部６ａは、（２）式を満足する黒ラ
ンを、サブパタンを構成する黒ランとみなして、内部に
設けられた垂直サブバタンメモリに格納する。（２）式
を満足しない黒ランは、白ビットとみなす。

また、水平サブバタン抽出部６ｂでは、垂直サブバタン
抽出部６ａと同様の動作により、水平方向を主走査方向
としてバタンレジスタ４を走査し、水平方向の走査線上
の黒ランのなかから（２〉式を満足する黒ランを抽出す
る。そして、抽出した黒ランを、サブパタンを構成する
黒ランとみなして、内部に設けられた水平サブバタンメ
モリに格納する。

（１ｖ〉　　文字傾斜抽出処理文字傾斜抽出部７は、サブバタン抽出部６より得られる
第１の垂直サブバタン（補助垂直サブバタン）及び第１
の水平サブバタン（補助水平サブバタン）のそれぞれに
ついて、該サブバタンの文字線素成分（これを「ストロ
ークｊという）を抽出する。次に、抽出した各ストロー
クの両端の座標値より、各ストロークの傾きを計算し、
それらを平均して、第１の垂直サブバタンからは垂直ス
トロークの平均傾斜θＶ、第１の水平サブバタンからは
水平ストロークの平均傾斜θｈを、それぞれ抽出する。

次に、この平均傾斜θＶ、θｈの具体的な抽出方法につ
いて説明する。

まず、第１の垂直サブバタンについて、水平走査を全面
について行い、白ビットから黒ビ・ソト、及び黒ビット
から白ビットへの変化点を検出する。

そして、１ライン前の走査線と、現在の走査線における
変化点座標との関係より、ストロークの両端座標を抽出
する。

抽出したストロークの両端座標を（ＶＸＳｉ。

ＶＹＳｉ）と（ＶＸＥ　ｉ　、　ＶＹＥ　ｉ　）とした
とき、（３）式を用いて垂直ストロークの平均傾斜θ■
を計算する。但し、ｉ−１，・・・・・・、Ｐｖ、Ｐｖ
は第１の垂直サブバタンより抽出したストローク数、ま
たＶＹＳｉ＜ＶＹＥｉである。

θ■＝＝１・・・・・・（３）ここで、ＶＬＧｉは次式（４）より求められる。

ＶＬＧｉ＝ＨＡＸ　　Ｉ、　ｊ　ＶＸＥｉ−ＶＸＳｉ　　１．　　
、：　ＶＹＥｉ−ＶＹＳｉ　　ｉ）トローク数、またＨ
ＸＳｊ＜ＨＸＥｊである。

θｈ＝この（４）式は、２点間の距離を、その２点間の水平及
び垂直座標差のうちで小さい方の１／２と他の一方との
和とする近似式である。

また、第１の水平サブバタンより水平ストロークの平均
傾斜θｈを、次のようにして抽出する。

第１の水平サブバタンについて垂直走査を行い、水平ス
トロークの両端座標を抽出する。その両端座標を、（Ｈ
ＸＳｊ、ＨＹＳｊ　）と（ＨＸＥｊ。

ＨＹＥｊ）としたとき、水平ストロークの平均座標θｈ
を（ヲ）式で計算する。但し、ｊ＝１．・・・・・・、
Ｐｈ、Ｐｈは水平サブバタンより抽出したスここで、Ｈ
ＬＧｊは次式（６）より求められる。

）ＩＬＧｊ＝ＭＡＸ　　Ｉ　Ｉ　ＨＸＥＪ−ＨＸＳＪＨｖＥｊ−ｈｖ
ｓｊ口なお、ストローク数がＯのときは、傾斜を０とする。即
ち、Ｐｖ＝ＯのときはθＶ＝Ｏ１ｐｈ＝Ｏのときはθｈ
＝○とする。

（Ｖ）　　文字枠検出処理文字枠検出部８では、バタンレジスタ４のパタンを走査
してそのパタンの左端座標χＭ、右端座標Ｘｒ、上端座
標Ｙｔ及び下端座標Ｙｂを検出する。外接枠、つまり文
字枠は（ｘｆＪ、ｙｔ＞、（Ｘ、Ｑ　、　Ｙｂ）、（Ｘ
ｒ、Ｙｔ）、（Ｘｒ、Ｙｂ）の４点を結ぶ矩形枠となる
。

また、文字枠検出後は、特徴量の正規化を行うために、
必要な文字枠の大きさを算出する。即ち、バタンレジス
タ４のＸ軸に対し、平行な方向（水平方向〉の文字枠の
大きさをＷＰｈとしてｗｐｈ＝Ｘｒ−ＸＪＩ↑１を、垂
直な方向く垂直方向）の文字枠の大きさをＷＰｖとして
ＷＰｖ＝Ｙｔ−Ｙｂ＋１を、それぞれ算出する。さらに
、右斜め及び左斜め４５°方向の文字枠の大きさをＷＰ
ｒ及びＷＰＪＩとしてＷＰｈ−ｉ−ＷＰｖＷＰｒ＝ＷＰｊｌ　＝を算出する。これらの算出結果は、分割点決定部９に与
えられる。

（ＶＩ）　　分割点決定処理分割点決定部９は、外接文字枠内をＮＸｘＮＹ個の部分
領域に分割するためのＸ軸上及びＹ軸上の分割点座標を
、各外接枠毎に決定する。但し、ＮＸはＸ軸方向におけ
る分割数、及びＮＹはＸ軸方向における分割数である。

分割数ＮＸ及びＮＹは、文字の複雑さに応して任意好適
な値に設定するのが好ましい。例えば、漢字・カタカナ
等の画数の少ない文字を認識対象とする場合は、（２Ｘ
２）〜（３Ｘ３）程度の少ない数の部分領域に、外接枠
内領域を分割する。

漢字が認識対象となる場合には、（４Ｘ４）〜（８Ｘ８
）程度の部分領域に、外接枠内領域を分割することが多
い。しかし、本実施例では、認識対象の複雑さにかかわ
らず、外接枠内領域を等分割、例えば（４ｘ４）個に分
割するようにした。

Ｘ軸上の分割座標ＤＸ（ｎ）、及びＹ軸上の分割座標Ｄ
Ｙ（ｎ）は、次式（７）、（８）で決定される。

ＤＸ　（ｎ＞ＮＸ・・・・・・（７）ＤＹ　（ｍ）但し、ｎ＝１．２．＝・＝−、ＮＸ−ｌｍ＝１．２．・
・・・・・、ＮＹ−１本実施例では、例えばＮＸ＝ＮＹ＝４Ｆ）　　サブバタン抽出処理第４図（ａ）、（ｂ）は、サブパタンの抽出方法を示す
図であり、同図（ａ＞は文字パタンの例、及び同図（ｂ
）は垂直サブパタンの例である。第４図（ａ）中の矢印
Ｐは、垂直サブバタン抽出時の走査経路を示す。

第２のサブバタン抽出部１０では、文字傾斜抽出部７で
得られた平均傾斜θ■、θｈに基づき、垂直サブバタン
抽出部１０ａ、水平サブバタン抽山部１０ｂ、右斜めサ
ブバタン抽出部１０ｃ及び左斜めサブバタン抽出部１０
ｄにより、文字傾斜抽出部７で得られた傾斜に対応して
、それぞれバタンレジスタ４上に設定したＸ軸方向にほ
ぼ垂直な方向（垂直方向）及びほぼ平行な方向（水平方
向）と、Ｘ軸から反時計方向４５°の方向（右斜め４５
°方向）及び時計方向４５°の方向（左斜め４５°方向
）とを、主走査方向としてバタンレジスタ４を走査し、
各主走査方向に対応する第２の垂直サブバタン、第２の
水平サブバタン、右斜めサブパタン、及び左斜めサブバ
タンを抽出する。

まず、垂直サブバタン抽出部１０ａの動作を説明する。

この垂直サブバタン抽出部１０ａでは、文字傾斜抽出部
７で得られた平均傾斜θＶに基づき、第４図（ａ）の文
字パタンを走査し、走査線上で連続する黒ビット（黒ラ
ン〉を検出する。そして、検出した黒ランのなかから次
式（９）を満足する長さ９の黒ランを抽出する。

ｐ≧Ｎ・ＷＬ・・・・・（９）但し、ｇ；主走査方向における黒ランの長さＮ；各サブパタンに対する任意定数（例えば、２）走査経路Ｐは次のとおりである。垂直走査は上辺から走
査を開始する。走査開始アドレス（ＸａＹＴ＞からの走
査経路Ｐの座標（ｘ−、ｙ・）は、次式（１０）で表わ
すことができる。

ｘｌ＝ｘａｙｌ＝ＹＴｘ　ｊ＝Ｘａ−ｉ−θｖ　ｘ　（ｙ　ｉＹ　Ｔ　）’ｊ
ｉ＝’５’ｊ　１；１・・・・・・（１０）但し、θＶは実数、θｖｘ　（ｙ　１−ＹＴ）の結果は
小数点以下切捨て、座標は全て整数である。

垂直サブバタン抽出部１０ａは、（９）式を満足する黒
ランを、第２の垂直サブバタンを構成する黒ランとみな
して図示しない垂直サブバタンメモリに格納する。（９
）式を満足しない黒ランは白ビットとみなす。

また、水平サブバタン抽出部１０ｂは、文字傾斜抽出部
７で得られた平均傾斜θｈを用い、垂直サブバタン抽出
部１０ａと同様の動作により、第２の水平サブバタンを
抽出する。同様に、右斜め及び左斜めサブバタン抽出部
１０ｃ、１０ｄは、右斜め及び左斜め方向を主走査方向
として原パタンを走査し、それぞれの主走査方向の走査
線上の黒ランのなかから、（９）式を満足する黒ランを
抽出し、抽出した黒ランを、サブパタンを構成する黒ラ
ンとみなして図示しない右斜め及び左斜めサブバタンメ
モリに格納する。

本実施例では、右斜め、及び左斜めサブパタンの抽出時
には、文字の傾きは考慮しない。

（■）　特徴マトリクス抽出処理文字枠検出部８が文字バタンの外接枠を規定する座標Ｘ
ｊ　、Ｘｒ、’ｒ’ｔ、Ｙｂを検出し、さらに分割点決
定部９が文字パタンについて対象分割点座標を検出する
と、特徴マトリクス抽出部１１では、垂直、水平、右斜
め、及び左斜めサブパタンの各バタンから特徴量を抽出
し、特徴マトリクスを作成する。

即ち、特徴マトリクス抽出部１１は、一つの外接枠内領
域を、対象分割点座標と座標ＸＪ）、Ｘｒ。

Ｙｔ、ＹｂとによってＮＸＸＮＹ個の部分領域に分割し
、各部分領域内のサブパタンの文字線量を表す特徴量を
抽出する。そして、一つの外接枠領域内の各サブパタン
から抽出したＮＸｘＮＹｘ４個の特徴量から成る特徴マ
トリクスを、当該外接枠内領域の特徴量マトリクスとし
て抽出する。

まず、水平サブバタン（Ｈ３Ｐ＞からの特徴量抽出につ
き説明する。

特徴マトリクス抽出部１１は、対象分割点座標と座標Ｘ
、Ｑ　、Ｘｒ、Ｙｔ、Ｙｂとに基づき、外接枠内領域を
ＮＸｘＮＹ個の部分領域に分割しく対象分割点座標及び
座標ＸＩ　、Ｘｒ、Ｙｔ、Ｙｂは分割点座標である）、
各部分領域毎に部分領域内の水平サブパタン）（ＳＰの
黒ビット数ＢＨ（ｉ。

ｊ〉を計数する。

分割点座標から分割領域の決定は、次のように行う。ま
ず、Ｘ軸上の分割点座標ＤＸ　（ｎ＞を、文字パタンの
外接枠の上端と下端の中点を通りＸ軸に平行な直線上に
設定する。この座標を起点として、次式（１１）〜（１
３）で求められる座標系列の左側を、第４図（ｂ）に示
すような分割境界Ｓとする。

ｘ　ｏ　＝　Ｄχ（ｎ）ｙ　（）　＝　（Ｙ　Ｔ　了Ｙ　Ｂ　）　／　２・・・
・・・（１１）（ｘ□、ｙ□）から、下方への座標系列は、ｘ　、＝Ｄ
Ｘ　（ｎ）ＴＩ　ＮＴ　（θ■べ（ｙ　ｉ−ｙ○）＝０．５）ｙｉ
＝ｙｉ　１７１・・・・・・（１２）但し、ｉ＝１．２，３．・・・・・＜　（ＹＴ−ＹＢ）／２−ＹＴ）（ｘ　ｏ　、　ｙ　ｏ　）から、上方への座標系列は、
ｘ−＝ＤＸ　（ｎ＞」 −ＩＮＴ（θｖ×（ｙ　Ｏｙ　Ｊ　）　十〇　−５）ｙ
ｊ＝ｙｊ士１−１・・・・・・（１３）但し、ｊ＝−１，−２，−３，・・・・・・（ＹＢ−（
ＹＴ−ＹＢ）、／２）で求める。但し、ＩＮ”ＩＮ　　＋は、その（）内の演
算を実数値を用いて行い、結果の小数点以下を切捨てて
、整数値とすることを表す。

水平方向の分割境界Ｓも同様に、ＤＹ　（ｍ）とθｈを
用いて設定する。

以上のように分割された分割領域毎に、水平サブパタン
Ｈ８Ｐの黒ビット数ＢＨ（ｉ、ｊ＞を計数する。このＢ
Ｈ（ｉ、ｊ）は、一つの外接枠内領域に関する第ｉ行第
ｊ列の部分領域の黒ビット数である。次に、（１４）式
に従って第ｉ行第ｊ列の部分領域に関する特徴量ＦＨ（
ｉ、ｊ＞を計算する。

ＢＨ（ｉ、ｊ）ＦＨ（ｉ、　ｊ＞＝　ｗｔ、、−ｗｐｈ・・・・・・（
１４）但し、ｉ＝１．２．・・・・・・、ＮＸｊ＝１．２．・
・・・・・、ＮＹＷＬ；線幅ｗｐｈ、文字幅（＝Ｘｒ−ＸＪＩ　−ｉ−１）さらに、
Ｈ８Ｐの場合と同様にして、第ｉ行第ｊ列の部分領域の
ＶＳＰ、Ｒ８Ｐ、ＬＳＰの黒ビット数ＢＶ（ｉ、ｊ）、
ＢＲ（ｉ、ｊ）、ＢＬ（ｉ、ｊ）を計数し、次式（１５
）〜（１７）に従って第ｉ行第ｊ列の部分領域に関する
ｖｓｐ。

Ｒ３Ｐ、ＬＳＰの特徴量ＦＶ（ｉ、ｊ）、ＦＲ＜ｉ、ｊ
＞、ＦＬ（ｉ、ｊ）を算出する。

ＦＬ（ｉ、ｊ）＝ＷＬ　−ＷＰＪ・・・・・・（１７）但し、ＷＰｖ：文字高さ（＝Ｙｂ−Ｙｔ下１）ＷＰｒ＝ＷＰ、
ｌ！　＝　（ＷＰｖ＋ＷＰｈ＞／２以上のようにして、
外接枠内領域の各部分領域毎にＶＳＰ、Ｈ３Ｐ、Ｈ３Ｐ
、ＬＳＰの特徴量を抽出し、これらＮＸｘＮＹｘ４個の
特徴量から成る特徴マトリクスＦ　（ｋ＞（ｋ＝１．２
．・・・・・ＮＸＸＮＹＸ４）を得る。特徴マトリクス
抽出部１１は、特徴マトリクスＦ　（ｋ）を各外接枠領
域毎に抽出し、その抽出結果を識別部１２へ送る。

（ＩＸ）　　識別処理識別部１２は、抽出された特徴マトリクスＦ（ｋ）と、
内部に設けられた辞書メモリ内の特徴マトリクスＧ（ｋ
＞とを、照合することにより、該特徴マトリクスＦ　（
ｋ）を得た外接枠内領域の文字図形の認識を行う。この
認識では、次式（１８）に従って特徴マトリクスＦ　（
ｋ）とＧ　（ｋ）間の距離りを求め、距離りが最小とな
る特徴マトリクスＧ（ｋ＞の標準文字の文字名（例えば
、ＪＩＳ規格に定められた文字コード＞ＯＵＴを認識結
果として出力する。

以上のように、本実施例では、次のような利点を有して
いる。

本実施例では、バタンレジスタ４内の文字パタンについ
て、第１のサブバタン抽出部６により、垂直方向及び水
平方向の双方の走査を行い、その走査線上の黒ビットの
連続と該文字パタンの線幅との関係により、当該走査方
向の線素成分を表わすサブパタンを抽出する。さらに、
文字傾斜抽出部７により、前記サブパタンに含まれる線
素の傾斜より、該サブパタンの傾斜θＶ、θｈを求める
。

そして、第２のサブバタン抽出部１０で、該傾斜θＶ、
θｈに基づき前記文字パタンを各方向に走査してサブパ
タンを抽出した後、特徴を抽出している。そのため、傾
斜を有する文字パタンについても、抽出される特徴が安
定となる。従って、文字傾斜の変形に対応した辞書を識
別部１２内に用意する必要がなく、辞書容量の減少によ
り、照合時間の短縮と、それによる処理速度の高速化が
図れると共に、ハード規模が小さく、認識精度の良い文
字認識が可能となる。

なお、本発明は、上記実施例に限定されず、種々の変形
が可能ある。その変形例としては、例えば次のようなも
のがある。

（ｉ）　本実施例では、水平、垂直の両方向について、
ストロークの傾斜を抽出する場合について説明した。し
かし、手書文字については、一般に右上がりの文字が多
いので、水平ストロークの傾斜抽出のみで十分である。

また、印刷文字の斜体字を対象とする場合は、垂直スト
ロークの傾斜抽出を行えば良い。このように、読取り対
象により、適宜、傾斜抽出方向を選択し、構成の簡略化
を図ることが可能である。

（ｉｉ）　　上記実施例の特徴抽出方法は、例えば前記
文献２に記載されたような、文字パタンの走査により特
徴の抽出を行う方法にも適用できる。例えば、前記文献
２の方法では、走査線とストロークの交差数を特徴量と
しているので、ストロークに傾斜があると、走査方向を
固定したとき、抽出される交差数が大きく変動する。そ
こで、上記実施例の方法によって傾斜を抽出し、該傾斜
に従って特徴抽出を行えば、上記実施例とほぼ同様の効
果が得られる。

（ｉｉｉ　）　　第１図の機能ブロックを、個別回路で
構成する以外に、コンピュータを用いたプログラム制御
等で実行する構成にしてもよい。

（発明の効果）以上詳細に説明したように、第１の発明によれば、文字
パタンについて垂直方向及び水平方向の双方又はいずれ
か一方の方向の走査を行って、走査線上の黒ビットの連
続と該文字パタンの線幅との関係により、該走査方向の
線素成分を表わす補助サブパタンを抽出する。そして、
該サブパタンに含ま１する線素の傾斜より、該サブパタ
ンの傾斜を求める。次に、その傾斜に従って文字パタン
を各方向に走査し、該文字バタンから、走査線とストロ
ークの交差数等といった特徴を抽出するようにしている
。そのため、手書文字のように水平線素が右上がりに傾
いた文字や、印刷文字のように垂直線素が右に傾いた斜
体字等を対象とする場合でも、安定な特徴を抽出するこ
とができる。従って、文字傾斜の変形に対応した辞書を
用意する必要がなく、処理速度が速く、小さなハード規
模で、認識精度の良い文字認識が可能となる。

第２の発明では、抽出された傾斜に従ってサブバタンを
抽出し、その後、そのサブパタンの特徴を抽出している
ので、前記第１の発明とほぼ同様の効果が得られる。

【図面の簡単な説明】

第１図は本発明の実施例を示す特徴抽出方法を用いた文
字認識装置の機能ブロック図、第２図は斜体字の例を示
す図、第３図（ａ）〜（ｄ）は従来の特徴抽出方法を説
明するための図、第４図（ａ）、（ｂ）はサブバタン抽
出方法を説明するための図である。１・・・・・・光電変換部、２・・・・・・行バッファ
、３・・・・・文字切出部、４・・・・・・バタンレジ
スタ、５・・・・・・線幅測定部、６・・・・・・第１
のサブバタン抽出部、７・・・・・・文字傾斜抽出部、
８・・・・・・文字枠検出部、９・・・・・・分割点決
定部、１０・・・・・・第２のサブバタン抽出部、１１
・・・・・・特徴マトリクス抽出部、１２・・曲識別部
。

Claims

【特許請求の範囲】１、媒体上の文字を光電変換して得られる文字パタンを
、複数の方向に走査して該文字パタンから特徴を抽出す
る特徴抽出方法において、前記文字パタンを垂直方向及び水平方向の双方又はいず
れか一方の方向に走査し、該走査方向の黒画素の連続数
と前記文字パタンの線幅との関係により、該走査方向の
線素成分を表わす補助サブパタンを抽出し、前記補助サブパタンに含まれる線素の傾斜より、前記補
助サブパタンの傾斜を抽出した後、前記補助サブパタンの傾斜に基づき、前記文字パタンを
複数の方向に走査して前記文字パタンから特徴を抽出す
ることを特徴とする特徴抽出方法。２、媒体上の文字を光電変換して得られる文字パタンを
複数の方向に走査し、該走査方向の黒画素の連続数と線
幅との関係により、該走査方向の線素成分を表わすサブ
パタンを抽出した後、前記サブパタンを複数の領域に分割してその分割された
領域毎に、前記サブパタンの線素量を表わす特徴を抽出
する特徴抽出方法において、前記文字パタンを垂直方向
及び水平方向の双方又はいずれか一方の方向に走査し、
該走査方向の黒画素の連続数と前記文字パタンの線幅と
の関係により、該走査方向の線素成分を表わす補助サブ
パタンを抽出し、前記補助サブパタンに含まれる線素の傾斜より、前記補
助サブパタンの傾斜を抽出した後、前記補助サブパタンの傾斜に基づき、前記サブパタンを
抽出することを特徴とする特徴抽出方法。