JPH04589A

JPH04589A - 特徴抽出方法

Info

Publication number: JPH04589A
Application number: JP2100830A
Authority: JP
Inventors: Koichi Higuchi; 浩一樋口; Yoshiyuki Yamashita; 山下　義征
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1990-04-17
Filing date: 1990-04-17
Publication date: 1992-01-06

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）本発明は、媒体上の文字を光電変換して得られる文字パ
タンを、複数方向に走査して該文字パタンの特徴を抽出
する特徴抽出方法、特に高速で、安定な特徴抽出方法に
関するものである。

（従来の技術）従来、この種の特徴抽出方法としては、特開昭５７−２
３１８５号公報（文献１）、及び特公昭５８−５５５５
１号公報（文献２）に記載されるものがあった。

文献１の技術では、媒体上の文字を光電変換して得られ
た文字パタンより、各方向の線素成分（ストローク成分
）を表わすサブパタンを抽出する。そして、該サブパタ
ンを複数の領域に分割してその分割された各領域毎に、
前記サブパタンの線素の量を表わす特徴を抽出して特徴
マトリクスを生成する。その後、該特徴マトリクスと、
予め用意した辞書とを、照合して前記文字を認識するも
のであった。

また、文献２の技術では、文字パタンの走査により、走
査線とストロークの交差数を特徴間として抽出するもの
であった。

（発明が解決しようとする課題）しかしながら、上記の特徴抽出方法では、次のような課
題があった。

（ｉ）　　第２図は、印刷文字の斜体字の例を示す図で
ある。この図における数字“Ｏ′を模式化した図を第３
図（ａ）〜（ｄ＞に示す。即ち、第３図（ａ）は斜体で
ない文字パタン“Ｏ′の例、同図（ｂ）は斜体字１０１
の例、同図（Ｃ）は前記文献１の方法を用いて同図（ａ
）の文字パタンから抽出した垂直サブパタン、及び同図
（ｄ）は前記文献１の方法を用いて同図（ｂ）の文字パ
タンから抽出した垂直サブパタンである。

前記文献１の特徴抽出方法を用いて第３図（ａ）の文字
パタンの垂直サブパタンを抽出すると、第３図（Ｃ）の
ように、垂直成分を忠実に抽出できる。

しかし、第３図（ｂ）の斜体字に対して垂直サブパタン
を抽出すると、第３図（ｄ）に示すように、線素成分が
傾く。その上、第３図（ｄ）の破線で示すような線素成
分が抽出されるべきところが、傾いた線素に対して垂直
に走査しているため、線素の両端部が欠けてしまう。そ
のため、同じ字形“Ｏ゛でありながら、抽出される特徴
が異なる（つまり、抽出される特徴が不安定となる）と
いう問題があった。また、手書文字の変形としては、一
般に右上がりのものが多く、水平線素が傾いているため
、前記と同様に、抽出される特徴が不安定となるという
問題があった。

従って、特徴抽出後、辞書と照合して文字認識を行う場
合、文字傾斜の変形に対応した多数の辞書を用意しなけ
ればならない。そのため、辞書容量が増大し、照合の長
時間化による処理速度の低下と、ハード規模（装置規模
）の増大を招くという不都合があった。

（ｉｉ）　　前記文献２の技術では、走査線と線素の交
差数を特徴間としているので、第３図（ｂ）のように線
素に傾斜があると、走査方向を固定したとき、抽出され
る交差数（特徴間）が大きく変動し、前記（ｉ）と同様
の問題が生じる。

本発明は前記従来技術が持っていた課題として、抽出さ
れる特徴が不安定となる点と、処理速度の低下及び装置
の大型化の点について解決した特徴抽出方法を提供する
ものである。

（課題を解決するための手段）前記課題を解決するために、第１の発明は、媒体上の文
字を光電変換して得られる文字パタンを、複数の方向に
走査して該文字パタンの特徴を抽出する特徴抽出方法に
おいて、次のような手段を講じたものである。

即ち、前記文字パタンを含むＸ−Ｙ座標系で定義される
平面において、少なくとも２組の特定の実数α、βにつ
いて前記文字パタンの黒画素に関するαｘ十βｙ（但し
、ｘ、ｙはＸ−Ｙ座標系の座標値）の最大値及び最小値
を与える座標を求め、該座標に基づき前記文字パタンの
傾斜角を検出し、該傾斜角に基づき前記文字パタンを走
査して特徴を抽出するようにしている。

第２の発明では、媒体上の文字を光電変換して得られる
文字パタンを複数の方向に走査し、該走査方向の黒画素
の連続数と線幅との関係により、該走査方向の線素成分
を表わすサブパタンを抽出した後、前記サブパタンを複
数の領域に分割してその分割された領域毎に、前記サブ
パタンの線素量を表わす特徴を抽出する特徴抽出方法に
おいて、次のような手段を講じたものである。

即ち、前記文字パタンを含むＸ−Ｙ座標系で定義される
平面において、少なくとも２組の特定の実数α、βにつ
いて前記文字バタンの黒画素に関するαＸ＋βｙ（但し
、ｘ、ｙはＸ−Ｙ座標系の座標値〉の最大値及び最小値
を与える座標を求め、該座標に基づき前記文字バタンの
傾斜角を検出し、該傾斜角に従って前記サブパタンを抽
出するようにしている。

（作　用）第１及び第２の発明によれば、以上のように特徴抽出方
法を構成したので、文字バタンか入力されると、その文
字バタンの黒画素に関するαｘ十βｙの最大値及び最小
値を与える座標を検出し、その座標に基づき該文字バタ
ンの傾斜角を検出する。

そして第１の発明では、検出された傾斜角に従って前記
文字バタンを走査し、走査線とストロークの交差数等と
いった特徴間を抽出する。

また第２の発明では、検出された傾斜角に従ってサブパ
タンを抽出し、その後、そのサブパタンを複数の領域に
分割してその分割された領域毎に前記サブパタンの特徴
を抽出する。

これにより、傾斜がある文字バタンについても、抽出さ
れる特徴が安定となり、前記課題を解決できるのである
。

（実施例）第１図は、本発明の実施例を示す特徴抽出方法を用いた
文字認識装置の機能ブロック図である。

この文字認識装置は、帳票等の媒体上の文字画像の光信
号ＩＮを量子化された電気信＠（ディジタル信号）に変
換する光電変換部１を有し、その出力側には、行バッフ
ァ２が接続されている。行バッファ２は、例えば幅２０
４８Ｘ高さ１２８ビツトの大きさを有し、１行分の文字
画像のディジタル信号を格納する構成になっており、そ
の出力側には、文字切出部３を介してバタンレジスタ４
が接続されている。

文字切出部３は、メモリを有し、行バッファ２の出力か
ら１文字分のディジタル信号（これを、「文字バタン」
という）をバタンレジスタ４に格納する機能を有してい
る。バタンレジスタ４は、例えば６４Ｘ６４ビツトの記
憶容量を有し、その出力側には、文字枠検出部５、線幅
測定部６、文字傾斜検出部７、分割点検出部８、及びサ
ブパタン抽出部９が接続されている。線幅測定部６、分
割点検出部８、及びサブパタン抽出部９の出力側には、
特徴マトリクス抽出部１０が接続され、ざらにその出力
側に、識別部１１が接続されている。

文字枠検出部５は、バタンレジスタ４内の文字バタンを
走査して外接枠、つまり文字枠を検出し、その検出結果
を分割点検出部８に与える機能を有している。線幅測定
部６は、バタンレジスタ４の出力に対する線幅を測定し
、その測定結果をサブパタン抽出部９及び特徴マトリク
ス抽出部１０に与える機能を有している。

文字傾斜検出部７は、バタンレジスタ４に格納された文
字バタンについて傾斜度を抽出し、その抽出結果をサブ
パタン抽出部９へ出力する機能を有している。分割点検
出部８は、外接枠内を複数の部分領域に分割するための
分割点座標を検出し、その検出結果を特徴マトリクス抽
出部１０へ出力する機能を有している。

サブパタン抽出部９は、文字傾斜検出部７の出力傾斜度
に基づき、バタンレジスタ４を複数方向に走査して垂直
、水平、右斜め、左斜めサブパタンを抽出するもので、
垂直サブパタン抽出部９ａ。

水平サブパタン抽出部９ｂ、右斜めサブパタン抽出部９
Ｃ１及び左斜めサブパタン抽出部９ｄより構成されてい
る。各抽出部９ａ〜９ｄは、それぞれバタン格納用のメ
モリを有している。

特徴マトリクス抽出部１０は、サブパタン抽出部９から
出力される垂直、水平、右斜め、及び左斜めサブパタン
の各バタンから、特徴間を抽出して特徴マトリクスを作
成し、それを識別部１１へ与える機能を有している。識
別部１１は、標準文字の特徴マトリクス（標準文字マス
ク）Ｇ（ｋ）と、この特徴マトリクスＧ　（ｋ）を有す
る標準文字の文字名とを、格納する辞書メモリを有して
いる。そして、特徴マトリクス抽出部１０で抽出された
特徴マトリクスＦ　（ｋ）と、辞書メモリの特徴マトリ
クスＧ　（ｋ）とを、照合することにより、該特徴マト
リクスＦ　（ｋ）を得た外接枠内領域の文字図形の認識
を行い、文字名ＯＵＴを出力する機能を有している。

第４図は、第１図の文字傾斜検出部７における一構成例
を示す機能ブロック図である。

この文字傾斜検出部７は、バタンレジスタ４から入力さ
れる画像データＭの画素にＸ座標を付与するためのＸ座
標発生手段２１と、画像データＭの画素にＹ座標を付与
するためのＹ座標発生手段２２とを備え、それらの出力
側には座標検出手段３０．４０が接続されている。座標
検出手段３０゜４０は、Ｘ、Ｙ座標と少なくとも２組の
特定のα値及びデータ値とを用いて被抽出バタンの画素
に関する最大及び最小の計篩値αｘ十βｙを検出し、そ
の最大最小計算値を与える被抽出バタンの画素のＸ、Ｙ
座標をそれぞれ特徴点座標として出力するものであり、
その出力側には、文字バタンの傾斜度を特徴点座標に基
づき算出する傾斜度算出手段５０が接続されている。

座標検出手段３０は、計算値αＸ＋βｙを算出するＸ十
Ｙ計算手段３１と、最大計算値を検出するだめの最大値
検出手段３２と、最大計算値を与える画素のＸ、Ｙ座標
を保存するための最大値座標保存手段３３と、最小計算
値を検出するための最小値検出手段３４と、最小計算値
を与える画素のＸ、Ｙ座標を保存するための最小値座標
保存手段３５とで、構成されている。同様に、座標検出
手段４０は、Ｘ−Ｙ計算手段４１、最大値検出手段４２
、最大値座標保存手段４３、最小値検出手段４４、及び
最小値座標保存手段４５より構成されている。

この文字傾斜検出部７では、特徴点座標検出のために、
例えばα＝Ｂ＝１及びα−１、β＝−１の２組のα値及
びβ値を用いるので、２つの座標検出手段３０．４０を
備えている。一方の座標検出手段３０では計算値Ｘ＋Ｙ
に関する最大及び最小計算値を、他方の座標検出手段４
０では計算値Ｘ−Ｙに関する最大及び最小計算値を、そ
れぞれ与える画素の座標を検出する機能を有している。

例えば、Ｘ十Ｙ計算手段３１は加算回路で、ＸＹ計算手
段４１は減算回路で、検出手段３２゜３４．４２．４４
はそれぞれ比較器及びレジスタで、座標保存手段３３．
３５．４３．４５はそれぞれレジスタ等で構成されてい
る。また、Ｘ座標発生手段２１及びＹ座標発生手段２２
は、座標検出手段３０．４０に対して共通に用いるよう
に構成されており、そのため座標検出手段３０．４０は
Ｘ座標発生手段２１及びＹ座標発生手段２２ｈ）ら出力
されるＸ、Ｙ座標をそれぞれ入力して特徴点座標の検出
を行う機能を有している。

次に、以上のように構成される文字認識装置を用いた特
徴抽出方法と、その抽出結果から文字認識を行う方法に
ついて、各機能ブロックの処理（Ｉ）〜（ＶＩ）につい
て説明する。

本実施例では、第２図に示すように、印刷文字における
斜体字のような、文字の垂直辺が傾斜するような文字を
含む文字列の特徴抽出とその認識処理について、以下説
明する。

（１）　　文字バタン生成処理帳票上に記入された文字画像の光信号ＩＮが光電変換部
１に入力されると、光電変換部１では、光信号］Ｎを２
値のデジタル信号、つまり文字線部を“１′、背景部を
“Ｏ′に変換する。光電変換部１で変換された１行分の
文字画像のデジタル信号は、行バッファ２に格納される
。

文字切出部３では、行バッノ７２に格納された文字画像
のデジタル信号から、１文字分のデジタル信号（文字バ
タン）を読出し、バタンレジスタ４に格納する。本実施
例では、帳票フォーマットが予め指定されており、文字
切出部３のメモリに、行バツフア２内の文字位置を示す
アドレスが格納されている。そのため、文字切出し動作
は、該アドレスで指定された行バッフ１２の内容を読み
出すことにより実行される。

（ｆｆ）　　文字枠検出・線幅測定処理文字枠検出部５
では、バタンレジスタ４のバタンを走査してそのバタン
の左端座標Ｘ、Ｉ！、右端座標Ｘｒ、上端座標Ｙｔ及び
下端座標Ｙｂを検出する。外接枠、つまり文字枠は（Ｘ
Ｊ！、Ｙｔ）、（ＸＪＩ、Ｙｂ）、（Ｘｒ、Ｙｔ）、（
Ｘｒ、Ｙｂ）の４点を結ぶ矩形枠となる。

また、文字枠検出後は、特徴間の正規化を行うために、
必要な文字枠の大きさを算出する。即ち、バタンレジス
タ４のＸ軸に対し、平行な方向（水平方向）の文字枠の
大きさをＷＰｈとしてＷＰｈ＝Ｘｒ−ＸＪ＋１を、垂直
な方向（垂直方向）の文字枠の大きさをＷＰＶとしてＷ
Ｐｖ＝Ｙｔ−Ｙｂ＋１を、それぞれ締出する。さらに、
右斜め及び左斜め４５°方向の文字枠の大きさをＷＰｒ
及びＷＰＮとしてを締出する。

一方、線幅測定部６では、バタンレジスタ４からのディ
ジタル信号を入力し、例えば２Ｘ２の窓の全ての点が黒
ビットとなる状態の個数Ｑと、全黒ビットの個数Ａとを
計数し、従来周知の（１）式に従って線幅ＷＬを算出す
る。

ＷＬ＝Ａ／　（Ａ−Ｑ）　　　　　　　・・・・・・（
１）（ＩＩＩ）　　文字傾斜検出処理文字傾斜検出部７は、バタンレジスタ４に格納された文
字バタンについて傾斜度を抽出する。この抽出方法を、
第４図、第５図（ａ）、（ｂ）及び第６図（ａ）、（ｂ
）を参照しつつ説明する。

第５図（ａ＞、（ｂ）は傾斜度検出方法を説明するため
の特徴点の検出例を示す図である。Ｘ−Ｙ座標系で表現
される平面には、被抽出バタンＭ２である傾きのない文
字（第５図（ａ））と斜体字（第５図（ｂ））とが示さ
れている。ＢＬ、　ＢＲ，ＴＬ、ＴＲは特徴点である。

第６図（ａ）。

（ｂ）は、文字傾斜検出方法を説明するもので、同図（
ａ）は最大値処理のフローチャート、及び同図（ｂ）は
最小値処理のフローチャートである。

この文字傾斜検出処理を、（Ａ）特徴点ＴＬ、ＢＲ座標
の検出処理と、（Ｂ）特徴点ＢＬ、ＴＲ座標の検出処理
と、（Ｃ）傾斜度算出処理とに分けて以下説明する。

（Ａ＞特徴点ＴＬ、ＢＲ座標の検出処理この処理では、
第３図の座標検出手段３０等により、次のような（１）
〜（５）の処理ステップで実行される。

（１）　ステップ８１〜Ｓ３先ず、バタンレジスタ４の走査を開始し、そのバタンレ
ジスタ４より出力された画像データＭを、文字傾斜検出
部７に入力する（ステップ３１）。

この画像データＭは、画素毎に座標検出手段３０内の最
大値検出手段３２及び最小値検出手段３４に入力される
。

これと共に、Ｘ座標発生手段２つ及びＹ座標発生手段２
２は、画像データＭの出力と同期させて、この画像デー
タＭの各画素毎に対応付けたＸ、Ｙ座標を発生する。そ
の結果、これら発生手段２１゜２２により、画像データ
ＭにＸ、Ｙ座標の付与が行われる。そして出力されたＸ
、Ｙ座標は、座標検出手段３０内のＸ十Ｙ計算手段３１
、最大値座標保存手段３３、及び最小値座標保存手段３
５に入力される（ステップ８２＞。

Ｘ＋Ｙ計輝手段３１はＸ、Ｙ座標を入力すると、これら
Ｘ、Ｙ座標から計算値Ｘ十Ｙを算出し、算出した計算値
を最大値検出手段３２及び最小値検出手段３４へ出力す
る（ステップ３３）。ステップ８２〜Ｓ３［よって、最
大値検出手段３２は画像データＭ及び計算値を、最小値
検出手段３４は画像データＭ及び計算値を、最大値座標
保存手段３３はＸ、Ｙ座標を、最小値座標保存手段３５
はＸ、Ｙ座標を、それぞれ１画素毎に入力する。そして
、座標検出手段３０は、後述のステップＳ４、Ｓ５ａ、
Ｓ５ｂ或いはＳ７の判断を１画素毎に繰り返し実行し、
その判断結果に応じた処理を行う。

（２）　ステップＳ４最大値検出手段３２及び最小値検出手段３４は、入力さ
れた画像データＭの画像が所定の画素値（例えば、“１
′）であるか否かを判断する。

■　所定の画素値を有さないとき最大値検出手段３２及び最小値検出手段３４は、格納し
ている比較値を書換えず、これと共に最大値座標保存手
段３３及び最小値座標保存手段３５も、格納されている
Ｘ、Ｙ座標を書換えない。検出手段３２．３４は、ステ
ップＳ４の次に、ステップＳ７の判断を行う。

■　所定の画素値を有するとき最大値検出手段３２はステップＳ４の次に比較値及び計
算値の比較（ステップ５５ａ）を、最小値検出手段３４
はステップＳ４の次に比較値及び計算値の比較（ステッ
プ５５ｂ）を、それぞれ行う。

（３）　ステップＳ５ａこのステップでは、計算値が比較値より大きいか否かを
判断し、その判断結果に応じた次のような処理を実行す
る。

■　計算値〉比較値のとき最大値検出手段３２は、先に格納されている比較値に代
えて、比較値よりも大きい計算値を新たな比較値として
格納しく比較値の書換え）、これと共にセットパルスを
最大値座標保存手段３３へ出力する。セットパルスを入
力した最大値座標保存手段３３は、格納されているＸ、
Ｙ座標に代えて、比較値よりも大きな計算値を与える画
素のＸ、Ｙ座標を新たに格納する（　ｒＸ、Ｙ座標の書
換え」ステップ３６）。

■　計算値≦比較値のとき最大値検出手段３２は、先に格納されている比較値を書
換えずにそのまま格納すると共に、最大値座標保存手段
３３も、格納されているＸ、Ｙ座標を書換えない。

最大値検出手段３２は、前記■及び■のいずれの場合も
、ステップＳ５ａの次に、ステップＳ７の判断を行う。

なあ、最大値検出手段３２に格納される比較値の初期値
としては、例えば計算値αとして取り得る値よりも小さ
な値を用いれば良い。例えば、α＝β＝１で、画像デー
タＭを１行ｍ列の画素に分割した（従って、Ｏ≦Ｘ≦ｍ
−１、及びＯ≦Ｙ≦１−１となる）場合には、−１を比
較値の初期値とすることができる。或は比較値の初期値
として、最大値検出手段３２に一番最初に入力された計
算値αＸ＋βｙを用いるようにしても良い。

また、最大値検出手段３２は、比較値及びＸ、Ｙ座標の
書換えを、計算値αｘ十βｙが比較値よりも大きいとき
、及び計算値が比較値と等しいときに行うようにし、こ
れと共に計算値が比較値よりも小さいとき、比較値及び
Ｘ、Ｙ座標の書換えを行わないようにしても良い。さら
に、最大値座標保存手段３３のＸ、Ｙ座標としては、任
意好適な数値を用いて良い。

（４）　ステップＳ５ｂ第６図（ｂ）のステップＳ５ｂでは、計算値が比較値よ
り小さいか否かの判断を行い、その判断結果に基づき次
のような処理を実行する。

■　計算値く比較値のとき最小値検出手段３４は、先に格納されている比較値に代
えて、比較値よりも小さい計算値を比較値として新たに
格納する（比較値の書換え）と共に、最小値座標保存手
段３５ヘセツトパルスを出力する。最小値座標保存手段
３５は、セットパルスを入力すると、格納されているＸ
、Ｙ座標を、比較値よりも小さな計算値を与える画素の
Ｘ、Ｙ座標に書換える（ｒＸ、Ｙ座標の書換え」ステッ
プ３６）。

■　計算値≧比較値のとき最小値検出手段３４は、先に格納されている比較値を書
換えずにそのまま格納すると共に、最小値座標保存手段
３５も、格納されているＸ、Ｙ座標を書換えない。

最小値検出手段３４は、前記■及び■のいずれの場合に
も、ステップＳ５ｂの次に、ステップＳ７の判断を行う
。

なお、最小値検出手段３４に格納される比較値の初期値
としては、例えば計算値αｘ十βｙとして取り得る値よ
りも大きな値を用いれば良い。例えば、α＝β＝１で、
画像データＭを１行ｍ列の画素に分割した（従って、０
≦Ｘ≦ｍ−１、及びＯ≦Ｙ≦１−１となる）場合には、
ｍ十ｎ−１を比較値の初期値とすることができる。或は
比較値の初期値として最小値検出手段３４に一番最初に
入力された計算値αｘ十βｙを用いるようにしても良い
。

また、最小値検出手段３４は、計算値が比較値よりも小
さいとき、及び計算値が比較値と等しいとき、比較値及
びＸ、Ｙ座標の書換えを行い、これと共に計算値が比較
値よりも大きいとき、比較値及びＸ、Ｙ座標の書換えを
行わないようにしても良い。ざらに、最小値座標保存手
段３５のＸ、Ｙ座標としては、任意好適な数値を用いて
良い。

（５）　ステップＳ７ステップＳ７では、画像データＭの走査を終了したか否
かを判断し、その判断結果に応じて次のような処理を実
行する。

■　画像データＭの走査を終了したとき最大値検出手段
３２及び最小値検出手段３４は、画像データＭの走査が
終了し、データＭの全画素につき処理が終了すると、Ｘ
、Ｙ座標の出力信号を、最大値座標保存手段３３及び最
小値座標保存手段３５へ出力する。すると、座標保存手
段３３゜３５は、格納しているＸ、Ｙ座標を特徴点座標
として出力する。これと共に検出手段３２．３４は、比
較値の初期化を行う（ステップ３８）。

全画素につき処理を終了した時点で、最大値座標保存手
段３３及び最小値座標保存手段３５に格納されているＸ
、Ｙ座標が、最大及び最小計紳値を与える画素のＸ、Ｙ
座標、すなわち特徴点座標となる。

座標検出手段３０では、α＝β−１としたので、全処理
終了時点で、例えば第５図に示す被抽出パタンＭ２の特
徴点ＢＲの座標が、最大値座標保存手段３３に格納され
ており、また特徴点下りの座標が、最小値座標保存手段
３５に格納されている。

■　画像データＭの走査が終了しないとき座標検出手段
３０は、画像データＭの走査が終了せず、従ってデータ
Ｍの全画素につき処理か終了していなければ、画像デー
タＭの残りの画素につき、ステップ３４．Ｓ５ａ、Ｓ５
ｂ或はＳ７の判断を行い、その判断結果に応じた処理を
行う。

（Ｂ）特徴点ＢＬ、ＴＲ座標の検出処理この処理は、座
標検出手段４０等で行われる処理である。即ち、座標検
出手段４０は、上述した座標検出手段３０の動作と並行
してその座標検出手段３０とほぼ同様の処理を行う。

この座標検出手段４０では、α＝１及びβ＝−１とした
ので、全画素につき処理を終了した時点で、例えば、第
５図に示す被抽出パタンＭ２の特徴点ＴＲの座標が、最
大値座標保存手段４３に格納されており、また特徴点Ｂ
Ｌの座標が、最小値座標保存手段４５に格納されている
。

（Ｃ）傾斜度算出処理前記処理（Ａ＞、（Ｂ）で、特徴点ＴＲ，ＴＬ。

ＳＲ，ＢＬの４点の座標（ＴＲｘ、ＴＲｙ＞。

（ＴＬＸ、ＴＬＶ）、（ＢＲｘ、ＢＲｙ）、（ＢＬＸ、
Ｂｌｊ’）が検出されると、傾斜度算出手段５０では、
該４点の座標より、入力文字パタンの傾斜角度に相当す
る値（傾斜度）ＴＨを次式に従って計算する。

即ち、傾斜度算出手段５０は、（２）式を用いて、４個
の特徴点を結んで得られる四辺形の右辺の上端と下端の
Ｘ座標値の差と、左辺の上端と下端のＸ座標値の差の平
均を、文字高さの平均で割った値を傾斜度ＴＨとして出
力し、サブパタン抽出部９へ与える。

（ＩＶ）　　分割点検出処理分割点検出部８では、外接枠内領域をＮＸＸＮＹ個の部
分領域に分割するためのＸ軸上及びＹ軸上の分割点座標
を、各外接枠毎に決定する。但し、ＮＸはＸ軸方向にお
ける分割数、及びＮＹはＹ軸方向における分割数である
。

分割数ＮＸ及びＮＹは、文字の複雑さに応じて任意好適
な値に設定するのが好ましい。例えば、漢字・カタカナ
等の画数の少ない文字を認識対象とする場合は、（２Ｘ
２）〜（３Ｘ３）程度の少ない数の部分領域に、外接枠
内領域を分割する。

漢字が認識対象となる場合には、（４Ｘ４）〜（８Ｘ８
）程度の部分領域に、外接枠内領域を分割することが多
い。しかし、本実施例では、認識対象の複雑さにかかわ
らず、外接枠内領域を等分割、例えば（４Ｘ４）個に分
割するようにした。

Ｘ軸上の分割座標ＤＸ（ｎ＞、及びＹ軸上の分割座標Ｄ
Ｙ　（ｎ）は、次式（４）、（５）で決定される。

ＤＸ（ｎ＞・・・・・・（３〉ＤＹ　（ｍ）但し、ｎ＝１．２．　・−・−・、ＮＸ−ｌｍ＝１．２
．−−−−−・、ＮＹ−１本実施例では、例えばＮＸ＝ＮＹ＝４（Ｖ）　　サブパタン抽出処理第７図（ａ）、（ｂ＞は、サブパタンの抽出方法を示す
図であり、同図（ａ）は文字バタンの例、及び同図（ｂ
）は垂直サブパタンの例である。第７図（ａ）中の矢印
Ｐは、垂直サブパタン抽出時の走査経路を示す。

サブパタン抽出部９では、文字傾斜検出部７で得られた
傾斜度に基づき、垂直サブパタン抽出部９ａ、水平サブ
パタン抽出部９ｂ、右斜めサブパタン抽出部９Ｃ及び左
斜めサブパタン抽出部９ｄにより、それぞれバタンレジ
スタ４上に設定したＸ軸方向にほぼ垂直な方向（垂直方
向）及び平行な方向（水平方向）と、Ｘ軸から反時計方
向４５°の方向（右斜め４５°方向）及び時計方向４５
°の方向（左斜め４５°方向）とを、主走査方向として
バタンレジスタ４を走査し、各主走査方向に対応する垂
直、水平、右斜め及び左斜めサブパタンを抽出する。

本実施例においては、例えば第７図（ａ）の斜体字を認
識対象としているので、前記傾斜検出部７では、文字の
４個の特徴点の座標を結んで得られる四辺形の右辺と左
辺の傾斜から、文字の傾斜度を抽出している。この傾斜
は、垂直サブパタンの傾斜によるものであるので、文字
バタンを該傾斜に基づき走査し、垂直サブパタンを抽出
する。

この垂直ザブバタン抽出部９ａの動作を説明する。

垂直サブパタン抽出部９ａでは、文字傾斜検出部７で得
られた傾斜度に基づき、第７図（ａ）の文字バタンを走
査し、走査線上で連続する黒ビット（黒ラン）を検出す
る。そして、検出した黒ランのなかから次式（５）を満
足する長ざｊの黒ランを抽出する。

ｇ≧Ｎ−ＷＬ　　　　　　　　・・・・・・（５）但し
、ｇ；主走査方向における黒ランの長さＮ；各サブパタンに対する任意定数（例えば、２）走査経路Ｐは次のとおりである。垂直走査は上辺から走
査を開始する。走査開始アドレス（Ｘａ。

ＹＴ）からの走査経路Ｐの座標（ｘＨ，ｙＨ）は、次式
（６）で表わすことができる。

ｘ１＝ｘａｙ１＝ＹＴｘ　・＝Ｘａ＋ＴＨｘ　（ｙ　１−ＹＴ）ＶＨ＝Ｖｉ−
１＋１・・・・・・（６）但し、丁Ｈは実数、丁ＨＸ（Ｖ・−ＹＴ）の結果は小数
点以下切捨て、座標は全て整数である。

垂直サブパタン抽出部９ａは、（５）式を満足する黒ラ
ンを、サブパタンを構成する黒ランとみなして図示しな
い垂直サブパタンメモリに格納する。（５）式を満足し
ない黒ランは白ビットとみなす。

同様に、水平、右斜め及び左斜めサブパタン抽出部９ｂ
、９Ｃ，９ｄは、水平、右斜め及び左斜め方向を主走査
方向として原パタンを走査し、それぞれの主走査方向の
走査線上の黒ランのなかから、（５）式を満足する黒ラ
ンを抽出し、抽出した黒ランを、サブパタンを構成する
黒ランとみなして図示しない水平、右斜め及び左斜めサ
ブパタンメモリに格納する。

本実施例では、水平、右斜め、及び左斜めサブパタンの
抽出時には、文字の傾きは考慮しない。

（Ｖｌ）　　特徴マトリクス抽出処理文字枠検出部５が文字バタンの外接枠を規定する座標Ｘ
、Ｉ）、Ｘｒ、Ｙｔ、Ｙｂを検出し、さらに分割点検出
部８が文字パタンについて対象分割点座標を検出すると
、特徴マトリクス抽出部１０ては、垂直、水平、右斜め
、及び左斜めサブパタンの各バタンから特重量を抽出し
、特徴マトリクスを作成する。

即ち、特徴マトリクス抽出部１０は、一つの外接枠内領
域を、対象分割点座標と座標ＸｆＪ、Ｘｒ。

Ｙｔ、ＹｂとによってＮＸＸＮＹ個の部分領域に分割し
、各部分領域内のサブパタンの文字線量を表す特徴量を
抽出する。そして、一つの外接枠領域内の各サブパタン
から抽出したＮＸＸＮＹＸ４個の特′重量から成る特徴
マトリクスを、当該外接枠内領域の特徴間マトリクスと
して抽出する。

まず、水平サブパタン（Ｈ３Ｐ）からの特徴量抽出につ
き説明する。

特徴マトリクス抽出部１０は、対象分割点座標と座標Ｘ
ＪＩＩ　、Ｘｒ、Ｙｔ、Ｙｂとに基づき、外接枠内領域
をＮＸＸＮＹ個の部分領域に分割しく対象分割点座標及
び座標Ｘ、！！、Ｘｒ、Ｙ↑、Ｙｂは分割点座標である
）、各部分領域毎に部分領域内の水平サブパタンＨ３Ｐ
の黒ビット数ＢＨ（ｉ。

ｊ）を計数する。

分割点座標から分割領域の決定は、次のように行う。ま
ず、Ｘ軸上の分割点座標ＤＸ（ｎ＞を、文字パタンの外
接枠の上端と下端の中点を通りＸ軸に平行な直線上に設
定する。この座標を起点として、次式（７）〜（９）で
求められる座標系列の左側を、第７図（ｂ）に示すよう
な分割境界Ｓとする。

Ｘ□＝ＤＸ（ｎ＞ｙ□＝（ＹＴ＋ＹＢ）／２・・・・・・（７〉（Ｘ□、　ｙ□）から、下方への座標系列は、Ｘ・＝Ｄ
Ｘ　（ｎ）ＩＮＴ　（ＴＨｘ　（ｙ　ｉ−ｙ□）　＋０．５）ｙｉ
＝ＶＨ、＋１・・・・・・（８）但し、；＝１．２．３゜（（ＹＴ−ＹＢ）／２−ＹＴ）（ｘ□、ｙ□）から、上方への座標系列は、ｘ　ｊ＝Ｄ
Ｘ　（ｎ）十ＩＮＴ　（ＴＨＸ　（Ｖ□　　Ｖ　ｊ）　＋０．５）
ｙｊ＝ｙｊ＋１　１・・・・・・（９）但し、ｊ＝−１，−２，−３，・・・・・・。

（ＹＢ−（ＹＴ−ＹＢ）／２）で求める。但し、ＩＮＴ（）は、その（）内の演算を実
数値を用いて行い、情果の小数点以下を切捨てて、整数
値とすることを表す。

水平方向の分割境界Ｓは、ＤＹ　（ｍ＞より、水平方向
に設定する。

以上のように分割された分割領域毎に、水平サブパタン
Ｈ３Ｐの黒ビット数ＢＨ（ｉ、ｊ）を計数する。このＢ
Ｈ（ｉ、ｊ）は、一つの外接枠内領域に関する第ｉ行第
ｊ列の部分領域の黒ビット数である。次に、（１０）式
に従って第ｉ行第Ｊ列の部分領域に関する特徴間ＦＨ（
ｉ、ｊ＞を計算する。

ざらに、Ｈ３Ｐの場合と同様にして、第ｉ行第ｊ列の部
分領域（７）ＶＳＰ、Ｈ３Ｐ、ＬＳＰ（７）黒１：ｊッ
ト数ＢＶ　（ｉ、　ｊ）、　ＢＲ（ｉ、　ｊ＞、　ＢＬ
（ｉ、ｊ＞を計数し、次式（１１）〜（１３）に従って
第ｉ行第ｊ列の部分領域に関するＶＳＰ。

Ｈ３Ｐ、ＬＳＰの持重量ＦＶ（ｉ、ｊ＞、ＦＲ（ｉ、ｊ
＞、ＦＬ（ｉ、ｊ）を算出する。

但し、ｉ＝１．２．・・・・・・、ＮＸｊ＝１．２．−
・・・・・、ＮＹＷＬ；線幅ＷＰｈ；文字幅（＝Ｘｒ−Ｘ、Ｑ　＋１　）但し、ＷＰＶ：文字高さ（＝Ｙｂ−Ｙｔ＋１＞ＷＰｒ＝ＷＰｌ
　＝　（ＷＰｖ＋ＷＰｈ＞／２以上のようにして、外接
枠内領域の各部分領域毎にＶＳＰ、Ｈ３Ｐ、Ｈ３Ｐ、Ｌ
ＳＰの特徴間を抽出し、これらＮＸＸＮＹＸ４個の持重
量から成る特徴マトリクスＦ　（ｋ）（ｋ＝１．２．・
・・・・・。

ＮＸｘＮＹｘ４）を得る。特徴マトリクス抽出部１０は
、特徴マトリクスＦ　（ｋ）を各外接枠領域毎に抽出し
、その抽出結果を識別部１１へ送る。

（ＶＩ　）　　識別処理識別部１１は、抽出された特徴マトリクスＦ（ｋ）と、
内部に設けられた辞書メモリ内の特徴マトリクスＧ　（
ｋ＞とを、照合することにより、該特徴マトリクスＦ　
（ｋ）を得た外接枠内領域の文字図形の認識を行う。こ
の認識では、次式（１４）に従って特徴マトリクスＦ　
（ｋ）とＧ　（ｋ）間の距離りを求め、距離りが最小と
なる特徴マトリクスＧ　（ｋ）の標準文字の文字名（例
えば、ＪＩＳ規格に定められた文字コード）ＯＵＴを認
識結果として出力する。

以上のように、本実施例では、次のような利点を有して
いる。

（ａ＞　　本実施例では、バタンレジスタ４内の文字バ
タンを含むＸ−Ｙ座標系で表現される平面において、文
字パタンの黒画素に関するαＸ十βｙの最大値及び最小
値を与える座標を文字傾斜検出部７で検出し、さらにそ
の座標に基づき文字パタンの傾斜角を検出する。そして
、サブパタン抽出部９で、該傾斜角に従ってサブパタン
を抽出している。そのため、傾斜を有する文字パタンに
ついても、抽出される特徴が安定となる。従って、文字
傾斜の変形に対応した辞書を識別部１１内に用意する必
要がなく、辞書容量の減少により、照合時間の短縮とそ
れによる処理速度の高速化が図れると共に、ハード規模
が小さく、認識精度の良い文字認識が可能となる。

（ｂ）　　上記実施例では、第２図のような印刷文字に
おける斜体字の特徴抽出方法と認識方法について説明し
たが、認識対象文字は、これに限定されない。例えば、
手書き文字の法学で、右上がりに記入された文字を認識
対象とする場合は、文字の水平辺が傾斜しているものと
して、上記実施例とほぼ同様の処理で認識することがで
きる。

なお、本発明は、上記実施例に限定されず、種々の変形
が可能ある。その変形例としては、例えば次のようなも
のがある。

（ｉ）　上記実施例の特徴抽出方法は、例えば前記文献
２に記載されたような、文字バタンの走査により特徴の
抽出を行う方法にも適用できる。例えば、前記文献２の
方法では、走査線とストロークの交差数を特徴量として
いるので、ストロークに傾斜があると、走査方向を固定
したとき、抽出される交差数が大きく変動する。そこで
、上記実施例の方法によって傾斜を抽出し、該傾斜に従
つて特徴抽出を行えば、上記実施例とほぼ同様の効果が
得られる。

（ｉｉ）　　第４図の文字傾斜検出部７を、他の機能ブ
ロックで構成したり、あるいはそれらの機能ブロックを
、コンピュータを用いたプログラム制御等で実行する構
成にしてもよい。さらに、その文字傾斜検出処理を、第
６図（ａ）、（ｂ）以外の処理フローチャートで実行し
てもよい。

（発明の効果）以上詳細に説明したように、第１の発明によれば、文字
パタンを含むＸ−Ｙ座標系で表現される平面において、
αＸ十βｙの最大値及び最小値を与える座標を求め、そ
の座標に基づき文字パタンの傾斜角を検出する。次に、
その傾斜角に従って文字パタンを走査し、走査線とスト
ロークの交差数等といった特徴を抽出するようにしてい
る。そのため、傾斜を有する文字パタンについても、抽
出される特徴が安定となる。従って、文字傾斜の変形に
対応した辞書を用意する必要がなく、処理速度が速く、
小さなハード規模で、認識精度の良い文字認識が可能と
なる。

第２の発明では、検出された傾斜角に従ってサブパタン
を抽出し、その後、そのサブパタンの特徴を抽出してい
るので、前記第１の発明とほぼ同様の効果が得られる。

【図面の簡単な説明】

第１図は本発明の実施例を示す特徴抽出方法を用いた文
字認識装置の機能ブロック図、第２図は斜体字の例を示
す図、第３図（ａ）〜（ｄ）は従来の特徴抽出方法を説
明するための図、第４図は第１図における文字傾斜検出
部の機能ブロック図、第５図（ａ）、（ｂ）は傾斜度検
出方法を説明するための特徴点の検出例を示す図、第６
図（ａ）。（ｂ）は文字傾斜検出のフローチャート、第７図（ａ）
、（ｂ＞はサブパタン抽出方法を説明するための図であ
る。１・・・・・・光電変換部、２・・・・・・行バッファ
、３・・・・・・文字切出部、４・・・・・・バタンレ
ジスタ、５・・・・・・文字枠検出部、６・・・・・・
線幅測定部、７・・・・・・文字傾斜検出部、８・・・
・・・分割点検出部、９・・・・・・サブパタン抽出部
、１０・・・・・・特徴マトリクス抽出部、１１・・・
・・・識別部、２１・・・・・・Ｘ座標発生手段、２２
・・・・・・Ｙ座標発生手段、３０，４０・・・・・・
座標検出手段、５０・・・・・・傾斜度算出手段。

Claims

【特許請求の範囲】１、媒体上の文字を光電変換して得られる文字パタンを
、複数の方向に走査して該文字パタンの特徴を抽出する
特徴抽出方法において、前記文字パタンを含むＸ−Ｙ座標系で定義される平面に
おいて、少なくとも２組の特定の実数α、βについて前
記文字パタンの黒画素に関するαｘ＋βｙ（但し、ｘ、
ｙはＸ−Ｙ座標系の座標値）の最大値及び最小値を与え
る座標を求め、該座標に基づき前記文字パタンの傾斜角
を検出し、該傾斜角に基づき前記文字パタンを走査して
特徴を抽出することを特徴とする特徴抽出方法。２、媒体上の文字を光電変換して得られる文字パタンを
複数の方向に走査し、該走査方向の黒画素の連続数と線
幅との関係により、該走査方向の線素成分を表わすサブ
パタンを抽出した後、前記サブパタンを複数の領域に分割してその分割された
領域毎に、前記サブパタンの線素量を表わす特徴を抽出
する特徴抽出方法において、前記文字パタンを含むＸ−
Ｙ座標系で定義される平面において、少なくとも２組の
特定の実数α、βについて前記文字パタンの黒画素に関
するαｘ＋βｙ（但し、ｘ、ｙはＸ−Ｙ座標系の座標値
）の最大値及び最小値を与える座標を求め、該座標に基
づき前記文字パタンの傾斜角を検出し、該傾斜角に従っ
て前記サブパタンを抽出することを特徴とする特徴抽出
方法。