JPH04588A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPH04588A
JPH04588A JP2100829A JP10082990A JPH04588A JP H04588 A JPH04588 A JP H04588A JP 2100829 A JP2100829 A JP 2100829A JP 10082990 A JP10082990 A JP 10082990A JP H04588 A JPH04588 A JP H04588A
Authority
JP
Japan
Prior art keywords
character
coordinates
value
coordinate
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2100829A
Other languages
English (en)
Other versions
JP2749947B2 (ja
Inventor
Koichi Higuchi
浩一 樋口
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2100829A priority Critical patent/JP2749947B2/ja
Publication of JPH04588A publication Critical patent/JPH04588A/ja
Application granted granted Critical
Publication of JP2749947B2 publication Critical patent/JP2749947B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、媒体上の文字を光電変換して得られる文字パ
タンより、入力文字を認識する文字認識方法、特に高速
で、認識精度の良い文字認識方法に関するものである。
(従来の技術) 従来5この種の文字認識方法とし2ては特開昭58−1
23171号公報に記載されるものがあった。
従来、媒体上の文字を認識する場合、手書き文字におい
ては、筆者の違いによる線素の移動速度や傾き、印刷文
字においては、フォント(字体)の違い等により、抽出
される特徴が変動するので、該特徴の変動に対応した辞
書を用意しなければならなかった。そのため4辞書容量
が増大し、さらにその辞書の照合に要する時間も増大し
、処理速度の低下、装置の大型化を招いていた。
そこで、前記文献の技術では、文字パタンを水平方向及
び垂直方向に走査して周辺分布を求め、該周辺分布の重
心位置により分割座標を決定している。これにより、文
字バタン上の領域を決定するための分割位置を線素の位
置移動に追従させることが可能となり、個人差に基づく
ストローク位置変動等の特徴の変動を吸収し、辞書容量
の減少による処理速度の高速化を図るようにしている。
(発明が解決しようとする課題) しかしながら、上記の文字認識方法では、次のような課
題があった。
第2図(a)、(b)は従来の文字認識方法を説明する
ための図であり、同図(a>は傾きのない文字パタンと
その周辺分布、及び同図(b)は斜体字の文字パタンと
その周辺分布についてそれぞれ示されている。
従来の文字MX識方法では、入力文字パタンを水平方向
及び垂直方向に走査して周辺分布を求め、その周辺分布
の重心位置により分割座標を決定している。ところが、
第2図(b)に示すように、垂直線素に傾きを持つよう
な斜体字について周辺分布を抽出した場合、第2図(a
>に示すような傾きのない文字の場合と比較すると、垂
直線素の部分の濃度分布がなだらかになるため、検出さ
れる分割点座標値が異なったものとなる。しかも、傾き
のない文字については垂直線素と平行に分割されるが、
垂直線素に傾きを持つ斜体字については文字線が斜めに
分断されてしまう。従って、同じ文字字形でありながら
、抽出される特徴量が大きく異なったものとなり、文字
認識精度が低下してしまう。
そこで、従来の文字認識方法では、このような特徴の変
動を吸収するために、様々な変形に対応する辞書を用意
していた。そのため、辞書容量が増大し、照合に時間が
かかり、それによってハード規模(装置規模)や処理時
間が増大するという問題があり、技術的に十分満足のゆ
くものが得られなかった。
本発明は前記従来技術が持っていた課題として、処理時
間の増大と装置の大型化という点について解決した文字
認識方法を提供するものである。
(課題を解決するための手段) 本発明は前記課題を解決するために、媒体上の文字を光
電変換して得られる文字パタンの外接枠を検出し、該外
接枠内を複数の領域に分割し、該分割された分割領域毎
に特徴を抽出した後、該抽出された特徴と予め用意した
標準特徴との照合により、前記文字を認識する文字認識
方法において、次のような手段を講じたものである。
即ち、前記文字パタンを含むX−Y座標系で定義される
平面において、少なくとも2組の特定の実数α、βにつ
いて前記文字パタンの黒画素に関するαχ+βy(但し
、刈yはX−Y座標系の座標値)の最大値及び最小値を
与える座標を求め、該座標に基づき前記文字パタンの傾
斜角を検出する。次に、前記傾斜角に基づき前記文字パ
タンを走査して周辺分布を抽出し、該周辺分布を使用し
て前記外接枠内の分割点を検出する。その後、前記傾斜
角及び分割点に基づき前記外接枠内の分割境界を設定し
、該分割境界に基づき前記外接枠内を複数の領域に分割
するようにしたものである。
(作用) 本発明によれば、以上のように文字認識方法を構成した
ので、文字パタンが入力されると、その文字パタンに対
する外接枠を検出すると共に、該文字パタンの黒画素に
関するαX+βyの最大値及び最小値を与える座標を検
出し、その座標に基づき該文字パタンの傾斜角を検出す
る。そして、検出された傾斜角に従って周辺分布を抽出
し、その周辺分布を使用して外接枠内の分割点を検出す
る。
次に、検出された傾斜角及び分割点に基づき、外接枠内
の分割境界を設定し、その設定された分割境界に基づき
外接枠内を複数の領域に分割する。
その後、分割された分割領域毎に特徴を抽出し、その特
徴と標準特徴との照合を行えば、入力文字の認識が行え
る。
このように、文字パタンの傾斜角を検出し、その傾斜角
に基づき、文字バタンを走査して周辺分布を抽出してい
るので、垂直軸に対して傾斜するような文字パタンにつ
いても、抽出される特徴が安定し、文字傾斜の変形に対
応した辞書を用意する必要がない。これにより、処理速
度の高速化と装置の小型化、及び認識精度の向上が図れ
る。従って、前記課題を解決できるのである。
(実施例) 第1図は、本発明の実施例を示すもので、文字認識方法
を説明するための文字認識装置の機能ブロック図である
この文字認識装置は、帳票等の媒体上の文字画像の光信
号INを量子化された電気信号(ディジタル信号)に変
換する光電変換部1を有し、その出力側には、行バッフ
ァ2が接続されている。行バッファ2は、例えば幅20
48x高さ128ビツトの大きさを有し、1行分の文字
画像のディジタル信号を格納する構成になっており、そ
の出力側には、文字切出部3を介してバタンレジスタ4
が接続されている。
文字切出部3は、メモリを有し、行バッファ2の出力か
ら1文字分のディジタル信号(これを、「文字パタン」
という)をバタンレジスタ4に格納する機能を有してい
る。バタンレジスタ4は、例えば64X64ビツトの記
憶容量を有し、その出力側には、文字枠検出部5、線幅
測定部6、及びサブバタン抽出部7が接続されると共に
、文字傾斜検出部8及び周辺分布抽出部9が接続されて
いる。
文字枠検出部5は、バタンレジスタ4内の文字パタンを
走査して外接枠、つまり文字枠を検出し、その検出結果
を文字傾斜検出部8及び周辺分布抽出部9等に与える機
能を有している。線幅測定部6は、バタンレジスタ4の
出力に対する線幅を測定し、その測定結果をサブバタン
抽出部7に与える機能を有している。サブバタン抽出部
7は、バタンレジスタ4を複数方向に走査して垂直、水
平、右斜め、左斜めサブバタンを抽出するもので、垂直
サブバタン抽出部7a、水平サブバタン抽出部7b、右
斜めサブバタン抽出部7c、及び左斜めサブバタン抽出
部7dより構成されている。各抽出部7a〜7dは、そ
れぞれバタン格納用のメモリを有している。
文字傾斜検出部8は、バタンレジスタ4に格納された文
字パタンについて傾斜度を抽出する機能を有している。
周辺分布抽出部9は、文字傾斜検出部8から出力された
傾斜度を用いてバタンレジスタ4を走査し、周辺分布を
抽出する機能を有している。この周辺分布抽出部9の出
力側には、分割点検出部10が接続され、その分割点検
出部10、文字枠検出部5、サブバタン抽出部7及び文
字傾斜検出部8の出力側には、特徴マトリクス抽出部1
1が接続され、さらにその出力側に識別部12が接続さ
れている。
分割点検出部10は、周辺分布抽出部9で抽出された周
辺分布を用いて、外接枠内を複数の部分領域に分割する
ための分割点座標を検出する機能を有している。特徴マ
トリクス抽出部11は、サブバタン抽出部7から出力さ
れる垂直、水平、右斜め、及び左斜めサブパタンの各バ
タンから、特徴量を抽出して特徴マトリクスを作成し、
それを識別部12へ与える機能を有している。識別部1
2は、標準文字の特徴マトリクス(標準文字マスク)G
(k)と、この特徴マトリクスG(k)を有する標準文
字の文字名とを、格納する辞書メモリを有している。そ
して、特徴マトリクス抽出部11で抽出された特徴マト
リクスF(k)と、辞書メモリの特徴マトリクスG (
k)とを、照合することにより、該特徴マトリクスF 
(k)を得た外接枠内領域の文字図形の認識を行い、文
字名○LJTを出力する機能を有している。
第3図は、第1図の文字傾斜検出部8における一構成例
を示す機能ブロック図である。
この文字傾斜検出部8は、バタンレジスタ4がら入力さ
れる画像データMの画素にX座標を付与するためのX座
標発生手段21と、画像データMの画素にY座標を付与
するためのY座標発生手段22とを備え、それらの出力
側には座標検出手段30.40が接続されている。座標
検出手段3040は、X、Y座標と少なくとも2組の特
定のα値及びデータ値とを用いて被抽出パタンの画素に
関する最大及び最小の計算値αX+βyを検出し。
その最大最小計算値を与える被抽出パタンの画素のX2
Y座標をそれぞれ特徴点座標として出力するものであり
、その出、力1則には、文字パタンの傾斜度を特徴点座
標に基づき算出する傾斜度!出手段ヲOが接続されてい
る。
座標検出手段30は、計算値αχ+βyを算出するX十
Y計算手段31と、最大計算値を検出するための最大値
検出手段32と、最大計算値を与える画素のX、Y座標
を保存するための最大値座標保存手段33と、最小計算
値を検出するための最小値検出手段34と、最小計算値
を与える画素のX、Y座標を保存するための最小値座標
保存手段35とで、構成されている。同様に、座標検出
手段40は、x −y計算手段41、最大値検出手段4
2、最大値座標保存手段43、最小値検出手段44、及
び最小値座標保存手段45より構成されている。
この文字傾斜検出部8では、特徴点座標検出のために、
例えばα=β=1及びα==−1、β=−1の2組のα
値及びβ値を用いるので、2つの座標検出手段30.4
0を備えている。一方の座標検出手段30では計算値X
+Yに関する最大及び最小計算値を、他方の座標検出手
段40では計X値X−Yに関する最大及び最小計算値を
、それぞれ与える画素の座標を検出する機能を有してい
る。
例えば、X+Y計算手段31は加算回路で、X−Y計算
手段41は減算回路で、検出手段32゜34.42.4
4はそれぞれ比較器及びレジスタで、座標保存手段33
,35,43.45はそれぞれレジスタ等で構成されて
いる。また、X座標発生手段21及びY座標発生手段2
2は、座標検出手段30.40に対して共通に用いるよ
うに構成されており、そのため座標検出手段30.40
はX座標発生手段21及びY座標発生手段22かち出力
されるX、)′座標をそれぞれ入力して特徴点座標の検
出を行う機能を有している。
次に、↓゛1上のようtこ襦成さり、る文字認識装置を
用いた文字認識方法について、各機能ブロックの処理(
I)〜(■)について説明する。
第4図は、印刷文字の斜体字の例を示す図である。本実
施例では、この第4図に示すように、印刷文字における
斜体字のような、文字の4個の特徴点を結んで得られる
四辺形の右辺及び左辺が傾斜するような文字を含む文字
列を認識する場合について、以下説明する。
(I>  文字パタン生成処理 帳票上に記入された文字画像の光信号INが光電変換部
1に入力されると、光電変換部1では、光信号INを2
値のデジタル信号、つまり文字線部を“1゛、背景部を
′O′に変換する。光電変換部1で変換された1行分の
文字画像のデジタル信号は、行バッファ2に格納される
文字切出部3では、行バッファ2に格納さhを文字画像
のデジタル信号から、1文字分のデジタル信号(文字パ
タン)を読出し、パタンレジスタ4に格納する。本実施
例では、帳票フォーマットが予め指定されており2文字
切出部3のメモリLこ、行バツフア2内の文字位置を示
すアドレスが格納されている そのため、文字切出し動
作は、該アドレスで指定された行バッファ2の内容を読
み出すことにより実行される。
(ff)  文字枠検出・線幅測定処理文字枠検出部う
では、バタンレジスタ4のパタンを走査してそのパタン
の左端座標X、il、右端、亭標Xr、上端座標Yt及
び下端座標ybを検出する。外接枠、つまり文字枠は(
、XJ)、Yt)、(XJII 、 Yb)、(Xr、
Yt)、(Xr、Yb)の4点を結ぶ矩形枠となる9 また、文字粋検出論は、特徴量の正規化を行うために、
必要な文字枠の大きさを算出する。即ち、バタンレジス
タ4のX軸に対し、平行な方向(水平方向)の文字枠の
大きさをWPhとしてWPh=Xr−XR÷1を、垂直
な方向(垂直方向)の文字枠の大きさをWPvとしてW
 P v = Y t −Yb+1を、それぞh算出す
る。さらに、右斜め及び左斜め45′方向の文字枠の大
きさをWPr及びWPNとして WRh+WPv Z を算出する。
一方、線幅測定部6では、バタンレジスタ4からのディ
ジタル信号を入力し、例えば2×2の窓の全ての点が黒
ビットとなる状態の個数Qと、全黒ビットの個数Aとを
計数し、従来周知の(1)式に従って線幅WLを算出す
る。
WL=A/ (A−Q)       ・・・・・・(
1)(III)  サブバタン抽出処理 サブバタン抽出部7では、垂直サブバタン抽出部7a、
水平サブバタン抽出部7b、右斜めサブバタン抽出部7
C及び左斜めサブバタン抽出部7dにより、それぞれバ
タンレジスタ4上に設定しなX軸方向に垂直な方向く垂
直方向)及び平行な方向(水平方向)と、X軸から反時
計方向45゜の方向(右斜め45°方向)及び時計方向
45゜の方向く左斜め45°方向)とを、主走査方向と
してバタンレジスタ4を走査し、各主走査方向に対応す
る垂直、水平、右斜め及び左斜めサブバタンを抽出する
即ち、垂直サブバタン抽出部7aでは、垂直方向を主走
査方向として環パタンを全面走査し、垂直方向の走査線
上で連続する黒ビット(黒ラン)を検出する。そして、
検出した黒ランのなかから次式(2)を満足する長さp
の黒ランを抽出する。
1≧N、WL ・・・・・・(2) 但し、p;主走査方向における黒ラ ンの長さ N;各サブパタンに対する任 意定数(例えば、2) 次に、垂直サブバタン抽出部7aは、(2)式を満足す
る黒ランを一サブパタンを構成する黒ランとみなして図
示しない垂直サブバタンメモリに格納する。(2)式を
満足しない黒ランは白ビットとみなす。
同様に、水平、右斜め及び左斜めサブバタン抽出部7b
、7c、7dは、水平、右斜め及び左斜め方向を主走査
方向として環パタンを走査し、それぞれの主走査方向の
走査線上の黒ランのなかから、(2〉式を満足する黒ラ
ンを抽出し、抽出した黒ランを、サブパタンを構成する
黒ランとみなして図示しない水平、右斜め及び左斜めサ
ブバタンメモリに格納する。
(IV)  文字傾斜検出処理 文字傾斜検出部8は、バタンレジスタ4に格納された文
字バタンについて傾斜度を抽出する。この抽出方法を、
第3図、第5図(a>、(b)及び第6図(a>、(b
)を参照しつつ説明する。
第5図(a>、(b)は傾斜度検出方法を説明するため
の特徴点の検出例を示す図である。X−Y座標系で表現
される平面には、被抽出バタンM2である傾きのない文
字(第5図(a))と斜体字(第5図(b))とが示さ
れている。BL、BR,TL、TRは特徴点である。第
6図(a)。
(b)は、文字傾斜検出方法を説明するもので、同図(
a)は最大値処理のフローチャート、及び同図(b)は
最小値処理のフローチャートである。
この文字傾斜検出処理を、(A>特徴点TL、BR座標
の検出処理と、(B)特徴点BL、TR座標の検出処理
と、(C)傾斜度算出処理とに分けて以下説明する。
(A>特徴点TL、BR座標の検出処理この処理では、
第3図の座標検出手段30等により、次のような(1)
〜(5)の処理ステップで実行される。
(1) ステップ81〜S3 先ず、バタンレジスタ4の走査を開始し、そのバタンレ
ジスタ4より出力された画像データMを、文字傾斜検出
部8に入力する(ステップSl)。
この画像データMは、画素毎に座標検出手段30内の最
大値検出手段32及び最小値検出手段34に入力される
これと共に、X座標発生手段21及びY座標発生手段2
2は、画像データMの出力と同期させて、この画像デー
タMの各画素毎に対応付けたχ、Y座標を発生する。そ
の結果、これら発生手段21゜22により、画像データ
MにX、Y座標の付与が行われる。そして出力されたX
、Y座標は、座標検出手段30内のX+Y計算手段31
、最大値座標保存手段33、及び最小値座標保存手段3
うに入力される(ステップS2)。
X+Y計算手段31はX、Y座標を入力すると、これら
χ、Y座標から計算値X+Yを算出し、算出した計算値
を最大値検出手段32及び最小値検出手段34へ出力す
る(ステップS3)。ステップ82〜S3によって、最
大値検出手段32は画像データM及び計算値を、最小値
検出手段34は画像データM及び計算値を、最大値座標
保存手段33はX、Y座標を、最小値座標保存手段35
はX、Y座標を、それぞれ1画素毎に入力する。そして
、座標検出手段30は、t★述のステップS4、Sea
、S5b或いはS7の判断を1画素毎L−″繰り返し実
行し、その判断結果りこ応じた処理を行う。
(2〉 ステップS4 最大値検出手段32及び最小値検出手段34は、入力さ
れた画像データMの画像が所定の画素値(例えば、′1
°)であるか否かを判断する。
■ 所定の画素値を有さないとき 最大値検出手段32及び最小値検出手段34は、格納し
ている比較値を書換えず、これと共に最大値座標保存手
段33及び最小値座標保存手段33も、格納されている
X、Y座標を書換えない。検出手段32.34は、ステ
ップS4の次に、ステップS7の判断を行う。
■ 所定の画素値を有するとき 最大値検出手段32はステップS4の次に比較値及び計
算値の比較(ステップS”;a)を、最小値検出手段3
4はステップS4の次に比較値及び計算値の比較(ステ
ップ55b)を、それぞれ行つ。
(3) ステップS5a このステップでは、計算値が比較値より大きいか否かを
判断し、その判断結果に応じた次のような処理を実行す
る。
■ 計算値〉比較値のとき 最大値検出手段32は、先に格納されている比較値に代
えて、比較値よりも大きい計算値を新たな比較値として
格納しく比較値の書換え)、これと共にセットパルスを
最大値座標保存手段33へ出力する。セットパルスを入
力した最大値座標保存手段33は、格納されているX、
Y座標に代えて、比較値よりも大きな計算値を与える画
素のX、Y座標を新たに格納する(「X、Y座標の書換
え」ステップS6)。
■ 計算値≦比較値のとき 最大値検出手段32は、先に格納されている比較値を書
換えずにそのまま格納すると共に、最大値座標保存手段
33も、格納されているX、Y座標を書換えない。
最大値検出手段32は、前記■及び■のいずれの場合も
、ステップS5aの次に、ステップS7の判断を行う。
なお、最大値検出手段32に格納される比較値の初期値
としては、例えば計算値αとして取り得る値よりも小さ
な値を用いれば良い。例えば、α=β−1で、画像デー
タMをp行用列の画素に分割した(従って、○≦X≦m
−1、及び0≦Y≦j−1となる)場合には、−1を比
較値の初期値とすることができる。或は比較値の初期値
として、最大値検出手段32に一番最初に入力された計
算値αχ十βyを用いるようにしても良い。
また、最大値検出手段32は、比較値及びX、Y座標の
書換えを、計算値αχ十βyが比較値よりも大きいとき
、及び計算値が比較値と等しいときに行うようにし、こ
れと共に計算値が比較値よりも小さいとき、比較値及び
X、Y座標の書換えを行わないようにしても良い。さら
に、最大値座標保存手段33のX、Y座標としては、任
意好適な数値を用いて良い。
(4) ステップS5b 第6図(b)のステップS5bでは、計算値が比較値よ
り小さいか否かの判断を行い、その判断結果に基づき次
のような処理を実行する。
■ 計算値〈比較値のとき 最小値検出手段34は、先に格納されている比較値に代
えて、比較値よりも小さい計算値を比較値として新たに
格納する(比較値の書換え)と共に、最小値座標保存手
段35ヘセツトパルスを出力する。最小値座標保存手段
35は、セットパルスを入力すると、格納されているX
、Y座標を、比較値よりも小さな計算値を与える画素の
X、Y座標に書換える( rX、Y座標の書換えJステ
ップS6)。
■ 計算値≧比較値のとき 最小値検出手段34は、先に格納されている比較値を書
換えずにそのまま格納すると共に、最小値座標保存手段
35も、格納されているX、Y座標を書換えない。
最小値検出手段34は、前記■及び■のいずれの場合に
も、ステップSobの次に、ステップS7の判断を行う
なお、最小値検出手段34に格納される比較値の初期値
としては、例えば計算値αχ+βyとして取り得る値よ
りも大きな値を用いれば良い。例えば、α=β=1で、
画像データMを1行m列の画素に分割した(従って、0
≦X≦m−1、及び0≦Y≦J−1となる)場合には、
m+n−1を比較値の初期値とすることができる。或は
比較値の初期値として最小値検出手段34に一番最初に
入力された計算値αχ十βyを用いるようにしても良い
また、最小値検出手段34は、計算値が比較値よりも小
さいとき、及び計算値が比較値と等しいとき、比較値及
びχ、Y座標の書換えを行い、これと共に計算値が比較
値よりも大きいとき、比較値及びχ、Y座標の書換えを
行わないようにしても良い。さらに、最小値座標保存手
段35のX、Y座標としては、任意好適な数値を用いて
良い。
(5) ステップS7 ステップS7では、画像データMの走査を終了したか否
かを判断し、その判断結果に応じて次のような処理を実
行する。
■ 画像データMの走査を終了したとき最大値検出手段
32及び最小値検出手段34は、画像データMの走査が
終了し、データMの全画素につき処理が終了すると、X
、Y座標の出力信号を、最大値座標保存手段33及び最
小値座標保存手段35へ出力する。すると、座標保存手
段33゜35は、格納しているX、Y座標を特徴点座標
として出力する。こ九と共に検出手段32.34は、比
較値の初期化を行う(ステップS8)。
全画素につき処理を終了した時点で、最大値座標保存手
段33及び最小値座標保存手段35に格納されているX
、Y座標が、最大及び最小計算値を与える画素のx、y
座標、すなわち特徴点座標となる。
座標検出手段30では、α=β=1としたので、全処理
終了時点で、例えば第5図に示す被抽出パタンM2の特
徴点BRの座標が、最大値座標保存手段33に格納され
ており、また特徴点TLの座標が、最小値座標保存手段
35に格納されている。
■ 画像データMの走査が終了しないとき座標検出手段
30は、画像データMの走査が終了せず、従ってデータ
Mの全画素につき処理が終了していなければ、画像デー
タMの残りの画素につき、ステップ84.S5a、S5
b或はS7の判断を行い、その判断結果に応じた処理を
行う。
(B)特徴点BL、TR座標の検出処理この処理は、座
標検出手段40等で行われる処理である。即ち、座標検
出手段40は、上述した座標検出手段30の動作と並行
してその座標検出手段30とほぼ同様の処理を行う。
この座標検出手段40では、α=1及びβ=1としなの
で、全画素につき処理を終了した時点で、例えば、第5
図に示す被抽出パタンM2の特徴点TRの座標が、最大
値座標保存手段43に格納されており、また特徴点BL
の座標が、最小値座標保存手段45に格納されている。
(C)傾斜度算出処理 前記処理(A)、(B)で、特徴点TR,TL。
BR,BLの4点の座標(TRx、TRy)。
(TLx、TLy)、(BRx、BRy)、(BLx、
BLy)が検出されると、傾斜度算出手段50では、該
4点の座標より、入力文字パタンの傾斜角度に相当する
値(傾斜度)THを次式に従って計算する。
即ち、傾斜度算出手段50は、(3)式を用いて、4個
の特徴点を結んで得られる四辺形の右辺の上端と下端の
X座標値の差と、左辺の上端と下端のX座標値の差の平
均を1文字高さの平均で割った値を傾斜度TH(但し、
TH;実数)として出力し、周辺分布抽出部9及び特徴
マトリクス抽出部11へ与える。
(V)  周辺分布抽出処理 第7図(a>、(b)は周辺分布抽出方法の説明図であ
り、同図(a>は入力文字パタンの例(数字の’o’>
、同図(b)は該パタンから抽出された周辺分布である
周辺分布抽出部9は、文字傾斜検出部8で得られた傾斜
度TH(=実数)に従って、第7図(a)に示す文字パ
タンの走査経路を決定する。第7図(a>では、TH=
5/20である。垂直走査は、上辺から走査を開始し、
開始アドレス(Xa、YT)から開始するときの走査経
路の座標(xl。
y・)は次式(4)で表わすことができる。
xl=Xa y1=YT x ==Xa+T)lx (y、−YT)’5’i=’
li 1+1 ・・・・・・(4) 但し、THX (yi−YT)の結果 は、小数点以下を切捨てる。
座標値は全て整数である。
走査経路中の黒ビット数を計数し、Xaにおける周辺分
布の値とする。XaliXL≦Xa≦XRの範囲で変化
させる。即ち、走査開始点を(XL。
YT> 、(XL+1.YT)、・・・・・・、(XR
,YT)に設定し、各走査開始点について(4)式に従
う走査経路上の黒ビット数を計数し、周辺分布を抽出す
る。該抽出された周辺分布を5X(x)(但し、x=X
L、・・・・・・、XR)で表わす。
該な、水平方向に走査し、Y117方向の周辺分布5Y
(y)(但し、y=YT、・・・・・・、YB)を抽出
する。
本実施例では、水平方向の走査はX軸と平行な走査経路
で行う。即ち、パタンレジスタ4の座標(x、y)画素
における画素の値をP (x、y)としたとき、 で計算される。
(Vl)分割点検出処理 分割点検出部10では、周辺分布SX (x> 。
SX(、y)を用いて、外接枠内領域をNXxNY個の
部分領域に分割するためのX軸上及びY軸上の分割点座
標を、各外接枠毎に決定する。但し、NXはX軸方向に
おける分割数、及びNYはYN方向における分割数であ
る。
分割数NX及びNYは、文字の複雑さに応じて任意好適
な値に設定するのが好ましい。例えば、漢字・カタカナ
等の画数の少ない文字を認識対象とする場合は、(2X
2)〜(3X3)程度の少ない数の部分領域に、外接枠
内領域を分割する。
漢字が認識対象となる場合には、(4X4)〜(8X8
)程度の部分領域に、外接枠内領域を分割することが多
い。しかし、本実施例では、認識対象の複雑さにかかわ
らず、外接枠内領域を、例えば常に(4X4>個に分割
するようにした。
この分割点検出部10は、周辺分布抽出部9で作成した
周辺分布SX (x)、SY (y)の重心座標より、
分割点座標DX (m> 、DY (n)を求めるもの
である。これは、文字枠のX軸方向またはY軸方向の全
範囲、あるいはそれまでに求めた重心座標で分割された
範囲における1次モーメントの和を、その範囲の黒ビッ
ト和で除算することにより求まる。但し、m、nは座標
値の大きさの順に付した重心座標番号であり、m=1〜
NX−1(NX−1はX軸方向の重心の個数)、n=1
〜NY−1(NY−1はY軸方向の重心の個数)である
まず、文字枠のX軸方向の範囲χL〜XRを対象とし、
次式(5)に示すように、入力文字パターンの周辺分布
SX、(x>の1次モーメント和を、その範囲の黒ビッ
ト和で除算することにより、中央の重心座標番号の重心
座標DX(2>を求める。
但し、右辺の式は実数となるので、 小数点以下を切り上げDX (2)を整数にする。
次に、その重心座標DX(2>で分割された夫々の範囲
、XL〜DX (2>−1,DX (2)〜XRを対象
として2つの重心DX(1)、DX(3)を求める。
DX(1) ・・・・・・(6) DX(3) 以上のようにして重心座標DX(1)、DX(2>、D
X (3)を求め、当該座標をX軸上の分割点座標とし
て決定する。
Y軸方向の重心座標も同様に、Y軸上の周辺分布5Y(
y)より、文字枠の範囲YT〜YBを対象として重心座
標DY(4)を検出する。次に、YT〜Y (2>−1
,Y (2)〜YBそれぞれを対象として、周辺分布5
Y(y>の重心座標Y(1)、Y (3)を検出する。
以上のようにして、重心座標DY(1)、DY(2>、
DY (3)を求め、該座標をY軸上の分割点座標とし
て決定する。
このX軸上及びY軸上の分割点座標は、特徴マトリクス
11へ与えられる。
(VN)  特徴マトリクス抽出処理 文字枠検出部5が文字パタンの外接枠を規定する座標X
J 、Xr、Yt、Ybを検出し、さらに分割点検出部
10が文字パタンについて対象分割点座標を検出すると
、特徴マトリクス抽出部11では、垂直、水平、右斜め
、及び左斜めサブパタンの各パタンから特徴量を抽出し
、特徴マトリクスを作成する。
即ち、特徴マトリクス抽出部11は、一つの外接枠内領
域を、対象分割点座標と座標Xj、Xr。
Yt、YbとによってNXXNY個の部分領域に分割し
、各部分領域内のサブパタンの文字線1を表す特徴量を
抽出する。そして、一つの外接枠領域内の各サブパタン
から抽出しなNXXNYX4個の特徴量から成る特徴マ
トリクスを、当該外接枠内領域の特徴量マトリクスとし
て抽出する。
まず、水平サブパタン(H3P)からの特徴量抽出につ
き説明する。
特徴マトリクス抽出部11は、対象分割点座標と座標X
fl 、Xr、Yt、Ybとに基づき、外接枠内領域を
NXxNY個の部分領域に分割しく対象分割点座標及び
座標XJ 、Xr、Yt、Ybは分割点座標である)、
各部分領域毎に部分領域内の水平サブパタンH8Pの黒
ビット数BH(i。
j〉を計数する。
分割点座標から分割領域の決定は、次のように行う。X
軸上の分割点座標DX(n>は、文字パタンの外接枠上
辺の分割点を示している。この座標を起点として、次式
(8)で求められる座標系列の左側を分割境界Sとする
xl=DX(n> yl=YT x 、=DX (n>−THx (y = −YT)y
i=yi−1+1 ・・・・・・(8) この分割境界の例が、第7図(a>に示されている。
水平方向の分割境界Sは、DY (m”)より、水平方
向に設定する。
以上のように分割された分割領域毎に、水平サブパタン
H8Pの黒ビット数BH(i、、j)を計数する。この
BH(i、j>は、一つの外接枠内領域に関する第i行
第j列の部分領域の黒ビット数である。次に、(9)式
に従って第i行第j列の部分領域に関する特徴量FH(
i、j)を計算する。
但し、i=1.2.・・・・・・、NXj=1.2.・
・・・・・、NY WL;線幅 wph、文字幅(=Xr−Xjl +1 )さらに、H
8Pの場合と同様にして、第i行第j列の部分領域のV
SP、H3P、LSPの黒ビット数BV(i、j>、B
R(i、j>、BL(i、j>を計数し、次式(10)
〜(12)に従って第i行第j列の部分領域に関するv
sp。
H8P、LSPの特徴量FV(i、j>、FR(i、j
>、FL(i、j)を算出する。
但し、 WPv;文字高さ(=Yb−Yt−i1)WP r =
WPN = (WP v +WP h > / 2以上
のようにして、外接枠内領域の各部分領域毎にVSP、
H3P、H8P、LSPの特徴量を抽出し、これらNX
XNYX4個の特徴量から成る特徴マトリクスF (k
)(k=1.2.・・・・・・NXxNYx4)を得る
。特徴マトリクス抽出部11は、特徴マトリクスF (
k)を各外接枠領域毎に抽出し、その抽出結果を識別部
12へ送る。
(■) 識別処理 識別部12は、抽出された特徴マトリクスF(k)と、
内部に設けられた辞書メモリ内の特徴マトリクスG (
k)とを、照合することにより、該特徴マトリクスF 
(k>を得た外接枠内領域の文字図形の認識を行う。こ
の認識では、次式(13)に従って特徴マトリクスF 
(k>とG(、k)間の距ti[)を求め、距離りが最
小となる特徴マトリクスG (k)の標準文字の文字名
(例えば、JIS規格に定められた文字コード〉OUT
を認識結果として出力する。
以上のように、本実施例では、次のような利点を有して
いる。
(a)  本実施例では、バタンレジスタ4内の文字バ
タンを含むX−Y座標系で表現される平面において、文
字パタンの黒画素に関するαχ+βyの最大値及び最小
値を与える座標を文字傾斜検出部8で検出し、さらにそ
の座標に基づき文字パタンの傾斜角を検出する。そして
、該傾斜角に従って周辺分布抽出部9で周辺分布を抽出
し、その周辺分布を用いて分割点検出部10で分割点を
検出する。その後、特徴マトリクス抽出部11で、該傾
斜角及び周辺分布に基づき分割境界を設定し、特徴マト
リクスを抽出している。そのため、傾斜を有する文字パ
タンについても、抽出される特徴が安定となる。従って
、文字傾斜の変形に対応した辞書を識別部12内に用意
する必要がなく、辞書容量の減少により照合時間を短縮
でき、処理速度の高速化が図れると共に、ハード規模が
小さく、認識精度の良い文字認識方法を提供できる。
(b)  上記実施例では、第4図のような印刷文字に
おける斜体字の認識方法について説明したが、認識対象
文字は、これに限定されない。例えば、手書き文字の法
学で、右上がりに記入された文字を認識対象とする場合
は、文字の4個の特徴点を結んで得られる四辺形の上辺
、下辺が傾斜しているものとして、上記実施例とほぼ同
様の処理で認識することができる。
なお、本発明は、上記実施例に限定されず、例えば第3
図の文字傾斜検出部8を、他の機能ブロックで構成した
り、あるいはそれらの機能ブロックを、コンピュータを
用いたプログラム制御等で実行する構成にしてもよい。
さらに、その文字傾斜検出処理を、第6図(a>、(b
)以外の処理フローチャートで実行する等、種々の変形
が可能である。
(発明の効果) 以上詳細に説明したように、本発明によれば、文字パタ
ンを含むX−Y座標系で表現される平面において、αχ
士βyの最大値及び最小値を与える座標を求め、その座
標に基づき文字パタンの傾斜角を検出する。次に、周辺
分布を抽出し、その周辺分布を用いて分割点を検出する
。その後、該傾斜角及び周辺分布に基づき、文字外接枠
内の分割境界を設定し、その分割境界で分割された領域
毎に、特徴を抽出するようにしている。そのため、傾斜
を有する文字パタンについても、抽出される特徴が安定
となり、文字傾斜の変形に対応した辞書を用意する必要
がない。これにより、辞書容量の減少と、それによる照
合時間の短縮化によって処理速度の高速化が図れると共
に、小さなハード規模で、認識精度の良い文字認識方法
を実現できる。
【図面の簡単な説明】
第1図は本発明の実施例を示すもので、文字認識方法を
説明するための文字認識装置の機かとブロック図、第2
図(a)、(b)は従来の文字認識方法を説明するため
の図、第3図は第1図における文字傾斜検出部の機能ブ
ロック図、第4図は斜体字の例を示す図、第5図(a>
、(b)は傾斜度検出方法を説明するための特徴点の検
出例を示す図、第6図(a)、(b)は文字傾斜検出の
フローチャート、第7図(a)、(b)+は周辺分布抽
出方法を説明するための図である。 1・・・・・・光電変換部、2・・・・・・行バッファ
、3・・・・・・文字切出部、4・・・・・・バタンレ
ジスタ、5・・・・・・文字枠検出部、6・・・・・・
線幅測定部、7・・・・・・サブバタン抽出部、8・・
・・・・文字傾斜検出部、9−−−−0:周辺分布抽出
部、10・・・・・・分割点検出部、11・・・・・・
特徴マトリクス抽出部、12・・・・・・識別部、21
・・・・・・X座標発生手段、22・・・・・・Y座標
発生手段、30,40・・・・・・座標検出手段、50
・・・・・・傾斜度算出手段。 餅米の文字証、讃、方法 尭2図 第3図 ?体字の例 莞4図 傾Pr度検出方法 第5図 泰小惰史埋 (bン 文字イ頃↑(検出フローヲ+−ト 蝉6図 文字イ頃金I杢出フローヲ+−ト W)6図 周辺チ151由工方夕大 亮7図

Claims (1)

  1. 【特許請求の範囲】 媒体上の文字を光電変換して得られる文字パタンの外接
    枠を検出し、該外接枠内を複数の領域に分割し、該分割
    された分割領域毎に特徴を抽出した後、該抽出された特
    徴と予め用意した標準特徴との照合により、前記文字を
    認識する文字認識方法において、 前記文字パタンを含むX−Y座標系で定義される平面に
    おいて、少なくとも2組の特定の実数α、βについて前
    記文字パタンの黒画素に関するαx+βy(但し、x、
    yはX−Y座標系の座標値)の最大値及び最小値を与え
    る座標を求め、該座標に基づき前記文字パタンの傾斜角
    を検出し、前記傾斜角に基づき前記文字パタンを走査し
    て周辺分布を抽出し、前記周辺分布を使用して前記外接
    枠内の分割点を検出した後、 前記傾斜角及び分割点に基づき前記外接枠内の分割境界
    を設定し、該分割境界に基づき前記外接枠内を複数の領
    域に分割することを特徴とする文字認識方法。
JP2100829A 1990-04-17 1990-04-17 文字認識方法 Expired - Lifetime JP2749947B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2100829A JP2749947B2 (ja) 1990-04-17 1990-04-17 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2100829A JP2749947B2 (ja) 1990-04-17 1990-04-17 文字認識方法

Publications (2)

Publication Number Publication Date
JPH04588A true JPH04588A (ja) 1992-01-06
JP2749947B2 JP2749947B2 (ja) 1998-05-13

Family

ID=14284212

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2100829A Expired - Lifetime JP2749947B2 (ja) 1990-04-17 1990-04-17 文字認識方法

Country Status (1)

Country Link
JP (1) JP2749947B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS603078A (ja) * 1983-06-21 1985-01-09 Oki Electric Ind Co Ltd 文字認識方法
JPS63238686A (ja) * 1987-03-26 1988-10-04 Oki Electric Ind Co Ltd 特徴抽出方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS603078A (ja) * 1983-06-21 1985-01-09 Oki Electric Ind Co Ltd 文字認識方法
JPS63238686A (ja) * 1987-03-26 1988-10-04 Oki Electric Ind Co Ltd 特徴抽出方式

Also Published As

Publication number Publication date
JP2749947B2 (ja) 1998-05-13

Similar Documents

Publication Publication Date Title
US4408342A (en) Method for recognizing a machine encoded character
EP0689153A2 (en) Character recognition
JPH08508128A (ja) 分布マップを用いる画像の分類方法及び装置
ITRM930179A1 (it) Apparecchio e procedimento per il riconoscimento di caratteri manoscritti.
JPH04588A (ja) 文字認識方法
US6859556B2 (en) Word recognizing apparatus for dynamically generating feature amount of word and method thereof
JP2749946B2 (ja) 文字認識方法
JP2616994B2 (ja) 特徴抽出装置
JPH04590A (ja) 文字認識方法
JPH0147829B2 (ja)
JPH04589A (ja) 特徴抽出方法
JPH03126188A (ja) 文字認識装置
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JP2582611B2 (ja) マルチフオント辞書の作成法
JP2708604B2 (ja) 文字認識方法
JPH01152586A (ja) 文字図形認識方法
JPH02287894A (ja) 文字認識装置
CN115512385A (zh) 一种位图格式钢筋图纸数据提取方法和系统
JPH0656625B2 (ja) 特徴抽出方式
JPH04591A (ja) 特徴抽出方法
JP2881080B2 (ja) 特徴抽出方法
JP3127413B2 (ja) 文字認識装置
JPH0310389A (ja) 文字認識装置
JPH01152585A (ja) 特徴抽出方法
JPH0547871B2 (ja)