JPH06223225A - 文字認識方法 - Google Patents
文字認識方法Info
- Publication number
- JPH06223225A JPH06223225A JP5009184A JP918493A JPH06223225A JP H06223225 A JPH06223225 A JP H06223225A JP 5009184 A JP5009184 A JP 5009184A JP 918493 A JP918493 A JP 918493A JP H06223225 A JPH06223225 A JP H06223225A
- Authority
- JP
- Japan
- Prior art keywords
- line width
- pattern
- sub
- contour
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【目的】 方向別に正確な線幅を算出できるようにして
的確なサブパタンの抽出を可能とし、日本語の明朝体の
ような水平方向と垂直方向の文字線幅が著しく異なるよ
うな文字をも正確に認識できる文字認識方法を提供す
る。 【構成】 線幅算出部200において、2以上の方向別
に認識対象文字パタンの線幅を算出し、該線幅を用い
て、各方向のサブパタンの抽出を各方向別のサブパタン
抽出部(105、106、107、108)で行い、当
該サブパタンを用いて特徴マトリクス抽出部109で特
徴マトリクスを抽出し、該特徴マトリクスを用いて認識
を行っているため、縦方向と横方向の線素の線幅が著し
く異なるような文字パタンからも的確なサブパタンの抽
出が可能となり、従って正確に文字の認識が可能とな
る。
的確なサブパタンの抽出を可能とし、日本語の明朝体の
ような水平方向と垂直方向の文字線幅が著しく異なるよ
うな文字をも正確に認識できる文字認識方法を提供す
る。 【構成】 線幅算出部200において、2以上の方向別
に認識対象文字パタンの線幅を算出し、該線幅を用い
て、各方向のサブパタンの抽出を各方向別のサブパタン
抽出部(105、106、107、108)で行い、当
該サブパタンを用いて特徴マトリクス抽出部109で特
徴マトリクスを抽出し、該特徴マトリクスを用いて認識
を行っているため、縦方向と横方向の線素の線幅が著し
く異なるような文字パタンからも的確なサブパタンの抽
出が可能となり、従って正確に文字の認識が可能とな
る。
Description
【0001】
【産業上の利用分野】この発明は、精度良く文字を認識
できる文字認識方法に関するものである。
できる文字認識方法に関するものである。
【0002】
【従来の技術】従来、文字を高精度に認識できる文字認
識方法としては、特公昭60―38756に開示されて
いる文字認識方法があった。この方法によれば、入力文
字パタンから線幅を算出し、入力文字パタン及び前記線
幅より2以上の複数方向の線素を表す複数のサブパタン
を抽出し、前記サブパタンの文字枠内領域を複数の部分
領域に分割し、前記各部分領域における各方向に関する
文字線量を計数し特徴マトリクスを抽出し、抽出した特
徴マトリクスを予め用意した辞書マトリクスと照合して
分類を行うというものであった。
識方法としては、特公昭60―38756に開示されて
いる文字認識方法があった。この方法によれば、入力文
字パタンから線幅を算出し、入力文字パタン及び前記線
幅より2以上の複数方向の線素を表す複数のサブパタン
を抽出し、前記サブパタンの文字枠内領域を複数の部分
領域に分割し、前記各部分領域における各方向に関する
文字線量を計数し特徴マトリクスを抽出し、抽出した特
徴マトリクスを予め用意した辞書マトリクスと照合して
分類を行うというものであった。
【0003】また、前記線幅の計算、及びサブパタンの
抽出は特公昭60―38755に開示されており、線幅
の計算は、入力文字パタンを2×2の窓で走査したとき
に2×2の窓の全ての点が黒画素となる点の個数Qと、
入力文字パタンの全ての黒画素数Aとを計数し、式
(1)に示す近似式に基づいて線幅Wを算出することに
より行い、 W = A / (A−Q) (1) サブパタンの抽出は、水平、垂直、左斜め、右斜めの各
方向に入力文字パタンを走査し、黒画素の連続を検出
し、該黒画素の連続数Lが式(2)を満足するときに当
該黒画素の連続を当該方向のサブパタンとして抽出する
ことにより行うというものであった。 L > N × W (2) 但し、Nは定数で水平、垂直方向のサブパタンを抽出す
る場合は2、左斜め、右斜めのサブパタンを抽出する場
合は21/2である。
抽出は特公昭60―38755に開示されており、線幅
の計算は、入力文字パタンを2×2の窓で走査したとき
に2×2の窓の全ての点が黒画素となる点の個数Qと、
入力文字パタンの全ての黒画素数Aとを計数し、式
(1)に示す近似式に基づいて線幅Wを算出することに
より行い、 W = A / (A−Q) (1) サブパタンの抽出は、水平、垂直、左斜め、右斜めの各
方向に入力文字パタンを走査し、黒画素の連続を検出
し、該黒画素の連続数Lが式(2)を満足するときに当
該黒画素の連続を当該方向のサブパタンとして抽出する
ことにより行うというものであった。 L > N × W (2) 但し、Nは定数で水平、垂直方向のサブパタンを抽出す
る場合は2、左斜め、右斜めのサブパタンを抽出する場
合は21/2である。
【0004】
【発明が解決しようとする課題】しかし、前記従来の認
識方法では、線幅の算出において前記式(1)に示すよ
うな近似式を用いて算出する入力文字パタン全体の平均
の文字線幅を用いているために、文字線の幅が一様でな
い文字パタンの認識を行う場合には、前記線幅を用いた
サブパタンの抽出が的確に行えず、従って正確に文字を
認識できないという問題点があった。
識方法では、線幅の算出において前記式(1)に示すよ
うな近似式を用いて算出する入力文字パタン全体の平均
の文字線幅を用いているために、文字線の幅が一様でな
い文字パタンの認識を行う場合には、前記線幅を用いた
サブパタンの抽出が的確に行えず、従って正確に文字を
認識できないという問題点があった。
【0005】例えば図3に示すような、日本語文字の明
朝体の文字であるような、垂直方向と水平方向の文字線
の線幅が著しく異なるような文字において前記従来の方
法により線幅及びサブパタンを求めると、先ず2×2の
すべての窓が黒画素となる点の数Qは192であり、総
画素数は325であるから、式(1)よりW=2.4と
なり、これを式(2)に代入すると、水平、垂直サブパ
タンにおいては5画素以上、左斜め、右斜めサブパタン
においては4画素以上、各々黒画素が連続している場合
に当該黒画素の連続をサブパタンとして抽出することに
なり、従って、図4に示すような各々水平、垂直、左斜
め、右斜めのサブパタンが抽出される。
朝体の文字であるような、垂直方向と水平方向の文字線
の線幅が著しく異なるような文字において前記従来の方
法により線幅及びサブパタンを求めると、先ず2×2の
すべての窓が黒画素となる点の数Qは192であり、総
画素数は325であるから、式(1)よりW=2.4と
なり、これを式(2)に代入すると、水平、垂直サブパ
タンにおいては5画素以上、左斜め、右斜めサブパタン
においては4画素以上、各々黒画素が連続している場合
に当該黒画素の連続をサブパタンとして抽出することに
なり、従って、図4に示すような各々水平、垂直、左斜
め、右斜めのサブパタンが抽出される。
【0006】しかし、図4に示した各サブパタンにおい
て、Vサブパタンについては入力文字パタンの垂直スト
ロークを的確に抽出したものといえるが、Hサブパタン
は入力文字パタンそのものであり、L、Rの各サブパタ
ンはVサブパタンにほぼ等しいサブパタンとなってい
る。従ってH、L、Rの各サブパタンは各々水平、左斜
め、右斜めのストロークを抽出したものとは言い難く、
故にこれらのサブパタンを用いて前述した本サブパタン
抽出以降の認識処理を行ったとしても、正確な認識結果
を期待することはできないのである。
て、Vサブパタンについては入力文字パタンの垂直スト
ロークを的確に抽出したものといえるが、Hサブパタン
は入力文字パタンそのものであり、L、Rの各サブパタ
ンはVサブパタンにほぼ等しいサブパタンとなってい
る。従ってH、L、Rの各サブパタンは各々水平、左斜
め、右斜めのストロークを抽出したものとは言い難く、
故にこれらのサブパタンを用いて前述した本サブパタン
抽出以降の認識処理を行ったとしても、正確な認識結果
を期待することはできないのである。
【0007】この発明は、以上述べたような線幅が一様
でないような文字については、正確な文字線幅を算出す
ることができないために、的確なサブパタンの抽出が不
可能となり、従って正確な文字の認識ができないと言う
問題点を除去し、各方向別に正確な線幅を算出できるよ
うにし、従って的確なサブパタンの抽出を可能とし、よ
って例えば日本語の明朝体のような水平方向と垂直方向
の文字線幅が著しく異なるような文字をも正確に認識で
きる文字認識方法を提供することを目的とする。
でないような文字については、正確な文字線幅を算出す
ることができないために、的確なサブパタンの抽出が不
可能となり、従って正確な文字の認識ができないと言う
問題点を除去し、各方向別に正確な線幅を算出できるよ
うにし、従って的確なサブパタンの抽出を可能とし、よ
って例えば日本語の明朝体のような水平方向と垂直方向
の文字線幅が著しく異なるような文字をも正確に認識で
きる文字認識方法を提供することを目的とする。
【0008】
【課題を解決するための手段】この発明の文字認識方法
は、前記課題を解決するために、入力文字パタンから線
幅を算出し、前記線幅を用いて方向別の線素を抽出した
サブパタンを複数得、前記各サブパタンを複数の領域に
それぞれ分割し、前記領域ごとの特徴量を求め各サブパ
タンの特徴マトリクスを得、前記特徴マトリクスを標準
文字の特徴マトリクスと照合して文字を認識する文字認
識方法において、入力文字パタンの線素の方向別に各々
前記線幅の算出を行い方向別に複数の線幅を得ることと
し、前記方向別の線幅を用いて前記入力文字パタンの特
定方向のサブパタンを得ることを特徴とする。
は、前記課題を解決するために、入力文字パタンから線
幅を算出し、前記線幅を用いて方向別の線素を抽出した
サブパタンを複数得、前記各サブパタンを複数の領域に
それぞれ分割し、前記領域ごとの特徴量を求め各サブパ
タンの特徴マトリクスを得、前記特徴マトリクスを標準
文字の特徴マトリクスと照合して文字を認識する文字認
識方法において、入力文字パタンの線素の方向別に各々
前記線幅の算出を行い方向別に複数の線幅を得ることと
し、前記方向別の線幅を用いて前記入力文字パタンの特
定方向のサブパタンを得ることを特徴とする。
【0009】
【作用】このような文字認識方法によれば、入力文字パ
タンの線素の方向別に各々正確に線幅を算出することが
可能であり、該正確な各方向別の線幅を用いて入力文字
パタンより方向別のサブパタンを得るのであるから、日
本語文字における明朝体の文字や欧文文字におけるロー
マン系の文字等、一般的に使用頻度が高く、かつ線素の
方向に応じて線幅が異なるような文字パタンにおいて
も、入力文字パタンの方向別の線素を的確に抽出した正
確なサブパタンの抽出が可能となり、従って的確な特徴
マトリクスが得られ、故に正確に文字認識が行える。
タンの線素の方向別に各々正確に線幅を算出することが
可能であり、該正確な各方向別の線幅を用いて入力文字
パタンより方向別のサブパタンを得るのであるから、日
本語文字における明朝体の文字や欧文文字におけるロー
マン系の文字等、一般的に使用頻度が高く、かつ線素の
方向に応じて線幅が異なるような文字パタンにおいて
も、入力文字パタンの方向別の線素を的確に抽出した正
確なサブパタンの抽出が可能となり、従って的確な特徴
マトリクスが得られ、故に正確に文字認識が行える。
【0010】
【実施例】以下図1〜図7を参照してこの発明の文字認
識方法を適用した文字認識装置の実施例につき説明す
る。図1は本発明の文字認識方法の実施に好適な文字認
識装置の一実施例を示すブロック図である。文字認識装
置100は、画像入力部101、パタンレジスタ10
3、線幅算出部200、水平サブパタン抽出部105、
垂直サブパタン抽出部106、左斜めサブパタン抽出部
107、右斜めサブパタン抽出部108、特徴マトリク
ス抽出部109、識別部110及び出力端子111とを
具えてなる。
識方法を適用した文字認識装置の実施例につき説明す
る。図1は本発明の文字認識方法の実施に好適な文字認
識装置の一実施例を示すブロック図である。文字認識装
置100は、画像入力部101、パタンレジスタ10
3、線幅算出部200、水平サブパタン抽出部105、
垂直サブパタン抽出部106、左斜めサブパタン抽出部
107、右斜めサブパタン抽出部108、特徴マトリク
ス抽出部109、識別部110及び出力端子111とを
具えてなる。
【0011】図2は線幅算出部200の一実施例を示し
たブロック図であり、輪郭追跡部201、最長同方向輪
郭系列抽出部202、線幅検出部203及び線幅集計部
204を具えてなる。図3は入力文字パタンの例を示し
た図である。図4は従来の方法により抽出されたサブパ
タンの例を示す図である。図5は輪郭追跡部201の動
作を説明する図である。図6は線幅算出部200の動作
を説明する図である。図7は本実施例の方法により抽出
されたサブパタンの例を示す図である。以下、この実施
例の文字認識装置の動作を図1〜図7を用いて詳細に説
明する。
たブロック図であり、輪郭追跡部201、最長同方向輪
郭系列抽出部202、線幅検出部203及び線幅集計部
204を具えてなる。図3は入力文字パタンの例を示し
た図である。図4は従来の方法により抽出されたサブパ
タンの例を示す図である。図5は輪郭追跡部201の動
作を説明する図である。図6は線幅算出部200の動作
を説明する図である。図7は本実施例の方法により抽出
されたサブパタンの例を示す図である。以下、この実施
例の文字認識装置の動作を図1〜図7を用いて詳細に説
明する。
【0012】画像入力部101は、文字、図形、記号等
(以下、文字という)が記載された帳票からの光信号S
を光電変換し、例えば文字線部を黒画素、背景部を白画
素で表現した白黒2値に量子化された電気信号(以下、
帳票画像データという)を生成し、1文字づつの文字パ
タン(以下、入力文字パタンという)を切り出し、該切
り出された入力文字パタンをパタンレジスタ103に出
力する。尚前記文字パタンの切り出しは以下に述べるよ
うな方法により行う。まず帳票画像データを行方向に平
行な方向に走査して黒画素の分布を作成し、該黒画素の
分布より1行ずつの行データを抽出する。次に前記抽出
した行データを行方向に垂直な方向に走査して、各行に
ついて黒画素の分布を作成し、該黒画素の分布より1文
字づつの文字間隔を検出する。そして、前記作成された
各行の黒画素の分布、及び前記検出された文字間隔を用
いて1文字づつの文字領域を検出し、該領域の基づいて
1文字づつの文字パタンを切り出す。
(以下、文字という)が記載された帳票からの光信号S
を光電変換し、例えば文字線部を黒画素、背景部を白画
素で表現した白黒2値に量子化された電気信号(以下、
帳票画像データという)を生成し、1文字づつの文字パ
タン(以下、入力文字パタンという)を切り出し、該切
り出された入力文字パタンをパタンレジスタ103に出
力する。尚前記文字パタンの切り出しは以下に述べるよ
うな方法により行う。まず帳票画像データを行方向に平
行な方向に走査して黒画素の分布を作成し、該黒画素の
分布より1行ずつの行データを抽出する。次に前記抽出
した行データを行方向に垂直な方向に走査して、各行に
ついて黒画素の分布を作成し、該黒画素の分布より1文
字づつの文字間隔を検出する。そして、前記作成された
各行の黒画素の分布、及び前記検出された文字間隔を用
いて1文字づつの文字領域を検出し、該領域の基づいて
1文字づつの文字パタンを切り出す。
【0013】パタンレジスタ103は、画像入力部10
1より入力された1文字づつの入力文字パタンを順次記
憶しておく記憶部であり、本実施例では128×128
画素の記憶容量を持つものである。本パタンレジスタ1
03内に記憶された1文字づつの入力文字パタンは、線
幅算出部200、水平サブパタン抽出部105、垂直サ
ブパタン抽出部106、左斜めサブパタン抽出部10
7、及び右斜めサブパタン抽出部108より自由に参照
することができるものである。
1より入力された1文字づつの入力文字パタンを順次記
憶しておく記憶部であり、本実施例では128×128
画素の記憶容量を持つものである。本パタンレジスタ1
03内に記憶された1文字づつの入力文字パタンは、線
幅算出部200、水平サブパタン抽出部105、垂直サ
ブパタン抽出部106、左斜めサブパタン抽出部10
7、及び右斜めサブパタン抽出部108より自由に参照
することができるものである。
【0014】次に、線幅算出部200の動作について、
図2を用いて詳細に説明をする。まず、線幅算出部20
0内の輪郭追跡部201においては、入力文字パタンの
輪郭を追跡し、輪郭画素の座標値、及び図5(A)の番
号で表現されるような次輪郭画素への方向番号を抽出
し、該座標値及び方向番号を輪郭座標系列として最長同
方向輪郭系列抽出部202に出力する。尚、前記入力文
字パタンの輪郭の追跡は以下のような方法により行う。 (1) パタンレジスタを左上画素よりY方向(以後列
方向という場合もある)に走査を行いつつ、X方向(以
後行方向という場合もある)に順次走査し黒画素を検出
し、検出した黒画素をスタートの黒画素かつ第1の輪郭
画素とする。 (2) 第1の黒画素を中心とした図5(A)に示すよ
うな8方向の隣接画素に、1から8の順に順次着目し黒
である隣接画素を検出し、当該画素を第2の輪郭画素と
する。 (3) 今度は第2の輪郭画素を中心とし前記(2)と
同様に8方向の隣接画素より黒画素を検出する処理を行
い第3の輪郭画素とする。 (4) 以降同様に輪郭画素の検出処理を、検出した輪
郭画素がスタートの輪郭画素と同一の画素となるまで繰
り返し行う。 (5) 検出した画素がスタートの輪郭画素と同一とな
り、前記処理が終了したら、抽出された輪郭の外部の画
素に対して再び走査を行い、スタートの黒画素を検出
し、前記(2)以下の処理を同様に行う。 (6) パタンレジスタ全領域について上記処理を行っ
たら終了する。
図2を用いて詳細に説明をする。まず、線幅算出部20
0内の輪郭追跡部201においては、入力文字パタンの
輪郭を追跡し、輪郭画素の座標値、及び図5(A)の番
号で表現されるような次輪郭画素への方向番号を抽出
し、該座標値及び方向番号を輪郭座標系列として最長同
方向輪郭系列抽出部202に出力する。尚、前記入力文
字パタンの輪郭の追跡は以下のような方法により行う。 (1) パタンレジスタを左上画素よりY方向(以後列
方向という場合もある)に走査を行いつつ、X方向(以
後行方向という場合もある)に順次走査し黒画素を検出
し、検出した黒画素をスタートの黒画素かつ第1の輪郭
画素とする。 (2) 第1の黒画素を中心とした図5(A)に示すよ
うな8方向の隣接画素に、1から8の順に順次着目し黒
である隣接画素を検出し、当該画素を第2の輪郭画素と
する。 (3) 今度は第2の輪郭画素を中心とし前記(2)と
同様に8方向の隣接画素より黒画素を検出する処理を行
い第3の輪郭画素とする。 (4) 以降同様に輪郭画素の検出処理を、検出した輪
郭画素がスタートの輪郭画素と同一の画素となるまで繰
り返し行う。 (5) 検出した画素がスタートの輪郭画素と同一とな
り、前記処理が終了したら、抽出された輪郭の外部の画
素に対して再び走査を行い、スタートの黒画素を検出
し、前記(2)以下の処理を同様に行う。 (6) パタンレジスタ全領域について上記処理を行っ
たら終了する。
【0015】上述のような方法によれば、例えば図5
(B)に示すような、図3に示した入力文字パタンの左
上の部分では501に示した黒画素がスタートの黒画素
となり、以降図5(A)の1の方向に画素を検定した段
階で各々黒画素と判定され、502、503なる輪郭座
標が、順次検出される。また図5(C)に示すような前
記入力文字パタンの左下部分のような場合では、輪郭座
標504を基準として1の方向の505、2の方向の5
06が各々検定されるが、各々白画素であるので3の方
向の507の画素が輪郭座標として検出され、以降同様
に508、509なる輪郭座標が検出される。その結果
最終的に、図3に示したような入力文字パタンに対して
は図6の602に示すような輪郭が抽出される。
(B)に示すような、図3に示した入力文字パタンの左
上の部分では501に示した黒画素がスタートの黒画素
となり、以降図5(A)の1の方向に画素を検定した段
階で各々黒画素と判定され、502、503なる輪郭座
標が、順次検出される。また図5(C)に示すような前
記入力文字パタンの左下部分のような場合では、輪郭座
標504を基準として1の方向の505、2の方向の5
06が各々検定されるが、各々白画素であるので3の方
向の507の画素が輪郭座標として検出され、以降同様
に508、509なる輪郭座標が検出される。その結果
最終的に、図3に示したような入力文字パタンに対して
は図6の602に示すような輪郭が抽出される。
【0016】次に線幅算出部200内の最長同方向輪郭
系列抽出部202においては、輪郭追跡部201より入
力された輪郭座標系列の次輪郭画素への方向番号より、
予め定めた2以上の特定の方向への輪郭画素の連続を検
出し、当該方向におけるもっとも長く連続している部分
を検出し、該輪郭画素の座標を当該各方向別に線幅検出
部203に出力するものである。本実施例においては、
縦方向(1、5の方向)、横方向(3、7の方向)、左
斜め方向(2、6の方向)及び右斜め方向(4、8の方
向)における輪郭座標系列の連続を検出するものとし、
またある方向における輪郭画素の連続の最長部分が2カ
所以上あった場合には、最初に検出された輪郭部分を出
力するものとする。前記検出条件において例えば図6の
602に示したような輪郭座標系列においては、縦方向
においては603の画素より604の画素にいたる輪郭
系列が縦方向の最長輪郭系列として検出され、横方向に
おいては605より606の画素にいたる輪郭系列が横
方向の最長輪郭系列として検出され、左斜め方向におい
ては606から607の画素にいたる輪郭系列が左斜め
方向の最長輪郭系列として検出され、さらに右斜め方向
においては608から605の画素にいたる輪郭系列が
右斜め方向の最長輪郭系列として検出され、各々線幅検
出部203に出力される。
系列抽出部202においては、輪郭追跡部201より入
力された輪郭座標系列の次輪郭画素への方向番号より、
予め定めた2以上の特定の方向への輪郭画素の連続を検
出し、当該方向におけるもっとも長く連続している部分
を検出し、該輪郭画素の座標を当該各方向別に線幅検出
部203に出力するものである。本実施例においては、
縦方向(1、5の方向)、横方向(3、7の方向)、左
斜め方向(2、6の方向)及び右斜め方向(4、8の方
向)における輪郭座標系列の連続を検出するものとし、
またある方向における輪郭画素の連続の最長部分が2カ
所以上あった場合には、最初に検出された輪郭部分を出
力するものとする。前記検出条件において例えば図6の
602に示したような輪郭座標系列においては、縦方向
においては603の画素より604の画素にいたる輪郭
系列が縦方向の最長輪郭系列として検出され、横方向に
おいては605より606の画素にいたる輪郭系列が横
方向の最長輪郭系列として検出され、左斜め方向におい
ては606から607の画素にいたる輪郭系列が左斜め
方向の最長輪郭系列として検出され、さらに右斜め方向
においては608から605の画素にいたる輪郭系列が
右斜め方向の最長輪郭系列として検出され、各々線幅検
出部203に出力される。
【0017】次に線幅算出部200内の線幅検出部20
3においては、最長同方向輪郭系列抽出部202より入
力された各方向の輪郭系列の各画素より、当該輪郭系列
の方向より垂直な方向に入力文字パタンを走査し、黒画
素の連続を計数し該連続個数を当該方向の当該画素部分
における局所的な線幅として線幅集計部204に出力す
る。図6に示した各方向の最長輪郭系列について前記処
理を具体的に説明すると、まず縦方向においては603
の画素より604の画素まで順次各画素を基準として6
09に示す方向に入力文字パタンを走査し黒画素の連続
を計数する。その結果613、614、615の各画素
を基準とした場合に計数値は35であり、そのほかの画
素を基準とした場合には計数値は5となり、これらの計
数結果が各画素における局所線幅として線幅集計部20
4に出力される。横方向においては605の画素より6
06の画素まで順次各画素を基準として610に示す方
向に入力文字パタンを走査し黒画素の連続を計数する。
この場合、全画素において計数結果は1であり、該結果
が局所線幅として線幅集計部204に出力される。又左
斜め方向においては、606及び607の画素を基準と
して611の方向に入力文字パタンを走査し、各々6及
び5の計数結果を得、縦方向、横方向と同様に局所線幅
として線幅集計部204に出力される。さらに右斜め方
向においては、608及び605の画素を基準として6
12の方向に入力文字パタンを走査し、各々5及び6の
計数結果を得、局所線幅として線幅集計部204に出力
される。
3においては、最長同方向輪郭系列抽出部202より入
力された各方向の輪郭系列の各画素より、当該輪郭系列
の方向より垂直な方向に入力文字パタンを走査し、黒画
素の連続を計数し該連続個数を当該方向の当該画素部分
における局所的な線幅として線幅集計部204に出力す
る。図6に示した各方向の最長輪郭系列について前記処
理を具体的に説明すると、まず縦方向においては603
の画素より604の画素まで順次各画素を基準として6
09に示す方向に入力文字パタンを走査し黒画素の連続
を計数する。その結果613、614、615の各画素
を基準とした場合に計数値は35であり、そのほかの画
素を基準とした場合には計数値は5となり、これらの計
数結果が各画素における局所線幅として線幅集計部20
4に出力される。横方向においては605の画素より6
06の画素まで順次各画素を基準として610に示す方
向に入力文字パタンを走査し黒画素の連続を計数する。
この場合、全画素において計数結果は1であり、該結果
が局所線幅として線幅集計部204に出力される。又左
斜め方向においては、606及び607の画素を基準と
して611の方向に入力文字パタンを走査し、各々6及
び5の計数結果を得、縦方向、横方向と同様に局所線幅
として線幅集計部204に出力される。さらに右斜め方
向においては、608及び605の画素を基準として6
12の方向に入力文字パタンを走査し、各々5及び6の
計数結果を得、局所線幅として線幅集計部204に出力
される。
【0018】そして線幅算出部200内の線幅集計部2
04においては、入力された各方向別の各画素を基準と
した局所線幅値より、式(3)の条件を満足している局
所線幅値を選択し、該選択された局所線幅値を用いて式
(4)により各方向別の線幅を算出し、該算出された各
方向の線幅を、後述するサブパタン抽出処理時に当該線
幅を用いる各サブパタン抽出部、即ち垂直方向線素の線
幅は水平サブパタン抽出部105に、水平方向線素の線
幅は垂直サブパタン抽出部106に、左斜め方向線素の
線幅は右斜めサブパタン抽出部108に、さらに右斜め
方向線素の線幅値は左斜めサブパタン抽出部107に、
各々出力される。
04においては、入力された各方向別の各画素を基準と
した局所線幅値より、式(3)の条件を満足している局
所線幅値を選択し、該選択された局所線幅値を用いて式
(4)により各方向別の線幅を算出し、該算出された各
方向の線幅を、後述するサブパタン抽出処理時に当該線
幅を用いる各サブパタン抽出部、即ち垂直方向線素の線
幅は水平サブパタン抽出部105に、水平方向線素の線
幅は垂直サブパタン抽出部106に、左斜め方向線素の
線幅は右斜めサブパタン抽出部108に、さらに右斜め
方向線素の線幅値は左斜めサブパタン抽出部107に、
各々出力される。
【0019】 wh < X / 2 wv < Y / 2 wl < (X2+Y2)1/2/2 (3) wr < (X2+Y2)1/2/2 但し、Xは入力文字パタン外接枠の幅、Yは入力文字パ
タン外接枠の高さ、wh,wv,wl,wrは各々横方向、
縦方向、左斜め方向、右斜め方向の局所線幅値である。
タン外接枠の高さ、wh,wv,wl,wrは各々横方向、
縦方向、左斜め方向、右斜め方向の局所線幅値である。
【0020】 WH = Σwh'/n(wh') WV = Σwv'/n(wv') WL = Σwl'/n(wl') (4) WR = Σwr'/n(wr') 但し、WH、WV、WL、WRは各々横方向、縦方向、左斜
め方向、右斜め方向の線幅、wh'、wv'、wl'、wr'は
各々横方向、縦方向、左斜め方向、右斜め方向の局所線
幅の内、(3)式を満足する局所線幅、n(・)は当該
要素の個数である。
め方向、右斜め方向の線幅、wh'、wv'、wl'、wr'は
各々横方向、縦方向、左斜め方向、右斜め方向の局所線
幅の内、(3)式を満足する局所線幅、n(・)は当該
要素の個数である。
【0021】図6に示した例においては、文字外接枠の
大きさはX=35、Y=25であり、従って線幅検出部
203において検出した各方向の局所線幅値のうち、縦
方向の線素の局所線幅の中の613、614、615の
画素を基準とした線幅が前記式(3)を満足しないため
式(4)による線幅の算出より除外され、その他の局所
線幅は全て式(4)で用いられ各方向別の線幅が算出さ
れる。その結果夫々の方向別の線幅は、WH=1.0、
WV=5.0、WL=5.5、WR=5.5となる。
大きさはX=35、Y=25であり、従って線幅検出部
203において検出した各方向の局所線幅値のうち、縦
方向の線素の局所線幅の中の613、614、615の
画素を基準とした線幅が前記式(3)を満足しないため
式(4)による線幅の算出より除外され、その他の局所
線幅は全て式(4)で用いられ各方向別の線幅が算出さ
れる。その結果夫々の方向別の線幅は、WH=1.0、
WV=5.0、WL=5.5、WR=5.5となる。
【0022】水平サブパタン抽出部105においては、
入力文字パタンを水平方向に走査し黒画素の連続を検出
し、黒画素の連続数Lが式(5)を満足するときに当該
黒画素の連続を水平方向のサブパタンとして抽出し、抽
出した水平サブパタンを特徴マトリクス抽出部109に
出力する。 L > 2 × WV (5) 但し、WVは線幅算出部200より入力された垂直方向
線素の線幅値である。
入力文字パタンを水平方向に走査し黒画素の連続を検出
し、黒画素の連続数Lが式(5)を満足するときに当該
黒画素の連続を水平方向のサブパタンとして抽出し、抽
出した水平サブパタンを特徴マトリクス抽出部109に
出力する。 L > 2 × WV (5) 但し、WVは線幅算出部200より入力された垂直方向
線素の線幅値である。
【0023】垂直サブパタン抽出部106においては、
入力文字パタンを垂直方向に走査し黒画素の連続を検出
し、黒画素の連続数Lが式(6)を満足するときに当該
黒画素の連続を垂直方向のサブパタンとして抽出し、抽
出した垂直サブパタンを特徴マトリクス抽出部109に
出力する。 L > 2 × WH (6) 但し、WHは線幅算出部200より入力された水平方向
線素の線幅値である。
入力文字パタンを垂直方向に走査し黒画素の連続を検出
し、黒画素の連続数Lが式(6)を満足するときに当該
黒画素の連続を垂直方向のサブパタンとして抽出し、抽
出した垂直サブパタンを特徴マトリクス抽出部109に
出力する。 L > 2 × WH (6) 但し、WHは線幅算出部200より入力された水平方向
線素の線幅値である。
【0024】左斜めサブパタン抽出部107において
は、入力文字パタンを左斜め方向に走査し黒画素の連続
を検出し、黒画素の連続数Lが式(7)を満足するとき
に当該黒画素の連続を左斜め方向のサブパタンとして抽
出し、抽出した左斜めサブパタンを特徴マトリクス抽出
部109に出力する。 L > 21/2 × WR (7) 但し、WRは線幅算出部200より入力された右斜め方
向線素の線幅値である。
は、入力文字パタンを左斜め方向に走査し黒画素の連続
を検出し、黒画素の連続数Lが式(7)を満足するとき
に当該黒画素の連続を左斜め方向のサブパタンとして抽
出し、抽出した左斜めサブパタンを特徴マトリクス抽出
部109に出力する。 L > 21/2 × WR (7) 但し、WRは線幅算出部200より入力された右斜め方
向線素の線幅値である。
【0025】右斜めサブパタン抽出部108において
は、入力文字パタンを右斜め方向に走査し黒画素の連続
を検出し、黒画素の連続数Lが式(8)を満足するとき
に当該黒画素の連続を右斜め方向のサブパタンとして抽
出し、抽出した右斜めサブパタンを特徴マトリクス抽出
部109に出力する。 L > 21/2 × WL (8) 但し、WLは線幅算出部200より入力された左斜め方
向線素の線幅値である。
は、入力文字パタンを右斜め方向に走査し黒画素の連続
を検出し、黒画素の連続数Lが式(8)を満足するとき
に当該黒画素の連続を右斜め方向のサブパタンとして抽
出し、抽出した右斜めサブパタンを特徴マトリクス抽出
部109に出力する。 L > 21/2 × WL (8) 但し、WLは線幅算出部200より入力された左斜め方
向線素の線幅値である。
【0026】特徴マトリクス抽出部109においては、
水平サブパタン抽出部105、垂直サブパタン抽出部1
06、左斜めサブパタン抽出部107、右斜めサブパタ
ン抽出部108より入力された各々水平、垂直、左斜
め、右斜めのサブパタンを、まず小領域に分割し各サブ
パタンの各領域の黒画素数を計数し、前記黒画素計結果
及び線幅算出部200より入力された水平、垂直、左斜
め、右斜めの線幅を用いて、式(9)に基づいて水平、
垂直、左斜め及び右斜めの特徴マトリクスを抽出し、該
抽出した特徴マトリクスを識別部110に出力するもの
である。 KH(m,n)=BH(m,n)/WH KV(m,n)=BV(m,n)/WV KL(m,n)=BL(m,n)/WL (9) KR(m,n)=BR(m,n)/WR 但し、KH、KV,KL、KRは各々水平、垂直、左斜め、
右斜めの特徴マトリクス、BH、BV,BL、BRは各々水
平、垂直、左斜め、右斜めの黒画素マトリクス、(m,
n)は各マトリクスの要素番号、WH、WV,WL、WRは
各々水平、垂直、左斜め、右斜めの線幅である。また、
本実施例においては、前記各サブパタンの小領域への分
割は入力文字パタン外接枠を水平、垂直方向に5等分し
て作成される5×5の25の小領域に分割をするものと
する。
水平サブパタン抽出部105、垂直サブパタン抽出部1
06、左斜めサブパタン抽出部107、右斜めサブパタ
ン抽出部108より入力された各々水平、垂直、左斜
め、右斜めのサブパタンを、まず小領域に分割し各サブ
パタンの各領域の黒画素数を計数し、前記黒画素計結果
及び線幅算出部200より入力された水平、垂直、左斜
め、右斜めの線幅を用いて、式(9)に基づいて水平、
垂直、左斜め及び右斜めの特徴マトリクスを抽出し、該
抽出した特徴マトリクスを識別部110に出力するもの
である。 KH(m,n)=BH(m,n)/WH KV(m,n)=BV(m,n)/WV KL(m,n)=BL(m,n)/WL (9) KR(m,n)=BR(m,n)/WR 但し、KH、KV,KL、KRは各々水平、垂直、左斜め、
右斜めの特徴マトリクス、BH、BV,BL、BRは各々水
平、垂直、左斜め、右斜めの黒画素マトリクス、(m,
n)は各マトリクスの要素番号、WH、WV,WL、WRは
各々水平、垂直、左斜め、右斜めの線幅である。また、
本実施例においては、前記各サブパタンの小領域への分
割は入力文字パタン外接枠を水平、垂直方向に5等分し
て作成される5×5の25の小領域に分割をするものと
する。
【0027】識別部110においては、特徴抽出部10
9より入力された特徴マトリクスと、予め識別部110
内に具える辞書内の標準文字の特徴マトリクスとを式
(10)に基づいて照合し、式(10)の距離値Dが最
も小さくなる標準文字の文字コードを、当該入力文字パ
タンの認識結果として出力端子111より出力するもの
である。 D = ((Σ(gi − ki)2))1/2 (10) 但し、giは標準文字の特徴マトリクスの要素、kiは入
力文字パタンの特徴マトリクスの要素である。
9より入力された特徴マトリクスと、予め識別部110
内に具える辞書内の標準文字の特徴マトリクスとを式
(10)に基づいて照合し、式(10)の距離値Dが最
も小さくなる標準文字の文字コードを、当該入力文字パ
タンの認識結果として出力端子111より出力するもの
である。 D = ((Σ(gi − ki)2))1/2 (10) 但し、giは標準文字の特徴マトリクスの要素、kiは入
力文字パタンの特徴マトリクスの要素である。
【0028】出力端子111は、認識結果を外部に出力
するためのデータ出力端子であり、そのほかのシステム
や、認識結果を記録する媒体、通信網、そのほかの情報
処理システム等を接続するものである。
するためのデータ出力端子であり、そのほかのシステム
や、認識結果を記録する媒体、通信網、そのほかの情報
処理システム等を接続するものである。
【0029】尚、本発明は上述した実施例にのみ限定さ
れるものではない。例えば、本実施例においては線幅算
出部200内において、輪郭追跡部201及び最長同方
向輪郭系列抽出部202により入力文字パタンの輪郭を
完全に抽出した後、特定方向において最も長く連続して
いる輪郭部分を検出し、該輪郭部分を用いて線幅を算出
したが、これに限られるものではなく、例えば輪郭追跡
を行いつつ輪郭の方向の連続画素数を検定し、該連続画
素数が予め定めた値以上に連続している輪郭部分を検出
した場合には直ちに当該輪郭部分を線幅算出のための輪
郭部分として用い、さらに各方向の全てにおいて前記の
ような連続輪郭部分が検出された場合には、その時点で
輪郭追跡の処理を終了する、等のようにしても何等差し
支えない。
れるものではない。例えば、本実施例においては線幅算
出部200内において、輪郭追跡部201及び最長同方
向輪郭系列抽出部202により入力文字パタンの輪郭を
完全に抽出した後、特定方向において最も長く連続して
いる輪郭部分を検出し、該輪郭部分を用いて線幅を算出
したが、これに限られるものではなく、例えば輪郭追跡
を行いつつ輪郭の方向の連続画素数を検定し、該連続画
素数が予め定めた値以上に連続している輪郭部分を検出
した場合には直ちに当該輪郭部分を線幅算出のための輪
郭部分として用い、さらに各方向の全てにおいて前記の
ような連続輪郭部分が検出された場合には、その時点で
輪郭追跡の処理を終了する、等のようにしても何等差し
支えない。
【0030】また、線幅算出部200内の線幅集計部2
04においては、入力された各方向の局所線幅を式
(3)を用いて各方向の文字枠の大きさの1/2よりも
大きいものは集計から除外するという選択を行ったが、
この選択基準は式(3)に示した場合に限られるもので
はなく、例えば日本語文字におけるゴシック体のような
文字線がある幅以上の線幅を必ず有する文字を認識対象
とする場合には局所線幅の下限値を設けることも可能で
あるし、認識対象となる文字パタンの種類が予めさらに
限定できる場合にはさらに厳密に線幅の値を選択する基
準を設けることができ、そのような選択基準としてもな
んら差し支えない。
04においては、入力された各方向の局所線幅を式
(3)を用いて各方向の文字枠の大きさの1/2よりも
大きいものは集計から除外するという選択を行ったが、
この選択基準は式(3)に示した場合に限られるもので
はなく、例えば日本語文字におけるゴシック体のような
文字線がある幅以上の線幅を必ず有する文字を認識対象
とする場合には局所線幅の下限値を設けることも可能で
あるし、認識対象となる文字パタンの種類が予めさらに
限定できる場合にはさらに厳密に線幅の値を選択する基
準を設けることができ、そのような選択基準としてもな
んら差し支えない。
【0031】また、線幅算出部200内の線幅集計部2
04においては、選択された各方向の局所線幅の平均を
式(4)に基づいて算出し、該算出結果を線幅としてい
るがこれに限られるわけではなく、例えば最大の局所線
幅と最小の局所線幅の中間値を用いる方法、そのほか局
所線幅のばらつきを考慮した統計的手法により線幅を算
出する方法、等種々の方法を用いることが可能であり、
認識対象文字の種類、品質等に応じて経験的に適宜適切
な方法を用いて何等差し支えない。
04においては、選択された各方向の局所線幅の平均を
式(4)に基づいて算出し、該算出結果を線幅としてい
るがこれに限られるわけではなく、例えば最大の局所線
幅と最小の局所線幅の中間値を用いる方法、そのほか局
所線幅のばらつきを考慮した統計的手法により線幅を算
出する方法、等種々の方法を用いることが可能であり、
認識対象文字の種類、品質等に応じて経験的に適宜適切
な方法を用いて何等差し支えない。
【0032】そのほか、画像入力方法、パタンレジスタ
の構成、特徴マトリクスの抽出方法、識別方法、等も本
発明の範囲内で適宜変更してもよく、さらに各構成部分
の動作、処理の仕方、入出力信号の流れ、配設個数、位
置、形状及び個数そのほかの条件を任意好適に変更でき
る。
の構成、特徴マトリクスの抽出方法、識別方法、等も本
発明の範囲内で適宜変更してもよく、さらに各構成部分
の動作、処理の仕方、入出力信号の流れ、配設個数、位
置、形状及び個数そのほかの条件を任意好適に変更でき
る。
【0033】
【発明の効果】以上詳細に説明したように、この発明の
文字認識方法によれば、2以上の方向別に当該認識対象
文字パタンの線幅を算出し、該線幅を用いて、各方向の
サブパタンの抽出を行い、当該サブパタンを用いて特徴
マトリクスを抽出し、該特徴マトリクスを用いて認識を
行っているため、一般的に頻出する日本語文字における
明朝体文字、欧文文字におけるローマン系文字のよう
な、縦方向と横方向の線素の線幅が著しく異なるような
文字パタンからも各方向の線素を的確に抽出した的確な
サブパタンの抽出が可能となり、従って正確に文字の認
識が可能となり、ひいては修正作業も少なくなり、文書
入力時間も短縮できるような高精度で、高性能な文字認
識装置の実現が可能となる。
文字認識方法によれば、2以上の方向別に当該認識対象
文字パタンの線幅を算出し、該線幅を用いて、各方向の
サブパタンの抽出を行い、当該サブパタンを用いて特徴
マトリクスを抽出し、該特徴マトリクスを用いて認識を
行っているため、一般的に頻出する日本語文字における
明朝体文字、欧文文字におけるローマン系文字のよう
な、縦方向と横方向の線素の線幅が著しく異なるような
文字パタンからも各方向の線素を的確に抽出した的確な
サブパタンの抽出が可能となり、従って正確に文字の認
識が可能となり、ひいては修正作業も少なくなり、文書
入力時間も短縮できるような高精度で、高性能な文字認
識装置の実現が可能となる。
【図1】本発明の文字認識方法の実施に好適な文字認識
装置の一実施例を示すブロック図である。
装置の一実施例を示すブロック図である。
【図2】線幅算出部200の一実施例を示すブロック図
である。
である。
【図3】入力文字パタンの例を示す図である。
【図4】従来の方法により抽出されたサブパタンの例を
示す図である。
示す図である。
【図5】輪郭追跡部201の動作を説明する図である。
【図6】線幅算出部200の動作を説明する図である。
【図7】本実施例の文字認識方法により抽出されたサブ
パタンの例を示す図である。
パタンの例を示す図である。
100 文字認識装置 101 画像入力部 103 パタンレジスタ 105 水平サブパタン抽出部 106 垂直サブパタン抽出部 107 左斜めサブパタン抽出部 108 右斜めサブパタン抽出部 109 特徴マトリクス抽出部 110 識別部 111 出力端子 200 線幅算出部 201 輪郭追跡部 202 最長同方向輪郭系列抽出部 203 線幅検出部 204 線幅集計部
Claims (2)
- 【請求項1】 入力文字パタンから線幅を算出し、前記
線幅を用いて入力文字パタンの特定方向の線素を抽出し
たサブパタンを複数方向について得、前記複数のサブパ
タンより特徴マトリクスを得、前記特徴マトリクスを標
準文字の特徴マトリクスと照合して文字を認識する文字
認識方法において、 入力文字パタンの線素の方向別に前記線幅の算出を行
い、 前記方向別の線幅を用いて前記入力文字パタンの特定方
向のサブパタンを得ることを特徴とする文字認識方法。 - 【請求項2】 請求項1項記載の文字認識方法におい
て、 前記入力文字パタンの線素の方向別の線幅の算出は、 入力文字パタンの輪郭抽出を行い、 前記輪郭中より前記特定方向に連続している輪郭部分の
うち、前記特定方向への輪郭点の連続長が最長となる最
長同方向輪郭系列を抽出し、 前記抽出された最長同方向輪郭系列の各画素を基準とし
て前記特定方向とは垂直な所定の方向に入力文字パタン
を走査して黒画素の連続数を計数し、この計数値を局所
線幅として各々保存し、 当該文字パタンのサイズ情報に基づいて設定される局所
線幅に関する所定の条件に基づき、前記保存された局所
線幅の中から前記条件を満足するものを選択し、 該選択された局所線幅値に基づいて前記特定方向の線素
の線幅を算出することを特徴とする文字認識方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5009184A JPH06223225A (ja) | 1993-01-22 | 1993-01-22 | 文字認識方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5009184A JPH06223225A (ja) | 1993-01-22 | 1993-01-22 | 文字認識方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH06223225A true JPH06223225A (ja) | 1994-08-12 |
Family
ID=11713463
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP5009184A Pending JPH06223225A (ja) | 1993-01-22 | 1993-01-22 | 文字認識方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH06223225A (ja) |
-
1993
- 1993-01-22 JP JP5009184A patent/JPH06223225A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7054485B2 (en) | Image processing method, apparatus and system | |
| US5321770A (en) | Method for determining boundaries of words in text | |
| US4903312A (en) | Character recognition with variable subdivisions of a character region | |
| US5557689A (en) | Optical word recognition by examination of word shape | |
| US5687253A (en) | Method for comparing word shapes | |
| US5640466A (en) | Method of deriving wordshapes for subsequent comparison | |
| EP0843275B1 (en) | Pattern extraction apparatus and method for extracting patterns | |
| JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
| CN100489885C (zh) | 图像识别方法及实现该方法的设备 | |
| JPH06223225A (ja) | 文字認識方法 | |
| JPH02293989A (ja) | 文字認識装置 | |
| CN117710985B (zh) | 光学字符识别方法、装置及智能终端 | |
| JPH06223226A (ja) | 文字認識装置 | |
| US6738530B1 (en) | Method of recognizing character in which correction of inclination of character is carried out and apparatus for carrying out this method | |
| JP2747136B2 (ja) | 文字認識装置 | |
| JPH06236456A (ja) | 文字認識装置 | |
| JPH06236455A (ja) | 文字認識装置 | |
| JP3127413B2 (ja) | 文字認識装置 | |
| JPH0991379A (ja) | 文字認識方法および文字認識装置 | |
| JP2708604B2 (ja) | 文字認識方法 | |
| JP2993533B2 (ja) | 情報処理装置及び文字認識装置 | |
| JP2918363B2 (ja) | 文字分類方法及び文字認識装置 | |
| JPH06325197A (ja) | バーコード認識方法 | |
| JPH0545992B2 (ja) | ||
| JPH11232392A (ja) | 文字認識装置と文字認識方法 |