JPH10187886A - 文字認識装置および文字認識方法 - Google Patents
文字認識装置および文字認識方法Info
- Publication number
- JPH10187886A JPH10187886A JP8347354A JP34735496A JPH10187886A JP H10187886 A JPH10187886 A JP H10187886A JP 8347354 A JP8347354 A JP 8347354A JP 34735496 A JP34735496 A JP 34735496A JP H10187886 A JPH10187886 A JP H10187886A
- Authority
- JP
- Japan
- Prior art keywords
- character
- line width
- contour
- image
- character line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【課題】文字線幅をほぼ一定値に正規化することがで
き、文字線幅の変動が大きな場合にも正確な文字認識が
可能となる文字認識装置を提供する。 【解決手段】文字の輪郭線の方向の分布を特徴量として
文字認識する文字認識装置において、入力文字画像の各
位置における輪郭線方向を検出して輪郭線方向データを
取得するとともに、入力文字画像の黒画素の総数および
輪郭の全長をそれぞれ計測し、この計測した黒画素の総
数および輪郭の全長を用いて文字画像の文字線幅を求
め、この求めた文字線幅に応じた量だけ、前記得られた
輪郭線方向データを、その方向データと直交する方向に
移動することにより文字線幅を一定値に正規化し、この
文字線幅が正規化された輪郭線方向データを複数のブロ
ックに分割し、この分割した各ブロック内の方向データ
の個数を計数することにより特徴ベクトルを求め、この
求めた特徴ベクトルを用いて文字認識を行なう。
き、文字線幅の変動が大きな場合にも正確な文字認識が
可能となる文字認識装置を提供する。 【解決手段】文字の輪郭線の方向の分布を特徴量として
文字認識する文字認識装置において、入力文字画像の各
位置における輪郭線方向を検出して輪郭線方向データを
取得するとともに、入力文字画像の黒画素の総数および
輪郭の全長をそれぞれ計測し、この計測した黒画素の総
数および輪郭の全長を用いて文字画像の文字線幅を求
め、この求めた文字線幅に応じた量だけ、前記得られた
輪郭線方向データを、その方向データと直交する方向に
移動することにより文字線幅を一定値に正規化し、この
文字線幅が正規化された輪郭線方向データを複数のブロ
ックに分割し、この分割した各ブロック内の方向データ
の個数を計数することにより特徴ベクトルを求め、この
求めた特徴ベクトルを用いて文字認識を行なう。
Description
【0001】
【発明の属する技術分野】本発明は、文字の輪郭線の方
向の分布を特徴量として文字認識する文字認識装置およ
び文字認識方法に関する。
向の分布を特徴量として文字認識する文字認識装置およ
び文字認識方法に関する。
【0002】
【従来の技術】従来、被読取物上の文字を認識する文字
認識装置において、文字の輪郭線の方向の分布を特徴量
として文字認識を行なう方式が広く用いられており、そ
のような方式の一例として、たとえば、特開平1−18
3793号公報に開示されている技術がある。
認識装置において、文字の輪郭線の方向の分布を特徴量
として文字認識を行なう方式が広く用いられており、そ
のような方式の一例として、たとえば、特開平1−18
3793号公報に開示されている技術がある。
【0003】この従来の技術を簡単に説明すると、入力
文字画像に対して2×2の論理フィルタを施すことによ
り、文字画像の各位置における輪郭線方向を検出して輪
郭線方向データを得、この得られた輪郭線方向データを
縦横それぞれ7等分して、複数のブロックに分割された
画像を得、この得られた各ブロック内の方向データの個
数を計数することにより特徴ベクトルを求め、この求め
た特徴ベクトルを、あらかじめ作成しておいた参照パタ
ーンと比較して、複合類似度法により文字認識を行なう
ものである。このような文字の輪郭線の方向分布の特徴
は、文字の変形に対して比較的安定であるため、最近の
文字認識装置に広く用いられている。
文字画像に対して2×2の論理フィルタを施すことによ
り、文字画像の各位置における輪郭線方向を検出して輪
郭線方向データを得、この得られた輪郭線方向データを
縦横それぞれ7等分して、複数のブロックに分割された
画像を得、この得られた各ブロック内の方向データの個
数を計数することにより特徴ベクトルを求め、この求め
た特徴ベクトルを、あらかじめ作成しておいた参照パタ
ーンと比較して、複合類似度法により文字認識を行なう
ものである。このような文字の輪郭線の方向分布の特徴
は、文字の変形に対して比較的安定であるため、最近の
文字認識装置に広く用いられている。
【0004】
【発明が解決しようとする課題】従来の文字認識装置に
おいては、手書き文字の筆記用具としてボールペン、鉛
筆、シャープペンシルだけが使われていたが、近年、文
字認識装置の適用範囲が広がるにつれて、筆、筆ペン、
マジックインキなどによって筆記された手書き文字をも
読取る必要が生じてきた。
おいては、手書き文字の筆記用具としてボールペン、鉛
筆、シャープペンシルだけが使われていたが、近年、文
字認識装置の適用範囲が広がるにつれて、筆、筆ペン、
マジックインキなどによって筆記された手書き文字をも
読取る必要が生じてきた。
【0005】また、印刷活字の認識においても、従来は
限られた数の字体のみを認識すればよかったが、近年で
は、非常に多様な字体を認識する必要が生じてきた。そ
の結果、読取るべき文字の文字線幅が、細いものから太
いものまで、非常に多様になっている。
限られた数の字体のみを認識すればよかったが、近年で
は、非常に多様な字体を認識する必要が生じてきた。そ
の結果、読取るべき文字の文字線幅が、細いものから太
いものまで、非常に多様になっている。
【0006】ところが、従来の文字の輪郭線の方向分布
を特徴とする文字認識方式は、このような線幅の大きな
変動には充分対応することができない。たとえば、図1
0に示すような線幅の太い文字が入力された場合には、
図3に示す普通の線幅の文字と比較して、輪郭線の位置
が大きくずれており、異なったブロックに輪郭線が移動
してしまう場合が多い。その結果、特徴ベクトルの値も
大きく変動し、誤った文字認識結果が得られてしまう可
能性が高くなる。
を特徴とする文字認識方式は、このような線幅の大きな
変動には充分対応することができない。たとえば、図1
0に示すような線幅の太い文字が入力された場合には、
図3に示す普通の線幅の文字と比較して、輪郭線の位置
が大きくずれており、異なったブロックに輪郭線が移動
してしまう場合が多い。その結果、特徴ベクトルの値も
大きく変動し、誤った文字認識結果が得られてしまう可
能性が高くなる。
【0007】そこで、本発明は、文字の輪郭線の方向の
分布を特徴量として文字を認識する際に、簡易な方法に
より文字線幅をほぼ一定値に正規化することができ、文
字線幅の変動が大きな場合にも正確な文字認識が可能と
なる文字認識装置および文字認識方法を提供することを
目的とする。
分布を特徴量として文字を認識する際に、簡易な方法に
より文字線幅をほぼ一定値に正規化することができ、文
字線幅の変動が大きな場合にも正確な文字認識が可能と
なる文字認識装置および文字認識方法を提供することを
目的とする。
【0008】
【課題を解決するための手段】本発明の文字認識装置
は、文字の輪郭線の方向の分布を特徴量として文字認識
する文字認識装置において、入力文字画像の各位置にお
ける輪郭線方向を検出して輪郭線方向データを得る輪郭
線方向検出手段と、入力文字画像から文字線幅を求める
文字線幅算出手段と、この文字線幅算出手段で求められ
た文字線幅に応じた量だけ、前記輪郭線方向検出手段か
ら得られる輪郭線方向データを所定の方向に移動するこ
とにより文字線幅を一定値に正規化する文字線幅正規化
手段と、この文字線幅正規化手段で文字線幅が正規化さ
れた輪郭線方向データから特徴ベクトルを求める特徴ベ
クトル算出手段と、この特徴ベクトル算出手段で求めら
れた特徴ベクトルを用いて文字認識を行なう認識手段と
を具備している。
は、文字の輪郭線の方向の分布を特徴量として文字認識
する文字認識装置において、入力文字画像の各位置にお
ける輪郭線方向を検出して輪郭線方向データを得る輪郭
線方向検出手段と、入力文字画像から文字線幅を求める
文字線幅算出手段と、この文字線幅算出手段で求められ
た文字線幅に応じた量だけ、前記輪郭線方向検出手段か
ら得られる輪郭線方向データを所定の方向に移動するこ
とにより文字線幅を一定値に正規化する文字線幅正規化
手段と、この文字線幅正規化手段で文字線幅が正規化さ
れた輪郭線方向データから特徴ベクトルを求める特徴ベ
クトル算出手段と、この特徴ベクトル算出手段で求めら
れた特徴ベクトルを用いて文字認識を行なう認識手段と
を具備している。
【0009】また、本発明の文字認識装置は、被読取物
上の画像を入力する入力手段と、この入力手段で入力さ
れた画像から前記被読取物上の文字行の画像を抽出する
行抽出手段と、この行抽出手段で抽出された文字行の画
像から個々の文字画像を抽出する文字抽出手段と、この
文字抽出手段で抽出された文字画像に対して所定の論理
フィルタを施すことにより文字画像の各位置における輪
郭線方向を検出して輪郭線方向データを得る輪郭線方向
検出手段と、前記文字抽出手段で抽出された文字画像の
黒画素の総数および輪郭の全長をそれぞれ計測し、この
計測した黒画素の総数および輪郭の全長を用いて文字線
幅を求める文字線幅算出手段と、この文字線幅算出手段
で求められた文字線幅と、あらかじめ定められた正規化
文字線幅とから輪郭線の移動量を求め、この求めた輪郭
線の移動量だけ、前記輪郭線方向検出手段から得られる
輪郭線方向データを、その方向データと直交する方向に
移動することにより文字線幅を一定値に正規化する文字
線幅正規化手段と、この文字線幅正規化手段で文字線幅
が正規化された輪郭線方向データを複数のブロックに分
割し、この分割した各ブロック内の方向データの個数を
計数することにより特徴ベクトルを求める特徴ベクトル
算出手段と、この特徴ベクトル算出手段で求められた特
徴ベクトルを用いて文字認識を行なう認識手段とを具備
している。
上の画像を入力する入力手段と、この入力手段で入力さ
れた画像から前記被読取物上の文字行の画像を抽出する
行抽出手段と、この行抽出手段で抽出された文字行の画
像から個々の文字画像を抽出する文字抽出手段と、この
文字抽出手段で抽出された文字画像に対して所定の論理
フィルタを施すことにより文字画像の各位置における輪
郭線方向を検出して輪郭線方向データを得る輪郭線方向
検出手段と、前記文字抽出手段で抽出された文字画像の
黒画素の総数および輪郭の全長をそれぞれ計測し、この
計測した黒画素の総数および輪郭の全長を用いて文字線
幅を求める文字線幅算出手段と、この文字線幅算出手段
で求められた文字線幅と、あらかじめ定められた正規化
文字線幅とから輪郭線の移動量を求め、この求めた輪郭
線の移動量だけ、前記輪郭線方向検出手段から得られる
輪郭線方向データを、その方向データと直交する方向に
移動することにより文字線幅を一定値に正規化する文字
線幅正規化手段と、この文字線幅正規化手段で文字線幅
が正規化された輪郭線方向データを複数のブロックに分
割し、この分割した各ブロック内の方向データの個数を
計数することにより特徴ベクトルを求める特徴ベクトル
算出手段と、この特徴ベクトル算出手段で求められた特
徴ベクトルを用いて文字認識を行なう認識手段とを具備
している。
【0010】さらに、本発明の文字認識方法は、文字の
輪郭線の方向の分布を特徴量として文字認識する文字認
識方法において、入力文字画像の各位置における輪郭線
方向を検出して輪郭線方向データを取得するとともに、
入力文字画像の黒画素の総数および輪郭の全長をそれぞ
れ計測し、この計測した黒画素の総数および輪郭の全長
を用いて文字画像の文字線幅を求め、この求めた文字線
幅に応じた量だけ、前記得られた輪郭線方向データを、
その方向データと直交する方向に移動することにより文
字線幅を一定値に正規化し、この文字線幅が正規化され
た輪郭線方向データを複数のブロックに分割し、この分
割した各ブロック内の方向データの個数を計数すること
により特徴ベクトルを求め、この求めた特徴ベクトルを
用いて文字認識を行なうことを特徴とする。
輪郭線の方向の分布を特徴量として文字認識する文字認
識方法において、入力文字画像の各位置における輪郭線
方向を検出して輪郭線方向データを取得するとともに、
入力文字画像の黒画素の総数および輪郭の全長をそれぞ
れ計測し、この計測した黒画素の総数および輪郭の全長
を用いて文字画像の文字線幅を求め、この求めた文字線
幅に応じた量だけ、前記得られた輪郭線方向データを、
その方向データと直交する方向に移動することにより文
字線幅を一定値に正規化し、この文字線幅が正規化され
た輪郭線方向データを複数のブロックに分割し、この分
割した各ブロック内の方向データの個数を計数すること
により特徴ベクトルを求め、この求めた特徴ベクトルを
用いて文字認識を行なうことを特徴とする。
【0011】本発明によれば、文字画像の各位置におけ
る輪郭線方向データを、推定文字線幅(入力文字画像か
ら求めた文字線幅)に応じた量だけ、その方向データと
直交する方向に移動することにより、文字線幅の正規化
を行なうことで、文字の輪郭線の方向の分布を特徴量と
して文字を認識する際に、簡易な方法により文字線幅を
ほぼ一定値に正規化することができ、文字線幅の変動が
大きな場合にも正確な文字認識が可能となる。
る輪郭線方向データを、推定文字線幅(入力文字画像か
ら求めた文字線幅)に応じた量だけ、その方向データと
直交する方向に移動することにより、文字線幅の正規化
を行なうことで、文字の輪郭線の方向の分布を特徴量と
して文字を認識する際に、簡易な方法により文字線幅を
ほぼ一定値に正規化することができ、文字線幅の変動が
大きな場合にも正確な文字認識が可能となる。
【0012】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して説明する。図1は、本実施の形態に係
る文字認識装置の構成を概略的に示すものである。この
文字認識装置は、被読取物としての帳票P上の画像を入
力する入力手段としての光電変換器などからなる画像入
力部1、画像入力部1で入力された画像を一時記憶する
ための記憶手段としての画像ファイル2、画像ファイル
2内の画像から帳票P上の文字行の画像を抽出する行抽
出手段としての行抽出部3、行抽出部3で抽出された文
字行の画像から個々の文字画像を抽出する文字抽出手段
としての文字抽出部4、文字抽出部4で抽出された文字
画像から文字認識を行なう文字認識部5、文字認識部5
で文字認識の際に用いる参照パターンを記憶している記
憶手段としての参照パターンファイル6、および、文字
認識部5の認識結果を格納する認識結果ファイル7によ
って構成されている。
て図面を参照して説明する。図1は、本実施の形態に係
る文字認識装置の構成を概略的に示すものである。この
文字認識装置は、被読取物としての帳票P上の画像を入
力する入力手段としての光電変換器などからなる画像入
力部1、画像入力部1で入力された画像を一時記憶する
ための記憶手段としての画像ファイル2、画像ファイル
2内の画像から帳票P上の文字行の画像を抽出する行抽
出手段としての行抽出部3、行抽出部3で抽出された文
字行の画像から個々の文字画像を抽出する文字抽出手段
としての文字抽出部4、文字抽出部4で抽出された文字
画像から文字認識を行なう文字認識部5、文字認識部5
で文字認識の際に用いる参照パターンを記憶している記
憶手段としての参照パターンファイル6、および、文字
認識部5の認識結果を格納する認識結果ファイル7によ
って構成されている。
【0013】このような構成において、全体的な動作を
簡単に説明する。まず、画像入力部1によって帳票P上
の画像を入力し、画像ファイル2に格納する。次に、行
抽出部3で、画像ファイル2内の画像に対して所定の画
像処理を行なうことにより、帳票P上に記入された文字
行の画像を抽出する。次に、文字抽出部4で、抽出され
た文字行の画像から個々の文字を抽出する。次に、文字
認識部5で、抽出された個々の文字画像から複合類似度
法を用いて文字認識を行ない、その認識結果を磁気ディ
スクなどの認識結果ファイル7に出力する。
簡単に説明する。まず、画像入力部1によって帳票P上
の画像を入力し、画像ファイル2に格納する。次に、行
抽出部3で、画像ファイル2内の画像に対して所定の画
像処理を行なうことにより、帳票P上に記入された文字
行の画像を抽出する。次に、文字抽出部4で、抽出され
た文字行の画像から個々の文字を抽出する。次に、文字
認識部5で、抽出された個々の文字画像から複合類似度
法を用いて文字認識を行ない、その認識結果を磁気ディ
スクなどの認識結果ファイル7に出力する。
【0014】以下では、文字認識部5における認識処理
の内容を、図2に示すフローチャートを参照して詳細に
説明する。まず、たとえば、図3に示すような文字画像
が入力されると(S1)、この入力文字画像に対して、
たとえば、図4に示すような2×2の論理フィルタを施
すことにより、文字画像の各位置における輪郭線方向を
検出し、輪郭線方向データを取得する(S2)。すなわ
ち、図4(a)の論理フィルタに当てはまる位置には上
下方向の輪郭線が存在するとみなす。同様に、図4
(b)(c)(d)は、それぞれ右上がり、左上がり、
左右方向の輪郭線を示す。このような論理フィルタ操作
を入力画像の全面に施すことにより、文字画像の各位置
における輪郭線方向の検出ができ、図5に示すような輪
郭線方向データが得られる。この図では、各位置の輪郭
線方向を矢印で示している。
の内容を、図2に示すフローチャートを参照して詳細に
説明する。まず、たとえば、図3に示すような文字画像
が入力されると(S1)、この入力文字画像に対して、
たとえば、図4に示すような2×2の論理フィルタを施
すことにより、文字画像の各位置における輪郭線方向を
検出し、輪郭線方向データを取得する(S2)。すなわ
ち、図4(a)の論理フィルタに当てはまる位置には上
下方向の輪郭線が存在するとみなす。同様に、図4
(b)(c)(d)は、それぞれ右上がり、左上がり、
左右方向の輪郭線を示す。このような論理フィルタ操作
を入力画像の全面に施すことにより、文字画像の各位置
における輪郭線方向の検出ができ、図5に示すような輪
郭線方向データが得られる。この図では、各位置の輪郭
線方向を矢印で示している。
【0015】次に、入力文字画像の黒画素の総数および
輪郭の全長を計測する(S3,S4)。次に、この計測
した黒画素の総数および輪郭の全長を用いて、以下の式
によって平均文字線幅を計算する(S5)。
輪郭の全長を計測する(S3,S4)。次に、この計測
した黒画素の総数および輪郭の全長を用いて、以下の式
によって平均文字線幅を計算する(S5)。
【0016】(平均文字線幅)=2×(黒画素の総数)
/(輪郭の全長) 次に、上記のように求められた平均文字線幅を用いて、
以下の式によって輪郭線移動量を計算する(S6)。こ
こで、正規化文字線幅は、あらかじめ定められた定数
で、正規化処理によって文字線幅がこの値に設定される
ものである。
/(輪郭の全長) 次に、上記のように求められた平均文字線幅を用いて、
以下の式によって輪郭線移動量を計算する(S6)。こ
こで、正規化文字線幅は、あらかじめ定められた定数
で、正規化処理によって文字線幅がこの値に設定される
ものである。
【0017】(輪郭線移動量)={(平均文字線幅)−
(正規化文字線幅)}/2 この場合、入力された文字画像の線幅が太い場合は、輪
郭線移動量は正の値になり、細い場合は、負の値にな
る。
(正規化文字線幅)}/2 この場合、入力された文字画像の線幅が太い場合は、輪
郭線移動量は正の値になり、細い場合は、負の値にな
る。
【0018】次に、ステップS2で求められた文字画像
の各位置の輪郭線方向データを、ステップS6で求めら
れた輪郭線移動量だけ移動させる(S7)。この場合、
移動する方向は、その方向データに直交する方向とす
る。すなわち、図6に示す白矢印で示した方向に各方向
データを移動する。ただし、図6で示した方向は、輪郭
線移動量が正の場合の移動方向であり、負の場合はこれ
とは180度反対の方向に移動するものとする。
の各位置の輪郭線方向データを、ステップS6で求めら
れた輪郭線移動量だけ移動させる(S7)。この場合、
移動する方向は、その方向データに直交する方向とす
る。すなわち、図6に示す白矢印で示した方向に各方向
データを移動する。ただし、図6で示した方向は、輪郭
線移動量が正の場合の移動方向であり、負の場合はこれ
とは180度反対の方向に移動するものとする。
【0019】このように、各輪郭線方向データを移動さ
せることにより、輪郭線方向データは、図7(a)から
図7(b)に示すように変換される。図7で明らかなよ
うに、入力文字画像の太い文字線幅が細められ、あらか
じめ定められた文字線幅(正規化文字線幅)を持った輪
郭線方向データに変換される。なお、入力文字画像の線
幅が細い場合には、同様な処理で一定の文字線幅に太め
られた輪郭線方向データを得ることができる。
せることにより、輪郭線方向データは、図7(a)から
図7(b)に示すように変換される。図7で明らかなよ
うに、入力文字画像の太い文字線幅が細められ、あらか
じめ定められた文字線幅(正規化文字線幅)を持った輪
郭線方向データに変換される。なお、入力文字画像の線
幅が細い場合には、同様な処理で一定の文字線幅に太め
られた輪郭線方向データを得ることができる。
【0020】次に、ステップS7で得られた図7(b)
の輪郭線方向データを縦横それぞれ7等分することによ
り、図8に示すような7×7個のブロックに分割された
画像を得る(S8)。
の輪郭線方向データを縦横それぞれ7等分することによ
り、図8に示すような7×7個のブロックに分割された
画像を得る(S8)。
【0021】次に、図9に示すように、各ブロックに含
まれる各方向の個数を並べて特徴ベクトルとする(S
9)。すなわち、ステップS8で得られた図8に示すよ
うな画像の各ブロックに含まれる各方向データの個数を
計数することにより特徴ベクトルを計算する。本例の場
合、方向が4方向でのブロック数が7×7個あるので、
特徴ベクトルの次元数は、4×7×7=196次元とな
る。
まれる各方向の個数を並べて特徴ベクトルとする(S
9)。すなわち、ステップS8で得られた図8に示すよ
うな画像の各ブロックに含まれる各方向データの個数を
計数することにより特徴ベクトルを計算する。本例の場
合、方向が4方向でのブロック数が7×7個あるので、
特徴ベクトルの次元数は、4×7×7=196次元とな
る。
【0022】次に、ステップS9で得られた特徴ベクト
ルを、あらかじめ作成して参照パターンファイル6に格
納されている参照パターン(標準パターン)と比較する
ことにより、文字認識を行なう(S10)。文字認識の
方式としては、たとえば、複合類似度法を用いるとよ
い。なお、ここで用いる参照パターン自体も、同じ方式
で文字線幅正規化された文字画像から作成されたもので
ある。
ルを、あらかじめ作成して参照パターンファイル6に格
納されている参照パターン(標準パターン)と比較する
ことにより、文字認識を行なう(S10)。文字認識の
方式としては、たとえば、複合類似度法を用いるとよ
い。なお、ここで用いる参照パターン自体も、同じ方式
で文字線幅正規化された文字画像から作成されたもので
ある。
【0023】次に、ステップS10で得られた認識結果
を出力し、認識結果ファイル7に格納する(S11)。
このように、上記実施の形態によれば、文字画像の各位
置における輪郭線方向データを、推定文字線幅(入力文
字画像から求めた文字線幅)に応じた量だけ、その方向
データと直交する方向に移動することにより、文字線幅
の正規化を行なうことで、文字の輪郭線の方向の分布を
特徴量として文字を認識する際に、簡易な方法により文
字線の幅をほぼ一定値に正規化することができ、たとえ
ば、図10に示すような文字線幅の太い文字画像が入力
された場合など、文字線幅の変動が大きな場合にも正確
な文字認識が可能になる。
を出力し、認識結果ファイル7に格納する(S11)。
このように、上記実施の形態によれば、文字画像の各位
置における輪郭線方向データを、推定文字線幅(入力文
字画像から求めた文字線幅)に応じた量だけ、その方向
データと直交する方向に移動することにより、文字線幅
の正規化を行なうことで、文字の輪郭線の方向の分布を
特徴量として文字を認識する際に、簡易な方法により文
字線の幅をほぼ一定値に正規化することができ、たとえ
ば、図10に示すような文字線幅の太い文字画像が入力
された場合など、文字線幅の変動が大きな場合にも正確
な文字認識が可能になる。
【0024】なお、本発明は前記実施の形態に限定され
るものでなく、本発明の要旨を変えない範囲で種々変形
実施可能である。たとえば、前記実施の形態では、入力
された文字画像の文字線幅として全体的な平均文字線幅
を用いている。しかし、文字を構成する文字線の太さが
均一でない場合もしばしば存在する。そのような場合
に、全体的な平均文字線幅を用いて線幅正規化を行なう
と、正規化後の文字画像が歪んでしまう可能性がある。
るものでなく、本発明の要旨を変えない範囲で種々変形
実施可能である。たとえば、前記実施の形態では、入力
された文字画像の文字線幅として全体的な平均文字線幅
を用いている。しかし、文字を構成する文字線の太さが
均一でない場合もしばしば存在する。そのような場合
に、全体的な平均文字線幅を用いて線幅正規化を行なう
と、正規化後の文字画像が歪んでしまう可能性がある。
【0025】このような場合には、文字画像の各位置ご
とに局所的な文字線幅を求め、それに応じて局所的に輪
郭線移動量を計算すればよい。局所的な文字線幅は、図
11に示すように、ある輪郭位置から、それと反対方向
に存在する輪郭位置までの距離を測定すれば得られる。
ただし、図12に示したように、その距離が大局的な平
均文字線幅と非常に異なる場合は、正しい文字線幅に対
応していないと判断して、輪郭線方向データの移動を行
なわない。
とに局所的な文字線幅を求め、それに応じて局所的に輪
郭線移動量を計算すればよい。局所的な文字線幅は、図
11に示すように、ある輪郭位置から、それと反対方向
に存在する輪郭位置までの距離を測定すれば得られる。
ただし、図12に示したように、その距離が大局的な平
均文字線幅と非常に異なる場合は、正しい文字線幅に対
応していないと判断して、輪郭線方向データの移動を行
なわない。
【0026】また、たとえば、正規化文字線幅を「1」
に指定すると、正規化処理によって、図13(a)から
図13(b)に示すように細線化された細線化画像が得
られる。このような細線化画像は、文字線の端点や交差
点の検出など、様々な用途に用いることができる。
に指定すると、正規化処理によって、図13(a)から
図13(b)に示すように細線化された細線化画像が得
られる。このような細線化画像は、文字線の端点や交差
点の検出など、様々な用途に用いることができる。
【0027】
【発明の効果】以上詳述したように本発明によれば、文
字の輪郭線の方向の分布を特徴量として文字を認識する
際に、簡易な方法により文字線幅をほぼ一定値に正規化
することができ、文字線幅の変動が大きな場合にも正確
な文字認識が可能となる文字認識装置および文字認識方
法を提供できる。
字の輪郭線の方向の分布を特徴量として文字を認識する
際に、簡易な方法により文字線幅をほぼ一定値に正規化
することができ、文字線幅の変動が大きな場合にも正確
な文字認識が可能となる文字認識装置および文字認識方
法を提供できる。
【図1】本発明の実施の形態に係る文字認識装置の構成
を概略的に示すブロック図。
を概略的に示すブロック図。
【図2】文字認識処理を説明するフローチャート。
【図3】入力された文字画像の一例を示す図。
【図4】文字の輪郭線の方向の検出に用いる論理フィル
タを示す図。
タを示す図。
【図5】文字の輪郭線の方向の分布を示す図。
【図6】それぞれの輪郭線方向データの移動方向を示す
図。
図。
【図7】輪郭線方向データの移動によって文字線幅の正
規化が行なわれることを示す図。
規化が行なわれることを示す図。
【図8】文字画像の輪郭線方向データを複数のブロック
に分割した画像を示す図。
に分割した画像を示す図。
【図9】特徴ベクトルの計算の例を説明する図。
【図10】太い線幅の文字画像が入力された場合の問題
点を説明する図。
点を説明する図。
【図11】局所的な文字線幅の計算法を説明する図。
【図12】局所的な文字線幅とみなさない対応を説明す
る図。
る図。
【図13】正規化処理により細線化画像も得られること
を説明する図。
を説明する図。
1……画像入力部(画像入力手段) 2……画像ファイル(記憶手段) 3……行抽出部(行抽出手段) 4……文字抽出部(文字抽出手段) 5……文字認識部 6……参照パターンファイル(記憶手段) 7……認識結果ファイル(記憶手段)
Claims (11)
- 【請求項1】 文字の輪郭線の方向の分布を特徴量とし
て文字認識する文字認識装置において、 入力文字画像の各位置における輪郭線方向を検出して輪
郭線方向データを得る輪郭線方向検出手段と、 入力文字画像から文字線幅を求める文字線幅算出手段
と、 この文字線幅算出手段で求められた文字線幅に応じた量
だけ、前記輪郭線方向検出手段から得られる輪郭線方向
データを所定の方向に移動することにより文字線幅を一
定値に正規化する文字線幅正規化手段と、 この文字線幅正規化手段で文字線幅が正規化された輪郭
線方向データから特徴ベクトルを求める特徴ベクトル算
出手段と、 この特徴ベクトル算出手段で求められた特徴ベクトルを
用いて文字認識を行なう認識手段と、 を具備したことを特徴とする文字認識装置。 - 【請求項2】 前記輪郭線方向検出手段は、入力文字画
像に対して2×2の論理フィルタを施すことにより文字
画像の各位置における輪郭線方向を検出することを特徴
とする請求項1記載の文字認識装置。 - 【請求項3】 前記文字線幅算出手段は、文字画像の黒
画素の総数および輪郭の全長をそれぞれ計測し、この計
測した黒画素の総数および輪郭の全長を用いて文字画像
の文字線幅を求めることを特徴とする請求項1記載の文
字認識装置。 - 【請求項4】 前記文字線幅算出手段は、文字画像の全
体的な平均文字線幅を求めることを特徴とする請求項1
または3記載の文字認識装置。 - 【請求項5】 前記文字線幅算出手段は、文字画像の各
位置における局所的な文字線幅を求めることを特徴とす
る請求項1または3記載の文字認識装置。 - 【請求項6】 前記文字線幅算出手段は、文字画像の大
局的な文字線幅および文字画像の各位置における局所的
な文字線幅をそれぞれ求めることを特徴とする請求項1
または3記載の文字認識装置。 - 【請求項7】 前記文字線幅正規化手段は、前記文字線
幅算出手段で求められた文字線幅と、あらかじめ定めら
れた正規化文字線幅とから輪郭線の移動量を求める輪郭
線移動量算出手段と、この輪郭線移動量算出手段で求め
られた輪郭線の移動量だけ、前記輪郭線方向検出手段か
ら得られる輪郭線方向データを、その方向データと直交
する方向に移動する輪郭線移動手段とからなることを特
徴とする請求項1記載の文字認識装置。 - 【請求項8】 前記特徴ベクトル算出手段は、文字線幅
正規化手段で文字線幅が正規化された輪郭線方向データ
を複数のブロックに分割し、この分割した各ブロック内
の方向データの個数を計数することにより特徴ベクトル
を求めることを特徴とする請求項1記載の文字認識装
置。 - 【請求項9】 前記認識手段は、前記特徴ベクトル算出
手段で求められた特徴ベクトルを、あらかじめ作成され
た参照パターンと比較して複合類似度法により文字認識
を行なうことを特徴とする請求項1記載の文字認識装
置。 - 【請求項10】 被読取物上の画像を入力する入力手段
と、 この入力手段で入力された画像から前記被読取物上の文
字行の画像を抽出する行抽出手段と、 この行抽出手段で抽出された文字行の画像から個々の文
字画像を抽出する文字抽出手段と、 この文字抽出手段で抽出された文字画像に対して所定の
論理フィルタを施すことにより文字画像の各位置におけ
る輪郭線方向を検出して輪郭線方向データを得る輪郭線
方向検出手段と、 前記文字抽出手段で抽出された文字画像の黒画素の総数
および輪郭の全長をそれぞれ計測し、この計測した黒画
素の総数および輪郭の全長を用いて文字線幅を求める文
字線幅算出手段と、 この文字線幅算出手段で求められた文字線幅と、あらか
じめ定められた正規化文字線幅とから輪郭線の移動量を
求め、この求めた輪郭線の移動量だけ、前記輪郭線方向
検出手段から得られる輪郭線方向データを、その方向デ
ータと直交する方向に移動することにより文字線幅を一
定値に正規化する文字線幅正規化手段と、 この文字線幅正規化手段で文字線幅が正規化された輪郭
線方向データを複数のブロックに分割し、この分割した
各ブロック内の方向データの個数を計数することにより
特徴ベクトルを求める特徴ベクトル算出手段と、 この特徴ベクトル算出手段で求められた特徴ベクトルを
用いて文字認識を行なう認識手段と、 を具備したことを特徴とする文字認識装置。 - 【請求項11】 文字の輪郭線の方向の分布を特徴量と
して文字認識する文字認識方法において、 入力文字画像の各位置における輪郭線方向を検出して輪
郭線方向データを取得するとともに、 入力文字画像の黒画素の総数および輪郭の全長をそれぞ
れ計測し、この計測した黒画素の総数および輪郭の全長
を用いて文字画像の文字線幅を求め、 この求めた文字線幅に応じた量だけ、前記得られた輪郭
線方向データを、その方向データと直交する方向に移動
することにより文字線幅を一定値に正規化し、 この文字線幅が正規化された輪郭線方向データを複数の
ブロックに分割し、この分割した各ブロック内の方向デ
ータの個数を計数することにより特徴ベクトルを求め、 この求めた特徴ベクトルを用いて文字認識を行なうこと
を特徴とする文字認識方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8347354A JPH10187886A (ja) | 1996-12-26 | 1996-12-26 | 文字認識装置および文字認識方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8347354A JPH10187886A (ja) | 1996-12-26 | 1996-12-26 | 文字認識装置および文字認識方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH10187886A true JPH10187886A (ja) | 1998-07-21 |
Family
ID=18389664
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP8347354A Pending JPH10187886A (ja) | 1996-12-26 | 1996-12-26 | 文字認識装置および文字認識方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH10187886A (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008021173A (ja) * | 2006-07-13 | 2008-01-31 | Oki Joho Systems:Kk | 携帯情報端末および電子メールシステム |
| JP2008210387A (ja) * | 2007-02-26 | 2008-09-11 | Fujitsu Ltd | 文書画像の2値化性能を改善するノイズ除去装置及びノイズ除去プログラム |
| KR100902491B1 (ko) | 2007-04-27 | 2009-06-10 | 금오공과대학교 산학협력단 | 숫자 영상 처리 시스템 및 그 방법 |
| KR101085699B1 (ko) | 2010-02-17 | 2011-11-23 | 고려대학교 산학협력단 | 문자 획 너비 계산을 이용한 문자 영역 추출 장치 및 방법 |
-
1996
- 1996-12-26 JP JP8347354A patent/JPH10187886A/ja active Pending
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008021173A (ja) * | 2006-07-13 | 2008-01-31 | Oki Joho Systems:Kk | 携帯情報端末および電子メールシステム |
| JP2008210387A (ja) * | 2007-02-26 | 2008-09-11 | Fujitsu Ltd | 文書画像の2値化性能を改善するノイズ除去装置及びノイズ除去プログラム |
| KR100902491B1 (ko) | 2007-04-27 | 2009-06-10 | 금오공과대학교 산학협력단 | 숫자 영상 처리 시스템 및 그 방법 |
| KR101085699B1 (ko) | 2010-02-17 | 2011-11-23 | 고려대학교 산학협력단 | 문자 획 너비 계산을 이용한 문자 영역 추출 장치 및 방법 |
| US8744189B2 (en) | 2010-02-17 | 2014-06-03 | Samsung Electronics Co., Ltd | Character region extracting apparatus and method using character stroke width calculation |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN111507251B (zh) | 试题图像中作答区域的定位方法、装置、电子设备及计算机存储介质 | |
| US4542526A (en) | Character recognition apparatus | |
| JP3576570B2 (ja) | 比較方法 | |
| CN104484643B (zh) | 一种手写表格的智能识别方法及系统 | |
| JPH03290774A (ja) | 文書画像の文章領域抽出装置 | |
| CN111222507A (zh) | 数字式仪表读数的自动识别方法、计算机可读存储介质 | |
| JPH08508128A (ja) | 分布マップを用いる画像の分類方法及び装置 | |
| JP3428494B2 (ja) | 文字認識装置及びその文字認識方法並びにその制御プログラムを記録した記録媒体 | |
| JP3728224B2 (ja) | 文書処理装置及び方法 | |
| JPH10187886A (ja) | 文字認識装置および文字認識方法 | |
| JP2011107878A (ja) | 位置検出装置、位置検出方法 | |
| Tsai et al. | Recognition of Vehicle License Plates from a Video Sequence. | |
| JP2898970B1 (ja) | 三次元印鑑登録・照合装置 | |
| CN121354226B (zh) | 一种防篡改和易追溯的手写数据双轨记录系统及记录设备 | |
| JP3388918B2 (ja) | 文字列読み取り装置 | |
| JP3100825B2 (ja) | 線認識方法 | |
| JPH09179982A (ja) | 特定パターン検出方法 | |
| Elrajubi et al. | Angle features extraction of handwritten signatures | |
| JP2715930B2 (ja) | 線分検出方法 | |
| JP3000480B2 (ja) | 文字領域区切り検出方法 | |
| JPH0656625B2 (ja) | 特徴抽出方式 | |
| Mishra et al. | Offline Signature Verification Scheme | |
| KR20250179300A (ko) | 차량 주행거리 인식 방법 및 장치 | |
| JPH0573718A (ja) | 領域属性識別方式 | |
| CN121354226A (zh) | 一种防篡改和易追溯的手写数据双轨记录系统及记录设备 |