JPH02193281A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH02193281A JPH02193281A JP1012721A JP1272189A JPH02193281A JP H02193281 A JPH02193281 A JP H02193281A JP 1012721 A JP1012721 A JP 1012721A JP 1272189 A JP1272189 A JP 1272189A JP H02193281 A JPH02193281 A JP H02193281A
- Authority
- JP
- Japan
- Prior art keywords
- character
- candidate
- characters
- candidate characters
- identification means
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〈産業上の利用分野〉
本発明は文字認識装置に関し、さらに詳細にいえば、画
像入力装置、またはファクシミリ等の通信媒体を通して
文字、記号等(以下代表して「文字」という)を表わす
画像信号を取得し、その特徴量を抽出し、上記特徴量を
基に演算を行って−群の候補文字をひとまず選定し、上
記候補文字の中から被読取対象である文字に最も近い文
字を詳細識別して当該文字を表わす信号を出力すること
のできる文字認識装置に関するものである。
像入力装置、またはファクシミリ等の通信媒体を通して
文字、記号等(以下代表して「文字」という)を表わす
画像信号を取得し、その特徴量を抽出し、上記特徴量を
基に演算を行って−群の候補文字をひとまず選定し、上
記候補文字の中から被読取対象である文字に最も近い文
字を詳細識別して当該文字を表わす信号を出力すること
のできる文字認識装置に関するものである。
〈従来の技術〉
従来の文字認識装置による文字認識を行う場合、例えば
、第5図に示すように、スキャナ等の画像入力手段(1
1)で文字を含む画像を入力し、文字切り出し手段(1
2)で1つ1つの単位文字を切り出す。
、第5図に示すように、スキャナ等の画像入力手段(1
1)で文字を含む画像を入力し、文字切り出し手段(1
2)で1つ1つの単位文字を切り出す。
そして、特徴抽出手段(13)で、切り出された文字信
号に基づいて特徴量を抽出した後、大分類識別手段(1
4)で、簡単な手法を用いて複数個の候補文字を絞る。
号に基づいて特徴量を抽出した後、大分類識別手段(1
4)で、簡単な手法を用いて複数個の候補文字を絞る。
詳細識別手段(15)では大分類識別手段(14)から
送られてきた各候補文字について、認識用辞書(1B)
(認識用辞書(16)は、特徴量の外、例えば特徴量
の平均値や分布の状態、各特徴量が認識に影響を与える
順位等を記憶している。)に蓄えられた当該候補文字の
特徴量その他の情報を得、特徴抽出手段(18)で得ら
れた特徴量と比較し、それぞれの相違度あるいは類似度
(以下代表して「相違度」という。)を計算してその結
果を出力する。順位決定手段(17)は、相違度の小さ
な順に並べ変え、例えば最も小さな相違度を出した文字
を認識結果として出力する。
送られてきた各候補文字について、認識用辞書(1B)
(認識用辞書(16)は、特徴量の外、例えば特徴量
の平均値や分布の状態、各特徴量が認識に影響を与える
順位等を記憶している。)に蓄えられた当該候補文字の
特徴量その他の情報を得、特徴抽出手段(18)で得ら
れた特徴量と比較し、それぞれの相違度あるいは類似度
(以下代表して「相違度」という。)を計算してその結
果を出力する。順位決定手段(17)は、相違度の小さ
な順に並べ変え、例えば最も小さな相違度を出した文字
を認識結果として出力する。
特に、この文字認識装置の一具体例として、特公昭63
−28915号公報記載の文字認識装置があげられる。
−28915号公報記載の文字認識装置があげられる。
この文字認識装置では、大分類識別手段で、同じような
偏を持つカテゴリの辞書を選択し、詳細識別手段では、
選択された候補カテゴリの辞書ニ入っている全ての文字
に対して、側部分はマスクし、労 部分のみを詳細識別
する。これにより、同じような偏を持つ文字群の認識率
を向上させている。
偏を持つカテゴリの辞書を選択し、詳細識別手段では、
選択された候補カテゴリの辞書ニ入っている全ての文字
に対して、側部分はマスクし、労 部分のみを詳細識別
する。これにより、同じような偏を持つ文字群の認識率
を向上させている。
〈発明が解決しようとする課題〉
ところが、上記第5図の文字認識装置では、詳細識別手
段(15)は、大分類識別手段(14)により選出され
た全ての候補文字について特徴量を比較するため、候補
文字を多く設定すると計算量が大きくなり、認識時間が
増大することになる。例えば、候補文字を100個設定
する漢字OCRでは、文字を認識するのに相違度を10
0回計算しなげればならない。
段(15)は、大分類識別手段(14)により選出され
た全ての候補文字について特徴量を比較するため、候補
文字を多く設定すると計算量が大きくなり、認識時間が
増大することになる。例えば、候補文字を100個設定
する漢字OCRでは、文字を認識するのに相違度を10
0回計算しなげればならない。
候補文字数を減らせば、計算時間は短縮されるが、ある
一定の認識性能を確保するためには、大分類識別手段(
14)で選定する候補文字数は十分な数を確保しておく
ことが望ましい。なぜならば、大分類識別手段(14)
で選定した候補文字の中がら正続文字が漏れていると、
詳細識別手段(15)でぃくら詳細に認識計算を行って
も、正続文字を得ることはできないからである。
一定の認識性能を確保するためには、大分類識別手段(
14)で選定する候補文字数は十分な数を確保しておく
ことが望ましい。なぜならば、大分類識別手段(14)
で選定した候補文字の中がら正続文字が漏れていると、
詳細識別手段(15)でぃくら詳細に認識計算を行って
も、正続文字を得ることはできないからである。
このために、従来では、候補文字数を多めに設定してお
り、その結果、詳細識別のための時間が多く費やされて
いたとい□う問題があった。
り、その結果、詳細識別のための時間が多く費やされて
いたとい□う問題があった。
本発明の目的は、簡単な手法を採用することにより、文
字の認識時間を全体として短縮することのできる文字認
識装置を提供することにある。
字の認識時間を全体として短縮することのできる文字認
識装置を提供することにある。
く課題を解決するための手段〉
上記の目的を達成するための本発明の文字認識゛装置は
、第1、図に示すように、文字を含む被読取対象を、表
わす画像信号を取得する画像信号取得手段(1)と、上
記画像信号に基づき画像中の認識しょうとする文字の特
徴量を抽出する特徴量抽出手段(2)と、上記特徴量を
基に演算を行い複数の候補文字を選定する大分類識別手
段(3)と、各文字の認識に必要な特徴量その他の情報
を記憶した認識用辞書と、上記認識しようとする文字の
特徴量を認識用辞書に記憶された候補文字の情報と比較
し特徴量比較計算を行う詳細識別手段(4)と、詳細識
別手段(4)で識別された文字の中から一定の基準で文
字を選択して当該文字を表わす信号を出力する認識文字
出力手段(5)と、特徴量比較計算をする時の候補文字
数を指定する定数を各文字に対応して記憶している候補
文字数対応表(7)と、上記候補文字の中から所定の基
準で1つまたは複数の候補文字を選びだし、この選び出
した候補文字に対応する候補文字数を検索する表検索手
段(8)と、検索した候補文字数を基に1つの候補文字
数を決定して当該候補文字数の候補文字信号を詳細識別
手段(4)に送り出す候補文字限定手段(9)とを具備
している。上記詳細識別手段(4)は、候補文字限定手
段(9)から指定された候補文字に対してのみ特徴量比
較計算をするものである。
、第1、図に示すように、文字を含む被読取対象を、表
わす画像信号を取得する画像信号取得手段(1)と、上
記画像信号に基づき画像中の認識しょうとする文字の特
徴量を抽出する特徴量抽出手段(2)と、上記特徴量を
基に演算を行い複数の候補文字を選定する大分類識別手
段(3)と、各文字の認識に必要な特徴量その他の情報
を記憶した認識用辞書と、上記認識しようとする文字の
特徴量を認識用辞書に記憶された候補文字の情報と比較
し特徴量比較計算を行う詳細識別手段(4)と、詳細識
別手段(4)で識別された文字の中から一定の基準で文
字を選択して当該文字を表わす信号を出力する認識文字
出力手段(5)と、特徴量比較計算をする時の候補文字
数を指定する定数を各文字に対応して記憶している候補
文字数対応表(7)と、上記候補文字の中から所定の基
準で1つまたは複数の候補文字を選びだし、この選び出
した候補文字に対応する候補文字数を検索する表検索手
段(8)と、検索した候補文字数を基に1つの候補文字
数を決定して当該候補文字数の候補文字信号を詳細識別
手段(4)に送り出す候補文字限定手段(9)とを具備
している。上記詳細識別手段(4)は、候補文字限定手
段(9)から指定された候補文字に対してのみ特徴量比
較計算をするものである。
く作用〉
上記の構成の文字認識装置によれば、画像信号取得手段
(1)により取り込まれた画像信号に含まれる文字信号
に対して、特徴量抽出手段(2)によって特徴量が抽出
される。大分類識別手段(3)は、この特徴量を用いて
簡単な手法で一群の候補文字を選定する。上記候補文字
数は、正続文字が必ず存在しているように、十分な数に
設定される。
(1)により取り込まれた画像信号に含まれる文字信号
に対して、特徴量抽出手段(2)によって特徴量が抽出
される。大分類識別手段(3)は、この特徴量を用いて
簡単な手法で一群の候補文字を選定する。上記候補文字
数は、正続文字が必ず存在しているように、十分な数に
設定される。
ところで、認識しようとする文字か複雑な場合、候補文
字もこれに類似した複雑な文字からなり、認識しようと
する文字が簡単な場合、候補文字もこれに類似した簡単
な文字からなることは容易に推測できる。ここで、「複
雑」 「簡単」というのは、認識する上で他の文字を誤
読してしまう可能性が高いか低いかをいい、例えば画数
の少ない文字でも類似した文字が多くあれば「複雑」な
文字であり、画数の多い文字でもそれが特異な特徴を持
っていて類似した文字がほとんどない場合[簡単」な文
字といえる。
字もこれに類似した複雑な文字からなり、認識しようと
する文字が簡単な場合、候補文字もこれに類似した簡単
な文字からなることは容易に推測できる。ここで、「複
雑」 「簡単」というのは、認識する上で他の文字を誤
読してしまう可能性が高いか低いかをいい、例えば画数
の少ない文字でも類似した文字が多くあれば「複雑」な
文字であり、画数の多い文字でもそれが特異な特徴を持
っていて類似した文字がほとんどない場合[簡単」な文
字といえる。
そこで、大分類識別手段(3)により簡単な手法で候補
文字群を選択する時には、「簡単」な文、字に対しては
、少ない候補文字を選択しても、上位に正読文字が入る
のに対し、「複雑」な文字に対しては、多くの候補文字
を選択しなければ上位に正読文字が入るとは限らないこ
とに着目した。
文字群を選択する時には、「簡単」な文、字に対しては
、少ない候補文字を選択しても、上位に正読文字が入る
のに対し、「複雑」な文字に対しては、多くの候補文字
を選択しなければ上位に正読文字が入るとは限らないこ
とに着目した。
本発明では、文字の「簡単」さ、「複雑」さといった性
質の相違に応じて、各文字に対応する、特徴量比較計算
をする時の候補文字数を候補文字数対応表(7)に記憶
させておき、実際に選定された候補文字に基づいて、候
補文字数対応表(7)を参照しながら、詳細計算の対象
とする候補文字を限定している。
質の相違に応じて、各文字に対応する、特徴量比較計算
をする時の候補文字数を候補文字数対応表(7)に記憶
させておき、実際に選定された候補文字に基づいて、候
補文字数対応表(7)を参照しながら、詳細計算の対象
とする候補文字を限定している。
すなわち、大分類識別手段(3)で選定された候補文字
を表検索手段(8)に通知し、表検索手段(8)は通知
された候補文字の中から所定の基準で1つまたは複数の
候補文字を選ぶ。そして、候補文字数対応表(7)を参
照して、上記選ばれた候補文字に対応する候補文字数を
検索する。候補文字限定手段(9)は、検索した候補文
字数を基に1つの候補文字数を決定し、この限定された
候補文字を詳細識別手段(4)に送り出す。詳細識別手
段(4)は、認識用辞書(6)を参照しながら、上記限
定された候補文字のみについて、それぞれ比較計算をす
る。認識文字出力手段(5)は、詳細識別手段(4)で
識別された文字の中から特定の文字を選定して当該文字
を表わす信号を出力する。
を表検索手段(8)に通知し、表検索手段(8)は通知
された候補文字の中から所定の基準で1つまたは複数の
候補文字を選ぶ。そして、候補文字数対応表(7)を参
照して、上記選ばれた候補文字に対応する候補文字数を
検索する。候補文字限定手段(9)は、検索した候補文
字数を基に1つの候補文字数を決定し、この限定された
候補文字を詳細識別手段(4)に送り出す。詳細識別手
段(4)は、認識用辞書(6)を参照しながら、上記限
定された候補文字のみについて、それぞれ比較計算をす
る。認識文字出力手段(5)は、詳細識別手段(4)で
識別された文字の中から特定の文字を選定して当該文字
を表わす信号を出力する。
〈実施例〉
以下実施例を示す添付図面によって詳細に説明する。
第2図は、本発明の文字認識装置の一構成を示すブロッ
ク図であり、(1a)は原稿全体を写し出すビジコン等
のイメージカメラ、およびその出力信号を二値化して整
形された信号を得る二値化回路からなる画像入力部を表
わす。画像信号は、文字切り出し手段(lb)によって
1字1字ごとに細分される。特徴抽出手段(2)は、各
文字の特徴量を抽出する。例えば、文字輪郭線の方向ベ
クトルのヒストグラムや空白部領域量の分布である。こ
の特徴量は、大分類識別手段(3)に入力され、大分類
識別手段(3)は、演算時間の短い簡単な識別関数、例
えばシティ・ブロック関数や線形−次関数等で全字種と
の相違度を計算する。そして、複数の候補文字を選定す
る。
ク図であり、(1a)は原稿全体を写し出すビジコン等
のイメージカメラ、およびその出力信号を二値化して整
形された信号を得る二値化回路からなる画像入力部を表
わす。画像信号は、文字切り出し手段(lb)によって
1字1字ごとに細分される。特徴抽出手段(2)は、各
文字の特徴量を抽出する。例えば、文字輪郭線の方向ベ
クトルのヒストグラムや空白部領域量の分布である。こ
の特徴量は、大分類識別手段(3)に入力され、大分類
識別手段(3)は、演算時間の短い簡単な識別関数、例
えばシティ・ブロック関数や線形−次関数等で全字種と
の相違度を計算する。そして、複数の候補文字を選定す
る。
各候補文字のデータは表検索手段(8)に送られ、表検
索手段(8)は、候補文字数対応表(7)を用いて、候
補文字のうちの最上位の文字(相違度が最少である文字
)、または上位数位の文字について候補文字数対応表(
7)から候補文字数を検索する。候補文字限定手段(9
)は、これらの候補文字数に基づいて1つの候補文字数
nを決定し、候補文字群の中から上位n個の候補文字を
詳細識別手段(4)に送り出す。候補文字数対応表(力
の内容は、候補文字数対応表(7)の作成時に予め決定
しておけばよいが、実際に使用した結果により内容を更
新していくことが好ましい。例えば、文字認識装置に学
習機能を付け、学習により更新されるようにすればよい
。
索手段(8)は、候補文字数対応表(7)を用いて、候
補文字のうちの最上位の文字(相違度が最少である文字
)、または上位数位の文字について候補文字数対応表(
7)から候補文字数を検索する。候補文字限定手段(9
)は、これらの候補文字数に基づいて1つの候補文字数
nを決定し、候補文字群の中から上位n個の候補文字を
詳細識別手段(4)に送り出す。候補文字数対応表(力
の内容は、候補文字数対応表(7)の作成時に予め決定
しておけばよいが、実際に使用した結果により内容を更
新していくことが好ましい。例えば、文字認識装置に学
習機能を付け、学習により更新されるようにすればよい
。
また、学習という方法を取らず、人為的に更新していっ
てもよい。
てもよい。
詳細識別手段(4)では、上記n個の候補文字のそれぞ
れについて相違度を計算する。例えば、認識用辞書(6
)に入っている候補文字の特徴量と、特徴抽出手段(2
)で求められた特徴量との距離を求めてもよい。
れについて相違度を計算する。例えば、認識用辞書(6
)に入っている候補文字の特徴量と、特徴抽出手段(2
)で求められた特徴量との距離を求めてもよい。
このようにして、各候補文字につき相違度が求まるので
、順位決定手段(51)は相違度の小さいものから順に
並べ変え、第一順位の文字コードを出力する。
、順位決定手段(51)は相違度の小さいものから順に
並べ変え、第一順位の文字コードを出力する。
次に、以上の文字認識装置の動作を「本日は晴天なり」
と書かれた原稿の最初の文字「本」を認識する場合を例
にとって説明する。
と書かれた原稿の最初の文字「本」を認識する場合を例
にとって説明する。
画像入力部(1a)が「本日は晴天なり」と書かれた原
稿を読み取ると、文字切り出し手段(1b)は「本」
1日」 「は」 「晴」 「天」 「な」 「す」とい
った単文字に画像信号を変換する。そして特徴抽出手段
(2)は、「本」の特徴量X (Xl、X2.−、X
n)を抽出する。大分類識別手段(3)は、前述したよ
うな手法で複数(例えば50程度)の候補文字「本」「
木」 「水」 「承」・・・を選定する。表検索手段(
8)は、例えば候補文字のうちの最上位の文字「本」に
ついて候補文字数を検索し、候補文字数対応表(7)か
ら3との結果を得る。候補文字限定手段(9)は、上位
3位の候補文字「本」 「木」 「水」を限定し、詳細
識別手段(4)に供給する。詳細識別手段(4)は、上
記3文字のみについて距離計算を行う。認識用辞書(6
)に入っている候補文字「本」の特徴量をA(A1.A
2.−An)、「木」の特徴量をB (Bl、B2.−
・・Bn)、r水」の特徴量をC(CL、C2,−Cn
)とすると、下記のシティ・ブロック関数により距離X
−A I −[(XI−Al)2 +(X2−A2)2
+−+ (Xn−An) 2 コ 1/2X −B
l −[(Xi−Bl)2 +(X2−82)2+−
+ (Xn−Bn)2] 112X −CI −[(
Xi−C1)2 +(X2−02)2+−+ (X
n−Cn) 2 コ l/2を求める。
稿を読み取ると、文字切り出し手段(1b)は「本」
1日」 「は」 「晴」 「天」 「な」 「す」とい
った単文字に画像信号を変換する。そして特徴抽出手段
(2)は、「本」の特徴量X (Xl、X2.−、X
n)を抽出する。大分類識別手段(3)は、前述したよ
うな手法で複数(例えば50程度)の候補文字「本」「
木」 「水」 「承」・・・を選定する。表検索手段(
8)は、例えば候補文字のうちの最上位の文字「本」に
ついて候補文字数を検索し、候補文字数対応表(7)か
ら3との結果を得る。候補文字限定手段(9)は、上位
3位の候補文字「本」 「木」 「水」を限定し、詳細
識別手段(4)に供給する。詳細識別手段(4)は、上
記3文字のみについて距離計算を行う。認識用辞書(6
)に入っている候補文字「本」の特徴量をA(A1.A
2.−An)、「木」の特徴量をB (Bl、B2.−
・・Bn)、r水」の特徴量をC(CL、C2,−Cn
)とすると、下記のシティ・ブロック関数により距離X
−A I −[(XI−Al)2 +(X2−A2)2
+−+ (Xn−An) 2 コ 1/2X −B
l −[(Xi−Bl)2 +(X2−82)2+−
+ (Xn−Bn)2] 112X −CI −[(
Xi−C1)2 +(X2−02)2+−+ (X
n−Cn) 2 コ l/2を求める。
なお、前述した大分類識別の際でも、このシティ・ブロ
ック関数が使われることがあるが、大分類識別の際は、
すべての項(1〜n)について総和をとるのではなく、
例えば、3つ飛ばしとか5つ飛ばしに「間引いて」高速
に計算する点で、この詳細分類の計算手順と異なってい
る。
ック関数が使われることがあるが、大分類識別の際は、
すべての項(1〜n)について総和をとるのではなく、
例えば、3つ飛ばしとか5つ飛ばしに「間引いて」高速
に計算する点で、この詳細分類の計算手順と異なってい
る。
順位決定手段(51)は距離の小さいものから順に並べ
変え、第一順位の文字コードを出力する。
変え、第一順位の文字コードを出力する。
なお、このように候補文字の数を限定して詳細分類する
こととしても、候補文字数の少ない入力文字はど、上位
に正続文字が入っているので、認識性能が低下すること
はない。
こととしても、候補文字数の少ない入力文字はど、上位
に正続文字が入っているので、認識性能が低下すること
はない。
以上のようにして、「本日は晴天なり」全ての文字に対
して、決定された候補文字数を示すグラフを第3図に示
す。「本」 「日」等のように「簡単」な文字に対して
は候補文字数は2〜3と少ないが、「晴」 「天」のよ
うな「複雑」な文字に対しては候補文字数は5〜8と多
くなっている。
して、決定された候補文字数を示すグラフを第3図に示
す。「本」 「日」等のように「簡単」な文字に対して
は候補文字数は2〜3と少ないが、「晴」 「天」のよ
うな「複雑」な文字に対しては候補文字数は5〜8と多
くなっている。
以上の手法により、「本日は晴天なり」を認識するのに
要した時間を第4図に示す。
要した時間を第4図に示す。
第4図(a)は、従来の文字認識装置で認識した時間を
示すものであり、各文字について同じ計算時間tがかか
っているので、全ての文字に対しては、 X7 の時間がかかる。一方、第4図(b)は本実施例の文字
認識装置を用いて認識した時間を示し、各文字の「複雑
」さの相違に応じて計算時間t 1. t 2゜X7が
異なっている。この結果、全体としての認識時間は、 t=Σtn となり、第4図(a)の場合よりも短縮できることが分
かる。
示すものであり、各文字について同じ計算時間tがかか
っているので、全ての文字に対しては、 X7 の時間がかかる。一方、第4図(b)は本実施例の文字
認識装置を用いて認識した時間を示し、各文字の「複雑
」さの相違に応じて計算時間t 1. t 2゜X7が
異なっている。この結果、全体としての認識時間は、 t=Σtn となり、第4図(a)の場合よりも短縮できることが分
かる。
なお、上記の実施例では、候補文字のうちの最上位の文
字「本」のみに基づいて候補文字数を決定する例を示し
たが、これに限定されるものではなく、上位数文字につ
いてそれぞれ候補文字数を求め、求めた複数の候補文字
数に基づき1つの候補文字数を決定するようにしてもよ
い。例えば、上位3文字「本」 「木」 「水」の候補
文字数がそれぞれ3,4.5であったとすると、これら
の候補文字数の平均値をとったり、最大値、最小値をと
ったりして1つの候補文字数を決定してもよい。
字「本」のみに基づいて候補文字数を決定する例を示し
たが、これに限定されるものではなく、上位数文字につ
いてそれぞれ候補文字数を求め、求めた複数の候補文字
数に基づき1つの候補文字数を決定するようにしてもよ
い。例えば、上位3文字「本」 「木」 「水」の候補
文字数がそれぞれ3,4.5であったとすると、これら
の候補文字数の平均値をとったり、最大値、最小値をと
ったりして1つの候補文字数を決定してもよい。
なぜなら、大分類の結実現れる候補文字群に含まれる各
候補文字は、候補文字数対応表(7)の中では、おおむ
ね等しい候補文字数を伴っていると考えられるので、最
上位の文字のみについて候補文字数を決定しても、上位
幾つかの文字について候補文字数を決定しても、結果は
あまり異ならないからである。
候補文字は、候補文字数対応表(7)の中では、おおむ
ね等しい候補文字数を伴っていると考えられるので、最
上位の文字のみについて候補文字数を決定しても、上位
幾つかの文字について候補文字数を決定しても、結果は
あまり異ならないからである。
また、上記の実施例では、詳細識別手段(4)は、単純
に距離を求めていたが、認識率を上げるため、もっと複
雑な計算式を用いることも可能であるのは勿論である。
に距離を求めていたが、認識率を上げるため、もっと複
雑な計算式を用いることも可能であるのは勿論である。
このときでも、候補文字の「簡単」さに応じて計算する
候補文字数を限定することができるので、本発明は、計
算時間の短縮に非常に効果的である。
候補文字数を限定することができるので、本発明は、計
算時間の短縮に非常に効果的である。
また、上記実施例では、イメージカメラを用いて原稿画
像を入力していたが、これに限定されるものではなく、
ファクシミリ等通信回線を通して画像上方を入力するも
のであってもよい。
像を入力していたが、これに限定されるものではなく、
ファクシミリ等通信回線を通して画像上方を入力するも
のであってもよい。
その池水発明の要旨を変更しない範囲内において、種々
の設計変更を施すことが可能である。
の設計変更を施すことが可能である。
〈発明の効果〉
以上のように、本発明の文字認識装置によれば、文字の
「複雑」 「簡単」の度合いに応じて詳細計算する候補
文字の数を予め決定して計算候補文字数対応表に記憶さ
せておき、大分類された候補文字群について1つの候補
文字数を決定した。
「複雑」 「簡単」の度合いに応じて詳細計算する候補
文字の数を予め決定して計算候補文字数対応表に記憶さ
せておき、大分類された候補文字群について1つの候補
文字数を決定した。
したがって、従来全ての候補文字に対して詳細計算して
いたため計算時間がかかっていたところ、本発明では、
−人力文字当たり、限定された候補文字のみについて比
較計算できるため、文字認識時間を短縮することができ
る。特に「簡単」な文字の認識に要する時間が著しく短
縮されるので、「複雑」 「簡単」な文字の混在する一
般の文書の認識に当たって、−文字当たりの平均認識時
間を短縮できる。このため、同じ認識時間を許されるな
らば文字認識の精度を高めることができ、文字認識装置
としての認識性能の向上を実現することができる。
いたため計算時間がかかっていたところ、本発明では、
−人力文字当たり、限定された候補文字のみについて比
較計算できるため、文字認識時間を短縮することができ
る。特に「簡単」な文字の認識に要する時間が著しく短
縮されるので、「複雑」 「簡単」な文字の混在する一
般の文書の認識に当たって、−文字当たりの平均認識時
間を短縮できる。このため、同じ認識時間を許されるな
らば文字認識の精度を高めることができ、文字認識装置
としての認識性能の向上を実現することができる。
第1図は本発明の文字認識装置の構成を示すプロ
0ツク図、
第2図は文字認識装置一実施例を示すブロック構成図、
第3図は各入力文字に対応して決定された候補文字数の
グラフ、 第4図は文字認識時間の従来例との比較表、第5図は従
来の文字認識装置の構成を示すブロック図である。 (1)・・・画像信号取得手段、(2)・・・特徴量抽
出手段、■・・・大分類識別手段、(4)・・・詳細識
別手段、■・・・認識文字出力手段、(6)・・・認識
用辞書、(7)・・・候補文字数対応表、(8)・・・
表検索手段、(9)・・・候補文字限定手段 特許出願人 住友電気工業株式会社 代 理 人
グラフ、 第4図は文字認識時間の従来例との比較表、第5図は従
来の文字認識装置の構成を示すブロック図である。 (1)・・・画像信号取得手段、(2)・・・特徴量抽
出手段、■・・・大分類識別手段、(4)・・・詳細識
別手段、■・・・認識文字出力手段、(6)・・・認識
用辞書、(7)・・・候補文字数対応表、(8)・・・
表検索手段、(9)・・・候補文字限定手段 特許出願人 住友電気工業株式会社 代 理 人
Claims (1)
- 【特許請求の範囲】 1、文字を含む被読取対象を表わす画像信 号を取得する画像信号取得手段と、上記 画像信号に基づき画像中の認識しようと する文字の特徴量を抽出する特徴量抽出 手段と、上記特徴量を基に演算を行い複 数の候補文字を選定する大分類識別手段 と、各文字の認識に必要な特徴量に関す る情報を記憶した認識用辞書と、上記認 識しようとする文字の特徴量を認識用辞 書に記憶された候補文字の情報と比較し 特徴量比較計算を行う詳細識別手段と、 詳細識別手段で識別された文字の中から 一定の基準で文字を選択して当該文字を 表わす信号を出力する認識文字出力手段 とを有する文字認識装置において、 特徴量比較計算をする時の候補文字数 を指定する定数を各文字に対応して記憶 している候補文字数対応表と、上記候補 文字の中から所定の基準で1つまたは複 数の候補文字を選び出し、この選び出し た候補文字に対応する候補文字数を検索 する表検索手段と、検索した候補文字数 を基に1つの候補文字数を決定して当該 候補文字数に対応する候補文字を詳細識 別手段に送り出す候補文字限定手段とを 具備し、かつ、上記詳細識別手段が候補 文字限定手段から指定された候補文字に 対して特徴量比較計算をすることを特徴 とする文字認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1012721A JPH02193281A (ja) | 1989-01-20 | 1989-01-20 | 文字認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1012721A JPH02193281A (ja) | 1989-01-20 | 1989-01-20 | 文字認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH02193281A true JPH02193281A (ja) | 1990-07-30 |
Family
ID=11813294
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1012721A Pending JPH02193281A (ja) | 1989-01-20 | 1989-01-20 | 文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH02193281A (ja) |
-
1989
- 1989-01-20 JP JP1012721A patent/JPH02193281A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3689455B2 (ja) | 情報処理方法及び装置 | |
| US6542635B1 (en) | Method for document comparison and classification using document image layout | |
| JPH0664631B2 (ja) | 文字認識装置 | |
| JPH087033A (ja) | 情報処理方法及び装置 | |
| JP3917349B2 (ja) | 文字認識結果を利用して情報を検索する検索装置および方法 | |
| JPS60153574A (ja) | 文字読取方法 | |
| JPH02193281A (ja) | 文字認識装置 | |
| KR19990016894A (ko) | 영상 데이터베이스 검색방법 | |
| JP2586372B2 (ja) | 情報検索装置及び情報検索方法 | |
| JPH02193280A (ja) | 文字認識装置 | |
| JPH05314320A (ja) | 認識距離の差と候補順を利用した認識結果の評価方式 | |
| JPH0766423B2 (ja) | 文字認識装置 | |
| JP2976445B2 (ja) | 文字認識装置 | |
| JP2996823B2 (ja) | 文字認識装置 | |
| JP3720405B2 (ja) | 領域識別装置及び方法 | |
| JP2728117B2 (ja) | 文字認識装置 | |
| JP4215385B2 (ja) | パターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
| JP2851865B2 (ja) | 文字認識装置 | |
| KR100292352B1 (ko) | 형태소 분석을 이용한 인식기의 편집방법 | |
| JP2622004B2 (ja) | 文字認識装置 | |
| JP2969751B2 (ja) | 文字認識処理方式 | |
| JP2886690B2 (ja) | 光学的文字読取装置における文字認識方法 | |
| JPS6252912B2 (ja) | ||
| JPH0528323A (ja) | 文字認識装置 | |
| JPS60138688A (ja) | 文字認識方法 |