JPH03282689A

JPH03282689A - 文字認識装置

Info

Publication number: JPH03282689A
Application number: JP2086300A
Authority: JP
Inventors: Kenji Mishima; 三縞　健司
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1990-03-29
Filing date: 1990-03-29
Publication date: 1991-12-12

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［発明の目的］（産業上の利用分野）本発明は、光学的文字読取装置に用いられる文字認識装
置に係り、特に漢字等の認識するカテゴリ数か多い場合
に好適な文字認識装置に関する。

（従来の技術）従来から、漢字等のカテゴリ数が多い文字セットを読取
る光学的文字読取装置における文字認識方式として、認
識部の前段に大分類部を設けることにより、文字認識の
前に大まかな文字の絞り込みを行う方式か知られている
。

この文字認識処理の流れを説明すると、まず入力文字パ
ターンから大分類用および認識用の特徴ベクトルを求め
る。この後、求められた大分類用の特徴ベクトルから、
大分類辞書を用いて複合類似度法等により大分類文字候
補を判定する。そして、判定した大分類文字候補に対応
する認識辞書を用いて、入力文字パターンより求めた認
識用の特徴ヘクトルから複合類似度法窩により文字認識
結果を？１ノる。

ところで、上述の大分類および文字認識に用いる特徴ベ
クトルとしては種々のものが知られているが、その一つ
として、縦Ｘ画素、横Ｙ画素のメツシュで表された２値
の入力文字パターンを、縦横にそれぞれＮ分割したＮＸ
Ｎ個のブロックに分割し、各ブロック中の黒画素数を特
徴量としたＮ×Ｎ次元ベクトルを認識用の特徴ベクトル
とし、さらにこのＮＸＮ次元ベクトルにポカン処理およ
びｔ悪水化処理を施してＭＸＭ次元ベクトル（イＹ］シ
Ｍ＜Ｎ）としたものを大分類用の特徴ベクトルとして用
いる方式かある。

方、複合類似度法に用いられる辞書としては、文字セッ
トのカテゴリ毎に多数のパターンを集め、各パターンに
対して大分類用および認識用の特徴ベクトルを抽出し、
正桑化およびノルムの正規化を行ったものをそれぞれ主
成分分析した結果の固有点および固有ベクトルか用いら
れている。

尚、大分類辞書の面数にと認識辞書の面数りとの関係は
Ｋ　＜　Ｌとするのか普通である。

しかしながら、複合類似度法に限らす、一般に文字認識
処理に必要な辞書を格納する記憶装置はザイスが大きい
という問題があり、特に上述した大分類用と認識用の辞
書を持つシステムでは、２つの辞書か必要となるためそ
の分コスト高になるという難点があった。

（発明か解決１〜ようとする課題）このように、漢字等のカテゴリ数か多い文字セットを認
識の対象とした文字認識装置では、大分類用と認識用の
２つの辞書を（ｉｉｉえる必要かあることから、コスト
高になるという問題があった。

本発明はこのような課題を解決するためのもので、大分
類処理の実行に作って知識辞書から大分類辞書を作成す
ることにより、構成において大分類辞書用の記憶装置を
必要としない安価な文字認識装置の提供を目的としてい
る。

［発明の構成］（課題を解決するための手段）本発明の文字認識装置は上記目的を達成するために、入
力文字パターンから大分類用および文字認識用の特徴を
それぞれ抽出する特徴抽出手段と、文字認識のための標
準パターンを定義する認識辞書が予め格納された認識辞
書格納手段と、大分類処理の実行に伴って、認識辞書格
納手段に格納された認識辞書から大分類辞書を生成する
大分類辞書生成手段と、この大分類辞書生成手段により
生成された大分類辞書を用いて、特徴抽出手段により抽
出された大分類用の特徴に基つき大分類文字候補を判定
する大分類手段と、この大分類手段により判定された大
分類文字候補に対応する認識辞書を用いて、特徴抽出手
段により抽出された文字認識用の特徴に基づき文字認識
を行う認識手段とを具備したものである。

（作　用）本発明の文字認識装置では、大分類辞書生成手段が、大
分類処理の実行に伴って認識辞書格納手段に格納された
認識辞書から大分類辞書を生成して、これを大分類手段
に１申力するので、構成において大分類辞書用の記憶装
置を用意する必要かなくなり、コストダウンを図ること
かできる。

（実施例）以下、本発明の実施例を図面に基ついて説明する。

第１図は本発明に係る一実施例の文字認識装置の構成を
説明するためのブロック図である。

同図において、１はザイスを正規化した入力文字パター
ンから大分類用のＮｘＮ次元特徴ベクトルおよび認識用
のＭＸＭ次元特徴ベクトル（但しＭ　＜　Ｎ　）をそれ
ぞれ求める特徴抽出部、２は文字認識のための標準パタ
ーンを定義するＬ面からなるＮＸＮ次元固有ペター・ル
が認識辞書として予め格納された認識辞書部、３は大分
類処理の実行に伴い、認識辞書部２に格納された認識辞
書の中の第１面〜第に面（イ目しＫ　＜　Ｌ　）のＮＸ
Ｎ次元固有ベクトルに対し所定のマスク処理を施すこと
により、大分類用のに面からなるＭ　ｘ　Ｍ次元固有ベ
クトルを大分類辞書として生成する大分類辞書生成部で
ある。また４は大分類辞書生成部３により生成された大
分類辞書を用いて、特徴抽出部］より出力された大分類
用の特徴ベクトルから複合類似度θ、−５によって大分
類文字候補を判定する大分類部、５は大分類部４により
判定された大分類文字候補に対応する認識辞書を用いて
、特徴抽１」１部１より出力された認識用の特徴ヘクト
ルから複合類似度法等によって認識結果を求める認識部
である。

次にこの文字認識装置の動作を第２図および第３図を用
い−Ｃ説明する。

第２図において、Ａは縦２５画素、横２５画素のメッシ
ュで表された２値の入力文字パターンを示している。こ
の入力文字パターンか特徴抽出部１に入力されると、特
徴抽出部１は、まず全画素領域を縦横にそれぞれＮ分割
（この実施例では５分割）してＮＸＮ個のブロックに分
割する。この後、各ブロック中の黒画素数を数え、各ブ
ロック毎の黒画素数を特徴間としたＮＸＮ次元ベクＩ・
ルＢを認識用の特徴ベクトルとして求める。

また特徴抽出部１は、このＮＸＮ次元ベクトルＢにおい
て予め位置が定められた複数の標本化点（図中二重枠で
示す）に、ＭＸＭ次元（この実施例ではＭ−３）のポカ
ン処理マスクＣの中心位置を重ねてそれぞれ整合する位
置同志の値を掛は合せ、さらに掛は合せた６値の和を求
めることによるマスク処理を行う。これによりＭＸＭ次
元の大分類用の特徴ベクＩ・ルＤを生成する。尚、上記
マスク処理の計％において、ＮＸＮ次元ベクトルＢの外
側の黒画素数は０”とする。

この後、大分類辞書生成部３は、大分類処理の実行に伴
い、第３図に示すように、認識辞書部２に格納された認
識辞書Ｅの中の第１面〜第に面のＮＸＮ次元固有ベクト
ルに対し、特徴抽出部１て用いたものと同しポカン処理
マスクＣ′を用いて順次同様のマスク処理を施すことに
より、ＭＸＭ次元の固有ベクトルからなる大分類辞書Ｆ
を生成する。

そして大分類部４は、この大分類辞書生成部３において
順次生成された大分類辞書Ｆを用いて、特徴抽出部１よ
り出力された大分類用の特徴ベクトルから複合類似度法
等により大分類文字候補を判定し、これを認識部５に出
力する。

この後、認識部５は、大分類部４により判定された大分
類文字候補に対応する認識辞書Ｅを用いて、特徴抽出部
］より出力された文字認識用の特徴ペター・ルから複合
類似度法等によって認識結果を求める。

かくしてこの実施例の文字認識装置によれば、大分類処
理の実行に伴って、認識辞書部２に格納された認識辞書
から大分類辞書をマスク処理にて生成し、これを大分類
部４に出力することかできるので、構成において大分類
辞書用の記憶装置を用意する必要がなくなり、その分の
コストダウンを図ることかできる。

尚、本発明はこの実施例に限定されるものではなく、技
術的思想の範囲内において種々の変形か可能である。

例えは、この実施例では、入力文字パターンの特徴間と
して黒画素数を用いたが、輪郭線の長さを特徴間として
用いてもよい。

また、入力文字パターンの正規化後の縦横分割ブロック
数は前記実施例では同じとしたか、縦横異なるものとし
てもかまわない。

さらに、前記実施例では、大分類処理の実行に伴って認
識辞書から大分類辞書を生成しているか、１面分あるい
は］カテゴリ分の大分類辞書メモリを用意しておき、認
識辞書を基に生成した大分類辞書をこのメモリに一時的
に蓄えながら大分類処理を４７つようにしてもよい。

［発明の効果］以上説明したように本発明の文′−ｆｌ認識装置によれ
ば、大分類処理の実行に作って知識辞書から大分類辞書
を作成することにより、ｆｊ、ｊ成において大分類辞書
用の記憶装置を省くことかでき、コストダウンを図るこ
とかできる。

【図面の簡単な説明】

第１図は本発明に係る一実施例の文字認識装置の＋１１
４成を説明するだめのブロック図、第２図は第１図の文
字認識装置において大分類用および認識用の特徴ヘクト
ルを求める流れを説明するための図、第３図は第１図の
文字認識装置において認識辞円から大分類辞書を生成す
る流れを説明するための図である。］　０１・特徴抽出部、２・・・認識辞書部、３・・大分類辞
書生成部、４・・・大分類部、５・認識部。

Claims

【特許請求の範囲】入力文字パターンから大分類用および文字認識用の特徴
をそれぞれ抽出する特徴抽出手段と、文字認識のための
標準パターンを定義する認識辞書が予め格納された認識
辞書格納手段と、大分類処理の実行に伴って、前記認識
辞書格納手段に格納された認識辞書から大分類辞書を生
成する大分類辞書生成手段と、この大分類辞書生成手段により生成された大分類辞書を
用いて、前記特徴抽出手段により抽出された大分類用の
特徴に基づき大分類文字候補を判定する大分類手段と、この大分類手段により判定された大分類文字候補に対応
する前記認識辞書を用いて、前記特徴抽出手段により抽
出された文字認識用の特徴に基づき文字認識を行う認識
手段とを具備することを特徴とする文字認識装置。