JPH03282689A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH03282689A JPH03282689A JP2086300A JP8630090A JPH03282689A JP H03282689 A JPH03282689 A JP H03282689A JP 2086300 A JP2086300 A JP 2086300A JP 8630090 A JP8630090 A JP 8630090A JP H03282689 A JPH03282689 A JP H03282689A
- Authority
- JP
- Japan
- Prior art keywords
- major classification
- recognition
- dictionary
- character
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[発明の目的]
(産業上の利用分野)
本発明は、光学的文字読取装置に用いられる文字認識装
置に係り、特に漢字等の認識するカテゴリ数か多い場合
に好適な文字認識装置に関する。
置に係り、特に漢字等の認識するカテゴリ数か多い場合
に好適な文字認識装置に関する。
(従来の技術)
従来から、漢字等のカテゴリ数が多い文字セットを読取
る光学的文字読取装置における文字認識方式として、認
識部の前段に大分類部を設けることにより、文字認識の
前に大まかな文字の絞り込みを行う方式か知られている
。
る光学的文字読取装置における文字認識方式として、認
識部の前段に大分類部を設けることにより、文字認識の
前に大まかな文字の絞り込みを行う方式か知られている
。
この文字認識処理の流れを説明すると、まず入力文字パ
ターンから大分類用および認識用の特徴ベクトルを求め
る。この後、求められた大分類用の特徴ベクトルから、
大分類辞書を用いて複合類似度法等により大分類文字候
補を判定する。そして、判定した大分類文字候補に対応
する認識辞書を用いて、入力文字パターンより求めた認
識用の特徴ヘクトルから複合類似度法窩により文字認識
結果を?1ノる。
ターンから大分類用および認識用の特徴ベクトルを求め
る。この後、求められた大分類用の特徴ベクトルから、
大分類辞書を用いて複合類似度法等により大分類文字候
補を判定する。そして、判定した大分類文字候補に対応
する認識辞書を用いて、入力文字パターンより求めた認
識用の特徴ヘクトルから複合類似度法窩により文字認識
結果を?1ノる。
ところで、上述の大分類および文字認識に用いる特徴ベ
クトルとしては種々のものが知られているが、その一つ
として、縦X画素、横Y画素のメツシュで表された2値
の入力文字パターンを、縦横にそれぞれN分割したNX
N個のブロックに分割し、各ブロック中の黒画素数を特
徴量としたN×N次元ベクトルを認識用の特徴ベクトル
とし、さらにこのNXN次元ベクトルにポカン処理およ
びt悪水化処理を施してMXM次元ベクトル(イY]シ
M<N)としたものを大分類用の特徴ベクトルとして用
いる方式かある。
クトルとしては種々のものが知られているが、その一つ
として、縦X画素、横Y画素のメツシュで表された2値
の入力文字パターンを、縦横にそれぞれN分割したNX
N個のブロックに分割し、各ブロック中の黒画素数を特
徴量としたN×N次元ベクトルを認識用の特徴ベクトル
とし、さらにこのNXN次元ベクトルにポカン処理およ
びt悪水化処理を施してMXM次元ベクトル(イY]シ
M<N)としたものを大分類用の特徴ベクトルとして用
いる方式かある。
方、複合類似度法に用いられる辞書としては、文字セッ
トのカテゴリ毎に多数のパターンを集め、各パターンに
対して大分類用および認識用の特徴ベクトルを抽出し、
正桑化およびノルムの正規化を行ったものをそれぞれ主
成分分析した結果の固有点および固有ベクトルか用いら
れている。
トのカテゴリ毎に多数のパターンを集め、各パターンに
対して大分類用および認識用の特徴ベクトルを抽出し、
正桑化およびノルムの正規化を行ったものをそれぞれ主
成分分析した結果の固有点および固有ベクトルか用いら
れている。
尚、大分類辞書の面数にと認識辞書の面数りとの関係は
K < Lとするのか普通である。
K < Lとするのか普通である。
しかしながら、複合類似度法に限らす、一般に文字認識
処理に必要な辞書を格納する記憶装置はザイスが大きい
という問題があり、特に上述した大分類用と認識用の辞
書を持つシステムでは、2つの辞書か必要となるためそ
の分コスト高になるという難点があった。
処理に必要な辞書を格納する記憶装置はザイスが大きい
という問題があり、特に上述した大分類用と認識用の辞
書を持つシステムでは、2つの辞書か必要となるためそ
の分コスト高になるという難点があった。
(発明か解決1〜ようとする課題)
このように、漢字等のカテゴリ数か多い文字セットを認
識の対象とした文字認識装置では、大分類用と認識用の
2つの辞書を(iiiえる必要かあることから、コスト
高になるという問題があった。
識の対象とした文字認識装置では、大分類用と認識用の
2つの辞書を(iiiえる必要かあることから、コスト
高になるという問題があった。
本発明はこのような課題を解決するためのもので、大分
類処理の実行に作って知識辞書から大分類辞書を作成す
ることにより、構成において大分類辞書用の記憶装置を
必要としない安価な文字認識装置の提供を目的としてい
る。
類処理の実行に作って知識辞書から大分類辞書を作成す
ることにより、構成において大分類辞書用の記憶装置を
必要としない安価な文字認識装置の提供を目的としてい
る。
[発明の構成]
(課題を解決するための手段)
本発明の文字認識装置は上記目的を達成するために、入
力文字パターンから大分類用および文字認識用の特徴を
それぞれ抽出する特徴抽出手段と、文字認識のための標
準パターンを定義する認識辞書が予め格納された認識辞
書格納手段と、大分類処理の実行に伴って、認識辞書格
納手段に格納された認識辞書から大分類辞書を生成する
大分類辞書生成手段と、この大分類辞書生成手段により
生成された大分類辞書を用いて、特徴抽出手段により抽
出された大分類用の特徴に基つき大分類文字候補を判定
する大分類手段と、この大分類手段により判定された大
分類文字候補に対応する認識辞書を用いて、特徴抽出手
段により抽出された文字認識用の特徴に基づき文字認識
を行う認識手段とを具備したものである。
力文字パターンから大分類用および文字認識用の特徴を
それぞれ抽出する特徴抽出手段と、文字認識のための標
準パターンを定義する認識辞書が予め格納された認識辞
書格納手段と、大分類処理の実行に伴って、認識辞書格
納手段に格納された認識辞書から大分類辞書を生成する
大分類辞書生成手段と、この大分類辞書生成手段により
生成された大分類辞書を用いて、特徴抽出手段により抽
出された大分類用の特徴に基つき大分類文字候補を判定
する大分類手段と、この大分類手段により判定された大
分類文字候補に対応する認識辞書を用いて、特徴抽出手
段により抽出された文字認識用の特徴に基づき文字認識
を行う認識手段とを具備したものである。
(作 用)
本発明の文字認識装置では、大分類辞書生成手段が、大
分類処理の実行に伴って認識辞書格納手段に格納された
認識辞書から大分類辞書を生成して、これを大分類手段
に1申力するので、構成において大分類辞書用の記憶装
置を用意する必要かなくなり、コストダウンを図ること
かできる。
分類処理の実行に伴って認識辞書格納手段に格納された
認識辞書から大分類辞書を生成して、これを大分類手段
に1申力するので、構成において大分類辞書用の記憶装
置を用意する必要かなくなり、コストダウンを図ること
かできる。
(実施例)
以下、本発明の実施例を図面に基ついて説明する。
第1図は本発明に係る一実施例の文字認識装置の構成を
説明するためのブロック図である。
説明するためのブロック図である。
同図において、1はザイスを正規化した入力文字パター
ンから大分類用のNxN次元特徴ベクトルおよび認識用
のMXM次元特徴ベクトル(但しM < N )をそれ
ぞれ求める特徴抽出部、2は文字認識のための標準パタ
ーンを定義するL面からなるNXN次元固有ペター・ル
が認識辞書として予め格納された認識辞書部、3は大分
類処理の実行に伴い、認識辞書部2に格納された認識辞
書の中の第1面〜第に面(イ目しK < L )のNX
N次元固有ベクトルに対し所定のマスク処理を施すこと
により、大分類用のに面からなるM x M次元固有ベ
クトルを大分類辞書として生成する大分類辞書生成部で
ある。また4は大分類辞書生成部3により生成された大
分類辞書を用いて、特徴抽出部]より出力された大分類
用の特徴ベクトルから複合類似度θ、−5によって大分
類文字候補を判定する大分類部、5は大分類部4により
判定された大分類文字候補に対応する認識辞書を用いて
、特徴抽1」1部1より出力された認識用の特徴ヘクト
ルから複合類似度法等によって認識結果を求める認識部
である。
ンから大分類用のNxN次元特徴ベクトルおよび認識用
のMXM次元特徴ベクトル(但しM < N )をそれ
ぞれ求める特徴抽出部、2は文字認識のための標準パタ
ーンを定義するL面からなるNXN次元固有ペター・ル
が認識辞書として予め格納された認識辞書部、3は大分
類処理の実行に伴い、認識辞書部2に格納された認識辞
書の中の第1面〜第に面(イ目しK < L )のNX
N次元固有ベクトルに対し所定のマスク処理を施すこと
により、大分類用のに面からなるM x M次元固有ベ
クトルを大分類辞書として生成する大分類辞書生成部で
ある。また4は大分類辞書生成部3により生成された大
分類辞書を用いて、特徴抽出部]より出力された大分類
用の特徴ベクトルから複合類似度θ、−5によって大分
類文字候補を判定する大分類部、5は大分類部4により
判定された大分類文字候補に対応する認識辞書を用いて
、特徴抽1」1部1より出力された認識用の特徴ヘクト
ルから複合類似度法等によって認識結果を求める認識部
である。
次にこの文字認識装置の動作を第2図および第3図を用
い−C説明する。
い−C説明する。
第2図において、Aは縦25画素、横25画素のメッシ
ュで表された2値の入力文字パターンを示している。こ
の入力文字パターンか特徴抽出部1に入力されると、特
徴抽出部1は、まず全画素領域を縦横にそれぞれN分割
(この実施例では5分割)してNXN個のブロックに分
割する。この後、各ブロック中の黒画素数を数え、各ブ
ロック毎の黒画素数を特徴間としたNXN次元ベクI・
ルBを認識用の特徴ベクトルとして求める。
ュで表された2値の入力文字パターンを示している。こ
の入力文字パターンか特徴抽出部1に入力されると、特
徴抽出部1は、まず全画素領域を縦横にそれぞれN分割
(この実施例では5分割)してNXN個のブロックに分
割する。この後、各ブロック中の黒画素数を数え、各ブ
ロック毎の黒画素数を特徴間としたNXN次元ベクI・
ルBを認識用の特徴ベクトルとして求める。
また特徴抽出部1は、このNXN次元ベクトルBにおい
て予め位置が定められた複数の標本化点(図中二重枠で
示す)に、MXM次元(この実施例ではM−3)のポカ
ン処理マスクCの中心位置を重ねてそれぞれ整合する位
置同志の値を掛は合せ、さらに掛は合せた6値の和を求
めることによるマスク処理を行う。これによりMXM次
元の大分類用の特徴ベクI・ルDを生成する。尚、上記
マスク処理の計%において、NXN次元ベクトルBの外
側の黒画素数は0”とする。
て予め位置が定められた複数の標本化点(図中二重枠で
示す)に、MXM次元(この実施例ではM−3)のポカ
ン処理マスクCの中心位置を重ねてそれぞれ整合する位
置同志の値を掛は合せ、さらに掛は合せた6値の和を求
めることによるマスク処理を行う。これによりMXM次
元の大分類用の特徴ベクI・ルDを生成する。尚、上記
マスク処理の計%において、NXN次元ベクトルBの外
側の黒画素数は0”とする。
この後、大分類辞書生成部3は、大分類処理の実行に伴
い、第3図に示すように、認識辞書部2に格納された認
識辞書Eの中の第1面〜第に面のNXN次元固有ベクト
ルに対し、特徴抽出部1て用いたものと同しポカン処理
マスクC′を用いて順次同様のマスク処理を施すことに
より、MXM次元の固有ベクトルからなる大分類辞書F
を生成する。
い、第3図に示すように、認識辞書部2に格納された認
識辞書Eの中の第1面〜第に面のNXN次元固有ベクト
ルに対し、特徴抽出部1て用いたものと同しポカン処理
マスクC′を用いて順次同様のマスク処理を施すことに
より、MXM次元の固有ベクトルからなる大分類辞書F
を生成する。
そして大分類部4は、この大分類辞書生成部3において
順次生成された大分類辞書Fを用いて、特徴抽出部1よ
り出力された大分類用の特徴ベクトルから複合類似度法
等により大分類文字候補を判定し、これを認識部5に出
力する。
順次生成された大分類辞書Fを用いて、特徴抽出部1よ
り出力された大分類用の特徴ベクトルから複合類似度法
等により大分類文字候補を判定し、これを認識部5に出
力する。
この後、認識部5は、大分類部4により判定された大分
類文字候補に対応する認識辞書Eを用いて、特徴抽出部
]より出力された文字認識用の特徴ペター・ルから複合
類似度法等によって認識結果を求める。
類文字候補に対応する認識辞書Eを用いて、特徴抽出部
]より出力された文字認識用の特徴ペター・ルから複合
類似度法等によって認識結果を求める。
かくしてこの実施例の文字認識装置によれば、大分類処
理の実行に伴って、認識辞書部2に格納された認識辞書
から大分類辞書をマスク処理にて生成し、これを大分類
部4に出力することかできるので、構成において大分類
辞書用の記憶装置を用意する必要がなくなり、その分の
コストダウンを図ることかできる。
理の実行に伴って、認識辞書部2に格納された認識辞書
から大分類辞書をマスク処理にて生成し、これを大分類
部4に出力することかできるので、構成において大分類
辞書用の記憶装置を用意する必要がなくなり、その分の
コストダウンを図ることかできる。
尚、本発明はこの実施例に限定されるものではなく、技
術的思想の範囲内において種々の変形か可能である。
術的思想の範囲内において種々の変形か可能である。
例えは、この実施例では、入力文字パターンの特徴間と
して黒画素数を用いたが、輪郭線の長さを特徴間として
用いてもよい。
して黒画素数を用いたが、輪郭線の長さを特徴間として
用いてもよい。
また、入力文字パターンの正規化後の縦横分割ブロック
数は前記実施例では同じとしたか、縦横異なるものとし
てもかまわない。
数は前記実施例では同じとしたか、縦横異なるものとし
てもかまわない。
さらに、前記実施例では、大分類処理の実行に伴って認
識辞書から大分類辞書を生成しているか、1面分あるい
は]カテゴリ分の大分類辞書メモリを用意しておき、認
識辞書を基に生成した大分類辞書をこのメモリに一時的
に蓄えながら大分類処理を47つようにしてもよい。
識辞書から大分類辞書を生成しているか、1面分あるい
は]カテゴリ分の大分類辞書メモリを用意しておき、認
識辞書を基に生成した大分類辞書をこのメモリに一時的
に蓄えながら大分類処理を47つようにしてもよい。
[発明の効果]
以上説明したように本発明の文′−fl認識装置によれ
ば、大分類処理の実行に作って知識辞書から大分類辞書
を作成することにより、fj、j成において大分類辞書
用の記憶装置を省くことかでき、コストダウンを図るこ
とかできる。
ば、大分類処理の実行に作って知識辞書から大分類辞書
を作成することにより、fj、j成において大分類辞書
用の記憶装置を省くことかでき、コストダウンを図るこ
とかできる。
第1図は本発明に係る一実施例の文字認識装置の+11
4成を説明するだめのブロック図、第2図は第1図の文
字認識装置において大分類用および認識用の特徴ヘクト
ルを求める流れを説明するための図、第3図は第1図の
文字認識装置において認識辞円から大分類辞書を生成す
る流れを説明するための図である。 ] 0 1・特徴抽出部、2・・・認識辞書部、3・・大分類辞
書生成部、4・・・大分類部、5・認識部。
4成を説明するだめのブロック図、第2図は第1図の文
字認識装置において大分類用および認識用の特徴ヘクト
ルを求める流れを説明するための図、第3図は第1図の
文字認識装置において認識辞円から大分類辞書を生成す
る流れを説明するための図である。 ] 0 1・特徴抽出部、2・・・認識辞書部、3・・大分類辞
書生成部、4・・・大分類部、5・認識部。
Claims (1)
- 【特許請求の範囲】 入力文字パターンから大分類用および文字認識用の特徴
をそれぞれ抽出する特徴抽出手段と、文字認識のための
標準パターンを定義する認識辞書が予め格納された認識
辞書格納手段と、大分類処理の実行に伴って、前記認識
辞書格納手段に格納された認識辞書から大分類辞書を生
成する大分類辞書生成手段と、 この大分類辞書生成手段により生成された大分類辞書を
用いて、前記特徴抽出手段により抽出された大分類用の
特徴に基づき大分類文字候補を判定する大分類手段と、 この大分類手段により判定された大分類文字候補に対応
する前記認識辞書を用いて、前記特徴抽出手段により抽
出された文字認識用の特徴に基づき文字認識を行う認識
手段とを具備することを特徴とする文字認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2086300A JPH03282689A (ja) | 1990-03-29 | 1990-03-29 | 文字認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2086300A JPH03282689A (ja) | 1990-03-29 | 1990-03-29 | 文字認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH03282689A true JPH03282689A (ja) | 1991-12-12 |
Family
ID=13882986
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2086300A Pending JPH03282689A (ja) | 1990-03-29 | 1990-03-29 | 文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH03282689A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007193588A (ja) * | 2006-01-19 | 2007-08-02 | Nagasaki Univ | 文字識別装置及び文字識別方法 |
-
1990
- 1990-03-29 JP JP2086300A patent/JPH03282689A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007193588A (ja) * | 2006-01-19 | 2007-08-02 | Nagasaki Univ | 文字識別装置及び文字識別方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Fu | Syntactic methods in pattern recognition | |
| Moayer et al. | A tree system approach for fingerprint pattern recognition | |
| US4317109A (en) | Pattern recognition system for hand-written characters operating on an on-line real-time basis | |
| JP2022177232A (ja) | 画像処理方法、テキスト認識方法及び装置 | |
| US4284975A (en) | On-line pattern recognition system for hand-written characters | |
| CN112541443B (zh) | 发票信息抽取方法、装置、计算机设备及存储介质 | |
| JPH0355869B2 (ja) | ||
| CN113378710A (zh) | 图像文件的版面分析方法、装置、计算机设备和存储介质 | |
| CN108664975B (zh) | 一种维吾尔文手写字母识别方法、系统及电子设备 | |
| JPH06162198A (ja) | パターン認識装置 | |
| US5204915A (en) | Method of extracting feature from line pattern and line pattern recognition method using the same | |
| Den Hartog et al. | Knowledge-based interpretation of utility maps | |
| Sun et al. | Convolutional multi-directional recurrent network for offline handwritten text recognition | |
| US5526440A (en) | Hand-written character recognition apparatus | |
| US5105470A (en) | Method and system for recognizing characters | |
| Kozlenko et al. | Identity documents recognition and detection using semantic segmentation with convolutional neural network | |
| Lamghari et al. | Template matching for recognition of handwritten Arabic characters using structural characteristics and Freeman code | |
| Bagwe et al. | Optical character recognition using deep learning techniques for printed and handwritten documents | |
| JPH03282689A (ja) | 文字認識装置 | |
| CN112149678A (zh) | 特殊语言的文字识别方法、识别模型训练方法和装置 | |
| JP2751865B2 (ja) | 文字列認識装置 | |
| Yang | Advancements and challenges in character recognition: A comparative analysis of CNN and deep learning approaches | |
| Jain | Unconstrained Arabic & Urdu Text Recognition using Deep CNN-RNN Hybrid Networks | |
| Fu | Introduction to pattern processing | |
| Fethi et al. | A progressive approach to Arabic character recognition using a modified freeman chain code algorithm |