JPS6029883A - 光学的文字読取装置 - Google Patents
光学的文字読取装置Info
- Publication number
- JPS6029883A JPS6029883A JP58138313A JP13831383A JPS6029883A JP S6029883 A JPS6029883 A JP S6029883A JP 58138313 A JP58138313 A JP 58138313A JP 13831383 A JP13831383 A JP 13831383A JP S6029883 A JPS6029883 A JP S6029883A
- Authority
- JP
- Japan
- Prior art keywords
- sampling
- pattern
- character
- read
- memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の技術分野〕
本発明は、特に印刷文字を読取るための光学的文字読取
装置に関する。
装置に関する。
一般に、光学的文字読取装置(以下OCRと称する)で
は、通常複合類似度法等のパターンマツチング法による
認識方式が用いられている。
は、通常複合類似度法等のパターンマツチング法による
認識方式が用いられている。
このようなOCRでは、帳票上に記録された印刷文字が
光電変換された後、1文字分の文字パターン(量子化画
像信号)が切出されて正規化処理が行なわれる。さらに
正規化された文字パターンに対して標本化マスク(mx
nビット)よるばかし操作が行なわれ、所定の清報量で
重み付けされた標本化パターンが作成される。この標本
化パターンに対する複合類似度計算が行なわれて、類似
度値の最大のカテゴリが文字パターンの答として出力さ
れる。
光電変換された後、1文字分の文字パターン(量子化画
像信号)が切出されて正規化処理が行なわれる。さらに
正規化された文字パターンに対して標本化マスク(mx
nビット)よるばかし操作が行なわれ、所定の清報量で
重み付けされた標本化パターンが作成される。この標本
化パターンに対する複合類似度計算が行なわれて、類似
度値の最大のカテゴリが文字パターンの答として出力さ
れる。
ところで上記のようなOCRでは、ばかし操作が行なわ
れる際、読取対象である印刷文字の字体とは無関係に一
律の標本化マスクが適用されている。しかしながら、読
取文字は字体により文字の大きさが異なる場合が多く、
このため各種字体に対するぼかし度が不適正になること
が発生する。したがって、読取文字に対して不適正な標
本化パターンが作成されることがあシ、OCRの読取精
度が低下する問題があった。
れる際、読取対象である印刷文字の字体とは無関係に一
律の標本化マスクが適用されている。しかしながら、読
取文字は字体により文字の大きさが異なる場合が多く、
このため各種字体に対するぼかし度が不適正になること
が発生する。したがって、読取文字に対して不適正な標
本化パターンが作成されることがあシ、OCRの読取精
度が低下する問題があった。
本発明は上記の事情に鑑みてなされたもので、その目的
は、読取対象である印刷文字の字体に応じた適正な標本
化パターンを作成して、パターンマツチング法による文
字読取の精度を向上することができる光学的文字読取装
置全提供することにある。
は、読取対象である印刷文字の字体に応じた適正な標本
化パターンを作成して、パターンマツチング法による文
字読取の精度を向上することができる光学的文字読取装
置全提供することにある。
本発明では、読取制御部により予め読取文字の字体が指
定され、この字体に応じて標本化マスク全切換える際の
モードデータを記憶するモードレジスタが設けられる。
定され、この字体に応じて標本化マスク全切換える際の
モードデータを記憶するモードレジスタが設けられる。
このモードレジスタのモードデータに応じて、読取文字
に対応する正規化パターンが重み付けの順に正規化パタ
ーンメモリに配列、蓄積される。標本化パターンメモリ
は予め複数の標本化マスクで作成された重み付はパター
ンである標本化パターンを記憶しており、上記モードデ
ータおよび正規化パターンの出力信号の両者からなるア
ドレスに応じて所定の標本化パターン全出力する。この
標本化パターンに基づいて類似度計算部により類似度演
算が行なわれて、類似度計算部から類似度計算結果が答
として出力されるように構成される。
に対応する正規化パターンが重み付けの順に正規化パタ
ーンメモリに配列、蓄積される。標本化パターンメモリ
は予め複数の標本化マスクで作成された重み付はパター
ンである標本化パターンを記憶しており、上記モードデ
ータおよび正規化パターンの出力信号の両者からなるア
ドレスに応じて所定の標本化パターン全出力する。この
標本化パターンに基づいて類似度計算部により類似度演
算が行なわれて、類似度計算部から類似度計算結果が答
として出力されるように構成される。
以下図面を参照して本発明の一実施例について説明する
。図は一実施例に係るOCRの構成を示すブロック図で
ある。図中、10はデータ処理装置で、読取データの鵜
集、出力制御を行ない、また読取制御情報を諷取制御部
11に出力する。読取制御部1ノは、データ処理装置1
0からの読取制御情報に基づいてOCRの読取動作を制
御する。ラインバッファ12は読取制御部1ノの制御信
号により読取対象である帳票上の読取文字に対応する1
行分の文字パターンを格納する。切出しパターンメモリ
13は、ラインバッファ12から切出された1文字分の
文字パターン金位置の正規化処理がなされた後に格納す
る。切出しパターンメモリ13がらの文字パターンは、
標本化回路14に与えられる。
。図は一実施例に係るOCRの構成を示すブロック図で
ある。図中、10はデータ処理装置で、読取データの鵜
集、出力制御を行ない、また読取制御情報を諷取制御部
11に出力する。読取制御部1ノは、データ処理装置1
0からの読取制御情報に基づいてOCRの読取動作を制
御する。ラインバッファ12は読取制御部1ノの制御信
号により読取対象である帳票上の読取文字に対応する1
行分の文字パターンを格納する。切出しパターンメモリ
13は、ラインバッファ12から切出された1文字分の
文字パターン金位置の正規化処理がなされた後に格納す
る。切出しパターンメモリ13がらの文字パターンは、
標本化回路14に与えられる。
標本化回路14は、読取制御部11から与えられる標本
化モードデータ全格納するモードレジスタ15を備えて
いる。標本化モードデータは読取文字の字体に応じて標
本化マスク全切換える際のモードデータである。正規化
パターンメモリ16はモードレジスタ15の標本化モー
ドデータに応じて重み付は金する順に正規化パターンを
配列、蓄積する。正規化パターンメモリ16から出力さ
れる正規化パターンはレジスタ17に格納される。この
レジスタ17は、正規化パターンが作成される以前に切
出しパターンメモリ13から文字パターンに応じた2値
化信号が与えられ、その2値化信号を正規化パターンメ
モリ16に6出力する。そして、レジスタ17は記憶し
た正規化パターンに応じたデータをアドレスとしてリー
ドオンリメモリ (以下ROMと称する)18に出力す
る。このROM2Sは、予め複数の標本化マスク(例え
ば3×3と5×5の各マスク)による重み付けがなされ
た標本化パターン(標本化値)全格納してお9、レジス
タ17からのアドレスおよびモードレジスタ15からの
標本化モードデータであるアドレスの両者のアドレスに
基づいて所定の標本化パターンを標本化メモリ19に出
力する。
化モードデータ全格納するモードレジスタ15を備えて
いる。標本化モードデータは読取文字の字体に応じて標
本化マスク全切換える際のモードデータである。正規化
パターンメモリ16はモードレジスタ15の標本化モー
ドデータに応じて重み付は金する順に正規化パターンを
配列、蓄積する。正規化パターンメモリ16から出力さ
れる正規化パターンはレジスタ17に格納される。この
レジスタ17は、正規化パターンが作成される以前に切
出しパターンメモリ13から文字パターンに応じた2値
化信号が与えられ、その2値化信号を正規化パターンメ
モリ16に6出力する。そして、レジスタ17は記憶し
た正規化パターンに応じたデータをアドレスとしてリー
ドオンリメモリ (以下ROMと称する)18に出力す
る。このROM2Sは、予め複数の標本化マスク(例え
ば3×3と5×5の各マスク)による重み付けがなされ
た標本化パターン(標本化値)全格納してお9、レジス
タ17からのアドレスおよびモードレジスタ15からの
標本化モードデータであるアドレスの両者のアドレスに
基づいて所定の標本化パターンを標本化メモリ19に出
力する。
類似度演算回路20は、標本化回路14即ち標本化メモ
リ19からの標本化パターンと辞書メモリ21からの標
準パターンとの類似度演算(例えば複合類似度演力、)
全行なって、最大類似度値のカテゴリを答として読取制
御部11に出力する。
リ19からの標本化パターンと辞書メモリ21からの標
準パターンとの類似度演算(例えば複合類似度演力、)
全行なって、最大類似度値のカテゴリを答として読取制
御部11に出力する。
このような構成のo c itにおいで、その動作全説
明する。先ず、例えば帳票上に記録された印刷文字が読
取られる場合、データ処理装置10から読取文字の字体
情報を含む読取制御情報が読取制御部11に与えられる
。読取制御部1ノは読取制御情報に基づいてラインバッ
ファ12に制御信号を出力する。この制御信号により、
ラインバッファ12には1行分の読取文字に対応する文
字パターンが格納される。さらに、ラインバッファ12
から1文字分の文字パターンが切出されて切出しパター
ンメモリ13に位置の正規化処理がなされた後に格納さ
れる。次に読取制御部11は、読取制御清報に隋づいて
読取文字の字体に応じた標本化モードデータ全標本化回
路14のモードレジスタ15に出力する。標本化モード
データは、読取文字の字体、即ち大きさに応じて例えば
大きい字体のときは5×5、小さい字体のときは3×3
の標本化マスクを切換選択するのに必要なデータである
6、そして、切出しパターンメモリ13から文字パター
ンに応じた2値化信号が、一定の順序で標本化回路14
のレジスタ17に送られる。正規化パターンメモリ16
では、モードレジスタ15からの標本化モードデータに
応じてレジスタ17からの2値化信号が所定の重み付け
をする順に正規化パターンとして配列、蓄積される。
明する。先ず、例えば帳票上に記録された印刷文字が読
取られる場合、データ処理装置10から読取文字の字体
情報を含む読取制御情報が読取制御部11に与えられる
。読取制御部1ノは読取制御情報に基づいてラインバッ
ファ12に制御信号を出力する。この制御信号により、
ラインバッファ12には1行分の読取文字に対応する文
字パターンが格納される。さらに、ラインバッファ12
から1文字分の文字パターンが切出されて切出しパター
ンメモリ13に位置の正規化処理がなされた後に格納さ
れる。次に読取制御部11は、読取制御清報に隋づいて
読取文字の字体に応じた標本化モードデータ全標本化回
路14のモードレジスタ15に出力する。標本化モード
データは、読取文字の字体、即ち大きさに応じて例えば
大きい字体のときは5×5、小さい字体のときは3×3
の標本化マスクを切換選択するのに必要なデータである
6、そして、切出しパターンメモリ13から文字パター
ンに応じた2値化信号が、一定の順序で標本化回路14
のレジスタ17に送られる。正規化パターンメモリ16
では、モードレジスタ15からの標本化モードデータに
応じてレジスタ17からの2値化信号が所定の重み付け
をする順に正規化パターンとして配列、蓄積される。
この正規化パターンがレジスタ12に格納される。RO
MJ gは、レジスタ17がらの正規化パターンおよび
モードレジスタ15からの標本化モードデータをアドレ
スとして供給され、このアドレスに基づいた標本化パタ
ーン全出力する。即ち、ROM 7 gからは標本化モ
ードデータに応じた標本化マスクによる重み付けがなさ
れた標本化パターンが出力され、類似度演算に適したフ
ォーマットで標本化メモリ19に格納される。
MJ gは、レジスタ17がらの正規化パターンおよび
モードレジスタ15からの標本化モードデータをアドレ
スとして供給され、このアドレスに基づいた標本化パタ
ーン全出力する。即ち、ROM 7 gからは標本化モ
ードデータに応じた標本化マスクによる重み付けがなさ
れた標本化パターンが出力され、類似度演算に適したフ
ォーマットで標本化メモリ19に格納される。
このようにして標本化回路14から得られる標本化パタ
ーンが、類似度演算回路20により類似度演算処理(辞
書メモリ2)の標準パターンに基づいた類似度演算)が
行なわれる1、この類似度演算結果により、最大の類似
度値のカテゴリが答として読取制御部11に出力される
。
ーンが、類似度演算回路20により類似度演算処理(辞
書メモリ2)の標準パターンに基づいた類似度演算)が
行なわれる1、この類似度演算結果により、最大の類似
度値のカテゴリが答として読取制御部11に出力される
。
この場合、上記のように標本化回路14がら出力される
標本化パターンは、読取文字の字体に応じて適正な標本
化マスクにより作成されることになる。したがって、読
取文字の字体が異なる場合でも、適正な標本化パターン
に基づいて読取処理(識別処理)が行なわれるため、高
い精度の読取処理を実現できる。
標本化パターンは、読取文字の字体に応じて適正な標本
化マスクにより作成されることになる。したがって、読
取文字の字体が異なる場合でも、適正な標本化パターン
に基づいて読取処理(識別処理)が行なわれるため、高
い精度の読取処理を実現できる。
以上詳述したように本発明によれば、読取対象である印
刷文字の字体に応じた適正な標本化パターンを作成でき
る。したがって、印刷文字の字体が異なる場合でも、標
本化パターンに基づいて行なわれるパターンマツチング
法による文字読取処理の精度を大幅に向上することがで
きる。例えば印刷文字が大文字から小文字に切きるもの
である。
刷文字の字体に応じた適正な標本化パターンを作成でき
る。したがって、印刷文字の字体が異なる場合でも、標
本化パターンに基づいて行なわれるパターンマツチング
法による文字読取処理の精度を大幅に向上することがで
きる。例えば印刷文字が大文字から小文字に切きるもの
である。
図は本発明の一実施例に係る光学的文字読取装置の部分
的構成金示すブロック図である。 11・・・読取制御部、14・・・標本化回路、15・
・・モードレジスタ、16・・・正規化パターンメモリ
、18・・・リードオンリメモリ、19・・・標本化メ
モリ、20・・・類似度演算回路。
的構成金示すブロック図である。 11・・・読取制御部、14・・・標本化回路、15・
・・モードレジスタ、16・・・正規化パターンメモリ
、18・・・リードオンリメモリ、19・・・標本化メ
モリ、20・・・類似度演算回路。
Claims (1)
- 読取対象である読取文字の字体金子め指定する読取制御
部と、この読取制御部から指定される字体に応じて標本
化マスクを切換える際の標本化モ〜トゝデータを記憶す
るモードレジスタと、このモードレジスタの標本化モー
ドデータに応じて上記読取文字に対応する正規化パター
ンを重み付けの順に配列、蓄積する正規化パターンメモ
リと、この正規化パターンメモリの出方信号および上記
モードレジスタの標本化モードデータの両者がアドレス
として供給されそのアドレスに基づいて予め複数の標本
化マスクで作成された各重み付はパターンの中から所定
の標本化パターンを出力する標本化パターンメモリと、
この1跳水化パターンメモリから出力される標本化パタ
ーンの類似度全計算しその計算結果を答として出力する
類似度計算部とを具備したこと全特徴とする光学的文字
読取装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58138313A JPS6029883A (ja) | 1983-07-28 | 1983-07-28 | 光学的文字読取装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58138313A JPS6029883A (ja) | 1983-07-28 | 1983-07-28 | 光学的文字読取装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS6029883A true JPS6029883A (ja) | 1985-02-15 |
Family
ID=15218967
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58138313A Pending JPS6029883A (ja) | 1983-07-28 | 1983-07-28 | 光学的文字読取装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6029883A (ja) |
-
1983
- 1983-07-28 JP JP58138313A patent/JPS6029883A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH0550783B2 (ja) | ||
| JPS6029883A (ja) | 光学的文字読取装置 | |
| JP2584973B2 (ja) | 文字認識装置における認識結果出力方法 | |
| US5473743A (en) | Character generator with selectable conversion | |
| JPH0991371A (ja) | 文字表示装置 | |
| JPH0528302A (ja) | 文字読取装置 | |
| JP2529421B2 (ja) | 文字認識装置 | |
| JPS6336389A (ja) | 文字読取装置 | |
| JP2784004B2 (ja) | 文字認識装置 | |
| JP2986478B2 (ja) | 文字処理装置 | |
| JPH0573027A (ja) | 個人筆跡辞書作成装置及び個人筆跡辞書を用いた文字出力処理装置 | |
| JP2746345B2 (ja) | 文字認識の後処理方法 | |
| JPH0632088B2 (ja) | 文字認識方法 | |
| JPS61221978A (ja) | 多色図面読取装置 | |
| JP2570571B2 (ja) | 光学文字読取装置 | |
| JPS62288989A (ja) | 文字認識方式 | |
| JPH06243285A (ja) | 文字認識方法 | |
| JP2665488B2 (ja) | 個人辞書登録方式 | |
| JPS63147287A (ja) | 光学的文字認識装置 | |
| JP3012269B2 (ja) | 印刷制御装置 | |
| JPH0658694B2 (ja) | 文字認識装置 | |
| JPH02206895A (ja) | ハイブリッド型文字認識装置 | |
| JPS60138689A (ja) | 文字認識方法 | |
| JPH05334493A (ja) | 文字認識装置 | |
| JPH04305694A (ja) | ドットパターン格納装置並びに格納方法 |