JPS6410875B2 - - Google Patents

Info

Publication number
JPS6410875B2
JPS6410875B2 JP55180949A JP18094980A JPS6410875B2 JP S6410875 B2 JPS6410875 B2 JP S6410875B2 JP 55180949 A JP55180949 A JP 55180949A JP 18094980 A JP18094980 A JP 18094980A JP S6410875 B2 JPS6410875 B2 JP S6410875B2
Authority
JP
Japan
Prior art keywords
character
candidate
similarity
similarity value
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55180949A
Other languages
English (en)
Other versions
JPS57103583A (en
Inventor
Yoshihisa Tanabe
Hideo Masaki
Toyoshi Sato
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP55180949A priority Critical patent/JPS57103583A/ja
Publication of JPS57103583A publication Critical patent/JPS57103583A/ja
Publication of JPS6410875B2 publication Critical patent/JPS6410875B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
この発明は文字認識部の改良を行なつた光学的
文字読取装置に関する。 従来の光学的文字読取装置では、帳票上に記入
された文字を光電変換し、この光電変換された文
字パターンを正規化した後、この正規化された文
字パターンを実際に書かれた文字をデータ収集し
シユミレーシヨンにより自動設計された辞書の標
準文字パターンと重ね合せることにより、候補文
字を選出し、この候補文字の類似度値に基づき選
出された候補文字を答として出力するかリジエク
ト(判読不能)文字とするか決定していた。しか
しながら、手書文字のような各人によつて字体が
大きく変化する文字を同一カテゴリーの文字とし
て認識しようとするには、データ収集された文字
のわずかな特徴をも辞書に記憶させる必要があ
る。したがつて、辞書には大容量のメモリを必要
とするばかりか、認識にも時間が長くかかること
になる。 この発明は上記のような事情に鑑みてなされた
もので、標準字体から字体の離れた文字について
もある程度読み取りを可能にすると共に、認識処
理効率のよい光学的文字読取装置を提供すること
を目的とする。 以下、図面を参照してこの発明の説明をする。 第1図はこの発明の一実施例の光学的文字読取
装置の概略構成図である。図中、符号1は光電変
換・前処理回路を示している。この光電変換・前
処理回路1は、図示せぬ帳票に記入された文字を
光電変換し、黒白の2値レベルのビデオ信号に変
換する機能を持つている。符号2は正規化回路を
示している。この正規化回路2は、光電変換・前
処理回路1で光電変換された文字パターンの高
さ、幅、傾き等を一定にする機能を持つている。
符号3は主類似度辞書を示している。この主類似
度辞書3は、標準字体をもとに実際に書かれた文
字からデータを収集し、シユミレーシヨンにより
自動設計したもので、例えば第2図A,Bに示す
ような標準文字パターンを記憶している。また、
符号4は副類似度辞書を示している。この副類似
度辞書4は、第3図A,Bに示すような標準字体
からは字体がかなり離れた手書きによる変形文字
を読み取るための辞書で、各字種について実際に
書かれた文字のデータ収集を行ない設計されたも
ので、各字種について種々の変形文字パターンを
記憶している。符号5は重ね合せ回路を示してい
る。この重ね合せ回路5は、正規化回路2で正規
化された文字パターンと、主類似度辞書3および
副類似度辞書4に記憶されている文字パターンと
の重ね合せを行なつて類似度値の高い順に複数の
候補文字を選出する機能を持つている。 符号6は編集・出力回路を示している。この編
集・出力回路6は、重ね合せ回路5で選出された
候補文字の類似度値に基づき候補文字を答として
出力するか、リジエクト(半読不能)文字として
出力するかを判断する機能を持つている。 次に、上記実施例の動作を説明する。図示せぬ
帳票に記入された文字は、光電変換・前処理回路
1で光電変換され、光電変換された文字パターン
は、正規化回路2においた正規化される。そし
て、正規化された文字パターンは重ね合せ回路5
に送られる。この重ね合せ回路5において、まず
正規化された文字パターンと主類似度辞書3に記
憶されている標準文字パターンとが重ね合わさ
れ、類似度の高い順に第1〜第3の候補文字が選
出されて編集・出力回路6に送られる。このと
き、第1の候補文字の類似度値が所定値以上であ
り、かつ第1と第2の候補文字の類似度の差が所
定値以上であつた場合には、副類似度辞書4の記
憶内容を参照することなく、第1の候補文字が編
集・出力回路6で選択され答として出力される。 次に、例えば第3図A,Bに示すような標準字
体とは字体がかなりかけ離れた文字の場合につい
て説明する。第3図Aに示す文字は、第2図Aに
示す文字アの標準文字パターンと比較して、文字
アの横線が右上がりで、縦線が垂直に近く描かれ
ている。そこで、重ね合せ回路5において、主類
似度辞書3の標準文字パターンと重ね合せた場合
に、表1に示すように、第1、第2、第3の候補
文字としてア、マ、ヤがそれぞれ選出される。こ
の場合、第1の候補文字アの類似度値が132で第
2の候補文字マの類似度値が130であり、その差
が小さいので重ね合せ回路5において、さらに副
類似度辞書4に記憶されている変形文字パターン
との重ね合わせを行なう。これにより、例えば表
1に示すように類似度値が150の候補文字アが選
出される。このようにして、主類似度辞書3およ
び副類似度辞書4と重ね合わせることにより選出
された候補文字の中から類似度値が高い方から3
つの候補文字が選ばれる。ただし、同一候補文字
がある場合には、類似度値が低い方は削除され
る。そして、表1に示すように3つの選出された
候補文字と各候補文字の類似度値は、編集・出力
回路6に送られる。この編集・出力回路6におい
て、選出された3つの候補文字における第1の候
補文字アの類似度値と、第2の候補文字マの類似
度値との差が求められる。この場合、その差が所
定値以上であり、かつ第1の候補文字の類似度値
が所定値以上であるので、第1の候補文字アが答
として出力される。
【表】 さらに、第3図Bに示すような文字の場合に
は、第2図Bの文字セの標準文字パターンと比較
して、文字セの横線の左側へのつき出しが長く、
縦線の上側へのつき出しが長いため、表2に示す
ように、重ね合せ回路5において主類似度辞書3
に記憶されている標準文字パターンとの重ね合せ
では、セという文字は第1〜第3の候補文字とし
ては選出されていない。この場合、第1の候補文
字ヒの類似度値と第2の候補文字Lの類似度値と
の差が所定値以下であるので、重ね合せ回路5に
おいて副類似度辞書4に記憶されている変形文字
パターンとの重ね合せを行なう。そして例えば表
2に示すように類似度値が120の候補文字セが選
出される。そして、主類似度辞書3および副類似
度辞書4と重ね合わせることにより、選出された
候補文字の中から類似度値が高い方から3つの候
補文字が選ばれる。この場合、第1〜第3の候補
文字としてヒ、セ、Lが選ばれる。このようにし
て選出された表2に示す第1〜第3の候補文字お
よび各候補文字の類似度値は、編集・出力回路6
に送られる。この編集・出力回路6において、選
出された3つの候補文字における第1の候補文字
ヒの類似度値と、第2の候補文字セの類似度値の
差が求められる。この場合、その差が所定値以下
であるので、編集・出力回路6はリジエクト文字
であることをオペレータに認知させるため表示等
を行なう。したがつて、このような光学的文字読
取装置は、第3図Aに示すような標準字体からか
なり字体の離れた文字の読み取りを行なうことが
できる。
【表】 第4図はこの発明の他の実施例を示すもので、
第1図と同一部分は同一符号を付して説明を省略
する。第4図において符号7は特徴抽出回路を示
している。この特徴抽出回路7には光電変換・前
処理回路1で光電変換された文字パターンが供給
されるようになつており、この光電変換された文
字パターンの特徴を抽出する機能を持つている。
符号9は構造解析回路を示している。この構造解
析回路9は、重ね合せ回路5aから出力される最
終的に求められた第1〜第3の候補文字に基づ
き、特徴抽出回路7から出力される特徴データを
特徴辞書8の内容を参照することにより、文字の
構造解析を行なう機能を持つている。なお、重ね
合せ回路5aは前記実施例における重ね合せ回路
5と同様の機能を有している。重ね合せ回路5a
で求められた最終的な第1〜第3の候補文字とそ
の類似度値、および構造解析回路9で求められた
構造解析結果は、編集・出力回路6aに送られる
ようになつている。この編集・出力回路6aは、
送られてきた第1〜第3の候補文字および構造解
析結果に基づき、候補文字のいずれかを答として
出力するか、リジエクト(判読不能)文字として
出力するかを判断する機能を持つている。 次に、上記実施例の動作を説明する。前記実施
例で読み取ることが不可能であつた第3図Bに示
すような文字を読み取る場合を例にとつて説明す
る。第3図Bに示す文字の場合、重ね合せ回路5
aにおいて前記表2に示したように、最終的な候
補文字としてヒ、セ、Lが選出される。さらに、
この場合第1の候補文字ヒの類似度値と第2の候
補文字セの類似度値の差が所定値以上でないの
で、光電変換・前処理回路1から出力された光電
変換された文字パターンの特徴抽出を特徴抽出回
路7において行なう。そして、特徴抽出されたデ
ータは構造解析回路9において、重ね合せ回路5
aから出力される最終的な第1〜第3の候補文字
ヒ、セ、Lの結果に基づき、特徴辞書8の記憶内
容を参照して文字パターンの構造解析を行なう。
この構造解析により、たとえばセという文字であ
ることが判断され、その構造解析結果は編集・出
力回路6aに送られる。また、編集・出力回路6
aには、重ね合せ回路5aで選出された候補文字
およびその類似度値も送られてくるようになつて
おり、ここで最終的な判断がなされる。この場
合、候補文字セは第2の候補文字であり、類似度
値は特に高くはないが、構造解析回路9において
セという字に判断されたので、編集・出力回路6
aからは、読み取り結果の文字としてセを出力す
る。 このように、重ね合せ回路5aにより認識する
ことができない文字パターンについては、さらに
構造解析回路9において構造解析を行なうことに
より、読み取り率を上げることができる。したが
つて、この実施例においては、第3図A,Bに示
したような標準字体からかなり字体の離れた文字
の読み取りを行なうことができる。 以上述べたようにこの発明によれば、標準字体
から字体の離れた文字についてもある程度読み取
りを可能にすると共に、認識処理効率のよい光学
的文字読取装置を提供することができる。また主
類似度辞書の容量が増加することがない。
【図面の簡単な説明】
第1図はこの発明の一実施例の概略構成図、第
2図A,Bはそれぞれ標準文字パターンの具体例
を示す図、第3図A,Bはそれぞれ手書き文字の
記入例を示す図、第4図はこの発明の他の実施例
を示す概略構成図である。 1…光電変換・前処理回路、2…正規化回路、
3…主類似度辞書、4…副類似度辞書、5,5a
…重ね合せ回路、6,6a…編集・出力回路。

Claims (1)

    【特許請求の範囲】
  1. 1 帳票上の文字を光電変換し、光電変換された
    文字パターンの認識を行なう光学的文字読取装置
    において、標準文字パターンを記憶している主類
    似度辞書と、1字種について種々の変形文字パタ
    ーンを記憶している副類似度辞書と、光電変換さ
    れた文字パターンと上記主および副類似度辞書に
    記憶された文字パターンとの重ね合せを行ない類
    似度値の高い順に複数の候補文字を選出する重ね
    合せ回路と、この重ね合せ回路から選出される候
    補文字の類似度値に基づき候補文字を答えとして
    出力するかリジエクト文字として出力するかを判
    断する編集・出力回路とを備えると共に、上記重
    ね合せ回路から選出される複数の候補文字につい
    て第1の候補文字の類似度値が所定値以上であ
    り、かつ第1と第2の候補文字の類似度値の差が
    所定値以上であつた場合には上記副類似度辞書の
    記憶内容を参照することなく第1の候補文字を答
    えとして出力し、第1の候補文字の類似度値と第
    2の候補文字の類似度値との差が所定値より小さ
    いときは上記重ね合せ回路により上記副類似度辞
    書に記憶されている変形文字パターンと光電変換
    された文字パターンとの重ね合せを行なつて候補
    文字を選出し、上記主類似度辞書との重ね合せに
    よる候補文字と上記副類似度辞書との重ね合せに
    よる候補文字の両者の候補文字のうち最も類似度
    値の高い第1の候補文字の類似度値と次位の類似
    度値の第2の候補文字の類似度値との差が所定値
    以上であればこの最も類似度値の高い第1の候補
    文字を答えとして出力し、最も類似度値の高い第
    1の候補文字の類似度値と次位の類似度値の第2
    の候補文字の類似度値との差が所定値未満であれ
    ば上記光電変換された文字をリジエクト文字とし
    て出力することを特徴とする光学的文字読取装
    置。
JP55180949A 1980-12-20 1980-12-20 Optical character reader Granted JPS57103583A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP55180949A JPS57103583A (en) 1980-12-20 1980-12-20 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP55180949A JPS57103583A (en) 1980-12-20 1980-12-20 Optical character reader

Publications (2)

Publication Number Publication Date
JPS57103583A JPS57103583A (en) 1982-06-28
JPS6410875B2 true JPS6410875B2 (ja) 1989-02-22

Family

ID=16092085

Family Applications (1)

Application Number Title Priority Date Filing Date
JP55180949A Granted JPS57103583A (en) 1980-12-20 1980-12-20 Optical character reader

Country Status (1)

Country Link
JP (1) JPS57103583A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58101379A (ja) * 1981-12-10 1983-06-16 Toyota Motor Corp 文字読取装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS523697B2 (ja) * 1971-09-20 1977-01-29

Also Published As

Publication number Publication date
JPS57103583A (en) 1982-06-28

Similar Documents

Publication Publication Date Title
JP3139521B2 (ja) 自動言語決定装置
US5373566A (en) Neural network-based diacritical marker recognition system and method
JPH10334185A (ja) パターン抽出装置
US4783835A (en) Method of character recognition
JPH0423185A (ja) 自動セル属性判定機能を有する表読取装置
JPS6410875B2 (ja)
JP2786361B2 (ja) 文書画像の領域抽出方法
JPH03142691A (ja) 表形式文書認識方式
JPH03268181A (ja) 文書読み取り装置
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JPS6154569A (ja) 文書画像処理方式
JP2973898B2 (ja) 文字認識方法及び装置
JPH0743718B2 (ja) マルチメディア文書構造化方式
KR20240079054A (ko) 전자 서식 문서 생성 장치
JP3220226B2 (ja) 文字列方向判別方法
JPH03126188A (ja) 文字認識装置
JPH0514952B2 (ja)
JP2972443B2 (ja) 文字認識装置
JPH06131496A (ja) パターン正規化処理方法
JPS5856909B2 (ja) 文字認識装置
JPH0259504B2 (ja)
JPH083830B2 (ja) 文字列パタ−ン切り出し方式
JPS59121476A (ja) 光学的文字読取装置
JPH0789361B2 (ja) 帳票登録装置
JPS5914078A (ja) 帳票読取装置