JPH01311390A - 文字置換制御方式 - Google Patents

文字置換制御方式

Info

Publication number
JPH01311390A
JPH01311390A JP63141625A JP14162588A JPH01311390A JP H01311390 A JPH01311390 A JP H01311390A JP 63141625 A JP63141625 A JP 63141625A JP 14162588 A JP14162588 A JP 14162588A JP H01311390 A JPH01311390 A JP H01311390A
Authority
JP
Japan
Prior art keywords
character
characters
threshold
similarity
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63141625A
Other languages
English (en)
Inventor
Kazuji Kiyono
清野 和司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63141625A priority Critical patent/JPH01311390A/ja
Publication of JPH01311390A publication Critical patent/JPH01311390A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、光学的文字読取り装置の文字置換制御方式に
関する。
(従来の技術) 従来、OCR(光学的文字読取り装置)の動車処理は、
文字単位の認識候補と、単語辞書内の全単語との類似度
を計算し、最も類似度の大きいものを、その最終結果と
するものであった。あるいは、類似度がある閾値を越え
なければ、単語辞書の中には正解が含まれないものとし
てリジェクトしたり、素読み(文字認識結果そのまま)
を最終的な結果とする場合もある。
(発明が解決しようとする課題) 上記従来の技術に従えば、単語辞書内から最終結果を出
力する場合、ある文字に着目すると、素読み結果が他の
文字に置換されることがある。
これが知識処理による補正であり、また、読取り率向上
のポイントとなる。しかし、逆に謝った補正を行い、素
読み結果が正しいものを他の文字に置換してしまう事も
発生する。全体的にはこの両者が相殺し合い、一般には
、正しい補正の数の方が多いため、読取り率は全体とし
て向上するが、単語辞書の装備が不完全であったり、素
読みの正読率が非常に高い(98〜99%ぐらい)場合
、知識処理によって全体の読取り率が低下することも発
生するという欠点があった。
本発明は、上記欠点に基づいて成されたものであり、知
識処理における誤った文字補正を無くし、いかなる条件
下においても、読取り率の低下することのない知識処理
を実現し、さらに、これによって、最終的な読取り率を
向上させる文字置換制御方式を提供することを目的とす
る。
[発明の構成〕 (課題を解決するための手段) 本発明の文字置換制御方式は、読取り率の低下すること
のない知識処理を実現し、これにより、最終的な読取り
率を向上させる方式である。そのために、本発明の文字
置換制御方式は、文字認識信頼度の閾値を設定し、その
閾値を越えた文字は正読として最終結果に出力する手段
と、閾値を越えない文字に対しては、単語として類似度
を判定し、閾値を越えない文字のみを類似度の高い単語
中の文字にに置換える手段とから成る。
(作用) 上記手段において、文字認識信頼度の閾値を設定し、そ
の閾値を越えた文字は正読として最終結果に出力し、閾
値を越えない文字に対しては、単語として類似度を判定
し、閾値を越えない文字のみを類似度の最も高い文字に
置換える。
それにより、読取り率の低下することのない知識処理を
実現し、最終的な読取り率を向上させることができる。
(実施例) 以下、本発明の一実施例を図面を参照しながら説明する
。第1図は、本発明の一実施例を示すブロック図である
。図において、1は読取るべき帳票、2は読取りにおけ
る全ての機器制御を司るコントローラ、3は光学的に記
入文字のイメージを取込む装置(スキャナ)、4はスキ
ャナ3で取込んだイメージを、文字単位に認識し、候補
文字とともに出力する装置、また、文字認識の信頼度が
低いときは、その文字をリジェクトとする。5は装置4
による認識結果と、単語知識辞書6を用いて動車処理を
行う装置、7は最終読取り結果である。
次に、本発明実施例の動作について、詳細に説明する。
文字認識装置4では、文字単位の認識を行うが、ある閾
値を設定し、その認識結果の信頼度が閾値を越えたもの
は、正読として出力し、この場合は候補文字は第1位の
みとする。その他の結果はすべてリジェクトとして出力
し、候補文字を幾つか出力する。この閾値の設定は、正
読として出力した認識結果の信頼度が、非常に高くなる
ように設定する。
次に、上記認識結果をコントローラ2が単語単位にまと
め、知識処理装置5に送る。知慮処理装置5では、知識
辞書6と、この認識結果とのマツチング(類似度計算)
を行い、いわゆる単語認識をおこない、最終結果を得る
。このとき、認識結果でリジェクトとなっている文字ケ
タでは、最終結果文字として、どのような文字に置換さ
れてもよい。逆に認識結果において、正読と判断された
文字ケタでは、最終結果においてもそれと同一で、他の
文字に置換されることはない。
このように、OCRの素読み結果で正しく認識した文字
を知識処理によって他の文字に置換してしまうことが完
全になくなり、それにより、読取り率が向上する。
[発明の効果] 以上、説明のように本発明によれば、認識結果によって
正読と判断された文字は、最終結果においても同一文字
であり、認識結果でリジェクトとなっている文字が知識
処理により最終結果を得ることにより、読取り率が向上
する。
【図面の簡単な説明】
第1図は本発明実施例を示すブロック図、第2図は本発
明実施例の動作の概念を示す説明図である。 1・・・帳票 2・・・コントローラ 3・・・スキャナ 4・・・文字認識装置 5・・・知識処理装置 6・・・知識辞書 7・・・最終結果

Claims (1)

    【特許請求の範囲】
  1. 文字単位の認識候補と単語辞書内の全単語との類似度を
    計算し、最も類似度の大きいものを、その最終結果とし
    て出力する光学的文字読取り装置において、文字認識信
    頼度の閾値を設定し、その閾値を越えた文字は正読とし
    て最終結果に出力する手段と、閾値を越えない文字に対
    しては、単語として類似度を判定し、最も類似度の高い
    単語のうち、閾値を越えない文字のみを類似度の高い単
    語中の文字に置換える手段とからなることを特徴とする
    文字置換制御方式。
JP63141625A 1988-06-10 1988-06-10 文字置換制御方式 Pending JPH01311390A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63141625A JPH01311390A (ja) 1988-06-10 1988-06-10 文字置換制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63141625A JPH01311390A (ja) 1988-06-10 1988-06-10 文字置換制御方式

Publications (1)

Publication Number Publication Date
JPH01311390A true JPH01311390A (ja) 1989-12-15

Family

ID=15296390

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63141625A Pending JPH01311390A (ja) 1988-06-10 1988-06-10 文字置換制御方式

Country Status (1)

Country Link
JP (1) JPH01311390A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01259477A (ja) * 1988-04-11 1989-10-17 Canon Inc 文字認識装置
JP2010015502A (ja) * 2008-07-07 2010-01-21 Sharp Corp 情報処理装置、その制御方法、制御プログラム、および記録媒体
WO2015178073A1 (ja) * 2014-05-20 2015-11-26 ソニー株式会社 情報処理装置、管理装置、情報処理方法、およびプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01259477A (ja) * 1988-04-11 1989-10-17 Canon Inc 文字認識装置
JP2010015502A (ja) * 2008-07-07 2010-01-21 Sharp Corp 情報処理装置、その制御方法、制御プログラム、および記録媒体
WO2015178073A1 (ja) * 2014-05-20 2015-11-26 ソニー株式会社 情報処理装置、管理装置、情報処理方法、およびプログラム

Similar Documents

Publication Publication Date Title
JPS63182793A (ja) 文字切り出し方式
JPH01311390A (ja) 文字置換制御方式
EP0593844A2 (en) Character recognition system
JPS6226587A (ja) 光学文字読取装置の文字フイ−ルドフリ−ピツチ処理方式
JP2856409B2 (ja) 文字認識装置および方法
JPH051512B2 (ja)
JPS5914078A (ja) 帳票読取装置
JP2677271B2 (ja) 文字認識装置
JPS61251982A (ja) 光学的文字読取装置
JPS6272085A (ja) 文字認識装置
JPS61107485A (ja) 光学的文字読取装置
JPH03123989A (ja) 文字認識装置
JPS63200288A (ja) オンライン文字認識装置
JPH0351982A (ja) 文字列認識方式
JPS6095689A (ja) 光学的文字読取装置
JP2801638B2 (ja) 住所認識装置
JPH0484380A (ja) 文字認識装置
JPS60254384A (ja) ストロ−ク対応づけ方式
JP2963474B2 (ja) 類似文字識別方法
JPS60138689A (ja) 文字認識方法
JPS5960690A (ja) 2値化装置
JPS6115288A (ja) 光学的文字読取装置
JPS6336392A (ja) 閾値設定方式
JPH06259595A (ja) 文字認識処理装置及び認識処理方法
JPS60147892A (ja) 文字認識装置