JPH05258100A

JPH05258100A - 文字認識装置

Info

Publication number: JPH05258100A
Application number: JP4055939A
Authority: JP
Inventors: Yoshiharu Shimada; 嘉治島田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1992-03-16
Filing date: 1992-03-16
Publication date: 1993-10-08

Abstract

(57)【要約】（修正有）【目的】文字認識の精度を上げるために候補文字の数
が増大していくと候補単語の数が巾乗で増大し、辞書フ
ァイル等の検索処理に多くの時間を要すため、効率的な
候補文字の選定が要請されている。本発明は、候補文字
の選定処理の効率化を図ることを目的とする。【構成】文字情報をＯＣＲ読取処理部10とＭＩＣＲ読
取処理部30とで読取り、認識処理部２，４で生成される
候補文字群21,41 を候補文字選別部５に出力し、候補文
字選別部５は該候補文字群21,41 に基づき抽出文字45,2
5 を生成して単語成部55に出力し、該単語生成部55は該
抽出文字45,25 の組合せから成る候補単語51を生成する
ように構成する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は磁気インクで印刷された
文字情報を光学的手段とＭＩＣＲとで読取る文字認識装
置に関する。

【０００２】読取られた文字は、文字毎に予め定められ
た文字パターンとの照合が行われ、該文字パターンと類
似性が高い順に所定の候補文字が決まり、該候補文字の
組合せから生成される候補単語をキーに所定の単語辞書
を検索し比較チェックすることにより、文字認識が行わ
れる。文字認識の精度を上げるために候補文字の数が増
大していくと候補単語の数が巾乗で増大し、辞書ファイ
ル等の検索処理に多くの時間を要すため、効率的な候補
文字の選定が要請されている。

【０００３】

【従来の技術】図７に従来の文字認識の説明図を示す。
図７において、図７（ａ）は納税等に使用される帳票の
１例を示しているが、この帳票の文字データ、例えば氏
名欄の複数の文字からなる文字情報が光学文字読取装置
で読取られると、１文字毎に認識され、文字毎に複数個
（例えば３文字）の候補文字が文字の現れる桁毎に類似
性の高い順に選定される。

【０００４】図７（ｂ）に示すような３文字の文字デー
タが文字認識される場合を以下に説明する。即ち該文字
データが光学文字読取装置によって読取られて文字認識
されると、それぞれの桁毎に認識の上位から順番に３つ
の候補文字が図７（ｃ）に示すように各文字毎に選定さ
れる。

【０００５】第1,2,3 の各候補文字の中からそれぞれ１
文字を取り出して氏名を構成する候補単語を生成する。
該候補単語をキーにして知識辞書（氏名情報がファイル
化されているファイル）を検索し、該候補単語と一致す
るものが存在するか否かを比較チェックする。知識辞書
に存在した氏名を該文字データの最終的な認識単語とし
て決定する。

【０００６】

【発明が解決しようとする課題】以上の説明のように３
文字から構成される単語は、第1,2,3 の各候補文字の中
からそれぞれ１文字を取り出す組合せ（３の３乗）だけ
存在することになり、単語及び候補文字の数が増加する
と知識辞書の検索処理に多くの時間を要すといった問題
があった。

【０００７】本発明は、文字認識の処理効率の向上を図
ることを目的とする。

【０００８】

【課題を解決するための手段】図１は本発明の原理ブロ
ック図である。帳票上に文字を形成したインクの属性に
応じた複数の読取部(1,3) を有する文字認識装置であっ
て、それぞれの読取部1,3 で読取った文字情報を認識
し、ランクつけた複数の候補文字群21,41 をそれぞれに
生成する認識処理部2,4 と、前記候補文字群字21,41 を
対比し、両候補文字群に同一の文字が存在するか否かを
判別し、最も確からしい候補単語51を生成する単語生成
部55を備える。

【０００９】

【作用】文字情報をＯＣＲ読取処理部10とＭＩＣＲ読取
処理部30とで読取り、認識処理部2,4 で生成される候補
文字群21,41 を候補文字選別部５に出力し、該候補文字
選別部５は該候補文字21,41 に基づき抽出文字45,25 を
生成して単語生成部55に出力し、該単語生成部55は該抽
出文字45,25 の組合せから成る候補単語51を生成する。

【００１０】

【実施例】図２に実施例のシステム構成図を示す。図２
において文字認識装置は、ＯＣＲ部11と認識処理部２と
から構成される光学文字読取装置101 と、ＭＩＣＲ部31
と認識処理部４とから構成される磁気インク文字読取装
置301 と、処理装置50と、知識ファイル57と、ディスプ
レイ装置58とから構成される。

【００１１】処理装置50は、文字読取処理部13と、候補
文字格納部52と、抽出文字格納部53と、候補文字選別部
５と、単語生成部55と、候補単語格納部56と、知識処理
部59とから構成され、知識ファイル57は文字認識で使用
される氏名辞書等が保持されている。

【００１２】図２において、帳票44に磁気インク文字で
印字された文字情報42は、光学文字読取装置10と磁気イ
ンク文字読取装置30とで読取られる。図３に示した文字
情報と候補文字の生成説明図の図３（ａ）に帳票44の詳
細を示す。文字情報42は磁気インク文字で印刷されてい
るものとし、該文字情報の認識処理の第１ステップを図
４の候補文字の生成処理手順に従って説明する。

【００１３】図４において、処理ステップ80で文字読取
処理部13は、光学文字読取装置101に対し帳票44の読込
みを指令する。処理ステップ81でＯＣＲ部11は、文字情
報42を読込み、認識処理部２は文字１桁毎に認識辞書
（図示せず）を参照しながら文字認識を行う。文字認識
の結果処理ステップ82で、文字１桁毎に標準文字パター
ンとの類似度の高い順番にランク付けされた所定の数、
例えば４文字の候補文字群21を生成する。この生成され
た文字毎の候補文字を図３（ｂ）に示す。即ち文字情報
42の第 1桁目の文字「ク」は、「ク,ワ,タ,フ」の４文字が候
補文字群21として生成される。

【００１４】処理ステップ83で文字読取処理部13は、該
候補文字群21を光学文字読取装置101 から入力して候補
文字格納部52に格納する。次に文字読取処理部13は処理
ステップ84で、磁気インク文字読取装置301 に対して帳
票44の読込みを指令する。

【００１５】処理ステップ85でＭＩＣＲ部31は文字情報
42を読込み、認識処理部４は文字１桁毎に認識辞書（図
示せず）を参照しながら文字認識を行う。文字認識の結
果処理ステップ86で、文字１桁毎に標準文字パターンと
の類似度の高い順番にランク付けされた所定の数、例え
ば４文字の候補文字群41を生成する。

【００１６】生成された文字毎の候補文字を図３（ｃ）
に示す。即ち文字情報42の第 1桁目の文字「ク」は、
「ク,タ,ク,フ」の４文字が候補文字群41として生成される。
処理ステップ87で文字読取処理部13は、該候補文字群41
を磁気インク文字読取置301 から入力して候補文字格納
部52に格納する。

【００１７】光学文字読取装置101 及び磁気インク文字
読取装置301 によって文字認識された結果の候補文字群
21,41 が候補文字格納部52に格納されると、図５の単語
生成の処理手順に従って文字認識の第２ステップが開始
される。

【００１８】即ち図５において、文字読取処理部13は候
補文字格納部52への候補文字群21,41 の格納を完了する
と処理ステップ90で候補文字選別部５に通知する。処理
ステップ91で候補文字選別部５は、候補文字群21,41 の
それぞれ第１桁目の候補文字の中から、ランクが第１の
文字（それぞれをC1,C2 で表し、図３（ｂ），（ｃ）に
おいて当該文字はいずれも「ク」，「ク」となる）を取
り出す。

【００１９】処理ステップ92で、取り出した候補文字群
21の候補文字(C1)をキーにして候補文字群41を検索し、
該文字と同一の文字を抽出し、該抽出された文字が有す
るランク情報と共に抽出文字45として抽出文字格納部53
へ格納する。

【００２０】同様に処理ステップ93で、取り出した候補
文字群41の文字(C2)をキーにして候補文字群21を検索
し、該文字と同一の文字を抽出し、該抽出された文字が
有するンク情報と共に抽出文字25として抽出文字格納部
53へ格納する。

【００２１】以上で第１桁目の抽出文字の生成が終了し
たが、第２桁目及び第３桁目のそれぞれの候補文字群2
1，41についても同様の抽出文字の生成を行い、処理ス
テップ94で抽出文字格納部53へ格納する。

【００２２】即ち図６の候補文字からの文字抽出と候補
単語に示すように、各桁毎に抽出文字45（図６（ａ）に
＊１印で示す），抽出文字25（図６（ａ）に＊２印で示
す）が抽出文字として抽出される。

【００２３】処理ステップ95で候補文字選別部５は単語
生成55に対し単語生成を通知する。単語生成部55は、桁
毎に抽出文字45,25 を読出し、同一の文字ならばその１
文字を、同一の文字でなければそれぞれの文字のランク
の値の比較し、同一のランクの場合はその２文字を、ラ
ンクが異なればランクの高い文字を各桁毎に選出し、処
理ステップ96で、その組合せからなる文字列から構成さ
れた候補単語51-1,2( 図６（ｂ））を生成して候補単語
格納部56へ格納する。

【００２４】処理ステップ97で知識処理部59は、候補単
語51-1,2を候補単語格納部56から読出し、該候補単語51
-1,2をキーにして知識辞書ファイル57を検索することに
より、登録済みの氏名とマッチングをとり、マッチング
がとれた氏名を例えばディスプレイ装置58に表示する。

【００２５】

【発明の効果】ＯＣＲ読取処理部10とＭＩＣＲ読取処理
部30とで読取られ認識された文字情報は、候補文字群2
1,41 として候補文字選別部５に出力され、該候補文字
選別部よって該候補文字群21,41 に基づき候補単語51を
構成する桁毎の認識文字が多くも2 つに選別されること
により、単語検索の処理効率を大きく向上させることが
可能となる。

【図面の簡単な説明】

【図１】本発明の原理ブロック図

【図２】実施例のシステム構成図

【図３】文字情報と候補文字の生成説明図

【図４】候補文字の生成処理手順

【図５】単語生成の処理手順

【図６】候補文字からの文字抽出と候補単語

【図７】従来の文字認識の説明図

【符号の説明】

１，３は読取部、 11はＯＣＲ部、 31はＭＩＣＲ部、 10はＯＣＲ読取処理部、 13は文字読取処理部、 101 は光学文字読取装置、２，４は認識処理部、 21,41 は候補文字群、 25,45 は抽出文字、 30はＭＩＣＲ読取処理部、 42は文字情報、 44は帳票、５は候補文字選別部、 51,51-1,51-2は候補単語、 52は候補文字格納部 53は抽出文字格納部、 55は単語生成部、 56は候補単語格納部、 57は知識ファイル、 58はディスプレイ装置、 59は知識処理部を示し、 C1,C2 は候補文字、 80〜87，90〜97は処理ステップを表す。

Claims

【特許請求の範囲】

【請求項１】帳票上に文字を形成したインクの属性に
応じた複数の読取部(1,3) を有する文字認識装置であっ
て、それぞれの読取部(1,3) で読取った文字情報を認識し、
ランクつけた複数の候補文字群(21,41) をそれぞれに生
成する認識処理部(2,4) と、前記候補文字群字(21,41) を対比し、両候補文字群に同
一の文字が存在するか否かを判別し、最も確からしい候
補単語(51)を生成する単語生成部(55)、を備えることを
特徴とする文字認識装置。
【請求項２】請求項１記載の文字認識装置にインクの
所定の属性を検出するセンサを設け、該センサが当該イ
ンク属性を検出した時は、当該属性による読取りを行う
ことを特徴とする文字認識装置。