JPH05258100A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH05258100A JPH05258100A JP4055939A JP5593992A JPH05258100A JP H05258100 A JPH05258100 A JP H05258100A JP 4055939 A JP4055939 A JP 4055939A JP 5593992 A JP5593992 A JP 5593992A JP H05258100 A JPH05258100 A JP H05258100A
- Authority
- JP
- Japan
- Prior art keywords
- character
- candidate
- word
- characters
- candidate character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】 (修正有)
【目的】 文字認識の精度を上げるために候補文字の数
が増大していくと候補単語の数が巾乗で増大し、辞書フ
ァイル等の検索処理に多くの時間を要すため、効率的な
候補文字の選定が要請されている。本発明は、候補文字
の選定処理の効率化を図ることを目的とする。 【構成】 文字情報をOCR読取処理部10とMICR読
取処理部30とで読取り、認識処理部2,4で生成される
候補文字群21,41 を候補文字選別部5に出力し、候補文
字選別部5は該候補文字群21,41 に基づき抽出文字45,2
5 を生成して単語成部55に出力し、該単語生成部55は該
抽出文字45,25 の組合せから成る候補単語51を生成する
ように構成する。
が増大していくと候補単語の数が巾乗で増大し、辞書フ
ァイル等の検索処理に多くの時間を要すため、効率的な
候補文字の選定が要請されている。本発明は、候補文字
の選定処理の効率化を図ることを目的とする。 【構成】 文字情報をOCR読取処理部10とMICR読
取処理部30とで読取り、認識処理部2,4で生成される
候補文字群21,41 を候補文字選別部5に出力し、候補文
字選別部5は該候補文字群21,41 に基づき抽出文字45,2
5 を生成して単語成部55に出力し、該単語生成部55は該
抽出文字45,25 の組合せから成る候補単語51を生成する
ように構成する。
Description
【0001】
【産業上の利用分野】本発明は磁気インクで印刷された
文字情報を光学的手段とMICRとで読取る文字認識装
置に関する。
文字情報を光学的手段とMICRとで読取る文字認識装
置に関する。
【0002】読取られた文字は、文字毎に予め定められ
た文字パターンとの照合が行われ、該文字パターンと類
似性が高い順に所定の候補文字が決まり、該候補文字の
組合せから生成される候補単語をキーに所定の単語辞書
を検索し比較チェックすることにより、文字認識が行わ
れる。文字認識の精度を上げるために候補文字の数が増
大していくと候補単語の数が巾乗で増大し、辞書ファイ
ル等の検索処理に多くの時間を要すため、効率的な候補
文字の選定が要請されている。
た文字パターンとの照合が行われ、該文字パターンと類
似性が高い順に所定の候補文字が決まり、該候補文字の
組合せから生成される候補単語をキーに所定の単語辞書
を検索し比較チェックすることにより、文字認識が行わ
れる。文字認識の精度を上げるために候補文字の数が増
大していくと候補単語の数が巾乗で増大し、辞書ファイ
ル等の検索処理に多くの時間を要すため、効率的な候補
文字の選定が要請されている。
【0003】
【従来の技術】図7に従来の文字認識の説明図を示す。
図7において、図7(a)は納税等に使用される帳票の
1例を示しているが、この帳票の文字データ、例えば氏
名欄の複数の文字からなる文字情報が光学文字読取装置
で読取られると、1文字毎に認識され、文字毎に複数個
(例えば3文字)の候補文字が文字の現れる桁毎に類似
性の高い順に選定される。
図7において、図7(a)は納税等に使用される帳票の
1例を示しているが、この帳票の文字データ、例えば氏
名欄の複数の文字からなる文字情報が光学文字読取装置
で読取られると、1文字毎に認識され、文字毎に複数個
(例えば3文字)の候補文字が文字の現れる桁毎に類似
性の高い順に選定される。
【0004】図7(b)に示すような3文字の文字デー
タが文字認識される場合を以下に説明する。即ち該文字
データが光学文字読取装置によって読取られて文字認識
されると、それぞれの桁毎に認識の上位から順番に3つ
の候補文字が図7(c)に示すように各文字毎に選定さ
れる。
タが文字認識される場合を以下に説明する。即ち該文字
データが光学文字読取装置によって読取られて文字認識
されると、それぞれの桁毎に認識の上位から順番に3つ
の候補文字が図7(c)に示すように各文字毎に選定さ
れる。
【0005】第1,2,3 の各候補文字の中からそれぞれ1
文字を取り出して氏名を構成する候補単語を生成する。
該候補単語をキーにして知識辞書(氏名情報がファイル
化されているファイル)を検索し、該候補単語と一致す
るものが存在するか否かを比較チェックする。知識辞書
に存在した氏名を該文字データの最終的な認識単語とし
て決定する。
文字を取り出して氏名を構成する候補単語を生成する。
該候補単語をキーにして知識辞書(氏名情報がファイル
化されているファイル)を検索し、該候補単語と一致す
るものが存在するか否かを比較チェックする。知識辞書
に存在した氏名を該文字データの最終的な認識単語とし
て決定する。
【0006】
【発明が解決しようとする課題】以上の説明のように3
文字から構成される単語は、第1,2,3 の各候補文字の中
からそれぞれ1文字を取り出す組合せ(3の3乗)だけ
存在することになり、単語及び候補文字の数が増加する
と知識辞書の検索処理に多くの時間を要すといった問題
があった。
文字から構成される単語は、第1,2,3 の各候補文字の中
からそれぞれ1文字を取り出す組合せ(3の3乗)だけ
存在することになり、単語及び候補文字の数が増加する
と知識辞書の検索処理に多くの時間を要すといった問題
があった。
【0007】本発明は、文字認識の処理効率の向上を図
ることを目的とする。
ることを目的とする。
【0008】
【課題を解決するための手段】図1は本発明の原理ブロ
ック図である。帳票上に文字を形成したインクの属性に
応じた複数の読取部(1,3) を有する文字認識装置であっ
て、それぞれの読取部1,3 で読取った文字情報を認識
し、ランクつけた複数の候補文字群21,41 をそれぞれに
生成する認識処理部2,4 と、前記候補文字群字21,41 を
対比し、両候補文字群に同一の文字が存在するか否かを
判別し、最も確からしい候補単語51を生成する単語生成
部55を備える。
ック図である。帳票上に文字を形成したインクの属性に
応じた複数の読取部(1,3) を有する文字認識装置であっ
て、それぞれの読取部1,3 で読取った文字情報を認識
し、ランクつけた複数の候補文字群21,41 をそれぞれに
生成する認識処理部2,4 と、前記候補文字群字21,41 を
対比し、両候補文字群に同一の文字が存在するか否かを
判別し、最も確からしい候補単語51を生成する単語生成
部55を備える。
【0009】
【作用】文字情報をOCR読取処理部10とMICR読取
処理部30とで読取り、認識処理部2,4 で生成される候補
文字群21,41 を候補文字選別部5に出力し、該候補文字
選別部5は該候補文字21,41 に基づき抽出文字45,25 を
生成して単語生成部55に出力し、該単語生成部55は該抽
出文字45,25 の組合せから成る候補単語51を生成する。
処理部30とで読取り、認識処理部2,4 で生成される候補
文字群21,41 を候補文字選別部5に出力し、該候補文字
選別部5は該候補文字21,41 に基づき抽出文字45,25 を
生成して単語生成部55に出力し、該単語生成部55は該抽
出文字45,25 の組合せから成る候補単語51を生成する。
【0010】
【実施例】図2に実施例のシステム構成図を示す。図2
において文字認識装置は、OCR部11と認識処理部2と
から構成される光学文字読取装置101 と、MICR部31
と認識処理部4とから構成される磁気インク文字読取装
置301 と、処理装置50と、知識ファイル57と、ディスプ
レイ装置58とから構成される。
において文字認識装置は、OCR部11と認識処理部2と
から構成される光学文字読取装置101 と、MICR部31
と認識処理部4とから構成される磁気インク文字読取装
置301 と、処理装置50と、知識ファイル57と、ディスプ
レイ装置58とから構成される。
【0011】処理装置50は、文字読取処理部13と、候補
文字格納部52と、抽出文字格納部53と、候補文字選別部
5と、単語生成部55と、候補単語格納部56と、知識処理
部59とから構成され、知識ファイル57は文字認識で使用
される氏名辞書等が保持されている。
文字格納部52と、抽出文字格納部53と、候補文字選別部
5と、単語生成部55と、候補単語格納部56と、知識処理
部59とから構成され、知識ファイル57は文字認識で使用
される氏名辞書等が保持されている。
【0012】図2において、帳票44に磁気インク文字で
印字された文字情報42は、光学文字読取装置10と磁気イ
ンク文字読取装置30とで読取られる。図3に示した文字
情報と候補文字の生成説明図の図3(a)に帳票44の詳
細を示す。文字情報42は磁気インク文字で印刷されてい
るものとし、該文字情報の認識処理の第1ステップを図
4の候補文字の生成処理手順に従って説明する。
印字された文字情報42は、光学文字読取装置10と磁気イ
ンク文字読取装置30とで読取られる。図3に示した文字
情報と候補文字の生成説明図の図3(a)に帳票44の詳
細を示す。文字情報42は磁気インク文字で印刷されてい
るものとし、該文字情報の認識処理の第1ステップを図
4の候補文字の生成処理手順に従って説明する。
【0013】図4において、処理ステップ80で文字読取
処理部13は、光学文字読取装置101に対し帳票44の読込
みを指令する。処理ステップ81でOCR部11は、文字情
報42を読込み、認識処理部2は文字1桁毎に認識辞書
(図示せず)を参照しながら文字認識を行う。文字認識
の結果処理ステップ82で、文字1桁毎に標準文字パター
ンとの類似度の高い順番にランク付けされた所定の数、
例えば4文字の候補文字群21を生成する。この生成され
た文字毎の候補文字を図3(b)に示す。即ち文字情報
42の第 1桁目の文字「ク」は、「ク,ワ,タ,フ」の4文字が候
補文字群21として生成される。
処理部13は、光学文字読取装置101に対し帳票44の読込
みを指令する。処理ステップ81でOCR部11は、文字情
報42を読込み、認識処理部2は文字1桁毎に認識辞書
(図示せず)を参照しながら文字認識を行う。文字認識
の結果処理ステップ82で、文字1桁毎に標準文字パター
ンとの類似度の高い順番にランク付けされた所定の数、
例えば4文字の候補文字群21を生成する。この生成され
た文字毎の候補文字を図3(b)に示す。即ち文字情報
42の第 1桁目の文字「ク」は、「ク,ワ,タ,フ」の4文字が候
補文字群21として生成される。
【0014】処理ステップ83で文字読取処理部13は、該
候補文字群21を光学文字読取装置101 から入力して候補
文字格納部52に格納する。次に文字読取処理部13は処理
ステップ84で、磁気インク文字読取装置301 に対して帳
票44の読込みを指令する。
候補文字群21を光学文字読取装置101 から入力して候補
文字格納部52に格納する。次に文字読取処理部13は処理
ステップ84で、磁気インク文字読取装置301 に対して帳
票44の読込みを指令する。
【0015】処理ステップ85でMICR部31は文字情報
42を読込み、認識処理部4は文字1桁毎に認識辞書(図
示せず)を参照しながら文字認識を行う。文字認識の結
果処理ステップ86で、文字1桁毎に標準文字パターンと
の類似度の高い順番にランク付けされた所定の数、例え
ば4文字の候補文字群41を生成する。
42を読込み、認識処理部4は文字1桁毎に認識辞書(図
示せず)を参照しながら文字認識を行う。文字認識の結
果処理ステップ86で、文字1桁毎に標準文字パターンと
の類似度の高い順番にランク付けされた所定の数、例え
ば4文字の候補文字群41を生成する。
【0016】生成された文字毎の候補文字を図3(c)
に示す。即ち文字情報42の第 1桁目の文字「ク」は、
「ク,タ,ク,フ」の4文字が候補文字群41として生成される。
処理ステップ87で文字読取処理部13は、該候補文字群41
を磁気インク文字読取置301 から入力して候補文字格納
部52に格納する。
に示す。即ち文字情報42の第 1桁目の文字「ク」は、
「ク,タ,ク,フ」の4文字が候補文字群41として生成される。
処理ステップ87で文字読取処理部13は、該候補文字群41
を磁気インク文字読取置301 から入力して候補文字格納
部52に格納する。
【0017】光学文字読取装置101 及び磁気インク文字
読取装置301 によって文字認識された結果の候補文字群
21,41 が候補文字格納部52に格納されると、図5の単語
生成の処理手順に従って文字認識の第2ステップが開始
される。
読取装置301 によって文字認識された結果の候補文字群
21,41 が候補文字格納部52に格納されると、図5の単語
生成の処理手順に従って文字認識の第2ステップが開始
される。
【0018】即ち図5において、文字読取処理部13は候
補文字格納部52への候補文字群21,41 の格納を完了する
と処理ステップ90で候補文字選別部5に通知する。処理
ステップ91で候補文字選別部5は、候補文字群21,41 の
それぞれ第1桁目の候補文字の中から、ランクが第1の
文字(それぞれをC1,C2 で表し、図3(b),(c)に
おいて当該文字はいずれも「ク」,「ク」となる)を取
り出す。
補文字格納部52への候補文字群21,41 の格納を完了する
と処理ステップ90で候補文字選別部5に通知する。処理
ステップ91で候補文字選別部5は、候補文字群21,41 の
それぞれ第1桁目の候補文字の中から、ランクが第1の
文字(それぞれをC1,C2 で表し、図3(b),(c)に
おいて当該文字はいずれも「ク」,「ク」となる)を取
り出す。
【0019】処理ステップ92で、取り出した候補文字群
21の候補文字(C1)をキーにして候補文字群41を検索し、
該文字と同一の文字を抽出し、該抽出された文字が有す
るランク情報と共に抽出文字45として抽出文字格納部53
へ格納する。
21の候補文字(C1)をキーにして候補文字群41を検索し、
該文字と同一の文字を抽出し、該抽出された文字が有す
るランク情報と共に抽出文字45として抽出文字格納部53
へ格納する。
【0020】同様に処理ステップ93で、取り出した候補
文字群41の文字(C2)をキーにして候補文字群21を検索
し、該文字と同一の文字を抽出し、該抽出された文字が
有するンク情報と共に抽出文字25として抽出文字格納部
53へ格納する。
文字群41の文字(C2)をキーにして候補文字群21を検索
し、該文字と同一の文字を抽出し、該抽出された文字が
有するンク情報と共に抽出文字25として抽出文字格納部
53へ格納する。
【0021】以上で第1桁目の抽出文字の生成が終了し
たが、第2桁目及び第3桁目のそれぞれの候補文字群2
1,41についても同様の抽出文字の生成を行い、処理ス
テップ94で抽出文字格納部53へ格納する。
たが、第2桁目及び第3桁目のそれぞれの候補文字群2
1,41についても同様の抽出文字の生成を行い、処理ス
テップ94で抽出文字格納部53へ格納する。
【0022】即ち図6の候補文字からの文字抽出と候補
単語に示すように、各桁毎に抽出文字45(図6(a)に
*1印で示す),抽出文字25(図6(a)に*2印で示
す)が抽出文字として抽出される。
単語に示すように、各桁毎に抽出文字45(図6(a)に
*1印で示す),抽出文字25(図6(a)に*2印で示
す)が抽出文字として抽出される。
【0023】処理ステップ95で候補文字選別部5は単語
生成55に対し単語生成を通知する。単語生成部55は、桁
毎に抽出文字45,25 を読出し、同一の文字ならばその1
文字を、同一の文字でなければそれぞれの文字のランク
の値の比較し、同一のランクの場合はその2文字を、ラ
ンクが異なればランクの高い文字を各桁毎に選出し、処
理ステップ96で、その組合せからなる文字列から構成さ
れた候補単語51-1,2( 図6(b))を生成して候補単語
格納部56へ格納する。
生成55に対し単語生成を通知する。単語生成部55は、桁
毎に抽出文字45,25 を読出し、同一の文字ならばその1
文字を、同一の文字でなければそれぞれの文字のランク
の値の比較し、同一のランクの場合はその2文字を、ラ
ンクが異なればランクの高い文字を各桁毎に選出し、処
理ステップ96で、その組合せからなる文字列から構成さ
れた候補単語51-1,2( 図6(b))を生成して候補単語
格納部56へ格納する。
【0024】処理ステップ97で知識処理部59は、候補単
語51-1,2を候補単語格納部56から読出し、該候補単語51
-1,2をキーにして知識辞書ファイル57を検索することに
より、登録済みの氏名とマッチングをとり、マッチング
がとれた氏名を例えばディスプレイ装置58に表示する。
語51-1,2を候補単語格納部56から読出し、該候補単語51
-1,2をキーにして知識辞書ファイル57を検索することに
より、登録済みの氏名とマッチングをとり、マッチング
がとれた氏名を例えばディスプレイ装置58に表示する。
【0025】
【発明の効果】OCR読取処理部10とMICR読取処理
部30とで読取られ認識された文字情報は、候補文字群2
1,41 として候補文字選別部5に出力され、該候補文字
選別部よって該候補文字群21,41 に基づき候補単語51を
構成する桁毎の認識文字が多くも2 つに選別されること
により、単語検索の処理効率を大きく向上させることが
可能となる。
部30とで読取られ認識された文字情報は、候補文字群2
1,41 として候補文字選別部5に出力され、該候補文字
選別部よって該候補文字群21,41 に基づき候補単語51を
構成する桁毎の認識文字が多くも2 つに選別されること
により、単語検索の処理効率を大きく向上させることが
可能となる。
【図1】 本発明の原理ブロック図
【図2】 実施例のシステム構成図
【図3】 文字情報と候補文字の生成説明図
【図4】 候補文字の生成処理手順
【図5】 単語生成の処理手順
【図6】 候補文字からの文字抽出と候補単語
【図7】 従来の文字認識の説明図
1,3は読取部、 11はOCR部、 31はMICR部、 10はOCR読取処理部、 13は文字読取処理部、 101 は光学文字読取装置、 2,4は認識処理部、 21,41 は候補文字群、 25,45 は抽出文字、 30はMICR読取処理部、 42は文字情報、 44は帳票、 5は候補文字選別部、 51,51-1,51-2は候補単語、 52は候補文字格納部 53は抽出文字格納部、 55は単語生成部、 56は候補単語格納部、 57は知識ファイル、 58はディスプレイ装置、 59は知識処理部を示し、 C1,C2 は候補文字、 80〜87,90〜97は処理ステップを表す。
Claims (2)
- 【請求項1】 帳票上に文字を形成したインクの属性に
応じた複数の読取部(1,3) を有する文字認識装置であっ
て、 それぞれの読取部(1,3) で読取った文字情報を認識し、
ランクつけた複数の候補文字群(21,41) をそれぞれに生
成する認識処理部(2,4) と、 前記候補文字群字(21,41) を対比し、両候補文字群に同
一の文字が存在するか否かを判別し、最も確からしい候
補単語(51)を生成する単語生成部(55)、を備えることを
特徴とする文字認識装置。 - 【請求項2】 請求項1記載の文字認識装置にインクの
所定の属性を検出するセンサを設け、該センサが当該イ
ンク属性を検出した時は、当該属性による読取りを行う
ことを特徴とする文字認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4055939A JPH05258100A (ja) | 1992-03-16 | 1992-03-16 | 文字認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4055939A JPH05258100A (ja) | 1992-03-16 | 1992-03-16 | 文字認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH05258100A true JPH05258100A (ja) | 1993-10-08 |
Family
ID=13013049
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP4055939A Withdrawn JPH05258100A (ja) | 1992-03-16 | 1992-03-16 | 文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH05258100A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101807405A (zh) * | 2009-02-16 | 2010-08-18 | 精工爱普生株式会社 | 记录装置及记录装置的控制方法 |
| CN107234882A (zh) * | 2016-03-28 | 2017-10-10 | 精工爱普生株式会社 | 认证装置、打印装置以及认证装置的控制方法 |
-
1992
- 1992-03-16 JP JP4055939A patent/JPH05258100A/ja not_active Withdrawn
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101807405A (zh) * | 2009-02-16 | 2010-08-18 | 精工爱普生株式会社 | 记录装置及记录装置的控制方法 |
| EP2219137A2 (en) | 2009-02-16 | 2010-08-18 | Seiko Epson Corporation | Recording device and control method for a recording device |
| JP2010188533A (ja) * | 2009-02-16 | 2010-09-02 | Seiko Epson Corp | 記録装置、及び、記録装置の制御方法 |
| US8457383B2 (en) | 2009-02-16 | 2013-06-04 | Seiko Epson Corporation | Recording device and control method for a recording device |
| US8953867B2 (en) | 2009-02-16 | 2015-02-10 | Seiko Epson Corporation | Recording device and control method for a recording device |
| US9189696B2 (en) | 2009-02-16 | 2015-11-17 | Seiko Epson Corporation | Recording device and control method for a recording device |
| CN107234882A (zh) * | 2016-03-28 | 2017-10-10 | 精工爱普生株式会社 | 认证装置、打印装置以及认证装置的控制方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4903206A (en) | Spelling error correcting system | |
| JP2726568B2 (ja) | 文字認識方法及び装置 | |
| JPH0797373B2 (ja) | 文書フアイリングシステム | |
| JPH07152774A (ja) | 文書検索方法および装置 | |
| JPH0869476A (ja) | 検索システム | |
| JPH05225238A (ja) | データベース検索システム | |
| JPH05258100A (ja) | 文字認識装置 | |
| JPH09198404A (ja) | 文書処理方法及び装置 | |
| JP3275704B2 (ja) | 入力文字列推測認識装置 | |
| JP2655087B2 (ja) | 文字認識後処理方式 | |
| JP2588261B2 (ja) | Ocrによる住所データベース検索装置 | |
| JP3924899B2 (ja) | テキスト検索装置およびテキスト検索方法 | |
| JPH07296005A (ja) | 日本語テキスト登録・検索装置 | |
| JPH0736926A (ja) | 不完全文字列と文字列の照合方法および装置 | |
| JP3045886B2 (ja) | 手書き入力機能付き文字処理装置 | |
| JPH05225248A (ja) | データベース検索システム | |
| JP2839515B2 (ja) | 文字読取システム | |
| JP2680311B2 (ja) | 文字認識方式 | |
| JPH10307839A (ja) | テキスト検索装置及び方法 | |
| JPH0492973A (ja) | イメージ情報登録検索装置 | |
| JP2917310B2 (ja) | 単語照合における単語辞書検索方式 | |
| JPH10240743A (ja) | 情報蓄積・検索方法及びシステム | |
| JPH0797369B2 (ja) | 仮名漢字変換装置 | |
| JPS6049480A (ja) | データ検索装置 | |
| JPS63138479A (ja) | 文字認識装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 19990518 |