JPH0934984A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH0934984A JPH0934984A JP18421395A JP18421395A JPH0934984A JP H0934984 A JPH0934984 A JP H0934984A JP 18421395 A JP18421395 A JP 18421395A JP 18421395 A JP18421395 A JP 18421395A JP H0934984 A JPH0934984 A JP H0934984A
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognized
- recognition
- candidate
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
(57)【要約】
【目的】 文字認識装置に関し、認識文字を連結する場
合に重複記入による余分な文字を自動的に除去すること
を目的とする。 【構成】 それぞれ異なるイメージより認識された第1
の認識文字(30)と第2の認識文字(31)とを連結して所定
の認識文字列(35)を生成する文字認識装置であって、第
1の認識文字うちの前記連結側の所定文字と第2の認識
文字とを桁対応で比較して一致不一致を検証する一致検
証部(32)と、前記検証結果、一致していると判別した場
合は第1の認識文字より前記所定文字を削除する文字削
除部(33)と、前記削除された第1の認識文字と第2の認
識文字とを連結する文字連結部(34)とを有するように構
成する。
合に重複記入による余分な文字を自動的に除去すること
を目的とする。 【構成】 それぞれ異なるイメージより認識された第1
の認識文字(30)と第2の認識文字(31)とを連結して所定
の認識文字列(35)を生成する文字認識装置であって、第
1の認識文字うちの前記連結側の所定文字と第2の認識
文字とを桁対応で比較して一致不一致を検証する一致検
証部(32)と、前記検証結果、一致していると判別した場
合は第1の認識文字より前記所定文字を削除する文字削
除部(33)と、前記削除された第1の認識文字と第2の認
識文字とを連結する文字連結部(34)とを有するように構
成する。
Description
【0001】
【産業上の利用分野】本発明は、項目別に記入されたイ
メージから読み取った認識文字を連結する場合等におい
て、重複記入による認識文字中の余分な文字を除去する
文字認識装置に関する。
メージから読み取った認識文字を連結する場合等におい
て、重複記入による認識文字中の余分な文字を除去する
文字認識装置に関する。
【0002】近年、知識処理等による認識率の向上によ
り、OCR装置(FAXを含む)を利用した業務形態が
増大しつつある。しかし、このOCR装置に読ませるO
CR帳票の記入者は、専門知識を有した人だけではな
く、金融業務における振込帳票のごとく、一般の人が記
入する機会が増えており、記入の仕方によっては認識率
が低下するといった不都合が生じている。
り、OCR装置(FAXを含む)を利用した業務形態が
増大しつつある。しかし、このOCR装置に読ませるO
CR帳票の記入者は、専門知識を有した人だけではな
く、金融業務における振込帳票のごとく、一般の人が記
入する機会が増えており、記入の仕方によっては認識率
が低下するといった不都合が生じている。
【0003】例えば、金融機関の固有名称「ニホン」と
金融機関種別名(業態名)「ギンコウ」とを別々に記入
させ、これをそれぞれ認識して1つの金融機関名「ニホ
ンギンコウ」を生成するような場合、一般の人は、固有
名称として通常の呼び名である「ニホンギンコウ」を記
入し、業態名として再度「ギンコウ」と記入する場合が
多く、これを連結すると「ニホンギンコウギンコウ」と
なる。従って、登録した「ニホンギンコウ」による知識
処理を行っても、桁数が異なる等の理由により、補正が
有効に機能せず、オペレータの修正操作が必要になる。
金融機関種別名(業態名)「ギンコウ」とを別々に記入
させ、これをそれぞれ認識して1つの金融機関名「ニホ
ンギンコウ」を生成するような場合、一般の人は、固有
名称として通常の呼び名である「ニホンギンコウ」を記
入し、業態名として再度「ギンコウ」と記入する場合が
多く、これを連結すると「ニホンギンコウギンコウ」と
なる。従って、登録した「ニホンギンコウ」による知識
処理を行っても、桁数が異なる等の理由により、補正が
有効に機能せず、オペレータの修正操作が必要になる。
【0004】このように、効率向上のために導入したO
CR装置でも、記入の仕方によっては業務効率は余り向
上しないといった弊害が発生しており、このような不都
合を解決する文字認識装置が求められている。
CR装置でも、記入の仕方によっては業務効率は余り向
上しないといった弊害が発生しており、このような不都
合を解決する文字認識装置が求められている。
【0005】
【従来の技術】図6は従来例の構成図、図7は従来例の
処理手順(その1)説明図、図8は従来例の処理手順
(その2)説明図である。
処理手順(その1)説明図、図8は従来例の処理手順
(その2)説明図である。
【0006】図6は、手書き帳票10に記入された取引デ
ータをOCR装置1で読み取らせて入力する金融端末装
置の構成例を示したものである。いま、顧客が帳票10に
手書きして窓口に提出すると、オペレータはOCR装置
1に挿入する。この結果、以下に示す処理により、表示
装置8に文字認識された取引データが表示される。 (1) OCR装置1は帳票10の各項目についてイメージを
読み取り、文字の認識処理を行い、文字コードに変換す
る。この際、認識が不確かで第1候補文字とは異なる他
の候補文字が存在すれば、文字ごとに提案する。帳票10
には、マークによる項目選択があり、選択情報(2値デ
ータ)も同時に出力する。 (2) 文字列変換部2は、文字列変換テーブル6を参照
し、選択情報を対応する文字列に変換する。 (3) 知識処理部3は、各項目について、すべての候補文
字を組み合わせた認識文字列と知識辞書7に登録されて
いる文字列とを比較し、登録文字列と一致する認識文字
列を正常認識した認識文字列として出力する。 (4) 画面表示部4は、決定した各項目の認識文字列を、
所定フォーマット、例えば帳票10の形式に相当する画面
を定義した画面定義体5に基づいて表示する。
ータをOCR装置1で読み取らせて入力する金融端末装
置の構成例を示したものである。いま、顧客が帳票10に
手書きして窓口に提出すると、オペレータはOCR装置
1に挿入する。この結果、以下に示す処理により、表示
装置8に文字認識された取引データが表示される。 (1) OCR装置1は帳票10の各項目についてイメージを
読み取り、文字の認識処理を行い、文字コードに変換す
る。この際、認識が不確かで第1候補文字とは異なる他
の候補文字が存在すれば、文字ごとに提案する。帳票10
には、マークによる項目選択があり、選択情報(2値デ
ータ)も同時に出力する。 (2) 文字列変換部2は、文字列変換テーブル6を参照
し、選択情報を対応する文字列に変換する。 (3) 知識処理部3は、各項目について、すべての候補文
字を組み合わせた認識文字列と知識辞書7に登録されて
いる文字列とを比較し、登録文字列と一致する認識文字
列を正常認識した認識文字列として出力する。 (4) 画面表示部4は、決定した各項目の認識文字列を、
所定フォーマット、例えば帳票10の形式に相当する画面
を定義した画面定義体5に基づいて表示する。
【0007】オペレータはこの表示された認識文字と手
書き帳票10とを比較し、認識誤りがある文字について
は、図示省略したキーボードにより修正する。図7,図
8は具体的な処理手順を示したものである。
書き帳票10とを比較し、認識誤りがある文字について
は、図示省略したキーボードにより修正する。図7,図
8は具体的な処理手順を示したものである。
【0008】帳票10には、口座番号、金融機関名、
支店名、を手書きする項目と、銀行,信金等の業態
名をマークで選択する選択項目とがあり、〔金融機関
名+業態名〕を正式な(金融機関名)として金融端末
装置に入力するようになっている。なお、図7の例で
は、金融機関名は正しくは「イロハ」と記入すべきとこ
ろを「イロハシンキン」と記入している例を示してい
る。
支店名、を手書きする項目と、銀行,信金等の業態
名をマークで選択する選択項目とがあり、〔金融機関
名+業態名〕を正式な(金融機関名)として金融端末
装置に入力するようになっている。なお、図7の例で
は、金融機関名は正しくは「イロハ」と記入すべきとこ
ろを「イロハシンキン」と記入している例を示してい
る。
【0009】ここで、図7の表(イ)は、OCR装置1
で認識された各項目の候補文字(このうち、最も正しい
と判別した認識文字を、認識文字または第1候補文字と
称する)を示したもので、業態名は、マーク位置により
「0100」と認識されている。
で認識された各項目の候補文字(このうち、最も正しい
と判別した認識文字を、認識文字または第1候補文字と
称する)を示したもので、業態名は、マーク位置により
「0100」と認識されている。
【0010】これらの認識データにより、先ず、選択情
報「0100」が文字列変換テーブル6により、表
(ロ)のごとく、文字列「シンキン」と変換される。続
いて、認識された金融機関名「イロハシ?キソ」(第1
候補文字)と業態「シンキン」とが連結され、「イロハ
シ?キンシンキン」を対象として知識辞書7による知識
処理(比較による正否の検証等)が行われる。知識辞書
7には「イロハシンキン」は登録されているが、「シン
キン」を二重に連結した「イロハシンキンシンキン」は
登録されていないから、一致する登録文字は検出でき
ず、認識誤りと判定される。
報「0100」が文字列変換テーブル6により、表
(ロ)のごとく、文字列「シンキン」と変換される。続
いて、認識された金融機関名「イロハシ?キソ」(第1
候補文字)と業態「シンキン」とが連結され、「イロハ
シ?キンシンキン」を対象として知識辞書7による知識
処理(比較による正否の検証等)が行われる。知識辞書
7には「イロハシンキン」は登録されているが、「シン
キン」を二重に連結した「イロハシンキンシンキン」は
登録されていないから、一致する登録文字は検出でき
ず、認識誤りと判定される。
【0011】ここで、他に候補文字があれば、次にその
候補文字を第1候補文字に組み込んだ文字列を対象とし
て知識処理が行われる。しかし、ここでも、「シンキ
ン」が二重に連結されたものとの比較になるから、すべ
ての候補文字について、知識処理による正しい認識文字
の抽出は行われず、第1候補文字である「イロハシ?キ
ソシンキン」がそのまま表示される。この結果、オペレ
ータは「シ?キソ」を削除する操作を行う。なお、口座
番号は、ここでは第1候補文字「01234567」が
採用され、支店名は「アイウエオマチ」が知識処理によ
って決定されている。
候補文字を第1候補文字に組み込んだ文字列を対象とし
て知識処理が行われる。しかし、ここでも、「シンキ
ン」が二重に連結されたものとの比較になるから、すべ
ての候補文字について、知識処理による正しい認識文字
の抽出は行われず、第1候補文字である「イロハシ?キ
ソシンキン」がそのまま表示される。この結果、オペレ
ータは「シ?キソ」を削除する操作を行う。なお、口座
番号は、ここでは第1候補文字「01234567」が
採用され、支店名は「アイウエオマチ」が知識処理によ
って決定されている。
【0012】
【発明が解決しようとする課題】手書き帳票等を読み取
り入力する文字認識装置では、認識率を向上させ、オペ
レータによる修正を少なくするため、手書き文字を少な
くした形式の帳票が使用されている。即ち、「シンキ
ン」,「ギンコウ」等の業態名はマークで選択させるよ
うにして認識率を改善している。
り入力する文字認識装置では、認識率を向上させ、オペ
レータによる修正を少なくするため、手書き文字を少な
くした形式の帳票が使用されている。即ち、「シンキ
ン」,「ギンコウ」等の業態名はマークで選択させるよ
うにして認識率を改善している。
【0013】これにより、金融機関名として「イロハシ
ンキン」と記入する代わりに、固有名称部分である「イ
ロハ」を手書きし、業態名である「シンキン」はマーク
で指定すればよく、文字認識装置では、この2項目を連
結して「イロハシンキン」と認識する。勿論、「イロハ
シンキン」と手書きし、マーク記入をしなければ「イロ
ハシンキン」と認識されるが、手書き部分が多くなるの
で、その分認識率が低下する。
ンキン」と記入する代わりに、固有名称部分である「イ
ロハ」を手書きし、業態名である「シンキン」はマーク
で指定すればよく、文字認識装置では、この2項目を連
結して「イロハシンキン」と認識する。勿論、「イロハ
シンキン」と手書きし、マーク記入をしなければ「イロ
ハシンキン」と認識されるが、手書き部分が多くなるの
で、その分認識率が低下する。
【0014】このような記入方法では、一般の顧客は、
固有名称の記入項目に、通常呼称する金融機関名、例え
ば「イロハシンキン」と記入した上、「信金」にマーク
を付けることが多く、文字認識装置では「イロハシンキ
ンシンキン」のごとく「シンキン」が重複することにな
る。この「イロハシンキンシンキン」は知識辞書には登
録されていないので、比較処理などの知識処理を実行し
ても候補文字から正しい認識文字を抽出することはでき
ず、そのまま「イロハシンキンシンキン」と表示される
ことになり、個々の文字は正しく認識されたとしてもオ
ペレータの修正が必要となる。
固有名称の記入項目に、通常呼称する金融機関名、例え
ば「イロハシンキン」と記入した上、「信金」にマーク
を付けることが多く、文字認識装置では「イロハシンキ
ンシンキン」のごとく「シンキン」が重複することにな
る。この「イロハシンキンシンキン」は知識辞書には登
録されていないので、比較処理などの知識処理を実行し
ても候補文字から正しい認識文字を抽出することはでき
ず、そのまま「イロハシンキンシンキン」と表示される
ことになり、個々の文字は正しく認識されたとしてもオ
ペレータの修正が必要となる。
【0015】このように、記入方法の仕方によっては、
知識処理による認識の改善効果は期待できず、オペレー
タの修正操作が削減できないといった課題があった。本
発明は、上記課題に鑑み、認識文字列を連結する際、余
分な文字を削除する文字認識装置を提供することを目的
とする。
知識処理による認識の改善効果は期待できず、オペレー
タの修正操作が削減できないといった課題があった。本
発明は、上記課題に鑑み、認識文字列を連結する際、余
分な文字を削除する文字認識装置を提供することを目的
とする。
【0016】
【課題を解決するための手段】上記目的を達成するた
め、本発明の文字認識装置は、図1の本発明の原理図に
示すように、 (1) それぞれ異なるイメージより認識された第1の認識
文字30と第2の認識文字31とを連結して所定の認識文字
列35を生成する文字認識装置であって、第1の認識文字
30うちの前記連結側の所定文字(B)と第2の認識文字
31(C)とを桁対応で比較して一致不一致を検証する一
致検証部32と、前記検証結果、一致していると判別した
場合は第1の認識文字30より前記所定文字(B)を削除
する文字削除部33と、前記削除された第1の認識文字
(A)と第2の認識文字(C)とを連結する文字連結部
34とを有するように構成する。 (2) 前記(1) において、第2の認識文字31は、マーク読
み取りにより認識され、変換された文字であるように構
成する。 (3) 前記(1) または(2) において、第1の認識文字30と
して、複数の候補文字が桁単位で提示されている場合、
各候補文字と第2の認識文字31とを桁対応で比較し、す
べての桁でそれぞれ第2の認識文字31と一致する候補文
字が存在すれば、第1の認識文字30より該候補文字を含
めた所定文字を削除するように構成する。 (4) 前記(1) または(2) または(3) において、認識文字
を登録済み文字と比較して補正する知識処理部を有し、
前記連結した認識文字列35の知識処理を行う場合は、前
記削除処理し連結した認識文字列を使用して知識処理を
行うように構成する。 (5) 前記(1) または(2) または(3) または(4) におい
て、表示装置を備え、該表示装置に連結した認識文字列
35を表示するように構成する。 (6) 前記(1) または(2) または(3) または(4) または
(5) において、イメージデータの文字認識を行い、前記
候補文字を出力する文字認識部を備えるように構成す
る。
め、本発明の文字認識装置は、図1の本発明の原理図に
示すように、 (1) それぞれ異なるイメージより認識された第1の認識
文字30と第2の認識文字31とを連結して所定の認識文字
列35を生成する文字認識装置であって、第1の認識文字
30うちの前記連結側の所定文字(B)と第2の認識文字
31(C)とを桁対応で比較して一致不一致を検証する一
致検証部32と、前記検証結果、一致していると判別した
場合は第1の認識文字30より前記所定文字(B)を削除
する文字削除部33と、前記削除された第1の認識文字
(A)と第2の認識文字(C)とを連結する文字連結部
34とを有するように構成する。 (2) 前記(1) において、第2の認識文字31は、マーク読
み取りにより認識され、変換された文字であるように構
成する。 (3) 前記(1) または(2) において、第1の認識文字30と
して、複数の候補文字が桁単位で提示されている場合、
各候補文字と第2の認識文字31とを桁対応で比較し、す
べての桁でそれぞれ第2の認識文字31と一致する候補文
字が存在すれば、第1の認識文字30より該候補文字を含
めた所定文字を削除するように構成する。 (4) 前記(1) または(2) または(3) において、認識文字
を登録済み文字と比較して補正する知識処理部を有し、
前記連結した認識文字列35の知識処理を行う場合は、前
記削除処理し連結した認識文字列を使用して知識処理を
行うように構成する。 (5) 前記(1) または(2) または(3) または(4) におい
て、表示装置を備え、該表示装置に連結した認識文字列
35を表示するように構成する。 (6) 前記(1) または(2) または(3) または(4) または
(5) において、イメージデータの文字認識を行い、前記
候補文字を出力する文字認識部を備えるように構成す
る。
【0017】
(1) 一致検証部32は、それぞれ異なるイメージより認識
された第1の認識文字30の連結側の所定文字列(図1の
B)と第2の認識文字31とを比較検証し、文字削除部33
は、前記検証の結果、一致していると判別した場合は第
1の認識文字30より前記所定文字列(B)を削除し、文
字連結部34は、削除された第1の認識文字(図1のA)
と第2の認識文字31(図1のC)とを連結する。
された第1の認識文字30の連結側の所定文字列(図1の
B)と第2の認識文字31とを比較検証し、文字削除部33
は、前記検証の結果、一致していると判別した場合は第
1の認識文字30より前記所定文字列(B)を削除し、文
字連結部34は、削除された第1の認識文字(図1のA)
と第2の認識文字31(図1のC)とを連結する。
【0018】以上により、第1の認識文字30と第2の認
識文字31を連結した場合に生じる二重記入による文字の
重複が自動的に除去される。 (2) 前記(1) において、第2の認識文字31としては、マ
ーク読み取りで認識され、変換された文字とする。マー
ク読み取りによる認識文字は、イメージから読み取った
認識文字より一般に認識率が高いので、検証における比
較基準として優れており、削除ミスが改善できる。 (3) 前記(1) または(2) において、 第1の認識文字30
に、複数の認識された候補文字が桁単位で提示されてい
る場合、各候補文字と第2の文字列31とを桁対応で比較
する。その結果、すべての桁でそれぞれ第2の文字列31
と一致する候補文字が存在すれば、二重記入があるとし
て第1の認識文字30より候補文字を含めた所定文字を削
除する。
識文字31を連結した場合に生じる二重記入による文字の
重複が自動的に除去される。 (2) 前記(1) において、第2の認識文字31としては、マ
ーク読み取りで認識され、変換された文字とする。マー
ク読み取りによる認識文字は、イメージから読み取った
認識文字より一般に認識率が高いので、検証における比
較基準として優れており、削除ミスが改善できる。 (3) 前記(1) または(2) において、 第1の認識文字30
に、複数の認識された候補文字が桁単位で提示されてい
る場合、各候補文字と第2の文字列31とを桁対応で比較
する。その結果、すべての桁でそれぞれ第2の文字列31
と一致する候補文字が存在すれば、二重記入があるとし
て第1の認識文字30より候補文字を含めた所定文字を削
除する。
【0019】これにより、余分な記入部分の認識率が悪
い場合でも、候補文字があれば削除が可能となる。 (4) 知識処理部により連結文字列の知識処理を行う場合
は、前記削除処理し連結した認識文字列を対象として知
識処理を行う。この場合、重複部分が削除されているの
で知識処理が有効となる。 (5) 文字認識の補正装置を構成する場合は、表示装置を
設けて連結した認識文字列を表示する。これにより、オ
ペレータによる確認, 修正が可能な装置が実現できる。 (6) イメージデータの文字認識を行う文字認識部を備え
ることにより、例えば、FAXで送られたイメージデー
タの文字認識が可能となる。また、OCR装置を設けれ
ば、手書き帳票による入力装置が実現できる。
い場合でも、候補文字があれば削除が可能となる。 (4) 知識処理部により連結文字列の知識処理を行う場合
は、前記削除処理し連結した認識文字列を対象として知
識処理を行う。この場合、重複部分が削除されているの
で知識処理が有効となる。 (5) 文字認識の補正装置を構成する場合は、表示装置を
設けて連結した認識文字列を表示する。これにより、オ
ペレータによる確認, 修正が可能な装置が実現できる。 (6) イメージデータの文字認識を行う文字認識部を備え
ることにより、例えば、FAXで送られたイメージデー
タの文字認識が可能となる。また、OCR装置を設けれ
ば、手書き帳票による入力装置が実現できる。
【0020】以上のごとく、項目を連結させる場合の余
分な重複記入を削除することができ、オペレータの修正
操作が少なくなるとともに、知識処理の効果を達成する
ことができるようになる。
分な重複記入を削除することができ、オペレータの修正
操作が少なくなるとともに、知識処理の効果を達成する
ことができるようになる。
【0021】
【実施例】図2は一実施例の構成図、図3は処理フロー
チャート図、図4は一実施例の処理手順(その1)説明
図、図5は一実施例の処理手順(その2)説明図であ
る。
チャート図、図4は一実施例の処理手順(その1)説明
図、図5は一実施例の処理手順(その2)説明図であ
る。
【0022】本実施例は、OCR装置により、従来例で
示した取引帳票を読み取り、知識処理を施した認識文字
を表示して、オペレータに修正させる文字認識装置に適
用した例を説明する。
示した取引帳票を読み取り、知識処理を施した認識文字
を表示して、オペレータに修正させる文字認識装置に適
用した例を説明する。
【0023】図2において、1はOCR装置で、挿入さ
れた手書き帳票10の各項目のイメージ, マークを読み取
り、認識文字,それに対する桁単位の候補文字(以上第
1の認識文字30に対応する) 、マークで指定された選択
情報を出力する。
れた手書き帳票10の各項目のイメージ, マークを読み取
り、認識文字,それに対する桁単位の候補文字(以上第
1の認識文字30に対応する) 、マークで指定された選択
情報を出力する。
【0024】2は文字列変換部で、マーク読み取りで認
識した2値の選択情報により、文字列変換テーブル6を
参照し、所定の文字列(第2の認識文字31に対応し、変
換文字列と称する)に変換する。
識した2値の選択情報により、文字列変換テーブル6を
参照し、所定の文字列(第2の認識文字31に対応し、変
換文字列と称する)に変換する。
【0025】14は文字削除部で、図1に示した一致検証
部32を含み、文字列変換部2で変換された変換文字列
(ここでは業態名)が連結対象の金融機関名の認識文字
中に存在するか否かを検証し、存在する場合は、金融機
関名から業態名を削除する。
部32を含み、文字列変換部2で変換された変換文字列
(ここでは業態名)が連結対象の金融機関名の認識文字
中に存在するか否かを検証し、存在する場合は、金融機
関名から業態名を削除する。
【0026】15は文字連結部で、文字削除部14で処理さ
れた金融機関名と業態名とを連結する。この際、第1候
補文字の他に候補文字があれば、第1候補文字と組み合
わせたすべての金融機関名と業態名とを連結する。
れた金融機関名と業態名とを連結する。この際、第1候
補文字の他に候補文字があれば、第1候補文字と組み合
わせたすべての金融機関名と業態名とを連結する。
【0027】3は知識処理部で、知識辞書中に登録した
文字列と金融機関名と業態名とを連結した認識文字(候
補文字を含む)とを比較し、一致したとき、その認識文
字を正しい認識文字と判定する。登録した文字列と一致
する認識文字がなければ、第1候補文字を認識文字とし
て出力する。
文字列と金融機関名と業態名とを連結した認識文字(候
補文字を含む)とを比較し、一致したとき、その認識文
字を正しい認識文字と判定する。登録した文字列と一致
する認識文字がなければ、第1候補文字を認識文字とし
て出力する。
【0028】4は画面表示部で、画面定義体5で定義さ
れている連結項目名に基づいて最終決定した認識文字を
連結し、表示部16に表示する。17はキーボードで、表示
された認識文字に修正の必要がある場合は、オペレータ
はその修正文字にカーソルを移動して修正文字を入力す
る。
れている連結項目名に基づいて最終決定した認識文字を
連結し、表示部16に表示する。17はキーボードで、表示
された認識文字に修正の必要がある場合は、オペレータ
はその修正文字にカーソルを移動して修正文字を入力す
る。
【0029】13は修正部で、キーボード17からの修正入
力により、認識文字の修正処理を行う。12はメモリで、
後述する各ファイルデータをロードするメモリ、読み取
った認識文字データの格納用メモリ、前述した各部のワ
ーク用のメモリとして使用される。
力により、認識文字の修正処理を行う。12はメモリで、
後述する各ファイルデータをロードするメモリ、読み取
った認識文字データの格納用メモリ、前述した各部のワ
ーク用のメモリとして使用される。
【0030】11は中央処理ユニットCPUで、バスで接
続された前記各部を動作させ、文字認識処理を遂行す
る。7は知識辞書で、ファイルに格納され、図8に示し
たように、各項目データが登録されている。
続された前記各部を動作させ、文字認識処理を遂行す
る。7は知識辞書で、ファイルに格納され、図8に示し
たように、各項目データが登録されている。
【0031】5はファイルに格納された帳票ごとの画面
定義体で、各項目ごとに画面表示属性、例えば、項目ご
とに、連結項目名,表示行位置,表示桁位置,項目長,
表示色等が定義されており、画面表示部4は、この画面
定義体を参照しつつ、表示する。なお、文字連結部15は
この画面定義体5を参照して連結処理を行い、メモリ12
に格納し、知識処理用に提供する。
定義体で、各項目ごとに画面表示属性、例えば、項目ご
とに、連結項目名,表示行位置,表示桁位置,項目長,
表示色等が定義されており、画面表示部4は、この画面
定義体を参照しつつ、表示する。なお、文字連結部15は
この画面定義体5を参照して連結処理を行い、メモリ12
に格納し、知識処理用に提供する。
【0032】6はファイルされた文字列変換テーブル
で、帳票種別を表す帳票ID,その帳票の変換項目数,
項目名(例えば業態別),テーブル個数(業態数)、選
択情報(0100等),対応する変換文字列(シンキン
等)等から構成されている。これにより、例えば振込帳
票で、帳票IDのマーク読み取りで「01001」が得
られ、業態読み取りで「0100」が得られたとき、振
込帳票用の文字列変換テーブルを参照して「シンキン」
と変換する。
で、帳票種別を表す帳票ID,その帳票の変換項目数,
項目名(例えば業態別),テーブル個数(業態数)、選
択情報(0100等),対応する変換文字列(シンキン
等)等から構成されている。これにより、例えば振込帳
票で、帳票IDのマーク読み取りで「01001」が得
られ、業態読み取りで「0100」が得られたとき、振
込帳票用の文字列変換テーブルを参照して「シンキン」
と変換する。
【0033】以上の構成により、以下に示す認識処理が
行われる。図3参照 いま、帳票10には、口座番号「01234567」, 金
融機関名「イロハシンキン」,支店名「アイウエオマ
チ」の各項目が手書きで記入され、業態として「信金」
にマークが付されているものとする。つまり、「シンキ
ン」が二重に記入されている。この帳票10をOCR装置
1に挿入すると、OCR装置1は各項目のイメージデー
タ,マーク,帳票10の左上の伝票ID「01001」の
イメージデータを読み取り、文字データに変換する。イ
メージデータについては、認識した第1候補文字の他
に、他の候補文字があれば、その候補文字を出力する。 (1) 先ず、帳票IDを取得する。 (2) 文字列変換部2は文字列変換テーブル6をメモリ12
にロードし、 (3) 帳票ID「01001」の変換テーブルについて項
目数分ループし、登録された項目を検索する。その結
果、選択情報「0100」に対応する文字列(変換文字
列)、ここでは「シンキン」が検索されるので「シンキ
ン」に変換する。 (4) 続いて、文字削除部14は、金融機関名の認識文字列
中の連結側文字列と、変換文字列とを比較する。 (5) 一致しない場合はそのまま後述のステップ(7) に処
理を進め、 (6) 一致していれば、認識文字列から変換文字列と同一
文字を削除する。 (7) 文字連結部15は、画面定義体5を参照して連結項目
を認識し、文字削除部14から出力された認識文字列と、
変換文字列とを連結する。そして、知識処理部3は、知
識辞書7を参照しつつ、連結された認識文字列が知識辞
書内にあるか否かの比較処理を行う。
行われる。図3参照 いま、帳票10には、口座番号「01234567」, 金
融機関名「イロハシンキン」,支店名「アイウエオマ
チ」の各項目が手書きで記入され、業態として「信金」
にマークが付されているものとする。つまり、「シンキ
ン」が二重に記入されている。この帳票10をOCR装置
1に挿入すると、OCR装置1は各項目のイメージデー
タ,マーク,帳票10の左上の伝票ID「01001」の
イメージデータを読み取り、文字データに変換する。イ
メージデータについては、認識した第1候補文字の他
に、他の候補文字があれば、その候補文字を出力する。 (1) 先ず、帳票IDを取得する。 (2) 文字列変換部2は文字列変換テーブル6をメモリ12
にロードし、 (3) 帳票ID「01001」の変換テーブルについて項
目数分ループし、登録された項目を検索する。その結
果、選択情報「0100」に対応する文字列(変換文字
列)、ここでは「シンキン」が検索されるので「シンキ
ン」に変換する。 (4) 続いて、文字削除部14は、金融機関名の認識文字列
中の連結側文字列と、変換文字列とを比較する。 (5) 一致しない場合はそのまま後述のステップ(7) に処
理を進め、 (6) 一致していれば、認識文字列から変換文字列と同一
文字を削除する。 (7) 文字連結部15は、画面定義体5を参照して連結項目
を認識し、文字削除部14から出力された認識文字列と、
変換文字列とを連結する。そして、知識処理部3は、知
識辞書7を参照しつつ、連結された認識文字列が知識辞
書内にあるか否かの比較処理を行う。
【0034】一般に複数の候補文字がOCR装置1より
出力されているので、第1候補文字が辞書内に存在しな
ければ、第1候補文字と他の候補文字との組み合わせの
認識文字を生成して連結処理を行い、比較処理を行う。
そして、知識辞書7に登録されている文字列と一致して
いる認識文字があればその認識文字を正常に認識された
文字として出力する。なければ第1候補文字を出力す
る。 (8) 画面表示部4は、画面定義体5の情報から連結項目
の文字列を抽出して連結し表示する。なお、前記(7) で
連結した認識文字が得られているので、そのまま表示す
るようにしてもよい。
出力されているので、第1候補文字が辞書内に存在しな
ければ、第1候補文字と他の候補文字との組み合わせの
認識文字を生成して連結処理を行い、比較処理を行う。
そして、知識辞書7に登録されている文字列と一致して
いる認識文字があればその認識文字を正常に認識された
文字として出力する。なければ第1候補文字を出力す
る。 (8) 画面表示部4は、画面定義体5の情報から連結項目
の文字列を抽出して連結し表示する。なお、前記(7) で
連結した認識文字が得られているので、そのまま表示す
るようにしてもよい。
【0035】図4,図5は、従来例に基づく一実施例の
処理手順を示したものである。表「イ」は、候補文字を
含んだOCR出力で、先ず文字列変換を行う。この結果
表「ロ」に示すように、業態名として「シンキン」が得
られる。ここまでは、従来例で示した通りである。
処理手順を示したものである。表「イ」は、候補文字を
含んだOCR出力で、先ず文字列変換を行う。この結果
表「ロ」に示すように、業態名として「シンキン」が得
られる。ここまでは、従来例で示した通りである。
【0036】次に、表「ヘ」に示すように、金融機関名
の文字削除処理を行う。変換文字列「シンキン」は4桁
であるから、金融機関名の連結側4桁と「シンキン」と
を比較する。いまの場合、連結側4桁の文字列には複数
の候補文字があるから、各桁ごとに、「シンキン」とそ
の桁のすべての候補文字とを比較する。「シンキン」の
「シ」と対応する候補文字には、「ソ」,「シ」,
「ン」があり、「シンキン」の「シ」が候補文字中の該
当桁に存在し、「シンキン」の「ン」と対応する候補文
字には、「?」,「ツ」,「ン」があり、「ン」がその
桁の候補文字中に存在する。
の文字削除処理を行う。変換文字列「シンキン」は4桁
であるから、金融機関名の連結側4桁と「シンキン」と
を比較する。いまの場合、連結側4桁の文字列には複数
の候補文字があるから、各桁ごとに、「シンキン」とそ
の桁のすべての候補文字とを比較する。「シンキン」の
「シ」と対応する候補文字には、「ソ」,「シ」,
「ン」があり、「シンキン」の「シ」が候補文字中の該
当桁に存在し、「シンキン」の「ン」と対応する候補文
字には、「?」,「ツ」,「ン」があり、「ン」がその
桁の候補文字中に存在する。
【0037】このようにして各桁で比較すると、表
「ト」の反転文字で示したように、比較するすべての桁
で「シンキン」と一致する候補文字が存在する。この結
果、金融機関名の最後の4桁は「シンキン」と判定し、
これは変換文字列「シンキン」と重複しているから、候
補文字「イロハシ?キン」,「リ−−ソツエン」,「−
−−ツン−−」の後半4桁を削除し、「イロハ」を第1
候補文字、「リ−−」,「−−−」を次の候補文字とす
る。
「ト」の反転文字で示したように、比較するすべての桁
で「シンキン」と一致する候補文字が存在する。この結
果、金融機関名の最後の4桁は「シンキン」と判定し、
これは変換文字列「シンキン」と重複しているから、候
補文字「イロハシ?キン」,「リ−−ソツエン」,「−
−−ツン−−」の後半4桁を削除し、「イロハ」を第1
候補文字、「リ−−」,「−−−」を次の候補文字とす
る。
【0038】この結果を表「チ」に示す。この削除した
候補文字列と業態名「シンキン」とを連結し、知識辞書
7による知識処理を行う。いまの場合「イロハ」+「シ
ンキン」=「イロハシンキン」は知識辞書7に存在する
から、金融機関名は「イロハシンキン」と認識され、表
「リ」に示すように、金融機関名は「イロハ」,業態名
は「シンキン」と決定される。そして、画面表示部4に
より、金融機関名と業態名とが連結されて、「イロハシ
ンキン」と表示される。
候補文字列と業態名「シンキン」とを連結し、知識辞書
7による知識処理を行う。いまの場合「イロハ」+「シ
ンキン」=「イロハシンキン」は知識辞書7に存在する
から、金融機関名は「イロハシンキン」と認識され、表
「リ」に示すように、金融機関名は「イロハ」,業態名
は「シンキン」と決定される。そして、画面表示部4に
より、金融機関名と業態名とが連結されて、「イロハシ
ンキン」と表示される。
【0039】なお、前述したように、取引処理において
「イロハ」と「シンキン」とを分離する必要がない場合
は、文字連結部15で連結され、補正された認識文字が保
存されているので、画面表示部4で連結する必要はな
い。
「イロハ」と「シンキン」とを分離する必要がない場合
は、文字連結部15で連結され、補正された認識文字が保
存されているので、画面表示部4で連結する必要はな
い。
【0040】以上の実施例では、OCR装置1を有する
装置について示したが、FAXで読み取った振込帳票の
イメージを受信して認識処理を行う装置にも適用できる
ことは勿論である。
装置について示したが、FAXで読み取った振込帳票の
イメージを受信して認識処理を行う装置にも適用できる
ことは勿論である。
【0041】以上のごとく、項目を分離して記入させる
場合、重複して記入された文字を両方の認識文字を比較
することにより自動的に削除することができ、知識処理
による認識率が向上する。
場合、重複して記入された文字を両方の認識文字を比較
することにより自動的に削除することができ、知識処理
による認識率が向上する。
【0042】
【発明の効果】以上説明したように、本発明の文字認識
装置は、認識した項目データを連結する場合、重複して
記入されたデータを削除するようにしたので、知識処理
を有効化することができ、オペレータによる修正操作を
削減できる効果を奏する。
装置は、認識した項目データを連結する場合、重複して
記入されたデータを削除するようにしたので、知識処理
を有効化することができ、オペレータによる修正操作を
削減できる効果を奏する。
【図1】 本発明の原理図
【図2】 一実施例の構成図
【図3】 処理フローチャート図
【図4】 一実施例の処理手順(その1)説明図
【図5】 一実施例の処理手順(その2)説明図
【図6】 従来例の構成図
【図7】 従来例の処理手順(その1)説明図
【図8】 従来例の処理手順(その2)説明図
1 OCR装置 2 文字列変換部 3 知識処理部 4 画面表示部 5 画面定義体 6 文字列変換テ
ーブル 7 知識辞書 8 表示装置 10 手書き帳票 11 中央処理ユニ
ットCPU 12 メモリ 13 修正部 14 文字列削除部 15 文字連結部 16 表示部 17 キーボード 30 第1の認識文字 31 第2の認識文
字 32 一致検証部 33 文字削除部 34 文字連結部 35 認識文字列
ーブル 7 知識辞書 8 表示装置 10 手書き帳票 11 中央処理ユニ
ットCPU 12 メモリ 13 修正部 14 文字列削除部 15 文字連結部 16 表示部 17 キーボード 30 第1の認識文字 31 第2の認識文
字 32 一致検証部 33 文字削除部 34 文字連結部 35 認識文字列
フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G06F 15/30 320
Claims (6)
- 【請求項1】 それぞれ異なるイメージより認識され
た第1の認識文字と第2の認識文字とを連結して所定の
認識文字列を生成する文字認識装置であって、 第1の認識文字うちの前記連結側の所定文字と第2の認
識文字とを桁対応で比較して一致不一致を検証する一致
検証部と、 前記検証結果、一致していると判別した場合は第1の認
識文字より前記所定文字を削除する文字削除部と、 前記削除された第1の認識文字と第2の認識文字とを連
結する文字連結部とを有することを特徴とする文字認識
装置。 - 【請求項2】 前記第2の認識文字は、マーク読み取
りにより認識され、変換された文字であることを特徴と
する請求項1記載の文字認識装置。 - 【請求項3】 前記第1の認識文字として、複数の候
補文字が桁単位で提示されている場合、各候補文字と第
2の認識文字とを桁対応で比較し、すべての桁でそれぞ
れ第2の認識文字と一致する候補文字が存在すれば、第
1の認識文字より該候補文字を含めた所定文字を削除す
るように構成したことを特徴とする請求項1または請求
項2記載の文字認識装置。 - 【請求項4】 認識文字を登録済み文字と比較して補
正する知識処理部を有し、前記連結した認識文字列の知
識処理を行う場合は、前記削除処理し連結した認識文字
列を使用して知識処理を行うように構成したことを特徴
とする請求項1または請求項2または請求項3記載の文
字認識装置。 - 【請求項5】 表示装置を備え、該表示装置に連結し
た該認識文字列を表示することを特徴とする請求項1ま
たは請求項2または請求項3または請求項4記載の文字
認識装置。 - 【請求項6】 イメージデータの文字認識を行い、候
補文字を出力する文字認識部を備えることを特徴とする
請求項1または請求項2または請求項3または請求項4
または請求項5記載の文字認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP18421395A JPH0934984A (ja) | 1995-07-20 | 1995-07-20 | 文字認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP18421395A JPH0934984A (ja) | 1995-07-20 | 1995-07-20 | 文字認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0934984A true JPH0934984A (ja) | 1997-02-07 |
Family
ID=16149351
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP18421395A Pending JPH0934984A (ja) | 1995-07-20 | 1995-07-20 | 文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0934984A (ja) |
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002304397A (ja) * | 2001-04-06 | 2002-10-18 | Toppan Forms Co Ltd | コード検索処理システム |
| JP2005327006A (ja) * | 2004-05-13 | 2005-11-24 | Nippon Telegr & Teleph Corp <Ntt> | 情報フィルタリング装置及び方法 |
| JP2008192024A (ja) * | 2007-02-07 | 2008-08-21 | Promise Co Ltd | 入金管理システム |
| JP2008192022A (ja) * | 2007-02-07 | 2008-08-21 | Promise Co Ltd | 入金管理システム |
| JP2008192023A (ja) * | 2007-02-07 | 2008-08-21 | Promise Co Ltd | 入金管理システム |
| JP2014063539A (ja) * | 2014-01-15 | 2014-04-10 | Oki Electric Ind Co Ltd | 帳票処理システム、エントリ端末、帳票データ処理方法およびプログラム |
| JP2015049873A (ja) * | 2013-09-04 | 2015-03-16 | 富士通株式会社 | 認識文字提示方法、認識文字提示プログラム及び認識文字提示装置 |
-
1995
- 1995-07-20 JP JP18421395A patent/JPH0934984A/ja active Pending
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002304397A (ja) * | 2001-04-06 | 2002-10-18 | Toppan Forms Co Ltd | コード検索処理システム |
| JP2005327006A (ja) * | 2004-05-13 | 2005-11-24 | Nippon Telegr & Teleph Corp <Ntt> | 情報フィルタリング装置及び方法 |
| JP2008192024A (ja) * | 2007-02-07 | 2008-08-21 | Promise Co Ltd | 入金管理システム |
| JP2008192022A (ja) * | 2007-02-07 | 2008-08-21 | Promise Co Ltd | 入金管理システム |
| JP2008192023A (ja) * | 2007-02-07 | 2008-08-21 | Promise Co Ltd | 入金管理システム |
| JP2015049873A (ja) * | 2013-09-04 | 2015-03-16 | 富士通株式会社 | 認識文字提示方法、認識文字提示プログラム及び認識文字提示装置 |
| JP2014063539A (ja) * | 2014-01-15 | 2014-04-10 | Oki Electric Ind Co Ltd | 帳票処理システム、エントリ端末、帳票データ処理方法およびプログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5305396A (en) | Data processing system and method for selecting customized character recognition processes and coded data repair processes for scanned images of document forms | |
| JP2968145B2 (ja) | 高度なデータ収集方法及びデータ処理システム | |
| US8520889B2 (en) | Automated generation of form definitions from hard-copy forms | |
| US5251273A (en) | Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms | |
| JPH04343190A (ja) | 文字データ入力方式 | |
| JP2001291060A (ja) | 単語列照合装置および単語列照合方法 | |
| JPH0934984A (ja) | 文字認識装置 | |
| JP2004013813A (ja) | 情報管理システムおよび情報管理方法 | |
| JP3435375B2 (ja) | 文字認識方法および装置 | |
| JP3915443B2 (ja) | レセプト処理システム | |
| JP3448895B2 (ja) | 取引処理装置 | |
| JPH05108689A (ja) | 為替振込処理装置 | |
| JPH10105654A (ja) | 帳票用文字認識装置 | |
| JP2894305B2 (ja) | 認識装置の候補修正方式 | |
| JP3455643B2 (ja) | 文字認識装置における学習辞書の更新方法及び文字認識装置 | |
| JP3548372B2 (ja) | 文字認識装置 | |
| JPH0749924A (ja) | 手書き文字認識装置 | |
| JPH0619884A (ja) | 名称入力システム | |
| JP2984287B2 (ja) | 光学式文字読取装置 | |
| JP3419425B2 (ja) | 認識文字補正装置 | |
| JP3058706B2 (ja) | 住所カナの漢字変換方法 | |
| JP3335494B2 (ja) | 文字認識処理装置 | |
| JP3929560B2 (ja) | 誤記自動修正方法、読取装置、および誤記自動修正プログラムを記録したコンピュータ読み取り可能な記憶媒体 | |
| JP2001155094A (ja) | 為替集中処理システム | |
| JPH0765109A (ja) | 運転免許証認識装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20020611 |