JPH0573710A - 光学的文字読取装置 - Google Patents
光学的文字読取装置Info
- Publication number
- JPH0573710A JPH0573710A JP3231729A JP23172991A JPH0573710A JP H0573710 A JPH0573710 A JP H0573710A JP 3231729 A JP3231729 A JP 3231729A JP 23172991 A JP23172991 A JP 23172991A JP H0573710 A JPH0573710 A JP H0573710A
- Authority
- JP
- Japan
- Prior art keywords
- character
- line width
- characters
- average line
- recognition result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【目的】つぶれて記入された文字の誤読を減少させるこ
とを可能とする。 【構成】線幅抽出回路16は、ラインバッファ10に格
納された1フィールド中の各文字について平均線幅を抽
出し、さらに各文字の平均線幅から全文字についての平
均線幅を求める。後処理部18の文字判別部18aは、
線幅抽出回路16において得られた平均線幅から極端に
太い文字を判別する。後処理部18の認識結果設定部1
8bは、極端に太いと判別された文字についての文字認
識結果をリジェクト扱いにする。これにより、少なくと
もつぶれて記入された文字の誤読を減少させることが可
能となる。
とを可能とする。 【構成】線幅抽出回路16は、ラインバッファ10に格
納された1フィールド中の各文字について平均線幅を抽
出し、さらに各文字の平均線幅から全文字についての平
均線幅を求める。後処理部18の文字判別部18aは、
線幅抽出回路16において得られた平均線幅から極端に
太い文字を判別する。後処理部18の認識結果設定部1
8bは、極端に太いと判別された文字についての文字認
識結果をリジェクト扱いにする。これにより、少なくと
もつぶれて記入された文字の誤読を減少させることが可
能となる。
Description
【0001】
【産業上の利用分野】本発明は、帳票等に記録された文
字の読取りを行なう光学的文字読取装置に関する。
字の読取りを行なう光学的文字読取装置に関する。
【0002】
【従来の技術】一般に、光学的文字読取装置において
は、帳票等に記録された文字列に意味がある場合には、
認識処理の結果について前後の文字の認識結果との規則
性に基づいて認識結果を確定する知識処理が行なわれて
いる。
は、帳票等に記録された文字列に意味がある場合には、
認識処理の結果について前後の文字の認識結果との規則
性に基づいて認識結果を確定する知識処理が行なわれて
いる。
【0003】このため、手書き等によって文字が記録さ
れている帳票を処理する場合に、例えば文字がつぶれて
いる場合であっても、前後の文字が正しく認識されてい
れば誤読を救うことができる。
れている帳票を処理する場合に、例えば文字がつぶれて
いる場合であっても、前後の文字が正しく認識されてい
れば誤読を救うことができる。
【0004】ところが、金額等の数字列の場合には、一
般的に重要なデータとなるにも関わらず、文字列に規則
性がないために個別の認識結果のみを読取り結果として
出力している。例えば、図5(a)に示す例では、C3
カラムの数字「0」がつぶれて記入されたために「1」
に誤読された例を示している。また、図5(b)に示す
例では、C4カラムの数字「8」がつぶれて記入された
ために「2」に誤読された例を示している。
般的に重要なデータとなるにも関わらず、文字列に規則
性がないために個別の認識結果のみを読取り結果として
出力している。例えば、図5(a)に示す例では、C3
カラムの数字「0」がつぶれて記入されたために「1」
に誤読された例を示している。また、図5(b)に示す
例では、C4カラムの数字「8」がつぶれて記入された
ために「2」に誤読された例を示している。
【0005】
【発明が解決しようとする課題】このように従来の光学
的文字読取装置においては、数字列についての認識では
知識的な処理ができなかった。このため、つぶれた文字
が誤読されて誤った結果が出力されてしまうことがあっ
た。
的文字読取装置においては、数字列についての認識では
知識的な処理ができなかった。このため、つぶれた文字
が誤読されて誤った結果が出力されてしまうことがあっ
た。
【0006】本発明は前記のような点に鑑みてなされた
もので、つぶれて記入された文字の誤読を減少させるこ
とが可能な光学的文字読取装置を提供することを目的と
する。
もので、つぶれて記入された文字の誤読を減少させるこ
とが可能な光学的文字読取装置を提供することを目的と
する。
【0007】
【課題を解決するための手段】本発明は、帳票に設けら
れた所定の領域毎に記録された文字について文字認識を
行なう光学的文字読取装置において、前記領域に記入さ
れた各文字の平均線幅、及び前記領域内の全文字につい
ての平均線幅を求める線幅抽出手段と、前記線幅抽出手
段によって抽出された平均線幅に基づいて、つぶれた状
態で記録された文字を判別する文字判別手段と、前記文
字判別手段によって判別された文字に対応する文字認識
結果を、認識不能扱いにする認識結果設定手段とを具備
して構成するものである。
れた所定の領域毎に記録された文字について文字認識を
行なう光学的文字読取装置において、前記領域に記入さ
れた各文字の平均線幅、及び前記領域内の全文字につい
ての平均線幅を求める線幅抽出手段と、前記線幅抽出手
段によって抽出された平均線幅に基づいて、つぶれた状
態で記録された文字を判別する文字判別手段と、前記文
字判別手段によって判別された文字に対応する文字認識
結果を、認識不能扱いにする認識結果設定手段とを具備
して構成するものである。
【0008】
【作用】このような構成によれば、つぶれた状態で文字
が記入されたために、他の文字と認識された場合でも、
この認識結果がそのまま出力されることなくリジェクト
扱いにされる。従って、少なくとも誤読による悪影響を
防止することができる。
が記入されたために、他の文字と認識された場合でも、
この認識結果がそのまま出力されることなくリジェクト
扱いにされる。従って、少なくとも誤読による悪影響を
防止することができる。
【0009】
【実施例】以下、図面を参照して本発明の一実施例を説
明する。図1は同実施例に係わる光学的文字読取装置の
主要部分の構成を示すブロック図である。図1におい
て、ラインバッファ10は、処理対象とする帳票を光学
的に走査することにより検出された1枚分の帳票イメー
ジから取り出された1フィールド分(認識の対象とする
領域)の文字パターンを格納するためのものである。文
字切出し部12は、ラインバッファ10を走査して、文
字パターンを1文字毎に切出すものである。
明する。図1は同実施例に係わる光学的文字読取装置の
主要部分の構成を示すブロック図である。図1におい
て、ラインバッファ10は、処理対象とする帳票を光学
的に走査することにより検出された1枚分の帳票イメー
ジから取り出された1フィールド分(認識の対象とする
領域)の文字パターンを格納するためのものである。文
字切出し部12は、ラインバッファ10を走査して、文
字パターンを1文字毎に切出すものである。
【0010】文字認識部14は、文字切出し部12によ
って切出された文字パターンをラインバッファ10から
読出し、図示せぬ認識辞書を参照して1文字毎に認識を
行なうものである。
って切出された文字パターンをラインバッファ10から
読出し、図示せぬ認識辞書を参照して1文字毎に認識を
行なうものである。
【0011】線幅抽出部16は、文字切出し部12によ
って切出された文字パターンをラインバッファ10から
読出し、各文字パターンについて輪郭追跡を行なうこと
により、各文字ブロック(文字パターン)の平均線幅を
求めるものである。また、線幅抽出部16は、各文字の
平均線幅から1フィールド中の全文字についての平均線
幅(全体の平均線幅)を求めるものである。
って切出された文字パターンをラインバッファ10から
読出し、各文字パターンについて輪郭追跡を行なうこと
により、各文字ブロック(文字パターン)の平均線幅を
求めるものである。また、線幅抽出部16は、各文字の
平均線幅から1フィールド中の全文字についての平均線
幅(全体の平均線幅)を求めるものである。
【0012】後処理部18には、文字判別部18a、及
び認識結果設定部18bが設けられている。文字判別部
18aは、各文字の平均線幅と全体の平均線幅に基づい
て極端に太い文字を判別するものである。認識結果設定
部18bは、文字判別部18aにおいて極端に太いと判
別された文字の文字認識部14における認識結果をリジ
ェクト(認識不能)の扱いにするものである。次に、同
実施例の動作について説明する。
び認識結果設定部18bが設けられている。文字判別部
18aは、各文字の平均線幅と全体の平均線幅に基づい
て極端に太い文字を判別するものである。認識結果設定
部18bは、文字判別部18aにおいて極端に太いと判
別された文字の文字認識部14における認識結果をリジ
ェクト(認識不能)の扱いにするものである。次に、同
実施例の動作について説明する。
【0013】まず、処理対象とする帳票について光学的
走査を行なうことにより、帳票イメージを検出する。帳
票には、複数のフィールド(認識対象とする文字が記入
される領域)が設けられている。その中には、金額等の
数字列が記入されるフィールドが含まれているものとす
る。
走査を行なうことにより、帳票イメージを検出する。帳
票には、複数のフィールド(認識対象とする文字が記入
される領域)が設けられている。その中には、金額等の
数字列が記入されるフィールドが含まれているものとす
る。
【0014】ここでは、ラインバッファ10に数字列が
記入される1つのフィールド分のパターンが格納されて
いるものとする。文字切出し回路12は、ラインバッフ
ァ10に格納されたパターンから1文字毎に文字パター
ンの切出しを行なう。
記入される1つのフィールド分のパターンが格納されて
いるものとする。文字切出し回路12は、ラインバッフ
ァ10に格納されたパターンから1文字毎に文字パター
ンの切出しを行なう。
【0015】文字認識部14は、切出される文字パター
ンについて順次認識処理を実行して、認識結果を後処理
部18に出力する。これと同時に、線幅抽出部16は、
文字切出し回路12によって切出された文字パターン
(文字ブロック)から線幅の検出を行なう。
ンについて順次認識処理を実行して、認識結果を後処理
部18に出力する。これと同時に、線幅抽出部16は、
文字切出し回路12によって切出された文字パターン
(文字ブロック)から線幅の検出を行なう。
【0016】次に、線幅抽出部16における処理につい
て説明する。図2には文字ブロックの一例を示してい
る。まず、幅線抽出部16は、文字ブロックの輪郭を追
跡し、その輪郭の方向コードから図3に示す面積を求め
るための計算テーブルに基づいて面積を求める。なお、
方向コードは、図4に示すように設定されているものと
する。
て説明する。図2には文字ブロックの一例を示してい
る。まず、幅線抽出部16は、文字ブロックの輪郭を追
跡し、その輪郭の方向コードから図3に示す面積を求め
るための計算テーブルに基づいて面積を求める。なお、
方向コードは、図4に示すように設定されているものと
する。
【0017】例えば、図2に示すように、輪郭点のポイ
ントP0とポイントP1は、水平方向で連続しているた
め方向コードが「3」となる。以下、ポイントP1,P
2,…,P22,P0について方向コードを求める。
ントP0とポイントP1は、水平方向で連続しているた
め方向コードが「3」となる。以下、ポイントP1,P
2,…,P22,P0について方向コードを求める。
【0018】そして、図3に示すように、隣合う輪郭点
(現在点をt、現在点の直前の点をt−1とする)の方
向コードの対応関係から、面積(Sn)を求めるための
Y´の値を求める。面積Snは、以下に示す数1のY´
に、各輪郭点におけるYアドレスを、加算値,減算値,
0,または1としてとして代入することによって求めら
れる。
(現在点をt、現在点の直前の点をt−1とする)の方
向コードの対応関係から、面積(Sn)を求めるための
Y´の値を求める。面積Snは、以下に示す数1のY´
に、各輪郭点におけるYアドレスを、加算値,減算値,
0,または1としてとして代入することによって求めら
れる。
【0019】
【数1】 なお、輪郭長(Ln)は、輪郭のビット数とする。従っ
て、図2に示す文字ブロックの輪郭長Ln=23とな
る。
て、図2に示す文字ブロックの輪郭長Ln=23とな
る。
【0020】次に、面積(Sn)と輪郭長(Ln)から
平均線幅を求める処理について説明する。線幅抽出部1
6は、以下のようにして1フィールド中の各文字の平均
線幅、及び全文字についての平均線幅を求める。
平均線幅を求める処理について説明する。線幅抽出部1
6は、以下のようにして1フィールド中の各文字の平均
線幅、及び全文字についての平均線幅を求める。
【0021】面積Sn=hn×ln …(2) 輪郭長Ln=2(hn+ln) …(3) ただし、hn=線幅,ln=線長とする。
【0022】ここで線幅(hn)は、線長(ln)に比
べて無視できるくらいに小さい(hn〜0、ただし
“〜”は、ほぼ等しいことを表す)とすると、前記
(3)式から 、 ln〜Ln/2 …(4) と求められる。
べて無視できるくらいに小さい(hn〜0、ただし
“〜”は、ほぼ等しいことを表す)とすると、前記
(3)式から 、 ln〜Ln/2 …(4) と求められる。
【0023】また、前記(2)式から hn〜2Sn/Ln …(5)
とと求められる。さらに、1フィ
ード中の平均線幅(have )は、以下に示す数2によっ
て求められる。
とと求められる。さらに、1フィ
ード中の平均線幅(have )は、以下に示す数2によっ
て求められる。
【0024】
【数2】
【0025】こうして1フィールド中の各文字の平均線
幅、及び全文字についての平均線幅が求まると、後処理
部18の文字判別部18aは、全文字についての平均線
幅に対して、極端に平均線幅が太い文字があるか否かを
判別する。
幅、及び全文字についての平均線幅が求まると、後処理
部18の文字判別部18aは、全文字についての平均線
幅に対して、極端に平均線幅が太い文字があるか否かを
判別する。
【0026】この判別の方式は、単純に両者の差と予め
設定された所定値と比較しても良いし、両者の差と全文
字の平均線幅との関係に基づいて行なっても良く、特に
限定されるものではない。
設定された所定値と比較しても良いし、両者の差と全文
字の平均線幅との関係に基づいて行なっても良く、特に
限定されるものではない。
【0027】後処理部18の認識結果設定部18bは、
極端に太いと判別された文字がある場合、この文字を文
字認識部14における認識結果と関係なくリジェクトと
して処理する。従って、図5に示すように、つぶれた文
字がある他の文字として認識された場合であっても強制
的にリジェクトされる。
極端に太いと判別された文字がある場合、この文字を文
字認識部14における認識結果と関係なくリジェクトと
して処理する。従って、図5に示すように、つぶれた文
字がある他の文字として認識された場合であっても強制
的にリジェクトされる。
【0028】このようにして、帳票に手書きによってつ
ぶれた状態で文字が記入され、その文字について誤った
認識結果が得られた場合であっても、極端に太い文字は
本来の文字がつぶれて記入されたものと判別され、その
認識結果がリジェクトされる。従って、少なくとも文字
のつぶれによる誤読を減少させることができる。
ぶれた状態で文字が記入され、その文字について誤った
認識結果が得られた場合であっても、極端に太い文字は
本来の文字がつぶれて記入されたものと判別され、その
認識結果がリジェクトされる。従って、少なくとも文字
のつぶれによる誤読を減少させることができる。
【0029】これは、1フィールド中に発生する文字
は、同一人間によって同一筆記用具を用いて記入される
場合が多いことから、有効に機能させることが可能とな
っている。
は、同一人間によって同一筆記用具を用いて記入される
場合が多いことから、有効に機能させることが可能とな
っている。
【0030】
【発明の効果】以上のように本発明によれば、各文字の
平均線幅と1フィールド内の全文字についての平均線幅
に基づいて極端に太い文字を判別し、この文字について
の認識結果についてはリジェクト扱いとすることによ
り、つぶれて記入された文字の誤読を減少させることが
可能となるものである。
平均線幅と1フィールド内の全文字についての平均線幅
に基づいて極端に太い文字を判別し、この文字について
の認識結果についてはリジェクト扱いとすることによ
り、つぶれて記入された文字の誤読を減少させることが
可能となるものである。
【図1】本発明の一実施例に関わる光学的文字読取装置
の主要部の構成を示すブロック図。
の主要部の構成を示すブロック図。
【図2】文字ブロックの一例を示す図。
【図3】面積を求めるための計算テーブルを示す図。
【図4】方向コードを説明するための図。
【図5】つぶれ文字の例を示す図。
10…ラインバッファ、12…文字切出し部、14…文
字認識部、16…線幅抽出部、18…後処理部、18a
…文字判別部、18b…認識結果設定部。
字認識部、16…線幅抽出部、18…後処理部、18a
…文字判別部、18b…認識結果設定部。
Claims (1)
- 【請求項1】 帳票に設けられた所定の領域に記録され
た文字について文字認識を行なう光学的文字読取装置に
おいて、 前記領域に記入された各文字の平均線幅、及び前記領域
内の全文字についての平均線幅を求める線幅抽出手段
と、 前記線幅抽出手段によって抽出された平均線幅に基づい
て、つぶれた状態で記録された文字を判別する文字判別
手段と、 前記文字判別手段によって判別された文字に対応する文
字認識結果を、認識不能扱いにする認識結果設定手段
と、 を具備したことを特徴とする光学的文字読取装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3231729A JPH0573710A (ja) | 1991-09-11 | 1991-09-11 | 光学的文字読取装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3231729A JPH0573710A (ja) | 1991-09-11 | 1991-09-11 | 光学的文字読取装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0573710A true JPH0573710A (ja) | 1993-03-26 |
Family
ID=16928119
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3231729A Pending JPH0573710A (ja) | 1991-09-11 | 1991-09-11 | 光学的文字読取装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0573710A (ja) |
-
1991
- 1991-09-11 JP JP3231729A patent/JPH0573710A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4481665A (en) | Character segmentation method | |
| JP3343864B2 (ja) | 語体の分離方法 | |
| JPH0420226B2 (ja) | ||
| US5621818A (en) | Document recognition apparatus | |
| US5956433A (en) | Method and device for removing spots from a character image in an optical character reader | |
| EP0432937B1 (en) | Hand-written character recognition apparatus | |
| JPS6115284A (ja) | 光学的文字読取装置 | |
| JPH0573710A (ja) | 光学的文字読取装置 | |
| KR102742277B1 (ko) | 만주어의 글자 추출 방법 및 이를 수행하는 시스템 | |
| JP3345246B2 (ja) | 文字認識装置及び文字認識方法 | |
| JP2868392B2 (ja) | 手書き記号認識装置 | |
| JPS62281082A (ja) | 文字認識装置 | |
| JP2877380B2 (ja) | 光学的文字読取装置 | |
| JP3157530B2 (ja) | 文字切り出し方法 | |
| JPH09114926A (ja) | オンライン文字認識における入力文字大分類方法および装置 | |
| JP4215385B2 (ja) | パターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
| JP2671533B2 (ja) | 文字列認識方法及びその装置 | |
| JP2851865B2 (ja) | 文字認識装置 | |
| JP2972443B2 (ja) | 文字認識装置 | |
| JPS60138689A (ja) | 文字認識方法 | |
| JP3100786B2 (ja) | 文字認識後処理方式 | |
| JPH01191992A (ja) | 文字認識装置 | |
| JPH0436885A (ja) | 光学式文字読取装置 | |
| JPH03219384A (ja) | 文字認識装置 | |
| JP2832035B2 (ja) | 文字認識装置 |