JPS6048582A - 文字認識装置の文字切出し方法 - Google Patents
文字認識装置の文字切出し方法Info
- Publication number
- JPS6048582A JPS6048582A JP58155415A JP15541583A JPS6048582A JP S6048582 A JPS6048582 A JP S6048582A JP 58155415 A JP58155415 A JP 58155415A JP 15541583 A JP15541583 A JP 15541583A JP S6048582 A JPS6048582 A JP S6048582A
- Authority
- JP
- Japan
- Prior art keywords
- character
- cutting
- pattern
- circuit
- observation pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(a)発明の技術分野
本発明は文字認識方法に係り、とくにフリーフォーマン
ト帳票を用いる場合の文字認識装置の文字切出し方法に
関する。
ト帳票を用いる場合の文字認識装置の文字切出し方法に
関する。
(b)技術の背景
文字認識装置は2通常、観測01;として光電変換走査
装置などを備え、帳票(文字記入シート)上に記入され
た文字行の中から一文字分ずつの文字パターンを観測し
て量子化データによって表される観測パターンに変換し
、あるいは帳票上に記入された一行分の文字パターンを
観測し量子化信号によって表される観測パターンに変換
したのちその中から一文字分すフの観測パターンを取り
出し。
装置などを備え、帳票(文字記入シート)上に記入され
た文字行の中から一文字分ずつの文字パターンを観測し
て量子化データによって表される観測パターンに変換し
、あるいは帳票上に記入された一行分の文字パターンを
観測し量子化信号によって表される観測パターンに変換
したのちその中から一文字分すフの観測パターンを取り
出し。
−文字分ずつ観測パターンの認識を行う。この−文字分
ずつの文字パターンを観測あるいは一文字分ずつの観測
パターンを取り出すことを切出しまたはセグメンテーシ
ョンと称し、この切出しを容易にするため、これまで、
帳票」二に一文字毎に文字記入枠を設けていた。
ずつの文字パターンを観測あるいは一文字分ずつの観測
パターンを取り出すことを切出しまたはセグメンテーシ
ョンと称し、この切出しを容易にするため、これまで、
帳票」二に一文字毎に文字記入枠を設けていた。
しかし最近では、一般にフリーフメーマ・ノド帳票と称
される帳票、ずなわら文字記入間隔を指定する文字枠を
設けず文字記人行のみを設けた帳票が用いられるように
なった。
される帳票、ずなわら文字記入間隔を指定する文字枠を
設けず文字記人行のみを設けた帳票が用いられるように
なった。
(C)従来技術と問題点
フリ−フォーマノ1〜帳票を使用する方式の文字認識装
置においては、帳票−ヒに記入された一行分の文字パタ
ーンを観測したのらに、その中から一文字分に相当する
観測パターンを切り出して認識を行うのであるが、観測
パターンの切り出しは。
置においては、帳票−ヒに記入された一行分の文字パタ
ーンを観測したのらに、その中から一文字分に相当する
観測パターンを切り出して認識を行うのであるが、観測
パターンの切り出しは。
従来2次のようにして行われていた。
ずなわら、第1図に例示するように2文字行に平行な軸
(Y輔)に関する文字パターン形成画素(通常は黒画素
)の投影分布、すなわちY軸に関する黒画素のヒストグ
ラムをめ、まず最初に8黒画素の投影分布の値の小さい
個所に↓印kO・kl・k2・k3・・・・・klにて
示すような仮の文字切り出し線を付し、これらの仮の文
字切り出し線の間隔の平均値をめる。
(Y輔)に関する文字パターン形成画素(通常は黒画素
)の投影分布、すなわちY軸に関する黒画素のヒストグ
ラムをめ、まず最初に8黒画素の投影分布の値の小さい
個所に↓印kO・kl・k2・k3・・・・・klにて
示すような仮の文字切り出し線を付し、これらの仮の文
字切り出し線の間隔の平均値をめる。
次に、前記仮の文字切り出し線の各間隔と前記平均値と
を比狡し、前記仮の文字すJり出し線の一部の削1徐(
k4)あるいは補充(口1およびn2)を施すことによ
って文字切り出し位置を決定し2−ζいた。
を比狡し、前記仮の文字すJり出し線の一部の削1徐(
k4)あるいは補充(口1およびn2)を施すことによ
って文字切り出し位置を決定し2−ζいた。
ところが、隣接する文字が相J1に入り組んでいる場所
が文字行中に多数ある場合6.−c;I止MYな文字切
り出し位16を得ることか非當に困ゲ1fであった。
が文字行中に多数ある場合6.−c;I止MYな文字切
り出し位16を得ることか非當に困ゲ1fであった。
(d)発明の目的
本発明の目的は、フリーフォーマノ1−帳票を使用する
方式の文字認識装置におりる文字りJり出し2精度を高
めるごとにある。
方式の文字認識装置におりる文字りJり出し2精度を高
めるごとにある。
(e)発明の構成
本発明になる文字認識装置の文字切出し方法は。
文字記入間隔を指定−1,4′J’文字記人行のめを指
定ずろ帳票に記入された文字を認識する文字認識装置に
おい′乙前記帳票の文字証人?−iに記入された文字行
を観測して得られる観測パターンの前記文字記人行に関
する投影分布によゲこ前記観測パターンを前記文字記入
行方向に分割し、前記分割によって御られる分割観/J
lllパターン旬の前記投影分布によって該分割観測パ
ターンを前記文字記入行方向に再分割し、前記分割と前
記再分割とによってniI記観ll1tl+パターンの
切り出しを行うものである。
定ずろ帳票に記入された文字を認識する文字認識装置に
おい′乙前記帳票の文字証人?−iに記入された文字行
を観測して得られる観測パターンの前記文字記人行に関
する投影分布によゲこ前記観測パターンを前記文字記入
行方向に分割し、前記分割によって御られる分割観/J
lllパターン旬の前記投影分布によって該分割観測パ
ターンを前記文字記入行方向に再分割し、前記分割と前
記再分割とによってniI記観ll1tl+パターンの
切り出しを行うものである。
(f)発明の実施例
以1・2本発明の要旨を実施例によって具体的に説明す
る。
る。
第2図は本発明一実施例の構成をボずブI’、+ 7り
図であり1図においζ1はフリーフオーーンノト帳票−
」−の火字記入行に記入された文字行を観測し前記文字
Lr毎の観測パターンを得る観/1i11部、2は観測
部1によって得られる観測パターンの11ii記文字記
人1]に関する投影分布を得る投影分布d1′#−回路
。
図であり1図においζ1はフリーフオーーンノト帳票−
」−の火字記入行に記入された文字行を観測し前記文字
Lr毎の観測パターンを得る観/1i11部、2は観測
部1によって得られる観測パターンの11ii記文字記
人1]に関する投影分布を得る投影分布d1′#−回路
。
3は後記第一の切出し7線検出回路4において用いるし
きい値を記憶するレジスタ、4は投影夕″14J01算
回路2によゲで得られる投影分布からレジスタ3に記憶
するしきい値より小ざい個Jす「を検出することによっ
て、前記観測パターンを前記文字記入方向に分^りする
ために伺ず第一の文字切出し綿を得る第一のリノ出し線
検出回路、54;l第一の切出し7線検出回路4によっ
て得られる第一の文字切出し線によって前記観測パター
ンを前記文字記入41方向に分割して得られる分;’;
+J観測バ観測バク−曲毎投影分布の平均値を得る平均
値計算回路、6は前記分割観測パターンの投影分布から
、前記分割観測パターン毎の投影分4jの平均値に1よ
り小さい所定数を乗することによって得られるしきい値
より小さいf1^(所を検出することによって、該分割
観測パターンを前記文字記入行方向に再分割するために
(jず第二の切出し線を得る第二の切出し線検出回路、
7は前記第一の切出し線および前記第二の切出し線によ
っ゛ζ切出される各分割観測パターンの間隔の平均イ1
αを得る平均値61洲回路、8は前記第一の切出し線お
よび前記第二の切出し線によって切出される各分割観測
パターンの間隔と平均値計算回路7によっζ得られる1
11均値とを比鮫し。
きい値を記憶するレジスタ、4は投影夕″14J01算
回路2によゲで得られる投影分布からレジスタ3に記憶
するしきい値より小ざい個Jす「を検出することによっ
て、前記観測パターンを前記文字記入方向に分^りする
ために伺ず第一の文字切出し綿を得る第一のリノ出し線
検出回路、54;l第一の切出し7線検出回路4によっ
て得られる第一の文字切出し線によって前記観測パター
ンを前記文字記入41方向に分割して得られる分;’;
+J観測バ観測バク−曲毎投影分布の平均値を得る平均
値計算回路、6は前記分割観測パターンの投影分布から
、前記分割観測パターン毎の投影分4jの平均値に1よ
り小さい所定数を乗することによって得られるしきい値
より小さいf1^(所を検出することによって、該分割
観測パターンを前記文字記入行方向に再分割するために
(jず第二の切出し線を得る第二の切出し線検出回路、
7は前記第一の切出し線および前記第二の切出し線によ
っ゛ζ切出される各分割観測パターンの間隔の平均イ1
αを得る平均値61洲回路、8は前記第一の切出し線お
よび前記第二の切出し線によって切出される各分割観測
パターンの間隔と平均値計算回路7によっζ得られる1
11均値とを比鮫し。
前記第一の切出し線および前記第二の切出し線の中から
削除すべき切出し線を決定する第三の切出し線検出回路
、9はiiJ記第−・の切出し線および前記第二の切出
し線によって切出される各分IGII観測パターンの間
隔と平均値計算回路7によって1牙られる平均値とを比
軸し、前記第=−の切出し線および前記第二、の切出し
線に追加すべき切出し線を決定する第四の切出し線検出
回路210は第一の切出し線検出回路4・第二の切出し
線検出回路ら 第三の切出し線検出回路8および第四の
切出し線検出回路9によって検出または決定される切出
し線によって前記観測パターンを前記文字記入行方向に
分割する切出し回路、11は切出し回路10によって切
出された分割観測パターン毎の特徴を抽出する特徴抽出
回路、12は文字種毎の杼〆(1′−特徴を記1aする
辞書メモリ、13は特徴抽出回路11によって得られる
分割観測パターンの特徴を辞書メモ1月2と照合するご
とによって前記分割観測バクーンの認識を行う認識回路
である。
削除すべき切出し線を決定する第三の切出し線検出回路
、9はiiJ記第−・の切出し線および前記第二の切出
し線によって切出される各分IGII観測パターンの間
隔と平均値計算回路7によって1牙られる平均値とを比
軸し、前記第=−の切出し線および前記第二、の切出し
線に追加すべき切出し線を決定する第四の切出し線検出
回路210は第一の切出し線検出回路4・第二の切出し
線検出回路ら 第三の切出し線検出回路8および第四の
切出し線検出回路9によって検出または決定される切出
し線によって前記観測パターンを前記文字記入行方向に
分割する切出し回路、11は切出し回路10によって切
出された分割観測パターン毎の特徴を抽出する特徴抽出
回路、12は文字種毎の杼〆(1′−特徴を記1aする
辞書メモリ、13は特徴抽出回路11によって得られる
分割観測パターンの特徴を辞書メモ1月2と照合するご
とによって前記分割観測バクーンの認識を行う認識回路
である。
ずなわら1 まず第一の切出し線検出回路4ては。
第3図ta+に↓印によって示すように黒画素の投影分
布の値が所定のしきい値より小さい個所に幻する第一の
切出し線として1(0・kl・k2・・・・klが得ら
れる。
布の値が所定のしきい値より小さい個所に幻する第一の
切出し線として1(0・kl・k2・・・・klが得ら
れる。
続いて第二の切出し線検出回路6では、第3図(blの
ように、 kOとに1との間、 k2とに3との間およ
びに6とに7との間に、それぞれ、第二の切出し線とし
てml・m2およびm3が得られる。なを、このとき。
ように、 kOとに1との間、 k2とに3との間およ
びに6とに7との間に、それぞれ、第二の切出し線とし
てml・m2およびm3が得られる。なを、このとき。
klとに2との間およびに5と1(6との間には第二の
切出し線が得られない。
切出し線が得られない。
k]とに2との間およびに5とに6との間に第二の切出
し線が得られない理由は、第一の切出し線によつ得られ
る分割観測パターン毎の投影分布の平均値に1より小さ
い所定数を乗することによって得られるしきい値を用い
ることによるものである。
し線が得られない理由は、第一の切出し線によつ得られ
る分割観測パターン毎の投影分布の平均値に1より小さ
い所定数を乗することによって得られるしきい値を用い
ることによるものである。
ごのあと第三の切出し線検出回路8では、第3図(C1
のように、 k4が削除すべき切出し線として決定され
、また第四の切出し線検出回路9ではに1とに2との間
およびに5とに6との間に、それぞれ、追加すべき切出
し線n1およびn2が決定される。
のように、 k4が削除すべき切出し線として決定され
、また第四の切出し線検出回路9ではに1とに2との間
およびに5とに6との間に、それぞれ、追加すべき切出
し線n1およびn2が決定される。
上記実施例によれば、−律なしきい(i#jを用いて切
出し線をめるのみならず、第二の切出し線検出回路6に
よって1分割観測パターンfυの投影分布の平均値から
得られるしきい値を用いて切出し線をめたのちに、各分
割観測パターンの間隔の平均値を用いて切出し線の削除
あるいは追加を行っており、したがって止面な文字切り
出し位置を得ることができる。
出し線をめるのみならず、第二の切出し線検出回路6に
よって1分割観測パターンfυの投影分布の平均値から
得られるしきい値を用いて切出し線をめたのちに、各分
割観測パターンの間隔の平均値を用いて切出し線の削除
あるいは追加を行っており、したがって止面な文字切り
出し位置を得ることができる。
(g)発明の詳細
な説明したように9本発明によれはフリーフメーマノト
帳票を使用する方式の文字認識精度°におりる文字りJ
り出し精度を向上し文字認識精度をit’liめること
かできる。
帳票を使用する方式の文字認識精度°におりる文字りJ
り出し精度を向上し文字認識精度をit’liめること
かできる。
第1図は従来例の説明図、第2図は本発明一実施例の構
成を示すブロック図、第3図は前記実施例の説明図であ
る。 図中、1は観測部、2は投影分布計算回路、4ば第一の
りJ出し線検出回路、5は平均値計算回路。 6は第二の切出し線検出回I烙、10は切出し回路であ
る。 芥 2 町 ! 授チ妙 2 蟹、J!、l #P f県訂路 切本り嶽 t 1″″′7y 験、1:、回路 −1;ヨ)ロワイm 、。 gTch巨:[路 エフ7本しぎK ど 二r@ ≦C5櫂111j路 平均イ1 に1発 2 ? 、q M’3:* 、*JL H粘j4 恥萌 昼 蕎、1.j // /θ 将軟 炉職回路 ri’lct’Bk 、、上、、。 水了唄 (α) ト′ 2/ ト−
成を示すブロック図、第3図は前記実施例の説明図であ
る。 図中、1は観測部、2は投影分布計算回路、4ば第一の
りJ出し線検出回路、5は平均値計算回路。 6は第二の切出し線検出回I烙、10は切出し回路であ
る。 芥 2 町 ! 授チ妙 2 蟹、J!、l #P f県訂路 切本り嶽 t 1″″′7y 験、1:、回路 −1;ヨ)ロワイm 、。 gTch巨:[路 エフ7本しぎK ど 二r@ ≦C5櫂111j路 平均イ1 に1発 2 ? 、q M’3:* 、*JL H粘j4 恥萌 昼 蕎、1.j // /θ 将軟 炉職回路 ri’lct’Bk 、、上、、。 水了唄 (α) ト′ 2/ ト−
Claims (2)
- (1)文字記入間隔を指定せず文字記入行のみを指定す
る帳票に記入された文字を認識する文字認識装置におい
て、前記帳票の文字記入行に記入された文字行を観1j
ii l、て得られる観/1tllパターンの前記文字
記入行に関する投影分布によって前記観測パターンを前
記文字記入行方向に分割し、前記分割によって得られる
分割観Δ111バクーン旬の前記投影分布によって該分
割観測パターンを前記文字記入行方向に再分割し、前記
分割と前記再分割とによって前記観測パターンの切り出
しを行うことを特徴とする文字認識装置の文字切出し方
法。 - (2)前記分割観測パターンの再分割は該分割観測パタ
ーン毎の前記投影分布の平均値から得られるしきい値に
よって行うことを特徴とする特許請求の範囲第1項記載
の文字認識装置の文字切出し方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58155415A JPS6048582A (ja) | 1983-08-25 | 1983-08-25 | 文字認識装置の文字切出し方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58155415A JPS6048582A (ja) | 1983-08-25 | 1983-08-25 | 文字認識装置の文字切出し方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS6048582A true JPS6048582A (ja) | 1985-03-16 |
Family
ID=15605493
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58155415A Pending JPS6048582A (ja) | 1983-08-25 | 1983-08-25 | 文字認識装置の文字切出し方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6048582A (ja) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH01196685A (ja) * | 1988-02-01 | 1989-08-08 | Fuji Electric Co Ltd | 文字検出方法 |
| JPH0231286A (ja) * | 1988-07-21 | 1990-02-01 | Fuji Electric Co Ltd | 特殊文字行の判別方法 |
| JPH02255995A (ja) * | 1988-04-28 | 1990-10-16 | Seiko Epson Corp | 文字切り出し方法 |
| US5275672A (en) * | 1990-11-10 | 1994-01-04 | Wilkinson Sword Gesellschaft Mit Beschrankter Haftung | Razor blade steel having high corrosion resistance and differential residual austenite content |
| JPH07319998A (ja) * | 1988-04-28 | 1995-12-08 | Seiko Epson Corp | 文字切り出し方法 |
-
1983
- 1983-08-25 JP JP58155415A patent/JPS6048582A/ja active Pending
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH01196685A (ja) * | 1988-02-01 | 1989-08-08 | Fuji Electric Co Ltd | 文字検出方法 |
| JPH02255995A (ja) * | 1988-04-28 | 1990-10-16 | Seiko Epson Corp | 文字切り出し方法 |
| JPH07319998A (ja) * | 1988-04-28 | 1995-12-08 | Seiko Epson Corp | 文字切り出し方法 |
| JPH0231286A (ja) * | 1988-07-21 | 1990-02-01 | Fuji Electric Co Ltd | 特殊文字行の判別方法 |
| US5275672A (en) * | 1990-11-10 | 1994-01-04 | Wilkinson Sword Gesellschaft Mit Beschrankter Haftung | Razor blade steel having high corrosion resistance and differential residual austenite content |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN110781877B (zh) | 一种图像识别方法、设备及存储介质 | |
| JPH06504866A (ja) | 拡大可能な答えマーク領域を使用して効率的な走査およびマーク検出を行うアンケート走査システム | |
| JPS59216285A (ja) | 文字認識装置 | |
| JPS6048582A (ja) | 文字認識装置の文字切出し方法 | |
| US5369715A (en) | Optical character recognition system | |
| JP3552196B2 (ja) | 印刷制御装置、印刷制御方法および記録媒体 | |
| JPS58134748A (ja) | 文字デ−タ圧縮用ブロツク設定方式 | |
| EP2631813A1 (en) | Method and device for eliminating cracks within page | |
| CN110827290B (zh) | 一种基于分水岭的极化sar影像超像素分割方法 | |
| JPH05159099A (ja) | 光学式文字認識装置における帳票の文字認識領域指定方法及び帳票 | |
| CN115205865B (en) | Method and device for identifying image and electronic equipment | |
| JPH01249482A (ja) | データ出力装置 | |
| CN111161247B (zh) | 用于可变码识读字符质量验证的检测方法 | |
| US4466191A (en) | Method for creating a plat from a metes and bounds property description | |
| JPS63101983A (ja) | 文字列抽出方式 | |
| JPH02178765A (ja) | 文書作成装置 | |
| Clarke et al. | Recognizing musical text | |
| JP2002251613A (ja) | 図形認識方法及び装置 | |
| DE102024135326A1 (de) | Fahrzeugkilometerstand-erkennungsverfahren und -vorrichtung | |
| JPS6195483A (ja) | 文字認識方法 | |
| JP2024138799A (ja) | 三次元点群データに基づく三次元モデル生成装置 | |
| Drevin et al. | Determining the skew and scale in images of Compton-Wollan-Bennett ionization chamber recordings | |
| CN110532943A (zh) | 基于Camshift算法与影像逐帧结合的航道状态分析方法 | |
| JPS63208990A (ja) | 文字パタ−ン切り出し装置 | |
| JPH0546734A (ja) | パターン認識方法 |