JPH0225555B2 - - Google Patents
Info
- Publication number
- JPH0225555B2 JPH0225555B2 JP56123427A JP12342781A JPH0225555B2 JP H0225555 B2 JPH0225555 B2 JP H0225555B2 JP 56123427 A JP56123427 A JP 56123427A JP 12342781 A JP12342781 A JP 12342781A JP H0225555 B2 JPH0225555 B2 JP H0225555B2
- Authority
- JP
- Japan
- Prior art keywords
- height
- information
- width
- segment
- register
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Description
【発明の詳細な説明】
本発明は光学文字読取装置の復調方式に関し、
とくにノイズ情報を除去する光学文字読取装置の
復調方式に関する。[Detailed Description of the Invention] The present invention relates to a demodulation method for an optical character reading device.
In particular, it relates to a demodulation method for optical character reading devices that removes noise information.
光学文字読取装置(OCR)は媒体に記された
文字、記号、数字等(以下文字という)に光照射
を行い、その反射光(または透過光)を光検知器
で光電変換して得られる電気信号に基づいて文字
の読取りを行うものである。 An optical character reader (OCR) irradiates light onto characters, symbols, numbers, etc. (hereinafter referred to as characters) written on a medium, and converts the reflected light (or transmitted light) into electricity using a photodetector. Characters are read based on signals.
この電気信号は一旦ビデオストレージ(以下メ
モリという)に蓄えられた後、読取り処理が行わ
れるが、媒体上に記された文字はかすれ、欠け等
があり、これら不完全な文字パターンのままメモ
リに蓄えられるため、このまま読取り処理を行う
と文字の誤認を生じる欠点があつた。 This electrical signal is once stored in video storage (hereinafter referred to as memory) and then read out, but the characters written on the medium may be faded or missing, and these incomplete character patterns remain in the memory. Since the data is stored, there is a drawback that if reading processing is continued as is, characters may be misrecognized.
本発明はかかる点に鑑みなされたもので媒体か
ら読取られた文字データに修正を加え、文字に対
する誤認識の少ないOCRを提供することを目的
とする。 The present invention has been devised in view of the above, and an object of the present invention is to provide an OCR that corrects character data read from a medium and reduces misrecognition of characters.
以下図面を参照しながら本発明の好ましい実施
例について詳細に説明する。 Preferred embodiments of the present invention will be described in detail below with reference to the drawings.
実施例の説明に先立つて、本発明の基本的考え
方を説明する。 Before explaining the embodiments, the basic idea of the present invention will be explained.
第1図に示すようにメモリM内に“4”,“2”
等のパターン情報が蓄えられている。 As shown in Figure 1, "4" and "2" are stored in memory M.
Pattern information such as the following is stored.
媒体に記されている文字寸法は一定の規格値内
に納まるように定められているので、メモリM内
に蓄えられている文字情報を表すセグメントの寸
法を算出すれば、真の文字情報か否か判別でき
る。例えば第1図において文字“2”の近くに汚
点を現す情報O1,O2が蓄えられているが、この
場合、1文字記憶領域R1内の情報セグメントの
幅を測る幅測定は記憶領域を列ごとに記憶内容の
OR演算を施し、その結果を得られる演算値をレ
ジスタに入力して黒画集を表す情報セグメントの
幅を計数すればよい。領域R1に在る情報セグメ
ントJ1J3J5の幅は3ビツト長、10ビツト長、2ビ
ツト長となる。従つて情報セグメントの全幅は3
ビツト+2ビツト+10ビツト+2ビツト+2ビツ
ト=19ビツトとなり、規格値WNより大きいため、
文字情報以外の情報(汚点情報)を含んでいるこ
とが判る。 Since the character size written on the medium is determined to be within a certain standard value, by calculating the size of the segment representing the character information stored in the memory M, it can be determined whether the character information is true or not. It can be determined whether For example, in Fig. 1, information O 1 and O 2 representing a blemish is stored near the character "2", but in this case, the width measurement that measures the width of the information segment within the one character storage area R 1 is of the memory contents for each column.
The width of the information segment representing the black art book can be counted by performing an OR operation and inputting the resulting calculated value into a register. The widths of the information segments J 1 J 3 J 5 in the region R 1 are 3 bits long, 10 bits long, and 2 bits long. Therefore, the total width of the information segment is 3
Bit + 2 bits + 10 bits + 2 bits + 2 bits = 19 bits, which is larger than the standard value WN , so
It can be seen that information other than character information (stain information) is included.
このためまず左端に位置するセグメントJ1幅を
調べ、その幅が一定値Wn、例えば2ビツト以下
なら文字情報ではないと判断する。次にこの文字
情報でないものを除いた情報セグメントの全幅を
調べると、10ビツト+2ビツト+2ビツト=14ビ
ツトであり、なお幅の規格値WNより大きいため
右端に位置するセグメントJ5の幅を調べる。この
セグメント幅が前記一定の規格値Wn以下なら非
文字情報として扱い、規格値より大きければ、次
に左側に位置するセグメント幅を調べ、前記規格
幅Wnより小さければ、この情報を非文字情報と
して扱い、この左側に位置するセグメント幅が前
記規格値Wnより大きければ、前述の右側および
左側に位置するセグメント幅を比較して幅の広い
セグメントを有効(文字情報)として扱う。 For this reason, first, the width of segment J1 located at the left end is checked, and if the width is less than a certain value Wn, for example 2 bits, it is determined that it is not character information. Next, when we examine the total width of the information segment excluding those that are not text information, we find that it is 10 bits + 2 bits + 2 bits = 14 bits, which is still larger than the width standard value WN , so the width of segment J5 located at the right end is investigate. If this segment width is less than the specified standard value Wn, it is treated as non-character information, if it is larger than the standard value, then the segment width located on the left side is checked, and if it is smaller than the standard width Wn, this information is treated as non-character information. If the segment width located on the left side is larger than the standard value Wn, the segment widths located on the right and left sides are compared and the wider segment is treated as valid (character information).
次にメモリM内のこの情報パターンの高さの測
定を行う。高さの測定は前述の幅測定と同様の方
法で可能であり、記憶領域を行ごとに記憶内容の
OR演算を施し、その結果得られる演算値をレジ
スタに入力して得られる情報パターンの高さを計
数すればよい。 The height of this information pattern in memory M is then measured. The height can be measured in the same way as the width measurement described above, and the storage area can be measured line by line.
The height of the information pattern obtained by performing an OR operation and inputting the resulting calculated value into a register is sufficient.
例えば、領域R1に在るセグメントの高さは、
h1,h2,h3、であり、情報パターンの全高Hはh1
+b1+h2+b2+h3であり、全高Hが情報パターン
の高さの規格値HNより大きければ、非文字情報
が含まれているものと判断し、最上位に在るセグ
メントの高さh1とセグメントの規格値Hnと比較
する。 For example, the height of the segment in region R1 is
h 1 , h 2 , h 3 , and the total height H of the information pattern is h 1
+b 1 +h 2 +b 2 +h 3 , and if the total height H is larger than the standard value HN for the height of the information pattern, it is determined that non-text information is included, and the height of the segment at the top Compare h 1 with the standard value Hn of the segment.
h1<Hnなら、この情報セグメントは非文字情
報と判断し、残りの情報セグメントの全高を調
べ、この全高H1と規格値HNを比較し、H1<HN
ならこの残りの情報セグメントは文字情報と判断
する。なお、H1>HNならこの残りの情報セグメ
ントはなお非文字情報を含んでいると判断して最
下位に在る情報セグメントの高さh5を調べh5と規
格値Hnを比較し、H5<Hnならこの最下位に在
る情報セグメントh5は非文字情報として扱い、h5
>Hnならこの最下位に在る情報セグメントの高
さh5と前述の情報セグメントの高さh3の大小を比
較し、高さの大の方の情報セグメントを有効(文
字情報)として扱う。この後、残余の情報セグメ
ントの全高と規格値HNを比較し、規格値HNより
大きければ、再び残余の情報セグメントのうち最
上位に在る情報セグメントの高さを調べるという
前述の操作を操返えす。 If h 1 < Hn, this information segment is determined to be non-text information, the total height of the remaining information segments is checked, this total height H 1 is compared with the standard value H N , and H 1 < H N
Then, this remaining information segment is determined to be character information. If H 1 > H N , it is determined that the remaining information segments still contain non-text information, and the height h 5 of the lowest information segment is checked, and h 5 is compared with the standard value Hn. If H 5 < Hn, the information segment h 5 at the lowest level is treated as non-character information, and h 5
>Hn, the height h5 of the lowest information segment is compared with the height h3 of the information segment described above, and the information segment with the larger height is treated as valid (character information). After this, the total height of the remaining information segments is compared with the standard value H N , and if it is larger than the standard value H N , the above-mentioned operation of checking the height of the highest information segment among the remaining information segments is performed again. I'll return it.
H1>HNなら最下位に在る情報セグメントの高
さを比較し、高さの低い方の情報セグメントを無
効(非文字情報)として除去し、残りの情報セグ
メントの全高を調べ、規定値HNと比較し、以下
前述と同様の操作によつて文字情報であるか否か
の判定を行う。このようにしてノイズ情報が削除
され、文字情報のみが選択される。 If H 1 > H N , compare the heights of the lowest information segments, remove the information segment with the lower height as invalid (non-text information), check the total height of the remaining information segments, and set the default value. H N is compared, and it is determined whether or not it is character information by the same operation as described above. In this way, noise information is deleted and only text information is selected.
第2図は本発明の一実施例構成図であつて、M
はビデオストレージ(メモリ)、Aはアドレスレ
ジスタ、R1R2はOR回路、L1L2L3はレジスタ、
K1K2はカウンタ、C1C2は比較器、L4は規格値が
セツトされているレジスタ、Sは制御部である。 FIG. 2 is a configuration diagram of an embodiment of the present invention, and shows M
is video storage (memory), A is address register, R 1 R 2 is OR circuit, L 1 L 2 L 3 is register,
K 1 K 2 is a counter, C 1 C 2 is a comparator, L 4 is a register in which a standard value is set, and S is a control section.
次にこの装置の動作を説明する。 Next, the operation of this device will be explained.
アドレスレジスタAのアドレス信号で指定され
るメモリMの記領域の1バイト分の領域M11の文
字情報がメモリMからOR回路R1の一側の入力端
子に並列に入力される。OR回路R1の他側の入力
端子にはレジスタL1の1バイト分のデータが並
列に入力されるが、レジスタL1の初期値は全て
“0”にセツトされており、OR回路R1の出力は
領域M11のデータそのものである。この1バイト
分のデータはレジスタL1に入力される。次にア
ドレスレジスタのAのアドレス信号により指定さ
れるメモリMの領域M12の1バイトのデータが
OR回路R1の一方の入力端子へ入力され、他方の
入力端子に入力されるレジスタL1のデータとの
OR演算が行われ、その出力はレジスタL1へ入力
される。このとき今までレジスタL1に蓄えられ
ていたデータは予めクリアされる。 Character information in one byte of the storage area M11 of the memory M specified by the address signal of the address register A is inputted in parallel from the memory M to one input terminal of the OR circuit R1 . One byte of data from register L1 is input in parallel to the input terminal on the other side of OR circuit R1 , but the initial values of register L1 are all set to "0", and OR circuit R1 The output of is the data itself of area M11 . This 1-byte data is input to register L1 . Next, 1 byte of data in area M12 of memory M specified by the address signal of address register A is
The data input to one input terminal of OR circuit R 1 and the data of register L 1 input to the other input terminal are
An OR operation is performed and its output is input to register L1 . At this time, the data previously stored in register L1 is cleared in advance.
このような操作の繰返しによつてメモリMの領
域M11〜Mo1のデータのOR演算が完了すると、
レジスタL1に蓄えられている1バイト分のデー
タはレジスタL2の領域L21に入力される。次に同
様の操作によつてメモリMの第2列の領域M21〜
M2oのデータに対するOR演算が施され、その演
算結果はレジスタL2の領域L22に収納され、同様
の操作により第3列……第m列の領域のデータの
OR演算結果がレジスタL2のL23……L2nに収納さ
れる。このようにしてレジスタL2にはメモリM
の黒画素情報を示すビツト群(セグメントJ1〜
J5)が得られる。 When the OR operation of the data in areas M 11 to M o1 of memory M is completed by repeating such operations,
One byte of data stored in register L1 is input to area L21 of register L2 . Next, by similar operation, the area M 21 ~ in the second column of the memory M is
An OR operation is performed on the data in M 2o , the result of the operation is stored in area L 22 of register L 2 , and the same operation is performed to store the data in the area of the third column...the m-th column.
The OR operation result is stored in L23 ... L2n of register L2 . In this way register L 2 has memory M
A group of bits indicating black pixel information (segment J 1 ~
J 5 ) is obtained.
次に計測部KでレジスタL2に収納されている
第1セグメントから最終セグメントまでの“長
さ”が計測された後、この計測値W0を比較器C1
の一方の入力端子に入力し、他方の端子には規格
値Wnが入力され、これと比較される。 Next, after the measuring section K measures the "length" from the first segment to the final segment stored in the register L2 , this measured value W0 is sent to the comparator C1.
The standard value Wn is input to one input terminal, and the standard value Wn is input to the other terminal, and compared with this.
W0WNなら比較器C1の出力はL(ロー)レベ
ルとなり、フラグレジスタL5の第1ビツトは
“0”、W0>WNなら比較器C2の出力はH(ハイ)
レベルとなり、フラグレジスタL5の第1ビツト
は‘1”となる。 If W 0 W N , the output of comparator C 1 becomes L (low) level, and the first bit of flag register L 5 is “0”; if W 0 > W N , the output of comparator C 2 becomes H (high).
level, and the first bit of flag register L5 becomes '1'.
W0WNなら次に文字情報の高さ方向の計測操
作を行う。しかしW0>WNの場合、レジスタL2に
収納されている各セグメントの内、両端に在るセ
グメントJ1J5の長さが比較される。 If W 0 W N , then the measurement operation in the height direction of the character information is performed. However, if W 0 >W N , the lengths of segments J 1 J 5 at both ends of the segments stored in register L 2 are compared.
そしてこの内、セグメント長の短い方のセグメ
ントを無効とし、残りの情報セグメントで構成さ
れるパターンの幅を計測し、その計数値W1を比
較器C1に入力して、規格値WNと比較する。 Then, among these segments, the one with the shorter segment length is invalidated, the width of the pattern made up of the remaining information segments is measured, and the counted value W 1 is inputted to the comparator C 1 , and the standard value W N is calculated. compare.
そして、セグメント幅が規格値WN以下になる
までこの操作を繰り返す。 This operation is then repeated until the segment width becomes equal to or less than the standard value WN .
そしてセグメント幅が規格値WN以下になると
次にパターン高さの計測を行うが、この計測法は
パターン幅の計測法と同様である。 Then, when the segment width becomes equal to or less than the standard value WN , the pattern height is next measured, and this measurement method is the same as the pattern width measurement method.
まずメモリMの第1行の領域N11〜N1lの対応
するビツトのデータのOR演算をOR回路R2で行
いレジスタL3に収納されているその演算結果を
レジスタL4に転送し以下同じようにして第2行
……第n行についてもそれぞれOR演算を行いそ
の結果をレジスタL3の領域……に収納する。そ
の後、計測部K2によりパターン高さの計測をし、
計測部K2の計測値H0を比較器C2の一方の入力端
子に入力し、他方の入力端子に入力される規格値
HNと比較する。 First, the OR circuit R2 performs an OR operation on the data of the corresponding bits in the areas N11 to N1l of the first row of the memory M, and transfers the operation result stored in the register L3 to the register L4 , and the same applies hereafter. In this way, the OR operation is performed for the second row, . . ., the nth row, respectively, and the results are stored in the area of register L3 . After that, the pattern height is measured by measuring part K2 ,
Input the measured value H 0 of the measuring section K 2 to one input terminal of the comparator C 2 , and the standard value input to the other input terminal.
Compare with HN .
H0<HNならこの領域に在るパターンデータを
有効とし、H0>HNなら両端に在るセグメント
h1,h5のセグメント高さをカウンタK2で計測し、
比較器C1で比較する。そしてこの内セグメント
高さの低い方のセグメントデータは無効とし、
(まりノイズデータとする)残余のパターン高さ
を計測部K2で計測し、その計測値を比較器C2の
一方の入力端子に入力し、他方の入力端子に入力
される規格値HNと比較する。パターン高さが規
格値HN以下になるまでこの操作を繰り返す。 If H 0 < H N , pattern data existing in this area is valid; if H 0 > H N , segments existing at both ends are valid.
Measure the segment heights of h 1 and h 5 with counter K 2 ,
Compare with comparator C1 . The segment data with the lower segment height among these will be invalidated,
The remaining pattern height (used as noise data) is measured by the measurement unit K 2 , and the measured value is input to one input terminal of the comparator C 2 , and the standard value H N is input to the other input terminal. Compare with. Repeat this operation until the pattern height becomes less than the standard value HN .
以上のようにして得られたパターン幅方向のセ
グメント領域SWおよびパターン高さ方向のセグ
メント領域SH内にあるデータが文字情報として扱
われる。 The data within the segment area SW in the pattern width direction and the segment area SH in the pattern height direction obtained as described above is treated as character information.
以上の説明から明らかなように本発明の係る光
学文字読取装置の復調方式は、媒体に記された文
字を読取つた後、予め定められた規格寸法内に在
るデータのみを文字を表すデータとして有効と
し、又、規格寸法外のデータに関しては、前記デ
ータの射影の両端側のセグメントを削除し、規格
寸法内に納めるので、前記媒体に付着した汚点等
が除去され、輪郭の明瞭な画像文字パターンが得
られる利点がある。 As is clear from the above description, the demodulation method of the optical character reading device according to the present invention, after reading characters written on a medium, converts only data within predetermined standard dimensions into data representing characters. In addition, for data that is outside the standard dimensions, the segments on both ends of the projection of the data are deleted and the data is placed within the standard dimensions, so dirt, etc. attached to the medium is removed, and image characters with clear outlines are created. It has the advantage of providing a pattern.
第1図は媒体から読取られた文字がメモリに格
納されている様子を示す図、第2図は本発明の一
実施例構成図である。
A……アドレスレジスタ、M……メモリ、R1,
R2……OR回路、L1〜L4……レジスタ、C1,C2…
…比較器。
FIG. 1 is a diagram showing how characters read from a medium are stored in a memory, and FIG. 2 is a configuration diagram of an embodiment of the present invention. A...address register, M...memory, R1 ,
R2 ...OR circuit, L1 to L4 ...Register, C1 , C2 ...
...Comparator.
Claims (1)
該読み取りパターンをメモリ内に格納し、該メモ
リ内の信号に基づいて前記媒体の文字を認識する
ようにした光学文字読取装置に於いて、 前記媒体の単位領域の幅方向及び高さ方向に沿
つて、それぞれ該単位領域内の記憶領域の記憶情
報について論理和を求め、前記単位領域の幅方向
及び高さ方向の射影を取り、 前記単位領域内のパターンの幅及び高さを求
め、該幅及び高さを規格値と比較し、 該規格値の範囲内に在るパターンを有効とし、 前記規格値の範囲外の幅及び高さを有する単位
領域内のパターンに於いては、前記幅及び高さ方
向の射影内の複数の射影部分から、前記パターン
の幅及び高さを規格値内に納める1乃至複数の射
影部分を前記射影の両端側から取り除く抽出回路
を設けたことを特徴とする光学文字読取装置の復
調方式。[Claims] 1. Reading characters written in a unit area of a medium,
In an optical character reading device that stores the reading pattern in a memory and recognizes characters on the medium based on signals in the memory, Then, calculate the logical OR of the storage information of the storage area in each unit area, take the projection in the width direction and height direction of the unit area, calculate the width and height of the pattern in the unit area, and calculate the width and height are compared with standard values, and patterns within the range of the standard values are considered valid; for patterns within the unit area whose width and height are outside the range of the standard values, the width and height are The present invention is characterized in that an extraction circuit is provided for removing from both ends of the projection one or more projection portions that keep the width and height of the pattern within standard values from a plurality of projection portions in the projection in the height direction. Demodulation method for optical character reading devices.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56123427A JPS5824973A (en) | 1981-08-06 | 1981-08-06 | Demodulation system for optical character reader |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56123427A JPS5824973A (en) | 1981-08-06 | 1981-08-06 | Demodulation system for optical character reader |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS5824973A JPS5824973A (en) | 1983-02-15 |
| JPH0225555B2 true JPH0225555B2 (en) | 1990-06-04 |
Family
ID=14860288
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP56123427A Granted JPS5824973A (en) | 1981-08-06 | 1981-08-06 | Demodulation system for optical character reader |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5824973A (en) |
-
1981
- 1981-08-06 JP JP56123427A patent/JPS5824973A/en active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS5824973A (en) | 1983-02-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4607385A (en) | Character recognition apparatus | |
| JPS6011973A (en) | Bar code reader | |
| JP2644041B2 (en) | Character recognition device | |
| JPH0225555B2 (en) | ||
| JPS6046471B2 (en) | character reading device | |
| JPH0325585A (en) | Erroneous reading prevention device in bar code reader | |
| JP2975720B2 (en) | Optical character reader | |
| JPS5919388B2 (en) | character reader | |
| JP2784004B2 (en) | Character recognition device | |
| JP2877380B2 (en) | Optical character reader | |
| JPS6111886A (en) | Character recognition system | |
| JP2779898B2 (en) | Barcode reader | |
| JP2542628B2 (en) | Mark reader | |
| JP3747602B2 (en) | Image processing method and image processing apparatus | |
| JP2726214B2 (en) | Image reading device | |
| JPS596419B2 (en) | Character extraction method | |
| JPS6252911B2 (en) | ||
| JPH0272497A (en) | Optical character reader | |
| JPS5914078A (en) | Reader of business form | |
| JPS6120912B2 (en) | ||
| JPS5927946B2 (en) | Character/mark reading device | |
| JPS6010671B2 (en) | pattern reading device | |
| JPH0736111A (en) | Method for encoding bar code for microfilm | |
| JPS59136872A (en) | Noise eliminator for bar code reader | |
| JPS6227435B2 (en) |