JPH0135384B2 - - Google Patents

Info

Publication number
JPH0135384B2
JPH0135384B2 JP56057557A JP5755781A JPH0135384B2 JP H0135384 B2 JPH0135384 B2 JP H0135384B2 JP 56057557 A JP56057557 A JP 56057557A JP 5755781 A JP5755781 A JP 5755781A JP H0135384 B2 JPH0135384 B2 JP H0135384B2
Authority
JP
Japan
Prior art keywords
projection
value
character
pitch
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56057557A
Other languages
Japanese (ja)
Other versions
JPS57172483A (en
Inventor
Yoshihisa Tanabe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP56057557A priority Critical patent/JPS57172483A/en
Publication of JPS57172483A publication Critical patent/JPS57172483A/en
Publication of JPH0135384B2 publication Critical patent/JPH0135384B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】 この発明は、特に自由なフオーマツトの文章等
の読取りを行なう光学的文字読取装置に用いられ
るピツチ抽出回路に関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention particularly relates to a pitch extraction circuit used in an optical character reading device that reads text in a free format.

従来、特に文章の読取りを行なう光学的文字読
取装置(以下OCRという)では、文字ピツチを
予め指定するフオーマツトコントロール方式が使
用しにくいため、OCR自身で文字ピツチを抽出
する必要があつた。ところで、音声の認識におい
ても、音声の基本周期を正確に抽出することは、
極めて重要である。その抽出方法として自己相関
法等が開発されており、それなりの効果を上げて
いるのは周知のことである。また音声認識におい
て基本周期を抽出することと、OCRにおいて1
文字づつ文字を切り出す(以下検切りするとい
う)ことは対応関係にあり、どちらも必要不可欠
な技術である。
Conventionally, in optical character reading devices (hereinafter referred to as OCR), which specifically read text, it has been difficult to use a format control method that specifies character pitch in advance, so it has been necessary to extract character pitch by OCR itself. By the way, in speech recognition, accurately extracting the fundamental period of speech is
extremely important. Autocorrelation methods and the like have been developed as extraction methods, and it is well known that they are quite effective. Also, extracting the fundamental period in speech recognition, and 1 in OCR.
There is a correspondence between cutting out characters one by one (hereinafter referred to as "cutting"), and both are essential techniques.

文字認識の場合には、文字間余白を使つてかな
り高精度に文字ピツチを抽出することも可能であ
るが、雑音、分離文字等の対処のため文字ピツチ
抽出のためのアルゴリズムが複雑となり、精度を
充分上げることができないという欠点があつた。
In the case of character recognition, it is possible to extract character pitch with a fairly high degree of accuracy by using the space between characters, but the algorithm for character pitch extraction becomes complicated to deal with noise, separated characters, etc. The drawback was that it was not possible to raise the level sufficiently.

この発明は上記のような事情に鑑みてなされた
もので、帳票に記入された自由フオーマツトの文
章等から文字ピツチ等のピツチを比較的簡単にか
つある程度精度よく抽出することができる光学的
文字読取装置に用いられるピツチ抽出回路を提供
することを目的とする。
This invention was made in view of the above-mentioned circumstances, and is an optical character reader that can relatively easily extract pitches such as character pitches from free-format text written on a form with a certain degree of accuracy. The object of the present invention is to provide a pitch extraction circuit used in a device.

以下、図面を参照してこの発明の実施例を説明
する。第1図は、この発明の一実施例のピツチ抽
出回路を含む概略構成図である、図中、1は光電
変換部で、文字等の記入された読取帳票上を光学
的に走査し、帳票表面からの反射光を電気信号に
変換する機能を持つている。2はA/D(アナロ
グ/デジタル)変換器で、光電変換部1から送ら
れてきたアナログ電気信号を多値のデジタル信号
に変換する機能を持つている。3はラインバツフ
アで、A/D変換器2から送られてきた多値デジ
タル信号を帳票の1行分記憶する機能を持つてい
る。すなわち、このラインバツフア3には、帳票
1行分の多値量子化されたパターン列が記憶され
るようになつている。4は射影回路で、ラインバ
ツフア3に記憶された1行分の多値量子化パター
ン列の縦方向(Y方向)の多値の射影値を抽出
し、射影値P(x)として記憶する機能を持つて
いる。5は自己相関器で、射影回路4で求められ
た射影値P(x)の自己相関関数φ(τ)を計算す
る機能を持つている。6はピーク検出回路で、自
己相関器5で求められた自己相関関数φ(τ)の
ピークを検出し、基本周期(ピツチ)を求めると
ともに、そのピーク値が文字ピツチとして妥当な
範囲にあるか等をチエツクして、最終的なピツチ
情報を出力する機能を持つている。このピツチ情
報は、図示せぬ検切部に上記ラインバツフア3に
記憶された多値量子化されたパターン列を1文字
単位のパターンに検切りするための情報として供
給されるようになつている。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a schematic configuration diagram including a pitch extraction circuit according to an embodiment of the present invention. In the figure, 1 is a photoelectric conversion unit that optically scans a read form with characters etc. It has the function of converting light reflected from the surface into electrical signals. Reference numeral 2 denotes an A/D (analog/digital) converter, which has a function of converting the analog electrical signal sent from the photoelectric conversion section 1 into a multi-value digital signal. Reference numeral 3 denotes a line buffer, which has a function of storing the multivalued digital signal sent from the A/D converter 2 for one line of a form. That is, the line buffer 3 stores a multi-value quantized pattern sequence for one line of a form. 4 is a projection circuit which has a function of extracting the multi-value projection value in the vertical direction (Y direction) of the multi-value quantization pattern string for one row stored in the line buffer 3 and storing it as the projection value P(x). I have it. Reference numeral 5 denotes an autocorrelator, which has a function of calculating an autocorrelation function φ(τ) of the projection value P(x) obtained by the projection circuit 4. 6 is a peak detection circuit that detects the peak of the autocorrelation function φ (τ) obtained by the autocorrelator 5, determines the fundamental period (pitch), and checks whether the peak value is within a reasonable range for character pitch. It has a function to check etc. and output the final pitch information. This pitch information is supplied to a check section (not shown) as information for checking the multi-level quantized pattern string stored in the line buffer 3 into patterns for each character.

次に、上記実施例の動作を説明する。例えば第
2図に示すような文字の記入された帳票CHは光
電変換部1で走査される。そして、例えば帳票の
1行目に記入された文字列は、光電変換され、多
値量子化されて、多値量子化された文字パターン
列としてラインバツフア3に第3図に示すように
記憶される。第3図に示すように記憶された文字
パターン列は、射影回路4で、第4図に示すよう
に、縦方向(Y方向)の多値射影値が抽出され
る。このとき、そのY方向で最も量子化レベルの
高い値をその射影値とする。そして、X方向に対
する各射影値をP(x)として記憶する。なお、
精度を要求しない場合は、多値射影でなく2値の
射影で代用してもよい。また、スキヤン間隔は通
常0.1mm程度にとればよい。
Next, the operation of the above embodiment will be explained. For example, a form CH on which characters are written as shown in FIG. 2 is scanned by the photoelectric conversion section 1. For example, the character string entered in the first line of the form is photoelectrically converted, multi-value quantized, and stored as a multi-value quantized character pattern string in the line buffer 3 as shown in FIG. . From the character pattern string stored as shown in FIG. 3, the projection circuit 4 extracts multilevel projection values in the vertical direction (Y direction) as shown in FIG. At this time, the value with the highest quantization level in the Y direction is set as the projected value. Then, each projection value in the X direction is stored as P(x). In addition,
If precision is not required, binary projection may be used instead of multilevel projection. Further, the scan interval should normally be set to about 0.1 mm.

射影回路4で求められた射影値P(x)に対す
る自己相関関数φ(τ)が自己相関器5で求めら
れる。この自己相関関数φ(τ)は、射影値P
(x)に対して次式で定義される。
An autocorrelator 5 obtains an autocorrelation function φ(τ) for the projection value P(x) obtained by the projection circuit 4. This autocorrelation function φ(τ) is the projection value P
(x) is defined by the following equation.

φ(τ)= lim T→∞1/2T∫T -TP(x)P(x+τ)dx 射影値P(x)は、実際には離散値であり、分析
区間もラインバツフア3以内であるので、簡単な
自己相関数器5で射影値P(x)に対する自己相
関関数φ(τ)を求めることができる。
φ(τ) = lim T→∞1/2T∫ T -T P(x)P(x+τ)dx The projected value P(x) is actually a discrete value, and the analysis interval is within 3 line buffers, so , the autocorrelation function φ(τ) for the projection value P(x) can be obtained using a simple autocorrelation calculator 5.

そして、ピーク検出回路6において、自己相関
器5で求められた自己相関関数φ(τ)から、ピ
ークを検出し、検出されたピークが文字のピツチ
として妥当な範囲であるか等のチエツクをした
後、最終的なピツチ情報が図示せぬ検切部に出力
される。このピーク検出回路6におけるピーク検
出の際には、擬似ピークとの分離が重要となる。
例えば、音声におけるピツチ抽出の際には、音声
波形P(t)が第5図Aに示すようになつていた
場合、その自己相関関数φ(τ)は第5図Bに示
すようになる。この音声波形の自己相関関数φ
(τ)には、基本周期に対応するピークPaの他
に、ホルマント情報に対応する擬似ピークPbが
現われる。これは基本周期にコンボルート(重
量)されたホルマント情報が、擬似ピークとして
大きな値をもつためである。音声の場合にはこの
擬似ピークが誤検出の原因となるが、文字の場合
には、ホルマントに相当する周波数成分を持たな
いため誤検出の可能性は少ない。また、ピーク値
から文字ピツチの乱れをある程度推定できるため
検切部に対して有効な情報を与えることができ
る。
Then, a peak detection circuit 6 detects a peak from the autocorrelation function φ(τ) obtained by the autocorrelator 5, and checks whether the detected peak is within an appropriate range for the pitch of a character. After that, the final pitch information is output to an inspection section (not shown). When detecting peaks in this peak detection circuit 6, separation from pseudo peaks is important.
For example, when pitch is extracted from speech, if the speech waveform P(t) is as shown in FIG. 5A, its autocorrelation function φ(τ) becomes as shown in FIG. 5B. The autocorrelation function φ of this speech waveform
In (τ), in addition to the peak Pa corresponding to the fundamental period, a pseudo peak Pb corresponding to formant information appears. This is because the formant information convorooted (weighted) to the fundamental period has a large value as a pseudo peak. In the case of speech, this pseudo peak causes erroneous detection, but in the case of text, there is less possibility of erroneous detection because it does not have a frequency component corresponding to a formant. Furthermore, since the disturbance in character pitch can be estimated to some extent from the peak value, effective information can be provided to the verification section.

なお、英国文章の場合は、単語間の空白はかな
り正確にとられているため、単語毎にピツチを抽
出することもできる。
Note that in the case of British sentences, the spaces between words are taken quite accurately, so it is also possible to extract pitches for each word.

また、上記実施例では自己相関器5を用いて自
己相関関数φ(τ)を求めるようにしたが、高速
フーリエ変換回路を用いて周波数パワースペクト
ルP(w)を求め、その逆変換として自己相関関
数φ(τ)を求めるようにしてもよい。この場合、
音声認識あるいは合成装置とOCRを組み合わせ
た装置では、高速フーリエ変換回路を音声認識あ
るいは合成装置とOCRに共通に使用できるとい
うメリツトが出てくる。
Furthermore, in the above embodiment, the autocorrelator 5 is used to obtain the autocorrelation function φ(τ), but a fast Fourier transform circuit is used to obtain the frequency power spectrum P(w), and as an inverse transform, the autocorrelation function φ(τ) is obtained. The function φ(τ) may also be determined. in this case,
A device that combines a speech recognition or synthesis device with OCR has the advantage that the fast Fourier transform circuit can be used in common with the speech recognition or synthesis device and OCR.

さらに、第6図に示すように、ラインバツフア
3に取り込まれた文字パターン間が、ゴーストg
等によりつながつてしまつたために、文字ピツチ
抽出のために誤差を生じることがある。そのた
め、射影回路4で射影値P(x)を求める際に、
上記実施例ではその縦方向(Y方向)で最も高い
射影値を射影値P(x)としたが、第7図に示す
ように、その縦方向における射影値の累積した値
を累積射影値P(x)とすれば、第7図に示すよ
うにゴーストによる影響部分hは相対的に小さく
なり、誤差を小さくすることができる。また、第
6図に示すように、文字パターンの縦方向に射影
をとる際に、黒−白−黒の部分は、黒−黒−黒に
すれば、さらにゴーストスによる影響部分hを相
対的に小さくすることができ、効果的である。
Furthermore, as shown in FIG.
etc., errors may occur due to character pitch extraction. Therefore, when calculating the projection value P(x) in the projection circuit 4,
In the above embodiment, the highest projection value in the vertical direction (Y direction) is set as the projection value P(x), but as shown in FIG. 7, the accumulated value of the projection values in the vertical direction is the cumulative projection value P (x), the portion h affected by the ghost becomes relatively small, as shown in FIG. 7, and the error can be reduced. Furthermore, as shown in Fig. 6, when taking the vertical projection of the character pattern, if the black-white-black part is made black-black-black, the part h affected by ghosts can be further reduced relatively. It can be made small and effective.

したがつて、このようなピツチ抽出回路では、
複雑なアルゴリズムを作成する必要がなく、比較
的簡単な回路の追加で文字ピツチを比較的精度よ
検出でき、特に文章の読取りを行なうOCRにお
いてピツチ情報を有効に与えることができる。な
お、帳票に記入される文字は活字でも書きでもよ
い。また、数字、ひらがな、漢字、図形等規則正
しく並んだものに対して有効であるが、並びの悪
いものはそれなりの情報を検切部に与えることが
できるので、検切り精度の向上につながる。
Therefore, in such a pitch extraction circuit,
There is no need to create a complicated algorithm, and by adding a relatively simple circuit, character pitches can be detected with relative accuracy, and pitch information can be provided effectively, especially in OCR, which reads text. Note that the characters entered on the form may be printed or written. It is also effective for items that are arranged in a regular manner, such as numbers, hiragana, kanji, and figures, but when it comes to items that are not arranged properly, a certain amount of information can be given to the cutting unit, leading to improved cutting accuracy.

以上述べたようにこの発明によれば、帳票に記
入された自由フオーマツトの文章等から文字ピツ
チ等のピツチを比較的簡単にかつある程度精度よ
抽出することができる光学的文字読取装置に用い
られるピツチ抽出回路を提供することができる。
As described above, according to the present invention, the pitch is used in an optical character reading device that can relatively easily and with a certain degree of accuracy extract pitches such as character pitches from free-format text written on a form. An extraction circuit can be provided.

【図面の簡単な説明】[Brief explanation of drawings]

第1図はこの発明の一実施例の概略構成図、第
2図は帳票の記入例を示す図、第3図はラインバ
ツフアに取り込まれた文字パターン列の様子を示
す図、第4図は第3図の文字パターン列の多値射
影を示す図、第5図Aは音声波形を示す図、第5
図Bは上記音声波に対する自己相関関数を示す
図、第6図はゴーストの影響のある文字パターン
列を示す図、第7図は第6図に示した文字パター
ン列の累積射影値を示す図である。 1……光電変換部、2……A/D変換器、3…
…ラインバツフア、4……射影回路、5……自己
相関器、6……ピーク検出回路。
FIG. 1 is a schematic configuration diagram of an embodiment of the present invention, FIG. 2 is a diagram showing an example of filling in a form, FIG. 3 is a diagram showing a character pattern string taken into a line buffer, and FIG. Figure 3A is a diagram showing the multilevel projection of the character pattern string, Figure 5A is a diagram showing the audio waveform, Figure 5
Figure B is a diagram showing the autocorrelation function for the above speech wave, Figure 6 is a diagram showing a character pattern string affected by ghosts, and Figure 7 is a diagram showing the cumulative projection value of the character pattern string shown in Figure 6. It is. 1...Photoelectric conversion section, 2...A/D converter, 3...
... line buffer, 4 ... projection circuit, 5 ... autocorrelator, 6 ... peak detection circuit.

Claims (1)

【特許請求の範囲】[Claims] 1 帳票に記入された文字あるいは図形を量子化
パターンとする光電変換手段と、上記帳票1行分
の量子化パターンを記憶する記憶部と、この記憶
部に記憶された1行分の量子化パターンの縦方向
射影をとる射影回路と、この射影回路で求められ
た射影値から自己相関関数を算出する回路と、上
記算出された自己相関関数のピークを検出するこ
とに基づきピツチ情報を出力するピーク検出回路
とを具備したことを特徴とするピツチ抽出回路。
1. A photoelectric conversion means that uses characters or figures written on a form as a quantization pattern, a storage unit that stores a quantization pattern for one line of the form, and a quantization pattern for one line stored in this storage unit. A projection circuit that takes a vertical projection of A pitch extraction circuit characterized by comprising a detection circuit.
JP56057557A 1981-04-16 1981-04-16 Pitch extracting circuit Granted JPS57172483A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56057557A JPS57172483A (en) 1981-04-16 1981-04-16 Pitch extracting circuit

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56057557A JPS57172483A (en) 1981-04-16 1981-04-16 Pitch extracting circuit

Publications (2)

Publication Number Publication Date
JPS57172483A JPS57172483A (en) 1982-10-23
JPH0135384B2 true JPH0135384B2 (en) 1989-07-25

Family

ID=13059110

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56057557A Granted JPS57172483A (en) 1981-04-16 1981-04-16 Pitch extracting circuit

Country Status (1)

Country Link
JP (1) JPS57172483A (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63304388A (en) * 1987-06-05 1988-12-12 Canon Inc Pitch detector
JPH04133546U (en) * 1991-05-29 1992-12-11 安藤電気株式会社 Tool storage mechanism

Also Published As

Publication number Publication date
JPS57172483A (en) 1982-10-23

Similar Documents

Publication Publication Date Title
EP0621542B1 (en) Method and apparatus for automatic language determination of a script-type document
JPH0135384B2 (en)
JP2618005B2 (en) Decryption method
JP2797848B2 (en) Optical character reader
JP3095437B2 (en) Character line detection cutout device and character reading device
JPH0135386B2 (en)
JP2576370B2 (en) ID mark reading device
JPH0325690A (en) Barcode reader signal processing method
JP2590099B2 (en) Character reading method
JPS6095689A (en) Optical character reader
JPS6111886A (en) Character recognition method
KR910007032B1 (en) A method for truncating strings of characters and each character in korean documents recognition system
JPS6311717B2 (en)
JPH0334112B2 (en)
JPS60181880A (en) Optical character inputting device
JPH0677270B2 (en) Character recognition device
JP2504373B2 (en) Character recognition device
JPS63178376A (en) Barcode pattern recognition device
JP2812705B2 (en) Character extraction device
KR920003910B1 (en) Character/document recognition system
JP2812704B2 (en) Character extraction device
JP2630384B2 (en) Image reading device
EP0215963A1 (en) Method for and apparatus of line pattern analysis
JPS6159582A (en) Pattern center position determining device
JPS60144886A (en) Post-processing system of character recognizer