JPH0135384B2 - - Google Patents
Info
- Publication number
- JPH0135384B2 JPH0135384B2 JP56057557A JP5755781A JPH0135384B2 JP H0135384 B2 JPH0135384 B2 JP H0135384B2 JP 56057557 A JP56057557 A JP 56057557A JP 5755781 A JP5755781 A JP 5755781A JP H0135384 B2 JPH0135384 B2 JP H0135384B2
- Authority
- JP
- Japan
- Prior art keywords
- projection
- value
- character
- pitch
- circuit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Description
【発明の詳細な説明】
この発明は、特に自由なフオーマツトの文章等
の読取りを行なう光学的文字読取装置に用いられ
るピツチ抽出回路に関する。
の読取りを行なう光学的文字読取装置に用いられ
るピツチ抽出回路に関する。
従来、特に文章の読取りを行なう光学的文字読
取装置(以下OCRという)では、文字ピツチを
予め指定するフオーマツトコントロール方式が使
用しにくいため、OCR自身で文字ピツチを抽出
する必要があつた。ところで、音声の認識におい
ても、音声の基本周期を正確に抽出することは、
極めて重要である。その抽出方法として自己相関
法等が開発されており、それなりの効果を上げて
いるのは周知のことである。また音声認識におい
て基本周期を抽出することと、OCRにおいて1
文字づつ文字を切り出す(以下検切りするとい
う)ことは対応関係にあり、どちらも必要不可欠
な技術である。
取装置(以下OCRという)では、文字ピツチを
予め指定するフオーマツトコントロール方式が使
用しにくいため、OCR自身で文字ピツチを抽出
する必要があつた。ところで、音声の認識におい
ても、音声の基本周期を正確に抽出することは、
極めて重要である。その抽出方法として自己相関
法等が開発されており、それなりの効果を上げて
いるのは周知のことである。また音声認識におい
て基本周期を抽出することと、OCRにおいて1
文字づつ文字を切り出す(以下検切りするとい
う)ことは対応関係にあり、どちらも必要不可欠
な技術である。
文字認識の場合には、文字間余白を使つてかな
り高精度に文字ピツチを抽出することも可能であ
るが、雑音、分離文字等の対処のため文字ピツチ
抽出のためのアルゴリズムが複雑となり、精度を
充分上げることができないという欠点があつた。
り高精度に文字ピツチを抽出することも可能であ
るが、雑音、分離文字等の対処のため文字ピツチ
抽出のためのアルゴリズムが複雑となり、精度を
充分上げることができないという欠点があつた。
この発明は上記のような事情に鑑みてなされた
もので、帳票に記入された自由フオーマツトの文
章等から文字ピツチ等のピツチを比較的簡単にか
つある程度精度よく抽出することができる光学的
文字読取装置に用いられるピツチ抽出回路を提供
することを目的とする。
もので、帳票に記入された自由フオーマツトの文
章等から文字ピツチ等のピツチを比較的簡単にか
つある程度精度よく抽出することができる光学的
文字読取装置に用いられるピツチ抽出回路を提供
することを目的とする。
以下、図面を参照してこの発明の実施例を説明
する。第1図は、この発明の一実施例のピツチ抽
出回路を含む概略構成図である、図中、1は光電
変換部で、文字等の記入された読取帳票上を光学
的に走査し、帳票表面からの反射光を電気信号に
変換する機能を持つている。2はA/D(アナロ
グ/デジタル)変換器で、光電変換部1から送ら
れてきたアナログ電気信号を多値のデジタル信号
に変換する機能を持つている。3はラインバツフ
アで、A/D変換器2から送られてきた多値デジ
タル信号を帳票の1行分記憶する機能を持つてい
る。すなわち、このラインバツフア3には、帳票
1行分の多値量子化されたパターン列が記憶され
るようになつている。4は射影回路で、ラインバ
ツフア3に記憶された1行分の多値量子化パター
ン列の縦方向(Y方向)の多値の射影値を抽出
し、射影値P(x)として記憶する機能を持つて
いる。5は自己相関器で、射影回路4で求められ
た射影値P(x)の自己相関関数φ(τ)を計算す
る機能を持つている。6はピーク検出回路で、自
己相関器5で求められた自己相関関数φ(τ)の
ピークを検出し、基本周期(ピツチ)を求めると
ともに、そのピーク値が文字ピツチとして妥当な
範囲にあるか等をチエツクして、最終的なピツチ
情報を出力する機能を持つている。このピツチ情
報は、図示せぬ検切部に上記ラインバツフア3に
記憶された多値量子化されたパターン列を1文字
単位のパターンに検切りするための情報として供
給されるようになつている。
する。第1図は、この発明の一実施例のピツチ抽
出回路を含む概略構成図である、図中、1は光電
変換部で、文字等の記入された読取帳票上を光学
的に走査し、帳票表面からの反射光を電気信号に
変換する機能を持つている。2はA/D(アナロ
グ/デジタル)変換器で、光電変換部1から送ら
れてきたアナログ電気信号を多値のデジタル信号
に変換する機能を持つている。3はラインバツフ
アで、A/D変換器2から送られてきた多値デジ
タル信号を帳票の1行分記憶する機能を持つてい
る。すなわち、このラインバツフア3には、帳票
1行分の多値量子化されたパターン列が記憶され
るようになつている。4は射影回路で、ラインバ
ツフア3に記憶された1行分の多値量子化パター
ン列の縦方向(Y方向)の多値の射影値を抽出
し、射影値P(x)として記憶する機能を持つて
いる。5は自己相関器で、射影回路4で求められ
た射影値P(x)の自己相関関数φ(τ)を計算す
る機能を持つている。6はピーク検出回路で、自
己相関器5で求められた自己相関関数φ(τ)の
ピークを検出し、基本周期(ピツチ)を求めると
ともに、そのピーク値が文字ピツチとして妥当な
範囲にあるか等をチエツクして、最終的なピツチ
情報を出力する機能を持つている。このピツチ情
報は、図示せぬ検切部に上記ラインバツフア3に
記憶された多値量子化されたパターン列を1文字
単位のパターンに検切りするための情報として供
給されるようになつている。
次に、上記実施例の動作を説明する。例えば第
2図に示すような文字の記入された帳票CHは光
電変換部1で走査される。そして、例えば帳票の
1行目に記入された文字列は、光電変換され、多
値量子化されて、多値量子化された文字パターン
列としてラインバツフア3に第3図に示すように
記憶される。第3図に示すように記憶された文字
パターン列は、射影回路4で、第4図に示すよう
に、縦方向(Y方向)の多値射影値が抽出され
る。このとき、そのY方向で最も量子化レベルの
高い値をその射影値とする。そして、X方向に対
する各射影値をP(x)として記憶する。なお、
精度を要求しない場合は、多値射影でなく2値の
射影で代用してもよい。また、スキヤン間隔は通
常0.1mm程度にとればよい。
2図に示すような文字の記入された帳票CHは光
電変換部1で走査される。そして、例えば帳票の
1行目に記入された文字列は、光電変換され、多
値量子化されて、多値量子化された文字パターン
列としてラインバツフア3に第3図に示すように
記憶される。第3図に示すように記憶された文字
パターン列は、射影回路4で、第4図に示すよう
に、縦方向(Y方向)の多値射影値が抽出され
る。このとき、そのY方向で最も量子化レベルの
高い値をその射影値とする。そして、X方向に対
する各射影値をP(x)として記憶する。なお、
精度を要求しない場合は、多値射影でなく2値の
射影で代用してもよい。また、スキヤン間隔は通
常0.1mm程度にとればよい。
射影回路4で求められた射影値P(x)に対す
る自己相関関数φ(τ)が自己相関器5で求めら
れる。この自己相関関数φ(τ)は、射影値P
(x)に対して次式で定義される。
る自己相関関数φ(τ)が自己相関器5で求めら
れる。この自己相関関数φ(τ)は、射影値P
(x)に対して次式で定義される。
φ(τ)=
lim
T→∞1/2T∫T -TP(x)P(x+τ)dx
射影値P(x)は、実際には離散値であり、分析
区間もラインバツフア3以内であるので、簡単な
自己相関数器5で射影値P(x)に対する自己相
関関数φ(τ)を求めることができる。
区間もラインバツフア3以内であるので、簡単な
自己相関数器5で射影値P(x)に対する自己相
関関数φ(τ)を求めることができる。
そして、ピーク検出回路6において、自己相関
器5で求められた自己相関関数φ(τ)から、ピ
ークを検出し、検出されたピークが文字のピツチ
として妥当な範囲であるか等のチエツクをした
後、最終的なピツチ情報が図示せぬ検切部に出力
される。このピーク検出回路6におけるピーク検
出の際には、擬似ピークとの分離が重要となる。
例えば、音声におけるピツチ抽出の際には、音声
波形P(t)が第5図Aに示すようになつていた
場合、その自己相関関数φ(τ)は第5図Bに示
すようになる。この音声波形の自己相関関数φ
(τ)には、基本周期に対応するピークPaの他
に、ホルマント情報に対応する擬似ピークPbが
現われる。これは基本周期にコンボルート(重
量)されたホルマント情報が、擬似ピークとして
大きな値をもつためである。音声の場合にはこの
擬似ピークが誤検出の原因となるが、文字の場合
には、ホルマントに相当する周波数成分を持たな
いため誤検出の可能性は少ない。また、ピーク値
から文字ピツチの乱れをある程度推定できるため
検切部に対して有効な情報を与えることができ
る。
器5で求められた自己相関関数φ(τ)から、ピ
ークを検出し、検出されたピークが文字のピツチ
として妥当な範囲であるか等のチエツクをした
後、最終的なピツチ情報が図示せぬ検切部に出力
される。このピーク検出回路6におけるピーク検
出の際には、擬似ピークとの分離が重要となる。
例えば、音声におけるピツチ抽出の際には、音声
波形P(t)が第5図Aに示すようになつていた
場合、その自己相関関数φ(τ)は第5図Bに示
すようになる。この音声波形の自己相関関数φ
(τ)には、基本周期に対応するピークPaの他
に、ホルマント情報に対応する擬似ピークPbが
現われる。これは基本周期にコンボルート(重
量)されたホルマント情報が、擬似ピークとして
大きな値をもつためである。音声の場合にはこの
擬似ピークが誤検出の原因となるが、文字の場合
には、ホルマントに相当する周波数成分を持たな
いため誤検出の可能性は少ない。また、ピーク値
から文字ピツチの乱れをある程度推定できるため
検切部に対して有効な情報を与えることができ
る。
なお、英国文章の場合は、単語間の空白はかな
り正確にとられているため、単語毎にピツチを抽
出することもできる。
り正確にとられているため、単語毎にピツチを抽
出することもできる。
また、上記実施例では自己相関器5を用いて自
己相関関数φ(τ)を求めるようにしたが、高速
フーリエ変換回路を用いて周波数パワースペクト
ルP(w)を求め、その逆変換として自己相関関
数φ(τ)を求めるようにしてもよい。この場合、
音声認識あるいは合成装置とOCRを組み合わせ
た装置では、高速フーリエ変換回路を音声認識あ
るいは合成装置とOCRに共通に使用できるとい
うメリツトが出てくる。
己相関関数φ(τ)を求めるようにしたが、高速
フーリエ変換回路を用いて周波数パワースペクト
ルP(w)を求め、その逆変換として自己相関関
数φ(τ)を求めるようにしてもよい。この場合、
音声認識あるいは合成装置とOCRを組み合わせ
た装置では、高速フーリエ変換回路を音声認識あ
るいは合成装置とOCRに共通に使用できるとい
うメリツトが出てくる。
さらに、第6図に示すように、ラインバツフア
3に取り込まれた文字パターン間が、ゴーストg
等によりつながつてしまつたために、文字ピツチ
抽出のために誤差を生じることがある。そのた
め、射影回路4で射影値P(x)を求める際に、
上記実施例ではその縦方向(Y方向)で最も高い
射影値を射影値P(x)としたが、第7図に示す
ように、その縦方向における射影値の累積した値
を累積射影値P(x)とすれば、第7図に示すよ
うにゴーストによる影響部分hは相対的に小さく
なり、誤差を小さくすることができる。また、第
6図に示すように、文字パターンの縦方向に射影
をとる際に、黒−白−黒の部分は、黒−黒−黒に
すれば、さらにゴーストスによる影響部分hを相
対的に小さくすることができ、効果的である。
3に取り込まれた文字パターン間が、ゴーストg
等によりつながつてしまつたために、文字ピツチ
抽出のために誤差を生じることがある。そのた
め、射影回路4で射影値P(x)を求める際に、
上記実施例ではその縦方向(Y方向)で最も高い
射影値を射影値P(x)としたが、第7図に示す
ように、その縦方向における射影値の累積した値
を累積射影値P(x)とすれば、第7図に示すよ
うにゴーストによる影響部分hは相対的に小さく
なり、誤差を小さくすることができる。また、第
6図に示すように、文字パターンの縦方向に射影
をとる際に、黒−白−黒の部分は、黒−黒−黒に
すれば、さらにゴーストスによる影響部分hを相
対的に小さくすることができ、効果的である。
したがつて、このようなピツチ抽出回路では、
複雑なアルゴリズムを作成する必要がなく、比較
的簡単な回路の追加で文字ピツチを比較的精度よ
検出でき、特に文章の読取りを行なうOCRにお
いてピツチ情報を有効に与えることができる。な
お、帳票に記入される文字は活字でも書きでもよ
い。また、数字、ひらがな、漢字、図形等規則正
しく並んだものに対して有効であるが、並びの悪
いものはそれなりの情報を検切部に与えることが
できるので、検切り精度の向上につながる。
複雑なアルゴリズムを作成する必要がなく、比較
的簡単な回路の追加で文字ピツチを比較的精度よ
検出でき、特に文章の読取りを行なうOCRにお
いてピツチ情報を有効に与えることができる。な
お、帳票に記入される文字は活字でも書きでもよ
い。また、数字、ひらがな、漢字、図形等規則正
しく並んだものに対して有効であるが、並びの悪
いものはそれなりの情報を検切部に与えることが
できるので、検切り精度の向上につながる。
以上述べたようにこの発明によれば、帳票に記
入された自由フオーマツトの文章等から文字ピツ
チ等のピツチを比較的簡単にかつある程度精度よ
抽出することができる光学的文字読取装置に用い
られるピツチ抽出回路を提供することができる。
入された自由フオーマツトの文章等から文字ピツ
チ等のピツチを比較的簡単にかつある程度精度よ
抽出することができる光学的文字読取装置に用い
られるピツチ抽出回路を提供することができる。
第1図はこの発明の一実施例の概略構成図、第
2図は帳票の記入例を示す図、第3図はラインバ
ツフアに取り込まれた文字パターン列の様子を示
す図、第4図は第3図の文字パターン列の多値射
影を示す図、第5図Aは音声波形を示す図、第5
図Bは上記音声波に対する自己相関関数を示す
図、第6図はゴーストの影響のある文字パターン
列を示す図、第7図は第6図に示した文字パター
ン列の累積射影値を示す図である。 1……光電変換部、2……A/D変換器、3…
…ラインバツフア、4……射影回路、5……自己
相関器、6……ピーク検出回路。
2図は帳票の記入例を示す図、第3図はラインバ
ツフアに取り込まれた文字パターン列の様子を示
す図、第4図は第3図の文字パターン列の多値射
影を示す図、第5図Aは音声波形を示す図、第5
図Bは上記音声波に対する自己相関関数を示す
図、第6図はゴーストの影響のある文字パターン
列を示す図、第7図は第6図に示した文字パター
ン列の累積射影値を示す図である。 1……光電変換部、2……A/D変換器、3…
…ラインバツフア、4……射影回路、5……自己
相関器、6……ピーク検出回路。
Claims (1)
- 1 帳票に記入された文字あるいは図形を量子化
パターンとする光電変換手段と、上記帳票1行分
の量子化パターンを記憶する記憶部と、この記憶
部に記憶された1行分の量子化パターンの縦方向
射影をとる射影回路と、この射影回路で求められ
た射影値から自己相関関数を算出する回路と、上
記算出された自己相関関数のピークを検出するこ
とに基づきピツチ情報を出力するピーク検出回路
とを具備したことを特徴とするピツチ抽出回路。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56057557A JPS57172483A (en) | 1981-04-16 | 1981-04-16 | Pitch extracting circuit |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56057557A JPS57172483A (en) | 1981-04-16 | 1981-04-16 | Pitch extracting circuit |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS57172483A JPS57172483A (en) | 1982-10-23 |
| JPH0135384B2 true JPH0135384B2 (ja) | 1989-07-25 |
Family
ID=13059110
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP56057557A Granted JPS57172483A (en) | 1981-04-16 | 1981-04-16 | Pitch extracting circuit |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS57172483A (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS63304388A (ja) * | 1987-06-05 | 1988-12-12 | Canon Inc | ピツチ検出装置 |
| JPH04133546U (ja) * | 1991-05-29 | 1992-12-11 | 安藤電気株式会社 | 工具格納機構 |
-
1981
- 1981-04-16 JP JP56057557A patent/JPS57172483A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS57172483A (en) | 1982-10-23 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3139521B2 (ja) | 自動言語決定装置 | |
| JPH0135384B2 (ja) | ||
| JP2618005B2 (ja) | 復号方法 | |
| KR880001082A (ko) | 레이저 기록 과정에서의 시스템 동작 정밀도 증진 방법 및 장치 | |
| JPH0131236B2 (ja) | ||
| JP3095437B2 (ja) | 文字行検出切出装置および文字読取装置 | |
| JPH0135386B2 (ja) | ||
| JP2576370B2 (ja) | Idマーク読み取り装置 | |
| JPH0325690A (ja) | バーコードリーダの信号処理方法 | |
| JP2590099B2 (ja) | 文字読取方式 | |
| JPS6095689A (ja) | 光学的文字読取装置 | |
| JPS6111886A (ja) | 文字認識方式 | |
| KR910007032B1 (ko) | 한글 문서 인식장치의 문자열과 개별문자 절출방법 | |
| JPS6311717B2 (ja) | ||
| JPH0677270B2 (ja) | 文字認識装置 | |
| JP2504373B2 (ja) | 文字認識装置 | |
| JPS63178376A (ja) | バ−コ−ドパタ−ン認識装置 | |
| JP2812705B2 (ja) | 文字切出し装置 | |
| KR920003910B1 (ko) | 문자/문서 인식시스템 | |
| JP2812704B2 (ja) | 文字切出し装置 | |
| JP2630384B2 (ja) | 画像読取装置 | |
| EP0215963A1 (en) | Method for and apparatus of line pattern analysis | |
| JPS6159582A (ja) | 図形中心位置決定装置 | |
| JPS60144886A (ja) | 文字認識装置における後処理方式 | |
| JPS5914078A (ja) | 帳票読取装置 |