JPS5932080A - 文字パタ−ンの認識処理方式 - Google Patents
文字パタ−ンの認識処理方式Info
- Publication number
- JPS5932080A JPS5932080A JP57141884A JP14188482A JPS5932080A JP S5932080 A JPS5932080 A JP S5932080A JP 57141884 A JP57141884 A JP 57141884A JP 14188482 A JP14188482 A JP 14188482A JP S5932080 A JPS5932080 A JP S5932080A
- Authority
- JP
- Japan
- Prior art keywords
- character
- circuit
- pattern
- candidate
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(1)発明の属する分野の説明
本発明は、単語及び文章を構成する文字パターン列内の
文字パターンに対する、文字パターンの形状特徴及び文
字列に関する言語知識を利用した、認識方式に関するも
のである。
文字パターンに対する、文字パターンの形状特徴及び文
字列に関する言語知識を利用した、認識方式に関するも
のである。
(2)従来の技術の説明
従来の文章入力を対象とした文字認識方式としては、個
々の入力文字パターンに対して、形状物欲を用いた類似
文字の識別を含む認識処理を行ない、然る後に、文字種
の決定が不可能な場合には、当該対象文字を含む前後の
文字列と、予め用意された単語、文法又は意味に関する
辞書との照合を取ることによって入力文字パターンの文
字種を決定する方式が知られている。
々の入力文字パターンに対して、形状物欲を用いた類似
文字の識別を含む認識処理を行ない、然る後に、文字種
の決定が不可能な場合には、当該対象文字を含む前後の
文字列と、予め用意された単語、文法又は意味に関する
辞書との照合を取ることによって入力文字パターンの文
字種を決定する方式が知られている。
しかしながら、かかる認識方式には以下のような欠点が
ある。すなわち、文字パターンの認識処理と言語情報に
よる後処理が別個に行なわれていたため、言語知識によ
って当該文字に対する候補字種が唯一に定まらない場合
には、認識が不可能となっていた。また、類似文字の識
別方式として、例えばパターン間の、形状の差異に基づ
いた識別を行なう場合には、単語又は文章として妥当で
ないにもかかわらず、非常に形状の似た多数の文字種の
組み合せに対して識別処理を行なう必要があり、。
ある。すなわち、文字パターンの認識処理と言語情報に
よる後処理が別個に行なわれていたため、言語知識によ
って当該文字に対する候補字種が唯一に定まらない場合
には、認識が不可能となっていた。また、類似文字の識
別方式として、例えばパターン間の、形状の差異に基づ
いた識別を行なう場合には、単語又は文章として妥当で
ないにもかかわらず、非常に形状の似た多数の文字種の
組み合せに対して識別処理を行なう必要があり、。
言語知識により候補が絞れるという利点が生かされず、
識別能力が十分発揮されなかった。
識別能力が十分発揮されなかった。
(3)発明の目的
本発明は、これらの欠点を除去するため、文字パターン
の大まかな形状特徴による認識処理の後に言語知識を用
いた後処理を行ない、然る処理によっても、未知パター
ンが唯一に決定されない場合には、閾値判定に基づく認
識及びパターン間の細かな形状の差異に基づいた認識処
理を行なうようにしたもので、以下図面について詳細に
説明する。
の大まかな形状特徴による認識処理の後に言語知識を用
いた後処理を行ない、然る処理によっても、未知パター
ンが唯一に決定されない場合には、閾値判定に基づく認
識及びパターン間の細かな形状の差異に基づいた認識処
理を行なうようにしたもので、以下図面について詳細に
説明する。
図は、本発明による文字パターンのgR方式を示す1実
施例である。図において、1は認識すべき未知入力文字
パターン列であり、これを走査して、光電変換回路2に
より、文字パターンの濃淡に比例した電気信号を得る。
施例である。図において、1は認識すべき未知入力文字
パターン列であり、これを走査して、光電変換回路2に
より、文字パターンの濃淡に比例した電気信号を得る。
この電気信号は2値化回路3において基準値と比較して
、白黒2値の文字パターンに変換され、記憶回路4に記
憶しておく。
、白黒2値の文字パターンに変換され、記憶回路4に記
憶しておく。
5は公知の方式(たとえば特開昭54−34638など
)を実現した分類回路であり、まず入力文字パターンの
特徴量を抽出し、次いで標準パターンと比較・照合する
ことによって、入力文字パターンの各文字種に対する距
離値を算出する。更に、ここで得られた距離値をもとに
、分類結果として、あらかじめ与えられた判定規準を満
足する工ないし複数個の文字種を選び出し、記憶回路6
にスタックする。通常用いられる判定規準としては、以
下のものが知られている。
)を実現した分類回路であり、まず入力文字パターンの
特徴量を抽出し、次いで標準パターンと比較・照合する
ことによって、入力文字パターンの各文字種に対する距
離値を算出する。更に、ここで得られた距離値をもとに
、分類結果として、あらかじめ与えられた判定規準を満
足する工ないし複数個の文字種を選び出し、記憶回路6
にスタックする。通常用いられる判定規準としては、以
下のものが知られている。
d(CI)<do d(Cz)−d(Cx)≧d1(
1)ここに、d(Ci)は文字種Ci に対する距離
値で、d(CI) r d(Cリフd(Cりく・・・と
する。またdotct、 は定数である。(1)を満
足する文字種が存在するときには、それを認識結果とし
て決定する。しかしく1)を満足する文字sC1が存在
しない場合は、d(Ci)−d(C1)<d2(diは
定数)(II)を満たす複数個の文字1m (Ci )
を、分類結果として記憶回路6にスタックする。
1)ここに、d(Ci)は文字種Ci に対する距離
値で、d(CI) r d(Cリフd(Cりく・・・と
する。またdotct、 は定数である。(1)を満
足する文字種が存在するときには、それを認識結果とし
て決定する。しかしく1)を満足する文字sC1が存在
しない場合は、d(Ci)−d(C1)<d2(diは
定数)(II)を満たす複数個の文字1m (Ci )
を、分類結果として記憶回路6にスタックする。
照合回路7は、分類回路5において出力された分類結果
(Ci)の各文字種の中から、前後の認識結果と言語的
に接続し得る文字を、記憶回路8に蓄積された言語知識
と照合することにより選出する。言語知識としては、単
語知識、文法知識、意味知識などが用いられる。この照
合・処理には、以下のような処理が一般的に行なわれる
。ただし、Ai (i=±1.±2.・・・山)は認識
結果であるとスル。各Ct (1=1t 2.・・・
・・・、N)に対して、なるN個の文字列を考える。ま
ず、これらの文字列と、記憶回路8に蓄積されている単
語辞書とを照合する。その結果、対応する単語が存在し
ない文字列は棄却される。
(Ci)の各文字種の中から、前後の認識結果と言語的
に接続し得る文字を、記憶回路8に蓄積された言語知識
と照合することにより選出する。言語知識としては、単
語知識、文法知識、意味知識などが用いられる。この照
合・処理には、以下のような処理が一般的に行なわれる
。ただし、Ai (i=±1.±2.・・・山)は認識
結果であるとスル。各Ct (1=1t 2.・・・
・・・、N)に対して、なるN個の文字列を考える。ま
ず、これらの文字列と、記憶回路8に蓄積されている単
語辞書とを照合する。その結果、対応する単語が存在し
ない文字列は棄却される。
更に、すべての文字が単語と対応する文字列に対しては
、文法知識、意味知識との照合が行なわれる。このとき
文字列は、単語列 ・・・W−2W−1wow1w21・(wi:単語)o
V)として表わすことができる。まず、Ov)の単語列
が、記憶回路8に記憶されている文法に合致した単語列
であるか否かの照合を行なう。次いで、それぞれの単語
の意味的な接続を、意味辞書との照合により行な5場合
もある。
、文法知識、意味知識との照合が行なわれる。このとき
文字列は、単語列 ・・・W−2W−1wow1w21・(wi:単語)o
V)として表わすことができる。まず、Ov)の単語列
が、記憶回路8に記憶されている文法に合致した単語列
であるか否かの照合を行なう。次いで、それぞれの単語
の意味的な接続を、意味辞書との照合により行な5場合
もある。
以上の照合処理によりOi+)に示されるN個の文字列
の中から、正しい文章又は単語となる文字列が抽出され
る。この抽出された文字列に対応する文字種Cjを、新
たにi補文字種群(Di)とする。
の中から、正しい文章又は単語となる文字列が抽出され
る。この抽出された文字列に対応する文字種Cjを、新
たにi補文字種群(Di)とする。
(Dipが2文字以上を含む場合には、判定回路9にお
いて再び判定処理が行なわれる。すなわち[)i)に対
して、(1)の条件が満たされるか否かを、記憶回路6
に記憶されている距離値を用いて判定する。
いて再び判定処理が行なわれる。すなわち[)i)に対
して、(1)の条件が満たされるか否かを、記憶回路6
に記憶されている距離値を用いて判定する。
判定回路9においても(1)が満足されない場合には、
識別回路10において詳細な識別処理が行なわれる。識
別回路10は、公知の方式(たとえば特願昭55−00
6688 )を実現したパターン間の差異に基づく識別
回路であり、候補文字種群(Di )に対して詳細な識
別を行ない、文字パターンで認識する。
識別回路10において詳細な識別処理が行なわれる。識
別回路10は、公知の方式(たとえば特願昭55−00
6688 )を実現したパターン間の差異に基づく識別
回路であり、候補文字種群(Di )に対して詳細な識
別を行ない、文字パターンで認識する。
以下に上記動作の例を示す。
例1:未知入力文字パターン列として、「片面」が入力
され、分類回路5において「語」に対する分類結果とし
°C(語、詰、詔2話、記)が出力されたとする。この
とき、照合回路7において単語辞書と照合した結果、“
単語”、“単記”なる文字列が単語となるため、候補文
字種群は、(語、記)の2つに絞られる。分類回路5に
おいては、語”と詰”との距離差が小さいために(1)
が満足されなかったが、”語”、記”間の距離差が太き
ければ、判定回路9において認識される。
され、分類回路5において「語」に対する分類結果とし
°C(語、詰、詔2話、記)が出力されたとする。この
とき、照合回路7において単語辞書と照合した結果、“
単語”、“単記”なる文字列が単語となるため、候補文
字種群は、(語、記)の2つに絞られる。分類回路5に
おいては、語”と詰”との距離差が小さいために(1)
が満足されなかったが、”語”、記”間の距離差が太き
ければ、判定回路9において認識される。
例2:未知入力文字パターン列が「解析」であるとする
。「析」に対する分類結果が(析、折、材。
。「析」に対する分類結果が(析、折、材。
体、祈)であったとする。6解析″”解体″なる単語が
照合され、(析2体)が照合回路7から候補文字種群と
して出力される。判定回路9で規準が満たされない場合
は、識別回路10において、パターンの差異に基づく識
別処理が行なわれる。分類結果すべてに対して識別を行
なう場合には、”析″。
照合され、(析2体)が照合回路7から候補文字種群と
して出力される。判定回路9で規準が満たされない場合
は、識別回路10において、パターンの差異に基づく識
別処理が行なわれる。分類結果すべてに対して識別を行
なう場合には、”析″。
1折”、°゛材″等のバター/の差異が比較的小さい文
字種間の識別処理を含めて行なう必要がある。
字種間の識別処理を含めて行なう必要がある。
しかしながら、識別回路10においては差異が比較的大
きい6析”、゛′体″ 間の識別のみを行なうため、高
精度な認識が可能どなる。
きい6析”、゛′体″ 間の識別のみを行なうため、高
精度な認識が可能どなる。
(イ)効果の説明
以上説明したように、本発明による文字パターンの認識
方式においては、分類および言語処理の後に、閾値に基
づく判定処理及び識別処理を行なうため、言語処理であ
いまい性が残る場合でも、精度よく認識を行なうことが
できるという利点がある。また、分類および言語処理に
より十分限定された候補文字種間においてのみ識別処理
を行なうため、分類処理により上げられた候補文字種す
べてに対して識別処理を行なう場合と比較して、識別処
理の処理量が大幅に減少し、効果的な処理が可能となる
という利点−もある。
方式においては、分類および言語処理の後に、閾値に基
づく判定処理及び識別処理を行なうため、言語処理であ
いまい性が残る場合でも、精度よく認識を行なうことが
できるという利点がある。また、分類および言語処理に
より十分限定された候補文字種間においてのみ識別処理
を行なうため、分類処理により上げられた候補文字種す
べてに対して識別処理を行なう場合と比較して、識別処
理の処理量が大幅に減少し、効果的な処理が可能となる
という利点−もある。
図は本発明による文字パターンの認識方式の1実施例図
である。図において、1は未知入力文字パターン列、2
は光電変換装置、3は2値化回路、4は記憶回路、5は
分類回路、6は記憶回路、7は照合回路、8は記憶回路
、9は判定回路、10は識別回路、11は認識結果を示
す。 特許出願人 日本電信電話公社 代理人弁理士 森 1) 寛
である。図において、1は未知入力文字パターン列、2
は光電変換装置、3は2値化回路、4は記憶回路、5は
分類回路、6は記憶回路、7は照合回路、8は記憶回路
、9は判定回路、10は識別回路、11は認識結果を示
す。 特許出願人 日本電信電話公社 代理人弁理士 森 1) 寛
Claims (1)
- 文章を構成する文字パターン列を文字単位で認識する文
字パターンの認識処理方式において、入力文字パターン
から抽出した特徴量と標準パターンのそれとの距離値を
算出し、これに基づいて工ないし複数個の候補文字種を
選出する第1手段と、第1手段により候補文字を唯一に
決定できない場合において、前後の文字パターンに対す
る候補文字種と該候補文字種との言語的接続の可否を、
単語、文法、意味辞書等の言語知識と照合比較すること
によって検証し、上記候補文字種群のなかから言語的に
妥当なもののみに絞る第2手段と、該第2手段によって
もなお複数の候補文字種が選出される場合において、第
1手段によって得られた距離値をもとにした該候補文字
種間の閾値判定により認識を行なう手段及び文字種間の
パターンの差異に基づいた識別を行なう第3手段とを具
備することを特徴とする文字パターンの認識処]A。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57141884A JPS5932080A (ja) | 1982-08-16 | 1982-08-16 | 文字パタ−ンの認識処理方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57141884A JPS5932080A (ja) | 1982-08-16 | 1982-08-16 | 文字パタ−ンの認識処理方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS5932080A true JPS5932080A (ja) | 1984-02-21 |
Family
ID=15302398
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57141884A Pending JPS5932080A (ja) | 1982-08-16 | 1982-08-16 | 文字パタ−ンの認識処理方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5932080A (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS61272888A (ja) * | 1985-05-28 | 1986-12-03 | Toshiba Corp | 単語認識方式 |
| JPS62251986A (ja) * | 1986-04-25 | 1987-11-02 | Nippon Telegr & Teleph Corp <Ntt> | 誤読文字訂正処理装置 |
| JPS63111590A (ja) * | 1986-10-29 | 1988-05-16 | Fujitsu Ltd | 文字認識装置 |
-
1982
- 1982-08-16 JP JP57141884A patent/JPS5932080A/ja active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS61272888A (ja) * | 1985-05-28 | 1986-12-03 | Toshiba Corp | 単語認識方式 |
| JPS62251986A (ja) * | 1986-04-25 | 1987-11-02 | Nippon Telegr & Teleph Corp <Ntt> | 誤読文字訂正処理装置 |
| JPS63111590A (ja) * | 1986-10-29 | 1988-05-16 | Fujitsu Ltd | 文字認識装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR100324847B1 (ko) | 수신인명 리드장치와 우편물등 구분기 및 문자열 인식방법 | |
| US6950555B2 (en) | Holistic-analytical recognition of handwritten text | |
| US8015124B2 (en) | Method for determining near duplicate data objects | |
| JPH0664631B2 (ja) | 文字認識装置 | |
| EP0054842A2 (en) | Figure recognizing system | |
| KR100291256B1 (ko) | 지문카드사전선택방법및장치 | |
| JPS62221088A (ja) | 光学式文字読取装置 | |
| Koga et al. | Lexical search approach for character-string recognition | |
| JPS5932080A (ja) | 文字パタ−ンの認識処理方式 | |
| Chaudhuri et al. | OCR error detection and correction of an inflectional indian language script | |
| Ting et al. | Business form classification using strings | |
| JP2732593B2 (ja) | 文字読取システム | |
| Hirayama et al. | Development of template-free form recognition system | |
| JPS59161787A (ja) | 文字パタ−ンの認識処理方式 | |
| Trenkle et al. | Disambiguation and spelling correction for a neural network based character recognition system | |
| JPH0795337B2 (ja) | 単語認識方式 | |
| Akiyama et al. | Handwritten address interpretation system allowing for non-use of postal codes and omission of address elements | |
| Peng et al. | Text separation from mixed documents using a tree-structured classifier | |
| JPH07105321A (ja) | 単語認識装置、住所認識装置及び単語認識方法 | |
| JPS61148585A (ja) | 文字認識装置 | |
| CN121234907A (zh) | 基于关键词的日志解析方法及系统 | |
| Lee et al. | A novel fusion of holistic and analytical paradigms for the recognition of handwritten address fields | |
| Kim et al. | Post-processing scheme for improving recognition performance of touching handwritten numeral strings | |
| Vogt et al. | Neural Network Recognition of Machine-Printed Characters | |
| Amin | Structural Description to Recognising Arabie Characters Using Decision Tree Learning Techniques |