JPS5932080A - 文字パタ−ンの認識処理方式 - Google Patents

文字パタ−ンの認識処理方式

Info

Publication number
JPS5932080A
JPS5932080A JP57141884A JP14188482A JPS5932080A JP S5932080 A JPS5932080 A JP S5932080A JP 57141884 A JP57141884 A JP 57141884A JP 14188482 A JP14188482 A JP 14188482A JP S5932080 A JPS5932080 A JP S5932080A
Authority
JP
Japan
Prior art keywords
character
circuit
pattern
candidate
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57141884A
Other languages
English (en)
Inventor
Mikio Shintani
幹夫 新谷
Shinichi Meguro
眞一 目黒
Michio Umeda
梅田 三千雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP57141884A priority Critical patent/JPS5932080A/ja
Publication of JPS5932080A publication Critical patent/JPS5932080A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (1)発明の属する分野の説明 本発明は、単語及び文章を構成する文字パターン列内の
文字パターンに対する、文字パターンの形状特徴及び文
字列に関する言語知識を利用した、認識方式に関するも
のである。
(2)従来の技術の説明 従来の文章入力を対象とした文字認識方式としては、個
々の入力文字パターンに対して、形状物欲を用いた類似
文字の識別を含む認識処理を行ない、然る後に、文字種
の決定が不可能な場合には、当該対象文字を含む前後の
文字列と、予め用意された単語、文法又は意味に関する
辞書との照合を取ることによって入力文字パターンの文
字種を決定する方式が知られている。
しかしながら、かかる認識方式には以下のような欠点が
ある。すなわち、文字パターンの認識処理と言語情報に
よる後処理が別個に行なわれていたため、言語知識によ
って当該文字に対する候補字種が唯一に定まらない場合
には、認識が不可能となっていた。また、類似文字の識
別方式として、例えばパターン間の、形状の差異に基づ
いた識別を行なう場合には、単語又は文章として妥当で
ないにもかかわらず、非常に形状の似た多数の文字種の
組み合せに対して識別処理を行なう必要があり、。
言語知識により候補が絞れるという利点が生かされず、
識別能力が十分発揮されなかった。
(3)発明の目的 本発明は、これらの欠点を除去するため、文字パターン
の大まかな形状特徴による認識処理の後に言語知識を用
いた後処理を行ない、然る処理によっても、未知パター
ンが唯一に決定されない場合には、閾値判定に基づく認
識及びパターン間の細かな形状の差異に基づいた認識処
理を行なうようにしたもので、以下図面について詳細に
説明する。
図は、本発明による文字パターンのgR方式を示す1実
施例である。図において、1は認識すべき未知入力文字
パターン列であり、これを走査して、光電変換回路2に
より、文字パターンの濃淡に比例した電気信号を得る。
この電気信号は2値化回路3において基準値と比較して
、白黒2値の文字パターンに変換され、記憶回路4に記
憶しておく。
5は公知の方式(たとえば特開昭54−34638など
)を実現した分類回路であり、まず入力文字パターンの
特徴量を抽出し、次いで標準パターンと比較・照合する
ことによって、入力文字パターンの各文字種に対する距
離値を算出する。更に、ここで得られた距離値をもとに
、分類結果として、あらかじめ与えられた判定規準を満
足する工ないし複数個の文字種を選び出し、記憶回路6
にスタックする。通常用いられる判定規準としては、以
下のものが知られている。
d(CI)<do  d(Cz)−d(Cx)≧d1(
1)ここに、d(Ci)は文字種Ci  に対する距離
値で、d(CI) r d(Cリフd(Cりく・・・と
する。またdotct、  は定数である。(1)を満
足する文字種が存在するときには、それを認識結果とし
て決定する。しかしく1)を満足する文字sC1が存在
しない場合は、d(Ci)−d(C1)<d2(diは
定数)(II)を満たす複数個の文字1m (Ci )
を、分類結果として記憶回路6にスタックする。
照合回路7は、分類回路5において出力された分類結果
(Ci)の各文字種の中から、前後の認識結果と言語的
に接続し得る文字を、記憶回路8に蓄積された言語知識
と照合することにより選出する。言語知識としては、単
語知識、文法知識、意味知識などが用いられる。この照
合・処理には、以下のような処理が一般的に行なわれる
。ただし、Ai (i=±1.±2.・・・山)は認識
結果であるとスル。各Ct (1=1t  2.・・・
・・・、N)に対して、なるN個の文字列を考える。ま
ず、これらの文字列と、記憶回路8に蓄積されている単
語辞書とを照合する。その結果、対応する単語が存在し
ない文字列は棄却される。
更に、すべての文字が単語と対応する文字列に対しては
、文法知識、意味知識との照合が行なわれる。このとき
文字列は、単語列 ・・・W−2W−1wow1w21・(wi:単語)o
V)として表わすことができる。まず、Ov)の単語列
が、記憶回路8に記憶されている文法に合致した単語列
であるか否かの照合を行なう。次いで、それぞれの単語
の意味的な接続を、意味辞書との照合により行な5場合
もある。
以上の照合処理によりOi+)に示されるN個の文字列
の中から、正しい文章又は単語となる文字列が抽出され
る。この抽出された文字列に対応する文字種Cjを、新
たにi補文字種群(Di)とする。
(Dipが2文字以上を含む場合には、判定回路9にお
いて再び判定処理が行なわれる。すなわち[)i)に対
して、(1)の条件が満たされるか否かを、記憶回路6
に記憶されている距離値を用いて判定する。
判定回路9においても(1)が満足されない場合には、
識別回路10において詳細な識別処理が行なわれる。識
別回路10は、公知の方式(たとえば特願昭55−00
6688 )を実現したパターン間の差異に基づく識別
回路であり、候補文字種群(Di )に対して詳細な識
別を行ない、文字パターンで認識する。
以下に上記動作の例を示す。
例1:未知入力文字パターン列として、「片面」が入力
され、分類回路5において「語」に対する分類結果とし
°C(語、詰、詔2話、記)が出力されたとする。この
とき、照合回路7において単語辞書と照合した結果、“
単語”、“単記”なる文字列が単語となるため、候補文
字種群は、(語、記)の2つに絞られる。分類回路5に
おいては、語”と詰”との距離差が小さいために(1)
が満足されなかったが、”語”、記”間の距離差が太き
ければ、判定回路9において認識される。
例2:未知入力文字パターン列が「解析」であるとする
。「析」に対する分類結果が(析、折、材。
体、祈)であったとする。6解析″”解体″なる単語が
照合され、(析2体)が照合回路7から候補文字種群と
して出力される。判定回路9で規準が満たされない場合
は、識別回路10において、パターンの差異に基づく識
別処理が行なわれる。分類結果すべてに対して識別を行
なう場合には、”析″。
1折”、°゛材″等のバター/の差異が比較的小さい文
字種間の識別処理を含めて行なう必要がある。
しかしながら、識別回路10においては差異が比較的大
きい6析”、゛′体″ 間の識別のみを行なうため、高
精度な認識が可能どなる。
(イ)効果の説明 以上説明したように、本発明による文字パターンの認識
方式においては、分類および言語処理の後に、閾値に基
づく判定処理及び識別処理を行なうため、言語処理であ
いまい性が残る場合でも、精度よく認識を行なうことが
できるという利点がある。また、分類および言語処理に
より十分限定された候補文字種間においてのみ識別処理
を行なうため、分類処理により上げられた候補文字種す
べてに対して識別処理を行なう場合と比較して、識別処
理の処理量が大幅に減少し、効果的な処理が可能となる
という利点−もある。
【図面の簡単な説明】
図は本発明による文字パターンの認識方式の1実施例図
である。図において、1は未知入力文字パターン列、2
は光電変換装置、3は2値化回路、4は記憶回路、5は
分類回路、6は記憶回路、7は照合回路、8は記憶回路
、9は判定回路、10は識別回路、11は認識結果を示
す。 特許出願人  日本電信電話公社 代理人弁理士  森 1)  寛

Claims (1)

    【特許請求の範囲】
  1. 文章を構成する文字パターン列を文字単位で認識する文
    字パターンの認識処理方式において、入力文字パターン
    から抽出した特徴量と標準パターンのそれとの距離値を
    算出し、これに基づいて工ないし複数個の候補文字種を
    選出する第1手段と、第1手段により候補文字を唯一に
    決定できない場合において、前後の文字パターンに対す
    る候補文字種と該候補文字種との言語的接続の可否を、
    単語、文法、意味辞書等の言語知識と照合比較すること
    によって検証し、上記候補文字種群のなかから言語的に
    妥当なもののみに絞る第2手段と、該第2手段によって
    もなお複数の候補文字種が選出される場合において、第
    1手段によって得られた距離値をもとにした該候補文字
    種間の閾値判定により認識を行なう手段及び文字種間の
    パターンの差異に基づいた識別を行なう第3手段とを具
    備することを特徴とする文字パターンの認識処]A。
JP57141884A 1982-08-16 1982-08-16 文字パタ−ンの認識処理方式 Pending JPS5932080A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57141884A JPS5932080A (ja) 1982-08-16 1982-08-16 文字パタ−ンの認識処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57141884A JPS5932080A (ja) 1982-08-16 1982-08-16 文字パタ−ンの認識処理方式

Publications (1)

Publication Number Publication Date
JPS5932080A true JPS5932080A (ja) 1984-02-21

Family

ID=15302398

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57141884A Pending JPS5932080A (ja) 1982-08-16 1982-08-16 文字パタ−ンの認識処理方式

Country Status (1)

Country Link
JP (1) JPS5932080A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61272888A (ja) * 1985-05-28 1986-12-03 Toshiba Corp 単語認識方式
JPS62251986A (ja) * 1986-04-25 1987-11-02 Nippon Telegr & Teleph Corp <Ntt> 誤読文字訂正処理装置
JPS63111590A (ja) * 1986-10-29 1988-05-16 Fujitsu Ltd 文字認識装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61272888A (ja) * 1985-05-28 1986-12-03 Toshiba Corp 単語認識方式
JPS62251986A (ja) * 1986-04-25 1987-11-02 Nippon Telegr & Teleph Corp <Ntt> 誤読文字訂正処理装置
JPS63111590A (ja) * 1986-10-29 1988-05-16 Fujitsu Ltd 文字認識装置

Similar Documents

Publication Publication Date Title
KR100324847B1 (ko) 수신인명 리드장치와 우편물등 구분기 및 문자열 인식방법
US6950555B2 (en) Holistic-analytical recognition of handwritten text
US8015124B2 (en) Method for determining near duplicate data objects
JPH0664631B2 (ja) 文字認識装置
EP0054842A2 (en) Figure recognizing system
KR100291256B1 (ko) 지문카드사전선택방법및장치
JPS62221088A (ja) 光学式文字読取装置
Koga et al. Lexical search approach for character-string recognition
JPS5932080A (ja) 文字パタ−ンの認識処理方式
Chaudhuri et al. OCR error detection and correction of an inflectional indian language script
Ting et al. Business form classification using strings
JP2732593B2 (ja) 文字読取システム
Hirayama et al. Development of template-free form recognition system
JPS59161787A (ja) 文字パタ−ンの認識処理方式
Trenkle et al. Disambiguation and spelling correction for a neural network based character recognition system
JPH0795337B2 (ja) 単語認識方式
Akiyama et al. Handwritten address interpretation system allowing for non-use of postal codes and omission of address elements
Peng et al. Text separation from mixed documents using a tree-structured classifier
JPH07105321A (ja) 単語認識装置、住所認識装置及び単語認識方法
JPS61148585A (ja) 文字認識装置
CN121234907A (zh) 基于关键词的日志解析方法及系统
Lee et al. A novel fusion of holistic and analytical paradigms for the recognition of handwritten address fields
Kim et al. Post-processing scheme for improving recognition performance of touching handwritten numeral strings
Vogt et al. Neural Network Recognition of Machine-Printed Characters
Amin Structural Description to Recognising Arabie Characters Using Decision Tree Learning Techniques