JPH04148294A - 文字認識方式 - Google Patents

文字認識方式

Info

Publication number
JPH04148294A
JPH04148294A JP2269932A JP26993290A JPH04148294A JP H04148294 A JPH04148294 A JP H04148294A JP 2269932 A JP2269932 A JP 2269932A JP 26993290 A JP26993290 A JP 26993290A JP H04148294 A JPH04148294 A JP H04148294A
Authority
JP
Japan
Prior art keywords
pattern
representative
character
unknown
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2269932A
Other languages
English (en)
Inventor
Osamu Sato
理 佐藤
Kenichiro Inoue
健一郎 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2269932A priority Critical patent/JPH04148294A/ja
Publication of JPH04148294A publication Critical patent/JPH04148294A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [概要] 文字認識を行うための文字認識方式に関し、未知パター
ンの数を減らすことで、さらに高速に文字認識を行うこ
とができる文字認識方式を提供することを目的とし、 入力される未知文字の未知パターンを文字認識部で認識
を行い、認識辞書の辞書パターンとマツチングを行う文
字認識装置において、前記未知パターンを代表文字格納
部の中の代表パターンとマツチングし、マツチング度が
高い代表パターンが存在するときは、その未知パターン
をその代表パターンに属するように分類する文字分類部
と、マツチング度が高い代表パターンが存在しないとき
は、その未知パターンが新しい代表パターンとして格納
される代表文字格納部とを備え、代表文字格納部にある
代表パターンを前記文字認識部に送り、前記辞書パター
ンとのマツチングを行うように構成する。
[産業上の利用分野コ 本発明は、文字認識を行うための文字認識方式文字認識
装置においては、入力された未知文字を文字認識部で認
識し、認識辞書の辞書パターンとマツチングし、出力部
に文字コードとして出力する。この場合、高速な認識を
行うためには、認識辞書とのマツチング処理の回数を抑
えることが必要である。
[従来の技術] 従来の文字認識方式としては、例えば第4図に示すよう
なものがある。
第4図において、入力される未知文字1の未知パターン
1aは、文字認識部4で直接認識を行っており、未知パ
ターン1aと認識辞書5の辞書パターン5aをマツチン
グ部4bでマツチング処理して、出力部6に文字コード
を送っていた。
文字認識部4の認識辞書5に対するマツチング処理の回
数を少なくするために、文字認識部4の候補選択部4a
で処理対象の辞書パターン5aを絞り、高速化を図って
いた。すなわち、候補選択部4aでは未知パターン1a
の特徴を把握することにより、処理対象の辞書パターン
5aを絞っていた。
[発明が解決しようとする課題] しかしながら、このような従来の文字認識方式にあって
は、未知パターンに対して候補選択部で処理対象の辞書
パターンの候補を絞るようにしているが、このような処
理だけでは、さらに高速に文字認識を行うことができな
いという問題点があった。
本発明は、このような従来の問題点に鑑みてなされたも
のであって、未知パターンの数を減らすことで、さらに
高速に文字認識を行うことができる文字認識方式を提供
することを目的としている。
[課題を解決するための手段] 第1図は本発明の原理説明図である。
第1図において、1aは入力される未知文字1の未知パ
ターン、5aは認識辞書5の辞書パターン、4は代表パ
ターン3aと辞書パターン5aとのマツチングを行う文
字認識部、2は前記未知パターン1aを代表文字格納部
3の中の代表パターン3aとマツチングし、マツチング
度が高い代表パターン3aが存在するときは、その未知
パターン1aをその代表パターン3aに属するように分
類する文字分類部、3はマツチング度が高い代表パター
ン3aが存在しないときは、その未知パターン1aが新
しい代表パターン3aとして格納される代表文字格納部
である。
[作用] 本発明においては、未知文字1の未知パターン1aが入
力されると、文字分類部2では、代表文字格納部3の中
の代表1〜代表n (nは動的に増加する)の代表パタ
ーン3aとマツチングし、マツチング度が高い代表パタ
ーン3aが存在すれば、未知パターン1aはその代表パ
ターン3aに属するように分類する。すべての代表パタ
ーン3aとマツチング度が低い場合は、新しい代表パタ
ーン3aとして代表文字格納部3へ登録する。紙面上の
未知文字1が無くなるまで以上の処理を繰り返すと、紙
面上の未知文字1の数は数分の1が代表パターン3aと
して代表文字格納部3に登録される。この代表文字格納
部3にある代表パターン3aを文字認識部4へ送り、実
際の認識辞書5の辞書パターン5aとのマツチングを行
わせる。文字分類部2でのマツチングは、同一の紙面上
にあられれる文字パターン同士のマツチング処理であり
、本来の文字認識部4で処理するものに比べ簡単な手法
を用いることができ、高速化することができる。
すなわち、未知パターン1aを代表パターン3aに属す
るように分類することにより、未知パタ−ン1aの数を
減らすことができるので、辞書パターン5aとのパター
ンマツチングの処理時間を短縮することができ、さらに
高速に文字認識を行うことができる。
[実施例] 以下、本発明の実施例を図面に基づいて説明する。
第2図および第3図(A)、(B)は本発明の一実施例
を示す図である。
第2図において、1aはスキャナによりメモリに入力さ
れる未知文字1の未知パターンであり、未知パターン1
aは、例えば、横が15ビツト、縦が20ビツトのrA
Jという文字よりなる。
2は文字分類部であり、文字分類部2はテンプレートマ
ツチング部2aを有し、入力された未知パターン1aの
大きさを調べ、同じ大きさの代表パターン3aを見つけ
ることで、大分類を行う。
次に、文字分類部2はその代表パターン3aとのマツチ
ング処理を行い、マツチングが最も良く、かっ、−窓開
値以上のマツチング度であれは、未知パターン1aをそ
の代表パターン3aと同じパターンであると判定する。
マツチング度の良いものが見つからない場合には、その
未知パターン1aは新しい代表パターン3aとして代表
文字格納部3に登録していく。
4は候補選択部4aとマツチング部4bを有する文字認
識部であり、文字認識部4は代表パターン3aと認識辞
書5の辞書パターン5aのマツチングを行う。文字認識
部4は代表パターン3aがなくなるまで、認識処理を行
い、出力部6に辞書パターン5aに付加されている文字
コードを出力する。
次に、動作を説明する。
第3図(A)、(B)は本発明の詳細な説明すフローチ
ャートである。
第3図(A)において、まず、ステップS1で代表文字
格納部3をクリアし、ステップS2て未知パターン1a
を切りだす。次に、ステップS3で未知パターン1aが
なければ、第3図(B)のステップ521に進み、未知
パターン1aがあるときは、ステップS4で未知パター
ン1aの外形(XW:横幅、YW:高さ)をチエツクす
る。
次に、ステップS5で同一大きさのパターンが代表パタ
ーン3aとして登録されているか否を判別し、登録され
ていないときは、ステップS6で未知パターン1aを代
表パターン3aとして新規に登録し、登録されていると
きは、ステップS7でパターンマツチングを行う。
次に、ステップS8でマツチング度が良いか否かを判別
し、良いときは、ステップS9で未知パターン1aを、
マツチした代表パターン3aと同じグループとみなす。
マツチング度が良くないときは、ステップSIOで次の
代表パターン3aがあるか否かを判別し、ないときは、
ステップS1aでその未知パターン1aを代表パターン
3aとして追加登録する。次の代表パターン3aがある
ときは、ステップS12で次の代表パターン3aを取り
出して、ステップS7に戻ってパターンマツチングを行
い、次の代表パターン3aがなくなるまで、くり返して
マツチング処理を行う。
次に、ステップS3で未知パターン1aがないときは、
第3図(B)のステップS21に進み、代表パターン3
aがないか否かを判別し、ないときは、処理終了とする
。代表パターン3aがあるときは、ステップS22で代
表パターン3aの規格化や分類情報などを作成し、ステ
ップ823で認識辞書5から辞書パターン5aを取り出
し、ステップS24で代表パターン3aと辞書パターン
5aのパターンマツチングを行う。なお、このパターン
マツチングは第3図(A)のステップS7のパターンマ
ツチングに比べ、アルゴリズムが重く、データの量が多
いので、処理時間がかかる。
次に、ステップS25でマツチング度が良いか否かを判
別し、良いときは、ステップS26で辞書パターン5a
に付加されている文字コードを与えて認識結果とする。
すなわち、代表パターン3aに属する他の未知パターン
1aの全てに認識結果として文字コードを与える。
マツチング度が良くないときは、ステップS27で次の
辞書パターン5aがあるか否かを判別し、ないときはス
テップ828で認識不可な未知パターン1aとして処理
する。次の辞書パターン5aがあるときはステップ82
3に戻り、その辞書パターン5aを取り出して、それが
なくなるまで、マツチング処理を繰り返して行う。
このように辞書パターン5aとのパターンマツチングを
行う未知パターン1aの数を減らすことができるので、
さらに高速に文字認識を行うことができる。
[発明の効果] 以上説明してきたように、本発明によれば、未知パター
ンの数を減らすことができるので、辞書パターンとのパ
ターンマツチング処理時間を短縮することができ、さら
に高速に文字認識を行うことができる。
【図面の簡単な説明】
第1図は本発明の原理説明図、 第2図は本発明の一実施例を示す図、 第3図(A)、CB)はフローチャー 第4図は従来例を示す図である。 図中、 1・・・未知文字、 1a・・・未知パターン、 2・・・文字分類部、 2a・・・テンプレートマツチング部、3・・・代表文
字格納部、 3a・・・代表パターン、 4・・・文字認識部、 4a・・・候補選択部、 4b・・・マツチング部、 5・・・認識辞書、 5a・・・辞書パターン、 6・・・出力部。 ト、

Claims (1)

  1. 【特許請求の範囲】 入力される未知文字(1)の未知パターン(1a)を文
    字認識部(4)で認識を行い、認識辞書(5)の辞書パ
    ターン(5a)とマッチングを行う文字認識装置におい
    て、 前記未知パターン(1a)を代表文字格納部(3)の中
    の代表パターン(3a)とマッチングし、マッチング度
    が高い代表パターン(3a)が存在するときは、その未
    知パターン(1a)をその代表パターン(3a)に属す
    るように分類する文字分類部(2)と、マッチング度が
    高い代表パターン(3a)が存在しないときは、その未
    知パターン(1a)が新しい代表パターン(3a)とし
    て格納される代表文字格納部(3)とを備え、 代表文字格納部(3)にある代表パターン(3a)を前
    記文字認識部(4)に送り、前記辞書パターン(5a)
    とのマッチングを行うことを特徴とする文字認識方式。
JP2269932A 1990-10-08 1990-10-08 文字認識方式 Pending JPH04148294A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2269932A JPH04148294A (ja) 1990-10-08 1990-10-08 文字認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2269932A JPH04148294A (ja) 1990-10-08 1990-10-08 文字認識方式

Publications (1)

Publication Number Publication Date
JPH04148294A true JPH04148294A (ja) 1992-05-21

Family

ID=17479209

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2269932A Pending JPH04148294A (ja) 1990-10-08 1990-10-08 文字認識方式

Country Status (1)

Country Link
JP (1) JPH04148294A (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5510624A (en) * 1978-07-07 1980-01-25 Nippon Telegr & Teleph Corp <Ntt> Discrimination processing method for handwritten english alphabet, numeral and symbol
JPS61138381A (ja) * 1984-12-08 1986-06-25 Fujitsu Ltd 文字認識方式
JPS62200483A (ja) * 1986-02-28 1987-09-04 Toshiba Corp 文字読取装置
JPS6472294A (en) * 1987-09-09 1989-03-17 Ibm Character recognition equipment
JPH0262682A (ja) * 1988-08-30 1990-03-02 Seiko Epson Corp 文字認識方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5510624A (en) * 1978-07-07 1980-01-25 Nippon Telegr & Teleph Corp <Ntt> Discrimination processing method for handwritten english alphabet, numeral and symbol
JPS61138381A (ja) * 1984-12-08 1986-06-25 Fujitsu Ltd 文字認識方式
JPS62200483A (ja) * 1986-02-28 1987-09-04 Toshiba Corp 文字読取装置
JPS6472294A (en) * 1987-09-09 1989-03-17 Ibm Character recognition equipment
JPH0262682A (ja) * 1988-08-30 1990-03-02 Seiko Epson Corp 文字認識方法

Similar Documents

Publication Publication Date Title
EP0307111B1 (en) Character recognition apparatus
US5125039A (en) Object recognition system
JPH0520500A (ja) 文書認識装置
JPH04148294A (ja) 文字認識方式
JPS60108981A (ja) 光学文字読取装置
JPH0331981A (ja) 文字認識装置
JPS6336389A (ja) 文字読取装置
JPS59158482A (ja) 文字認識装置
JP2644859B2 (ja) パターン詳細同定装置の同定処理方式
JPS6139175A (ja) 光学的文字読取装置
JP3121401B2 (ja) 認識辞書及び文字認識装置
KR100210492B1 (ko) 영문 접촉문자 분리기능을 개선한 문서 인식장치 및 그 방법
JPH07121665A (ja) 文字認識辞書の構成方法及び検索方法
JPH06274701A (ja) 単語照合装置
JP2935533B2 (ja) 文字処理方法
JPH03212783A (ja) マッチング方式
KR19990048707A (ko) 문자간격과 단어간격을 구분하는 방법
JPS6198487A (ja) 辞書選択方式
JPH05298489A (ja) 文字認識方式
JP2875678B2 (ja) 文字認識結果の後処理方法
JPS6143383A (ja) 文字認識装置
JPH01183796A (ja) 文字認識装置
JPS60110089A (ja) 文字認識装置
JPS6327991A (ja) 入力情報認識装置用ヒストグラム作成方法
JPH01259417A (ja) 候補データ選出装置