JPH0421080A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0421080A
JPH0421080A JP2124891A JP12489190A JPH0421080A JP H0421080 A JPH0421080 A JP H0421080A JP 2124891 A JP2124891 A JP 2124891A JP 12489190 A JP12489190 A JP 12489190A JP H0421080 A JPH0421080 A JP H0421080A
Authority
JP
Japan
Prior art keywords
character
characters
similar
information
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2124891A
Other languages
English (en)
Inventor
Hiroaki Ikeda
裕章 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2124891A priority Critical patent/JPH0421080A/ja
Priority to DE69132789T priority patent/DE69132789T2/de
Priority to EP91304283A priority patent/EP0457534B1/en
Publication of JPH0421080A publication Critical patent/JPH0421080A/ja
Priority to US08/348,833 priority patent/US5729630A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野コ 本発明は、相似文字の識別か可能である認識対象文字に
含まれている文字認識装置に関するものである。
[従来の技術] 従来、文字認識装置は、少なくとも認識対象となる文字
数の識別辞書を、主に学習データの平均的な特徴として
持っており、入力画像は文字ごとに切り出され、大きさ
の正規化をして特徴を抽出し、識別辞書を用いて類似度
を計算し、類似度か最大のものを認識結果として、ある
いは大きいものから順番にいくつかを認識候補として表
示装置や記憶装置に出力するものかあった。
[発明か解決しようとしている課題] しかしなから上記従来例ては切り出された文字の大きさ
を正規化するのて、相似文字たとえば“つ゛と゛つ′の
ように字形が同して大きさのみ違うような文字の区別か
つかなくなり、方識別辞書はそれぞれを異なるカテゴリ
ーとして扱っているため、入力か“つ′てあっても“つ
°てあったり、逆に“つ′を入力した場合゛つ゛か認識
結果となってしまう欠点かあった。
[課題を解決するための手段] 本発明によれば、上記欠点を解決する為に画像情報を入
力する手段と、入力した画像情報から文字情報を切り出
す切り出し手段と1切り出された文字情報に対する候補
文字を識別する識別手段とを有する文字認識装置におい
て、前記切り出された文字情報の位置情報を記憶する第
一記憶手段、複数の相似文字を1つのカテゴリーとして
記憶する第二記憶手段、前記候補文字に相似文字が存在
するか否か判定する判定手段、前記第一記憶手段に記憶
された位置情報に応じて前記第二記憶手段に記憶された
相似文字から一つの文字を認識結果として決定する決定
手段を有する。
[実施例1] 第1図は本発明の実施例における基本構成を示す図であ
り100は第8図、第9図におけるフローチャート等の
演算を行う中央演算装置(CPU)、101は文字・記
号等の入力や、誤認識した時に修正する際の指示等を行
うためのキーボード(K、B)、102はボインテイン
クデバイスPD、103は文字を認識する際に用いる辞
書等を記憶しているリートオンリーメモリ(ROM)、
IO2はスキャナ108により読みとられたデータを記
憶するメモリ、105はスキャナ108により読みとら
れたデータから候補となる単語等をみつけ、各々の相違
度を計算する識別計算部、106はCRT、107はス
キャナ108のインターフェース(SCAN  I /
F )108は画像情報を読みとるスキャナである。
第2図は本発明の特徴を最もよく表わす実施例のブロッ
ク図てあり、lてイメージスキャナ108等から画像が
入力され、2でCP U 100により入力画像から1
文字ずつ文字を切り出し、3てCP U 100により
切り出された文字の外接矩形を求め、正規化して一定の
大きさに拡縮し、4てCP U 1[]0により正規化
された文字画像の特徴を抽出し、5て識別計算部105
により抽出された特徴とROM 103に記憶しである
識別辞書9を用いて類似度を計算し、6てROM103
に記憶しである相似文字テーブル11を用いて相似文字
かあるか否か判定する。2で文字切り出しをした際の文
字の位置情報は10でメモリ104に格納しであるので
、この文字位置情報に基づいて8てCP U 100に
より相似文字のどちらかを選択し、7でCRT 105
に認識結果を出力する。
ここで第8図に示すフローチャートに従ってCP U 
100に3いて行われる処理の流れを詳細に説明する。
スキャナ108より画像を入力しくSl)、入力した画
像情報から行の描出を行い(S2)、第3図に示すよう
な行の高さhを求める(S3)。次に第3図に示すよう
な文字の切り出しを行う(S4)。文字の切り出しを行
ってその行にある文字数かわかったら、メモリ104内
の位置情報格納部に下部文字ステータスを表わすビット
を入力文字数分確保する(S5)。
文字の最上部の画素の高さかhx−より下に存在してい
るか否かを判定しくS6)、x%より下に存在している
ならばその文字は下部文字であると判断し、位置情報の
ビットをオンしくS7)、S6で下に存在していると判
定されなかったならば位置情報のビットをオフする(S
8)。次の文字があるならば(S9)、S6に戻り、次
に文字がなければ(S9)、次の行へと移る。次に行か
ある場合は(SIO)S3へ戻り、最後の行まで83か
らS10を繰り返し、次に行がない場合は(SIO)切
り出しを行った文字画像の外接矩形を正規化しく5ll
)、文字の特徴を描出しく512) 、識別計算を識別
計算部105において行う(313)。ここで識別計算
を行う際に用いる識別辞書9は第4図のようにROM 
103に記憶されており、大小の区別がある文字は2文
字てlカテゴリーとしてカテゴリ一番号(l〜n)を割
り付けておく。切り出した文字の識別と類似度の計算か
できたら(S13) 、類似度の最大のカテゴリーが相
似文字チーフルに存在するか否か判定する(S14)。
相似文字テーブル11は第5図のようにROM 103
に記憶されており、識別辞書9て相似文字か存在するカ
テゴリ一番号について、位置情報のビットがオンの時と
オフの時のそれぞれのカテゴリーか含まれている。
ts3図の例て説明すると、識別計算部の結果かカテゴ
リ一番号でfm、に、IJとなったとする。また位置情
報格納部はrオフ、オン、オフJである。カテゴリ一番
号mは相似文字テーブル11に含まれているのて相似文
字判定部6て相似文字を含むと判定し相似文字選択部8
てカテゴリ一番号mてビットがオフすなわち認識される
。カテゴリ番号父は、相似文字判定部6て相似文字は存
在しないと判定され、「ト」か認識結果となる。S14
て相似文字チーフルに存在しないと判定された場合は、
S]3において類似艙か最大であると識別されたカテゴ
リーを認識結果とする。またS14て相似文字テーブル
に存在すると判定された場合は、S16て更にメモリ1
04内の位置情報のビットかオンしているか否かの判定
を行う。
S16てビットかオンであると判定された場合は、相似
文字テーブル11のカテゴリーの小文字を認識結果とし
、S16てビットかオンてはないと判定された場合は、
相似文字テーブル11のカテゴリーの大文字を認識結果
とする。
S15.’S17.S18て認識結果か出たら、次に文
字かあるか否か判定しく519) 、次に文字かある場
合はSllに戻り、最後の文字まてSllからS ]、
 9を繰り返す、S19て次に文字かないと判定された
場合は結果をCRT 106に表示する(S20)。
[実施例2] 第6図に相似文字選択方法についての他の実施例を説明
する図を示す。本実施例においては、認識対象文字かア
ルファヘットと記号である時に、「FJとFyJを区別
する方法を例にとって同し文字の特徴を有し、文字位置
のみ異なる文字の識別の方法について説明する。
本実施例においても第1図、第2図に示したような文字
認識の構成は実施例1と同様であるのて、ここでは述べ
ない。
ここで第9図に示すフローチャートに従ってCP U 
100において行われる処理の流れを詳細に説明する。
第9図における処理において、S1〜54S11〜S1
3.S19.S20は実施例1と同様であるのて、ここ
ては述べない。
実施例1と同様に文字の切り出しを行い(S4)、第6
図に示したような、切り出した文字の切り出し枠上部か
ら文字上部までの長さいと、文字下部から切り出し枠下
部まての長さ■を求め(S:11) 、メモリ104内
の位置情報格納部10に記憶し、UとVの大きさを比較
する(S32)  S32てu < vと判定されたな
らばS5においてS5て確保した位置情報のビットをオ
ンしく533) 、S32てu>vと判定されたならば
位置情報のビットをオフする(S34)。次に文字かあ
るか否か判定しく535) 、次に文字かある場合はS
32に戻って最後の文字まてS32からS35を繰り返
す。S35て次に文字かないと判定された場合は336
へ進み、次に行かあるか否か判定する。次に行がある場
合はS3へ戻り、最後の行までS3から336を繰り返
す。536で次に行かないと判定された場合はSllへ
進む。
S13て文字の識別計算を行ったら、類似度最大のカテ
ゴリーが2のカテゴリーであるか否か判定しく537)
 、 9のカテゴリーてはないと判定された場合は、類
似度が最大のカテゴリーを認識結果としく538) 、
337てりのカテゴリーであると判定された場合はメモ
リ104内の位置情報のビットかオンであるか否か判定
しく539) 、ヒツトがオンであると判定された場合
はIrtJを認識結果としく540) 、 S39てビ
ットかオンてないと判定された場合は「、Jを認識結果
とする(S41)。
なお、これと同しようにUと■を求め、Uと■の関係に
よって同し特徴を持つ文字でありながら、文字位置の異
なる文字の識別は第7図のようなテーブルを設けること
により、ツ以外の文字でも可能なことは言うまでもない
[発明の効果] 以上説明したように、本発明によれば相似文字を1つの
文字と認識した後に大文字と小文字を選択するようにし
たことにより、相似文字を確実に区別することが可能と
なり、誤認識を減少させる効果かある。
以上説明したよ・うに、本発明によれば相似文字の識別
辞書を1つにまとめることにより、辞書容量を減少させ
る効果があり、また処理速度を上げる効果がある。
【図面の簡単な説明】
第1図は本発明の実施例の基本的な構成図、第2図は本
発明を実施した文字認識装置のブロック図、 第3図は入力画像における文字の切り出しと、位置情報
取り出しについての説明図、ts4図は識別辞書の内部
を説明した図、第5図は相似文字テーブルを説明した国
策6図は「夕1と「、1の区別方法の文字切り出しと位
置情報取り出しについての説明図、第7図は相似文字選
択の条件を示した図、第8図は実施例1の処理を示すフ
ローチャート、 第9図は実施例2の処理を示すフローチャートである。 1は画像入力部 2は文字切り出し部 3は正規化部 4は特徴抽出部 5は識別計算部 6は相似文字判定部 7は認識結果出力部 8は相似文字選択部 9は識別辞書 lOは位置情報格納部 1は相似文字テーブル 2は文字切り出し枠である

Claims (1)

  1. 【特許請求の範囲】 画像情報を入力する手段と、入力した画像 情報から文字情報を切り出す切り出し手段 と、切り出された文字情報に対する候補文字を識別する
    識別手段とを有する文字認識装置において、前記切り出
    された文字情報の位置情報を記憶する第一記憶手段、 複数の相似文字を1つのカテゴリーとして 記憶する第二記憶手段、 前記候補文字に相似文字が存在するか否か 判定する判定手段、 前記第一記憶手段に記憶された位置情報に 応じて前記第二記憶手段に記憶された相似文字から一つ
    の文字を認識結果として決定する決定手段 を有することを特徴とする文字認識装置。
JP2124891A 1990-05-14 1990-05-14 文字認識装置 Pending JPH0421080A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2124891A JPH0421080A (ja) 1990-05-14 1990-05-14 文字認識装置
DE69132789T DE69132789T2 (de) 1990-05-14 1991-05-13 Verfahren und Gerät zur Bildverarbeitung
EP91304283A EP0457534B1 (en) 1990-05-14 1991-05-13 Image processing method and apparatus
US08/348,833 US5729630A (en) 1990-05-14 1994-11-29 Image processing method and apparatus having character recognition capabilities using size or position information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2124891A JPH0421080A (ja) 1990-05-14 1990-05-14 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0421080A true JPH0421080A (ja) 1992-01-24

Family

ID=14896664

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2124891A Pending JPH0421080A (ja) 1990-05-14 1990-05-14 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0421080A (ja)

Similar Documents

Publication Publication Date Title
KR100249055B1 (ko) 문자인식장치및방법
CA1061000A (en) Multi-channel recognition discriminator
CN100483450C (zh) 地址识别设备和方法
JP4553241B2 (ja) 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体
KR100412317B1 (ko) 문자인식/수정방법및장치
JP2007042097A (ja) キー文字抽出プログラム、キー文字抽出装置、キー文字抽出方法、一括地名認識プログラム、一括地名認識装置および一括地名認識方法
Kavallieratou et al. Handwritten character segmentation using transformation-based learning
US11361529B2 (en) Information processing apparatus and non-transitory computer readable medium
US7133556B1 (en) Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition
JPH0421080A (ja) 文字認識装置
KR940007345B1 (ko) 온라인 한글 필기체 문자의 인식방법
JP2017146841A (ja) 文字認識装置、文字認識方法、およびプログラム
JPH07319880A (ja) キーワード抽出・検索装置
JP3911942B2 (ja) 文字認識装置
JPS63269267A (ja) 文字認識方法
JP2963474B2 (ja) 類似文字識別方法
JP2972443B2 (ja) 文字認識装置
JP2637762B2 (ja) パターン詳細同定方式
JP2004030695A (ja) キーワード抽出・検索装置
JPH056464A (ja) 文字列認識方法及びその装置
JPH08202822A (ja) 文字切り出し装置、及び文字切り出し方法
Hwang et al. Segmentation of a text printed in Korean and English using structure information and character recognizers
JP2931485B2 (ja) 文字切出し装置及び方法
JPH06162269A (ja) 手書き文字認識装置
JP2977244B2 (ja) 文字認識方法及び文字認識装置