JPH03260886A

JPH03260886A - 文字認識方法

Info

Publication number: JPH03260886A
Application number: JP2057995A
Authority: JP
Inventors: Tetsuo Kiuchi; 木内　哲夫; Kazushi Yoshida; 收志吉田
Original assignee: Fuji Electric Co Ltd; Fuji Facom Corp
Current assignee: Fuji Electric Co Ltd; Fuji Facom Corp
Priority date: 1990-03-12
Filing date: 1990-03-12
Publication date: 1991-11-20

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕この発明は、文字やマークなど（以下、単に文字等とい
う）を認識するための文字認識方法、特に高精度な文字
認識が可能な文字認識方法に関する。

〔従来の技術〕

従来、この種の方法として、例えば文書画像から文字行
または文字列（以下、単に文字行という）を切り出した
後、文字らしきものを仮文字として抽出し、この仮文字
から所定の文字サイズを基準として全角文字（漢字等）
を切り出し、文字サイズから全角文字と確定できないも
のは、半角文字として有効に成立し得る文字か否かを調
べ、取立すれば半角文字として認識する方法がある。し
かし、このような方法では文字によって全角文字が２つ
以上の半角文字として誤Ｅ？２１にされるおそれがある
。そこで、出願人は次のような方法を提案している（特
願昭６３−２９２４４５号；提案済み方法１とも云う）
。

第６図は提案済みの方法１を説明するためのフローチャ
ートである。

これは、図示されない画像処理装置の処理手順を示すも
ので、まず文書画像データを入力しく■参照）、その水
平方向の投影値をとることにより、各文字行を切り出す
（■参照）。これにより、行の幅寸法を求め、全角文字
の大きさに相当する量（文字サイズ）を得る。なお、こ
こでは横書きの場合を想定しているが、縦書きの場合も
同様である。

次に、各行に垂直な方向の投影値を調べ、文字サイズを
考慮することにより、各文字行から文字らしきもの、す
なわち仮文字群を切り出しく■参照）、シかる後この仮
文字群の中から上記文字サイズを利用して全角文字を選
出する（■参照）。

全角文字として選出する条件は次のとおりである。

イ）それ単独で文字サイズが全角文字サイズのもの、即
ち他の仮文字と結合する余地の全くないもの。

口）句読点。

ハ）それ単独では半角サイズであるが、隣り合う他の半
角サイズの仮文字と結合させてみると全角サイズとなる
もの。

二）それ単独ではサイズが全角サイズよりも小さいが、
隣り合う他の半角サイズの仮文字との間に距離があり過
ぎ、これらを無理に結合させると全角文字サイズをこえ
るもの。

以上の如き条件に従って全角文字を全て選出した後、あ
とに残った仮文字について、これを統合または分離して
統合文字１分離文字を作威しく０参照）、シかる後これ
らの統合文字１分離文字をＯＣＲ（文字読取装置）によ
り、辞書パターンとの類似度を利用して認識する（■参
照）。

次に、その認識結果に対して次のような矛盾処理を実行
する（■参照）。

ａ）例えば認識すべき対象が分離文字であるにも関わら
ず、ＯＣＲによる認識結果が全角サイズの漢字を示すも
のとすれば互いに矛盾するので、かかる認識結果は採用
しない。

ｂ）上記とは逆に、認識すべき対象か統合文字であるに
もかかわらず、ＯＣＲによる認識結果が英字、数字等の
半角サイズ文字を示す場合。

そして、最後に残された文字につき、これを統合文字と
すべきか分離文字とすべきかを、ＯＣＲにより相対類似
度を用いて判別する（■参照）。

なお、類似度ｘｌは、類似度Ｘと類似度の平均値ｍとの
比に、或る定数（例えば、１０２４）を掛けたものとし
て定義する。すなわち、ｘｌ＝ｘ／ｍ一定数（１０２４
）である。

上述の方法では類似度から認識結果を決定するようにし
ているので、例えば「う」と「ろ」、「テ」と「チｊの
如く非常に似ているものは、文字画像の僅かな違い、例
えば文字等の太さや字体の相違、文字等のつぶれやかす
れ等により誤認識するおそれがある。また、同様の理由
から、「は」の相対類似度よりも「（ｊと「よ」の部分
の相対ＭｉｆＪ度の方が高くなり、ｆ４　認識してしま
うことがある。このことにつき、以下に具体的に説明す
る。

第７図は入力文字「は」について、これを統合文字１と
して処理した場合と、分離文字２．３として処理した場
合の類似度Ｘ、相対類似度ｘｉを示すものである。すな
わち、類似度Ｘ、類似度の平均値ｍとが図示の如く得ら
れたものとすると、類似度とその平均値との比に一定数
（１０２４）を乗じて得られる相対類似度は、統合文字
１の場合はｒ９５４．、分離文字２，３の場合はそれぞ
れ「１０２８３．　　「８９８．でその平均値は「９６
３」となり、９５４＜９６３であることから、入力文字「は」は「（」（前括弧）と
「はヨからなるものとして誤認識されることになる。な
お、定数はｒ１０２４」に限らないことは勿論である。

このような問題を解決するため、出願人はさらに次のよ
うな方法を提案している（特願平１−３９３０８号；提
案済み方法２ともいう）。

第８図は提案済み方法２を説明するためのフローチャー
トで、第６図に示すものに対し形状特徴照合ステップ［
相］〜［相］を付加した点が特徴である。

この方法の要点は、認識すべき文字の縦横比と縦方向お
よび横方向にそれぞれいくつに分離できるかを示す形状
特徴量も辞書として予め記憶しておき、入力文字の形状
特徴量をその認識結果と対応する候補文字の予め記憶さ
れている形状特徴量と比較して、類似度に基づく認識結
果を採用するか否かを決定するようにした点にある。

この例につき、以下に具体的に説明する。

第９図は入力画像（または入力文字）が「う」で、人力
画像から得られる形状特徴は「縦長で、縦方向に２つに
分離する」であり、これに対して認識結果の候補文字の
第１〜第１０位のうちの第１位が「ろ」となった例であ
る。この場合、辞書に予め記憶されている「ろ」の形状
特徴は「縦長でも横長でもなく、縦横に分離しない」で
ある。

従って、縦長・横長チエツクのステップ（第８図［相］
参照）でＮｏ”となるため、第２位の候補文字のチエツ
クが行なわれる。第２位の候補文字は「う」であり、形
状特徴量が一致するので、これを認識結果として採用す
る。

第１０図は入力文字「は」を統合文字として処理する場
合と、分離文字ｒ（、、ｒよ」として処理する場合の例
である。すなわち、同図（イ）の如く統合文字として処
理する場合は、認識結果の第１候補「は」が形状特徴量
の点からも適合するので、「はｊが採用される。同様に
、分離文字「（」は同図（ロ）の如く第１位候補文字「
（」と適合するが、分離文字「よ」は同図（ハ）の如く
、その形状特徴量から第１位候補文字「は」とは適合せ
ず、結局第２位の候補文字「まＪと適合する。

そし＝、同図（ニ）に示す如く、「は」として認識した
ときの相対類似度はｒ９５４」、「（」と「ま」に分離
されるものとしたときの相対類似度はｒｃ＋４６」とな
り、９４６＜９５４から１は」が採用されることになる。つまり、入力文字
は「は」と認識され、「（」と「ま」に誤認識されるお
それをなくすことができる。

〔発明が解決しようとする課題〕

上述の形状特徴は限定された条件では有効であるが、−
船釣に扱おうとすると困難である。例えば、文字の縦横
比は字体によって異なるため縦横比が２倍以上必要とさ
れることから、「−」や「１」のように適用可能な字種
が限定されることになる。例えば、片仮名の「口」と漢
字の「口」は文字画像が相似であるが、大きさを比べる
と漢字の「日二の方が大きく、片仮名の「力」と漢字の
１カニ、片仮名の「工ｊと漢字のｒ工、も同様である。

また、英字の小文字と大文字ではｒ（、とｒｃ４．　ｒ
Ｋ」とｒｋ、、　ｒ□、と７０；、　ｒｐ。

と７ＰＪ、　’Ｓｊと’ＳＪ、　’ＵＪとｒｔＢ、ｒＶ
ごと’ｖ二、ｒＪ、とｒＷＪ、　７ＸＪと「Ｘ−１「Ｚ
：とｚＢが同様である。さらに、英字の「Ｉ」と漢字の
「工」、漢字の「８二とｒ日二は縦横比を変えると相似
となる。

一方、分離数については「二ｊは確実に１＠１方向に２
つに分離する」が、「は」は常に「横方向に２つに分離
する」とは限らない。つまり、文字種により分離数を確
実に指定することはできない。

このように、文字画像のノイズは勿論のこと、文字の傾
き１文字の大きさ（級数）、変形率等が分離数に影響す
るので、やはり適用可能な字種が限定されることになる
。

したがって、この発明の目的は形状特徴を広く適用でき
るように改良して以上の如き欠点を除去し、認識率を向
上させることにある。

〔課題を解決するための手段〕

文書を画像処理して個々の文字を切り出し各文字毎に辞
書パターンとの類似度を求めて文字を認識するに当たり
、認識すべき文字の文字幅１文字高さ、外接矩形の面積
、縦横比の少なくとも１つについて、認識すべき文字を
含む文書内の標準的な文字との比率を求め、これを予め
求めておいた基準値と比較することにより、或る文字の
字形が他の文字の字形を縦方向、横方向または縦横両方
向に伸張または圧縮して得られる文字と類似するときの
判別を容易にする。このとき、前記各比率の平均値、標
準偏差またはこれらから導かれる量を求めるとともに、
その各々に対する基準値を予め求めてこれを辞書として
所定のメモリに記憶しておくことができる。

また、文書を画像処理して個々の文字を切り出し各文字
毎に辞書パターンとの類似度を求めて文字を認識するに
当たり、認識すべき文字の縦置離数、横分離数をその文
字サイズから予測し、これを基準値と比較することによ
り、或る文字が分離文字になり易い字形であるときの判
別を容易にする。このとき、前記縦分離数、横分離数の
平均値。

標準偏差またはこれらから導かれる量を求めるとともに
、その各々に対する基準値を予め求めてこれを辞書とし
て所定のメモリに記憶しておくことができる。

〔作用〕

一般に、例えば片仮名の「口」と漢字の１口」を判別す
る場合、明朝体を除いてはその文字単独では困難である
。しかし、片仮名の「口、と漢字の「口」の２つの文字
を比較できれば、小さい方が片仮名の「口ｊで、大きい
方が漢字の「口」である。一般の文書を読んでいる場合
、そのような直接比較は出来ないが、他の文字と比較し
てその文字が大きめのものに属するか、小さめのものに
属するかで判定することができる。すなわち、その文字
の標準文字サイズ（変形率も含めて）を知り、文字画像
の大きさを量的に比較することにより、類似文字の判定
を正確に行なうことができる。

また、文字サイズが小さくなって０に近づくと、どんな
文字でも文字画像は潰れて塊になるので、分離数は１に
収束し、文字サイズが大きくなると、文字は潰れにくく
なって分離数は増加傾向となり、さらに大きくなると分
離数はその字種の分離し得る最大値に収束する。そこで
、分離文字を文字サイズの連続関数とみなし、分離数の
期待値からどれくらい外れているかを求めることにより
、統合文字２分離文字の判定を正確に行なうことができ
る。

つまり、認識すべき文字の文字幅２文字高さ。

外接矩形の面積、縦横比の少なくとも１つについての認
識すべき文字を含む文書内の標準的な文字の各対応する
量との比率、または縦分離数、横分離数をその文字サイ
ズから予測することにより、より高精度の認識を可能に
するものである。

〔実施例〕

第１図はこの発明の実施例を示すフローチャートである
。なお、ステップ■〜■は従来と同様なので、ステップ
■〜［相］について以下に説明する。

まず、次式で定義される正規化した文字高さの残差Ｈｎ
、および正規化した文字幅の残差Ｗｎを求める（■、［
相］参照）。

二二に、Ｈ，Ｗは文字画像から測定した文字高さ５文字
幅である。第２図（イ）に入力画像のサンプルデータを
示す。Ｈｓ、Ｗｓは入力文書（文章２段落１行）の標準
文字高さ、標準文字幅で、第２図（ロ）にそのデータを
文書データとして示している。或る字体の標準文字高さ
、標準文字幅シよその字体の最大文字高さ、最大文字幅
であり、その字体の漢字の最大文字高さ、最大文字幅と
考えて差支えない。なお、標準文字サイズは字体や変形
率１級数等の違いによって生しる誤差を吸収するための
もので、安定な値が得られるのであれば最大値に限らず
、平均値または最頻値でも良いことは勿論である。入力
文書の標準文字高さ、標単文字幅は文書を読取る前に外
部から指定されるか、読取り中に周囲の文字から統計的
に求めることができるので、その詳細は省略する。

また、標準文字高さＨｓ、標準文字幅Ｗｓは文字級数を
Ｑ１垂直変形率をαＶ、水平変形率をαｈ、レターフェ
ースと正体の標準文字高さ、標準文字幅との比率をそれ
ぞれβＶ、βｈとすれば、次式の関係にある。

Ｈｓ＝β７．Ｑ、αＶ　　　　　　　・・・（３）Ｗ　
ｓ　＝βｈ−にｌαｈ　　　　　　　　＝（４ｊＨμｊ
、Ｈσｊは字種ｊの字体毎の標準文字高さとの比率の平
均値、標準偏差を示し、Ｗ、ｃｚｊ。

Ｗσｊは字種ｊの字体毎の標準文字高さとの比率の平均
値、標準偏差を示す。これらの求め方につき、以下に説
明する。

例えば、ゴシック体と明朝体とでは、同し級数の同し字
種を比べると、一般に明朝体の方が大きい。片仮名の「
口ｊと漢字の「口」とを大きさで判別するため、このよ
うな字体間の文字サイズの違いを補正しておくことが望
ましい。そこで、例えばゴシック体１３級の「あ」を、
ゴシック体１３級の標準文字高さで割った値を求める。

次に、明朝体１６級の「あ」を、明朝体１６級の標準文
字高さで割った値を求める。このようにして、次々と「
あ」について文字セント（字体）毎の標準文字高さとの
比率を求め、これらから平均値「Ｈμあ」と標準偏差「
Ｈσあ：が求められる。これらＨｕｊ、Ｈσｊ、Ｈｕｊ
、Ｗσｊは、文書を読取るに先立って読取り辞書を作成
するとともに計算しておき、字種ｊによって簡単に引け
るように表にして第３図の如く記憶しておく。なお、第
３図は字種に１の特徴量を詳細に示しているが、他の字
種についても同様である。また、以上では文字高さ１文
字幅を用いたが、これと等価な外接矩形と縦横比を用い
ても良い。

次に、次式の如く定義される正規化した縦分離数の残差
ＮＶｎ、および正規化した横分離数の残差ＮＨｎを求め
る（■、ａ２）参照）。

ＮＶ　σ　ｊ二二に、ＮＶ、ＮＨは入力文字画像から測定した縦置離
数、横分離数で、これらは、縦分離数の平均　　二Ｎ■μｊ＝Ｆ１　（Ｌ　　Ｈ）縦
分離数の標準偏差二ＮＶσｊ＝Ｆ２　（ｊ、Ｈ）横分離
数の平均　　：ＮＨμｊ＝Ｆ３　（ｊ、Ｗ）横分離数の
標準偏差：ＮＨｔｊｊ＝Ｆ・４　（ｊ、Ｗ）のように字
種ｊと文字幅Ｗ１文字高さＨとの関数である。

例えシヨ、ゴシック体１０級の「は」の横分離数は「２
」、教科書体１０級の「は」の横分離数は「１」、明朝
体１０級の「は」の横分離数はＦ２」であったとすると
、その平均値と標準偏差は、ＮＨμは＝Ｆ３（は、１０
級）＝、（２＋１＋２）／３＝１．６６７ＮＨσは＝Ｆ４（は、１０級）＝　［（４＋１＋４）／３−　（１，６６７）”］　”
２＝０．４７となる。このようにして、１０級のもっと多くの字体に
対してｒＮＨμはＪ、ｒＮＨσはコを求める。次に、１
２級についても同様にしてｒＮＨμはｊ＋　　ｒＮＨσ
は」を求め、以後同様の操作を繰り返し、補間法により
Ｆｌ（は、　　Ｈ）、Ｆ２　ｅまＨ）、Ｆ３（は、Ｗ）
、Ｆ４（は　Ｗ）を求める。

そして、全ての字種についてかかる操作を実施すれば、
関数Ｆｌ　（ｊ、Ｈ）、Ｆ２　（ｊ、Ｈ）、Ｆ３　（ｊ
、Ｗ）　、Ｆ４　（ｊ、Ｗ）が求められることになる。

第４図に縦分離数の平均関数とその標準偏差Ｆ１、Ｆ２
および横分離数の平均関数とその標準偏差Ｆ３．Ｆ４の
例を示す。

縦分離数の平均関数Ｆｌ　（ｊ、Ｈ）は同図（イ）のよ
うに文字種ｊ１文字高さＨの関数であり、（ａ　３　　
　　　　　　　　　（ａ　２≦Ｈ）（７）で表わされる。その標準偏差の関数Ｆ２　（ｊ、Ｈ）は
同図（ロ）から、［６（Ｈ≦ｂｌ）ＮＶσ＝Ｊ、　（ｂ５−ｂ３）　（Ｈ−ｂ２）／　（ｂ
・・・　（８）で表わされる。同様に、・・・　（９）・・・　（１０）で表わされる。

次のステップ＠では、次式で定義されるノルム（パター
ンの長さに相当する）を求める。

Ｄ　　ｊ　　＝　　［Ｈｎ”＋Ｗｎｚ＋ＮＶｎ”＋ＮＨ
ｎ２コ　ｌ／２・・・（１１）上記ではＨｎ、Ｗｎ、ＮＶｎ、ＮＨｎの４つの量でノル
ムを表現するようにしているか、そのうちの１つ以上を
用いて表現することができる。

ステップ［相］では、類似度の判定結果と統合して文字
種ｊの総合判定結果Ｔｊを得る。すなわち、相関値であ
る類似度Ｒｊを、次式の如く形状特徴の結果Ｄｊと結合
する。

Ｔｊ＝ｗｌ　・Ｒｊ＋ｗ２・　［ｍａｘ　（Ａ”Ｄｊ”
、Ｏ）　　コ　１″　　　　　　　　　　　・・・　（
１２）ここに、ｗｌ、ｗ２は定数で、類似度Ｒｊと形状
特徴の結果Ｄｊの重みを示し、Ａは形状特徴の効果に限
度を与えるための定数である。なお、上式（１２）は、Ｔｊ＝Ｗ１・Ｒｊ＋ｗ２・Ｄｊ　　　・・・（１３）の
ように簡略化することができる。

形状特徴を類似度の補助として用いる場合、すなわち類
似字形がなく類似度だけで充分判定が可能で形状特徴を
必要としない字種の場合は、上記多量の標準偏差の値を
実際よりも大きめにしておけぽＤｊの値は非常に小さく
なり、形状特徴の効果を弱めることができる。

なお、分離文字をより詳細に表現するには、文字を部分
図形と空白の組み合わせと見做して表わすこともできる
。例えば第５図（イ）に示すように漢字「洲」は６つの
部分図形の大きさと５つの空白の大きさのリストとして
同図（ロ）、（ハ）のように表現し、標準文字サイズで
正規化したときに空白の大きさが１画素以下になったら
潰れるとしてリスト間でパターンマツチングをとるよう
にしても良い。ただし、どの空白から潰れるかは確率的
な問題となるので、パターンマツチングをとる手法が複
雑となる。

〔発明の効果〕

この発明によれぽ、標準文字高さＨｓ、標準文字幅Ｗｓ
は字体間の文字の大きさの違いを補正する量であり、１
つの文書では路間−の字体を用いていることから、字体
間の文字の大きさの違いを詳細かつ正確に判定すること
ができる。これにより、或る文字の字形が他の文字の字
形を縦方向。

横方向または縦横両方向に伸張または圧縮して得られる
類似文字であるときも、両者の判別が可能となる。さら
に、字種毎の平均値、標準偏差を大きさのバラツキを評
価するための評価基準に組み込むことにより、判定がよ
り正確となる。

その結果、片仮名の「口ごと漢字の「口」は文字画像が
相似であるが、大きさを比べると漢字の「口」の方が大
きく、片仮名の「力」と漢字の「力」、片仮名の「工」
と漢字の「工」も同様である。また、英字の小文字と大
文字では「Ｃ」と「Ｃｌ、　ｒＫ」とｒｋ、、　ｒＯ」
とｒｏ」、ｒｐ」と’ＰＪ、　ｒ３．と「Ｓ」、「Ｕ」
とｒｕ」、ｒＶ、と「■」、「Ｗ」と「Ｗ」、「Ｘ」と
「Ｘ」「Ｚ」と「ｚ」が同様である。さらに、英字の「
Ｉ」と漢字の「工」、漢字の「日」と「日」は縦横比を
変えると相似となるが、以上のような類似の文字の判別
が容易となる。

また、文字の分離の仕方を文字サイズによって予測し、
その予測結果を基準値と比較して判定するようにすれば
、文字の統合２分離をより正確に判定することができる
。さらに、分離の仕方の字種毎の平均値、標準偏差を大
きさのバラツキを評価するための評価基準に組み込み、
これを文字サイズの近似式または関数として利用すれば
、判定がより正確となる。

その結果、「二」のように確実に「縦方向に２つに分離
するｊ文字は勿論のこと、ｒは」のように常に「横方向
に２つに分離する」とは限らない文字種についても統合
２分離判定が容易となる。

【図面の簡単な説明】

第１図はこの発明の実施例を示すフローチャート、第２
図はサンプルデータおよび文書データを説明するための
説明図、第３図は辞書データを説明するための説明図、
第４図は縦分離数、横分離数の各平均、標準偏差を説明
するための説明図、第５図は或る文字の一例とその文字
分離リストを説明するための説明図、第６図は提案済み
方法１を説明するためのフローチャート、第７図は提案
済み方法ｌを具体的に説明するための説明図、第８図１
ま提案済み方法２を説明するためのフローチャート、第
９図および第１０図はいずれも提案済み方法２を具体的
に説明するための説明図である。符号説明１・−・統合文字、２．３・・・分離文字。

Claims

【特許請求の範囲】１）文書を画像処理して個々の文字を切り出し各文字毎
に辞書パターンとの類似度を求めて文字を認識するに当
たり、認識すべき文字の文字幅、文字高さ、外接矩形の面積、
縦横比の少なくとも１つについて、認識すべき文字を含
む文書内の標準的な文字の各対応量との比率を求め、こ
れを予め求めておいた基準値と比較することにより、或
る文字の字形が他の文字の字形を縦方向、横方向または
縦横両方向に伸張または圧縮して得られる文字と類似す
るときの判別を容易にしてなることを特徴とする文字認
識方法。２）前記各比率の平均値、標準偏差またはこれらから導
かれる量を求めるとともに、その各々に対する基準値を
予め求めてこれを辞書として所定のメモリに記憶してお
くことを特徴とする請求項１）に記載の文字認識方法。３）文書を画像処理して個々の文字を切り出し各文字毎
に辞書パターンとの類似度を求めて文字を認識するに当
たり、認識すべき文字の縦分離数、横分離数をその文字サイズ
から予測し、これを基準値と比較することにより、或る
文字が分離文字になり易い字形であるときの判別を容易
にしてなることを特徴とする文字認識方法。４）前記縦分離数、横分離数の平均値、標準偏差または
これらから導かれる量を求めるとともに、その各々に対
する基準値を予め求めてこれを辞書として所定のメモリ
に記憶しておくことを特徴とする請求項３）に記載の文
字認識方法。