JPH03260888A

JPH03260888A - 標準パターン作成方法

Info

Publication number: JPH03260888A
Application number: JP2057993A
Authority: JP
Inventors: Shinji Matsui; 伸二松井; Yasuo Hongo; 本郷　保夫; Tetsuo Kiuchi; 木内　哲夫; Akiko Konno; 紺野　章子
Original assignee: Fuji Electric Co Ltd; Fuji Facom Corp
Current assignee: Fuji Electric Co Ltd; Fuji Facom Corp
Priority date: 1990-03-12
Filing date: 1990-03-12
Publication date: 1991-11-20
Anticipated expiration: 2013-05-13
Also published as: JP2749692B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、パターンマツチングによる文字認識処理に用
いる標準パターンの作成方法に関する。

〔従来の技術〕

パターンマツチングを用いた一般的な文字認識処理手順
を第２図に示す。同図において、ステップＳ１は文字画
像入力、ステップＳ２は特徴抽出、ステップＳ３は字種
判別、を示す。

ここで、字種判別部（ステップ３３）では、認識対象と
なる文字ごとにあらかじめ用意された標準パターンと入
力画像から抽出された特徴パターンとの間で類似度が算
出され、入力文字の字種が判別される。

類似度Ｇは、標準パターンと人力画像の特徴パターンそ
れぞれをｎ次元のベクトルＳ　（ｎ）、　Ｐ　（ｎ）と
して、以下の式から求められる。

ここで、（ｓ、ｐ）＝Σ＝　Ｓ　（ｉ）　Ｐ　（ｉ）で
あり、ベクトルの内積をあられす。（Ｓ、Ｓ）、（Ｐ、
Ｐ）はそれぞれ、標準パターン、特徴パターンの自己相
関値と呼ばれる。

このようにして使用される標準パターンの一般的な作成
手順を第３図に示す。

同図に見られるように、ステップＳｌで得た複数のサン
プルからの特徴抽出をステップＳ２で行い、その結果を
ステップＳ３で各要素ごとに足し込み、ステップＳ４で
得られる総和パターンに対し、必要に応じた濃度変換を
ステップＳ５で施して標準パターンを得る。ここで言う
濃度とは特徴要素の大きさをさす。以後同様とする。

一般に濃度変換としては、それぞれの標準パターンの中
の最大要素を所定の値Ｆに揃えるように、他の要素もそ
れに比例して一律的に大きさを変換する処理が行われる
。複数ある字種の中のｊ番目字種の総和パターンＪ（ｎ
）の最大要素をＭ、とすれば、標準パターンＳ、（ｎ）
のｉ番目の要素は、５Ｊ（ｉ）＝Ｈｊ（ｉ）・Ｆ／ＭＪ
　　・・・・・・（１）として得られる。

これは認識処理を行う装置の有効桁数や、標準パターン
の格納領域の制約から、限られたビット幅を有効に使う
ためである。または、入力画像の特徴パターンと標準パ
ターンの濃度のオーダを一致させるため、総和パターン
の各要素をサンプル数で割る処理が行われる。

〔発明が解決しようとする課題〕

所で、このようにして作成された標準パターンが、結果
的に、少数の突出した値の特徴要素をもつことがあり、
その場合、これらの突出した要素が字種の判別に大きな
影響を与えることが判明した。すなわち、文字の変動に
弱くなり、認識率が低くなる。

第４図は、従来手法で作成された標準パターンにおける
濃度分布を示したグラフであるが、横軸に沿って濃度２
５５．２０８及び２０７の所にそれぞれ、１個の画素が
存在し、少数の突出した値の特徴要素になっていること
が分かる。

本発明の目的は、かかる問題点を改善し、少数の突出し
た値の特徴要素をもつ標準パターンの場合には、それら
の特徴要素をうまく処理することにより、認識率の低下
を招かないようにした標準パターンの作成方法を提供す
ることにある。

〔課題を解決するための手段〕

標準パターン作成時、各サンプルの特徴抽出結果を足し
込んだ総和パターンが、少数の突出した特徴要素をもつ
とき、該総和パターンの各特徴要素に対し、ａ乗根（ａ
＞１．０）をとる演算や対数に類似した関数ｆ　（ｘ）
を用いた演算をほどこすことにより、第６図に示すよう
な濃度の非線形変換を行い、この後、必要に応じた濃度
の線形変換を行う。

ｆ　（ｘ）は、任意のＸ（≧０）に対して以下の条件を
満たすような凸関数である。

ｆ（ｘ）　−ｆ（ｘ−７１１ｘ）≧ｆ（ｘ＋、ｄｘ）−
ｆ（ｘ）≧０・・・・・・（２）さらに、以下の条件を満たす。

ここで、Ａｘは任意の正の実数であり、関数の増分を表
す。

〔作用〕

上記の如き非線形変換を施すことにより、突出した特徴
要素を、そうでない特徴要素よりも一段と押え込むこと
が可能になるから、これにより、文字の変動に強い安定
した標準パターンを得ることができ、従来と同様の処理
を用いた認識処理において認識率を向上させることがで
きる。

〔実施例］第１図は本発明の一実施例としての標準パターン作成方
法を示すフローチャートである。同図に見られるように
、各サンプル画像に対し順次特徴抽出処理が施され足し
込まれる。この総和パターンに対して、ステップＳ５に
見られる如く、各特徴要素のａ乗根（ａは１．０より大
きな実数）をとり、その結果で新たな総和パターンを得
る。すなわち、ａ乗根をとる演算は、下記に示すような
非線形関数ｆ　（ｘ）を用いた演算により、非線形な濃
度変換を行うことを意味する。

ｆ　（ｘ）＝χＩ／１１　　　　　　　　　　・・・・
・・（４）その後、更に、従来も行われていた濃度変換
（第１図のステップＳ６或いは第３図のステップＳ５）
として、前記（１）式を用いた濃度変換が行われる。こ
こでは、各特徴要素のビット長を８ピントに圧縮するた
めＦ＝２５５として一律的な濃度変換を行っている。従
来手法と異なるのは各特徴要素の８乗根をとって非線形
変換を行う点である。

従来手法と本手法（ａ＝４）を用いた場合の標準パター
ンの例を、“あ”という文字について、学習サンプル数
８０個で、特徴抽出手法として、（１６ｘ１６）メツシ
ュに正規化された画像の輪郭画素を白画素を挟んだ輪郭
画素間の相対距離で複数の特徴面（例えば１５面）に割
り付ける手法（特願平１１年第７１７５７号）を用いて
作成し比較してみると、後者の方が、突出した特徴要素
を低く抑え、その後、全体をカサ上げするように濃度変
換しているので、全体に濃度が濃くなっているのが分か
る。

本発明による手法で標準パターンをひらがな７５文字に
対して作成し、判別式として類似度を用いた従来と同様
の認識処理を学習サンプル８０文字、ひらがな７５字種
に対して行った場合、従来手法で作成された標準パター
ンを用いた場合の認識率９０．５％に対して、９５．５
％に認識率が向上した。変数ａ　（８乗根のａ）と認識
率の関係を第５図に示したので参照されたい。

本発明は、前記特徴抽出手法に依存するものではなく、
伝播停止処理を用いた背景特徴（特開昭５９−７９２号
公報）でも、その有効性が確認されている。

ここでは前記（４）式において、ａ＝４としたが、ａの
最適値は認識対象とするフィールドや特徴抽出手法、判
別式の種類によって異なると考えられる。また、総和パ
ターンの各特徴要素の対数をとる非線形変換も、８乗根
をとる非線形変換と同様に有効である。すなわち、ｆ　
（ｘ）として下記に示す関数を用いる。

ｆ　（ｘ）＝ｌｏｇ＋ｏ（ｘ　＋　１）　　　　　　−
−（５）ただし、前記（４〉式におけるａを大きくして
いくと特徴パターンは２値画像に近づき、認識率は低下
する。そこで、サンプル画像から抽出された特徴パター
ンの各要素をａ乗して足し込み、前記総和パターンを得
ることで、総和パターンにおける濃度分布をある程度保
存したまま、突出した特徴要素の値を低く押さえること
ができる。

〔発明の効果〕

本発明によれば、標準パターン作成時に、各サンプル文
字画像から抽出した特徴要素の足し込み総和パターンに
おいて、生しることのある突出した特徴要素を押え込む
ような非線形変換を、各特徴要素に施して標準パターン
を作成することにより、認識率が向上するという利点が
ある。非線形変換として４乗根を用いる場合、認識率は
９０．５％から９５．５％に向上し、認識率にして５３
％の改善がみられた。

【図面の簡単な説明】

第１図は本発明の一実施例を示すフローチャート、第２
図はパターンマツチングを用いる一般的な文字認識手順
を示すフローチャート、第３図は従来の標準パターン作
成方法を示すフローチャート、第４図は従来手法により
得られる標準パターンの濃度分布を示すグラフ、第５図
は変数ａと認識率の関係を示す特性図、第６図は本発明
による非線形変換の特性例を示す特性図、である。符号の説明Ｓ１〜Ｓ６・・・ステップ第　１　図第２図第図第５図第図

Claims

【特許請求の範囲】

１）パターンマッチングによる文字認識処理のために用
いる標準パターンを複数のサンプル文字画像から作成す
る標準パターン作成方法において、各サンプル文字画像
からの特徴抽出結果を各特徴要素毎に足し込んでその総
和パターンを得た後、得られた該総和パターンを構成す
る各特徴要素に対し、その大きさのａ乗根（但し、ａ＞
１．０）をとる演算又は対数をとる演算の如き、非線形
変換を行う演算を施して、その演算結果から成る総和パ
ターンを得る段階を含むことを特徴とする標準パターン
作成方法。