JPH0447486A

JPH0447486A - 文字認識方法

Info

Publication number: JPH0447486A
Application number: JP2154085A
Authority: JP
Inventors: Takatsugu Yamada; 山田　敬嗣
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1990-06-14
Filing date: 1990-06-14
Publication date: 1992-02-17
Anticipated expiration: 2012-11-26
Also published as: JP2682203B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、文字画像から特徴量を求めた後に、多層神経
回路網を用いて識別を行う文字認識方法に関するもので
ある。

〔従来の技術〕

従来、多層神経回路網を用いた文字認識では、文字画像
から特徴抽出を行い、その特徴量を多層神経回路網に入
力し、文献じＡ　Ｎｅｕｒａｌ　ＮｅｔｗｏｒｋＤｉｇ
ｉｔ　Ｒｅｃｏｇｎｉｔｉｏｎ’　ｂｙ　Ｄ、Ｊ、Ｂｕ
ｒｒ：　ＴＥＥＥ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏ
ｎｆｅｒｅｎｃｅ　ｏｎ　Ｓｙｓｔｅｍ、　Ｍａｎ　ａ
ｎｄ　Ｃｙｂｅｒ−ｎｅｔｉｃｓ：　１９８６．　ｐｐ
、１６２１−１６２５）に示されるように、各要素がカ
テゴリへの類似度を表現するようなベクトル量として出
力信号を得る。多くの場合、出力信号の要素は、０から
１の数値または一工から１の数値として表現されている
。ベクトル量の要素の中で最大の値を取る要素が表すカ
テゴリを認識結果とするものである。さらに、出力信号
から認識結果に対する確信度が計算され、その確信度が
しきい値よりも高い場合には、その認識結果を出力し、
しきい値よりも低い場合には、その認識結果を棄却して
認識結果を出力しないことにより、誤った認識結果を出
力することを避け、認識結果の信顛性を高めている。

〔発明が解決しようとする課題〕

手書き文字の特徴としては、文字線のかすれによる欠落
やにじみによる穴のつぶれが多いことや、非線形や文字
の位相構造が変化することが挙げられる。前述のような
特徴抽出を行った後に、識別を行うような従来手法では
、特徴抽出段階でパラメータが用いられており、そのパ
ラメータは予め決定され固定されている。文字認識の実
行時において、認識結果が棄却された場合に、多くの場
合に人間がみると明確に認識できることがある。これは
特徴抽出の段階でパラメータが固定されているために、
文字パターンの変形に特徴抽出処理が追従できず、正し
く特徴が抽出できないために、識別も正しく行えずに認
識結果が棄却されてしまうためである。

本発明の目的は、文字線の途切れや穴のつぶれ、非線形
な局所位置の変化、位相構造の変化という多様な文字パ
ターンの変形に、従来の文字認識方法が追従できないと
いう欠点を除去せしめ、入力された文字の変形が大きい
場合にも、その変化に追従できる文字認識方法を提供す
ることにある。

〔課題を解決するための手段〕

第１の発明は、文字画像から特徴を計算して多層神経回
路網により識別処理を行う文字認識方法において、文字画像から複数のパラメータ値を用いて特徴抽出を行
うステップと、それによって得られた特徴ベクトルを入力して、各カテ
ゴリ毎のスコアを出力する多層神経回路網を計算するス
テップと、多層神経回路網の出力から出力結果の確信度を計算し、
その確信度をしきい値と比較して、しきい値よりも高け
れば認識結果をそのまま出力するステップと、もししきい値よりも低ければ、各パラメータを一定値増
減させて確信度を求め、確信度が高くなった場合のパラ
メータの変更量を求めるステ・ンブと、全パラメータについて変更量を求めた後に、全パラメー
タを変更して特徴抽出から再試行することを制御するス
テップとを、含むことを特徴とする。

第２の発明は、文字画像から特徴を計算して多層神経回
路網により識別処理を行う文字認識方法において、文字画像から複数のパラメータ値を用いて特徴抽出を行
うステップと、それによって得られた特徴ベクトルを入力して、各カテ
ゴリ毎のスコアを出力する多層神経回路網を計算するス
テップと、多層神経回路網の出力から出力結果の確信度を計算し、
その確信度をしきい値と比較して、しきい値よりも高け
れば認識結果をそのまま出力するステップと、もししきい値よりも低ければ、確信度を高めるように多
層神経回路網に入力する特徴ベクトルが変化すべき量を
求めるステップと、１つのパラメータが影響を与える特徴ベクトル内の要素
の変更量の和を求めるステップと、特徴ベクトルの変化
量の和に基づいて特徴抽出でのパラメータ値を変更する
ステップと、変更したパラメータ値を用いて特徴抽出か
ら再試行することを制御するステップとを、含むことを
特徴とする。

第３の発明は、文字画像から特徴を計算して多層神経回
路網により識別処理を行う文字認識方法において、文字画像から複数のパラメータ値を用いて特徴抽出を行
うステップと、それによって得られた特徴ベクトルを入力して、各カテ
ゴリ毎のスコアを出力する多層神経回路網を計算するス
テップと、多層神経回路網の出力から出力結果の確信度を計算し、
その確信度をしきい値と比較して、しきい値よりも高け
れば認識結果をそのまま出力するステップと、もししきい値よりも低ければ、確信度を高めるように多
層神経回路網に入力する特徴ベクトルが変化すべき量を
求めるステップと、１つのパラメータを増減させた場合の特徴ベクトルの変
化量を求め、全パラメータに対する特徴ベクトルの変化
量の組による行列の擬逆行列と特徴ベクトルが変化すべ
き量を表すベクトルとの積から各パラメータを変更する
量を求めるステップと、変更したパラメータ値を用いて特徴抽出から再試行する
ことを制御するステップとを、含むことを特徴とする。

〔作用〕

第１の発明では、文字画像から特徴抽出、識別を行った
後に、各カテゴリのスコアから認識結果の確信度を計算
し、その確信度がしきい値より低い場合には、特徴抽出
でのパラメータを少量変化させて特徴抽出、識別を行っ
てみて、認識結果の確信度の高い方を選択することによ
り徐々に高い確信度をもつ認識結果を得る。

この第１の発明では特徴抽出の方法に依存せず、ここで
は特徴抽出でのパラメータ集合を（θｊ１≦ｊ≦パラメ
ータ数）として、抽出された特徴ベクトルを［ｆｉｌ　
　（１≦ｉ≦特徴次元）とする。

特徴ベクトルを多層神経回路網に入力し、各カテゴリ毎
のスコアを計算する。多層神経回路網での計算は、３層
の場合を例にとると、以下のように計算できる。

特徴ベクトル値を多層神経回路網に入力し第０層のベク
トル値として、第０層ベクトル（ｉから第１層のマート
リクス積を計算する。第０層のベクトル値をｏｉ　（１
≦ｉ≦Ｎ、）とし、第１層重みマトリクス値をＷ、ｊ’
　（ｌ≦ｉ≦Ｎ０，１≦ｊ≦Ｎ＋）、計算結果のベクト
ル値をｏ、’（１≦ｊ≦Ｎ、）とすると、ＯＪ′＝Σ　（Ｏ工’ＸＷｔｊ’）　＋θｊ　’　　　
　　　　　（１）となる。ただし、ここでθ、１はバイ
アス値である。次にｏＪ’（１≦ｊ≦Ｎ、）の各々に対
して以下の式に従ってＳ関数を計算する。

ｏ’ｊ’　＝　１／２　（１＋ｔａｎｈ　（ｏｊ’）　
）　　　　　（２）さらに、第２層重みマトリクスをｗ
ｊ−（１≦ｊｓＮ＋、１≦に≦Ｎ　ｔ　）とし、バイア
ス値をθ−とすると、ｏ−＝Σ（０’＝’ＸＷＪｈ”）＋θ−（３）なる計算
を行う。続いて、ｏ−（１≦に≦Ｎ２）は各々、以下の
ようにＳ関数が計算され、各カテゴリのスコアとして出
力される。

ｏ’ｗ”　＝　１　／　２　（１＋ｔａｎｈ　（ｏｈ”
）　）　　　　　（４）次に多層神経回路網の出力値か
ら確信度を計算する。確信度の計算方法はどのようなも
のでも良いが、例えば以下のような確信度Ｒの定義式を
用いることができる。

・　・　・（５）この式では、認識対象のカテゴリ数をＮとして、神経回
路網からの出力ベクトルをＰ、（１≦ｉ≦Ｎ、Ｏ≦Ｐ８
≦１）、α、βを係数とする。この確信度の値は、カテ
ゴリのスコアのうち１つの値だけが上限値１に近く、他
の全ての値が下限値０に近いときに最大値を取り、最大
値を持つ要素Ｐ。

が１から離れたり、第２位以下の要素が最大値に接近し
た場合に、Ｒは小さくなる。

確信度が予め定めたしきい値よりも大きい場合には、識
別結果は充分な確信度が得られたものと見なし、その結
果を認識結果として出力する。確信度Ｒがしきい値より
も小さい場合には、特徴抽出でのパラメータ値を調節し
て認識処理を再試行する。パラメータ値の調節方法を以
下に述べる。

まず、特徴抽出段階での第ｉ番目のパラメータ値θ、だ
けを一定量大きくして、特徴抽出・識別をした場合の認
識結果の確信度Ｒ、＋と、一定量小さくした場合の認識
結果の確信度Ｒ８−を求める。パラメータ変更前の確信
度をＲｏとして、Ｒｏ。

Ｒ，”、Ｒ，−を比較し、高い確信度を得た場合の変更
量を、第ｉ番目のパラメータの変更量Δθ。

として定めることができる。全パラメータに対して変更
量を求めた後に、それらを元のパラメータ値に加えて全
パラメータを変更して、認識処理を行うことにより、少
し高い確信度の認識結果を得ることができる。

これを繰り返し行うことにより、徐々に最適なパラメー
タへと変更して、確信度がしきい値を超えたところで繰
り返し処理を終了すれば、確信度の高い認識結果を得る
ことができる。−足回数の繰り返し後も、確信度がしき
い値を超えない場合には、入力文字画像を認識できない
ものとして棄却する。

第２の発明では、文字画像から特徴抽出、識別を行った
後に、各カテゴリのスコアから認識結果の確信度を計算
し、その確信度がしきい値より低い場合には、第１の発
明と同様の確信度の規範に基づいて、多層神経回路網に
入力する特徴量が変化すべき値を求めた後に、それを実
現するための特徴抽出でのパラメータの変更量を求める
ことにより、徐々に確信度の高い認識結果を得ることが
できる。確信度Ｒを太き（するための入力待微量の変更
量を求めるには、以下の式に従って計算できる。

Δｆ、＝ｒｄＲ／ｄ　ｆ、　　　　　　　　　　　　（
６）これは、確信度Ｒの計算式を定める式の偏微分によ
りΔｆ１の計算式は得られることを示している。

例えば、第１の発明で説明したような式（１）から式（
４）で表される３層の神経回路網によって識別を行うと
し、さらに確信度の定義式として、式（５）を用いて、
係数α、βをそれぞれ１とした場合には、特徴ベクトル
の変更量Δｆ、は、 Δｆ、＝・　・（７）となり、実際の値を代入して計算することにより、特徴
ベクトルの要素の変更量Δｆ、は計算できる。

ここで、γは０．１などの適当な小さな値でよい。

また、Ｕは式（２）５式（４）でのシグモイド関数の傾
き制御のパラメータであり、ｈｊは多層神経回路網での
第１層ユニットの第ｊ番目のユニットの出力値で、式（
２）での０′１　と同一であり、ｑｋは第２層の第に番
目のユニットの出力値で、式（４）でのＯＬ、ｌ　と同
一とする。

次に特徴ベクトルの変更を実現するための特徴抽出での
パラメータの変更量を求める。これは特徴抽出でのパラ
メータが影響する特徴ベクトルの要素の変更量を足し合
わせることにより、パラメータを変更すべき値を求める
。第ｊ番目のパラメータθ、を増加させた時に、増加す
る特徴ベクトルの要素の集合Ｆ、゛と減少する特徴ベク
トルの要素の集合ＦＪ″を予め定めておき、１つのパラ
メータが影響する特徴ベクトルの要素の変更蓋Δｆ、の
総和からパラメータの変更量を求める。

Ｆ　、　＋に属する要素の変更量Δｆ、の総和をΔθ、
とし、Ｆ、−に属する要素の変更量のΔｆ、の総和をΔ
θ、−とした場合に、パラメータの変更量Δθ、は、 Δθｊ＝Δθ、−Δθｊ　−（８）によって求められる。Δθｉの方がΔθ、−より大きい
場合には、パラメータθ１を増加させた場合に増加する
特徴ベクトルの要素の方を大きく変更すべきであること
がわかり、パラメータθ、をΔθｊに従って増加させれ
ばよく、逆にΔθ１−の方が大きい場合には、パラメー
タθｊを減少させたときに増加する特徴ベクトルの方を
大きく変更すべきであることがわかり、パラメータθｊ
をΔθ、に従って減少させる。

これを全パラメータに対して計算して、全パラメータを
変更すれば、確信度を少し高めるための特徴ベクトルの
変更量を実現できる。その後に認識処理を再試行して、
少し確信度の高い認識結果を得ることができる。これを
繰り返し行って、徐々に最適なパラメータへと変更して
、確信度がしきい値を超えたところで繰り返し処理を終
了することにより、確信度の高い結果を得ることができ
る。−足回数の繰り返し後も、確信度がしきい値を超え
ない場合には、入力文字画像を認識できないものとして
棄却する。

第３の発明では、文字画像から特徴抽出、識別を行った
後に、各カテゴリのスコアから認識結果の確信度を計算
し、その確信度がしきい値より低い場合には、第２の発
明と同様の確信度の規範に基づいて、式（６）と式（７
）に従って確信度を高めるために特徴ベクトルの要素の
変更量ＥΔｆ、Ｊを求め、それを列ベクトルＡとする。

次に特徴抽出での第１番目のパラメータθｉを一定量増
減させた場合の特徴ベクトルをそれぞれ［ｆｉパ］と［
ｆｉ’１として、その差分ベクトルを、［Δｆｉ’］−［Δｆｉ”］　−［Δｆｉ’−］　　　
　（９）に従って求め、それを全パラメータに対して行
って得たベクトル集合を行列Ｂとする。パラメータの変
更量の列ベクトル［Δθ、］をＣとすると、Ａ＝ＢＣ０
０）なる線形変換を仮定すれば、ＢｔをＢの擬逆行列とする
と、パラメータの変更量のベクトルＣは、Ｃ＝Ｂ’Ａ　
　　　　　　　　　　　　　　００で求められる。これ
により、確信度を高めるように求めた特徴ベクトルの変
更量を実現するパラメータの変更量［Δθ、コを求める
ことができる。

これを基に全パラメータを変更して認識処理を再試行す
れば、少し確信度の高い認識結果を得ることができる。

これを繰り返し行って徐々に最適なパラメータへと変更
して、確信度がしきい値を超えたところで繰り返し処理
を終了することにより、確信度の高い結果を得ることが
できる。

〔実施例〕

以下、図面を用いて本発明の文字認識方法の実施例を説
明する。

第１図は、第１の発明の文字認識方法の処理の流れ図を
示す。

文字入カステップ１０２では、粒状雑音が除去された後
の文字画像を１文字ずっ二値画像として入力する。初期
パラメータ設定ステップ１０３では、特徴抽出のための
パラメータを初期的に設定する。

本実施例では、後述のように特徴ベクトルとして輪郭線
の曲率と方向を用いるので、輪郭線の疑似方向と疑似曲
率を求めるための輪郭線追跡の画素数を第１のパラメー
タθ１とし、曲率を５種類に分類するためのパラメータ
（θ２．θ３．θ４．θ５）を４つ用意する。初期的な
パラメータ値として、それぞれ（５，１，２，０，２，
−０，２，−１，２）と設定する。ここで説明する特徴
抽出方法とそのパラメータは、本発明を説明する上で便
宜的なもので本質的な問題ではない。

特徴ベクトル計算ステップ１０４では、第２図に示すよ
うに局所構造解析ステップ２０１を実施する。

局所構造解析の内容を第３図を用いて説明する。

まず、文字サイズの正規化ステップ３０１では、２値の
文字パターンを一定の大きさに正規化する。

次に、その２値画像の黒画素と白画素との隣接する位置
を順に探索することにより輪郭抽出ステップ３０２を行
い、ステップ３０３では、その輪郭上の各点から両方向
に長さθ、の触手をのばし、両方向の触手のなす角度を
曲率とすることにより輪郭点の曲率を計算し、さらに両
方向にのばした触手の方向の平均を輪郭点の方向とする
。続くステ・ンブ３０４では、連続するＬ個の曲率のデ
ータから曲率の平滑化をする。ここでは、正規化処理は
横３０画素、縦４０ｉｉ１素程度になるようにし、曲率
平滑化の画素数りを５画素とする。上記の平滑化された
曲率データを基に、ステップ３０５で局所構造への分割
を行う、ここで、局所構造として５種類のものを用いる
０局所構造の抽出には、曲率φ（ｓ）（Ｓは起点からの
輪郭上の距離）と４つのパラメータ（θ２〜θ、）を用
いる。

（０）直線分（θ、〉φ（Ｓ）〉θ４なるＳの区間）（１）正曲率の曲線骨（θ２〉φ（Ｓ）〉θ３なるＳの
区間）（２）負曲率の曲線骨（θ４〉φ（Ｓ）〉θ、なるＳの
区間）（３）正曲率の屈曲点（φ（Ｓ）〉θ２なるＳの区間）（４）負曲率の屈曲点（φ（Ｓ）〈θ、なるＳの区間）ステップ３０６では、近接する同種の局所構造のうち、
それらの間隔がしきい値以下の場合には該当する２つの
局所構造を統合し１つにする。このしきい値は、実施例
では２画素とした。また、ステップ３０７では局所構造
のうちの曲線骨は、局所構造の部分における曲率の総和
が、π／２を超えないように分割される。屈曲点では、
同様に３π／２を超えないように分割される。このよう
にして求められた局所構造は、ステップ３０Ｂにおいて
、その始点、終点の座標と方向が５種類の局所構造ごと
に記憶される。このようにして抽出された局所構造の例
を第４図に示す、第４図（ａ）は、抽出された文字の輪
郭線４０１を示し、第４図Φ）は抽出された局所構造の
例を示す。第４図（ｂ）において白丸から白丸までを結
んだ実線分が１つの局所構造である。４０２は直線分で
あり、４０３は正曲率の曲線骨、４０４は負曲率の曲線
骨、４０５は正曲率の屈曲点、４０６は負曲率の屈曲点
の例である。

次に第２図の特徴ベクトル計算ステップ２０２の手順に
ついて、第５図を用いて説明する。ステップ５０１にお
ける局所構造の位置計算では、局所構造の始点と終点の
座標の平均を局所構造の位置として定め、さらに文字を
ｎＸｍの粗メツシユで区切り、局所構造の属するメツシ
ュの位１ｆ（ｉ、ｊ）（０≦ｉ≦ｎ−１，０≦ｊ≦ｍ−
１）を求める。

ステップ５０２では、局所構造の始点の方向ベクトルと
終点の方向ベクトル平均ベクトルにより局所構造の方向
を定め、これを４５°おきの８方向に量子化し、方向コ
ードｑ（０≦９≦７）を求める。

以上局所構造の種類番号Ｐ（上記の０から４）、メツシ
ュの位置（ｉ、ｊ）、方向ｄを用いて、特徴ベクトルの
要素番号に＝５（８（ｉｘｍ＋ｊ）＋ｑ）＋ｐ＋１　　０２）を
求め、特徴ベクトル［ｆｍ］　　（ｋ＝１〜Ｄ、　Ｄ＝
ｎＸｍＸ５ｘ８）に特徴量を加算する。ステップ５０３
で局所構造が屈曲点か否かを判定し、屈曲点の場合〆は
ステップ５０６に進み、特徴ベクトルの要素に特徴量と
して１を加算し、屈曲点でなければステップ５０４に進
み局所構造の大きさとして、局所構造の始点から終点ま
での輪郭線上の距離を特徴とする求め、ステップ５０５
において特徴ベクトルの要素に加算する。全局所構造に
ついての処理を終了するまで、ステップ５０１からステ
ップ５０７までの処理を繰り返して、入力文字データの
特徴ベクトル［ｒ、］を求める。

以上の特徴ベクトル計算ステップ１０４で求められた特
徴ベクトルは、第１図の多層神経回路網計算ステップ１
０５において、各カテゴリ毎のスコアに変換される。多
層神経回路網計算ステップ１０５での処理手順の詳細な
説明を第６図を用いて行う。

第６図では、第０層から第２層までの３層構造の神経回
路網の計算方法を説明しているが、本発明では、３層構
造に限るものではなく、２層のものや４層以上のものに
も拡張が可能である。

第６図のステップ６０１では、第１図のステップ１０４
によって抽出された特徴ベクトル値を多層神経回路網に
入力し第０層のベクトル値として、式（１）に従って第
０層ベクトル値から第１層のマトリクス積ｏ＝’（１≦
ｊ≦Ｎｌ）を計算する。次にステップ６０２でｏＪ′の
各々に対して、式（２）に従ってＳ関数を計算する。

次にステップ６０３では、式（３）に従って第２層のマ
トリクス積ｏｈ”（ｌ≦に≦Ｎ２）を求める。さらにス
テップ６０４において、ｏ　ｋＺは各々の式（４）に従
ってＳ関数が計算され、各カテゴリのスコアとして出力
される。

ここで用いられる第１層および第２層の重みマトリクス
は、文献（”Ａｎ　Ｉｎｔｒｏｄｕｃｔｉｏｎ　ｔｏ　
Ｃｏｍｐｕ−ｔｉｎｇ　ｗｉｔｈ　Ｎｅｕｒａｌ　Ｎｅ
ｔｓ″ｂｙ　Ｒ，Ｐ、Ｌｉｐｐｗａｎｎ：　ＩＥＥＥ。

ＡＳＳＰ：　Ａｐｒｉｌ　１９８７．　ｐｐ、４−２２
）に示されるような方法で予め学習により決定しである
ものとする。

次に第１図の確信度計算ステップ１０６では、以下の式
を用いて確信度を計算する。ここで、認識対象のカテゴ
リ数をＮとして、神経回路網からの出力ヘクトルをＰ、
（１≦ｉ≦Ｎ、　　ｏ≦Ｐｉ≦１）、α、βを係数とす
ると、確信度Ｒは、式（５）によって定義することがで
きる。この確信度の定義は、本発明においては本質的な
ものでなく、確信度を他の方法で定義した場合にも適用
が可能である。

この文字認識方法を、数字認識のために用いる場合には
、１０個の文字を認識対象とするためＮの値は１０と設
定し、英数字を認識対象とする場合には、大文字２６文
字、小文字２６文字、数字１０文字を認識するため、Ｎ
の値を６２に設定する。また、式（５）の係数α、βを
それぞれ１とした。これは、本質的な問題ではなく他の
値をとることも可能である。また、式（５）では、出力
データの各要素が０から１までの値を仮定したが、−１
から１の場合や、さらに−船釣に出力データの各要素が
ａからｂまでの値をとる場合にも容易に拡張できる。

第１図のステップ１０７では、確信度Ｒとしきい値を比
較し、Ｒの方が大きい場合には、多層神経回路網計算ス
テップ１０６の出力結果は、信転できる結果として、そ
の出力信号から最大値カテゴリ検出１１３を行い、その
結果カテゴリを出力して（ステップ１１４）、１文字の
認識処理を終了する。

確信度としきい値との比較ステップ１０７で、確信度が
小さい場合には、今までの繰り返し数をカウントしくス
テップ１０８）、繰り返し回数としきい値とを比較（ス
テップ１０９）　して、繰り返し回数が多くなると、認
識処理を中断して、棄却信号出力を行い（ステップｌｌ
２）、入力された文字画像はとのカテゴリに属するかは
明確には判断できないものであると出力する。

もし繰り返し回数が一定回数以下である場合には、ステ
ップ１１０に進み、特徴抽出でのパラメータの変更量を
計算する。

パラメータの変更量の計算方法を第７図を用いて説明す
る。ステップ７０１では確信度計算ステップ１０６で得
られた値をＲｏとして保存する。ステップ７０２では、
第１番目のパラメータをθｉとして、ステップ７０３で
は第１番目のパラメータだけを、一定量増やして、θ、
＋Δθ、とじて、他のパラメータは元の値を用いて、特
徴抽出と多層神経回路網による識別を行い、その出力結
果がら式（５）に従って確信度Ｒ３゛を求める。次にス
テップ７０４では、第１番目のパラメータだけを、一定
量減らして、θ、−Δθ、とじて、他のパラメータは元
の値を用いて、特徴抽出と多層神経回路網による識別を
行い、その出力結果から式（５）に従って確信度Ｒ，−
を求める。

ステップ７０５では、Ｒｉ　”　＋　　Ｒｉ　−＋　　
Ｒ１１を比較して、もしＲ，＋が最大値をとるならば、
ステップ７０６に進みａ、を１として、ステップ７１０
に進む。

もし、Ｒｉ−が最大値をとるならば、ステップ７０８に
進みａｉを−１として、ステップ７１０に進む。

もし、Ｒｏが最大値をとるならば、ステップ７０９に進
みａｉを０として、ステップ７１０に進む。以上のステ
ップ７０２からステップ７１０までの処理を、全パラメ
ータに対して実行した後に、ステップ７１２において全
パラメータの変更量（ａｉΔθ、）（１≦ｉ≦パラメー
タ数）を求める。

この変更量を基に、第１図のステップ１１１でパラメー
タの変更を行い、ステップ１０４から認識処理を再試行
し、確信度がしきい値以上になり、認識結果が得られる
か、繰り返し回数がしきい値以上になり棄却されるまで
、以上のステップ１０４からステップ１１０の処理を繰
り返して行う。

次に第２の発明の文字認識方法の実施例を説明する。全
体の処理の流れは、第１の発明の文字認識方法と同様に
第１図の流れにしたがう、その内容は、ステップ１１０
のパラメータ変更量の計算を除いて第１図の内容と同様
であり説明を省略する。

本実施例の文字認識方法のパラメータ変更量の計算ステ
ップ１１０の詳細な説明を第８図を用いて行う。

まず、ステップ８０１では確信度Ｒを高めるための特徴
ベクトルｆ、（１≦ｉ≦Ｎ　ｏ　）の変更量Δｆ。

を計算する。Ｒを式（５）として定義して、α、βをそ
れぞれ１とすると、式（７）を用いて実際の値を代入し
て計算することにより、特徴ベクトルの要素の変更量Δ
ｆ、は計算できる。ここで、γは０．１などの適当な小
さな値でよい。また、Ｕは式（２）。

式（４）でのシグモイド関数の傾き制御のパラメータで
、ｈ、は多層神経回路網での第１層ユニットの第ｊ番目
のユニットの出力値で、ｑｌは第２雁の第に番目のユニ
ットの出力値とする。

次に、ステップ８０２からステップ８０７では、各パラ
メータの変更量を求める。この処理をパラメータの数だ
け繰り返す。

まず、１つのパラメータが影響を与える特徴ベクトルの
要素の総和を求める。実施例では、文字の輪郭線の方向
と、曲率を求める触手長θ１と、曲率を５つの種類に分
類するためのしきい値（θ２〜θ、）を利用しているが
、例えばθ３は局所構造を、正曲率の曲線骨と直線骨を
分類するためのしきい値であり、θ、を大きくすると正
曲率の曲線骨に関する特徴量は減少し、直線骨に関する
特徴量は増加する。よって、ステップ８０３では直線骨
に関する特徴ベクトルの要素の変更量の総和を以下の式
で求める。

ΣΔｆ’＋＋　　（ｋ＝５　（８（ｍｘ＋ｙ）＋ｑ）＋
ｐ）・・ａつメツシュの位置（ｘ、ｙ）（Ｏ≦Ｘ≦ｎ−１，０≦ｙ＜ｍ−１方向コード　ｑ（０≦ｑ≦７）局所構造の種類番号　ｐ（１≦ｐ≦５）ただし、正曲率
の曲線骨の局所構造種類番号を３とすると、ｐ＝３とし
て、ｘ、ｙ、ｑに関して、Δｆｋの総和を計算し、Δθ
１°とする。また、ステップ８０４では、パラメータθ
１を大きくした場合に、減少する特徴ベクトル要素の総
和を求める。θ３の場合には式０湯でＰ＝２として、Δ
ｆ。

の総和を求め、ΔθＪ−とする。

つぎに、ステップ８０５では、パラメータθ１の変更量
Δθｊを式（８）に従った計算により求める。

ステップ８０６では、パラメータの変更量Δθ、があま
り太き（ならないように、小さな値の定数δと一δとの
間になるように修正する。もし、δより大きい場合には
Δθ、をδに置換し、もし−δより小さい場合には、−
δにＷ摸する。

以上のステップ８０２からステップ８０８までの処理を
、全パラメータに対して実行した後に、ステップ８０９
において全パラメータの変更量（Δθ、）（１≦ｊ≦パ
ラメータ数）を求める。

この変更量を基に、第一図のステップ１１１でパラメー
タの変更を行い、ステップ１０４がら認識処理を再試行
し、確信度がしきい値以上になり、認識結果得られるか
、繰り返し回数がしきい値以上になり棄却されるまで、
以上のステ・ンブ１０４からステップ１１０の処理を繰
り返して行う。

次に第３の発明の文字認識方法の実施例を説明する。全
体の処理の流れは、第１の発明の文字認識方法と同様に
第１図の流れに従う。その内容は、ステップ１１０のパ
ラメータ変更量の計算を除いて第１図の内容と同様であ
り説明を省略する。本実施例の文字認識方法パラメータ
変更量の計算ステップ１１０の詳細な説明を第９図を用
いて行う。

よす、ステップ９０１では、第８図の場合と同様に、確
信度Ｒを高めるための特徴ベクトルｆ。

（１≦ｉ≦Ｎ、）の変更量Δｆ１を式（７）に従った計
算により求める。

次にステップ９０２からステップ９０４で、パラメータ
θｊによる特徴ベクトルの要素ｆ、の変化量ΔｆＩＪを
求める。ステップ９０２では、パラメータθ、を少量増
加させてθ、＋Δθ、として特徴抽出を行い、その結果
の特徴ベクトルを［ｆ　ｉ”］を求める。次に同様にし
て、ステップ９０３において、パラメータθ１を少量減
少させてθｊ−Δθ１として特徴抽出を行い、その結果
の特徴ベクトルを［ｆｉ’−］を求める。その後、ステ
ップ９０４において、パラメータθ、が特徴ベクトルに
与える影響量として、列ベクトル［Δｆ　ｉ’］を式（
９）に従った計算により求める。

ステップ９０２からステップ９０４までの処理を全パラ
メータに対して行うことにより、パラメータ数の特徴量
の変更ベクトル［Δｆ１″］が得られる。

これらを行方向に並べることにより、行列［Δｆ、゛］
が得られ、これを行列Ｂとする。Ｂの擬逆行列Ｂｔは、
ステップ９０５で以下の式に従って計算される。

Ｂｔ＝Ｂ”（ＢＢ”）−’　　　　　　　　　　　　圓
ここでＢ′″は、行列Ｂの随伴行列を表し、Ｘ　−１は
Ｘの逆行列を表す。

ステップ９０６では、ステップ９０１で求められている
特徴量の変更量の列ベクトル［Δｆｉ］をＡとし上記の
Ｂｔとから、式（ＩＱに従ってパラメータの変更量の列
ベクトル［Δθｊ′］であるＣが求められる。

ステップ９０７では、パラメータの変更量Δθ１があま
り大きくならないように、小さな値の定数δと−δとの
間にはいるように修正する。もし、δより大きい場合に
はΔθ１′をδに置換し、もし−δより小さい場合には
、−δに置換する。

この変更量を基に、第１図ステップ１１１でパラメータ
の変更を行い、ステップ１０４から認識処理を再試行し
、確信度がしきい値以上になり、認識結果得られるか、
繰り返し回数がしきい値以上になり棄却されるまで、以
上のステップ１０４からステップ１１０の処理を繰り返
して行う。

ここでは、文字輪郭線の方向と曲率に関する特徴量を用
いて本発明の実施例を述べたが、他の特徴抽出方法につ
いてもいくつかのパラメータへの拡張は容易に行える。

〔発明の効果〕

以上の説明から明らかなように、本発明の文字認識方法
では、認識結果の信軌性を評価する確信度を定義した上
で、文字認識での特徴抽出で用いられるパラメータを認
識結果の確信度を高めるという規範に基づいて、入力文
字の変形に適応的にしかも自動的に調節を行い、その結
果の確信度の高い認識結果のみを出力する。これによっ
てパラメータの設定が微妙に影響して、本来充分認識で
きる程度の質の文字画像であるにも拘わらず、認識結果
を棄却して、認識結果が得られなかったものを、本発明
の文字認識方法を用いることによって、特徴抽出のパラ
メータが調節され、正しい認識を得ることができる。ま
た、非常に質が悪（人間がみても認識できないような文
字画像は、何度パラメータを調節しても高い確信度が得
られないために、従来と同様に棄却される。よって、誤
認識率を増加させることなく、棄却率を減少させ、認識
率を増加させて、全体的に認識性能を向上させることが
できる。

【図面の簡単な説明】

第１図は、本発明の文字認識方法の処理全体の流れ図、第２図は、特徴ベクトルの計算方法の流れ図、第３図は
、特徴ベクトル計算での局所構造を抽出する処理を示す
流れ図、第４図は、抽出された文字の輪郭線の局所構造の例を示
す図、第５図は、抽出された局所構造から特徴ベクトルに変換
する方法を示す流れ図、第６図は、多層神経回路網の計算方法を示す図、第７図
は、第１の発明の文字認識方法での特徴抽出でのパラメ
ータの変更量を計算する方法を示す図、第８図は、第２の発明の文字認識方法での特徴抽出での
パラメータの変更量を計算する方法を示す図、第９図は、第３の発明の文字認識方法での特徴抽出での
パラメータの変更量を計算する方法を示す図である。

Claims

【特許請求の範囲】

（１）文字画像から特徴を計算して多層神経回路網によ
り識別処理を行う文字認識方法において、文字画像から
複数のパラメータ値を用いて特徴抽出を行うステップと
、それによって得られた特徴ベクトルを入力して、各カテ
ゴリ毎のスコアを出力する多層神経回路網を計算するス
テップと、多層神経回路網の出力から出力結果の確信度を計算し、
その確信度をしきい値と比較して、しきい値よりも高け
れば認識結果をそのまま出力するステップと、もししきい値よりも低ければ、各パラメータを一定値増
減させて確信度を求め、確信度が高くなった場合のパラ
メータの変更量を求めるステップと、全パラメータについて変更量を求めた後に、全パラメー
タを変更して特徴抽出から再試行することを制御するス
テップとを、含むことを特徴とする文字認識方法。
（２）文字画像から特徴を計算して多層神経回路網によ
り識別処理を行う文字認識方法において、文字画像から
複数のパラメータ値を用いて特徴抽出を行うステップと
、それによって得られた特徴ベクトルを入力して、各カテ
ゴリ毎のスコアを出力する多層神経回路網を計算するス
テップと、多層神経回路網の出力から出力結果の確信度を計算し、
その確信度をしきい値と比較して、しきい値よりも高け
れば認識結果をそのまま出力するステップと、もししきい値よりも低ければ、確信度を高めるように多
層神経回路網に入力する特徴ベクトルが変化すべき量を
求めるステップと、１つのパラメータが影響を与える特徴ベクトル内の要素
の変更量の和を求めるステップと、特徴ベクトルの変化
量の和に基づいて特徴抽出でのパラメータ値を変更する
ステップと、変更したパラメータ値を用いて特徴抽出から再試行する
ことを制御するステップとを、含むことを特徴とする文字認識方法。
（３）文字画像から特徴を計算して多層神経回路網によ
り識別処理を行う文字認識方法において、文字画像から
複数のパラメータ値を用いて特徴抽出を行うステップと
、それによって得られた特徴ベクトルを入力して、各カテ
ゴリ毎のスコアを出力する多層神経回路網を計算するス
テップと、多層神経回路網の出力から出力結果の確信度を計算し、
その確信度をしきい値と比較して、しきい値よりも高け
れば認識結果をそのまま出力するステップと、もししきい値よりも低ければ、確信度を高めるように多
層神経回路網に入力する特徴ベクトルが変化すべき量を
求めるステップと、１つのパラメータを増減させた場合の特徴ベクトルの変
化量を求め、全パラメータに対する特徴ベクトルの変化
量の組による行列の擬逆行列と特徴ベクトルが変化すべ
き量を表すベクトルとの積から各パラメータを変更する
量を求めるステップと、変更したパラメータ値を用いて特徴抽出から再試行する
ことを制御するステップとを、含むことを特徴とする文字認識方法。