JPH11175660A - 文字認識方法及び装置及び文字認識プログラムを格納した記憶媒体 - Google Patents
文字認識方法及び装置及び文字認識プログラムを格納した記憶媒体Info
- Publication number
- JPH11175660A JPH11175660A JP9337388A JP33738897A JPH11175660A JP H11175660 A JPH11175660 A JP H11175660A JP 9337388 A JP9337388 A JP 9337388A JP 33738897 A JP33738897 A JP 33738897A JP H11175660 A JPH11175660 A JP H11175660A
- Authority
- JP
- Japan
- Prior art keywords
- candidate
- template
- character pattern
- additional template
- category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【課題】 誤読となった文字パターンは学習後は正読と
なり、かつ学習前には正読であった他カテゴリの文字パ
ターンが学習により誤読となることを抑制することが可
能な文字認識方法及び装置及び文字認識プログラムを格
納した記憶媒体を提供する。 【解決手段】 本発明は、誤読となった入力文字パター
ンを正解カテゴリの追加テンプレートとして登録してお
き、新たな入力文字パターンに対しては、標準テンプレ
ートを用いて候補を選出し、該候補の指定する追加テン
プレートを用いて別の候補を選出し、これらの候補の中
から予め定めた条件により候補を出力し、追加テンプレ
ートを用いて取得した距離が、所定値以下の場合は、該
追加テンプレートに対応するカテゴリを候補として受理
し、該所定値より大きい場合は、該追加テンプレートに
対応するカテゴリを候補から棄却し、追加テンプレート
の登録後に、正読となった入力文字パターン数から誤読
となった入力文字パターン数を減算した値が所定値以下
となったとき、該追加テンプレートを削除する。
なり、かつ学習前には正読であった他カテゴリの文字パ
ターンが学習により誤読となることを抑制することが可
能な文字認識方法及び装置及び文字認識プログラムを格
納した記憶媒体を提供する。 【解決手段】 本発明は、誤読となった入力文字パター
ンを正解カテゴリの追加テンプレートとして登録してお
き、新たな入力文字パターンに対しては、標準テンプレ
ートを用いて候補を選出し、該候補の指定する追加テン
プレートを用いて別の候補を選出し、これらの候補の中
から予め定めた条件により候補を出力し、追加テンプレ
ートを用いて取得した距離が、所定値以下の場合は、該
追加テンプレートに対応するカテゴリを候補として受理
し、該所定値より大きい場合は、該追加テンプレートに
対応するカテゴリを候補から棄却し、追加テンプレート
の登録後に、正読となった入力文字パターン数から誤読
となった入力文字パターン数を減算した値が所定値以下
となったとき、該追加テンプレートを削除する。
Description
【0001】
【発明の属する技術分野】本発明は、文字認識方法及び
装置及び文字認識プログラムを格納した記憶媒体に係
り、特に、認識処理に用いる辞書を学習し、認識性能の
向上を図る文字認識方法及び装置及び文字認識プログラ
ムを格納した記憶媒体に関する。
装置及び文字認識プログラムを格納した記憶媒体に係
り、特に、認識処理に用いる辞書を学習し、認識性能の
向上を図る文字認識方法及び装置及び文字認識プログラ
ムを格納した記憶媒体に関する。
【0002】
【従来の技術】従来の文字認識方法及び装置では、カテ
ゴリ毎に多量の文字パターンを収集し、当該文字パター
ンを用いて作成した辞書を辞書メモリに格納しておき、
入力文字パターンと辞書との照合により認識する方法が
採られている。最近では、文字パターンの統計的分布を
考慮した認識手法が効果的であることが明らかになり、
従って、文字認識時に使用される辞書も統計的分布を考
慮して作成されている。しかし、当該認識方法は、認識
対象とする文字パターンの分布が辞書作成時点での分布
と大きく異なる場合、これに対処することができず、十
分な認識性能が得られないという問題がある。
ゴリ毎に多量の文字パターンを収集し、当該文字パター
ンを用いて作成した辞書を辞書メモリに格納しておき、
入力文字パターンと辞書との照合により認識する方法が
採られている。最近では、文字パターンの統計的分布を
考慮した認識手法が効果的であることが明らかになり、
従って、文字認識時に使用される辞書も統計的分布を考
慮して作成されている。しかし、当該認識方法は、認識
対象とする文字パターンの分布が辞書作成時点での分布
と大きく異なる場合、これに対処することができず、十
分な認識性能が得られないという問題がある。
【0003】そこで、認識性能の向上を図るために、辞
書を学習する方式が種々提唱されている。辞書学習方式
としては、各カテゴリ毎に予め格納してある標準テンプ
レートを当該カテゴリに正読あるいは、誤読された文字
パターンを用いて逐次修正する方式と、誤読された文字
パターンを新たなテンプレートとして追加登録する方式
とに大別される。
書を学習する方式が種々提唱されている。辞書学習方式
としては、各カテゴリ毎に予め格納してある標準テンプ
レートを当該カテゴリに正読あるいは、誤読された文字
パターンを用いて逐次修正する方式と、誤読された文字
パターンを新たなテンプレートとして追加登録する方式
とに大別される。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の辞書の逐次修正方式は、辞書作成に使用した文字パ
ターンの分布と認識対象とすべき文字パターンの分布と
が大きく異なる場合、標準テンプレートは学習によりそ
の中間点付近に収束し、その結果、認識対象とすべき文
字パターン及び標準テンプレート作成に使用した文字パ
ターンの認識性能はいずれも低下し、文字パターンの総
合的分布を考慮した辞書の形成は難しいという問題があ
る。
来の辞書の逐次修正方式は、辞書作成に使用した文字パ
ターンの分布と認識対象とすべき文字パターンの分布と
が大きく異なる場合、標準テンプレートは学習によりそ
の中間点付近に収束し、その結果、認識対象とすべき文
字パターン及び標準テンプレート作成に使用した文字パ
ターンの認識性能はいずれも低下し、文字パターンの総
合的分布を考慮した辞書の形成は難しいという問題があ
る。
【0005】これに対し、前述のテンプレートの追加登
録方式は、標準テンプレートはそのまま保持し、誤読さ
れた入力パターンから新たなテンプレートを生成して登
録する方策を採ることにより上記の問題点の解決を図ろ
うとしている。最初に試みられた方法は、外字即時登録
を流用した方法であり、誤読となった文字パターンから
生成したテンプレートを単純に登録する方法である。当
該方法は、登録したテンプレートに近い字形で書かれた
文字パターンは登録後は、正読となる正作用を有してい
る。しかし、当該情報は、僅か1パターンで以て追加テ
ンプレートを作成するので、統計的性質が反映されてお
らず、不安定であること、また、追加テンプレートの近
傍に存在する標準テンプレートを考慮した登録とはなっ
ていないため、追加テンプレート登録前には正読であっ
た近傍の標準テンプレートに属する文字パターンが追加
テンプレート登録後には、誤読となる副作用の問題点が
ある。
録方式は、標準テンプレートはそのまま保持し、誤読さ
れた入力パターンから新たなテンプレートを生成して登
録する方策を採ることにより上記の問題点の解決を図ろ
うとしている。最初に試みられた方法は、外字即時登録
を流用した方法であり、誤読となった文字パターンから
生成したテンプレートを単純に登録する方法である。当
該方法は、登録したテンプレートに近い字形で書かれた
文字パターンは登録後は、正読となる正作用を有してい
る。しかし、当該情報は、僅か1パターンで以て追加テ
ンプレートを作成するので、統計的性質が反映されてお
らず、不安定であること、また、追加テンプレートの近
傍に存在する標準テンプレートを考慮した登録とはなっ
ていないため、追加テンプレート登録前には正読であっ
た近傍の標準テンプレートに属する文字パターンが追加
テンプレート登録後には、誤読となる副作用の問題点が
ある。
【0006】そこで、第1の問題である不安定さの解消
を狙いとして、同一カテゴリの誤読パターンを一定数以
上確保し、統計的処理を施して追加テンプレートを作成
する方法が採られている。しかし、当該方法では、誤読
先カテゴリの異なる誤読文字パターンに対して当統計的
処理を施しているため意味のある統計的処理が実現され
ているとは言い難い。例えば、カテゴリC0 に属する2
つのパターンP1 ,P 2 がそれぞれカテゴリC1 ,C2
に誤読されたとすると、P1 ,P2 の平均操作を行うこ
とにより、生成した追加テンプレートは、P1 ,P2 の
中間点付近に位置し、再度P1 ,P2 近傍の文字パター
ンが入力されたとき認識可能となる原理とはなっていな
い。
を狙いとして、同一カテゴリの誤読パターンを一定数以
上確保し、統計的処理を施して追加テンプレートを作成
する方法が採られている。しかし、当該方法では、誤読
先カテゴリの異なる誤読文字パターンに対して当統計的
処理を施しているため意味のある統計的処理が実現され
ているとは言い難い。例えば、カテゴリC0 に属する2
つのパターンP1 ,P 2 がそれぞれカテゴリC1 ,C2
に誤読されたとすると、P1 ,P2 の平均操作を行うこ
とにより、生成した追加テンプレートは、P1 ,P2 の
中間点付近に位置し、再度P1 ,P2 近傍の文字パター
ンが入力されたとき認識可能となる原理とはなっていな
い。
【0007】これに対処するため、正解カテゴリと誤読
カテゴリとを1組のペアとして捉え、ペア毎に誤読文字
パターンを収集し、追加テンプレートを作成する方法が
採られている。しかし、当該方法は、追加テンプレート
と当該テンプレートの近傍に位置する標準テンプレート
との競合を回避する手段は、講じられておらず、第2の
問題である副作用は依然として残されている。
カテゴリとを1組のペアとして捉え、ペア毎に誤読文字
パターンを収集し、追加テンプレートを作成する方法が
採られている。しかし、当該方法は、追加テンプレート
と当該テンプレートの近傍に位置する標準テンプレート
との競合を回避する手段は、講じられておらず、第2の
問題である副作用は依然として残されている。
【0008】本発明は、上記の点に鑑みなされたもの
で、誤読となった文字パターンは学習後は正読となり、
かつ学習前には正読であった他カテゴリの文字パターン
が学習により誤読となることを抑制することが可能な文
字認識方法及び装置及び文字認識プログラムを格納した
記憶媒体を提供することを目的とする。
で、誤読となった文字パターンは学習後は正読となり、
かつ学習前には正読であった他カテゴリの文字パターン
が学習により誤読となることを抑制することが可能な文
字認識方法及び装置及び文字認識プログラムを格納した
記憶媒体を提供することを目的とする。
【0009】
【課題を解決するための手段】第1の発明は、入力文字
パターンの特徴と標準テンプレート及び追加テンプレー
トの特徴との間で距離計算を行うことにより該入力文字
パターンの属するカテゴリを候補として出力する文字認
識方法において、誤読となった入力文字パターンを正解
カテゴリの追加テンプレートとして登録しておき(ステ
ップ1)、新たな入力文字パターンに対しては、最初
に、標準テンプレートを用いて第1の候補を選出し(ス
テップ2)、選出された第1の候補の指定する追加テン
プレートを用いて第2の候補を選出し(ステップ3)、
第1の候補と第2の候補の中から予め定めた条件により
候補を出力する階層的識別方法を採用し(ステップ
4)、追加テンプレートを用いて取得した距離が、予め
定めた第1の閾値以下の場合は、該追加テンプレートに
対応するカテゴリを候補として受理し、該第1の閾値よ
り大きい場合は、該追加テンプレートに対応するカテゴ
リを候補から棄却する候補受理判定を行い(ステップ
5)、第1の閾値を、入力文字パターンと標準テンプレ
ートとの間の距離の関数として、追加テンプレート毎に
設定し(ステップ6)、追加テンプレートの登録後に、
該追加テンプレートの作用により正読となった入力文字
パターン数から誤読となった入力文字パターン数を減算
した値が、予め定めた第2の閾値以下となったとき、該
追加テンプレートを削除する(ステップ7)。
パターンの特徴と標準テンプレート及び追加テンプレー
トの特徴との間で距離計算を行うことにより該入力文字
パターンの属するカテゴリを候補として出力する文字認
識方法において、誤読となった入力文字パターンを正解
カテゴリの追加テンプレートとして登録しておき(ステ
ップ1)、新たな入力文字パターンに対しては、最初
に、標準テンプレートを用いて第1の候補を選出し(ス
テップ2)、選出された第1の候補の指定する追加テン
プレートを用いて第2の候補を選出し(ステップ3)、
第1の候補と第2の候補の中から予め定めた条件により
候補を出力する階層的識別方法を採用し(ステップ
4)、追加テンプレートを用いて取得した距離が、予め
定めた第1の閾値以下の場合は、該追加テンプレートに
対応するカテゴリを候補として受理し、該第1の閾値よ
り大きい場合は、該追加テンプレートに対応するカテゴ
リを候補から棄却する候補受理判定を行い(ステップ
5)、第1の閾値を、入力文字パターンと標準テンプレ
ートとの間の距離の関数として、追加テンプレート毎に
設定し(ステップ6)、追加テンプレートの登録後に、
該追加テンプレートの作用により正読となった入力文字
パターン数から誤読となった入力文字パターン数を減算
した値が、予め定めた第2の閾値以下となったとき、該
追加テンプレートを削除する(ステップ7)。
【0010】第2の発明は、上記の条件を、候補受理判
定によって選出された追加テンプレートの候補数が零の
場合は標準テンプレートにより選出された候補を出力
し、候補数が1の場合は当該候補を出力し、該候補数が
2以上の場合は該候補の中で最小距離をとる候補を出力
するものとする。第3の発明は、上記の関数を、各カテ
ゴリに属する多数の文字パターンにおいて各文字パター
ンから最近傍に位置する文字パターンまでの距離の期待
値を標準テンプレートからの距離の関数として求めるこ
とにより、各カテゴリ毎に作成されるものとする。
定によって選出された追加テンプレートの候補数が零の
場合は標準テンプレートにより選出された候補を出力
し、候補数が1の場合は当該候補を出力し、該候補数が
2以上の場合は該候補の中で最小距離をとる候補を出力
するものとする。第3の発明は、上記の関数を、各カテ
ゴリに属する多数の文字パターンにおいて各文字パター
ンから最近傍に位置する文字パターンまでの距離の期待
値を標準テンプレートからの距離の関数として求めるこ
とにより、各カテゴリ毎に作成されるものとする。
【0011】図2は、本発明の原理構成図である。第4
の発明は、入力文字パターンの特徴と標準テンプレート
及び追加テンプレートの特徴との間で距離計算を行うこ
とにより、該入力文字パターンの属するカテゴリを候補
として出力する文字認識装置であって、誤読となった入
力文字パターンを正解カテゴリの追加テンプレート60
として登録しておき、新たな入力文字パターンに対して
は、最初に標準テンプレート50を用いて第1の候補を
選出し、次に該第1の候補の指定する追加テンプレート
60を用いて第2の候補を選出し、該第1の候補と該第
2の候補の中から予め定めた条件により候補を出力する
階層的識別手段10と、追加テンプレート60を用いて
得た距離が予め定めた第1の閾値以下の場合は、該追加
テンプレート60に対応するカテゴリを候補として受理
し、該第1の閾値より大きい場合は、該追加テンプレー
ト60に対応するカテゴリを候補から棄却する候補受理
判定手段20と、第1の閾値を入力文字パターンと標準
テンプレートとの間の距離の関数として追加テンプレー
ト60毎に与える設定手段30と、追加テンプレート6
0の登録後に、該追加テンプレート60の作用により正
読となった入力文字パターン数から誤読となった入力文
字パターン数を減算した値が予め定めた第2の閾値以下
となったとき、該追加テンプレート60を削除する淘汰
手段40とを有する。
の発明は、入力文字パターンの特徴と標準テンプレート
及び追加テンプレートの特徴との間で距離計算を行うこ
とにより、該入力文字パターンの属するカテゴリを候補
として出力する文字認識装置であって、誤読となった入
力文字パターンを正解カテゴリの追加テンプレート60
として登録しておき、新たな入力文字パターンに対して
は、最初に標準テンプレート50を用いて第1の候補を
選出し、次に該第1の候補の指定する追加テンプレート
60を用いて第2の候補を選出し、該第1の候補と該第
2の候補の中から予め定めた条件により候補を出力する
階層的識別手段10と、追加テンプレート60を用いて
得た距離が予め定めた第1の閾値以下の場合は、該追加
テンプレート60に対応するカテゴリを候補として受理
し、該第1の閾値より大きい場合は、該追加テンプレー
ト60に対応するカテゴリを候補から棄却する候補受理
判定手段20と、第1の閾値を入力文字パターンと標準
テンプレートとの間の距離の関数として追加テンプレー
ト60毎に与える設定手段30と、追加テンプレート6
0の登録後に、該追加テンプレート60の作用により正
読となった入力文字パターン数から誤読となった入力文
字パターン数を減算した値が予め定めた第2の閾値以下
となったとき、該追加テンプレート60を削除する淘汰
手段40とを有する。
【0012】第5の発明は、階層的識別手段10におけ
る条件を、候補受理判定手段によって選出された追加テ
ンプレートの候補数が零の場合は標準テンプレートによ
り選出された候補を出力し、候補数が1の場合は当該候
補を出力し、該候補数が2以上の場合は該候補の中で最
小距離をとる候補を出力するものである。第6の発明
は、設定手段30における関数は、各カテゴリに属する
多数の文字パターンにおいて各文字パターンから最近傍
に位置する文字パターンまでの距離の期待値を標準テン
プレートからの距離の関数として求めることにより、各
カテゴリ毎に作成される。
る条件を、候補受理判定手段によって選出された追加テ
ンプレートの候補数が零の場合は標準テンプレートによ
り選出された候補を出力し、候補数が1の場合は当該候
補を出力し、該候補数が2以上の場合は該候補の中で最
小距離をとる候補を出力するものである。第6の発明
は、設定手段30における関数は、各カテゴリに属する
多数の文字パターンにおいて各文字パターンから最近傍
に位置する文字パターンまでの距離の期待値を標準テン
プレートからの距離の関数として求めることにより、各
カテゴリ毎に作成される。
【0013】第7の発明は、入力文字パターンの特徴と
標準テンプレート及び追加テンプレートの特徴との間で
距離計算を行うことにより、該入力文字パターンの属す
るカテゴリを候補として出力する文字認識装置であっ
て、標準テンプレートを格納する辞書と、文字パターン
を入力する文字パターン入力手段と、文字パターン入力
手段により入力された文字パターンについて文字認識を
行うための特徴を抽出する特徴抽出手段と、特徴抽出手
段により抽出された特徴と、辞書に格納されている標準
テンプレートの特徴との間でカテゴリ毎に距離を計算
し、該距離の中で最小値をとる候補を最終結果として取
得する認識手段と、認識手段により取得された最終結果
が誤りである場合に、正解カテゴリに修正する認識結果
修正手段と、最終結果と正解カテゴリと文字パターンの
特徴とを用いて辞書にテンプレートを追加登録し、また
は、先に登録されている追加テンプレートを削除する辞
書学習手段とを有する。
標準テンプレート及び追加テンプレートの特徴との間で
距離計算を行うことにより、該入力文字パターンの属す
るカテゴリを候補として出力する文字認識装置であっ
て、標準テンプレートを格納する辞書と、文字パターン
を入力する文字パターン入力手段と、文字パターン入力
手段により入力された文字パターンについて文字認識を
行うための特徴を抽出する特徴抽出手段と、特徴抽出手
段により抽出された特徴と、辞書に格納されている標準
テンプレートの特徴との間でカテゴリ毎に距離を計算
し、該距離の中で最小値をとる候補を最終結果として取
得する認識手段と、認識手段により取得された最終結果
が誤りである場合に、正解カテゴリに修正する認識結果
修正手段と、最終結果と正解カテゴリと文字パターンの
特徴とを用いて辞書にテンプレートを追加登録し、また
は、先に登録されている追加テンプレートを削除する辞
書学習手段とを有する。
【0014】第8の発明は、認識手段において、追加テ
ンプレートに、標準テンプレート作成用文字パターンに
おいて各文字パターンから見て、最も近傍に位置するパ
ターンまでの距離である最隣接近傍パターン間距離に基
づいて設定されている有効半径領域内に存在する入力文
字パターンのみを認識対象とする。第9の発明は、入力
文字パターンの特徴と標準テンプレート及び追加テンプ
レートの特徴との間で距離計算を行うことにより、該入
力文字パターンの属するカテゴリを候補として出力する
文字認識プログラムを格納した記憶媒体であって、誤読
となった入力文字パターンを正解カテゴリの追加テンプ
レートとして登録しておき、新たな入力文字パターンに
対しては、最初に標準テンプレートを用いて第1の候補
を選出し、次に該第1の候補の指定する追加テンプレー
トを用いて第2の候補を選出し、該第1の候補と該第2
の候補の中から予め定めた条件により候補を出力する階
層的識別プロセスと、追加テンプレートを用いて得た距
離が予め定めた第1の閾値以下の場合は、該追加テンプ
レートに対応するカテゴリを候補として受理し、該第1
の閾値より大きい場合は、該追加テンプレートに対応す
るカテゴリを候補から棄却する候補受理判定プロセス
と、第1の閾値を入力文字パターンと標準テンプレート
との間の距離の関数として追加テンプレート毎に与える
設定プロセスと、追加テンプレートの登録後に、該追加
テンプレートの作用により正読となった入力文字パター
ン数から誤読となった入力文字パターン数を減算した値
が予め定めた第2の閾値以下となったとき、該追加テン
プレートを削除する淘汰プロセスとを有する。
ンプレートに、標準テンプレート作成用文字パターンに
おいて各文字パターンから見て、最も近傍に位置するパ
ターンまでの距離である最隣接近傍パターン間距離に基
づいて設定されている有効半径領域内に存在する入力文
字パターンのみを認識対象とする。第9の発明は、入力
文字パターンの特徴と標準テンプレート及び追加テンプ
レートの特徴との間で距離計算を行うことにより、該入
力文字パターンの属するカテゴリを候補として出力する
文字認識プログラムを格納した記憶媒体であって、誤読
となった入力文字パターンを正解カテゴリの追加テンプ
レートとして登録しておき、新たな入力文字パターンに
対しては、最初に標準テンプレートを用いて第1の候補
を選出し、次に該第1の候補の指定する追加テンプレー
トを用いて第2の候補を選出し、該第1の候補と該第2
の候補の中から予め定めた条件により候補を出力する階
層的識別プロセスと、追加テンプレートを用いて得た距
離が予め定めた第1の閾値以下の場合は、該追加テンプ
レートに対応するカテゴリを候補として受理し、該第1
の閾値より大きい場合は、該追加テンプレートに対応す
るカテゴリを候補から棄却する候補受理判定プロセス
と、第1の閾値を入力文字パターンと標準テンプレート
との間の距離の関数として追加テンプレート毎に与える
設定プロセスと、追加テンプレートの登録後に、該追加
テンプレートの作用により正読となった入力文字パター
ン数から誤読となった入力文字パターン数を減算した値
が予め定めた第2の閾値以下となったとき、該追加テン
プレートを削除する淘汰プロセスとを有する。
【0015】第10の発明は、階層的識別プロセスにお
ける条件を、候補受理判定プロセスによって選出された
追加テンプレートの候補数が零の場合は標準テンプレー
トにより選出された候補を出力し、候補数が1の場合は
当該候補を出力し、該候補数が2以上の場合は該候補の
中で最小距離をとる候補を出力するものとする。第11
の発明は、設定プロセスにおける関数を、各カテゴリに
属する多数の文字パターンにおいて各文字パターンから
最近傍に位置する文字パターンまでの距離の期待値を標
準テンプレートからの距離の関数として求めることによ
り、各カテゴリ毎に作成されるものとする。
ける条件を、候補受理判定プロセスによって選出された
追加テンプレートの候補数が零の場合は標準テンプレー
トにより選出された候補を出力し、候補数が1の場合は
当該候補を出力し、該候補数が2以上の場合は該候補の
中で最小距離をとる候補を出力するものとする。第11
の発明は、設定プロセスにおける関数を、各カテゴリに
属する多数の文字パターンにおいて各文字パターンから
最近傍に位置する文字パターンまでの距離の期待値を標
準テンプレートからの距離の関数として求めることによ
り、各カテゴリ毎に作成されるものとする。
【0016】上記のように、本発明において、認識手段
において、追加テンプレートに第1の閾値を半径とする
有効半径領域内に存在する入力文字パターンのみを識別
対象とし、また、当該有効半径は、標準テンプレート作
成用文字パターンにおいて各文字パターンから見て、最
も近傍に位置するパターンまでの距離である最隣接近傍
パターン間距離に基づいて設定されているため、標準テ
ンプレートの勢力圏に元来存在している文字パターンを
意識した識別となっており、従来の手法で生じていた副
作用を軽減できる。
において、追加テンプレートに第1の閾値を半径とする
有効半径領域内に存在する入力文字パターンのみを識別
対象とし、また、当該有効半径は、標準テンプレート作
成用文字パターンにおいて各文字パターンから見て、最
も近傍に位置するパターンまでの距離である最隣接近傍
パターン間距離に基づいて設定されているため、標準テ
ンプレートの勢力圏に元来存在している文字パターンを
意識した識別となっており、従来の手法で生じていた副
作用を軽減できる。
【0017】また、追加テンプレートは、正作用、副作
用の得失点差に基づく評価値により、淘汰させるため、
仮に不適切な誤読文字パターンが追加テンプレートとし
て登録されたとしても長期間使用される間には削除さ
れ、辞書は、時々刻々入力される文字パターンに適応し
ていく。従って、従来問題となっていた登録の不安定さ
と副作用の低減との両方が可能となる。
用の得失点差に基づく評価値により、淘汰させるため、
仮に不適切な誤読文字パターンが追加テンプレートとし
て登録されたとしても長期間使用される間には削除さ
れ、辞書は、時々刻々入力される文字パターンに適応し
ていく。従って、従来問題となっていた登録の不安定さ
と副作用の低減との両方が可能となる。
【0018】
【発明の実施の形態】図3は、本発明の文字認識装置の
構成を示す。実線は、各構成部間のデータの流れを示
し、破線は、制御部9の制御信号の流れを示す。同図に
示す文字認識装置は、文字パターン入力部1、前処理部
2、特徴抽出部3、認識部4、辞書5、認識結果メモリ
部6、認識結果修正部7、辞書学習部8及び制御部9か
ら構成される。
構成を示す。実線は、各構成部間のデータの流れを示
し、破線は、制御部9の制御信号の流れを示す。同図に
示す文字認識装置は、文字パターン入力部1、前処理部
2、特徴抽出部3、認識部4、辞書5、認識結果メモリ
部6、認識結果修正部7、辞書学習部8及び制御部9か
ら構成される。
【0019】文字パターン入力部1は、スキャナ、テレ
ビカメラ等の入力装置により文字パターンを取り込む。
前処理部2は、入力された文字パターンについて正規化
・雑音除去等を行う。特徴抽出部3は、認識に使用する
ための特徴を抽出する。認識部4は、文字パターンの特
徴と辞書5に格納されている標準テンプレートの特徴と
の間でカテゴリ毎に距離を計算し、当該距離の中で最小
値をとる候補を最終結果として認識結果メモリ部6に出
力する。以下の説明において、距離としては、任意の2
パターンの座標のみを用いて計算される距離、例えば、
シティ・ブロック距離、ユークリッド距離等を用いる。
ビカメラ等の入力装置により文字パターンを取り込む。
前処理部2は、入力された文字パターンについて正規化
・雑音除去等を行う。特徴抽出部3は、認識に使用する
ための特徴を抽出する。認識部4は、文字パターンの特
徴と辞書5に格納されている標準テンプレートの特徴と
の間でカテゴリ毎に距離を計算し、当該距離の中で最小
値をとる候補を最終結果として認識結果メモリ部6に出
力する。以下の説明において、距離としては、任意の2
パターンの座標のみを用いて計算される距離、例えば、
シティ・ブロック距離、ユークリッド距離等を用いる。
【0020】認識結果修正部7は、認識部4で出力され
た最終結果が誤りである場合に、正解カテゴリに修正す
る。辞書学習部8は、認識部4から出力された最終結果
と、認識結果修正部7で求められた正解カテゴリと、特
徴抽出部3で得られた文字パターンの特徴とを用いて辞
書5にテンプレートを追加登録し、あるいは、先に登録
されている追加テンプレートを削除することにより辞書
5を適応化する。
た最終結果が誤りである場合に、正解カテゴリに修正す
る。辞書学習部8は、認識部4から出力された最終結果
と、認識結果修正部7で求められた正解カテゴリと、特
徴抽出部3で得られた文字パターンの特徴とを用いて辞
書5にテンプレートを追加登録し、あるいは、先に登録
されている追加テンプレートを削除することにより辞書
5を適応化する。
【0021】
【実施例】以下、図面と共に本発明の実施例を説明す
る。以下、前述の図3の構成に基づいて説明する。ま
ず、辞書5について説明する。図4は、本発明の一実施
例の辞書の構成を示す。
る。以下、前述の図3の構成に基づいて説明する。ま
ず、辞書5について説明する。図4は、本発明の一実施
例の辞書の構成を示す。
【0022】同図に示す辞書5は、辞書ヘッダ51、標
準テンプレート52、追加テンプレート53から構成さ
れる。辞書作成時点で存在するのは、辞書ヘッダ51、
標準テンプレート52であり、追加テンプレート53
は、当該標準テンプレート52の属するカテゴリに誤読
された他カテゴリの入力文字パターンから形成されたも
のである。
準テンプレート52、追加テンプレート53から構成さ
れる。辞書作成時点で存在するのは、辞書ヘッダ51、
標準テンプレート52であり、追加テンプレート53
は、当該標準テンプレート52の属するカテゴリに誤読
された他カテゴリの入力文字パターンから形成されたも
のである。
【0023】図4を用いて辞書5の詳細構成及び探索機
能について説明する。辞書ヘッダ51には先頭から順に
カテゴリ数511、第1の標準テンプレートの先頭アド
レス512、第nカテゴリの標準テンプレートの先頭ア
ドレス513、第Nカテゴリの標準テンプレートの先頭
アドレス514、辞書の最終アドレス515が格納され
ている。
能について説明する。辞書ヘッダ51には先頭から順に
カテゴリ数511、第1の標準テンプレートの先頭アド
レス512、第nカテゴリの標準テンプレートの先頭ア
ドレス513、第Nカテゴリの標準テンプレートの先頭
アドレス514、辞書の最終アドレス515が格納され
ている。
【0024】辞書ヘッダ51の下には、標準テンプレー
ト52が配置されており、カテゴリ1、カテゴリ2、
…、カテゴリNの順の並びとなっている。図4の例で
は、辞書ヘッダ51で第nカテゴリの先頭アドレス51
2を知ることにより第nカテゴリの標準テンプレート5
20にアクセスする様子が矢印で示されている。第nカ
テゴリの標準テンプレート520は、カテゴリ名520
1、次アドレス5202、特徴値5203から成ってい
る。次アドレス5202は、第nカテゴリの標準テンプ
レート520に追加テンプレートが存在するときにアク
セスする番地を表すものであり、追加テンプレートが存
在しない場合は“0”が格納されている。
ト52が配置されており、カテゴリ1、カテゴリ2、
…、カテゴリNの順の並びとなっている。図4の例で
は、辞書ヘッダ51で第nカテゴリの先頭アドレス51
2を知ることにより第nカテゴリの標準テンプレート5
20にアクセスする様子が矢印で示されている。第nカ
テゴリの標準テンプレート520は、カテゴリ名520
1、次アドレス5202、特徴値5203から成ってい
る。次アドレス5202は、第nカテゴリの標準テンプ
レート520に追加テンプレートが存在するときにアク
セスする番地を表すものであり、追加テンプレートが存
在しない場合は“0”が格納されている。
【0025】図4の第nカテゴリの標準テンプレート5
20の例では、追加テンプレートが存在し、第1追加テ
ンプレート530にアクセスする様子が矢印で示されて
いる。標準テンプレート52の下には追加テンプレート
53が登録された順に配置されている。第nカテゴリの
第1追加テンプレート530は、先頭からカテゴリ名5
301、追加テンプレート番号5302、次アドレス5
303、有効半径5304、評価得点5305、特徴値
5306が順に格納されている。次アドレス5303
は、第2テンプレートが存在するときに、アクセスする
番地を表すものであり、第2追加テンプレートが存在し
ない場合は、“0”が格納されている。
20の例では、追加テンプレートが存在し、第1追加テ
ンプレート530にアクセスする様子が矢印で示されて
いる。標準テンプレート52の下には追加テンプレート
53が登録された順に配置されている。第nカテゴリの
第1追加テンプレート530は、先頭からカテゴリ名5
301、追加テンプレート番号5302、次アドレス5
303、有効半径5304、評価得点5305、特徴値
5306が順に格納されている。次アドレス5303
は、第2テンプレートが存在するときに、アクセスする
番地を表すものであり、第2追加テンプレートが存在し
ない場合は、“0”が格納されている。
【0026】図4の第1テンプレートの例では、次アド
レス5303の内容が“0”となっているので、辞書探
索はこれで終了することになる。本発明における認識部
4の動作の例を説明する。図5は、本発明の一実施例の
認識部の処理を示すフローチャートである。 ステップ101) 特徴抽出部3から入力文字パターン
の特徴値が送出されると、認識部4は、まず、辞書5に
格納されている標準テンプレートの特徴値5203との
距離をカテゴリ1からカテゴリNまで各カテゴリ毎に計
算する。
レス5303の内容が“0”となっているので、辞書探
索はこれで終了することになる。本発明における認識部
4の動作の例を説明する。図5は、本発明の一実施例の
認識部の処理を示すフローチャートである。 ステップ101) 特徴抽出部3から入力文字パターン
の特徴値が送出されると、認識部4は、まず、辞書5に
格納されている標準テンプレートの特徴値5203との
距離をカテゴリ1からカテゴリNまで各カテゴリ毎に計
算する。
【0027】ステップ102) 最小の距離を有するカ
テゴリに対応する候補を求める。 ステップ103) 次に、求められた候補の標準テンプ
レートの次アドレスを見ることにより、追加テンプレー
トを有するか否かのチェックを行う。追加テンプレート
がない場合にはステップ104に移行し、ある場合には
ステップ105に移行する。
テゴリに対応する候補を求める。 ステップ103) 次に、求められた候補の標準テンプ
レートの次アドレスを見ることにより、追加テンプレー
トを有するか否かのチェックを行う。追加テンプレート
がない場合にはステップ104に移行し、ある場合には
ステップ105に移行する。
【0028】ステップ104) 次アドレスが“0”で
あれば、上記の候補のカテゴリは追加テンプレートを保
有せず、上記の候補が最終結果として認識結果メモリ6
に出力される。 ステップ105) 次アドレスが正値である場合は、次
アドレスの指示する番地に飛び、追加テンプレートを読
み出す。当該追加テンプレートは他カテゴリでありなが
ら以前に、候補に誤って認識されたパターンから生成さ
れ、登録されたテンプレートである。追加テンプレート
の特徴値と、文字パターンの特徴値との間で距離計算を
行う。
あれば、上記の候補のカテゴリは追加テンプレートを保
有せず、上記の候補が最終結果として認識結果メモリ6
に出力される。 ステップ105) 次アドレスが正値である場合は、次
アドレスの指示する番地に飛び、追加テンプレートを読
み出す。当該追加テンプレートは他カテゴリでありなが
ら以前に、候補に誤って認識されたパターンから生成さ
れ、登録されたテンプレートである。追加テンプレート
の特徴値と、文字パターンの特徴値との間で距離計算を
行う。
【0029】ステップ106) 計算された距離が有効
半径以下であれば、追加テンプレートのカテゴリ名を候
補として保持し、有効半径より大きい場合は、棄却する
という候補受理判定を行う。 ステップ107) 受理された追加テンプレートの数が
0の場合には、ステップ104に移行し、候補の追加テ
ンプレートは当該追加テンプレートで終了していること
を示し、正値であれば、次アドレスの指示する番地へ飛
び、上記と同様の処理を繰り返し実行する。そうでない
場合にはステップ108に移行する。 ステップ108) 次アドレスの値が0となった時点
で、保持された追加テンプレートの候補数をカウント
し、候補数が0であれば、標準テンプレートを用いて認
識したときの最小距離に対応する候補を最終結果とす
る。当該候補数が1のときは、当該候補を出力する。当
該候補数が2以上の場合は、追加テンプレートの候補の
中で最小距離に対応する候補を出力する。
半径以下であれば、追加テンプレートのカテゴリ名を候
補として保持し、有効半径より大きい場合は、棄却する
という候補受理判定を行う。 ステップ107) 受理された追加テンプレートの数が
0の場合には、ステップ104に移行し、候補の追加テ
ンプレートは当該追加テンプレートで終了していること
を示し、正値であれば、次アドレスの指示する番地へ飛
び、上記と同様の処理を繰り返し実行する。そうでない
場合にはステップ108に移行する。 ステップ108) 次アドレスの値が0となった時点
で、保持された追加テンプレートの候補数をカウント
し、候補数が0であれば、標準テンプレートを用いて認
識したときの最小距離に対応する候補を最終結果とす
る。当該候補数が1のときは、当該候補を出力する。当
該候補数が2以上の場合は、追加テンプレートの候補の
中で最小距離に対応する候補を出力する。
【0030】最終結果及び当該最終結果のとる距離は、
認識部4から出力され、認識結果メモリ部6に格納され
る。認識結果修正部7は、認識結果に正読/誤読の区別
を表す正誤フラグ、及び誤読の場合は正解カテゴリを付
与して辞書学習部8に送出する。次に、本発明の主旨で
ある辞書学習部8の動作を図6及び図7を用いて説明す
る。
認識部4から出力され、認識結果メモリ部6に格納され
る。認識結果修正部7は、認識結果に正読/誤読の区別
を表す正誤フラグ、及び誤読の場合は正解カテゴリを付
与して辞書学習部8に送出する。次に、本発明の主旨で
ある辞書学習部8の動作を図6及び図7を用いて説明す
る。
【0031】図6は、本発明の一実施例の辞書学習部の
構成を示す。辞書学習部8は、正誤判定回路81、評価
得点更新回路82、追加テンプレート削除回路83、次
アドレス更新回路84、追加テンプレート登録回路8
5、有効半径設定回路86、評価得点初期設定回路8
7、半径情報生成回路88から構成される。
構成を示す。辞書学習部8は、正誤判定回路81、評価
得点更新回路82、追加テンプレート削除回路83、次
アドレス更新回路84、追加テンプレート登録回路8
5、有効半径設定回路86、評価得点初期設定回路8
7、半径情報生成回路88から構成される。
【0032】図7は、本発明の一実施例の辞書学習部の
処理を示すフローチャートである。 ステップ301) 正誤判定回路81は、認識結果修正
部7から送出されてきた正誤フラグの示す値により正読
/誤読で処理を振り分ける。誤読の場合にはステップ3
04に移行し、正読の場合にはステップ302に移行す
る。 ステップ302) 正読の場合で、最終結果が追加テン
プレートから得られているときは、評価得点更新回路8
2において、当該追加テンプレートの評価得点が1点加
算される。
処理を示すフローチャートである。 ステップ301) 正誤判定回路81は、認識結果修正
部7から送出されてきた正誤フラグの示す値により正読
/誤読で処理を振り分ける。誤読の場合にはステップ3
04に移行し、正読の場合にはステップ302に移行す
る。 ステップ302) 正読の場合で、最終結果が追加テン
プレートから得られているときは、評価得点更新回路8
2において、当該追加テンプレートの評価得点が1点加
算される。
【0033】ステップ303) 学習処理終了の信号が
制御部9へ送信され、次パターンの処理が開始される。
上記のように、正読の場合は評価得点5305の更新の
みがなされ、追加テンプレートの登録は行われない。 ステップ304) 誤読の場合は、次アドレス更新回路
84において次アドレスを更新し、追加テンプレート登
録回路85において追加テンプレートを登録する。
制御部9へ送信され、次パターンの処理が開始される。
上記のように、正読の場合は評価得点5305の更新の
みがなされ、追加テンプレートの登録は行われない。 ステップ304) 誤読の場合は、次アドレス更新回路
84において次アドレスを更新し、追加テンプレート登
録回路85において追加テンプレートを登録する。
【0034】ステップ305) 有効半径設定回路86
において、距離に基づいて候補受理判定処理を行い、評
価得点初期設定回路87において、評価得点に1を初期
設定する。 ステップ306) 最終結果の出力に使用されたテンプ
レートは追加テンプレートであるかを判定し、追加テン
プレートでない場合にはステップ303に移行する。
において、距離に基づいて候補受理判定処理を行い、評
価得点初期設定回路87において、評価得点に1を初期
設定する。 ステップ306) 最終結果の出力に使用されたテンプ
レートは追加テンプレートであるかを判定し、追加テン
プレートでない場合にはステップ303に移行する。
【0035】ステップ307) 追加テンプレートであ
る場合には、認識時に使用した追加テンプレートの評価
得点を1点減点する。 ステップ308) 評価得点が1以下であるかを判定
し、1より大きい場合にはステップ303に移行し、1
以下である場合にはステップ309に移行する。 ステップ309) 評価得点が1以下である場合には、
最終結果出力に使用された追加テンプレートを削除する
必要があると判定し、追加テンプレート削除回路83の
処理を行い、ステップ303に移行する。
る場合には、認識時に使用した追加テンプレートの評価
得点を1点減点する。 ステップ308) 評価得点が1以下であるかを判定
し、1より大きい場合にはステップ303に移行し、1
以下である場合にはステップ309に移行する。 ステップ309) 評価得点が1以下である場合には、
最終結果出力に使用された追加テンプレートを削除する
必要があると判定し、追加テンプレート削除回路83の
処理を行い、ステップ303に移行する。
【0036】追加テンプレート53は、標準テンプレー
ト52の下に形成されるが、最終結果の候補出力に使用
されたテンプレートが標準テンプレートか既設の追加テ
ンプレートかによって登録処理が異なる。登録処理の詳
細を以下に説明する。最終結果の候補出力に使用された
テンプレートが標準テンプレートである場合は、次アド
レス更新回路84は、次アドレスには最終アドレス51
5に“1”を加算した値を書込み、また、最終アドレス
515には現在格納されている値に1追加テンプレート
分のアドレスを加算した値を書き込む。追加テンプレー
ト登録回路85は、最終アドレス515に格納された値
を起点として、第nカテゴリの第1追加テンプレート5
20と同じ形式で誤読パターンを登録する。登録される
追加テンプレートのカテゴリ名には、正解カテゴリ名
が、追加テンプレート番号には、“1”が、次アドレス
には、“0”が、特徴値には誤読パターンの特徴値がそ
れぞれ格納される(ステップ304)。
ト52の下に形成されるが、最終結果の候補出力に使用
されたテンプレートが標準テンプレートか既設の追加テ
ンプレートかによって登録処理が異なる。登録処理の詳
細を以下に説明する。最終結果の候補出力に使用された
テンプレートが標準テンプレートである場合は、次アド
レス更新回路84は、次アドレスには最終アドレス51
5に“1”を加算した値を書込み、また、最終アドレス
515には現在格納されている値に1追加テンプレート
分のアドレスを加算した値を書き込む。追加テンプレー
ト登録回路85は、最終アドレス515に格納された値
を起点として、第nカテゴリの第1追加テンプレート5
20と同じ形式で誤読パターンを登録する。登録される
追加テンプレートのカテゴリ名には、正解カテゴリ名
が、追加テンプレート番号には、“1”が、次アドレス
には、“0”が、特徴値には誤読パターンの特徴値がそ
れぞれ格納される(ステップ304)。
【0037】有効半径設定回路86は、半径情報生成回
路88から読み出した情報に、後述する所定の処理を施
した値を有効半径に格納し、評価得点初期設定回路87
は、評価得点に“1”を格納する(ステップ305)。
最終結果出力に使用されたテンプレートは、標準テンプ
レートであるので、評価得点更新回路82、追加テンプ
レート削除回路83の処理は行われず(ステップ30
6)、学習終了の信号が制御部9へ送信され、次パター
ンの処理が開始される(ステップ303)。
路88から読み出した情報に、後述する所定の処理を施
した値を有効半径に格納し、評価得点初期設定回路87
は、評価得点に“1”を格納する(ステップ305)。
最終結果出力に使用されたテンプレートは、標準テンプ
レートであるので、評価得点更新回路82、追加テンプ
レート削除回路83の処理は行われず(ステップ30
6)、学習終了の信号が制御部9へ送信され、次パター
ンの処理が開始される(ステップ303)。
【0038】最終結果の候補出力に使用されたテンプレ
ートが既設の追加テンプレートの場合は、次アドレス更
新回路84は、当該追加テンプレートの次アドレスに最
終アドレス515の値に“1”を加算した値を書込み、
また、最終アドレス515には、現在格納されている値
に1追加テンプレート分のアドレスを加算した値を書き
込む。
ートが既設の追加テンプレートの場合は、次アドレス更
新回路84は、当該追加テンプレートの次アドレスに最
終アドレス515の値に“1”を加算した値を書込み、
また、最終アドレス515には、現在格納されている値
に1追加テンプレート分のアドレスを加算した値を書き
込む。
【0039】追加テンプレート登録回路85は、最終ア
ドレス515に格納された値を起点として、第nカテゴ
リの第1追加テンプレート520と同じ形式で誤読パタ
ーンを登録する。登録される追加テンプレートのカテゴ
リ名には、正解カテゴリ名が、追加テンプレート番号に
は最終結果のカテゴリが指定する最終追加テンプレート
の追加テンプレート番号に“1”を加算した値が、特徴
値には誤読文字パターンの特徴値がそれぞれ格納される
(ステップ304)。
ドレス515に格納された値を起点として、第nカテゴ
リの第1追加テンプレート520と同じ形式で誤読パタ
ーンを登録する。登録される追加テンプレートのカテゴ
リ名には、正解カテゴリ名が、追加テンプレート番号に
は最終結果のカテゴリが指定する最終追加テンプレート
の追加テンプレート番号に“1”を加算した値が、特徴
値には誤読文字パターンの特徴値がそれぞれ格納される
(ステップ304)。
【0040】有効半径設定回路86は、半径情報生成回
路88から得た情報に後述する所定の処理を施した値を
有効半径に格納し、評価得点初期設定回路87は、評価
得点5305に“1”を格納する(ステップ305)。
最終結果出力に使用されたテンプレートは、追加テンプ
レートであるので、評価得点更新回路82、追加テンプ
レート削除回路83の処理が行われる(ステップ30
6)。
路88から得た情報に後述する所定の処理を施した値を
有効半径に格納し、評価得点初期設定回路87は、評価
得点5305に“1”を格納する(ステップ305)。
最終結果出力に使用されたテンプレートは、追加テンプ
レートであるので、評価得点更新回路82、追加テンプ
レート削除回路83の処理が行われる(ステップ30
6)。
【0041】評価得点更新回路82は、最終結果を出力
した追加テンプレートの評価得点を“1”だけ減算する
(ステップ307)。当該評価得点の値が予め定めた第
2の閾値以下の場合のみ当該追加テンプレートを削除す
る。図7のフローチャートにおいて、第2の閾値は、
“−1”となっており、当該評価得点の値が非負の場合
は(ステップ308)、学習終了信号を制御部9に送出
し、次パターンの処理が開始される(ステップ30
3)。
した追加テンプレートの評価得点を“1”だけ減算する
(ステップ307)。当該評価得点の値が予め定めた第
2の閾値以下の場合のみ当該追加テンプレートを削除す
る。図7のフローチャートにおいて、第2の閾値は、
“−1”となっており、当該評価得点の値が非負の場合
は(ステップ308)、学習終了信号を制御部9に送出
し、次パターンの処理が開始される(ステップ30
3)。
【0042】当該評価得点の値が負の場合は(ステップ
308)、追加テンプレート削除回路83は、最終結果
を出力した追加テンプレートの情報を削除し、追加テン
プレートの下に存在する各追加テンプレートを1追加テ
ンプレート分だけ繰り上げて格納し、繰り上げて格納し
た各追加テンプレートの次アドレス5202の値を1追
加テンプレート分だけ減算した値に更新し、また、辞書
ヘッダ51の最終アドレス515の値を1追加テンプレ
ート分だけ減算した値に更新する(ステップ309)。
処理が終了すると学習終了信号が制御部9に送信され、
次パターンの処理が開始される(ステップ303)。
308)、追加テンプレート削除回路83は、最終結果
を出力した追加テンプレートの情報を削除し、追加テン
プレートの下に存在する各追加テンプレートを1追加テ
ンプレート分だけ繰り上げて格納し、繰り上げて格納し
た各追加テンプレートの次アドレス5202の値を1追
加テンプレート分だけ減算した値に更新し、また、辞書
ヘッダ51の最終アドレス515の値を1追加テンプレ
ート分だけ減算した値に更新する(ステップ309)。
処理が終了すると学習終了信号が制御部9に送信され、
次パターンの処理が開始される(ステップ303)。
【0043】有効半径設定回路86の処理動作を以下に
示す。有効半径設定回路86は、制御部9より追加テン
プレート登録の信号が送出されると、最終結果のカテゴ
リ名を登録すべきテンプレートのカテゴリ名mに読み換
え、最終結果で得られた距離dと共に半径情報生成回路
88に入力し、有効半径を設定するための情報を得る。
半径情報生成回路88は、カテゴリnと標準テンプレー
トからの距離sに応じて定まる関数Φn (s)(n=
1,2,…,N)の集合から成っており、有効半径設定
回路86の入力m、及び距離dに対し、関数Φm (d)
の値を返す。関数Φn (s)は、カテゴリnに属する文
字パターンを多量に収集し、各文字パターンにおける最
隣接近傍パターン間距離の期待値を標準テンプレートか
ら距離sの関数として求めたものであり、標準テンプレ
ートの形成する勢力圏において誤読先カテゴリの追加テ
ンプレートを登録するときに、当該勢力圏における最隣
接近傍パターン間距離に関する情報を与えるものであ
る。
示す。有効半径設定回路86は、制御部9より追加テン
プレート登録の信号が送出されると、最終結果のカテゴ
リ名を登録すべきテンプレートのカテゴリ名mに読み換
え、最終結果で得られた距離dと共に半径情報生成回路
88に入力し、有効半径を設定するための情報を得る。
半径情報生成回路88は、カテゴリnと標準テンプレー
トからの距離sに応じて定まる関数Φn (s)(n=
1,2,…,N)の集合から成っており、有効半径設定
回路86の入力m、及び距離dに対し、関数Φm (d)
の値を返す。関数Φn (s)は、カテゴリnに属する文
字パターンを多量に収集し、各文字パターンにおける最
隣接近傍パターン間距離の期待値を標準テンプレートか
ら距離sの関数として求めたものであり、標準テンプレ
ートの形成する勢力圏において誤読先カテゴリの追加テ
ンプレートを登録するときに、当該勢力圏における最隣
接近傍パターン間距離に関する情報を与えるものであ
る。
【0044】有効半径設定回路86は、半径情報生成回
路88から関数Φm (d)の値を得ると、登録すべき追
加テンプレートの有効半径にΦm (d)/2の値を格納
する。本実施例では、設定法をΦm (d)/2とした
が、これは、最近傍に存在するパターンの混入を防ぐた
め、最隣接近傍パターン間距離の期待値の1/2を採っ
たのであって、目的を達成するものであれば他の設定法
であってもよい。
路88から関数Φm (d)の値を得ると、登録すべき追
加テンプレートの有効半径にΦm (d)/2の値を格納
する。本実施例では、設定法をΦm (d)/2とした
が、これは、最近傍に存在するパターンの混入を防ぐた
め、最隣接近傍パターン間距離の期待値の1/2を採っ
たのであって、目的を達成するものであれば他の設定法
であってもよい。
【0045】上記のように、追加テンプレートの追加登
録及び削除が行われる。これにより辞書は時々刻々入力
される文字パターンの性質に適応した辞書を再構築する
ことがきるようになる。上記の実施例では、文字パター
ンの認識に距離を用いる例について説明したが、近さの
尺度が反映されている量であれば何であってもよい。但
し、類似度のように、尺度が大きい場合に認識の信頼性
が高くなる量については、一定値から類似度を減算した
値を用いる等、ある種の変換を施しておくことが必要と
なる。
録及び削除が行われる。これにより辞書は時々刻々入力
される文字パターンの性質に適応した辞書を再構築する
ことがきるようになる。上記の実施例では、文字パター
ンの認識に距離を用いる例について説明したが、近さの
尺度が反映されている量であれば何であってもよい。但
し、類似度のように、尺度が大きい場合に認識の信頼性
が高くなる量については、一定値から類似度を減算した
値を用いる等、ある種の変換を施しておくことが必要と
なる。
【0046】本実施例は、入力文字パターン1パターン
に対して認識・学習が行われる場合について述べたが、
誤読文字パターンをメモリに格納しておき、予め定めた
パターン数以上が確保されたとき、格納された誤読パタ
ーンを一括して学習する場合についても本実施例と同様
の処理が可能である。また、本発明の図3に示す各構成
要素をプログラムとして構築し、当該文字認識装置に接
続されるディスク装置や、フロッピーディスク、CD−
ROM等の可搬記憶媒体に格納しておき、当該文字認識
を行う際に、使用するコンピュータにインストールする
ことにより、容易に本発明を実現することが可能であ
る。
に対して認識・学習が行われる場合について述べたが、
誤読文字パターンをメモリに格納しておき、予め定めた
パターン数以上が確保されたとき、格納された誤読パタ
ーンを一括して学習する場合についても本実施例と同様
の処理が可能である。また、本発明の図3に示す各構成
要素をプログラムとして構築し、当該文字認識装置に接
続されるディスク装置や、フロッピーディスク、CD−
ROM等の可搬記憶媒体に格納しておき、当該文字認識
を行う際に、使用するコンピュータにインストールする
ことにより、容易に本発明を実現することが可能であ
る。
【0047】なお、本発明は、上記の実施例に限定され
ることなく、特許請求の範囲内で種々変更・応用が可能
である。
ることなく、特許請求の範囲内で種々変更・応用が可能
である。
【0048】
【発明の効果】上述のように、本発明によれば、標準テ
ンプレートを用いて候補を選出し、当該候補が指定する
追加テンプレートを用いて識別する階層的識別法を採
り、追加テンプレートを用いた識別においては、入力パ
ターンが予め定められた有効半径内に存在する場合に限
って候補を出力する候補受理判定を行い、登録されたテ
ンプレートの正副作用の得失点差に基づく評価値により
当該追加テンプレートを淘汰するため、登録した文字パ
ターンに近い字形の文字パターンは登録後は正読とな
り、かつ登録前に正読となっていた文字パターンが誤読
になることを抑制できる効果がある。
ンプレートを用いて候補を選出し、当該候補が指定する
追加テンプレートを用いて識別する階層的識別法を採
り、追加テンプレートを用いた識別においては、入力パ
ターンが予め定められた有効半径内に存在する場合に限
って候補を出力する候補受理判定を行い、登録されたテ
ンプレートの正副作用の得失点差に基づく評価値により
当該追加テンプレートを淘汰するため、登録した文字パ
ターンに近い字形の文字パターンは登録後は正読とな
り、かつ登録前に正読となっていた文字パターンが誤読
になることを抑制できる効果がある。
【0049】また、有効半径を与える半径情報生成回路
は外部から書換え可能なため、用途に応じた細かいチュ
ーニングにも適するという効果がある。
は外部から書換え可能なため、用途に応じた細かいチュ
ーニングにも適するという効果がある。
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明の文字認識装置の構成図である。
【図4】本発明の一実施例の辞書の構成図である。
【図5】本発明の一実施例の認識部の処理を示すフロー
チャートである。
チャートである。
【図6】本発明の一実施例の辞書学習部の構成図であ
る。
る。
【図7】本発明の一実施例の辞書学習部の処理を示すフ
ローチャートである。
ローチャートである。
1 文字パターン入力部 2 前処理部 3 特徴抽出部 4 認識部 5 辞書 6 認識結果メモリ部 7 認識結果修正部 8 辞書学習部 9 制御部 10 階層的識別手段 20 候補受理判定手段 30 設定手段 40 淘汰手段 50、52 標準テンプレート 51 辞書ヘッダ 60、53 追加テンプレート 70 条件 81 正誤判定回路 82 評価得点更新回路 83 追加テンプレート削除回路 84 次アドレス更新回路 85 追加テンプレート設定回路 86 有効半径設定回路 87 評価得点初期設定回路 88 半径情報生成回路
Claims (11)
- 【請求項1】 入力文字パターンの特徴と標準テンプレ
ート及び追加テンプレートの特徴との間で距離計算を行
うことにより該入力文字パターンの属するカテゴリを候
補として出力する文字認識方法において、 誤読となった入力文字パターンを正解カテゴリの追加テ
ンプレートとして登録しておき、 新たな入力文字パターンに対しては、最初に、前記標準
テンプレートを用いて第1の候補を選出し、 選出された前記第1の候補の指定する追加テンプレート
を用いて第2の候補を選出し、 前記第1の候補と前記第2の候補の中から予め定めた条
件により候補を出力する階層的識別方法を採用し、 前記追加テンプレートを用いて取得した距離が、予め定
めた第1の閾値以下の場合は、該追加テンプレートに対
応するカテゴリを候補として受理し、該第1の閾値より
大きい場合は、該追加テンプレートに対応するカテゴリ
を候補から棄却する候補受理判定を行い、 前記第1の閾値は、前記入力文字パターンと前記標準テ
ンプレートとの間の距離の関数として、追加テンプレー
ト毎に設定され、 前記追加テンプレートの登録後に、該追加テンプレート
の作用により正読となった入力文字パターン数から誤読
となった入力文字パターン数を減算した値が予め定めた
第2の閾値以下となったとき、該追加テンプレートを削
除することを特徴とする文字認識方法。 - 【請求項2】 前記条件は、 前記候補受理判定によって選出された前記追加テンプレ
ートの候補数が零の場合は前記標準テンプレートにより
選出された候補を出力し、前記候補数が1の場合は当該
候補を出力し、該候補数が2以上の場合は該候補の中で
最小距離をとる候補を出力するものである請求項1記載
の文字認識方法。 - 【請求項3】 前記関数は、 各カテゴリに属する多数の文字パターンにおいて各文字
パターンから最近傍に位置する文字パターンまでの距離
の期待値を標準テンプレートからの距離の関数として求
めることにより、各カテゴリ毎に作成される請求項1記
載の文字認識方法。 - 【請求項4】 入力文字パターンの特徴と標準テンプレ
ート及び追加テンプレートの特徴との間で距離計算を行
うことにより、該入力文字パターンの属するカテゴリを
候補として出力する文字認識装置であって、 誤読となった入力文字パターンを正解カテゴリの追加テ
ンプレートとして登録しておき、新たな入力文字パター
ンに対しては、最初に前記標準テンプレートを用いて第
1の候補を選出し、次に該第1の候補の指定する追加テ
ンプレートを用いて第2の候補を選出し、該第1の候補
と該第2の候補の中から予め定めた条件により候補を出
力する階層的識別手段と、 前記追加テンプレートを用いて得た距離が予め定めた第
1の閾値以下の場合は、該追加テンプレートに対応する
カテゴリを候補として受理し、該第1の閾値より大きい
場合は、該追加テンプレートに対応するカテゴリを候補
から棄却する候補受理判定手段と、 前記第1の閾値を前記入力文字パターンと前記標準テン
プレートとの間の距離の関数として前記追加テンプレー
ト毎に与える設定手段と、 前記追加テンプレートの登録後に、該追加テンプレート
の作用により正読となった入力文字パターン数から誤読
となった入力文字パターン数を減算した値が予め定めた
第2の閾値以下となったとき、該追加テンプレートを削
除する淘汰手段とを有することを特徴とする文字認識装
置。 - 【請求項5】 前記階層的識別手段における前記条件
は、 前記候補受理判定手段によって選出された前記追加テン
プレートの候補数が零の場合は前記標準テンプレートに
より選出された候補を出力し、前記候補数が1の場合は
当該候補を出力し、該候補数が2以上の場合は該候補の
中で最小距離をとる候補を出力するものである請求項4
記載の文字認識装置。 - 【請求項6】 前記設定手段における前記関数は、 各カテゴリに属する多数の文字パターンにおいて各文字
パターンから最近傍に位置する文字パターンまでの距離
の期待値を標準テンプレートからの距離の関数として求
めることにより、各カテゴリ毎に作成される請求項4記
載の文字認識装置。 - 【請求項7】 入力文字パターンの特徴と標準テンプレ
ート及び追加テンプレートの特徴との間で距離計算を行
うことにより、該入力文字パターンの属するカテゴリを
候補として出力する文字認識装置であって、 標準テンプレートを格納する辞書と、 文字パターンを入力する文字パターン入力手段と、 前記文字パターン入力手段により入力された文字パター
ンについて文字認識を行うための特徴を抽出する特徴抽
出手段と、 前記特徴抽出手段により抽出された特徴と、前記辞書に
格納されている前記標準テンプレートの特徴との間でカ
テゴリ毎に距離を計算し、該距離の中で最小値をとる候
補を最終結果として取得する認識手段と、 前記認識手段により取得された前記最終結果が誤りであ
る場合に、正解カテゴリに修正する認識結果修正手段
と、 前記最終結果と前記正解カテゴリと前記文字パターンの
特徴とを用いて前記辞書にテンプレートを追加登録し、
または、先に登録されている追加テンプレートを削除す
る辞書学習手段とを有することを特徴とする文字認識装
置。 - 【請求項8】 前記認識手段は、 追加テンプレートに、標準テンプレート作成用文字パタ
ーンにおいて各文字パターンから見て、最も近傍に位置
するパターンまでの距離である最隣接近傍パターン間距
離に基づいて設定されている有効半径領域内に存在する
入力文字パターンのみを認識対象とする請求項7記載の
文字認識装置。 - 【請求項9】 入力文字パターンの特徴と標準テンプレ
ート及び追加テンプレートの特徴との間で距離計算を行
うことにより、該入力文字パターンの属するカテゴリを
候補として出力する文字認識プログラムを格納した記憶
媒体であって、誤読となった入力文字パターンを正解カ
テゴリの追加テンプレートとして登録しておき、新たな
入力文字パターンに対しては、最初に標準テンプレート
を用いて第1の候補を選出し、次に該第1の候補の指定
する追加テンプレートを用いて第2の候補を選出し、該
第1の候補と該第2の候補の中から予め定めた条件によ
り候補を出力する階層的識別プロセスと、 追加テンプレートを用いて得た距離が予め定めた第1の
閾値以下の場合は、該追加テンプレートに対応するカテ
ゴリを候補として受理し、該第1の閾値より大きい場合
は、該追加テンプレートに対応するカテゴリを候補から
棄却する候補受理判定プロセスと、 第1の閾値を入力文字パターンと標準テンプレートとの
間の距離の関数として追加テンプレート毎に与える設定
プロセスと、 追加テンプレートの登録後に、該追加テンプレートの作
用により正読となった入力文字パターン数から誤読とな
った入力文字パターン数を減算した値が予め定めた第2
の閾値以下となったとき、該追加テンプレートを削除す
る淘汰プロセスとを有することを特徴とする文字認識プ
ログラムを格納した記憶媒体。 - 【請求項10】 階層的識別プロセスにおける条件は、 候補受理判定プロセスによって選出された追加テンプレ
ートの候補数が零の場合は標準テンプレートにより選出
された候補を出力し、候補数が1の場合は当該候補を出
力し、該候補数が2以上の場合は該候補の中で最小距離
をとる候補を出力するものである請求項9記載の文字認
識プログラムを格納した記憶媒体。 - 【請求項11】 設定プロセスにおける関数は、 各カテゴリに属する多数の文字パターンにおいて各文字
パターンから最近傍に位置する文字パターンまでの距離
の期待値を標準テンプレートからの距離の関数として求
めることにより、各カテゴリ毎に作成される請求項9記
載の文字認識プログラムを格納した記憶媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP33738897A JP3456390B2 (ja) | 1997-12-08 | 1997-12-08 | 文字認識方法及び装置及び文字認識プログラムを格納した記憶媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP33738897A JP3456390B2 (ja) | 1997-12-08 | 1997-12-08 | 文字認識方法及び装置及び文字認識プログラムを格納した記憶媒体 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH11175660A true JPH11175660A (ja) | 1999-07-02 |
| JP3456390B2 JP3456390B2 (ja) | 2003-10-14 |
Family
ID=18308170
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP33738897A Expired - Fee Related JP3456390B2 (ja) | 1997-12-08 | 1997-12-08 | 文字認識方法及び装置及び文字認識プログラムを格納した記憶媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3456390B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010224983A (ja) * | 2009-03-24 | 2010-10-07 | Glory Ltd | 顔画像照合装置、顔画像照合方法及び顔画像照合プログラム |
-
1997
- 1997-12-08 JP JP33738897A patent/JP3456390B2/ja not_active Expired - Fee Related
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010224983A (ja) * | 2009-03-24 | 2010-10-07 | Glory Ltd | 顔画像照合装置、顔画像照合方法及び顔画像照合プログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3456390B2 (ja) | 2003-10-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN101510252B (zh) | 区域提取方法、字符识别方法以及字符识别装置 | |
| JP5146190B2 (ja) | 文字認識装置、文字認識プログラム、および文字認識方法 | |
| CN100474331C (zh) | 字符串识别装置 | |
| US6947596B2 (en) | Character recognition method, program and recording medium | |
| JPH10307889A (ja) | 文字認識方法、装置及び文字認識プログラムを記録した記録媒体 | |
| CN111291535B (zh) | 剧本处理方法、装置、电子设备及计算机可读存储介质 | |
| JP3558493B2 (ja) | 用紙位置合わせ装置、用紙位置合わせ方法及び用紙位置合わせプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
| JPH11175660A (ja) | 文字認識方法及び装置及び文字認識プログラムを格納した記憶媒体 | |
| JP2000322514A (ja) | パターン抽出装置及び文字切り出し装置 | |
| JPH07282193A (ja) | 表を含む帳票処理装置 | |
| JP3145071B2 (ja) | 文字認識方法および装置 | |
| JP4350228B2 (ja) | パターン認識方法および装置 | |
| JP4878057B2 (ja) | 文字認識方法,プログラム及び記録媒体 | |
| JP3985926B2 (ja) | 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体 | |
| JP3466899B2 (ja) | 文字認識装置及び方法並びにプログラム記憶媒体 | |
| JP2004046723A (ja) | 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置 | |
| JP2001236467A (ja) | パターン認識方法、装置、およびパターン認識プログラムを記録した記録媒体 | |
| JP2002297638A (ja) | 文書画像からのタイトル抽出方法 | |
| JP2002157550A (ja) | 文字認識装置、文字認識方法、および記録媒体 | |
| JP2902097B2 (ja) | 情報処理装置及び文字認識装置 | |
| JP4320124B2 (ja) | パターン認識方法、装置及びプログラム | |
| JP4633271B2 (ja) | 辞書学習方法及び辞書学習プログラム | |
| JP2006072520A (ja) | 情報処理装置及びその方法及びそのプログラム記録媒体 | |
| JP3270551B2 (ja) | 文字認識装置および文字認識方法 | |
| US20050213819A1 (en) | Form recognition system, method, program, and storage medium |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080801 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080801 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090801 Year of fee payment: 6 |
|
| LAPS | Cancellation because of no payment of annual fees |