JPH1063784A - 文字認識方法および装置 - Google Patents

文字認識方法および装置

Info

Publication number
JPH1063784A
JPH1063784A JP8223720A JP22372096A JPH1063784A JP H1063784 A JPH1063784 A JP H1063784A JP 8223720 A JP8223720 A JP 8223720A JP 22372096 A JP22372096 A JP 22372096A JP H1063784 A JPH1063784 A JP H1063784A
Authority
JP
Japan
Prior art keywords
character
probability
character recognition
correct reading
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8223720A
Other languages
English (en)
Other versions
JP3421200B2 (ja
Inventor
Katsuto Fujimoto
克仁 藤本
Hiroshi Kamata
洋 鎌田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP22372096A priority Critical patent/JP3421200B2/ja
Publication of JPH1063784A publication Critical patent/JPH1063784A/ja
Application granted granted Critical
Publication of JP3421200B2 publication Critical patent/JP3421200B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 (修正有) 【課題】 文字認識結果の正読確率を信頼度として出力
することにより、後処理を容易にするとともに、異なる
文字認識手法を統合した文字認識を可能とする。 【解決手段】 文字認識手段1により文字パターンの文
字認識を行い、得られた候補文字の距離値から確率パラ
メータ算出手段2により確率パラメータを算出する。一
方、変換テーブル生成手段4は文字パターン、正解文字
コードの集合から確率パラメータを正読確率に変換する
変換テーブル5を生成する。正読確率出力手段3は、確
率パラメータに対応する正読確率を変換テーブル5から
読み出して出力する。また、正読確率を用いて、高速だ
が低精度の第1の文字認識手段6a、及び低速だが高精
度の第2の文字認識手段6bを統合し、高速高精度の文
字認識を行うことができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は文字認識方法および
装置に関し、さらに詳細には、高精度かつ高速な文字認
識を実行するために、文字認識結果の信頼度を出力する
ことができる文字認識方法および装置に関するものであ
る。近年、オフィスにおけるワークフローの効率化のた
めに文書を電子的にファイリングし、必要に応じてコー
ド化するための文字認識装置が強く求められている。特
に、文字認識装置は文字列情報のコード化のために必須
であり、実用化と広範囲にわたる普及のために、認識精
度を維持したままでの高速な文字種推定が求められてい
る。
【0002】文字認識結果の信頼度を出力することによ
り、文字認識結果の信頼度は低いが高速な文字認識手法
と、文字認識結果の信頼度は高いが低速な文字認識手法
とを統合することが可能となり、その結果、両者の長所
をとった文字認識結果の信頼度が高くかつ高速な文字認
識機能を提供することができる。また、文字認識結果の
信頼度により、検査・修正の対象を絞り込むことがで
き、後処理を効率化することもできる。すなわち、文字
認識結果の信頼度を出力する文字認識装置は、実用的な
文書認識装置を構築する上で重要な技術要素としての役
割を果す。
【0003】
【従来の技術】信頼度を出力する文字認識方式として
は、文字認識結果の第1候補の距離値をそのまま信頼度
として用いる文字認識方式が知られている。図7は上記
した従来の文字認識方式を説明する図であり、同図によ
り従来技術について説明する。
【0004】同図において、認識対象となる文字パター
ンから特徴を抽出し(S1)、特徴ベクトルを得る。次
に、認識辞書D1に格納された各文字に対する代表特徴
ベクトルと上記文字パターンから得られた特徴ベクトル
とを照合するために、距離値を算出する(S2)。つい
で、上記距離値をソートして、第1,第2、第3、…の
候補文字とその距離値d1,d2,…を得る。そして、
上記第1の候補文字の距離値d1を文字認識結果の信頼
度として出力する。
【0005】
【発明が解決しようとする課題】上記した第1候補の文
字認識結果をそのまま信頼度として出力する文字認識方
式は、出力された文字認識結果の信頼度と、その結果の
正読確率との間の対応関係が明確でないため、次のよう
な問題が発生する。 従来の文字認識方式を単独で用いて信頼度の低い文
字認識結果をリジェクトしたりあるいは誤りの訂正の対
象とする場合の信頼度のしきい値の設定を行うに際し、
上記のように信頼度とその結果の正読確率との間の対応
関係が明確でないため、実験的にしきい値を求めるなど
の手続きが必要となり、煩雑であるという問題が発生す
る。
【0006】 従来の第1の候補の距離値をそのまま
信頼度として用いる場合、異なった2つの文字認識手法
を統合して両者の持つ長所を兼ね備えた文字認識装置を
構築しようとしても、それぞれの文字認識手法において
得られた信頼度は、それぞれの文字認識手法の出力する
距離値、文字認識手法に依存した性質を持つため、例え
ば信頼度が高い方を出力するという統合方法をとる場
合、信頼度を互いに比較することが困難となる。
【0007】本発明は上記した事情に鑑みなされたもの
であり、本発明の第1の目的は、文字認識結果の正読確
率の推定値を信頼度として出力することにより、信頼度
の意味付けを明確にでき、後処理を容易にした文字認識
方法および装置を提供することである。本発明の第2の
目的は、文字認識結果の正読確率の推定値を信頼度とし
て出力することにより、異なる文字認識手法の信頼度を
互いに比較できるようにし、異なる文字認識手法を統合
した高精度かつ高速な文字認識を可能とすることであ
る。
【0008】
【課題を解決するための手段】図1は本発明の原理図で
ある。図1(a)は、文字認識結果から正読確率を出力
する本発明の請求項1〜3、請求項5〜請求項7の原理
図を示している。同図において、1は文字パターンから
文字認識を行う文字認識手段、2は文字認識手段により
得られた候補文字の距離値から認識結果の確信度を示す
確率パラメータを算出する手段、3は正読確率出力手段
であり、上記確率パラメータ算出手段2により得られた
確率パラメータに対応する正読確率を確率パラメータ−
正読確率変換テーブル5から読み出して出力する。ま
た、4は確率パラメータ−正読確率変換テーブル生成手
段であり、文字パターン、正解文字コードの集合から確
率パラメータを正読確率に変換するための変換テーブル
5を生成する。
【0009】図1(b)は、正読確率を用いて高速だが
低精度の第1の文字認識手段と、低速だが高精度の第2
の文字認識手段を統合し、高速かつ高精度の文字認識を
行うようにした、本発明の請求項4,請求項8の原理図
を示している。同図において、6aは高速だが低精度の
第1の文字認識手段であり、文字パターンから高速、低
精度の文字認識を行い候補文字、距離値を出力する。7
は正読確率推定手段であり、上記距離値より確率パラメ
ータを求め、確率パラメータ−正読確率変換テーブル5
を参照して正読確率を推定する。8は正読確率比較手段
であり、正読確率推定手段7で推定した正読確率をしき
い値と比較する。6bは低速だが高精度の第2の文字認
識手段であり、上記正読確率推定手段7で推定した正読
確率がしきい値より低いとき、低速、高精度の文字認識
を行う。9は認識結果出力手段であり、正読確率推定手
段7で推定した正読確率がしきい値より大きいとき、第
1の文字認識手段6aによる文字認識結果を出力し、正
読確率推定手段7で推定した正読確率がしきい値より大
きいとき、第2の文字認識手段6bによる文字認識結果
を出力する。
【0010】図1に示すように本発明は次のようにして
前記課題を解決する。 (1)文字パターンを入力とし、文字認識手段により、
入力された文字パターンに対応する複数の候補文字とそ
れぞれに対応する距離値を算出し、予め定義された式に
基づき上記距離値から確率パラメータを計算し、確率パ
ラメータとそれに対応する正読確率を格納したテーブル
を参照して、確率パラメータに対応する正読確率を出力
する。 (2)上記(1)において、候補文字の第1の候補の距
離値と第2の距離値の比に基づいて確率パラメータを算
出する。
【0011】(3)上記(1)(2)において、予め与
えられた学習文字パターン集合に対する確率パラメータ
を計算し、同じ確率パラメータを持つ学習文字パターン
数と、その中で第1候補が正解であった学習文字パター
ンの比を正読確率の推定値として、確率パラメータと正
読確率の変換テーブルを生成する。 (4)文字パターンを入力とし、比較的高速かつ低精度
の第1の文字認識手段で文字認識を行い、文字認識結果
として得られた候補文字の距離値から確率パラメータを
計算し、上記確率パラメータとそれに対応する正読確率
を格納したテーブルを参照して、上記確率パラメータに
対応する正読確率の推定値を求め、上記正読確率の推定
値が所定のしきい値より大きいとき、上記第1の文字認
識手段により得られた文字認識結果を出力し、上記正読
確率が所定のしきい値より小さいとき、比較的低速で高
精度な第2の文字認識手段を用いて上記文字パターンに
ついて文字認識を行い、上記第2の文字認識手段により
得られた文字認識結果を出力する。
【0012】(5)文字認識装置を、文字パターンを入
力とし、入力された文字パターンから複数の候補文字と
それぞれに対応する距離値を出力する文字認識手段と、
文字認識手段により得られた複数の候補文字とそれぞれ
に対応する距離値を用いて予め定義された式に基づき確
率パラメータを算出する確率パラメータ計算手段と、確
率パラメータのそれぞれに対応する正読確率の推定値を
記憶した変換テーブルと、変換テーブルを参照し、上記
確率パラメータ計算手段により求めた確率パラメータに
対応した正読確率を求めて出力する正読確率出力手段と
から構成する。
【0013】(6)上記(5)において、確率パラメー
タ計算手段は、文字認識手段により得られた複数の候補
文字の第1の候補文字の距離値と第2の候補文字の距離
値の基づき確率パラメータを算出する。 (7)上記(5)(6)における正読確率の推定値を記
憶した変換テーブルを、予め与えられた学習文字パター
ン集合に対する確率パラメータを計算し、同じ確率パラ
メータを持つ学習文字パターン数と、その中で第1候補
が正解であった学習文字パターンの比より正読確率の推
定値を求め、各正読確率の推定値とそれぞれに対応する
確率パラメータを記憶手段に記憶することにより生成す
る。
【0014】(8)文字認識装置を、入力された文字パ
ターンの文字認識を行う比較的高速かつ低精度の第1の
文字認識手段と、入力された文字パターンの文字認識を
行う比較的低速で高精度な第2の文字認識手段と、確率
パラメータとそれに対応する正読確率を格納した変換テ
ーブルと、候補文字の距離値から確率パラメータを計算
し、上記変換テーブルを参照して、上記確率パラメータ
に対応する正読確率の推定値を求める正読確率推定手段
と、上記第1の文字認識手段により得られた候補文字の
ついて上記正読確率推定手段により求めた正読確率の推
定値を所定のしきい値と比較し、上記正読確率が所定の
しきい値より大きいとき、上記第1の文字認識手段によ
り得られた文字認識結果を出力し、上記正読確率の推定
値が所定のしきい値より小さいとき、上記第2の文字認
識手段により得られた文字認識結果を出力する正読確率
比較手段から構成する。
【0015】本発明の請求項1〜3および請求項5〜7
の発明においては、上記(1)〜(3)および(5)〜
(7)のように構成したので、意味付けが明確な正読確
率を文字認識結果の評価基準として使用することがで
き、後処理が容易となる。本発明の請求項4,8の発明
においては、上記(4),(8)のように構成したの
で、異なる文字認識手法を統合した、高速で高精度な文
字認識結果を得ることができる。
【0016】
【発明の実施の形態】図2は本発明の第1の実施例のシ
ステムの構成を示す図であり、同図は、確率パラメータ
から正読確率を得るテーブルを設け、候補文字の距離値
から確率パラメータを算出し、上記テーブルを参照して
確率パラメータに対応した正読確率を読み出すことによ
り、正読確率を出力できるようにした文字認識装置の構
成を示している。
【0017】同図において、11は認識対象となる文字
パターン、D1は複数の文字の文字コードとその特徴ベ
クトルと格納した認識辞書、12は文字認識手段であ
る。文字認識手段12は文字パターン11から特徴を抽
出して特徴ベクトルを求め、上記認識辞書に格納された
各文字の特徴ベクトルと照合し距離値を算出する。そし
て、距離値が近い順にソートして、各文字コードとその
距離値d1,d2,d3,…を第1,第2,…の候補と
して出力する。13は確率パラメータ算出手段であり、
例えば、上記第1候補文字の距離値d1と第2の候補文
字の距離値d2に基づき次の式(1)により確率パラメ
ータrを算出する。 r=d2/(d1+d2) (1)
【0018】D2は文字パターンと正解文字コードの集
合を格納した記憶手段、15は確率パラメータ−正読確
率変換テーブル生成手段であり、上記記憶手段D2に格
納された文字パターンと正解文字コードの集合に基づ
き、後述するように確率パラメータ−正読確率変換テー
ブルT(r) を生成する。14は正読確率出力手段であ
り、上記確率パラメータ算出手段13により算出した確
率パラメータrに対応する正読確率を上記確率パラメー
タ−正読確率変換テーブルT(r) から読み出し正読確率
pを出力する。
【0019】上記文字パターン11から第1候補,第2
候補,…およびその距離値d1,d2,d3…を得る手
法は周知であるので、以下、確率パラメータ−正読確率
変換テーブルT(r) の生成について説明する。図3は上
記確率パラメータ−正読確率変換テーブルT(r) を生成
する手法の一例を説明する図である。同図において、ま
ず、ステップS1において、文字パターン、正解文字コ
ードの集合からなる学習データを格納した記憶手段D3
から第1番目の文字パターンと正解文字コードとを読み
だす。ステップS2において文字認識を行い、第1,第
2,第3,…の候補と距離値d1,d2,…を得る。す
なわち、前記したように、認識辞書(図示せず)に格納
された各文字と上記文字パターンとを照合して距離値を
算出し、距離値が近い順にソートして、各文字コードと
その距離値d1,d2,d3,…を得る。
【0020】ステップS3において、上記第1候補の文
字コードと記憶手段D3から読みだした正解文字コード
を比較して正読、誤読の判定を行い、正読/誤読の判定
結果を得る。一方、ステップS4において、前記式
(1)により確率パラメータRを計算する。ステップS
5において、判定結果が正読であるか誤読であるかを調
べる。判定結果が正読の場合には、ステップS6に行
き、同図に示すヒストグラム(最初は全ての値が0に設
定されている)のrn ≦R≦rn +δrの正解文字数N
ok(r n )の値に1を加え、ステップS7に行き、ヒス
トグラムのrn ≦R≦rn +δrの学習パターン数N
(rn )の値に1を加える。
【0021】また、判定結果が誤読の場合には、ステッ
プS7に行き上記と同様ヒストグラムのrn ≦R≦rn
+δrの学習パターン数N(rn )の値に1を加える。
次いで、ステップS8において、記憶手段D3に記憶さ
れた全ての文字パターンについて、正解文字数Nok(r
n )、学習パターン数N(rn )を求めたかを判定し、
全ての学習パターンについて計算が終わっていない場合
にはステップS1に戻り、上記処理を繰り返す。全ての
学習パターンについて計算が終了すると、ステップS9
に行き、上記ヒストグラムの全rの値について、P(r
n )=Nok(rn )/N(rn )を計算し、正読確率P
(rn )を求める。その結果、各確率パラメータrn
ついて同図に示す変換テーブルT(rn ) を得る。
【0022】なお、上記のようにして得た変換テーブル
T(rn ) は離散的なrn の値に対する正読確率P(rn )
であるが、任意のrの値に対する正読確率P(r) は、r
n ≦r≦rn+1 (rn+1 =rn +δr)よりrn とr
n+1 を求め、rn に対する正読確率P(rn ) とrn+1
対する正読確率P(rn+1 )から補間演算により求めるこ
とができる。上記のようにして変換テーブルT(r) を生
成することにより、図2に示した確率パラメータ算出手
段13により計算した確率パラメータrから正読確率P
(rn) を得ることができる。上記のようにして、正読確
率を求めることにより、信頼度の意味付けが明確にな
り、後処理が容易となる。
【0023】次に、上記正読確率を用いて異なる文字認
識手法を統合し、高精度かつ高速な文字認識を行うこと
ができるようにした実施例について説明する。図4は上
記した第2の実施例のシステムの構成を示す図である。
同図において、21は認識対象となる文字パターン、2
2は文字パターンから特徴ベクトルを抽出する特徴ベク
トル抽出手段である。D11はM次元の特徴ベクルトを
持つL文字種(例えば3600文字種)の文字を格納し
た第1の認識辞書、23は大分類照合手段であり、大分
類照合手段23は上記第1の認識辞書D11に格納され
たL文字分の特徴ベクトル(M次元)と上記文字パター
ン21の特徴ベクトルを照合し、距離が小さい順にK2
個(例えばK2=300)の候補文字を出力する。
【0024】D12はN次元(M≦N)の特徴ベクルト
を持つL文字種の文字を格納した第2の認識辞書、24
は詳細分類照合手段である。詳細分類照合手段24は、
まず、上記大分類照合手段23が出力するK2個の候補
文字の内、距離値が小さいK1(K1≦K2;例えばK
1=70)文字分の特徴ベクトル(N次元)を上記第2
の認識辞書D12から読み出して文字パターン21の特
徴ベクトルと照合し、その結果得られた候補文字の正読
率が低い場合には、大分類照合手段23が出力するK2
文字分の候補文字の特徴ベクトル(N次元)を第2の認
識辞書D12から読み出して、文字パターン21の特徴
ベクトルと照合する。
【0025】25は、確率パラメータ算出手段であり、
上記詳細分類照合手段24により得られた候補文字の距
離値から例えば前記式(1)により確率パラメータrを
算出する。26は、正読確率比較手段であり、確率パラ
メータ算出手段25により求めた確率パラメータrに対
応する正読確率P(r)を確率パラメータ−正読確率変
換テーブルT(r)から読み出し、予め定められたしき
い値Pthと比較する。そして、上記詳細分類照合手段2
4において、K1文字分の照合結果により得られた候補
文字の正読確率が上記しきい値Pthより大きい場合に
は、その候補文字を認識結果として出力し、上記正読確
率が上記しきい値Pthより小さい場合には、詳細分類照
合手段24に対して上記K2文字分の照合を依頼する。
【0026】図5、図6は図4の文字認識システムの動
作を示すフローチャートであり、同図により本実施例の
動作をさらに詳細に説明する。認識対象となる文字パタ
ーンが与えられると、ステップS1において、特徴抽出
を行い、N次元の特徴ベクトルを求める。ステップS2
において、第1の認識辞書D11からL文字分のM次元
の特徴ベクトルを読み出し、読み出したL文字種の文字
と上記認識対象となる文字パターン(M次元)との距離
計算(L×M次元)を行い、候補文字とその距離値d
1’,d2’,d3’,…を得る。ステップS3におい
て、K=70に設定し、ステップS4において、上記ス
テップS2で得た候補文字から、距離値の小さい順にK
(=70)文字分の文字を取り出す。
【0027】ステップS5において、上記K文字分のN
次元の特徴ベクトルを第2の認識辞書D12から読み出
し、読み出したK文字分の文字と上記認識対象となる文
字パターン(N次元)との距離計算(K×N次元)を
行う。ステップS6において、上記距離計算の結果得
られた候補文字の距離値を小さい方からソートし、第
1,第2,…の候補文字とその距離値d1,d2,…を
得る。ステップS7において、上記距離値d1,d2に
基づき前記式(1)により確率パラメータrを求め、図
6のステップS8において、変換テーブルT(r)を参
照して上記確率パラメータrに対応した正読確率Pを求
める。なお、変換テーブルT(r)に上記確率パラメー
タrに一致する値が格納されていない場合には、前記し
たように補間により正読確率Pを求める。
【0028】ステップS9において、上記処理が2回目
であるかを調べ、2回目でない場合には、ステップS1
0において、正読確率P(r)と予め定められたしきい
値Pthとを比較する。正読確率P(r)がしきい値Pth
以上の場合には、上記候補文字と距離値、正読率、確率
パラメータ等を文字認識結果として出力する。また、正
読確率P(r)がしきい値Pthより小さい場合には、図
5のステップS11に行き、K=300に設定してステ
ップS4に戻り、ステップS2で得た候補文字から、距
離値の小さい順に300文字分の文字を取り出し、上記
と同様に、ステップS5で距離計算を行う。そして、
ステップS7〜ステップS8において、上記と同様に正
読確率Pを求め、ステップS12において、得られた候
補文字と距離値、正読率、確率パラメータ等を文字認識
結果として出力する。
【0029】以上のように本実施例においては、大分類
照合を行ったのち、まず、K1文字分の候補文字につい
て詳細分類照合を行って正読確率を求め、正読確率がし
きい値以上のとき、上記詳細分類照合による文字認識結
果を出力し、上記正読確率がしきい値より小さいとき、
K2文字(K1≦K2)文字分の候補文字について詳細
分類照合を行ってその結果を文字認識結果として出力し
ており、比較的精度は低いが高速なK1文字分の候補文
字による照合処理と、高精度だが比較的低速なK2文字
分(K1≦K2)の照合処理を統合して文字認識を行っ
ているので、高速で高精度な文字認識を行うことができ
る。
【0030】なお、上記第1、第2の実施例において
は、第1候補文字の距離値d1と第2の候補文字の距離
値d2に基づき前記式(1)により確率パラメータrを
算出しているが、例えば、第1,第2の候補文字の距離
値d1,d2に加えて、第3,第4,…の候補文字の距
離値d3,d4,…を使用して確率パラメータを算出し
たり、あるいは、上記距離値の逆数を用いて確率パラメ
ータを算出する等、上記式(1)以外の式を用いて確率
パラメータを算出してもよい。
【0031】
【発明の効果】以上説明したように、本発明において
は、以下の効果を得ることができる。 (1)認識結果の確信度を示す確率パラメータと正読確
率の変換テーブルを生成するとともに、文字認識結果よ
り候補文字の距離値より確率パラメータを算出し、上記
変換テーブルを参照して文字認識結果の正読確率を求め
ているので、意味付けの明確な正読確率を文字認識結果
の評価基準として使用することができ、文字認識結果の
後処理を容易にすることができる。
【0032】(2)文字パターンを入力とし、比較的高
速かつ低精度の第1の文字認識手段で文字認識を行い、
上記文字認識結果として得られた候補文字の距離値から
確率パラメータを計算し、上記確率パラメータとそれに
対応する正読確率を格納したテーブルを参照して、上記
確率パラメータに対応する正読確率の推定値を求め、上
記正読確率の推定値が所定のしきい値より大きいとき、
上記第1の文字認識手段により得られた文字認識結果を
出力し、上記正読確率が所定のしきい値より小さいと
き、比較的低速で高精度な第2の文字認識手段を用いて
上記文字パターンについて文字認識を行い、上記第2の
文字認識手段により得られた文字認識結果を出力するよ
うにしているので、高速で高精度な文字認識を行うこと
ができる。
【図面の簡単な説明】
【図1】本発明の原理図である。
【図2】本発明の第1の実施例のシステムの構成を示す
図である。
【図3】図2における変換テーブルT(r) の生成を説明
する図である。
【図4】本発明の第2の実施例のシステムの構成を示す
図である。
【図5】第2の実施例のシステムの動作を説明する図で
ある。
【図6】第2の実施例のシステムの動作を説明する図
(続き)である。
【図7】従来例である。
【符号の説明】
1 文字認識手段 2 確率パラメータ算出手段 3 正読確率出力手段 4 確率パラメータ−正読確率変換テーブル生成手
段 5 確率パラメータ−正読確率変換テーブル 6a 第1の文字認識手段 6b 第2の文字認識手段 7 正読確率推定手段 8 正読確率比較手段 9 認識結果出力手段 11 認識対象となる文字パターン 12 文字認識手段 13 確率パラメータ算出手段 15 確率パラメータ−正読確率変換テーブル生成手
段 14 正読確率出力手段 21 認識対象となる文字パターン 22 特徴ベクトル抽出手段 23 大分類照合手段 24 詳細分類照合手段 25 確率パラメータ算出手段 26 正読確率比較手段 D1 認識辞書 D2 学習データを格納した記憶手段 D11 第1の認識辞書 D12 第2の認識辞書 T(r) 確率パラメータ−正読確率変換テーブル

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 文字パターンを入力とし、文字認識手段
    により、入力された文字パターンに対応する複数の候補
    文字とそれぞれに対応する距離値を算出し、 予め定義された式に基づき上記距離値から確率パラメー
    タを計算し、 上記確率パラメータとそれに対応する正読確率を格納し
    たテーブルを参照して、上記確率パラメータに対応する
    正読確率を出力することを特徴する文字認識方法。
  2. 【請求項2】 候補文字の第1の候補の距離値と第2の
    距離値の比に基づいて確率パラメータを算出することを
    特徴とする請求項1の文字認識方式。
  3. 【請求項3】 予め与えられた学習文字パターン集合に
    対する確率パラメータを計算し、 同じ確率パラメータを持つ学習文字パターン数と、その
    中で第1候補が正解であった学習文字パターンの比を正
    読確率の推定値として、確率パラメータと正読確率の変
    換テーブルを生成することを特徴とする請求項1または
    請求項2の文字認識方法。
  4. 【請求項4】 文字パターンを入力とし、比較的高速か
    つ低精度の第1の文字認識手段で文字認識を行い、 上記文字認識結果として得られた候補文字の距離値から
    確率パラメータを計算し、 上記確率パラメータとそれに対応する正読確率を格納し
    たテーブルを参照して、上記確率パラメータに対応する
    正読確率の推定値を求め、 上記正読確率の推定値が所定のしきい値より大きいと
    き、上記第1の文字認識手段により得られた文字認識結
    果を出力し、 上記正読確率が所定のしきい値より小さいとき、比較的
    低速で高精度な第2の文字認識手段を用いて上記文字パ
    ターンについて文字認識を行い、上記第2の文字認識手
    段により得られた文字認識結果を出力することを特徴と
    する文字認識方法。
  5. 【請求項5】 文字パターンを入力とし、入力された文
    字パターンから複数の候補文字とそれぞれに対応する距
    離値を出力する文字認識手段と、 上記文字認識手段により得られた複数の候補文字とそれ
    ぞれに対応する距離値を用いて予め定義された式に基づ
    き確率パラメータを算出する確率パラメータ計算手段
    と、 確率パラメータのそれぞれに対応する正読確率の推定値
    を記憶した変換テーブルと、 上記変換テーブルを参照し、上記確率パラメータ計算手
    段により求めた確率パラメータに対応した正読確率を求
    めて出力する正読確率出力手段を備えたことを特徴する
    文字認識装置。
  6. 【請求項6】 上記確率パラメータ計算手段は、文字認
    識手段により得られた複数の候補文字の第1の候補文字
    の距離値と第2の候補文字の距離値の基づき確率パラメ
    ータを算出することを特徴する請求項5の文字認識装
    置。
  7. 【請求項7】 正読確率の推定値を記憶した変換テーブ
    ルは、予め与えられた学習文字パターン集合に対する確
    率パラメータを計算し、同じ確率パラメータを持つ学習
    文字パターン数と、その中で第1候補が正解であった学
    習文字パターンの比より正読確率の推定値を求め、各正
    読確率の推定値とそれぞれに対応する確率パラメータを
    記憶手段に記憶することにより生成されることを特徴と
    する請求項5または請求項6の文字認識装置。
  8. 【請求項8】 入力された文字パターンの文字認識を行
    う比較的高速かつ低精度の第1の文字認識手段と、 入力された文字パターンの文字認識を行う比較的低速で
    高精度な第2の文字認識手段と、 確率パラメータとそれに対応する正読確率を格納した変
    換テーブルと、 候補文字の距離値から確率パラメータを計算し、上記変
    換テーブルを参照して、上記確率パラメータに対応する
    正読確率の推定値を求める正読確率推定手段と、 上記第1の文字認識手段により得られた候補文字のつい
    て上記正読確率推定手段により求めた正読確率の推定値
    を所定のしきい値と比較し、上記正読確率が所定のしき
    い値より大きいとき、上記第1の文字認識手段により得
    られた文字認識結果を出力し、 上記正読確率の推定値が所定のしきい値より小さいと
    き、上記第2の文字認識手段により得られた文字認識結
    果を出力する正読確率比較手段を備えたことを特徴とす
    る文字認識装置。
JP22372096A 1996-08-26 1996-08-26 文字認識方法および装置 Expired - Fee Related JP3421200B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP22372096A JP3421200B2 (ja) 1996-08-26 1996-08-26 文字認識方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22372096A JP3421200B2 (ja) 1996-08-26 1996-08-26 文字認識方法および装置

Publications (2)

Publication Number Publication Date
JPH1063784A true JPH1063784A (ja) 1998-03-06
JP3421200B2 JP3421200B2 (ja) 2003-06-30

Family

ID=16802629

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22372096A Expired - Fee Related JP3421200B2 (ja) 1996-08-26 1996-08-26 文字認識方法および装置

Country Status (1)

Country Link
JP (1) JP3421200B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102314252A (zh) * 2010-06-30 2012-01-11 汉王科技股份有限公司 一种手写字符串的字符切分方法和装置
JP2016018353A (ja) * 2014-07-08 2016-02-01 富士通株式会社 情報処理装置、情報処理方法及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102314252A (zh) * 2010-06-30 2012-01-11 汉王科技股份有限公司 一种手写字符串的字符切分方法和装置
JP2016018353A (ja) * 2014-07-08 2016-02-01 富士通株式会社 情報処理装置、情報処理方法及びプログラム

Also Published As

Publication number Publication date
JP3421200B2 (ja) 2003-06-30

Similar Documents

Publication Publication Date Title
Kolcz et al. A line-oriented approach to word spotting in handwritten documents
RU2641225C2 (ru) Способ выявления необходимости обучения эталона при верификации распознанного текста
US6834121B2 (en) Apparatus for rough classification of words, method for rough classification of words, and record medium recording a control program thereof
JP2000353215A (ja) 文字認識装置および文字認識プログラムを記録した記録媒体
JPH0981730A (ja) パターン認識方法及び装置及びコンピュータ制御装置
KR100617292B1 (ko) 지문 인식 방법 및 그 장치
CN103329166A (zh) 图像检索装置和方法、图像处理装置和方法
JP3099771B2 (ja) 文字認識方法、装置及び文字認識プログラムを記録した記録媒体
JPH1166238A (ja) 手書き文字認識方法
JP3099797B2 (ja) 文字認識装置
CN120371976A (zh) 基于人工智能的个性化智能问答系统
JPH1063784A (ja) 文字認識方法および装置
JP2002063548A (ja) 手書き文字認識方法
JP2003022446A (ja) 署名照合装置、署名照合方法およびその方法をコンピュータに実行させるプログラム
JP2001014465A (ja) 物体認識方法及び物体認識装置
JPH0458073B2 (ja)
JP3897999B2 (ja) 手書き文字認識方法
JPH08263655A (ja) パターン認識方法
JP2856409B2 (ja) 文字認識装置および方法
JP2001243425A (ja) オンライン文字認識装置およびオンライン文字認識方法
JP4215385B2 (ja) パターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4320124B2 (ja) パターン認識方法、装置及びプログラム
JP2851865B2 (ja) 文字認識装置
CN120931905A (zh) 一种基于跨模态一致性循环的目标检测模型训练方法
CN117076695A (zh) 图文跨模态检索方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030408

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080418

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100418

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120418

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130418

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees