JPH0485687A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0485687A
JPH0485687A JP2201962A JP20196290A JPH0485687A JP H0485687 A JPH0485687 A JP H0485687A JP 2201962 A JP2201962 A JP 2201962A JP 20196290 A JP20196290 A JP 20196290A JP H0485687 A JPH0485687 A JP H0485687A
Authority
JP
Japan
Prior art keywords
character
pattern
string
candidate
candidate pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2201962A
Other languages
English (en)
Inventor
Koshi Sakurada
桜田 孔司
Koji Ito
伊東 晃治
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2201962A priority Critical patent/JPH0485687A/ja
Publication of JPH0485687A publication Critical patent/JPH0485687A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業1・、の利甲分野) 本発明(シ、用紙等の媒体に(、こ記録されか文字列画
像から1文字ずつ文字パタンを切出し9て文字を認識計
る文字認識装置、特に認識積電の優f’t ’/’と文
字認識装置に関するC2りである。
(従来の技術) 、一般に文字枠を備えない活字や手書きの女湯を対象と
し、ノと文字認識装置においては、1行文の文字列画イ
(を]文字毎の文字パタンに切り出I、てλ、↑シ識を
打つ。、二の文字切り出しは、例えば文字列画像を行方
向と垂直なノ戸11に投影して1@られる周辺骨イdに
基ついて行われる。とこ7)が、複数の分離11.な部
分図形がら槙成さi−する文字(分離文字)や隣り合っ
た文字と接触した文字(接触文字)にχ・1し5て誤っ
た切り出し7を行うことがあり、これによって、認識率
の低干を招いていた。
従来、この種の分野の技術としては、特開昭63−31
.、1492号公報等に記載さノ′走るものがあった。
この文献に開示された文字認識装置は、文字列画像から
認識対象文字の構成要素であるサブ文字パタンを切出し
、該サブ文字パタンを組合せて]−種類以上の文字パタ
ン列を抽出し、てH?3識し、その結果、得られた認識
候補文字列を単語照合するこ゛とにより一札類以上の認
識候補文字列を一意(・鏝9シ定1′る。このSにして
、上述した認識率の低1・−を・防いでいる。
(発明が解決し2ようとする課題) しかしながら、1−、記構成の文字認識装置“ζ゛(1
i、各文字パタン列に対シ1.て、文字認識処理とψ諸
態合処理とを行−〕ので、該文字パタン列の組合せか増
大する場合、例疋ば文字列画像に含ま、h、る文字数が
多い場斤や分離文字の割合が多い場合(、、二ζ」、処
理時間が増大するという問題かあ−リな。
本発明は前記従来技術の侍、っていた課題と1・−で、
処理時間が増大する点について解決した文字認識装置を
提供するものである。
(課題を解決するための手段) 本発明は、前記課題を解決するために、情報媒体1−の
文字列より得られる文字列画像データを入力し5、該文
字列画像データ中の所定の画素領域を部分パタンとして
抽出する部分パタン抽出部と、前記部分パタンを組合せ
て複数の文字候補パタンを設定し、該各文字候補パタン
の第1−の文字評価値を順次検出する第1の文字評価値
検出部と、前記第1の文字評価値に基づき、前記文字候
補パタン列の中から前記文字列と類似する文字候補パタ
ン列を1@以上選択する候補パタン列選択手段と、前記
候補パタン列選択手段により選択さね、l’、:。
各文字候補パタン列から、文字候補パタンの配列の妥]
−1j性を表す第1−の組合せ評価値をそノ“r7F:
’h検出゛りる評価値検出f−段と、前記候補パタン列
選択手段(、こより選択された各文字候補パタン列中の
名文字候補パタン毎に文字認識を行い、その文字認識結
果に応した文字候補コード及び文字候補パタンの認識信
頼性を表す第2の文字評価値を検出する第2の文字評価
値検出部と、前記第2の文字評価値に基づき、前記候補
パタン列選択手段により選択された各文字候補パタン列
から文字候補パタンの配列の妥当性を表わす第2の組合
せ評価値を検出する第2の組合せ評価値検出部と、前記
候補パタン列選択手段により選択された各文字候補パタ
ン列に対する前記第1及び第2の組合せ評価値に基づき
前記文字列に対する文字候補パタン列を決定し、該決定
結果の文字候補パタン列に対応する文字候補コード列を
検出する文字決定部とを、備えたものである。
また、前記第1の文字評価値検出部は、前記部分パタン
の内、注目部分パタンと該注目部分パタンに後続する部
分パタンとの組合わせにより、前記文字候補パタンを順
次設定する文字候補パタン設定手段と、前記文字候補パ
タンの近傍領域に存在する部分パタンの配置関係に基づ
き、該文字候補パタンの幾何学的な特徴量を表す第1の
文字評価値を順次検出する文字評価手段とで、構成して
もよい。
さらに、前記文字決定部は、前記候補パタン列選択手段
により選択された各文字候補パタン列に対する前記第1
及び第2の組合せ評価値に基づき、前記文字列に類似す
る文字候補ペタン列を選択するパタン列選択手段と、前
記パタン列選択手段により選択された各文字候補パタン
列に対応する文字候補コード列の妥当性を単語照合によ
り判定するコード列判定手段と、前記コード列判定手段
により妥当性が得られた場合に前記文字候補コード列を
最終出力とし検出し、妥当性が得られない場合に前記文
字候補コード列の妥当性が得られるまで、前記単語照合
を繰り返し実行させる最終出力検出部とで、構成してし
よい。また、前記単語照合に代えて言語検定としてもよ
い。
(作用) 本発明は、以上のように文字認識装置を構成したので、
部分パタン抽圧部は、情報媒体上の文字列より得られる
文字列画像データを入力し、該文字列画像データ中の個
々の画素領域(例えば、黒画素)を部分パタンとして抽
出する。第1の文字評価値検出部は、例えば、部分パタ
ンの内、切出し開始の注目部分パタンと該注目部分パタ
ンに後続する部分パタンとの組合せにより文字候補パタ
ンを順次設定し、その文字候補パタンの近傍領域に存在
する部分パタンの配置関係に基づき、第1の文字評価値
を順次検出する。その第1の文字評価値に基づき、候補
パタン列選択手段は、文字候補パタン列の中から前記文
字列と類似する文字候補パタン列を1組以上選択し、認
識対象とする文字候補パタン列を限定し、処理時間を短
縮するように働く。
評価値検出手段は、候補パタン列選択手段により選択さ
れた各文字候補パタン列から、文字候補パタンの配列の
妥当性を表す第1の組合せ評価値をそれぞれ検出し、第
2の文字評価値検出部は、候補パタン列選択手段により
選択さ1また各文字候補パタン列中の各文字候補パタン
毎に文字認識を行い、その文字認識結果に応じた文字候
補コード及び文字候補パタンの認識信頼性を表す第2の
文字評価値を検出する。第2の組合せ評価値検圧部は、
第2の文字評価値に基づき、候補パタン列選択手段によ
り選択された各文字候補パタン列から文字候補パタンの
配列の妥当性を表わす第2の組合せ評価値を検出する。
さらに、文字決定部は、例えば、候補パタン列選択手段
により選択された各文字候補パタン列に対する前記第1
及び第2の組合せ評価値に基づき、前記文字列に類似す
る文字候補パタン列を選択し、その上、コード列判定手
段により、パタン列選択手段により選択された各文字候
補パタン列に対応する文字候補コード列の妥当性を単語
照合または言語検定により判定する。そして、最終出力
検出部により、コード列判定手段により妥当性が得られ
た場合に前記文字候補コード列を最終出力として検出し
、妥当性が得られない場合に前記文字候補コード列の妥
当性が得られるまで、前記単語照合または言語検定を繰
り返し実行させる。これにより、認識精度が大幅に向上
する。し、たがって、前記課題を解決で゛きるのである
(実施例) 第1−図は、本発明の実施例を示す文字認識装置の機能
ブロック図である。
この文字認識装置]−〇の入力側には、]−個または複
数個の文字列が記載された情報媒体1−を光学的に走査
して光電変換し1.2値化された電気信号(文字画像パ
タン)を記憶するイメージスキャナ等の文字列画像入力
部]Oaが接続されている、さらに、文字列画像入力部
10aは、前記画像パタン′に含まノ′しる文字列画像
を切出し、てその文字列画像データI) ]を文字認識
装置10へ出力する機能を有している。
文字認識装置10は、文字列画像データ1〕コから14
文字づつ文字パタンを切出し、切出された文字パタンに
対して文字認識を行うものであり、文字列画像入力部1
−Oaより入力された文字列画像データ■、)]−中の
個々の黒画素領域である部分パタンを抽出する部分パタ
ン抽出部11を有(、ている。
その部分パタン抽出部11の出力側には、第11の文字
評価値検出部1−2が接続さ)′1−ている6第1の文
字評価値検出部12は、前記部分パタンの内、切出し、
開始の注1,1部分パタンと該注目部分パタンに後続す
る部分パタンとの組合ゼ、により、文字候補パタンを順
次設定する文字候補パタン設定手段12aと、その文字
候補パタン設定手段12aから出力された文字候補パタ
ンの近傍領域(X存在する部分パタンの配置関係に基づ
き、該文字候補パタンの幾何学的な特徴址を表を第1の
文字評価値を順次検出する文字評価1段121)とで、
構成さノ′じCいる。そしこ、第1の文字評価値検出部
1−2の出力側には第1の組合ぜ評価値検出部13が接
続されている。
第jの組合せ評価値検出部13は、第1の文字評価値に
基づき、文字候補パタンからなる文字候補パタン列の中
から前記文字列と3J似する文字候補パタン列(以)、
有効文字候補パタン列どいつ)を]−組以」−選択する
候補パタン列選択手段1.、3 aと、候補パタン列選
択手段1.3aにより選択さtr。
た各有効文字候補パタン列から、文字候補パタンの配列
の妥当性を表す第1の組合せ評価値をそれぞれ検出する
評価値検出手段13F)とで、構成されてる。そして、
第1の組合せ評価値検出部13の出力側には、第2の文
字評価値検出部14及び第2の組合せ評価値検出部】−
5が順次接続されている。
第2の文字評価値検出部14は、有効文字候補パタン列
中の各文字候補パタン毎に文字認識を行い、その文字認
識結果に応じた文字候補コード及び文字候補パタンの認
識信頼性を表す第2の文字評価値を検出する機能を有し
ている6第2の組合せ評価値検出部〕5は、第2の文字
評価値に基づき、有効文字候補パタン列から文字候補パ
タンの配列の妥当性を表わす第2の組合せ評価値を検出
する機能を有し、ている。そして、第2の組合せ評価値
検出部15の出力側には、文字決定部16が接続されて
いる。
文字決定部]6は、各有効文字候補パタン列に対する第
1及び第2の組合せ評価値に基づき、前記文字列に類似
する文字候補パタン列を選択するパタン列選択手段16
aと、各有効文字候補パタン列に対応する文字候補コー
ド列の妥当性を単語照合または言語検定(文法的に妥当
性をチエツクする〉により判定するコード列判定手段]
−□ bと、コード列判定手段16bにより妥当性が得
られた場合に文字候補コード列を最終出力とシ1.て検
出し1、妥当性が得られない場合に文字候補コード列の
以内性が得られるまで、単語照合または一語検定を繰り
返(7実行させるMl、終出力検出部16cとで、構成
されている。
第2図及び第3図を参照しつつ、以上のように構成され
る文字認識装置の動作について説明づ゛る。
なお、第2図は第1図の動作説明図であり、図中の符号
20は文字列画像入力部1−Oaより得られた文字列画
像パタンの某端から6文字分[−君」(Pl)、1羊−
+ (P2> 「馬r (P3>、「県−1(P4)、
;−高−+ (P5>、「山1 (P6)、゛奇−+(
P、7)、「市+(P8)の領域パタンを表しており、
行方向をχ、及び行方向に垂直な方向をyで示している
。第3図は第1図の動作フローチャートである。
(A)部分抽出の動作(ステップ31)まず、文字列画
像入力部10aから文字列画像テ゛−タD1が出力され
ると(ステップ30)、その文字列画像データD1は部
分パタン抽出部11に入力され、部分パタンの位置デー
タ及びパタンデータが次のように検出される。即ち、文
字画像パタンをy方向に投影して得た周辺分布値の大き
さに基づいて部分パタンを抽出し、その部分パタンのχ
方向の位置データ(左端座標及び右端座標〉とパタンデ
ータとを検出して保存する。第2図に示すように、「君
J  (PL>、「羊J  (P2>、「馬J (P3
)、「県J (P4)、「高J (P:)>[山4 (
P6)、7奇J (P7)、「市J (P8)の8つの
部分パタンとして得られる。
(B)第1の文字評価値の検出動作(ステップ3第1の
文字評価値検出部12は、文字候補パタン設定手段12
a及び文字評価手段12bにより、部分パタンの内、切
出し開始の注目部分パタンと該注目部分パタンに後続す
る部分パタンとの組合せにより、文字候補パタンを順次
設定しながら、その文字候補パタンに対応する第1の文
字評価値を順次検出する。本実施例では、文字候補パタ
ンの横幅が所定の値、例えば文字画像パタンの高さの1
,5倍の値より小さくなる範囲で、第1の文字評価値の
検出を行う。
この第1の文字評価値の検出するに際し、例えば、文字
候補パタンの横幅、隣接する部分パタン間の空白幅、文
字候補パタン内の空白幅など文字候補パタンの近傍領域
に存在する部分パタンの配置関係に基づいた検出を行う
。本実施例では、文字候補パタンの横幅C1が文字画像
パタンの高さC2に近く、また、隣接する部分パタン間
の最小空白幅C3が大きく、文字候補パタン内の最大空
白幅C4が小さい程、その文字候補パタンか文字らしい
という一般的な傾向に基づいて、第1の文字評価値を、 kix (l cl−C2i /c2) +に2x (
C2/c3)十に3X (C4/’C2) 但し、kl、 k2. k3:適当な正の実定数とする
第4図は、部分パタンP1〜P8に基づいて設定した文
字候補パタンに対応する第1の文字評価値の一例を示す
図であり、図中の矢印で表した16個の各領域が文字候
補パタンに対応付けられ、該矢印に付記した数値が第1
の文字評価値を示している。なお、前記16個の文字候
補パタンは、文字列画像パタン20より得られる全ての
文字候補パタンである。
(C)第1の組合せ評価値検出の動作(ステップ第1の
組合せ評価値検出部13は、候補パタン列選択手段13
aにより、第1の文字評価値検出部12より文字候補パ
タン毎の第1の文字評価値を入力し、文字候補パタン列
の中から前記文字列と類似する文字候補パタン列である
有効文字候補パタン列を1組以上選択する。さらに、評
価値検出手段13bにより、該各有効文字候補パタン列
から、文字候補パタンの配列の妥当性を表す第1の組合
せ評価値をそれぞれ検出して保存する。本実施例では、
有効文字候補パタン列を検出するために、次の(1)式
で表せる評価関数値FV(II<)がより小さくなる場
合の文字候補パタン列(IK>をL組(Lは適当な正の
整数)だけ検出し、これら文字候補パタン列を有効文字
候補パタン列とすると共に、該有効文字候補パタン列に
対応する(1)式の評価関数値を第1の組合せ評価値と
する。
・・・・・・(1) 但し、ni:文字候補パタンiを構成する部分パタン数 ui;文字候補パタンiの第1の文字評価値 前記の条件を満足する有効文字候補パタン列を検出する
には、(1〉式が1番ff1l (j = 1.、 、
2゜・・・・・・、F7)に小さくなる文字候補パタン
列 )を検出すればよく、該検出のため(へ例1ば■:
<、Be1lyna、、nの動的計画法(1′−よ−・
)で高率良く処理することができる。
第2図に[5パ5としまた場合の有効文字候補パタン列
 、j(、j=・i、2,3,4.5>を示゛す゛。こ
の場合、前記有効文字候補パタン列 、j(5こ対応す
る第)の組合ぜ評価値1.: 、、’r (、j・−1
−、2,3,45)は、第4図の第1の文字評価値に基
づき。
L13=FV(ド3) 1 ・ 14 →−2・ S +−1・ 5 +  1
−−+ 1 ・ 15→−二2・ 10 =−i”らU
4=FV< 柱こ4 ) 1−・1t1−→]・1・1生1・1−3日1・う→ 
 ]−・  千5−ト 2 ・ 8−+−1−、]−(
’、)  ニュー 7 ′ンL、、15  =F \、
・′ (吐(5)2 ・  ]−0]−]   ・  
13 + 1−  ・ 5−i−コ  ・ =6−−1
   ・ 1 5  ・ 2 ・ コ ()=−パ18
tJ1 =FV (肘1) ?−1・ ]、]4−+−28−.1 ・511 ・ 
5−i−2・8盲−1・ 1.0 = 661j2 =
FV (F2 ) =2・10トド1−3−.1・5)−1・5+2・81
1 ・ ]O=ご00 とイrる。第、′4図においては、実際tJ(= 、4
2絹の文字候補パタン列が存在′ζるが、この内、ら絹
が有効候補パタン列となる。
(■))文字認識コード及び第2の文字評価値検出の動
作(スう〜ツブ34) 第2の文字評価値検出部]・・1は、第1の組斤せ評価
値検出部13より得られる有効文字候補パタン列の位置
情報と部分パタン抽出部]]−に保存された部分パタン
の位置及びパタンデータとCm基づいて、該有効文字候
補パタン列を構成づる個ノzの文字候補パタンを作成し
て文学誌WfiL1、文字候補パタン毎に文字認識二1
−ドと第2の文字評価値とを検出して保存する。第2の
文字評価値は夕字認識における信頼性を表す巖であ−・
)で2本実施例では、文字候補パタンの特徴量と文字認
識コートに対する標準特徴1とのユークリッド距離を第
2の文字評価値とする。なお、文字候補パタンの認識処
理に当っては、異なる文字候補パタン列に同一の文字候
補パタンか含まれる場合には、該文字候補パタンの認識
は、文字認識装置]−〇の1−回の動作中にただ1度だ
け行えばよい。
・従って、第2図の例においては、「君」、[羊j「馬
」、1県」、「高1.1山1、:奇1、「市」の合計1
0回の認識動作を行っ。第4図(1,−よれば、文字候
補パタンの数は16個であるが:)、本ステップにより
6文字分の認識処理が削減される。
(E)第2の組合せ評価値検出の動作(ステップ31:
)) 第2の組りせ評価値検出部1らは、第2の文字評価値検
出部]−4より得られる有効文字候補パタン列毎の第2
の文字評価値群に基づいて、該有効文′(・′1分補パ
タン列に対応した第2の組合せ評価値を検出する。第2
の組合せ評価値は、有効文字候補パタン列の妥当性を対
応する第2の文字評価値群ML基づいて設定し、たもの
であり 本実施例で゛(j、有効性候補パタン列を構成
する文字候補パタン全てに対応する第1の文字評価値群
の平均値を該有効文字候補パタン列の第2の組合せ評価
値とする。
第2図において、有効文字候補パタン刊本、)乙こ対応
する第2の組合せ評価値Vj(、j−・F23、4. 
”5)は、例えば、 Vl = 1.3 F2 二“ 1 (〕 F3 = 1.、5 V4=lO V5=1.3 のようになる。
(F)文字コード列検出の動作(ステップ36)文字決
定部16は、第1及び第2の組合せ評価値検出部13.
15より、有効文字候補パタン列に対応した第1及び第
2の組み合わせ評価値を入力して文字候補パタン列を決
定し、その文字候補パタン列に対応する文字コード列を
第2の文字評価値検出部14より読出し、最終出力OU
Tとして検出し、文字認識装置10の1回の動作を終了
する。
前記文字候補パタン列の決定に当っては、本実施例にお
いて、有効文字候補パタン列Fj(jl、、2.・・・
・・・)に対応した第1及び第2の組合せ評価値Uj及
びVjの積(Wj=UjxVj)の小さい順に該有効文
字候補パタン列 jに類似度(確からしさ)の順位付け
を行って、第1位となる有効文字候補パタン列を認識対
象の文字列に対応する文字候補パタン列として決定する
第5図は、第2図に対応した第1及び第2の組み合わせ
評価値と文字列に対する類似度の順位の一例を示す図で
ある。この例では、文字候補パタン列胞が最も類似度が
高いことが検知され、その結果、検知結果に対応する文
字コード列「群馬県高崎市」が最終出力OUTとなる。
なお、本発明は、図示の実施例に限定されず、種々の変
形が可能である。例えば、その変形例として次のような
ものがある。
(I>本実施例では、文字認識装置10の入力データは
、1つの文字列画像パタンテータであるとして説明した
が、1つの文字列画像パタン中の一部の領域パタンデー
タを入力データとするように構成してもよい。例えば、
周辺分布法などの文字切出し方法によって、対象とする
文字列画像パタン中から1文字として確からしいパタン
を切り出した後、残されたパタン領域を対象として本発
明による文字認識装置10を適用したり、または文字量
境界として確からしい位置を予め検出しておき、該文字
量境界により分割されるパタン領域を対象として本発明
による文字認識装置を適用すれば、本発明の場合に比べ
、文字候補パタンの場合の数を実質的に減少できるので
、さらに効率よく、文字の切出し及び認識が行える。
(II)本実施例では、第1の組合せ評価値検出部13
を上記(1)式の評価関数値FV(N→に基づいて、有
効文字候補パタン列を検出するように構成する場合につ
いて説明したが、該評価関数としては他の適当な関数を
用いてもよい。例えば、次式に示すように、該評価関数
として文字候補パタン列置に関する第1の文字評価値の
平均値FV2を用いても、本実施例とほぼ同様の効果が
得られる。
・・・・・・(2) 但し、  ui:文字候補パタンiの第1の文字評価値 NIK;IKに含まれる文字候補パタン数 (IIi)第1の組合せ評価値検出部13において、有
効文字候補パタン列の組数を所定のL組とし、さらに、
第1の組合せ評価値を評価関数値FV(IK)と等しぐ
設定するように構成する場合について説明したが、例え
ば、前記有効文字候補パタン列として評価関数値FV(
IK)が所定値以下となる文字候補パタン列Kを設定す
るように構成してもよい。また、第1の組合せ評価値を
評価関数値FV (IK)に応じた適当な値となるよう
に構成してもよく、第1の組合せ評価値検出部13を、
適宜変形して構成することが可能である。
(IV)第2の組合せ評価値検出部15において、有効
文字候補パタン列に関する第2の文字評価値の平均値を
第2の組合せ評価値とするように構成したが、第2の組
合せ評価値として、有効文字候補パタン列に関する第2
の文字評価値に基づいた他の値、例えば最大値を用いて
も構わない。
(V)文字決定部16において、有効文字候補パタン列
IKjに対応した第1及び第2の組合せ評価値Uj、V
jの積に基づいて文字候補パタン列を決定するように構
成したが、第1及び第2の組合ぜ評価値(j−j、Vj
を用いた他の計算方法、例えば(C1l \じ:’、j
+C\1゛・へパ、):但し、cu 、 c’r、vに
定数)に基づいて文字候補パタン列を決定゛づるように
構成してもよい。また4文字決定部1−()を、第1及
び第2の組合せ評価値(、こ基つい”J、イ1効文字候
補パタン列のそれぞれC6″、本実施例と1・11揉、
(16′類似度順位を〕jえ、該順位の高い有効文キ候
袖パタシ列から順(2こ単語照合または言語検定を行い
、妥当性か得へりだ時点で対応″J゛る文字コード列を
員終出)〕とするよっに構成し、゛こもよい。二力場合
(1,′は、第2図の例に対し、では、第ら図の通り、
1K2−Ik4−、、、、−区1 ・V?、5−・べ3
の順に単語照合また(シバ語検定か用意されるか、結果
的には区?に対づる第1回目の単語照合またはハ語検定
の時点て′妥当性が検知され、剋終出力・群馬県高崎−
,が検出される。この様に、文字決定部1(1)を、単
語照合またはバー語検定を備えるよ′う(、こ構成宅゛
ること(、;mより、本実施例に比へ、より高い認識率
を達成−3−ることか期待て′きる。
(発明の効果) 以1−1詐i6;−説明しまたよ・〕に、本発明C6−
よムは、文字候補パタン毎tこ近傍領域の部分パタンの
配置関係に基ついC検出計、ノこ第1の文字評(lll
l値に基づいて、認識対象の文字列(J類似“aる文字
候補パタン列と該文字候補パタン列に対)1四・する第
1の組合せ評価値とを1組員に選択し15、該文字候補
パタン列毎に文字認識を行つ゛ζ文字62識:l−ド列
と第2の文字評価値とを検出J−る。さら(1J、該第
2の文字評価値CJ基ついて、文字候補パタン列毎に第
2の組合せ評価値を検出1,5、第1−及び第2の組合
せ評価値C=基づいて前記文字列(1,r月応゛′J゛
るえ字候補パタン列を決定し2、決定された文字候補パ
タン列に対応喝゛る文字候補:J−ド列を鼓終出力と喝
゛るようにし、5たのζ′、次のよ・うな効果が期待て
”きる。
(1)第1の文字評価値に基ついて、文字候補パタン列
の組を限定し/こ後、文字認識をイコシこと(こより、
従来技術に比べ、認識を打ツ友字パタンの数を低減て′
き、処理達磨か向1=する。
(2)文字候補パタンの配置関係の妥当性を示づ′第1
 &’)文字評価値と文字認識の信頼性を示′″、h−
第2の文字評価値に基ついて、れ終出力を決定すること
により、単語照合を必要とする従来技術4.7比べ、認
識率を低I′:させることなく、装置規模の削減と処理
速度の高速化が図れる。
(3)単語照合や言語検定の処理を追加することにより
、従来よりも高い認識率が達成できる。
【図面の簡単な説明】
第1図は本発明の実施例を承す文字認識装置の機能ブロ
ック図、第2図は第1図の動作説明図、第3図は第1図
の動作フローチャー1・、第11図は第1の文字評価値
の一例を示す図、第5図は文字列に対重る類似度の順位
の一例を示す図である。 10・・・・・・文字認識装置、]〕−・・・・・・部
分パタシ抽出部、12.14・・・・・・第1−及び第
2の文字評価値検出部、1.2 a・・・・・・文字候
補パタン設定部、12F)・・・・・・文字評価手段、
13.15・・・・・・第1及び第2の組合せ評価値検
出部、13a・・・・・・候補パタン列選択手段、13
b・・・・・・評価値検出手段、10・・・文字決定部
、16計・・・・・パタン列選択手段、16[)・・・
・・・コード列判定手段、〕−6c・・・・・・妓終出
ノJ検出部、I)]−・・・・・・文字列画像データ。

Claims (1)

  1. 【特許請求の範囲】 1、情報媒体上の文字列より得られる文字列画像データ
    を入力し、該文字列画像データ中の所定の画素領域を部
    分パタンとして抽出する部分パタン抽出部と、 前記部分パタンを組合せて複数の文字候補パタン設定し
    、該各文字候補パタンの第1の文字評価値を順次検出す
    る第1の文字評価値検出部と、前記第1の文字評価値に
    基づき、前記文字候補パタンからなる文字候補パタン列
    の中から前記文字列と類似する文字候補パタン列を1組
    以上選択する候補パタン列選択手段と、 前記候補パタン列選択手段により選択された各文字候補
    パタン列から、文字候補パタンの配列の妥当性を表す第
    1の組合せ評価値をそれぞれ検出する評価値検出手段と
    、 前記候補パタン列選択手段により選択された各文字候補
    パタン列中の各文字候補パタン毎に文字認識を行い、そ
    の文字認識結果に応じた文字候補コード及び文字候補パ
    タンの認識信頼性を表す第2の文字評価値を検出する第
    2の文字評価値検出部と、 前記第2の文字評価値に基づき、前記候補パタン列選択
    手段により選択された各文字候補パタン列から文字候補
    パタンの配列の妥当性を表わす第2の組合せ評価値を検
    出する第2の組合せ評価値検出部と、 前記候補パタン列選択手段により選択された各文字候補
    パタン列に対する前記第1及び第2の組合せ評価値に基
    づき前記文字列に対する文字候補パタン列を決定し、該
    決定結果の文字候補パタン列に対応する文字候補コード
    列を検出する文字決定部とを、 備えたことを特徴とする文字認識装置。 2、請求項1記載の文字認識装置において、前記第1の
    文字評価値検出部は、 前記部分パタンの内、注目部分パタンと該注目部分パタ
    ンに後続する部分パタンとの組合わせにより、前記文字
    候補パタンを順次設定する文字候補パタン設定手段と、 前記文字候補パタンの近傍領域に存在する部分パタンの
    配置関係に基づき、該文字候補パタンの幾何学的な特徴
    量を表す第1の文字評価値を順次検出する文字評価手段
    とで、 構成した文字認識装置。 3、請求項1記載の文字認識装置において、前記文字決
    定部は、 前記候補パタン列選択手段により選択された各文字候補
    パタン列に対する前記第1及び第2の組合せ評価値に基
    づき、前記文字列に類似する文字候補パタン列を選択す
    るパタン列選択手段と、前記パタン列選択手段により選
    択された各文字候補パタン列に対応する文字候補コード
    列の妥当性を単語照合により判定するコード列判定手段
    と、前記コード列判定手段により妥当性が得られた場合
    に前記文字候補コード列を最終出力として検出し、妥当
    性が得られない場合に前記文字候補コード列の妥当性が
    得られるまで、前記単語照合を繰り返し実行させる最終
    出力検出部とで、 構成した文字認識装置。 4、請求項2記載の文字認識装置において、前記単語照
    合に代えて言語検定とした文字認識装置。
JP2201962A 1990-07-30 1990-07-30 文字認識装置 Pending JPH0485687A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2201962A JPH0485687A (ja) 1990-07-30 1990-07-30 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2201962A JPH0485687A (ja) 1990-07-30 1990-07-30 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0485687A true JPH0485687A (ja) 1992-03-18

Family

ID=16449651

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2201962A Pending JPH0485687A (ja) 1990-07-30 1990-07-30 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0485687A (ja)

Similar Documents

Publication Publication Date Title
JP3842006B2 (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3445394B2 (ja) 少なくとも二つのイメージセクションの比較方法
US7657091B2 (en) Method for automatic removal of text from a signature area
US5040226A (en) Courtesy amount read and transaction balancing system
JPH0684006A (ja) オンライン手書き文字認識方法
CN111563563B (zh) 一种手写体识别的联合数据的增强方法
CN114495135B (zh) 票据识别方法及装置
RU2707320C1 (ru) Способ распознавания символа на банкноте и сопроцессор для вычислительной системы устройства для обработки банкнот
US5995652A (en) Pattern searching method using neural networks and correlation
US4769849A (en) Method and apparatus for separating overlapping patterns
JPS63137386A (ja) 書類の認証システム
Fornés et al. On the use of textural features for writer identification in old handwritten music scores
JPH0485687A (ja) 文字認識装置
Bouafif et al. A hybrid method for three segmentation level of handwritten Arabic script
US6175651B1 (en) On line-character recognition method and device
US20220318240A1 (en) Method, apparatus, and system for form auto-registration using virtual table generation and association
Chahi et al. Effective feature descriptor-based new framework for off-line text-independent writer identification
EP1394726A3 (en) Image processing for pattern recognition using edge detection and projections along predetermined directions
JP4132234B2 (ja) 文字認識方法および装置および文字認識プログラムを記録した記録媒体
KR940004476A (ko) 화상대조방법
JP3157530B2 (ja) 文字切り出し方法
JPS5835674A (ja) オンライン手書文字特徴抽出方法
JPH0371379A (ja) 文字認識方式
JP2778436B2 (ja) 文字切り出し装置
JP2000099631A (ja) パターン認識装置及びパターン認識方法