JPH056464A - 文字列認識方法及びその装置 - Google Patents
文字列認識方法及びその装置Info
- Publication number
- JPH056464A JPH056464A JP3155039A JP15503991A JPH056464A JP H056464 A JPH056464 A JP H056464A JP 3155039 A JP3155039 A JP 3155039A JP 15503991 A JP15503991 A JP 15503991A JP H056464 A JPH056464 A JP H056464A
- Authority
- JP
- Japan
- Prior art keywords
- character
- characters
- string
- candidate
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 32
- 238000011156 evaluation Methods 0.000 claims abstract description 58
- 230000007704 transition Effects 0.000 claims abstract description 33
- 238000000605 extraction Methods 0.000 claims description 9
- 238000012795 verification Methods 0.000 claims description 9
- 238000005520 cutting process Methods 0.000 claims description 4
- 230000003287 optical effect Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 10
- 239000000284 extract Substances 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000012015 optical character recognition Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】
【目的】認識と切り出しを同時に行なう文字が誤認識さ
れた場合にも単語知識を用いて正しく認識する。 【構成】候補文字パタン抽出部2は文字列画像から文字
候補となるパタンを抽出する。文字認識部4は候補文字
パタンを認識し、認識結果で得られる文字コードと文字
評価値とを記憶する。文字切り出し部7は、候補文字パ
タンを基に仮定された文字列画像に含まれる文字数x
と、予め知識として記憶されている文字遷移評価値と、
文字認識部4で得られた文字評価値とを用いて、x個の
候補文字パタンからなる文字列のうち最適なものを探索
する。認識結果検定部9は探索した文字列に対して単語
辞書により照合する。すべての文字が照合されればこれ
を認識結果として出力し、そうでない場合には文字数設
定部5で設定文字数を変更し、前述の処理を繰り返し、
最も良く照合した文字列を出力する。
れた場合にも単語知識を用いて正しく認識する。 【構成】候補文字パタン抽出部2は文字列画像から文字
候補となるパタンを抽出する。文字認識部4は候補文字
パタンを認識し、認識結果で得られる文字コードと文字
評価値とを記憶する。文字切り出し部7は、候補文字パ
タンを基に仮定された文字列画像に含まれる文字数x
と、予め知識として記憶されている文字遷移評価値と、
文字認識部4で得られた文字評価値とを用いて、x個の
候補文字パタンからなる文字列のうち最適なものを探索
する。認識結果検定部9は探索した文字列に対して単語
辞書により照合する。すべての文字が照合されればこれ
を認識結果として出力し、そうでない場合には文字数設
定部5で設定文字数を変更し、前述の処理を繰り返し、
最も良く照合した文字列を出力する。
Description
【0001】
【産業上の利用分野】本発明は文字列認識方法及びその
装置に関し、特に光学的文字読み取り装置(OCR)に
おける文字列認識方法及びその装置に関する。
装置に関し、特に光学的文字読み取り装置(OCR)に
おける文字列認識方法及びその装置に関する。
【0002】
【従来の技術】文字列認識方法及びその装置において、
光学的文字読み取り装置の帳票は、文字記入枠が設けら
れ、筆記者がその枠に1文字ずつを記入する方法がとら
れていた。これに対して、罫線のような緩い書式制約の
元で筆記された文字を認識するための技術が文字列認識
である。
光学的文字読み取り装置の帳票は、文字記入枠が設けら
れ、筆記者がその枠に1文字ずつを記入する方法がとら
れていた。これに対して、罫線のような緩い書式制約の
元で筆記された文字を認識するための技術が文字列認識
である。
【0003】文字列認識においては、文字切り出しの問
題が1つの重要な課題である。特に日本語のように一文
字が複数の連結したパタンに分かれる場合があり、ま
た、手書きのように隣接する文字パタンが接触する場合
には、必ずしもパタン間の余白やパタンの形状だけから
切り出すことは困難である。そこで、文字候補となるパ
タンをまず認識し、その結果を用いて文字列として最適
なパタンの組み合わせを探索する方法が知られている。
この方法については、例えば、文献「候補文字ラティス
法による枠無し筆記文字列のオンライン認識」、電子情
報通信学会(D)J68−D,No.4、1985、7
65〜772頁)に記載されている。
題が1つの重要な課題である。特に日本語のように一文
字が複数の連結したパタンに分かれる場合があり、ま
た、手書きのように隣接する文字パタンが接触する場合
には、必ずしもパタン間の余白やパタンの形状だけから
切り出すことは困難である。そこで、文字候補となるパ
タンをまず認識し、その結果を用いて文字列として最適
なパタンの組み合わせを探索する方法が知られている。
この方法については、例えば、文献「候補文字ラティス
法による枠無し筆記文字列のオンライン認識」、電子情
報通信学会(D)J68−D,No.4、1985、7
65〜772頁)に記載されている。
【0004】しかしながら、漢字には「明」のように偏
と旁に分かれて、それぞれが文字と認識できる文字もあ
り、このような文字が含まれていると上記のような方法
では正しく認識することは困難である。このような場合
にも精度良く認識するために、言語的な知識を利用した
文字列認識方法が知られている。例えば文献「言語情報
を利用した手書き文字列からの文字切り出しと認識」、
電子情報通信学会論文誌(D)、J69−D,No.
9、1986、1292−1301頁に記載されてい
る。
と旁に分かれて、それぞれが文字と認識できる文字もあ
り、このような文字が含まれていると上記のような方法
では正しく認識することは困難である。このような場合
にも精度良く認識するために、言語的な知識を利用した
文字列認識方法が知られている。例えば文献「言語情報
を利用した手書き文字列からの文字切り出しと認識」、
電子情報通信学会論文誌(D)、J69−D,No.
9、1986、1292−1301頁に記載されてい
る。
【0005】
【発明が解決しようとする課題】上述した従来の文字列
認識方法及びその装置では、文字候補を組み合わせてで
きる文字列候補の中に、正しい認識結果が含まれていれ
ば、単語照合によりこれを認識結果として判断すること
は可能であるが、含まれない場合には、正しい認識を行
うことは困難である。
認識方法及びその装置では、文字候補を組み合わせてで
きる文字列候補の中に、正しい認識結果が含まれていれ
ば、単語照合によりこれを認識結果として判断すること
は可能であるが、含まれない場合には、正しい認識を行
うことは困難である。
【0006】また、図2のように文字パタンが誤認識さ
れている場合には、上述のように認識結果だけを利用し
て文字列候補を選出すると、正しい認識結果が数の限定
された文字列候補の中に含まれないことが多くなり、単
語照合によっても認識誤りを修正できなくなる。
れている場合には、上述のように認識結果だけを利用し
て文字列候補を選出すると、正しい認識結果が数の限定
された文字列候補の中に含まれないことが多くなり、単
語照合によっても認識誤りを修正できなくなる。
【0007】ところで、認識対象が住所のように予め限
定されていて、2つの文字が連続して発生する場合は非
常に限定される。例えば、ある地域の住所に限定した場
合に、「東」の次に「京」が書かれることはあるが、
「野」が書かれることはないといった知識が得られる。
従って、文字列候補を選出するときに、単に個別のパタ
ンの文字らしさの評価値だけでなく、隣接する文字との
整合性を文字遷移情報という上位の知識を用いて評価す
ることにより、たとえ、個別のパタンが誤認識され、下
位の候補として認識された場合にも、文字遷移情報によ
り、文字列候補を有効に選ぶことが可能になり、単語照
合が効果的に利用できる。
定されていて、2つの文字が連続して発生する場合は非
常に限定される。例えば、ある地域の住所に限定した場
合に、「東」の次に「京」が書かれることはあるが、
「野」が書かれることはないといった知識が得られる。
従って、文字列候補を選出するときに、単に個別のパタ
ンの文字らしさの評価値だけでなく、隣接する文字との
整合性を文字遷移情報という上位の知識を用いて評価す
ることにより、たとえ、個別のパタンが誤認識され、下
位の候補として認識された場合にも、文字遷移情報によ
り、文字列候補を有効に選ぶことが可能になり、単語照
合が効果的に利用できる。
【0008】本発明の目的は、認識対象が予め限定され
ている場合に、対象に関する知識として、文字間の遷移
情報を予め文字遷移評価値として記憶し、これを用いる
ことにより、誤認識された場合にもこれを修正すること
を可能にする。
ている場合に、対象に関する知識として、文字間の遷移
情報を予め文字遷移評価値として記憶し、これを用いる
ことにより、誤認識された場合にもこれを修正すること
を可能にする。
【0009】
【課題を解決するための手段】本発明の文字列認識方法
は、光学的に帳票から読み取った文字列画像から候補文
字パタンを抽出し、前記候補文字パタンと文字認識辞書
の標準パタンとを照合する認識処理の結果により文字評
価値を算出し、前記候補文字パタンにより前記文字列画
像の文字数を仮定し、前記文字評価値及び予め単語辞書
から算出した文字間の遷移情報を表す文字遷移評価値に
より前記文字列画像から前記文字数を切り出して文字コ
ード列として出力し、前記文字コード列と前記単語辞書
に格納してある単語とを照合し、前記文字コード列の全
ての文字が照合された場合には前記文字コード列を前記
文字列画像の認識結果として出力し、照合しない場合に
は可能な文字数の範囲内で前記文字数を変更して前記文
字切り出し処理及び前記単語照合処理を反復し、可能な
文字数の範囲の全てに対して照合されなかった場合に
は、可能な文字数の範囲内の最適な照合結果を前記文字
列画像の認識結果として出力する。
は、光学的に帳票から読み取った文字列画像から候補文
字パタンを抽出し、前記候補文字パタンと文字認識辞書
の標準パタンとを照合する認識処理の結果により文字評
価値を算出し、前記候補文字パタンにより前記文字列画
像の文字数を仮定し、前記文字評価値及び予め単語辞書
から算出した文字間の遷移情報を表す文字遷移評価値に
より前記文字列画像から前記文字数を切り出して文字コ
ード列として出力し、前記文字コード列と前記単語辞書
に格納してある単語とを照合し、前記文字コード列の全
ての文字が照合された場合には前記文字コード列を前記
文字列画像の認識結果として出力し、照合しない場合に
は可能な文字数の範囲内で前記文字数を変更して前記文
字切り出し処理及び前記単語照合処理を反復し、可能な
文字数の範囲の全てに対して照合されなかった場合に
は、可能な文字数の範囲内の最適な照合結果を前記文字
列画像の認識結果として出力する。
【0010】本発明の文字列認識装置は、光学的な走査
で読み取った文字列画像を格納する文字列画像記憶手段
と、前記文字列画像記憶手段から読み出された文字列画
像により文字候補となる候補文字パタンを抽出し格納す
る候補文字パタン抽出手段と、標準パタンを記憶する文
字認識辞書記憶手段と、前記候補文字パタン抽出手段か
ら読み出された候補文字パタンと前記文字認識辞書記憶
手段から読み出された標準パタンとを照合する認識処理
により文字コードと認識結果とから得られる文字評価値
を格納する文字認識手段と、前記候補文字パタン抽出手
段から読み出された候補文字パタンにより前記文字列画
像の文字数を仮定し、認識結果検定部から文字数が入力
された場合には可能な範囲内で文字数を変更する文字数
設定手段と、前記文字数設定手段からの文字数と前記文
字認識手段から読み出された候補文字パタンの文字評価
値と文字遷移評価値記憶手段から読み出された文字間の
遷移情報を表す文字遷移評価値とにより複数の候補文字
パタンから構成される文字列候補の内最適なものを探索
し、前記文字列候補と認識結果である文字コード列とを
格納する文字切り出し手段と、前記文字切り出し手段か
らの文字コード列と、単語辞書記憶手段からの単語とを
照合し、前記文字コード列の全ての文字が照合された場
合には前記文字コード列を文字列認識結果出力手段に出
力し、照合しない場合には照合文字列を記憶するととも
に、文字数を前記文字数設定手段に出力し、可能な文字
数の全てに対して照合されなかった場合には、格納され
ている照合文字列の内で最適な照合文字列を前記文字列
認識結果出力手段に出力する認識結果検定部と、前記認
識結果検定部からの文字照合結果を出力する文字列認識
結果出力手段とを有する。
で読み取った文字列画像を格納する文字列画像記憶手段
と、前記文字列画像記憶手段から読み出された文字列画
像により文字候補となる候補文字パタンを抽出し格納す
る候補文字パタン抽出手段と、標準パタンを記憶する文
字認識辞書記憶手段と、前記候補文字パタン抽出手段か
ら読み出された候補文字パタンと前記文字認識辞書記憶
手段から読み出された標準パタンとを照合する認識処理
により文字コードと認識結果とから得られる文字評価値
を格納する文字認識手段と、前記候補文字パタン抽出手
段から読み出された候補文字パタンにより前記文字列画
像の文字数を仮定し、認識結果検定部から文字数が入力
された場合には可能な範囲内で文字数を変更する文字数
設定手段と、前記文字数設定手段からの文字数と前記文
字認識手段から読み出された候補文字パタンの文字評価
値と文字遷移評価値記憶手段から読み出された文字間の
遷移情報を表す文字遷移評価値とにより複数の候補文字
パタンから構成される文字列候補の内最適なものを探索
し、前記文字列候補と認識結果である文字コード列とを
格納する文字切り出し手段と、前記文字切り出し手段か
らの文字コード列と、単語辞書記憶手段からの単語とを
照合し、前記文字コード列の全ての文字が照合された場
合には前記文字コード列を文字列認識結果出力手段に出
力し、照合しない場合には照合文字列を記憶するととも
に、文字数を前記文字数設定手段に出力し、可能な文字
数の全てに対して照合されなかった場合には、格納され
ている照合文字列の内で最適な照合文字列を前記文字列
認識結果出力手段に出力する認識結果検定部と、前記認
識結果検定部からの文字照合結果を出力する文字列認識
結果出力手段とを有する。
【0011】
【作用】本発明の文字列認識方法について説明する。以
下の説明では、縦書き文字列画像を例として用いるが、
横書きの文字列についても同様に適用できる。図3
(a)は手書き文字列画像の例である。入力された文字
列画像に対して、文字候補となるパタン(候補文字パタ
ン)を抽出する。図3(b)はその抽出結果を表したラ
ティスである。ラティスの各ノードが文字列画像の切り
出し候補位置に対応し、2つのノードを結ぶリンクが、
対応する切り出し位置に挟まれたパタンで、候補文字パ
タンを表す。
下の説明では、縦書き文字列画像を例として用いるが、
横書きの文字列についても同様に適用できる。図3
(a)は手書き文字列画像の例である。入力された文字
列画像に対して、文字候補となるパタン(候補文字パタ
ン)を抽出する。図3(b)はその抽出結果を表したラ
ティスである。ラティスの各ノードが文字列画像の切り
出し候補位置に対応し、2つのノードを結ぶリンクが、
対応する切り出し位置に挟まれたパタンで、候補文字パ
タンを表す。
【0012】各候補文字パタンと文字認識辞書の標準パ
タンとを照合し、候補文字パタンの認識を行い、これに
基づいて候補文字パタンの文字である信頼性を表す文字
評価値を算出する。文字評価値の算出方法として、例え
ば特願平1−334347「文字列認識方法及びその装
置」が知られている。これにより、候補文字パタンが文
字らしいほど高い評価値を得ることが可能である。
タンとを照合し、候補文字パタンの認識を行い、これに
基づいて候補文字パタンの文字である信頼性を表す文字
評価値を算出する。文字評価値の算出方法として、例え
ば特願平1−334347「文字列認識方法及びその装
置」が知られている。これにより、候補文字パタンが文
字らしいほど高い評価値を得ることが可能である。
【0013】候補文字パタンを組み合わせて構成される
文字列候補に対して、単語照合を行い、文字列認識を行
うが、一般にはすべての組み合わせを照合すると処理量
が膨大となる。そのために、ある文字の次に別の文字が
発生することがあるかどうかを文字遷移評価値として、
予め単語辞書があるいは学習データから算出しておく。
文字遷移評価値としては、例えば文字Ciの次に文字C
jがくることがある場合には1、そうでない場合には0
として、2値で表す方法、あるいはカテゴリの出現確率
という形で算出する方法等がある。この文字遷移評価値
と文字評価値を利用して文字列候補を絞ることによっ
て、たとえ文字パタンが図2のように誤認識されて文字
評価値が低く、下位の候補として認識されていても、文
字遷移評価値により文字列候補の中に選出することが可
能となる。
文字列候補に対して、単語照合を行い、文字列認識を行
うが、一般にはすべての組み合わせを照合すると処理量
が膨大となる。そのために、ある文字の次に別の文字が
発生することがあるかどうかを文字遷移評価値として、
予め単語辞書があるいは学習データから算出しておく。
文字遷移評価値としては、例えば文字Ciの次に文字C
jがくることがある場合には1、そうでない場合には0
として、2値で表す方法、あるいはカテゴリの出現確率
という形で算出する方法等がある。この文字遷移評価値
と文字評価値を利用して文字列候補を絞ることによっ
て、たとえ文字パタンが図2のように誤認識されて文字
評価値が低く、下位の候補として認識されていても、文
字遷移評価値により文字列候補の中に選出することが可
能となる。
【0014】具体的には、文字数の違いによる文字列候
補の評価誤差を生じないために、文字数の等しい文字列
候補毎に、候補を絞る。このときに、文字列候補に含ま
れる候補文字パタンの文字評価値及び文字遷移評価値の
和を文字列評価値として、文字列評価値の最大となるも
のを探索し、これを候補とする方法を採る。これによっ
て、最終的には文字列候補として互いに文字数が異なる
ものが選出されるが、この中から単語照合によって、最
も良く照合した文字列を認識結果として出力する処理に
より、たとえ文字パタンが誤認識されても文字遷移情報
を利用することにより、これを修正し、正しく認識する
ことが可能となる。
補の評価誤差を生じないために、文字数の等しい文字列
候補毎に、候補を絞る。このときに、文字列候補に含ま
れる候補文字パタンの文字評価値及び文字遷移評価値の
和を文字列評価値として、文字列評価値の最大となるも
のを探索し、これを候補とする方法を採る。これによっ
て、最終的には文字列候補として互いに文字数が異なる
ものが選出されるが、この中から単語照合によって、最
も良く照合した文字列を認識結果として出力する処理に
より、たとえ文字パタンが誤認識されても文字遷移情報
を利用することにより、これを修正し、正しく認識する
ことが可能となる。
【0015】
【実施例】次に本発明について図面を参照して説明す
る。図1は本発明の一実施例を示すブロック図である。
る。図1は本発明の一実施例を示すブロック図である。
【0016】文字画像記憶部1は、2値化された文字列
画像を格納する。候補文字パタン抽出部2は、文字列画
像記憶部1から読み出した文字列画像信号11により文
字候補となるパタンを抽出して、これをラティスとして
記憶装置に格納する。文字候補となるパタンの抽出方法
としては、例えば以下のようにして実現できる。まず、
文字列画像から図形としてのまとまりの最小単位のパタ
ンを抽出するために、文字列画像に対してその文字列方
向と垂直な方向に黒画素を計数して得られる投影関数を
f(x)とする。関数f(x)に対して式(1)で表さ
れるガウシァン関数g(x)を用いて、式(2)の計算
を施し、平滑化した投影関数f′(x)を算出する。
画像を格納する。候補文字パタン抽出部2は、文字列画
像記憶部1から読み出した文字列画像信号11により文
字候補となるパタンを抽出して、これをラティスとして
記憶装置に格納する。文字候補となるパタンの抽出方法
としては、例えば以下のようにして実現できる。まず、
文字列画像から図形としてのまとまりの最小単位のパタ
ンを抽出するために、文字列画像に対してその文字列方
向と垂直な方向に黒画素を計数して得られる投影関数を
f(x)とする。関数f(x)に対して式(1)で表さ
れるガウシァン関数g(x)を用いて、式(2)の計算
を施し、平滑化した投影関数f′(x)を算出する。
【0017】
【0018】この投影関数f′(x)の極小値を与える
全てのx座標を算出し、この点を切り出し候補位置Ni
(i=0,…,K)とし、この点を通り文字列方向と垂
直な方向の直線を切り出し候補線とし、この隣接する2
つの切り出し候補線に挟まれたパタンを処理の最小パタ
ンとする。文字列画像から平滑化した投影関数を算出
し、その極小点を算出する。また、隣接する文字が接触
したり、重なったりする場合にも、その分離点は投影関
数f′(x)の極小点となることが予想される。従っ
て、このように画像を細かく分割しておくことにより、
たとえ文字と文字が接触したり、重なったりしていて
も、これを分離しておくことが可能になる。この切り出
し候補位置を記憶手段に格納しておく。
全てのx座標を算出し、この点を切り出し候補位置Ni
(i=0,…,K)とし、この点を通り文字列方向と垂
直な方向の直線を切り出し候補線とし、この隣接する2
つの切り出し候補線に挟まれたパタンを処理の最小パタ
ンとする。文字列画像から平滑化した投影関数を算出
し、その極小点を算出する。また、隣接する文字が接触
したり、重なったりする場合にも、その分離点は投影関
数f′(x)の極小点となることが予想される。従っ
て、このように画像を細かく分割しておくことにより、
たとえ文字と文字が接触したり、重なったりしていて
も、これを分離しておくことが可能になる。この切り出
し候補位置を記憶手段に格納しておく。
【0019】次に異なる2つの切り出し候補線に挟まれ
たパタンが1文字であるか否かを判断し、1文字と判断
されたパタンを候補文字パタンとして記憶手段に格納す
る。ここで、1文字である可能性のあるパタンは、判定
基準(1)及び(2)により判定する。
たパタンが1文字であるか否かを判断し、1文字と判断
されたパタンを候補文字パタンとして記憶手段に格納す
る。ここで、1文字である可能性のあるパタンは、判定
基準(1)及び(2)により判定する。
【0020】判定基準(1)はパタンの外接矩形の縦横
比(w/h)が、0.5≦r≦2.5ならばそのパタン
は候補文字パタンとする(図4)。判定基準(2)はパ
タンの内部の余白(s)の文字幅(w)に対する比が
0.5以下ならば、候補文字パタンとする(図4)。
比(w/h)が、0.5≦r≦2.5ならばそのパタン
は候補文字パタンとする(図4)。判定基準(2)はパ
タンの内部の余白(s)の文字幅(w)に対する比が
0.5以下ならば、候補文字パタンとする(図4)。
【0021】文字認識部4は、候補文字パタン抽出部2
から信号12として各候補文字パタンを読み込み、文字
認識辞書記憶部3から信号13として標準パタンを読み
込み、候補文字パタンの認識を行い、認識結果の候補そ
れぞれに対する信頼性を示す文字評価値を算出し(図
5)、候補文字パタンの文字コードと文字評価値を記憶
手段に記憶する。候補文字パタンの各認識候補に対する
信頼性が0から1までの値で表され、1に近いほど信頼
性が高いと評価されることになる。文字数設定部5は候
補文字パタン抽出部2から全ての候補文字パタンを信号
14として読み込み、候補文字パタンを基に、入力され
た文字列画像に対して可能な文字数を設定し、この文字
数を信号15として出力する。
から信号12として各候補文字パタンを読み込み、文字
認識辞書記憶部3から信号13として標準パタンを読み
込み、候補文字パタンの認識を行い、認識結果の候補そ
れぞれに対する信頼性を示す文字評価値を算出し(図
5)、候補文字パタンの文字コードと文字評価値を記憶
手段に記憶する。候補文字パタンの各認識候補に対する
信頼性が0から1までの値で表され、1に近いほど信頼
性が高いと評価されることになる。文字数設定部5は候
補文字パタン抽出部2から全ての候補文字パタンを信号
14として読み込み、候補文字パタンを基に、入力され
た文字列画像に対して可能な文字数を設定し、この文字
数を信号15として出力する。
【0022】次に図6を参照して、具体的な処理動作を
説明する。まず、ステップ61ではレジスタに文字数x
として0をセットする。ステップ62では、x=x+1
と文字数をインクリメントして、ステップ63で文字数
xが最大値K以下であるか否かを判断する。ステップ6
3で、xが最大値K以下の場合はステップ64におい
て、入力文字列画像がx個の候補文字パタンから構成さ
れるか否かを判断する。これは、切り出し候補位置Ni
(i=0,…,K)をノードとし、候補文字パタンl
(i,j)をリンクとする2端子有向グラフの始点から
終点に至るパスの内、x個のリンクを通るパスが存在す
るかどうかを調べることにより容易に実現できる。ステ
ップ64において肯定された場合は、文字数xを信号1
5として出力する。否定された場合は、ステップ62に
戻る。ステップ63で文字数xが最大値kを越えた場合
は、信号15を通して処理の終了を伝える。
説明する。まず、ステップ61ではレジスタに文字数x
として0をセットする。ステップ62では、x=x+1
と文字数をインクリメントして、ステップ63で文字数
xが最大値K以下であるか否かを判断する。ステップ6
3で、xが最大値K以下の場合はステップ64におい
て、入力文字列画像がx個の候補文字パタンから構成さ
れるか否かを判断する。これは、切り出し候補位置Ni
(i=0,…,K)をノードとし、候補文字パタンl
(i,j)をリンクとする2端子有向グラフの始点から
終点に至るパスの内、x個のリンクを通るパスが存在す
るかどうかを調べることにより容易に実現できる。ステ
ップ64において肯定された場合は、文字数xを信号1
5として出力する。否定された場合は、ステップ62に
戻る。ステップ63で文字数xが最大値kを越えた場合
は、信号15を通して処理の終了を伝える。
【0023】文字遷往評価値記憶部6は、カテゴリCi
の次にカテゴリCjが発生するかどうかを予め単語辞書
から文字遷移評価値t(Ci,Cj)として算出し、こ
れを通常の記憶装置に格納しておく。文字遷移評価値t
としては、例えばカテゴリCiの次のカテゴリCjが発
生することがある場合には1で、無い場合には0の2値
で表す。
の次にカテゴリCjが発生するかどうかを予め単語辞書
から文字遷移評価値t(Ci,Cj)として算出し、こ
れを通常の記憶装置に格納しておく。文字遷移評価値t
としては、例えばカテゴリCiの次のカテゴリCjが発
生することがある場合には1で、無い場合には0の2値
で表す。
【0024】文字切り出し部7は文字数設定部5から信
号15として文字数xを読み込み、文字認識部4から信
号16として文字評価値を読み込み、文字遷移評価値記
憶部6から信号17として文字遷移評価値を読み込み、
x個の候補文字パタンから構成される文字列候補の内、
最適なものを文字評価値と文字遷移評価値とを使って決
定し、その切り出し位置及び文字コード列を記憶する。
号15として文字数xを読み込み、文字認識部4から信
号16として文字評価値を読み込み、文字遷移評価値記
憶部6から信号17として文字遷移評価値を読み込み、
x個の候補文字パタンから構成される文字列候補の内、
最適なものを文字評価値と文字遷移評価値とを使って決
定し、その切り出し位置及び文字コード列を記憶する。
【0025】x個の文字からなる最適な文字列の決定
は、以下のようにして実現できる。s(t)(t=0,
…,x)を第t番目文字の終了位置(切り出し位置)と
する。s(0)=0,s(x)=Kである。また、r
(t)(t=1,…,x)を第t番目の候補文字パタン
の認識結果の順位とする。文字切り出し部7では、文字
評価値と文字遷移評価値により算出される式(3)を最
大にする切り出し位置s(t)と認識結果の順位r
(t)を、動的計画法を用いて決定する。但し、切り出
し候補位置NiとNjに挟まれた候補文字パタンl
(i,j)の認識結果として、第1位から第R位までの
文字コードをc(i,j,k)(k=1,…,R)及び
その文字評価値w(i,j,k)と表す。また、文字C
iの次に文字Cjが発生する時の文字遷移評価値をt
(Ci,Cj)と表し、文字Ciが文字列の先頭に位置
するかどうかを表す評価値をt′(Ci)で表す。パラ
メータαは、文字遷移評価値の文字評価値に対する影響
を制御するためのパラメータである。これにより、各文
字のパタンの文字である信頼性が高く、かつ直前の文字
に対する出現の可能性の大きい文字が最適な文字列とし
て決定される。
は、以下のようにして実現できる。s(t)(t=0,
…,x)を第t番目文字の終了位置(切り出し位置)と
する。s(0)=0,s(x)=Kである。また、r
(t)(t=1,…,x)を第t番目の候補文字パタン
の認識結果の順位とする。文字切り出し部7では、文字
評価値と文字遷移評価値により算出される式(3)を最
大にする切り出し位置s(t)と認識結果の順位r
(t)を、動的計画法を用いて決定する。但し、切り出
し候補位置NiとNjに挟まれた候補文字パタンl
(i,j)の認識結果として、第1位から第R位までの
文字コードをc(i,j,k)(k=1,…,R)及び
その文字評価値w(i,j,k)と表す。また、文字C
iの次に文字Cjが発生する時の文字遷移評価値をt
(Ci,Cj)と表し、文字Ciが文字列の先頭に位置
するかどうかを表す評価値をt′(Ci)で表す。パラ
メータαは、文字遷移評価値の文字評価値に対する影響
を制御するためのパラメータである。これにより、各文
字のパタンの文字である信頼性が高く、かつ直前の文字
に対する出現の可能性の大きい文字が最適な文字列とし
て決定される。
【0026】
【0027】ここで、最適な文字列の探索は式(4)と
(5)を用いることにより、実現できる。但し、φt
(nt-1 ,nt ,rt-1 ,rt )はt個の候補文字パタ
ンからなる文字列候補の内、t−1番目のパタンの終了
位置がnt-1 で、第rt-1 位の認識結果を採用し、t番
目のパタンの終了位置がnt で、第rt 位の認識結果を
採用する文字列候補の評価値の中で最大の評価値を表
す。また、式(4)の中で、t=2の場合には式(6)
により算出する。
(5)を用いることにより、実現できる。但し、φt
(nt-1 ,nt ,rt-1 ,rt )はt個の候補文字パタ
ンからなる文字列候補の内、t−1番目のパタンの終了
位置がnt-1 で、第rt-1 位の認識結果を採用し、t番
目のパタンの終了位置がnt で、第rt 位の認識結果を
採用する文字列候補の評価値の中で最大の評価値を表
す。また、式(4)の中で、t=2の場合には式(6)
により算出する。
【0028】単語辞書記憶部8には、単語としての文字
コード列を記憶手段によって記憶しておく。認識結果検
定部9は文字切り出し部7から信号18として文字コー
ド列を読み込み、単語辞書記憶部8に格納してある各単
語の文字コード列を信号19として読み込み、文字コー
ド列の意味が成立するかどうかを検定する。具体的には
以下のような手段により実現できる。
コード列を記憶手段によって記憶しておく。認識結果検
定部9は文字切り出し部7から信号18として文字コー
ド列を読み込み、単語辞書記憶部8に格納してある各単
語の文字コード列を信号19として読み込み、文字コー
ド列の意味が成立するかどうかを検定する。具体的には
以下のような手段により実現できる。
【0029】文字コード列をc0 ,c1 ,…cx とす
る。文字コード列の先頭の文字コードc0 から単語辞書
のすべての単語と照合を行う。1文字でも照合された単
語があれば、その単語及び先頭の文字位置と最後の文字
位置および一致した文字数を記憶手段により記憶する。
例えば、図7(a)では単語「東京都」に対して、一致
文字数3、先頭文字位置C0 ,末端文字位置C2 を記憶
する。次に照合する文字位置を1つずつずらして同様に
単語辞書と照合を行う。このようにして、文字コード列
の各文字位置を先頭として可能な単語を全て記憶する。
その結果を示したのが図7(b)である。この照合され
た単語候補を組み合わせてできる文字列の中から、最も
一致文字数の多い文字列d0 d1 …dy を探索する。
る。文字コード列の先頭の文字コードc0 から単語辞書
のすべての単語と照合を行う。1文字でも照合された単
語があれば、その単語及び先頭の文字位置と最後の文字
位置および一致した文字数を記憶手段により記憶する。
例えば、図7(a)では単語「東京都」に対して、一致
文字数3、先頭文字位置C0 ,末端文字位置C2 を記憶
する。次に照合する文字位置を1つずつずらして同様に
単語辞書と照合を行う。このようにして、文字コード列
の各文字位置を先頭として可能な単語を全て記憶する。
その結果を示したのが図7(b)である。この照合され
た単語候補を組み合わせてできる文字列の中から、最も
一致文字数の多い文字列d0 d1 …dy を探索する。
【0030】文字コード列c0 ,c1 ,…cx の全ての
文字が照合結果の文字列d0 d1 …dy と一致した場合
は、この文字コード列を文字列認識結果出力部10に信
号21として出力し、処理を終了する。そうでない場合
は、文字数設定部5に信号20として文字数xを出力す
る。文字数設定部5では、ステップ62で文字数xを入
力し、前述と同様の処理を行う。
文字が照合結果の文字列d0 d1 …dy と一致した場合
は、この文字コード列を文字列認識結果出力部10に信
号21として出力し、処理を終了する。そうでない場合
は、文字数設定部5に信号20として文字数xを出力す
る。文字数設定部5では、ステップ62で文字数xを入
力し、前述と同様の処理を行う。
【0031】また、文字数設定部5から処理終了の信号
が送られているときには、各文字数xに対して得られて
いる照合結果の文字コード列d0 xd1 x …dy x の最
適なものを探索する。例えば、照合結果の文字コード列
d0 x d1 x …dy x から、入力文字コード列c0 c1
…cx との一致文字数、照合単語数および照合結果の文
字数yを計数し、これらを基に最良の照合結果を以下の
ような基準を用いて探索する。基準1は最も一致文字数
の多い文字列コード列とし、基準2は基準1を満たす文
字コード列が複数ある場合には、それらの内で照合単語
数の最小の文字コード列とし、基準3は基準2を満たす
文字コード列が複数ある場合には、それらの内で文字数
yの最も多い文字コード列とする。
が送られているときには、各文字数xに対して得られて
いる照合結果の文字コード列d0 xd1 x …dy x の最
適なものを探索する。例えば、照合結果の文字コード列
d0 x d1 x …dy x から、入力文字コード列c0 c1
…cx との一致文字数、照合単語数および照合結果の文
字数yを計数し、これらを基に最良の照合結果を以下の
ような基準を用いて探索する。基準1は最も一致文字数
の多い文字列コード列とし、基準2は基準1を満たす文
字コード列が複数ある場合には、それらの内で照合単語
数の最小の文字コード列とし、基準3は基準2を満たす
文字コード列が複数ある場合には、それらの内で文字数
yの最も多い文字コード列とする。
【0032】文字列認識結果出力部10は文字コード列
の先頭から認識結果を出力する。
の先頭から認識結果を出力する。
【0033】なお、本実施例では、縦書きの文字列を使
って説明したが、横書きの文字列にも本実施例と同様に
適用できる。また、候補文字パタンの抽出方法も、本実
施例に限らず、接触した文字でも分離することが可能な
方法ならば、支障なく適用できる。また、住所などの読
み取り対象が限定され、知識の階層化が可能な対象に対
しては、単語辞書として木(ツリー)構造の表現を用い
て単語を記憶しておくことにより、単語照合時の処理を
削減することが可能であると共に、より高精度の認識が
可能になる。
って説明したが、横書きの文字列にも本実施例と同様に
適用できる。また、候補文字パタンの抽出方法も、本実
施例に限らず、接触した文字でも分離することが可能な
方法ならば、支障なく適用できる。また、住所などの読
み取り対象が限定され、知識の階層化が可能な対象に対
しては、単語辞書として木(ツリー)構造の表現を用い
て単語を記憶しておくことにより、単語照合時の処理を
削減することが可能であると共に、より高精度の認識が
可能になる。
【0034】また、文字遷移評価値についても本実施例
に限定されることはなく、例えば、式(7)で算出され
る評価値を用いても本実施例と同様の結果が得られる。
に限定されることはなく、例えば、式(7)で算出され
る評価値を用いても本実施例と同様の結果が得られる。
【0035】
【0036】また、文字遷移評価値の算出のためのデー
タを単語辞書すべてを用いて行う必要もなく、学習デー
タとして、本装置に入力される可能性のあるもの、ある
いは出現頻度の多いデータに限っても良い。
タを単語辞書すべてを用いて行う必要もなく、学習デー
タとして、本装置に入力される可能性のあるもの、ある
いは出現頻度の多いデータに限っても良い。
【0037】
【発明の効果】以上説明したように本発明によれば、隣
接する文字が接触したり重なったりして、比較的自由に
筆記された文字列画像からも、文字を正確に切り出すこ
とを可能にすると共に、個別文字が誤認識されたときに
も単語情報を用いて修正することが可能である。
接する文字が接触したり重なったりして、比較的自由に
筆記された文字列画像からも、文字を正確に切り出すこ
とを可能にすると共に、個別文字が誤認識されたときに
も単語情報を用いて修正することが可能である。
【図1】本発明の文字列認識装置の一実施例を示すブロ
ック図である。
ック図である。
【図2】従来の文字列認識方法を説明するための図であ
る。
る。
【図3】本実施例の手書き文字列画像に対する候補文字
パタン抽出の説明図である。
パタン抽出の説明図である。
【図4】本実施例の文字パタンの評価要素の説明図であ
る。
る。
【図5】本実施例の候補文字パタンの文字評価値の説明
図である。
図である。
【図6】本実施例の文字数設定部5の処理内容を示すフ
ローチャートである。
ローチャートである。
【図7】本実施例の認識結果検定部9の単語照合の説明
図である。
図である。
1 文字列画像記憶部
2 候補文字パタン抽出部
3 文字認識辞書記憶部
4 文字認識部
5 文字数設定部
6 文字遷移評価値記憶部
7 文字切り出し部
8 単語辞書記憶部
9 認識結果検定部
10 文字列認識結果出力部
Claims (2)
- 【請求項1】 光学的に帳票から読み取った文字列画像
から候補文字パタンを抽出し、前記候補文字パタンと文
字認識辞書の標準パタンとを照合する認識処理の結果に
より文字評価値を算出し、前記候補文字パタンにより前
記文字列画像の文字数を仮定し、前記文字評価値及び予
め単語辞書から算出した文字間の遷移情報を表す文字遷
移評価値により前記文字列画像から前記文字数を切り出
して文字コード列として出力し、前記文字コード列と前
記単語辞書に格納してある単語とを照合し、前記文字コ
ード列の全ての文字が照合された場合には前記文字コー
ド列を前記文字列画像の認識結果として出力し、照合し
ない場合には可能な文字数の範囲内で前記文字数を変更
して前記文字切り出し処理及び前記単語照合処理を反復
し、可能な文字数の範囲の全てに対して照合されなかっ
た場合には、可能な文字数の範囲内の最適な照合結果を
前記文字列画像の認識結果として出力することを特徴と
する文字列認識方法。 - 【請求項2】 光学的な走査で読み取った文字列画像を
格納する文字列画像記憶手段と、前記文字列画像記憶手
段から読み出された文字列画像により文字候補となる候
補文字パタンを抽出し格納する候補文字パタン抽出手段
と、標準パタンを記憶する文字認識辞書記憶手段と、前
記候補文字パタン抽出手段から読み出された候補文字パ
タンと前記文字認識辞書記憶手段から読み出された標準
パタンとを照合する認識処理により文字コードと認識結
果とから得られる文字評価値を格納する文字認識手段
と、前記候補文字パタン抽出手段から読み出された候補
文字パタンにより前記文字列画像の文字数を仮定し、認
識結果検定部から文字数が入力された場合には可能な範
囲内で文字数を変更する文字数設定手段と、前記文字数
設定手段からの文字数と前記文字認識手段から読み出さ
れた候補文字パタンの文字評価値と文字遷移評価値記憶
手段から読み出された文字間の遷移情報を表す文字遷移
評価値とにより複数の候補文字パタンから構成される文
字列候補の内最適なものを探索し、前記文字列候補と認
識結果である文字コード列とを格納する文字切り出し手
段と、前記文字切り出し手段からの文字コード列と、単
語辞書記憶手段からの単語とを照合し、前記文字コード
列の全ての文字が照合された場合には前記文字コード列
を文字列認識結果出力手段に出力し、照合しない場合に
は照合文字列を記憶するとともに、文字数を前記文字数
設定手段に出力し、可能な文字数の全てに対して照合さ
れなかった場合には、格納されている照合文字列の内で
最適な照合文字列を前記文字列認識結果出力手段に出力
する認識結果検定部と、前記認識結果検定部からの文字
照合結果を出力する文字列認識結果出力手段とを有する
ことを特徴とする文字列認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3155039A JP2903779B2 (ja) | 1991-06-27 | 1991-06-27 | 文字列認識方法及びその装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3155039A JP2903779B2 (ja) | 1991-06-27 | 1991-06-27 | 文字列認識方法及びその装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH056464A true JPH056464A (ja) | 1993-01-14 |
| JP2903779B2 JP2903779B2 (ja) | 1999-06-14 |
Family
ID=15597338
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3155039A Expired - Fee Related JP2903779B2 (ja) | 1991-06-27 | 1991-06-27 | 文字列認識方法及びその装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2903779B2 (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH11120293A (ja) * | 1997-10-16 | 1999-04-30 | Fujitsu Ltd | 文字認識/修正方式 |
| CN112784125A (zh) * | 2021-01-14 | 2021-05-11 | 辽宁工程技术大学 | 一种输入信息的模式识别方法和装置 |
| CN113614737A (zh) * | 2019-03-27 | 2021-11-05 | 三菱电机大楼技术服务株式会社 | 机器设备信息收集系统 |
-
1991
- 1991-06-27 JP JP3155039A patent/JP2903779B2/ja not_active Expired - Fee Related
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH11120293A (ja) * | 1997-10-16 | 1999-04-30 | Fujitsu Ltd | 文字認識/修正方式 |
| CN113614737A (zh) * | 2019-03-27 | 2021-11-05 | 三菱电机大楼技术服务株式会社 | 机器设备信息收集系统 |
| CN113614737B (zh) * | 2019-03-27 | 2023-08-29 | 三菱电机楼宇解决方案株式会社 | 机器设备信息收集系统 |
| CN112784125A (zh) * | 2021-01-14 | 2021-05-11 | 辽宁工程技术大学 | 一种输入信息的模式识别方法和装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2903779B2 (ja) | 1999-06-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11715014B2 (en) | System and method of character recognition using fully convolutional neural networks with attention | |
| US6950555B2 (en) | Holistic-analytical recognition of handwritten text | |
| US10936862B2 (en) | System and method of character recognition using fully convolutional neural networks | |
| Lee et al. | A new methodology for gray-scale character segmentation and recognition | |
| US9665768B2 (en) | Process of handwriting recognition and related apparatus | |
| KR100412317B1 (ko) | 문자인식/수정방법및장치 | |
| JP2000353215A (ja) | 文字認識装置および文字認識プログラムを記録した記録媒体 | |
| JP3480404B2 (ja) | 単語大分類装置及びその単語大分類方法並びにその制御プログラムを記録した記録媒体 | |
| Hussain et al. | Nastalique segmentation-based approach for Urdu OCR | |
| JP2730665B2 (ja) | 文字認識装置および方法 | |
| Al Ghamdi | A novel approach to printed Arabic optical character recognition | |
| Procter et al. | Cursive handwriting recognition using hidden Markov models and a lexicon-driven level building algorithm | |
| JP2903779B2 (ja) | 文字列認識方法及びその装置 | |
| US20200242387A1 (en) | Information processing apparatus and non-transitory computer readable medium storing program | |
| Amrouch et al. | A novel feature set for recognition of printed amazigh text using maximum deviation and hmm | |
| Fermanian et al. | Deep recognition-based character segmentation in handwritten syriac manuscripts | |
| Wang et al. | Multi-branch and two-pass HMM modeling approaches for off-line cursive handwriting recognition | |
| Koga et al. | Segmentation of Japanese handwritten characters using peripheral feature analysis | |
| Pourreza et al. | Persian OCR with Cascaded Convolutional Neural Networks Supported by Language Model | |
| JP3374762B2 (ja) | 文字認識方法及びその装置 | |
| JP3419251B2 (ja) | 文字認識装置及び文字認識方法 | |
| Amin | Recognition of printed Arabic text using machine learning | |
| JPH04363780A (ja) | 文字列認識方法及びその装置 | |
| JP2851102B2 (ja) | 文字切出し方法 | |
| JPH08202830A (ja) | 文字認識システム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |