JPH0738212B2 - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH0738212B2 JPH0738212B2 JP63007927A JP792788A JPH0738212B2 JP H0738212 B2 JPH0738212 B2 JP H0738212B2 JP 63007927 A JP63007927 A JP 63007927A JP 792788 A JP792788 A JP 792788A JP H0738212 B2 JPH0738212 B2 JP H0738212B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- memory
- address pointer
- string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Discrimination (AREA)
Description
【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、例えば光学的文字読取装置を用いて読取入力
された文字列を高精度に認識入力することのできる文字
認識装置に関する。
された文字列を高精度に認識入力することのできる文字
認識装置に関する。
(従来の技術) 近時、帳票等に記載された文字列を光学的文字読取装置
(OCR)を用いて読取り、その文字列を構成する各文字
をそれぞれ認識して計算機入力することが行なわれてい
る。またその文字の認識処理の形態についても従来より
種々の手法が提唱されている。
(OCR)を用いて読取り、その文字列を構成する各文字
をそれぞれ認識して計算機入力することが行なわれてい
る。またその文字の認識処理の形態についても従来より
種々の手法が提唱されている。
ところでこのような文字認識装置において、手書き文字
列を認識しようとする場合には種々の問題が生じる。例
えば一般的には手書き文字の大きさはまちまちであるこ
とから、入力された文字列中から個々の文字を切出すこ
とが必要となる。この際、特に手書き漢字のような場合
には、その遍と旁とが離れて別々の文字として切出され
る虞れがある。例えば第7図に示すように『中畑清』な
る文字列が与えられた場合には、第8図に示すように
「中畑清」「中火田清」「中畑シ青」「中火シ青」のよ
うに各文字が切出される虞れがある。この結果、その認
識結果が入力文字列とは全く異なったものとなる可能性
があった。
列を認識しようとする場合には種々の問題が生じる。例
えば一般的には手書き文字の大きさはまちまちであるこ
とから、入力された文字列中から個々の文字を切出すこ
とが必要となる。この際、特に手書き漢字のような場合
には、その遍と旁とが離れて別々の文字として切出され
る虞れがある。例えば第7図に示すように『中畑清』な
る文字列が与えられた場合には、第8図に示すように
「中畑清」「中火田清」「中畑シ青」「中火シ青」のよ
うに各文字が切出される虞れがある。この結果、その認
識結果が入力文字列とは全く異なったものとなる可能性
があった。
そこで従来では、上述した如く切出した各文字に対する
認識文字候補を認識結果メモリに一旦格納し、辞書メモ
リに予め登録された認識対象とする辞書項目の文字列と
照合してその認識結果を求めることが行なわれている。
認識文字候補を認識結果メモリに一旦格納し、辞書メモ
リに予め登録された認識対象とする辞書項目の文字列と
照合してその認識結果を求めることが行なわれている。
第6図はこのように構成された従来装置の概略構成図で
あり、1はOCR等によって読出入力された文字列から個
々の文字を切出し、その文字についての認識文字候補を
求める文字認識部である。この文字認識部1にて求めら
れた各文字についての複数の認識文字候補が、その認識
文字候補を得た認識対象文字に対する類似度の情報と共
に認識結果メモリ2に順に格納される。
あり、1はOCR等によって読出入力された文字列から個
々の文字を切出し、その文字についての認識文字候補を
求める文字認識部である。この文字認識部1にて求めら
れた各文字についての複数の認識文字候補が、その認識
文字候補を得た認識対象文字に対する類似度の情報と共
に認識結果メモリ2に順に格納される。
文字候補列メモリ3は上記認識結果メモリ2に格納され
た各文字についての認識文字候補とその類似度とに従っ
て求められる文字列候補(例えば単語候補)を順に格納
するものである。この文字候補列メモリ3に格納された
文字列と、辞書メモリである単語辞書4に登録されてい
る辞書項目(認識対象単語)の文字列とをアドレス・カ
ウンタ5,6の制御の下でそれぞれ順に読出し、一致度計
算部7にてその一致度を計算する。そして制御部8の管
理下で、最も高い一致度を得た辞書項目(認識対象単
語)を見出し、これを前記入力文字列に対する認識結果
として求めるものとなっている。
た各文字についての認識文字候補とその類似度とに従っ
て求められる文字列候補(例えば単語候補)を順に格納
するものである。この文字候補列メモリ3に格納された
文字列と、辞書メモリである単語辞書4に登録されてい
る辞書項目(認識対象単語)の文字列とをアドレス・カ
ウンタ5,6の制御の下でそれぞれ順に読出し、一致度計
算部7にてその一致度を計算する。そして制御部8の管
理下で、最も高い一致度を得た辞書項目(認識対象単
語)を見出し、これを前記入力文字列に対する認識結果
として求めるものとなっている。
ところがこのように構成された従来装置にあっては、認
識結果メモリ2に一旦各文字について求められた認識文
字候補を格納し、その上で文字候補列を生成して文字候
補列メモリ3に格納するので、その情報転送容量が膨大
化して処理効率が低下することのみならず、前記メモリ
2,3として膨大なメモリ容量を必要とすると云う問題が
あった。
識結果メモリ2に一旦各文字について求められた認識文
字候補を格納し、その上で文字候補列を生成して文字候
補列メモリ3に格納するので、その情報転送容量が膨大
化して処理効率が低下することのみならず、前記メモリ
2,3として膨大なメモリ容量を必要とすると云う問題が
あった。
ところで上述した入力文字列は、例えばその天地が逆転
した逆さの文字列として与えられることがある。このよ
うなことから、従来では専ら前述したように入力文字列
の先頭側から文字の切出しを行い、その文字についてそ
れぞれ認識処理すると共に、上記入力文字列をその末尾
側から文字の切出しを行い、切出された文字を180°回
転した後に認識処理を行うものとなっている。そしてこ
れらの認識結果をそれぞれ認識辞書メモリに格納し、前
述したように文字候補列を生成するものとなっている。
した逆さの文字列として与えられることがある。このよ
うなことから、従来では専ら前述したように入力文字列
の先頭側から文字の切出しを行い、その文字についてそ
れぞれ認識処理すると共に、上記入力文字列をその末尾
側から文字の切出しを行い、切出された文字を180°回
転した後に認識処理を行うものとなっている。そしてこ
れらの認識結果をそれぞれ認識辞書メモリに格納し、前
述したように文字候補列を生成するものとなっている。
然し乍ら、その為には入力文字列についてその先頭側と
末尾側とから2回に亙って文字の切出しとその番号付け
による管理を行なう必要があり、多大な処理負担が伴っ
た。しかも前述したメモリ容量も、逆向きの文字切出し
の分だけ余分に必要とし、認識結果メモリ2および文字
候補列メモリ3として必要なメモリ容量が相当膨大化す
ると云う問題があった。
末尾側とから2回に亙って文字の切出しとその番号付け
による管理を行なう必要があり、多大な処理負担が伴っ
た。しかも前述したメモリ容量も、逆向きの文字切出し
の分だけ余分に必要とし、認識結果メモリ2および文字
候補列メモリ3として必要なメモリ容量が相当膨大化す
ると云う問題があった。
(発明が解決しようとする問題点) このように入力文字列の各文字について認識し、その認
識文字候補の列と辞書項目の文字列との一致度を求めて
上記入力文字列を認識する従来の文字認識装置にあって
は、認識文字候補や文字候補列を格納する為の膨大なメ
モリ容量を必要とし、更にはメモリ間等での情報転送容
量が大きいので処理効率が悪く、処理速度の向上を図る
ことが困難である等の不具合があった。
識文字候補の列と辞書項目の文字列との一致度を求めて
上記入力文字列を認識する従来の文字認識装置にあって
は、認識文字候補や文字候補列を格納する為の膨大なメ
モリ容量を必要とし、更にはメモリ間等での情報転送容
量が大きいので処理効率が悪く、処理速度の向上を図る
ことが困難である等の不具合があった。
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、必要とするメモリ容量の低減を
図り、しかも処理効率の向上を図ることのできる実用性
の高い文字認識装置を提供することにある。
の目的とするところは、必要とするメモリ容量の低減を
図り、しかも処理効率の向上を図ることのできる実用性
の高い文字認識装置を提供することにある。
[発明の構成] (問題点を解決するための手段) 本発明は、文字列が記載された帳票上の画像情報を読取
り、辞書に記憶された認識対象文字及び認識対象文字列
との比較により認識を行う文字読取装置において、帳票
上の画像情報を読取る入力手段、この入力手段により入
力された画像情報から、個々の文字に相当する画像情報
を抜き出す切出手段、この切出手段により切出された画
像情報に対して、前記認識対象文字との類似度に基づ
き、認識候補を提供する第1の認識手段、この第1の認
識手段により提供された認識候補及び前記類似度を記憶
する第1のメモリ、前記切出手段により切出された画像
情報に対して所定角度単位での回転させる回転手段、こ
の回転手段により回転された画像情報に対して、前記認
識対象文字との類似度に基づき、認識候補を提供する第
2の認識手段、この第2の認識手段により提供された認
識候補及び前記類似度を記憶する第2のメモリ、前記切
出手段により切出された文字の遷移ネットワークに応じ
て、前記第1及び第2のメモリにアクセスするためのア
ドレスポインタを記憶するアドレスポインタメモリ手
段、認識対象文字列に関する情報を記憶する辞書手段、
前記アドレスポインタメモリ手段から第1の順序で読出
されるアドレスポインタに従って前記第1のメモリをア
クセスし、前記アドレスポインタメモリ手段から第1の
順序とは反対の順序で読出されるアドレスポインタに従
って前記第2のメモリをアクセスするメモリアクセス手
段、前記第1及び第2のメモリから読出された認識候補
及び前記辞書手段に記憶された情報との一致度を算出す
る一致検出手段、および各認識対象文字列について算出
された一致度を比較して前記文字列に対する認識結果を
求める手段から構成されている。
り、辞書に記憶された認識対象文字及び認識対象文字列
との比較により認識を行う文字読取装置において、帳票
上の画像情報を読取る入力手段、この入力手段により入
力された画像情報から、個々の文字に相当する画像情報
を抜き出す切出手段、この切出手段により切出された画
像情報に対して、前記認識対象文字との類似度に基づ
き、認識候補を提供する第1の認識手段、この第1の認
識手段により提供された認識候補及び前記類似度を記憶
する第1のメモリ、前記切出手段により切出された画像
情報に対して所定角度単位での回転させる回転手段、こ
の回転手段により回転された画像情報に対して、前記認
識対象文字との類似度に基づき、認識候補を提供する第
2の認識手段、この第2の認識手段により提供された認
識候補及び前記類似度を記憶する第2のメモリ、前記切
出手段により切出された文字の遷移ネットワークに応じ
て、前記第1及び第2のメモリにアクセスするためのア
ドレスポインタを記憶するアドレスポインタメモリ手
段、認識対象文字列に関する情報を記憶する辞書手段、
前記アドレスポインタメモリ手段から第1の順序で読出
されるアドレスポインタに従って前記第1のメモリをア
クセスし、前記アドレスポインタメモリ手段から第1の
順序とは反対の順序で読出されるアドレスポインタに従
って前記第2のメモリをアクセスするメモリアクセス手
段、前記第1及び第2のメモリから読出された認識候補
及び前記辞書手段に記憶された情報との一致度を算出す
る一致検出手段、および各認識対象文字列について算出
された一致度を比較して前記文字列に対する認識結果を
求める手段から構成されている。
(作用) 本発明は、文字列を認識する際に、切出手段により切出
された画像情報に対して認識対象文字との類似度に基づ
き認識候補を提供し、この提供された認識候補および類
似度を第1のメモリに記憶し、また切出手段により切出
された画像情報を回転した画像情報に対して認識対象文
字との類似度に基づき認識候補を提供し、この提供され
た認識候補および類似度を第2のメモリに記憶し、第1
の順序で読出されるアドレスポインタにしたがって第1
のメモリをアクセスし、第1の順序とは反対の順序で読
出されるアドレスポインタにしたがって第2のメモリを
アクセスし、第1および第2のメモリから読出された認
識候補と認識対象文字列との一致度を算出し、この算出
結果に応じて上記文字列に対する認識結果を求めるよう
にしたものである。
された画像情報に対して認識対象文字との類似度に基づ
き認識候補を提供し、この提供された認識候補および類
似度を第1のメモリに記憶し、また切出手段により切出
された画像情報を回転した画像情報に対して認識対象文
字との類似度に基づき認識候補を提供し、この提供され
た認識候補および類似度を第2のメモリに記憶し、第1
の順序で読出されるアドレスポインタにしたがって第1
のメモリをアクセスし、第1の順序とは反対の順序で読
出されるアドレスポインタにしたがって第2のメモリを
アクセスし、第1および第2のメモリから読出された認
識候補と認識対象文字列との一致度を算出し、この算出
結果に応じて上記文字列に対する認識結果を求めるよう
にしたものである。
(実施例) 以下、図面を参照して本発明の一実施例につき説明す
る。
る。
第1図は実施例装置の概略構成図で、11は入力文字列か
ら個々の文字を切出し、その文字についての認識文字候
補を求める文字認識部(切出手段、第1、第2の認識手
段、回転手段)、12はこの文字認識部11にて求められた
各文字についての複数の認識文字候補を、その認識文字
候補を得た認識対象文字に対する類似度の情報と共に順
に格納する第1の認識結果メモリ(第1のメモリ)であ
る。また13は上記文字認識部11にて切出された各文字を
180°回転したときに求められる各文字についての複数
の認識文字候補を、その認識文字候補を得た認識対象文
字に対する類似度の情報と共に順に格納する第2の認識
結果メモリ(第2のメモリ)である。
ら個々の文字を切出し、その文字についての認識文字候
補を求める文字認識部(切出手段、第1、第2の認識手
段、回転手段)、12はこの文字認識部11にて求められた
各文字についての複数の認識文字候補を、その認識文字
候補を得た認識対象文字に対する類似度の情報と共に順
に格納する第1の認識結果メモリ(第1のメモリ)であ
る。また13は上記文字認識部11にて切出された各文字を
180°回転したときに求められる各文字についての複数
の認識文字候補を、その認識文字候補を得た認識対象文
字に対する類似度の情報と共に順に格納する第2の認識
結果メモリ(第2のメモリ)である。
アドレスポインタ・メモリ(アドレスポインタメモリ手
段)14は、上記第1および第2の認識結果メモリ12,13
をアクセスする為のアドレスポインタを、前記文字認識
部11における文字の切出し結果に従って順に格納するも
ので、そのアドレスポインタをアドレス・カウンタ15の
制御を受けて昇順(第1の順序)または降順(第1の順
序とは反対の順序)に読出し、前記第1または第2の認
識結果メモリ12を選択的にアクセスする。
段)14は、上記第1および第2の認識結果メモリ12,13
をアクセスする為のアドレスポインタを、前記文字認識
部11における文字の切出し結果に従って順に格納するも
ので、そのアドレスポインタをアドレス・カウンタ15の
制御を受けて昇順(第1の順序)または降順(第1の順
序とは反対の順序)に読出し、前記第1または第2の認
識結果メモリ12を選択的にアクセスする。
即ち、アドレス・カウンタ15はアップ・ダウン動作し、
前記アドレスポインタ・メモリ14を昇順または降順にア
クセスする。セレクタ(メモリアクセス手段)16は、ア
ドレスポインタ・メモリ14から昇順に読出されるアドレ
スポインタにて前記第1の認識結果メモリ12をアクセス
し、そこに格納されている認識文字候補を順に読出す。
またセレクタ16は、アドレスポインタ・メモリ14から降
順に読出されるアドレスポインタにて前記第2の認識結
果メモリ13をアクセスし、そこに格納されている認識文
字候補を順に読出す。
前記アドレスポインタ・メモリ14を昇順または降順にア
クセスする。セレクタ(メモリアクセス手段)16は、ア
ドレスポインタ・メモリ14から昇順に読出されるアドレ
スポインタにて前記第1の認識結果メモリ12をアクセス
し、そこに格納されている認識文字候補を順に読出す。
またセレクタ16は、アドレスポインタ・メモリ14から降
順に読出されるアドレスポインタにて前記第2の認識結
果メモリ13をアクセスし、そこに格納されている認識文
字候補を順に読出す。
このようにして認識結果メモリ12,13から順に読出され
る認識文字候補の列が文字候補列として一致度計算部
(一致検出手段)17に与えられる。
る認識文字候補の列が文字候補列として一致度計算部
(一致検出手段)17に与えられる。
また辞書メモリとしての単語辞書(辞書手段)18は認識
対象とする複数の認識項目の文字列を格納しており、ア
ドレス・カウンタ19の制御を受けてその文字列を順に前
記一致度計算部17に読出している。一致度計算部17はこ
の辞書項目の文字列と前記認識結果メモリ12,13から読
出された認識文字候補の列との一致度を、前記類似度の
情報に基づいて計算する。そしてこの一致度計算結果に
従って制御部20が動作し、前述したアドレス・カウンタ
15,19のカウント動作がそれぞれ制御されるようになっ
ている。
対象とする複数の認識項目の文字列を格納しており、ア
ドレス・カウンタ19の制御を受けてその文字列を順に前
記一致度計算部17に読出している。一致度計算部17はこ
の辞書項目の文字列と前記認識結果メモリ12,13から読
出された認識文字候補の列との一致度を、前記類似度の
情報に基づいて計算する。そしてこの一致度計算結果に
従って制御部20が動作し、前述したアドレス・カウンタ
15,19のカウント動作がそれぞれ制御されるようになっ
ている。
ここで上記認識結果メモリ12,13と、これらの認識結果
メモリ12,13をアクセスするアドレスポインタについて
更に詳しく説明する。
メモリ12,13をアクセスするアドレスポインタについて
更に詳しく説明する。
例えば前述した第7図に示すような文字列が与えられる
ものとすると、まず文字認識部11はその入力文字列に対
して各文字の切出しを実行する。この文字の切出しは、
例えば文字の並び方向と直交する向きへの文字パターン
・データの射影を求める等して行なわれる。このような
文字の切出しが行なわれると、文字認識部11は第7図に
示す入力文字列に対して、その文字の区切り位置の情報
をa,b,c,d,e,fのように求める。但し、区切り位置c,eに
ついてはその文字間隔が狭いことから、本来の文字区切
り位置ではない可能性があることが検出される。
ものとすると、まず文字認識部11はその入力文字列に対
して各文字の切出しを実行する。この文字の切出しは、
例えば文字の並び方向と直交する向きへの文字パターン
・データの射影を求める等して行なわれる。このような
文字の切出しが行なわれると、文字認識部11は第7図に
示す入力文字列に対して、その文字の区切り位置の情報
をa,b,c,d,e,fのように求める。但し、区切り位置c,eに
ついてはその文字間隔が狭いことから、本来の文字区切
り位置ではない可能性があることが検出される。
尚、このような文字の切出しについては従来より種々提
唱されている技術を適宜採用すれば良いものである。
唱されている技術を適宜採用すれば良いものである。
文字認識部11はこのような文字の区切りの情報から、例
えば第2図に示すような遷移ネットワークが文字の区切
り位置をノードとして生成し、文字の切出し位置がアー
クとして求める。これらのアークを、例えば左端の文字
から順にラベリングし、文字認識処理における文字候補
の管理情報として用いる。この結果、『中畑清』なる入
力文字列は、「中」なる文字部分、「火」なる文字
部分、「田」なる文字部分、「畑」なる文字部分、
「シ」なる文字部分、「青」なる文字部分、そして
「清」なる文字部分についてそれぞれ独立の文字とし
て切出されることになる。
えば第2図に示すような遷移ネットワークが文字の区切
り位置をノードとして生成し、文字の切出し位置がアー
クとして求める。これらのアークを、例えば左端の文字
から順にラベリングし、文字認識処理における文字候補
の管理情報として用いる。この結果、『中畑清』なる入
力文字列は、「中」なる文字部分、「火」なる文字
部分、「田」なる文字部分、「畑」なる文字部分、
「シ」なる文字部分、「青」なる文字部分、そして
「清」なる文字部分についてそれぞれ独立の文字とし
て切出されることになる。
文字認識部11は上記アークの管理情報に従って上述した
ように入力文字列中から順に切出される文字について、
順に認識対象文字との類似度計算を実行する。この類似
度計算の結果から、その入力文字に対する複数の認識文
字候補が、例えば第1位から第10位まで求められ、その
認識文字候補を得た類似度の値と共に第1の認識結果メ
モリ12に格納される。
ように入力文字列中から順に切出される文字について、
順に認識対象文字との類似度計算を実行する。この類似
度計算の結果から、その入力文字に対する複数の認識文
字候補が、例えば第1位から第10位まで求められ、その
認識文字候補を得た類似度の値と共に第1の認識結果メ
モリ12に格納される。
この結果、第1の認識結果メモリ12には、例えば第4図
に示すように各文字についての認識文字候補が順次格納
される。即ち、『中畑清』なる入力文字列から最初に切
出された文字についての認識文字候補が「中,小,1,
巾,大,…」として認識結果メモリ12に格納され、2番
目に切出された文字については「小,火,中,水,天,
…」,3番目に切出された文字については「田,団,匹,
囲,匡,…」,また4番目に切出される2番目の文字と
3番目の文字とが結合した文字については「畑,軸,
伸,挿,沈,…」なる認識文字候補がそれぞれ格納され
る。同様にして4番目以降に切出される文字について
も、その認識文字候補が順に格納される。
に示すように各文字についての認識文字候補が順次格納
される。即ち、『中畑清』なる入力文字列から最初に切
出された文字についての認識文字候補が「中,小,1,
巾,大,…」として認識結果メモリ12に格納され、2番
目に切出された文字については「小,火,中,水,天,
…」,3番目に切出された文字については「田,団,匹,
囲,匡,…」,また4番目に切出される2番目の文字と
3番目の文字とが結合した文字については「畑,軸,
伸,挿,沈,…」なる認識文字候補がそれぞれ格納され
る。同様にして4番目以降に切出される文字について
も、その認識文字候補が順に格納される。
同様にして文字認識部11では上記各文字をそれぞれ180
°回転した文字についても認識対象文字との類似度計算
を実行し、その類似度計算の結果から、その入力文字に
対する複数の認識文字候補とその類似度値を求める。そ
してこれらの情報については、前記第2の認識結果メモ
リ13に格納する。
°回転した文字についても認識対象文字との類似度計算
を実行し、その類似度計算の結果から、その入力文字に
対する複数の認識文字候補とその類似度値を求める。そ
してこれらの情報については、前記第2の認識結果メモ
リ13に格納する。
しかしてアドレスポインタ・メモリ14は、このようにし
て各文字について求められた認識文字候補を前記第1お
よび第2の認識結果メモリ12,13から順に読出して文字
候補列を一致度計算部17に与えるべく、上記認識結果メ
モリ12,13をアドレス指定するアドレスポインタを、前
述した各文字の管理情報に従って順に格納する。例えば
認識対象とする文字列が3文字である場合、第1の認識
結果メモリ12から連続する3つの認識文字候補を読出し
て文字候補列を生成するべく、そのアドレスポインタを
第3図に示すように順に格納する。
て各文字について求められた認識文字候補を前記第1お
よび第2の認識結果メモリ12,13から順に読出して文字
候補列を一致度計算部17に与えるべく、上記認識結果メ
モリ12,13をアドレス指定するアドレスポインタを、前
述した各文字の管理情報に従って順に格納する。例えば
認識対象とする文字列が3文字である場合、第1の認識
結果メモリ12から連続する3つの認識文字候補を読出し
て文字候補列を生成するべく、そのアドレスポインタを
第3図に示すように順に格納する。
この例では第2図に示す遷移ネットワークワークに従っ
て、そのアドレスポインタを(1→2→3)(1→4→
5)(1→4→7)(2→3→4)(2→3→5)(4
→5→6)(3→5→6)として順に格納する。アドレ
ス・カウンタ15はアップカウント動作して上記アドレス
ポインタ・メモリ14を順にアクセスし、上述したアドレ
スポインタを昇順に読出して前記第1の認識結果メモリ
12のアクセスを制御する。またアドレス・カウンタ15は
ダウンカウント動作して上記アドレスポインタ・メモリ
14を順にアクセスし、上述したアドレスポインタを降順
に読出して前記第2の認識結果メモリ13のアクセスを制
御する。
て、そのアドレスポインタを(1→2→3)(1→4→
5)(1→4→7)(2→3→4)(2→3→5)(4
→5→6)(3→5→6)として順に格納する。アドレ
ス・カウンタ15はアップカウント動作して上記アドレス
ポインタ・メモリ14を順にアクセスし、上述したアドレ
スポインタを昇順に読出して前記第1の認識結果メモリ
12のアクセスを制御する。またアドレス・カウンタ15は
ダウンカウント動作して上記アドレスポインタ・メモリ
14を順にアクセスし、上述したアドレスポインタを降順
に読出して前記第2の認識結果メモリ13のアクセスを制
御する。
この結果、前記アドレス・カウンタのアップカウント動
作時には前記第1の認識結果メモリ12からは、前述した
入力文字列の場合には、先ず「中」なる文字部分、
「火」なる文字部分、「田」なる文字部分についてそ
れぞれ求められた認識文字候補の列(文字候補列)が求
められ、単語辞書16に登録されている辞書項目の文字列
との一致度計算に供される。その後、「中」なる文字
部分、「畑」なる文字部分、「シ」なる文字部分に
ついてそれぞれ求められた認識文字候補の列(文字候補
列)が、その次には「中」なる文字部分、「畑」な
る文字部分、「清」なる文字部分についてそれぞれ求
められた認識文字候補の列(文字候補列)が辞書項目と
の一致度計算に供される。以降、同様にしてアドレスポ
インタによって指定される文字の認識文字候補の列が順
に生成され、一致度計算に供されてその認識処理が行な
われることになる。
作時には前記第1の認識結果メモリ12からは、前述した
入力文字列の場合には、先ず「中」なる文字部分、
「火」なる文字部分、「田」なる文字部分についてそ
れぞれ求められた認識文字候補の列(文字候補列)が求
められ、単語辞書16に登録されている辞書項目の文字列
との一致度計算に供される。その後、「中」なる文字
部分、「畑」なる文字部分、「シ」なる文字部分に
ついてそれぞれ求められた認識文字候補の列(文字候補
列)が、その次には「中」なる文字部分、「畑」な
る文字部分、「清」なる文字部分についてそれぞれ求
められた認識文字候補の列(文字候補列)が辞書項目と
の一致度計算に供される。以降、同様にしてアドレスポ
インタによって指定される文字の認識文字候補の列が順
に生成され、一致度計算に供されてその認識処理が行な
われることになる。
一方、アドレス・カウンタのダウンカウント動作時には
前記第2の認識結果メモリ13からは、その入力文字列の
各文字について180°回転したときの認識文字候補の列
が順に読出され、辞書項目の文字列との一致度計算に供
されることになる。
前記第2の認識結果メモリ13からは、その入力文字列の
各文字について180°回転したときの認識文字候補の列
が順に読出され、辞書項目の文字列との一致度計算に供
されることになる。
この場合には、「清」「シ」「田」をそれぞれ回転した
文字についての文字候補列から一致度の計算が行なわれ
る。
文字についての文字候補列から一致度の計算が行なわれ
る。
しかし例えば入力文字列が『清畑中』として与えられて
いる場合には、第5図に示すように第2の認識結果メモ
リ13には、各文字を回転したときの各文字「青」「シ」
「清」「田」「火」「畑」「中」についての認識文字候
補が求められている。そしてこの第2の認識結果メモリ
13に対しては、アドレス・カウンタ15のダウンカウント
動作により、その認識文字候補が降順に読出されること
から、先ず「中」なる文字部分、「火」なる文字部分、
「田」なる文字部分についてそれぞれ求められた認識文
字候補の列(文字候補列)が求められ、単語辞書18に登
録されている辞書項目の文字列との一致度計算に供され
る。その後、「中」なる文字部分、「畑」なる文字部
分、「シ」なる文字部分についてそれぞれ求められた認
識文字候補の列(文字候補列)が、その次には「中」な
る文字部分、「畑」なる文字部分、「清」なる文字部分
についてそれぞれ求められた認識文字候補の列(文字候
補列)が辞書項目との一致度計算に供される。
いる場合には、第5図に示すように第2の認識結果メモ
リ13には、各文字を回転したときの各文字「青」「シ」
「清」「田」「火」「畑」「中」についての認識文字候
補が求められている。そしてこの第2の認識結果メモリ
13に対しては、アドレス・カウンタ15のダウンカウント
動作により、その認識文字候補が降順に読出されること
から、先ず「中」なる文字部分、「火」なる文字部分、
「田」なる文字部分についてそれぞれ求められた認識文
字候補の列(文字候補列)が求められ、単語辞書18に登
録されている辞書項目の文字列との一致度計算に供され
る。その後、「中」なる文字部分、「畑」なる文字部
分、「シ」なる文字部分についてそれぞれ求められた認
識文字候補の列(文字候補列)が、その次には「中」な
る文字部分、「畑」なる文字部分、「清」なる文字部分
についてそれぞれ求められた認識文字候補の列(文字候
補列)が辞書項目との一致度計算に供される。
この結果、文字列が正しい向きで入力され、その認識文
字候補が第1の認識結果メモリ12に格納された場合と同
様にして、逆向きに入力された文字列に対する認識候補
文字の読出しが第2の認識結果メモリ13から行なわれ、
その文字候補列が辞書項目の文字列との一致度の計算に
供されることになる。
字候補が第1の認識結果メモリ12に格納された場合と同
様にして、逆向きに入力された文字列に対する認識候補
文字の読出しが第2の認識結果メモリ13から行なわれ、
その文字候補列が辞書項目の文字列との一致度の計算に
供されることになる。
かくしてこのように構成された本装置によれば、従来装
置のように認識結果メモリに格納された各文字について
の認識文字候補から一旦文字候補列を生成し、これを文
字候補列メモリに格納する必要がないので、そのメモリ
間での情報転送が不要となることのみならず、文字候補
列メモリ自体を不要とすることが可能となる。
置のように認識結果メモリに格納された各文字について
の認識文字候補から一旦文字候補列を生成し、これを文
字候補列メモリに格納する必要がないので、そのメモリ
間での情報転送が不要となることのみならず、文字候補
列メモリ自体を不要とすることが可能となる。
その反面、文字候補列メモリに代えてアドレスポインタ
・メモリ13を必要とするが、このアドレスポインタ・メ
モリ13には認識結果メモリ12,13をアクセスする為のア
ドレスポインタの時系列を格納するだけで良いので、結
果的に装置として必要なメモリ容量の大幅な低減を図る
ことが可能となる。
・メモリ13を必要とするが、このアドレスポインタ・メ
モリ13には認識結果メモリ12,13をアクセスする為のア
ドレスポインタの時系列を格納するだけで良いので、結
果的に装置として必要なメモリ容量の大幅な低減を図る
ことが可能となる。
また上述したようにメモリ間の情報(認識文字候補)転
送が不要であり、文字候補列を認識結果メモリ12,13か
らの直接的な情報(認識文字候補)読出しによって生成
し、これを一致度計算部17に与えるので、情報転送に要
する処理時間を大幅に低減することができ、その処理効
率、および処理速度の向上を図ることが可能となる。
送が不要であり、文字候補列を認識結果メモリ12,13か
らの直接的な情報(認識文字候補)読出しによって生成
し、これを一致度計算部17に与えるので、情報転送に要
する処理時間を大幅に低減することができ、その処理効
率、および処理速度の向上を図ることが可能となる。
しかも180°回転した文字について求められた認識候補
文字については、その文字の並びの向きが逆であること
から、アドレスポインタを降順に読出すだけでその正し
い文字列を復元して辞書項目との一致度の計算に供する
ことができる。この結果、アドレスポインタメモリ14を
余分に必要とすることなく、また単にアドレス・カウン
タ15のアップ・ダウンカウント動作を制御するだけで、
非常に簡易に逆向きの入力文字列に対処することができ
る。
文字については、その文字の並びの向きが逆であること
から、アドレスポインタを降順に読出すだけでその正し
い文字列を復元して辞書項目との一致度の計算に供する
ことができる。この結果、アドレスポインタメモリ14を
余分に必要とすることなく、また単にアドレス・カウン
タ15のアップ・ダウンカウント動作を制御するだけで、
非常に簡易に逆向きの入力文字列に対処することができ
る。
尚、本発明は上述した実施例に限定されるものではな
い。例えば入力文字列からの個々の文字の切出しや、切
出した文字に対する文字認識の手法は従来より種々提唱
されている技術を適宜採用すれば良いものである。また
文字候補列の生成の順序等も仕様に応じて定めれば良い
ものであり、認識対象とする辞書項目や、その文字数も
特に限定されない。更には入力文字パターンに対す回転
角度も上述した例に限定されず、90°回転,45°回転し
て認識処理することも可能である。このようにすれば縦
書き、横書き文字や斜字についても効果的に対処するこ
とが可能となる。またここでは手書きされた文字に対す
る認識処理の例につき説明したが、入力音声を音節単位
に切出して認識処理する場合についても同様に適用する
ことが可能である。要するに本発明はその要旨を逸脱し
ない範囲で種々変形して実施することができる。
い。例えば入力文字列からの個々の文字の切出しや、切
出した文字に対する文字認識の手法は従来より種々提唱
されている技術を適宜採用すれば良いものである。また
文字候補列の生成の順序等も仕様に応じて定めれば良い
ものであり、認識対象とする辞書項目や、その文字数も
特に限定されない。更には入力文字パターンに対す回転
角度も上述した例に限定されず、90°回転,45°回転し
て認識処理することも可能である。このようにすれば縦
書き、横書き文字や斜字についても効果的に対処するこ
とが可能となる。またここでは手書きされた文字に対す
る認識処理の例につき説明したが、入力音声を音節単位
に切出して認識処理する場合についても同様に適用する
ことが可能である。要するに本発明はその要旨を逸脱し
ない範囲で種々変形して実施することができる。
[発明の効果] 以上詳述したように本発明によれば、第1および第2の
メモリに格納された各文字に対する認識候補を、アドレ
スポインタメモリ手段から第1の順序で読出されるアド
レスポインタに従って読出し、あるいはアドレスポイン
タメモリ手段から第1の順序とは反対の順序で読出され
るアドレスポインタに従って読出して文字候補列を直接
的に生成し、これを一致度の算出に供するので、従来用
いられていた文字候補列メモリを不要としてメモリ容量
の大幅な低減を図ることができる。しかも逆様に入力さ
れた文字列に対しても非常に簡易に対処することがで
き、またメモリ間での情報転送量を少なくしてその処理
効率と処理速度の向上を図り得る等の実用上多大なる効
果が奏せられる。
メモリに格納された各文字に対する認識候補を、アドレ
スポインタメモリ手段から第1の順序で読出されるアド
レスポインタに従って読出し、あるいはアドレスポイン
タメモリ手段から第1の順序とは反対の順序で読出され
るアドレスポインタに従って読出して文字候補列を直接
的に生成し、これを一致度の算出に供するので、従来用
いられていた文字候補列メモリを不要としてメモリ容量
の大幅な低減を図ることができる。しかも逆様に入力さ
れた文字列に対しても非常に簡易に対処することがで
き、またメモリ間での情報転送量を少なくしてその処理
効率と処理速度の向上を図り得る等の実用上多大なる効
果が奏せられる。
第1図は本発明の一実施例に係る文字認識装置の概略構
成図、第2図は入力文字列に対する文字の切出しを制御
する為の遷移ネットワークの例を示す図、第3図はアド
レスポインタ・メモリの構成例を示す図、第4図は認識
辞書メモリの構成例を示す図、第5図は逆向きに入力さ
れた文字列に対する文字の切出し例を示す図、第6図は
従来装置の概略構成図、第7図な入力文字列の例を示す
図、第8図は第7図に示す入力文字列に対する文字の切
出し例を示す図である。 1…文字認識部(切出手段、第1、第2の認識手段、回
転手段)、12…第1の認識結果メモリ(第1のメモ
リ)、13…第2の認識結果メモリ(第2のメモリ)、14
…アドレスポインタ・メモリ(アドレスポインタメモリ
手段)、15…アドレスカウンタ、16…セレクタ(メモリ
アクセス手段)、17…一致度計算部(一致検出手段)、
18…単語辞書(辞書手段)、19…アドレスカウンタ、20
…制御部。
成図、第2図は入力文字列に対する文字の切出しを制御
する為の遷移ネットワークの例を示す図、第3図はアド
レスポインタ・メモリの構成例を示す図、第4図は認識
辞書メモリの構成例を示す図、第5図は逆向きに入力さ
れた文字列に対する文字の切出し例を示す図、第6図は
従来装置の概略構成図、第7図な入力文字列の例を示す
図、第8図は第7図に示す入力文字列に対する文字の切
出し例を示す図である。 1…文字認識部(切出手段、第1、第2の認識手段、回
転手段)、12…第1の認識結果メモリ(第1のメモ
リ)、13…第2の認識結果メモリ(第2のメモリ)、14
…アドレスポインタ・メモリ(アドレスポインタメモリ
手段)、15…アドレスカウンタ、16…セレクタ(メモリ
アクセス手段)、17…一致度計算部(一致検出手段)、
18…単語辞書(辞書手段)、19…アドレスカウンタ、20
…制御部。
Claims (1)
- 【請求項1】文字列が記載された帳票上の画像情報を読
取り、辞書に記憶された認識対象文字及び認識対象文字
列との比較により認識を行う文字読取装置において、 帳票上の画像情報を読取る入力手段と、 この入力手段により入力された画像情報から、個々の文
字に相当する画像情報を抜き出す切出手段と、 この切出手段により切出された画像情報に対して、前記
認識対象文字との類似度に基づき、認識候補を提供する
第1の認識手段と、 この第1の認識手段により提供された認識候補及び前記
類似度を記憶する第1のメモリと、 前記切出手段により切出された画像情報に対して所定角
度単位での回転させる回転手段と、 この回転手段により回転された画像情報に対して、前記
認識対象文字との類似度に基づき、認識候補を提供する
第2の認識手段と、 この第2の認識手段により提供された認識候補及び前記
類似度を記憶する第2のメモリと、 前記切出手段により切出された文字の遷移ネットワーク
に応じて、前記第1及び第2のメモリにアクセスするた
めのアドレスポインタを記憶するアドレスポインタメモ
リ手段と、 認識対象文字列に関する情報を記憶する辞書手段と、 前記アドレスポインタメモリ手段から第1の順序で読出
されるアドレスポインタに従って前記第1のメモリをア
クセスし、前記アドレスポインタメモリ手段から第1の
順序とは反対の順序で読出されるアドレスポインタに従
って前記第2のメモリをアクセスするメモリアクセス手
段と、 前記第1及び第2のメモリから読出された認識候補及び
前記辞書手段に記憶された情報との一致度を算出する一
致検出手段と、 各認識対象文字列について算出された一致度を比較して
前記文字列に対する認識結果を求める手段と、 を具備したことを特徴とする文字認識装置。
Priority Applications (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63007927A JPH0738212B2 (ja) | 1988-01-18 | 1988-01-18 | 文字認識装置 |
| DE68916978T DE68916978T2 (de) | 1988-01-18 | 1989-01-18 | Zeichenkettenerkennungssystem. |
| KR1019890000484A KR910007752B1 (ko) | 1988-01-18 | 1989-01-18 | 문자인식시스템 |
| EP89100819A EP0325233B1 (en) | 1988-01-18 | 1989-01-18 | Character string recognition system |
| US07/298,041 US5020117A (en) | 1988-01-18 | 1989-01-18 | Handwritten character string recognition system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63007927A JPH0738212B2 (ja) | 1988-01-18 | 1988-01-18 | 文字認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH01183796A JPH01183796A (ja) | 1989-07-21 |
| JPH0738212B2 true JPH0738212B2 (ja) | 1995-04-26 |
Family
ID=11679157
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63007927A Expired - Fee Related JPH0738212B2 (ja) | 1988-01-18 | 1988-01-18 | 文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0738212B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109492573A (zh) * | 2018-11-05 | 2019-03-19 | 四川华雁信息产业股份有限公司 | 一种指针读取方法及装置 |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS57136285A (en) * | 1981-02-17 | 1982-08-23 | Fujitsu Ltd | Character recognizing system |
| JPS5839377A (ja) * | 1981-09-02 | 1983-03-08 | Toshiba Corp | 文字認識装置 |
-
1988
- 1988-01-18 JP JP63007927A patent/JPH0738212B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JPH01183796A (ja) | 1989-07-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5020117A (en) | Handwritten character string recognition system | |
| US5774588A (en) | Method and system for comparing strings with entries of a lexicon | |
| US5161245A (en) | Pattern recognition system having inter-pattern spacing correction | |
| CN109918658B (zh) | 一种从文本中获取目标词汇的方法及系统 | |
| CN112487823A (zh) | 一种基于bert模型的文本语义相似度计算方法 | |
| JPS5822782B2 (ja) | パタ−ン類似度計算装置 | |
| JPH0738212B2 (ja) | 文字認識装置 | |
| JPH01183794A (ja) | 文字認識装置 | |
| JPH0640352B2 (ja) | 文字認識装置 | |
| JPS646514B2 (ja) | ||
| JPS63138479A (ja) | 文字認識装置 | |
| JP3154752B2 (ja) | 単語認識装置 | |
| JPS6186883A (ja) | オンライン手書き文字認識方式 | |
| JPH0438026B2 (ja) | ||
| JP2519782B2 (ja) | 文字分離方式 | |
| JPH0540853A (ja) | 文字認識結果の後処理方式 | |
| JPS63103393A (ja) | 単語認識装置 | |
| JPH0355874B2 (ja) | ||
| CN115374769A (zh) | 词语的对齐方法、装置、电子设备及介质 | |
| JPH02121078A (ja) | 用語辞書検索装置 | |
| JPH0540854A (ja) | 文字認識結果の後処理方法 | |
| JPS5975377A (ja) | 文字選択方式 | |
| JPS63142487A (ja) | 特定文字列高速抽出方法 | |
| JPH0245874A (ja) | Cd−rom検索装置 | |
| JPH0527912B2 (ja) |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |