JPH0696277A - 英文字認識装置 - Google Patents
英文字認識装置Info
- Publication number
- JPH0696277A JPH0696277A JP4243059A JP24305992A JPH0696277A JP H0696277 A JPH0696277 A JP H0696277A JP 4243059 A JP4243059 A JP 4243059A JP 24305992 A JP24305992 A JP 24305992A JP H0696277 A JPH0696277 A JP H0696277A
- Authority
- JP
- Japan
- Prior art keywords
- character
- unit
- recognition
- contact
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】
【目的】 本発明は接触文字の影響を最小限にとどめ、
高精度の認識結果を短時間で得ることの出来る英文字認
識装置の提供を目的とする。 【構成】 本発明の英文字認識装置は、文字パターンを
重ね合わせ法によりパターン群に分類する文字パターン
群分類部13と、接触文字と判定された文字パターン群
内の文字パターンを含む単語文字列を抽出し接触文字パ
ターンの以外の文字をキーとして、単語辞書18と照合
し接触文字列を確定する接触文字パターン群確定部17
と、を備えた構成からなる。
高精度の認識結果を短時間で得ることの出来る英文字認
識装置の提供を目的とする。 【構成】 本発明の英文字認識装置は、文字パターンを
重ね合わせ法によりパターン群に分類する文字パターン
群分類部13と、接触文字と判定された文字パターン群
内の文字パターンを含む単語文字列を抽出し接触文字パ
ターンの以外の文字をキーとして、単語辞書18と照合
し接触文字列を確定する接触文字パターン群確定部17
と、を備えた構成からなる。
Description
【0001】
【産業上の利用分野】本発明は英文一般文書を構成する
各文字の認識を行う英文字認識装置に関するものであ
る。
各文字の認識を行う英文字認識装置に関するものであ
る。
【0002】
【従来の技術】近年、文字認識装置を電子計算機等の入
力装置として利用する要求が高まっており、安定な認識
結果を効率的に得ることができる文字入力装置が電子計
算機等のシステムの性能向上に不可欠となっている。
力装置として利用する要求が高まっており、安定な認識
結果を効率的に得ることができる文字入力装置が電子計
算機等のシステムの性能向上に不可欠となっている。
【0003】以下に従来の英文字認識装置について説明
する。図6は従来の文字認識装置の機能構成を示すブロ
ック図である。
する。図6は従来の文字認識装置の機能構成を示すブロ
ック図である。
【0004】1は認識対象文書を2値画像として入力す
る画像入力部、2は画像入力部1で入力した文書画像を
記憶する画像格納部、3は画像格納部2で記憶した文書
画像中の文字に外接する矩形を黒画素の連なりをもとに
求める外接矩形検出部、4は外接矩形検出部3にて求め
られた矩形内の画像の黒画素の分布を図形特徴として抽
出する図形特徴抽出部、5は図形特徴抽出部4にて求め
られた図形特徴と、予め用意される全ての認識対象文字
の図形特徴を比較し、類似する特徴を有する文字を認識
結果と出力し、また、類似する特徴がない場合に矩形内
の画像を接触文字として判定する文字認識部、6は認識
対象となるすべての文字の図形特徴を記憶している認識
辞書、7は文字認識部5にて出力された認識結果を記憶
する認識結果格納部、8は文字認識部5にて接触文字と
して判定された画像の黒画素の縦方向のヒストグラムに
注目し、その値が小さい部分を文字間の接触点として1
文字ずつ分割する接触文字分割部である。
る画像入力部、2は画像入力部1で入力した文書画像を
記憶する画像格納部、3は画像格納部2で記憶した文書
画像中の文字に外接する矩形を黒画素の連なりをもとに
求める外接矩形検出部、4は外接矩形検出部3にて求め
られた矩形内の画像の黒画素の分布を図形特徴として抽
出する図形特徴抽出部、5は図形特徴抽出部4にて求め
られた図形特徴と、予め用意される全ての認識対象文字
の図形特徴を比較し、類似する特徴を有する文字を認識
結果と出力し、また、類似する特徴がない場合に矩形内
の画像を接触文字として判定する文字認識部、6は認識
対象となるすべての文字の図形特徴を記憶している認識
辞書、7は文字認識部5にて出力された認識結果を記憶
する認識結果格納部、8は文字認識部5にて接触文字と
して判定された画像の黒画素の縦方向のヒストグラムに
注目し、その値が小さい部分を文字間の接触点として1
文字ずつ分割する接触文字分割部である。
【0005】以上のように構成された文字認識装置につ
いて、以下その動作を説明する。まず、画像入力部1に
て認識対象文書を2値画像として入力し、画像格納部2
に記憶する。次に、画像格納部2に記憶された文書画像
中の文字に外接する矩形を黒画素の連なりをもとに外接
矩形検出部3にて求め、その矩形内の画像の黒画素の分
布を図形特徴として図形特徴抽出部4にて抽出する。抽
出された図形特徴は文字認識部5に送られ、認識辞書と
して予め用意される全ての認識対象文字の図形特徴と比
較し、類似する特徴を有する文字を認識結果と出力し、
また、類似する特徴がない場合に矩形内の画像を接触文
字として判定する。文字認識部5にて認識結果が得られ
た場合は、その結果を認識結果格納部7に記憶し、得ら
れなかった場合は、矩形内の画像を接触文字として接触
文字分割処理部8に送る。
いて、以下その動作を説明する。まず、画像入力部1に
て認識対象文書を2値画像として入力し、画像格納部2
に記憶する。次に、画像格納部2に記憶された文書画像
中の文字に外接する矩形を黒画素の連なりをもとに外接
矩形検出部3にて求め、その矩形内の画像の黒画素の分
布を図形特徴として図形特徴抽出部4にて抽出する。抽
出された図形特徴は文字認識部5に送られ、認識辞書と
して予め用意される全ての認識対象文字の図形特徴と比
較し、類似する特徴を有する文字を認識結果と出力し、
また、類似する特徴がない場合に矩形内の画像を接触文
字として判定する。文字認識部5にて認識結果が得られ
た場合は、その結果を認識結果格納部7に記憶し、得ら
れなかった場合は、矩形内の画像を接触文字として接触
文字分割処理部8に送る。
【0006】接触文字分割処理部8では画素中の黒画素
の縦方向のヒストグラムを求め、その値が小さな部分を
文字間の接触点とし、接触点にて画像を分割することに
より接触した文字を1文字ずつ分離する。分割された画
像は再び図形特徴抽出部4に送られ、図形特徴を抽出し
た後、文字認識部5にて認識される。
の縦方向のヒストグラムを求め、その値が小さな部分を
文字間の接触点とし、接触点にて画像を分割することに
より接触した文字を1文字ずつ分離する。分割された画
像は再び図形特徴抽出部4に送られ、図形特徴を抽出し
た後、文字認識部5にて認識される。
【0007】以上の処理にて、文書画像中の接触文字を
含む全ての文字が認識していた。
含む全ての文字が認識していた。
【0008】
【発明が解決しようとする課題】しかしながら上記従来
の構成では、1文字ずつ認識処理を行うことにより認識
結果を得ているので、文書画像中に接触した文字列、す
なわち接触文字が存在している場合、その図形特徴をも
とに1文字ずつ分割した後、認識していたため、接触文
字が多く存在する文書の認識を行う場合、接触文字の分
割精度の不安定さにより低い認識精度しか得られないと
いう問題点を有していた。又、1文字ずつの認識処理な
ので分割処理・認識処理作業が多く発生することによる
多大の処理時間を要し、作業性が悪いという問題点を有
していた。
の構成では、1文字ずつ認識処理を行うことにより認識
結果を得ているので、文書画像中に接触した文字列、す
なわち接触文字が存在している場合、その図形特徴をも
とに1文字ずつ分割した後、認識していたため、接触文
字が多く存在する文書の認識を行う場合、接触文字の分
割精度の不安定さにより低い認識精度しか得られないと
いう問題点を有していた。又、1文字ずつの認識処理な
ので分割処理・認識処理作業が多く発生することによる
多大の処理時間を要し、作業性が悪いという問題点を有
していた。
【0009】本発明は上記従来の問題点を解決するもの
で、接触文字の影響を最小限にとどめ、高精度の認識結
果を短時間で得ることの出来る英文字認識装置を提供す
ることを目的とする。
で、接触文字の影響を最小限にとどめ、高精度の認識結
果を短時間で得ることの出来る英文字認識装置を提供す
ることを目的とする。
【0010】
【課題を解決するための手段】この目的を達成するため
に本発明の英文字認識装置は、要約すると文字パターン
を重ね合わせ法によりパターン群に分類する文字パター
ン群分類部と、接触文字と判定された文字パターン群内
の文字パターンを含む単語文字列を抽出し接触文字パタ
ーンの以外の文字をキーとして、単語辞書と照合し接触
文字列を確定する接触文字パターン群確定部により構成
されている。具体的には、認識対象文書を入力する画像
入力部と、前記画像入力部で入力された文書画像を記憶
する画像記憶部と、前記画像記憶部に記憶された文書画
像中の文字に外接する矩形を黒画素の連なりをもとに求
める外接矩形検出部と、前記外接矩形検出部で求められ
た外接矩形の水平方向の間隔をもとに単語領域を求める
単語領域切り出し部と、前記外接矩形検出部で求められ
た外接矩形内の文字パターンを重ね合わせ法によりパタ
ーン群に分類する文字パターン群分類部と、前記外接矩
形検出部で求められた外接矩形内の黒画素の分布を図形
特徴として抽出する図形特徴抽出部と、予め全ての認識
対象文字の図形特徴を記憶している認識辞書と、前記図
形特徴抽出部で抽出した図形特徴と前記認識辞書との比
較により類似した特徴を有する文字が前記認識辞書中に
存在した場合、該当文字を認識結果として後述の認識結
果格納部に記憶させ、また、類似する特徴が認識辞書中
に存在しない場合、前記外接矩形検出部で求められた外
接矩形内の画像を隣接している2文字が接触している接
触文字として判定する文字認識処理部と、接触文字と判
定された文字パターン群内の文字パターンを含む単語文
字列を抽出し接触文字パターンの以外の文字をキーとし
て前記単語辞書と照合し接触文字列を確定する接触文字
パターン群確定部と、前記接触文字パターン群確定部に
て確定できなかった文字パターン群の画像の黒画素の縦
方向のヒストグラムに注目し、その値が小さな部分を文
字と文字との接触点として1文字ずつ分割する接触文字
分割処理部と、前記文字認識処理部にて得られた認識結
果及び前記接触文字パターン群確定部にて得られた確定
文字列を格納している認識結果格納部と、前記認識結果
格納部に格納されている結果及び前記単語領域切り出し
部にて切り出された単語領域をもとに認識対象文書の認
識結果を出力する認識結果出力部と、を備えた英文字認
識装置である。
に本発明の英文字認識装置は、要約すると文字パターン
を重ね合わせ法によりパターン群に分類する文字パター
ン群分類部と、接触文字と判定された文字パターン群内
の文字パターンを含む単語文字列を抽出し接触文字パタ
ーンの以外の文字をキーとして、単語辞書と照合し接触
文字列を確定する接触文字パターン群確定部により構成
されている。具体的には、認識対象文書を入力する画像
入力部と、前記画像入力部で入力された文書画像を記憶
する画像記憶部と、前記画像記憶部に記憶された文書画
像中の文字に外接する矩形を黒画素の連なりをもとに求
める外接矩形検出部と、前記外接矩形検出部で求められ
た外接矩形の水平方向の間隔をもとに単語領域を求める
単語領域切り出し部と、前記外接矩形検出部で求められ
た外接矩形内の文字パターンを重ね合わせ法によりパタ
ーン群に分類する文字パターン群分類部と、前記外接矩
形検出部で求められた外接矩形内の黒画素の分布を図形
特徴として抽出する図形特徴抽出部と、予め全ての認識
対象文字の図形特徴を記憶している認識辞書と、前記図
形特徴抽出部で抽出した図形特徴と前記認識辞書との比
較により類似した特徴を有する文字が前記認識辞書中に
存在した場合、該当文字を認識結果として後述の認識結
果格納部に記憶させ、また、類似する特徴が認識辞書中
に存在しない場合、前記外接矩形検出部で求められた外
接矩形内の画像を隣接している2文字が接触している接
触文字として判定する文字認識処理部と、接触文字と判
定された文字パターン群内の文字パターンを含む単語文
字列を抽出し接触文字パターンの以外の文字をキーとし
て前記単語辞書と照合し接触文字列を確定する接触文字
パターン群確定部と、前記接触文字パターン群確定部に
て確定できなかった文字パターン群の画像の黒画素の縦
方向のヒストグラムに注目し、その値が小さな部分を文
字と文字との接触点として1文字ずつ分割する接触文字
分割処理部と、前記文字認識処理部にて得られた認識結
果及び前記接触文字パターン群確定部にて得られた確定
文字列を格納している認識結果格納部と、前記認識結果
格納部に格納されている結果及び前記単語領域切り出し
部にて切り出された単語領域をもとに認識対象文書の認
識結果を出力する認識結果出力部と、を備えた英文字認
識装置である。
【0011】
【作用】この構成によって、分類された文字パターン群
の代表パターンの認識を行い、接触文字に対して、単語
列内の接触していない認識確度の高い文字列をキーとし
て単語辞書との照合により認識結果を求めるので、短時
間で高精度の認識結果を得ることができる。
の代表パターンの認識を行い、接触文字に対して、単語
列内の接触していない認識確度の高い文字列をキーとし
て単語辞書との照合により認識結果を求めるので、短時
間で高精度の認識結果を得ることができる。
【0012】
【実施例】以下本発明の一実施例について、図面を参照
しながら説明する。
しながら説明する。
【0013】図1は本発明の一実施例における英文字認
識装置の機能構成を示すブロック図であり、図2はその
装置構成を示すブロック図である。
識装置の機能構成を示すブロック図であり、図2はその
装置構成を示すブロック図である。
【0014】図1において、9は認識対象文書を2値画
像として入力する画像入力部、10は入力した画像を記
憶する画像格納部、11は文書画像中の文字の外接する
矩形を黒画素の連結をもとに求める外接矩形検出部、1
2は求められた外接矩形の水平方向の間隔をもとに単語
領域を求める単語領域切り出し部、13は外接矩形検出
部11にて求められた矩形内の画像(文字パターン)を
重ね合わせ法により分類する文字パターン群分類部、1
4は外接矩形検出部11にて求められた矩形内の画像の
黒画素の分布を図形特徴として抽出する図形特徴抽出
部、15は図形特徴抽出部14にて求められた図形特徴
と、全ての認識対象文字の図形特徴を予め記憶している
認識辞書16とを比較し、類似する図形特徴を有する文
字を認識結果とし、また、類似する図形特徴を有する文
字が存在しない場合、矩形内の文字パターンを接触文字
と判定する文字認識部、16は全ての認識対象文字の図
形特徴を予め記憶している認識辞書、17は単語領域切
り出し部12にて求められた単語領域の中で、文字認識
部15において、接触文字と判定された文字パターン群
内の文字パターンを含む単語領域について、接触文字と
判定されなかった文字をキーとして、予め単語の綴りを
記憶している単語辞書18を参照することにより接触文
字列を確定する接触文字パターン群確定部、18は予め
単語の綴りを記憶している単語辞書、19は接触文字パ
ターン群確定部17において確定できなかった文字パタ
ーン群に対して、矩形内の画像の黒画素の縦方向のヒス
トグラムに注目し、その値が小さい部分を隣接文字間の
接触点とみなし1文字ずつ分割する接触文字分割処理
部、20は文字認識結果を格納している認識結果格納
部、21は認識結果格納部20に格納されている認識結
果、単語領域切り出し結果をもとに認識対象文書の認識
結果を出力する認識結果出力部である。
像として入力する画像入力部、10は入力した画像を記
憶する画像格納部、11は文書画像中の文字の外接する
矩形を黒画素の連結をもとに求める外接矩形検出部、1
2は求められた外接矩形の水平方向の間隔をもとに単語
領域を求める単語領域切り出し部、13は外接矩形検出
部11にて求められた矩形内の画像(文字パターン)を
重ね合わせ法により分類する文字パターン群分類部、1
4は外接矩形検出部11にて求められた矩形内の画像の
黒画素の分布を図形特徴として抽出する図形特徴抽出
部、15は図形特徴抽出部14にて求められた図形特徴
と、全ての認識対象文字の図形特徴を予め記憶している
認識辞書16とを比較し、類似する図形特徴を有する文
字を認識結果とし、また、類似する図形特徴を有する文
字が存在しない場合、矩形内の文字パターンを接触文字
と判定する文字認識部、16は全ての認識対象文字の図
形特徴を予め記憶している認識辞書、17は単語領域切
り出し部12にて求められた単語領域の中で、文字認識
部15において、接触文字と判定された文字パターン群
内の文字パターンを含む単語領域について、接触文字と
判定されなかった文字をキーとして、予め単語の綴りを
記憶している単語辞書18を参照することにより接触文
字列を確定する接触文字パターン群確定部、18は予め
単語の綴りを記憶している単語辞書、19は接触文字パ
ターン群確定部17において確定できなかった文字パタ
ーン群に対して、矩形内の画像の黒画素の縦方向のヒス
トグラムに注目し、その値が小さい部分を隣接文字間の
接触点とみなし1文字ずつ分割する接触文字分割処理
部、20は文字認識結果を格納している認識結果格納
部、21は認識結果格納部20に格納されている認識結
果、単語領域切り出し結果をもとに認識対象文書の認識
結果を出力する認識結果出力部である。
【0015】図2において、22は認識対象文書を2値
画像として読み込むスキャナ、23は全体の制御を行う
中央処理装置(以下CPUと略称する)、24はCPU
が全体の制御を行うための制御プログラム、25は全て
の認識対象文字の図形特徴を記憶している認識辞書、2
6は単語の綴りを記憶している単語辞書、27は制御プ
ログラム24、認識辞書25、単語辞書26を記憶する
リードオンリメモリ、28はスキャナ22にて読み込ま
れた文書画像領域、29は画像中の外接矩形領域、30
は画像中の単語領域、31は文字パターン群、32は認
識結果、33は文書画像領域28、外接矩形領域29、
単語領域30、文字パターン群31、認識結果32を記
憶するためのランダムアクセスメモリ、34はCPU2
3に対して外部より開始・終了等の指令を与えるための
キーボード、35は認識結果32を出力するための出力
装置、36はスキャナ22からキーボード34を結ぶ内
部バスである。
画像として読み込むスキャナ、23は全体の制御を行う
中央処理装置(以下CPUと略称する)、24はCPU
が全体の制御を行うための制御プログラム、25は全て
の認識対象文字の図形特徴を記憶している認識辞書、2
6は単語の綴りを記憶している単語辞書、27は制御プ
ログラム24、認識辞書25、単語辞書26を記憶する
リードオンリメモリ、28はスキャナ22にて読み込ま
れた文書画像領域、29は画像中の外接矩形領域、30
は画像中の単語領域、31は文字パターン群、32は認
識結果、33は文書画像領域28、外接矩形領域29、
単語領域30、文字パターン群31、認識結果32を記
憶するためのランダムアクセスメモリ、34はCPU2
3に対して外部より開始・終了等の指令を与えるための
キーボード、35は認識結果32を出力するための出力
装置、36はスキャナ22からキーボード34を結ぶ内
部バスである。
【0016】以上のように構成された英文字認識装置に
ついて、以下その動作を説明する。図3は本実施例の英
文字認識装置の全体の動作を示すフローチャートであ
る。
ついて、以下その動作を説明する。図3は本実施例の英
文字認識装置の全体の動作を示すフローチャートであ
る。
【0017】認識対象文書の2値画像を画像入力部9に
て入力し、画像格納部10に記憶し(ステップS1)、
その画像中にて、8近傍で連結している黒画素の集まり
を1つの文字パターンとして、その文字パターンに外接
する矩形を外接矩形検出部11にて求め、内部データと
して蓄える。この際、微少矩形が存在しかつ、その矩形
の垂直方向のすぐ近くに矩形が存在する場合、i,j等
の分離文字とみなし統合する(ステップS2)。また、
求められた外接矩形の水平方向の間隔が広い箇所を単語
区切りとして単語領域として求め、内部データに蓄える
(ステップS3)。
て入力し、画像格納部10に記憶し(ステップS1)、
その画像中にて、8近傍で連結している黒画素の集まり
を1つの文字パターンとして、その文字パターンに外接
する矩形を外接矩形検出部11にて求め、内部データと
して蓄える。この際、微少矩形が存在しかつ、その矩形
の垂直方向のすぐ近くに矩形が存在する場合、i,j等
の分離文字とみなし統合する(ステップS2)。また、
求められた外接矩形の水平方向の間隔が広い箇所を単語
区切りとして単語領域として求め、内部データに蓄える
(ステップS3)。
【0018】検出された外接矩形の領域は文字パターン
群分類部13に送られ、外接矩形内の文字パターンを重
ね合わせ法によりパターン群に分類し、内部データに蓄
える(ステップS4)。
群分類部13に送られ、外接矩形内の文字パターンを重
ね合わせ法によりパターン群に分類し、内部データに蓄
える(ステップS4)。
【0019】分類された文字パターン群の代表パターン
の外接矩形領域が、図形特徴抽出部14に送られ、この
領域内の画像を画像格納部から取り出し、画像中の黒画
素の分布を図形特徴として抽出する(ステップS5)。
の外接矩形領域が、図形特徴抽出部14に送られ、この
領域内の画像を画像格納部から取り出し、画像中の黒画
素の分布を図形特徴として抽出する(ステップS5)。
【0020】抽出された図形特徴は文字認識部15に送
られ、予め全ての認識対象文字の図形特徴を記憶してい
る認識辞書との比較により、類似した特徴を有する文字
か認識辞書中に存在した場合、該当文字を認識結果とし
て認識結果格納部に記憶し、また、類似する特徴が認識
辞書中に存在しない場合、外接矩形内の画像を隣接して
いる2文字が接触している接触文字として判定する(ス
テップS6)。
られ、予め全ての認識対象文字の図形特徴を記憶してい
る認識辞書との比較により、類似した特徴を有する文字
か認識辞書中に存在した場合、該当文字を認識結果とし
て認識結果格納部に記憶し、また、類似する特徴が認識
辞書中に存在しない場合、外接矩形内の画像を隣接して
いる2文字が接触している接触文字として判定する(ス
テップS6)。
【0021】文字認識処理において接触文字が存在した
場合、接触文字処理パターン群確定部にて接触文字処理
を行う(ステップS7,ステップS8)。
場合、接触文字処理パターン群確定部にて接触文字処理
を行う(ステップS7,ステップS8)。
【0022】次に接触文字の処理方法について、具体例
を基に説明する。図4は接触文字の処理方法を示すフロ
ーチャートであり、図5は被処理対象の具体例を示す図
であり、(a)は入力画像を示す図であり、(b)は文
字パターン群分類結果(文字の下の番号が分類パターン
番号)を示す図であり、(c)は文字認識結果(*は接
触文字)を示す図である。
を基に説明する。図4は接触文字の処理方法を示すフロ
ーチャートであり、図5は被処理対象の具体例を示す図
であり、(a)は入力画像を示す図であり、(b)は文
字パターン群分類結果(文字の下の番号が分類パターン
番号)を示す図であり、(c)は文字認識結果(*は接
触文字)を示す図である。
【0023】まず、接触文字と判定された文字パターン
群内の文字パターンが存在する全ての単語を抽出する
(ステップS10)。抽出された各単語毎に接触文字以
外の文字列をキーとして、接触文字列の認識結果となり
得る文字列を単語辞書の検索により求める(ステップS
11)。ステップS10にて抽出された全ての単語にあ
てはまる文字列が存在するか判定する(ステップS1
2)。全ての単語にあてはまる文字列が存在した場合、
その文字列を接触文字列の認識結果として認識結果格納
部20に格納する(ステップS13)。図5の例では
〔*ey〕〔*rough〕〔*eir〕〔ra*e
r〕〔*an〕〔*eory〕キーにしてそれぞれ単語
照合を行い、全ての単語にあてはまる〔th〕を得、認
識結果とする。ステップS12において、該当する文字
列が存在しない場合、この接触文字パターン群の代表パ
ターンが、接触文字分割処理部19に送られ、この文字
パターンの矩形内の画像の黒画素の縦方向のヒストグラ
ムを求め、その値が与えられるしきい値より小さい場合
にその部分を隣接文字間の接触点として、接触点にて外
接矩形領域を分割する(ステップS14)。以下、ステ
ップS4、ステップS5と同様の図形特徴抽出処理、文
字認識処理を行い(ステップS15、ステップS1
6)、その認識結果を認識結果格納部20に格納する。
群内の文字パターンが存在する全ての単語を抽出する
(ステップS10)。抽出された各単語毎に接触文字以
外の文字列をキーとして、接触文字列の認識結果となり
得る文字列を単語辞書の検索により求める(ステップS
11)。ステップS10にて抽出された全ての単語にあ
てはまる文字列が存在するか判定する(ステップS1
2)。全ての単語にあてはまる文字列が存在した場合、
その文字列を接触文字列の認識結果として認識結果格納
部20に格納する(ステップS13)。図5の例では
〔*ey〕〔*rough〕〔*eir〕〔ra*e
r〕〔*an〕〔*eory〕キーにしてそれぞれ単語
照合を行い、全ての単語にあてはまる〔th〕を得、認
識結果とする。ステップS12において、該当する文字
列が存在しない場合、この接触文字パターン群の代表パ
ターンが、接触文字分割処理部19に送られ、この文字
パターンの矩形内の画像の黒画素の縦方向のヒストグラ
ムを求め、その値が与えられるしきい値より小さい場合
にその部分を隣接文字間の接触点として、接触点にて外
接矩形領域を分割する(ステップS14)。以下、ステ
ップS4、ステップS5と同様の図形特徴抽出処理、文
字認識処理を行い(ステップS15、ステップS1
6)、その認識結果を認識結果格納部20に格納する。
【0024】認識結果格納部20に格納されている認識
結果、及び単語領域切り出し結果を認識結果出力部20
に送り、認識対象文書の認識結果を出力する(ステップ
S9)。
結果、及び単語領域切り出し結果を認識結果出力部20
に送り、認識対象文書の認識結果を出力する(ステップ
S9)。
【0025】以上ステップS1〜ステップS9の処理を
行うことにより、与えられた文書画像の文字認識処理を
行う。
行うことにより、与えられた文書画像の文字認識処理を
行う。
【0026】
【発明の効果】以上のように本発明は、文字パターンを
重ね合わせ法によりパターン群に分類する文字パターン
群分類部と、接触文字と判定された文字パターン群内の
文字パターンを含む単語文字列のうち接触文字パターン
の以外の文字をキーとして、単語辞書と照合し接触文字
列を確定する接触文字パターン群確定部を設けることに
より、分類された文字パターン群の代表パターンの認識
を行い、接触文字に対しては、認識確度の高い文字列を
キーとして単語辞書との照合により認識結果を求めるの
で短時間で高精度の認識結果を得ることが出来る英文字
認識装置を実現できるものである。
重ね合わせ法によりパターン群に分類する文字パターン
群分類部と、接触文字と判定された文字パターン群内の
文字パターンを含む単語文字列のうち接触文字パターン
の以外の文字をキーとして、単語辞書と照合し接触文字
列を確定する接触文字パターン群確定部を設けることに
より、分類された文字パターン群の代表パターンの認識
を行い、接触文字に対しては、認識確度の高い文字列を
キーとして単語辞書との照合により認識結果を求めるの
で短時間で高精度の認識結果を得ることが出来る英文字
認識装置を実現できるものである。
【図1】本発明の一実施例における英文字認識装置の機
能構成を示すブロック図
能構成を示すブロック図
【図2】本発明の一実施例における英文字認識装置の装
置構成を示すブロック図
置構成を示すブロック図
【図3】本発明の一実施例における英文字認識装置の全
体の制御手順を示すフローチャート
体の制御手順を示すフローチャート
【図4】本発明の一実施例における英文字認識装置の接
触文字の処理方法を示すフローチャート
触文字の処理方法を示すフローチャート
【図5】(a)本発明の一実施例における英文字認識装
置の被処理対象の入力画像の例を示す図 (b)その文字パターン群の分類結果を示す図 (c)その文字の文字認識結果を示す図
置の被処理対象の入力画像の例を示す図 (b)その文字パターン群の分類結果を示す図 (c)その文字の文字認識結果を示す図
【図6】従来の英文字認識装置の機能構成を示すブロッ
ク図
ク図
9 画像入力部 10 画像格納部 11 外接矩形検出部 12 単語領域切り出し部 13 文字パターン群分類部 14 図形特徴抽出部 15 文字認識部 16 認識辞書 17 接触文字パターン群確定部 18 単語辞書 19 接触文字分割処理部 20 認識結果格納部 21 認識結果出力部
Claims (1)
- 【請求項1】認識対象文書を入力する画像入力部と、前
記画像入力部で入力された文書画像を記憶する画像記憶
部と、前記画像記憶部に記憶された文書画像中の文字に
外接する矩形を黒画素の連なりをもとに求める外接矩形
検出部と、前記外接矩形検出部で求められた外接矩形の
水平方向の間隔をもとに単語領域を求める単語領域切り
出し部と、前記外接矩形検出部で求められた外接矩形内
の文字パターンを重ね合わせ法によりパターン群に分類
する文字パターン群分類部と、前記外接矩形検出部で求
められた外接矩形内の黒画素の分布を図形特徴として抽
出する図形特徴抽出部と、予め全ての認識対象文字の図
形特徴を記憶している認識辞書と、前記図形特徴抽出部
で抽出した図形特徴と前記認識辞書との比較により類似
した特徴を有する文字が前記認識辞書中に存在した場
合、該当文字を認識結果として後述の認識結果格納部に
記憶させ、また、類似する特徴が認識辞書中に存在しな
い場合、前記外接矩形検出部で求められた外接矩形内の
画像を隣接している2文字が接触している接触文字とし
て判定する文字認識処理部と、接触文字と判定された文
字パターン群内の文字パターンを含む単語文字列を抽出
し接触文字パターンの以外の文字をキーとして前記単語
辞書と照合し接触文字列を確定する接触文字パターン群
確定部と、前記接触文字パターン群確定部にて確定でき
なかった文字パターン群の画像の黒画素の縦方向のヒス
トグラムに注目し、その値が小さな部分を文字と文字と
の接触点として1文字ずつ分割する接触文字分割処理部
と、前記文字認識処理部にて得られた認識結果及び前記
接触文字パターン群確定部にて得られた確定文字列を格
納している認識結果格納部と、前記認識結果格納部に格
納されている結果及び前記単語領域切り出し部にて切り
出された単語領域をもとに認識対象文書の認識結果を出
力する認識結果出力部と、を備えたことを特徴とする英
文字認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4243059A JPH0696277A (ja) | 1992-09-11 | 1992-09-11 | 英文字認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4243059A JPH0696277A (ja) | 1992-09-11 | 1992-09-11 | 英文字認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0696277A true JPH0696277A (ja) | 1994-04-08 |
Family
ID=17098194
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP4243059A Pending JPH0696277A (ja) | 1992-09-11 | 1992-09-11 | 英文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0696277A (ja) |
-
1992
- 1992-09-11 JP JP4243059A patent/JPH0696277A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3445394B2 (ja) | 少なくとも二つのイメージセクションの比較方法 | |
| JP3919617B2 (ja) | 文字認識装置および文字認識方法、プログラムおよび記憶媒体 | |
| JP2713622B2 (ja) | 表形式文書読取装置 | |
| JPH0721310A (ja) | 文書認識装置 | |
| JP3589007B2 (ja) | 文書ファイリングシステムおよび文書ファイリング方法 | |
| JP2000322514A (ja) | パターン抽出装置及び文字切り出し装置 | |
| JPH0696277A (ja) | 英文字認識装置 | |
| JPH06180771A (ja) | 英文字認識装置 | |
| JPH11328315A (ja) | 文字認識装置 | |
| KR102673900B1 (ko) | 표 데이터 추출 시스템 및 그 방법 | |
| JPH05346974A (ja) | 文字認識装置 | |
| JP3060248B2 (ja) | 表認識装置 | |
| JP4697387B2 (ja) | 原稿画像判定装置、原稿画像判定方法及びそのプログラム | |
| JP3151866B2 (ja) | 英文字認識方法 | |
| JPH1166230A (ja) | 文書認識装置、文書認識方法及び媒体 | |
| JPH05298487A (ja) | 英文字認識装置 | |
| JP3428504B2 (ja) | 文字認識装置 | |
| JP3116453B2 (ja) | 英文字認識装置 | |
| JPS63269267A (ja) | 文字認識方法 | |
| JP2746345B2 (ja) | 文字認識の後処理方法 | |
| JP2972443B2 (ja) | 文字認識装置 | |
| JPH0728944A (ja) | 英文字認識装置 | |
| JPH06309508A (ja) | 英文字認識装置 | |
| JPH06309503A (ja) | 英文字認識装置 | |
| JPH11120294A (ja) | 文字認識装置および媒体 |