JPH03246779A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH03246779A JPH03246779A JP2044818A JP4481890A JPH03246779A JP H03246779 A JPH03246779 A JP H03246779A JP 2044818 A JP2044818 A JP 2044818A JP 4481890 A JP4481890 A JP 4481890A JP H03246779 A JPH03246779 A JP H03246779A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- character
- sub
- line width
- horizontal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 claims description 58
- 238000006243 chemical reaction Methods 0.000 claims description 13
- 239000011159 matrix material Substances 0.000 description 37
- 239000000284 extract Substances 0.000 description 20
- 230000006870 function Effects 0.000 description 16
- 238000001514 detection method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000000034 method Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 101100258233 Caenorhabditis elegans sun-1 gene Proteins 0.000 description 1
- 240000001987 Pyrus communis Species 0.000 description 1
- 206010064127 Solar lentigo Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は、印刷文書等を光学的に読取る光学式文字読取
り装置(Optical Character Rea
der、以下OCRという)等における高速かつ小型で
、操作性の良い文字認識装置に関するものである。
り装置(Optical Character Rea
der、以下OCRという)等における高速かつ小型で
、操作性の良い文字認識装置に関するものである。
(従来の技術)
従来、このような分野の技術としては、特開昭62−1
66479号公報に記載されるものがあった。
66479号公報に記載されるものがあった。
近年、日本語情報処理システムの普及により、日本語印
刷文書を計算機に入力する要求が急速に高まり、入力の
高速化及び省力化のために、印刷漢字OCRの必要性が
急速に高まってきている。
刷文書を計算機に入力する要求が急速に高まり、入力の
高速化及び省力化のために、印刷漢字OCRの必要性が
急速に高まってきている。
この印刷漢字OCRでは、文字認識装置が設けられ、そ
の文字認識装置によって印刷文書中の漢字等を読取り、
その読取った漢字等の文字パタンを認識することが必要
となる。
の文字認識装置によって印刷文書中の漢字等を読取り、
その読取った漢字等の文字パタンを認識することが必要
となる。
ところで、印刷文書には、横書きの文書と、新聞や文庫
本等の縦書きの文書とがある。
本等の縦書きの文書とがある。
例えば、印刷文書の一例として名刺を挙げると、第2図
(a)〜(d)に示すように、横書きの名刺(第2図(
a))と縦書きの名刺(第2図(b))とがある。第2
図(C)は、横書き名刺(第2図(a))のパタンであ
り、また第2図(d)は、縦書き名刺(第2図(b))
のパタン例であって第2図(C)のパタンを反時計方向
に90°回転させたパタンになっている。
(a)〜(d)に示すように、横書きの名刺(第2図(
a))と縦書きの名刺(第2図(b))とがある。第2
図(C)は、横書き名刺(第2図(a))のパタンであ
り、また第2図(d)は、縦書き名刺(第2図(b))
のパタン例であって第2図(C)のパタンを反時計方向
に90°回転させたパタンになっている。
従来の印刷漢字OCRにおける文字認識装置では、画像
読取手段により読取った入力パタンを画像記憶手段に記
憶し、その画像記憶手段に記憶された入力パタンから文
字切出手段によって1文字ずつ文字パタンを切出す。そ
して、その切出された文字パタンの特徴を特徴抽出手段
によって抽出し、その抽出された特徴と、照合辞書マス
クを格納した辞書記憶手段の内容とを、照合手段によっ
て照合し、入力パタンの文字認識を行うようになってい
る。
読取手段により読取った入力パタンを画像記憶手段に記
憶し、その画像記憶手段に記憶された入力パタンから文
字切出手段によって1文字ずつ文字パタンを切出す。そ
して、その切出された文字パタンの特徴を特徴抽出手段
によって抽出し、その抽出された特徴と、照合辞書マス
クを格納した辞書記憶手段の内容とを、照合手段によっ
て照合し、入力パタンの文字認識を行うようになってい
る。
このような文字認識装置では、第2図のように帳票の形
状が同じで文字方向が横書きと縦書きがある場合や、横
書き行と縦書き行が混在した文書を認識する場合には、
オペレータが帳票を見ながら、帳票毎や文字列毎に、横
書きか縦書きかをキーボード等で指定しなければ、正し
く文字認識を行うことができなかった。
状が同じで文字方向が横書きと縦書きがある場合や、横
書き行と縦書き行が混在した文書を認識する場合には、
オペレータが帳票を見ながら、帳票毎や文字列毎に、横
書きか縦書きかをキーボード等で指定しなければ、正し
く文字認識を行うことができなかった。
そこで、このような問題を解決するため、前記文献の技
術では、0°、90°、180°、270°回転した4
種類の辞書を予め辞書記憶手段に記憶させておく。そし
て、入力パタンを前記4種類の辞書で認識し、それぞれ
の辞書で認識して得られた認識結果から、最も類似度の
高い結果が出力された辞書の方向を文字方向と判定し、
その判定結果に基づき文字の認識を行うようになってい
た。
術では、0°、90°、180°、270°回転した4
種類の辞書を予め辞書記憶手段に記憶させておく。そし
て、入力パタンを前記4種類の辞書で認識し、それぞれ
の辞書で認識して得られた認識結果から、最も類似度の
高い結果が出力された辞書の方向を文字方向と判定し、
その判定結果に基づき文字の認識を行うようになってい
た。
(発明が解決しようとする課題)
しかしながら、上記構成の装置では、次のような課題が
あった。
あった。
前記文献の技術では、文字方向を判定してその判定結果
に基づき文字の認識を行うようになっているが、1つの
文字パタンに対し、0°、90゜180°、270°回
転に対応する4種類の識別を行うことが必要となるため
、文字認識処理に時間がかかる。しかも、0°、90°
、180゜270°といった4種類の辞書を用意しなけ
ればならないため、それらを記憶する辞書記憶手段のメ
モリ容量が大きくなってしまい、装置の大型化を招くと
いう問題があった。さらに、前記文献の技術では、縦書
きや横書きの名刺を自動的に認識することはできても、
名刺以外の印刷文書等については認識することができず
、そのため装置としての汎用性が低く、技術的に十分満
足のゆくものではなかった。
に基づき文字の認識を行うようになっているが、1つの
文字パタンに対し、0°、90゜180°、270°回
転に対応する4種類の識別を行うことが必要となるため
、文字認識処理に時間がかかる。しかも、0°、90°
、180゜270°といった4種類の辞書を用意しなけ
ればならないため、それらを記憶する辞書記憶手段のメ
モリ容量が大きくなってしまい、装置の大型化を招くと
いう問題があった。さらに、前記文献の技術では、縦書
きや横書きの名刺を自動的に認識することはできても、
名刺以外の印刷文書等については認識することができず
、そのため装置としての汎用性が低く、技術的に十分満
足のゆくものではなかった。
本発明は前記従来技術が持っていた課題として、名刺以
外の印刷文書等についてはオペレータが文字方向の横書
きかまたは紺書きかを判別して指定しなければならず、
オペレータの操作が煩雑になって処理時間がかかるとい
う点と、装置が大型化する等といった点について解決し
た文字認識装置を提供するものである。
外の印刷文書等についてはオペレータが文字方向の横書
きかまたは紺書きかを判別して指定しなければならず、
オペレータの操作が煩雑になって処理時間がかかるとい
う点と、装置が大型化する等といった点について解決し
た文字認識装置を提供するものである。
(課題を解決するための手段)
前記課題を解決するために、第1の発明は、帳票上等の
文字列を含む所定の領域内から1文字ずつ文字パタンを
切出す文字切出手段と、前記文字切出手段で切出された
文字パタンの特徴を抽出する特徴抽出手段と、横書き用
等の所定の照合辞書マスクを格納した辞書記憶手段と、
前記特徴抽出手段で抽出された特徴を前記辞書記憶手段
の内容と照合して前記文字パタンの識別を行う識別手段
とを、備えた文字認識装置において、前記所定の領域を
任意の数の領域に分割して複数の分割領域を生成する領
域切出手段と、前記各分割領域の垂直サブパタン及び水
平サブパタンを任意の領域数だけ抽出するサブパタン抽
出手段と、文字方向判定手段と、変換手段とを、設けた
ものである。
文字列を含む所定の領域内から1文字ずつ文字パタンを
切出す文字切出手段と、前記文字切出手段で切出された
文字パタンの特徴を抽出する特徴抽出手段と、横書き用
等の所定の照合辞書マスクを格納した辞書記憶手段と、
前記特徴抽出手段で抽出された特徴を前記辞書記憶手段
の内容と照合して前記文字パタンの識別を行う識別手段
とを、備えた文字認識装置において、前記所定の領域を
任意の数の領域に分割して複数の分割領域を生成する領
域切出手段と、前記各分割領域の垂直サブパタン及び水
平サブパタンを任意の領域数だけ抽出するサブパタン抽
出手段と、文字方向判定手段と、変換手段とを、設けた
ものである。
ここで、文字方向判定手段は、前記サブパタン抽出手段
で抽出された垂直サブパタン及び水平サブパタンの特徴
を抽出し、その特徴に基づき、前記所定の領域内に含ま
れる文字列の文字の方向を判定して文字方向判定結果を
出力する機能を有している。また、変換手段は、前記文
字方向判定結果に基づき、特徴変換またはパタン変換を
行って前記特徴抽出手段で文字パタンの特徴抽出を行な
わせる機能を有している。
で抽出された垂直サブパタン及び水平サブパタンの特徴
を抽出し、その特徴に基づき、前記所定の領域内に含ま
れる文字列の文字の方向を判定して文字方向判定結果を
出力する機能を有している。また、変換手段は、前記文
字方向判定結果に基づき、特徴変換またはパタン変換を
行って前記特徴抽出手段で文字パタンの特徴抽出を行な
わせる機能を有している。
第2〜第4の発明では、前記文字方向判定手段を次のよ
うに構成している。即ち、第2の発明の文字方向判定手
段では、前記複数の分割領域がら垂直サブパタン及び水
平サブパタンか抽出される毎に、該垂直サブパタンの線
幅と水平サブパタンの線幅を算出し、その垂直サブパタ
ンの線幅和と水平サブパタンの線幅和とを求め、その両
線幅和の比と予め定めた線幅比基準値とを比較して文字
方向を判定する機能を有している。
うに構成している。即ち、第2の発明の文字方向判定手
段では、前記複数の分割領域がら垂直サブパタン及び水
平サブパタンか抽出される毎に、該垂直サブパタンの線
幅と水平サブパタンの線幅を算出し、その垂直サブパタ
ンの線幅和と水平サブパタンの線幅和とを求め、その両
線幅和の比と予め定めた線幅比基準値とを比較して文字
方向を判定する機能を有している。
第3の発明の文字方向判定手段では、垂直サブパタンの
線幅と水平サブパタンの線幅とを算出し、その両線幅の
比を前記各分割領域毎に求め、その線幅比と予め定めた
線幅比基準値とを比較した分割領域毎の比較結果に基づ
き、文字方向を判定する機能を有している。
線幅と水平サブパタンの線幅とを算出し、その両線幅の
比を前記各分割領域毎に求め、その線幅比と予め定めた
線幅比基準値とを比較した分割領域毎の比較結果に基づ
き、文字方向を判定する機能を有している。
第4の発明の文字方向判定手段では、垂直サブパタンの
線幅と水平サブパタンの線幅を算出し、その両線幅の比
を前記各分割領域毎に求め、その線幅比の平均と予め定
めた線幅比基準値とを比較して文字方向を判定する機能
を有している。
線幅と水平サブパタンの線幅を算出し、その両線幅の比
を前記各分割領域毎に求め、その線幅比の平均と予め定
めた線幅比基準値とを比較して文字方向を判定する機能
を有している。
第5の発明では、第1〜第4の発明において、前記の所
定の領域を行とすることを特徴としている。
定の領域を行とすることを特徴としている。
(作用)
第1〜第5の発明によれば、以上のように文字認識装置
を構成したので、帳票イメージ等が入力されると、領域
切出平段は、文字列を含む所定の領域(例えば、行)を
任意の数の領域に分割して複数の分割領域を生成し、そ
の生成結果をサブパタン抽出手段に与える。サブパタン
抽出手段は、複数の分割領域をそれぞれ走査して垂直サ
ブパタン及び水平サブパタンを任意の領域数だけ抽出し
、その抽出結果を文字方向判定手段に与える。文字方向
判定手段は、サブパタン抽出手段で抽出された垂直サブ
パタン及び水平サブパタンの特徴(例えば、垂直サブパ
タン及び水平サブパタンの線幅等)を抽出し、その特徴
に基づき、演算等によって前記所定の領域内に含まれる
文字列の文字方向(例えば、縦方向及び横方向)を判定
し、その文字方向判定結果を変換手段へ出力する。
を構成したので、帳票イメージ等が入力されると、領域
切出平段は、文字列を含む所定の領域(例えば、行)を
任意の数の領域に分割して複数の分割領域を生成し、そ
の生成結果をサブパタン抽出手段に与える。サブパタン
抽出手段は、複数の分割領域をそれぞれ走査して垂直サ
ブパタン及び水平サブパタンを任意の領域数だけ抽出し
、その抽出結果を文字方向判定手段に与える。文字方向
判定手段は、サブパタン抽出手段で抽出された垂直サブ
パタン及び水平サブパタンの特徴(例えば、垂直サブパ
タン及び水平サブパタンの線幅等)を抽出し、その特徴
に基づき、演算等によって前記所定の領域内に含まれる
文字列の文字方向(例えば、縦方向及び横方向)を判定
し、その文字方向判定結果を変換手段へ出力する。
変換手段は、文字方向判定結果に基づき、特徴抽出手段
における文字パタンの特徴の変換あるいは文字パタンの
パタン変換を行ってその特徴抽出手段で、文字パタンの
的確な特徴抽出を行なわせるように働く。すると、識別
手段では、特徴抽出手段の出力に基づき、辞書記憶手段
内の照合辞書マスクを参照して文字パタンの識別を行う
。これにより、名刺を含めた種々の帳票等における文字
列の文字を高速で、かつ操作性が良く、小さなメモリ容
量で的確に認識可能となる。従って、前記課題を解決で
きるのである。
における文字パタンの特徴の変換あるいは文字パタンの
パタン変換を行ってその特徴抽出手段で、文字パタンの
的確な特徴抽出を行なわせるように働く。すると、識別
手段では、特徴抽出手段の出力に基づき、辞書記憶手段
内の照合辞書マスクを参照して文字パタンの識別を行う
。これにより、名刺を含めた種々の帳票等における文字
列の文字を高速で、かつ操作性が良く、小さなメモリ容
量で的確に認識可能となる。従って、前記課題を解決で
きるのである。
(実施例)
第1図は、本発明の一実施例を示す文字認識装置の機能
ブロック図である。
ブロック図である。
この機能ブロック図を説明する前に、先ず本実施例の原
理を説明する。
理を説明する。
印刷文書に使用される活字の大部分を占める、例えば明
朝体について、その線幅に着目し、後述するサブパタン
抽出方法を用いて得た水平サブパタンの線幅と垂直サブ
パタンの線幅との比について測定を行った結果を第1表
に示す。
朝体について、その線幅に着目し、後述するサブパタン
抽出方法を用いて得た水平サブパタンの線幅と垂直サブ
パタンの線幅との比について測定を行った結果を第1表
に示す。
第1表
水平サブパタン及び垂直サブパタンの
線幅比測定結果
第3図(a)〜(f>は、明朝体「亜」の垂直サブパタ
ンと水平サブパタンを示す図である。第1表の測定では
、第3図(a)に示す明朝体の「亜」の文字について、
活字の大きさ8.12、及び16ポイントを対象に、分
解能37.5μmのイメージスキャンにより得られた2
値パタンについて水平サブパタン及び垂直サブパタンを
抽出し、水平サブパタン線幅及び垂直サブパタン線幅を
それぞれ求めた。
ンと水平サブパタンを示す図である。第1表の測定では
、第3図(a)に示す明朝体の「亜」の文字について、
活字の大きさ8.12、及び16ポイントを対象に、分
解能37.5μmのイメージスキャンにより得られた2
値パタンについて水平サブパタン及び垂直サブパタンを
抽出し、水平サブパタン線幅及び垂直サブパタン線幅を
それぞれ求めた。
水平サブパタン及び垂直サブパタンの抽出方法は、後述
する(1)式を用いて入力パタンの線幅を求め、該入力
パタンを水平及び垂直方向に走査して検出した文字線の
断面の中から、その断面共が該入力パタンの線幅よりも
十分に長い断面を抽出して行う。
する(1)式を用いて入力パタンの線幅を求め、該入力
パタンを水平及び垂直方向に走査して検出した文字線の
断面の中から、その断面共が該入力パタンの線幅よりも
十分に長い断面を抽出して行う。
第3図(a)に示す明朝体の横書きの「亜」の垂直サブ
パタン例が第3図(b)に、及び水平サブパタン例が第
3図(C)にそれぞれ示されている。また、第3図(a
>、(b)、(c)に対応する縦書きのパタン例が第3
図(d)、(e)。
パタン例が第3図(b)に、及び水平サブパタン例が第
3図(C)にそれぞれ示されている。また、第3図(a
>、(b)、(c)に対応する縦書きのパタン例が第3
図(d)、(e)。
(f)にそれぞれ示されている。すなわち、第3図(d
)は、縦書きの明朝体の「亜」であり、第3図(a)の
文字パタンを反時計方向に90°回転させた状態となっ
ている。従って、第3図(d)の垂直サブパタンを示す
第3図(e)と水平サブパタンを示す第3図(f>とは
、それぞれ第3図(C)、(b)のパタンを反時計方向
に90°回転させたものと同一のパタンとなる。
)は、縦書きの明朝体の「亜」であり、第3図(a)の
文字パタンを反時計方向に90°回転させた状態となっ
ている。従って、第3図(d)の垂直サブパタンを示す
第3図(e)と水平サブパタンを示す第3図(f>とは
、それぞれ第3図(C)、(b)のパタンを反時計方向
に90°回転させたものと同一のパタンとなる。
第1表から明らかなように、明朝体は、水平サブパタン
線幅と垂直サブパタン線幅の大きさが大きく異なる。従
って、横書き文字の線幅比(=垂直サブパタン線幅/水
平サブパタン線幅)の大きさは、2゜8以上となってい
る。同様に、縦書き文字の線幅比(=垂直サブパタン線
幅/水平サブパタン線幅)は、0.36以下となってい
る。
線幅と垂直サブパタン線幅の大きさが大きく異なる。従
って、横書き文字の線幅比(=垂直サブパタン線幅/水
平サブパタン線幅)の大きさは、2゜8以上となってい
る。同様に、縦書き文字の線幅比(=垂直サブパタン線
幅/水平サブパタン線幅)は、0.36以下となってい
る。
以上のことから理解できるように、入力パタンの線幅比
(=垂直サブパタン線幅/水平サブパタン線幅)の大き
さにより、入力パタンが横書きか、縦書きかを判断する
ことが可能となる。
(=垂直サブパタン線幅/水平サブパタン線幅)の大き
さにより、入力パタンが横書きか、縦書きかを判断する
ことが可能となる。
次に、以上のような原理に基づき構成された第1図の文
字認識装置の構成を説明する。
字認識装置の構成を説明する。
この文字認識装置は、帳票上の文字を光信号Sinの形
で入力して光電変換により電気信号に変換する画像読取
手段1を有し、その画像読取手段1の出力側には、ラン
ダム・アクセス・メモリ(RAM)等で構成された画像
記憶手段2が接続されている。画像記憶手段2は、例え
ば1帳票分のイメージを格納するもので、その出力側に
は、行位置検出手段3及び領域切出手段4が接続されて
いる。行位置検出手段3は、画像記憶手段2の帳票イメ
ージより、その画像記憶手段2における行の位置座標を
出力する機能を有している。領域切出手段4は、行位置
検出手段3の出力に基づき、画像記憶手段2の帳票イメ
ージの行を、文字を含む複数の領域に分割する機能を有
し、その出力側には、サブパタン抽出手段10が接続さ
れている。
で入力して光電変換により電気信号に変換する画像読取
手段1を有し、その画像読取手段1の出力側には、ラン
ダム・アクセス・メモリ(RAM)等で構成された画像
記憶手段2が接続されている。画像記憶手段2は、例え
ば1帳票分のイメージを格納するもので、その出力側に
は、行位置検出手段3及び領域切出手段4が接続されて
いる。行位置検出手段3は、画像記憶手段2の帳票イメ
ージより、その画像記憶手段2における行の位置座標を
出力する機能を有している。領域切出手段4は、行位置
検出手段3の出力に基づき、画像記憶手段2の帳票イメ
ージの行を、文字を含む複数の領域に分割する機能を有
し、その出力側には、サブパタン抽出手段10が接続さ
れている。
サブパタン抽出手段10は、領域切出手段4で切出され
た複数の分割領域の垂直サブパタン及び水平サブパタン
を複数の領域数だけ抽出する機能を有している。このサ
ブパタン抽出手段10は、領域切出手段4から出力され
た1領域分のデータを格納するバッファ等からなる領域
記憶手段11と、領域切出手段4から出力された領域に
ついて領域線幅Waを計算する領域線幅計算手段12と
、領域記憶手段11の領域内を垂直に走査して領域の垂
直サブパタンを抽出する垂直サブパタン抽出手段13と
、領域記憶手段11の領域内を水平に走査して領域の水
平サブパタンを抽出する水平サブパタン抽出手段14と
で、構成されている。この垂直サブパタン抽出手段13
及び水平サブパタン抽出手段14の出力側には、文字方
向判定手段20が接続されている。
た複数の分割領域の垂直サブパタン及び水平サブパタン
を複数の領域数だけ抽出する機能を有している。このサ
ブパタン抽出手段10は、領域切出手段4から出力され
た1領域分のデータを格納するバッファ等からなる領域
記憶手段11と、領域切出手段4から出力された領域に
ついて領域線幅Waを計算する領域線幅計算手段12と
、領域記憶手段11の領域内を垂直に走査して領域の垂
直サブパタンを抽出する垂直サブパタン抽出手段13と
、領域記憶手段11の領域内を水平に走査して領域の水
平サブパタンを抽出する水平サブパタン抽出手段14と
で、構成されている。この垂直サブパタン抽出手段13
及び水平サブパタン抽出手段14の出力側には、文字方
向判定手段20が接続されている。
文字方向判定手段20は、垂直サブパタン及び水平サブ
パタンの特徴、例えば線幅を抽出し、その線幅に基づき
、文字方向が縦書きが横書きかを判定し、その文字方向
判定結果を出力するものであり、判定手段21と、バッ
ファ等からなる記憶手段22とで構成されている。
パタンの特徴、例えば線幅を抽出し、その線幅に基づき
、文字方向が縦書きが横書きかを判定し、その文字方向
判定結果を出力するものであり、判定手段21と、バッ
ファ等からなる記憶手段22とで構成されている。
また、行位置検出手段3の出力側には文字切出手段30
が接続されている。文字切出手段30は、行位置検出手
段3から出力された各行の行位置座標を入力し、1文字
ずつを切出した文字パタンを出力する機能を有し、その
出力側には、特徴抽出手段40が接続されている。
が接続されている。文字切出手段30は、行位置検出手
段3から出力された各行の行位置座標を入力し、1文字
ずつを切出した文字パタンを出力する機能を有し、その
出力側には、特徴抽出手段40が接続されている。
特徴抽出手段40は、文字切出手段30で切出された文
字パタンに基づき、特徴マトリクスを生成するものであ
り、パタン記憶手段41、線幅計算手段42、サブパタ
ン抽出手段43、文字枠検出手段44、文字枠分割決定
手段45、特徴マトリクス抽出手段46、及び特徴変換
手段47より構成されている。
字パタンに基づき、特徴マトリクスを生成するものであ
り、パタン記憶手段41、線幅計算手段42、サブパタ
ン抽出手段43、文字枠検出手段44、文字枠分割決定
手段45、特徴マトリクス抽出手段46、及び特徴変換
手段47より構成されている。
パタン記憶手段41は、文字切出手段30で切出された
文字パタンを格納し、その格納結果をサブパタン抽出手
段43及び文字枠検出手段44へ与えるものであり、レ
ジスタ等で構成されている。
文字パタンを格納し、その格納結果をサブパタン抽出手
段43及び文字枠検出手段44へ与えるものであり、レ
ジスタ等で構成されている。
線幅計算手段42は、文字切出手段30で切出された文
字パタンの線幅Wを計算し、その計算結果をサブパタン
抽出手段43及び特徴マトリクス抽出手段46へ与える
機能を有している。
字パタンの線幅Wを計算し、その計算結果をサブパタン
抽出手段43及び特徴マトリクス抽出手段46へ与える
機能を有している。
サブパタン抽出手段43は、パタン記憶手段41につい
て複数の方向く例えば、垂直方向、水平方向、右斜め方
向、左斜め方向)に走査して垂直サブパタンVSP、水
平サブパタンH3P、右斜めサブパタンR3P、及び左
斜めサブパタンLSPを抽出し、その抽出結果を特徴マ
トリクス抽出手段46へ出力する機能を有している。文
字枠検出手段44は、パタン記憶手段41内の文字パタ
ンに外接する文字枠を検出し、それを文字枠分割決定手
段45へ出力する機能を有している。文字枠分割決定手
段45は、検出された文字枠の内部領域を複数の領域に
分割するためのX軸(文字枠の水平方向)、Y軸(文字
枠の垂直方向)上の分割点座標を決定し、その決定結果
を特徴マトリクス抽出手段46へ出力するものである。
て複数の方向く例えば、垂直方向、水平方向、右斜め方
向、左斜め方向)に走査して垂直サブパタンVSP、水
平サブパタンH3P、右斜めサブパタンR3P、及び左
斜めサブパタンLSPを抽出し、その抽出結果を特徴マ
トリクス抽出手段46へ出力する機能を有している。文
字枠検出手段44は、パタン記憶手段41内の文字パタ
ンに外接する文字枠を検出し、それを文字枠分割決定手
段45へ出力する機能を有している。文字枠分割決定手
段45は、検出された文字枠の内部領域を複数の領域に
分割するためのX軸(文字枠の水平方向)、Y軸(文字
枠の垂直方向)上の分割点座標を決定し、その決定結果
を特徴マトリクス抽出手段46へ出力するものである。
特徴マトリクス抽出手段46は、パタン記憶手段41内
の文字パタンの特徴を抽出して特徴マトリクスを生成し
、それを特徴変換手段47へ与える機能を有している。
の文字パタンの特徴を抽出して特徴マトリクスを生成し
、それを特徴変換手段47へ与える機能を有している。
特徴変換手段47は、判定手段21から出力された文字
方向判定結果に基づき、特徴マトリクス抽出手段46か
らの特徴マトリクスを所定角度回転する機能を有してい
る。この特徴変換手段47の出力側には、識別手段51
が接続され、その識別手段51に辞書記憶手段50が接
続されている。
方向判定結果に基づき、特徴マトリクス抽出手段46か
らの特徴マトリクスを所定角度回転する機能を有してい
る。この特徴変換手段47の出力側には、識別手段51
が接続され、その識別手段51に辞書記憶手段50が接
続されている。
辞書記憶手段50は、例えば横書き用の照合辞書マスク
を格納するもので、リード・オンリ・メモリ(ROM>
等で構成されている。識別手段51は、特徴抽出手段4
7からの特徴マトリクスを照合辞書マスクで照合し、そ
の照合した文字パタンの文字名5outを出力する機能
を有している。
を格納するもので、リード・オンリ・メモリ(ROM>
等で構成されている。識別手段51は、特徴抽出手段4
7からの特徴マトリクスを照合辞書マスクで照合し、そ
の照合した文字パタンの文字名5outを出力する機能
を有している。
次に、以上のように構成される文字認識装置の動作を、
第4図及び第5図(a)〜(e)を参照しつつ説明する
。なお、第4図は名刺のイメージを示す図、第5図(a
〉〜(e)は2値パタンと各サブパタンとを説明するた
めの図である。
第4図及び第5図(a)〜(e)を参照しつつ説明する
。なお、第4図は名刺のイメージを示す図、第5図(a
〉〜(e)は2値パタンと各サブパタンとを説明するた
めの図である。
第1図において、帳票上の文字に対応した光信号Sin
が画像読取手段1に入力されると、画像読取手段1は、
光信号Sinを電気信号に変換して画像記憶手段2へ出
力する。画像記憶手段2は、画像読取手段1からの電気
信号を入力し、1帳票分のイメージを格納する。行位置
検出手段3は、画像記憶手段2に格納された帳票イメー
ジを走査して水平方向と垂直方向の周辺分布を作成し、
行の切出しを行い、画像記憶手段2における行の位置座
標を出力する。
が画像読取手段1に入力されると、画像読取手段1は、
光信号Sinを電気信号に変換して画像記憶手段2へ出
力する。画像記憶手段2は、画像読取手段1からの電気
信号を入力し、1帳票分のイメージを格納する。行位置
検出手段3は、画像記憶手段2に格納された帳票イメー
ジを走査して水平方向と垂直方向の周辺分布を作成し、
行の切出しを行い、画像記憶手段2における行の位置座
標を出力する。
即ち、第4図のような名刺のイメージが画像記憶手段2
に格納されている場合、行位置検出手段3ではそのイメ
ージに対して水平走査を行い、周辺分布h (y)を作
成し、1行目の開始位fiYs1と終了位置Yel、2
行目の開始位置Ys2と終了位置Ye2.3行目の開始
位置Ys3と終了位置Ye3を順次得る。次に、行位置
検出手段3は、画像記憶手段2のイメージに対して行毎
に垂直走査を行い、例えば2行目について開始位置XS
と終了位置Xeを得る。このようにして行位置検出手段
3は、画像記憶手段2のイメージに対して行位置を検出
し、その検出結果を領域切出手段4及び文字切出手段3
0へ出力する。
に格納されている場合、行位置検出手段3ではそのイメ
ージに対して水平走査を行い、周辺分布h (y)を作
成し、1行目の開始位fiYs1と終了位置Yel、2
行目の開始位置Ys2と終了位置Ye2.3行目の開始
位置Ys3と終了位置Ye3を順次得る。次に、行位置
検出手段3は、画像記憶手段2のイメージに対して行毎
に垂直走査を行い、例えば2行目について開始位置XS
と終了位置Xeを得る。このようにして行位置検出手段
3は、画像記憶手段2のイメージに対して行位置を検出
し、その検出結果を領域切出手段4及び文字切出手段3
0へ出力する。
領域切出手段4は、行位置検出手段3から出力された画
像記憶手段2内の行の位置を検出し、その行を、文字を
含む複数の領域に分割する。第4図を例にとると、「吉
」 「田」 「正」の1文字ずつを含む3つの領域ml
、m2.m3に分割する。
像記憶手段2内の行の位置を検出し、その行を、文字を
含む複数の領域に分割する。第4図を例にとると、「吉
」 「田」 「正」の1文字ずつを含む3つの領域ml
、m2.m3に分割する。
即ち、この領域切出手段4では、第4図に示すように、
垂直走査による各文字の中心Xml、Xm2、Xm3の
中点Xdl、Xd2を分割点とし、それぞれml、m2
.m3の3つの領域(分割領域)に分割する。そして、
領域切出手段4は、1領域のデータを、サブパタン抽出
手段10内の領域記憶手段11及び領域線幅計算手段1
2へ出力する。
垂直走査による各文字の中心Xml、Xm2、Xm3の
中点Xdl、Xd2を分割点とし、それぞれml、m2
.m3の3つの領域(分割領域)に分割する。そして、
領域切出手段4は、1領域のデータを、サブパタン抽出
手段10内の領域記憶手段11及び領域線幅計算手段1
2へ出力する。
領域記憶手段11は、領域切出手段4から出力された1
領域分のデータを格納し、その格納結果を垂直サブパタ
ン抽出手段13及び水平サブパタン抽出手段14へ出力
する。領域線幅計算手段12は、領域切出手段4から出
力された領域について領域線幅Waを計算し、その線幅
Waを垂直サブパタン抽出手段13及び水平サブパタン
抽出手段14へ出力する。
領域分のデータを格納し、その格納結果を垂直サブパタ
ン抽出手段13及び水平サブパタン抽出手段14へ出力
する。領域線幅計算手段12は、領域切出手段4から出
力された領域について領域線幅Waを計算し、その線幅
Waを垂直サブパタン抽出手段13及び水平サブパタン
抽出手段14へ出力する。
この領域線幅計算手段12は、例えば公知の画像処理用
フィルタ回路と同様にシフトレジスタ構成となっており
、次式に示すような公知の近似式を用いて線幅Wを計算
する。
フィルタ回路と同様にシフトレジスタ構成となっており
、次式に示すような公知の近似式を用いて線幅Wを計算
する。
W=1/ (1−(Q/A)) ・・・・・・
(1)この(1)式において、Qは(2X2>の窓(W
indow:方形領域)の全ての点が黒点となる点(こ
れを4黒点という〉の個数、Aは全黒点の個数である。
(1)この(1)式において、Qは(2X2>の窓(W
indow:方形領域)の全ての点が黒点となる点(こ
れを4黒点という〉の個数、Aは全黒点の個数である。
領域線幅計算手段12では、これら4黒点の個数Q及び
全黒点の個数Aを計数し、その計数結果から(1)式に
従って線幅Wを演算により求める。
全黒点の個数Aを計数し、その計数結果から(1)式に
従って線幅Wを演算により求める。
垂直サブパタン抽出手段13は、領域記憶手段11の領
域内を垂直に走査し、黒点の連続する長さと、領域線幅
計算部平段12で計算された線幅Waとの関係により、
領域の垂直サブパタンを抽出し、その抽出結果を文字方
向判定手段20内の判定手段21へ出力する。また、水
平サブパタン抽出手段14は、領域記憶手段11の領域
内を水平に走査し、黒点の連続する長さと、領域線幅計
算手段12で計算された線幅Waとの関係により、領域
の水平サブパタンを抽出し、その抽出結果を判定手段2
1へ出力する。
域内を垂直に走査し、黒点の連続する長さと、領域線幅
計算部平段12で計算された線幅Waとの関係により、
領域の垂直サブパタンを抽出し、その抽出結果を文字方
向判定手段20内の判定手段21へ出力する。また、水
平サブパタン抽出手段14は、領域記憶手段11の領域
内を水平に走査し、黒点の連続する長さと、領域線幅計
算手段12で計算された線幅Waとの関係により、領域
の水平サブパタンを抽出し、その抽出結果を判定手段2
1へ出力する。
文字方向判定手段20における判定手段21は、垂直サ
ブパタン抽出手段13に格納されている領域の垂直サブ
パタンについて、領域線幅計算手段12と同様に全黒点
数と4黒点数を求め、(1)式を用いて垂直サブパタン
の線幅Wvを求める。
ブパタン抽出手段13に格納されている領域の垂直サブ
パタンについて、領域線幅計算手段12と同様に全黒点
数と4黒点数を求め、(1)式を用いて垂直サブパタン
の線幅Wvを求める。
また、水平サブパタン抽出手段14に格納されている領
域の水平サブパタンについても、同様にして線幅whを
求める。このようにして求めた垂直サブパタンの線幅W
v及び水平サブパタンの線幅whは、記憶手段22に格
納される。これらの線幅計算処理と記憶手段22への格
納処理とは、領域切出手段4が切出すべき全ての領域(
例えば、第4図の3つの分割領域ml、m2.m3)に
ついて行われる。
域の水平サブパタンについても、同様にして線幅whを
求める。このようにして求めた垂直サブパタンの線幅W
v及び水平サブパタンの線幅whは、記憶手段22に格
納される。これらの線幅計算処理と記憶手段22への格
納処理とは、領域切出手段4が切出すべき全ての領域(
例えば、第4図の3つの分割領域ml、m2.m3)に
ついて行われる。
判定手段21では、領域切出手段4が切出すべき全ての
領域(例えば、ml、m2.m3)を切出した後に、記
憶手段22に格納された前記切出すべき全ての領域の垂
直サブパタンの線幅Wvと水平サブパタンの線幅whを
読出し、垂直サブパタンの線幅Wvと水平サブパタンの
線幅whのそれぞれの総和を求める。さらに、この判定
手段21では、垂直サブパタンの線幅の総和ΣWvと水
平サブパタンの線幅の総和Σwhとの比ΣWv/Σwh
を求め、その比を予め定めた線幅比基準値wthと比較
し、次の(2)式、(3)式を満足するか否かの判定を
行う。
領域(例えば、ml、m2.m3)を切出した後に、記
憶手段22に格納された前記切出すべき全ての領域の垂
直サブパタンの線幅Wvと水平サブパタンの線幅whを
読出し、垂直サブパタンの線幅Wvと水平サブパタンの
線幅whのそれぞれの総和を求める。さらに、この判定
手段21では、垂直サブパタンの線幅の総和ΣWvと水
平サブパタンの線幅の総和Σwhとの比ΣWv/Σwh
を求め、その比を予め定めた線幅比基準値wthと比較
し、次の(2)式、(3)式を満足するか否かの判定を
行う。
ΣWv/Σwh≧wth ・・・・・・(2)
ΣWv/Σwh<wth ・曲直3)(本実施例
では、例えばWth=1> 判定手段21では、(2)式を満足すれば、文字方向を
横書きと判定して横書きの文字方向判定結果を、(3)
式を満足すれば、文字方向を縦書きと判定して縦書きの
文字方向判定結果を、それぞれ特徴変換手段47へ出力
する。
ΣWv/Σwh<wth ・曲直3)(本実施例
では、例えばWth=1> 判定手段21では、(2)式を満足すれば、文字方向を
横書きと判定して横書きの文字方向判定結果を、(3)
式を満足すれば、文字方向を縦書きと判定して縦書きの
文字方向判定結果を、それぞれ特徴変換手段47へ出力
する。
以上のように、画像記憶手段2内の帳票イメージ上の文
字の方向が判定した後、次に説明するように、帳票イメ
ージ上の各文字に対して認識処理が行われる。
字の方向が判定した後、次に説明するように、帳票イメ
ージ上の各文字に対して認識処理が行われる。
先ず、文字切出手段30では、行位置検出手段3から出
力された各行の行位置座標を入力すると、その行位置検
出手段3で得た画像記憶手段2内における行位置の行に
ついて、垂直に走査を行って周辺分布を作成し、その周
辺分布に基づき、1文字ずつ切出した文字パタンを、特
徴抽出手段40内のパタン記憶手段41及び線幅計算手
段42に与える。パタン記憶手段41は、文字切出手段
30で切出された文字パタンを格納する。線幅計算手段
42は、文字切出手段30から出力された文字パタンに
ついて、領域線幅計算手段12と同様にして、全黒点数
と4黒点数を求め、前記(1)式を用いて文字パタンの
線幅Wを計算し、その計算結果をサブパタン抽出手段4
3及び特徴マトリクス抽出手段46に与える。
力された各行の行位置座標を入力すると、その行位置検
出手段3で得た画像記憶手段2内における行位置の行に
ついて、垂直に走査を行って周辺分布を作成し、その周
辺分布に基づき、1文字ずつ切出した文字パタンを、特
徴抽出手段40内のパタン記憶手段41及び線幅計算手
段42に与える。パタン記憶手段41は、文字切出手段
30で切出された文字パタンを格納する。線幅計算手段
42は、文字切出手段30から出力された文字パタンに
ついて、領域線幅計算手段12と同様にして、全黒点数
と4黒点数を求め、前記(1)式を用いて文字パタンの
線幅Wを計算し、その計算結果をサブパタン抽出手段4
3及び特徴マトリクス抽出手段46に与える。
サブパタン抽出手段43は、パタン記憶手段41に格納
された文字パタンに対して垂直走査を全面に行い、黒点
の連続する長さと、線幅計算手段42で計算された線幅
Wとの関係により、垂直サブパタンVSPを抽出する。
された文字パタンに対して垂直走査を全面に行い、黒点
の連続する長さと、線幅計算手段42で計算された線幅
Wとの関係により、垂直サブパタンVSPを抽出する。
同様にして、サブパタン抽出手段43は、水平走査によ
り水平サブパタンH3Pを、右斜め45°走査により右
斜めサブパタンR8Pを、左斜め45°走査により左斜
めサブパタンLSPを、それぞれ抽出する。
り水平サブパタンH3Pを、右斜め45°走査により右
斜めサブパタンR8Pを、左斜め45°走査により左斜
めサブパタンLSPを、それぞれ抽出する。
このようにして抽出されたサブパタンの例が第5図(a
)〜(e)に示されている。第5図(a)は外接する文
字枠F内の2値パタンからなる原パタンであり、このよ
うな原パタンから得られた垂直サブパタンか第5図(b
)に、水平サブパタンか第5図(C)に、右斜めサブパ
タンか第5図(d)に、左斜めサブパタンか第5図(e
)に、それぞれ示されている。
)〜(e)に示されている。第5図(a)は外接する文
字枠F内の2値パタンからなる原パタンであり、このよ
うな原パタンから得られた垂直サブパタンか第5図(b
)に、水平サブパタンか第5図(C)に、右斜めサブパ
タンか第5図(d)に、左斜めサブパタンか第5図(e
)に、それぞれ示されている。
パタン記憶手段41の出力側に接続された文字枠検出手
段44では、パタン記憶手段41内の文字パタンに外接
する文字枠Fを検出し、その検出結果を文字枠分割決定
手段45へ出力する。文字枠分割決定手段45は、検出
された文字枠Fの内部領域をMXNの領域(但し、M、
Nは整数、本実施例では例えばM=N=5とする〉に分
割するための、X軸およびY軸上の分割点座標を決定す
る。ここで、X軸は文字枠Fの水平方向を、Y軸は文字
枠Fの垂直方向をそれぞれ示す。
段44では、パタン記憶手段41内の文字パタンに外接
する文字枠Fを検出し、その検出結果を文字枠分割決定
手段45へ出力する。文字枠分割決定手段45は、検出
された文字枠Fの内部領域をMXNの領域(但し、M、
Nは整数、本実施例では例えばM=N=5とする〉に分
割するための、X軸およびY軸上の分割点座標を決定す
る。ここで、X軸は文字枠Fの水平方向を、Y軸は文字
枠Fの垂直方向をそれぞれ示す。
次に、特徴マトリクス抽出手段46は、文字枠分割決定
手段45によって決定された分割点座標に基づき、垂直
、水平、右斜め及び左斜めの各サブパタン(VSP、H
3P、H3P及びLSP)におけるパタン記憶手段41
上の文字枠領域を、MXNの領域に分割し、得られた各
分割領域内の黒点数Bijを計数する。この黒点Bij
と、線幅計算手段42で求めた線幅Wとを用い、次の式
(4)によって文字線長Lijを示す特徴を計算し、M
XNX4次元の特徴マトリクスを作成する。
手段45によって決定された分割点座標に基づき、垂直
、水平、右斜め及び左斜めの各サブパタン(VSP、H
3P、H3P及びLSP)におけるパタン記憶手段41
上の文字枠領域を、MXNの領域に分割し、得られた各
分割領域内の黒点数Bijを計数する。この黒点Bij
と、線幅計算手段42で求めた線幅Wとを用い、次の式
(4)によって文字線長Lijを示す特徴を計算し、M
XNX4次元の特徴マトリクスを作成する。
Lij=Bij/W ・・・・・・(4)さら
に、この特徴マトリクス抽出手段46では、垂直サブパ
タン■SPの特徴マトリクスに対しては文字枠FのY軸
方向の長さΔYで、水平サブパタンH3Pの特徴マトリ
クスに対してはX軸方向の長さΔXで、右斜めサブパタ
ンR3P及び左斜めサブパタンLSPの特徴マトリクス
に対しては(Δχ+ΔY)/2で、それぞれ正規化を行
い、文字の大きさによる変動を吸収した]VIXNX4
次元の特徴マトリクスを作成する。
に、この特徴マトリクス抽出手段46では、垂直サブパ
タン■SPの特徴マトリクスに対しては文字枠FのY軸
方向の長さΔYで、水平サブパタンH3Pの特徴マトリ
クスに対してはX軸方向の長さΔXで、右斜めサブパタ
ンR3P及び左斜めサブパタンLSPの特徴マトリクス
に対しては(Δχ+ΔY)/2で、それぞれ正規化を行
い、文字の大きさによる変動を吸収した]VIXNX4
次元の特徴マトリクスを作成する。
特徴変換手段47は、判定手段21から出力された文字
方向判定結果に基づき、特徴マトリクス抽出手段46で
抽出された特徴マトリクスを変換する。即ち、文字方向
判定結果が横書きである場合、特徴マトリクス抽出手段
46で抽出された特徴マトリクスをそのまま識別手段5
1へ出力する。
方向判定結果に基づき、特徴マトリクス抽出手段46で
抽出された特徴マトリクスを変換する。即ち、文字方向
判定結果が横書きである場合、特徴マトリクス抽出手段
46で抽出された特徴マトリクスをそのまま識別手段5
1へ出力する。
また、文字方向判定結果が縦書きである場合、特徴マト
リクス抽出手段46で抽出した特徴マトリクスを90°
時計方向に回転し、水平特徴マトリクスを垂直特徴マト
リクスへ、垂直特徴マトリクスを水平特徴マトリクスへ
、左斜め特徴マトリクスを右斜め特徴マトリクスへ、右
斜め特徴マトリクスを左斜め特徴マトリクスへ、それぞ
れ変換して識別手段51に出力する。
リクス抽出手段46で抽出した特徴マトリクスを90°
時計方向に回転し、水平特徴マトリクスを垂直特徴マト
リクスへ、垂直特徴マトリクスを水平特徴マトリクスへ
、左斜め特徴マトリクスを右斜め特徴マトリクスへ、右
斜め特徴マトリクスを左斜め特徴マトリクスへ、それぞ
れ変換して識別手段51に出力する。
その後、識別手段51では、辞書記憶手段50に格納さ
れた照合辞書マスクを用い、各特徴毎に指定された照合
辞書マスクfjと、抽出された特徴マトリクスfiとの
間に、次の式(5)で定義される距離りを適用し、この
距離りが最小の値となるような辞書マスクのカテゴリ名
を文字名S。
れた照合辞書マスクを用い、各特徴毎に指定された照合
辞書マスクfjと、抽出された特徴マトリクスfiとの
間に、次の式(5)で定義される距離りを適用し、この
距離りが最小の値となるような辞書マスクのカテゴリ名
を文字名S。
utの形で出力する。
これにより、帳票上の文字の的確な認識が行える。
以上のように、本実施例では次のような利点を有してい
る。
る。
(i)本実施例では、領域切出手段4により、帳票上の
文字列を含む所定の領域を任意の複数の領域に分割し、
各分割領域からサブパタン抽出手段10で垂直サブパタ
ン及び水平サブパタンを抽出し、文字方向判定手段20
により、垂直サブパタン及び水平サブパタンの特徴、例
えば線幅を抽出し、その特徴に基づき所定の領域内の文
字列の文字の方向を自動的に判定し5、その文字方向判
定結果に基づき、文字パタンの特徴を抽出するようにし
た。そのため、名刺を含む種々の帳票について、オペレ
ータが張票単位や、帳票上の文字列毎に文字方向を指定
するという煩雑な作業が省略でき、それによって名刺を
含む種々の帳票上等の文字を、操作性良く、高精度かつ
高速に認識することができる。
文字列を含む所定の領域を任意の複数の領域に分割し、
各分割領域からサブパタン抽出手段10で垂直サブパタ
ン及び水平サブパタンを抽出し、文字方向判定手段20
により、垂直サブパタン及び水平サブパタンの特徴、例
えば線幅を抽出し、その特徴に基づき所定の領域内の文
字列の文字の方向を自動的に判定し5、その文字方向判
定結果に基づき、文字パタンの特徴を抽出するようにし
た。そのため、名刺を含む種々の帳票について、オペレ
ータが張票単位や、帳票上の文字列毎に文字方向を指定
するという煩雑な作業が省略でき、それによって名刺を
含む種々の帳票上等の文字を、操作性良く、高精度かつ
高速に認識することができる。
(ii) 本実施例では、領域切出手段4により、所
定の領域を任意の複数の領域に分割し、各分割領域につ
いてサブパタン抽出手段10で垂直サブパタン及び水平
サブパタンを抽出し、文字方向判定手段20で文字方向
を判定し、その判定結果に基づき特徴抽出手段40で文
字パタンの特徴を抽出している。そのため、文字方向の
判定に必要なメモリ(領域記憶手段11及び記憶手段2
2等〉は、所定の領域全体を記憶する必要がなく、分割
領域の大きさのメモリ容量で十分である。さらに、文字
方向判定手段20の文字方向判定結果に基づき、特徴抽
出手段40で文字パタンの特徴抽出を行っているので、
辞書記憶手段50に格納する所定角度回転した照合辞書
マスクの数を、従来のものに比べて少なくでき、それに
よって辞書記憶手段50のメモリ容量の小型化が図れる
。このように、従来のものに比べてメモリ容量を小さく
できるので、装置全体の小型化が可能となる。
定の領域を任意の複数の領域に分割し、各分割領域につ
いてサブパタン抽出手段10で垂直サブパタン及び水平
サブパタンを抽出し、文字方向判定手段20で文字方向
を判定し、その判定結果に基づき特徴抽出手段40で文
字パタンの特徴を抽出している。そのため、文字方向の
判定に必要なメモリ(領域記憶手段11及び記憶手段2
2等〉は、所定の領域全体を記憶する必要がなく、分割
領域の大きさのメモリ容量で十分である。さらに、文字
方向判定手段20の文字方向判定結果に基づき、特徴抽
出手段40で文字パタンの特徴抽出を行っているので、
辞書記憶手段50に格納する所定角度回転した照合辞書
マスクの数を、従来のものに比べて少なくでき、それに
よって辞書記憶手段50のメモリ容量の小型化が図れる
。このように、従来のものに比べてメモリ容量を小さく
できるので、装置全体の小型化が可能となる。
(iii ) 文字方向判定手段20は、垂直サブパ
タンの線幅Wvと水平サブパタンの線幅whとの比を求
め、その比と予め設定された線幅比基準値Wthとを比
較し、その比較結果に基づき行内の文字列の文字の方向
を判定するようにしているので、構成が簡単で、精度の
良い文字方向の判定結果が得られる。
タンの線幅Wvと水平サブパタンの線幅whとの比を求
め、その比と予め設定された線幅比基準値Wthとを比
較し、その比較結果に基づき行内の文字列の文字の方向
を判定するようにしているので、構成が簡単で、精度の
良い文字方向の判定結果が得られる。
なお、本発明は、図示の実施例に限定されず、種々の変
形が可能である。その変形例としては、例えば次のよう
なものがある。
形が可能である。その変形例としては、例えば次のよう
なものがある。
(i) 上記実施例では、切出すべき各領域の垂直サ
ブパタンの線幅Wvと水平サブパタンの線幅whとを、
各領域毎に記憶手段22に格納し、領域切出手段4が切
出すべき全ての領域を切出した後に、文字方向を判定す
るようにしているが、他の方法によって文字方向を判定
するようにしても良い。
ブパタンの線幅Wvと水平サブパタンの線幅whとを、
各領域毎に記憶手段22に格納し、領域切出手段4が切
出すべき全ての領域を切出した後に、文字方向を判定す
るようにしているが、他の方法によって文字方向を判定
するようにしても良い。
例えば、各領域毎に垂直サブパタンの線幅Wvと水平サ
ブパタンの線幅whとを求めた後に、垂直サブパタンの
線幅Wvと水平サブパタンの線幅whの比を求め、その
線幅比を記憶手段22に各領域毎に格納する。そして、
領域切出手段4によって切出すべき領域を全て切出した
後に、判定手段21により、記憶手段22に格納された
領域毎の線幅比について、それぞれの線幅比と予め定め
た線幅比基準値とをそれぞれ比較し、縦書きと判定され
た領域数Atと横書きと判定された領域数Ayとを求め
、次の(6)式及び(7)式の判定を行う。
ブパタンの線幅whとを求めた後に、垂直サブパタンの
線幅Wvと水平サブパタンの線幅whの比を求め、その
線幅比を記憶手段22に各領域毎に格納する。そして、
領域切出手段4によって切出すべき領域を全て切出した
後に、判定手段21により、記憶手段22に格納された
領域毎の線幅比について、それぞれの線幅比と予め定め
た線幅比基準値とをそれぞれ比較し、縦書きと判定され
た領域数Atと横書きと判定された領域数Ayとを求め
、次の(6)式及び(7)式の判定を行う。
At≦Ay ・・・・・ペロ)At>Ay
・・・・・・(7)判定手段21では、 (6)式を満足するならば、 横書きの文字方向判定結果を、(7)式を満足するなら
ば、縦方向の文字判定結果を、それぞれ出力し、それを
特徴変換手段47へ与えるようにしてもよい。
・・・・・・(7)判定手段21では、 (6)式を満足するならば、 横書きの文字方向判定結果を、(7)式を満足するなら
ば、縦方向の文字判定結果を、それぞれ出力し、それを
特徴変換手段47へ与えるようにしてもよい。
また、判定手段21では、記憶手段22に格納された領
域毎の線幅比の平均Wavを求め、その平均Wavと予
め定めた線幅比基準値wthとを比較し、その比較結果
に基づき文字方向を判定するようにしても良い。
域毎の線幅比の平均Wavを求め、その平均Wavと予
め定めた線幅比基準値wthとを比較し、その比較結果
に基づき文字方向を判定するようにしても良い。
文字方向判定手段をこのような構成にしても、上記実施
例とほぼ同様の利点が得られる。
例とほぼ同様の利点が得られる。
(ii) 上記実施例では、文字方向判定手段20に
よる文字方向の判定結果に基づき、特徴変換手段47で
特徴マトリクスを変換した後、文字の識別を行うように
しているが、例えばパタン変換手段を文字切出手段30
の出力側に設け、そのパタン変換手段により、文字方向
判定手段20の文字方向判定結果に基づき、文字切出手
段30から切出された文字パタンを所定方向に回転し、
その回転した文字パタンに基づき、文字パタンの特徴抽
出を行うようにしても良い。このような構成にしても、
上記実施例とほぼ同様の作用、効果が得られる。
よる文字方向の判定結果に基づき、特徴変換手段47で
特徴マトリクスを変換した後、文字の識別を行うように
しているが、例えばパタン変換手段を文字切出手段30
の出力側に設け、そのパタン変換手段により、文字方向
判定手段20の文字方向判定結果に基づき、文字切出手
段30から切出された文字パタンを所定方向に回転し、
その回転した文字パタンに基づき、文字パタンの特徴抽
出を行うようにしても良い。このような構成にしても、
上記実施例とほぼ同様の作用、効果が得られる。
(iii ) 上記実施例では、サブパタン抽出手段
43でサブパタンを求め、このサブパタンから、特徴マ
トリクス抽出手段46で特徴マトリクスを求めることに
より、文字の特徴抽出を行っているが、これ以外の構成
により、特徴を抽出することも可能である。例えば、パ
タン記憶手段41内を水平及び垂直方向にそれぞれ走査
し、走査線が文字手段を横切る回数を被認識文字の特徴
とするような構成にしても良い。このように構成した場
合、特徴変換手段47は、被認識文字が縦書きの場合、
水平走査により得られた特徴を被認識文字の垂直方向の
特徴として識別手段51へ出力し、垂直方向により得ら
れた特徴を被認識文字の水平方向の特徴として識別手段
51へ出力するような構成に変更することが必要である
。
43でサブパタンを求め、このサブパタンから、特徴マ
トリクス抽出手段46で特徴マトリクスを求めることに
より、文字の特徴抽出を行っているが、これ以外の構成
により、特徴を抽出することも可能である。例えば、パ
タン記憶手段41内を水平及び垂直方向にそれぞれ走査
し、走査線が文字手段を横切る回数を被認識文字の特徴
とするような構成にしても良い。このように構成した場
合、特徴変換手段47は、被認識文字が縦書きの場合、
水平走査により得られた特徴を被認識文字の垂直方向の
特徴として識別手段51へ出力し、垂直方向により得ら
れた特徴を被認識文字の水平方向の特徴として識別手段
51へ出力するような構成に変更することが必要である
。
(iv) 上記実施例の行位置検出手段3、領域切出
手段4、サブパタン抽出手段10、文字方向判定年段2
0、文字切出手段30、特徴抽出手段40、及び識別手
段51等は、個別回路で構成する以外に、計算機Gこよ
るプログラム制御等により実行するようにしても良い。
手段4、サブパタン抽出手段10、文字方向判定年段2
0、文字切出手段30、特徴抽出手段40、及び識別手
段51等は、個別回路で構成する以外に、計算機Gこよ
るプログラム制御等により実行するようにしても良い。
(発明の効果)
以上詳細に説明したように、第1の発明によれば、領域
切出手段により、帳票上等の文字列を含む所定の領域を
任意の複数の領域に分割し、各分割領域からサブパタン
抽出手段によって垂直サブパタン及び水平サブパタンを
抽出し、文字方向判定手段によって垂直サブパタン及び
水平サブパタンの特徴を抽出し、その特徴に基づき所定
の領域内の文字列の文字方向を判定し、その判定結果に
基づき文字パタンの特徴抽出を行なわせるようにしたの
で、名刺はもとより、それ以外の帳票等の文字について
も、文字方向の判定が行え、その判定結果に基づき的確
な文字認識が可能となる。そのため、オペレータが帳票
単位や、帳票上の文字列毎に文字方向を指定するという
煩雑な作業を省略でき、高速かつ操作性の良い文字認識
が行える。
切出手段により、帳票上等の文字列を含む所定の領域を
任意の複数の領域に分割し、各分割領域からサブパタン
抽出手段によって垂直サブパタン及び水平サブパタンを
抽出し、文字方向判定手段によって垂直サブパタン及び
水平サブパタンの特徴を抽出し、その特徴に基づき所定
の領域内の文字列の文字方向を判定し、その判定結果に
基づき文字パタンの特徴抽出を行なわせるようにしたの
で、名刺はもとより、それ以外の帳票等の文字について
も、文字方向の判定が行え、その判定結果に基づき的確
な文字認識が可能となる。そのため、オペレータが帳票
単位や、帳票上の文字列毎に文字方向を指定するという
煩雑な作業を省略でき、高速かつ操作性の良い文字認識
が行える。
しかも、領域切出手段により、所定の領域を任意の複数
の領域に分割し、各分割領域についてサブパタン抽出手
段でサブパタンを抽出し、その抽出したサブパタンによ
り文字方向判定手段で文字方向を判定し、その判定結果
に基づき文字パタンの特徴抽出を行わせているので、文
字方向の判定に必要なメモリ容量は、所定の領域全体で
ある必要がなく、分割領域の大きさのメモリ容量があれ
ば十分である。その上、文字方向判定結果に基づき文字
パタンの特徴抽出を行っているので、辞書記憶手段に格
納するデータ数を少なくでき、それによって辞書記憶手
段のメモリ容量を小さくできる。このように記憶容量を
小さくすることができるので、装置全体を小型にするこ
とが可能となる。
の領域に分割し、各分割領域についてサブパタン抽出手
段でサブパタンを抽出し、その抽出したサブパタンによ
り文字方向判定手段で文字方向を判定し、その判定結果
に基づき文字パタンの特徴抽出を行わせているので、文
字方向の判定に必要なメモリ容量は、所定の領域全体で
ある必要がなく、分割領域の大きさのメモリ容量があれ
ば十分である。その上、文字方向判定結果に基づき文字
パタンの特徴抽出を行っているので、辞書記憶手段に格
納するデータ数を少なくでき、それによって辞書記憶手
段のメモリ容量を小さくできる。このように記憶容量を
小さくすることができるので、装置全体を小型にするこ
とが可能となる。
第2〜第4の発明によれば、文字方向判定手段により、
垂直サブパタンの線幅と水平サブパタンの線幅とに基づ
き文字方向を判定するようにしているので、構成が簡単
で、精度の良い文字方向の判定が行える。
垂直サブパタンの線幅と水平サブパタンの線幅とに基づ
き文字方向を判定するようにしているので、構成が簡単
で、精度の良い文字方向の判定が行える。
第5の発明では、所定の領域を行としているので、横書
き、あるいは縦書きで書かれた文字を的確に認識できる
。
き、あるいは縦書きで書かれた文字を的確に認識できる
。
第1図は本発明の実施例を示す文字認識装置の機能ブロ
ック図、第2図(a)〜(d)は印刷文書の例を示す図
、第3図(a)〜(f)は明朝体の垂直サブパタンと水
平サブパタンの例を示す図、第4図は名刺のイメージの
例を示す図、第5図(a)〜(e)は2値パタンと各サ
ブパタンとを説明するための図である。 1・・・・・・画像読取手段、2・・・・・・画像記憶
手段、3・・・・・・行位置検出手段、4・・・・・・
領域切出手段、10・・・・・・サブパタン抽出手段、
12・・・・・・領域線幅計算手段、13・・・・・・
垂直サブパタン抽出手段、14・・・1.・水平サブパ
タン抽出手段、20・・・・・・文字方向判定手段、2
1・・・・・・判定手段、22・・・・・・記憶手段、
30・・・・・・文字切出手段、40・・・・・・特徴
槽lJ后段、46・・・・・・特徴マトリクス抽出手段
、47・・・・・・特徴変換手段、50・・・・・・辞
書記憶手段、51・・・・・・識別手段。 印刷文書の例 第2図 (α) (b) (c) [ぎ明朝クリ?穴タン (d7) 縦書き明WwM”lTKグン (e) 剥を書さ明I#*千寸1大タシ (f) 明朝体の垂直サブノマグンと水平サブツマタンのイ列第
3図 名利のイメージ 第4図
ック図、第2図(a)〜(d)は印刷文書の例を示す図
、第3図(a)〜(f)は明朝体の垂直サブパタンと水
平サブパタンの例を示す図、第4図は名刺のイメージの
例を示す図、第5図(a)〜(e)は2値パタンと各サ
ブパタンとを説明するための図である。 1・・・・・・画像読取手段、2・・・・・・画像記憶
手段、3・・・・・・行位置検出手段、4・・・・・・
領域切出手段、10・・・・・・サブパタン抽出手段、
12・・・・・・領域線幅計算手段、13・・・・・・
垂直サブパタン抽出手段、14・・・1.・水平サブパ
タン抽出手段、20・・・・・・文字方向判定手段、2
1・・・・・・判定手段、22・・・・・・記憶手段、
30・・・・・・文字切出手段、40・・・・・・特徴
槽lJ后段、46・・・・・・特徴マトリクス抽出手段
、47・・・・・・特徴変換手段、50・・・・・・辞
書記憶手段、51・・・・・・識別手段。 印刷文書の例 第2図 (α) (b) (c) [ぎ明朝クリ?穴タン (d7) 縦書き明WwM”lTKグン (e) 剥を書さ明I#*千寸1大タシ (f) 明朝体の垂直サブノマグンと水平サブツマタンのイ列第
3図 名利のイメージ 第4図
Claims (1)
- 【特許請求の範囲】 1、文字列を含む所定の領域内から1文字ずつ文字パタ
ンを切出す文字切出手段と、前記文字切出手段で切出さ
れた文字パタンの特徴を抽出する特徴抽出手段と、所定
の照合辞書マスクを格納した辞書記憶手段と、前記特徴
抽出手段で抽出された特徴を前記辞書記憶手段の内容と
照合して前記文字パタンの識別を行う識別手段とを、備
えた文字認識装置において、 前記所定の領域を任意の数の領域に分割して複数の分割
領域を生成する領域切出手段と、 前記各分割領域の垂直サブパタン及び水平サブパタンを
任意の領域数だけ抽出するサブパタン抽出手段と、 前記サブパタン抽出手段で抽出された垂直サブパタン及
び水平サブパタンの特徴を抽出し、その特徴に基づき、
前記所定の領域内に含まれる文字列の文字の方向を判定
して文字方向判定結果を出力する文字方向判定手段と、 前記文字方向判定結果に基づき特徴変換またはパタン変
換を行って前記特徴抽出手段で文字パタンの特徴抽出を
行なわせる変換手段とを、 設けたことを特徴とする文字認識装置。 2、請求項1記載の文字認識装置において、前記文字方
向判定手段は、 前記複数の分割領域から垂直サブパタン及び水平サブパ
タンが抽出される毎に、該垂直サブパタンの線幅と水平
サブパタンの線幅を算出し、その垂直サブパタンの線幅
和と水平サブパタンの線幅和とを求め、その両線幅和の
比と予め定めた線幅比基準値とを比較して文字方向を判
定する機能を有することを特徴とする文字認識装置。 3、請求項1記載の文字認識装置において、前記文字方
向判定手段は、 前記複数の分割領域から垂直サブパタン及び水平サブパ
タンが抽出される毎に、該垂直サブパタンの線幅と水平
サブパタンの線幅とを算出し、その両線幅の比を前記各
分割領域毎に求め、その線幅比と予め定めた線幅比基準
値とを比較した分割領域毎の比較結果に基づき文字方向
を判定する機能を有することを特徴とする文字認識装置
。 4、請求項1記載の文字認識装置において、前記文字方
向判定手段は、 前記複数の分割領域から垂直サブパタン及び水平サブパ
タンが抽出される毎に、該垂直サブパターンの線幅と水
平サブパタンの線幅を算出し、その両線幅の比を前記各
分割領域毎に求め、その線幅比の平均と予め定めた線幅
比基準値とを比較して文字方向を判定する機能を有する
ことを特徴とする文字認識装置。 5、請求項1、2、3又は4記載の文字認識装置におい
て、 前記所定の領域を行とすることを特徴とする文字認識装
置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2044818A JPH03246779A (ja) | 1990-02-26 | 1990-02-26 | 文字認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2044818A JPH03246779A (ja) | 1990-02-26 | 1990-02-26 | 文字認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH03246779A true JPH03246779A (ja) | 1991-11-05 |
Family
ID=12702024
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2044818A Pending JPH03246779A (ja) | 1990-02-26 | 1990-02-26 | 文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH03246779A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2018116647A (ja) * | 2017-01-20 | 2018-07-26 | リード テクノロジーズ,インコーポレイティド | テキストの回転角を決定する装置、方法及びコンピュータ可読記憶媒体 |
-
1990
- 1990-02-26 JP JP2044818A patent/JPH03246779A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2018116647A (ja) * | 2017-01-20 | 2018-07-26 | リード テクノロジーズ,インコーポレイティド | テキストの回転角を決定する装置、方法及びコンピュータ可読記憶媒体 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5664027A (en) | Methods and apparatus for inferring orientation of lines of text | |
| US4933979A (en) | Data reading apparatus for reading data from form sheet | |
| US6208744B1 (en) | Document image processor and method for setting a document format conforming to a document image | |
| JPH0420226B2 (ja) | ||
| US20010055423A1 (en) | Image processing device and program product | |
| US5561720A (en) | Method for extracting individual characters from raster images of a read-in handwritten or typed character sequence having a free pitch | |
| JPH03246779A (ja) | 文字認識装置 | |
| JPH0516632B2 (ja) | ||
| JP3276555B2 (ja) | フォーマット認識装置及び文字読取り装置 | |
| JPS6214277A (ja) | 画像処理方式 | |
| JP2000076378A (ja) | 文字認識方法 | |
| JP3276554B2 (ja) | フォーマット認識装置及び文字読取り装置 | |
| JP3083609B2 (ja) | 情報処理装置及びそれを用いた文字認識装置 | |
| JP2902097B2 (ja) | 情報処理装置及び文字認識装置 | |
| JP2827288B2 (ja) | 文字認識装置 | |
| JP2616995B2 (ja) | 文字認識装置 | |
| JP2995818B2 (ja) | 文字切り出し方法 | |
| JPS63269267A (ja) | 文字認識方法 | |
| JP3090928B2 (ja) | 文字認識装置 | |
| JPH03244094A (ja) | 文字認識装置 | |
| JP2755299B2 (ja) | 画像処理方法 | |
| JP3428504B2 (ja) | 文字認識装置 | |
| JP2747136B2 (ja) | 文字認識装置 | |
| JP3195405B2 (ja) | 文字認識装置 | |
| JPH04241074A (ja) | 自動文書清書装置 |