JPH0795331B2 - 文字切出し装置 - Google Patents
文字切出し装置Info
- Publication number
- JPH0795331B2 JPH0795331B2 JP60263376A JP26337685A JPH0795331B2 JP H0795331 B2 JPH0795331 B2 JP H0795331B2 JP 60263376 A JP60263376 A JP 60263376A JP 26337685 A JP26337685 A JP 26337685A JP H0795331 B2 JPH0795331 B2 JP H0795331B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- scanning
- detected
- pattern
- column
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Input (AREA)
Description
【発明の詳細な説明】 (産業上の利用分野) 本発明は、文字切出し装置に関し、更に詳細には帳票に
記入された文字を読取り、読取った文字に基づく文字パ
タン列を1文字領域毎に分離して抽出する文字切出し装
置に関する。
記入された文字を読取り、読取った文字に基づく文字パ
タン列を1文字領域毎に分離して抽出する文字切出し装
置に関する。
(従来の技術) 光学式文字認識装置(以下、OCRと略す)においては帳
票に記入された文字を行毎に走査し、光信号を光電変換
器により画像信号に変換し、ラインバッファに格納す
る。そのラインバッファを順次読み出し文字パタン列を
1文字領域毎に分離し、その分離された文字パタンによ
り認識を行っているので、文字パタン列の中から1文字
領域を抽出する文字切出し法はOCRの性能に大きく影響
する。
票に記入された文字を行毎に走査し、光信号を光電変換
器により画像信号に変換し、ラインバッファに格納す
る。そのラインバッファを順次読み出し文字パタン列を
1文字領域毎に分離し、その分離された文字パタンによ
り認識を行っているので、文字パタン列の中から1文字
領域を抽出する文字切出し法はOCRの性能に大きく影響
する。
OCRにおいて、文字列が格納されているラインバッファ
の上端から下端に向って1列走査し、この走査と直角な
方向に順次列を移動することにより、ラインバッファの
文字パタンの読出しを行う。また、1列の走査中に黒点
(文字部分を黒点、背景部分を白点)を計数することに
よりヒストグラムを作成し、その黒点ヒストグラムを参
照して、1文字の領域を決定する。
の上端から下端に向って1列走査し、この走査と直角な
方向に順次列を移動することにより、ラインバッファの
文字パタンの読出しを行う。また、1列の走査中に黒点
(文字部分を黒点、背景部分を白点)を計数することに
よりヒストグラムを作成し、その黒点ヒストグラムを参
照して、1文字の領域を決定する。
しかしながら、手書文字の場合において記入者が文字を
傾斜して記入しているため、あるいは文字記入枠からは
み出して記入したため、もしくは記入者が文字の一部を
はねたため等の理由により、隣接する文字が重なって、
2文字以上の文字パタンが1文字として切出されるとい
う問題点がある。
傾斜して記入しているため、あるいは文字記入枠からは
み出して記入したため、もしくは記入者が文字の一部を
はねたため等の理由により、隣接する文字が重なって、
2文字以上の文字パタンが1文字として切出されるとい
う問題点がある。
この問題点を解決するために本出願人が先に提案した特
願昭60-36574号では黒点ヒストグラムの幅より何文字分
に相当するか判定し、2文字以上の場合には、その文字
パタン列の文字外接枠を検出し、その文字外接枠内の文
字パタン列を記憶手段に保持する。次に文字外接枠の上
下の辺から各々反対側の辺へ向って走査し、記憶手段か
ら文字パタン列の内容を読み出し、その内容が文字部分
であるか背景部分であるか検出する。
願昭60-36574号では黒点ヒストグラムの幅より何文字分
に相当するか判定し、2文字以上の場合には、その文字
パタン列の文字外接枠を検出し、その文字外接枠内の文
字パタン列を記憶手段に保持する。次に文字外接枠の上
下の辺から各々反対側の辺へ向って走査し、記憶手段か
ら文字パタン列の内容を読み出し、その内容が文字部分
であるか背景部分であるか検出する。
このようにして、上辺からの走査により検出された背景
部分及び下辺からの走査により検出された背景部分、文
字部分、並びに該走査で文字部分が検出されると、該列
の走査を打ち切り、そのため該走査を受けなかった背景
部分の4種類に文字外接枠内の文字パタン列を分類す
る。次に水平走査を行い分類が変化する変化点を検出
し、順次変化点を格納し、同時に変化点の前後の状態
(分類結果)を保持し、該状態の遷移を所定の分類の変
化の遷移の組合せと比較して一致する変化点を検出し、
その変化点により、隣接する文字の一部が重なった文字
パタン列から文字を切出していた。
部分及び下辺からの走査により検出された背景部分、文
字部分、並びに該走査で文字部分が検出されると、該列
の走査を打ち切り、そのため該走査を受けなかった背景
部分の4種類に文字外接枠内の文字パタン列を分類す
る。次に水平走査を行い分類が変化する変化点を検出
し、順次変化点を格納し、同時に変化点の前後の状態
(分類結果)を保持し、該状態の遷移を所定の分類の変
化の遷移の組合せと比較して一致する変化点を検出し、
その変化点により、隣接する文字の一部が重なった文字
パタン列から文字を切出していた。
第9図(a)(b)は以上に述べた従来の文字切出し方
式の具体例を示す図である。同図において、100,101は
文字パタンである。103は上辺から下辺への走査方向、1
04は下辺から上辺への走査方向を示す。第9図(a)に
示すように、文字外接枠の上下の辺から各々反対側の辺
へ向って走査を行い当該文字パタン列を4種類(上辺か
らの走査を受けた背景部分:図中“2"で示す。下辺から
の走査を受けた背景部分:図中“4"で示す。両走査を受
けなかった背景部分:図中“0"で示す。文字線部分:図
中“1"で示す)に分類した結果より分類が“4"→“0"→
“2"と変換する領域を検出しその変化点よりA−A′の
ごとき切出し位置を検出していた。
式の具体例を示す図である。同図において、100,101は
文字パタンである。103は上辺から下辺への走査方向、1
04は下辺から上辺への走査方向を示す。第9図(a)に
示すように、文字外接枠の上下の辺から各々反対側の辺
へ向って走査を行い当該文字パタン列を4種類(上辺か
らの走査を受けた背景部分:図中“2"で示す。下辺から
の走査を受けた背景部分:図中“4"で示す。両走査を受
けなかった背景部分:図中“0"で示す。文字線部分:図
中“1"で示す)に分類した結果より分類が“4"→“0"→
“2"と変換する領域を検出しその変化点よりA−A′の
ごとき切出し位置を検出していた。
(発明が解決しようとする問題点) しかしながら上記従来の文字切出し方式では文字外接枠
内の分類結果の遷移の組合せが所定の組合せと一致する
ものがない隣接した文字の一部が重なった文字パタン列
は1文字を切出すことは出来なかった。すなわち、帳票
の記入者の習慣、くせ等により文字が記入枠より大きく
はみ出したり、はねてしまうために、文字の一部が隣接
する文字に大きく入込んだり、より複雑に重なった場合
には、第9図(b)に示すように上下の辺からの走査の
結果を水平方向に走査して分類が変化する変化点を検出
し、その変化点を保持し、同時に変化点の前後の分類結
果を保持し、該分類結果の組合せを所定の組合せと一致
するものを検出することが出来ないというような問題点
があった。
内の分類結果の遷移の組合せが所定の組合せと一致する
ものがない隣接した文字の一部が重なった文字パタン列
は1文字を切出すことは出来なかった。すなわち、帳票
の記入者の習慣、くせ等により文字が記入枠より大きく
はみ出したり、はねてしまうために、文字の一部が隣接
する文字に大きく入込んだり、より複雑に重なった場合
には、第9図(b)に示すように上下の辺からの走査の
結果を水平方向に走査して分類が変化する変化点を検出
し、その変化点を保持し、同時に変化点の前後の分類結
果を保持し、該分類結果の組合せを所定の組合せと一致
するものを検出することが出来ないというような問題点
があった。
本発明は、これらの問題点を解決するためのもので、簡
単な構成で精度の良い文字切出し装置を提供することを
目的とする。
単な構成で精度の良い文字切出し装置を提供することを
目的とする。
(問題点を解決するための手段) 本発明は前記問題点を解決するために、帳票上に記入さ
れた文字列を光電変換して得られる量子化された文字パ
タン列から1文字毎の文字パタンを分離して抽出する文
字切出し装置において、前記文字パタン列を格納するラ
インバッファメモリと、該ラインバッファメモリを文字
パタン列の列方向に1列毎に走査して列方向の黒点ヒス
トグラムを作成し、第1の閾値より大きい黒点ヒストグ
ラムが連続して第2の閾値以上続く黒点ヒストグラムの
幅に基づき切出し対象のブロックを検出するブロック検
出手段と、前記ブロック検出手段で得られたブロックの
幅と第3の閾値とを比較して該幅が何文字に相当するか
を判定する判定手段と、前記ブロック検出手段で検出さ
れたブロックの文字パタン列を行方向に各行毎に走査し
て作成した行方向の黒点ヒストグラムと前記列方向の黒
点ヒストグラムに基づいて文字外接枠を検出する外接枠
検出手段と、前記外接枠検出手段で得られた文字外接枠
内の文字パタン列を記憶する記憶手段と、前記判定手段
が複数文字であると判定した場合には前記文字外接枠の
上辺,下辺から各々反対側の辺に向かって走査して前記
記憶手段から文字パタン列の内容を読出し、該内容が文
字領域であるか背景領域であるかを検出し、この検出処
理により上辺からの走査で検出された背景領域,下辺か
らの走査で検出された背景領域,文字領域,並びに該走
査で文字領域が検出されると、該列の走査を打ち切り、
当該走査を打ち切ったことにより該走査を受けなかった
背景領域の各領域に前記文字外接枠内の文字パタン列を
分類する分類手段と、前記分類手段による文字外接枠内
の分類結果について、水平走査を行って分類が変化する
変化点を検出して順次格納すると共に該変化点の前後の
状態を保持し、該状態の遷移を所定の分類の変化の遷移
の組合せと比較して一致する変化点を検出する変化点検
出手段と、前記変化点検出手段で一致する変化点が検出
されない場合には、前記文字外接枠を水平方向に分割す
る分割手段と、前記分割手段で分割された各分割領域を
新たな文字外接枠として前記分類手段及び変化点検出手
段により各分割領域毎に検出された変化点に基づいて文
字切出し位置を決定する決定手段とから構成されるもの
である。
れた文字列を光電変換して得られる量子化された文字パ
タン列から1文字毎の文字パタンを分離して抽出する文
字切出し装置において、前記文字パタン列を格納するラ
インバッファメモリと、該ラインバッファメモリを文字
パタン列の列方向に1列毎に走査して列方向の黒点ヒス
トグラムを作成し、第1の閾値より大きい黒点ヒストグ
ラムが連続して第2の閾値以上続く黒点ヒストグラムの
幅に基づき切出し対象のブロックを検出するブロック検
出手段と、前記ブロック検出手段で得られたブロックの
幅と第3の閾値とを比較して該幅が何文字に相当するか
を判定する判定手段と、前記ブロック検出手段で検出さ
れたブロックの文字パタン列を行方向に各行毎に走査し
て作成した行方向の黒点ヒストグラムと前記列方向の黒
点ヒストグラムに基づいて文字外接枠を検出する外接枠
検出手段と、前記外接枠検出手段で得られた文字外接枠
内の文字パタン列を記憶する記憶手段と、前記判定手段
が複数文字であると判定した場合には前記文字外接枠の
上辺,下辺から各々反対側の辺に向かって走査して前記
記憶手段から文字パタン列の内容を読出し、該内容が文
字領域であるか背景領域であるかを検出し、この検出処
理により上辺からの走査で検出された背景領域,下辺か
らの走査で検出された背景領域,文字領域,並びに該走
査で文字領域が検出されると、該列の走査を打ち切り、
当該走査を打ち切ったことにより該走査を受けなかった
背景領域の各領域に前記文字外接枠内の文字パタン列を
分類する分類手段と、前記分類手段による文字外接枠内
の分類結果について、水平走査を行って分類が変化する
変化点を検出して順次格納すると共に該変化点の前後の
状態を保持し、該状態の遷移を所定の分類の変化の遷移
の組合せと比較して一致する変化点を検出する変化点検
出手段と、前記変化点検出手段で一致する変化点が検出
されない場合には、前記文字外接枠を水平方向に分割す
る分割手段と、前記分割手段で分割された各分割領域を
新たな文字外接枠として前記分類手段及び変化点検出手
段により各分割領域毎に検出された変化点に基づいて文
字切出し位置を決定する決定手段とから構成されるもの
である。
(作用) 本発明によれば以上のように文字切出し装置を構成した
ので、技術的手段は次のように作用する。ブロック検出
手段はラインバッファメモリの文字パタン列の列方向の
黒点ヒストグラムを作成して列方向の黒点ヒストグラム
の幅を求め、これに対応して文字パタン列の切出し処理
を施すブロックを検出するように働く。判定手段は検出
したブロックが何文字分であるかを判定するように働
く。外接枠検出手段はブロック内の文字パタン列の行方
向の黒点ヒストグラムを作成し、これと列方向の黒点ヒ
ストグラムからブロック内の文字パタン列の文字外接枠
を検出するように働く。記憶手段は文字外接枠内の文字
パタンを記憶するように働く。分類手段は、判定手段が
ブロックを複数文字であると判定した場合には文字外接
枠内の上下の辺から各々反対側の辺に向かって走査して
4種類の領域に分類するように働く。この分類結果に対
し、変化点検出手段は水平走査して領域が変化する変化
点を検出して順次格納すると共に変化点の前後の状態を
保持し、該状態の遷移を所定の分類の変化の遷移の組み
合わせとを比較して一致する変化点を検出するように働
く。ここで、一致する変化点が検出されない場合には分
割手段は文字外接枠を水平方向に分割するように働く。
この分割された各分割領域に対し、上記と同様にして分
類手段、変化点検出手段により変化点を検出し、これら
の変化点に基づいて決定手段が文字切出し位置を決定す
るように働く。従って、文字の一部が隣接する文字に深
く入こんだ場合にも精度よく文字切出しを行うことがで
きる。
ので、技術的手段は次のように作用する。ブロック検出
手段はラインバッファメモリの文字パタン列の列方向の
黒点ヒストグラムを作成して列方向の黒点ヒストグラム
の幅を求め、これに対応して文字パタン列の切出し処理
を施すブロックを検出するように働く。判定手段は検出
したブロックが何文字分であるかを判定するように働
く。外接枠検出手段はブロック内の文字パタン列の行方
向の黒点ヒストグラムを作成し、これと列方向の黒点ヒ
ストグラムからブロック内の文字パタン列の文字外接枠
を検出するように働く。記憶手段は文字外接枠内の文字
パタンを記憶するように働く。分類手段は、判定手段が
ブロックを複数文字であると判定した場合には文字外接
枠内の上下の辺から各々反対側の辺に向かって走査して
4種類の領域に分類するように働く。この分類結果に対
し、変化点検出手段は水平走査して領域が変化する変化
点を検出して順次格納すると共に変化点の前後の状態を
保持し、該状態の遷移を所定の分類の変化の遷移の組み
合わせとを比較して一致する変化点を検出するように働
く。ここで、一致する変化点が検出されない場合には分
割手段は文字外接枠を水平方向に分割するように働く。
この分割された各分割領域に対し、上記と同様にして分
類手段、変化点検出手段により変化点を検出し、これら
の変化点に基づいて決定手段が文字切出し位置を決定す
るように働く。従って、文字の一部が隣接する文字に深
く入こんだ場合にも精度よく文字切出しを行うことがで
きる。
(実施例) 以下、この発明の一実施例を図面に基づいて説明する。
第1図は、この発明の一実施例を示すブロック図であ
る。同図において、200は図示されていない光電変換部
よりの画像信号、201はラインバッファ、202は黒点ヒス
トグラム作成回路220、外接枠検出回路221および文字判
定回路222である。203はデータの切替え回路、204はパ
タンメモリ、205,206はパタンメモリ用のアドレスを発
生するx方向のxアドレスカウンタ(以下xカウンタと
いう)とy方向のyアドレスカウンタ(以下yカウンタ
という)である。207は制御回路である。208はパタン領
域分類回路、209は白点より黒点への変化点を検出する
文字線検出回路である。210はパタン領域変化点検出回
路、211は切出し領域の検出回路である。また、各回路
を接続する一重の矢印はデータの流れを示し、二重の矢
印は制御信号を示す。
る。同図において、200は図示されていない光電変換部
よりの画像信号、201はラインバッファ、202は黒点ヒス
トグラム作成回路220、外接枠検出回路221および文字判
定回路222である。203はデータの切替え回路、204はパ
タンメモリ、205,206はパタンメモリ用のアドレスを発
生するx方向のxアドレスカウンタ(以下xカウンタと
いう)とy方向のyアドレスカウンタ(以下yカウンタ
という)である。207は制御回路である。208はパタン領
域分類回路、209は白点より黒点への変化点を検出する
文字線検出回路である。210はパタン領域変化点検出回
路、211は切出し領域の検出回路である。また、各回路
を接続する一重の矢印はデータの流れを示し、二重の矢
印は制御信号を示す。
以下に、第1図のブロック図を用いて本実施例動作につ
いて説明を行う。
いて説明を行う。
帳票上の文字列は光電変換器により2値化された画像信
号200に変換され、ラインバッファ201に格納される。制
御回路207の制御により以下の処理が行われる。制御回
路207はラインバッファ201に格納されている画像信号を
ラインバッファ201の先頭位置よ1列単位に読出し、順
次列を更新し、1行分の文字パタンデータを全て読出し
た時点で終了する。また、制御回路207では、ラインバ
ッファ201より1列単位にパタンデータを読出すと同時
に黒点ヒストグラム作成回路220を起動する。黒点ヒス
トグラム作成回路220では、1列の読出し中の黒点数を
計数することにより当該列の黒点ヒストグラムを作成
し、黒点ヒストグラム作成回路220に含まれるヒストグ
ラムメモリ230に格納する。以上の処理を繰返し1行
分、全列の黒点ヒストグラムをヒストグラムメモリ230
に格納した時点で処理を終了する。
号200に変換され、ラインバッファ201に格納される。制
御回路207の制御により以下の処理が行われる。制御回
路207はラインバッファ201に格納されている画像信号を
ラインバッファ201の先頭位置よ1列単位に読出し、順
次列を更新し、1行分の文字パタンデータを全て読出し
た時点で終了する。また、制御回路207では、ラインバ
ッファ201より1列単位にパタンデータを読出すと同時
に黒点ヒストグラム作成回路220を起動する。黒点ヒス
トグラム作成回路220では、1列の読出し中の黒点数を
計数することにより当該列の黒点ヒストグラムを作成
し、黒点ヒストグラム作成回路220に含まれるヒストグ
ラムメモリ230に格納する。以上の処理を繰返し1行
分、全列の黒点ヒストグラムをヒストグラムメモリ230
に格納した時点で処理を終了する。
1行分の黒点ヒストグラムを作成した後は、黒点ヒスト
グラム作成回路220中のヒストグラムメモリ230を先頭よ
り読出して、前記黒点ヒストグラムを参照してブロック
の検出を行う。制御回路207は黒点ヒストグラム作成回
路220中のヒストグラムメモリ230より、順次黒点ヒスト
グラムを読出し、黒点ヒストグラムと閾値α(α:定
数、ただし、本実施例においてα=1とする)を比較
し、前記ヒストグラムが大きければ文字のブロックの始
点候補とし、順次黒点ヒストグラムの格納番地を更進
し、読出された黒点ヒストグラムが閾値αより大きい列
を計数し、β(β:定数、ただし、本実施例においては
β=2とする)列連続した場合、前記始点候補を始点と
する。さらに列の更進を続け、始点が検出された後、始
めて黒点ヒストグラムが閾値αより小さくなる列を終点
とし、始点から終点までの長さで示される領域をブロッ
クとする。次に、制御回路207は文字判定回路222を起動
し前記検出されたブロックの長さを読取対象としている
文字の平均的な幅より求められた閾値γ1,γ2(γ1,
γ2定数、ただし、本実施例においてはγ1=75,γ2=12
5とする)と比較する。そして、当該ブロックの長さW
が閾値γ1より小さいときには当該ブロックを1文字と
判定し、γ1≦W≦γ2のときは2文字と判定し、さらに
W>γ2のときは3文字以上と判定する。また、制御回
路207では当該ブロックの判定の後、該ブロックについ
て外接枠検出回路221を起動し、外接枠を検出する。さ
らに、このブロックの外接枠が検出されると、前記外接
枠内の文字パタンをパタンメモリ204に転送する。ここ
で、W>γ2の場合つまり前記ブロックを3文字以上と
判定した場合、始点からγ2まで切出し処理を行って1
文字目と2文字目を分割する。この結果の切出し点を始
点として、その始点からγ2まで切出し処理を行ってさ
らに2文字目と3文字目を分割するごとき順次切出しを
行いWまで処理することとなる。ここで、後述する第5
図に示すように文字外接枠の上辺左端を原点とし、下辺
位置をPB、右辺位置をPRとする。
グラム作成回路220中のヒストグラムメモリ230を先頭よ
り読出して、前記黒点ヒストグラムを参照してブロック
の検出を行う。制御回路207は黒点ヒストグラム作成回
路220中のヒストグラムメモリ230より、順次黒点ヒスト
グラムを読出し、黒点ヒストグラムと閾値α(α:定
数、ただし、本実施例においてα=1とする)を比較
し、前記ヒストグラムが大きければ文字のブロックの始
点候補とし、順次黒点ヒストグラムの格納番地を更進
し、読出された黒点ヒストグラムが閾値αより大きい列
を計数し、β(β:定数、ただし、本実施例においては
β=2とする)列連続した場合、前記始点候補を始点と
する。さらに列の更進を続け、始点が検出された後、始
めて黒点ヒストグラムが閾値αより小さくなる列を終点
とし、始点から終点までの長さで示される領域をブロッ
クとする。次に、制御回路207は文字判定回路222を起動
し前記検出されたブロックの長さを読取対象としている
文字の平均的な幅より求められた閾値γ1,γ2(γ1,
γ2定数、ただし、本実施例においてはγ1=75,γ2=12
5とする)と比較する。そして、当該ブロックの長さW
が閾値γ1より小さいときには当該ブロックを1文字と
判定し、γ1≦W≦γ2のときは2文字と判定し、さらに
W>γ2のときは3文字以上と判定する。また、制御回
路207では当該ブロックの判定の後、該ブロックについ
て外接枠検出回路221を起動し、外接枠を検出する。さ
らに、このブロックの外接枠が検出されると、前記外接
枠内の文字パタンをパタンメモリ204に転送する。ここ
で、W>γ2の場合つまり前記ブロックを3文字以上と
判定した場合、始点からγ2まで切出し処理を行って1
文字目と2文字目を分割する。この結果の切出し点を始
点として、その始点からγ2まで切出し処理を行ってさ
らに2文字目と3文字目を分割するごとき順次切出しを
行いWまで処理することとなる。ここで、後述する第5
図に示すように文字外接枠の上辺左端を原点とし、下辺
位置をPB、右辺位置をPRとする。
次に、上記のような文字の判定により2文字以上と判定
されたものの処理について第1図に基づいて説明する。
されたものの処理について第1図に基づいて説明する。
制御回路207はパタンメモリ204のアドレスを与えるxカ
ウンタ205及びyカウンタ206を文字の外接枠の上辺の左
端の位置にセットし、yカウンタ106をインクリメント
して文字外接枠の下辺に向って走査を行う。そして、パ
タンメモリ204のアドレスをX軸,Y軸に対して(x,y)と
し、それぞれxカウンタ、yカウンタの値を用いる。前
記アドレスで示される位置のパタンメモリ204の内容をP
M(x,y)で表わす。本実施例においては白点をPM(x,
y)=0、黒点をPM(x,y)=1、前記上辺からの走査時
に検出された白点をPM(x,y)=2,前記下辺からの走査
時に検出された白点をPM(x,y)=4とした。従って、
本実施例におけるパタンメモリ204は1メッシュに対し
て3ビットのデータ幅を有する。パタン領域分類回路20
8において、文字外接枠の上辺左端にアドレスを設定し
パタンメモリ204より文字パタンを読みだす。PM(x,y)
=0のときは(PM(x,y).OR.2)を新たなPM(x,y)と
し、切換え回路203を介してパタンメモリ204の当該番地
に書き込みを行う。
ウンタ205及びyカウンタ206を文字の外接枠の上辺の左
端の位置にセットし、yカウンタ106をインクリメント
して文字外接枠の下辺に向って走査を行う。そして、パ
タンメモリ204のアドレスをX軸,Y軸に対して(x,y)と
し、それぞれxカウンタ、yカウンタの値を用いる。前
記アドレスで示される位置のパタンメモリ204の内容をP
M(x,y)で表わす。本実施例においては白点をPM(x,
y)=0、黒点をPM(x,y)=1、前記上辺からの走査時
に検出された白点をPM(x,y)=2,前記下辺からの走査
時に検出された白点をPM(x,y)=4とした。従って、
本実施例におけるパタンメモリ204は1メッシュに対し
て3ビットのデータ幅を有する。パタン領域分類回路20
8において、文字外接枠の上辺左端にアドレスを設定し
パタンメモリ204より文字パタンを読みだす。PM(x,y)
=0のときは(PM(x,y).OR.2)を新たなPM(x,y)と
し、切換え回路203を介してパタンメモリ204の当該番地
に書き込みを行う。
制御回路207は、白点から黒点への変化点を検出する文
字線検出回路209がPM(x,y)=1である黒点を検出する
と、該列の走査を打ち切りxカウンタ205を1つインク
リメントし、次の列の走査を文字外接枠の上辺より行
う。また、前記文字外接枠の上辺より走査を行い下辺ま
で到達したときも該列の走査を打ち切り、次列の走査を
行う。以上の走査を順次繰返し、文字外接枠の右端の列
を処理したら終了する。前記上辺よりの走査が終了した
ら制御回路207は、xカウンタ、yカウンタを文字外接
枠の下辺左端に設定し、前記下辺より上辺に向っての走
査を行い、前記上辺よりの走査時と同様の処理を行う。
ただし、PM(x,y)=0のときは、(PM(x,y).OR.4)
をPM(x,y)としてパタンメモリ204に格納する。前記上
辺よりの走査と同様に右端の列の処理をしたら終了す
る。前記2種類の走査が終了し、文字外接枠内のパタン
の分類が終了後、制御回路207は、xカウンタ205及びy
カウンタ206を文字外接枠上の上辺左端設定し、水平走
査を行い文字切出し領域の検出を行う。
字線検出回路209がPM(x,y)=1である黒点を検出する
と、該列の走査を打ち切りxカウンタ205を1つインク
リメントし、次の列の走査を文字外接枠の上辺より行
う。また、前記文字外接枠の上辺より走査を行い下辺ま
で到達したときも該列の走査を打ち切り、次列の走査を
行う。以上の走査を順次繰返し、文字外接枠の右端の列
を処理したら終了する。前記上辺よりの走査が終了した
ら制御回路207は、xカウンタ、yカウンタを文字外接
枠の下辺左端に設定し、前記下辺より上辺に向っての走
査を行い、前記上辺よりの走査時と同様の処理を行う。
ただし、PM(x,y)=0のときは、(PM(x,y).OR.4)
をPM(x,y)としてパタンメモリ204に格納する。前記上
辺よりの走査と同様に右端の列の処理をしたら終了す
る。前記2種類の走査が終了し、文字外接枠内のパタン
の分類が終了後、制御回路207は、xカウンタ205及びy
カウンタ206を文字外接枠上の上辺左端設定し、水平走
査を行い文字切出し領域の検出を行う。
ここで上記の列走査の具体例としては前述の第9図
(a)(b)が挙げられる。
(a)(b)が挙げられる。
次に、文字切出し領域の検出を第1図に基づいて説明す
る。
る。
先ず、パタン領域変化点検出回路210は制御回路207によ
り起動されると、パタンメモリ204から文字パタンデー
タ(垂直走査による分類結果)を読出しながら外接枠内
を水平走査する。また、パタン領域変化点検出回路210
は、パタンメモリ204からの文字パタンデータを処理す
る。
り起動されると、パタンメモリ204から文字パタンデー
タ(垂直走査による分類結果)を読出しながら外接枠内
を水平走査する。また、パタン領域変化点検出回路210
は、パタンメモリ204からの文字パタンデータを処理す
る。
第2図はパタン領域変化点検出回路210の内部構成を示
すブロック図である。同図において、300はyカウンタ2
06の出力、301はxカウンタ205の出力、302は文字パタ
ンデータを示す303はxカウンタ205用のレジスタ(REG
A)、304は文字パタンデータ保持用のレジスタ(REG
D)、305は文字パタンデータの比較用のコンパレータ、
306は文字パタンデータの変化点が検出された点の1点
前のX軸の座標検出用のレジスタ(xREG I)、307は後
述する切出し位置判定回路211より与えられる信号310に
よってX座標を保持するためのレジスタ(xREG II)308
は変化点が検出されたときのY座標を保持するためのレ
ジスタ(yREG I)である。
すブロック図である。同図において、300はyカウンタ2
06の出力、301はxカウンタ205の出力、302は文字パタ
ンデータを示す303はxカウンタ205用のレジスタ(REG
A)、304は文字パタンデータ保持用のレジスタ(REG
D)、305は文字パタンデータの比較用のコンパレータ、
306は文字パタンデータの変化点が検出された点の1点
前のX軸の座標検出用のレジスタ(xREG I)、307は後
述する切出し位置判定回路211より与えられる信号310に
よってX座標を保持するためのレジスタ(xREG II)308
は変化点が検出されたときのY座標を保持するためのレ
ジスタ(yREG I)である。
以下第2図を用いてパタン領域変化点検出回路210の動
作を説明する。
作を説明する。
外接枠内の水平走査によって読出された文字パタンデー
タは、文字パタンデータ保持用レジスタ(REGD)304に
保持される。そして、保持されている文字パタンデータ
すなわち1点前の文字パタンデータと現在読出されてい
る文字パタンデータをコンパレータ305により比較しそ
の比較した結果により変化したと判定されると、その1
点前のX軸方向の座標位置を保持する。すなわちxカウ
ンタの出力301はレジスタ(REGA)303に座標が更進され
る毎に保持され、コンパレータ305によって変化点が検
出されると、レジスタ(REGA)303に保持されている1
点前の座標がレジスタ(XREG I)306に保持される。
タは、文字パタンデータ保持用レジスタ(REGD)304に
保持される。そして、保持されている文字パタンデータ
すなわち1点前の文字パタンデータと現在読出されてい
る文字パタンデータをコンパレータ305により比較しそ
の比較した結果により変化したと判定されると、その1
点前のX軸方向の座標位置を保持する。すなわちxカウ
ンタの出力301はレジスタ(REGA)303に座標が更進され
る毎に保持され、コンパレータ305によって変化点が検
出されると、レジスタ(REGA)303に保持されている1
点前の座標がレジスタ(XREG I)306に保持される。
次に第1図に示す切出し領域検出回路211においては、
パタン領域変化点検出回路210でパタン領域の変化点が
検出されたとき、PM(x-1,y)文字パタンデータ(領
域)をレジスタに保持する。
パタン領域変化点検出回路210でパタン領域の変化点が
検出されたとき、PM(x-1,y)文字パタンデータ(領
域)をレジスタに保持する。
切出し領域検出回路211では、前記PM(x-1,y)の文字パ
タンデータを保持する状態レジスタを3個有し、該状態
レジスタはパタン領域の変化点が検出されたときに、レ
ジスタの内容が隣接するレジスタにシフトする構成とな
っている。さらに、パタン領域の変化点が検出され、状
態レジスタのシフトが完了したら前記3種類状態レジス
タの内容が所定の値と一致するかを検出する。
タンデータを保持する状態レジスタを3個有し、該状態
レジスタはパタン領域の変化点が検出されたときに、レ
ジスタの内容が隣接するレジスタにシフトする構成とな
っている。さらに、パタン領域の変化点が検出され、状
態レジスタのシフトが完了したら前記3種類状態レジス
タの内容が所定の値と一致するかを検出する。
第3図は切出し領域検出回路211の内部構成を示すブロ
ック図である。同図において、400は制御回路207からの
制御信号、401はパタンメモリ204よりの文字パタンデー
タ、402はパタン領域変化点検出回路210で検出された変
化点検出信号を示す。403〜406は制御回路207からの文
字パタンデータの遷移の所定の組合せを示す遷移レジス
タ(組合せ回路)である。407〜409はパタン領域変化点
検出回路210により変化点が検出されたときの文字パタ
ンデータの内容を保持する状態レジスタ(ST3〜ST1)で
ある。410〜413は状態レジスタ407〜409と遷移レジスタ
403〜406の一致を検出する比較回路(コンパレータ)で
ある。414は比較回路410〜413の出力を論理和する論理
和回路、415は遷移レジスタ403〜406と状態レジスタが
一致したことを保持するフリップフロップである。
ック図である。同図において、400は制御回路207からの
制御信号、401はパタンメモリ204よりの文字パタンデー
タ、402はパタン領域変化点検出回路210で検出された変
化点検出信号を示す。403〜406は制御回路207からの文
字パタンデータの遷移の所定の組合せを示す遷移レジス
タ(組合せ回路)である。407〜409はパタン領域変化点
検出回路210により変化点が検出されたときの文字パタ
ンデータの内容を保持する状態レジスタ(ST3〜ST1)で
ある。410〜413は状態レジスタ407〜409と遷移レジスタ
403〜406の一致を検出する比較回路(コンパレータ)で
ある。414は比較回路410〜413の出力を論理和する論理
和回路、415は遷移レジスタ403〜406と状態レジスタが
一致したことを保持するフリップフロップである。
次に第3図を用いて切出し領域検出回路211の動作を説
明する。文字パタンデータ401は座標位置が更進される
毎に状態レジスタ(ST3)407に保持される。パタン領域
変化点検出回路210でパタン領域の変化点が検出される
と、状態レジスタ(ST3)407の出力は状態レジスタ(ST
2)408に保持される。さらに同時に状態レジスタ(ST
1)409には状態レジスタ408の出力が保持される。以上
のようにして連続する3つの文字パタンデータの変化の
組合せが、3つの状態レジスタ407,408,409に保持され
る。変化点が検出されると、3つの状態レジスタ407〜4
09の組合せと、所定の数種の遷移レジスタ403〜406はそ
れぞれ比較回路410〜413により比較され、一致する組合
せがあれば切出し領域が検出済を示すフリップフロップ
415をセットする。
明する。文字パタンデータ401は座標位置が更進される
毎に状態レジスタ(ST3)407に保持される。パタン領域
変化点検出回路210でパタン領域の変化点が検出される
と、状態レジスタ(ST3)407の出力は状態レジスタ(ST
2)408に保持される。さらに同時に状態レジスタ(ST
1)409には状態レジスタ408の出力が保持される。以上
のようにして連続する3つの文字パタンデータの変化の
組合せが、3つの状態レジスタ407,408,409に保持され
る。変化点が検出されると、3つの状態レジスタ407〜4
09の組合せと、所定の数種の遷移レジスタ403〜406はそ
れぞれ比較回路410〜413により比較され、一致する組合
せがあれば切出し領域が検出済を示すフリップフロップ
415をセットする。
次に第1図においてフリップフロップ415がセットされ
ると、切出し領域検出回路211からの決定信号がパタン
領域変化点検出回路210の(y REG)308及び(x REGII)
307に供給される。その時に各レジスタに格納されてい
たxカウンタ205もしくはyカウンタ206の内容が各レジ
スタからy1,x2として出力される。
ると、切出し領域検出回路211からの決定信号がパタン
領域変化点検出回路210の(y REG)308及び(x REGII)
307に供給される。その時に各レジスタに格納されてい
たxカウンタ205もしくはyカウンタ206の内容が各レジ
スタからy1,x2として出力される。
状態レジスタ407〜409が所定の組合せと一致した場合、
その行の水平走査は打ち切り、yカウンタ206をインク
リメントし新たな次の行の水平走査を行う。以上の水平
走査が、外接枠内で全て終了した次点でx1(x REG
I),x2(x REG II),y1(y REGI)をもとに切出し位
置を決定する。
その行の水平走査は打ち切り、yカウンタ206をインク
リメントし新たな次の行の水平走査を行う。以上の水平
走査が、外接枠内で全て終了した次点でx1(x REG
I),x2(x REG II),y1(y REGI)をもとに切出し位
置を決定する。
ここで用いた所定の組合せは、“4"→“0"→“2",“2"
→“0"→“4",“4"→“2"および“2"→“4"の4種類で
遷移レジスタ403〜406にそれぞれ格納されている。
→“0"→“4",“4"→“2"および“2"→“4"の4種類で
遷移レジスタ403〜406にそれぞれ格納されている。
水平走査が外接枠内で全て終了した時点で状態レジスタ
407〜409が遷移レジスタ403〜406と一致するものがない
ときは、制御回路207は文字外接枠の水平2等分割線を
求める。該水平2等分割線によって分割された2つの領
域を新たな外接枠として制御回路207は2つの外接枠そ
れぞれで切出し手順と同様にして切出し位置を検出す
る。すなわち先ず水平2等分割線より上にある外接枠に
ついて、上下の辺からそれぞれ対辺へ走査を行うことに
より該外接枠内を4種類に分類し、その分類結果につい
て水平走査を行いつつ分類の変化する変化点および変化
点の前後での分類の遷移の組合せを検出し、その組合せ
と所定の組合せとの一致する変化点を検出して前記分割
線の上側の外接枠の切出し位置とする。制御回路207は
次に前記分割線の下側の領域についても同じ方向にて切
出し位置を検出し、それぞれの切出し位置を接続するこ
とにより、文字パタン全体の切出し位置とする。
407〜409が遷移レジスタ403〜406と一致するものがない
ときは、制御回路207は文字外接枠の水平2等分割線を
求める。該水平2等分割線によって分割された2つの領
域を新たな外接枠として制御回路207は2つの外接枠そ
れぞれで切出し手順と同様にして切出し位置を検出す
る。すなわち先ず水平2等分割線より上にある外接枠に
ついて、上下の辺からそれぞれ対辺へ走査を行うことに
より該外接枠内を4種類に分類し、その分類結果につい
て水平走査を行いつつ分類の変化する変化点および変化
点の前後での分類の遷移の組合せを検出し、その組合せ
と所定の組合せとの一致する変化点を検出して前記分割
線の上側の外接枠の切出し位置とする。制御回路207は
次に前記分割線の下側の領域についても同じ方向にて切
出し位置を検出し、それぞれの切出し位置を接続するこ
とにより、文字パタン全体の切出し位置とする。
ここで分割された外接枠の上辺より下辺に向う走査時に
黒点が検出されずに下辺に到達した場合は、その走査線
の位置を切出し位置とし、複数の走査線が検出された場
合には文字パタンの外接枠のx軸方向の中央位置に最も
近い走査線を持って切出し位置とする。該切出し位置を
与えるx軸上の位置をxPとする。
黒点が検出されずに下辺に到達した場合は、その走査線
の位置を切出し位置とし、複数の走査線が検出された場
合には文字パタンの外接枠のx軸方向の中央位置に最も
近い走査線を持って切出し位置とする。該切出し位置を
与えるx軸上の位置をxPとする。
以上のように上下の領域で切出し位置x1x2y1あるいはxP
が検出されると検出された2組の切出し線と水平分割線
で接続することにより全体の切出し位置とする。
が検出されると検出された2組の切出し線と水平分割線
で接続することにより全体の切出し位置とする。
以下に、第4図に示す切出し位置が決定されたパタン例
を使用して、パタンの転送方法を説明する。また、第4
図は、第1図のブロック図におけるパタンメモリ204に
格納されているパタンおよび切出し位置を示している。
座標は横軸をX軸,縦軸をY軸としており、パタンメモ
リ204は第4象限に位置しているものとする。XMおよびY
Mはパタンメモリ204の大きさを示しており、本実施例に
おいてはXM=YM=128メッシュとした。PRおよびPBはパ
タンメモリ204に格納されているパタンの外接枠を示す
ものでX=0,X=PR,Y=0,Y=PRの4本の直線により外接
枠は表わされる。第4図において300,301はパタン、直
線Y=y1,X=x1,X=x2は切出し位置を示している。本実
施例におけるパタンメモリは、1メッシュを表わすデー
タが第5図の構成となっている。同図において、(1)
が1のときは下辺から上辺への列走査時に白点であった
ことを意味し、(1)が0のときは該白点以外であった
ことを意味する。また、(2)が1のときは上辺から下
辺への列走査時に白点であったことを意味し、(2)が
0のときは該白以外であったことを意味する。さらに
(3)が1のときは黒点である点を意味し、(3)が0
のときは白点である点を意味する。従って、転送するパ
タンデータは、(3)で示されるデータだけである。X
=0で表わされる直線上のメッシュをY=0の点よりY
座標を1つづつインクリメントすることによりY=PBの
点までパタンデータを転送する。1列転送終了後X座標
をインクリメントする。1列毎に前記転送を繰返し、X
=x1の列の転送を終了した時点で次の列からX=x2の列
まではY座標が0よりYDまでは、パタンデータをマスク
し固定値0を転送する。次のX=x3の列まではY座標が
0よりYD及びY1よりPBまでをマスクし固定値0を転送す
る。X=x3の列まで転送した時点でパタン300の転送は
終了する。パタン301についても同様な方法によりパタ
ンを転送することが可能である。また、外接枠内に1文
字が含まれるデータについては外接枠内のパタンを同様
な方法により転送することが出来る。
を使用して、パタンの転送方法を説明する。また、第4
図は、第1図のブロック図におけるパタンメモリ204に
格納されているパタンおよび切出し位置を示している。
座標は横軸をX軸,縦軸をY軸としており、パタンメモ
リ204は第4象限に位置しているものとする。XMおよびY
Mはパタンメモリ204の大きさを示しており、本実施例に
おいてはXM=YM=128メッシュとした。PRおよびPBはパ
タンメモリ204に格納されているパタンの外接枠を示す
ものでX=0,X=PR,Y=0,Y=PRの4本の直線により外接
枠は表わされる。第4図において300,301はパタン、直
線Y=y1,X=x1,X=x2は切出し位置を示している。本実
施例におけるパタンメモリは、1メッシュを表わすデー
タが第5図の構成となっている。同図において、(1)
が1のときは下辺から上辺への列走査時に白点であった
ことを意味し、(1)が0のときは該白点以外であった
ことを意味する。また、(2)が1のときは上辺から下
辺への列走査時に白点であったことを意味し、(2)が
0のときは該白以外であったことを意味する。さらに
(3)が1のときは黒点である点を意味し、(3)が0
のときは白点である点を意味する。従って、転送するパ
タンデータは、(3)で示されるデータだけである。X
=0で表わされる直線上のメッシュをY=0の点よりY
座標を1つづつインクリメントすることによりY=PBの
点までパタンデータを転送する。1列転送終了後X座標
をインクリメントする。1列毎に前記転送を繰返し、X
=x1の列の転送を終了した時点で次の列からX=x2の列
まではY座標が0よりYDまでは、パタンデータをマスク
し固定値0を転送する。次のX=x3の列まではY座標が
0よりYD及びY1よりPBまでをマスクし固定値0を転送す
る。X=x3の列まで転送した時点でパタン300の転送は
終了する。パタン301についても同様な方法によりパタ
ンを転送することが可能である。また、外接枠内に1文
字が含まれるデータについては外接枠内のパタンを同様
な方法により転送することが出来る。
次に、第6図、第7図及び第8図に示すフローチャート
に基づいて本実施例の処理の流れを詳細に説明する。こ
こで、第6図は全体の流れを示し、第7図及び第8図は
それぞれ上下2回の走査によるパタンの領域の分類、及
び切出し領域の決定の流れ図を示している。先ず、第6
図の全体の流れ図より説明する。S400では、読取動作を
開始する。S401ではラインバッファに格納されたパタン
データを1列読出し、第1図での黒点ヒストグラム作成
回路220にて黒点ヒストグラムを作成しヒストグラムメ
モリ230に格納する。S402においては1行分全ての黒点
ヒストグラムの作成終了を検出し、1行全て作成される
までS401の処理を繰返す。S403においては処理した文字
を管理し、1行中全部の文字の切出しが終了するまで以
下の処理を繰返す。S404では黒点ヒストグラムをヒスト
グラムメモリより読出し、黒点ヒストグラムの始点、及
び終点を検出しブロックとする。また、該ブロックの長
さと閾値γ1,γ2とを比較し何文字で構成されるブロッ
クであるかを保持しておく。S405においては第1図の外
接枠検出回路221においてブロックの外接枠を検出し、
その外接枠内のパタンデータをパタンメモリ204に転送
する。S406においては前記保持されたブロックの長さの
判定結果により、1文字であればパタンメモリ204のパ
タンデータを出力段へ転送し次の文字の処理へ進む。2
文字以上であれば、以下の処理を行う。S407において
は、外接枠の上辺及び下辺からそれぞれ対辺へ列走査を
行いパタンの領域の分類を行い結果をパタンメモリ204
に格納する。S408においては外接枠内の水平走査を行い
前記分類結果をパタンメモリ204より読出し切出し領域
の検出を行って切出し位置を決定する。
に基づいて本実施例の処理の流れを詳細に説明する。こ
こで、第6図は全体の流れを示し、第7図及び第8図は
それぞれ上下2回の走査によるパタンの領域の分類、及
び切出し領域の決定の流れ図を示している。先ず、第6
図の全体の流れ図より説明する。S400では、読取動作を
開始する。S401ではラインバッファに格納されたパタン
データを1列読出し、第1図での黒点ヒストグラム作成
回路220にて黒点ヒストグラムを作成しヒストグラムメ
モリ230に格納する。S402においては1行分全ての黒点
ヒストグラムの作成終了を検出し、1行全て作成される
までS401の処理を繰返す。S403においては処理した文字
を管理し、1行中全部の文字の切出しが終了するまで以
下の処理を繰返す。S404では黒点ヒストグラムをヒスト
グラムメモリより読出し、黒点ヒストグラムの始点、及
び終点を検出しブロックとする。また、該ブロックの長
さと閾値γ1,γ2とを比較し何文字で構成されるブロッ
クであるかを保持しておく。S405においては第1図の外
接枠検出回路221においてブロックの外接枠を検出し、
その外接枠内のパタンデータをパタンメモリ204に転送
する。S406においては前記保持されたブロックの長さの
判定結果により、1文字であればパタンメモリ204のパ
タンデータを出力段へ転送し次の文字の処理へ進む。2
文字以上であれば、以下の処理を行う。S407において
は、外接枠の上辺及び下辺からそれぞれ対辺へ列走査を
行いパタンの領域の分類を行い結果をパタンメモリ204
に格納する。S408においては外接枠内の水平走査を行い
前記分類結果をパタンメモリ204より読出し切出し領域
の検出を行って切出し位置を決定する。
S411では、切出し位置が決定できたかどうか検出し、検
出済みであれば、S409において、パタンメモリ204内の
パタンを切出し位置に従って転送し、パタンメモリ204
内のパタンを全て転送した時点で次の文字の処理を行
う。また、切出し位置が検出出来ない場合には以下の処
理を行う。S412において、ブロックの外接枠について水
平2等分割線を検出し、S413においては該水平2等分割
線で分割される上側の新たな外接枠を求める。S414,S41
5では指定された外接枠についてS407,S408と同一の処理
を行い、S416で上下の外接枠の処理が両方終了したかを
検出し、下側が終了していなければS418にて下側の外接
枠を検出しS414及びS415で下側の切出し領域を検出す
る。分割した上下の外接枠で切出し位置が決定されると
S417において上下の切出し位置より、ブロックの切出し
位置の合成を行い、S409でパタンメモリ204内のパタン
を転送する。パタンメモリ204内のパタンを全て転送し
た時点で次の文字の処理を行う。
出済みであれば、S409において、パタンメモリ204内の
パタンを切出し位置に従って転送し、パタンメモリ204
内のパタンを全て転送した時点で次の文字の処理を行
う。また、切出し位置が検出出来ない場合には以下の処
理を行う。S412において、ブロックの外接枠について水
平2等分割線を検出し、S413においては該水平2等分割
線で分割される上側の新たな外接枠を求める。S414,S41
5では指定された外接枠についてS407,S408と同一の処理
を行い、S416で上下の外接枠の処理が両方終了したかを
検出し、下側が終了していなければS418にて下側の外接
枠を検出しS414及びS415で下側の切出し領域を検出す
る。分割した上下の外接枠で切出し位置が決定されると
S417において上下の切出し位置より、ブロックの切出し
位置の合成を行い、S409でパタンメモリ204内のパタン
を転送する。パタンメモリ204内のパタンを全て転送し
た時点で次の文字の処理を行う。
次に、第6図におけるS407及びS408の処理について第7
図及び第8図に詳細なフローチャートを示し、その動作
を順に説明する。
図及び第8図に詳細なフローチャートを示し、その動作
を順に説明する。
第7図は、文字パタン領域の分類と、白点から黒点への
変化点検出の流れを示している。S500で、文字パタンデ
ータが入力されると、S501〜S503では初期化であ、パタ
ンメモリ204のx,yの座標を文字外接枠の上辺左端に設定
し、走査の方向を示す値U/Dを上辺より下辺に向って走
査するので2とする。S504においては、パタンメモリの
内容を調べPM(x,y)=1(黒点)であれば処理をS514
へ移し、PM(x,y≠1(白色)であるときは、S505でパ
タンメモリ204の内容をPM(x,y)=(PM(x,y).OR.U/
D)とする。S506においてはスキャンの方向によりyカ
ウンタの値をインクリメントあるいはデクリメントす
る。S507では1例の終了を検出し、1例終了が検出され
るとS508以下の処理を行い、1例終了が検出されるとS5
08以下の処理を行い、1例終了でなければS504に戻り上
記処理を繰返す。S507で1列終了が検出されるとS508で
は1列終了フラグであるEに1をたてる。S509では当該
列が1列終了を始めて検出した例であるこを示すフラグ
Cにより始めての列であればS510で当該列のXカウンタ
205の値をxSに格納し、前列も1列終了を検出した列で
あるときはS511へ進む。S511においてはフラグCは当該
列が1列終了を検出しているので1をセットし、S512に
進み次の列の処理を行う。S514では、1列終了検出フラ
グCを判定し0であればS516へ進み、フラグCが1であ
れば、1/2(xS+x−1)を切出し点としてxPに登録す
る。検出されたxPは全て登録し、第6図でS417の切出し
位置の合成を行うときに切出し位置として用いる。S516
においてはフラグCをリセットしてS512に進み次列の処
理を行う。
変化点検出の流れを示している。S500で、文字パタンデ
ータが入力されると、S501〜S503では初期化であ、パタ
ンメモリ204のx,yの座標を文字外接枠の上辺左端に設定
し、走査の方向を示す値U/Dを上辺より下辺に向って走
査するので2とする。S504においては、パタンメモリの
内容を調べPM(x,y)=1(黒点)であれば処理をS514
へ移し、PM(x,y≠1(白色)であるときは、S505でパ
タンメモリ204の内容をPM(x,y)=(PM(x,y).OR.U/
D)とする。S506においてはスキャンの方向によりyカ
ウンタの値をインクリメントあるいはデクリメントす
る。S507では1例の終了を検出し、1例終了が検出され
るとS508以下の処理を行い、1例終了が検出されるとS5
08以下の処理を行い、1例終了でなければS504に戻り上
記処理を繰返す。S507で1列終了が検出されるとS508で
は1列終了フラグであるEに1をたてる。S509では当該
列が1列終了を始めて検出した例であるこを示すフラグ
Cにより始めての列であればS510で当該列のXカウンタ
205の値をxSに格納し、前列も1列終了を検出した列で
あるときはS511へ進む。S511においてはフラグCは当該
列が1列終了を検出しているので1をセットし、S512に
進み次の列の処理を行う。S514では、1列終了検出フラ
グCを判定し0であればS516へ進み、フラグCが1であ
れば、1/2(xS+x−1)を切出し点としてxPに登録す
る。検出されたxPは全て登録し、第6図でS417の切出し
位置の合成を行うときに切出し位置として用いる。S516
においてはフラグCをリセットしてS512に進み次列の処
理を行う。
S517においてxカウンタ205が外接枠の右端であること
が検出されるとS518にて1列終了フラグEにより検出済
であれば次の処理を打切りS521で文字線検出によるパタ
ンの領域の分類処理は終了する。フラグEが1列終了を
未検出であればS519においてU/D=2であればS520でU/D
を4にセットし、xカウンタ205,yカウンタ206を初期化
してS504に戻り処理を行う。U/D=4のときはS521に進
み処理を終了する。
が検出されるとS518にて1列終了フラグEにより検出済
であれば次の処理を打切りS521で文字線検出によるパタ
ンの領域の分類処理は終了する。フラグEが1列終了を
未検出であればS519においてU/D=2であればS520でU/D
を4にセットし、xカウンタ205,yカウンタ206を初期化
してS504に戻り処理を行う。U/D=4のときはS521に進
み処理を終了する。
第8図はパタン領域の変化点検出と切出し領域の決定に
ついても流れを示すものであ、パタンメモリ204の文字
外接枠内の水平走査を上辺左端より行い切出し領域の決
定をする。S600,S601ではそれぞれyカウンタ206,xカウ
ンタ205を初期化する。S602では行走査中の領域の変化
を保持するための状態レジスタ(ST1〜ST3)409〜407の
初期化を行う。現在位置の状態を示すものはST3であ
り、走査中現在の領域の前の領域を示すものはST2であ
り、ST2前の領域を示すものはST1である。S603では、パ
タンメモリ204の内容PM(x,y)がST3と比較し一致して
いればS605に進み、一致していなければ該座標は変化点
であるので、S604でST2,ST3の内容をそれぞれST1,ST2へ
シフトする。S605においてはPM(x,y)の内容をST3にシ
フトする。S606では状態レジスタST3が“2"あるいは
“4"であるか判定し、“2"あるいは“4"のときは、xカ
ウンタ205の内容を(x REGI)308に格納する。S608では
状態レジスタST1,ST2,ST3の状態の組合せを判定し、S61
6に示す組合せと一致する場合にはS611〜S613により、x
1により(x REGI)306を、x2にxカウンタ205の内容
を、y1にYカウンタ206の内容を格納する。S614,S615に
おいてyカウンタ206をインクリメントし、文字外接枠
の下辺と一致するまでS601に戻同様の処理を行う。ただ
し、S608で組合せがS616の後半の2項である場合には、
S611では、x1にx REGIの内容から−1を加えたものを格
納する。
ついても流れを示すものであ、パタンメモリ204の文字
外接枠内の水平走査を上辺左端より行い切出し領域の決
定をする。S600,S601ではそれぞれyカウンタ206,xカウ
ンタ205を初期化する。S602では行走査中の領域の変化
を保持するための状態レジスタ(ST1〜ST3)409〜407の
初期化を行う。現在位置の状態を示すものはST3であ
り、走査中現在の領域の前の領域を示すものはST2であ
り、ST2前の領域を示すものはST1である。S603では、パ
タンメモリ204の内容PM(x,y)がST3と比較し一致して
いればS605に進み、一致していなければ該座標は変化点
であるので、S604でST2,ST3の内容をそれぞれST1,ST2へ
シフトする。S605においてはPM(x,y)の内容をST3にシ
フトする。S606では状態レジスタST3が“2"あるいは
“4"であるか判定し、“2"あるいは“4"のときは、xカ
ウンタ205の内容を(x REGI)308に格納する。S608では
状態レジスタST1,ST2,ST3の状態の組合せを判定し、S61
6に示す組合せと一致する場合にはS611〜S613により、x
1により(x REGI)306を、x2にxカウンタ205の内容
を、y1にYカウンタ206の内容を格納する。S614,S615に
おいてyカウンタ206をインクリメントし、文字外接枠
の下辺と一致するまでS601に戻同様の処理を行う。ただ
し、S608で組合せがS616の後半の2項である場合には、
S611では、x1にx REGIの内容から−1を加えたものを格
納する。
S608において、状態レジスタST1〜ST3がS616に示す組合
せと一致しない場合は、S609,S610において、xカウン
タ205をインクリメントし、文字外接枠の右辺と一致す
るまでS603に戻前記処理を繰返す。S615でyカウンタ20
6の値が文字外接枠の下辺と一致した場合は、x1,x2,y1
の値を切出し点とする。
せと一致しない場合は、S609,S610において、xカウン
タ205をインクリメントし、文字外接枠の右辺と一致す
るまでS603に戻前記処理を繰返す。S615でyカウンタ20
6の値が文字外接枠の下辺と一致した場合は、x1,x2,y1
の値を切出し点とする。
以上説明したように、本実施例によれば、前後の文字パ
タンが当該文字パタンに重なった場合でも、当該文字パ
タンが欠落したり、前後の文字パタンの一部が混入する
ことなく文字パタンの切出しを行うことが出来る。
タンが当該文字パタンに重なった場合でも、当該文字パ
タンが欠落したり、前後の文字パタンの一部が混入する
ことなく文字パタンの切出しを行うことが出来る。
さらに、本実施例においては、2文字が重な合った場合
を示したが、3文字以上重な合った場合においても、重
な合った文字の先頭より2文字を基準に順次切出し点を
決定することにより同様な効果を得ることが出来る。
を示したが、3文字以上重な合った場合においても、重
な合った文字の先頭より2文字を基準に順次切出し点を
決定することにより同様な効果を得ることが出来る。
(発明の効果) 以上説明したように、本発明によれば、文字パタンの外
接枠の上下の辺から各々対辺に向って列走査を行うこと
より背景部分を走査方向別の領域に分類し、その分類結
果により外接枠内の水平走査を行って切出し領域を検出
し、切出し位置を決定するので、精度の高い文字切出し
を行うことができる。また、パタンの外接枠内を走査し
て、変化点の検出を行うことにより実現しているので簡
単な回路構成で実施することが可能である。さらに、本
発明を用いることにより、隣接した文字が重な合った場
合でも切出しが可能であるので、文字記入枠の間隔を小
さくすることができ一行当りの読取可能文字数を増やす
ことができる。従って、多くの種類の帳票に対応でき、
帳票設計の自由度が大きく、従って性能のよいOCRが実
現出来るという効果がある。
接枠の上下の辺から各々対辺に向って列走査を行うこと
より背景部分を走査方向別の領域に分類し、その分類結
果により外接枠内の水平走査を行って切出し領域を検出
し、切出し位置を決定するので、精度の高い文字切出し
を行うことができる。また、パタンの外接枠内を走査し
て、変化点の検出を行うことにより実現しているので簡
単な回路構成で実施することが可能である。さらに、本
発明を用いることにより、隣接した文字が重な合った場
合でも切出しが可能であるので、文字記入枠の間隔を小
さくすることができ一行当りの読取可能文字数を増やす
ことができる。従って、多くの種類の帳票に対応でき、
帳票設計の自由度が大きく、従って性能のよいOCRが実
現出来るという効果がある。
第1図は本発明の一実施例を示すブロック図、第2図は
第1図のパタン領域変化点検出回路の内部構成を示すブ
ロック図、第3図は第1図の切出し領域検出回路の内部
構成を示すブロック図、第4図は第1図の実施例の切出
し位置が決定したパタン図、第5図はパタンメモリの一
メッシュ分のデータの構成図、第6図乃至第8図は第1
図の実施例の文字切出し処理を示すフローチャート、第
9図は従来の方式の具体例の説明図である。 200…画像信号、201…ラインバッファ、202…外接枠作
成回路、203…切替回路、204…パタンメモリ、205…x
アドレスカウンタ(xカウンタ)、206…yアドレスカ
ウンタ(yカウンタ)、207…制御回路、208…パタン領
域分類回路、209…文字線検出回路、210…パタン領域変
換点検出回路、211…切出し領域検出回路、300…yカウ
ンタの出力、301…xカウンタの出力、302…文字パタン
データ、303…レジスタ(REGA)、304…レジスタ(REG
D)、305…コンパレータ、306…レジスタ(xREG I)、3
07…レジスタ(xREG II)、308…レジスタ(yREG I)、
400…制御信号、401…文字パタンデータ、402…変化点
検出信号、403〜406…遷移レジスタ、407〜409…状態レ
ジスタ、410〜413…コンパレータ、414…論理和回路、4
15…フリップフロップ(F/F)。
第1図のパタン領域変化点検出回路の内部構成を示すブ
ロック図、第3図は第1図の切出し領域検出回路の内部
構成を示すブロック図、第4図は第1図の実施例の切出
し位置が決定したパタン図、第5図はパタンメモリの一
メッシュ分のデータの構成図、第6図乃至第8図は第1
図の実施例の文字切出し処理を示すフローチャート、第
9図は従来の方式の具体例の説明図である。 200…画像信号、201…ラインバッファ、202…外接枠作
成回路、203…切替回路、204…パタンメモリ、205…x
アドレスカウンタ(xカウンタ)、206…yアドレスカ
ウンタ(yカウンタ)、207…制御回路、208…パタン領
域分類回路、209…文字線検出回路、210…パタン領域変
換点検出回路、211…切出し領域検出回路、300…yカウ
ンタの出力、301…xカウンタの出力、302…文字パタン
データ、303…レジスタ(REGA)、304…レジスタ(REG
D)、305…コンパレータ、306…レジスタ(xREG I)、3
07…レジスタ(xREG II)、308…レジスタ(yREG I)、
400…制御信号、401…文字パタンデータ、402…変化点
検出信号、403〜406…遷移レジスタ、407〜409…状態レ
ジスタ、410〜413…コンパレータ、414…論理和回路、4
15…フリップフロップ(F/F)。
Claims (1)
- 【請求項1】帳票上に記入された文字列を光電変換して
得られる量子化された文字パタン列から1文字毎の文字
パタンを分離して抽出する文字切出し装置において、 前記文字パタン列を格納するラインバッファメモリと、 該ラインバッファメモリを文字パタン列の列方向に1列
毎に走査して列方向の黒点ヒストグラムを作成し、第1
の閾値より大きい黒点ヒストグラムが連続して第2の閾
値以上続く黒点ヒストグラムの幅に基づき切出し対象の
ブロックを検出するブロック検出手段と、 前記ブロック検出手段で得られたブロックの幅と第3の
閾値とを比較して該幅が何文字に相当するかを判定する
判定手段と、 前記ブロック検出手段で検出されたブロックの文字パタ
ン列を行方向に各行毎に走査して作成した行方向の黒点
ヒストグラムと前記列方向の黒点ヒストグラムに基づい
て文字外接枠を検出する外接枠検出手段と、 前記外接枠検出手段で得られた文字外接枠内の文字パタ
ン列を記憶する記憶手段と、 前記判定手段が複数文字であると判定した場合には前記
文字外接枠の上辺,下辺から各々反対側の辺に向かって
走査して前記記憶手段から文字パタン列の内容を読出
し、該内容が文字領域であるか背景領域であるかを検出
し、この検出処理により上辺からの走査で検出された背
景領域,下辺からの走査で検出された背景領域,文字領
域,並びに該走査で文字領域が検出されると、該列の走
査を打ち切り、当該走査を打ち切ったことにより該走査
を受けなかった背景領域の各領域に前記文字外接枠内の
文字パタン列を分類する分類手段と、 前記分類手段による文字外接枠内の分類結果について、
水平走査を行って分類が変化する変化点を検出して順次
格納すると共に該変化点の前後の状態を保持し、該状態
の遷移を所定の分類の変化の遷移の組合せと比較して一
致する変化点を検出する変化点検出手段と、 前記変化点検出手段で一致する変化点が検出されない場
合には、前記文字外接枠を水平方向に分割する分割手段
と、 前記分割手段で分割された各分割領域を新たな文字外接
枠として前記分類手段及び変化点検出手段により各分割
領域毎に検出された変化点に基づいて文字切出し位置を
決定する決定手段とを有することを特徴とする文字切出
し装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60263376A JPH0795331B2 (ja) | 1985-11-22 | 1985-11-22 | 文字切出し装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60263376A JPH0795331B2 (ja) | 1985-11-22 | 1985-11-22 | 文字切出し装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS62123582A JPS62123582A (ja) | 1987-06-04 |
| JPH0795331B2 true JPH0795331B2 (ja) | 1995-10-11 |
Family
ID=17388626
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP60263376A Expired - Lifetime JPH0795331B2 (ja) | 1985-11-22 | 1985-11-22 | 文字切出し装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0795331B2 (ja) |
-
1985
- 1985-11-22 JP JP60263376A patent/JPH0795331B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JPS62123582A (ja) | 1987-06-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5907631A (en) | Document image processing method and system having function of determining body text region reading order | |
| JP3308032B2 (ja) | スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置 | |
| US8059868B2 (en) | License plate recognition apparatus, license plate recognition method, and computer-readable storage medium | |
| JPS6159568A (ja) | 文書処理装置 | |
| US5164996A (en) | Optical character recognition by detecting geo features | |
| JP4275866B2 (ja) | カラー画像から文字列パターンを抽出する装置および方法 | |
| JPH0256708B2 (ja) | ||
| JPH0256707B2 (ja) | ||
| JP2926066B2 (ja) | 表認識装置 | |
| CN113408532A (zh) | 一种基于多特征提取的药品标签数字识别方法 | |
| JPH06208625A (ja) | 画像処理方法及び装置 | |
| JPH0795331B2 (ja) | 文字切出し装置 | |
| JPH0581474A (ja) | 文字列抽出方法および文字領域検出方法 | |
| JP2832928B2 (ja) | 文字認識方法 | |
| JPH0433074B2 (ja) | ||
| JP2954218B2 (ja) | 画像処理方法及び装置 | |
| JPS62121589A (ja) | 文字切出し方法 | |
| JPS61196381A (ja) | 文字切出し方式 | |
| JP2522511B2 (ja) | 画像輪郭追跡ユニット | |
| JPH03126188A (ja) | 文字認識装置 | |
| JPS63131287A (ja) | 文字認識方式 | |
| JP3277977B2 (ja) | 文字認識方法 | |
| JPH03177985A (ja) | 文字データの登録方法 | |
| JP2002251613A (ja) | 図形認識方法及び装置 | |
| JP2979089B2 (ja) | 情景画像中の文字認識方式 |