JPH07120390B2 - 文字切出し方法 - Google Patents

文字切出し方法

Info

Publication number
JPH07120390B2
JPH07120390B2 JP60261488A JP26148885A JPH07120390B2 JP H07120390 B2 JPH07120390 B2 JP H07120390B2 JP 60261488 A JP60261488 A JP 60261488A JP 26148885 A JP26148885 A JP 26148885A JP H07120390 B2 JPH07120390 B2 JP H07120390B2
Authority
JP
Japan
Prior art keywords
character
histogram
black dot
pattern
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60261488A
Other languages
English (en)
Other versions
JPS62121589A (ja
Inventor
茂 後藤
義征 山下
真二 成田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP60261488A priority Critical patent/JPH07120390B2/ja
Publication of JPS62121589A publication Critical patent/JPS62121589A/ja
Publication of JPH07120390B2 publication Critical patent/JPH07120390B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は、文字切出し方法に関し、更に詳細には帳票
に記入された文字を読取り、読取つた文字に基づく文字
パタン列を1文字領域毎に分離して抽出する文字切出し
方法に関する。
(従来の技術) 光学式文字認識装置(以下、OCRと略す)においては帳
票に記入された文字を行毎に走査し、光信号を光電変換
器により画像信号に変換し、ラインバツフアに格納す
る。そのラインバツフアを順次読み出し文字パタン列を
1文字領域毎に分離し、その分離された文字パタンによ
り認識を行つているので、文字パタン列の中から1文字
領域を抽出する文字切出し法はOCRの性能に大きく影響
する。
OCRにおいて、文字列が格納されているラインバツフア
の上端から下端に向つて1列走査し、この走査と直角な
方向に順次列を移動することにより、ラインバツフアの
文字パタンの読出しを行う。また1列の走査中に黒点
(文字部分を黒点,背景部分を白点)を計数することに
よりヒストグラムを作成し、その黒点ヒストグラムを参
照して、1文字の領域を決定する。
しかしながら手書文字の場合において記入者が文字を傾
斜して記入しているため、あるいは文字記入枠からはみ
出して記入したため、もしくは記入者が文字の一部をは
ねたため等の理由により、隣接する文字が重なつて、2
文字以上の文字パタンが1文字として切出されるという
問題がある。
この問題点を解決するために本出願人が先に提案した特
願昭60-36573号(特開昭61-196381号公報)ではヒスト
グラム作成手段により文字パタン列に対して黒点ヒスト
グラムを作成し、所定の閾値により黒点ヒストグラムの
始点から終点までの幅を検出手段で検出する。この黒点
ヒストグラムの幅より何文字分に相当するか判定し、2
文字以上の場合は、その文字パタン列の文字外接枠を検
出し、該文字外接枠について、水平方向に予め指定され
た分割数の領域に分割し、各領域内で前記検出された文
字外接枠内で前記ヒストグラム作成手段及び検出手段に
より、再度始点及び終点を検出して前記分割数の領域毎
に各文字パタンの切出し位置を決定していた。
第6図は、以上説明した従来の文字切出し方式のパタン
例を示したものである。100はパタン101,102の外接枠、
103は外接枠100の水平2等分割線(以下C軸とする)、
104,105はC軸に投影した上側の領域のパタンの黒点ヒ
ストグラムのブロツクを示している。108は外接枠100の
底辺を示している(以下E軸とする)。106,107はE軸1
08上に投影された、C軸とE軸の間のパタンの黒点ヒス
トグラムのブロツクを示している。109,110はブロツク1
04,105および106,107の中点を示している。外接枠100の
水平2等分割線(C軸)103によつて外接枠を2つの領
域に分割し、それぞれの領域で垂直方向の黒点ヒストグ
ラムを作成し、黒点ヒストグラムが連続するブロツク10
4〜105,106〜107を検出しそれぞれの領域でブロツク間
の中点109,110を切出し点とし、第6図に示すごとき、A
-A′を切出し位置としていた。
(発明が解決しようとする問題点) しかしながら上記従来の文字切出し方式では、外接枠の
水平分割領域において黒点ヒストグラムのブロツクが1
つしか検出できない領域が1つ以上あると1文字を正し
く切出すことは出来なかつた。
ここで、帳票記入者の習慣、くせ等により文字が記入枠
より大きくはみ出したり、はねてしまうために、文字の
一部が隣接する文字に大きく入り込んだりした例とし
て、より複雑に重つた場合を第7図(a)(b)に示
す。同図(a)はパタン201,202を含む文字外接枠200内
の領域をC軸203で2等分割した場合を示し、同図
(b)は同じ文字外接枠200内の領域をC1軸203及びC2
204で3等分割した場合を示す。いずれの場合もE軸210
に投影されたパタンの黒点ヒストグラムはブロツク209
が1つしか検出されず、従つて正しい切出し位置を検出
することが出来ないというような問題点があつた。さら
に文字外接枠の水平分割数を増加させると処理時間も増
大するという問題があつた。
本発明は、これらの問題点を解決するためのもので、簡
単な構成で精度の良い文字切出し方法を提供することを
目的とする。
(問題点を解決するための手段) 本発明は前記問題点を解決するために、帳票上の記入さ
れた文字列を光電変換して得られる量子化された文字パ
タン列をラインバッファメモリに格納し、該文字パタン
列から1文字毎の文字パタンを分離抽出する文字切出し
方法において、前記ラインバッファメモリを文字パタン
列の列方向に1列毎に走査して列方向の黒点ヒストグラ
ムを作成し、第1の閾値より大きい黒点ヒストグラムが
連続して第2の閾値以上続く水平ブロックのブロック幅
と第3の閾値とを比較して該幅が何文字分に相当するか
を判定する判定ステップと、前記水平方向ブロックのブ
ロック幅に対応する文字パタン列を行方向に1行毎に走
査して行方向の黒点ヒストグラムを作成し、前記第1の
閾値より大きな黒点ヒストグラムが連続して前記第2の
閾値以上続く垂直ブロックの始点及び終点の座標、及び
前記水平方向ブロックの始点及び終点座標とに基づいて
文字外接枠を検出する外接枠検出ステップと、検出され
た文字外接枠内の文字パタン列を保持するパタン記憶ス
テップと、前記文字外接枠内を水平方向に分割した分割
領域毎に1列毎走査した列方向の黒点ヒストグラムを作
成する黒点ヒストグラム作成ステップと、作成した黒点
ヒストグラムを分割領域毎に記憶するヒストグラム記憶
ステップと、記憶した黒点ヒストグラムを用いて、所望
の分割領域における黒点ヒストグラムの連続する部分で
ある水平ブロックを検出し、隣接する水平ブロックの水
平方向の中心点の座標に基づき当該分割領域の切出し点
を決定する決定ステップと、切出し点が決定できない分
割領域に対し、該分割領域を水平方向に再分割し、前記
パタン記憶ステップ、前記黒点ヒストグラム作成ステッ
プ、前記ヒストグラム記憶ステップ及び前記決定ステッ
プを施して再分割領域のブロックを検出する再分割処理
を行う再分割処理ステップと、全ての領域の切出し点が
決定できるまで前記再分割処理ステップを繰返し、決定
した各分割領域の切出し点及び水平方向の分割線に基づ
いて文字切出し位置を決定するものである。
(作用) 本発明によれば以上のように文字切出し方法を構成した
ので、技術的手段は次のように作用する。
判定ステップは、ラインバッファメモリを文字パタン列
の列方向に1列毎に走査して列方向の黒点ヒストグラム
を作成し、第1の閾値より大きい黒点ヒストグラムが連
続して第2の閾値以上続く水平ブロックのブロック幅と
第3の閾値とを比較して該幅が何文字分に相当するかを
判定する。次に、外接枠検出ステップは水平方向ブロッ
クのブロック幅に対応する文字パタン列を行方向に1行
毎に走査して行方向の黒点ヒストグラムを作成し、第1
の閾値より大きな黒点ヒストグラムが連続して第2の閾
値以上続く垂直ブロックの始点及び終点の座標、及び水
平方向ブロックの始点及び終点座標とに基づいて文字外
接枠を検出する。パタン記憶ステップは検出された文字
外接枠内の文字パタン列を保持する。黒点ヒストグラム
作成ステップは文字外接枠内を水平方向に分割した分割
領域毎に1列毎走査した列方向の黒点ヒストグラムを作
成する。ヒストグラム記憶ステップは作成した黒点ヒス
トグラムを分割領域毎に記憶する。決定ステップは記憶
した黒点ヒストグラムを用いて、所望の分割領域におけ
る黒点ヒストグラムの連続する部分である水平ブロック
を検出し、隣接する水平ブロックの水平方向の中心点の
座標に基づき当該分割領域の切出し点を決定する。そし
て、再分割処理ステップは切出し点が決定できない分割
領域に対し、該分割領域を水平方向に再分割し、パタン
記憶ステップ、黒点ヒストグラム作成ステップ、ヒスト
グラム記憶ステップ及び決定ステップを施して再分割領
域のブロックを検出する再分割処理を行うが、全ての領
域の切出し点が決定できるまでこの再分割処理ステップ
を繰返す。最終的に決定した分割領域の切出し点及び水
平方向の分割線に基づいて文字切出し位置を決定する。
従つて、隣接する文字間で文字の一部が深く入り込んだ
ような場合にも精度よく文字の切出しを行なうことがで
きる。
(実施例) 本発明の実施例を第1図乃至第5図に基づいて説明す
る。第1図はこの発明の一実施例を示すブロツク図であ
る。同図において300は図示されていない光電変換部よ
りの画像信号、301はラインバツフア、302はパタンバツ
フア、303はパタンバツフアのX方向のアドレスカウン
タ、同じく304はY方向のアドレスカウンタ、305は、ラ
インバツフア301の出力とパタンバツフア302の出力を切
換える切換回路、306は、ラインバツフア301あるいはパ
タンバツフア302の黒点ヒストグラム作成回路、307はラ
インバツフア301の黒点ヒストグラムを格納する1行ヒ
ストグラムメモリ、308はパタンバツフア302の黒点ヒス
トグラムを格納するパタンヒストグラムメモリ、309
は、1行ヒストグラムメモリ307とパタンヒストグラム
メモリ308を切換える切換回路、310は黒点ヒストグラム
演算回路、311は黒点ヒストグラムのブロツク,及び文
字外接枠を検出するブロツク検出回路、312は制御回路
である。また、同図において一重の矢印はデータの流れ
を示し、二重の矢印は制御回路312の制御信号を示す。
以下に、第1図のブロツク図を用いて本実施例の動作に
ついて説明を行う。
帳票上の文字列は光電変換器により2値化された画像信
号300に変換され、ラインバツフア301に格納される。制
御回路312の制御により以下の処理が行われる。制御回
路312はラインバツフア301に格納されている画像信号を
ラインバツフア301の先頭位置より1列単位に読出し、
順次列を更進し、1行分の文字パタンデータを全て読出
した時点で終了する。また、制御回路312では、切換回
路305をラインバツフア301に切換えて、ラインバツフア
301より1列単位にパタンデータを読出すと同時に黒点
ヒストグラム作成回路306を起動する。黒点ヒストグラ
ム作成回路306では、1列の読出し中の黒点数を計数す
ることにより当該列の黒点ヒストグラムを作成し、1行
ヒストグラムメモリ307に格納する。以上の処理を繰り
返し1行分、全列の黒点ヒストグラムを1行ヒストグラ
ムメモリ307に格納した時点で処理を終了する。1行ヒ
ストグラムメモリ307はラインバツフア301の全列数に相
当する黒点ヒストグラムを格納できる容量をもつてい
る。
1行分の黒点ヒストグラムを作成した後は、1行ヒスト
グラムメモリ307を先頭より読出して、黒点ヒストグラ
ムを参照してブロツクの検出を行う。制御回路312は切
換回路309を1行ヒストグラムメモリ307に切換え、ブロ
ツク検出回路311を起動する。ブロツク検出回路311は1
行ヒストグラムメモリ307より、順次黒点ヒストグラム
を読出し、黒点ヒストグラムと閾値α(α:定数、ただ
し、本実施例においてはα=1とする)を比較し、黒点
ヒストグラムが大きければ文字のブロツクの始点候補と
し、順次黒点ヒストグラムの格納番地を更新し、読出さ
れた黒点ヒストグラムが閾値αより大きい列を計数し、
β(β:定数、ただし、本実施例においてはβ=2とす
る)列連続した場合、前記始点候補を始点とする。さら
に列の更新を続け、始点が検出された後、初めて黒点ヒ
ストグラムが閾値αより小さくなる列を終点とし、始点
から終点までの長さで示される水平ブロックの領域を検
出する。次に、制御回路312は検出された水平ブロック
の長さを読取対象としている文字の平均的な幅より求め
られた閾値γ1(γ1は定数、ただし、本実施
例においてはγ=75,γ=125とする)と比較する。
そして、当該ブロツクの長さWが閾値γより小さいと
きには当該ブロツクを1文字と判定し、γ≦W≦γ
のときは2文字と判定し、さらに、W>γのときは3
文字以上と判定する。また、制御回路312では当該ブロ
ツクの判定の後、該ブロツクについてブロツク検出回路
311で外接枠を検出する。この外接枠の検出は次のよう
に行う。即ち、水平ブロックの始点から終点までに対応
する文字列パタンの部分を行方向に1行毎に走査して行
方向の黒点ヒストグラムを作成し、図示しない一時ヒス
トグラムメモリに記憶する。この行方向の黒点ヒストグ
ラムを順に読み出すことにより前記同様の処理を行い、
所定の条件を満足する黒点ヒストグラムの連続する垂直
ブロックの領域を検出し、このブロックの始点及び終点
とすでに求めている水平ブロックの始点及び終点座標か
ら外接枠の座標を求める。さらに、外接枠の座標が検出
されると、制御回路312はこの外接枠で示される文字パ
タンをラインバッファ301内から読み出しパタンバッフ
ァ302に転送する。ここで、W>γの場合つまり前記
ブロツクを3文字以上と判定した場合、始点からγ
で切出し処理を行つて1文字目と2文字目を分割し、そ
の結果の切出し点を始点としてその始点からγまで切
出し処理を行つてさらに2文字目と3文字目を分割する
ごとき順次切出しを行いWまで処理することとなる。こ
こで、後述する第4図に示すように文字外接枠の上辺左
端を原点とし、下辺位置をPB、右辺位置をPRとする。
次に、上記のような文字の判定により2文字以上と判定
されたものの処理について第1図に基づいて説明する。
制御回路312は切換回路305をパタンバツフア302に切換
え黒点ヒストグラム作成回路306を起動する。黒点ヒス
トグラム作成回路306は、パタンバツフア302に格納され
ている文字パタン列について、その文字外接枠内の垂直
方向の黒点ヒストグラムを作成する。以下にその詳細に
ついて第2図および第3図を用いて説明する。
第2図はパタンバツフア302の垂直方向の黒点ヒストグ
ラムを作成するブロツクである。同図において、308は
第1図と同一のパタンヒストグラムメモリ、400は黒点
ヒストグラム作成回路306の黒点ヒストグラム、401はパ
タンバツフア302のXアドレスカウンタ303の出力を示
す。402は文字外接枠内を水平方向に分割し、その分割
領域の文字外接枠の上側よりアドレスを示す領域アドレ
スカウンタ、403はパタンバツフア302のYアドレスカウ
ンタ304の出力、404は検出回路312より与えられる文字
外接枠の分割情報、405は分割情報404により分割位置を
算出する分割位置指定回路、406はYアドレスカウンタ3
04の出力403と分割位置指定回路405の出力の一致を検出
する分割位置一致検出回路、410はパタンヒストグラム
メモリ308の出力、411は分割位置が一致したことを制御
回路312に知らせる一致信号を示している。412は領域ア
ドレスカウンタ402を制御する制御回路312よりの制御信
号(アドレス)である。
次に第3図は第1図および第2図に示したパタンヒスト
グラムメモリ308の構成を示したものである。501は文字
外接枠検出用エリアであり、502,503は黒点ヒストグラ
ムの演算およびブロツク検出用のエリアである分割領域
用テンポラリ(1),(2)、504〜509は所定の分割領
域の黒点ヒストグラムを格納するエリアを示している。
第1図乃至第2図を用いて文字外接枠内の文字パタン列
について垂直方向の黒点ヒストグラムの作成方法につい
て説明する。制御回路312では文字外接枠が検出される
と、Yアドレス方向の所定の分割位置を算出する。本実
施例においては分割数は6とした。次に制御回路312は
第2図に示す領域アドレスカウンタ402に所定のアドレ
ス(412)をセツトし、分割位置指定回路405に分割位置
情報404をセツトした後、黒点ヒストグラム作成回路306
を起動する。黒点ヒストグラム作成回路306は、Xアド
レスカウンタ303,およびYアドレスカウンタ304を初期
化し、Yアドレスカウンタ304をインクリメントしてパ
タンの黒点の計数を行い、Yアドレスが文字外接枠の下
辺に到達した時点で黒点の計数結果をパタンヒストグラ
ムメモリ308に格納し、Xアドレスカウンタ303をインク
リメントし、Yアドレスカウンタ304はクリヤする。以
上の処理をXアドレスカウンタ303が文字外接枠の右辺
に到達するまで行う。なお、パタンバツフア302の座標
は第4象限に取つている。
次に第1図乃至第3図を用いて文字外接枠の分割領域毎
の黒点ヒストグラムの作成方法を示す。黒点ヒストグラ
ム作成回路306によりYアドレスカウンタ304がインクリ
メントされて分割位置指定回路405で与えられる分割位
置とYアドレスカウンタ304が分割位置一致検出回路406
により一致が検出されると、そのときまでに計数された
黒点数をパタンヒストグラムメモリ308の領域アドレス
カウンタ402とXアドレスカウンタ401で示される位置に
格納する。同時に領域アドレスカウンタ402をインクリ
メントする。なお、領域アドレスカウンタ402はYアド
レスカウンタ304が初期化されるときに同時に初期化す
る。以上の様にして分割領域毎の黒点ヒストグラムが第
3図に示すパタンヒストグラムメモリ308の分割領域
(1)504〜分割領域(6)509に作成され格納される。
分割領域毎の黒点ヒストグラムが作成されると、第1図
において制御回路312は、黒点ヒストグラム演算回路310
を起動して、文字外接枠を中央で分割した場合の上下の
分割領域の黒点ヒストグラムを作成する。作成方法は上
側については第3図に示す分割領域(3)506に格納さ
れている黒点ヒストグラムそのものであり、下側の領域
は、分割領域(6)509の黒点ヒストグラムから分割領
域(3)506の黒点ヒストグラムを差し引いた残りであ
る。すなわち、ある分割領域の黒点ヒストグラムをHnm
(nは1〜6の分割領域の番号、mは0〜PRでPRは文字
外接枠の右端)とし、求める黒点ヒストグラムで上側の
分割領域のものをHum,下側をHLmとすれば、以下の式に
より求める。
Hum=H3m HLm=H6m−H3m 黒点ヒストグラム演算回路で、2分割した領域の黒点ヒ
ストグラムが求まると第3図に示すパタンヒストグラム
メモリ308の分割領域用テンポラリ(1)502および
(2)503に格納する。
次に制御回路312は、切換回路309をパタンヒストグラム
メモリ308に切換え、前記検出し黒点ヒストグラムにつ
いてブロツク検出回路311を起動しブロツクを検出す。
このときの閾値はα=1,β=2とした。ブロツクが検出
されたら隣接するブロツク間の中点を求め切出し点とす
る。該切出し点が1つの分割領域で複数個検出された場
合は、文字外接枠の水平方向の中央位置に最も近いもの
を切出し点とする。上下それぞれの分割領域で切出し点
が決定されたら、それらの切出し点により切出し位置を
決定する。もし各分割領域の一方でも切出し点が決定さ
れない場合には、その決定されなかつた分割領域につい
て、さらに3分割した領域の黒点ヒストグラムを黒点ヒ
ストグラム演算回路310により作成しブロツク検出回路3
11にて、3つの分割領域それぞれで黒点ヒストグラムの
ブロツクを検出して分割領域毎の切出し点を決定する。
分割領域の切出し点が全て検出されたら各切出し点と水
平分割線とにより文字の切出し位置とする。
以下に、第4図に示す切出し位置が決定されたパタン例
を使用して、パタンの切出方法を説明する。また、第4
図は、第1図のブロツク図におけるパタンバツフア302
に格納されているパタンおよび切出し位置を示してい
る。座標は横軸をX軸,縦軸をY軸としており、パタン
バツフア302は第4象限に位置しているものとする。XM
およびYMはパタンバツフア302の大きさを示しており、
本実施例においてはXM=YM=128メツシユとした。PRお
よびPBはパタンバツフア302に格納されているパタンの
外接枠を示すものでX=0,X=PR,Y=0,Y=PRの4本の直
線により表わされる。第4図において600,601はパタ
ン、602で示される折れ線は切出し位置を示している。y
3の分割線により上下の分割領域に分けてそれぞれの領
域の黒点ヒストグラムのブロツク検出を行いそれぞれの
分割領域の切出し点を求めると上側はx1と検出されるが
下側は切出し位置を検出することが出来ない。そこで下
側のy3からPBまでの領域について予め指定されている点
y4,y5で3分割する。次にそれぞれの分割領域について
その領域の黒点ヒストグラムによりブロツク検出を行い
切出し点を決定し、x2およびx3を得る。以上により文字
の切出し線が、折れ線602のように決定される。よつて
文字外接枠と該折れ線602で示される多角形内のパタン6
00,601を次段に転送する。
次に、第5図に示すフローチヤートに基づいて本実施例
の流れを詳細に説明する。第5図においてS700で処理を
開始する。S701でラインバツフア301の読出し位置を先
頭列にセツトし、初期化を行つた後、S702でラインバツ
フア301に格納されたパタンデータを1列読み出し切換
回路305を介し黒点ヒストグラム作成回路306にて黒点ヒ
ストグラムを作成し1行ヒストグラムメモリ307に格納
する。S703においては1行分全ての黒点ヒストグラムの
作成終了を検出し、1行全て作成されるまでS702の処理
を繰り返す。S704においては処理した文字を管理し、1
行中全部の文字の切出しが終了するまで以下の処理を繰
り返す。S705では黒点ヒストグラムを1行ヒストグラム
メモリ307より読出し、黒点ヒストグラムの始点、およ
び終点を検出しブロツクとする。また、該ブロツクの長
さと閾値γ1とを比較し何文字で構成されるブロツ
クであるかを保持しておく。S706においてはブロツク検
出回路311においてブロツクの外接枠を検出し、その外
接枠内のパタンデータをパタンバツフア302に転送す
る。S707においては前記保持されたブロツクの長さの判
定結果により、1文字であればパタンバツフア302のパ
タンデータを出力段へ転送し次の文字の処理へ進む、2
文字以上であれば、以下の処理を行う。S708において文
字外接枠内の文字パタン列に垂直方向の黒点ヒストグラ
ムを指定された分割領域毎に作成し、パタンヒストグラ
ムメモリ308に格納する。S709で文字外接枠の分割位置
を中央に選定し、S710で黒点ヒストグラム演算回路310
で2分割された上下の分割領域の黒点ヒストグラムをそ
れぞれ作成し、パタンヒストグラムメモリ308に格納す
る。S711ではS710で作成された2つの領域の黒点ヒスト
グラムのブロツクを検出し、切出し点を決定する。S712
では各分割領域の切出し点より位置を判定し、S713で全
ての分割領域で決定済であれば、S714で文字の切出し位
置を検出し、S715でパタンを次段へ転送し、次の文字の
処理へ進む。S713において、切出し点が決定されなかつ
た領域がある場合にはS717へ進み、該領域についてさら
に3分割する分割点を決定し、S710へ進み再度分割領域
毎の黒点ヒストグラムを作成し、ブロツク検出して分割
領域の切出し点を決定する。以上の処理により文字の切
出し位置を決定する。
本実施例においては、切出し点が検出できない分割領域
は1回の再生分割で切出し点が検出できたが、切出し点
が検出できない領域について上記切出し点検出処理を繰
返し実施して切出し点を検出することにより、より複雑
に重つた文字を切出すことも可能である。
以上のように、本実施例によれば、前後の文字パタンが
当該文字パタンに重なつた場合でも、当該文字パタンが
欠落したり、前後の文字パタンの一部が混入することな
く文字パタンの切出しを行うことが出来る。
さらに、本実施例においては、2文字が重なり合つた場
合を示したが、3文字以上重なり合つた場合において
も、重なり合つた文字の先頭より2文字を基準に順次切
出し点を決定することにより同様な効果を得ることが出
来る。
(発明の効果) 以上説明したように、本発明によれば、文字外接枠を水
平方向に分割して黒点ヒストグラムを作成し、分割領域
毎に切出し位置を決定しているので当該文字の一部が欠
落したり、他の文字の一部が混入することなく精度の高
い文字切出しを行うことが出来る。分割領域の切出し点
が決定されない分割領域のみについて、切出し点が検出
されるまで繰り返し再分割を行つているので隣接する文
字が複雑に重つている場合でも処理時間が早く精度の良
い切出しを行うことが出来る。分割領域毎の黒点ヒスト
グラムを予め指定された領域数分を1回のパタンバツフ
アの走査により作成しているので処理時間の速い文字切
出しを実現することが可能である。また、単なる黒点の
計数という処理により作成される黒点ヒストグラムを利
用して高精度な文字切出しを実現しているので簡単な回
路構成で実現することが可能である。
さらに、本発明を用いることにより、隣接した文字が重
り合つた場合に切出しが可能であるので文字記入枠の間
隔を小さくすることができ1行当りの読取可能文字数を
増やすことができる。従つて多くの種類の帳票等の記録
媒体に対応でき、帳票設計の自由度が大きく、従つて性
能のよい光学式文字認識装置が実現出来るという効果が
ある。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロツク図、第2図は
第1図の実施例の文字外接枠内の黒点ヒストグラムを作
成するためのブロツク図、第3図はパタンヒストグラム
メモリの構成図、第4図は切出し位置が決定されたパタ
ン例を示す図、第5図は第1図の実施例の文字切出し処
理を示すフローチヤート、第6図は従来の文字切出し方
式によるパタン例を示す図、第7図(a),(b)は従
来の方式で問題となるパタン例を示す図である。 300……画像信号、301……ラインバツフア、302……パ
タンバツフア、303……Xアドレスカウンタ、304……Y
アドレスカウンタ、305,309……切換回路、306……黒点
ヒストグラム作成回路、307……1行ヒストグラムメモ
リ、308……パタンヒストグラムメモリ,310……黒点ヒ
ストグラム演算回路、311……ブロツク検出回路、312…
…制御回路、400……黒点ヒストグラム、401……Xアド
レスカウンタの出力、402……領域アドレスカウンタ、4
03……Yアドレスカウンタの出力、404……分割情報、4
05……分割位置指定回路、410……パタンヒストグラム
メモリの出力、411……一致信号。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】帳票上の記入された文字列を光電変換して
    得られる量子化された文字パタン列をラインバッファメ
    モリに格納し、該文字パタン列から1文字毎の文字パタ
    ンを分離抽出する文字切出し方法において、 前記ラインバッファメモリを文字パタン列の列方向に1
    列毎に走査して列方向の黒点ヒストグラムを作成し、第
    1の閾値より大きい黒点ヒストグラムが連続して第2の
    閾値以上続く水平ブロックのブロック幅と第3の閾値と
    を比較して該幅が何文字分に相当するかを判定する判定
    ステップと、 前記水平方向ブロックのブロック幅に対応する文字パタ
    ン列を行方向に1行毎に走査して行方向の黒点ヒストグ
    ラムを作成し、前記第1の閾値より大きな黒点ヒストグ
    ラムが連続して前記第2の閾値以上続く垂直ブロックの
    始点及び終点の座標、及び前記水平方向ブロックの始点
    及び終点座標とに基づいて文字外接枠を検出する外接枠
    検出ステップと、 検出された文字外接枠内の文字パタン列を保持するパタ
    ン記憶ステップと、 前記文字外接枠内を水平方向に分割した分割領域毎に1
    列毎走査した列方向の黒点ヒストグラムを作成する黒点
    ヒストグラム作成ステップと、 作成した黒点ヒストグラムを分割領域毎に記憶するヒス
    トグラム記憶ステップと、 記憶した黒点ヒストグラムを用いて、所望の分割領域に
    おける黒点ヒストグラムの連続する部分である水平ブロ
    ックを検出し、隣接する水平ブロックの水平方向の中心
    点の座標に基づき当該分割領域の切出し点を決定する決
    定ステップと、 切出し点が決定できない分割領域に対し、該分割領域を
    水平方向に再分割し、前記パタン記憶ステップ、前記黒
    点ヒストグラム作成ステップ、前記ヒストグラム記憶ス
    テップ及び前記決定ステップを施して再分割領域のブロ
    ックを検出する再分割処理を行う再分割処理ステップ
    と、 全ての領域の切出し点が決定できるまで前記再分割処理
    ステップを繰返し、決定した各分割領域の切出し点及び
    水平方向の分割線に基づいて文字切出し位置を決定する
    ことを特徴とする文字切り出し方法。
JP60261488A 1985-11-22 1985-11-22 文字切出し方法 Expired - Lifetime JPH07120390B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60261488A JPH07120390B2 (ja) 1985-11-22 1985-11-22 文字切出し方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60261488A JPH07120390B2 (ja) 1985-11-22 1985-11-22 文字切出し方法

Publications (2)

Publication Number Publication Date
JPS62121589A JPS62121589A (ja) 1987-06-02
JPH07120390B2 true JPH07120390B2 (ja) 1995-12-20

Family

ID=17362603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60261488A Expired - Lifetime JPH07120390B2 (ja) 1985-11-22 1985-11-22 文字切出し方法

Country Status (1)

Country Link
JP (1) JPH07120390B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63313287A (ja) * 1987-06-16 1988-12-21 Fujitsu Ltd 食い込み文字切り出し方式
JPH07107648B2 (ja) * 1987-09-09 1995-11-15 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 物体間衝突検出装置
JPH01124082A (ja) * 1987-11-10 1989-05-16 Matsushita Electric Ind Co Ltd 文字認識装置
JP2722549B2 (ja) * 1988-11-09 1998-03-04 日本電気株式会社 光学文字読取装置
JP2722550B2 (ja) * 1988-11-09 1998-03-04 日本電気株式会社 光学文字読取装置

Also Published As

Publication number Publication date
JPS62121589A (ja) 1987-06-02

Similar Documents

Publication Publication Date Title
US5048107A (en) Table region identification method
EP0843275B1 (en) Pattern extraction apparatus and method for extracting patterns
US4757551A (en) Character recognition method and system capable of recognizing slant characters
JPH07120390B2 (ja) 文字切出し方法
JP2926066B2 (ja) 表認識装置
JP2868134B2 (ja) 画像処理方法及び装置
JPH0656618B2 (ja) 画像情報の文字・図形分離方法
JP2644477B2 (ja) 画像処理方法
JPS61196381A (ja) 文字切出し方式
JP2003317107A (ja) 罫線抽出方法及び装置
US5313529A (en) System for representing line drawings by polygonal lines
JPS62126485A (ja) 文字切出し方式
JP2505402B2 (ja) 画像処理装置
JP3196755B2 (ja) 文字の傾き検出補正方法ならびに装置
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
JPH0750496B2 (ja) 画信号処理装置
EP0974931A1 (en) Method and apparatus for identifying a plurality of sub-images in an input image
JP2954218B2 (ja) 画像処理方法及び装置
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JP2827288B2 (ja) 文字認識装置
JP2975720B2 (ja) 光学的文字読取装置
JPH0433074B2 (ja)
JPH03268181A (ja) 文書読み取り装置
JPS6343788B2 (ja)
JP2626084B2 (ja) 文字認識装置