JPH083833B2 - 文字分離方法 - Google Patents
文字分離方法Info
- Publication number
- JPH083833B2 JPH083833B2 JP62195893A JP19589387A JPH083833B2 JP H083833 B2 JPH083833 B2 JP H083833B2 JP 62195893 A JP62195893 A JP 62195893A JP 19589387 A JP19589387 A JP 19589387A JP H083833 B2 JPH083833 B2 JP H083833B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- area
- white line
- line segment
- divided
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Input (AREA)
Description
【発明の詳細な説明】 [概要] 本発明は、オーバーハングまたは軽微接触している文
字を切り出し推定範囲内で分離する文字分離方法に関
し、 オーバーハングまたは軽微接触している文字を適切に
分離する文字分離方法を提供することを目的とし、 画像メモリに格納された文字列情報を読出し、該文字
列情報を、一文字毎に分離する文字分離方法であって、 読出された文字列情報の高さに基づいて文字の切出し
推定範囲を定め、 該推定範囲を、文字の高さ方向に複数の領域に分割
し、 各分割領域毎に、高さ方向に連続する白線分の存在の
有無を判定し、 分割領域内に連続する白線分が存在しない場合は、該
分割領域に対して領域分割及び白線分の有無の判定を繰
り返し行ない、 各分割領域毎に連続する白線分が存在する場合は、各
分割領域毎の白線分を接続して得られた線分を、文字の
分離線とし、 分割した現分割領域の高さが1ドットになったときで
あって最上部領域のときは現分割領域をすべて白線分と
みなし、最上部領域でないときは上部領域に存在する白
線分と同一位置に白線分が存在するものとしてこの白線
分を分離線とし、 得られた分離線に基づいて前記文字列情報を分離する
ように構成する。
字を切り出し推定範囲内で分離する文字分離方法に関
し、 オーバーハングまたは軽微接触している文字を適切に
分離する文字分離方法を提供することを目的とし、 画像メモリに格納された文字列情報を読出し、該文字
列情報を、一文字毎に分離する文字分離方法であって、 読出された文字列情報の高さに基づいて文字の切出し
推定範囲を定め、 該推定範囲を、文字の高さ方向に複数の領域に分割
し、 各分割領域毎に、高さ方向に連続する白線分の存在の
有無を判定し、 分割領域内に連続する白線分が存在しない場合は、該
分割領域に対して領域分割及び白線分の有無の判定を繰
り返し行ない、 各分割領域毎に連続する白線分が存在する場合は、各
分割領域毎の白線分を接続して得られた線分を、文字の
分離線とし、 分割した現分割領域の高さが1ドットになったときで
あって最上部領域のときは現分割領域をすべて白線分と
みなし、最上部領域でないときは上部領域に存在する白
線分と同一位置に白線分が存在するものとしてこの白線
分を分離線とし、 得られた分離線に基づいて前記文字列情報を分離する
ように構成する。
[産業上の利用分野] 本発明は、オーバーハングまたは軽微接触している文
字を切り出し推定範囲内で分離する文字分離方法に関す
る。
字を切り出し推定範囲内で分離する文字分離方法に関す
る。
紙面上の文字を正しく読み取るには、まず、文字の書
かれている位置を検出し、複数の文字が連続して記入さ
れているときは、これを分離して1字づつ切り出す処理
が必要である。
かれている位置を検出し、複数の文字が連続して記入さ
れているときは、これを分離して1字づつ切り出す処理
が必要である。
[従来の技術] 従来の文字分離方法としては、例えば画像メモリ内の
文字をX軸に投影し、一定値以上の黒ビットが続くとこ
ろを文字のX方向の存在領域とみて、第8図あるいは第
9図に示すような文字列を切り出す。次にこのX方向の
存在領域の文字列のみをY軸に投影し、第8図に示すよ
うに、投影線a〜dを求める。そして、この投影線a〜
dの長さが所定の閾値の範囲内にあるもののみ、投影線
の長さの領域毎に分離して同様にY方向の切り出しを行
なって1文字を切り出すようにしていた。
文字をX軸に投影し、一定値以上の黒ビットが続くとこ
ろを文字のX方向の存在領域とみて、第8図あるいは第
9図に示すような文字列を切り出す。次にこのX方向の
存在領域の文字列のみをY軸に投影し、第8図に示すよ
うに、投影線a〜dを求める。そして、この投影線a〜
dの長さが所定の閾値の範囲内にあるもののみ、投影線
の長さの領域毎に分離して同様にY方向の切り出しを行
なって1文字を切り出すようにしていた。
また、投影線の長さが所定の閾値より大きい場合(第
8図では投影線dの部分、第9図では投影線eの部分)
は、例えば、第10図に示すように、投影線fの左端Y1を
基準として1文字幅wに相当する位置Ywを分離位置と決
定し、分離線Gにより定まる領域を1文字として切り出
す、いわゆる強制分離を行なう。このことは、第8図の
ように文字がオーバーハングしている場合、第9図のよ
うに軽微接触している場合に適用され、夫々分離線A,B
で分離が行なわれる。
8図では投影線dの部分、第9図では投影線eの部分)
は、例えば、第10図に示すように、投影線fの左端Y1を
基準として1文字幅wに相当する位置Ywを分離位置と決
定し、分離線Gにより定まる領域を1文字として切り出
す、いわゆる強制分離を行なう。このことは、第8図の
ように文字がオーバーハングしている場合、第9図のよ
うに軽微接触している場合に適用され、夫々分離線A,B
で分離が行なわれる。
[発明が解決しようとする問題点] このような従来の文字分離方法にあっては、第8図に
示すように文字間でオーバーハングしているか、または
第9図に示すように軽微接触しているような場合にも、
第10図と同様にして縦の1直線で強制的に文字を分離す
るようになっていたため、隣りの文字の一部を含んだ
り、また最適位置から大きくずれるなど適切に文字を分
離することができないという問題点があった。
示すように文字間でオーバーハングしているか、または
第9図に示すように軽微接触しているような場合にも、
第10図と同様にして縦の1直線で強制的に文字を分離す
るようになっていたため、隣りの文字の一部を含んだ
り、また最適位置から大きくずれるなど適切に文字を分
離することができないという問題点があった。
本発明は、このような従来の問題点に鑑みてなされた
ものであって、オーバーハングまたは軽微接触している
文字を適切に分離する文字分離方法を提供することを目
的としている。
ものであって、オーバーハングまたは軽微接触している
文字を適切に分離する文字分離方法を提供することを目
的としている。
[問題点を解決するための手段] 第1図は本発明に係る文字分離方法の原理説明図であ
り、同図(a)は基本構成図、同図(b)は動作フロー
チャート、同図(c)は文字分離の処理説明図である。
り、同図(a)は基本構成図、同図(b)は動作フロー
チャート、同図(c)は文字分離の処理説明図である。
図において、100は画像メモリであり、例えば画像入
力装置であるスキャナからの読取信号が格納されるも
の、110はプロセッサであり、画像メモリ100に格納され
た画像の文字分離の処理を実行するものである。
力装置であるスキャナからの読取信号が格納されるも
の、110はプロセッサであり、画像メモリ100に格納され
た画像の文字分離の処理を実行するものである。
すなわち、プロセッサ110は、まず、ステップ100aで
画像メモリ100より読出し、X,Y方向への投影処理等を行
なって高さh、幅wの文字列情報を読出す。
画像メモリ100より読出し、X,Y方向への投影処理等を行
なって高さh、幅wの文字列情報を読出す。
次いで、ステップ100bで得られた高さhに基づいて、
文字の切出し推定範囲Dを定め、第1図(c)に示すよ
うな画信号を得る。
文字の切出し推定範囲Dを定め、第1図(c)に示すよ
うな画信号を得る。
得られた画信号を、ステップ100cで上下方向に複数の
領域(例えば2個)に分割し、領域h1,h2を得る。
領域(例えば2個)に分割し、領域h1,h2を得る。
そして、ステップ100dで、領域h1,h2の夫々に対して
上下に連続する白ドットの線分(第1図(c)では、・
で示す点が白ドットであり、∂で示す点が黒ドット)の
存在の有無を判定する。
上下に連続する白ドットの線分(第1図(c)では、・
で示す点が白ドットであり、∂で示す点が黒ドット)の
存在の有無を判定する。
領域内に白ドットの線分が存在しない場合は、ステッ
プ100cに戻り、その領域(例えばh1)を更に複数の領域
h11,h12に分割し、同様の処理を繰り返す。
プ100cに戻り、その領域(例えばh1)を更に複数の領域
h11,h12に分割し、同様の処理を繰り返す。
一方、領域内に連続する白ドットの線分が存在する場
合には、ステップ100eで、得られた白ドットの線分を接
続して分離線を求める。
合には、ステップ100eで、得られた白ドットの線分を接
続して分離線を求める。
すなわち、各領域h11,h12,h2毎に複数の白線分(11
a〜11f,12a〜12d,l2a〜l2e)のうちの一つを分離
線(11f,12a,l2a)として定め、これらを接続した
線分を分離線とする。
a〜11f,12a〜12d,l2a〜l2e)のうちの一つを分離
線(11f,12a,l2a)として定め、これらを接続した
線分を分離線とする。
次に、ステップ100fで、分割した現分割領域の高さが
1ドットになったときであって最上部領域のときは現分
割領域をすべて白線分とみなし、最上部領域でないとき
は上部領域に存在する白線分と同一位置に白線分が存在
するものとしてこの白線分を分離線とする。
1ドットになったときであって最上部領域のときは現分
割領域をすべて白線分とみなし、最上部領域でないとき
は上部領域に存在する白線分と同一位置に白線分が存在
するものとしてこの白線分を分離線とする。
そして、ステップ100gで、得られた分離線(11f,
12a,l2a)で文字の分離を行なう。
12a,l2a)で文字の分離を行なう。
[作用] 本発明では、文字間でオーバーハングが生じている場
合、また文字間で軽微接触が生じている場合でも切出し
推定範囲を、複数領域に分割し、各領域毎の白線分を求
め、この白線分を接続して分離線を設定するようにした
ため、文字を適切に分離することができ、隣りの文字の
一部を含んだり、最適位置から大きくずれることがな
く、文字を正しく認識することができる。
合、また文字間で軽微接触が生じている場合でも切出し
推定範囲を、複数領域に分割し、各領域毎の白線分を求
め、この白線分を接続して分離線を設定するようにした
ため、文字を適切に分離することができ、隣りの文字の
一部を含んだり、最適位置から大きくずれることがな
く、文字を正しく認識することができる。
分割を繰り返して現分割領域の高さが1ドットとなっ
た場合であっても、分離線を設定することができ、文字
を適切に分離することができる。
た場合であっても、分離線を設定することができ、文字
を適切に分離することができる。
[実施例] 以下、本発明の実施例を図面に基づいて説明する。
第2図は本発明を実施するために用いる文字読取装置
の制御部を示す回路ブロック図である。
の制御部を示す回路ブロック図である。
第2図において、本回路は、マイクロプロセッサ1、
イメージスキャナ2、I/Oインタフェイス3、ROM4、文
字認識処理部5、およびRAM6,7,8,9,10から構成されて
いる。
イメージスキャナ2、I/Oインタフェイス3、ROM4、文
字認識処理部5、およびRAM6,7,8,9,10から構成されて
いる。
イメージスキャナ2はマイクロプロセッサ1からの指
令により紙面上の文字を光学的に走査して得られる反射
光を光電変換して文字の画像信号を得る。イメージスキ
ャナ2で得た画像信号はI/Oインタフェイス3を介して
画像格納用RAM6内に格納される。ROM4は文字が存在する
と推定されるセグメントを求めるプログラムおよび文字
を分離するためのプログラムをそれぞれ格納する。RAM9
はセグメントの高さにより求めた文字の切り出し推定範
囲位置を格納し、RAM10は切り出し推定範囲を上下に分
割した上下分割位置、すなわち分割領域の先頭のY座標
を格納する。RAM8は分割された切り出し推定範囲内で投
影により検出した縦方向に連続した白線分位置を格納
し、RAM7は検出した白線分を横方向に接続した切り出し
線位置を格納する。
令により紙面上の文字を光学的に走査して得られる反射
光を光電変換して文字の画像信号を得る。イメージスキ
ャナ2で得た画像信号はI/Oインタフェイス3を介して
画像格納用RAM6内に格納される。ROM4は文字が存在する
と推定されるセグメントを求めるプログラムおよび文字
を分離するためのプログラムをそれぞれ格納する。RAM9
はセグメントの高さにより求めた文字の切り出し推定範
囲位置を格納し、RAM10は切り出し推定範囲を上下に分
割した上下分割位置、すなわち分割領域の先頭のY座標
を格納する。RAM8は分割された切り出し推定範囲内で投
影により検出した縦方向に連続した白線分位置を格納
し、RAM7は検出した白線分を横方向に接続した切り出し
線位置を格納する。
次に、本実施例における文字分離処理を第3図および
第4図に示すフローチャートに基づいて説明する。
第4図に示すフローチャートに基づいて説明する。
第3図において、まずステップS1でROM4内に格納した
セグメントを求めるプログラムにより文字が存在すると
推定される矩形領域Cを求める。すなわち、第5図の上
側に示すような矩形領域Cを求める。この場合セグメン
トの高さは図中hで示される。
セグメントを求めるプログラムにより文字が存在すると
推定される矩形領域Cを求める。すなわち、第5図の上
側に示すような矩形領域Cを求める。この場合セグメン
トの高さは図中hで示される。
次に、ステップS2において、前記矩形領域Cより比例
的に求められる左右の中心付近で矩形領域よりせまい左
右の幅で示される切り出し範囲Dを求める。この切り出
し範囲Dは、画像の一例を示す第6図中の矢印Dで示さ
れ、この切り出し範囲Dを取り出したものが第5図のD
で示される。尚、切り出し範囲DのデータはRAM9に格納
される。
的に求められる左右の中心付近で矩形領域よりせまい左
右の幅で示される切り出し範囲Dを求める。この切り出
し範囲Dは、画像の一例を示す第6図中の矢印Dで示さ
れ、この切り出し範囲Dを取り出したものが第5図のD
で示される。尚、切り出し範囲DのデータはRAM9に格納
される。
次に、ステップS3で本発明の特徴をなす文字を分離す
る処理を行なう。この処理の詳細は、第4図のフローチ
ャートに示され、これを第5図を参照しつつ説明する。
る処理を行なう。この処理の詳細は、第4図のフローチ
ャートに示され、これを第5図を参照しつつ説明する。
まず、ステップS31でRAM9に格納された切り出し範囲
Dを、第5図に示すように、領域Y1,Y2に上下に2分割
すると共に、分割位置a、及び分割領域テーブルを生成
しRAM10に格納する。
Dを、第5図に示すように、領域Y1,Y2に上下に2分割
すると共に、分割位置a、及び分割領域テーブルを生成
しRAM10に格納する。
次に、ステップS32a〜cで分割された領域の数だけル
ープすべく、ステップS32aでN=1をセットし、ステッ
プS32bの判断ステップでN=3になったか否かを判断す
る。ここで、N=3になった場合は、全ての領域につい
て処理が終了したものとして、文字分離処理を終了す
る。
ープすべく、ステップS32aでN=1をセットし、ステッ
プS32bの判断ステップでN=3になったか否かを判断す
る。ここで、N=3になった場合は、全ての領域につい
て処理が終了したものとして、文字分離処理を終了す
る。
最初は、N=1であるので、次のステップS32cで領域
YNを選択、つまり、上側の領域Y1を選択する。
YNを選択、つまり、上側の領域Y1を選択する。
次いで、この領域Y1が処理済みか否かをステップS33
で判断し、処理済みの場合はステップS33bでN=N+1
とし、次の領域Y2を選択し、処理済みでない場合は、ス
テップS33aでRAM10内の分割領域テーブルのうち、領域Y
1のフラグを“1"にする。
で判断し、処理済みの場合はステップS33bでN=N+1
とし、次の領域Y2を選択し、処理済みでない場合は、ス
テップS33aでRAM10内の分割領域テーブルのうち、領域Y
1のフラグを“1"にする。
そして、ステップS34で領域Y1内で縦方向へ投影、つ
まり、X軸への投影をとり、ステップS35で投影結果か
ら白線分の位置(X座標)を求める。尚、領域Y1の場
合、投影結果は全て黒ドットであり、白線分は存在しな
い。
まり、X軸への投影をとり、ステップS35で投影結果か
ら白線分の位置(X座標)を求める。尚、領域Y1の場
合、投影結果は全て黒ドットであり、白線分は存在しな
い。
従って、ステップS36では、領域Y1には白線分が存在
していないと判断し、ステップS44に進み、現領域Y1の
高さは、“1"でないため、ステップS42に進み、現領域Y
1を、領域Y11,Y12の上下に2分割し、分割位置a2及び領
域Y11,Y12をRAM10内に格納して次のループ2に移る。す
なわち、ステップS32dを経てステップS32bに戻り、前述
したステップS32cからステップS35の処理を、まず領域Y
11について実行する。従って、この場合は、第5図の領
域で示すように、白線分Eが求められるので、ステッ
プS36では、領域Y11(第5図のの領域)には白線分E
が存在しているものとして、ステップS37に移行し、領
域Y11が最上部領域か否かを判断する。
していないと判断し、ステップS44に進み、現領域Y1の
高さは、“1"でないため、ステップS42に進み、現領域Y
1を、領域Y11,Y12の上下に2分割し、分割位置a2及び領
域Y11,Y12をRAM10内に格納して次のループ2に移る。す
なわち、ステップS32dを経てステップS32bに戻り、前述
したステップS32cからステップS35の処理を、まず領域Y
11について実行する。従って、この場合は、第5図の領
域で示すように、白線分Eが求められるので、ステッ
プS36では、領域Y11(第5図のの領域)には白線分E
が存在しているものとして、ステップS37に移行し、領
域Y11が最上部領域か否かを判断する。
この場合、領域Y11は最上部領域であるので、別表
に示すように、ステップS37aで現領域Y11の白線部Eの
X座標(第4図において、左端の座標を「1」とする)
を、上部領域の白線分Eの最も近いX座標を「0」とし
て(最上部領域であるため)、白線分位置格納RAM8に格
納する。
に示すように、ステップS37aで現領域Y11の白線部Eの
X座標(第4図において、左端の座標を「1」とする)
を、上部領域の白線分Eの最も近いX座標を「0」とし
て(最上部領域であるため)、白線分位置格納RAM8に格
納する。
そして、ループ2におけるステップS32dでN=N+1
を実行した後、ステップS32bに戻り、前述と同様にして
ステップS32c〜ステップS35を、領域Y12(第5図の領域
)に対して実行し、白線分EのX座標(「3」
「4」)を求める。
を実行した後、ステップS32bに戻り、前述と同様にして
ステップS32c〜ステップS35を、領域Y12(第5図の領域
)に対して実行し、白線分EのX座標(「3」
「4」)を求める。
従って、領域Y12の場合は、白線分Eが存在し、且つ
最上部領域でもないので、ステップS36,S37を経て、別
表に示すように、ステップS38で領域Y12の白線分Eの
X座標を、上部領域Y11の白線分EのX座標「5」〜「1
1」のうち、最も近いX座標と共にRAM8へ格納すること
で上部領域Y11と現領域Y12の白線分Eを接続する。尚、
この場合、現領域Y12のX座標を基準として上部領域内
の最下部を横方向に走査して白ドットが連続する領域内
で接続された白線分EのみのX座標のうち、最も近いも
のを格納する。
最上部領域でもないので、ステップS36,S37を経て、別
表に示すように、ステップS38で領域Y12の白線分Eの
X座標を、上部領域Y11の白線分EのX座標「5」〜「1
1」のうち、最も近いX座標と共にRAM8へ格納すること
で上部領域Y11と現領域Y12の白線分Eを接続する。尚、
この場合、現領域Y12のX座標を基準として上部領域内
の最下部を横方向に走査して白ドットが連続する領域内
で接続された白線分EのみのX座標のうち、最も近いも
のを格納する。
そして、ステップS39で上部領域Y11と現領域Y12の白
線分が接続された否かを、RAM8内の上部領域の白線分の
X座標の格納の有無から判断する。
線分が接続された否かを、RAM8内の上部領域の白線分の
X座標の格納の有無から判断する。
白線分が接続できた場合には、ステップS39aで別表
のうち、白線分EのX座標の距離の差の少ないX座標
「4」の位置を現領域Y12の切り出し線F2とする。すな
わち、X座標「4」で、Y座標a1〜a2の線分を切り出し
線F2とする。また、別表に示すように、上部領域、す
なわち最上部領域の白線分Eのうち、現領域Y12の切り
出し線のX座標「4」に対応するものは、X座標「5」
であるので、これを最上部領域Y11の切り出し位置と
し、Y座標0〜a2の線分を切り出し線F1とする。
のうち、白線分EのX座標の距離の差の少ないX座標
「4」の位置を現領域Y12の切り出し線F2とする。すな
わち、X座標「4」で、Y座標a1〜a2の線分を切り出し
線F2とする。また、別表に示すように、上部領域、す
なわち最上部領域の白線分Eのうち、現領域Y12の切り
出し線のX座標「4」に対応するものは、X座標「5」
であるので、これを最上部領域Y11の切り出し位置と
し、Y座標0〜a2の線分を切り出し線F1とする。
そして、このようにして得られた切り出し線F1,F2の
X,Y座標を切り出し線位置格納用RAM7に格納し、ステッ
プS32dでN=N+1を実行し、ループ2におけるステッ
プS32bに戻るので、ループ2における領域Y11,Y12の部
分の切り出し線抽出処理を終了し、ループ1に戻る。
X,Y座標を切り出し線位置格納用RAM7に格納し、ステッ
プS32dでN=N+1を実行し、ループ2におけるステッ
プS32bに戻るので、ループ2における領域Y11,Y12の部
分の切り出し線抽出処理を終了し、ループ1に戻る。
従って、ループ1のステップS32dでN=N+1を実行
し、領域Y2について前述と同様にして、ステップS32c〜
S36を実行する。
し、領域Y2について前述と同様にして、ステップS32c〜
S36を実行する。
領域Y2の場合、投影結果は全て黒ドットであり、白線
分は存在しない。
分は存在しない。
従って、ステップS36を経て、ステップS44に進み、現
領域Y2の高さが“1"ではないので、ステップS42に進
み、現領域Y2を、領域Y21,Y22に上下に分割し、前記と
同様に分割位置a3等をRAM10に格納して、次のループ3
に移る。
領域Y2の高さが“1"ではないので、ステップS42に進
み、現領域Y2を、領域Y21,Y22に上下に分割し、前記と
同様に分割位置a3等をRAM10に格納して、次のループ3
に移る。
そして、前記と同様にして順次切り出し線の抽出処理
を繰り返し実行し、第5図に示すように、分割領域,
,を得、ステップS37,S38,S39,S39aを経て、それぞ
れ別表,,に示されるような白線分位置表に基づ
いて、切り出し線F3,F4,F5を得る。
を繰り返し実行し、第5図に示すように、分割領域,
,を得、ステップS37,S38,S39,S39aを経て、それぞ
れ別表,,に示されるような白線分位置表に基づ
いて、切り出し線F3,F4,F5を得る。
一方、処理を実行し、分割領域となった場合には、
別表に示されるような白線分位置表が得られる。
別表に示されるような白線分位置表が得られる。
ところが、分割領域の場合には、ステップS39で接
続できないと判断されるので、ステップS40に進み、現
領域の高さが“1"か否かを判断し、高さが“1"でない場
合は、ステップS42に進み、再度領域分割の処理を実行
し、分割領域のように、高さが“1"の場合は、ステッ
プS41に進み、上部領域に存在する白線分と同一の位置
に白線分Eが存在するものとする。そして、この白線分
位置に基づいて切り出し線F6を設定する。すなわち、分
割領域の場合には、X座標「5」を強制的に白線分位
置とし、切り出し線F6を求める。そして、分割領域の
白線分位置格納RAMの内容を、「5」に訂正する。従っ
て、別表のX座標の値は「11」→「5」に訂正され
る。
続できないと判断されるので、ステップS40に進み、現
領域の高さが“1"か否かを判断し、高さが“1"でない場
合は、ステップS42に進み、再度領域分割の処理を実行
し、分割領域のように、高さが“1"の場合は、ステッ
プS41に進み、上部領域に存在する白線分と同一の位置
に白線分Eが存在するものとする。そして、この白線分
位置に基づいて切り出し線F6を設定する。すなわち、分
割領域の場合には、X座標「5」を強制的に白線分位
置とし、切り出し線F6を求める。そして、分割領域の
白線分位置格納RAMの内容を、「5」に訂正する。従っ
て、別表のX座標の値は「11」→「5」に訂正され
る。
次いで、分割領域について処理を実行すると、別表
に示されるような白線分位置表が得られるので、分割
領域も領域と同様の処理を行なって切り出し線F7を
得る。
に示されるような白線分位置表が得られるので、分割
領域も領域と同様の処理を行なって切り出し線F7を
得る。
また、ステップS40で現領域の高さが“1"と判断さ
れ、ステップS41に進む際にステップS40aでm=m+1
が実行され、ステップS40bでm>Mとなったか否かを判
断する。ここで、Mは高さhの値から任意に定める。
れ、ステップS41に進む際にステップS40aでm=m+1
が実行され、ステップS40bでm>Mとなったか否かを判
断する。ここで、Mは高さhの値から任意に定める。
つまり、mの値が所定値Mを超える場合は、白線分で
接続される領域がきわめて少なく、文字の中間点、ある
いは縦の直線(門構え)が存在するものとして、切出し
線抽出処理を停止し、ステップS40cに移り、強制分離の
処理の実行を指示する。
接続される領域がきわめて少なく、文字の中間点、ある
いは縦の直線(門構え)が存在するものとして、切出し
線抽出処理を停止し、ステップS40cに移り、強制分離の
処理の実行を指示する。
なお、第5図に示す例では、ステップS36で白線分が
存在せず、ステップS44で現領域の高さが1ドットとな
るような場合は存在しないが、ステップS44で現領域の
高さが1ドットのときは、ステップS45で最上部領域か
否かを判別し、最上部領域のときはステップS46で現領
域をすべて白線分Eとみなし、最上部領域でないときは
ステップS47で上部領域に存在する白線分Eと同一位置
に白線分Eが存在するものとし、この白線分Eを切り出
し線とし、その座標を、RAM7に格納する。そして、該ル
ープにおけるステップS32dへ進み、ループを繰り返す。
存在せず、ステップS44で現領域の高さが1ドットとな
るような場合は存在しないが、ステップS44で現領域の
高さが1ドットのときは、ステップS45で最上部領域か
否かを判別し、最上部領域のときはステップS46で現領
域をすべて白線分Eとみなし、最上部領域でないときは
ステップS47で上部領域に存在する白線分Eと同一位置
に白線分Eが存在するものとし、この白線分Eを切り出
し線とし、その座標を、RAM7に格納する。そして、該ル
ープにおけるステップS32dへ進み、ループを繰り返す。
そして、残りの分割領域,,,についても同
様の処理を繰返して実行することで、切り出し線F8〜F1
1を求める。
様の処理を繰返して実行することで、切り出し線F8〜F1
1を求める。
次に、再び第3図のフローチャートに戻り、ステップ
S4で求めた切り出し線位置により上下方向、左右方向に
一文字が存在する領域を求めて一文字を抽出し、ステッ
プS5で文字認識処理部5で文字を認識する。
S4で求めた切り出し線位置により上下方向、左右方向に
一文字が存在する領域を求めて一文字を抽出し、ステッ
プS5で文字認識処理部5で文字を認識する。
なお、オーバーハング、軽微接触分離で分離できなか
ったときは、第7図に示すように、一文字幅で強制的に
分離する。
ったときは、第7図に示すように、一文字幅で強制的に
分離する。
以上のように、本実施例においては、オーバーハング
したり、また軽微接触している文字の場合でも前述した
手順により切り出し線Fを設定することにより、文字を
適切に分離することができる。したがって、隣りの文字
の一部を含んだり、最適位置から大きくずれることがな
く、正しく文字を認識することができる。
したり、また軽微接触している文字の場合でも前述した
手順により切り出し線Fを設定することにより、文字を
適切に分離することができる。したがって、隣りの文字
の一部を含んだり、最適位置から大きくずれることがな
く、正しく文字を認識することができる。
(発明の効果) 以上説明してきたように、この発明によれば、オーバ
ーハングしている文字や軽微接触している所定の文字を
切り出し線を設定することにより適切に分離することが
でき、正しく文字を認識することができる。
ーハングしている文字や軽微接触している所定の文字を
切り出し線を設定することにより適切に分離することが
でき、正しく文字を認識することができる。
第1図は本発明の原理説明図、 第2図は本発明を実施するための文字読取装置の制御部
の回路ブロック図、 第3図は本実施例におけるメインフローチャート、 第4図は第3図の文字分離処理を示すフローチャート、 第5図は切り出し範囲内で切り出し線を求めるための説
明図、 第6図は読み出す画像の一例を示す図、 第7図は強制分離を説明するための説明図、 第8図はオーバーハングの一例を示す図、 第9図は軽微接触の一例を示す図、 第10図は強制的分離の一例を示すである。 図中、 1…マイクロプロセッサ、2…イメージスキャナ、4…
ROM、5…文字認識処理部、6…画像格納用RAM、7…切
り出し線位置格納用RAM、8…白線分位置格納用RAM、9
…上下分割位置格納用RAM。
の回路ブロック図、 第3図は本実施例におけるメインフローチャート、 第4図は第3図の文字分離処理を示すフローチャート、 第5図は切り出し範囲内で切り出し線を求めるための説
明図、 第6図は読み出す画像の一例を示す図、 第7図は強制分離を説明するための説明図、 第8図はオーバーハングの一例を示す図、 第9図は軽微接触の一例を示す図、 第10図は強制的分離の一例を示すである。 図中、 1…マイクロプロセッサ、2…イメージスキャナ、4…
ROM、5…文字認識処理部、6…画像格納用RAM、7…切
り出し線位置格納用RAM、8…白線分位置格納用RAM、9
…上下分割位置格納用RAM。
Claims (1)
- 【請求項1】画像メモリ(100)に格納された文字列情
報を読出し、該文字列情報を、一文字毎に分離する文字
分離方法であって、 読出された文字列情報の高さに基づいて文字の切出し推
定範囲を定め(100b)、 該推定範囲を、文字の高さ方向に複数の領域に分割し
(100c)、 各分割領域毎に、高さ方向に連続する白線分の存在の有
無を判定し(100d)、 分割領域内に連続する白線分が存在しない場合は、該分
割領域に対して領域分割及び白線分の有無の判定を繰り
返し行ない、 各分割領域毎に連続する白線分が存在する場合は、各分
割領域毎の白線分を接続して得られた線分を、文字の分
離線とし(100e)、 分割した現分割領域の高さが1ドットになったときであ
って最上部領域のときは現分割領域をすべて白線分とみ
なし、最上部領域でないときは上部領域に存在する白線
分と同一位置に白線分が存在するものとしてこの白線分
を分離線とし(100f)、 得られた分離線に基づいて前記文字列情報を分離するよ
うにした(100g)、 ことを特徴とする文字分離方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62195893A JPH083833B2 (ja) | 1987-08-05 | 1987-08-05 | 文字分離方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62195893A JPH083833B2 (ja) | 1987-08-05 | 1987-08-05 | 文字分離方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6438884A JPS6438884A (en) | 1989-02-09 |
| JPH083833B2 true JPH083833B2 (ja) | 1996-01-17 |
Family
ID=16348740
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP62195893A Expired - Fee Related JPH083833B2 (ja) | 1987-08-05 | 1987-08-05 | 文字分離方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH083833B2 (ja) |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5668871A (en) * | 1979-11-09 | 1981-06-09 | Toshiba Corp | Character detecting and cutting-out device |
| JPS62121859A (ja) * | 1985-11-22 | 1987-06-03 | Yamaha Motor Co Ltd | 内燃機関のエアクリ−ナ |
-
1987
- 1987-08-05 JP JP62195893A patent/JPH083833B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JPS6438884A (en) | 1989-02-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5613016A (en) | Area discrimination system for text image | |
| US6959121B2 (en) | Document image processing device, document image processing method, and memory medium | |
| US5075895A (en) | Method and apparatus for recognizing table area formed in binary image of document | |
| US6947596B2 (en) | Character recognition method, program and recording medium | |
| EP1073002B1 (en) | Character extracting method | |
| US20100008587A1 (en) | Image processing improving postprocessing rate of character rectangle extraction and improving character recognition accuracy | |
| US20100054587A1 (en) | Image processing apparatus and image processing method | |
| JP5171421B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
| JPH0418351B2 (ja) | ||
| JPH083833B2 (ja) | 文字分離方法 | |
| JP4281236B2 (ja) | 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体 | |
| JP2868134B2 (ja) | 画像処理方法及び装置 | |
| JPS61193277A (ja) | 文書読取装置 | |
| JPH0944594A (ja) | 文書画像の領域分割方法および段組種類判別方法 | |
| JP3019897B2 (ja) | 行切出し方法 | |
| JPH0581475A (ja) | 文字領域抽出方法 | |
| JPS6327752B2 (ja) | ||
| JP2851087B2 (ja) | 表処理方法 | |
| JP2721415B2 (ja) | 文字画像抽出方法 | |
| JPH05135204A (ja) | 文字認識装置 | |
| JP2803735B2 (ja) | 罫線を含んだ文字認識装置 | |
| JP4810995B2 (ja) | 画像処理装置、方法及びプログラム | |
| JP3880091B2 (ja) | 情報処理装置及び方法 | |
| JPH027183A (ja) | 文字切出装置 | |
| JP3976804B2 (ja) | 画像処理方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |