JPH06251197A - 文字切り出し装置 - Google Patents
文字切り出し装置Info
- Publication number
- JPH06251197A JPH06251197A JP5038094A JP3809493A JPH06251197A JP H06251197 A JPH06251197 A JP H06251197A JP 5038094 A JP5038094 A JP 5038094A JP 3809493 A JP3809493 A JP 3809493A JP H06251197 A JPH06251197 A JP H06251197A
- Authority
- JP
- Japan
- Prior art keywords
- character
- point
- separation
- slicing
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000926 separation method Methods 0.000 claims abstract description 86
- 238000001514 detection method Methods 0.000 claims description 25
- 238000010586 diagram Methods 0.000 description 16
- 230000014509 gene expression Effects 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 7
- 230000010365 information processing Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
データ入力に要する時間と費用を低減しすることにより
種々の機能を持つ情報処理装置を構築することのできる
文字切り出し装置を提供する。 【構成】 点検出部134において文字塊中の上部叉は
下部における点の有無と該点の文字行画像データ上にお
ける座標値とを検出し、相対位置判断部135は前記点
が存在する場合には当該文字塊中での点の位置を判断し
この判断結果に基づいて当該文字塊を分離する分離領域
信号を出力すると共に前記点が存在しない場合には当該
文字塊の全領域を分離領域信号として出力する。分離位
置判断部136は、点が検出された場合には分離領域信
号の表わす領域内に存在するくびれ位置の内で検出され
た点に最も近い位置を分離位置として出力すると共に前
記点が検出されなかった場合には前記くびれ部分の位置
を文字の分離位置とする。
Description
し、特に欧文文書での接触文字を分離するための文字切
り出し装置に関する。
得ることができれば、種々の情報処理装置(例えば、文
字情報を記憶する装置、文字情報を音声に変換する装置
等)の実現が可能となる。このような情報処理装置を実
現するためには、媒体上の入力文字列から得た入力文字
列データより、1文字ずつを正確に切り出す必要があ
る。しかし、入力文字列によっては文字同士の間隔が狭
いものや、接触するものがあり、1文字ずつの分離が困
難である。例えば、欧文文章においては、隣接した文字
同士が接触する場合が頻出する。このような接触文字を
分離する装置として、例えば特願平03-275470
に開示されているものがあった。この文字切り出し装置
は、接触文字が文字同士の接触部分でくびれている事が
多い事に着目し、該くびれ部分で文字を分離するもので
あった。
装置のブロック図を図3(a)に示す。文字認識装置3
0は、画像入力部31、文字行切り出し部32、文字切
り出し装置33、文字認識部34、文字コード出力端子
35からなる。以下、従来の文字認識装置30について
詳細に説明する。文字、図形、記号等(以下文字とい
う)が記載された帳票からの光信号sは画像入力部31
に入力される。画像入力部31は、入力された光信号s
を文字部は黒画素、背景部は白画素の白黒に二値化した
電気信号(以下帳票画像データと称する)に光電変換
し、該帳票画像データを文字行切り出し部32に出力す
る。文字行切り出し部32は、帳票画像データより、1
行ずつの文字行を切り出し(以下文字行画像データと称
する)、該文字行画像データを文字切り出し装置33に
出力する。文字切り出し装置33は文字行画像データよ
り1つ1つの文字(以下文字パタンと称する)を切り出
し、該文字パタンを文字認識部34に出力する。文字認
識部34は前記文字パタンを認識し、文字コードを得、
該文字コードを文字コード出力端子35に出力する。
て、詳細に説明する。従来の文字切り出し装置33のブ
ロック図を図3(b)に示す。文字切り出し装置33は
文字塊切り出し部331、くびれ検出部332、接触文
字分離部333とを備えている。文字塊切り出し部33
1は帳票画像データを垂直方向を主走査方向(以下、y
方向という場合もある)、水平方向を副走査方向(以
下、x方向という場合もある)として走査し、垂直方向
の黒画素の分布を作成する。さらに、該黒画素の分布が
「0」から「1」以上に変化する位置から、「1」以上
から「0」に変化する直前の位置までを文字塊として切
り出し、該文字塊の画像データを、くびれ検出部332
及び接触文字分離部333に出力する。くびれ検出部3
32においては入力された文字塊の画像データより、文
字線のくびれ部分を検出し、該くびれ位置の座標を接触
文字分離部333に出力する。接触文字分離部333
は、前記くびれ位置の座標、及び文字塊切り出し部33
1より入力された文字塊の画像データより、文字塊の分
離を行い、分離した結果の文字パタンを文字認識部34
に出力する。
くびれの検出は以下のように行う。切り出した文字塊中
の全ての黒画素に対して水平方向、垂直方向、左斜め4
5゜の方向、右斜め45゜の方向の連続黒画素数を数
え、式(1)のいずれかを満たしたときに、その黒画素
の位置を文字線幅のくびれ部分として検出する。 KH < TH KV < TV KL < TL (1) KR < TR ここで、KH、KV、KL、KRはそれぞれ水平方向、垂直
方向、左斜め45゜方向、右斜め45゜方向の連続黒画
素数である。また、TH、TV、TL、TRはそれぞれ水平
方向、垂直方向、左斜め45゜方向、右斜め45゜方向
のしきい値であり、予め定めた固定値である。
を分離する一例を図4に示す。図4(a)の42は帳票
41に記載された接触文字である。図4(b)は当該接
触文字の帳票画像データである。帳票画像データにおい
て黒画素の部分は、“0”で示してある(以下の図中で
は黒画素部分を“0”の記号にて表わす)。くびれ検出
部332は図4(a)の接触部4aに対応する図4
(b)の4bの黒画素の位置をくびれ部分として検出
し、該くびれ部分の座標を表す信号を、接触文字分離部
333に出力する。接触文字分離部333は前記座標に
て文字塊を分離し、分離した文字パタンを文字認識部3
4に出力する。
り出し装置ではくびれ検出部332において、文字塊中
の全ての黒画素について式(1)を満足するか否かを検
証し、式(1)を満足する全ての黒画素の位置において
文字塊の分離を行う。これにより誤った切り出し結果が
生じ、正確なデータ入力が出来ないという問題点があっ
た。一例を挙げると、図5(a)は“r”と“i”の接
触文字の画像データであるが、従来の文字切り出し装置
はくびれ部分5a、5b、5c、5dを見つけ、図5(b)
に示すように前記接触文字をこの4点で分離し、“r”
と“i”それぞれの1文字を複数に分割している。(こ
の例では、式(1)での4種類の文字線幅のしきい値を
全て4としてあり、文字線幅が3以下の部分で文字塊を
分離する)また、他の接触文字の画像データとその分離
例を図6、図7に挙げた。いずれの例でも、接触文字を
間違った部分で分離し、これにより文字塊中の1文字を
複数に分割している。
は、接触文字を間違った部分で分離し、接触文字中の1
文字を複数に分割してしまう。これにより誤った切り出
し結果が生じ、正確なデータ入力が出来ないという問題
点があった。さらに誤った切り出し結果を直すには、オ
ペレータによる修正作業が必要となるが、この作業は膨
大な切り出し結果の中から誤った切り出し結果を見つけ
るもので、複雑であり時間と費用を要するものである。
このため、文字切り出し装置本来の目的であるデータ入
力時間の短縮、それに要するコストの低減をはかれない
という問題があった。さらにこの文字切り出し装置を文
字認識装置に適用した場合には、間違った認識結果の修
正が必要だが、この作業には時間と費用がかかるという
問題点があった。
してしまうという従来の文字切り出し装置の問題点を解
決し、正確に文字切り出しを行い、データ入力に要する
時間と費用を低減し、そして前述した種々の機能を持つ
情報処理装置を構築することのできる文字切り出し装置
の提供を目的とする。
記課題を解決するために、接触文字を個々の文字に分離
して切り出す文字切り出し装置において、文字行画像デ
ータから文字塊を切り出す第1の文字切り出し部と、切
り出された文字塊中の上部叉は下部における点の有無と
該点の前記文字行画像データ上における座標値とを検出
する点検出部と、前記点が存在する場合には当該点の前
記座標値に基づき当該文字塊中での点の位置を判断しこ
の判断結果に基づいて当該文字塊を分離する分離領域信
号を出力すると共に前記点が存在しない場合には当該文
字塊の全領域を前記分離領域信号として出力する相対位
置判断部とから成る分離領域決定部と、文字塊の画像デ
ータから文字線のくびれ部分を検出し該くびれ部分の座
標値を出力するくびれ部分検出部と、前記点が検出され
た場合には前記分離領域信号の表わす領域内に存在する
くびれ位置の内で前記検出された点に最も近い位置を分
離位置として出力すると共に前記点が検出されなかった
場合には前記くびれ部分の位置を分離位置とする分離位
置判断部と、該分離位置に基づいて当該文字塊を分離し
て複数の文字パタンを得る接触文字分離部とから成る第
2の文字切り出し部とを備えたことを特徴とする。
々の文字に分離して切り出す文字切り出し装置におい
て、文字行画像データから文字塊を切り出す第1の文字
切り出し部と、切り出された文字塊中の上部叉は下部に
おける点の有無と該点の前記文字行画像データ上におけ
る座標値とを検出する点検出部と、前記点が存在する場
合には当該点の前記座標値に基づき当該文字塊中での点
の位置を判断しこの判断結果に基づいて当該文字塊を分
離する分離領域信号を出力すると共に前記点が存在しな
い場合には当該文字塊の全領域を前記分離領域信号とし
て出力する相対位置判断部とから成る分離領域決定部
と、前記点が検出された場合には前記分離領域信号の表
わす領域内において文字線のくびれ部分を検出し当該点
に最も近いくびれ位置を表わす座標値を出力すると共に
前記点が検出されなかった場合には前記領域内の全領域
に於いてくびれ位置を検出するくびれ検出部と、前記く
びれ位置に基づいて当該文字塊を分離して複数の文字パ
タンを得る接触文字分離部とから成る第2の文字切り出
し部とを備えたことを特徴とする。
の塊(これを「点」と称する)の文字塊中の位置を、接
触文字の接触位置の判断に用いる理由を以下に説明す
る。欧文で、「点」を持つ文字(i、j、?、! な
ど)が他の文字と接触した場合、「点」のある文字の後
に他の文字が接触すれば「点」の位置は文字塊全体から
見て左に片寄っている。また「点」を持つ文字の前に他
の文字が接触した場合には、「点」の位置は文字塊全体
から見て右に片寄っている。以上のことを逆に考えれ
ば、切り出した文字塊の中に「点」が有る場合、「点」
の位置が文字塊全体から見て左に片寄っていれば、この
文字塊は「点」を持つ文字の後に他の文字が接触したも
のである。よって、文字同士の接触の位置はx方向にみ
て、「点」の右側近辺の領域内にある。また、「点」の
位置が文字塊全体から見て右に片寄っていれば、この文
字塊は「点」を持つ文字の前に他の文字が接触したもの
で、文字同士の接触点はx方向にみて、「点」の左近辺
の領域内にある。「点」を持つ接触文字の文字数が三文
字以上であっても、以上の考え方を用いて、正しい位置
で文字切り出しが出来る。
て、「点」が有る場合はその位置に基づいて文字塊を分
離する領域をを決定し、該領域内に存在するくびれ位置
のうち、前記「点」に最も近い位置を分離位置として決
定するものである。また、第2の発明に於いては、前記
原理に基づいて「点」が有る場合はその位置に基づいて
決定された分離領域の中でくびれ部分を検出し分離位置
を決定するものであり、何れの発明に於いても従来の文
字切り出し装置が、正しい分離点以外でも接触文字を分
離してしまうという問題点を解決することができ、正確
な文字切り出しを実現し、前記課題を解決するものであ
る。
装置の第1の実施例を図1(a)に示す。文字認識装置
10は、画像入力部11、文字行切り出し部12、文字
切り出し装置13、文字認識部14、文字コード出力端
子15からなる。以下、文字認識装置10の動作につい
て詳細に説明する。先ず文字が記載された帳票からの光
信号sを画像入力部11に入力する。画像入力部11
は、入力された光信号sを帳票画像データに光電変換
し、該帳票画像データを文字行切り出し部12に出力す
る。文字行切り出し部12は、入力された帳票画像デー
タより、1行ずつの文字行を切り出し、文字行画像デー
タを文字切り出し装置13に出力する。文字切り出し装
置13は、入力された文字行画像データから1文字ずつ
の文字パタンを切り出し、該文字パタンを文字認識部1
4に出力する。文字認識部14では前記文字パタンを認
識し、文字コードを得、該文字コードを文字コード出力
端子15に出力する。
実施例について詳細に説明する。文字切り出し装置13
は文字塊切り出し部131(以下、第1の文字切り出し
部と言う場合もある)、第2の文字切り出し部138、
分離領域決定部137から成る。更に、第2の文字切り
出し部138はくびれ検出部132、接触文字分離部1
33、分離位置判断部136から成り、分離領域決定部
137は点検出部134、相対位置判断部135から成
る。
行画像データをy方向を主走査方向、x方向を副走査方
向として走査し、y方向の黒画素の分布を作成する。そ
して、該黒画素の分布が「0」から「1」以上に変化す
る位置から、「1」以上から「0」に変化する直前の位
置までを文字塊として切り出し、該文字塊を点検出部1
34、くびれ検出部132、接触文字分離部133に出
力する。
の上部、または下部の「点」の有無と、該「点」の文字
行画像データ上での座標を調べ、「点」の有無と前記座
標を表す信号を相対位置判断部135に出力する。尚、
前記「点」の有無、及び文字行画像データ上での位置
は、以下のようにして調べる。先ず切り出した文字塊画
像データ上で走査線のy値を一定にして、xの正方向
に、黒画素の有無を検索する。前記検索を前記走査線の
y値を文字塊のy方向の最小値から最大値まで変えて行
い、黒画素が検出されたら、背景部との境にある黒画素
(以下、輪郭点と称する)に沿って、黒画素の塊を一周
する。(以下、この処理を輪郭追跡と称する)前記輪郭
点の数がm以上n以下(但しm、nは文章、書体などに
より変え得る固定値である)なら、この黒画素の塊を
「点」として検出する。また、前記「点」の輪郭点の文
字画像データ上の座標の中で、x値とy値それぞれの最
小値と最大値の座標を記憶しておく。
り入力された「点」の座標より、前記「点」の文字塊中
での位置を判断し、この判断に基づいて前記文字塊を分
離する領域を決定し、該領域を表わす信号(分離領域信
号と称する)を分離位置判断部136に出力する。
し部131より入力された文字塊の画像データより、従
来の文字切り出し装置と同じ方法で文字塊のくびれを抽
出し、該くびれの位置の座標を表わす信号を分離位置判
断部136に出力する。
32から入力されたくびれの座標の中で、相対位置判断
部135から入力された領域内に有るものを抽出し、更
にその中で、前記「点」にいちばん近いくびれを分離位
置として選択し、該分離位置の座標を表わす信号を接触
文字分離部133に出力する。
断部136より入力された分離位置にて文字塊を分離
し、分離して得た文字パタンを文字認識部14に出力す
る。
に説明する。相対位置判断部135は、文字塊中での
「点」の相対的な位置を判断する。文字の上側に「点」
が付く場合、考えられる「点」と文字塊の相対的な位置
関係は4通りあり、図8及び図9にその4通りの場合を
例示した。図8(a)は「点」6bの位置がx方向にみ
て文字塊6aのほぼ中央にあり、「点」の幅が文字塊の
幅と同じくらいの場合であり、“i”や“j”等を単独
で切り出した場合にこのようになる。これをケースAと
する。図8(b)は「点」6eの位置が文字塊6d全体に
対してx方向にみて、左に片寄っている場合である。
“i”や“j”等の後に他の1文字以上の文字が接触し
た場合にこのようになる。これをケースBとする。ケー
スBの場合は、文字同士の接触点は「点」の右の領域に
ある。図9(a)は「点」6hの位置が文字塊6gに対し
てx方向にみて、右に片寄っている場合である。“i”
や“j”等の前に他の1文字以上の文字が接触した場合
にこのようになる。これをケースCとする。ケースCの
場合は、文字同士の接触点は「点」の左側にある。図9
(b)は「点」6kの位置は文字塊6jに対してx方向に
みてほぼ中央にあるが、ケースAと違うのは、「点」の
幅に比べて、文字塊の幅が広いことである。これは、
“i”や“j”の前と後に他の1文字以上の文字が接触
した場合で、これをケースDとする。ケースDの場合は
文字の接触点は、「点」の左右の領域にある。
すると以下のようになる。「点」を含む文字パタンにお
いて、式(2)のwを求め、このwの値より式(3)で
定めるLとHの値を求める。 w=x2−x1 (2) 但し、x1は「点」の存在する領域のx方向の最小値、
x2は最大値であり、wは「点」の幅である。 L=x1−t×w H=x2+t×w (3) 但し0<tであり、tは文字の書体などによって変える
得る固定値である。
断には、式(2)と式(3)で求めたw、L、Hの値を
用い、以下の式(4)、から式(7)までのどれを満た
すかにより判断する。 L < x3 x4 < H (4) L < x3 x4 ≧ H (5) L ≧ x3 x4 < H (6) L ≧ x3 x4 ≧ H (7) 但し、x3は文字塊のx方向の最小値であり、x4は文字
塊のx方向の最大値である。
範囲内におさまるとき、文字塊は式(4)の2式を満た
し、「点」と文字塊の相対的な位置関係は前記のケース
Aの場合である(図10(a)参照)。相対位置判断部
135はケースAの場合は、文字塊を分離する領域はな
い(つまり文字塊を分離しない)ことを表わす信号を分
離位置判断部136に出力する。
Hより右側にも有るとき文字塊は式(5)の2式を満た
し、「点」と文字塊の相対的な位置関係は前記のケース
Bの場合である(図10(b)参照)。ケースBの場
合、相対位置判断部135は、文字同士の接触点の存在
する領域をx2<x<H(xは接触点のχ座標)と判断
し、前記領域を表す分離領域信号を分離位置判断部13
6に出力する。
Lより左側にも有るとき文字塊は式(6)の2式を満た
し、「点」と文字塊の相対的な位置関係は前記のケース
Cの場合である(図11(a)参照)。ケースCの場
合、相対位置判断部135は、文字同士の接触点の存在
する領域をL<x<x1(xは接触点のχ座標)と判断
し、前記領域を表す分離領域信号を分離位置判断部13
6に出力する。
Lより左側と、x=Hより右側にも有るとき、文字塊は
式(7)の2式を満たし、「点」と文字塊の相対的な位
置関係は前記ケースDの場合である(図11(b)参
照)。ケースDの場合は、相対位置判断部135は、文
字同士の接触点の存在する領域をL<x<x1とx2<x
<H(xは接触点のχ座標)の2つと判断し、前記領域
を表す分離領域信号を分離位置判断部136に出力す
る。
35に、文字塊には「点」がないことを表わす信号が入
力されたとき、相対位置判断部135は文字塊を分離す
る領域を全ての領域と判断し(つまり、全てのくびれ位
置にて文字塊を分離する)、前記領域を示す信号を分離
位置判断部136に出力する。この場合、分離位置判定
部は当該領域内の全てのくびれ位置を分離位置と判定し
て該分離位置の座標を表わす信号を接触文字分離部13
3に出力する。
の具体例を、図5(a)の“r”と“i”の接触文字の
文字塊の場合について説明する。該文字塊の文字パタン
に座標を付けて図12に示した。図12より、 x1=31 x2=35 x3=4 x4=35 w =x2−x1=4 L =x1−t×w=23 H =x2+t×w=43 (ここでt=2.0であ
る) これより前記文字塊“ri”は式(6)を満たすのでケ
ースCにあたり、文字塊の分離領域は、23<x<31
(xは分離位置のχ座標)となる。相対位置判断部13
5は前記領域を表わす信号を分離位置判断部136に出
力する。
“ri”の4ヶ所のくびれ8a,8b,8c,8dのうち、
前記領域に存在する8cのくびれを分離点として選択
し、該分離点の座標を接触文字分離部133に出力す
る。接触文字分離部133では、文字塊“ri”を前記
8cの位置で分離する。この結果を図13(a)に示
す。また、図6(a)及び図7(a)に示したの接触文
字を本発明の文字切り出し装置で分離した結果を各々図
13(b)、(c)に示す。いずれの場合も「点」付近
のくびれを分離点に選び、正確な文字切り出しがなされ
ていることが分かる。
る。まず、文字パタンより文字平均線幅を算出する。前
記文字平均線幅の算出は、文字パタンを2×2の窓で走
査したときに2×2の窓の全ての点が黒画素となる点の
個数Qと、入力パタンの全ての黒画素数Aとを計数し、
式(8)に示す文字平均線幅の近似式に基づいて文字パ
タン中の文字の文字平均線幅Wを算出することにより行
う。 W=A/(A−Q) (8)
め、右斜めの4方向の線素を抽出した4個のサブパタン
を抽出する。前記、サブパタン抽出の処理は、例えば水
平サブパタンの場合は、文字パタンを水平方向に走査し
黒画素の連続を検出し、黒画素の連続数LHが式(9)
を満足するときに当該黒画素の連続を水平方向のサブパ
タンとして抽出するものである。同様に式(9)より垂
直、左斜め、右斜めサブパタンの抽出も行う。 LH > 2 × W LV > 2 × W LL > 21/2× W (9) LR > 21/2× W 但し、LH、LV、LL、LRは各々水平、垂直、左斜め、
右斜めの連続黒画素数である。
ブパタンを、小領域に分割し各サブパタンの各領域の黒
画素数を計数し、前記黒画素計結果及び前記平均線幅よ
り、式(10)に基づいて水平、垂直、左斜め及び右斜
めの特徴マトリクスを抽出する。 KH(m,n)=BH(m,n)/W KV(m,n)=BV(m,n)/W KL(m,n)=BL(m,n)/W (10) KR(m,n)=BR(m,n)/W 但し、KH、KV,KL、KRは各々水平、垂直、左斜め、
右斜めの特徴マトリクス、BH、BV,BL、BRは各々水
平、垂直、左斜め、右斜めの黒画素マトリクスであり、
(m,n)は各マトリクスの要素番号である。前記小領
域の分割は本実施例においては、入力文字パタン外接枠
を水平、垂直方向に5等分して作成される5×5の25
の小領域に分割をするものとする。
徴マトリクスと、予め文字認識部14内に備えた辞書内
の標準文字の特徴マトリクスとを式(11)に基づいて
照合し、式(11)の距離値dが最も小さくなる標準文
字の文字コードを、入力文字パタンの認識結果として文
字コード出力端子15より出力するものである。 d=(Σ(gi−ki)2)1/2 (11) 但し、giは標準文字の特徴マトリクスの要素、kiは入
力文字パタンの特徴マトリクスの要素である。
用いた文字認識装置の第2の実施例をに示す。文字認識
装置20の構成、処理の内容は文字認識装置10と同じ
である。図2(b)に文字切り出し装置の第2の実施例
のブロック図を示す。文字切り出し装置23は、文字塊
切り出し部231(以下、第1の文字切り出し部と言う
場合もある)、第2の文字切り出し部237、分離領域
決定部236から成る。更に、第2の文字切り出し部2
37はくびれ検出部232と接触文字分離部233とか
らなり、分離領域決定部236は点検出部234と相対
位置判断部235とから成る。第2の実施例に於いて
は、分離領域決定部236において「点」の有無に応じ
て決定された分離領域を表わす信号をくびれ検出部23
2に出力し、くびれ検出部232は前記領域内にてくび
れ検出を行い、「点」が有る場合は検出されたくびれ位
置の内「点」に最も近い位置を分離位置とし、「点」が
無い場合は全てのくびれ位置を分離位置とする。
した場合について説明したが、他言語の文字、記号であ
っても本発明が有効であることは明かである。
明によれば、「点」を含む接触文字では、文字同士の接
触点は「点」の付近にある事を利用して、文字同士の接
触点の存在する領域を判断し、該判断に基づいて接触文
字を分離するようにしたものである。これにより、接触
文字を誤った位置で分離することを防止すると共に
「点」の位置を接触文字の分離領域の決定に利用したこ
とにより、1文字を分割してしまうという従来の文字切
り出し装置の問題を解決でき、正確な文字切り出しが出
来るようになる。従って、誤った切り出し結果が減少す
るので、データ入力のための、オペレータによる修正作
業が低減され、これに要する時間と費用の節約が図れ
る。そして、前述の各種情報処理装置、例えば高性能な
文字認識装置の構築が可能となる。
識装置の第1の実施例を示すブロック図である。
識装置の第2の実施例を示すブロック図である。
装置の実施例を示すブロック図である。
処理の説明図である。
触文字分離例の説明図である。
触文字分離例の説明図である。
触文字分離例の説明図である。
る。
る。
票画像を示す図である。
触文字の分離例を示す図である。
Claims (2)
- 【請求項1】 接触文字を個々の文字に分離して切り出
す文字切り出し装置において、 文字行画像データから文字塊を切り出す第1の文字切り
出し部と、 切り出された文字塊中の上部叉は下部における点の有無
と該点の前記文字行画像データ上における座標値とを検
出する点検出部と、前記点が存在する場合には当該点の
前記座標値に基づき当該文字塊中での点の位置を判断し
この判断結果に基づいて当該文字塊を分離する分離領域
信号を出力すると共に前記点が存在しない場合には当該
文字塊の全領域を前記分離領域信号として出力する相対
位置判断部とから成る分離領域決定部と、 文字塊の画像データから文字線のくびれ部分を検出し該
くびれ部分の座標値を出力するくびれ部分検出部と、前
記点が検出された場合には前記分離領域信号の表わす領
域内に存在するくびれ位置の内で前記検出された点に最
も近い位置を分離位置として出力すると共に前記点が検
出されなかった場合には前記くびれ部分の位置を分離位
置とする分離位置判断部と、該分離位置に基づいて当該
文字塊を分離して複数の文字パタンを得る接触文字分離
部とから成る第2の文字切り出し部とを備えたことを特
徴とする文字切り出し装置。 - 【請求項2】 接触文字を個々の文字に分離して切り出
す文字切り出し装置において、 文字行画像データから文字塊を切り出す第1の文字切り
出し部と、 切り出された文字塊中の上部叉は下部における点の有無
と該点の前記文字行画像データ上における座標値とを検
出する点検出部と、前記点が存在する場合には当該点の
前記座標値に基づき当該文字塊中での点の位置を判断し
この判断結果に基づいて当該文字塊を分離する分離領域
信号を出力すると共に前記点が存在しない場合には当該
文字塊の全領域を前記分離領域信号として出力する相対
位置判断部とから成る分離領域決定部と、 前記点が検出された場合には前記分離領域信号の表わす
領域内において文字線のくびれ部分を検出し当該点に最
も近いくびれ位置を表わす座標値を出力すると共に前記
点が検出されなかった場合には前記領域内の全領域に於
いてくびれ位置を検出するくびれ検出部と、前記くびれ
位置に基づいて当該文字塊を分離して複数の文字パタン
を得る接触文字分離部とから成る第2の文字切り出し部
とを備えたことを特徴とする文字切り出し装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5038094A JPH06251197A (ja) | 1993-02-26 | 1993-02-26 | 文字切り出し装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5038094A JPH06251197A (ja) | 1993-02-26 | 1993-02-26 | 文字切り出し装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH06251197A true JPH06251197A (ja) | 1994-09-09 |
Family
ID=12515893
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP5038094A Pending JPH06251197A (ja) | 1993-02-26 | 1993-02-26 | 文字切り出し装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH06251197A (ja) |
-
1993
- 1993-02-26 JP JP5038094A patent/JPH06251197A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0854434B1 (en) | Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof | |
| EP0138445A2 (en) | Method and apparatus for segmenting character images | |
| US5197107A (en) | Character recognition apparatus | |
| Dori et al. | Segmentation and recognition of dimensioning text from engineering drawings | |
| US5625710A (en) | Character recognition apparatus using modification of a characteristic quantity | |
| JP4011646B2 (ja) | 行検出方法および文字認識装置 | |
| KR20010015025A (ko) | 문자인식장치의 문자추출방법 및 장치 | |
| JPH06251197A (ja) | 文字切り出し装置 | |
| US7139429B2 (en) | Image recognition scheme | |
| EP0767941B1 (en) | Automatic determination of landscape scan in binary images | |
| JP2978801B2 (ja) | 手書き文字認識の文字入力方式 | |
| JPH06251196A (ja) | 文字切り出し装置 | |
| JP2728086B2 (ja) | 文字切り出し方法 | |
| JPH10162104A (ja) | 文字認識装置 | |
| JP2520174B2 (ja) | 文字自動抽出装置 | |
| JPH05114047A (ja) | 文字切り出し装置 | |
| JP2859307B2 (ja) | 文字切出し装置 | |
| JP3662967B2 (ja) | 文字ループ候補抽出装置及び文字補完装置 | |
| CN115731250A (zh) | 文本分割方法、装置、设备及存储介质 | |
| JPH06223224A (ja) | 行切出し方法 | |
| JP2888885B2 (ja) | 文字切出し装置 | |
| JPH0816720A (ja) | 文字認識装置 | |
| JPS6362025B2 (ja) | ||
| JPH05135204A (ja) | 文字認識装置 | |
| JPH08115384A (ja) | 文字切り出し装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071006 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081006 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081006 Year of fee payment: 8 |
|
| S202 | Request for registration of non-exclusive licence |
Free format text: JAPANESE INTERMEDIATE CODE: R315201 |
|
| FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 8 Free format text: PAYMENT UNTIL: 20081006 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091006 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101006 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101006 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111006 Year of fee payment: 11 |
|
| FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 14 Free format text: PAYMENT UNTIL: 20141006 |
|
| FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 14 Free format text: PAYMENT UNTIL: 20141006 |
|
| S212 | Written request for registration of transfer of non-exclusive license |
Free format text: JAPANESE INTERMEDIATE CODE: R315211 |
|
| FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141006 Year of fee payment: 14 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| EXPY | Cancellation because of completion of term |