JPH08115384A - 文字切り出し装置 - Google Patents
文字切り出し装置Info
- Publication number
- JPH08115384A JPH08115384A JP6249106A JP24910694A JPH08115384A JP H08115384 A JPH08115384 A JP H08115384A JP 6249106 A JP6249106 A JP 6249106A JP 24910694 A JP24910694 A JP 24910694A JP H08115384 A JPH08115384 A JP H08115384A
- Authority
- JP
- Japan
- Prior art keywords
- character
- loop
- block
- separation
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000926 separation method Methods 0.000 claims abstract description 86
- 238000001514 detection method Methods 0.000 claims abstract description 36
- 230000011218 segmentation Effects 0.000 claims description 2
- 230000008602 contraction Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 23
- 230000014509 gene expression Effects 0.000 description 14
- 238000000034 method Methods 0.000 description 10
- 239000011159 matrix material Substances 0.000 description 5
- 239000000284 extract Substances 0.000 description 3
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】
【目的】 文字同士が接触して成る文字塊を正確に分離
する文字切り出し装置を提供すること。 【構成】 本発明は、文字行画像データの中から文字塊
を文字塊切り出し部131にて切り出し、文字塊内での
ループ画素の有無を検出するとともにループ画素が存在
する場合に文字塊に対するループの位置に基づいて文字
塊における分離領域を分離領域検出決定部137によっ
て検出する。また、文字塊の中からくびれ部分の位置を
くびれ検出部132によって検出し、分離位置判断部1
36によって分離領域内に存在するくびれ部分を検出
し、接触文字分離部133によってそのくびれ部分での
文字塊分離を行う文字切り出し装置13である。
する文字切り出し装置を提供すること。 【構成】 本発明は、文字行画像データの中から文字塊
を文字塊切り出し部131にて切り出し、文字塊内での
ループ画素の有無を検出するとともにループ画素が存在
する場合に文字塊に対するループの位置に基づいて文字
塊における分離領域を分離領域検出決定部137によっ
て検出する。また、文字塊の中からくびれ部分の位置を
くびれ検出部132によって検出し、分離位置判断部1
36によって分離領域内に存在するくびれ部分を検出
し、接触文字分離部133によってそのくびれ部分での
文字塊分離を行う文字切り出し装置13である。
Description
【0001】
【産業上の利用分野】本発明は、文字認識等の処理を行
うにあたり、文字行画像データから文字パターンを適切
に切り出すための文字切り出し装置に関する。
うにあたり、文字行画像データから文字パターンを適切
に切り出すための文字切り出し装置に関する。
【0002】
【従来の技術】帳票や用紙などの媒体上に記載された文
字、図形、記号等(以下、単に文字と言う。)から成る
文字情報を読み取って正確に認識するには、文字画像か
ら文字パターンを的確に切り出す必要がある。この文字
パターンを的確に抽出し正確な認識を行うことができれ
ば、種々の情報処理装置(例えば、文字情報を記憶する
装置や文字情報を音声に変換する装置)を実現すること
が可能となる。
字、図形、記号等(以下、単に文字と言う。)から成る
文字情報を読み取って正確に認識するには、文字画像か
ら文字パターンを的確に切り出す必要がある。この文字
パターンを的確に抽出し正確な認識を行うことができれ
ば、種々の情報処理装置(例えば、文字情報を記憶する
装置や文字情報を音声に変換する装置)を実現すること
が可能となる。
【0003】ところが、入力された文字列によっては隣
合う文字パターンが接近していて間隔の狭くなっている
ものや、隣合う文字パターン同士が接触しているものな
どがあり、このような文字列から1文字づつ文字パター
ンを切り出すのは困難である。そこで、特開平3−27
5470号公報では、文字列画像データから切り出した
文字塊の中から他の箇所に比べて十分細いくびれ部分を
検出し、そこを接触部分として文字塊を分離することで
1文字づつの文字パターン切り出しを行う技術が開示さ
れている。
合う文字パターンが接近していて間隔の狭くなっている
ものや、隣合う文字パターン同士が接触しているものな
どがあり、このような文字列から1文字づつ文字パター
ンを切り出すのは困難である。そこで、特開平3−27
5470号公報では、文字列画像データから切り出した
文字塊の中から他の箇所に比べて十分細いくびれ部分を
検出し、そこを接触部分として文字塊を分離することで
1文字づつの文字パターン切り出しを行う技術が開示さ
れている。
【0004】図11は、従来例を説明するブロック図で
あり、特開平3−275470号公報に開示されている
ものである。図11(a)は従来の文字切り出し装置3
3が適応される文字認識装置30のブロック図である。
この文字認識装置30は、画像入力部31、文字行切り
出し部32、文字切り出し装置33、文字認識部34お
よび文字コード出力端子35から構成されている。
あり、特開平3−275470号公報に開示されている
ものである。図11(a)は従来の文字切り出し装置3
3が適応される文字認識装置30のブロック図である。
この文字認識装置30は、画像入力部31、文字行切り
出し部32、文字切り出し装置33、文字認識部34お
よび文字コード出力端子35から構成されている。
【0005】この文字認識装置30にて帳票等の媒体上
に記載された文字を認識するには、先ず画像入力部31
で媒体上に記載された文字からの光信号S(例えば、文
字からの反射光)を取り込み、例えば文字部分は黒
(「1」データ)、背景部分は白(「0」データ)とい
った2値化電気信号に変換して画像データを得る。次い
で、この画像データを文字行切り出し部32へ送り、こ
こで1行づつの文字行画像データを得て文字切り出し装
置33へ出力する。文字切り出し装置33では、文字行
画像データを1つ1つの文字パターンに切り出す処理を
行い、切り出した文字パターンを文字認識部34へ出力
する。文字認識部34は、1つ1つの文字パターンの所
定のマッチング処理によって認識し、文字に対応した文
字コードを文字コード出力端子35へ出力する。
に記載された文字を認識するには、先ず画像入力部31
で媒体上に記載された文字からの光信号S(例えば、文
字からの反射光)を取り込み、例えば文字部分は黒
(「1」データ)、背景部分は白(「0」データ)とい
った2値化電気信号に変換して画像データを得る。次い
で、この画像データを文字行切り出し部32へ送り、こ
こで1行づつの文字行画像データを得て文字切り出し装
置33へ出力する。文字切り出し装置33では、文字行
画像データを1つ1つの文字パターンに切り出す処理を
行い、切り出した文字パターンを文字認識部34へ出力
する。文字認識部34は、1つ1つの文字パターンの所
定のマッチング処理によって認識し、文字に対応した文
字コードを文字コード出力端子35へ出力する。
【0006】図11(b)は文字切り出し装置33の内
部構成を示すブロック図である。文字切り出し装置33
は、文字塊切り出し部331、くびれ検出部332、接
触文字分離部333から構成されている。文字塊切り出
し部331は、画像データにおける水平方向(以下、x
方向と言う場合もある。)と垂直方向(以下、y方向と
言う場合もある。)とに沿って走査を行い、先ず、垂直
方向の黒画素の分布を作成する。そして、この黒画素の
分布が「0」から「1」以上に変化する位置から、
「1」以上から「0」に変化する直前の位置までを文字
塊として切り出し、くびれ検出部332および接触文字
分離部3へ出力する。
部構成を示すブロック図である。文字切り出し装置33
は、文字塊切り出し部331、くびれ検出部332、接
触文字分離部333から構成されている。文字塊切り出
し部331は、画像データにおける水平方向(以下、x
方向と言う場合もある。)と垂直方向(以下、y方向と
言う場合もある。)とに沿って走査を行い、先ず、垂直
方向の黒画素の分布を作成する。そして、この黒画素の
分布が「0」から「1」以上に変化する位置から、
「1」以上から「0」に変化する直前の位置までを文字
塊として切り出し、くびれ検出部332および接触文字
分離部3へ出力する。
【0007】くびれ検出部332においては、入力され
た文字塊の画像データより、文字線のくびれ部分すなわ
ち他の箇所に比べて十分細い部分を検出して、その位置
座標を接触文字分離部333へ渡している。接触文字分
離部333では、くびれ位置の座標を分離位置として文
字塊切り出し部331から得た文字塊の画像データを分
離し、その結果得られた文字パターンを図11(a)に
示す文字認識部34へ渡している。
た文字塊の画像データより、文字線のくびれ部分すなわ
ち他の箇所に比べて十分細い部分を検出して、その位置
座標を接触文字分離部333へ渡している。接触文字分
離部333では、くびれ位置の座標を分離位置として文
字塊切り出し部331から得た文字塊の画像データを分
離し、その結果得られた文字パターンを図11(a)に
示す文字認識部34へ渡している。
【0008】なお、くびれ検出部332によって文字線
のくびれ部分を検出するには、切り出した文字塊の中の
全ての黒画素に対して水平方向、垂直方向、左斜め45
°方向、右斜め45°方向の連続黒画素数を数え、
(1)式のいずれかを満たした場合にその黒画素の位置
を文字線幅のくびれ部分として検出している。
のくびれ部分を検出するには、切り出した文字塊の中の
全ての黒画素に対して水平方向、垂直方向、左斜め45
°方向、右斜め45°方向の連続黒画素数を数え、
(1)式のいずれかを満たした場合にその黒画素の位置
を文字線幅のくびれ部分として検出している。
【0009】
【数1】
【0010】ここで、KH 、KV 、KL 、KR はそれぞ
れ水平方向、垂直方向、左斜め45°方向、右斜め45
°方向の連続黒画素数であり、TH 、TV 、TL 、TR
はそれぞれ水平方向、垂直方向、左斜め45°方向、右
斜め45°方向のしきい値(予め設定された固定値)で
ある。
れ水平方向、垂直方向、左斜め45°方向、右斜め45
°方向の連続黒画素数であり、TH 、TV 、TL 、TR
はそれぞれ水平方向、垂直方向、左斜め45°方向、右
斜め45°方向のしきい値(予め設定された固定値)で
ある。
【0011】図12は、文字塊分離の一例を説明する図
である。図12(a)は、帳票41上に例えば「t」と
「h」から成る文字42が接触した状態で記載されてい
る場合を示しており、図12(b)はこの文字42の画
像データを切り出した文字塊を示している。ここで、図
中「o」印は画像データにおける黒画素の部分を示して
いる(以下同様)。
である。図12(a)は、帳票41上に例えば「t」と
「h」から成る文字42が接触した状態で記載されてい
る場合を示しており、図12(b)はこの文字42の画
像データを切り出した文字塊を示している。ここで、図
中「o」印は画像データにおける黒画素の部分を示して
いる(以下同様)。
【0012】図11(b)に示す文字切り出し装置33
のくびれ検出部332は、図12(b)に示す(E)部
をくびれ部分として検出し、その座標を示す信号を図1
1(b)に示す接触文字分離部333へ渡している。接
触文字分離部333では、このくびれ部分の座標におい
て文字塊を分離し、図12(c)に示すような「t」と
「h」との2つの文字パターンに切り出す処理を行って
いる。
のくびれ検出部332は、図12(b)に示す(E)部
をくびれ部分として検出し、その座標を示す信号を図1
1(b)に示す接触文字分離部333へ渡している。接
触文字分離部333では、このくびれ部分の座標におい
て文字塊を分離し、図12(c)に示すような「t」と
「h」との2つの文字パターンに切り出す処理を行って
いる。
【0013】
【発明が解決しようとする課題】しかしながら、このよ
うな文字切り出し装置には次のような問題がある。すな
わち、上記説明した文字切り出し装置においては、文字
塊の中のくびれ部分を検出するにあたり、文字塊中の全
ての黒画素について(1)式を満足するか否かを検証
し、(1)式を満足する全ての黒画素の位置で文字塊の
分離処理を行っている。このため、実際には分離すべき
でない位置にもかかわらず誤って分離してしまい、文字
パターン切り出しにおける信頼性を低下させる原因とな
っている。
うな文字切り出し装置には次のような問題がある。すな
わち、上記説明した文字切り出し装置においては、文字
塊の中のくびれ部分を検出するにあたり、文字塊中の全
ての黒画素について(1)式を満足するか否かを検証
し、(1)式を満足する全ての黒画素の位置で文字塊の
分離処理を行っている。このため、実際には分離すべき
でない位置にもかかわらず誤って分離してしまい、文字
パターン切り出しにおける信頼性を低下させる原因とな
っている。
【0014】例えば、図13(a)に示すように、
「F」と「R」とが図中(G)部で接触している場合、
図中(F)部においても(1)式を満足するくびれ部分
となり、図13(b)に示すように、実際には分離すべ
きでない位置すなわち図13(a)に示す(F)部まで
も分離処理を行う結果となっている。また、図14
(a)に示す例においても、図中(H)部および(I)
部がくびれ部分であると判断し、図14(b)に示すよ
うに分離すべきでない文字「S」の(I)部(図14
(a)参照)を分離してしまっている。同様に、図15
(a)に示す例においても、図中(J)部、(K)部、
(L)部がくびれ部分であると判断し、図15(b)に
示すように分離すべきでない(L)部(図15(a)参
照)での分離を行っている。
「F」と「R」とが図中(G)部で接触している場合、
図中(F)部においても(1)式を満足するくびれ部分
となり、図13(b)に示すように、実際には分離すべ
きでない位置すなわち図13(a)に示す(F)部まで
も分離処理を行う結果となっている。また、図14
(a)に示す例においても、図中(H)部および(I)
部がくびれ部分であると判断し、図14(b)に示すよ
うに分離すべきでない文字「S」の(I)部(図14
(a)参照)を分離してしまっている。同様に、図15
(a)に示す例においても、図中(J)部、(K)部、
(L)部がくびれ部分であると判断し、図15(b)に
示すように分離すべきでない(L)部(図15(a)参
照)での分離を行っている。
【0015】このように、間違った位置で文字塊を分離
してしまうと、正確な文字パターンの切り出しとはなら
ず、誤認識を起こす結果となる。また、間違った位置で
文字塊を分離してしまった場合には、オペレータが正確
なデータを入力し直さなければならない、この修正作業
は膨大な切り出し結果の中から誤った切り出し結果を見
つける必要があり、複雑で多大な時間を要することにな
る。さらに、誤認識を起こした場合には、ここでもオペ
レータによる修正作業が必要となり、その結果、文字認
識処理における時間の長期化、および修正作業における
負担の増加を招くことになる。
してしまうと、正確な文字パターンの切り出しとはなら
ず、誤認識を起こす結果となる。また、間違った位置で
文字塊を分離してしまった場合には、オペレータが正確
なデータを入力し直さなければならない、この修正作業
は膨大な切り出し結果の中から誤った切り出し結果を見
つける必要があり、複雑で多大な時間を要することにな
る。さらに、誤認識を起こした場合には、ここでもオペ
レータによる修正作業が必要となり、その結果、文字認
識処理における時間の長期化、および修正作業における
負担の増加を招くことになる。
【0016】
【課題を解決するための手段】本発明は、このような課
題を解決するために成された文字切り出し装置である。
すなわち、本発明は、文字行画像データから文字パター
ンを切り出すための文字切り出し装置であり、文字行画
像データの中から文字パターンを示すための画素が連続
する文字塊を文字塊切り出し手段によって切り出し、文
字塊内で文字パターンとその背景との境界となる画素の
うち閉ループを構成するループ画素の有無を検出すると
ともにループが存在する場合に文字塊に対するループ画
素の位置に基づいて文字塊が接触文字か否かを判断し、
接触文字の場合にはその文字塊における分離領域を分離
領域検出手段によって検出する。また、文字塊の中から
文字線のくびれ部分の位置をくびれ検出手段によって検
出し、分離手段によって分離領域内に存在するくびれ部
分を検出しそのくびれ部分の位置で文字塊を分離して文
字パターンの切り出しを行うものである。
題を解決するために成された文字切り出し装置である。
すなわち、本発明は、文字行画像データから文字パター
ンを切り出すための文字切り出し装置であり、文字行画
像データの中から文字パターンを示すための画素が連続
する文字塊を文字塊切り出し手段によって切り出し、文
字塊内で文字パターンとその背景との境界となる画素の
うち閉ループを構成するループ画素の有無を検出すると
ともにループが存在する場合に文字塊に対するループ画
素の位置に基づいて文字塊が接触文字か否かを判断し、
接触文字の場合にはその文字塊における分離領域を分離
領域検出手段によって検出する。また、文字塊の中から
文字線のくびれ部分の位置をくびれ検出手段によって検
出し、分離手段によって分離領域内に存在するくびれ部
分を検出しそのくびれ部分の位置で文字塊を分離して文
字パターンの切り出しを行うものである。
【0017】
【作用】本発明では、文字塊切り出し手段によって切り
出された文字塊内において文字パターンとその背景との
境界となる画素のうち閉ループを構成するループ画素の
有無を分離領域検出手段で検出している。さらに、分離
領域検出手段は、ループ画素が存在する場合に文字塊に
対するループの位置に基づいて文字塊における分離領域
を検出している。すなわち、文字塊とその中に存在する
ループ画素との相対位置から、その文字塊が複数の文字
パターンから構成されている接触文字か否かを判断する
とともに、接触文字から成ると判断した場合にその文字
塊を分離すべき領域を特定している。つまり、実際に分
離すべき位置が分離領域検出手段で検出した分離領域内
にあるものと判断でき、分離手段において分離領域内に
存在するくびれ部分での文字塊分離を行っている。これ
によって、的確な部分での分離による文字パターン切り
出しを行うことができるようになる。
出された文字塊内において文字パターンとその背景との
境界となる画素のうち閉ループを構成するループ画素の
有無を分離領域検出手段で検出している。さらに、分離
領域検出手段は、ループ画素が存在する場合に文字塊に
対するループの位置に基づいて文字塊における分離領域
を検出している。すなわち、文字塊とその中に存在する
ループ画素との相対位置から、その文字塊が複数の文字
パターンから構成されている接触文字か否かを判断する
とともに、接触文字から成ると判断した場合にその文字
塊を分離すべき領域を特定している。つまり、実際に分
離すべき位置が分離領域検出手段で検出した分離領域内
にあるものと判断でき、分離手段において分離領域内に
存在するくびれ部分での文字塊分離を行っている。これ
によって、的確な部分での分離による文字パターン切り
出しを行うことができるようになる。
【0018】
【実施例】以下に本発明の文字切り出し装置における実
施例を図に基づいて説明する。図1は本発明の文字切り
出し装置における第1実施例を説明するブロック図であ
り、(a)は文字切り出し装置を適応した文字認識装
置、(b)は文字切り出し装置の構成を示すものであ
る。図1(a)に示すように、この文字認識装置10
は、画像入力部11、文字行切り出し部12、第1実施
例にかかる文字切り出し装置13、文字認識部14、文
字コード出力端子15から構成されている。
施例を図に基づいて説明する。図1は本発明の文字切り
出し装置における第1実施例を説明するブロック図であ
り、(a)は文字切り出し装置を適応した文字認識装
置、(b)は文字切り出し装置の構成を示すものであ
る。図1(a)に示すように、この文字認識装置10
は、画像入力部11、文字行切り出し部12、第1実施
例にかかる文字切り出し装置13、文字認識部14、文
字コード出力端子15から構成されている。
【0019】この文字認識装置10によって文字認識を
行うには、先ず、帳票等の媒体上に記載された文字から
の光信号S(例えば、文字からの反射光)をスキャナ等
から成る画像入力部11にて取り込み、2値化電気信号
に変換して画像データを得る。画像データは、例えば文
字部分が黒(「1」データ)、背景部分が白(「0」デ
ータ)から成るものである。
行うには、先ず、帳票等の媒体上に記載された文字から
の光信号S(例えば、文字からの反射光)をスキャナ等
から成る画像入力部11にて取り込み、2値化電気信号
に変換して画像データを得る。画像データは、例えば文
字部分が黒(「1」データ)、背景部分が白(「0」デ
ータ)から成るものである。
【0020】次いで、この画像データを文字行切り出し
部12へ送り、ここで1行づつの文字行画像データを得
て文字切り出し装置13へ出力する。文字切り出し装置
13では、文字行画像データを1つ1つの文字パターン
に切り出す処理を行い、切り出した文字パターンを文字
認識部14へ出力する。文字認識部14は、1つ1つの
文字パターンを所定のマッチング処理によって認識し、
文字に対応した文字コードを出力端子15へ出力する。
部12へ送り、ここで1行づつの文字行画像データを得
て文字切り出し装置13へ出力する。文字切り出し装置
13では、文字行画像データを1つ1つの文字パターン
に切り出す処理を行い、切り出した文字パターンを文字
認識部14へ出力する。文字認識部14は、1つ1つの
文字パターンを所定のマッチング処理によって認識し、
文字に対応した文字コードを出力端子15へ出力する。
【0021】本実施例においては、文字行画像データか
ら1つ1つの文字パターンに切り出す処理を行う文字切
り出し装置13に特徴がある。すなわち、本実施例にお
ける文字切り出し装置13は、文字行画像データから切
り出した文字塊内において文字パターンとその背景との
境界となる画素(文字パターンを示すための画素)のう
ち閉ループを構成するループ画素を検出し、文字塊とこ
のループ画素との相対位置に基づいて文字塊が接触文字
か否かを判断し、接触文字の場合には、文字塊を分離す
べき領域および位置(文字パターンが接触している位
置)を判断している。
ら1つ1つの文字パターンに切り出す処理を行う文字切
り出し装置13に特徴がある。すなわち、本実施例にお
ける文字切り出し装置13は、文字行画像データから切
り出した文字塊内において文字パターンとその背景との
境界となる画素(文字パターンを示すための画素)のう
ち閉ループを構成するループ画素を検出し、文字塊とこ
のループ画素との相対位置に基づいて文字塊が接触文字
か否かを判断し、接触文字の場合には、文字塊を分離す
べき領域および位置(文字パターンが接触している位
置)を判断している。
【0022】ここで、文字塊内のループ画素の位置に基
づき分離すべき領域および位置を判断するための原理を
説明する。例えば、欧文文字において、文字中にループ
(輪)を持つもの(例えば、「O」、「P」、「g」、
「B」)では1文字中の最大ループ数は2個であり
(「g」や「B」)、しかもその2つのループはy方向
(垂直方向)に並ぶものだけである。つまり、1文字に
おいて2つのループがx方向(水平方向)に並ぶ場合は
なく、またそのループの幅(x方向の長さ)は文字全体
の幅とほぼ等しくなっている。
づき分離すべき領域および位置を判断するための原理を
説明する。例えば、欧文文字において、文字中にループ
(輪)を持つもの(例えば、「O」、「P」、「g」、
「B」)では1文字中の最大ループ数は2個であり
(「g」や「B」)、しかもその2つのループはy方向
(垂直方向)に並ぶものだけである。つまり、1文字に
おいて2つのループがx方向(水平方向)に並ぶ場合は
なく、またそのループの幅(x方向の長さ)は文字全体
の幅とほぼ等しくなっている。
【0023】一方、ループを持つ文字が他の文字と接触
した場合の文字塊を考えると、ループのある文字の後ろ
に他の文字が接触するとループの位置は文字塊全体の位
置に対して左寄りとなる。反対に、ループを持つ文字の
前に他の文字が接触するとループの位置は文字塊全体の
位置に対して右寄りとなる。また、ループを持つ文字の
前後に他の文字が接触するとループの位置は文字塊全体
に対してほぼ中央となるが、ループの幅に対して文字塊
の幅がかなり大きくなる。
した場合の文字塊を考えると、ループのある文字の後ろ
に他の文字が接触するとループの位置は文字塊全体の位
置に対して左寄りとなる。反対に、ループを持つ文字の
前に他の文字が接触するとループの位置は文字塊全体の
位置に対して右寄りとなる。また、ループを持つ文字の
前後に他の文字が接触するとループの位置は文字塊全体
に対してほぼ中央となるが、ループの幅に対して文字塊
の幅がかなり大きくなる。
【0024】このことから、文字塊内におけるループの
相対位置を検出することによって、ループの前後どちら
に他の文字が接触しているかを判断し、文字塊の分離領
域および分離位置を判断できることになる。例えば、切
り出した文字塊内にループが存在し、その位置が文字塊
全体に対してx方向にみて左寄りとなっている場合に
は、この文字塊はループを持つ文字の後ろに他の文字が
接触するものであると判断できる。また、ループの位置
が文字塊全体に対してx方向にみて右寄りとなっている
場合には、この文字塊はループを持つ文字の前に他の文
字が接触するものであると判断できる。
相対位置を検出することによって、ループの前後どちら
に他の文字が接触しているかを判断し、文字塊の分離領
域および分離位置を判断できることになる。例えば、切
り出した文字塊内にループが存在し、その位置が文字塊
全体に対してx方向にみて左寄りとなっている場合に
は、この文字塊はループを持つ文字の後ろに他の文字が
接触するものであると判断できる。また、ループの位置
が文字塊全体に対してx方向にみて右寄りとなっている
場合には、この文字塊はループを持つ文字の前に他の文
字が接触するものであると判断できる。
【0025】また、ループの位置が文字塊全体に対して
ほぼ中央となっているが、ループの幅に対して文字塊の
幅がかなり大きい場合(例えば3倍以上の場合)には、
この文字塊はループを持つ文字の前後に他の文字が接触
するものであると判断できる。なお、ループの位置が文
字塊全体に対してほぼ中央となっており、ループの幅と
文字塊の幅とがほぼ等しい場合には、この文字塊はルー
プを持つ文字1つから成るものと判断できる。この考え
方は、ループを持つ文字に対して3文字以上他の文字が
接触する場合であっても同様である。これによって判断
された文字の接触位置に基づき、文字塊の分離領域およ
び分離位置を判断することができるようになる。
ほぼ中央となっているが、ループの幅に対して文字塊の
幅がかなり大きい場合(例えば3倍以上の場合)には、
この文字塊はループを持つ文字の前後に他の文字が接触
するものであると判断できる。なお、ループの位置が文
字塊全体に対してほぼ中央となっており、ループの幅と
文字塊の幅とがほぼ等しい場合には、この文字塊はルー
プを持つ文字1つから成るものと判断できる。この考え
方は、ループを持つ文字に対して3文字以上他の文字が
接触する場合であっても同様である。これによって判断
された文字の接触位置に基づき、文字塊の分離領域およ
び分離位置を判断することができるようになる。
【0026】次に、このような文字塊とループとの位置
関係から文字塊を分離する考え方を反映するための第1
実施例を具体的に説明する。第1実施例における文字切
り出し装置13は図1(b)に示すような構成となって
いる。すなわち、第1実施例における文字切り出し装置
13は、主として文字塊切り出し部131と、検出分離
部138と、分離領域決定部137とから構成されてい
る。また、検出分離部138はくびれ検出部132と、
接触文字分離部133と、分離位置判断部136とから
成り、分離領域決定部137はループ検出部134と、
相対位置判断部135とから成る。
関係から文字塊を分離する考え方を反映するための第1
実施例を具体的に説明する。第1実施例における文字切
り出し装置13は図1(b)に示すような構成となって
いる。すなわち、第1実施例における文字切り出し装置
13は、主として文字塊切り出し部131と、検出分離
部138と、分離領域決定部137とから構成されてい
る。また、検出分離部138はくびれ検出部132と、
接触文字分離部133と、分離位置判断部136とから
成り、分離領域決定部137はループ検出部134と、
相対位置判断部135とから成る。
【0027】このような文字切り出し装置13におい
て、文字塊切り出し部131は文字行切り出し部12
(図1(a)参照)から得た文字行画像データをy方向
を主走査方向、x方向を副走査方向として走査し、y方
向の黒画素の分布を作成する。そして、この黒画素の分
布が「0」から「1」以上に変化する位置から、「1」
以上から「0」に変化する直前の位置までを文字塊とし
て切り出して、その文字塊をループ検出部134、くび
れ検出部132および接触文字分離部133へ出力して
いる。
て、文字塊切り出し部131は文字行切り出し部12
(図1(a)参照)から得た文字行画像データをy方向
を主走査方向、x方向を副走査方向として走査し、y方
向の黒画素の分布を作成する。そして、この黒画素の分
布が「0」から「1」以上に変化する位置から、「1」
以上から「0」に変化する直前の位置までを文字塊とし
て切り出して、その文字塊をループ検出部134、くび
れ検出部132および接触文字分離部133へ出力して
いる。
【0028】また、ループ検出部134は、切り出され
た文字塊内のループの有無と、ループがあった場合に文
字行画像データ上におけるそのループ画素の座標を調
べ、ループの有無および座標を示す信号を相対位置判断
部135へ出力している。相対位置判断部135では、
ループ検出部134より受けたループ画素の座標に基づ
きループの文字塊に対する位置を判断し、その判断結果
より文字塊が接触文字か否かを判断し、接触文字の場合
には文字同士の接触位置の存在し得る領域を推定する。
そして、この領域を示す信号(座標データ)を分離位置
判断部136へ出力している。なお、ループ検出部13
4から相対位置判断部135に対して文字塊内にループ
が無い旨の信号が送られた場合には、相対位置判断部1
35は文字塊を分離する領域が無い(すなわち、文字塊
を分離しない)ことを示す信号を分離位置判断部136
に出力する。
た文字塊内のループの有無と、ループがあった場合に文
字行画像データ上におけるそのループ画素の座標を調
べ、ループの有無および座標を示す信号を相対位置判断
部135へ出力している。相対位置判断部135では、
ループ検出部134より受けたループ画素の座標に基づ
きループの文字塊に対する位置を判断し、その判断結果
より文字塊が接触文字か否かを判断し、接触文字の場合
には文字同士の接触位置の存在し得る領域を推定する。
そして、この領域を示す信号(座標データ)を分離位置
判断部136へ出力している。なお、ループ検出部13
4から相対位置判断部135に対して文字塊内にループ
が無い旨の信号が送られた場合には、相対位置判断部1
35は文字塊を分離する領域が無い(すなわち、文字塊
を分離しない)ことを示す信号を分離位置判断部136
に出力する。
【0029】一方、くびれ検出部132は、文字塊切り
出し部131から得た文字塊の画像データより、従来例
と同様の方法で文字塊のくびれ部分を抽出し、そのくび
れ部分の位置の座標を示す信号を分離位置判断部136
へ出力する。分離位置判断部136では、くびれ検出部
132から受けた信号と相対位置判断部135から受け
た信号とに基づき、文字塊の分離領域内に存在するくび
れ部分を抽出し、これが複数ある場合にはその中で最も
ループに近いくびれ部分を分離位置として選択し、その
座標を示す信号を接触文字分離部133へ出力する。接
触文字分離部133は、分離位置判断部136から得た
分離位置にて文字塊を分離し、文字パターンの切り出し
を行う。そして、切り出した文字パターンを文字認識部
14(図1(a)参照)へ出力している。
出し部131から得た文字塊の画像データより、従来例
と同様の方法で文字塊のくびれ部分を抽出し、そのくび
れ部分の位置の座標を示す信号を分離位置判断部136
へ出力する。分離位置判断部136では、くびれ検出部
132から受けた信号と相対位置判断部135から受け
た信号とに基づき、文字塊の分離領域内に存在するくび
れ部分を抽出し、これが複数ある場合にはその中で最も
ループに近いくびれ部分を分離位置として選択し、その
座標を示す信号を接触文字分離部133へ出力する。接
触文字分離部133は、分離位置判断部136から得た
分離位置にて文字塊を分離し、文字パターンの切り出し
を行う。そして、切り出した文字パターンを文字認識部
14(図1(a)参照)へ出力している。
【0030】次に、ループ検出部134における具体的
なループ検出処理を以下に説明する。ループ検出部13
4は、先ず文字塊切り出し部131から得た文字塊の画
像データにおいて、走査線のy座標を一定としx座標の
正方向に沿って黒画素の有無を検出する。そして、この
検出を走査線のy座標における最小値から最大値まで順
に変えて行い、背景部との境界にある黒画素(以下、輪
郭点と言う。)が最初に検出された段階で、その黒画素
より輪郭点に沿って文字塊の周りを1周する。(以下、
この処理を輪郭追跡と言う。)。
なループ検出処理を以下に説明する。ループ検出部13
4は、先ず文字塊切り出し部131から得た文字塊の画
像データにおいて、走査線のy座標を一定としx座標の
正方向に沿って黒画素の有無を検出する。そして、この
検出を走査線のy座標における最小値から最大値まで順
に変えて行い、背景部との境界にある黒画素(以下、輪
郭点と言う。)が最初に検出された段階で、その黒画素
より輪郭点に沿って文字塊の周りを1周する。(以下、
この処理を輪郭追跡と言う。)。
【0031】一方、文字パターンに対応した2次元配列
を容易し、その配列において文字パターンの白画素と座
標が対応する配列の要素には「0」のフラグを、黒画素
と座標が対応する配列の要素には「1」のフラグを立
て、さらに輪郭点と座標が対応する配列の要素には
「2」のフラグを立てる。次に、この文字塊において輪
郭点の走査をもう1度行い、検出された輪郭点のうち座
標が対応する配列の要素に「2」のフラグが立っていな
いものがあった場合に、その輪郭点を文字塊内のループ
における輪郭点と判断する。そして、この輪郭点よりル
ープの輪郭追跡を行い、検出された輪郭点と座標が対応
する2次元配列の要素に「3」のフラグを立てる。
を容易し、その配列において文字パターンの白画素と座
標が対応する配列の要素には「0」のフラグを、黒画素
と座標が対応する配列の要素には「1」のフラグを立
て、さらに輪郭点と座標が対応する配列の要素には
「2」のフラグを立てる。次に、この文字塊において輪
郭点の走査をもう1度行い、検出された輪郭点のうち座
標が対応する配列の要素に「2」のフラグが立っていな
いものがあった場合に、その輪郭点を文字塊内のループ
における輪郭点と判断する。そして、この輪郭点よりル
ープの輪郭追跡を行い、検出された輪郭点と座標が対応
する2次元配列の要素に「3」のフラグを立てる。
【0032】図2〜図3は、ループ検出部134(図1
(b)参照)によるループ検出の一例を説明する図であ
る。図2〜図3において、横軸はx座標、縦軸はy座標
を示し、各座標軸には10画素毎に罫線を付してある。
先ず、図2に示す文字塊100の外郭を輪郭追跡し、文
字塊100の輪郭点と座標が対応する2次元配列の要素
に「2」のフラグを立て、輪郭点以外の黒画素と座標が
対応する2次元配列の要素に「1」のフラグを立てる。
この様子を図3(a)に示す。
(b)参照)によるループ検出の一例を説明する図であ
る。図2〜図3において、横軸はx座標、縦軸はy座標
を示し、各座標軸には10画素毎に罫線を付してある。
先ず、図2に示す文字塊100の外郭を輪郭追跡し、文
字塊100の輪郭点と座標が対応する2次元配列の要素
に「2」のフラグを立て、輪郭点以外の黒画素と座標が
対応する2次元配列の要素に「1」のフラグを立てる。
この様子を図3(a)に示す。
【0033】次に、文字塊100にて黒画素の走査を座
標y=1からもう1度行う。図2の文字塊100におい
て、y=4の走査線(図中破線参照)でx座標の正方向
に走査したとき、x=4の点(A)を輪郭点として検出
するが、図3(a)の2次元配列ではx=4,y=4の
要素には既に「2」のフラグが立っており輪郭追跡を終
えたものであることが分かる。さらに走査線に沿った走
査を続け、x=5,y=4では黒画素を検出し、x=
7,y=4の点(B)を輪郭点として検出する。この点
(B)と座標が対応する2次元配列の要素(図3(a)
参照)には「2」のフラグが立っていないことから、こ
れをループの輪郭点として検出し、この輪郭点より輪郭
追跡を開始する。そして、検出した輪郭点と座標が対応
する2次元配列の要素に「3」のフラグを立てる。この
様子を図3(b)に示す。
標y=1からもう1度行う。図2の文字塊100におい
て、y=4の走査線(図中破線参照)でx座標の正方向
に走査したとき、x=4の点(A)を輪郭点として検出
するが、図3(a)の2次元配列ではx=4,y=4の
要素には既に「2」のフラグが立っており輪郭追跡を終
えたものであることが分かる。さらに走査線に沿った走
査を続け、x=5,y=4では黒画素を検出し、x=
7,y=4の点(B)を輪郭点として検出する。この点
(B)と座標が対応する2次元配列の要素(図3(a)
参照)には「2」のフラグが立っていないことから、こ
れをループの輪郭点として検出し、この輪郭点より輪郭
追跡を開始する。そして、検出した輪郭点と座標が対応
する2次元配列の要素に「3」のフラグを立てる。この
様子を図3(b)に示す。
【0034】つまり、文字塊100の外郭画素と対応す
る要素がフラグ「2」で示され、ループ画素と対応する
要素がフラグ「3」で示されることになる。図1(b)
に示すループ検出部134は、このような処理によって
文字塊内のループの有無および位置を検出し、その座標
を相対位置判断部135へ渡すことになる。
る要素がフラグ「2」で示され、ループ画素と対応する
要素がフラグ「3」で示されることになる。図1(b)
に示すループ検出部134は、このような処理によって
文字塊内のループの有無および位置を検出し、その座標
を相対位置判断部135へ渡すことになる。
【0035】次に相対位置判断部135における処理を
図4〜図7に基づいて説明する。相対位置判断部135
は、文字塊の文字行画像データ上でのループの相対的な
位置を判断する。ループと文字塊との相対的な位置関係
は以下の4通りとなる。図4(a)、(b)および図5
(a)、(b)にそれ4通りの場合を示す。
図4〜図7に基づいて説明する。相対位置判断部135
は、文字塊の文字行画像データ上でのループの相対的な
位置を判断する。ループと文字塊との相対的な位置関係
は以下の4通りとなる。図4(a)、(b)および図5
(a)、(b)にそれ4通りの場合を示す。
【0036】すなわち、図4(a)に示す位置関係にお
いては、ループ101の位置がx方向(図中横方向)に
みて文字塊102のほぼ中央にあり、しかもループ10
1の幅が文字塊102の幅と同じくらいとなっている。
これは、「O」や「P」等の文字を単独で切り出した場
合に生じる位置関係である。以下、このような位置関係
をケースAとする。
いては、ループ101の位置がx方向(図中横方向)に
みて文字塊102のほぼ中央にあり、しかもループ10
1の幅が文字塊102の幅と同じくらいとなっている。
これは、「O」や「P」等の文字を単独で切り出した場
合に生じる位置関係である。以下、このような位置関係
をケースAとする。
【0037】図4(b)に示す位置関係においては、ル
ープ103の位置がx方向にみて文字塊104全体に対
して左寄りとなっている。これは、「O」や「P」等の
文字の後に他の1文字以上が接触した場合に生じる位置
関係である。以下、このような位置関係をケースBとす
る。このケースBの場合には、文字同士の接触位置がx
方向にみてループ103の右側の領域にあること分か
る。また、図5(a)に示す位置関係においては、ルー
プ111の位置がx方向にみて文字塊112全体に対し
て右寄りとなっている。これは、「O」や「P」等の文
字の前に他の1文字以上が接触した場合に生じる位置関
係である。以下、このような位置関係をケースCとす
る。このケースCの場合には、文字同士の接触位置がx
方向にみてループ111の左側の領域にあること分か
る。
ープ103の位置がx方向にみて文字塊104全体に対
して左寄りとなっている。これは、「O」や「P」等の
文字の後に他の1文字以上が接触した場合に生じる位置
関係である。以下、このような位置関係をケースBとす
る。このケースBの場合には、文字同士の接触位置がx
方向にみてループ103の右側の領域にあること分か
る。また、図5(a)に示す位置関係においては、ルー
プ111の位置がx方向にみて文字塊112全体に対し
て右寄りとなっている。これは、「O」や「P」等の文
字の前に他の1文字以上が接触した場合に生じる位置関
係である。以下、このような位置関係をケースCとす
る。このケースCの場合には、文字同士の接触位置がx
方向にみてループ111の左側の領域にあること分か
る。
【0038】さらに、図5(b)に示す位置関係におい
ては、ループ113の位置がx方向にみて文字塊114
のほぼ中央にあるが、先に説明したケースAと異なるの
は、ループ画素113の幅に比べて文字塊114の幅が
かなり広くなっていることである。これは、「O」や
「P」等の文字の前と後ろにそれぞれ他の1文字以上が
接触した場合に生じる位置関係である。以下、このよう
な位置関係をケースDとする。このケースDの場合に
は、文字同士の接触位置がx方向にみてループ113の
右側と左側との両方の領域にあること分かる。
ては、ループ113の位置がx方向にみて文字塊114
のほぼ中央にあるが、先に説明したケースAと異なるの
は、ループ画素113の幅に比べて文字塊114の幅が
かなり広くなっていることである。これは、「O」や
「P」等の文字の前と後ろにそれぞれ他の1文字以上が
接触した場合に生じる位置関係である。以下、このよう
な位置関係をケースDとする。このケースDの場合に
は、文字同士の接触位置がx方向にみてループ113の
右側と左側との両方の領域にあること分かる。
【0039】次に、上記説明した4つのケースへの分類
処理を、式を用いて説明する。先ず、ループを含む文字
塊において、(2)式を用いて文字平均線幅Wを求め
る。
処理を、式を用いて説明する。先ず、ループを含む文字
塊において、(2)式を用いて文字平均線幅Wを求め
る。
【0040】
【数2】
【0041】この(2)式で、Aは文字塊におけるパタ
ーンの全ての黒画素数であり、またQは文字塊を2×2
の窓で走査したときに、その窓の全てが黒画素となる点
の個数である。次に、このWに基づき(3)式を用いて
LとHとを求める。
ーンの全ての黒画素数であり、またQは文字塊を2×2
の窓で走査したときに、その窓の全てが黒画素となる点
の個数である。次に、このWに基づき(3)式を用いて
LとHとを求める。
【0042】
【数3】
【0043】この(3)式で、x1 はループのx方向に
おける最小値、x2 はループのx方向における最大値で
あり、tは文字の書体などによって適宜決定する定数で
ある。ただし、0<tである。文字塊とループとの相対
的な位置関係を判断するには、この(2)式、(3)式
で求めたW、H、Lの値を用いて、対象となる文字塊が
次の(4)式〜(7)式までのどれを満たすかにより判
断する。
おける最小値、x2 はループのx方向における最大値で
あり、tは文字の書体などによって適宜決定する定数で
ある。ただし、0<tである。文字塊とループとの相対
的な位置関係を判断するには、この(2)式、(3)式
で求めたW、H、Lの値を用いて、対象となる文字塊が
次の(4)式〜(7)式までのどれを満たすかにより判
断する。
【0044】
【数4】
【0045】
【数5】
【0046】
【数6】
【0047】
【数7】
【0048】(4)式〜(7)式においてx3 は文字塊
のx方向における最小値、x4 は文字塊のx方向におけ
る最大値である。図6〜図7は、分離領域の判断を説明
する図であり、図6(a)は(4)式を満たす場合、図
6(b)は(5)式を満たす場合、図7(a)は(6)
式を満たす場合、図7(b)は(7)式を満たす場合に
それぞれ対応している。すなわち、図6(a)では文字
塊102がL〜Hの間に収まる場合つまり(4)式を満
たす場合であり、ループ101と文字塊102との幅が
ほぼ等しいケースAに対応している。この場合には、文
字塊102の分離領域はなく、相対位置判断部135は
文字塊は接触文字ではないと判断し、分離を行わない旨
を示す信号を分離位置判断部136に出力する。
のx方向における最小値、x4 は文字塊のx方向におけ
る最大値である。図6〜図7は、分離領域の判断を説明
する図であり、図6(a)は(4)式を満たす場合、図
6(b)は(5)式を満たす場合、図7(a)は(6)
式を満たす場合、図7(b)は(7)式を満たす場合に
それぞれ対応している。すなわち、図6(a)では文字
塊102がL〜Hの間に収まる場合つまり(4)式を満
たす場合であり、ループ101と文字塊102との幅が
ほぼ等しいケースAに対応している。この場合には、文
字塊102の分離領域はなく、相対位置判断部135は
文字塊は接触文字ではないと判断し、分離を行わない旨
を示す信号を分離位置判断部136に出力する。
【0049】また、図6(b)では文字塊104のx3
、x4 がx方向にみて各々L、Hよりも右側にある場
合つまり(5)式を満たす場合であり、ループ103と
文字塊104との相対的な位置関係がケースBの場合に
対応している。この場合には、文字同士の接触点の存在
し得る領域がx2 <x<Hであると判断し、相対位置判
断部135はこの範囲を分離領域であることを示す信号
を分離位置判断部136に出力する。
、x4 がx方向にみて各々L、Hよりも右側にある場
合つまり(5)式を満たす場合であり、ループ103と
文字塊104との相対的な位置関係がケースBの場合に
対応している。この場合には、文字同士の接触点の存在
し得る領域がx2 <x<Hであると判断し、相対位置判
断部135はこの範囲を分離領域であることを示す信号
を分離位置判断部136に出力する。
【0050】また、図7(a)では文字塊112のx3
、x4 がx方向にみて各々L、Hよりも左側にある場
合つまり(6)式を満たす場合であり、ループ111と
文字塊112との相対的な位置関係がケースCの場合に
対応している。この場合には、文字同士の接触点の存在
し得る領域がL<x<x1 であると判断し、相対位置判
断部135はこの範囲を分離領域であることを示す信号
を分離位置判断部136に出力する。
、x4 がx方向にみて各々L、Hよりも左側にある場
合つまり(6)式を満たす場合であり、ループ111と
文字塊112との相対的な位置関係がケースCの場合に
対応している。この場合には、文字同士の接触点の存在
し得る領域がL<x<x1 であると判断し、相対位置判
断部135はこの範囲を分離領域であることを示す信号
を分離位置判断部136に出力する。
【0051】さらに、図7(b)ではx方向にみて文字
塊114のx3 とx4 との間にL、Hがある場合つまり
(7)式を満たす場合であり、ループ113と文字塊1
14との相対的な位置関係がケースDの場合に対応して
いる。この場合には、文字同士の接触点の存在し得る領
域をL<x<x1 とx2 <x<Hとの2つと判断し、相
対位置判断部135はこの2つの範囲を分離領域である
ことを示す信号を分離位置判断部136に出力する。
塊114のx3 とx4 との間にL、Hがある場合つまり
(7)式を満たす場合であり、ループ113と文字塊1
14との相対的な位置関係がケースDの場合に対応して
いる。この場合には、文字同士の接触点の存在し得る領
域をL<x<x1 とx2 <x<Hとの2つと判断し、相
対位置判断部135はこの2つの範囲を分離領域である
ことを示す信号を分離位置判断部136に出力する。
【0052】次に、このような判断に基づいた相対位置
判断部135の処理の具体例を、図8を用いて説明す
る。図8では、文字「F」と「R」とが接触している場
合の例であり、図8(a)は分離前、図8(b)は分離
後を示している。図8(a)では、分離前すなわち接触
している状態の文字塊についてx、yの座標軸を付した
ものであり、10画素毎に罫線を入れてある。この文字
塊のループ(文字「R」のループ部分)のx方向におけ
る最小値x1、最大値x2 、文字塊のx方向における最
小値x3 、最大値x4 は以下の通りである。 x1 =34、x2 =44、x3 =5、x4 =52。
判断部135の処理の具体例を、図8を用いて説明す
る。図8では、文字「F」と「R」とが接触している場
合の例であり、図8(a)は分離前、図8(b)は分離
後を示している。図8(a)では、分離前すなわち接触
している状態の文字塊についてx、yの座標軸を付した
ものであり、10画素毎に罫線を入れてある。この文字
塊のループ(文字「R」のループ部分)のx方向におけ
る最小値x1、最大値x2 、文字塊のx方向における最
小値x3 、最大値x4 は以下の通りである。 x1 =34、x2 =44、x3 =5、x4 =52。
【0053】また、(2)式よりこの場合の文字平均線
幅Wは、W=A/(A−Q)=600/(600−41
4)=3.22となり、(3)式よりL=x1 −t×W
=34−3×3.22≒24、H=x2 +t×W=44
+3×3.22≒53となる、なお、この場合において
t=3を用いた。これより、文字塊における文字行画像
データは(6)式を満たすため、ループの位置はケース
Cとなり、文字同士の接触点の存在する領域は24<x
<34であると判断する。そして、相対位置判断部13
5は、この領域を示す信号を分離位置判断部136へ出
力することになる。
幅Wは、W=A/(A−Q)=600/(600−41
4)=3.22となり、(3)式よりL=x1 −t×W
=34−3×3.22≒24、H=x2 +t×W=44
+3×3.22≒53となる、なお、この場合において
t=3を用いた。これより、文字塊における文字行画像
データは(6)式を満たすため、ループの位置はケース
Cとなり、文字同士の接触点の存在する領域は24<x
<34であると判断する。そして、相対位置判断部13
5は、この領域を示す信号を分離位置判断部136へ出
力することになる。
【0054】分離位置判断部136は、図8(a)にお
ける文字塊の2か所のくびれ部分(C)、(D)のう
ち、先に判断した領域内に存在するくびれ部分(D)を
分離点として選択し、その分離点の座標を接触文字分離
部133へ出力する。接触文字分離部133では、文字
塊のくびれ部分(D)で分離する処理を行う。この結
果、図8(b)に示すように文字「F」と「R」とを正
確に分離することが可能となる。
ける文字塊の2か所のくびれ部分(C)、(D)のう
ち、先に判断した領域内に存在するくびれ部分(D)を
分離点として選択し、その分離点の座標を接触文字分離
部133へ出力する。接触文字分離部133では、文字
塊のくびれ部分(D)で分離する処理を行う。この結
果、図8(b)に示すように文字「F」と「R」とを正
確に分離することが可能となる。
【0055】また、同様な判断によって分離した他の例
を図9に示す。すなわち、図9(a)に示すように、文
字「O」と「S」とが接触している場合には、(5)式
を満たすことになり文字塊とループとの位置関係がケー
スBに対応する。また、図9(b)に示すように、文字
「r」、「e」、「s」の3文字が接触する場合には、
(7)式を満たすことになり文字塊とループとの位置関
係がケースDに対応する。各々の場合において分離領域
を算出し、この分離領域内に存在するくびれ部分で文字
塊を分離することで、正確な位置でも分離を行うことが
できるようになる。
を図9に示す。すなわち、図9(a)に示すように、文
字「O」と「S」とが接触している場合には、(5)式
を満たすことになり文字塊とループとの位置関係がケー
スBに対応する。また、図9(b)に示すように、文字
「r」、「e」、「s」の3文字が接触する場合には、
(7)式を満たすことになり文字塊とループとの位置関
係がケースDに対応する。各々の場合において分離領域
を算出し、この分離領域内に存在するくびれ部分で文字
塊を分離することで、正確な位置でも分離を行うことが
できるようになる。
【0056】このようにして文字塊を分離した後は、文
字認識部14による認識処理を行う。文字認識部14で
は、正確に分離された文字パターンを文字切り出し装置
13から得ることができるため、的確な文字認識を行う
ことができるようになる。ここで、文字認識部14での
処理の一例を説明する。先ず(2)式より文字平均線幅
Wを算出する。次に文字切り出し装置13から得た文字
パターンより水平、垂直、左斜め、右斜めの4方向の線
素を取り出した4個のサブパターンを抽出する。サブパ
ターンの抽出処理は、例えば水平サブパターンの場合に
は、文字パターンを水平方向に走査して黒画素の連続を
検出し、黒画素の連続数LH が(8)式を満たす場合に
その黒画素の連続を水平方向のサブパターンとして抽出
するものである。
字認識部14による認識処理を行う。文字認識部14で
は、正確に分離された文字パターンを文字切り出し装置
13から得ることができるため、的確な文字認識を行う
ことができるようになる。ここで、文字認識部14での
処理の一例を説明する。先ず(2)式より文字平均線幅
Wを算出する。次に文字切り出し装置13から得た文字
パターンより水平、垂直、左斜め、右斜めの4方向の線
素を取り出した4個のサブパターンを抽出する。サブパ
ターンの抽出処理は、例えば水平サブパターンの場合に
は、文字パターンを水平方向に走査して黒画素の連続を
検出し、黒画素の連続数LH が(8)式を満たす場合に
その黒画素の連続を水平方向のサブパターンとして抽出
するものである。
【0057】
【数8】
【0058】同様に、(9)式より垂直、左斜め、右斜
めのサブパターン抽出を行う。(9)式で、LH 、LV
、LL 、LR は各々水平、垂直、左斜め、右斜めの連
続黒画素数である。
めのサブパターン抽出を行う。(9)式で、LH 、LV
、LL 、LR は各々水平、垂直、左斜め、右斜めの連
続黒画素数である。
【0059】次に、水平、垂直、左斜め、右斜めの各サ
ブパターンを、小領域い分割し各サブパターンの各領域
における黒画素数を計数する。そして、黒画素計数結果
および文字平均線幅Wより(9)式に基づいて水平、垂
直、左斜め、右斜めの特徴マトリクスを抽出する。
ブパターンを、小領域い分割し各サブパターンの各領域
における黒画素数を計数する。そして、黒画素計数結果
および文字平均線幅Wより(9)式に基づいて水平、垂
直、左斜め、右斜めの特徴マトリクスを抽出する。
【0060】
【数9】
【0061】(9)式で、KH 、KV 、KL 、KR は各
々水平、垂直、左斜め、右斜めの特徴マトリクス、BH
、BV 、BL 、BR は各々水平、垂直、左斜め、右斜
めの黒画素マトリクスであり、(m,n)は各マトリク
スの要素番号である。本実施例においては、入力文字パ
ターン外接枠を水平、垂直方向に5等分して得られる5
×5の25の小領域に分割するものとする。文字認識部
14においては、特徴マトリクスと予め文字認識部14
内に備えている辞書内の標準文字の特徴マトリクスとを
(10)式に基づいて照合し、(10)式の距離値dが
最小となる標準文字の文字コードを認識結果として文字
コード出力端子15より出力する。
々水平、垂直、左斜め、右斜めの特徴マトリクス、BH
、BV 、BL 、BR は各々水平、垂直、左斜め、右斜
めの黒画素マトリクスであり、(m,n)は各マトリク
スの要素番号である。本実施例においては、入力文字パ
ターン外接枠を水平、垂直方向に5等分して得られる5
×5の25の小領域に分割するものとする。文字認識部
14においては、特徴マトリクスと予め文字認識部14
内に備えている辞書内の標準文字の特徴マトリクスとを
(10)式に基づいて照合し、(10)式の距離値dが
最小となる標準文字の文字コードを認識結果として文字
コード出力端子15より出力する。
【0062】
【数10】
【0063】ただし、(10)式においてgi は標準文
字の特徴マトリクスの要素、ki は入力文字パターンの
特徴マトリクスの要素である。このようにして、入力文
字パターンの正確な認識を行うことができるようにな
る。
字の特徴マトリクスの要素、ki は入力文字パターンの
特徴マトリクスの要素である。このようにして、入力文
字パターンの正確な認識を行うことができるようにな
る。
【0064】次に、本発明の第2実施例を図10に基づ
いて説明する。図10(a)は第2実施例における文字
切り出し装置23を適応した文字認識装置20を示すブ
ロック図、図10(b)は第2実施例における文字切り
出し装置23を示すブロック図である。図10(a)に
示すように、この文字認識装置20は、画像入力部2
1、文字行切り出し部22、文字切り出し装置23、文
字認識部24、文字コード出力端子25から構成されて
いる。なお、この文字認識装置20の構成は、文字切り
出し装置23の内部構成を除き第1実施例と同様であ
る。
いて説明する。図10(a)は第2実施例における文字
切り出し装置23を適応した文字認識装置20を示すブ
ロック図、図10(b)は第2実施例における文字切り
出し装置23を示すブロック図である。図10(a)に
示すように、この文字認識装置20は、画像入力部2
1、文字行切り出し部22、文字切り出し装置23、文
字認識部24、文字コード出力端子25から構成されて
いる。なお、この文字認識装置20の構成は、文字切り
出し装置23の内部構成を除き第1実施例と同様であ
る。
【0065】図10(b)に示すように、第2実施例に
おける文字切り出し装置23は、文字塊切り出し部23
1、検出分離部237、分離領域決定部236から構成
され、さらに、検出分離部237は、くびれ検出部23
2と接触文字分離部233とから構成される。また、分
離領域決定部236は、ループ検出部234と相対位置
判断部235とから構成される。
おける文字切り出し装置23は、文字塊切り出し部23
1、検出分離部237、分離領域決定部236から構成
され、さらに、検出分離部237は、くびれ検出部23
2と接触文字分離部233とから構成される。また、分
離領域決定部236は、ループ検出部234と相対位置
判断部235とから構成される。
【0066】第2実施例の文字切り出し装置23では、
先ず、文字塊切り出し部231が第1実施例と同様な方
法で文字行切り出し部22から得た文字行画像データを
切り出して文字塊を接触文字分離部233、くびれ検出
部232およびループ検出部234へ出力する。分離領
域決定部236は文字塊切り出し部231より入力され
た文字塊において、第1実施例と同様な方法で文字塊内
のループの位置に基づいて接触文字か否かと、接触文字
の場合には文字同士の接触点の存在し得る領域を決定
し、その領域を示す信号をくびれ検出部232へ出力す
る。また、ループが無い場合には文字塊を分離しない旨
を示す信号をくびれ検出部232へ出力する。
先ず、文字塊切り出し部231が第1実施例と同様な方
法で文字行切り出し部22から得た文字行画像データを
切り出して文字塊を接触文字分離部233、くびれ検出
部232およびループ検出部234へ出力する。分離領
域決定部236は文字塊切り出し部231より入力され
た文字塊において、第1実施例と同様な方法で文字塊内
のループの位置に基づいて接触文字か否かと、接触文字
の場合には文字同士の接触点の存在し得る領域を決定
し、その領域を示す信号をくびれ検出部232へ出力す
る。また、ループが無い場合には文字塊を分離しない旨
を示す信号をくびれ検出部232へ出力する。
【0067】第2実施例における文字切り出し装置23
では、くびれ検出部232が分離領域決定部236から
得た領域内でのみくびれ部分の検出を行い、くびれ位置
が複数ある場合には検出されたくびれ部分のうちで最も
ループに近いものを分離位置とし、この座標を接触文字
分離部233へ出力する。これによって、くびれ検出部
232は限られた領域(相対位置判断部235にて算出
された分離領域)内だけでくびれ部分を検出することに
なり、短時間での検出処理を行うことが可能となる。し
かも、文字切り出し装置23における内部構成を簡素化
できるメリットもある。
では、くびれ検出部232が分離領域決定部236から
得た領域内でのみくびれ部分の検出を行い、くびれ位置
が複数ある場合には検出されたくびれ部分のうちで最も
ループに近いものを分離位置とし、この座標を接触文字
分離部233へ出力する。これによって、くびれ検出部
232は限られた領域(相対位置判断部235にて算出
された分離領域)内だけでくびれ部分を検出することに
なり、短時間での検出処理を行うことが可能となる。し
かも、文字切り出し装置23における内部構成を簡素化
できるメリットもある。
【0068】第2実施例においても第1実施例と同様な
判断によって文字塊とループとの位置関係をケースA〜
Dに当てはめ、各々に対応する分離領域および分離位置
を決定する。これにより、文字同士が接触する文字塊で
あっても正確に文字を分離することが可能となる。な
お、本実施例においては欧文文字から成る文字塊を分離
する例を示したが、本発明はこれに限定されず、1文字
においてx方向に沿ってループが2つ以上存在しない他
言語の文字、記号であっても同様である。
判断によって文字塊とループとの位置関係をケースA〜
Dに当てはめ、各々に対応する分離領域および分離位置
を決定する。これにより、文字同士が接触する文字塊で
あっても正確に文字を分離することが可能となる。な
お、本実施例においては欧文文字から成る文字塊を分離
する例を示したが、本発明はこれに限定されず、1文字
においてx方向に沿ってループが2つ以上存在しない他
言語の文字、記号であっても同様である。
【0069】
【発明の効果】以上説明したように、本発明の文字切り
出し装置によれば次のような効果がある。すなわち、本
発明の文字切り出し装置では、文字塊とループとの位置
関係に基づき文字塊が接触文字か否かを判断し、接触文
字の場合には文字同士が接触し得る領域を判断し、その
中のくびれ部分を接触点として文字塊の分離を行ってい
るため、不要な位置を分離することなく正確な位置で文
字パターンを切り出すことが可能となる。これによっ
て、文字パターン切り出しにおける信頼性が向上すると
ともに、誤った切り出し結果が減少することからオペレ
ータによる修正作業を大幅に軽減することが可能とな
る。つまり、文字認識における処理時間を大幅に短縮す
ることができ、高性能の文字認識装置を構築することが
可能となる。
出し装置によれば次のような効果がある。すなわち、本
発明の文字切り出し装置では、文字塊とループとの位置
関係に基づき文字塊が接触文字か否かを判断し、接触文
字の場合には文字同士が接触し得る領域を判断し、その
中のくびれ部分を接触点として文字塊の分離を行ってい
るため、不要な位置を分離することなく正確な位置で文
字パターンを切り出すことが可能となる。これによっ
て、文字パターン切り出しにおける信頼性が向上すると
ともに、誤った切り出し結果が減少することからオペレ
ータによる修正作業を大幅に軽減することが可能とな
る。つまり、文字認識における処理時間を大幅に短縮す
ることができ、高性能の文字認識装置を構築することが
可能となる。
【図1】本発明の第1実施例を説明するブロック図であ
り、(a)は文字認識装置、(b)は文字切り出し装置
の構成を示すものである。
り、(a)は文字認識装置、(b)は文字切り出し装置
の構成を示すものである。
【図2】ループ画素の検出を説明する図(その1)であ
る。
る。
【図3】ループ画素の検出を説明する図(その2)であ
る。
る。
【図4】文字塊内におけるループの位置を説明する図
(その1)である。
(その1)である。
【図5】文字塊内におけるループの位置を説明する図
(その2)である。
(その2)である。
【図6】分離領域の判断を説明する図(その1)であ
る。
る。
【図7】分離領域の判断を説明する図(その2)であ
る。
る。
【図8】具体例を説明する図(その1)である。
【図9】具体例を説明する図(その2)である。
【図10】本発明の第2実施例を説明する図であり、
(a)は文字認識装置、(b)は文字切り出し装置の構
成を示すものである。
(a)は文字認識装置、(b)は文字切り出し装置の構
成を示すものである。
【図11】従来例を説明する図であり、(a)は文字認
識装置、(b)は文字切り出し装置の構成を示すもので
ある。
識装置、(b)は文字切り出し装置の構成を示すもので
ある。
【図12】分離の一例を説明する図である。
【図13】従来の分離例を説明する図(その1)であ
る。
る。
【図14】従来の分離例を説明する図(その2)であ
る。
る。
【図15】従来の分離例を説明する図(その3)であ
る。
る。
10 文字認識装置 11 画像入力部 12 文字行切り出し部 13 文字切り出し装置 14 文字認識部 15 文字コード出力端子 131 文字塊切り出し部 132 くびれ検出部 133 接触文字分離部 134 ループ検出部 135 相対位置判断部 136 分離位置判断部
Claims (1)
- 【請求項1】 文字行画像データから文字パターンを切
り出すための文字切り出し装置であって、 文字行画像データの中から文字パターンを示すための画
素が連続する文字塊を切り出すための文字塊切り出し手
段と、 前記文字塊切り出し手段によって切り出された文字塊内
において前記文字パターンとその背景との境界となる前
記画素のうち閉ループを構成するループ画素の有無を検
出するとともに、ループが存在する場合に該文字塊に対
する該ループの位置に基づき該文字塊が接触文字か否か
を判断し、接触文字の場合には該文字塊における分離領
域を検出するための分離領域検出手段と、 前記文字塊の中から文字線のくびれ部分の位置を検出す
るためのくびれ検出手段と、 前記分離領域内に存在する前記くびれ部分を検出し、該
くびれ部分の位置で前記文字塊を分離して文字パターン
の切り出しを行う分離手段とを備えていることを特徴と
する文字切り出し装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6249106A JPH08115384A (ja) | 1994-10-14 | 1994-10-14 | 文字切り出し装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6249106A JPH08115384A (ja) | 1994-10-14 | 1994-10-14 | 文字切り出し装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH08115384A true JPH08115384A (ja) | 1996-05-07 |
Family
ID=17188050
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP6249106A Pending JPH08115384A (ja) | 1994-10-14 | 1994-10-14 | 文字切り出し装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH08115384A (ja) |
-
1994
- 1994-10-14 JP JP6249106A patent/JPH08115384A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4903311A (en) | Character region extracting method and apparatus capable of implementing the method | |
| US4562594A (en) | Method and apparatus for segmenting character images | |
| JPH05242292A (ja) | 分離方法 | |
| JP2018055255A (ja) | 情報処理装置、情報処理方法及びプログラム | |
| JPH02293989A (ja) | 文字認識装置 | |
| JPH08115384A (ja) | 文字切り出し装置 | |
| JPH07230525A (ja) | 罫線認識方法及び表処理方法 | |
| JP3348224B2 (ja) | 表枠線の交点補正装置および表認識装置および光学文字読取装置 | |
| JPH0728935A (ja) | 文書画像処理装置 | |
| JP2902097B2 (ja) | 情報処理装置及び文字認識装置 | |
| JP2722550B2 (ja) | 光学文字読取装置 | |
| JPS61190679A (ja) | 文字デ−タ処理装置 | |
| JP2978801B2 (ja) | 手書き文字認識の文字入力方式 | |
| JPH01234985A (ja) | 文字読取装置の文字切出し装置 | |
| JP2813601B2 (ja) | 表形式文書認識装置 | |
| JPH03160582A (ja) | 文書画像データに於ける罫線と文字の分離方法 | |
| JPH01217583A (ja) | 罫線認識装置 | |
| JPH06251197A (ja) | 文字切り出し装置 | |
| JPH06251196A (ja) | 文字切り出し装置 | |
| JPH1069522A (ja) | 文字認識装置及び文字認識方法並びに文字認識方法を記録した記録媒体 | |
| JPS6362025B2 (ja) | ||
| JPH02189696A (ja) | 光学文字読取装置 | |
| JPH03222082A (ja) | 文字認識装置 | |
| JPS6252687A (ja) | 文字読取装置の文字検出切出し方式 | |
| JPH05166010A (ja) | 文字切出方法 |