JPH10254992A - 表処理装置および表処理方法 - Google Patents
表処理装置および表処理方法Info
- Publication number
- JPH10254992A JPH10254992A JP9061066A JP6106697A JPH10254992A JP H10254992 A JPH10254992 A JP H10254992A JP 9061066 A JP9061066 A JP 9061066A JP 6106697 A JP6106697 A JP 6106697A JP H10254992 A JPH10254992 A JP H10254992A
- Authority
- JP
- Japan
- Prior art keywords
- ruled line
- line
- ruled
- pitch
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims description 9
- 238000009826 distribution Methods 0.000 claims abstract description 26
- 238000013500 data storage Methods 0.000 claims abstract description 11
- 238000000605 extraction Methods 0.000 claims abstract description 4
- 230000002093 peripheral effect Effects 0.000 claims description 15
- 238000003672 processing method Methods 0.000 claims description 9
- 239000000284 extract Substances 0.000 abstract description 4
- 238000001514 detection method Methods 0.000 abstract description 3
- 239000011295 pitch Substances 0.000 description 42
- 238000010586 diagram Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】
【課題】 表領域で囲まれた文字パターンの線領域を罫
線であると誤って判断することを防止する。 【解決手段】 画像データから作成した周辺分布とこの
周辺分布に基づいて決定された閾値とから罫線の候補と
なり得る線領域を抽出し、この線領域の座標位置を検出
する罫線候補検出部131と、この罫線候補検出部13
1が検出した線領域の座標位置からこれらの線領域のピ
ッチを検出する罫線ピッチ推定部132と、この罫線ピ
ッチ推定部132が検出した線領域のピッチの出現度数
分布から罫線のピッチを推定し、この推定結果から罫線
の座標位置を決定する罫線位置決定部133と、この罫
線位置決定部133が決定した罫線の座標位置に基づい
て罫線幅を検出するとともに、これらの罫線の座標位置
および罫線幅に基づいて表領域から罫線の領域を抽出す
る罫線領域抽出部134とを備える。
線であると誤って判断することを防止する。 【解決手段】 画像データから作成した周辺分布とこの
周辺分布に基づいて決定された閾値とから罫線の候補と
なり得る線領域を抽出し、この線領域の座標位置を検出
する罫線候補検出部131と、この罫線候補検出部13
1が検出した線領域の座標位置からこれらの線領域のピ
ッチを検出する罫線ピッチ推定部132と、この罫線ピ
ッチ推定部132が検出した線領域のピッチの出現度数
分布から罫線のピッチを推定し、この推定結果から罫線
の座標位置を決定する罫線位置決定部133と、この罫
線位置決定部133が決定した罫線の座標位置に基づい
て罫線幅を検出するとともに、これらの罫線の座標位置
および罫線幅に基づいて表領域から罫線の領域を抽出す
る罫線領域抽出部134とを備える。
Description
【0001】
【発明の属する技術分野】この発明は、画像データ記憶
部に画像データとして格納された表領域から罫線を抽出
するための、表処理装置および表処理方法に関するもの
である。
部に画像データとして格納された表領域から罫線を抽出
するための、表処理装置および表処理方法に関するもの
である。
【0002】
【従来の技術】従来、文書や帳簿等の画像イメージを処
理する際には、その画像イメージを文字領域、図形・写
真領域、表領域等に分けて各領域ごとに画像イメージか
ら抽出し、それぞれの領域に対して異なる画像処理を施
すことが多い。
理する際には、その画像イメージを文字領域、図形・写
真領域、表領域等に分けて各領域ごとに画像イメージか
ら抽出し、それぞれの領域に対して異なる画像処理を施
すことが多い。
【0003】一般に、表領域を画像イメージから抽出し
て画像処理を施す際には、まず、画像イメージ(例えば
二値化画像情報)から、一定以上の長さの矩形を構成す
る領域を表領域の罫線であると判断して抽出する。そし
て、抽出された罫線を表枠とし、この表枠内の領域を文
字領域であると判断して文字パターンを抽出し、文字認
識を行なう。
て画像処理を施す際には、まず、画像イメージ(例えば
二値化画像情報)から、一定以上の長さの矩形を構成す
る領域を表領域の罫線であると判断して抽出する。そし
て、抽出された罫線を表枠とし、この表枠内の領域を文
字領域であると判断して文字パターンを抽出し、文字認
識を行なう。
【0004】このような方法で罫線を抽出する装置とし
ては、例えば、特開平5−174186号公報に開示さ
れたものが、従来知られている。
ては、例えば、特開平5−174186号公報に開示さ
れたものが、従来知られている。
【0005】
【発明が解決しようとする課題】しかしながら、上述し
たような表領域の抽出方法には、表枠内の文字を罫線の
一部であると過って認識してしまう場合があり、このた
めに正しい画像処理を行なうことができなくなる場合が
あるという欠点があった。
たような表領域の抽出方法には、表枠内の文字を罫線の
一部であると過って認識してしまう場合があり、このた
めに正しい画像処理を行なうことができなくなる場合が
あるという欠点があった。
【0006】図7(A)は、画像イメージ中の表領域と
文字領域とからなる領域を示す概念図である。
文字領域とからなる領域を示す概念図である。
【0007】同図において、表領域は、横方向に延びる
2本の罫線701a,701bと、縦方向に延びる10
本の罫線702a,702b,・・・,702jとを有
している。そして、これらの罫線701a,701b,
702a〜702jで囲まれた領域は文字領域となって
おり、文字画像である「1」,「2」,・・・,「9」
が配置されている。
2本の罫線701a,701bと、縦方向に延びる10
本の罫線702a,702b,・・・,702jとを有
している。そして、これらの罫線701a,701b,
702a〜702jで囲まれた領域は文字領域となって
おり、文字画像である「1」,「2」,・・・,「9」
が配置されている。
【0008】ここで、文字領域中の画像のうち、「1」
および「4」は、縦棒の部分711,712が罫線であ
ると判断されやすい。このため、図7(B)に示したよ
うに、罫線を抽出する際に、これらの縦棒に対応する部
分721,722も抽出されてしまう場合がある。
および「4」は、縦棒の部分711,712が罫線であ
ると判断されやすい。このため、図7(B)に示したよ
うに、罫線を抽出する際に、これらの縦棒に対応する部
分721,722も抽出されてしまう場合がある。
【0009】このような理由により、罫線を画像イメー
ジから抽出する際に判断の誤りが生じない表処理装置お
よび表処理方法の登場が嘱望されていた。
ジから抽出する際に判断の誤りが生じない表処理装置お
よび表処理方法の登場が嘱望されていた。
【0010】
(1)この発明に係る表処理装置は、画像データ記憶部
に画像データとして格納された表領域から罫線を抽出す
る表処理装置に関するものである。
に画像データとして格納された表領域から罫線を抽出す
る表処理装置に関するものである。
【0011】そして、画像データから作成した周辺分布
とこの周辺分布に基づいて決定された閾値とから罫線の
候補となり得る線領域を抽出し、この線領域の座標位置
を検出する罫線候補検出部と、この罫線候補検出部が検
出した線領域の座標位置からこれらの線領域のピッチを
検出する罫線ピッチ推定部と、この罫線ピッチ推定部が
検出した線領域のピッチの出現度数分布から罫線のピッ
チを推定し、この推定結果から罫線の座標位置を決定す
る罫線位置決定部と、この罫線位置決定部が決定した罫
線の座標位置における罫線幅を検出するとともに、これ
らの罫線の座標位置および罫線幅に基づいて表領域から
罫線の領域を抽出する罫線領域抽出部とを備えたことを
特徴とする。
とこの周辺分布に基づいて決定された閾値とから罫線の
候補となり得る線領域を抽出し、この線領域の座標位置
を検出する罫線候補検出部と、この罫線候補検出部が検
出した線領域の座標位置からこれらの線領域のピッチを
検出する罫線ピッチ推定部と、この罫線ピッチ推定部が
検出した線領域のピッチの出現度数分布から罫線のピッ
チを推定し、この推定結果から罫線の座標位置を決定す
る罫線位置決定部と、この罫線位置決定部が決定した罫
線の座標位置における罫線幅を検出するとともに、これ
らの罫線の座標位置および罫線幅に基づいて表領域から
罫線の領域を抽出する罫線領域抽出部とを備えたことを
特徴とする。
【0012】このような表処理装置によれば、表領域で
囲まれた文字領域内の線領域を罫線であると誤って判断
することを防止できる。
囲まれた文字領域内の線領域を罫線であると誤って判断
することを防止できる。
【0013】(2)この発明に係る表処理方法は、画像
データ記憶部に画像データとして格納された表領域から
罫線を抽出する表処理方法に関するものである。
データ記憶部に画像データとして格納された表領域から
罫線を抽出する表処理方法に関するものである。
【0014】そして、画像データから作成した周辺分布
とこの周辺分布に基づいて決定された閾値とから罫線の
候補となり得る線領域を抽出し、この線領域の座標位置
を検出する罫線候補検出過程と、この罫線候補検出過程
で検出した線領域の座標位置からこれらの線領域のピッ
チを検出する罫線ピッチ推定過程と、この罫線ピッチ推
定過程で検出した線領域のピッチの出現度数分布から罫
線のピッチを推定し、この推定結果から罫線の座標位置
を決定する罫線位置決定過程と、この罫線位置決定過程
で決定した罫線の座標位置における罫線幅を検出すると
ともに、これらの罫線の座標位置および罫線幅に基づい
て表領域から罫線の領域を抽出する罫線領域抽出過程と
を備えたことを特徴とする。
とこの周辺分布に基づいて決定された閾値とから罫線の
候補となり得る線領域を抽出し、この線領域の座標位置
を検出する罫線候補検出過程と、この罫線候補検出過程
で検出した線領域の座標位置からこれらの線領域のピッ
チを検出する罫線ピッチ推定過程と、この罫線ピッチ推
定過程で検出した線領域のピッチの出現度数分布から罫
線のピッチを推定し、この推定結果から罫線の座標位置
を決定する罫線位置決定過程と、この罫線位置決定過程
で決定した罫線の座標位置における罫線幅を検出すると
ともに、これらの罫線の座標位置および罫線幅に基づい
て表領域から罫線の領域を抽出する罫線領域抽出過程と
を備えたことを特徴とする。
【0015】このような表処理方法によれば、表領域で
囲まれた文字領域内の線領域を罫線であると誤って判断
することを防止できる。
囲まれた文字領域内の線領域を罫線であると誤って判断
することを防止できる。
【0016】
【発明の実施の形態】以下、この発明の実施の形態につ
いて、図面を用いて説明する。なお、図中、各構成成分
の大きさ、形状および配置関係は、この発明が理解でき
る程度に概略的に示してあるにすぎず、また、以下に説
明する数値的条件は単なる例示にすぎないことを理解さ
れたい。
いて、図面を用いて説明する。なお、図中、各構成成分
の大きさ、形状および配置関係は、この発明が理解でき
る程度に概略的に示してあるにすぎず、また、以下に説
明する数値的条件は単なる例示にすぎないことを理解さ
れたい。
【0017】図1は、この実施の形態に係る表処理装置
の構成を説明するためのブロック図である。
の構成を説明するためのブロック図である。
【0018】同図において、画像読取部110は、原稿
を例えば二値化画像データとして読み取り、読み取った
画像データを画像データ記憶部120に一時的に記憶さ
せる。そして、この画像データ記憶部120から読み出
された画像データが、この実施の形態に係る表処理装置
130に入力される。
を例えば二値化画像データとして読み取り、読み取った
画像データを画像データ記憶部120に一時的に記憶さ
せる。そして、この画像データ記憶部120から読み出
された画像データが、この実施の形態に係る表処理装置
130に入力される。
【0019】この表処理装置130において、罫線候補
検出部131は、画像データ記憶部120から入力した
画像データを用いて周辺分布を作成し、この周辺分布に
基づいて閾値を決定したのち、かかる周辺分布と閾値と
から罫線の候補となり得る線領域を抽出し、さらに、こ
の線領域の座標位置を検出する。
検出部131は、画像データ記憶部120から入力した
画像データを用いて周辺分布を作成し、この周辺分布に
基づいて閾値を決定したのち、かかる周辺分布と閾値と
から罫線の候補となり得る線領域を抽出し、さらに、こ
の線領域の座標位置を検出する。
【0020】また、罫線ピッチ推定部132は、罫線候
補検出部131が検出した線領域(罫線候補)の座標位
置から、これらの線領域のピッチを検出する。
補検出部131が検出した線領域(罫線候補)の座標位
置から、これらの線領域のピッチを検出する。
【0021】罫線位置決定部133は、罫線ピッチ推定
部132が検出した線領域のピッチの出現度数分布から
罫線のピッチを推定し、この推定結果から罫線の座標位
置を決定する。
部132が検出した線領域のピッチの出現度数分布から
罫線のピッチを推定し、この推定結果から罫線の座標位
置を決定する。
【0022】罫線領域抽出部134は、罫線位置決定部
133が決定した罫線の座標位置における罫線幅を検出
するとともに、これらの罫線の座標位置および罫線幅に
基づいて表領域から罫線の領域を抽出する。そして、抽
出された罫線の領域を、表処理装置130の外部に出力
する。
133が決定した罫線の座標位置における罫線幅を検出
するとともに、これらの罫線の座標位置および罫線幅に
基づいて表領域から罫線の領域を抽出する。そして、抽
出された罫線の領域を、表処理装置130の外部に出力
する。
【0023】なお、これらの各部110,120,13
1〜134は、図示しない制御部によって動作を制御さ
れる。
1〜134は、図示しない制御部によって動作を制御さ
れる。
【0024】次に、図1に示した装置の動作について、
図2〜図6を用いて説明する。
図2〜図6を用いて説明する。
【0025】図2および図3は、図1に示した装置の動
作を示す概略フローチャートである。
作を示す概略フローチャートである。
【0026】まず、画像読取部110が、文書や帳簿等
の読取原稿を光学的に読み取る。そして、これにより得
られた光情報を量子化して電気信号に変換することによ
り画像データ(すなわち画像イメージを表すデータ)を
生成し、出力する(S201)。
の読取原稿を光学的に読み取る。そして、これにより得
られた光情報を量子化して電気信号に変換することによ
り画像データ(すなわち画像イメージを表すデータ)を
生成し、出力する(S201)。
【0027】そして、画像データ記憶部120が、画像
読取部110から入力された画像データを一時的に記憶
する(S202)。
読取部110から入力された画像データを一時的に記憶
する(S202)。
【0028】次に、罫線候補検出部131が、以下のよ
うにして、画像データ記憶部120から読み込んだ画像
データを用いて周辺分布の抽出(S203,S20
6)、閾値の決定(S204,S207)および罫線候
補の位置座標検出(S205,S208)を行なう。
うにして、画像データ記憶部120から読み込んだ画像
データを用いて周辺分布の抽出(S203,S20
6)、閾値の決定(S204,S207)および罫線候
補の位置座標検出(S205,S208)を行なう。
【0029】図4は、罫線候補検出部131の動作を説
明するための概念図である。
明するための概念図である。
【0030】まず、画像イメージ401について、y方
向に並ぶ各画素の値(「1」または「0」;ここでは黒
画素を「1」、白画素を「0」とする)の総和を、一行
ごとに算出する。すなわち、画像イメージ401の各画
素をs(x,y) とし、x方向の総画素数をm、y方向の画
素数をnとすると、下式(1)で与えられる計算によ
り、各列ごとの画素値の総和X(1) ,X(2) ,・・・,
X(m) を算出する。
向に並ぶ各画素の値(「1」または「0」;ここでは黒
画素を「1」、白画素を「0」とする)の総和を、一行
ごとに算出する。すなわち、画像イメージ401の各画
素をs(x,y) とし、x方向の総画素数をm、y方向の画
素数をnとすると、下式(1)で与えられる計算によ
り、各列ごとの画素値の総和X(1) ,X(2) ,・・・,
X(m) を算出する。
【0031】
【数1】
【0032】これにより、図4に示した周辺分布402
を得る(S203)。
を得る(S203)。
【0033】そして、X(1) ,X(2) ,・・・,X(m)
のうち、最も値が大きいものの1/α倍(αは予め定め
られた定数)を閾値xs として算出する(S204)。
のうち、最も値が大きいものの1/α倍(αは予め定め
られた定数)を閾値xs として算出する(S204)。
【0034】続いて、この閾値xs と各列ごとの画素値
の総和X(1) ,X(2) ,・・・,X(m) とを比較し、画
素値の総和が閾値xs よりも大きい列(図4の線領域4
03a〜403lに相当する)を垂直罫線候補406a
〜406lとして抽出する。そして、かかる垂直罫線候
補406a〜406lに対応する線領域403a〜40
3lの位置座標をそれぞれ検出する(S205)。
の総和X(1) ,X(2) ,・・・,X(m) とを比較し、画
素値の総和が閾値xs よりも大きい列(図4の線領域4
03a〜403lに相当する)を垂直罫線候補406a
〜406lとして抽出する。そして、かかる垂直罫線候
補406a〜406lに対応する線領域403a〜40
3lの位置座標をそれぞれ検出する(S205)。
【0035】次に、罫線候補検出部131は、画像イメ
ージ401について、x方向に並ぶ各画素の値の総和
を、一行ごとに算出する。すなわち、下式(2)で与え
られる計算により、各行ごとの画素値の総和Y(1) ,Y
(2) ,・・・,Y(n) を算出する。
ージ401について、x方向に並ぶ各画素の値の総和
を、一行ごとに算出する。すなわち、下式(2)で与え
られる計算により、各行ごとの画素値の総和Y(1) ,Y
(2) ,・・・,Y(n) を算出する。
【0036】
【数2】
【0037】これにより、図4に示した周辺分布404
を得る(S206)。
を得る(S206)。
【0038】そして、Y(1) ,Y(2) ,・・・,Y(n)
のうち、最も値が大きいものの1/β倍(βは予め定め
られた定数)を閾値ys として算出する(S207)。
のうち、最も値が大きいものの1/β倍(βは予め定め
られた定数)を閾値ys として算出する(S207)。
【0039】続いて、この閾値ys と各行ごとの画素値
の総和Y(1) ,Y(2) ,・・・,Y(n) とを比較し、画
素値の総和が閾値ys よりも大きい行(図4の線領域4
05a,405bに相当する)を水平罫線候補407
a,407bとして抽出する。そして、かかる水平罫線
候補407a,407bに対応する線領域405a,4
05bの位置座標を、それぞれ検出する(S208)。
の総和Y(1) ,Y(2) ,・・・,Y(n) とを比較し、画
素値の総和が閾値ys よりも大きい行(図4の線領域4
05a,405bに相当する)を水平罫線候補407
a,407bとして抽出する。そして、かかる水平罫線
候補407a,407bに対応する線領域405a,4
05bの位置座標を、それぞれ検出する(S208)。
【0040】次に、罫線ピッチ推定部132が、以下の
ようにして、垂直罫線候補406a〜406lのピッチ
および水平罫線候補407a,407bのピッチを推定
する(S209,S210)。
ようにして、垂直罫線候補406a〜406lのピッチ
および水平罫線候補407a,407bのピッチを推定
する(S209,S210)。
【0041】まず、垂直罫線候補406a〜406lに
ついて、ピッチの推定を行なう(S209)。
ついて、ピッチの推定を行なう(S209)。
【0042】図5(A)〜(D)のうち、(A)〜
(C)は、罫線ピッチ推定部132の動作を説明するた
めの概念図である。
(C)は、罫線ピッチ推定部132の動作を説明するた
めの概念図である。
【0043】最初に、画像イメージ401(同図(A)
参照)に対応する垂直罫線候補406a〜406l(同
図(B)参照)について、隣接する垂直罫線候補間のピ
ッチを検出する。ここでは、この検出の結果、垂直罫線
候補406aと垂直罫線候補406bとの間隔、垂直罫
線候補406bと垂直罫線候補406cとの間隔、垂直
罫線候補406eと垂直罫線候補406fとの間隔およ
び垂直罫線候補406fと垂直罫線候補406gとの間
隔はaであり、他の垂直罫線候補間ピッチはそれぞれb
であったものとする。したがって、各垂直罫線候補40
6a〜406lの線間隔の検出数11のうち、検出値が
aとなったのが4か所であり、また、検出値がbとなっ
たのが7か所である。すなわち、ピッチaの出現度数は
4であり、ピッチbの出現度数は7である。このため、
ここでは垂直罫線候補間ピッチの推定値をbとする。こ
れにより、図5(C)に示したような垂直罫線候補間ピ
ッチbを得る。そして、このようにして得られた推定値
bを、罫線位置決定部133に対して出力する。
参照)に対応する垂直罫線候補406a〜406l(同
図(B)参照)について、隣接する垂直罫線候補間のピ
ッチを検出する。ここでは、この検出の結果、垂直罫線
候補406aと垂直罫線候補406bとの間隔、垂直罫
線候補406bと垂直罫線候補406cとの間隔、垂直
罫線候補406eと垂直罫線候補406fとの間隔およ
び垂直罫線候補406fと垂直罫線候補406gとの間
隔はaであり、他の垂直罫線候補間ピッチはそれぞれb
であったものとする。したがって、各垂直罫線候補40
6a〜406lの線間隔の検出数11のうち、検出値が
aとなったのが4か所であり、また、検出値がbとなっ
たのが7か所である。すなわち、ピッチaの出現度数は
4であり、ピッチbの出現度数は7である。このため、
ここでは垂直罫線候補間ピッチの推定値をbとする。こ
れにより、図5(C)に示したような垂直罫線候補間ピ
ッチbを得る。そして、このようにして得られた推定値
bを、罫線位置決定部133に対して出力する。
【0044】次に、水平罫線候補407a,407bに
ついて、ピッチの推定を行なうが(S210)、この実
施の形態の場合には水平罫線候補となる線領域が2本し
かないのでピッチは1種類しか検出できず、したがっ
て、水平罫線候補間ピッチの検出ができないと判断し
て、その旨を示す信号を罫線位置決定部133に出力す
る。
ついて、ピッチの推定を行なうが(S210)、この実
施の形態の場合には水平罫線候補となる線領域が2本し
かないのでピッチは1種類しか検出できず、したがっ
て、水平罫線候補間ピッチの検出ができないと判断し
て、その旨を示す信号を罫線位置決定部133に出力す
る。
【0045】なお、罫線間のピッチを検出するために必
要な垂直罫線候補や水平罫線候補の最小数は、予め任意
に設定されているものとする。
要な垂直罫線候補や水平罫線候補の最小数は、予め任意
に設定されているものとする。
【0046】次に、罫線位置決定部133が、以下のよ
うにして、垂直罫線の位置を決定する(S211〜S2
15)。
うにして、垂直罫線の位置を決定する(S211〜S2
15)。
【0047】まず、この罫線位置決定部133は、垂直
罫線候補406a〜406lについて、罫線候補間ピッ
チの推定が行なわれたか否かを判断する(S211)。
そして、罫線候補間ピッチの推定が行なえなかった場合
は、罫線候補となっている線領域をそのまま罫線である
と判断して、これらの線領域の位置座標をそのまま出力
する(S212)。
罫線候補406a〜406lについて、罫線候補間ピッ
チの推定が行なわれたか否かを判断する(S211)。
そして、罫線候補間ピッチの推定が行なえなかった場合
は、罫線候補となっている線領域をそのまま罫線である
と判断して、これらの線領域の位置座標をそのまま出力
する(S212)。
【0048】一方、罫線候補間ピッチの推定が行なわれ
た場合は、垂直罫線候補406a〜406lに対応する
線領域403a〜403lのうち右端または左端にある
もの(ここでは線領域403aとする)を基準として、
隣接する線領域(ここでは線領域403b)を検出する
(S213)。そして、線領域(ここでは線領域403
b)が検出されると、この線領域の座標位置を検出し
(S214)、罫線間ピッチと一致するか否かをチェッ
クする(S215)。そして、罫線間ピッチと一致しな
い場合は、罫線ではないと判断して(ここでは線領域は
403bなので罫線間ピッチとは一致しない)、次の線
領域(ここでは線領域403c)の検出を行う(S21
3)。以下同様にして、すべての線領域についてチェッ
クを行い、垂直罫線の位置を決定する。これにより、図
5(D)に示したような垂直罫線501a〜501jを
得る。
た場合は、垂直罫線候補406a〜406lに対応する
線領域403a〜403lのうち右端または左端にある
もの(ここでは線領域403aとする)を基準として、
隣接する線領域(ここでは線領域403b)を検出する
(S213)。そして、線領域(ここでは線領域403
b)が検出されると、この線領域の座標位置を検出し
(S214)、罫線間ピッチと一致するか否かをチェッ
クする(S215)。そして、罫線間ピッチと一致しな
い場合は、罫線ではないと判断して(ここでは線領域は
403bなので罫線間ピッチとは一致しない)、次の線
領域(ここでは線領域403c)の検出を行う(S21
3)。以下同様にして、すべての線領域についてチェッ
クを行い、垂直罫線の位置を決定する。これにより、図
5(D)に示したような垂直罫線501a〜501jを
得る。
【0049】次に、罫線位置決定部133は、水平罫線
の位置を決定する(S216〜S220)。
の位置を決定する(S216〜S220)。
【0050】この場合も、上述の垂直罫線の場合と同
様、まず、罫線間ピッチの推定が行われたか否かをチェ
ックし(S216)、行えなかった場合は罫線候補とな
っている線領域をそのまま罫線であると判断してこれら
の線領域の位置座標をそのまま出力する(S217)。
なお、この実施の形態では水平罫線候補の推定は行えな
かったので、線領域405a,405bの座標を、その
まま出力する。
様、まず、罫線間ピッチの推定が行われたか否かをチェ
ックし(S216)、行えなかった場合は罫線候補とな
っている線領域をそのまま罫線であると判断してこれら
の線領域の位置座標をそのまま出力する(S217)。
なお、この実施の形態では水平罫線候補の推定は行えな
かったので、線領域405a,405bの座標を、その
まま出力する。
【0051】一方、罫線間ピッチの推定を行った場合に
は、上述の垂直罫線の場合(S213〜S215)の場
合と同様にして、水平罫線の位置を決定する。
は、上述の垂直罫線の場合(S213〜S215)の場
合と同様にして、水平罫線の位置を決定する。
【0052】続いて、罫線領域抽出部134が、以下の
ようにして、罫線位置決定部133が決定した罫線の座
標位置に基づいて罫線幅を検出する(S221)。
ようにして、罫線位置決定部133が決定した罫線の座
標位置に基づいて罫線幅を検出する(S221)。
【0053】図6は、罫線領域抽出部134の動作を説
明するための概念図である。
明するための概念図である。
【0054】最初に、この罫線領域抽出部134は、上
述の罫線候補検出部131で検出した各線領域403a
〜403l,405a,405bについての周辺分布
(図4参照)のうち、罫線位置決定部133が罫線であ
ると判断した線領域の周辺分布を、この罫線候補検出部
131から入力する。さらに、例えば垂直罫線の場合で
あれば、まず、第1の線領域403aの周辺分布(図6
参照)のうちで最大値を有する画素列の画素値の総和X
(k) を検出して、閾値xw =X(k) /γ(γは予め定め
られた定数)を算出する。そして、画素値の総和がこの
閾値xw よりも大きい画素列の数に相当する線幅を、罫
線の幅wとして出力する。
述の罫線候補検出部131で検出した各線領域403a
〜403l,405a,405bについての周辺分布
(図4参照)のうち、罫線位置決定部133が罫線であ
ると判断した線領域の周辺分布を、この罫線候補検出部
131から入力する。さらに、例えば垂直罫線の場合で
あれば、まず、第1の線領域403aの周辺分布(図6
参照)のうちで最大値を有する画素列の画素値の総和X
(k) を検出して、閾値xw =X(k) /γ(γは予め定め
られた定数)を算出する。そして、画素値の総和がこの
閾値xw よりも大きい画素列の数に相当する線幅を、罫
線の幅wとして出力する。
【0055】続いて、他の罫線についても同様の処理を
行うことにより、すべての罫線について線幅を検出する
(S221)。
行うことにより、すべての罫線について線幅を検出する
(S221)。
【0056】すべての罫線の線幅が検出されると、続い
て、このようにして検出された罫線を構成する矩形枠の
座標値を抽出する(S222)。そして、このようにし
て得られた座標値を罫線領域の情報として、表処理装置
130の外部に出力する。
て、このようにして検出された罫線を構成する矩形枠の
座標値を抽出する(S222)。そして、このようにし
て得られた座標値を罫線領域の情報として、表処理装置
130の外部に出力する。
【0057】このように、この実施の形態によれば、罫
線候補としての線領域のピッチを検出し、このピッチの
出現度数から文字パターンを構成する線領域と罫線を構
成する線領域とを判別することとしたので、表領域で囲
まれた文字パターンの線領域を罫線であると誤って判断
することを防止できる。
線候補としての線領域のピッチを検出し、このピッチの
出現度数から文字パターンを構成する線領域と罫線を構
成する線領域とを判別することとしたので、表領域で囲
まれた文字パターンの線領域を罫線であると誤って判断
することを防止できる。
【0058】
【発明の効果】以上詳細に説明したように、この発明に
係る表処理装置および表処理方法によれば、表領域で囲
まれた文字領域内の線領域を罫線であると誤って判断す
ることを防止できる。したがって、表領域を判断して画
像イメージから抽出する際に判断の誤りが生じない表処
理装置および表処理方法を提供することができる。
係る表処理装置および表処理方法によれば、表領域で囲
まれた文字領域内の線領域を罫線であると誤って判断す
ることを防止できる。したがって、表領域を判断して画
像イメージから抽出する際に判断の誤りが生じない表処
理装置および表処理方法を提供することができる。
【図1】この発明の実施の形態に係る表処理装置の構成
を説明するためのブロック図である。
を説明するためのブロック図である。
【図2】図1に示した装置の動作を示す概略フローチャ
ートである。
ートである。
【図3】図1に示した装置の動作を示す概略フローチャ
ートである。
ートである。
【図4】この発明の実施の形態に係る表処理装置の動作
を説明するための概念図である。
を説明するための概念図である。
【図5】この発明の実施の形態に係る表処理装置の動作
を説明するための概念図である。
を説明するための概念図である。
【図6】この発明の実施の形態に係る表処理装置の動作
を説明するための概念図である。
を説明するための概念図である。
【図7】従来技術の課題を説明するための概念図であ
る。
る。
110 画像読取部 120 画像データ記憶部 130 表処理装置 131 罫線候補検出部 132 罫線ピッチ推定部 133 罫線位置決定部 134 罫線領域抽出部
Claims (2)
- 【請求項1】 画像データ記憶部に画像データとして格
納された表領域から罫線を抽出する表処理装置におい
て、 前記画像データから作成した周辺分布とこの周辺分布に
基づいて決定された閾値とから前記罫線の候補となり得
る線領域を抽出し、この線領域の座標位置を検出する罫
線候補検出部と、 この罫線候補検出部が検出した前記線領域の座標位置か
らこれらの線領域のピッチを検出する罫線ピッチ推定部
と、 この罫線ピッチ推定部が検出した前記線領域のピッチの
出現度数分布から前記罫線のピッチを推定し、この推定
結果から前記罫線の座標位置を決定する罫線位置決定部
と、 この罫線位置決定部が決定した前記罫線の座標位置にお
ける罫線幅を検出するとともに、これらの罫線の座標位
置および罫線幅に基づいて前記表領域から前記罫線の領
域を抽出する罫線領域抽出部と、 を備えたことを特徴とする表処理装置。 - 【請求項2】 画像データ記憶部に画像データとして
格納された表領域から罫線を抽出する表処理方法におい
て、 前記画像データから作成した周辺分布とこの周辺分布に
基づいて決定された閾値とから前記罫線の候補となり得
る線領域を抽出し、この線領域の座標位置を検出する罫
線候補検出過程と、 この罫線候補検出過程で検出した前記線領域の座標位置
からこれらの線領域のピッチを検出する罫線ピッチ推定
過程と、 この罫線ピッチ推定過程で検出した前記線領域のピッチ
の出現度数分布から前記罫線のピッチを推定し、この推
定結果から前記罫線の座標位置を決定する罫線位置決定
過程と、 この罫線位置決定過程で決定した前記罫線の座標位置に
おける罫線幅を検出するとともに、これらの罫線の座標
位置および罫線幅に基づいて前記表領域から前記罫線の
領域を抽出する罫線領域抽出過程と、 を備えたことを特徴とする表処理方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9061066A JPH10254992A (ja) | 1997-03-14 | 1997-03-14 | 表処理装置および表処理方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9061066A JPH10254992A (ja) | 1997-03-14 | 1997-03-14 | 表処理装置および表処理方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH10254992A true JPH10254992A (ja) | 1998-09-25 |
Family
ID=13160419
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP9061066A Withdrawn JPH10254992A (ja) | 1997-03-14 | 1997-03-14 | 表処理装置および表処理方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH10254992A (ja) |
-
1997
- 1997-03-14 JP JP9061066A patent/JPH10254992A/ja not_active Withdrawn
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4926492A (en) | Optical character reading apparatus and method | |
| JP3278471B2 (ja) | 領域分割方法 | |
| EP0138445B1 (en) | Method and apparatus for segmenting character images | |
| US8571270B2 (en) | Segmentation of a word bitmap into individual characters or glyphs during an OCR process | |
| JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
| JP5600723B2 (ja) | 様々な文字幅を有するテキスト行の文字を分割するための方法及びシステム | |
| JP3936436B2 (ja) | 表認識方法 | |
| EP0461760B1 (en) | Image processing apparatus and method | |
| JP3544324B2 (ja) | 文字列情報抽出装置及び方法及びその方法を記録した記録媒体 | |
| JPH10254992A (ja) | 表処理装置および表処理方法 | |
| JP2000090194A (ja) | 画像処理方法および画像処理装置 | |
| JP4244692B2 (ja) | 文字認識装置及び文字認識プログラム | |
| JP2003317107A (ja) | 罫線抽出方法及び装置 | |
| JP3019897B2 (ja) | 行切出し方法 | |
| JP3157530B2 (ja) | 文字切り出し方法 | |
| JPH117493A (ja) | 文字認識処理装置 | |
| JPH0581475A (ja) | 文字領域抽出方法 | |
| KR20220168787A (ko) | 만주어의 글자 추출 방법 및 이를 수행하는 시스템 | |
| JP2917394B2 (ja) | 文字認識装置及び文字切り出し方法 | |
| JP3145264B2 (ja) | 文字切出し装置 | |
| Amano et al. | Character string detection algorithm using horizontal boundaries, and its application to a part number entry system | |
| JP2022019253A (ja) | 情報処理装置、情報処理方法及びプログラム | |
| CN115731250A (zh) | 文本分割方法、装置、设备及存储介质 | |
| JP3024234B2 (ja) | 文書画像の罫線抽出装置 | |
| JPH10134145A (ja) | 文字切り出し方法およびそれを用いた文字認識装置と、その文字切り出し方法を実行するプログラムを格納した、コンピュータが読取可能な記憶媒体 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20040601 |