JPH0628520A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH0628520A JPH0628520A JP4183357A JP18335792A JPH0628520A JP H0628520 A JPH0628520 A JP H0628520A JP 4183357 A JP4183357 A JP 4183357A JP 18335792 A JP18335792 A JP 18335792A JP H0628520 A JPH0628520 A JP H0628520A
- Authority
- JP
- Japan
- Prior art keywords
- rectangle
- character
- line
- area
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】
【目的】 罫線内文字領域を正しく抽出する文字認識装
置を提供する。 【構成】 画像データを文字矩形かそれ以外かに分類す
る文字矩形決定部10と、文字矩形以外については矩形
内の線成分を抽出し、線成分から表か表以外かを判定す
る表矩形決定部12と、表以外の外接矩形について、外
接矩形黒画素密度と矩形領域内の全黒画素密度を検出
し、黒画素密度と線成分情報から罫線領域か図形領域か
を判定する罫線領域抽出部を備え、罫線領域と判定した
矩形の矩形情報を抽出されている線成分に入れ替える構
成を有する。
置を提供する。 【構成】 画像データを文字矩形かそれ以外かに分類す
る文字矩形決定部10と、文字矩形以外については矩形
内の線成分を抽出し、線成分から表か表以外かを判定す
る表矩形決定部12と、表以外の外接矩形について、外
接矩形黒画素密度と矩形領域内の全黒画素密度を検出
し、黒画素密度と線成分情報から罫線領域か図形領域か
を判定する罫線領域抽出部を備え、罫線領域と判定した
矩形の矩形情報を抽出されている線成分に入れ替える構
成を有する。
Description
【0001】
【産業上の利用分野】本発明は、印刷文書のデータベー
ス化や文書の再利用のために、スキャナ等の光学的手段
を用いて文書画像を取り込み、取り込んだ画像データか
ら文字、図形、表、罫線等の属性ごとに領域を抽出し、
各属性に応じた認識処理を行う文字認識装置に関する。
ス化や文書の再利用のために、スキャナ等の光学的手段
を用いて文書画像を取り込み、取り込んだ画像データか
ら文字、図形、表、罫線等の属性ごとに領域を抽出し、
各属性に応じた認識処理を行う文字認識装置に関する。
【0002】
【従来の技術】従来の方式について以下説明する。
【0003】まず、スキャナによって取り込まれた2値
データから外接矩形を検出し、外接矩形の大きさと外接
矩形の黒画素密度から、文字矩形と文字以外の矩形とに
分類し、分類された文字矩形を統合することによって文
字領域を抽出する。
データから外接矩形を検出し、外接矩形の大きさと外接
矩形の黒画素密度から、文字矩形と文字以外の矩形とに
分類し、分類された文字矩形を統合することによって文
字領域を抽出する。
【0004】文字以外の矩形については、矩形内に微小
な矩形があらかじめ定められたしきい値以上か、あるい
は、矩形内に占める黒画素密度があらかじめ定められた
しきい値以上あれば、その矩形領域は画像領域となる。
な矩形があらかじめ定められたしきい値以上か、あるい
は、矩形内に占める黒画素密度があらかじめ定められた
しきい値以上あれば、その矩形領域は画像領域となる。
【0005】文字・画像にならなかった残りの矩形に対
しては、矩形内での罫線候補を検出し、線情報を基に表
か図形かを判断して領域を抽出する。
しては、矩形内での罫線候補を検出し、線情報を基に表
か図形かを判断して領域を抽出する。
【0006】抽出した領域が他の領域と重なる場合は領
域を1つの領域に統合して、文字領域については文字認
識を行う。画像領域は画像圧縮、表領域は表認識、図形
領域はベクトル化を行う。
域を1つの領域に統合して、文字領域については文字認
識を行う。画像領域は画像圧縮、表領域は表認識、図形
領域はベクトル化を行う。
【0007】
【発明が解決しようとする課題】しかしながら従来の方
式では、図3に示すような例においては、図7のように
複数の罫線で構成される領域は、表の条件に当てはまら
ないために図形領域となってしまい、内部の文字に対し
てベクトル化するといった課題を有していた。
式では、図3に示すような例においては、図7のように
複数の罫線で構成される領域は、表の条件に当てはまら
ないために図形領域となってしまい、内部の文字に対し
てベクトル化するといった課題を有していた。
【0008】本発明は上記課題を解決するもので、罫線
で囲まれている文字領域を正しく抽出する文字認識装置
の提供を目的とする。
で囲まれている文字領域を正しく抽出する文字認識装置
の提供を目的とする。
【0009】
【課題を解決するための手段】本発明は、上記目的を達
成するため、図形領域となった外接矩形について、外接
矩形黒画素密度と矩形領域内の全黒画素密度(図3の例
では外接矩形黒画素密度は外接矩形領域内の全画素数に
対する領域内に占める罫線の黒画素数の割合、矩形領域
内の全黒画素密度は外接矩形領域内の全画素数に対する
外接矩形領域内の罫線と文字を合せた全部の黒画素数の
割合)を検出する。全黒画素密度が外接矩形黒画素密度
の所定の倍数以上で、かつ、図形候補外接矩形内に、図
2の線成分抽出部で抽出した線成分があればその線成分
は罫線と判定格納され、罫線が取り出された図形候補矩
形を削除する構成を有する。
成するため、図形領域となった外接矩形について、外接
矩形黒画素密度と矩形領域内の全黒画素密度(図3の例
では外接矩形黒画素密度は外接矩形領域内の全画素数に
対する領域内に占める罫線の黒画素数の割合、矩形領域
内の全黒画素密度は外接矩形領域内の全画素数に対する
外接矩形領域内の罫線と文字を合せた全部の黒画素数の
割合)を検出する。全黒画素密度が外接矩形黒画素密度
の所定の倍数以上で、かつ、図形候補外接矩形内に、図
2の線成分抽出部で抽出した線成分があればその線成分
は罫線と判定格納され、罫線が取り出された図形候補矩
形を削除する構成を有する。
【0010】
【作用】本発明は上記した構成によって、複数の罫線が
結合している領域に対して1本ずつの罫線として取り出
すことが可能となるため、罫線で囲まれている文字領域
も罫線領域に統合されることなく、文字領域として正確
に抽出するように作用する。
結合している領域に対して1本ずつの罫線として取り出
すことが可能となるため、罫線で囲まれている文字領域
も罫線領域に統合されることなく、文字領域として正確
に抽出するように作用する。
【0011】
【実施例】本発明の一実施例について図面を参照して説
明する。図1は本実施例における領域分割を実行する装
置のハードウェア構成を示すブロック図である。図1に
おいて、1は領域抽出を行う中央処理装置(以下、CP
Uという)であって図2に示す画像データ入力部7、画
像データ格納部8、外接矩形検出部9、文字矩形決定部
10、線成分抽出部11、表矩形決定部12、罫線領域
抽出部13、認識処理部14を含む。2は領域抽出プロ
グラムが格納されているリードオンリメモリ(以下、R
OMという)である。3はランダムアクセスメモリ(以
下、RAMという)であって、4のスキャナで読み取っ
た画像データが格納される。5は外部からCPU1に対
して指令を与えるためのキーボードであり、6はCPU
1によって認識された認識結果を表示する表示装置であ
る。
明する。図1は本実施例における領域分割を実行する装
置のハードウェア構成を示すブロック図である。図1に
おいて、1は領域抽出を行う中央処理装置(以下、CP
Uという)であって図2に示す画像データ入力部7、画
像データ格納部8、外接矩形検出部9、文字矩形決定部
10、線成分抽出部11、表矩形決定部12、罫線領域
抽出部13、認識処理部14を含む。2は領域抽出プロ
グラムが格納されているリードオンリメモリ(以下、R
OMという)である。3はランダムアクセスメモリ(以
下、RAMという)であって、4のスキャナで読み取っ
た画像データが格納される。5は外部からCPU1に対
して指令を与えるためのキーボードであり、6はCPU
1によって認識された認識結果を表示する表示装置であ
る。
【0012】以下、領域分割処理について、図1ないし
図10を参照しながら説明する。画像データ入力部7と
画像データ格納部8では、スキャナ4で取り込んだ2値
画像データをRAM3に格納する(図6のフローチャー
トのs1)。画像データの座標は図9に示すように左上
が原点で、水平方向の座標をx、垂直方向の座標をyで
表す。
図10を参照しながら説明する。画像データ入力部7と
画像データ格納部8では、スキャナ4で取り込んだ2値
画像データをRAM3に格納する(図6のフローチャー
トのs1)。画像データの座標は図9に示すように左上
が原点で、水平方向の座標をx、垂直方向の座標をyで
表す。
【0013】外接矩形検出部9では、格納された画像デ
ータから、8近傍で連結している黒画素の外接矩形と黒
画素の数を検出し(s2)、外接矩形のデータ、すなわ
ち左上の座標(x1,y1)と右下の座標(x2,y
2)と、黒画素の数をRAM3に格納する。図9に示す
画像データの外接矩形は図10となり、座標(x1,y
1,x2,y2)=(3,2,7,8)と、黒画素数1
5が格納される。図3の外接矩形については、図4に示
すように10個の外接矩形が検出される。
ータから、8近傍で連結している黒画素の外接矩形と黒
画素の数を検出し(s2)、外接矩形のデータ、すなわ
ち左上の座標(x1,y1)と右下の座標(x2,y
2)と、黒画素の数をRAM3に格納する。図9に示す
画像データの外接矩形は図10となり、座標(x1,y
1,x2,y2)=(3,2,7,8)と、黒画素数1
5が格納される。図3の外接矩形については、図4に示
すように10個の外接矩形が検出される。
【0014】文字矩形決定部10では、外接矩形の短辺
の長さがあらかじめ定められたしきい値Th1(=2
5)以上か、あるいは、領域に占める黒画素の割合がし
きい値Th2(=15)以下の場合は文字以外の矩形と
判定し、処理を続ける。外接矩形の短辺がしきい値Th
1未満で、かつ、外接矩形黒画素密度がしきい値Th2
を超える場合は文字領域と判定し、s9へ処理を進める
(s3)。図4の矩形1は、文字以外矩形としてs4へ
進み、矩形2〜矩形10は文字候補としてs9へ進む。
の長さがあらかじめ定められたしきい値Th1(=2
5)以上か、あるいは、領域に占める黒画素の割合がし
きい値Th2(=15)以下の場合は文字以外の矩形と
判定し、処理を続ける。外接矩形の短辺がしきい値Th
1未満で、かつ、外接矩形黒画素密度がしきい値Th2
を超える場合は文字領域と判定し、s9へ処理を進める
(s3)。図4の矩形1は、文字以外矩形としてs4へ
進み、矩形2〜矩形10は文字候補としてs9へ進む。
【0015】ここで、黒画素密度は[黒画素密度d1=
外接矩形の黒画素数/(矩形の幅×矩形の高さ)×10
0%]として求めた値であって、図4の矩形1は、座標
(x1,y1,x2,y2)=(5,5,34,4
4)、黒画素数98であるので、黒画素密度d1は、
[98/((34−5+1)×(44−5+1))×1
00=8.17]となる。
外接矩形の黒画素数/(矩形の幅×矩形の高さ)×10
0%]として求めた値であって、図4の矩形1は、座標
(x1,y1,x2,y2)=(5,5,34,4
4)、黒画素数98であるので、黒画素密度d1は、
[98/((34−5+1)×(44−5+1))×1
00=8.17]となる。
【0016】文字以外の矩形として残った矩形に対し
て、その矩形内に線の成分があるかどうかを調べる線成
分の検出処理を線成分抽出部11において行う(s
4)。線成分抽出の方法は水平方向/垂直方向それぞれ
に、黒画素の長さがしきい値Th3(=10)以上ある
かどうかをチェックする。図4の矩形1の線成分抽出結
果は図5のようになる。こうして検出された線成分を基
に次の表矩形決定部12では表の判定を行う。検出され
た水平線の線の長さが矩形の幅のしきい値Th4(=4
/5)倍のものがしきい値Th5(=3)個以上で、か
つ、垂直線の長さが矩形の高さのしきい値Th4倍以上
のものがしきい値Th5個以上あり、さらに、上記のい
ずれかの線に対して横切る線がしきい値Th6(=2)
以上あればその矩形は表と判定する(s5)。表と決定
された矩形はs9へジャンプし、表と判定されなかった
ものは罫線判定処理へ進む。図4の矩形1は、線成分が
図5のように水平線2、垂直線1であるため表の条件を
満たさない。したがって、この表と判定されなかった矩
形に対して、罫線領域抽出部13において、以下に述べ
る罫線判定を行う。
て、その矩形内に線の成分があるかどうかを調べる線成
分の検出処理を線成分抽出部11において行う(s
4)。線成分抽出の方法は水平方向/垂直方向それぞれ
に、黒画素の長さがしきい値Th3(=10)以上ある
かどうかをチェックする。図4の矩形1の線成分抽出結
果は図5のようになる。こうして検出された線成分を基
に次の表矩形決定部12では表の判定を行う。検出され
た水平線の線の長さが矩形の幅のしきい値Th4(=4
/5)倍のものがしきい値Th5(=3)個以上で、か
つ、垂直線の長さが矩形の高さのしきい値Th4倍以上
のものがしきい値Th5個以上あり、さらに、上記のい
ずれかの線に対して横切る線がしきい値Th6(=2)
以上あればその矩形は表と判定する(s5)。表と決定
された矩形はs9へジャンプし、表と判定されなかった
ものは罫線判定処理へ進む。図4の矩形1は、線成分が
図5のように水平線2、垂直線1であるため表の条件を
満たさない。したがって、この表と判定されなかった矩
形に対して、罫線領域抽出部13において、以下に述べ
る罫線判定を行う。
【0017】s3で検出した外接矩形黒画素密度とs6
で検出する矩形内全黒画素密度の関係から罫線領域であ
るかどうかを判定する。全黒画素密度d2は矩形内のす
べての黒画素を計数してその数を矩形の面積で割ったも
のに100を掛けることにより算出する。図4の矩形1
の全黒画素数は239であるので、全黒画素密度d2
は、[239/((34−5+1)×(44−5+
1))×100=19.9]となる(s6)。s6で検
出した全黒画素密度d2が黒画素密度d1の2倍以上あ
り、線成分抽出部11で検出した水平線が矩形の幅のし
きい値Th7(=4/5)倍のものがあるか、または、
垂直線が矩形の高さのしきい値Th7倍以上のものがあ
れば、その矩形は罫線領域矩形と判定する(s7)。罫
線領域と判定されなかったものは図形領域と判定され、
s9へジャンプする。罫線領域と判定されたものに対し
ては、その矩形情報を削除して、その代わりに線成分抽
出部11で検出した線情報を追加する(s8)。図4の
矩形1は罫線領域候補矩形と判定され、矩形1は削除さ
れ、図5に示すように線1,線2,線3が追加される。
で検出する矩形内全黒画素密度の関係から罫線領域であ
るかどうかを判定する。全黒画素密度d2は矩形内のす
べての黒画素を計数してその数を矩形の面積で割ったも
のに100を掛けることにより算出する。図4の矩形1
の全黒画素数は239であるので、全黒画素密度d2
は、[239/((34−5+1)×(44−5+
1))×100=19.9]となる(s6)。s6で検
出した全黒画素密度d2が黒画素密度d1の2倍以上あ
り、線成分抽出部11で検出した水平線が矩形の幅のし
きい値Th7(=4/5)倍のものがあるか、または、
垂直線が矩形の高さのしきい値Th7倍以上のものがあ
れば、その矩形は罫線領域矩形と判定する(s7)。罫
線領域と判定されなかったものは図形領域と判定され、
s9へジャンプする。罫線領域と判定されたものに対し
ては、その矩形情報を削除して、その代わりに線成分抽
出部11で検出した線情報を追加する(s8)。図4の
矩形1は罫線領域候補矩形と判定され、矩形1は削除さ
れ、図5に示すように線1,線2,線3が追加される。
【0018】以上の処理によって、図3の画像データに
ついては、文字矩形である図4の矩形2〜矩形10の9
個と罫線である図5の線1、線2、線3の3個の計12
個の矩形情報から領域の抽出を行う。このようにして得
られた領域結果を図8に示す。
ついては、文字矩形である図4の矩形2〜矩形10の9
個と罫線である図5の線1、線2、線3の3個の計12
個の矩形情報から領域の抽出を行う。このようにして得
られた領域結果を図8に示す。
【0019】次に、抽出された領域が他領域と重ならな
いかどうかをチェックし、重なる場合は領域を統合する
(s9)。
いかどうかをチェックし、重なる場合は領域を統合する
(s9)。
【0020】以上のようにして得たそれぞれの領域に対
して認識処理部14では、文字領域の場合は文字切り出
し処理を施した後、文字認識処理を行う。図形領域の場
合は図形をベクトル化し、表領域の場合は、表の構造認
識を行い、各セルに対して文字認識処理を行う。
して認識処理部14では、文字領域の場合は文字切り出
し処理を施した後、文字認識処理を行う。図形領域の場
合は図形をベクトル化し、表領域の場合は、表の構造認
識を行い、各セルに対して文字認識処理を行う。
【0021】このように本実施例によると、領域抽出処
理を行う中央処理装置と、領域抽出プログラムが格納さ
れているROMと、読み取った画像データを格納するR
AMと、中央処理装置で認識された結果を表示する表示
装置を備え、中央処理装置は、画像データ入力部、画像
データ格納部、外接矩形検出部、文字矩形決定部、線成
分抽出部、表矩形決定部、罫線領域抽出部、認識処理部
を含み、画像データから文字矩形か、それ以外かに分類
し、文字矩形以外のものから表か、表でないかを判定
し、表以外の矩形について罫線領域か図形領域かを判定
し、罫線領域と判定された矩形に対し、その矩形情報を
線成分に変えて、従来のように罫線領域を1つの図形領
域として抽出することなく、1本ずつの罫線として抽出
するので、罫線で囲まれている文字領域が正しく抽出で
きる。
理を行う中央処理装置と、領域抽出プログラムが格納さ
れているROMと、読み取った画像データを格納するR
AMと、中央処理装置で認識された結果を表示する表示
装置を備え、中央処理装置は、画像データ入力部、画像
データ格納部、外接矩形検出部、文字矩形決定部、線成
分抽出部、表矩形決定部、罫線領域抽出部、認識処理部
を含み、画像データから文字矩形か、それ以外かに分類
し、文字矩形以外のものから表か、表でないかを判定
し、表以外の矩形について罫線領域か図形領域かを判定
し、罫線領域と判定された矩形に対し、その矩形情報を
線成分に変えて、従来のように罫線領域を1つの図形領
域として抽出することなく、1本ずつの罫線として抽出
するので、罫線で囲まれている文字領域が正しく抽出で
きる。
【0022】なお、本実施例では、各しきい値は、Th
1=25、Th2=15、Th3=10、Th4=4/
5、Th5=3、Th6=2、Th7=4/5、とした
が、これらの値に限定されるものではない。
1=25、Th2=15、Th3=10、Th4=4/
5、Th5=3、Th6=2、Th7=4/5、とした
が、これらの値に限定されるものではない。
【0023】
【発明の効果】以上の実施例から明らかなように本発明
によると、複数の線が結合している罫線領域を1つの図
形領域として抽出せずに、1本ずつの罫線として取り出
せるので、罫線で囲まれている文字領域は図形領域に統
合されず、文字領域として正確に抽出することが可能と
なり、精度の高い認識が行える文字認識装置を提供でき
る。
によると、複数の線が結合している罫線領域を1つの図
形領域として抽出せずに、1本ずつの罫線として取り出
せるので、罫線で囲まれている文字領域は図形領域に統
合されず、文字領域として正確に抽出することが可能と
なり、精度の高い認識が行える文字認識装置を提供でき
る。
【図1】本発明の一実施例における領域分割を実行する
装置のハードウェア構成を示すブロック図
装置のハードウェア構成を示すブロック図
【図2】同装置における機能構成を示すブロック図
【図3】本実施例における画像データ例を示す模式図
【図4】図3の外接矩形検出結果の模式図
【図5】図3の線成分抽出結果の模式図
【図6】本実施例における画像領域分割処理を示すフロ
ーチャート
ーチャート
【図7】画像データの座標の説明図
【図8】本実施例における領域抽出結果を示す模式図
【図9】画像データの一例を示す模式図
【図10】図9に示す画像データの外接矩形図
1 CPU 2 ROM 3 RAM 4 スキャナ 6 表示装置 7 画像データ入力部 8 画像データ格納部 9 外接矩形検出部 10 文字矩形決定部 11 線成分抽出部 12 表矩形決定部 13 罫線領域抽出部
Claims (1)
- 【請求項1】文字を読み取り、画像データを生成するス
キャナ、読み取られた画像データを格納するRAM、文
字領域抽出プログラムが格納されているROM、文字領
域抽出処理を行う中央処理装置、前記中央処理装置で認
識された結果を表示する表示装置を備え、前記中央処理
装置の中に、前記スキャナで読み取った画像データを前
記RAMに格納するための画像データ入力および格納部
と、前記RAMに格納された画像データにおける黒画素
の外接矩形と黒画素を検出し、外接矩形の座標と黒画素
数を前記RAMに格納する外接矩形検出部と、前記外接
矩形の大きさを基準値と比較し、外接矩形内全画素数に
対して前記外接矩形の黒画素数の占める割合である黒画
素密度を密度基準値と比較した結果から前記外接矩形が
文字矩形か非文字矩形かを判定する文字矩形決定部と、
前記文字矩形決定部において判定された非文字矩形から
線成分の抽出処理をする線成分抽出部と、前記線成分抽
出部において抽出された線成分の水平線分および垂直線
分の長さをそれぞれの長さ基準値と比較した結果から前
記非文字矩形は表であるか否かを決定する表矩形決定部
と、前記表矩形決定部で表でないと決定された矩形につ
いて前記矩形内全画素数に対する前記矩形内全黒画素数
の割合である全黒画素密度を全密度基準値と比較し、そ
して前記線成分抽出部において抽出された水平および垂
直線分長をそれぞれの長さ基準値と比較した結果から前
記矩形を罫線領域矩形と判定する罫線領域抽出部とを含
み、前記中央処理装置は、前記罫線領域抽出部において
罫線領域矩形と判定された矩形を削除し、前記線成分抽
出部にて抽出された線成分に入れ替え、罫線で囲まれて
いる文字領域を抽出して、文字認識処理が行われるよう
に構成した文字認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4183357A JPH0628520A (ja) | 1992-07-10 | 1992-07-10 | 文字認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4183357A JPH0628520A (ja) | 1992-07-10 | 1992-07-10 | 文字認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0628520A true JPH0628520A (ja) | 1994-02-04 |
Family
ID=16134340
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP4183357A Pending JPH0628520A (ja) | 1992-07-10 | 1992-07-10 | 文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0628520A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003216944A (ja) * | 2002-01-23 | 2003-07-31 | Fujitsu Ltd | 画像結合装置 |
| JP2012022575A (ja) * | 2010-07-15 | 2012-02-02 | Canon Inc | 画像処理装置、画像処理方法及びプログラム |
-
1992
- 1992-07-10 JP JP4183357A patent/JPH0628520A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003216944A (ja) * | 2002-01-23 | 2003-07-31 | Fujitsu Ltd | 画像結合装置 |
| JP2012022575A (ja) * | 2010-07-15 | 2012-02-02 | Canon Inc | 画像処理装置、画像処理方法及びプログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3278471B2 (ja) | 領域分割方法 | |
| US7164795B2 (en) | Apparatus for extracting ruled line from multiple-valued image | |
| JP2940936B2 (ja) | 表領域識別方法 | |
| CN115661848B (zh) | 一种基于深度学习的表格提取和识别方法及系统 | |
| US20050201619A1 (en) | Video text processing apparatus | |
| JP3913985B2 (ja) | 文書画像中の基本成分に基づく文字列抽出装置および方法 | |
| JPH0721310A (ja) | 文書認識装置 | |
| JP3411472B2 (ja) | パターン抽出装置 | |
| JPH0628520A (ja) | 文字認識装置 | |
| JPH06187489A (ja) | 文字認識装置 | |
| Mitchell et al. | Document page segmentation based on pattern spread analysis | |
| JP3476595B2 (ja) | 画像領域分割方法、および画像2値化方法 | |
| JPH06180771A (ja) | 英文字認識装置 | |
| JPH07160810A (ja) | 文字認識装置 | |
| US7103220B2 (en) | Image processing apparatus, method and program, and storage medium | |
| JP3095470B2 (ja) | 文字認識装置 | |
| Okun et al. | Robust text detection from binarized document images | |
| JP3406942B2 (ja) | 画像処理装置及び方法 | |
| JPH0721309A (ja) | 文書認識装置 | |
| JPH07168911A (ja) | 文書認識装置 | |
| JPH0822507A (ja) | 文書認識装置 | |
| JP3060248B2 (ja) | 表認識装置 | |
| JP3517077B2 (ja) | パターン抽出装置及びパターン領域の切り出し方法 | |
| JP3220226B2 (ja) | 文字列方向判別方法 | |
| JP3100825B2 (ja) | 線認識方法 |