JPH01216493A - 文字行抽出装置 - Google Patents

文字行抽出装置

Info

Publication number
JPH01216493A
JPH01216493A JP63041564A JP4156488A JPH01216493A JP H01216493 A JPH01216493 A JP H01216493A JP 63041564 A JP63041564 A JP 63041564A JP 4156488 A JP4156488 A JP 4156488A JP H01216493 A JPH01216493 A JP H01216493A
Authority
JP
Japan
Prior art keywords
character
blocks
block
line
character block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63041564A
Other languages
English (en)
Inventor
Yoshitake Tsuji
辻 善丈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63041564A priority Critical patent/JPH01216493A/ja
Publication of JPH01216493A publication Critical patent/JPH01216493A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、郵便物上の住所名などを読み取る文字認識装
置等に利用され、紙面上に書かれた複数個の文字行を抽
出する文字行抽出装置に係わる。
(従来の技術) 郵便物上の住所名や既存文書上の各文字を文字認識技術
を利用して、読み取るためには、紙面上に手書き又は印
刷きれた文字を光学的に走査し、通常2値量子化の変換
処理を行った後、最初に紙面上に記載された文字行領域
を抽出する処理を行う必要がある。ここで、文字行抽出
処理において、郵便物の如く、手書き文字サイズの変動
等に起因する文字行の傾きや紙面上の傾きが生じると文
字行抽出処理が困難となる場合が生じる。また、郵便物
住所領域の丁―番地記載の際に、住所行に縦書きと横書
きが混在する場合には、更にこれらを分離した上で、1
つの住所行として抽出する必要がある。従来、このよう
な文字行抽出方法として、例えばr書式指定情報によら
ない紙面構成要素抽出法」(電子通信学会論文誌D V
OL、J66−D、 No、1. PPIII〜113
.1983年)に示きれているように、印刷文書を対象
に投影分布等により抽出する方法がある。別の文字行抽
出方法として、例えば「対象文書に関する知識を援用し
た手書き文書からの文字切り出しの一提案」(電子通信
学会、バタン認識と学習研究報告P RL 85−63
 )に示されているように、ラベリング処理等により抽
出された文字塊領域を囲む最小矩形ブロックからマージ
処理により近接する矩形ブロック間の統合、更には傾き
検出等を行う方法がある。
(発明が解決しようとする課題) 以上述べた従来技術において、第1番目に述べた従来技
術では、予め傾き補正を施す必要があり、また、郵便物
上の手書きで記載された住所行を対象とすると、文字サ
ンズの変動もあり、文字行抽出処理が困難となる場合が
生じる。一方、第2番目に述べた従来技術を用いても、
例えば、手書き文字のサイズや書き方による行の傾き、
更には1つの文字行内に縦書きや横書きが存在する場合
には、文字行抽出精度が劣化することになる。
本発明の目的は、従来の文字行の傾きや手書き文字サイ
ズの変動を吸収して、文字行領域を精度良く抽出するた
めに、ラベリング処理により抽出きれた複数個の文字塊
ブロック間の所定方向の配置関係に着目して文字行を抽
出するようにした文字行抽出装置を提供することにある
本発明の他の目的は、郵便物上のT目番地記載の際に見
られるように、1つの文字行内に異なる方向を持つ文字
行が存在しても、複数個の文字塊ブロック間の配置関係
に着目して文字行を抽出するようにした文字行抽出装置
を提供することにある。
(課題を解決するための手段) 前述の課題を解決するために本発明が提供する第1の文
字行抽出装置は、紙面上から背景と分離可能な複数個の
文字塊ブロックを抽出する手段と、上下又は左右方向の
うちの所定方向における任意の2つの文字塊ブロック間
の距離及び重なり具合を検査することによって、複数個
の前記文字塊ブロック間の上下又は左右の配置関係を求
め、記憶する手段と、前記複数個の文字塊ブロック間の
配置関係に基づいて、各文字塊ブロックを分類し、前記
所定方向の複数個の文字行を抽出する手段とを備えるこ
とを特徴とする。
また、本発明の第2の文字行抽出装置は、紙面上から背
景と分離可能な複数個の文字塊ブロックを抽出する手段
と、上下及び左右方向における任意の2つの文字塊ブロ
ック間の距離及び重なり具合を検査することによって、
複数個の文字塊ブロック間の上下及び左右の配置関係及
び文字塊ブロック間距離を求め、記憶する手段と、上下
又は左右方向のうちの所定方向の前記文字塊ブロック間
の配置関係に基づいて、各文字塊ブロックを分類し、文
字行候補を抽出する手段と、前記文字行候補の形状を調
べ、前記所定方向の複数個の文字行を決定する手段と、
前記所定方向と異なる方向を持つ前記文字塊ブロック間
の配置関係に従って前記文字行に含まれない文字ブロッ
クを分類し、前記異なる方向を持つ文字行候補を抽出す
る手段と、前記異なる方向を持つ文字行候補に含まれる
複数個の文字塊ブロックに対して、1つ以上の前記文字
塊ブロックが前記所定方向の1つないし複数個の文字行
に含まれる場合、前記異なる方向における前記複数個の
文字塊ブロック間の距離に従って前記異なる方向を持つ
文字行候補内の各文字塊ブロックを検査し、前記各文字
塊ブロックを前記所定方向の文字行に統合する手段とを
備えることを特徴とする。
(実施例) 以下、本発明の実施例について図面を参照にしながら説
明する。
第1図は、本発明における各文字塊ブロック間の配置関
係に基づいて各文字塊ブロックを分類し、文字行を抽出
する一例を示したものである。
第1図(a)において、斜線は文字イメージを示し、記
号す、(、i=1.2・・・6)で文字部イメージを囲
む矩形ブロック(以下、文字塊ブロック)を示している
。ここで、このような文字塊ブロックの抽出は、ラベリ
ング処理や輪郭追跡などの公知の技術を用いて実現でき
る。尚、第1図(a)の点線で示した文字塊ブロン、り
す、は、文字塊ブロックb4に包含されるため、通常の
マージ処理により文字塊ブロックb4に統合跡れるもの
とする。また、本発明を適用する前に、通常用いられる
隣接した文字塊ブロックの統合処理やサイズ処理によっ
て文字塊ブロックの数を減少きせておいても良い。
$l[3U(b)は、2つの文字塊ブロック1) l 
+b、の左右方向の配置関係の検査方法の一例を説明す
るための図である。尚、第1図(b)を用いて、左右方
向の配置関係の検査方法の一例について説明するが、上
下方向についても同様である。
第1Vl!J(b)において、記号d1..は、文字塊
ブロックb+、bt間の距離を示している。また、記号
!、及び2.は、それiれ文字塊ブロックの高さ、即ち
図中X軸方向への射影を示している。また、図中点線で
示した1、nl、は、文字塊ブロックb、、b、の左右
方向の重なり量を示している。
そこで、文字塊ブロックb=、b*の左右方向への重な
り具合を示す尺度の一例として、例えば、2つの文字塊
ブロックb、、iのX軸方向への射影のうち、最小とな
る値、即ちwin(j!−、j!−)と文字塊ブロック
bs−baの左右方向の重なり量と呼ぶ)を用いること
ができる。上記文字塊ブロックb、とす、との重なり尺
度@@elは、0かも1の範囲を示し、0の場合には、
全く左右方向に重なりを持たないことを示す。
尚、2つの文字塊ブロックが重なりを持つか否かの判定
は、上記重なり尺度を予め定められた固定的な閾値Ts
(但し、0<T、<1)により決定しても良いし、前記
閾値Tsを上記文字塊ブロック間の距離dにより動的に
変更きせながら決定しても良い。
次に、上下又は左右の配置関係の有無は、上記重なり尺
度S及び文字塊ブロック間の距離dをそれぞれ閾値T、
及びTaにより判定する。即ち2つの文字塊ブロックb
、、b、の所定方向(上下又はが閾値T、より大きく且
つ文字塊ブロック間距離dl+1が閾値T4より小さい
時、所定方向の配置関係が成立するとする。
第1図(c)は、第1図(a)で示した文字塊ブロック
bs、bz−bs−ba−baに対する上下方向の配置
関係を抽出し、マトリックスとして表現したものである
尚、第1図(1k)における上下方向の配置関係は、2
つの文字塊ブロック1) I m t) I (1#j
 s1 + j =1 + 2 +・・・5)の重なり
尺度S11.の閾値T、を0.9程度、文字塊間距離d
0..の閾値T、を第1図(a)の2文字公租度に設定
した場合の一例であるが、上記閾値の設定以外に限定さ
れるものではない。
第1図(C)のマトリックス内の値1又は−1は、マト
リックスの列上の文字ブロックb+に対してζマトリッ
クスの打上の文字ブロックb、がそれぞれ下方向又は上
方向に配置されていることを示す、即ち、第1図(C)
から例えば、文字塊ブロックb、と文字塊ブロックb4
とは上下方向の配置関係を満足し、文字ブロックb、は
文字ブロックb4の上方にあることがわかる。ここで、
上記マトリックスは、配を関係の有無を示す値1と−1
が対称の形をとるから、マトリックスの対角線から下半
分は、上半分と同じことを意味する。そこで、その下半
分は省略できる。また、第1図(C)で示した2つの文
字塊ブロックb。
bl(i≠Li+j雲1,2.・・・5)の配置関係に
関連した特徴量として、第1図(C)のマトリックスに
一意に関連付けられて、文字塊ブロック間距離d9..
や重なり尺度5illの特徴量も抽出されているものと
する。
第1図(d)は、第1図(a)で示した縦書き文字行り
を第1図(c)から抽出する一例を示したものである。
最初に第1図(c)の配置関係から部分文字行り、、L
、、Lee L、が容易に算出できる。即ち、文字ブロ
ックb□とb4は上下関係が成立するため、文字塊ブロ
ックb+、baから構成される部分文字行L8が抽出で
きる。(L、ε(b、、’b4))、同様に文字塊ブロ
ックbx、b−から構成される部分文字行り、(L、ε
(ba、ba))、部分文字行り、ε(bs、ba、b
i)、L4ヨ(ba、bi)となる。
次に、上述して求めた部分文字行L1*L!*L、、L
、に対して、共通する文字塊ブロックを含む部分文字行
を順次統合することにより、第1図(a)で示した文字
行りを抽出することができる。即ち、部分文字行L1と
り、では共通する文字塊ブロックb4を持ち、統合され
た部分文字行と部分文字行り、では共通する文字ブロッ
クb4を持つ。その結果として、文字塊ブロックb 1
 + 1) Rg、。
b、、b、、bsを含む上下方向即ち縦書きの文字行り
が抽出できる。尚、第1図では縦書き文字行について説
明したが、横書き文字行の場合でも左右方向の配置関係
を用いることにより実現できる。
第2図は、第1図で説明した上下方向の配置関係に従っ
て、手書ききれた文字行を抽出した一例である。尚、第
2図で示す文字行抽出処理は、請求項の第1項に記載の
文字行抽出装置により実現できる。
第2図において、各文字塊ブロック間の上下方向の配置
関係を第1図で説明した重なり尺度の閾値Ts及び文字
塊ブロック間の距離の閾値T4を用いて求め、各文字塊
ブロックb、(i=1・−15)を分類すると、(bl
、ba、bs)、(bl、my、。
bi)、(b、、b、、bi)、(ba、bs−be)
、(b、、b、、bt)、(bit by、bs)、(
b、)、(b、、bIs、btt)、(bI。e t)
 tt w 1) It r 1) It +b、、)
、(tilt e t)t! e bIs e t)+
a e bus)、(bIs 、bts −bI−、b
aa)、(bll e t)14 *b+i)、(bt
−、baa)、(bti)が得られ、共通する文字塊ブ
ロックを検出し、統合処理を行うと、図中点線で示す2
つの縦書き文字行り、ε(bl−ba−bs、ba、b
l、bs、by、bs)、L、ε(1)as bxst
 bll、 bt*+t)ts* bratb、i)が
抽出できる。即ち、第2図の点線で示された2つの文字
行り、、b、の如く、手書き文字のザイズ変動や傾き変
動が生じても、前述したように請求項の第1項に記載の
文字行抽出装置により安定に文字行の抽出が行うことが
できる。
第3図及び第4図は、郵便物等に見られる縦書きと横書
きとが混在した文字行イメージの一例であり、請求項の
第2項に記載の文字行抽出処理の方法を説明するために
用いた図である。ここで、第1図及び第2図で説明した
ように、上下方向の配電関係が求められ、更に、第1図
及び第2図で説明した同様な方法で、左右方向の配置関
係も求められているとする。最初に、上下方向の配置関
係に従って図中点線で示す文字行候補L@@Lb+Lc
、Laが抽出きれる。即ち、それぞれの文字行は、L、
ε(b+ 、bffie bs、b4,1)l+ b、
by)、L1ε(b、)、Lcε(b、)、L4ε(b
It、bIt、blg)を満足することになる0次に、
上下方向即ち縦書きの4つの文字行候補り、。
L、、L、、L、が文字行となり得るか否かが判定され
る0判定方法として、各文字行候補内の文字塊ブロック
数や各文字行の縦横比、大きき等を用いて、1つないし
複数個の判定条件を組み合わせて適用することができる
0例えば、最も簡単な文字行判定条件として、文字行内
の文字塊ブロックが2個以上存在し、且つ一定以上の領
域の大ききを持つという判定条件を適用すると、図中、
文字行候補り、及びL4は、縦書き文字行として成立す
るが、文字行候補Lc及びL4は、縦書き文字行として
成立しなくなるため、文字塊ブロックb a eb、は
、縦書き文字行に含まれない文字塊ブロックとして以下
のように処理きれる。
まず、第1図で説明したように左右方向の配置関係に従
って、文字塊ブロックba、beは含む左右方向の配置
関係が存在するか否かが検査され、文字塊ブロックba
、beを含む左右方向の文字行(以下、文字列と呼ぶ)
候補を抽出する。即ち、第3図の場合には、第4図に示
す如く、図中点線で示す文字塊ブロックba、beを含
む文字列候補C1のみが得られ、それに含まれる文字塊
ブロックは、bsp bl、by、bar bes b
lffiとなる。
ここで、文字列候補C1の如く、縦書き文字行に含まれ
ない文字塊ブロックが左右方向の配置関係により、文字
列候補を形成しない場合は、文字行を形成しない文字塊
ブロックとして取り扱われることになる。
次に、文字列候補C1内の各文字塊ブロックb。
(i=5.6,7,8,9.12)が前述した縦書き文
字行の要素であるか否かを第3図で示した縦書き文字行
り、、L、内の各文字ブロックと比較することによって
検査きれる。即ち、第4図の例では、文字塊ブロックb
、、b、、b、が第3図で示した文字行り、に含まれ、
文字塊ブロックbl!は第3図で示した文字行り、に含
まれる。
そこで、第3図で示した文字行り、、L、に含まれない
文字塊ブロックb、、b、がそれぞれ、文字行り、に属
する文字塊ブロックbA、bat byに統合諮れるか
あるいは、文字行L4に属する文字塊ブロックb、、に
統合諮れるかが検査きれる1文字塊ブロック間の統合・
分割条件として、例えば左右方向の文字塊ブロック間の
配置関係に関連して抽出される文字塊ブロック間距離を
利用することができる。即ち、第4図で示す文字塊ブロ
ックb、、b、に対して左右方向に配置関係が存在する
最も小ネい文字塊ブロック間距離d1.2、dl、8、
dI!、、の値を比較しながら文字塊ブロック、b、。
b、を文字行り、に含まれる文字塊ブロックb?。
ba、biに統合される。具体的には、文字塊ブロック
b、に対して、文字塊ブロック間距離d、、。
及びd90.が比較され、d、、、がd、1より大きけ
れば、文字塊ブロックb、は文字塊ブロックb、に統合
きれる。一方d1..がd9.、より小さければ、文字
塊ブロックb、は文字塊ブロックb、に統合される。上
記文字塊ブロックb、と文字塊ブロックb、とが統合さ
れた場合には、文字塊ブロック間距離d、、、とdll
lとが比較され、d、1.がdlll**より小さけれ
ば、文字塊ブロックb、、b、は文字塊ブロックb、に
統合されることによって、第4図で示された文字列C5
が形成きれることになり、d、、、がdl!IIより大
きければ、文字塊ブロックb、、b、は文字塊ブロック
b1mに統合されることになる。一方、文字塊ブロック
b、が文字塊ブロックb、に統合された場合には、文字
塊ブロック間距離d、1とdI!+@が比較され、d9
1.がd +*+sより小さければ、文字塊ブロックb
、は、文字塊ブロックb、に統合されることによって、
図中文字列C1が形成きれることになり、d90.がd
 +**sより大きければ文字塊ブロックb、は、文字
塊間ブロックbI!に統合きれることになる。第3図の
郵便物上の手書き文字の場合には、第4図で示す横方向
の文字行c1が形成されることになる。
以上に述べたように、第3図で示したように、縦書き横
書きの文字行が存在する場合には、最初に、所定方向の
文字塊ブロック間の配置関係に従って所定方向の文字行
を決定した後、所定方向とは異なる方向の文字塊ブロッ
ク間の配置関係及び所定方向の文字行に含まれなかった
複数個の文字塊ブロックに関連する文字塊ブロック間の
距離を検査することにより前記1つないし複数個の、文
字塊ブロックがどの所定方向の文字行に属するかを決定
することができる。
尚、第3図で示した文字行り、が上方に記載され、文字
塊ブロックb、と文字塊ブロックb11が左右方向の配
置関係が成立しない場合にも上述したような文字塊ブロ
ック間の距離の検査により、第4図の横書き文字行C1
が抽出されることは明らかである。
第5図は請求項の第1項に記載の文字行抽出装置の一実
施例を示す機能ブロック図である。1は、画像メモリで
あり、画像メモリ1には紙面上に記載された複数個の文
字行を光学的に走査し、2値量子化後複数個の文字行イ
メージとして記憶する。2は、文字塊ブロック抽出部で
あり、第1図(a)で示したように、複数個文字部イメ
ージを囲む矩形ブロック即ち文字塊ブロックを抽出し、
文字塊ブロック記憶部3に順次格納する。9は、方向パ
ラメータ記憶部であり、上下方向又は左右方向を指示す
るパラメータが記憶されている。11は配置関係抽出部
であり、重なり計測部4及び距離計測部5及び配置関係
判定部6から構成される装置関係抽出部10は、方向パ
ラメータ記憶部9から検出すべき配置関係の方向文字塊
ブロック記憶部3から複数個の文字塊ブロックを読み出
し、重なり計測部4及び距離計測部5によって、第1図
で示したように文字塊ブロック間の重なり尺度及び距離
が順次計測され、判定部6において重なり尺度及び距離
に関する閾値T、、T、と比較され、第1図(c)で説
明したように、方向パラメータ記憶部9に格納された所
定の方向における文字塊ブロック間の配置関係情報を算
出し、配置関係記憶部7に格納する。8は行分類部であ
り、第1図(d)で説明したように、配置関係記憶部7
に格納きれた所定方向の配置関係情報を読み出し、各文
字塊ブロックを前記配置関係情報に従って分類し、分類
された各文字塊ブロックの位置・大きさから1つないし
複数個の文字行領域とそれに属する各文字塊ブロックを
文字行記憶部10に転送する。
第6図は請求項の第2項に記載の文字行抽出装置の一実
施例を示す機能ブロック図である。1は画像メモリであ
る。2は文字塊ブロック抽出部である。3は文字塊ブロ
ック記憶部である0図中点線で示したブロック11は、
配置関係抽出部であり、重なり計測部4.距離計測部5
9判定部6から構成きれる。7は配置関係記憶部である
。ここまでに述べた機能ブロックは、第5図の文字行抽
出装置で述べた機能と同等な機能を有する。但し、配置
関係抽出部11において、第5図の文字行抽出装置では
、上下又は左右方向のどちらか一方の文字塊ブロックの
配置関係情報のみが抽出されるが、第6図の文字行抽出
装置では、上下及び左右方向の両方向に対する文字塊ブ
ロックの配置関係情報が抽出され、配置関係記憶部7に
格納きれるとする。
上下及び左右方向における文字塊ブロック間の配置関係
情報が抽出され、配置関係情報が配置関係記憶部7に格
納きれると、行分類部8は方向パラメータ記憶部9から
上下又は左右方向を示すパラメータを読み出し、前記パ
ラメータで指示きれた所定方向の配置関係情報を配置関
係記憶部7から読み出し、第3図で示したように、文字
塊ブロック記憶部3に格納された複数個の文字塊ブロッ
クを前記所定方向の複数個の文字行候補の要素に分類す
ることによって、複数個の文字行候補を生成する0次に
、前述した複数個の文字行候補とその要素である複数個
の文字塊ブロックが行候補検査部21に転送きれる0行
候補検査部21では、第3図で説明したように、生成さ
れた複数個の各文字行候補が文字行であるか否かを検査
し、文字行と決定きれれば、文字行としてそれに含まれ
る文字塊ブロックと共に行記憶部23に転送する。−方
、文字行でないと判断されると、それに含まれていた1
つないし複数個の文字塊ブロックを非行文字塊ブロック
記憶部22に転送される。ここで、文字行検査部21に
おいて、文字行であるか否かの判定方法の一例として、
文字行候補内の文字塊ブロック数及び文字行候補の縦横
比を予め定めた閾値と比較することによって行われる。
次に、列分類部24は、非行文字塊ブロック記憶部22
に格納された複数個の文字塊ブロック(以下、非行文字
塊ブロックと呼ぶ)及び方向パラメータ記憶部9に格納
された所定方向情報を読み出す。次に、前記所定方向と
異なる方向の文字塊ブロック間の配置関係情報のうち、
各非行文字塊ブロックを含む配置関係情報を配置関係記
憶部7から読み出し、第4図で示したように、非行文字
塊ブロックを含む前記具なる方向の文字行候補、即ち文
字列候補を生成し、複数個の文字列候補とその要素であ
る非行文字塊ブロックを含む複数個文字塊ブロックを列
記憶部25に格納する。
次に、列状合部26は、第4図の図中文字列C5で示し
たように、非行文字塊ブロックの文字行への統合処理を
行う。列状合部26におい工、最初に行記憶部23に格
納された文字行とそれに含まれる複数個の文字塊ブロッ
クと列記憶部25に格納きれた文字列候補とその要素で
ある非行文字塊ブロックを含む複数個の文字塊ブロック
を読み出し、文字列候補内の各文字塊ブロックのうち、
前記1つないし複数個の文字行に含まれる文字塊ブロッ
クを抽出する0次に、各文字列候補内の1つないし複数
個の非行文字ブロック間の距離及び、非行文字ブロック
間の距離を比較検査することによって、前記文字列候補
内の各非行文字塊ブロックの所定の文字行に統合し、文
字行記憶部10へ転送する。
(発明の効果) 以上に説明したように、本発明によれば、複数個の文字
塊ブロック間の上下又は左右の重なり具合及びブロック
間距離に従って抽出きれる配置関係を利用することによ
って、文字行の傾きや手書き文字サイズの変動が生じた
り、更には1つの文字行内に縦書きと横書きが混在する
ような場合にも、安定にしかも容易に文字行が抽出でき
る装置を提供できる。
【図面の簡単な説明】
第1図は本発明における各文字塊ブロック間の配置関係
に基づいて各文字塊ブロックを分類し、文字行を抽出す
る一例を示す図である。 第2図は請求項の第1項に記載の文字行抽出装置により
実現される手書きされる文字行の抽出例を示す図である
。 第3図及び第4図は縦書きと横書きとが混在した文字行
イメージの一例を示す図であり、請求項の第2項に記載
の文字行抽出装置により実現される文字行の抽出例を示
す。 第5図は請求項の第1項に記載の文字行抽出装置の一実
施例を示す機能ブロック図である。 第6図は請求項の第2項に記載の文字行抽出装置の一実
施例を示す機能ブロック図である。 図において、1は画像メモリ、2は文字塊ブロック抽出
部、3は文字塊ブロック記憶部、4は重なり計測部、5
は距離計測部、6は判定部、11は配置関係抽出部、7
は配置関係記憶部、8は行分類部、9は方向パラメータ
記憶部、10は画像メモリ、11は配置関係抽出部、2
1は行候補検査部、22は非行文字塊ブロック記憶部、
23は行記憶部、24は列分類部、25は列記憶部、2
6は列状合部である。

Claims (1)

  1. 【特許請求の範囲】 1、紙面上に記載された複数個の文字行を抽出する文字
    行抽出装置において、 紙面上から背景と分離可能な複数個の文字 塊ブロックを抽出する手段と、 上下又は左右方向のうちの所定方向におけ る任意の2つの文字塊ブロック間の距離及び重なり具合
    を検査することによって、複数個の前記文字塊ブロック
    間の上下又は左右の配置関係を求め、記憶する手段と、 前記複数個の文字塊ブロック間の配置関係 に基づいて、各文字塊ブロックを分類し、前記所定方向
    の複数個の文字行を抽出する手段とを備えることを特徴
    とする文字行抽出装置。 2、紙面上に記載された複数個の文字行を抽出する文字
    行抽出装置において、 紙面上から背景と分離可能な複数個の文字 塊ブロックを抽出する手段と、 上下及び左右方向における任意の2つの文 字塊ブロック間の距離及び重なり具合を検査することに
    よって、複数個の文字塊ブロック間の上下及び左右の配
    置関係及び文字塊ブ ロック間距離を求め、記憶する手段と、 上下又は左右方向のうちの所定方向の前記 文字塊ブロック間の配置関係に基づいて、各文字塊ブロ
    ックを分類し、文字行候補を抽出する手段と、 前記文字行候補の形状を調べ、前記所定方 向の複数個の文字行を決定する手段と、 前記所定方向と異なる方向を持つ前記文字 塊ブロック間の配置関係に従って前記文字行に含まれな
    い文字ブロックを分類し、前記異なる方向を持つ文字行
    候補を抽出する手段と、前記異なる方向を持つ文字行候
    補に含まれ る複数個の文字塊ブロックに対して、1つ以上の前記文
    字塊ブロックが前記所定方向の1つないし複数個の文字
    行に含まれる場合、前記異なる方向における前記複数個
    の文字塊ブロック間の距離に従って前記異なる方向を持
    つ文字行候補内の各文字塊ブロックを検査 し、前記各文字塊ブロックを前記所定方向の文字行に統
    合する手段とを備えることを特徴とする文字行抽出装置
JP63041564A 1988-02-24 1988-02-24 文字行抽出装置 Pending JPH01216493A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63041564A JPH01216493A (ja) 1988-02-24 1988-02-24 文字行抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63041564A JPH01216493A (ja) 1988-02-24 1988-02-24 文字行抽出装置

Publications (1)

Publication Number Publication Date
JPH01216493A true JPH01216493A (ja) 1989-08-30

Family

ID=12611936

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63041564A Pending JPH01216493A (ja) 1988-02-24 1988-02-24 文字行抽出装置

Country Status (1)

Country Link
JP (1) JPH01216493A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05166000A (ja) * 1991-12-12 1993-07-02 Oki Electric Ind Co Ltd 文書画像の領域抽出方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05166000A (ja) * 1991-12-12 1993-07-02 Oki Electric Ind Co Ltd 文書画像の領域抽出方法

Similar Documents

Publication Publication Date Title
Shafait et al. Table detection in heterogeneous documents
US5325447A (en) Handwritten digit normalization method
CN1103087C (zh) 光学扫描表单识别及更正方法
US7106904B2 (en) Form identification method
JP4098845B2 (ja) テキストのバイナリー画像から抽出されたシンボルを比較する方法
JPS615386A (ja) パタ−ン認識装置
KR101235226B1 (ko) 화상 처리 장치, 화상 처리 방법 및 기록 매체
JP2006509271A (ja) 画像シグネチャによる郵便物の識別タグおよび関連するメール操作機
WO2004104922A2 (en) Image and part recognition technology
US7085432B2 (en) Edge detection using Hough transformation
CN109919146A (zh) 图片文字识别方法、装置及平台
CN119762438B (zh) 一种基于散热片图像识别的缺陷检测方法及系统
JPH0821057B2 (ja) 文書画像解析方式
JPH01216493A (ja) 文字行抽出装置
JP2623844B2 (ja) 文字行抽出装置
JPH0430070B2 (ja)
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JPH04502526A (ja) 像認識
JP5476884B2 (ja) 画像処理装置及び画像処理プログラム
US7058203B2 (en) Region of interest identification using region of adjacent pixels analysis
CN114495142B (zh) 文档段落位置提取装置
JP6310155B2 (ja) 文字認識装置、文字認識方法及び文字認識プログラム
JP2009223612A (ja) 画像認識装置及びプログラム
JP4242962B2 (ja) 文字切出装置
JP2570703B2 (ja) 文字読取装置