JPH022193B2 - - Google Patents

Info

Publication number
JPH022193B2
JPH022193B2 JP57225251A JP22525182A JPH022193B2 JP H022193 B2 JPH022193 B2 JP H022193B2 JP 57225251 A JP57225251 A JP 57225251A JP 22525182 A JP22525182 A JP 22525182A JP H022193 B2 JPH022193 B2 JP H022193B2
Authority
JP
Japan
Prior art keywords
character
label
window
area
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP57225251A
Other languages
English (en)
Other versions
JPS59114686A (ja
Inventor
Shigemi Osada
Junji Hatsuzaki
Akira Inoe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57225251A priority Critical patent/JPS59114686A/ja
Publication of JPS59114686A publication Critical patent/JPS59114686A/ja
Publication of JPH022193B2 publication Critical patent/JPH022193B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 (1) 発明の技術分野 本発明は複数の文字が近接して書かれた文字列
に対して個々の文字を分離抽出することができる
文字分離抽出方式に関するものである。
(2) 従来技術と問題点 従来の文字列の分離抽出方式としては、一定の
形状たとえば矩形のウインドウを文字列上に走査
させ、個々の文字を抽出する方式があるが、複数
の文字が互いに近接して書かれている文字列の場
合、これらの文字を正確に分離抽出することは不
可能であつた。これに対し、本出願人は特願昭57
―157237号「文字分離抽出方式」を提案した。こ
の方式は近接した文字の分離抽出でも非常に効果
があるが、最短径路を求める際の前処理としての
ラベル付与の処理速度に時間がかかることが問題
であつた。
(3) 発明の目的 本発明の目的は複数の文字が近接して書かれて
いる場合でも各文字を正確に分離することができ
るとともに、最短径路を求めるためのラベル付与
処理を高速化しうる文字分離抽出方式を提供する
ことである。
(4) 発明の構成 前記目的を達成するため、本発明の文字分離抽
出方式は単一または複数の文字から構成される文
字列をその外接矩形よりも各方向にそれぞれ1画
素分大きい矩形によつて切出された画像に対し、
文字列方向に垂直で長さが矩形幅に等しい1画素
幅のウインドウを矩形領域の一端より走査し、最
初に該ウインドウ内に黒画素が出現する位置を検
出してその位置での該ウインドウの両端に存在す
る画素間の最短径路の探索領域を該ウインドウ位
置から走査方向側に該探索領域の画素にラベルを
付与し該ラベルから限定して最短径路を見出し、
該ウインドウと前記最短径路によつて囲まれた領
域を1文字の存在する領域とみなし、その領域を
逐次分離抽出することにより、近接して書かれた
文字列から個々の文字の存在する領域を抽出する
文字分離抽出方式において、水平・垂直の一次元
走査で前記探索領域の画素にラベルを付与する手
段を具えたことを特徴とするものである。
(5) 発明の実施例 第1図〜第14図は本発明を具体例により説明
する手順説明図である。
ここでは文字列として第1図に示す「V2B」の
ようにそのままでは分離困難な場合の処理手順を
示す。
第1図は文字列111〜113をその外接矩形よ
りも各方向にそれぞれ1画素分大きい矩形枠12
により切出した画像を示す。この画像に対して同
図に示すウインドウ13、すなわち文字列方向に
垂直で長さが矩形枠12の縦幅に等しく、1画素
幅のウインドウを矩形枠内領域の1端より走査さ
せ、最初にウインドウ13内に黒画素14が出現
する位置を検出する。
第2図は第1図の文字列111〜113に対しウ
インドウ13により黒画素14を検出した位置を
示す。次に、この位置におけるウインドウ13の
両端位置“S”,“E”の白画素間の最短径路を見
出すのであるが、その探索領域をウインドウ13
の位置から文字列の走査方向に限定する。第2図
の“+”印で示す文字端位置15は探索領域の限
定を表わすラベルである。すなわち、“+”印の
右側の領域が探索領域である。最短径路の抽出ア
ルゴリズムとしては、従来各種のものが提案され
ているが、ここではリー(Lee)のアルゴリズム
を用いて説明する。
前述の処理によつて決定された2点“S”,
“E”のうち、まずどちらか一方、たとえば“S”
を出発点として選ぶ。最初に、第3図aに示すウ
インドウを水平方向に一次元的に走査させ、次の
論理条件によつて白画素の領域に“1”→“2”
→“3”→“1”→“2”→……のラベルを与え
る。
この場合のラベル付与の論理条件は次のとおり
である。
() A0が白画素でなければスキツプ(走査
を進める)する。
() A0が白画素で、かつ A1がラベル“1”,“2”,“3”のいずれ
かである時はA1のラベルの次のラベルをA0
に与える。たとえば、A1のラベルが“1”
ならばA0にラベル“2”を与える。A1のラ
ベル“3”ならばA0にラベル“1”を与え
る。
A1がラベル“1”,“2”,“3”以外の時
で、かつA2がラベル“1”,“2”,“3”の
いずれかである時はA2のラベルの次のラベ
ルをA0に与える。A2がラベル“1”,“2”,
“3”以外の時はスキツプ(走査を進める)
する。
なお、初期条件としてA1が出発点“S”の時、
A0にラベル“1”を与える。
第4図は第3図に示した論理条件を水平走査に
よるラベル付与に適用した途中結果を示したもの
であり、第5図に最終結果を示す。
すなわち、第4図に示すように、“S”から始
まり第1行目に対し“1”,“2”,“3”,…の順
にラベルを付してゆく。第2行目は“1”,“2”
で黒画素14にぶつかるからこれをスキツプし、
黒画素の終つたところで縦列の次のラベル“2”
を付し以下“3”,“1”,“2”…の順にラベルを
付す。以下同様に黒画素にぶつかつたらスキツプ
し縦列を見てラベルを付すことを繰返し第4図か
ら第5図を完了する。
次に第3図(b)に示すウインドウを垂直方向に一
次元的に走査させ、水平方向と同様の論理条件に
よつてラベル付与を実行する。この際、垂直方向
の走査の出発点は文字列の外接矩形12の1端で
探索領域の限定位置15と反対の側12′とする。
第6図は垂直走査によるラベル付与の途中結果
を、第7図は終点“E”まで到達した最終結果を
示す。
このようにして、水平方向、垂直方向の一次元
走査を各1回ずつ実行することによつて、必ずラ
ベル付与処理は完結するので、高速度の処理が実
現できる。
次に切出しの段階に入る。終点“E”から
“3”→“2”→“1”の順番に逆追跡し、始点
“S”に到達する径路を見出す。
この径路は最短径路であるが、必ずしも一意的
に定まることは限らない。ここでは第8図に示す
ように、逆追跡の方向に優先順位を設け、最短径
路を一意に定めている。
第9図に逆追跡によつて検出された最短径路を
示し、逆追跡の際に径路上の画素16にラベル
“+”を与えたものである。
以上の処理によつて、文字列中の1文字の存在
する領域が“+”で囲まれた領域として識別され
る。そこでこの領域内の黒画素を切出すことによ
つて、1文字の画像が分離抽出される。
第10図は1文字を分離抽出した後の矩形枠1
2の領域内の文字列112,113の画像を示す。
以上の処理を、1文字分離抽出する毎に白画素、
黒画素以外のラベルが付与された画素を白画素に
変換した後、矩形領域内の黒画素が検出されなく
なるまで繰返すことにより、文字列の個々の文字
が1文字ずつ分離抽出できる。
すなわち、次の文字112に対しウインドウを
設定し、次の文字の探索領域の限定を表わすラベ
ルを決定し、第4図〜第9図の手順を繰返す。
第11図は本発明の実施例の構成説明図であ
る。同図において、21は入力文字列画像の外接
矩形を検出する外接矩形検出回路、22は文字列
画像を格納しておく画像メモリ、23は分離され
た文字を切出す文字切出し回路、24は文字端位
置を検出するためのウインドウを走査するウイン
ドウ走査回路、25は文字端位置へのラベル付け
や最短径路探索のためのラベルを付与するラベリ
ング回路、26は付与されたラベルを基に逆追跡
を行なう逆追跡回路、27は分離抽出された文字
の消去及びラベルの消去を行なうクリア回路、2
8は文字列画像の外接矩形のアドレスやラベリン
グの始点、終点のアドレスを保持しておくアドレ
ステーブルである。
この構成において、第1図〜第10図の例を引
用して説明する。
まず、入力文字列画像111〜113を外接矩形
検出回路21を介して画像メモリ22に格納す
る。このとき外接矩形検出回路21によつて検出
された入力文字列111〜113の外接矩形より各
方向にそれぞれ1画素分大きい矩形枠12のアド
レスをアドレステーブル28に書込む。
ウインドウ走査回路24は、アドレステーブル
28に保持されている矩形アドレスを基に、矩形
領域の一端よりウインドウ13を走査し、文字端
位置15、すなわちウインドウ内に最初の黒画素
が現われる位置を検出する。そしてその位置15
でのウインドウ13の両端の一方を始点(S)、
他方を終点(E)としてそのアドレスをアドレス
テーブル28に書込む。
ラベリング回路25は始点アドレスを基に、ま
ず最短径路探索領域を限定するためのラベル、後
の処理では文字の切出しに利用されるラベルを、
文字端位置15に付与する。
これは第2図中に“+”印で示されるラベルで
あり、実際には他のラベルと区別される特別のコ
ードである。
その後、ラベリング回路25は始点(S)から
前述の第4図〜第7図に示す手順の如く、水平・
垂直の一次元走査を各一回実行し、終点(E)ま
でラベルを付与していく。
ラベル付けが終点(E)に達すると、逆追跡回
路26は終点(E)からラベル付けの逆の順番で
ラベルを逆追跡し、始点(S)に到達する径路1
6を見出す。これと同時に見出した径路16には
文字端位置15に付与したものと同じラベル
“+”を付与する。
文字切出し回路23は文字端位置15のラベル
“+”と、始点(S)、終点(E)間の最短径路1
6のラベル“+”で囲まれる領域内の黒画素14
を切出し、この画像111を出力に接続される文
字認識装置等に送出する。
クリア回路27は前記ラベル“+”で囲まれる
文字領域およびこの切出しのために用いた各ラベ
ルを消去し、第10図の次の文字列112,113
のみが得られ、次に形成する文字端位置で限定さ
れる領域につき前述の手順が再び繰返えされる。
(6) 発明の効果 以上説明したように、本発明によれば、文字列
の中から1文字毎の画像を分離抽出する際のラベ
ル付与の処理を水平、垂直の一次元走査を各1回
ずつ実行するのみで、非常に高速度の文字分離抽
出が実現できる。従つてフリーフオーマツトの手
書き文字でも個々の文字を確実にかつ高速度で分
離抽出することができるので、手書文字に対する
文字認識等に適用して大きな効果を発揮するもの
である。
【図面の簡単な説明】
第1図〜第10図は本発明の手順説明図、第1
1図は本発明の実施例の構成説明図であり、図中
111〜113は文字列、12,12′は矩形枠、
13はウインドウ、14は黒画素、15は文字端
位置、16は最短径路、21は外接矩形検出回
路、22は画像メモリ、23は文字切出し回路、
24はウインドウ走査回路、25はラベリング回
路、26は逆追跡回路、27はクリア回路、28
はアドレステーブルを示す。

Claims (1)

    【特許請求の範囲】
  1. 1 単一または複数の文字から構成される文字列
    をその外接矩形よりも各方向にそれぞれ1画素分
    大きい矩形によつて切出された画像に対し、文字
    列方向に垂直で長さが矩形幅に等しい1画素幅の
    ウインドウを矩形領域の一端より走査し、最初に
    該ウインドウ内に黒画素が出現する位置を検出し
    てその位置での該ウインドウの両端に存在する画
    素間の最短径路の探索領域を該ウインドウ位置か
    ら走査方向側に限定して該探索領域の画素にラベ
    ルを付与し該ラベルから最短径路を見出し、該ウ
    インドウと前記最短径路によつて囲まれた領域を
    1文字の存在する領域とみなし、その領域を逐次
    分離抽出することにより、近接して書かれた文字
    列から個々の文字の存在する領域を抽出する文字
    分離抽出方式において、水平・垂直の一次元走査
    で前記探索領域の画素にラベルを付与する手段を
    具えたことを特徴とする文字分離抽出方式。
JP57225251A 1982-12-22 1982-12-22 文字分離抽出方式 Granted JPS59114686A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57225251A JPS59114686A (ja) 1982-12-22 1982-12-22 文字分離抽出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57225251A JPS59114686A (ja) 1982-12-22 1982-12-22 文字分離抽出方式

Publications (2)

Publication Number Publication Date
JPS59114686A JPS59114686A (ja) 1984-07-02
JPH022193B2 true JPH022193B2 (ja) 1990-01-17

Family

ID=16826372

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57225251A Granted JPS59114686A (ja) 1982-12-22 1982-12-22 文字分離抽出方式

Country Status (1)

Country Link
JP (1) JPS59114686A (ja)

Also Published As

Publication number Publication date
JPS59114686A (ja) 1984-07-02

Similar Documents

Publication Publication Date Title
JP2005523530A (ja) 取り込み画像データから文字列を識別して抜出するシステムおよび方法
JPH05500875A (ja) 光学式文字認識のために英数字文字を細線化するための方法及び装置
JPH022193B2 (ja)
JPH022192B2 (ja)
JP2796561B2 (ja) 表形式文書認識方式
JP2846486B2 (ja) 画像入力装置
Chandran et al. Structure recognition and information extraction from tabular documents
JPS6254380A (ja) 文字認識装置
JPS615383A (ja) 文字パタ−ン分離装置
KR950001594B1 (ko) 이치화된 영상의 고속 영역 분할 추출방법
KR100315427B1 (ko) 다단계 지형학적 특징 및 점-선-면 확장법에 의한 자막영역 추출 장치 및 그 방법
JP3140079B2 (ja) 罫線認識方法及び表処理方法
JP3341097B2 (ja) 光学文字読取装置
JPH01137385A (ja) 文字認識装置
JPH0564396B2 (ja)
JP2506071B2 (ja) 輪郭追跡装置
JP2803735B2 (ja) 罫線を含んだ文字認識装置
JPH08171609A (ja) 文字列高速抽出装置
JPS61125687A (ja) パタ−ン抽出方式
JPH0377550B2 (ja)
JPH0728933A (ja) 文字認識装置
JPH0443312B2 (ja)
JPH05258105A (ja) 文字切り出し装置
JPH02139685A (ja) 図形要素分離装置
JPH04165870A (ja) 写真領域抽出装置