JPH022192B2 - - Google Patents

Info

Publication number
JPH022192B2
JPH022192B2 JP57157237A JP15723782A JPH022192B2 JP H022192 B2 JPH022192 B2 JP H022192B2 JP 57157237 A JP57157237 A JP 57157237A JP 15723782 A JP15723782 A JP 15723782A JP H022192 B2 JPH022192 B2 JP H022192B2
Authority
JP
Japan
Prior art keywords
character
window
area
pixel
shortest path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP57157237A
Other languages
English (en)
Other versions
JPS5945584A (ja
Inventor
Shigemi Osada
Junji Hatsuzaki
Akira Inoe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57157237A priority Critical patent/JPS5945584A/ja
Publication of JPS5945584A publication Critical patent/JPS5945584A/ja
Publication of JPH022192B2 publication Critical patent/JPH022192B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】 (1) 発明の技術分野 本発明は複数の文字が近接して書かれた文字列
に対して個々の文字を分離抽出することができる
文字分離抽出方式に関するものである。
(2) 従来技術と問題点 従来の文字列の分離抽出方式としては、一定の
形状たとえば矩形のウインドウを文字列上に走査
させ、個々の文字を抽出する方式があるが、複数
の文字が互いに近接して書かれている文字列の場
合、これらの文字を正確に分離抽出することは不
可能であつた。
(3) 発明の目的 本発明の目的は複数の文字が近接して書かれて
いる場合でも各文字を正確に分離することができ
る文字分離抽出方式を提供することである。
(4) 発明の構成 前記目的を達成するため、本発明の文字分離抽
出方式は単一または複数の文字から構成される文
字列をその外接矩形よりも各方向にそれぞれ1画
素分大きい矩形によつて切出された画像に対し、
文字列方向に垂直で長きが矩形幅に等しい1画素
幅のウインドウを矩形領域の一端より走査し、最
初に該ウインドウ内に黒画素が出現する位置を検
出してその位置での該ウインドウの両端に存在す
る画素間の最短径路の探索領域を該ウインドウ位
置から走査方向側に限定して最短径路を見出し、
該ウインドウと前記最短径路によつて囲まれた領
域を1文字の存在する領域とみなし、その領域を
逐次分離抽出することにより、近接して書かれた
文字列から個々の文字の存在する領域を抽出可能
としたことを特徴とするものである。
(5) 発明の実施例 第1図〜第14図は本発明を具体例により説明
する手順説明図である。
ここでは文字列として第1図に示す「V2B」の
ようにそのままでは分離困難な場合の処理手順を
示す。
第1図は文字列111〜113をその外接矩形よ
りも各方向にそれぞれ1画素分大きい矩形枠12
により切出した画像を示す。この画像に対して同
図に示すウインドウ13、すなわち文字列方向の
垂直で長さが矩形枠12の縦幅に等しく、1画素
幅のウインドウを矩形枠内領域の1端より走査さ
せ、最初にウインドウ13内に黒画素14が出現
する位置を検出する。
第2図は第1図の文字列111〜113に対しウ
インドウ13により黒画素14を検出した位置を
示す。次に、この位置におけるウインドウ13の
両端位置“S”,“E”の白画素間の最短径路を見
出すのであるが、その探索領域をウインドウ13
の位置から文字列の走査方向に限定する。第2図
の“+”印で示す文字端位置15は探索領域の限
定を表わすラベルである。すなわち、“+”印の
右側の領域が探索領域である。最短径路の抽出ア
ルゴリズムとしては、従来各種のものが提案され
ているが、ここではリー(Lee)のアルゴリズム
を用いて説明する。
前述の処理によつて決定された2点“S”,
“E”のうち、まずどちらか一方、たとえば“S”
を出発点として選ぶ。最初に、“S”に直接隣接
する(4方向連結)白画素にラベル“1”を与え
る。次にラベル“1”の与えられた画素に隣接す
る白画素にラベル“2”を与える。ラベル“2”
に隣接する白画素にラベル“3”を与える。さら
にラベル“3”に隣接する白画素にラベル“1”
を与える。以下、これを繰返えす。この処理は終
点“E”に到達するまでこの手順で続けられる。
第3図はこのラベル付与の手順の結果を示す。
次にこのラベルを終点“E”からラベル付与と
逆の手順で“3”→“2”→“1”→“3”と巡
回するラベルの順番に逆追跡し、始点“S”に到
達する径路を見出す。この径路が最短径路である
が、必ずしも一意的に定まることは限らない。こ
れを一意に定めるため、第4図に示すように、逆
追跡の方向に優先順位を設け、これに従つて追跡
を行なう。第5図に逆追跡によつて検出された最
短径路を示し、逆追跡の際に径路上の画素16に
ラベル“+”を与えたものである。
以上の処理によつて、文字列中の1文字の存在
する領域が“+”で囲まれた領域として識別され
る。そこでこの領域内の黒画像を切出すことによ
つて、1文字の画像が分離抽出される。
第6図は1文字を分離抽出した後の矩形枠12
の領域内の文字列112,113の画像である。
以上の処理を、1文字分離抽出する毎に白画
素、黒画素以外のラベルが付与された画素を白画
素に変換した後、矩形領域内の黒画素が検出され
なくなるまで繰返すことにより、文字列の個々の
文字が1文字ずつ分離抽出できる。
すなわち、第7図に示すように、次の文字11
に対しウインドウを設定し、次の文字の探索領
域の限定を表わすラベル17を決定し、第2図〜
第6図の手順を繰返す。
第8図は本発明の実施例の構成説明図である。
同図において、21は入力文字列画像の外接矩形
を検出する外接矩形検出回路、22は文字列画像
を格納しておく画像メモリ、23は分離された文
字を切出す文字切出し回路、24は文字端位置を
検出するためのウインドウを走査するウインドウ
走査回路、25は文字端位置へのラベル付けや最
短径路探索のためのラベルを付与するラベリング
回路、26は付与されたラベルを基に逆追跡を行
なう逆追跡回路、27は分離抽出された文字の消
去及びラベルの消去を行なうクリア回路、28は
文字列画像の外接矩形のアドレスやラベリングの
始点、終点のアドレスを保持しておくアドレステ
ーブルである。
この構成において、第1図〜第7図の例を引用
して説明する。
まず、入力文字列画像111〜113を外接矩形
検出回路21を介して画像メモリ22に格納す
る。このとき外接矩形検出回路21によつて検出
された入力文字列111〜113の外接矩形より各
方向にそれぞれ1画素分大きい矩形枠12のアド
レスをアドレステーブル28に書込む。
ウインドウ走査回路24は、アドレステーブル
28に保持されている矩形アドレスを基に、矩形
領域の一端よりウインドウ13を走査し、文字端
位置15、すなわちウインドウ内に最初に黒画素
が現われる位置を検出する。そしてその位置15
でのウインドウ13の両端の一方を始点(S)、
他方を終点(E)としてそのアドレスをアドレス
テーブル28に書込む。
ラベリング回路25は始点アドレスを基に、ま
ず最短径路探索領域を限定するためのラベル、後
の処理では文字の切出しに利用されるラベルを、
文字端位置15に付与する。
これは第2図中に“+”印で示されるラベルで
あり、実際には他のラベルと区別される特別のコ
ードである。
その後、ラベリング回路25は始点(S)から
隣接する4方向連結画素に“1”→“2”→
“3”→“1”と巡回するラベルを終点に達する
まで付与していく。
ラベル付けが終点に達すると、逆追跡回路26
は終点(E)からラベル付けの逆の順番でラベルを逆
追跡し、始点(S)に到達する径路16を見出
す。これと同時に見出した径路16には文字端位
置15に付与したものと同じラベル“+”を付与
する。
文字切出し回路23は文字端位置15のラベル
“+”と、始点(S)、終点(E)の最短径路16のラ
ベル“+”で囲まれる領域内の黒画素14を切出
し、この画像111を出力に接続される文字認識
装置等に送出する。
クリア回路27は前記ラベル“+”で囲まれる
文字領域およびこの切出しのために用いた各ラベ
ルを消去し、第6図の次の文字列112,113
みが得られ、第7図の文字端位置17で限定され
る領域につき前述の手順が再び繰返えされる。
(6) 発明の効果 以上説明したように、本発明によれば、複数の
文字が近接して書かれている場合でも、これを単
独に分離抽出することが可能となる。従つて、フ
リーフオーマツトの手書き文字でも単独に分離抽
出することができるので、手書き文字に対する文
字認識等を行なう場合に大きな効果が発揮され
る。
【図面の簡単な説明】
第1図〜第7図は本発明の手順説明図、第8図
は本発明の実施例の構成説明図であり、図中11
〜113は文字列、12は矩形枠、13はウイン
ドウ、14は黒画素、15,17は文字端位置、
16は最短径路、21は外接矩形検出回路、22
は画像メモリ、23は文字切出し回路、24はウ
インドウ走査回路、25はラベリング回路、26
は逆追跡回路、27はクリア回路、28はアドレ
ステーブルを示す。

Claims (1)

    【特許請求の範囲】
  1. 1 単一または複数の文字から構成される文字列
    をその外接矩形よりも各方向にそれぞれ1画素分
    大きい矩租形によつて切出された画像に対し、文
    字列方向に垂直で長さが矩形幅に等しい1画素幅
    のウインドウを矩形領域の一端より走査し、最初
    に該ウインドウ内に黒画素が出現する位置を検出
    してその位置での該ウインドウの両端に存在する
    画素間の最短径路の探索領域を該ウインドウ位置
    から走査方向側に限定して最短径路を見出し、該
    ウインドウと前記最短径路によつて囲まれた領域
    を1文字の存在する領域とみなし、その領域を逐
    次分離抽出することにより、近接して書かれた文
    字列から個々の文字の存在する領域を抽出可能と
    したことを特徴とする文字分離抽出方式。
JP57157237A 1982-09-09 1982-09-09 文字分離抽出方式 Granted JPS5945584A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57157237A JPS5945584A (ja) 1982-09-09 1982-09-09 文字分離抽出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57157237A JPS5945584A (ja) 1982-09-09 1982-09-09 文字分離抽出方式

Publications (2)

Publication Number Publication Date
JPS5945584A JPS5945584A (ja) 1984-03-14
JPH022192B2 true JPH022192B2 (ja) 1990-01-17

Family

ID=15645240

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57157237A Granted JPS5945584A (ja) 1982-09-09 1982-09-09 文字分離抽出方式

Country Status (1)

Country Link
JP (1) JPS5945584A (ja)

Also Published As

Publication number Publication date
JPS5945584A (ja) 1984-03-14

Similar Documents

Publication Publication Date Title
WO2019085971A1 (zh) 图像中定位文本的方法、装置、电子设备和存储介质
KR950004054A (ko) 화상추출장치
CN111414908B (zh) 一种视频中字幕字符的识别方法及装置
IL98293A (en) A method for distinguishing between text and graphics
JPH022192B2 (ja)
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JPH022193B2 (ja)
KR0186172B1 (ko) 문자 인식장치의 접촉문자 분리 및 특징 추출방법
JPH03142691A (ja) 表形式文書認識方式
Chandran et al. Structure recognition and information extraction from tabular documents
JPS6254380A (ja) 文字認識装置
JPS615383A (ja) 文字パタ−ン分離装置
JPH0377550B2 (ja)
JP2590099B2 (ja) 文字読取方式
JPS61125687A (ja) パタ−ン抽出方式
JP2506071B2 (ja) 輪郭追跡装置
JPH01137385A (ja) 文字認識装置
JPH02139685A (ja) 図形要素分離装置
JPS60238986A (ja) 文字認識装置のパタ−ンマツチング方式
JPS62190576A (ja) 線分離装置
JPH03182985A (ja) 文字読取装置
JPH04260980A (ja) 図形認識装置
JPS6410872B2 (ja)
JPS61206088A (ja) 文字読取装置
JPH05225385A (ja) 文字切り出し装置