JPS5953983A - 文字の検出切出方法 - Google Patents

文字の検出切出方法

Info

Publication number
JPS5953983A
JPS5953983A JP57164262A JP16426282A JPS5953983A JP S5953983 A JPS5953983 A JP S5953983A JP 57164262 A JP57164262 A JP 57164262A JP 16426282 A JP16426282 A JP 16426282A JP S5953983 A JPS5953983 A JP S5953983A
Authority
JP
Japan
Prior art keywords
character
point
projection
area
adjacent characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57164262A
Other languages
English (en)
Inventor
Masaki Komiya
小宮 雅紀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Tokyo Shibaura Electric Co Ltd filed Critical Toshiba Corp
Priority to JP57164262A priority Critical patent/JPS5953983A/ja
Publication of JPS5953983A publication Critical patent/JPS5953983A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、光学的文字読取装僅におりる文字の検出切出
し方法、髄に隣り合う文字が伺ら力・の原因により接触
しているような場合に正しく切出しうる切出し方法に関
するものである。
〔発明の技術的背景とその間断点〕
帳票上に記入される文字の中には印字ずれや文字記入枠
カーらはみ出して記入ジズまたことにより、隣り合う文
字同士で接触する場合がある 折角中した場合には正確
な文字認識を行うことができないつそこで、このような
場合に従来では次のような方法で対拠していた。
■ 隣接文字間の中心位置で強制的に切出す。
■ 接触した文字をリジェクトする。
■ 射影を求めた結果接触しているとしても、λ次元的
に定食して文字線の縁部を追跡し、切出可能か否かを確
認する。
[有] 隣接文字間の間隙相当部分ある黒ピッ)hのピ
ストグラムを作り、蜂積値の小さな部分で切出す。
以上の方法の中でも■の方法が比較的粘度が良いとはい
うものの、接触の状態によっては切出し位置を駐り、誤
認識するおそれがあった。
〔発明の目的〕
そこで、本発明は隣り合う文字の#縁やね端が接触し、
A當の方法では切出しが困難な場合にも正確に切出しす
ることができる切出し方法を提供することを目的とする
〔発明の構成〕
上記目的を達成するために、本発明による文字の検出切
出し方法は、以下に示す処理を行う点に生1徴を有する
・ (aJ  光電変換により得られた文字画像)(ターン
の射影を求める。その射影から隣接する文字画像パター
ン間に接触があるかどうかを確認する。
(1))  8語の結果、接触がある場合には@接文牢
画像パターン相互間の開腔に相当する部分を覆う検査領
域を設定する。なお、接触がない場合には分離点をもっ
て切出し膚とすればよい1、(0)  設定さgた検査
飴域内に夕1から進入する文字組の数およびその進入位
置を検イj・領域の外周を声査して求める。通常、検氷
9域は方形状に設定する。
(d)  文字画像パターンの前払方向に存在する検査
領域の辺、すなわち文字の配列方向に直交する左右辺な
越を越えて進入する文字線を追跡して、娼該進入文字線
が前記左右の辺に亘ってイと断するか否かを求める。
+e)  横断する進入文字線に注目して、そのヌ字糾
中に存在する特異点を求める。求めたも異点なもって切
出し点とする。
〔発明の効果〕
以上の構成を有する本発明によJ■ば、隣り合う文字間
の間隙(あるいは文字記入枠間)とその周辺を覆って設
定官肚た検査仙域力・らWICり合う文字の接触点をさ
がし出し、檜断貌の特異点をもって切出点とするもので
あるため、特異方の特徴さ之−明確なものであれば確実
に切出しすることカーできるO 〔発明の実施例〕 以下、本発明を図示する実施例に基づいて詳述する。第
1図に本発明による文字の検出切出し方法が適用される
光学的文字読取装置(OCR)の要部を示す。
まず、第1図に示すような手書き文字の場合について鋭
、明する。第1図において、光電変換部(図示せず〕に
て読取られた文字画像パターンPは画像メモリ/に送ら
れ、一時的に格納される。画像メモリは原稿画像の1行
分寸たは1頁分の文字画像パターンを蓄積可能である。
一方1文字画像パターンPは射影部7にも送られ1文字
画像パターンPの射影が蓄積される。
次に、制御部6は予め与えられた夕字位置情報と上記求
められた射影情報とを比較し、射影自体で切出しが可能
か否かを判断する。このとき、第1図に示すように、文
字枠10 、71間の領域/コに一方もしくは両方の文
字枠io 、 //から文字の一部が延在している場合
でも轟該伸域/、2内において射影に分離点がある場合
には原則としてその切れ目を切出し点とする。なお、領
域/、!内にノイスがあったシ、射影のブロック複数存
在するような場合の処理については、例えば、ノイズ部
分の面積な予め定めた基準の値と比較することにより判
断するなど、既知の方法で処理する。
一方、第2図に示すように、文字枠io、i/間の領域
la内の射影に1つの分離点もない場合(すなわち、I
li!F接文字の細文字扶・角東しているような場合)
には、制御部tは検査領域13を設定する。この検査領
域/3は切出点の判断のための情報を得るためのもので
あり、切出しマーi//を[?すための1、のである。
そして、そのiP Bは文字枠のヤイズ、記入者の菅込
み状態(めろいは、印字の場合は印字精度〕に応じて制
御部6がト定するものであり、−律に決定することはで
きない。しカーし、少tc くとも文字枠10 、 I
10対向辺/y、 、 t!;n6の距離、すなわち伊
域/、7のIP Aよりは太きい。
このように検査領域/、?を設定すると、制往1部6は
検査領域/3の四辺を走査し、又文字枠io 、 ii
の対向する辺/’7 、 /!5を走査し、領域/、2
 、 /3内への文字線の進入する位置とそのしを確認
する。この進入文字線とは、第2図の例では■、■、■
、■部分を才旨す。
進入文字線が特定されたら、その進入文字線を走査又は
追跡することにより、当該進入文字線中に存在する特異
点を求める。特異点とは、屈曲点、屈折点なとのことで
るる。第2図の例では■の点が特異点になる。特異点の
求め方としては、の 線熟を追跡しながら一定の微小距
離ごとに線Hの方向をg方向ベクトルの1つに割り当て
てその変化を記憶し、後にその記憶内容から雑音と区別
できる程度の変化があったか否かを判断して文字f、4
縁の船徴を求める一般的な方法、■ 領域/、2の全域
を走査し、その白黒レベルの変什点の移1j+距離を各
走摘紳ごとに徴発することにより求め、微分値(すなわ
ち、移動距離)がブラフあるいはマイナスに変化する点
をもって眉選府と判断する。その他、一般に知られた方
式を用いてもよい。
特異点が求められたら、その特異点を切出し点として文
字パターンを切出すべくp隊メモリ/に制御信号を送る
。この制御信号にカーづき、第2図■の点で切出さrま
た/文字(例えは、錆、!図の「ホ」)は1文字分蓄歌
メモリ2に一計譬的に格納される。それ以後は周知の1
・法にて処理さ才しる。
つまり、正規化回路3にてLE規化嘔盪、文字勤1識部
jにて認識される。jは辞昔パターンが格納で才(てい
るメモリである。
次に、帳票上の文字が活字等の印字文字である場合につ
いて述べる。第3図は又♀のセリフが接触している例を
示している。セリフとは、債に英夕゛牢等の上下の薪端
に杉向きに付りられブこ装す11゛部分のことを指す。
このような場合、従来の■のヒストグラムを使う方式だ
と■、■、■のl(分のセリフの切れ目で腔って切り出
すあ・そ11が届い。そこで、本発明の場合は、■や@
なとの夕与樟−が直角に交差する点でセ゛出し、磨削と
して垂1oに−長い線や傾剰紹をyりけた場合(・工そ
11らの袋にその側方を文字線の一部と判断し、それを
ガ〕きた点で切出しをイrうものとする。しかし、第弘
図のように特異点の検出が困難な場合がある。そのよう
な場合は制御部乙に事前に与えらオ′シる情報に従って
リジェクトするか、仮想中心位置にて強制分離を行つこ
ととする。
【図面の簡単な説明】
第1[ン1(・工本発明による文字切出し方法が逆用さ
れるOO’Hの要部を示すブロック図、第、2図は対象
文字が手■きである場合の例を示す説明図、 第J Piは対象文字が印字でをッる鵠1合の例を示す
説明図1、 第を図は印字の場合で特異虞′検出が困難な例を示す説
明図である、。 P・・・文字画像パターン、l・・・圃像メ千り、コ・
・・1文字分蓄稍メモリ、3・・・正ガ1化回路、≠・
・・文字認識部、!・・・辞Wパターン、6・・・制御
部、7・・・射影V接部、10 、 //・・・文字枠
、/−!・・・9域、/、?・惺督域。

Claims (1)

  1. 【特許請求の範囲】 光電変換により得られた文字画像パターンのうち互に隣
    接する文字画像パターン相互の境界を検出して各文字画
    像を切出す方法において、前記文字画像パターンの射影
    を求めて隣接文字面像パターン間の接触の有無を確認し
    、接触がある場合に隣接文字画像パターン相互間の間隙
    に相当する部分を覆う検ぞ領域を設定し、検査領域内に
    外から進入する文字線の数およびその進入位置を検り領
    域の外周を走査することにより求め、 前記検査領域内に進入する文字線を追跡して当該進入文
    字線が前記検斉伸域を棉断するか百方を求め、 措置するW1合に焔該積断文字わ′かテ特異点を求め、
    この4′¥Iノ点をもってMi出し点とすることを特徴
    とする文字の検出切出方法。
JP57164262A 1982-09-21 1982-09-21 文字の検出切出方法 Pending JPS5953983A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57164262A JPS5953983A (ja) 1982-09-21 1982-09-21 文字の検出切出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57164262A JPS5953983A (ja) 1982-09-21 1982-09-21 文字の検出切出方法

Publications (1)

Publication Number Publication Date
JPS5953983A true JPS5953983A (ja) 1984-03-28

Family

ID=15789742

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57164262A Pending JPS5953983A (ja) 1982-09-21 1982-09-21 文字の検出切出方法

Country Status (1)

Country Link
JP (1) JPS5953983A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007058304A (ja) * 2005-08-22 2007-03-08 Toshiba Corp 文字認識装置及び文字認識方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS522339A (en) * 1975-06-24 1977-01-10 Nec Corp Unnecessary portion eliminating equipment in pattern identifying equip ment
JPS5561880A (en) * 1978-10-31 1980-05-09 Fujitsu Ltd Character cut out system
JPS5617574A (en) * 1979-07-23 1981-02-19 Nec Corp Noise picture eliminating device
JPS5668871A (en) * 1979-11-09 1981-06-09 Toshiba Corp Character detecting and cutting-out device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS522339A (en) * 1975-06-24 1977-01-10 Nec Corp Unnecessary portion eliminating equipment in pattern identifying equip ment
JPS5561880A (en) * 1978-10-31 1980-05-09 Fujitsu Ltd Character cut out system
JPS5617574A (en) * 1979-07-23 1981-02-19 Nec Corp Noise picture eliminating device
JPS5668871A (en) * 1979-11-09 1981-06-09 Toshiba Corp Character detecting and cutting-out device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007058304A (ja) * 2005-08-22 2007-03-08 Toshiba Corp 文字認識装置及び文字認識方法

Similar Documents

Publication Publication Date Title
JP2553608B2 (ja) 光学文字読取装置
JPS6077279A (ja) 文字イメ−ジ切出し方法
JPH02306386A (ja) 文字認識装置
JPH0743755B2 (ja) 文字認識装置
JPS5953983A (ja) 文字の検出切出方法
JP2797848B2 (ja) 光学式文字読取装置
JPH07230525A (ja) 罫線認識方法及び表処理方法
JPH0548510B2 (ja)
JP3957471B2 (ja) 分離文字列統合装置
JPH05189546A (ja) 指紋特徴点の真偽判定装置
JP4242962B2 (ja) 文字切出装置
JP3090036B2 (ja) 枚数検出装置
JP2877380B2 (ja) 光学的文字読取装置
JPH0467674B2 (ja)
JP2590099B2 (ja) 文字読取方式
JP2925270B2 (ja) 文字読取装置
JP2832035B2 (ja) 文字認識装置
JP2963807B2 (ja) 郵便番号枠検出装置
JP2659182B2 (ja) 文字認識装置
JPH04205690A (ja) 文字認識装置、および文字認識方法
JPS58165178A (ja) 文字読取り装置
JP2683290B2 (ja) 罫線判定方法および文字認識装置
JPS63136181A (ja) 文字読取装置
JPH0235577A (ja) 個人認証装置
JP2001038303A (ja) 宛名読取装置