JPS5953983A - 文字の検出切出方法 - Google Patents
文字の検出切出方法Info
- Publication number
- JPS5953983A JPS5953983A JP57164262A JP16426282A JPS5953983A JP S5953983 A JPS5953983 A JP S5953983A JP 57164262 A JP57164262 A JP 57164262A JP 16426282 A JP16426282 A JP 16426282A JP S5953983 A JPS5953983 A JP S5953983A
- Authority
- JP
- Japan
- Prior art keywords
- character
- point
- projection
- area
- adjacent characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の技術分野〕
本発明は、光学的文字読取装僅におりる文字の検出切出
し方法、髄に隣り合う文字が伺ら力・の原因により接触
しているような場合に正しく切出しうる切出し方法に関
するものである。
し方法、髄に隣り合う文字が伺ら力・の原因により接触
しているような場合に正しく切出しうる切出し方法に関
するものである。
帳票上に記入される文字の中には印字ずれや文字記入枠
カーらはみ出して記入ジズまたことにより、隣り合う文
字同士で接触する場合がある 折角中した場合には正確
な文字認識を行うことができないつそこで、このような
場合に従来では次のような方法で対拠していた。
カーらはみ出して記入ジズまたことにより、隣り合う文
字同士で接触する場合がある 折角中した場合には正確
な文字認識を行うことができないつそこで、このような
場合に従来では次のような方法で対拠していた。
■ 隣接文字間の中心位置で強制的に切出す。
■ 接触した文字をリジェクトする。
■ 射影を求めた結果接触しているとしても、λ次元的
に定食して文字線の縁部を追跡し、切出可能か否かを確
認する。
に定食して文字線の縁部を追跡し、切出可能か否かを確
認する。
[有] 隣接文字間の間隙相当部分ある黒ピッ)hのピ
ストグラムを作り、蜂積値の小さな部分で切出す。
ストグラムを作り、蜂積値の小さな部分で切出す。
以上の方法の中でも■の方法が比較的粘度が良いとはい
うものの、接触の状態によっては切出し位置を駐り、誤
認識するおそれがあった。
うものの、接触の状態によっては切出し位置を駐り、誤
認識するおそれがあった。
そこで、本発明は隣り合う文字の#縁やね端が接触し、
A當の方法では切出しが困難な場合にも正確に切出しす
ることができる切出し方法を提供することを目的とする
。
A當の方法では切出しが困難な場合にも正確に切出しす
ることができる切出し方法を提供することを目的とする
。
上記目的を達成するために、本発明による文字の検出切
出し方法は、以下に示す処理を行う点に生1徴を有する
・ (aJ 光電変換により得られた文字画像)(ターン
の射影を求める。その射影から隣接する文字画像パター
ン間に接触があるかどうかを確認する。
出し方法は、以下に示す処理を行う点に生1徴を有する
・ (aJ 光電変換により得られた文字画像)(ターン
の射影を求める。その射影から隣接する文字画像パター
ン間に接触があるかどうかを確認する。
(1)) 8語の結果、接触がある場合には@接文牢
画像パターン相互間の開腔に相当する部分を覆う検査領
域を設定する。なお、接触がない場合には分離点をもっ
て切出し膚とすればよい1、(0) 設定さgた検査
飴域内に夕1から進入する文字組の数およびその進入位
置を検イj・領域の外周を声査して求める。通常、検氷
9域は方形状に設定する。
画像パターン相互間の開腔に相当する部分を覆う検査領
域を設定する。なお、接触がない場合には分離点をもっ
て切出し膚とすればよい1、(0) 設定さgた検査
飴域内に夕1から進入する文字組の数およびその進入位
置を検イj・領域の外周を声査して求める。通常、検氷
9域は方形状に設定する。
(d) 文字画像パターンの前払方向に存在する検査
領域の辺、すなわち文字の配列方向に直交する左右辺な
越を越えて進入する文字線を追跡して、娼該進入文字線
が前記左右の辺に亘ってイと断するか否かを求める。
領域の辺、すなわち文字の配列方向に直交する左右辺な
越を越えて進入する文字線を追跡して、娼該進入文字線
が前記左右の辺に亘ってイと断するか否かを求める。
+e) 横断する進入文字線に注目して、そのヌ字糾
中に存在する特異点を求める。求めたも異点なもって切
出し点とする。
中に存在する特異点を求める。求めたも異点なもって切
出し点とする。
以上の構成を有する本発明によJ■ば、隣り合う文字間
の間隙(あるいは文字記入枠間)とその周辺を覆って設
定官肚た検査仙域力・らWICり合う文字の接触点をさ
がし出し、檜断貌の特異点をもって切出点とするもので
あるため、特異方の特徴さ之−明確なものであれば確実
に切出しすることカーできるO 〔発明の実施例〕 以下、本発明を図示する実施例に基づいて詳述する。第
1図に本発明による文字の検出切出し方法が適用される
光学的文字読取装置(OCR)の要部を示す。
の間隙(あるいは文字記入枠間)とその周辺を覆って設
定官肚た検査仙域力・らWICり合う文字の接触点をさ
がし出し、檜断貌の特異点をもって切出点とするもので
あるため、特異方の特徴さ之−明確なものであれば確実
に切出しすることカーできるO 〔発明の実施例〕 以下、本発明を図示する実施例に基づいて詳述する。第
1図に本発明による文字の検出切出し方法が適用される
光学的文字読取装置(OCR)の要部を示す。
まず、第1図に示すような手書き文字の場合について鋭
、明する。第1図において、光電変換部(図示せず〕に
て読取られた文字画像パターンPは画像メモリ/に送ら
れ、一時的に格納される。画像メモリは原稿画像の1行
分寸たは1頁分の文字画像パターンを蓄積可能である。
、明する。第1図において、光電変換部(図示せず〕に
て読取られた文字画像パターンPは画像メモリ/に送ら
れ、一時的に格納される。画像メモリは原稿画像の1行
分寸たは1頁分の文字画像パターンを蓄積可能である。
一方1文字画像パターンPは射影部7にも送られ1文字
画像パターンPの射影が蓄積される。
画像パターンPの射影が蓄積される。
次に、制御部6は予め与えられた夕字位置情報と上記求
められた射影情報とを比較し、射影自体で切出しが可能
か否かを判断する。このとき、第1図に示すように、文
字枠10 、71間の領域/コに一方もしくは両方の文
字枠io 、 //から文字の一部が延在している場合
でも轟該伸域/、2内において射影に分離点がある場合
には原則としてその切れ目を切出し点とする。なお、領
域/、!内にノイスがあったシ、射影のブロック複数存
在するような場合の処理については、例えば、ノイズ部
分の面積な予め定めた基準の値と比較することにより判
断するなど、既知の方法で処理する。
められた射影情報とを比較し、射影自体で切出しが可能
か否かを判断する。このとき、第1図に示すように、文
字枠10 、71間の領域/コに一方もしくは両方の文
字枠io 、 //から文字の一部が延在している場合
でも轟該伸域/、2内において射影に分離点がある場合
には原則としてその切れ目を切出し点とする。なお、領
域/、!内にノイスがあったシ、射影のブロック複数存
在するような場合の処理については、例えば、ノイズ部
分の面積な予め定めた基準の値と比較することにより判
断するなど、既知の方法で処理する。
一方、第2図に示すように、文字枠io、i/間の領域
la内の射影に1つの分離点もない場合(すなわち、I
li!F接文字の細文字扶・角東しているような場合)
には、制御部tは検査領域13を設定する。この検査領
域/3は切出点の判断のための情報を得るためのもので
あり、切出しマーi//を[?すための1、のである。
la内の射影に1つの分離点もない場合(すなわち、I
li!F接文字の細文字扶・角東しているような場合)
には、制御部tは検査領域13を設定する。この検査領
域/3は切出点の判断のための情報を得るためのもので
あり、切出しマーi//を[?すための1、のである。
そして、そのiP Bは文字枠のヤイズ、記入者の菅込
み状態(めろいは、印字の場合は印字精度〕に応じて制
御部6がト定するものであり、−律に決定することはで
きない。しカーし、少tc くとも文字枠10 、 I
10対向辺/y、 、 t!;n6の距離、すなわち伊
域/、7のIP Aよりは太きい。
み状態(めろいは、印字の場合は印字精度〕に応じて制
御部6がト定するものであり、−律に決定することはで
きない。しカーし、少tc くとも文字枠10 、 I
10対向辺/y、 、 t!;n6の距離、すなわち伊
域/、7のIP Aよりは太きい。
このように検査領域/、?を設定すると、制往1部6は
検査領域/3の四辺を走査し、又文字枠io 、 ii
の対向する辺/’7 、 /!5を走査し、領域/、2
、 /3内への文字線の進入する位置とそのしを確認
する。この進入文字線とは、第2図の例では■、■、■
、■部分を才旨す。
検査領域/3の四辺を走査し、又文字枠io 、 ii
の対向する辺/’7 、 /!5を走査し、領域/、2
、 /3内への文字線の進入する位置とそのしを確認
する。この進入文字線とは、第2図の例では■、■、■
、■部分を才旨す。
進入文字線が特定されたら、その進入文字線を走査又は
追跡することにより、当該進入文字線中に存在する特異
点を求める。特異点とは、屈曲点、屈折点なとのことで
るる。第2図の例では■の点が特異点になる。特異点の
求め方としては、の 線熟を追跡しながら一定の微小距
離ごとに線Hの方向をg方向ベクトルの1つに割り当て
てその変化を記憶し、後にその記憶内容から雑音と区別
できる程度の変化があったか否かを判断して文字f、4
縁の船徴を求める一般的な方法、■ 領域/、2の全域
を走査し、その白黒レベルの変什点の移1j+距離を各
走摘紳ごとに徴発することにより求め、微分値(すなわ
ち、移動距離)がブラフあるいはマイナスに変化する点
をもって眉選府と判断する。その他、一般に知られた方
式を用いてもよい。
追跡することにより、当該進入文字線中に存在する特異
点を求める。特異点とは、屈曲点、屈折点なとのことで
るる。第2図の例では■の点が特異点になる。特異点の
求め方としては、の 線熟を追跡しながら一定の微小距
離ごとに線Hの方向をg方向ベクトルの1つに割り当て
てその変化を記憶し、後にその記憶内容から雑音と区別
できる程度の変化があったか否かを判断して文字f、4
縁の船徴を求める一般的な方法、■ 領域/、2の全域
を走査し、その白黒レベルの変什点の移1j+距離を各
走摘紳ごとに徴発することにより求め、微分値(すなわ
ち、移動距離)がブラフあるいはマイナスに変化する点
をもって眉選府と判断する。その他、一般に知られた方
式を用いてもよい。
特異点が求められたら、その特異点を切出し点として文
字パターンを切出すべくp隊メモリ/に制御信号を送る
。この制御信号にカーづき、第2図■の点で切出さrま
た/文字(例えは、錆、!図の「ホ」)は1文字分蓄歌
メモリ2に一計譬的に格納される。それ以後は周知の1
・法にて処理さ才しる。
字パターンを切出すべくp隊メモリ/に制御信号を送る
。この制御信号にカーづき、第2図■の点で切出さrま
た/文字(例えは、錆、!図の「ホ」)は1文字分蓄歌
メモリ2に一計譬的に格納される。それ以後は周知の1
・法にて処理さ才しる。
つまり、正規化回路3にてLE規化嘔盪、文字勤1識部
jにて認識される。jは辞昔パターンが格納で才(てい
るメモリである。
jにて認識される。jは辞昔パターンが格納で才(てい
るメモリである。
次に、帳票上の文字が活字等の印字文字である場合につ
いて述べる。第3図は又♀のセリフが接触している例を
示している。セリフとは、債に英夕゛牢等の上下の薪端
に杉向きに付りられブこ装す11゛部分のことを指す。
いて述べる。第3図は又♀のセリフが接触している例を
示している。セリフとは、債に英夕゛牢等の上下の薪端
に杉向きに付りられブこ装す11゛部分のことを指す。
このような場合、従来の■のヒストグラムを使う方式だ
と■、■、■のl(分のセリフの切れ目で腔って切り出
すあ・そ11が届い。そこで、本発明の場合は、■や@
なとの夕与樟−が直角に交差する点でセ゛出し、磨削と
して垂1oに−長い線や傾剰紹をyりけた場合(・工そ
11らの袋にその側方を文字線の一部と判断し、それを
ガ〕きた点で切出しをイrうものとする。しかし、第弘
図のように特異点の検出が困難な場合がある。そのよう
な場合は制御部乙に事前に与えらオ′シる情報に従って
リジェクトするか、仮想中心位置にて強制分離を行つこ
ととする。
と■、■、■のl(分のセリフの切れ目で腔って切り出
すあ・そ11が届い。そこで、本発明の場合は、■や@
なとの夕与樟−が直角に交差する点でセ゛出し、磨削と
して垂1oに−長い線や傾剰紹をyりけた場合(・工そ
11らの袋にその側方を文字線の一部と判断し、それを
ガ〕きた点で切出しをイrうものとする。しかし、第弘
図のように特異点の検出が困難な場合がある。そのよう
な場合は制御部乙に事前に与えらオ′シる情報に従って
リジェクトするか、仮想中心位置にて強制分離を行つこ
ととする。
第1[ン1(・工本発明による文字切出し方法が逆用さ
れるOO’Hの要部を示すブロック図、第、2図は対象
文字が手■きである場合の例を示す説明図、 第J Piは対象文字が印字でをッる鵠1合の例を示す
説明図1、 第を図は印字の場合で特異虞′検出が困難な例を示す説
明図である、。 P・・・文字画像パターン、l・・・圃像メ千り、コ・
・・1文字分蓄稍メモリ、3・・・正ガ1化回路、≠・
・・文字認識部、!・・・辞Wパターン、6・・・制御
部、7・・・射影V接部、10 、 //・・・文字枠
、/−!・・・9域、/、?・惺督域。
れるOO’Hの要部を示すブロック図、第、2図は対象
文字が手■きである場合の例を示す説明図、 第J Piは対象文字が印字でをッる鵠1合の例を示す
説明図1、 第を図は印字の場合で特異虞′検出が困難な例を示す説
明図である、。 P・・・文字画像パターン、l・・・圃像メ千り、コ・
・・1文字分蓄稍メモリ、3・・・正ガ1化回路、≠・
・・文字認識部、!・・・辞Wパターン、6・・・制御
部、7・・・射影V接部、10 、 //・・・文字枠
、/−!・・・9域、/、?・惺督域。
Claims (1)
- 【特許請求の範囲】 光電変換により得られた文字画像パターンのうち互に隣
接する文字画像パターン相互の境界を検出して各文字画
像を切出す方法において、前記文字画像パターンの射影
を求めて隣接文字面像パターン間の接触の有無を確認し
、接触がある場合に隣接文字画像パターン相互間の間隙
に相当する部分を覆う検ぞ領域を設定し、検査領域内に
外から進入する文字線の数およびその進入位置を検り領
域の外周を走査することにより求め、 前記検査領域内に進入する文字線を追跡して当該進入文
字線が前記検斉伸域を棉断するか百方を求め、 措置するW1合に焔該積断文字わ′かテ特異点を求め、
この4′¥Iノ点をもってMi出し点とすることを特徴
とする文字の検出切出方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57164262A JPS5953983A (ja) | 1982-09-21 | 1982-09-21 | 文字の検出切出方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57164262A JPS5953983A (ja) | 1982-09-21 | 1982-09-21 | 文字の検出切出方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS5953983A true JPS5953983A (ja) | 1984-03-28 |
Family
ID=15789742
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57164262A Pending JPS5953983A (ja) | 1982-09-21 | 1982-09-21 | 文字の検出切出方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5953983A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007058304A (ja) * | 2005-08-22 | 2007-03-08 | Toshiba Corp | 文字認識装置及び文字認識方法 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS522339A (en) * | 1975-06-24 | 1977-01-10 | Nec Corp | Unnecessary portion eliminating equipment in pattern identifying equip ment |
| JPS5561880A (en) * | 1978-10-31 | 1980-05-09 | Fujitsu Ltd | Character cut out system |
| JPS5617574A (en) * | 1979-07-23 | 1981-02-19 | Nec Corp | Noise picture eliminating device |
| JPS5668871A (en) * | 1979-11-09 | 1981-06-09 | Toshiba Corp | Character detecting and cutting-out device |
-
1982
- 1982-09-21 JP JP57164262A patent/JPS5953983A/ja active Pending
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS522339A (en) * | 1975-06-24 | 1977-01-10 | Nec Corp | Unnecessary portion eliminating equipment in pattern identifying equip ment |
| JPS5561880A (en) * | 1978-10-31 | 1980-05-09 | Fujitsu Ltd | Character cut out system |
| JPS5617574A (en) * | 1979-07-23 | 1981-02-19 | Nec Corp | Noise picture eliminating device |
| JPS5668871A (en) * | 1979-11-09 | 1981-06-09 | Toshiba Corp | Character detecting and cutting-out device |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007058304A (ja) * | 2005-08-22 | 2007-03-08 | Toshiba Corp | 文字認識装置及び文字認識方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2553608B2 (ja) | 光学文字読取装置 | |
| JPS6077279A (ja) | 文字イメ−ジ切出し方法 | |
| JPH02306386A (ja) | 文字認識装置 | |
| JPH0743755B2 (ja) | 文字認識装置 | |
| JPS5953983A (ja) | 文字の検出切出方法 | |
| JP2797848B2 (ja) | 光学式文字読取装置 | |
| JPH07230525A (ja) | 罫線認識方法及び表処理方法 | |
| JPH0548510B2 (ja) | ||
| JP3957471B2 (ja) | 分離文字列統合装置 | |
| JPH05189546A (ja) | 指紋特徴点の真偽判定装置 | |
| JP4242962B2 (ja) | 文字切出装置 | |
| JP3090036B2 (ja) | 枚数検出装置 | |
| JP2877380B2 (ja) | 光学的文字読取装置 | |
| JPH0467674B2 (ja) | ||
| JP2590099B2 (ja) | 文字読取方式 | |
| JP2925270B2 (ja) | 文字読取装置 | |
| JP2832035B2 (ja) | 文字認識装置 | |
| JP2963807B2 (ja) | 郵便番号枠検出装置 | |
| JP2659182B2 (ja) | 文字認識装置 | |
| JPH04205690A (ja) | 文字認識装置、および文字認識方法 | |
| JPS58165178A (ja) | 文字読取り装置 | |
| JP2683290B2 (ja) | 罫線判定方法および文字認識装置 | |
| JPS63136181A (ja) | 文字読取装置 | |
| JPH0235577A (ja) | 個人認証装置 | |
| JP2001038303A (ja) | 宛名読取装置 |