JPS59178585A - 文字領域抽出方式 - Google Patents
文字領域抽出方式Info
- Publication number
- JPS59178585A JPS59178585A JP58052534A JP5253483A JPS59178585A JP S59178585 A JPS59178585 A JP S59178585A JP 58052534 A JP58052534 A JP 58052534A JP 5253483 A JP5253483 A JP 5253483A JP S59178585 A JPS59178585 A JP S59178585A
- Authority
- JP
- Japan
- Prior art keywords
- area
- character
- areas
- characters
- divided
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(1)発明の技術分野
本発明は、文字と図形が混在する図面領域から文字領域
のみを抽出する文字領域抽出方式に関する。
のみを抽出する文字領域抽出方式に関する。
(2)技術の背景
一般に、文字に用いる認識処理方式と図形に用いる認識
処理方式とは異なるだめ、文字と図形が混在する図面に
おいては認識処理が困難である。
処理方式とは異なるだめ、文字と図形が混在する図面に
おいては認識処理が困難である。
従ってこのような文字と図形が混在する図形の認識処理
の前提として、最初に文字と図形を分離する必要がある
。
の前提として、最初に文字と図形を分離する必要がある
。
(3)従来技術と問題点
従来、文字と図形を分離する方式としては文字と図形の
全体を構成する輪郭を追跡して行って文字を抽出する方
式がある。しかしこの方式は追跡を基本としているので
孤立した文字のみ抽出されるに過ぎず、かつランダムア
クセスを必要とするので低速であるという間!+:jM
点があった。
全体を構成する輪郭を追跡して行って文字を抽出する方
式がある。しかしこの方式は追跡を基本としているので
孤立した文字のみ抽出されるに過ぎず、かつランダムア
クセスを必要とするので低速であるという間!+:jM
点があった。
また、従来の他の方式としては、−次元走査により黒白
の変化点を検出することによシ文字を抽出する方式があ
るが、この方式は一次元走査を基本とするため文字が横
書き又は縦■きに統一されていなければ分離できないと
いう問題点があった。
の変化点を検出することによシ文字を抽出する方式があ
るが、この方式は一次元走査を基本とするため文字が横
書き又は縦■きに統一されていなければ分離できないと
いう問題点があった。
(4)発明の目的
本発明の目的は、アダマール変換を階層的に用いて文字
が存在すると予想される領域を順次せばめること釦よシ
、文字がどの方向に病かれていても高速かつ正確に文字
領域を抽出することにある。
が存在すると予想される領域を順次せばめること釦よシ
、文字がどの方向に病かれていても高速かつ正確に文字
領域を抽出することにある。
(5)発明の構成
本発明によれば、文字と図形が混在する入力画像の領域
から文字領域のみを抽出する文字領域抽出方式において
、 上記入力画f惚領域を分割して各分割子1′(域ごとに
アゲマール変換を行い、高周波成分が多い領域を文字が
含まれている可能性がある領域と判断し高周波り部分が
少ない領域を文字が含ま)1.ている可能性が々い領域
と判断し 分割領域の一辺長が基準値以下に々るまで上
記動作11返して文字領域と非文字領域を分離して文字
領域のみを抽出するようにしたことk %徴とする文字
領域抽出方式が提供される。
から文字領域のみを抽出する文字領域抽出方式において
、 上記入力画f惚領域を分割して各分割子1′(域ごとに
アゲマール変換を行い、高周波成分が多い領域を文字が
含まれている可能性がある領域と判断し高周波り部分が
少ない領域を文字が含ま)1.ている可能性が々い領域
と判断し 分割領域の一辺長が基準値以下に々るまで上
記動作11返して文字領域と非文字領域を分離して文字
領域のみを抽出するようにしたことk %徴とする文字
領域抽出方式が提供される。
(6)発明の実施例
以下、本発明を実施例によシ?/15・[・]図面を参
照して説明する。
照して説明する。
第1図は本発明に係る文字領域抽出方式の処理工程図で
ある。本発明方式は図示する通り5tep1.2及び3
の3段階に分かれている。
ある。本発明方式は図示する通り5tep1.2及び3
の3段階に分かれている。
■ 5tep 1
先ず入力画1段を、第2図に示すように領域Iをn分割
、例えは16分9fすし、アゲマール変換を行って高周
波領域に形成された文字らしき部分に論理フィルタをか
けてその部分を抽出する。尚、第2図において、実線で
四重れた領域は分割領域を破線は画像に描かれた図形を
、それぞれ示しでいる。
、例えは16分9fすし、アゲマール変換を行って高周
波領域に形成された文字らしき部分に論理フィルタをか
けてその部分を抽出する。尚、第2図において、実線で
四重れた領域は分割領域を破線は画像に描かれた図形を
、それぞれ示しでいる。
ここに−アダマール変換とは、 i’8’4’に211
酊【F1像に対する周波数特性の抽出に使用′ざ:11
.るものであり、第3図にアダマール変換の基本マトリ
ックス(8X8)を示す。例えば、第3図において、一
点鎖線で示すaの部分は最も変化が少々く低Rd波成分
を多く含むが、bの部分は最も変化が激しく高周波成分
を多く含む。従って、アダマール変換によれ(・x高周
波成分が多く倉む領域は漢字、英字など文字を含む可能
性がある領域であり、高周波成分が少ない領域は文字を
含む可nに性がない領域であることが判断される。かか
るアダマー・l・布!91(を順次対象領域を分割して
適用して行けば、最後には文字と図形が混在する図面か
ら文字領域だけを抽出できる。
酊【F1像に対する周波数特性の抽出に使用′ざ:11
.るものであり、第3図にアダマール変換の基本マトリ
ックス(8X8)を示す。例えば、第3図において、一
点鎖線で示すaの部分は最も変化が少々く低Rd波成分
を多く含むが、bの部分は最も変化が激しく高周波成分
を多く含む。従って、アダマール変換によれ(・x高周
波成分が多く倉む領域は漢字、英字など文字を含む可能
性がある領域であり、高周波成分が少ない領域は文字を
含む可nに性がない領域であることが判断される。かか
るアダマー・l・布!91(を順次対象領域を分割して
適用して行けば、最後には文字と図形が混在する図面か
ら文字領域だけを抽出できる。
上述したように、この5tep、tにおいては入力画像
を16分割してそのうち1つの領域■でアダ1一層変換
を行う。
を16分割してそのうち1つの領域■でアダ1一層変換
を行う。
■ 5tep 2
次に、5tep1においてアダマール変換を行った結果
、高周波成分を多く含む領域がいくつか検出される。そ
のうち、例えば領域IIIが高周波領域であれば、この
■は文字を含む可能性がある領域とみなしく第1図のY
ES ) 、領域■を更に4つに分割しアダマール変換
を行う。5teplと同様に論理フィルタを通して高周
波成分を多く含む領域、例えば斜線を施した領域■が抽
出される。また、この段階で高周波成分が少々いならば
文字の可能性なしとして処理は終了する(NO)。
、高周波成分を多く含む領域がいくつか検出される。そ
のうち、例えば領域IIIが高周波領域であれば、この
■は文字を含む可能性がある領域とみなしく第1図のY
ES ) 、領域■を更に4つに分割しアダマール変換
を行う。5teplと同様に論理フィルタを通して高周
波成分を多く含む領域、例えば斜線を施した領域■が抽
出される。また、この段階で高周波成分が少々いならば
文字の可能性なしとして処理は終了する(NO)。
(’J) 5tep 3
この領域■の大きさ即ち一辺の長さを基準値mと比較し
m以下であれば処理を終了し、mより大であh7は高周
波領域が少ないときも処理を終了する。mより犬で高周
波領域を多く含む+11域であれば(ygs)再びこの
領域■を4分割すべ(5tep2に戻る。上記のような
5tep 1 、2及び3の各行程は、第4図の回路に
従って実施さ凡る。即ち、画像入力装置からそのメモリ
に入力された画像を領域分割回路11アダマ一ル変換回
路を介して第1図の5tep 1の段階が実行される。
m以下であれば処理を終了し、mより大であh7は高周
波領域が少ないときも処理を終了する。mより犬で高周
波領域を多く含む+11域であれば(ygs)再びこの
領域■を4分割すべ(5tep2に戻る。上記のような
5tep 1 、2及び3の各行程は、第4図の回路に
従って実施さ凡る。即ち、画像入力装置からそのメモリ
に入力された画像を領域分割回路11アダマ一ル変換回
路を介して第1図の5tep 1の段階が実行される。
次に判定回路、領域分割回路■アダマール変換回路によ
り5tep2が、更に判定回路により5tep 3がそ
れぞれ実行され、この5tep 1から3才での実行に
嶺たり画像メモリ回路1.Jlのアドレスはアドレス制
御部により制御される。
り5tep2が、更に判定回路により5tep 3がそ
れぞれ実行され、この5tep 1から3才での実行に
嶺たり画像メモリ回路1.Jlのアドレスはアドレス制
御部により制御される。
(7)発明の効果
上記の通り、本発明によil−はアダマール変換を利用
して入力画像を順次分割して高周波成分が多い領域を文
字を含む領域と予想して抽出するので、文牢列にかかわ
らず高速かつ正確に図面から文字領域のみを抽出するこ
とができる。
して入力画像を順次分割して高周波成分が多い領域を文
字を含む領域と予想して抽出するので、文牢列にかかわ
らず高速かつ正確に図面から文字領域のみを抽出するこ
とができる。
第1図は本発明に係る文字領域抽出方式の処理行程図、
第2図は第1図の方式による分割段階説明図、第3図は
第1図の方式に使用するアダマール変換の基本マトリッ
クス図、第4図は第1図の方式を実’Jjfjするため
の回路構成図である。 特許出題人 富士通株式会社 特許出願代理人 弁理士 官 木 朗 弁理士 西 舘 和 之 弁理士 内 1) 幸 男 弁理士 山 口 昭 之 結果出力 447 第2図 第3図 1 第4図 448−
第2図は第1図の方式による分割段階説明図、第3図は
第1図の方式に使用するアダマール変換の基本マトリッ
クス図、第4図は第1図の方式を実’Jjfjするため
の回路構成図である。 特許出題人 富士通株式会社 特許出願代理人 弁理士 官 木 朗 弁理士 西 舘 和 之 弁理士 内 1) 幸 男 弁理士 山 口 昭 之 結果出力 447 第2図 第3図 1 第4図 448−
Claims (1)
- 文字と図形が混在する入力画像の領域から文字領域のみ
を抽出する文字領域抽出方式において、上記入力画像領
域を分割して各分割領域ごとにアダマール変換を行い、
高周波成分が多い領域を文字が含まれている可能性があ
る領域と判断し高周波成分が少々い領域を文字が含まれ
ている可能性がない領域と判断し、分割領域の一辺長が
基準値以下にkる1で上記動作を繰り返して文字領域と
非文字領域全分離して文字領域のみを抽出するようにし
たことを特徴とする文字;前職抽出方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58052534A JPS59178585A (ja) | 1983-03-30 | 1983-03-30 | 文字領域抽出方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58052534A JPS59178585A (ja) | 1983-03-30 | 1983-03-30 | 文字領域抽出方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS59178585A true JPS59178585A (ja) | 1984-10-09 |
Family
ID=12917427
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58052534A Pending JPS59178585A (ja) | 1983-03-30 | 1983-03-30 | 文字領域抽出方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS59178585A (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS647175A (en) * | 1987-06-30 | 1989-01-11 | Canon Kk | Picture characteristic extraction device |
| JPS6481080A (en) * | 1987-09-24 | 1989-03-27 | Canon Kk | Image processing system |
| JP2006308685A (ja) * | 2005-04-26 | 2006-11-09 | Sanyo Electric Co Ltd | 表示装置 |
| JP2011100143A (ja) * | 2010-12-16 | 2011-05-19 | Global Oled Technology Llc | Oled表示装置 |
-
1983
- 1983-03-30 JP JP58052534A patent/JPS59178585A/ja active Pending
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS647175A (en) * | 1987-06-30 | 1989-01-11 | Canon Kk | Picture characteristic extraction device |
| JPS6481080A (en) * | 1987-09-24 | 1989-03-27 | Canon Kk | Image processing system |
| JP2006308685A (ja) * | 2005-04-26 | 2006-11-09 | Sanyo Electric Co Ltd | 表示装置 |
| JP2011100143A (ja) * | 2010-12-16 | 2011-05-19 | Global Oled Technology Llc | Oled表示装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3086702B2 (ja) | テキスト又は線図形を識別する方法及びデジタル処理システム | |
| US4167728A (en) | Automatic image processor | |
| Brisinello et al. | Improving optical character recognition performance for low quality images | |
| CN114359048B (zh) | 图像的数据增强方法、装置、终端设备及存储介质 | |
| US4665441A (en) | Method and system for line-thinning in electronic image processing | |
| KR0167616B1 (ko) | 화상 처리 장치 및 방법 | |
| JPS59178585A (ja) | 文字領域抽出方式 | |
| DE69110213T2 (de) | Verfahren zur erzeugung von punktsignalen für zeichenmuster und einrichtung hierzu. | |
| JP2993007B2 (ja) | 画像領域識別装置 | |
| JP2675303B2 (ja) | 文字認識方法 | |
| US6058219A (en) | Method of skeletonizing a binary image using compressed run length data | |
| DE69131304T2 (de) | System zur Bildverarbeitung | |
| US20110091111A1 (en) | Multilevel bit-mapped image analysis method | |
| JP2968284B2 (ja) | 文字認識装置およびその文字領域分離方法 | |
| JPS62257583A (ja) | 文字認識方式 | |
| JPS6346875B2 (ja) | ||
| JPH05298487A (ja) | 英文字認識装置 | |
| JP2562067B2 (ja) | 文字画像の単語切出し装置 | |
| Sarfraz et al. | An automatic outline fitting algorithm for Arabic characters | |
| US20120163719A1 (en) | Multilevel Image Analysis | |
| JP2581409B2 (ja) | 文字切出装置 | |
| JP3335032B2 (ja) | 画像連結成分抽出装置 | |
| Park et al. | A fully parallel thinning algorithm using a weighted template | |
| JPH0269877A (ja) | 画像処理装置 | |
| JPH10222610A (ja) | 文書画像構成要素抽出方法および装置 |