JPS59178585A - 文字領域抽出方式 - Google Patents

文字領域抽出方式

Info

Publication number
JPS59178585A
JPS59178585A JP58052534A JP5253483A JPS59178585A JP S59178585 A JPS59178585 A JP S59178585A JP 58052534 A JP58052534 A JP 58052534A JP 5253483 A JP5253483 A JP 5253483A JP S59178585 A JPS59178585 A JP S59178585A
Authority
JP
Japan
Prior art keywords
area
character
areas
characters
divided
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58052534A
Other languages
English (en)
Inventor
Akira Inoue
彰 井上
Katsuhiko Nishikawa
克彦 西川
「はい」 東善
Touzen Hai
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58052534A priority Critical patent/JPS59178585A/ja
Publication of JPS59178585A publication Critical patent/JPS59178585A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (1)発明の技術分野 本発明は、文字と図形が混在する図面領域から文字領域
のみを抽出する文字領域抽出方式に関する。
(2)技術の背景 一般に、文字に用いる認識処理方式と図形に用いる認識
処理方式とは異なるだめ、文字と図形が混在する図面に
おいては認識処理が困難である。
従ってこのような文字と図形が混在する図形の認識処理
の前提として、最初に文字と図形を分離する必要がある
(3)従来技術と問題点 従来、文字と図形を分離する方式としては文字と図形の
全体を構成する輪郭を追跡して行って文字を抽出する方
式がある。しかしこの方式は追跡を基本としているので
孤立した文字のみ抽出されるに過ぎず、かつランダムア
クセスを必要とするので低速であるという間!+:jM
点があった。
また、従来の他の方式としては、−次元走査により黒白
の変化点を検出することによシ文字を抽出する方式があ
るが、この方式は一次元走査を基本とするため文字が横
書き又は縦■きに統一されていなければ分離できないと
いう問題点があった。
(4)発明の目的 本発明の目的は、アダマール変換を階層的に用いて文字
が存在すると予想される領域を順次せばめること釦よシ
、文字がどの方向に病かれていても高速かつ正確に文字
領域を抽出することにある。
(5)発明の構成 本発明によれば、文字と図形が混在する入力画像の領域
から文字領域のみを抽出する文字領域抽出方式において
、 上記入力画f惚領域を分割して各分割子1′(域ごとに
アゲマール変換を行い、高周波成分が多い領域を文字が
含まれている可能性がある領域と判断し高周波り部分が
少ない領域を文字が含ま)1.ている可能性が々い領域
と判断し 分割領域の一辺長が基準値以下に々るまで上
記動作11返して文字領域と非文字領域を分離して文字
領域のみを抽出するようにしたことk %徴とする文字
領域抽出方式が提供される。
(6)発明の実施例 以下、本発明を実施例によシ?/15・[・]図面を参
照して説明する。
第1図は本発明に係る文字領域抽出方式の処理工程図で
ある。本発明方式は図示する通り5tep1.2及び3
の3段階に分かれている。
■ 5tep 1 先ず入力画1段を、第2図に示すように領域Iをn分割
、例えは16分9fすし、アゲマール変換を行って高周
波領域に形成された文字らしき部分に論理フィルタをか
けてその部分を抽出する。尚、第2図において、実線で
四重れた領域は分割領域を破線は画像に描かれた図形を
、それぞれ示しでいる。
ここに−アダマール変換とは、 i’8’4’に211
酊【F1像に対する周波数特性の抽出に使用′ざ:11
.るものであり、第3図にアダマール変換の基本マトリ
ックス(8X8)を示す。例えば、第3図において、一
点鎖線で示すaの部分は最も変化が少々く低Rd波成分
を多く含むが、bの部分は最も変化が激しく高周波成分
を多く含む。従って、アダマール変換によれ(・x高周
波成分が多く倉む領域は漢字、英字など文字を含む可能
性がある領域であり、高周波成分が少ない領域は文字を
含む可nに性がない領域であることが判断される。かか
るアダマー・l・布!91(を順次対象領域を分割して
適用して行けば、最後には文字と図形が混在する図面か
ら文字領域だけを抽出できる。
上述したように、この5tep、tにおいては入力画像
を16分割してそのうち1つの領域■でアダ1一層変換
を行う。
■ 5tep 2 次に、5tep1においてアダマール変換を行った結果
、高周波成分を多く含む領域がいくつか検出される。そ
のうち、例えば領域IIIが高周波領域であれば、この
■は文字を含む可能性がある領域とみなしく第1図のY
ES ) 、領域■を更に4つに分割しアダマール変換
を行う。5teplと同様に論理フィルタを通して高周
波成分を多く含む領域、例えば斜線を施した領域■が抽
出される。また、この段階で高周波成分が少々いならば
文字の可能性なしとして処理は終了する(NO)。
(’J)  5tep 3 この領域■の大きさ即ち一辺の長さを基準値mと比較し
m以下であれば処理を終了し、mより大であh7は高周
波領域が少ないときも処理を終了する。mより犬で高周
波領域を多く含む+11域であれば(ygs)再びこの
領域■を4分割すべ(5tep2に戻る。上記のような
5tep 1 、2及び3の各行程は、第4図の回路に
従って実施さ凡る。即ち、画像入力装置からそのメモリ
に入力された画像を領域分割回路11アダマ一ル変換回
路を介して第1図の5tep 1の段階が実行される。
次に判定回路、領域分割回路■アダマール変換回路によ
り5tep2が、更に判定回路により5tep 3がそ
れぞれ実行され、この5tep 1から3才での実行に
嶺たり画像メモリ回路1.Jlのアドレスはアドレス制
御部により制御される。
(7)発明の効果 上記の通り、本発明によil−はアダマール変換を利用
して入力画像を順次分割して高周波成分が多い領域を文
字を含む領域と予想して抽出するので、文牢列にかかわ
らず高速かつ正確に図面から文字領域のみを抽出するこ
とができる。
【図面の簡単な説明】
第1図は本発明に係る文字領域抽出方式の処理行程図、
第2図は第1図の方式による分割段階説明図、第3図は
第1図の方式に使用するアダマール変換の基本マトリッ
クス図、第4図は第1図の方式を実’Jjfjするため
の回路構成図である。 特許出題人 富士通株式会社 特許出願代理人 弁理士 官 木    朗 弁理士 西  舘  和  之 弁理士  内  1) 幸  男 弁理士  山  口  昭  之 結果出力 447 第2図 第3図 1 第4図 448−

Claims (1)

    【特許請求の範囲】
  1. 文字と図形が混在する入力画像の領域から文字領域のみ
    を抽出する文字領域抽出方式において、上記入力画像領
    域を分割して各分割領域ごとにアダマール変換を行い、
    高周波成分が多い領域を文字が含まれている可能性があ
    る領域と判断し高周波成分が少々い領域を文字が含まれ
    ている可能性がない領域と判断し、分割領域の一辺長が
    基準値以下にkる1で上記動作を繰り返して文字領域と
    非文字領域全分離して文字領域のみを抽出するようにし
    たことを特徴とする文字;前職抽出方式。
JP58052534A 1983-03-30 1983-03-30 文字領域抽出方式 Pending JPS59178585A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58052534A JPS59178585A (ja) 1983-03-30 1983-03-30 文字領域抽出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58052534A JPS59178585A (ja) 1983-03-30 1983-03-30 文字領域抽出方式

Publications (1)

Publication Number Publication Date
JPS59178585A true JPS59178585A (ja) 1984-10-09

Family

ID=12917427

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58052534A Pending JPS59178585A (ja) 1983-03-30 1983-03-30 文字領域抽出方式

Country Status (1)

Country Link
JP (1) JPS59178585A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS647175A (en) * 1987-06-30 1989-01-11 Canon Kk Picture characteristic extraction device
JPS6481080A (en) * 1987-09-24 1989-03-27 Canon Kk Image processing system
JP2006308685A (ja) * 2005-04-26 2006-11-09 Sanyo Electric Co Ltd 表示装置
JP2011100143A (ja) * 2010-12-16 2011-05-19 Global Oled Technology Llc Oled表示装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS647175A (en) * 1987-06-30 1989-01-11 Canon Kk Picture characteristic extraction device
JPS6481080A (en) * 1987-09-24 1989-03-27 Canon Kk Image processing system
JP2006308685A (ja) * 2005-04-26 2006-11-09 Sanyo Electric Co Ltd 表示装置
JP2011100143A (ja) * 2010-12-16 2011-05-19 Global Oled Technology Llc Oled表示装置

Similar Documents

Publication Publication Date Title
JP3086702B2 (ja) テキスト又は線図形を識別する方法及びデジタル処理システム
US4167728A (en) Automatic image processor
Brisinello et al. Improving optical character recognition performance for low quality images
CN114359048B (zh) 图像的数据增强方法、装置、终端设备及存储介质
US4665441A (en) Method and system for line-thinning in electronic image processing
KR0167616B1 (ko) 화상 처리 장치 및 방법
JPS59178585A (ja) 文字領域抽出方式
DE69110213T2 (de) Verfahren zur erzeugung von punktsignalen für zeichenmuster und einrichtung hierzu.
JP2993007B2 (ja) 画像領域識別装置
JP2675303B2 (ja) 文字認識方法
US6058219A (en) Method of skeletonizing a binary image using compressed run length data
DE69131304T2 (de) System zur Bildverarbeitung
US20110091111A1 (en) Multilevel bit-mapped image analysis method
JP2968284B2 (ja) 文字認識装置およびその文字領域分離方法
JPS62257583A (ja) 文字認識方式
JPS6346875B2 (ja)
JPH05298487A (ja) 英文字認識装置
JP2562067B2 (ja) 文字画像の単語切出し装置
Sarfraz et al. An automatic outline fitting algorithm for Arabic characters
US20120163719A1 (en) Multilevel Image Analysis
JP2581409B2 (ja) 文字切出装置
JP3335032B2 (ja) 画像連結成分抽出装置
Park et al. A fully parallel thinning algorithm using a weighted template
JPH0269877A (ja) 画像処理装置
JPH10222610A (ja) 文書画像構成要素抽出方法および装置