JPS6362084A - 文字切出し方式 - Google Patents

文字切出し方式

Info

Publication number
JPS6362084A
JPS6362084A JP61207273A JP20727386A JPS6362084A JP S6362084 A JPS6362084 A JP S6362084A JP 61207273 A JP61207273 A JP 61207273A JP 20727386 A JP20727386 A JP 20727386A JP S6362084 A JPS6362084 A JP S6362084A
Authority
JP
Japan
Prior art keywords
character
pattern
scanning
detected
character pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61207273A
Other languages
English (en)
Inventor
Mamoru Maeda
護 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61207273A priority Critical patent/JPS6362084A/ja
Publication of JPS6362084A publication Critical patent/JPS6362084A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔技術分野〕 本発明は、OCR(光学文字読取り装置)等における文
字切出し方式に関する。
〔従来技術〕
一般にOCR等においては、文字切出しに垂直射影及び
水平射影が用いられる。しかしながら、原稿上の文字の
一部かすれ等によって1文字のパターンが複数個に分離
した場合、及びノイズがパターンの周囲に存在した場合
には、誤って切り出されることがあるという問題があっ
た。
〔目 的〕
本発明の目的は、OCR等において、文字パターンの切
出し時、文字パターンの周辺に存在するノイズ、あるい
は文字のかすれ等によって生じる文字パタ〒ンの分離に
より誤って切り出されるのを防ぐことにある。
〔構 成〕
本発明は、文字切出し時に幅の狭いパターンを検出した
時には1文字の標準サイズに合せて前方の射影走査を行
い、1つの文字パターンとして統合できるかという判定
する。また、求まった文字幅の範囲内を上方あるいは下
方から走査し、パターンありを検出すると、所定の高さ
だけスキップした位置から走査を再開し、再びパターン
ありを検出した時、前の検出位置と比較して文字パター
ンの上方あるいは下方に含まれるノイズを除去して文字
切出しを行う。
以下、本発明の一実施例について図面により説明する。
第1図は本発明の文字切出し方式を説明するための図で
あり、第1図(a)は文字パターンの文字幅を決定する
場合の図、第1図(b)は文字パターンの上方あるいは
下方に存在するノイズを除去する場合の図を示している
。なお、第1図では、1つの文字パターンは7セグメン
トで構成されるとしている。第1図(a)において、1
は読み取られた一つの文字パターン行、2はその垂直射
影パターンである。周知のように、垂直射影パターン2
は文字パターン行2を例えば左から右に順次、垂直方向
に黒ドツトがあるかどうか見ていき、黒ドツトがあれば
“1”、なければ“O”とすることで得られる。また、
第1図(b)において、3は一つの文字パターン、4は
該文字パターンの上方に存在するノイズである。
初め、第1図(a)により、切出すべき文字パターンの
横方向の文字幅を決定する処理について説明する。第2
図はこの場合の処理フローを示したものである1例とし
て、二Nでは第1図(a)中の数字「4」 (これは、
かすれ等により2つに分離されている)を切り出すもの
とする。
数字「5」のパターンを切り出した後、垂直射影パター
ン2を左から右に走査して、次のパターンとの間隔WL
ENを求める(ステップ101)。
このWLENを予め定めた文字ピッチP I TCHと
比較し【ステップ102) 、 WLEN<P I T
CHであれば、そのま\ステップ104に進み、WLE
N≧PITCHであればスペース処理(ステップ103
)を行った後、ステップ104に進む。ステップ処理で
は、WLEN≧PITCHの場合、当該間隔領域をスペ
ースとして数える。スペニス数はWLEN/PITCH
で求める。もし、後処理でスペースを出力しない方がよ
い場合には、PITCH=Oと指定しておき、スペース
数を求める前にPITCH=Oをチェックし、PITC
H=Oであれば、スペース数を求める処理をスキップし
、スペースサプレスを行う。
ステップ104では、次の黒長さBLENを求める。こ
のBLENを予め定めた文字の最小幅CHMINと比較
しくステップ105)、BLEN≦CHMINであれば
、この黒領域はノイズと見做して、そのま>WLENに
加え(ステップ106)、BLEN>CHMINの場合
には、さらに垂直射影パターン2の走査を続けて前方の
白長さFWLENを求める(ステップ107)、このF
WLENを予め定めた白長さGAPと比較しくステップ
108) 、FWLEN≧GAPであれば。
FWLENは文字等のかすれが原因で生じたと判断して
、さらに前方の黒長さFBLENを求める(ステップ1
09)。そして、BLEN+FWLEN+FBLEN=
HWを計算しくステップ110)、このHWを予め定め
た最大文字幅CHMAXと比較しくステップ111)、
HW≦CHMAXであれば、このHWを1つの文字パタ
ーンに対する切出し幅とする(ステップ112)、一方
、HW>CHMAXの場合は、BLENとFBLENの
部分をそれぞれ別の文字パターンとする(ステップ11
3)、これはステップ108でFWLEN>GAPが判
定された場合も同様である。
次に、第1図(b)により、切出すべき文字パターンの
上方あるいは下方に存在するノイズを除去する処理につ
いて説明する。第3図はこの場合の処理フローを示した
ものである。
文字パターン3の文字幅(HW’ とする)が第2図の
如き処理により求まったなら、該文字幅HW′の範囲内
を例えば上方から下方に向けて走査し、最初に黒画素を
検出した位置で走査を一担停止しその位置(xt−y□
)を求める(ステップ201)0次に、該位置のY座標
Y1に文字パターンの最小高さCHMINを加え(ステ
ップ202)、その位置から走査を再開して次に黒画素
を検出したら走査を再び停止して該位置(X、、 Y、
)を求める(ステップ2o3)。こ\で、最初に停止し
た位置のX座標X1と次に停止した位置のX座標x2と
を比較しくステップ204)、X1=X、であれば、最
初に停止した位置(Xユ、Yl)をパターンの頂点とす
る(ステップ205)、一方、X1〜X2であれば、2
回目に停止した位置を最初に停止した位置と見做し、即
ち、x2→X□、Y2→Y□として(ステップ206)
、X□=x2の位置が見つかるまでステップ202以降
の処理を繰り返す。これにより、第1図(b)に示すよ
うなパターン3の上方に存在するノイズを除去すること
ができる。同様にして、求まった文字幅の範囲内を下方
から上方に向けて走査することにより、パターンの底点
が求まる1文字パターンを切出す際、その縦方向の幅は
頂点と底点の範囲内とすればよい。
第4図は本発明方式を実現するハードウェア構成例の概
略ブロック図である。第4図において、イメージメモリ
14には文字パターンデータとその垂直射影パターンが
格納されている。いま、CFULLから垂直射影走査が
指定されると、走査制御部12はアドレス生成部13に
対してイメージメモリ14内の垂直射影パターン格納ア
ドレスの初期値をロードすると共に、アドレス生成部1
3をカウントイネーブル状態にする。この結果。
イメージメモリ14内の垂直射影パターンが走査され、
走査制御部12に順次取り込まれる。走査制御部12で
は、この取り込まれた垂直射影パターンの黒ラン、白ラ
ンを検出し、その始点/終点アドレスをCPUIIに送
る。CPUIIでは走査制御部12から送られた黒ラン
、白ランの始点/終点アドレスにもとづいて第2図の処
理を実行し、切出すべきパターンの文字幅(横方向)を
求める。
次に、切出すべき文字パターンの上方あるいは下方に存
在するノイズを除去する処理の場合には、CPU11は
走査制御部12に対して文字パターン走査とその走査範
囲を指定する。これを受けて走査制御部12はアドレス
生成部13に対してイヌニジメモリ14内の文字パター
ン格納アドレスの初期値をロードし、該アドレス生成部
13をカウントイネーブル状態にする。これにより、イ
メージメモリ14内の該当文字パターン領域が上方から
下方あるいは下方から上方に走査され、その結果が走査
制御部12に順次取り込まれる。走査制御部12は黒画
素を検出すると、アドレス生成部13のカウントアツプ
を一時中止して、即ち、走査を一時中止して、そのアド
レスをCPUIIに送り、CPUI 1から次の走査開
始位置の指示を受けて走査を再開する。そして、黒画素
を検出すると、再び走査を中止してそのアドレスをCP
U1lに送り、C,FULLからの次の指示を待つ。
CPUI 1では走査制御部12から送られた黒画素の
アドレスにもとづいて第3図の処理を実行し、走査制御
部12に対して走査の再開を指示したり。
パターンの頂点、底点を求める。
〔効 果〕
以上の説明から明らかな如く、本発明によれば、文字切
出しの際、文字の最小幅を越えるノイズを効率よく除去
でき、また、かすれ等により文字パターンが分離した場
合にも容易に統合でき、OCR等における認識率の向上
がもたらされる。
【図面の簡単な説明】
第1図は本発明の文字切出し方式の原理説明図、第2図
及び第3図は本発明による文字切出し方式の一実施例の
フローチャート、第4図は本発明方式を実現するハード
ウェア構成例を示す図である。 11・・・CPU、  12・・・走査制御部、13・
・・アドレス生成図、  14・・・イメージメモリ。 FWLEN 第  2  図

Claims (2)

    【特許請求の範囲】
  1. (1)垂直射影あるいは水平射影により文字切出しを行
    う方式において、幅の狭いパターンを検出すると、文字
    の標準サイズに合わせて前方の射影走査を行い、一つの
    文字パターンとして統合できるかどうか判定することを
    特徴とする文字切出し方式。
  2. (2)文字パターンを走査し、最初に黒画素を検出する
    と、所定の位置をずらして走査を再開し、最初に検出し
    た黒画素の位置と次に検出する黒画素の位置関係からノ
    イズ部分を除去することを特徴とする特許請求の範囲第
    1項記載の文字切出し方式。
JP61207273A 1986-09-03 1986-09-03 文字切出し方式 Pending JPS6362084A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61207273A JPS6362084A (ja) 1986-09-03 1986-09-03 文字切出し方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61207273A JPS6362084A (ja) 1986-09-03 1986-09-03 文字切出し方式

Publications (1)

Publication Number Publication Date
JPS6362084A true JPS6362084A (ja) 1988-03-18

Family

ID=16537064

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61207273A Pending JPS6362084A (ja) 1986-09-03 1986-09-03 文字切出し方式

Country Status (1)

Country Link
JP (1) JPS6362084A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0383135U (ja) * 1989-12-15 1991-08-23

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0383135U (ja) * 1989-12-15 1991-08-23

Similar Documents

Publication Publication Date Title
JP3338537B2 (ja) 画像傾き検出装置
US7227557B2 (en) Method, system and record medium for generating wide-area high-resolution image
JP2812982B2 (ja) 表認識方法
JPH05500875A (ja) 光学式文字認識のために英数字文字を細線化するための方法及び装置
JP2010002991A (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JPS6362084A (ja) 文字切出し方式
CN115187851B (zh) 处理视觉数据中的敏感信息的方法、装置、设备和介质
JP2004128643A (ja) 画像の傾き補正方法
JP3772845B2 (ja) 画像処理プログラム、画像処理装置、および撮影装置
JP3015641B2 (ja) 部品位置認識装置
KR20100009452A (ko) 영상 처리 방법
CN114943972B (zh) 一种真实场景形变数字图片生成方法及系统
JP3095470B2 (ja) 文字認識装置
Okun et al. Robust text detection from binarized document images
JP2003317107A (ja) 罫線抽出方法及び装置
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
JP3162414B2 (ja) 罫線認識方法及び表処理方法
JP2931041B2 (ja) 表内文字認識方法
JPH11242716A (ja) 画像処理方法および記録媒体
JP2872757B2 (ja) 行方向判定装置
JP3430506B2 (ja) 画像処理方法及び該方法を用いたナンバープレートのサーチ方法
CN107680046A (zh) 影像矫正方法、装置、存储介质和计算机设备
JPH04309191A (ja) 領域属性識別装置
JPH07225809A (ja) 文書読取り枠の自動生成方法
JPS63131287A (ja) 文字認識方式