JPS60200384A - 文字認識処理方法 - Google Patents

文字認識処理方法

Info

Publication number
JPS60200384A
JPS60200384A JP59057058A JP5705884A JPS60200384A JP S60200384 A JPS60200384 A JP S60200384A JP 59057058 A JP59057058 A JP 59057058A JP 5705884 A JP5705884 A JP 5705884A JP S60200384 A JPS60200384 A JP S60200384A
Authority
JP
Japan
Prior art keywords
substrokes
stroke
substroke
strokes
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59057058A
Other languages
English (en)
Inventor
Minoru Nagao
永尾 実
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Tateisi Electronics Co
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tateisi Electronics Co, Omron Tateisi Electronics Co filed Critical Tateisi Electronics Co
Priority to JP59057058A priority Critical patent/JPS60200384A/ja
Publication of JPS60200384A publication Critical patent/JPS60200384A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈発明の技術分野〉 本発明は、未知文字を光学的に読み取り、これを白黒2
値化して文字パターンをめた後、この文字パターンより
未知文字の特徴を抽出し、標準パターンと照合すること
によって、未知文字を特定化して認識する文字認識処理
方法に関する。
〈発明の背景〉 従来の文字認識装置は、第1図に示す如く、帳票1上の
未知文字2を光学的に読み取る読取ヘッド3と、読取り
出力を電気信号に変換するCCD (Chorged−
Coupl ed Device ) 4と、CCD出
力をデジタル信号に変換するA/D変換器5と、デジタ
ル信号のノイズ除去、平滑化等の前処理を実行して文字
パターンを画像メモリ6へ格納する前処理回路7と、文
−字パターンより未知文字2の特徴を抽出する特徴抽出
回路8と、抽出された特徴を予め辞書9に格納しである
標準パターンの特徴と照合して未知文字2を認識する辞
書照合回路10とから構成される。
従来、未知文字2の特徴抽出に際し、前記前処理回路7
にて文字パターンを細線化した後、この細線化パターン
に基づき前記特徴抽出処理を実行していた。ところがこ
の方式の場合、文字パターンの細線化処理を必要とする
ため、近年、文字パターンから直接、未知文字の特徴を
抽出する方式が提案された。この方式は第2図に示す如
く、文字パターンの輪郭をなす白地と黒地との境界線(
図中、太線で示す)に着目し、この境界線が伸びる方向
を、第3図に示すA〜Dの4方向で追跡することにより
、方向性を持つ対をなすサブストローク(At 、 A
2) (Bl l B2)(C1,C2) CD1l 
B2) CB51 B4) (031C4)を抽出し、
更に、各対をなすサブストロークに基づき第4図に示す
文字パターンのストローク3.b。
C+ d + b’+”を抽出して、特徴抽出用の近似
パターンPを得るものである。かくて第4図に示す近似
パターンPにおいて、例えばストロークaの左端11は
いずれのストロークとも連結しておらず、直ち1こ文字
端点と認識される。また、ストロークaの右端12はス
トロークbと連結されているため、これは文字の屈曲点
であると認識される。従って第4図の近似パターンPの
場合、文字の端点や屈曲点を適正に抽出でき、未知文字
の特徴抽出を正確に実施し得る。
ところで、第5図に示す文字パターンの場合、各対をな
すサブストローク(Bt+ B2 ) (B31 B4
)(C1,C2) (bl 、 bz)に基づき4本の
ストロークBl、B2.C,bが抽出さ些、第6図に示
す近似パターンPが得られるへきである。ところが、第
3図に示すA、Dの各4方向は、それぞれ一定の幅を有
している。従って、この文字パターンではサブストロー
クB0とサブストロークB4が共に同じB方向性の範囲
内に位置し、対をなすサブストローク(B1.B4)と
して抽出される。
そのため、対をなすサブストローク(BIIB2)と、
対をなすサブストローク(B31 B4 )が、対をな
すサブストローク(Blr B4 )を介して相互に接
続された一連の組を構成し、ここから本来、2本のスト
ロークB1およびTS2が抽出されるべきであるにも拘
らず、1本のストロークBが抽出され、第7図に示す如
き屈曲点の不明な近似パターンPが得られ、未知文字の
正確な特徴を抽出し得ない。
〈発明の目的〉 本発明は、複数の対をなすサブストロークが、他の対を
なすサブストロークを介して相互に接続され各サブスト
ロークが一連の組をなすと看做ナレる文字パターンにつ
いても端点、屈曲点等の文字の特徴を正確に抽出し得る
新規な文字認識処理方法を提供することを目的とする。
〈発明の構成および効果〉 上記目的を達成するため、本発明では対をなすサブスト
ロークからストロークを抽出する際、各サブストローク
のうち、1のストロークを構成する1のサブストローク
と、他のストロークを構成する他のサブストロークとが
対をなす関係にある一連の組を検出し、両ストローク間
に介在して繋ぎ作用を果す対をなすサブストロークを抹
消した後、抹消処理後のサブストロークに基づき文字パ
ターンのストローク抽出を行なうこととした。
本発明によれば、各ストロークの連結作用を果す対をな
すサブストロークが抹消される力Sら、一連の組が分断
され、対をなすサブストローク毎にストローク抽出が行
なわれ、文字、sl+ターンに忠実な近似パターンか得
られ、未知文字の特徴抽出を正確化し得る等、発明目的
を達成した優れた効果を奏する。
〈実施例の説明〉 第8図は、縦横25メツシユのXY座標系(と文字パタ
ーンを適用させである。
図中、太線部は、白地と黒地との境界線を示し、この境
界線の情報は第9図に示すメモリ14に格納されている
。第9図における境界線情報は、各アドレスに対応する
メツシュが黒地であり、且つ下側メツシュが白地のとき
、第0ビ′ントにデータ「1」が、また上側メツシュが
白地のとき、第1ビツトにデータ「1」が、また右側メ
ツシュが白地のとき、第2ビツトにデータ「1」が、ま
た、左側メツシュが白地のとき第3ビツトにデータ「1
」が夫々格納される。従って、第Oビットおよび第2ビ
ツトがデータ「1」である境界線情報は、そのアドレス
に対応するメツシュの右側および下側が境界線であるこ
とを意味する。更に、第8図中、鎖線部は対をなすサブ
ストローク(Bt+ B2) (B3. B4) (B
t+B4) (C1,C2) (bt + bz)を示
し、各サブストロークの情報は第10図に示すメモIJ
 15に格納されている。このメモリ15には、対をな
すサブストロークを構成するメツシュの座標データがサ
ブストローク毎に連続して格納されている。
第11図は、各サブストロークを走査して対をなすサブ
ストロークを抽出する処理動作を示す。
まずステップ21において、第10図に示すサブストロ
ークB1の先頭座標データ(1,20)がロードされ、
次のステップ22で、サブストロークB、の走査方向を
決定する。サブストロークB1は縦方向に伸びる境界線
であるから走査方向は水平方向と決定され、この走査方
向に基づき座標(1,20)が座標(2,20)に移行
される(ステップ24)。ステップ24では、移行した
座標(2,20)が黒地か否かを判定し、また、ステッ
プ25では黒地のうち、その座標が別のサブストローク
の座標であるか否かを判定する。
いま、座標(2,20)は黒地であり且つサブストロー
クB2の座標であるから、この場合、ステップ24およ
びステップ25の判定が−YES”となり、サブストロ
ークB1とB2は一対性を有すると判定され、第12図
に示す如く、対をなすサブストローク(BllB2)デ
ータが格納される(ステップ26)。次のステップ27
では、サブストロークBlの全座標データについて、走
査が完了したか否かを判定しており、サブストロークB
1の座標データが残っていればステップ27の判定が°
’NO”となってステップ30へ進み、次の座標データ
がセットされる。いま、セットされた座標が(5,8)
であるとすると、走査のために移行した座標(7,8)
は、黒地で且つサブストロークB4の座標であるからサ
ブストロークB1とB4が一対性を有すると判定され(
ステップ24.ステップ25)、第12図の如く対をな
すサブストローク(B□、B4)データが格納される(
ステップ26)。サブストロークB1の全座標データに
ついて走査が完了したとき、ステップ27の判定がYE
S・となって、次のステップ28へ進む。ステップ28
では全サブストロークについて走査が完了したが否がを
判定しており、この場合、完了していないから判定がN
o”となってステップ31へ進み、次ノサブストローク
、この場合、サブストロークB2の先如座標データ(2
,20)がセットされ、全サブストロークにつき走査が
完了するまで同様の処理が繰り返される。
尚、対をなすサブストロークのデータ格納(ステップ2
6)に際しては、抽出したデータが既に格納されたデー
タと同一が否がかチェックされ、データの重複格納が防
止されている。
第11図に示す処理動作が完了したとき、対をなすサブ
ストロークに対応するストローク1゜2.3,4.5が
得られる(第12図)。
第13図は、第12図に格納された対をなすサブストロ
ークデータに基づき抽出されたストロークデータを示す
。このデータではサブスト・ローフBl + ”2 r
 B3 + B4から1本のストロークBが抽出されて
いる。
第14図は、第12図に示すストローク1゜2.3の各
相互関係を示しており、対をなすサブストローク(B1
1B2)に対応するストローク1と、対をなすサブスト
ローク(B11B4)に対応するストローク2が、サブ
ストロークB1を介して接続され、更に対をなすサブス
トローク(B3゜B4)に対応するストローク3がサブ
ストロークB4を介してストローク2と接続されている
。かくてストローク11ストローク2、ストローク3は
一体に連続する1本の線であると判定され、第13図の
如く、1本のストロークBに変換される。そこで本発明
は、格納されたサブストロークデータのうち、第14図
に示す如き一連の組を構成するデータがあるとき、この
組を形成する繋ぎサブストローク(B11B4)を抹消
することとした。
第15図は、本発明の特徴をなす繋ぎサブストロークの
抹消処理動作を示す。
まずステップ41は、第12図のストロークデータをサ
ーチする。ステップ42では、サーチの結果、同じサブ
ストロークが複数のストロークを構成するサブストロー
クとなっているか否を判定する。第12図の場合、サブ
ストロークBlはストローク1とストローク2を構成し
ており、また、サブストロークB4はストローク2とス
トローク3を構成している。従って、この場合ステップ
42の判定が°’YES”となり、次のステップ43て
サブストローク131.サブストロークB4のデータが
別領域に格納される。ステップ44は、第12図のスト
ロークデータを全て走査したか否かを判定しており、全
てのデータの走査が完了するまで同様の処理が繰り返さ
れる。次に、ステップ45では、ステップ43で格納さ
れたサブストロークの数が2箇以上であるか否かを判定
しており、この場合、2箇以上であるから判定が“YE
S″となってステップ46へ移る。ステップ46では格
納された2箇以上のサブストローク間に関連があるか否
かを判定しており、この場合、サブストロークB1とサ
ブストロークB4は対をなしストローク2を構成してい
るから判定が“”YES”となって、ステップ47で、
この対をなすサブストロークデータが抹消される。次の
ステップ48は、ステップ43で格納された全データに
ついて同様の処理がなされたか否かを判定しており全て
の処理が完了すれば、整理された対をなすサブストロー
クデータ(第12図)に基つき、ステップ49てストロ
ークデータの抽出が行なわれ(第16図)、特徴抽出用
の適正な近似パターンP(第6図)が得られる。
【図面の簡単な説明】
第1図は文字認識装置の全体構成を示すブロック図、第
2図は文字パターンのサブストローク抽出状態を示す説
明図、第3図は境界線追跡方向を示す説明図、第4図は
第2図に示すサブストロークに基ついて得られた近似パ
ターンを示す説明図、第5図は未知文字rMJの文字パ
ターンのサブストローク抽出状態を示す説明図、第6図
は第5図に示すサブストロークに基づいて得られた近似
パターンを示す説明図、第7図は従来方式にかかるサブ
ストロークに基づいて得られた近似パターンを示す説明
図、第8図はXY座標系に設定された文字パターンを示
す説明図、第9図は境界線の情報が格納されたメモリの
構成を示す説明図、第10図はサブストロークの情報が
格納されたメモリのデータ内容を示す説明図、第11図
は対をなす各サブストロークの抽出処理動作を示す説明
図、第12図は対をなすサブストロークの情報が格納さ
れたデータの内容を示す説明図、第13図は従来方式に
基つき第12図のデータから抽出されたストローク情報
が格納されたデータ内容を示す説明図、第14図はスト
ローク1,2.3の各相互関係を示す説明図、第15図
は本発明の特徴をなす繋きサブストロークの抹消処理動
作を示すフローチャート、第16図は抹消処理後に抽出
されたストローク情報が格納されたデータ内容を示す説
明図である。 特許出願人 立石電機株式会社 葺2図 岳3図 苔4図 分 j 図 −A6 ロ 昔70 約し 、 (0,l (0,2 (O三

Claims (1)

    【特許請求の範囲】
  1. 未知文字を光学的に読み取り白黒2値化して文字パター
    ンを得、文字パターンの輪郭をなす白地と黒地との境界
    線を所定方向に追跡して、方向性を持つ対をなすサブス
    トロークを抽出し、ついで、各サブストロークのうち1
    のストロークを構成する1・のサブストロークと、他の
    ストロークを構成する他のサブストロークとが対をなす
    関係にある一連の組を検出して、両ストローク間に介在
    し繋ぎ作用を果す対をなすサブストロークを抹消した後
    、抹消処理後のサブストロークに基づき文字パターンの
    ストロークを抽出して、未知文字の特徴抽出処理へ移行
    することを特徴とする文字認識処理方法。
JP59057058A 1984-03-23 1984-03-23 文字認識処理方法 Pending JPS60200384A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59057058A JPS60200384A (ja) 1984-03-23 1984-03-23 文字認識処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59057058A JPS60200384A (ja) 1984-03-23 1984-03-23 文字認識処理方法

Publications (1)

Publication Number Publication Date
JPS60200384A true JPS60200384A (ja) 1985-10-09

Family

ID=13044839

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59057058A Pending JPS60200384A (ja) 1984-03-23 1984-03-23 文字認識処理方法

Country Status (1)

Country Link
JP (1) JPS60200384A (ja)

Similar Documents

Publication Publication Date Title
US4891750A (en) Optical character recognition by forming and detecting matrices of geo features
JPH0546591B2 (ja)
US4015239A (en) Character recognition apparatus
JPS60200384A (ja) 文字認識処理方法
JP2859681B2 (ja) 指紋データの2値化方法
JP3021323B2 (ja) 筆跡記憶・再現装置及び筆跡再現方法及び画像再現方法
JPH0578067B2 (ja)
JPS60150194A (ja) 文字認識処理方法
JPH04255080A (ja) 画像入力装置
CN117291944B (zh) 图像处理方法及相关设备
JP2506071B2 (ja) 輪郭追跡装置
JPS61161585A (ja) 文字認識装置
JPS60146377A (ja) 文字パタ−ン切出し方法
JPS589471B2 (ja) リンカクツイセキマエシヨリホウシキ
JPS60225985A (ja) 文字認識装置
JPS641827B2 (ja)
JPS6279580A (ja) 画像処理装置
JPS61117679A (ja) 文字認識装置
JPH06150056A (ja) 表認識装置
JPH08212292A (ja) 枠線認識装置
JP2002230564A (ja) 輪郭抽出装置、方法および輪郭抽出プログラム
JPS61267882A (ja) 文字認識装置
JPH0420221B2 (ja)
JPS63182780A (ja) 図面読取装置における画像処理方法
JPH01189787A (ja) 特徴抽出方法及び特徴抽出装置