JPS6037954B2 - 特徴抽出処理方式 - Google Patents

特徴抽出処理方式

Info

Publication number
JPS6037954B2
JPS6037954B2 JP55012208A JP1220880A JPS6037954B2 JP S6037954 B2 JPS6037954 B2 JP S6037954B2 JP 55012208 A JP55012208 A JP 55012208A JP 1220880 A JP1220880 A JP 1220880A JP S6037954 B2 JPS6037954 B2 JP S6037954B2
Authority
JP
Japan
Prior art keywords
code
feature
point
white
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55012208A
Other languages
English (en)
Other versions
JPS56110188A (en
Inventor
茂 赤松
和昭 小森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP55012208A priority Critical patent/JPS6037954B2/ja
Publication of JPS56110188A publication Critical patent/JPS56110188A/ja
Publication of JPS6037954B2 publication Critical patent/JPS6037954B2/ja
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 本発明は、特徴抽出処理方式、特に位相幾何的にみて複
数な構造をもつ漢字等のパタンから識別に有効な特徴を
効果的に抽出する特徴抽出処理方式に関するものである
黒白2値パタン1個を含むパタン領域の各点から予め定
めた方向をみた時に見つかる位相幾何的特徴をして方向
情報を保存して各点に集積し、この結果得られる高次特
徴を用いて識別する文字論取方式として、特豚昭51一
85708号(特開昭53一10931号)がある。
この方式の基本部分である特徴抽出処理の原理を第1図
に示す。同図aにおいて、文字部分(黒)6を含むパタ
ン領域7の任意の白点5から、上下左右4方向に走査線
を出し(右方向1、上方向2、左方向3、下方向4)、
各方向に文字部分が存在するか杏かを調べる。各白点に
対応して4ビットの特徴ベクトル10が与えられ、上記
文字部分の存在状況に応じて存在すれば1を、存在しな
ければ0を特徴ベクトル10の所定の位置にセットする
。白点5が本例の位置にあるとき、この点の特徴ベクト
ル1川ま右方向走査線1に対応するビット位置11は1
、上方向走査線2に対応するビット位置12は0、左方
向走査線3に対応するビット位置13は1、そして下方
向走査線4に対応するビット位置14は1である。以上
の処理を1次位相特徴抽出と呼ぶ。この処理によってパ
タン領域7の白点領域は各白点が如何なる特徴ベクトル
をもつかに従っていくつかに分割される。本例では同図
bに図形的に示すように文字部分6の閉じ状況に応じて
図示21,22,23,24,25,26,27の如き
特徴をもつ特徴ベクトルが抽出される。例えば、特徴ベ
クトル21は右方向1および下方向4のみに文字部分が
あること、特徴ベクトル22は上方向2のみに空きがあ
ること、特徴ベクトル24は空き方向がないこと等を図
的に表わす。さて次に、1次位相特徴抽出にパタン領域
7の各白点に形成された位相幾何的特徴すなわち特徴ベ
クトル10を基に高次特徴を形成するようにする。
このため各白点については自分自身の特徴ベクトル10
の他に、各方向に走査線を出したときに文字部分6を越
えて初めて出合う白点の特徴ベクトルを方向情報を保存
して追加する。白点5が本体の位置にあるときは、その
高次特徴は図的に表わせば図示高次特徴30のようにな
る。該特徴3川こおいて小さな丸31は白点5の上方向
2に文字部分がないことを示している。また各黒V点‘
こついては、その点から各方向に走査線を出した時に初
めて出合う白点の特徴ベクトルを方向情報を保存して追
加する。黒点8が本例の位置にあるときはその高次特徴
は図的に表わせば図示高次特徴40のようになる。なお
特顔昭51一85708号(特開昭53一10931号
)では1次位相特徴抽出された特徴ベクトル10の中で
文字変形に対し不安定なものを安定なものに変換する統
合処理を行なう。例えば、特徴ベクトルのうちの特徴ベ
クトル24はループと区別がつかないので該ベクトル2
4と接している白点特徴ベクトル26に変換される。ま
た黒V点に対してその点の隣接点の白黒の状態をみて局
所懐き情報を与え、これを黒V点の1次位相特徴とする
特徴抽出法、持豚昭51一121792号(特関昭53
−47239号)がある。これら上記万式は手書きある
いは印字の英数字、カタカナ等の比較的単純な位相幾何
的構造をもったパタンの特徴抽出法に適している。そし
て入力文字の識別は上記高次特徴の存在状況とカテゴリ
毎に予め用意されている高次特徴のリストと比較して行
なうようにされる。上記従来方式では、背景白部の点に
与えられる位相幾何的特徴は当該白点を中心に上下左右
方向に文字枠まで走査線を伸ばした時の文字線の有無に
よって閉じ状態を記述する一次位相特徴を基本として構
成されている。
しかし、上記特徴では、漢字のように文字線の縦・横・
斜めの方向性の区別が比較的明確なパタンであっても、
対象文字の図形的変形・雑音によって生じた特徴と、安
定なストロークの構造を記述した特徴とを、特徴抽出の
段階で区別することが困難であること、並びに、漢字の
部首に代表されるような部分パタンの存在を文字全体の
中から区別して特徴づける際に必要となる文字線の分離
状態を表わす情報が充分でないこと等、特徴のもつ位相
幾何的情報の不足を原因とする欠点をなお含んでいる。
本発明は、これらの欠点を解決するために、パタン面上
の白点における位相幾何的特徴の基本となる1次特徴を
、予め定められた方向に存在する文字線の額きを表現し
ている傾斜コードを該白点上の集積させることによって
求め、併せて該白点の周辺の文字線の連結性をも表現し
うるようにすることを目的としており、以下図面につい
て詳細に説明する。
第2図は本発明の実施例であって、5川ま走査部、6川
まパタンメモリ部、61はパタンメモリ、7川ま制御部
、80は識別部、9川ま特徴抽出部を表わす。
該特徴抽出部90の構成要部として、910川ま傾斜コ
ード抽出部、9200は特徴集積部、9300は特徴コ
ード変換部、9400は特徴点抽出部、9500は背景
分割線抽出部、9600は周辺閉じ状態コード抽出部で
ある。これを動作するには、制御部70の指令により走
査部50が紙面を走査し、用紙上の1文字を含む領域の
黒及び白を表わす2値信号がパタンメモリ61の所定の
アドレスに順次格納される。
パタンメモリ61上では、パタン領域内の1メッシュに
対して予め定められたワード数から成るメモリアドレス
が割りあてられている。パタン領域内の信号がパタンメ
モリ61に格納され終ると、制御部70の指令を受け、
特徴抽出部9川ま予め定められた手順でパタンメモリ6
1の内容を読み出し、格納された文字パタン上の各点に
その位相幾何的特徴を表わす特徴コードを求め、パタン
メモリ上の対応するアドレスに格納する。特徴抽出部9
0を用いた一連の特徴コード作成処理が終了すると、パ
タンメモリ61の内容は識別部8川こ順次転送される。
識別部80では、パタン領域の各メッシュに対応するパ
タンメモリ61上のアドレスに記憶された特徴コードを
読み出し、その種類と各々の個数とを求めて、この情報
に基づいて入力文字が何であったかを決定し、その結果
を出力する。特徴抽出部90では、まず額斜コード抽出
部9100でパタンメモリ61上に格納された文字パタ
ン上の黒V点に対して、その文字線の煩きを表わす額斜
コードを形成する。
頚斜コード抽出部9100による動作が終了すると、制
御部70の指令により、予め定められた手順に従ってパ
タンメモリ部60はパタンメモリ61を上下左右に走査
しつつその内容を読み出し、特徴集積部9200に転送
する。特徴集積部9200ではパタン領域の白点に対し
て該白点の上下左右方向に存在する文字線上の黒点から
煩斜コードを選択して抽出しこれに基づいて該白点より
ながめた時の該文字線の煩きを表わす頃斜コードを求め
、該コードを予め定められたビッド構成に従って配分す
ることにより集積コードを作成し、これをパタンメモリ
61上の該白点‘こ対応するアドレスの転送する。特徴
集積部9200の動作が終了した後特徴コード変換部9
300では、制御部70の指令によりパタンメモリ61
を上下左右に走査する過程を読み出された前記額斜コー
ドを含む特徴コードを変換する。即ち該走査線上にあっ
てパタンメモリ61上の隣接する点から読み出された特
徴コードを参照することにより、必要ならば予め定めら
れた規則に従って該額斜コードを変換し、パタンのより
安定な構造を記述するよう特徴コードを作成し、これを
パタンメモリ61上の対応するアドレスに格納する。以
上に示す特徴集積部9200及び特徴コード変換部93
00の動作とは独立に特徴点抽出部9400は、予め定
められた手順でパタンメモリ61の内容を読み出し、格
納された文字パタン上の端点、屈曲点などの位相幾何的
特徴点を検出する。特徴点抽出部9400動作が終了し
た後、背景分割線抽出部9500では、予め定められた
手順に従ってパタンメモリ61を走査する過程で、前記
特徴点抽出部94001こよって抽出された位相幾何的
特徴点が検出された時に、該特徴点の種別に応じて予め
定められた方向に該走査方向が一致するとき該特徴点を
起点として背景白部を分割する線分を延ばし、パタンメ
モリ上の該線分に対応する点のアドレスに該背景分割線
を表わすコードを格納する。周辺閉じ状態コード抽出部
9600では、前記特徴集積部9200及び背景分割線
抽出部9500‘こよる動作が終了した後、制御部70
の指令によりパタンメモリ61を上下左右に走査し、文
字線部分或いは背景分割線によって仕切られた任意の白
部領域に含まれる該走査線上の白点‘こ対して、該走査
線が文字線部分を通過してから該白熱こ至るまでの間に
交叉した背景分割線の回数とその方向、ならびにその間
に白点より読み出された特徴コード上に集積された方向
別の文字線傾斜コードの種類別出現個数などに応じて、
該白部領域の周囲の文字線閉じ状態を表現する特徴コー
ドを作成し、該白点に対応するアドレスに定められたビ
ット構成で格納する。以上に示す各部の動作によって、
特徴抽出部90はパタンメモリ61に格納された文字パ
タン上の各点にその位相幾何的特徴を表わす特徴コード
を格納する。次に特徴抽出部90を構成する各処理部に
ついて詳細に説明する。傾斜コード抽出部9100は、
文字線上の任意の黒V点から予め定められた各方向別の
黒V点の連続数を計数し方向別距離を求め、該方向別距
離を比較することにより文字線の方向成分を決定するな
どの方法によって、文字パタンを構成するストロークの
額斜を表わす煩斜コードを形成する。
この種のストローク額斜抽出法は既に幾つか知られてお
り、公知の技術を利用することができる。第3図は、文
字パタン上の黒V点に対応するアドレスにおいて、傾斜
コード抽出部9100の出力として得られる頭斜コード
等を表現するビット構成の一実施例と、該傾斜コードに
よって記述されるストロークの方向成分の定義を示す。
本実施例ではストロークの方向を、右方向51と左方向
52、上方向53と下方向54、右上45o方向55と
左下45o方向56、左上45o方向57と右下45o
方向58の4対計8方向に童子化するものとする。61
0はパタンメモリ61上のメッシュに対応するアドレス
に用意された1語以上のメモリから構成される特徴コー
ドであり、該メッシュが文字線上に位置するとき黒白情
報部611は「1」となつて、額斜コード部620‘ま
該黒V点上に検出される頃斜コードを格納するビット領
域となる。
ここでビット位置621,622,623,624,6
25,626,627,628は各々ストローク方向5
1,52,53,54,55,56,57,58に対応
している。たとえば、該黒V点を中心として51方向に
ストロークが検出された場合にはビット621を「1」
とし、逆に51方向にストロークが検出されないときビ
ット621を「0」とすることにより、該黒点における
頃斜コード620を8方向のストロークの有無を表わす
8ビットの領域でコード化する。第4図は、パタンメモ
リ61上の2値パタン500と、煩斜コード抽出部91
001こよって形成された該パタンの文字線上黒V点の
懐斜コードの一例を幾つかの点501,502,503
によって図示したものである。
ビット列506は図的表現511に示すように点501
が53,54方向に連なる垂直方向のストローク上にあ
ることを示す頃斜コードであり、ビット列507は図的
表現512に示すように点502が55方向にのみ連な
る右上り方向のストローク上にあることを示す煩斜コー
ドである。またビット列508は図的表現513に示す
様に点503においては54,55,56方向のみなら
ず52,53方向についての文字線の連なりをも検出さ
れたことを示す煩斜コードであり、該文字パタン500
のスケルトンのもつ構造とは矛盾する雑音とみなすべき
コードであるが、文字線が変動する太さをもっているこ
とから、このような雑音の発生を抑えることは困難であ
る。この種の雑音に対しては特徴集積部9200におて
対処することができる(後述)。第5図は、特徴集積部
9200をはじめとして特徴コード変換部9300背景
分割線抽出部9500、周辺閉じ状態コード抽出部96
00等によって、パタン領域上の任意の白点に形成され
る特徴コード630のビット構成一実施例と、該特徴コ
ードを構成し該白点の周囲4方向の文字線懐斜情報を表
現する集積コードの一実施例を示す。ビット列651,
652,653,654はそれぞれ任意の白点から予め
定められた方向に走査線を出した時に水平方向、垂直方
向、右上り方向、左上り方向の煩斜をもつ文字線が存在
することを表わす集積コード、ビット列655は該走査
線延長上に文字線の存在しないことを表わす集積コード
、ビット列656は該走査線上に最初に存在する文字線
上の黒点より抽出される頚斜コードが額斜コード判定回
路9211によっていずれも不安定と判断され該文字線
の傾斜を一意にコード化できなかったことを表わす集積
コードであり、これらに対応する記号661,662,
663,664,665,666は、第8図に一例を示
す白点上の集積コードの図的表現に用いるシンボルであ
る。白点の特徴コード63川ま、黒V点と白点とを弁別
するビット631と、文字線の煩斜を表わす前記集積コ
ードを該白点を起点として該文字線の存在する方向に対
応して右方向51を641、左方向52を642、上方
向53を643、下方向54を644のビット位置に配
置した集積コ−ド部640と、後述の特徴コード変換部
9300において該集積コードをそれぞれコード変換し
た結果を格納する変換済み集積コード部645と、後述
の背景分割線抽出部9500及び周辺閉じ状態コード抽
出部960川こよって形成されるその他の集積情報をコ
ード化し豚部分635とから成る。第6図は特徴集積部
9200の一実施例をブロック図で示したものである。
制御部70の指令にもとず〈文字パタン上の走査によっ
て、パタンメモリ61より読み出された黒V点の特徴コ
ード及び白点が結線303を通じて入力レジスタ921
0に絡納される。なおこの時点では白点に対応する特徴
は未だ形成されていない。黒点から転送された特徴コー
ド‘こ対しては懐斜コード判定回路9211が動作し第
3図に示す該特徴コード610上の傾斜コード620が
、後述の判定論理により、該文字線の煩斜情報を安定に
表現しているものと判定ざれた場合にのみ、集積コード
選択部9212が動作し、第5図で示したビット列65
1,652,653,654,655,656によつて
表わされる集積コードのうち、該黒点の煩斜情報を該走
査方向の白点の集積させる場合に対応する集積コードを
選択して出力し、3ビットから成る集積コードレジスタ
9213の内容を更新する。また、入力レジスタ921
0上のデータが白点から転送された場合には集積コード
合成部9215が動作し、集積コードレジスタ9213
の内容が入力レジスタ9210上の白点特徴コード63
0の頃斜コード集積部分640内の第5図で述べたよう
に該走査方向によって定まる集積方向に対応した所定ビ
ット位置に格納される。この処理の結果は走査方向と相
対する方向の文字線煩斜コードが該白点の特徴コード上
に集積されることを意味する。つづいて制御部70より
の指令により集積コード合成部9215で作られた1語
が結線304を通してパタンメモリ61上の対応するア
ドレスに格納される。煩斜コード判定回路9211によ
る額斜情報の安定性の判定論理の一実施例を以下に示す
第3図に示したように、黒点より抽出される特徴コ‐ド
610上の鏡斜コード部620において、ビット対62
1,622、ビット対623,624、ビット対625
,626、ビット対627,628等はいずれか一方ま
たは双方のビットが「1」となることによって、それぞ
れ水平、垂直、右上り、左上りのストローク成分の存在
をあらわす。そこで上記4つのビット対のうちいずれか
1つだけ「1」なるビットが存在し、他はすべて「0」
となる銭斜コードを、文字線の煩斜情報を安定に表現し
ているものとみなす。そして、複数のビット対に「1」
なるビットが存在するときには、該コード‘こよって文
字線の鏡斜を一意に定めることは困難である為、これを
不安定な煩斜情報とみなすことにする。また、例えば右
水平方向51に走査する過程では、ビット対621,6
22のうち左水平方向52に対応するビット622のみ
「1」となる傾斜コードを不安定な情報コードとして捨
て去るなど、走査方向の情報を考慮した安定性の判定も
可能である。
第7図はその一例であって、右方向51に走査するとき
、文字パタン520の文字線上の点521における、図
的表現526によって示される額斜コード‘ま、垂直方
向に安定と判断されて集積コードレジスタ9213に転
送されるが、点522における図的表現527で示され
る煩斜コードはビット622のみ「1」となることから
上記理由により不安定とみなされ、集積コード・レジス
タに書き込まれない。このことによって、走査線延長上
の白点523では、点522近傍の突起部分の影響が除
去され左方向52の文字線情報として、文字線の3分岐
点に相当する点521近傍の情報を保存して集積するこ
とができる。以上実例を示したような榎斜情報の安定性
に関する判定にはケース・バィ・ケースで種々の方法が
可能であるが、詳細については省略する。懐斜コード判
定回路9211の動作により、集積コード・レジスタ9
213の内容は文字線上の黒点を走査する過程で次々と
更新され、白点に対しては、走査線上に位置する安定な
額斜情報をもつ黒点のうちで最も該白則こ近い点の煩斜
情報がコード化されて集積されることになる。
イニシャル・セット回路9214は制御部70の指令に
もとづき、集積コード・レジスタ9213上に予め定め
られた集積コードを書き込んで該レジスタの内容を初期
化する。
初期化の内容は、周辺文字枠からパタン領域内に走査が
開始される時′点では該走査線が初めて文字線を横切る
までの間の白点に書き込む為の集積コード655(第5
図)が、また該走査線が白点から黒V真に移る時点では
該文字線上の黒点から安定な懐斜コードが1つも抽出さ
れない場合があることの為に集積コード656(第5図
)が、それぞれ集積コードレジスタ9213に転送され
る。以上述べた処理によって、パタン領域内のすべての
白点に対応するアドレスに、該白点から上下左右方向に
走査線を延ばした時初めて横切る文字線の傾斜をコード
化して集積した特徴コード630が形成される。
第8図に一例としてその図的表現を示す。図中白点50
4には、図的表現531に示すように、上方向には右上
りの文字線、右方向には垂直の文字線がそれぞれ存在し
、さらに左方向及び下方向には文字枠まで文字線が存在
しないことを表わす特徴コードが形成される。一方、白
点505には、図的表現532に示すように、上方向及
び左方向には文字線が存在せず、下方向には右上りの文
字線が存在し、さらに右方向には文字線は存在するもの
の点505より右方向に延ばした走査線上に初めて出現
する黒V点列からは例えば黒点503に形成される煩斜
コード508(第4図)に代表されるように「不安定」
と判定される頃斜コードしか抽出されなかったことを表
わす特徴コードが形成される。白点505に形成された
特徴にみられるようにある方向についての文字線の懐き
に関して不確定集積コード(図的表現532における*
印)をもつ不確定特徴コードは、そのまま放置して識別
処理の段階で該特繊コードをdontcareとするな
どの対策も不可能ではないが、多くの漢字のように文字
パタンが複雑になるにつれてこの種の不確定特徴の出現
頻度が高まり、その結果パタンの詳細の構造を反映した
特徴の抽出が困難となるなど問題が多い。この問題は、
複数の文字線傾斜情報抽出手段の組み合せによる集積コ
ード決定法により解決可能である。第6図に示す輪郭形
状判定部922川まその一実施例をブロック図で示した
ものである。判定回路9221は入力レジスタ9210
の内容を調べることによって走査が文字線上の黒点から
白点‘こ移った時点を検出し、この時点の集積コードレ
ジス夕9213の内容を読み出す。該集積コードレジス
夕中に格納された集積コードが前記不確定集積コードで
あると判定されると、文字線輪郭追跡部9222は制御
部70に結線701を介して信号を出す。制御部70は
これを受けてパタンメモリ部6川こ現時点のパタンメモ
リレジスタを退避保存させるとともに、一時点前のアド
レス(不安定集積コードをもつ黒点に対応する)を起点
として一定範囲のパタン輪郭を追跡させ各点のアドレス
を結線305を介して逐次文字線輪郭追跡部9222に
転送する。この時、額斜判定部9223は、例えば文字
線輪郭追跡部9222により発せられる議論郭線上点の
アドレス情報の縦及び藤方向成分の変化分等により、該
輪郭線の懐斜を判定し、該判定結果を集積コード選択部
9212に与え所定の煩斜コードの集積コード・レジス
タ9213にセットする。この一連の処理が終了すると
、制御部70はパタンメモリ部60に指令を出し退避し
ていたパタンメモリレジス夕から再び走査をつづけさせ
る。第8図において図的表現532に示した下確定特徴
をもつ点505の場合について輪郭形状判定部9220
の動作の効果の一例を第9図に示す。
走査線534を右より左に走査するとき、黒V点503
を含む文字線部分の黒V点列535より抽出される特徴
は図的表現によって示すとおりいずれも不安定懐斜コー
ドをもつ為に、走査が黒点から白点に切りかわる点53
6に達した時点において、該走査方向からの集積コード
を与える集積コード・レジスタ9213上にはビット列
537に示すように上記イニシャル・セット回路921
4によって予め設定された不確定集積コード656が格
納されている。そこで輪郭形状判定部9220が動作し
、例えば文字線輪郭上の黒点列538,539を一定メ
ッシュ数追跡し、この時の水平方向のパタンメモリ上の
距離変化分540,541及び垂直方向のパタンメモI
J上の距離変化分542,543を用いるなどして、文
字線輪郭部538,539の傾斜を検出し、集積コード
レジスタ9213の内容を544に示すとおり右上り頭
斜を表わすコード653(第5図)の形に更新する。こ
れによって、走査線534上に位置する白点505には
当該コードが集積されることになり、最終的には図的表
現533によって示される特徴コードが形成される。第
10図は特徴コード変換部9300の一実施例をブロッ
ク図で示したものである。
制御部70の指令によりパタンメモリ61上の上下左右
方向の走査に凝ってパタンメモリから読み出された白点
の特徴コードは、結線306を通じて現在レジスタ93
01に格納される。テーブル検索回路9303は、該走
査線上の該白点に至る直前までの走査でパタンメモリに
最終に書き込まれた白点の特徴コードを格納している過
去レジスタ9302の内容と、前記現在レジスタ930
1の内容とから、制御部70よりの指令によって与えら
れる走査方向に対して例えば該走査方向と直交する2方
向等のように予め定められた特定方向に関する鏡斜コー
ドをそれぞれ抽出する。そして両煩斜コ−Nこよって定
まる変換処理後の該白点の額斜コード内容が格納されて
いるコード変換テーブル9304上の該当アドレスを指
定する。変換コード合成回路9305では、コード変換
テーブル9304から読み出された変換済み煩斜コード
を、該白点の特徴コード630(第5図)上のビット位
置646,647,648,649のうちで方向の対応
する1つのビット位置に格納し、残り3つのビット位置
には該特徴コード上の集積コード部640の、それぞれ
方向の対応するビット位置の内容をそのまま格納する。
変換コード合成回路9305の動作によって一部修正さ
れた現在レジス夕9301の内容は、過去レジスタ93
02に格納されるとともに結線307を通じてパタンメ
モリ上の該当するアドレスに書き込まれる。特徴コード
変換部9300の動作による効果は、コード変換テ−ブ
ル9304にあらかじめ格納されるコード変換則の定義
に依存し、ノイズ除去や大域的特徴の抽出などが可能と
なる。
第11図はコード変換処理の−実施例を第4図の文字線
パタン500上の白点509の近傍について示したもの
である。
注目白点552(第4図図示の白点509に相当すると
する)を含む走査線550上をまず53方向に、次に5
4方向に走査する場合について、簡単の為に各々の白点
551,552,553における右方向51の頃斜コー
ドの推移にのみ注目することにする。図的表現554,
555,556は特徴コード変換部9300が動作する
以前の白点551,552,553における各方向の集
積コードを表わしている。557は上方向53又は下方
向54に走査するとき、任意の白点の右方向51の集積
コードの変換テーブルの一例である。
558に示す記号の列は現在レジスタ上の対応する集積
コードの内容を、また559に示す記号の行は過去レジ
スタ上の対応する集積コードの内容を示し、テーブル上
の記号は該コード変換テーブルによって書きかえられた
集積コードの出力を表わす。
図的表現563,562,561は、走査線550上を
53方向に白点553,552,551と処理を進めた
時に、図的表現556,555,554に与えられた各
点の集積コードがコード変換された結果を示す。ここで
564,565,566は現在レジスタ、567,56
8,569は過去レジスタの、それぞれ右方向51の集
積コード格納部分の内容である。例えば点552におい
ては、図的表現555に示す特徴コードの右方向51の
集積コードを与える現在レジスタ565の内容と、1つ
前の点553において形成された過去レジスタ569の
内容とから、テーブル557を検索し新しい右方向51
の集積コードを過去レジスタ568に与えることにより
、新たに図的表現562に示す各方向の集積コードを得
る。同様に図的表現571,572,573は走査線5
50上を下方向54に白点551,552,553と処
理を進めた時に図的表現561,562,563に与え
られた各点の集積コードがさらにコード変換された結果
を示す。ここで574,575,576は現在レジスタ
、577,578,579は過去レジスタの、それぞれ
右方向51の集積コード格納部分の内容である。この結
果、557に示すようなコード変換テーブルを与えると
き、特徴コード変換部9300の動作により白点551
,552,553の特徴コード630上の変換済み集積
コード部645(第5図)にはいずれも図的表現571
,572,573に示す安定かつ大域的な図形構造を示
す集積コードが形成される。特徴点抽出部94001こ
おいて、文字パタン上の端点、屈曲点などの位相幾何的
特徴点を抽出する方法は既に幾つか知られており公知の
技術を利用することができる。
とくに前記実施例に示したように、傾斜コード抽出部9
100において、文字線上の任意の黒点から予め定めら
れた各方向別の黒点の連続数を計数し方向別距離を求め
、該方向別距離を比較することにより文字線の方向成分
を第3図図示6201こ示したようにコード化する方法
を用いた場合には、該煩斜コードをそのまま位相幾何的
特徴点の表現として用いることができ、その場合特徴点
抽出部9400は傾斜コード抽出部9100に包含する
ことができる。一例として第4図で、図的表現512な
る特徴コード507をもつ黒点502は唯一右方向にの
み文字線が一定の長さ以上連結していることを表現して
おり、このような特徴コードをもつ黒点を端点として定
義することにするようにする。背景分割線抽出部950
0の一実施例ブロック図を第12図に示す。
制御部70の指令により上下左右に走査してパタンメモ
リ61から読み出された黒点の特徴コード610及び白
点の特徴コード630は結線310を通して入力レジス
夕9501に格納される。黒点の集積コードの場合は位
相幾何的特徴点抽出部9502が動作し、該特徴コード
610(第3図)上のビット位置620に示す傾斜コー
ドの内容と、制御部70よりの指令によって与えられる
走査方向とから背景分割線の発生の有無を判定し、背景
分割線コードレジスタ9503上に該走査方向によって
定まる背景分割線コードをセットする。第13図図示の
67川ま背景分割線コードの一実施例である。ビット6
71,672,673,674はそれぞれ第3図51,
52,53,54方向の背景分割線が存在する時「1」
となり、いずれの方向の背景分割線も該白点上に存在し
ない時にはビット671,672,673,674はい
ずれも「0」とある。背景分割線発生の有無の判定では
、第3図62川こ示す黒V点の煩斜コードが、該全8ビ
ットのうち1つ又は互いに対となる方向に対応しない2
つのビットのみが「1」となる条件を満足する時に、「
1」となっている該ビットに対応する方向以外の走査方
向に背景分割線を発生せることととし、その為に背景分
割線コード670上の該走査方向に対応するビット位置
に1がセットされる。前記条件を満足しない黒V点の倭
斜コードが検出された時はビット671,672,67
3,674はすべて01こリセットされる。第13図に
は、例として文字パタン500上の黒点584,585
,586の煩斜コードを図的表現684,685.68
6によって示し、各々の黒点を起点として発生する背景
分割線を、黒V点584を起点とする851,852,
853,854及び黒点585を起点とする855,8
56さらに黒点586を起点とする857,858,8
59によって示している。入力レジスタ9501の内容
が白点の特徴コードである場合、背景分割線コード合成
部9504が動作し、入力レジスタ9501より転送さ
れた該特徴コード630(第5図)の中で背景分割線コ
ードを表わすビット位置680の内容を、背景分割線コ
ード・レジスタ9503の内容とビット対応でORをと
ることによって更新し、このデータを結線311を介し
てパタンメモリ61上の対応するアドレスに格納する。
第13図のビット表現681,682,683は白点5
81,582,583における特徴コード630上の背
景分割線コード680の内容である。例えば白点581
では黒点584,685,586からの背景分割線85
4,855,857が交叉していることが表わされてい
る。周辺閉じ状態コード抽出部9600の−実施例フロ
ック図を第14図に示す。
制御部70の指令により上下左右に走査してパタンメモ
リ61から読み出された黒点及び白点の特徴コードは結
線312を通して入力レジスタ961に格納される。黒
V点の特徴コードの場合は、イニシャルセット回路96
03が動作し、周辺閉じ状態コード・レジスタ部960
5上の走査方向に相対する方向に対応するビット位置に
「IJがセットされる。第15図図示695は周辺閉じ
状態コ−ドレジスタ部9605のレジスタの一実施例で
あり、ビット位贋696,697,698,699はそ
れぞれ方向51,52,53,54の周辺閉じ状態を表
わしており、議しジス外ま白点の特徴(第5図)630
上の周辺閉じ状態コード記述部分6901こ対応してい
る。例えば、右方向51に走査する過程で入力レジスタ
9601に黒点の特徴コードが格納された場合には、該
黒点にひきつづいて走査線上から読み出される各々の白
点に対して、左方向52が後述する意味で文字線によっ
て閉じていることを表現する為に、左方向52に対応す
るビット位置697が「1」をセットされる。入力レジ
ス夕9601の内容が白点の特徴コードである場合には
、背景分割線交叉検出部9604において、背景分割線
抽出部95001こよって求められた背景分割線コード
680を解析し、該走査線と直交する方向の背景分割線
との交叉の有無と判定する。該背景分割線が検出されな
かった時には、該特徴コード630上に集積コードを表
わすビット部分640のうちで、該走査線に直交する2
方向に対応する集積コードが、第5図に示した不確定集
積コード656以外の確定集積コードである時、コード
カウンタ部9606において、該方向に対応するコード
・カウンタ9611又は9612の内容を1加算する。
たとえば、右方向51に走査する時、上方向53の確定
集積コードの数はカウン夕9611によって、また下方
向54の確定集積コードの数はカウンタ9612によっ
て計数する。一方、背景分割線が検出された場合には、
周辺閉じ状態コード反転部9607が動作し、該背景分
割線が起点とする方向に対応するコードカウンタ961
1又は9612の内容が予め定められた閥値を越え、か
つ周辺閉じ状態コード・レジスタ部9605のレジスタ
695の内容のうち該走査方向と相対する方向に対応す
るビットが「1」となる場合に限り、該ビット内容をr
o」に変換して周辺閉じ状態コード・レジスタ部960
5内レジスタ695に格納する。コード・カウンタ96
11,9612の内容は、それぞれの対応する方向に起
点をもつ背景分割線が検出されて上記の処理が終了した
時点で、0にリセットされる。周辺閉じ状態コード合成
部9602は、周辺閉じ状態コード反転部9607にお
けるビット反転を必要ならば終了した周辺閉じ状態コー
ド・レジスタ部9605のレジスタ695の内客と、入
力レジスタ9601上の白点の特徴コード630のうち
対応するビット位置690の内容とのORをとって、該
白点の周辺閉じ状態コード記述部分690(第5図)の
内容を更新する。つづいて制御部70はこの内容を結線
313を通してパタンメモリ61上の対応するアドレス
に格納する。第16図に以上説明した周辺閉じ状態コー
ド抽出部9600の動作結果を例によって示す。
文字パタン500内の同一走査線810上にある白点8
11,812における特徴コード630のビット位置6
401こは、特徴集積部9200‘こおける処理によっ
て図的表現814,815に示す額斜コードを集積され
ている。周辺閉じ状態コード抽出部9600の動作によ
り、該白点811,812の特徴コード630上のビッ
ト位置690には、それぞれ816,817に示す周辺
閉じ状態コードが抽出される。該周辺閉じ状態コードは
、走査線810上を走査するとき背景分割線854上の
白点813の前後において右方向.51に走査する場合
には左方向52の周辺閉じ状態を表わすビット位置69
7(第15図)が、一方左方向52に走査する場合には
右方向51の周辺閉じ状態を表わすビット位置696(
第15図)が、それぞれ「1」から「0」に変化するこ
とにより抽出される。特徴集積部920川こよって求め
られる図的表現814の表わす煩斜コードと周辺閉じ状
態コード抽出部9600によって求められる周辺閉じ状
態コード816とを、それぞれ方向51,52,53,
54に対応づけて組み合わせることにより、図的表現8
25に示す特徴コードが得られる。該図的表現において
「V′」はコード816においてビット821が「0」
となることに対応し、「V」との違いは、白点811よ
り右方向51には左方向52と同様に垂直ストロークが
存在するが、該白点と該ストロークとの間には図中84
0に示す文字線分機部分の影響によって背景分割線85
4を境として右方向51に直交する上方向53、下方向
54のいずれかの方向の文字線状態が異なることを示し
ている。同様に、白点812に関して図的表現815と
コード817とを組み合わせることにより、図的表現8
35に示す特徴コードが得られる。以上説明したように
、本発明によれば、パタン構造を記述する特徴を抽出で
きて識別処理においても特豚昭51−85708号のも
のと整合性をもち、従来法では白点の周囲上下左右方向
の文字線の存在のみしか表現できなかったのに比べて、
各方向に存在する文字線の煩斜情報を集積してコード化
した特徴を各白点より抽出することができる。
このため、漢字などのように直線ストロークが多くその
方向性が明確なパタンについてはノイズに対して安定な
特徴を抽出できる利点がある。また、上記の文字線傾斜
情報を集積した特徴と、該特徴を用いて抽出される前記
周辺閉じ状態コードとを組み合わせた特徴は、文字パタ
ンの一部だけに注目した特徴抽出に利用でき、漢字など
のように幾つかの部分パタンから成るアドレスの識別に
有効な特徴として利用される。
【図面の簡単な説明】
第1図は従来のもの則ち侍鹿昭51−85708号に示
す特徴抽出を概念的に説明する説明図、第2図は本発明
の一実施例ブロック図、第3図は第2図額斜コード抽出
部によって得られる黒V点の特徴のビット構成を示す説
明図、第4図は該傾斜コード抽出部によってパタン上の
黒点に形成される額斜コードの例を示す説明図、第5図
は第2図特徴集積部、特徴コード変換部、背景分割線抽
出部、周辺閉じ状態コード抽出部によって得られる白点
の特徴コードのビット構成を示す説明図、第6図は第2
図図示の特徴集積部の一実施例ブロック図、第7図は該
特徴集積部において文字線上の安定傾斜コードを選択し
て集積する処理をパタン領域上で説明する説明図、第8
図は該特徴集積部によって得られる特徴の概念をパタン
領域上で図的に示す説明図、第9図は第5図図示の輪郭
形状判定部の処理をパタン領域について説明する説明図
、第10図は第2図図示の特徴コード変換部の一実施例
ブロック図、第1 1図は該特徴コード変換部の処理を
パタン領域について説明する説明図、第12図は第2図
図示の背景分割線抽出部の一実施例フロック図、第13
図は該背景分割線抽出部の処理をパタン領域について説
明する説明図、第14図は周辺閉じ状態コード抽出部の
一実施例ブロック図、第15図は該周辺閉じ状態コード
抽出部により得られる白点の周辺閉じ状態コードのビッ
ト構成を示す説明図、第16図は該周辺閉じ状態コード
の概念をパタン領域上で図的に示す説明図を示す。 図中、5川ま走査線、60はパタンメモリ部、61はパ
タンメモリ、70は制御部、80は識別部、90は特徴
抽出部、9100は煩斜コード抽出部、920川ま特徴
集積部、930川ま特徴コード変換部、9400は特徴
点抽出部、9500は背景分割線抽出部、9600は周
辺閉じ状態コード抽出部を表わす。 汐3図 ゲワ図 ゲー図 才2図 才4図 グ5図 汐q図 劣5図 沙8図 才′2図 オー5図 矛′○図 オー1図 オー3図 オー4図 オf6図

Claims (1)

  1. 【特許請求の範囲】 1 黒白の2値パタン1個を含むパタン領域の各点から
    予め定めた方向を見た時に見つかる位相幾何的特徴を方
    向情報を保存して各点に集積し、この結果得られる高次
    特徴を用いて識別する文字読取方式において、上記位相
    幾何的特徴として文字線の傾きを検出して当該傾きをパ
    タン面上の対応する黒点に傾斜コードとしてコード化し
    て形成する傾斜コード抽出手段と、白点に対して予め定
    められた方向に存在する文字線上の当該傾斜コードを該
    方向に対応づけて集積させて高次特徴を形成させる特徴
    集積手段と、をもつ特徴抽出部をそなえ、該特徴抽出部
    によつて、白点の周辺の文字線の存在及び傾斜情報を表
    わす特徴コードを抽出することを特徴とする特徴抽出処
    理方式。 2 ドキユメント上の文字を走査して走査信号を黒白2
    値化して出力する走査部と、1個の2値パタンを含むパ
    タン領域をその一部として格納する1メツシユあたり複
    数ビツトのM×Nメツシユのパタンメモリ部と、当該パ
    タンメモリ上に格納されているパタンを処理して位相幾
    何的特徴を表わす特徴コードを該2値パタン上の各点に
    対応する該パタンメモリ上に形成する特徴抽出部と、該
    特徴コードを処理して入力文字がどのカテゴリに属する
    かを決定する識別部と、それぞれの回路に必要なタイミ
    ング信号を発生する制御部とから構成される文字読取装
    置において、上記特徴抽出部は、黒点に傾斜コードを形
    成する傾斜コード抽出部、パタン面上を予め定められた
    方向に走査し文字線上の前記傾斜コードを選択し該傾斜
    コードを該方向に対応づけてパタンメモリ上の白点の集
    積させて新たな高次特徴を形成させる特徴集積部とから
    構成され、上記識別部は白点上の当該高次特徴をも用い
    て総合判断しドキユメント上の文字を識別することを特
    徴とする特許請求の範囲第1項記載の特徴抽出処理方式
    。 3 文字線の傾きを表現する前記傾斜コードの抽出は、
    予め定められた幾つかの方向について文字線上の黒点の
    連りの長さを求め、該方向別にその大きさを比較するこ
    とにより文字線の傾きを検出する手段と、文字パタンの
    文字線部と背景白部との輪郭線を追跡することによりそ
    の傾きを検出する手段とを設け、前記2つの手段により
    検出される文字線の傾き情報とを組み合せて判定し傾斜
    コードを決定することを特徴とする特許請求の範囲第1
    項記載の特徴抽出処理方式。 4 白点上の前記高次特徴を該白点から予め定められた
    方向にある近傍白点上の高次特徴と比較して、必要なら
    ば該高次特徴の一部に集積された傾斜コードを予め定め
    られた規則に従つてコード変換を行なう手段を設け、当
    該コード変換された新たなる特徴を高次特徴として抽出
    することを特徴とする特許請求の範囲第1項記載の特徴
    抽出処理方式。 5 文字線上の位相幾何的特徴として端点・分岐点・屈
    曲点等の特徴点を抽出し対応する黒点にコード化して形
    成する手段と、黒点上の当該特徴点を起点として該特徴
    点の種別に応じて予め定められた方向に背景白部を分割
    する背景分割線を伸ばし該背景分割線上に位置する白点
    に該背景分割線の方向を表わすコードを形成する手段と
    、文字線或いは該背景分割線によつて区切られた背景白
    部の領域を1つの単位領域とみなして、当該領域から予
    め定められた方向に存在する単位領域内白点の高次特徴
    の種別、及び当該方向に存在する背景分割線の方向と個
    数とから求められ該単位領域周囲の閉じ状態を表わす特
    徴を当該領域内の白点にコードとして形成する手段とを
    設け、白点上に周囲の文字線の不連続性を反映した位相
    幾何的特徴を表わす特徴コードを形成することを特徴と
    する特許請求の範囲第1項記載の特徴抽出処理方式。
JP55012208A 1980-02-04 1980-02-04 特徴抽出処理方式 Expired JPS6037954B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP55012208A JPS6037954B2 (ja) 1980-02-04 1980-02-04 特徴抽出処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP55012208A JPS6037954B2 (ja) 1980-02-04 1980-02-04 特徴抽出処理方式

Publications (2)

Publication Number Publication Date
JPS56110188A JPS56110188A (en) 1981-09-01
JPS6037954B2 true JPS6037954B2 (ja) 1985-08-29

Family

ID=11798961

Family Applications (1)

Application Number Title Priority Date Filing Date
JP55012208A Expired JPS6037954B2 (ja) 1980-02-04 1980-02-04 特徴抽出処理方式

Country Status (1)

Country Link
JP (1) JPS6037954B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3018891U (ja) * 1995-05-31 1995-11-28 有限会社オフィスキャット 携帯用電気機器のホルダー

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0643979U (ja) * 1992-11-17 1994-06-10 エスエムケイ株式会社 ロータリーエンコーダ

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3018891U (ja) * 1995-05-31 1995-11-28 有限会社オフィスキャット 携帯用電気機器のホルダー

Also Published As

Publication number Publication date
JPS56110188A (en) 1981-09-01

Similar Documents

Publication Publication Date Title
JP3302147B2 (ja) 文書画像処理方法
US4408342A (en) Method for recognizing a machine encoded character
KR19990062829A (ko) 문자열 추출 장치 및 패턴 추출 장치
JP6220770B2 (ja) 帳票定義装置、帳票定義方法、及び帳票定義プログラム
CN115439866B (zh) 一种针对三线表的表格结构识别的方法、设备和存储介质
US6947596B2 (en) Character recognition method, program and recording medium
JPS6037954B2 (ja) 特徴抽出処理方式
US5228097A (en) Method for registering image data
CN119445600A (zh) 图像中表格的识别方法、装置、计算机设备和可读存储介质
JPH0516632B2 (ja)
JPH03177982A (ja) 画像処理方法
JP4282467B2 (ja) 像域分離方法
KR100332752B1 (ko) 문자인식방법
JPS62134767A (ja) 記号名・線分名の自動抽出装置
JP2009259291A (ja) 文字認識方法,プログラム及び記録媒体
JPH10198761A (ja) 文字認識方法および文字認識装置
JPS6047636B2 (ja) 特徴抽出処理方式
JPH0736433A (ja) 文字データベース作成装置
JPH0253829B2 (ja)
JPH0113583B2 (ja)
JP2004334913A (ja) 帳票認識装置及び帳票認識方法
JPS5811662B2 (ja) 文字図形認識方式
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JPH08212292A (ja) 枠線認識装置
JPH11203406A (ja) 文字切り出し方法、文字認識方法、文字認識装置および記録媒体