JPH01189785A - 特徴抽出方法及び特徴抽出装置 - Google Patents

特徴抽出方法及び特徴抽出装置

Info

Publication number
JPH01189785A
JPH01189785A JP63014222A JP1422288A JPH01189785A JP H01189785 A JPH01189785 A JP H01189785A JP 63014222 A JP63014222 A JP 63014222A JP 1422288 A JP1422288 A JP 1422288A JP H01189785 A JPH01189785 A JP H01189785A
Authority
JP
Japan
Prior art keywords
value
coordinates
coordinate
feature
maximum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63014222A
Other languages
English (en)
Other versions
JPH0821060B2 (ja
Inventor
Koichi Higuchi
浩一 樋口
Yoshiyuki Yamashita
山下 義征
Koji Ito
伊東 晃治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP63014222A priority Critical patent/JPH0821060B2/ja
Publication of JPH01189785A publication Critical patent/JPH01189785A/ja
Publication of JPH0821060B2 publication Critical patent/JPH0821060B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は、文字図形の特徴抽出を簡単な手順でしかも
高速に行なうための方法及び装置に関する。
(従来の技術) 従来、文字図形認識装置において一般に行なわれる特徴
抽出ては、文字図形パタンがらストロークを抽出し、そ
れら抽出されたストロークの位置、長さ、ストローク間
の相互関係等を用いて認識する方法が広く採用されでい
る。その手法は、(1)文字図形の輪郭を追跡すること
により検出された輪郭点系列についで曲率を計算し、そ
の曲率の大きな値の点を分割点として輪郭系列を分割し
、分割された系列を組合せることによりストローク(パ
タンの線素)を抽出するか、(2)文字図形パタンに細
線化処理を行なって骨格化し、その骨格化パタンの連結
性及び骨格パタンを追跡して急激な角度の変化点等を検
出してストロークについて幾何学的な特徴等を抽出して
識別を行なっていた。
また、認識対象となる文字の数が少ない場合例えば数字
の認識を行なう場合の方法として、例えば文献■「電子
計算機入力のための文字・図形の自動認識(電気学会編
)」に開示される■マトリウスマツチング法、■ストロ
ーク・アナリシス法及び■幾何学的特徴抽出法かある。
(発明か解決しようとする課題) しかしなから、上述した従来の一般的手法である(1)
の方法は文字パタンか大きくなり、又、文字図形パタン
か複雑化すると、その処理量が増大し処理速度の低下を
招いていた。又、(2)の方法は文字図形パタンを細線
化する必要があり、細線化によるパタンの歪、ヒゲの発
生等の問題があり、歪の修正、ヒゲの除去等その後の処
理を複雑なものとしていた。処理か複雑となる結果、装
置構成の規模か大きくなり、また高速な処理か行なえな
いという問題点があった。
また、文献■に掲げられる■の方法は数字のように1O
f!程度の文字を認識する場合には処理手順が簡単とな
るという利点があるが、印字のじみや欠けなどの雑音に
弱く従って印字品質に影響され易く、さらに印字ずれ、
読取り時の位置決め精度が悪いために生じる文字パタン
の傾き(傾斜)や位置ずれに影響され易いという問題点
があった。
ざらに■及び■の方法は、文字図形パタンがらストロー
クを抽出する必要があるので、上述した(1)及び(2
)の方法と同様の問題が生じ、従って装置規模が大きく
、また高速な処理が行なえないという問題点があった。
この出願の目的は、上述した従来の問題点を解決するた
め、入力文字図形パタンがらストロークを抽出する等の
複雑な処理手順を省略し簡単な処理手順で従って高速に
特徴抽出が行なえ、しかも安定した特徴抽出が行なえる
方法及び装置を桿供することにある。
(課題を解決するための手段) この目的の達成を図るため、この出願の特徴抽出方法は
、 特徴抽出対象となる被抽出パタンを含む量子化画像テー
クの画素にX座標及びX座標を付与し、 ×、X座標と少なくとも2組の特定のα値及びβ値とを
用いて所定の画素値を有する被抽出パタンの画素に関す
る最大及び最小の計算値αX+βYi検出し、これら最
大及び最小計算値を与える前記被抽出パタンの画素のX
、X座標を特徴点座標とし、 この特徴点座標に基づき幾何学的特徴1を算出すること
によって被抽出パタンの特徴抽出を行なうことを特徴と
する。
ざらに、この出願の装置発明は、 特徴抽出対象となる被抽出パタンを含む量子化画像デー
タの画素にX座標を付与するためのX座標発生手段と、 前記量子化画像データの画素にX座標を付与するための
X座標発生手段と、 X、X座標と少なくとも2組の特定のα値及びβ値とを
用いて所定の画素値を有する被抽出パタンの画素に関す
る最大及び最小の計算値αX+βYを検出し、これら最
大及び最小計算値を与える被抽出パタンの画素のX、Y
座標をそれぞれ特徴点座標として出力するための座標検
出手段と、被抽出パタンの特徴抽出を行なうための幾何
学的特徴量を特徴点座標に基づき算出する特徴量算出手
段とを備える。
この装置発明の実施に当り、座標検出手段は、計算値α
X+βYを算出する計算手段と、最大計算値を検出する
ための最大値検出手段と、最大計算値を与える画素のX
、Y座標を保存するための最大値座標保存手段と、最小
計算値を検出するための最小値検出手段と、最小計算値
を与える画素のX、Y座標を保存するための最小値座標
保存手段とを備えた構成とするのか好適である。
(作用) 上述した方法及び装置発明によれば、量子化画像データ
の画素にX、Y座標を付与して画像データ%X−Y座標
系て表現し、所定の画素値を有する被抽出パタンの画素
に関する最大及び最小の計算値αX+βYを検出し、検
出した最大及び最小計算値を与える画素の座標をそれぞ
れ特徴点座標とする。そして、特徴点座標に基づき被抽
出パタンの幾何学的特徴量を算出する。
このようにして特徴量を算出する上述の処理手順におい
ては、最大及び最小計算値を検出する手順か非常に簡単
な手順であるので、装置構成の簡素化を図れる。
また上述の処理手順は簡単であるので特徴量の算出を高
速に行なえる。
(実施例) 以下、図面を参照して、この出願の方法発明及び装置発
明の実施例につき説明する。尚、図面はこれら発明が理
解出来る程度;こ概略的に示しであるにすぎず、従って
各構成成分の構成、データ、データの流れ及び数値的条
件は必ずしも図示例に限定されるものではない。
夫施刊 く装置発明の実施例の構成〉 第1図は装置発明の実施例の構成の説明に供する機能ブ
ロック図である。
同図において、Mは特徴抽出対象となる被抽出パタンを
含む量子化画像データを示す。この実施例の特徴抽出対
象は、特徴抽出に適した一単位の画像データMを出力す
る読取処理部8と、画像データMの画素にX座標を付与
するためのX座標発生手段10と、画像データMの画素
にY座標、を付与するためのY座標発生手段12と、前
記×、Y座標と少なくとも2組の特定のα値及びβ値と
を用いて被抽出パタンの画素に関する最大及び最小の計
算値αX+βYu検出し、これら最大及び最小計算値を
与える被抽出パタンの画素のX、Y座標をそれぞれ特徴
点座標として出力するための座標検出手段14.16と
、被抽出パタンの特徴抽出を行なうための幾何学的特徴
量を特徴点座標に基づき算出する特徴量算出手段18と
を備えている。
読取処理部8の構成は、特徴抽出に適したー単位の被抽
出パタンを含む画像データMを出力するのであれば、ど
のような構成としても良い。この実施例では読取処理部
8を、図示せずも、光電変換部及び走査機構(スキャナ
)を備える読取部と、原画像データを格納する画像メモ
リと、帳票、原稿等に記載された文字図形パタンの記載
位置情報に基づき通常行なわれる如く原画像データから
画像データMu切出す切出部とを以って構成している。
また、座標検出手段14は、計算値αX+βYを算出す
る計算手段141と、最大計算値を検出するための最大
値検出手段142と、最大計算値を与える画素のX、Y
座標を保存するための最大値座標保存手段143と、最
小計算値を検出するための最小値検出手段144と、最
小計算値を与える画素のX、Y座標を保存するための最
小値座標保存手段145とを備えている。座標検出手段
16もまたこの座標検出手段14と同様、計算手段16
1と最大値検出手段162と最大値座標保存手段163
と最小値検出手段164と最小値座標保存手段165と
を備えている。
この実施例では、特徴点座標検出のために例えば(α−
β−1)及び(α=1、β−−1)の二組のα及びβ値
を用いるので2個の座標検出手段14.16を備える構
成となっている。座標検出手段14にあっては計算値X
十Yに関する、及び座標検出手段16(こあっては計算
値]−Yに関する、最大及び最小計算値を与える画素の
座標を検出する。
座標検出手段14.16の構成については、例えば、計
算手段141ヲ加算回路を以って、計算手段161は減
算回路を以って、検出手段142.144.162.1
64ヲそれぞれ比較器及びレジスタを以って、ざらに座
標保存手段143.145.163.165をそれぞれ
レジスタを以って構成することが出来る。このような構
成によれば装置構成を非常に簡単化することか出来、従
ってハードウェア規模を小さく出来る。
また、座標発生手段10.12は座標検出手段14.1
6に関し共通に用いるように成しであり、従って各座標
検出手段14.16は座標発生手段10.12から出力
される×、Y座標をそれぞれ入力して特徴点座標の検出
を行なう。
尚、座標検出手段の配設個数は特徴量算出のために何組
のα及びβ値ヲ用いるかによって任意好適(こ変更する
ことが出来、例えばn組のα及びβ値を用いる場合、n
個の座標検出手段を備えた構成としα及び又はβ値を座
標検出手段毎に異なる任意好適な値に設定すれば良い。
また、X座標発生手段及びY座標発生手段は、各座標検
出手段に関して共通して用いても良いし、或は各座標検
出手段毎に個別に設けるようにしても良い。装置構成を
簡素化するため、X及びY座標発生手段を共通に用いる
のが良い。
また、読取処理部の構成は、上述の実施例のものに限定
されない。例えば、帳票等に特徴抽出−単位分の文字図
形しか記載されない場合(例えば文字か1文字しか書か
れない場合)に、上述した実施例において画像メモリ及
び切出部を省略した構成としても良い。この場合、帳票
等の読取領域を全面走査して読取処理部から出力される
画像データを、特徴抽出−単位の被抽出パタンを含む画
像データとして用いれば良い。或は読取処理部を、帳票
等に記載された文字図形の記載位置情報に基づき特徴抽
出−単位分の領域のみを走査するように動作する走査機
構と、光電変換部とからのみ構成するようにしても良い
。この場合、読取領域を部分的に走査して読取処理部か
ら出力される原画像データを、特徴抽出−単位の被抽出
パタンを含む画像データとして用いれば良い。
また、図中の符号24は後述する文字認識装置の特徴抽
出部に相当する部分である。
く画像データ〉 第2図は被抽出パタンを含む量子化画像データの一例を
示す図である。
同図において、Mlは被抽出パタン及びM2は被抽出パ
タンの背景となる背景パタンを示し、これらパタンM1
及びM2から成る量子化画像データMか読取処理部8か
ら出力される。この実施例のパタンMl、M2は、2値
のディジタル信号で表現されでおり、被抽出パタンMl
i画素値「1」の黒ビット及び背景パタンM2を画素値
「0」の白ビットとしている。
画像データMの画素は、主走査方向(水平右向き方向)
(こX軸及び副走査方向(垂直下向き方向)にY軸を取
り、左上角の画素を原点とする×−Y座標系で表現され
、後述するように、画像データMの画素に対しX、Y座
標か付与される。
座標検出手段14.16に入力される画像データMは、
特徴抽出対象である文字−単位或は図形−単位の被抽出
パタンM2u含んだデータとなっている。
尚、第2図に示す被抽出パタンM1は、数字の「4」を
示す文字パタン(文字線)であり、この実施例では、特
徴抽出対象の一例として213Bフオントの数文字を用
いる。参考のため第3図に213Bフオントの「1」〜
「9」、「0」の字形を示した。
〈方法発明の詳細な説明、 及び装置発明の実施例の動作の説明〉 第4図(A)〜(B)は方法発明の実施例及び装置発明
の実施例の動作の説明に供する図である。
被抽出パタンに関する最大計算値及び最小計算値を検出
する方法としては、例えば次の■或は■の方法が考えら
れる。■計算手段141及び161においで画像データ
Mの全画素につき計算値を算出し、検出手段142.1
44及び162.164において手段141.161か
ら入力された計算値か被抽出パタンの画素値を有する画
素のものであるか否かを判断し被抽出パタンの画素の計
算値についでのみ比較判定を行なうことによって、被抽
出パタンの画素に関する最小及び最大計算値を検出する
、■計算手段141及び161においで入力された画素
のX、 Y座標か被抽出パタンの画素値を有する画素の
ものであるか否かを判断し被抽出パタンの画素について
のみX、Y座標から計算値を算出し、検出手段142.
144及び162.164において手段141.161
から入力された全ての計算値の比較判定を行なうことに
よって被抽出パタンの画素に関する最小及び最大計算値
を検出する。方法としては前記■及び■のいずれても良
いか、以下に述へる実施例では前記■の方法によって検
出を行なう。
■、座標検出手段14に着目した説明 *ステップ(1)〜(3) 読取処理部8の読取部か文字図形の記されている帳票の
読取り領域の走査を開始すると(ステップ(1))、帳
票上の文字図形パタンの光信号Gか読取処理部8の光電
変換部に入力される。光電変換部は入力された光信号G
を2値の量子化されたディジタル信号に変換し、このデ
ィジタル信号から成る原画像データを出力する。そして
、読取処理部8の切出部によって、特徴抽出−単位の画
像データMが原画像データから切出され出力される。こ
の画像データMは画素毎に最大値検出手段142及び最
小値検出手段144に入力される。
これと共に、X座標発生手段10及びY座標発生手段1
2は、画像データMの出力と同期させてこのデータMの
それぞれの画素毎に対応付けたX、 Y座標を発生する
。その結果、これら発生手段10.12によって画像デ
ータMにX、Y座標の付与が行なわれる。そして出力さ
れたX、Y座標は計算手段141、最大値座標保存手段
143及び最小値座標保存手段145に入力される。(
ステップ(2))計算手段141はX、Y座標を入力す
るとこれらX、Y座標から計算値X+Yを算出し、算出
した計算値を最大値検出手段142及び最小値検出手段
144に対し出力する。(ステップ(3))ステップ(
2)〜(3)によって、最大値検出手段142は画像デ
ータM及び計算値を、最小値検出手段144は画像デー
タM及び計算値を、最大値座標保存手段143はX、Y
座標を、最小値座標保存手段145はX、Y座標を、そ
れぞれ1画素毎に入力する。そして、座標検出生殺14
は後述のステップ(4)、(5a)、(5b)或は(7
)の判断を1画素毎に繰り返し行ない、その判断結果に
応した動作を行なう。
*ステップ(4) 最大値検出手段142及び最小値検出手段144は入力
された画像データMの画素が被抽出パタンM2の画素で
あるか否かを判断する。この判断は、入力された画素の
画素値か被抽出パタンM2を意味する所定の画素値(こ
の実施例では画素値「1」)であるか否かを判断するこ
とによって、行なう。
■所定の画素値を有さないとき 最大値検出手段142及び最小値検出手段144は格納
しでいる比較値を書換えず、これと共に最大値座標保存
手段143及び最小値座標保存手段145は格納されて
いるX、Y座標を書換えない。
検出手段142.144はステップ(4)の次にステッ
プ(7)の判断を行なう。
■所定の画素値を有するとき 最大値検出手段142はステップ(4)の次に比較値及
び計算値の比較(ステップ(5))を及び、最小値検出
手段144はステップ(4)の次に比較値及び計算値の
比較(ステップ(5b) ) u行なう。
*ステップ(5a) ■計算値か比較値よりも大きいとき 最大値検出手段142は先に格納されている比較値に換
えて、比較値よりも大きい計算値を新たな比較値として
格納しく比較値の書換え)、これと共にセットパルスを
最大値座標保存手段143に対し出力する。セットパル
スを入力した最大値座標保存手段143は格納されてい
るX、Y座標に換えて、比較値よりも大きな計算値を与
える画素のX、Y座標を新たに格納する(X、Y座標の
書換え)。(ステップ(6)) ■計算値か比較値よりも小さいか或は比較値と等しいと
き 最大値検出手段142は先に格納されている比較値を書
換えずにそのまま格納すると共に、最大値座標保存手段
122は格納されているX、Y座標を書換えない。
最大値検出手段142は■及び■のいずれの場合もステ
ップ(5a)の次にステップ(7)の判断を行なう。
尚、最大Ja検出手段142に格納される比較値の初期
値としては、例えば計算値αとして取り得る値よりも小
さな値を用いれば良い。例えばα−8−]であり画像デ
ータMをρ行m列の画素に分割した(従ってO≦X≦m
−1、及びO≦Y≦p−1となる)場合には、例えば−
1を比較値の初期値とすることか出来る。或は比較値の
初期値として最大値検出手段142に一番最初に入力さ
れた計算値αX+βYW用いるようにしても良い。
また最大値検出手段142が比較値及びX、Y座標の書
換えを計算値αX+βYが比較値よりも大きいとき及び
計算値か比較値と等しいときに行なうようにし、これと
共に計算値が比較値よりも小さいとき比較値及び×、Y
座標の書換えを行なわないようにしても良い。
また最大値座標保存手段143の×、Y座標としては任
意好適な数値を用いで良い。
*ステップ(5b) ■計算値が比較値よりも小さいとき 最小値検出手段144は先(こ格納されている比較値に
換えて比較値よりも小さい計算値を比較値として新たに
格納する(比較値の書換え)と共に、最小値座標保存手
段145に対しセットパルスを出力する。最小値座標保
存手段145はセ・ントバルスを入力すると、格納され
ているX、Y座標を比較値よりも小さな計算値を与える
画素のX、 Y座標に書換える(X、Y座標の書換え)
。(ステップ(6)) 最小値検出手段144(よ■及び■のいずれの場合にも
ステップ(5b)の次にステップ(7)の判断を行なう
尚、最小値検出手段144に格納される比較値の初期値
としては、例えば計算値αX+BYとして取り得る値よ
りも大きな値を用いれば良い。例えばα−B−1であり
画像データMをβ行m列の画素に分割した(従ってO≦
X≦m−1、及びO≦Y≦β−1となる)場合には、例
えばm+n−1を比較値の初期値とすることが出来る。
或は比較値の初期値として最小値検出手段144に一番
最初に入力された計算値αX+βYを用いるようにして
も良い。
また最小値検出手段144は計算値か比較値よりも小さ
いとき及び計算値か比較値と等しいとき比較値及びX、
Y座標の書換えを行ない、これと共に計算値か比較値よ
りも大きいとき比較値及びX、Y座標の書換えを行なわ
ないようにしても良い。
また最小値座標保存手段145のX、Y座標としては任
意好適な数値を用いて良い。
*ステップ(7) ■画像データMの走査を終了したとき 最大値検出手段142及び最小値座標保存手段144は
画像データMの走査が終了しデータMの全ての画素につ
き処理か終了すると、X、Y座標の出力信号を最大値座
標保存手段143及び最小値座標保存手段145に対し
て出力する。この出力信号を入力した座標保存手段14
3.145は、格納している×、Y座標を特徴点座標と
して出力する。これと共に検出手段142.144は比
較値の初期化を行なう6 (ステップ(8)) 全ての画素につき処理を終了した時点で、最大値座標保
存手段143及び最小値座標保存手段145に格納され
ている×、Y座標か最大及び最小計算値を与える画素の
X、Y座標すなわち特徴点座標となる。
座標検出手段14にあってはα=8−1としたので、全
処理終了時点で例えば第2図に示す被抽出パタンM2の
特徴点BRの座標が最大値座標保存手段143に格納さ
れており、また特徴点TLの座標が最小値座標保存手段
145に格納されている。
■画像データMの走査が終了しないとき座標検出手段1
4は、画像データMの走査が終了せず従ってデータMの
全ての画素につき処理が終了しでいなければ、画像デー
タMの残りの画素につきステップ(4)、(5a)、(
5b)或は(7)の判断を行ない、その判断結果に応し
で動作する。
■I:座標検出手段16に着目した説明座標検出手段1
6は、上述した座標検出手段14の動作と並行して座標
検出手段14と同様の動作を行なうので、この検出手段
16の動作説明を省略する。
座標検出手段16にあっては、α−1及びβ==1とし
たので、全ての画素につき処理を終了した時点で、例え
ば第2図(こ示す被抽出パタンM2の特徴点TRの座標
が最大値座標保存手段163に格納されており、また特
徴点B[の座標か最小値座標保存手段165に格納され
ている。
■・特徴量算出手段18に着目した説明特徴量算出手段
18は、特徴点8日、TL、TR,BLの座標を読出し
、−これら特徴点座標に基づき幾何学的特徴量DT、D
B、DR,DLを算出する。これら特徴量はそれぞれ特
徴点間の距離を表すものであり、式(1)〜(4)に従
って算出することか出来る。尚、式(1)〜(4)にお
いて特徴点8日、TL、TR,BLのX座標を8RX、
 TLX、 TRX、 BLXとして及びY座標をBR
V’、几YXTRY8叶Yとしてそれぞれ表す。
DT=、巨1罰C〒i了丁「で百Y−TLY)’  ・
・・式(1)特徴量算出手段18は上式(1)〜(4)
に従って特徴量を算出すると、算出した特徴量DT、D
B、DR,DLを出力する。
■:特徴点座標検出の原理的説明 第5図は特徴点座標検出の原理的説明に供する図である
。以下、第5図を参照して説明するが、この説明では、
特徴抽出対象となる被抽出パタンM2を矩形パタンとす
る。この場合、特徴点は被抽出パタンM2の角点TL、
TR,BL、SRとなる。
特徴点座標検出のため、ます、画像データM上(こおい
て被抽出パタンM2G通過する直線αX+βYを想定し
、傾きか一定値に固定されCの値が種々の値となる直線
群α×+βY=Cを考える。
すると、被抽出パタンM2@A過する直線を見出すこと
が出来、このとき特徴点となる角点を通過する直線のC
の値は直線群中、最小の値或は最大の値となる。
従って、被抽出パタンM2の各画素につきCの1直すな
わち計算値αX+βYを算出し、計算値αX+BYか最
大成は最小となる画素のX、Y座標を特徴点の座標とす
れば良いことが理解出来る。
矩形パタンの場合であれば、−組の特定のα及びβ値を
用いること(こよって2つの角点(特徴点)を検出する
ことか出来る。
例えばα−β−1として被抽出パタンM2の領域を通過
する直線群L : X+Y=CIを考え、C1の値をよ
り小さくしてゆくと特徴点下りを通過する直線し、が得
られることか理解出来る。またC1の値か最小となると
き特徴点T[を通過する直線し、か得らえる。またC4
の値をより大きくしてゆくと特徴点BRにより近い直線
か得られC1の値か最大となるとき特徴点SRを通過す
る直線Lnが得られる。従って、被抽出パタンM2の画
素のなかで計算値X十Yの最小値を与える画素の座標が
特徴点Tしの及び最大値を与える画素の座標が特徴点B
Rの座標となることか理解出来る。
同様にして、例えばα−1及びβ=−1として被抽出パ
タンM2の領域を通過する直線群に:XY ” C2を
考えると、C2の値が最小となるとき特徴点BLを通過
する直線に□が及びC2の値が最大となるとき特徴点T
Rを通過する直線K。
か得られる。従って、被抽出パタンM2の画素のなかで
計算値X−Yの最小値を与える画素の座標が特徴点BL
の及び最大値を与える画素の座標が特徴点1日の座標と
なる。
〈文字認識装置〉 次に、この出願の方法発明及び装置発明の理解を深める
ため、上述した方法及び装置発明の実施例を文字認識装
置に適用した例につき説明する。
第6図は文字認識装置の一構成例を示す機能ブロック図
である。同図に示す文字認識装置は、読取部20と、画
像メモリ21と、切出部22と、被抽出パタンに関する
幾何学的特徴量を出力する特徴抽出部24と(第1図参
照)、標準パタンに関する幾何字的特微量を収める辞N
26と、標準パタン及び被抽出パタンに関する幾何学的
特徴量に基づき認識結果を出力する識別部28とを備え
た構成を有する。この文字認識装置の読取部20は光電
変換部20a及び走査機構(図示せす)を備えている。
このような構成の文字認識装置にあっては、読取部20
が、帳票等を走査しで得られる光信号Gを量子化された
ディジタル信号に変換し、このディジタル信号から成る
原画像データを出力する。
出力された原画像データは画像メモリ21に格納され、
切出部22は帳票上の文字の記載位置の情報に基づき画
像メモリ21の原画像データから画像データMを切り出
し、この切出した画像データMを1画素毎に特徴抽出部
24に対し出力する。特徴抽出部24は画像データMを
入力すると、既に説明したようにして、被抽出パタンの
幾何学的特徴量DT、DB、DR,DLを算出しこれら
特徴量を識別部28に対し出力する。
ところで、辞書26は予め用意された標準パタンの標準
時微量JT、JB、JR及びJLを格納している。これ
ら幾何学的特徴量JT、JB、JR,JLは、被抽出パ
タンの特徴量と同様、検出された特徴点の間の距Mを表
すものであり、JTはDTに、JBはDBに、JRはD
Rに及びJLはDLに対応する特徴量である。
識別部28は、特徴抽出部28からの特徴量DT、DB
、DB、DLと辞書26の特徴量JT、JB、JR,J
Lとを照合する。この照合のため、認識部28は次式(
5)に基づき距離りを算出し、距離りが最も小さくなる
標準時微量を検出する。そして、最も小さな距離りを与
える標準時微量を有する標準パタンの文字名を、文字名
出力(認識結果)として出力する。
D −(DT−JT)2+ (DO−JB)2+ (D
R−JR)2+ (DL−JL)2・・・ (5) 尚、上述の装置においで、文字の標準パタンに関する標
準時微量に換えて或は加えて図形の標準パタンに関する
標準時微量を辞書26に格納すれば、図形認識装置或は
文字図形認識装置を構成することが出来る。文字及び図
形の標準パタンのための辞書はそれぞれ個別の辞書とし
ても良いし或は共通の1個の辞書としても良い。この出
願の方法及び装置発明は従来提案されている種々の文字
及び又は図形認識装置に適用及び応用することが出来る
この出願の方法発明及び装置発明は上述した実施例にの
み限定されるものではなく、任意好適に変更或は変形す
ることが出来る。
例えば、特徴抽出のための画像データMとして2値に処
理されたデータのみならす、多値処理されたデータを用
いても良い。多値処理された画像データから特定色の文
字図形パタンの特徴抽出や特定範囲の濃度を有する文字
図形パタンの特徴抽出を行なうことか出来る。特定色の
文字図形パタンの場合(こは、特定の色を有する画素で
あることを意味する画素値の画素に着目し、この画素に
閉する最大及び最小計算値を求めることによって、特徴
点座標を検出出来る。また特定範囲の濃度を有する文字
図形パタンの場合には、特定濃度範囲の画素値を有する
画素に着目して、この画素に関する最大及び最小計算値
を求めることによって、特徴点座標を検出することが出
来る。
また上述した実施例では、2組のα及びβを用い従って
傾きが異なる2つの直線群り、Kを用いて特徴点座標を
検出した場合につき説明したが、例えばほぼ多角形形状
(はぼn角形形状)の図形パタンに関する特徴点座標を
検出する場合など、3組以上のα及びβを用い従って傾
きが異なる3つ以上の直線群を用いて特徴点座標の検出
を行なうようにしても良い。この場合、それぞれの組の
α及びβ値に関し上述と同様の原理に従って最大及び最
小計算(aを求め、これら最大及び最小計算値を与える
画素の座標から文字図形パタンの幾何学的特徴量を求め
ることが出来る。この場合の装置構成は、座標検出手段
の配設個数を、特徴点座標検出のために用いるα及びβ
値の組の個数と同数とする他は、上述した実施例と同様
の構成とすれば良い。
また幾何学的特徴量として、検出された特徴点の座標を
もとにして得られる種々の幾何学的特徴量を用いること
が出来る。上述した特徴点間の距離以外の幾何学的特徴
量を例示すれば、例えば、特長点を結ぶ直線の傾きや、
特長点を結んで得られる三角形、四角形等の多角形領域
の面積その他を挙げることが出来る。そして、これら種
々の幾何字的特微量を単独で或は種々に組み合せて文字
パクンや図形パタンの認識のために用いることが出来る
また所定の画素@を有する画素に関する最大及び最小計
算値を算出するための手順(アルゴリズム)は上述した
実施例にのみ限定されず、最大及び最小値を求めるため
に従来より用いられている任意好適な手順を用いても良
い。
またこの出願の方法及び装置発明は、特に字形の簡単な
文字例えばE13Bフォントの数字を認識対象とする文
字認識装置に適用して好適であり、この場合に小型で処
理速度の速い文字認識袋Mを実現することが出来る。ま
た、これら方法及び装置発明は文字認識装置、図形認識
装置その他の画像処理装置に広く適用して良い。
(発明の効果) 上述した説明からも明らかなように、この出願の特徴抽
出方法及び特徴抽出装置によれば、量子化画像データの
画素に×、Y座標を付与して画像データをX−Y座標系
で表現し、所定の画素値を有する被抽出パタンの画素(
こ開する最大及び最小の計算値αX+βYを検出し、こ
れら最大及び最小計算値を与える画素の座標をそれぞれ
特徴点座標とする。そして、特徴点座標に基づき被抽出
パタンの幾何学的特徴量を算出する。
このようにして特徴量を算出する上述の処理手順にあっ
ては、最大及び最小計算値を検出する手順か非常に簡単
な手順であるので、装置構成の簡素化を図れ、ハードウ
ェアの規模縮小化を実現出来るという利点がある。
また最大及び最小計算値を検出する処理手順は簡単であ
るので特徴量の算出を高速に行なえるという利点かある
。特に読取処理部が画像メモリを有する場合(こは、特
徴点座標を画像メモリの一回の走査で検出することが出
来るので、高速化を効果的に図れる。
また最大及び最小計算値を与える画素の座標を特徴点座
標とするので、従来のマトリクス・マツチング法と比較
して帳票、原稿等の傾きや、被抽出パタンの欠けに影響
されにくい安定した特徴量を得られるという利点がある
【図面の簡単な説明】
第1図は装置発明の詳細な説明に供する機能ブロック図
、 第2図は特徴抽出のために用いる量子化画像データの一
例を示す図、 第3図は特徴抽出対象となる文字パタンの一例を示す図
、 第4図(A)〜(B)は方法発明及び装置発明の詳細な
説明に供する動作流れ図、 第5図は特徴点座標検出の原理的説明に供する図、 第6図は方法発明及び装置発明の実施例を適用例として
示す文字認識装置の機能ブロック図である。 8・・・読取処理部、  10・・・X座標発生手段1
2・・・Y座標発生手段、14.16・・・座標検出手
段141.161・・・計算手段 142.162・・・最大値検出手段 143.163・・・最大値座標保存手段144.16
4・・・最小値検出手段 145.165・・・最小値座標保存手段18・・・特
徴量算出手段。 特許出願人   沖電気工業株式会社 量子化画像データの一例 第2図 特徴抽出対象の一例 第3図 方法発明及び装置発明の説明図 第4図 方法発明及び装置発明の説明図 第4図

Claims (3)

    【特許請求の範囲】
  1. (1)特徴抽出対象となる被抽出パタンを含む量子化画
    像データの画素にX座標及びY座標を付与し、 前記X、Y座標と少なくとも2組の特定のα値及びβ値
    とを用いて所定の画素値を有する前記被抽出パタンの画
    素に関する最大及び最小の計算値αX+βYを検出し、
    これら最大及び最小計算値を与える前記被抽出パタンの
    画素のX、Y座標を特徴点座標とし、 該特徴点座標に基づき幾何学的特徴量を算出することに
    よって前記被抽出パタンの特徴抽出を行なうことを特徴
    とする特徴抽出方法。
  2. (2)特徴抽出対象となる被抽出パタンを含む量子化画
    像データの画素にX座標を付与するためのX座標発生手
    段と、 前記量子化画像データの画素にY座標を付与するための
    Y座標発生手段と、 前記X、Y座標と少なくとも2組の特定のα値及びβ値
    とを用いて所定の画素値を有する前記被抽出パタンの画
    素に関する最大及び最小の計算値αX+βYを検出し、
    これら最大及び最小計算値を与える前記被抽出パタンの
    画素のX、Y座標をそれぞれ特徴点座標として出力する
    ための座標検出手段と、 前記被抽出パタンの特徴抽出を行なうための幾何学的特
    徴量を前記特徴点座標に基づき算出する特徴量算出手段
    とを備えて成ることを特徴とする特徴抽出装置。
  3. (3)前記座標検出手段は、前記計算値αX+βYを算
    出する計算手段と、前記最大計算値を検出するための最
    大値検出手段と、前記最大計算値を与える画素のX、Y
    座標を保存するための最大値座標保存手段と、前記最小
    計算値を検出するための最小値検出手段と、前記最小計
    算値を与える画素のX、Y座標を保存するための最小値
    座標保存手段とを備えて成ることを特徴とする請求項2
    に記載の特徴抽出装置。
JP63014222A 1988-01-25 1988-01-25 特徴抽出方法及び特徴抽出装置 Expired - Lifetime JPH0821060B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63014222A JPH0821060B2 (ja) 1988-01-25 1988-01-25 特徴抽出方法及び特徴抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63014222A JPH0821060B2 (ja) 1988-01-25 1988-01-25 特徴抽出方法及び特徴抽出装置

Publications (2)

Publication Number Publication Date
JPH01189785A true JPH01189785A (ja) 1989-07-28
JPH0821060B2 JPH0821060B2 (ja) 1996-03-04

Family

ID=11855044

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63014222A Expired - Lifetime JPH0821060B2 (ja) 1988-01-25 1988-01-25 特徴抽出方法及び特徴抽出装置

Country Status (1)

Country Link
JP (1) JPH0821060B2 (ja)

Also Published As

Publication number Publication date
JPH0821060B2 (ja) 1996-03-04

Similar Documents

Publication Publication Date Title
JP3445394B2 (ja) 少なくとも二つのイメージセクションの比較方法
US5410611A (en) Method for identifying word bounding boxes in text
JP3453134B2 (ja) 複数の記号ストリングの等価性を判定する方法
US4284975A (en) On-line pattern recognition system for hand-written characters
JP3139521B2 (ja) 自動言語決定装置
US5515455A (en) System for recognizing handwritten words of cursive script
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
Al-Badr et al. Segmentation-free word recognition with application to Arabic
US9959475B2 (en) Table data recovering in case of image distortion
JPH05242292A (ja) 分離方法
CN112364834A (zh) 一种基于深度学习和图像处理的表格识别的还原方法
US4891750A (en) Optical character recognition by forming and detecting matrices of geo features
CN114663897A (zh) 表格提取方法与表格提取系统
CN118135584A (zh) 一种基于深度学习的手写表单自动识别方法和系统
CN111126266A (zh) 文本处理方法、文本处理系统、设备及介质
US20020051574A1 (en) Character recognition method, program and recording medium
CA2265423C (en) Classification-driven thresholding of a normalized grayscale image
JPH01189785A (ja) 特徴抽出方法及び特徴抽出装置
US5307424A (en) Character recognition system
JP2846486B2 (ja) 画像入力装置
Bloomberg et al. Document image applications
JP2827288B2 (ja) 文字認識装置
JPH01189787A (ja) 特徴抽出方法及び特徴抽出装置
JPH01189786A (ja) 特徴抽出方法及び特徴抽出装置
JPH0252329A (ja) 画像情報記録・読取方法