JPH0628476A - 画像信号の処理装置 - Google Patents
画像信号の処理装置Info
- Publication number
- JPH0628476A JPH0628476A JP4181403A JP18140392A JPH0628476A JP H0628476 A JPH0628476 A JP H0628476A JP 4181403 A JP4181403 A JP 4181403A JP 18140392 A JP18140392 A JP 18140392A JP H0628476 A JPH0628476 A JP H0628476A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- image
- unit
- transform
- conversion unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 claims abstract description 89
- 238000012545 processing Methods 0.000 claims abstract description 64
- 230000009466 transformation Effects 0.000 claims abstract description 24
- 230000009467 reduction Effects 0.000 claims abstract description 10
- 238000000034 method Methods 0.000 claims description 43
- 230000008569 process Effects 0.000 claims description 33
- 238000006073 displacement reaction Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000001131 transforming effect Effects 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 abstract description 16
- 238000003672 processing method Methods 0.000 abstract 1
- 238000012937 correction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000003909 pattern recognition Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000003696 structure analysis method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
(57)【要約】
【目的】 拡大縮小、回転、位置ずれに対して強く、ま
た背景ノイズの重畳に対しても強いパタン認識のための
画像処理方法を提供する。 【構成】 入力画像に対して前処理を行った後、変換部
14によりフーリエ・メラン変換などの変換を施し、像
を拡大縮小、回転、位置ずれに対して不変なパタンへと
変換する。このような変換を施したパタンをマッチング
部15が標準パタンと比較し、候補パタンを決める。逆
変換部16が候補パタンに対して変換部による変換の逆
変換処理を行い、フィードバック像を計算する。イメー
ジメモリ部13はフィードバック像に基づいて入力像か
ら背景ノイズの除去を行う。これらの処理の繰り返しに
よりパタン判定を行う。
た背景ノイズの重畳に対しても強いパタン認識のための
画像処理方法を提供する。 【構成】 入力画像に対して前処理を行った後、変換部
14によりフーリエ・メラン変換などの変換を施し、像
を拡大縮小、回転、位置ずれに対して不変なパタンへと
変換する。このような変換を施したパタンをマッチング
部15が標準パタンと比較し、候補パタンを決める。逆
変換部16が候補パタンに対して変換部による変換の逆
変換処理を行い、フィードバック像を計算する。イメー
ジメモリ部13はフィードバック像に基づいて入力像か
ら背景ノイズの除去を行う。これらの処理の繰り返しに
よりパタン判定を行う。
Description
【0001】
【産業上の利用分野】本発明は、パタン認識のための画
像処理を行う画像信号の処理装置に関するものである。
像処理を行う画像信号の処理装置に関するものである。
【0002】
【従来の技術】従来のOCR等のパタン認識のための画
像処理を行う装置の認識方式は、大別してアナログ的マ
ッチング法(テンプレートマッチング法)と構造解析法
とに分けることができる。前者は標準パタンと未知パタ
ンとの重ね合わせによってパタンを認識する方式であ
り、汎用性にすぐれ、特に、活字の読み取りには有利で
あるとされている。
像処理を行う装置の認識方式は、大別してアナログ的マ
ッチング法(テンプレートマッチング法)と構造解析法
とに分けることができる。前者は標準パタンと未知パタ
ンとの重ね合わせによってパタンを認識する方式であ
り、汎用性にすぐれ、特に、活字の読み取りには有利で
あるとされている。
【0003】
【発明が解決しようとする課題】しかしこの従来の方式
には、パターンに拡大縮小や回転などの変形があった
り、位置ずれがあったりすると標準パタンとの重なりあ
いが少なくなり、正しく認識されないという欠点があっ
た。“Applied Optics,1976,vo
l.15”に掲載のD.Casasentらによる文献
“Position,rotation,and sc
ale invariant optical cor
relation”には、光学的な方法によりパタンの
フーリエ・メラン変換(Fourier−Mellin
transform)を行った上でパタンマッチング
を行う方法が記載されている。この方法は、パタンのフ
ーリエ変換の振幅がもとのパタンの位置をずらしても不
変であること、また、バタンの拡張されたメラン変換の
振幅は、もとのパタンを拡大縮小あるいは回転しても不
変であることを利用したもので、もとのパタンを、位置
ずれ、拡大縮小、回転などに対して不変なパタンに変換
しておいてから、標準パタンとのマッチングを行うもの
であり、変形や位置ずれに対して強い方式である。しか
しながら、この方式では、掲示されるパタンに背景ノイ
ズが重畳している場合、マッチングが著しく悪化すると
いう難点があった。
には、パターンに拡大縮小や回転などの変形があった
り、位置ずれがあったりすると標準パタンとの重なりあ
いが少なくなり、正しく認識されないという欠点があっ
た。“Applied Optics,1976,vo
l.15”に掲載のD.Casasentらによる文献
“Position,rotation,and sc
ale invariant optical cor
relation”には、光学的な方法によりパタンの
フーリエ・メラン変換(Fourier−Mellin
transform)を行った上でパタンマッチング
を行う方法が記載されている。この方法は、パタンのフ
ーリエ変換の振幅がもとのパタンの位置をずらしても不
変であること、また、バタンの拡張されたメラン変換の
振幅は、もとのパタンを拡大縮小あるいは回転しても不
変であることを利用したもので、もとのパタンを、位置
ずれ、拡大縮小、回転などに対して不変なパタンに変換
しておいてから、標準パタンとのマッチングを行うもの
であり、変形や位置ずれに対して強い方式である。しか
しながら、この方式では、掲示されるパタンに背景ノイ
ズが重畳している場合、マッチングが著しく悪化すると
いう難点があった。
【0004】本発明の目的は、このような従来の欠点を
取り除き、拡大縮小、回転、位置ずれに対して強く、ま
た同時に背景ノイズの重畳に対しても強いパタン認識の
ための画像信号の処理装置を提供することにある。
取り除き、拡大縮小、回転、位置ずれに対して強く、ま
た同時に背景ノイズの重畳に対しても強いパタン認識の
ための画像信号の処理装置を提供することにある。
【0005】
【課題を解決するための手段】第1の発明は、入力画像
に対してフーリエ・メラン変換を施し、像を位置ずれ、
拡大縮小、回転操作に対して不変なパタンに変換する第
1の変換部と、第1の変換部より得られたパタンを標準
パタンと比較して候補パタンを決めるマッチング部と、
候補パタンに対して第1の変換部による変換の逆変換を
施してフィードバック像を計算する第1の逆変換部と、
フィードバック像に基づいて入力像からパタンに無関係
の背景ノイズを除去するイメージメモリとを備え、ルー
プ処理の繰り返しによりパタン判定を行うことを特徴と
している。
に対してフーリエ・メラン変換を施し、像を位置ずれ、
拡大縮小、回転操作に対して不変なパタンに変換する第
1の変換部と、第1の変換部より得られたパタンを標準
パタンと比較して候補パタンを決めるマッチング部と、
候補パタンに対して第1の変換部による変換の逆変換を
施してフィードバック像を計算する第1の逆変換部と、
フィードバック像に基づいて入力像からパタンに無関係
の背景ノイズを除去するイメージメモリとを備え、ルー
プ処理の繰り返しによりパタン判定を行うことを特徴と
している。
【0006】また、第2の発明は、入力画像を小領域に
分割して多段の階層的なフーリエ変換を施し、像のフー
リエ変換の振幅を求める処理によって像を位置ずれに対
して不変なパタンに変換する第2の変換部と、第2の変
換部より得られたパタンに対して拡張されたメラン変換
を施して拡大縮小、回転操作に対しても不変なパタンに
変換する第3の変換部と、第3の変換部より得られたパ
タンを標準パタンと比較して候補パタンを決めるマッチ
ング部と、マッチング部で決まった候補パタンおよび第
3の変換部からのデータにより第3の変換部の逆変換を
計算する第2逆変換部と、第2の逆変換部からのデータ
と第2の変換部からのデータによりフィードバック像を
計算する第3の逆変換部と、フィードバック像に基づい
て入力像からパタンに無関係の背景ノイズを除去するイ
メージメモリとを備え、ループ処理の繰り返しによりパ
タン判定を行うことを特徴としている。
分割して多段の階層的なフーリエ変換を施し、像のフー
リエ変換の振幅を求める処理によって像を位置ずれに対
して不変なパタンに変換する第2の変換部と、第2の変
換部より得られたパタンに対して拡張されたメラン変換
を施して拡大縮小、回転操作に対しても不変なパタンに
変換する第3の変換部と、第3の変換部より得られたパ
タンを標準パタンと比較して候補パタンを決めるマッチ
ング部と、マッチング部で決まった候補パタンおよび第
3の変換部からのデータにより第3の変換部の逆変換を
計算する第2逆変換部と、第2の逆変換部からのデータ
と第2の変換部からのデータによりフィードバック像を
計算する第3の逆変換部と、フィードバック像に基づい
て入力像からパタンに無関係の背景ノイズを除去するイ
メージメモリとを備え、ループ処理の繰り返しによりパ
タン判定を行うことを特徴としている。
【0007】さらに、第3の発明は、入力画像に複素対
数変換で表される座標変換を施す第4の変換部と、第4
の変換部より得られたパタンを小領域に分割して多段の
階層的なフーリエ変換を施し、像のフーリエ変換の振幅
を求める処理によって像を小さい位置ずれ、拡大縮小、
回転操作に対して不変なパタンに変換する第5の変換部
と、第5の変換部より得られたパタンを標準パタンと比
較して候補パタンを決めるマッチング部と、候補パタン
に対して前記多段の階層的なフーリエ変換とフーリエ変
換の振幅計算の逆変換を施してフィードバック像を計算
する第4の逆変換部と、フィードバック像に基づいて入
力像からパタンに無関係の背景ノイズを除去するイメー
ジメモリとを備え、ループ処理の繰り返しによりパタン
判定を行うことを特徴としている。
数変換で表される座標変換を施す第4の変換部と、第4
の変換部より得られたパタンを小領域に分割して多段の
階層的なフーリエ変換を施し、像のフーリエ変換の振幅
を求める処理によって像を小さい位置ずれ、拡大縮小、
回転操作に対して不変なパタンに変換する第5の変換部
と、第5の変換部より得られたパタンを標準パタンと比
較して候補パタンを決めるマッチング部と、候補パタン
に対して前記多段の階層的なフーリエ変換とフーリエ変
換の振幅計算の逆変換を施してフィードバック像を計算
する第4の逆変換部と、フィードバック像に基づいて入
力像からパタンに無関係の背景ノイズを除去するイメー
ジメモリとを備え、ループ処理の繰り返しによりパタン
判定を行うことを特徴としている。
【0008】
【作用】第1の発明では、入力画像に対してフーリエ変
換が施され、その振幅が計算される。よく知られている
ように、像のフーリエ変換の振幅は像の位置をずらして
も不変であるから、これにより位置不変なパタンが得ら
れる。この時、もとの像をa倍拡大するとそのフーリエ
変換の振幅のパタンは1/aに縮小し、もとの像を回転
するとフーリエ変換のパタンも同じ角度だけ回転するこ
ともよく知られている。そこで、次にこのパタンを新座
標で表わし、縦軸にその偏角、横軸に対数目盛りで動径
をとって表示する。このようにして表したパタンは、も
とのパタンを回転させると縦軸方向に平行移動するし、
また、もとのパタンを拡大あるいは縮小すると横軸方向
に平行移動することがわかる。そこで、このパタンに対
して再度フーリエ変換を行い、その振幅を計算すると拡
張されたメラン変換が得られ、D.Casasentら
が指摘したように、それはもとのパタンの回転あるいは
拡大縮小に対しても不変なものになる。
換が施され、その振幅が計算される。よく知られている
ように、像のフーリエ変換の振幅は像の位置をずらして
も不変であるから、これにより位置不変なパタンが得ら
れる。この時、もとの像をa倍拡大するとそのフーリエ
変換の振幅のパタンは1/aに縮小し、もとの像を回転
するとフーリエ変換のパタンも同じ角度だけ回転するこ
ともよく知られている。そこで、次にこのパタンを新座
標で表わし、縦軸にその偏角、横軸に対数目盛りで動径
をとって表示する。このようにして表したパタンは、も
とのパタンを回転させると縦軸方向に平行移動するし、
また、もとのパタンを拡大あるいは縮小すると横軸方向
に平行移動することがわかる。そこで、このパタンに対
して再度フーリエ変換を行い、その振幅を計算すると拡
張されたメラン変換が得られ、D.Casasentら
が指摘したように、それはもとのパタンの回転あるいは
拡大縮小に対しても不変なものになる。
【0009】次に、ここまでの処理と同様の処理をあら
かじめ施しておいた標準パタンとのテンプレートマッチ
ングを行う。この処理により、提示されたパタンが標準
パタンに対し位置がずれていたり、拡大縮小あるいは回
転していても正しく認識することはできるが、一般的に
は提示パタンには対象としているパタン以外にも背景ノ
イズが重畳しているので、これだけの処理で精度のよい
認識をすることは困難である。そこで、上述のテンプレ
ートマッチングにより得られる類似度があらかじめ設定
しておいたしきい値よりも小さい場合には判定を保留
し、類似度の比較的高い標準パタンを候補パタンとす
る。この候補パタンに基づいて上述の処理を逆にたどっ
ていき、フィードバック像を計算して入力像をこのフィ
ードバック像に基づいて修正する。候補パタンが正しい
パタンであった場合には、フィードバック像により、対
象とするべきパタンの部分と、パタンとは関係のない背
景ノイズの部分とを決めることができるから、これによ
りもともとの入力像中の背景ノイズの部分を抑制するこ
とができる。このような修正により背景ノイズを抑制し
た上で、再び順方向の変換処理とテンプレートマッチン
グを繰り返す。このようにして、候補パタンが正しいパ
タンであった場合には、フィードバック処理により背景
ノイズが抑制されるので、2回目のテンプレートマッチ
ングの結果は大幅に改善し、以上のようなループ処理を
数回繰り返せばマッチングはほぼ完ぺきになって、背景
ノイズがある場合にも精度の高いパタン判定が可能にな
る。
かじめ施しておいた標準パタンとのテンプレートマッチ
ングを行う。この処理により、提示されたパタンが標準
パタンに対し位置がずれていたり、拡大縮小あるいは回
転していても正しく認識することはできるが、一般的に
は提示パタンには対象としているパタン以外にも背景ノ
イズが重畳しているので、これだけの処理で精度のよい
認識をすることは困難である。そこで、上述のテンプレ
ートマッチングにより得られる類似度があらかじめ設定
しておいたしきい値よりも小さい場合には判定を保留
し、類似度の比較的高い標準パタンを候補パタンとす
る。この候補パタンに基づいて上述の処理を逆にたどっ
ていき、フィードバック像を計算して入力像をこのフィ
ードバック像に基づいて修正する。候補パタンが正しい
パタンであった場合には、フィードバック像により、対
象とするべきパタンの部分と、パタンとは関係のない背
景ノイズの部分とを決めることができるから、これによ
りもともとの入力像中の背景ノイズの部分を抑制するこ
とができる。このような修正により背景ノイズを抑制し
た上で、再び順方向の変換処理とテンプレートマッチン
グを繰り返す。このようにして、候補パタンが正しいパ
タンであった場合には、フィードバック処理により背景
ノイズが抑制されるので、2回目のテンプレートマッチ
ングの結果は大幅に改善し、以上のようなループ処理を
数回繰り返せばマッチングはほぼ完ぺきになって、背景
ノイズがある場合にも精度の高いパタン判定が可能にな
る。
【0010】次に、第2の発明では、第1の発明におけ
る最初の処理であるフーリエ変換の振幅計算処理を次の
ように多段に分割された処理に置き換える。すなわち、
入力像全体のフーリエ変換を一度に計算するかわりに、
入力像を多数の小領域に分割し、まず、各小領域ごとに
像のフーリエ変換とその振幅を計算する。これにより像
中の多数の位置において、ローカルなフーリエ変換の振
幅が得られるが、次にこれを新たにパタンと見なして、
再び位置変数に関するフーリエ変換を行い、その振幅を
計算する。このような処理によって得られるパタンは近
似的に、もとの像についてのフーリエ変換の振幅と同じ
性質を持つので、この処理に第1の発明における残りの
処理をつけ加えることにより、位置ずれ、拡大縮小、回
転に対して強く、同時に背景ノイズの重畳に対しても強
いパタン認識処理が可能になる。
る最初の処理であるフーリエ変換の振幅計算処理を次の
ように多段に分割された処理に置き換える。すなわち、
入力像全体のフーリエ変換を一度に計算するかわりに、
入力像を多数の小領域に分割し、まず、各小領域ごとに
像のフーリエ変換とその振幅を計算する。これにより像
中の多数の位置において、ローカルなフーリエ変換の振
幅が得られるが、次にこれを新たにパタンと見なして、
再び位置変数に関するフーリエ変換を行い、その振幅を
計算する。このような処理によって得られるパタンは近
似的に、もとの像についてのフーリエ変換の振幅と同じ
性質を持つので、この処理に第1の発明における残りの
処理をつけ加えることにより、位置ずれ、拡大縮小、回
転に対して強く、同時に背景ノイズの重畳に対しても強
いパタン認識処理が可能になる。
【0011】次に、第3の発明では、まず、入力像を複
素対数変換を施した座標軸で表現する。よく知られてい
るように、この処理により得られるパタンは、もとの像
を拡大縮小あるいは回転すると近似的に平行移動する。
次に、このパタンを多数の小領域に分割し、まず、各小
領域ごとに像のフーリエ変換とその振幅を計算する。こ
こで、もとの像の位置をずらすと、各小領域の中の像も
移動するが、もしも各小領域での位置ずれの大きさが小
領域の大きさよりも小さければ、フーリエ変換の振幅の
位置ずれに対する不変性により、このような処理により
得られるパタンは近似的に不変である。次に、このよう
にして得られた、多数の位置におけるローカルなフーリ
エ変換の振幅を新たにパタンとみなして、再び位置変数
に関するフーリエ変換を行い、その振幅を計算する。こ
のような処理によって得られるパタンは近似的に、複素
対数変換を施した座標軸で表現された入力像についての
フーリエ変換の振幅と同じ性質を持つので、この座標軸
上でパタンを平行移動しても、すなわちもとの入力像を
拡大縮小、あるいは回転させても近似的に不変である。
従って以上の処理により、小さな位置ずれ、および拡大
縮小変換、回転に対してほぼ不変のパタンが得られる。
素対数変換を施した座標軸で表現する。よく知られてい
るように、この処理により得られるパタンは、もとの像
を拡大縮小あるいは回転すると近似的に平行移動する。
次に、このパタンを多数の小領域に分割し、まず、各小
領域ごとに像のフーリエ変換とその振幅を計算する。こ
こで、もとの像の位置をずらすと、各小領域の中の像も
移動するが、もしも各小領域での位置ずれの大きさが小
領域の大きさよりも小さければ、フーリエ変換の振幅の
位置ずれに対する不変性により、このような処理により
得られるパタンは近似的に不変である。次に、このよう
にして得られた、多数の位置におけるローカルなフーリ
エ変換の振幅を新たにパタンとみなして、再び位置変数
に関するフーリエ変換を行い、その振幅を計算する。こ
のような処理によって得られるパタンは近似的に、複素
対数変換を施した座標軸で表現された入力像についての
フーリエ変換の振幅と同じ性質を持つので、この座標軸
上でパタンを平行移動しても、すなわちもとの入力像を
拡大縮小、あるいは回転させても近似的に不変である。
従って以上の処理により、小さな位置ずれ、および拡大
縮小変換、回転に対してほぼ不変のパタンが得られる。
【0012】次に、ここまでの処理と同様の処理をあら
かじめ施しておいた標準パタンとのテンプレートマッチ
ングを行う。第1の発明と同様に、掲示パタンに背景ノ
イズが重畳している場合には、これだけの処理では精度
のよい認識をすることは困難である。そこで、第1の発
明と同様に、類似度があらかじめ設定しておいたしきい
値よりも小さい場合には、類似度の比較的高い標準パタ
ンを候補パタンとしてフィードバックし、この候補パタ
ンに基づいて上述の処理を逆にたどっていき、フィード
バック像を計算して入力像をこのフィードバック像に基
づいて修正する。このような修正を施した上で、再び順
方向の変換処理とテンプレートマッチングを繰り返す。
第1の発明と同様に、以上のようなループ処理を数回繰
り返せばマッチングはほぼ完ぺきになって、背景ノイズ
がある場合にも精度の高い、また位置ずれ、拡大縮小、
回転に対しても強いパタン判定が可能になる。
かじめ施しておいた標準パタンとのテンプレートマッチ
ングを行う。第1の発明と同様に、掲示パタンに背景ノ
イズが重畳している場合には、これだけの処理では精度
のよい認識をすることは困難である。そこで、第1の発
明と同様に、類似度があらかじめ設定しておいたしきい
値よりも小さい場合には、類似度の比較的高い標準パタ
ンを候補パタンとしてフィードバックし、この候補パタ
ンに基づいて上述の処理を逆にたどっていき、フィード
バック像を計算して入力像をこのフィードバック像に基
づいて修正する。このような修正を施した上で、再び順
方向の変換処理とテンプレートマッチングを繰り返す。
第1の発明と同様に、以上のようなループ処理を数回繰
り返せばマッチングはほぼ完ぺきになって、背景ノイズ
がある場合にも精度の高い、また位置ずれ、拡大縮小、
回転に対しても強いパタン判定が可能になる。
【0013】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
て説明する。
【0014】図1は、第1の発明の一実施例を示す構成
図である。図1に示す実施例は、イメージスキャナーも
しくはテレビカメラなどを利用する画像入力部11と、
データをディジタル化したりエッジ強調などの必要な前
処理をする前処理部12と、ディジタルデータを格納す
るイメージメモリ13と、イメージメモリ13から読み
だした画像データに対してフーリエ変換、拡張されたメ
ラン変換を行って位置ずれ、回転、拡大縮小変化に対し
て不変なパタンに入力を変換する変換部14と、変換部
14の出力と標準パタンとのテンプレートマッチングを
行ってパタン判定、候補パタンの決定を行うマッチング
部15と、マッチング部15で決まった候補パタンおよ
び変換部14のデータからフィードバック像を計算する
逆変換部16とを備えている。
図である。図1に示す実施例は、イメージスキャナーも
しくはテレビカメラなどを利用する画像入力部11と、
データをディジタル化したりエッジ強調などの必要な前
処理をする前処理部12と、ディジタルデータを格納す
るイメージメモリ13と、イメージメモリ13から読み
だした画像データに対してフーリエ変換、拡張されたメ
ラン変換を行って位置ずれ、回転、拡大縮小変化に対し
て不変なパタンに入力を変換する変換部14と、変換部
14の出力と標準パタンとのテンプレートマッチングを
行ってパタン判定、候補パタンの決定を行うマッチング
部15と、マッチング部15で決まった候補パタンおよ
び変換部14のデータからフィードバック像を計算する
逆変換部16とを備えている。
【0015】次に、第1の発明の実施例の動作について
説明する。画像入力部11から入力された画像情報は、
前処理部12でA/D変換処理を受け、ディジタル化さ
れ、メモリに格納される。後の認識処理に便利なよう
に、必要に応じてこの部分において像中のエッジ部の強
調などの前処理を行っておいてもよい。次に、この処理
結果はイメージメモリ13に送られ、変換部14がイメ
ージメモリ13中のパタンに対して、そのフーリエ変
換、F(Kx,Ky)とその振幅P(Kx,Ky)を計
算する。以上の処理をかりに変換Aと呼ぶことにする。
こうして得られる振幅は、よく知られているように入力
像を平行移動しても不変である。計算の都合によっては
振幅の代わりにその2乗であるパワーを計算してもかま
わない。フーリエ変換の位相は後の処理で使うので、変
換部14内のメモリに格納しておく。
説明する。画像入力部11から入力された画像情報は、
前処理部12でA/D変換処理を受け、ディジタル化さ
れ、メモリに格納される。後の認識処理に便利なよう
に、必要に応じてこの部分において像中のエッジ部の強
調などの前処理を行っておいてもよい。次に、この処理
結果はイメージメモリ13に送られ、変換部14がイメ
ージメモリ13中のパタンに対して、そのフーリエ変
換、F(Kx,Ky)とその振幅P(Kx,Ky)を計
算する。以上の処理をかりに変換Aと呼ぶことにする。
こうして得られる振幅は、よく知られているように入力
像を平行移動しても不変である。計算の都合によっては
振幅の代わりにその2乗であるパワーを計算してもかま
わない。フーリエ変換の位相は後の処理で使うので、変
換部14内のメモリに格納しておく。
【0016】次に、変換部14はフーリエ変換の振幅を
極座標表示に変換し、縦軸にその偏角、横軸に対数目盛
りで動径をとって表示する。数式であらわすと
極座標表示に変換し、縦軸にその偏角、横軸に対数目盛
りで動径をとって表示する。数式であらわすと
【数1】 rcosθ=Kx s=log(1+r/r
c) rsinθ=Ky で表される座標変換(Kx,Ky)→(s,θ)を計算
し、s−θ軸のパタンへとフーリエ変換の振幅のパタン
を変換する。ここでrcは、r=0で対数関数が発散す
ることを防ぐための正の定数である。
c) rsinθ=Ky で表される座標変換(Kx,Ky)→(s,θ)を計算
し、s−θ軸のパタンへとフーリエ変換の振幅のパタン
を変換する。ここでrcは、r=0で対数関数が発散す
ることを防ぐための正の定数である。
【0017】こうして得られたパタンP(s,θ)は、
もとのパタンを回転させるとθ軸方向に平行移動する
し、また、もとのパタンを拡大あるいは縮小すると近似
的にs軸方向に平行移動することがわかる。そこで、こ
のパタンに対して再度フーリエ変換を行い、その振幅を
計算すると、すでに知られているように、それはもとの
パタンの回転あるいは拡大縮小に対しても不変なものに
なる。
もとのパタンを回転させるとθ軸方向に平行移動する
し、また、もとのパタンを拡大あるいは縮小すると近似
的にs軸方向に平行移動することがわかる。そこで、こ
のパタンに対して再度フーリエ変換を行い、その振幅を
計算すると、すでに知られているように、それはもとの
パタンの回転あるいは拡大縮小に対しても不変なものに
なる。
【0018】変換A以降ここまでの処理を変換Bと呼ぶ
ことにする。変換Bで得られた振幅はマッチング部15
に送られる。また、変換Bで得られたフーリエ変換の位
相は、やはり後の処理で使うためメモリに格納してお
く。
ことにする。変換Bで得られた振幅はマッチング部15
に送られる。また、変換Bで得られたフーリエ変換の位
相は、やはり後の処理で使うためメモリに格納してお
く。
【0019】マッチング部15は、あらかじめ上に述べ
た変換を施しておいた標準パタンを格納しており、これ
らの標準パタンと変換部14からおくられてくるパタン
とのテンプレートマッチングを行い、パタン判定を行
う。変換部14での処理の結果、提示されたパタンが標
準パタンに対し位置がずれていたり、拡大縮小あるいは
回転していてもマッチング部は正しく認識することがで
きるが、一般的には展示パタンには対象としているパタ
ン以外にも背景ノイズが重畳しているので、これだけの
処理で精度のよい認識をすることは困難である。そこ
で、マッチング部15は、上述のテンプレートマッチン
グにより得られる類似度が、あらかじめ設定しておいた
しきい値よりもよい場合には、それを判定結果として処
理を終了するが、そうでない場合には、類似度の高い標
準パタンを候補パタンとして逆変換部16にフィードバ
ックする。
た変換を施しておいた標準パタンを格納しており、これ
らの標準パタンと変換部14からおくられてくるパタン
とのテンプレートマッチングを行い、パタン判定を行
う。変換部14での処理の結果、提示されたパタンが標
準パタンに対し位置がずれていたり、拡大縮小あるいは
回転していてもマッチング部は正しく認識することがで
きるが、一般的には展示パタンには対象としているパタ
ン以外にも背景ノイズが重畳しているので、これだけの
処理で精度のよい認識をすることは困難である。そこ
で、マッチング部15は、上述のテンプレートマッチン
グにより得られる類似度が、あらかじめ設定しておいた
しきい値よりもよい場合には、それを判定結果として処
理を終了するが、そうでない場合には、類似度の高い標
準パタンを候補パタンとして逆変換部16にフィードバ
ックする。
【0020】逆変換部16は、変換部14での処理を逆
にたどり、フィードバック像を計算する。すなわち、ま
ずはじめにマッチング部15からフィードバックされて
きた候補パタンの振幅と、変換部14において変換Bで
計算された位相とから逆フーリエ変換を計算し、s−θ
座標軸上のフィードバックパタンを計算する。さらに、
それに対して数1で表される座標変換の逆変換を施し、
パタンP′(Kx,Ky)を計算する。さらに、こうし
て得られたフィードバック振幅P′と変換部14におけ
る変換Aで計算された位相とから再び逆フーリエ変換を
行い、フィードバック像I′を求める。以上の逆変換処
理において、本来、正であるべき振幅や明暗度が負にな
ったりあるいは大きくなりすぎることを防ぐために、各
逆フーリエ変換処理のあとにしきい値処理をつけ加えて
もよい。
にたどり、フィードバック像を計算する。すなわち、ま
ずはじめにマッチング部15からフィードバックされて
きた候補パタンの振幅と、変換部14において変換Bで
計算された位相とから逆フーリエ変換を計算し、s−θ
座標軸上のフィードバックパタンを計算する。さらに、
それに対して数1で表される座標変換の逆変換を施し、
パタンP′(Kx,Ky)を計算する。さらに、こうし
て得られたフィードバック振幅P′と変換部14におけ
る変換Aで計算された位相とから再び逆フーリエ変換を
行い、フィードバック像I′を求める。以上の逆変換処
理において、本来、正であるべき振幅や明暗度が負にな
ったりあるいは大きくなりすぎることを防ぐために、各
逆フーリエ変換処理のあとにしきい値処理をつけ加えて
もよい。
【0021】イメージメモリ部13は、逆変換部16か
ら送られてきたフィードバック像I′にもとづいて、例
えば、次式によって入力像I0 を修正し、修正された像
Iを再び変換部14へと送る。
ら送られてきたフィードバック像I′にもとづいて、例
えば、次式によって入力像I0 を修正し、修正された像
Iを再び変換部14へと送る。
【数2】 I(x,y)=(I0 (x,y)a+(1−a))・ (I′(x,y)b+(1−b)) x,yは画素の位置を指定するパラメータである。
【0022】この変換の後に、値が大きくなりすぎるこ
とを防ぐための適当なしきい値処理をつけ加えてもよ
い。数2において、aおよびbはそれぞれ入力像および
フィードバック像の重みを決めるパラメータであり、0
から1の間に設定する。いま、かりに入力像が標準パタ
ンの中のどれかを平行移動、拡大縮小、回転したもので
あり、背景ノイズはまったくないとする。この場合には
最初のマッチング処理で判定結果がでるので逆変換処理
は行われないが、かりに逆変換処理が行われたと仮定す
ると、この場合、逆変換部16で行われる処理は、正確
に変換部14での処理の逆変換になり、フィードバック
像は前処理を受けた入力像と正確に一致する。
とを防ぐための適当なしきい値処理をつけ加えてもよ
い。数2において、aおよびbはそれぞれ入力像および
フィードバック像の重みを決めるパラメータであり、0
から1の間に設定する。いま、かりに入力像が標準パタ
ンの中のどれかを平行移動、拡大縮小、回転したもので
あり、背景ノイズはまったくないとする。この場合には
最初のマッチング処理で判定結果がでるので逆変換処理
は行われないが、かりに逆変換処理が行われたと仮定す
ると、この場合、逆変換部16で行われる処理は、正確
に変換部14での処理の逆変換になり、フィードバック
像は前処理を受けた入力像と正確に一致する。
【0023】入力像にノイズが重畳している場合にも、
近似的にフィードバック像は入力像中からノイズ部分を
除いたものになる。従って、例えば、数2において、a
およびbを1に設定すると、修正された像からはノイズ
が大幅に抑制されることになる。これは数2によって、
入力像ではゼロでない値を持つ画素であっても、その画
素がノイズ部分のものであればフィードバック信号I′
がゼロであるためゼロにされてしまうからである。aお
よびbを1に設定する場合には、数2の後に平方根をと
る処理を加える。この結果、入力像とフィードバック像
とが等しい場合には、修正された像もこれに等しくな
る。
近似的にフィードバック像は入力像中からノイズ部分を
除いたものになる。従って、例えば、数2において、a
およびbを1に設定すると、修正された像からはノイズ
が大幅に抑制されることになる。これは数2によって、
入力像ではゼロでない値を持つ画素であっても、その画
素がノイズ部分のものであればフィードバック信号I′
がゼロであるためゼロにされてしまうからである。aお
よびbを1に設定する場合には、数2の後に平方根をと
る処理を加える。この結果、入力像とフィードバック像
とが等しい場合には、修正された像もこれに等しくな
る。
【0024】このようにして修正された像Iに対して再
び変換部14の変換およびマッチング部15のマッチン
グ処理が繰り返される。このループはマッチングによる
類似度があらかじめ定めておいたしきい値を越えるまで
くりかえされるが、あらかじめ定めておいた繰り返し回
数に達しても十分な類似度が得られない場合には、最初
の候補パタンは正しくなかったものとし、次順位のもの
へ候補パタンを変えて同様の操作を続ける。
び変換部14の変換およびマッチング部15のマッチン
グ処理が繰り返される。このループはマッチングによる
類似度があらかじめ定めておいたしきい値を越えるまで
くりかえされるが、あらかじめ定めておいた繰り返し回
数に達しても十分な類似度が得られない場合には、最初
の候補パタンは正しくなかったものとし、次順位のもの
へ候補パタンを変えて同様の操作を続ける。
【0025】図2は、第2の発明の一実施例を示す構成
図である。図2に示す実施例は、イメージスキャナーも
しくはテレビカメラなどを利用する画像入力部21と、
データをディジタル化したりエッジ強調などの必要な前
処理をする前処理部22と、ディジタルデータを格納す
るイメージメモリ23と、多段の階層的なフーリエ変換
を行い、位置ずれに対して不変なパタンに入力を変換す
る変換部A24と、拡張されたメラン変換を行って回
転、拡大縮小変化に対して不変なパタンに入力を変換す
る変換部B25と、変換部B25の出力と標準パタンと
のテンプレートマッチングを行ってパタン判定、候補パ
タンの決定を行うマッチング部26と、マッチング部2
6で決まった候補パタンおよび変換部B25のデータか
ら変換部B25の逆変換を計算する逆変換部B27と、
逆変換部B27からのデータと変換部A24からのデー
タによりフィードバック像を計算する逆変換部A28と
を備えている。
図である。図2に示す実施例は、イメージスキャナーも
しくはテレビカメラなどを利用する画像入力部21と、
データをディジタル化したりエッジ強調などの必要な前
処理をする前処理部22と、ディジタルデータを格納す
るイメージメモリ23と、多段の階層的なフーリエ変換
を行い、位置ずれに対して不変なパタンに入力を変換す
る変換部A24と、拡張されたメラン変換を行って回
転、拡大縮小変化に対して不変なパタンに入力を変換す
る変換部B25と、変換部B25の出力と標準パタンと
のテンプレートマッチングを行ってパタン判定、候補パ
タンの決定を行うマッチング部26と、マッチング部2
6で決まった候補パタンおよび変換部B25のデータか
ら変換部B25の逆変換を計算する逆変換部B27と、
逆変換部B27からのデータと変換部A24からのデー
タによりフィードバック像を計算する逆変換部A28と
を備えている。
【0026】次に、第2の発明の実施例の動作について
説明する。第2の発明の実施例の動作は第1の発明の動
作とほぼ同様であるが、第1の発明の実施例における最
初のフーリエ変換の振幅計算処理を次のように多段に分
割された処理に置き換える点が異なっている。また、こ
れに対応して逆変換部も多段に分割されている。
説明する。第2の発明の実施例の動作は第1の発明の動
作とほぼ同様であるが、第1の発明の実施例における最
初のフーリエ変換の振幅計算処理を次のように多段に分
割された処理に置き換える点が異なっている。また、こ
れに対応して逆変換部も多段に分割されている。
【0027】第1の発明の実施例と同様に、画像入力部
21から入力された画像情報は、前処理部22で必要な
前処理を受けてメモリに格納される。第2の発明の実施
例では、第1の発明の実施例での変換部における処理の
うち変換Aの部分が多段に分割された階層的なフーリエ
変換に置き換えられている。すなわち、まず変換部Aに
おいては前処理を受けた像を多数の小領域に分割し、各
小領域ごとに像のフーリエ変換とその振幅を計算する。
これらの値は後の処理で用いるため変換部A内のメモリ
に保存しておく。この処理を数式で表すと以下のように
なる。
21から入力された画像情報は、前処理部22で必要な
前処理を受けてメモリに格納される。第2の発明の実施
例では、第1の発明の実施例での変換部における処理の
うち変換Aの部分が多段に分割された階層的なフーリエ
変換に置き換えられている。すなわち、まず変換部Aに
おいては前処理を受けた像を多数の小領域に分割し、各
小領域ごとに像のフーリエ変換とその振幅を計算する。
これらの値は後の処理で用いるため変換部A内のメモリ
に保存しておく。この処理を数式で表すと以下のように
なる。
【0028】今、入力画像の画素数をN×Nとする。ま
ず、この入力画像を、画素数n1 ×n1 からなる、n2
×n2 個の小領域に分割する。ここで、互いにオーバー
ラップがないように画像を分割する場合には、N=n1
×n2 であるが、互いにオーバーラップがあるように分
割してもかまわない。
ず、この入力画像を、画素数n1 ×n1 からなる、n2
×n2 個の小領域に分割する。ここで、互いにオーバー
ラップがないように画像を分割する場合には、N=n1
×n2 であるが、互いにオーバーラップがあるように分
割してもかまわない。
【0029】次に、これらの小領域に分割された各画像
に対して、次のように、そのフーリエ変換およびその振
幅を求める処理を施す。なお、以後、X* はXのベクト
ルを表し、x* はxのベクトルを表し、k* はkのベク
トルを表すものとする。
に対して、次のように、そのフーリエ変換およびその振
幅を求める処理を施す。なお、以後、X* はXのベクト
ルを表し、x* はxのベクトルを表し、k* はkのベク
トルを表すものとする。
【0030】ここで、各小領域を添え字X* =(X,
Y)(X,Y=1〜n2 )で表し、各小領域中での画素
の位置を添え字x* =(x,y)(x,y=1〜n1 )
で表す。また、X* で表される小領域中のx* の位置に
ある画素の値をI(x* ;X*)で表す。
Y)(X,Y=1〜n2 )で表し、各小領域中での画素
の位置を添え字x* =(x,y)(x,y=1〜n1 )
で表す。また、X* で表される小領域中のx* の位置に
ある画素の値をI(x* ;X*)で表す。
【0031】
【数3】
【0032】
【数4】
【0033】Wは窓関数である。W=1であれば数3
は、I(x* ;X* )の添え字x* に関する2次元の離
散値フーリエ変換を表す。小領域の境界での不連続を消
去するために、境界でゼロになるような窓関数、例え
ば、ガウシアンあるいはハミング窓をWとして用いても
よい。
は、I(x* ;X* )の添え字x* に関する2次元の離
散値フーリエ変換を表す。小領域の境界での不連続を消
去するために、境界でゼロになるような窓関数、例え
ば、ガウシアンあるいはハミング窓をWとして用いても
よい。
【0034】数3の計算に関しては、高速フーリエ変換
のアルゴリズムを利用することが可能である。数4のP
1(k* 1,X* )がフーリエ変換の振幅である。計算
の都合によって振幅の代わりにその2乗であるパワーを
計算しても同じである。入力像の位置をずらしても位置
ずれの大きさが小領域の大きさ程度以下であれば、以上
の処理で得られるパタンP1(k* 1,X* )は、近似
的に不変である。ここで計算されたフーリエ変換の位相
は後の処理で使うためメモリに格納しておく。
のアルゴリズムを利用することが可能である。数4のP
1(k* 1,X* )がフーリエ変換の振幅である。計算
の都合によって振幅の代わりにその2乗であるパワーを
計算しても同じである。入力像の位置をずらしても位置
ずれの大きさが小領域の大きさ程度以下であれば、以上
の処理で得られるパタンP1(k* 1,X* )は、近似
的に不変である。ここで計算されたフーリエ変換の位相
は後の処理で使うためメモリに格納しておく。
【0035】次に、変換部A24は、P1(k* 1,X
* )に対して再び位置変数X* に関するフーリエ変換を
行い、その振幅を計算する。
* )に対して再び位置変数X* に関するフーリエ変換を
行い、その振幅を計算する。
【0036】
【数5】
【0037】
【数6】
【0038】ここで得られるフーリエ変換の位相もやは
り後の処理で使うためメモリに格納しておく。ここまで
に述べた処理は2段階の処理であるが、必要に応じて3
段階以上の多段の処理にすることも可能である。変換部
A24は、さらに次のような変数変換を行う。
り後の処理で使うためメモリに格納しておく。ここまで
に述べた処理は2段階の処理であるが、必要に応じて3
段階以上の多段の処理にすることも可能である。変換部
A24は、さらに次のような変数変換を行う。
【0039】
【数7】
【0040】こうして得られるパタンP(k* )は、第
1の発明の実施例において計算されている像全体のフー
リエ変換の振幅と類似の性質を持ち、入力像を平行移動
しても不変である。
1の発明の実施例において計算されている像全体のフー
リエ変換の振幅と類似の性質を持ち、入力像を平行移動
しても不変である。
【0041】次に、Pは変換部B25へと送られ、第1
の発明の実施例における変換Bの処理がなされ、パタン
の回転あるいは拡大縮小に対しても不変なパタンへと変
換される。マッチング部26の働きは第1の発明の実施
例と同様である。逆変換部は変換部を多段に分割したこ
とに対応してやはり多段に分割される。まず、逆変換部
27は、第1の発明の実施例と同様に逆フーリエ変換、
逆座標変換を行い、パタンP′(k* )を計算する。次
に、逆変換部A28は、数7の変換の逆変換を行い、P
2′(k* 1,k* 2)を計算した上で、このP2′と
変換部A24で計算された位相とを用いて逆フーリエ変
換を行い、P1′(k* 1,X* )を計算する。さら
に、逆変換部A28は、このP1′と変換部A24での
最初のローカルなフーリエ変換で計算された位相とを用
いて逆変換を行い、フィードバック像I′を計算する。
の発明の実施例における変換Bの処理がなされ、パタン
の回転あるいは拡大縮小に対しても不変なパタンへと変
換される。マッチング部26の働きは第1の発明の実施
例と同様である。逆変換部は変換部を多段に分割したこ
とに対応してやはり多段に分割される。まず、逆変換部
27は、第1の発明の実施例と同様に逆フーリエ変換、
逆座標変換を行い、パタンP′(k* )を計算する。次
に、逆変換部A28は、数7の変換の逆変換を行い、P
2′(k* 1,k* 2)を計算した上で、このP2′と
変換部A24で計算された位相とを用いて逆フーリエ変
換を行い、P1′(k* 1,X* )を計算する。さら
に、逆変換部A28は、このP1′と変換部A24での
最初のローカルなフーリエ変換で計算された位相とを用
いて逆変換を行い、フィードバック像I′を計算する。
【0042】イメージメモリ部26は、第1の発明の実
施例と同様にこのフィードバック像に基づいて入力像を
修正し、これを再び変換部A24へと送る。このループ
は、マッチングによる類似度があらかじめ定めておいた
しきい値を越えるまで繰り返され、また、あらかじめ定
めておいた繰り返し回数に達しても十分な類似度が得ら
れない場合には、次順位のものへ候補パタンを変えて同
様の操作を続ける点も第1の発明の実施例と同様であ
る。
施例と同様にこのフィードバック像に基づいて入力像を
修正し、これを再び変換部A24へと送る。このループ
は、マッチングによる類似度があらかじめ定めておいた
しきい値を越えるまで繰り返され、また、あらかじめ定
めておいた繰り返し回数に達しても十分な類似度が得ら
れない場合には、次順位のものへ候補パタンを変えて同
様の操作を続ける点も第1の発明の実施例と同様であ
る。
【0043】この実施例では、フィードバック像I′ま
での逆変換を行い、入力の修正処理を行っているが、逆
変換部A28におけるP1′(k* 1,X* )までの逆
変換までしか行わず、これを用いて、入力像から計算さ
れたP1(k* 1,X* )に修正処理を行い、マッチン
グ処理、修正処理のループを回すことも可能である。さ
らに、P1までのループを何回か回してP1′を安定さ
せてから、フィードバック像I′までのループを回すと
いう組合せ処理を行うバリエーションも可能である。
での逆変換を行い、入力の修正処理を行っているが、逆
変換部A28におけるP1′(k* 1,X* )までの逆
変換までしか行わず、これを用いて、入力像から計算さ
れたP1(k* 1,X* )に修正処理を行い、マッチン
グ処理、修正処理のループを回すことも可能である。さ
らに、P1までのループを何回か回してP1′を安定さ
せてから、フィードバック像I′までのループを回すと
いう組合せ処理を行うバリエーションも可能である。
【0044】第1の発明の実施例においては、最初に像
全体のフーリエ変換を行うため、背景ノイズが対象とす
るパタンと同じ空間周波数成分を持つような場合にはノ
イズ抑制が難しくなる場合もある。第2の発明の実施例
では、変換の中間表現として場所ごとの空間周波数の分
布であるP1(k* 1,X* )が計算されるため、たと
えノイズがパタンと同じ空間周波数成分を持っていたと
しても、それがパタンとは離れた位置にあれば抑制する
ことが可能になる。
全体のフーリエ変換を行うため、背景ノイズが対象とす
るパタンと同じ空間周波数成分を持つような場合にはノ
イズ抑制が難しくなる場合もある。第2の発明の実施例
では、変換の中間表現として場所ごとの空間周波数の分
布であるP1(k* 1,X* )が計算されるため、たと
えノイズがパタンと同じ空間周波数成分を持っていたと
しても、それがパタンとは離れた位置にあれば抑制する
ことが可能になる。
【0045】図3は、第3の発明の一実施例を示す構成
図である。図3に示す実施例は、イメージスキャナーも
しくはテレビカメラなどを利用する画像入力部31と、
データをディジタル化してエッジ強調などの必要な前処
理をする前処理部32と、入力像を複素対数変換を施し
た座標軸上でのパタンへと変換する変換部C33と、変
換部C33の出力パタンを格納するイメージメモリ34
と、このパタンに対して多段の階層的なフーリエ変換を
行い、小さな位置ずれおよび回転、拡大縮小変化に対し
て近似的に不変なパタンに入力を変換する変換部D35
と、変換部D35の出力と標準パタンとのテンプレート
マッチングを行ってパタン判定、候補パタンの決定を行
うマッチング部36と、マッチング部36で決まった候
補パタンおよび変換部D35のデータから変換部D35
の逆変換を行う逆変換部D37とを備えている。
図である。図3に示す実施例は、イメージスキャナーも
しくはテレビカメラなどを利用する画像入力部31と、
データをディジタル化してエッジ強調などの必要な前処
理をする前処理部32と、入力像を複素対数変換を施し
た座標軸上でのパタンへと変換する変換部C33と、変
換部C33の出力パタンを格納するイメージメモリ34
と、このパタンに対して多段の階層的なフーリエ変換を
行い、小さな位置ずれおよび回転、拡大縮小変化に対し
て近似的に不変なパタンに入力を変換する変換部D35
と、変換部D35の出力と標準パタンとのテンプレート
マッチングを行ってパタン判定、候補パタンの決定を行
うマッチング部36と、マッチング部36で決まった候
補パタンおよび変換部D35のデータから変換部D35
の逆変換を行う逆変換部D37とを備えている。
【0046】次に、第3の発明の実施例の動作について
説明する。第1の発明の実施例と同様に、画像入力部3
1から入力された画像情報は、前処理部32で必要な前
処理を受ける。次に、変換部C33は前処理部からの送
られてきたパタンI(x,y)に対して、 w=Log(z+a) x>0の場合 w=Log(z−a) x<0の場合 ;z=x+iy, w=u+iv, a:正の定数,
i=√−1 の複素対数変換で表される座標変換(x,y)→(u,
v)を行い、u−v軸上のパタンへと変更する。ここで
aは原点で対数関数が発散することを防ぐための正の定
数である。対数変換のよく知られた性質により、この処
理によって得られるパタンは、もとの像を拡大縮小ある
いは回転すると近似的に平行移動する。変換部C33で
処理を受けたパタンはイメージメモリ34に送られ格納
される。
説明する。第1の発明の実施例と同様に、画像入力部3
1から入力された画像情報は、前処理部32で必要な前
処理を受ける。次に、変換部C33は前処理部からの送
られてきたパタンI(x,y)に対して、 w=Log(z+a) x>0の場合 w=Log(z−a) x<0の場合 ;z=x+iy, w=u+iv, a:正の定数,
i=√−1 の複素対数変換で表される座標変換(x,y)→(u,
v)を行い、u−v軸上のパタンへと変更する。ここで
aは原点で対数関数が発散することを防ぐための正の定
数である。対数変換のよく知られた性質により、この処
理によって得られるパタンは、もとの像を拡大縮小ある
いは回転すると近似的に平行移動する。変換部C33で
処理を受けたパタンはイメージメモリ34に送られ格納
される。
【0047】次に、変換部D35がこのパタンを多数の
小領域に分割し、まず、各小領域ごとに像のフーリエ変
換とその振幅を計算する。ここで、もとの像の位置をず
らすと、各小領域の中の像も移動するが、もしも各小領
域での位置ずれの大きさが小領域の大きさよりも小さけ
れば、このような処理により得られるパタンは近似的に
不変である。
小領域に分割し、まず、各小領域ごとに像のフーリエ変
換とその振幅を計算する。ここで、もとの像の位置をず
らすと、各小領域の中の像も移動するが、もしも各小領
域での位置ずれの大きさが小領域の大きさよりも小さけ
れば、このような処理により得られるパタンは近似的に
不変である。
【0048】さらに、変換部D35では、このようにし
て得られた、像中の多数の位置における、ローカルなフ
ーリエ変換の振幅を新たにパタンとみなして、再び位置
変数に関するフーリエ変換を行い、その振幅を計算す
る。この処理は複素対数変換を受けたパタンに対して行
われることを除けば、第2の発明の実施例における数3
〜数6の処理とまったく同様である。
て得られた、像中の多数の位置における、ローカルなフ
ーリエ変換の振幅を新たにパタンとみなして、再び位置
変数に関するフーリエ変換を行い、その振幅を計算す
る。この処理は複素対数変換を受けたパタンに対して行
われることを除けば、第2の発明の実施例における数3
〜数6の処理とまったく同様である。
【0049】このような処理によって得られるパタンは
近似的に、複素対数変換を施した座標軸で表現された入
力像についてのフーリエ変換の振幅と同じ性質を持つの
で、この座標軸上でパタンを平行移動しても、すなわち
もとの入力像を拡大縮小、あるいは回転させても近似的
に不変である。従って以上の処理により、小さな位置ず
れおよび拡大縮小変換、回転に対してほぼ不変のパタン
が得られる。
近似的に、複素対数変換を施した座標軸で表現された入
力像についてのフーリエ変換の振幅と同じ性質を持つの
で、この座標軸上でパタンを平行移動しても、すなわち
もとの入力像を拡大縮小、あるいは回転させても近似的
に不変である。従って以上の処理により、小さな位置ず
れおよび拡大縮小変換、回転に対してほぼ不変のパタン
が得られる。
【0050】次に、マッチング部36においては、第1
の発明と同様に、ここまでの処理と同様の処理をあらか
じめ施しておいた標準パタンとのテンプレートマッチン
グを行う。逆変換部D37は、やはりマッチング部36
で決定された候補パタンをもとにフィードバック像の計
算を行う。逆変換部D37の処理は、第2の発明の実施
例における逆変換部A28においてP2′からフィード
バック像を計算する処理とまったく同じである。
の発明と同様に、ここまでの処理と同様の処理をあらか
じめ施しておいた標準パタンとのテンプレートマッチン
グを行う。逆変換部D37は、やはりマッチング部36
で決定された候補パタンをもとにフィードバック像の計
算を行う。逆変換部D37の処理は、第2の発明の実施
例における逆変換部A28においてP2′からフィード
バック像を計算する処理とまったく同じである。
【0051】イメージメモリ部34は、第1の発明の実
施例と同様にこのフィードバック像に基づいて入力像を
修正し、これを再び変換部D35へと送る。このループ
は、マッチングによる類似度があらかじめ定めておいた
しきい値を越えるまでくりかえされ、また、あらかじめ
定めておいた繰り返し回数に達しても十分な類似度が得
られない場合には、次順位のものへ候補パタンを変えて
同様の操作を続ける点は第1の発明の実施例と同様であ
る。
施例と同様にこのフィードバック像に基づいて入力像を
修正し、これを再び変換部D35へと送る。このループ
は、マッチングによる類似度があらかじめ定めておいた
しきい値を越えるまでくりかえされ、また、あらかじめ
定めておいた繰り返し回数に達しても十分な類似度が得
られない場合には、次順位のものへ候補パタンを変えて
同様の操作を続ける点は第1の発明の実施例と同様であ
る。
【0052】また、第2の発明の実施例のバリエーショ
ンで述べたように、多段のフーリエ変換すべての逆変換
を行わず、途中までの逆変換処理の結果を用いて修正処
理を行い、マッチング処理、修正処理のループを回すこ
とも可能である。さらに、これにフィードバック像まで
戻っての修正処理のループを組み合わせる処理が可能な
点も第2の発明の実施例と同様である。
ンで述べたように、多段のフーリエ変換すべての逆変換
を行わず、途中までの逆変換処理の結果を用いて修正処
理を行い、マッチング処理、修正処理のループを回すこ
とも可能である。さらに、これにフィードバック像まで
戻っての修正処理のループを組み合わせる処理が可能な
点も第2の発明の実施例と同様である。
【0053】
【発明の効果】以上説明したように本発明は、パタンの
拡大縮小、回転、位置ずれに対して強いパタン認識処理
を行うことができ、また、提示されるパタンに背景ノイ
ズが重畳している場合にも標準パタンとのマッチングが
大幅に改善され、精度の高いパタン認識処理を行うこと
ができるという効果を有する。
拡大縮小、回転、位置ずれに対して強いパタン認識処理
を行うことができ、また、提示されるパタンに背景ノイ
ズが重畳している場合にも標準パタンとのマッチングが
大幅に改善され、精度の高いパタン認識処理を行うこと
ができるという効果を有する。
【図1】第1の発明の一実施例を示す構成図である。
【図2】第2の発明の一実施例を示す構成図である。
【図3】第3の発明の一実施例を示す構成図である。
11,21,31 画像入力部 12,22,32 前処理部 13,23,34 イメージメモリ 14 変換部 15,26,36 マッチング部 16 逆変換部 24 変換部A 25 変換部B 27 逆変換部B 28 逆変換部A 33 変換部C 35 変換部D 37 逆変換部D
Claims (3)
- 【請求項1】入力画像に対してフーリエ・メラン変換を
施し、像を位置ずれ、拡大縮小、回転操作に対して不変
なパタンに変換する第1の変換部と、 第1の変換部より得られたパタンを標準パタンと比較し
て候補パタンを決めるマッチング部と、 候補パタンに対して第1の変換部による変換の逆変換を
施してフィードバック像を計算する第1の逆変換部と、 フィードバック像に基づいて入力像からパタンに無関係
の背景ノイズを除去するイメージメモリとを備え、 ループ処理の繰り返しによりパタン判定を行うことを特
徴とする画像信号の処理装置。 - 【請求項2】入力画像を小領域に分割して多段の階層的
なフーリエ変換を施し、像のフーリエ変換の振幅を求め
る処理によって像を位置ずれに対して不変なパタンに変
換する第2の変換部と、 第2の変換部より得られたパタンに対して拡張されたメ
ラン変換を施して拡大縮小、回転操作に対しても不変な
パタンに変換する第3の変換部と、 第3の変換部より得られたパタンを標準パタンと比較し
て候補パタンを決めるマッチング部と、 マッチング部で決まった候補パタンおよび第3の変換部
からのデータにより第3の変換部の逆変換を計算する第
2逆変換部と、 第2の逆変換部からのデータと第2の変換部からのデー
タによりフィードバック像を計算する第3の逆変換部
と、 フィードバック像に基づいて入力像からパタンに無関係
の背景ノイズを除去するイメージメモリとを備え、 ループ処理の繰り返しによりパタン判定を行うことを特
徴とする画像信号の処理装置。 - 【請求項3】入力画像に複素対数変換で表される座標変
換を施す第4の変換部と、 第4の変換部より得られたパタンを小領域に分割して多
段の階層的なフーリエ変換を施し、像のフーリエ変換の
振幅を求める処理によって像を小さい位置ずれ、拡大縮
小、回転操作に対して不変なパタンに変換する第5の変
換部と、 第5の変換部より得られたパタンを標準パタンと比較し
て候補パタンを決めるマッチング部と、 候補パタンに対して前記多段の階層的なフーリエ変換と
フーリエ変換の振幅計算の逆変換を施してフィードバッ
ク像を計算する第4の逆変換部と、 フィードバック像に基づいて入力像からパタンに無関係
の背景ノイズを除去するイメージメモリとを備え、 ループ処理の繰り返しによりパタン判定を行うことを特
徴とする画像信号の処理装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4181403A JPH0628476A (ja) | 1992-07-09 | 1992-07-09 | 画像信号の処理装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4181403A JPH0628476A (ja) | 1992-07-09 | 1992-07-09 | 画像信号の処理装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0628476A true JPH0628476A (ja) | 1994-02-04 |
Family
ID=16100150
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP4181403A Pending JPH0628476A (ja) | 1992-07-09 | 1992-07-09 | 画像信号の処理装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0628476A (ja) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001036731A (ja) * | 1999-07-21 | 2001-02-09 | Nec Corp | デジタル画像処理方法、デジタル画像処理装置、および記録媒体 |
| JP2002298124A (ja) * | 2001-03-29 | 2002-10-11 | Toshiba Corp | パターン欠陥検査装置 |
| JP2003067739A (ja) * | 2001-08-28 | 2003-03-07 | Monolith Co Ltd | 画像変換方法および装置 |
| JP2010134957A (ja) * | 1999-03-03 | 2010-06-17 | Fr Telecom | パターン認識方法 |
| WO2010092952A1 (ja) * | 2009-02-10 | 2010-08-19 | 公立大学法人大阪府立大学 | パターン認識装置 |
| JP2018174979A (ja) * | 2017-04-03 | 2018-11-15 | 株式会社ユニバーサルエンターテインメント | 遊技機及び遊技用装置 |
-
1992
- 1992-07-09 JP JP4181403A patent/JPH0628476A/ja active Pending
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010134957A (ja) * | 1999-03-03 | 2010-06-17 | Fr Telecom | パターン認識方法 |
| JP2001036731A (ja) * | 1999-07-21 | 2001-02-09 | Nec Corp | デジタル画像処理方法、デジタル画像処理装置、および記録媒体 |
| JP2002298124A (ja) * | 2001-03-29 | 2002-10-11 | Toshiba Corp | パターン欠陥検査装置 |
| JP2003067739A (ja) * | 2001-08-28 | 2003-03-07 | Monolith Co Ltd | 画像変換方法および装置 |
| WO2010092952A1 (ja) * | 2009-02-10 | 2010-08-19 | 公立大学法人大阪府立大学 | パターン認識装置 |
| US8422793B2 (en) | 2009-02-10 | 2013-04-16 | Osaka Prefecture University Public Corporation | Pattern recognition apparatus |
| JP5522408B2 (ja) * | 2009-02-10 | 2014-06-18 | 公立大学法人大阪府立大学 | パターン認識装置 |
| JP2018174979A (ja) * | 2017-04-03 | 2018-11-15 | 株式会社ユニバーサルエンターテインメント | 遊技機及び遊技用装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7450765B2 (en) | Increasing accuracy of discrete curve transform estimates for curve matching in higher dimensions | |
| US7158677B2 (en) | Matching of discrete curves under affine transforms | |
| JP5082637B2 (ja) | 画像処理プログラム、画像処理方法及び画像処理装置 | |
| US20030185445A1 (en) | Method for extracting and matching gesture features of image | |
| JP6612822B2 (ja) | モデルを修正するためのシステムおよび方法 | |
| CN110533601A (zh) | 一种激光光斑中心位置及轮廓获取方法 | |
| JP4527885B2 (ja) | フーリエ変換の相関による回転の修正および重複イメージの識別 | |
| JP3054682B2 (ja) | 画像処理方法 | |
| JPH0628476A (ja) | 画像信号の処理装置 | |
| JPH06274619A (ja) | 画像処理装置 | |
| JP5945823B2 (ja) | 画像処理方法および画像処理装置 | |
| EP3522115A1 (en) | Medium recognition device and medium recognition method | |
| JP4509512B2 (ja) | スキュー検知 | |
| JP2992446B2 (ja) | 画像認識方法およびその装置 | |
| So et al. | Implementation of a High-speed Template Matching System for Wafer-vision Alignment Using FPGA. | |
| JPH05174182A (ja) | 文書傾き角検出方法および文書傾き角検出装置 | |
| JP3304404B2 (ja) | 傾き検出方法および画像処理装置 | |
| JP2637711B2 (ja) | 半導体パターン幅測定装置 | |
| Chen et al. | A new objective evaluation method on image edge detection | |
| JP3693147B2 (ja) | 画像照合方法、装置及び記録媒体 | |
| JP2829968B2 (ja) | 波形照合方法 | |
| JP2006023976A (ja) | パラメータ設定方法、画像パターン抽出方法、パラメータ設定装置、画像パターン抽出装置、およびこれら方法のプログラム | |
| JP3080102B2 (ja) | データ処理方法および装置 | |
| JPS63198168A (ja) | 線図形折線化装置 | |
| JP6904922B2 (ja) | 情報処理装置及びプログラム |