JPH03225482A - 目標物体の位置と大きさを表現するニューラルネットワーク - Google Patents
目標物体の位置と大きさを表現するニューラルネットワークInfo
- Publication number
- JPH03225482A JPH03225482A JP2018941A JP1894190A JPH03225482A JP H03225482 A JPH03225482 A JP H03225482A JP 2018941 A JP2018941 A JP 2018941A JP 1894190 A JP1894190 A JP 1894190A JP H03225482 A JPH03225482 A JP H03225482A
- Authority
- JP
- Japan
- Prior art keywords
- input
- neuron unit
- size
- dimensional image
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Image Analysis (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
「目 的」
[産業上の利用分野]
本発明は、画像認識やパターン認識等に使用され、目標
物体の位置、大きさ及びその両方を表現するニューラル
ネットワークに関する。
物体の位置、大きさ及びその両方を表現するニューラル
ネットワークに関する。
[従来の技術]
近年、脳を模倣したニューラルネットワークの研究が盛
んになり、各方面で応用が試みられている。ニューラル
ネットワークのモデルの−っである階層型構造をもつパ
ックプロパゲーションモデル(以下BPモデルという)
は、その学習能力及び非線型関数の近似能力等のために
、手書き文字等のパターン認識への応用が試みられてい
る。従来のBPモデルに基づくニューラルネットワーク
では、認識対象であるパターンの変形、ノイズ等に対し
ては強い、即ち補正が正しく行えるが、学習パターンか
らの位置ずれ、大きさのずれに対しては殆ど考慮されて
いない。即ち、従来のBPモデルでは、位置ずれ、大き
さずれの解消は達成されていない。
んになり、各方面で応用が試みられている。ニューラル
ネットワークのモデルの−っである階層型構造をもつパ
ックプロパゲーションモデル(以下BPモデルという)
は、その学習能力及び非線型関数の近似能力等のために
、手書き文字等のパターン認識への応用が試みられてい
る。従来のBPモデルに基づくニューラルネットワーク
では、認識対象であるパターンの変形、ノイズ等に対し
ては強い、即ち補正が正しく行えるが、学習パターンか
らの位置ずれ、大きさのずれに対しては殆ど考慮されて
いない。即ち、従来のBPモデルでは、位置ずれ、大き
さずれの解消は達成されていない。
[当該発明が解決しようとする課題3
以上のようにBPモデルは、目標パターンの状態によっ
ては位置や大きさを正しく検出できないという問題があ
った。
ては位置や大きさを正しく検出できないという問題があ
った。
本発明は、二次元視野内にある目標パターンの位置、大
きさ及びその両方を正確に検出できるニューラルネット
ワークを提供することを目的とする。
きさ及びその両方を正確に検出できるニューラルネット
ワークを提供することを目的とする。
「構 成」
[課題を解決するための手段]
本発明に係る目標物体の位置を表現するニューラルネッ
トワークは、ニューロン間の結合と学習則とを規定した
BPモデルにおいて、格子状に分割された入力二次元画
像を各々の格子の強度信号として入力する入力層のニュ
ーロンユニットと、前記入力二次元画像の目的とするパ
ターンの位置を出力する出力層のニューロンユニットと
、前記入力層のニューロンユニットと前記出力層のニュ
ーロンユニット間に設けられた中間層のニューロンユニ
ットとからなり、前記入力二次元画像上に存在する任意
の形状と大きさを有する前記パターンの位置を検出する
ことを特徴とする。
トワークは、ニューロン間の結合と学習則とを規定した
BPモデルにおいて、格子状に分割された入力二次元画
像を各々の格子の強度信号として入力する入力層のニュ
ーロンユニットと、前記入力二次元画像の目的とするパ
ターンの位置を出力する出力層のニューロンユニットと
、前記入力層のニューロンユニットと前記出力層のニュ
ーロンユニット間に設けられた中間層のニューロンユニ
ットとからなり、前記入力二次元画像上に存在する任意
の形状と大きさを有する前記パターンの位置を検出する
ことを特徴とする。
本発明に係る目標物体の大きさを表現するニュラルネッ
トワークは、ニューロン間の結合と学習則とを規定した
BPモデルにおいて、格子状に分割された入力二次元画
像を各々の格子の強度信号として入力する入力層のニュ
ーロンユニットと、前記入力二次元画像の目的とするパ
ターンの大きさを出力する出力層のニューロンユニット
と、前記入力層のニューロンユニットと前記出方層のニ
ューロンユニット間に設けられた中間層のニュロンユニ
ットとからなり、前記入力二次元画像上に存在する任意
の形状と大きさを有する前記パターンの大きさを検出す
ることを特徴とする。
トワークは、ニューロン間の結合と学習則とを規定した
BPモデルにおいて、格子状に分割された入力二次元画
像を各々の格子の強度信号として入力する入力層のニュ
ーロンユニットと、前記入力二次元画像の目的とするパ
ターンの大きさを出力する出力層のニューロンユニット
と、前記入力層のニューロンユニットと前記出方層のニ
ューロンユニット間に設けられた中間層のニュロンユニ
ットとからなり、前記入力二次元画像上に存在する任意
の形状と大きさを有する前記パターンの大きさを検出す
ることを特徴とする。
本発明に係る目標物体の位置と大きさを表現するニュー
ラルネットワークは、ニューロン間の結合と学習則とを
規定したBPモデルにおいて、格子状に分割された入力
二次元画像を各々の格子の強度信号として入力する第1
入力層のニューロンユニットと、前記入力二次元画像の
目的とするパターンの大きさを出力する第1出力層のニ
ューロンユニットと、前記第1入力層のニューロンユニ
ットと前記第1出力層のニューロンユニット間に設けら
れた第1中間層のニューロンユニットとからなり、前記
入力二次元画像上に存在する任意の形状と大きさを有す
る前記パターンの大きさを検出する位置ネットと、格子
状に分割された入力二次元画像を各々の格子の強度信号
として入力する第2入力層のニューロンユニットと、前
記入力二次元画像の目的とするパターンの大きさを出力
する第2出力層のニューロンユニットと、前記第1入力
層のニューロンユニットと前記第2出力層のニューロン
ユニット間に設けられた第2中間層のニューロンユニッ
トとからなり、前記入力二次元画像上に存在する任意の
形状と大きさを有する前記パターンの大きさを検出する
大きさネットとからなることを特徴とする。
ラルネットワークは、ニューロン間の結合と学習則とを
規定したBPモデルにおいて、格子状に分割された入力
二次元画像を各々の格子の強度信号として入力する第1
入力層のニューロンユニットと、前記入力二次元画像の
目的とするパターンの大きさを出力する第1出力層のニ
ューロンユニットと、前記第1入力層のニューロンユニ
ットと前記第1出力層のニューロンユニット間に設けら
れた第1中間層のニューロンユニットとからなり、前記
入力二次元画像上に存在する任意の形状と大きさを有す
る前記パターンの大きさを検出する位置ネットと、格子
状に分割された入力二次元画像を各々の格子の強度信号
として入力する第2入力層のニューロンユニットと、前
記入力二次元画像の目的とするパターンの大きさを出力
する第2出力層のニューロンユニットと、前記第1入力
層のニューロンユニットと前記第2出力層のニューロン
ユニット間に設けられた第2中間層のニューロンユニッ
トとからなり、前記入力二次元画像上に存在する任意の
形状と大きさを有する前記パターンの大きさを検出する
大きさネットとからなることを特徴とする。
本発明に係る目標物体の位置と大きさを表現するニュー
ラルネットワークは、ニューロン間の結合と学習則とを
規定したBPモデルにおいて、格子状に分割された入力
二次元画像を各々の格子の強度信号として入力する第1
入力層のニューロンユニットと、前記入力二次元画像の
目的とするパターンの大きさを出力する第1出力層のニ
ューロンユニットと、前記第1入力層のニューロンユニ
ットと前記第1出力層のニューロンユニット間に設けら
れた第1中間層のニューロンユニットとからなり、前記
入力二次元画像上に存在する任意の形状と大きさを有す
る前記パターンの大きさを検出する位置ネットと、格子
状に分割された入力二次元画像を各々の格子の強度信号
として入力する第2入力層のニューロンユニットと、前
記入力二次元画像の目的とするパターンの大きさを出力
する第2出力層のニューロンユニットと、前記第2入力
層のニューロンユニットと前記第2出力層のニューロン
ユニット間に設けられた第2中間層のニューロンユニッ
トとからなり、前記入力二次元画像上に存在する任意の
形状と大きさを有する前記パターンの大きさを検出する
大きさネットと、格子状に分割された入力二次元画像を
各々の格子の強度信号として入力する第3入力層のニュ
ーロンユニットと、上下左右の4方向に対応した各ニュ
ーロンユニットに対して枠を内側に動かす場合には0を
、外側に動かす場合には1を教師の値とする第3出力層
のニューロンユニットと、前記第3入力層のニューロン
ユニットと前記第3出力層のニューロンユニット間に設
けられた第3中間層のニューロンユニットとからなり、
前記位置ネットと大きさネットの出力に基づいて生成さ
れた枠の補正を行い前記パターンの存在範囲を絞り込む
ことができる枠取りネットとからなることを特徴とする [作 用] 位置、大きさ、枠取りは従来のパターン認識でも特徴抽
出の前処理に、正規化処理として考慮されていたもので
あるが、いづれも番地指定メモリに対する逐次処理を前
提としている。本発明の大きな特徴は、これらの前処理
も並列処理に基づいたパターン変換の問題としてとらえ
、それをネットワークの学習として実現している点にあ
る。
ラルネットワークは、ニューロン間の結合と学習則とを
規定したBPモデルにおいて、格子状に分割された入力
二次元画像を各々の格子の強度信号として入力する第1
入力層のニューロンユニットと、前記入力二次元画像の
目的とするパターンの大きさを出力する第1出力層のニ
ューロンユニットと、前記第1入力層のニューロンユニ
ットと前記第1出力層のニューロンユニット間に設けら
れた第1中間層のニューロンユニットとからなり、前記
入力二次元画像上に存在する任意の形状と大きさを有す
る前記パターンの大きさを検出する位置ネットと、格子
状に分割された入力二次元画像を各々の格子の強度信号
として入力する第2入力層のニューロンユニットと、前
記入力二次元画像の目的とするパターンの大きさを出力
する第2出力層のニューロンユニットと、前記第2入力
層のニューロンユニットと前記第2出力層のニューロン
ユニット間に設けられた第2中間層のニューロンユニッ
トとからなり、前記入力二次元画像上に存在する任意の
形状と大きさを有する前記パターンの大きさを検出する
大きさネットと、格子状に分割された入力二次元画像を
各々の格子の強度信号として入力する第3入力層のニュ
ーロンユニットと、上下左右の4方向に対応した各ニュ
ーロンユニットに対して枠を内側に動かす場合には0を
、外側に動かす場合には1を教師の値とする第3出力層
のニューロンユニットと、前記第3入力層のニューロン
ユニットと前記第3出力層のニューロンユニット間に設
けられた第3中間層のニューロンユニットとからなり、
前記位置ネットと大きさネットの出力に基づいて生成さ
れた枠の補正を行い前記パターンの存在範囲を絞り込む
ことができる枠取りネットとからなることを特徴とする [作 用] 位置、大きさ、枠取りは従来のパターン認識でも特徴抽
出の前処理に、正規化処理として考慮されていたもので
あるが、いづれも番地指定メモリに対する逐次処理を前
提としている。本発明の大きな特徴は、これらの前処理
も並列処理に基づいたパターン変換の問題としてとらえ
、それをネットワークの学習として実現している点にあ
る。
この特徴によって、変形、ノイズに対しては学習パター
ンを工夫することで、人間の認識に近づけることが可能
となり、目標パターンの位置と大きさを正確に検出でき
る。
ンを工夫することで、人間の認識に近づけることが可能
となり、目標パターンの位置と大きさを正確に検出でき
る。
即ち、本発明の位置ネットでは、視野内にあるパターン
の位置を検出する問題を、BPモデルによるパターン変
換として解くことができ、本発明の大きさネットでは、
視野内にあるパターンの大きさを検出する問題を、BP
モデルによるパターン変換として解くことができるので
、目標パターンの位置と大きさを正確に検出できる。
の位置を検出する問題を、BPモデルによるパターン変
換として解くことができ、本発明の大きさネットでは、
視野内にあるパターンの大きさを検出する問題を、BP
モデルによるパターン変換として解くことができるので
、目標パターンの位置と大きさを正確に検出できる。
なお、本発明に使用している枠取りネットは、パターン
に外接するおおよその枠を設定し、生成された枠の補正
を行い、パターンの存在範囲を絞り込むことができるの
で、目標パターンの位置と大きさの補正を行う機能を学
習により獲得でき、ノイズによる影響を除去できる。
に外接するおおよその枠を設定し、生成された枠の補正
を行い、パターンの存在範囲を絞り込むことができるの
で、目標パターンの位置と大きさの補正を行う機能を学
習により獲得でき、ノイズによる影響を除去できる。
[実施例]
第1図を参照して、本発明の位置ネットの実施例を説明
する。第1(a)図は、入力二次元画像を示していて、
X方向に6分割、X方向に6分割されており、計36個
の格子に分割されている。この各格子からの入力信号は
、第1(b)図に示す36個の入力層のニューロンユニ
ットに入力される。中間層の40個のニューロンユニッ
トは入力層のニューロンユニットにネットワーク状に接
続され、かつx−y直交座標に対応させた出力層の2個
のニューロンユニットにネットワーク状に接続されてい
る。この位置ネットはパターンの位置、例えば重心(x
、y)を検出するものである。
する。第1(a)図は、入力二次元画像を示していて、
X方向に6分割、X方向に6分割されており、計36個
の格子に分割されている。この各格子からの入力信号は
、第1(b)図に示す36個の入力層のニューロンユニ
ットに入力される。中間層の40個のニューロンユニッ
トは入力層のニューロンユニットにネットワーク状に接
続され、かつx−y直交座標に対応させた出力層の2個
のニューロンユニットにネットワーク状に接続されてい
る。この位置ネットはパターンの位置、例えば重心(x
、y)を検出するものである。
第2図を参照して、本発明の大きさネットの実施例を説
明する。第2(a)図は、入力二次元画像を示していて
、X方向に6分割、X方向に6分割されており、計36
個の格子に分割されている。
明する。第2(a)図は、入力二次元画像を示していて
、X方向に6分割、X方向に6分割されており、計36
個の格子に分割されている。
この各格子からの入力信号は、第2(b)図に示す36
個の入力層のニューロンユニットに入力される。中間層
の40個のニューロンユニットは入力層のニューロンユ
ニットにネットワーク状に接続され、かつ目標パターン
に外接した正方形の一片に対応させた出力層の1個のニ
ューロンユニットに接続されている。この大きさネット
はパターンの大きさ、例えばパターンを取り囲む正方形
の一辺の長さdを検出するものである。
個の入力層のニューロンユニットに入力される。中間層
の40個のニューロンユニットは入力層のニューロンユ
ニットにネットワーク状に接続され、かつ目標パターン
に外接した正方形の一片に対応させた出力層の1個のニ
ューロンユニットに接続されている。この大きさネット
はパターンの大きさ、例えばパターンを取り囲む正方形
の一辺の長さdを検出するものである。
第3図を参照して、本発明の枠取りネットの実施例を説
明する。第3(a)図は、入力二次元画像を示していて
、X方向に6分割、X方向に6分割されており、計36
個の格子に分割されている。
明する。第3(a)図は、入力二次元画像を示していて
、X方向に6分割、X方向に6分割されており、計36
個の格子に分割されている。
この各格子からの入力信号は、第3(b)図に示す36
個の入力層のニューロンユニットに入力される。中間層
の40個のニューロンユニットは入力層のニューロンユ
ニットにネットワーク状に接続され、かつ上下左右の4
方向に対応させた出力層の4個のニューロンユニットに
接続されている。
個の入力層のニューロンユニットに入力される。中間層
の40個のニューロンユニットは入力層のニューロンユ
ニットにネットワーク状に接続され、かつ上下左右の4
方向に対応させた出力層の4個のニューロンユニットに
接続されている。
この枠取りネットは上下左右4方向に対し、枠がらはみ
出していると考えられる方向の成分を1とし、他を0と
して出力する。そして、1のときは枠を内側に移動させ
、0のときは枠を外側に移動する。
出していると考えられる方向の成分を1とし、他を0と
して出力する。そして、1のときは枠を内側に移動させ
、0のときは枠を外側に移動する。
第4図を参照して、位置ネッと、大きさネットを応用し
たパターン認識アーキテクチャについて説明する。本発
明のパターン認識アーキテクチャは、第4図に示すよう
に、位置ネッと、大きさネッと、枠取りネッと、認識ネ
ットという4つのネットワークを核として構成されるも
のである。
たパターン認識アーキテクチャについて説明する。本発
明のパターン認識アーキテクチャは、第4図に示すよう
に、位置ネッと、大きさネッと、枠取りネッと、認識ネ
ットという4つのネットワークを核として構成されるも
のである。
第4図の参照符号1oの部分の2つのネットワークは、
入力画像に存在する1つのパターンの位置及び大きさを
それぞれ抽出する。2つのネットワークは並列に用いら
れ、位置ネットはパターンの位置を抽出する機能のみを
有し、大きさネットはパターンの大きさを抽出する機能
のみを有する。
入力画像に存在する1つのパターンの位置及び大きさを
それぞれ抽出する。2つのネットワークは並列に用いら
れ、位置ネットはパターンの位置を抽出する機能のみを
有し、大きさネットはパターンの大きさを抽出する機能
のみを有する。
得られた位置ネッと、大きさネットの出力に基づいて入
力画像に存在するパターンに枠をはめる。
力画像に存在するパターンに枠をはめる。
次に、位置ネッと、大きさネットの出力に基づいて生成
した枠の精度をさらに上げるために、参照符号12で示
す部分に於いて、枠取りネットを繰り返し数回用いるこ
とにより、パターンの存在範囲を少しずつ絞り込んでい
く処理を行う。その後、枠取りネットの出力に基づいて
補正した枠内の画像を認識ネットへの入力とする。
した枠の精度をさらに上げるために、参照符号12で示
す部分に於いて、枠取りネットを繰り返し数回用いるこ
とにより、パターンの存在範囲を少しずつ絞り込んでい
く処理を行う。その後、枠取りネットの出力に基づいて
補正した枠内の画像を認識ネットへの入力とする。
そして、そのパターンが何であるか認識を行うのが、参
照符号14の部分であり、認識ネットの出力に基づいた
判断の結果が最終的な答えとなる。
照符号14の部分であり、認識ネットの出力に基づいた
判断の結果が最終的な答えとなる。
このとき、枠取りネットによって枠を変化させながら、
数回認識ネットの出力を見るのが望ましい。
数回認識ネットの出力を見るのが望ましい。
ここで用いたアーキテクチャは、4つのネットワークの
機能を分化し、単純化したところが特徴である。個々の
ネットワークの構造については第1図、第2図、第3図
及び第5図に示すように、いずれも3層BPモデルを基
準としている。以下にそれぞれのネットの機能及び特徴
を説明する。
機能を分化し、単純化したところが特徴である。個々の
ネットワークの構造については第1図、第2図、第3図
及び第5図に示すように、いずれも3層BPモデルを基
準としている。以下にそれぞれのネットの機能及び特徴
を説明する。
(a)位置ネット
二次元空間における画像情報を入力すれば、その中に存
在する、一つのパターンを抽出し、その位置座標(x、
y)を出力するネットワークが位置ネットである。ここ
で、位置ネットによって出力される”位置”とは、一般
にパターン認識で用いられる入力画像全体に対する”重
心”とは異なる。例えば、左上に大きく偏ったノイズが
重畳した場合、重心の座標は実際のパターンの位置より
も左上に大きくはずれたところになる。しかし、適正な
一般化が行われれば、ノイズがあっても提示されたパタ
ーンの存在位置に近づけることが可能である。
在する、一つのパターンを抽出し、その位置座標(x、
y)を出力するネットワークが位置ネットである。ここ
で、位置ネットによって出力される”位置”とは、一般
にパターン認識で用いられる入力画像全体に対する”重
心”とは異なる。例えば、左上に大きく偏ったノイズが
重畳した場合、重心の座標は実際のパターンの位置より
も左上に大きくはずれたところになる。しかし、適正な
一般化が行われれば、ノイズがあっても提示されたパタ
ーンの存在位置に近づけることが可能である。
(b)大きさネット
二次元空間における画像情報を入力すれば、そこに存在
する一つのパターンを抽出し、それを取り囲むことがで
きるような大きさをもつ正方形の一辺の長さdを出力す
るネットワークが、大きさネットである。この大きさネ
ットの出力に基づき、入カバターンに対して正方形の枠
をはめる。このとき、縦長、横長のパターンについても
正方形の枠を与えたが、必要ならば、大きさネットの出
力を長方形の縦、横の辺の長さ(2出力)とすればよい
ことも確認している。
する一つのパターンを抽出し、それを取り囲むことがで
きるような大きさをもつ正方形の一辺の長さdを出力す
るネットワークが、大きさネットである。この大きさネ
ットの出力に基づき、入カバターンに対して正方形の枠
をはめる。このとき、縦長、横長のパターンについても
正方形の枠を与えたが、必要ならば、大きさネットの出
力を長方形の縦、横の辺の長さ(2出力)とすればよい
ことも確認している。
(C)枠取りネット
位置ネッと、大きさネットの出力に基づいて生成された
枠の補正を行い、パターンの存在範囲を絞りこんでいく
機能をもつネットワークが枠取りネットである。枠内の
画像情報を入力とし、枠内に存在するパターンが、上下
左右各方向で枠に当たっているかどうか判定した結果を
出力する。各方向に対応するユニットの出力が1に近け
ればパターンが枠に当たっているので枠を内側へ移動さ
せ、それ以外ならば枠を外側に移動させる。
枠の補正を行い、パターンの存在範囲を絞りこんでいく
機能をもつネットワークが枠取りネットである。枠内の
画像情報を入力とし、枠内に存在するパターンが、上下
左右各方向で枠に当たっているかどうか判定した結果を
出力する。各方向に対応するユニットの出力が1に近け
ればパターンが枠に当たっているので枠を内側へ移動さ
せ、それ以外ならば枠を外側に移動させる。
(d)認識ネット
はめられた枠の中に存在するパターンが何であるか、そ
のカテゴリー分けを行うネットワークが認識ネットであ
る。第4図の10.12の部分で作られた枠内の画像情
報を入力すれば、そこに存在するパターンのカテゴリー
を出力する。
のカテゴリー分けを行うネットワークが認識ネットであ
る。第4図の10.12の部分で作られた枠内の画像情
報を入力すれば、そこに存在するパターンのカテゴリー
を出力する。
ところで、位置ネッと、大きさネットを基本にしたパタ
ーン認識アーキテクチャの有効性を示すために、 1“
から5″までの手書き数字を認識させる、計算機シミュ
レーションを行ったので、以下にその結果を記述する。
ーン認識アーキテクチャの有効性を示すために、 1“
から5″までの手書き数字を認識させる、計算機シミュ
レーションを行ったので、以下にその結果を記述する。
このシミュレーションで用いたネットワークは、いずれ
も3層構造であり、中間層及び出力層においては、各ユ
ニットの出力関数をシグモイド関数f (x) −1
/ (1+exp(−x)1とした。そして、各層に
おけるユニット数は、−膜化能力の評価を行った結果を
もとに、表1のように選定した。
も3層構造であり、中間層及び出力層においては、各ユ
ニットの出力関数をシグモイド関数f (x) −1
/ (1+exp(−x)1とした。そして、各層に
おけるユニット数は、−膜化能力の評価を行った結果を
もとに、表1のように選定した。
入力層 中間層 出力層
位置ネット 36402
大きさネット 36401
枠取りネット 36404
認識ネット 64505
表 1
ここで、位置ネッと、大きさネットでは入力画像を縦6
画素×横6画素、枠取りネットでは枠内の画像を6画素
×6画素、認識ネットでは枠内の画像を縦8画素X横8
画素に重みをつけて量子化を行ったものをそれぞれのネ
ットワークへの入力とする。
画素×横6画素、枠取りネットでは枠内の画像を6画素
×6画素、認識ネットでは枠内の画像を縦8画素X横8
画素に重みをつけて量子化を行ったものをそれぞれのネ
ットワークへの入力とする。
以上の設定によって、学習後のそれぞれのネットワーク
を用い、システムを構成した。位置、大きさを抽出した
後の枠取りネットによる補正の回数は10回とした。そ
の後、枠取りと認識を交互に繰り返し、認識ネットが3
回続けて同じ出力を出した場合、それを答えとして1回
の認識作業を終了させた。
を用い、システムを構成した。位置、大きさを抽出した
後の枠取りネットによる補正の回数は10回とした。そ
の後、枠取りと認識を交互に繰り返し、認識ネットが3
回続けて同じ出力を出した場合、それを答えとして1回
の認識作業を終了させた。
第6図はシミュレーション結果の例である。第6(a)
図はシステムへの入力、第6(b)図はその入力に対す
る出力、即ち認識ネットの出力である。
図はシステムへの入力、第6(b)図はその入力に対す
る出力、即ち認識ネットの出力である。
この結果を見ると、位置、大きさ、変形、ノイズに対し
て不変の変換がなされていることがわかる。
て不変の変換がなされていることがわかる。
また、従来のパターン認識手法では難しい塊状のノイズ
がのったものや、指定された領域外に書いたものにも対
応できていることがわかる。
がのったものや、指定された領域外に書いたものにも対
応できていることがわかる。
「効 果」
本発明によれば、二次元画面上に存在する任意の形状と
大きさを有するパターンのおおよその位置と大きさをそ
れぞれ検出する位置ネッと、大きさネットを設けたので
、ノイズの重畳、位置のずれ、大きさのずれに対して極
めてロバストで正確なパターンの認識が行える。
大きさを有するパターンのおおよその位置と大きさをそ
れぞれ検出する位置ネッと、大きさネットを設けたので
、ノイズの重畳、位置のずれ、大きさのずれに対して極
めてロバストで正確なパターンの認識が行える。
第1図は本発明の位置ネットの機能と構成を説明する図
、第2図は本発明の大きさネットの機能と構成を説明す
る図、第3図は本発明の枠取りネットの機能と構成を説
明する図、第4図は本発明のパターン認識アーキテクチ
ャの構成を説明する図、第5図は認識ネットの機能と構
成を説明する図、第6図は本発明の位置ネッと、大きさ
ネッと、枠取りネットを用いたパターン認識のシミュレ
ーション結果を示す図である。 10・・・位置ネットと大きさネットによる処理、12
・・・枠取りネットによる処理、 14・・・認識ネットによる処理
、第2図は本発明の大きさネットの機能と構成を説明す
る図、第3図は本発明の枠取りネットの機能と構成を説
明する図、第4図は本発明のパターン認識アーキテクチ
ャの構成を説明する図、第5図は認識ネットの機能と構
成を説明する図、第6図は本発明の位置ネッと、大きさ
ネッと、枠取りネットを用いたパターン認識のシミュレ
ーション結果を示す図である。 10・・・位置ネットと大きさネットによる処理、12
・・・枠取りネットによる処理、 14・・・認識ネットによる処理
Claims (4)
- (1)ニューロン間の結合と学習則とを規定したBPモ
デルにおいて、格子状に分割された入力二次元画像を各
々の格子の強度信号として入力する入力層のニューロン
ユニットと、前記入力二次元画像の目的とするパターン
の位置を出力する出力層のニューロンユニットと、前記
入力層のニューロンユニットと前記出力層のニューロン
ユニット間に設けられた中間層のニューロンユニットと
からなり、前記入力二次元画像上に存在する任意の形状
と大きさを有する前記パターンの位置を検出することを
特徴とする目標物体の位置を表現するニューラルネット
ワーク。 - (2)ニューロン間の結合と学習則とを規定したBPモ
デルにおいて、格子状に分割された入力二次元画像を各
々の格子の強度信号として入力する入力層のニューロン
ユニットと、前記入力二次元画像の目的とするパターン
の大きさを出力する出力層のニューロンユニットと、前
記入力層のニューロンユニットと前記出力層のニューロ
ンユニット間に設けられた中間層のニューロンユニット
とからなり、前記入力二次元画像上に存在する任意の形
状と大きさを有する前記パターンの大きさを検出するこ
とを特徴とする目標物体の大きさを表現するニューラル
ネットワーク。 - (3)ニューロン間の結合と学習則とを規定したBPモ
デルにおいて、格子状に分割された入力二次元画像を各
々の格子の強度信号として入力する第1入力層のニュー
ロンユニットと、前記入力二次元画像の目的とするパタ
ーンの大きさを出力する第1出力層のニューロンユニッ
トと、前記第1入力層のニューロンユニットと前記第1
出力層のニューロンユニット間に設けられた第1中間層
のニューロンユニットとからなり、前記入力二次元画像
上に存在する任意の形状と大きさを有する前記パターン
の大きさを検出する位置ネットと、格子状に分割された
入力二次元画像を各々の格子の強度信号として入力する
第2入力層のニューロンユニットと、前記入力二次元画
像の目的とするパターンの大きさを出力する第2出力層
のニューロンユニットと、前記第1入力層のニューロン
ユニットと前記第2出力層のニューロンユニット間に設
けられた第2中間層のニューロンユニットとからなり、
前記入力二次元画像上に存在する任意の形状と大きさを
有する前記パターンの大きさを検出する大きさネットと
からなることを特徴とする目標物体の位置と大きさを表
現するニューラルネットワーク。 - (4)ニューロン間の結合と学習則とを規定したBPモ
デルにおいて、格子状に分割された入力二次元画像を各
々の格子の強度信号として入力する第1入力層のニュー
ロンユニットと、前記入力二次元画像の目的とするパタ
ーンの大きさを出力する第1出力層のニューロンユニッ
トと、前記第1入力層のニューロンユニットと前記第1
出力層のニューロンユニット間に設けられた第1中間層
のニューロンユニットとからなり、前記入力二次元画像
上に存在する任意の形状と大きさを有する前記パターン
の大きさを検出する位置ネットと、格子状に分割された
入力二次元画像を各々の格子の強度信号として入力する
第2入力層のニューロンユニットと、前記入力二次元画
像の目的とするパターンの大きさを出力する第2出力層
のニューロンユニットと、前記第2入力層のニューロン
ユニットと前記第2出力層のニューロンユニット間に設
けられた第2中間層のニューロンユニットとからなり、
前記入力二次元画像上に存在する任意の形状と大きさを
有する前記パターンの大きさを検出する大きさネットと
、格子状に分割された入力二次元画像を各々の格子の強
度信号として入力する第3入力層のニューロンユニット
と、上下左右の4方向に対応した各ニューロンユニット
に対して枠を内側に動かす場合には0を、外側に動かす
場合には1を教師の値とする第3出力層のニューロンユ
ニットと、前記第3入力層のニューロンユニットと前記
第3出力層のニューロンユニット間に設けられた第3中
間層のニューロンユニットとからなり、前記位置ネット
と大きさネットの出力に基づいて生成された枠の補正を
行い前記パターンの存在範囲を絞り込むことができる枠
取りネットとからなることを特徴とする目標物体の位置
と大きさを表現するニューラルネットワーク。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018941A JPH0736200B2 (ja) | 1990-01-31 | 1990-01-31 | 目標物体の位置と大きさを表現するニューラルネットワーク |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018941A JPH0736200B2 (ja) | 1990-01-31 | 1990-01-31 | 目標物体の位置と大きさを表現するニューラルネットワーク |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH03225482A true JPH03225482A (ja) | 1991-10-04 |
| JPH0736200B2 JPH0736200B2 (ja) | 1995-04-19 |
Family
ID=11985669
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018941A Expired - Lifetime JPH0736200B2 (ja) | 1990-01-31 | 1990-01-31 | 目標物体の位置と大きさを表現するニューラルネットワーク |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0736200B2 (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06176159A (ja) * | 1992-12-10 | 1994-06-24 | Nec Corp | カラー画像対応型物体認識装置 |
| JP2008198078A (ja) * | 2007-02-15 | 2008-08-28 | Toyota Central R&D Labs Inc | 画像検出装置 |
| JP2018018384A (ja) * | 2016-07-29 | 2018-02-01 | ヤフー株式会社 | 推定装置、推定方法、及び推定プログラム |
-
1990
- 1990-01-31 JP JP2018941A patent/JPH0736200B2/ja not_active Expired - Lifetime
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06176159A (ja) * | 1992-12-10 | 1994-06-24 | Nec Corp | カラー画像対応型物体認識装置 |
| JP2008198078A (ja) * | 2007-02-15 | 2008-08-28 | Toyota Central R&D Labs Inc | 画像検出装置 |
| JP2018018384A (ja) * | 2016-07-29 | 2018-02-01 | ヤフー株式会社 | 推定装置、推定方法、及び推定プログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0736200B2 (ja) | 1995-04-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN111476219B (zh) | 智能家居环境中图像目标检测方法 | |
| Kussul et al. | Improved method of handwritten digit recognition tested on MNIST database | |
| CN109664300B (zh) | 一种基于力觉学习的机器人多风格书法临摹方法 | |
| Barros et al. | A multichannel convolutional neural network for hand posture recognition | |
| JP6159489B2 (ja) | 顔認証方法およびシステム | |
| Fukumi et al. | Rotation-invariant neural pattern recognition system estimating a rotation angle | |
| CN107358258A (zh) | 基于nsct双cnn通道和选择性注意机制的sar图像目标分类 | |
| CN117079098B (zh) | 一种基于位置编码的空间小目标检测方法 | |
| Türkyılmaz et al. | License plate recognition system using artificial neural networks | |
| CN110070115B (zh) | 一种单像素攻击样本生成方法、装置、设备及存储介质 | |
| CN107784303A (zh) | 车牌识别方法及装置 | |
| CN108108751A (zh) | 一种基于卷积多特征和深度随机森林的场景识别方法 | |
| CN111476188B (zh) | 基于特征金字塔的人群计数方法、系统、介质及电子设备 | |
| CN108665509A (zh) | 一种超分辨率重构方法、装置、设备及可读存储介质 | |
| CN107808376A (zh) | 一种基于深度学习的举手检测方法 | |
| Iacono et al. | Proto-object based saliency for event-driven cameras | |
| CN114972335A (zh) | 一种用于工业检测的图像分类方法、装置及计算机设备 | |
| CN106709431A (zh) | 虹膜识别方法及装置 | |
| CN118840322A (zh) | 一种基于深度学习的道路病害检测方法 | |
| CN117854155A (zh) | 一种人体骨骼动作识别方法及系统 | |
| EP3671635B1 (en) | Curvilinear object segmentation with noise priors | |
| CN110738213B (zh) | 一种包括周边环境的图像识别方法及装置 | |
| JPH03225482A (ja) | 目標物体の位置と大きさを表現するニューラルネットワーク | |
| CN113516676A (zh) | 角点检测方法、脉冲神经网络处理器、芯片及电子产品 | |
| Fukushima et al. | Symmetry axis extraction by a neural network |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
| R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
| R370 | Written measure of declining of transfer procedure |
Free format text: JAPANESE INTERMEDIATE CODE: R370 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
| R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| EXPY | Cancellation because of completion of term |