JPH03225482A

JPH03225482A - 目標物体の位置と大きさを表現するニューラルネットワーク

Info

Publication number: JPH03225482A
Application number: JP2018941A
Authority: JP
Inventors: Yoshiki Uchikawa; 内川　嘉樹; Kazuhisa Gohara; 一寿郷原
Original assignee: Nagoya University NUC
Current assignee: Nagoya University NUC
Priority date: 1990-01-31
Filing date: 1990-01-31
Publication date: 1991-10-04
Anticipated expiration: 2010-04-19
Also published as: JPH0736200B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】「目　的」［産業上の利用分野］本発明は、画像認識やパターン認識等に使用され、目標
物体の位置、大きさ及びその両方を表現するニューラル
ネットワークに関する。

［従来の技術］近年、脳を模倣したニューラルネットワークの研究が盛
んになり、各方面で応用が試みられている。ニューラル
ネットワークのモデルの−っである階層型構造をもつパ
ックプロパゲーションモデル（以下ＢＰモデルという）
は、その学習能力及び非線型関数の近似能力等のために
、手書き文字等のパターン認識への応用が試みられてい
る。従来のＢＰモデルに基づくニューラルネットワーク
では、認識対象であるパターンの変形、ノイズ等に対し
ては強い、即ち補正が正しく行えるが、学習パターンか
らの位置ずれ、大きさのずれに対しては殆ど考慮されて
いない。即ち、従来のＢＰモデルでは、位置ずれ、大き
さずれの解消は達成されていない。

［当該発明が解決しようとする課題３以上のようにＢＰモデルは、目標パターンの状態によっ
ては位置や大きさを正しく検出できないという問題があ
った。

本発明は、二次元視野内にある目標パターンの位置、大
きさ及びその両方を正確に検出できるニューラルネット
ワークを提供することを目的とする。

「構　成」［課題を解決するための手段］本発明に係る目標物体の位置を表現するニューラルネッ
トワークは、ニューロン間の結合と学習則とを規定した
ＢＰモデルにおいて、格子状に分割された入力二次元画
像を各々の格子の強度信号として入力する入力層のニュ
ーロンユニットと、前記入力二次元画像の目的とするパ
ターンの位置を出力する出力層のニューロンユニットと
、前記入力層のニューロンユニットと前記出力層のニュ
ーロンユニット間に設けられた中間層のニューロンユニ
ットとからなり、前記入力二次元画像上に存在する任意
の形状と大きさを有する前記パターンの位置を検出する
ことを特徴とする。

本発明に係る目標物体の大きさを表現するニュラルネッ
トワークは、ニューロン間の結合と学習則とを規定した
ＢＰモデルにおいて、格子状に分割された入力二次元画
像を各々の格子の強度信号として入力する入力層のニュ
ーロンユニットと、前記入力二次元画像の目的とするパ
ターンの大きさを出力する出力層のニューロンユニット
と、前記入力層のニューロンユニットと前記出方層のニ
ューロンユニット間に設けられた中間層のニュロンユニ
ットとからなり、前記入力二次元画像上に存在する任意
の形状と大きさを有する前記パターンの大きさを検出す
ることを特徴とする。

本発明に係る目標物体の位置と大きさを表現するニュー
ラルネットワークは、ニューロン間の結合と学習則とを
規定したＢＰモデルにおいて、格子状に分割された入力
二次元画像を各々の格子の強度信号として入力する第１
入力層のニューロンユニットと、前記入力二次元画像の
目的とするパターンの大きさを出力する第１出力層のニ
ューロンユニットと、前記第１入力層のニューロンユニ
ットと前記第１出力層のニューロンユニット間に設けら
れた第１中間層のニューロンユニットとからなり、前記
入力二次元画像上に存在する任意の形状と大きさを有す
る前記パターンの大きさを検出する位置ネットと、格子
状に分割された入力二次元画像を各々の格子の強度信号
として入力する第２入力層のニューロンユニットと、前
記入力二次元画像の目的とするパターンの大きさを出力
する第２出力層のニューロンユニットと、前記第１入力
層のニューロンユニットと前記第２出力層のニューロン
ユニット間に設けられた第２中間層のニューロンユニッ
トとからなり、前記入力二次元画像上に存在する任意の
形状と大きさを有する前記パターンの大きさを検出する
大きさネットとからなることを特徴とする。

本発明に係る目標物体の位置と大きさを表現するニュー
ラルネットワークは、ニューロン間の結合と学習則とを
規定したＢＰモデルにおいて、格子状に分割された入力
二次元画像を各々の格子の強度信号として入力する第１
入力層のニューロンユニットと、前記入力二次元画像の
目的とするパターンの大きさを出力する第１出力層のニ
ューロンユニットと、前記第１入力層のニューロンユニ
ットと前記第１出力層のニューロンユニット間に設けら
れた第１中間層のニューロンユニットとからなり、前記
入力二次元画像上に存在する任意の形状と大きさを有す
る前記パターンの大きさを検出する位置ネットと、格子
状に分割された入力二次元画像を各々の格子の強度信号
として入力する第２入力層のニューロンユニットと、前
記入力二次元画像の目的とするパターンの大きさを出力
する第２出力層のニューロンユニットと、前記第２入力
層のニューロンユニットと前記第２出力層のニューロン
ユニット間に設けられた第２中間層のニューロンユニッ
トとからなり、前記入力二次元画像上に存在する任意の
形状と大きさを有する前記パターンの大きさを検出する
大きさネットと、格子状に分割された入力二次元画像を
各々の格子の強度信号として入力する第３入力層のニュ
ーロンユニットと、上下左右の４方向に対応した各ニュ
ーロンユニットに対して枠を内側に動かす場合には０を
、外側に動かす場合には１を教師の値とする第３出力層
のニューロンユニットと、前記第３入力層のニューロン
ユニットと前記第３出力層のニューロンユニット間に設
けられた第３中間層のニューロンユニットとからなり、
前記位置ネットと大きさネットの出力に基づいて生成さ
れた枠の補正を行い前記パターンの存在範囲を絞り込む
ことができる枠取りネットとからなることを特徴とする［作　用］位置、大きさ、枠取りは従来のパターン認識でも特徴抽
出の前処理に、正規化処理として考慮されていたもので
あるが、いづれも番地指定メモリに対する逐次処理を前
提としている。本発明の大きな特徴は、これらの前処理
も並列処理に基づいたパターン変換の問題としてとらえ
、それをネットワークの学習として実現している点にあ
る。

この特徴によって、変形、ノイズに対しては学習パター
ンを工夫することで、人間の認識に近づけることが可能
となり、目標パターンの位置と大きさを正確に検出でき
る。

即ち、本発明の位置ネットでは、視野内にあるパターン
の位置を検出する問題を、ＢＰモデルによるパターン変
換として解くことができ、本発明の大きさネットでは、
視野内にあるパターンの大きさを検出する問題を、ＢＰ
モデルによるパターン変換として解くことができるので
、目標パターンの位置と大きさを正確に検出できる。

なお、本発明に使用している枠取りネットは、パターン
に外接するおおよその枠を設定し、生成された枠の補正
を行い、パターンの存在範囲を絞り込むことができるの
で、目標パターンの位置と大きさの補正を行う機能を学
習により獲得でき、ノイズによる影響を除去できる。

［実施例］第１図を参照して、本発明の位置ネットの実施例を説明
する。第１（ａ）図は、入力二次元画像を示していて、
Ｘ方向に６分割、Ｘ方向に６分割されており、計３６個
の格子に分割されている。この各格子からの入力信号は
、第１（ｂ）図に示す３６個の入力層のニューロンユニ
ットに入力される。中間層の４０個のニューロンユニッ
トは入力層のニューロンユニットにネットワーク状に接
続され、かつｘ−ｙ直交座標に対応させた出力層の２個
のニューロンユニットにネットワーク状に接続されてい
る。この位置ネットはパターンの位置、例えば重心（ｘ
、ｙ）を検出するものである。

第２図を参照して、本発明の大きさネットの実施例を説
明する。第２（ａ）図は、入力二次元画像を示していて
、Ｘ方向に６分割、Ｘ方向に６分割されており、計３６
個の格子に分割されている。

この各格子からの入力信号は、第２（ｂ）図に示す３６
個の入力層のニューロンユニットに入力される。中間層
の４０個のニューロンユニットは入力層のニューロンユ
ニットにネットワーク状に接続され、かつ目標パターン
に外接した正方形の一片に対応させた出力層の１個のニ
ューロンユニットに接続されている。この大きさネット
はパターンの大きさ、例えばパターンを取り囲む正方形
の一辺の長さｄを検出するものである。

第３図を参照して、本発明の枠取りネットの実施例を説
明する。第３（ａ）図は、入力二次元画像を示していて
、Ｘ方向に６分割、Ｘ方向に６分割されており、計３６
個の格子に分割されている。

この各格子からの入力信号は、第３（ｂ）図に示す３６
個の入力層のニューロンユニットに入力される。中間層
の４０個のニューロンユニットは入力層のニューロンユ
ニットにネットワーク状に接続され、かつ上下左右の４
方向に対応させた出力層の４個のニューロンユニットに
接続されている。

この枠取りネットは上下左右４方向に対し、枠がらはみ
出していると考えられる方向の成分を１とし、他を０と
して出力する。そして、１のときは枠を内側に移動させ
、０のときは枠を外側に移動する。

第４図を参照して、位置ネッと、大きさネットを応用し
たパターン認識アーキテクチャについて説明する。本発
明のパターン認識アーキテクチャは、第４図に示すよう
に、位置ネッと、大きさネッと、枠取りネッと、認識ネ
ットという４つのネットワークを核として構成されるも
のである。

第４図の参照符号１ｏの部分の２つのネットワークは、
入力画像に存在する１つのパターンの位置及び大きさを
それぞれ抽出する。２つのネットワークは並列に用いら
れ、位置ネットはパターンの位置を抽出する機能のみを
有し、大きさネットはパターンの大きさを抽出する機能
のみを有する。

得られた位置ネッと、大きさネットの出力に基づいて入
力画像に存在するパターンに枠をはめる。

次に、位置ネッと、大きさネットの出力に基づいて生成
した枠の精度をさらに上げるために、参照符号１２で示
す部分に於いて、枠取りネットを繰り返し数回用いるこ
とにより、パターンの存在範囲を少しずつ絞り込んでい
く処理を行う。その後、枠取りネットの出力に基づいて
補正した枠内の画像を認識ネットへの入力とする。

そして、そのパターンが何であるか認識を行うのが、参
照符号１４の部分であり、認識ネットの出力に基づいた
判断の結果が最終的な答えとなる。

このとき、枠取りネットによって枠を変化させながら、
数回認識ネットの出力を見るのが望ましい。

ここで用いたアーキテクチャは、４つのネットワークの
機能を分化し、単純化したところが特徴である。個々の
ネットワークの構造については第１図、第２図、第３図
及び第５図に示すように、いずれも３層ＢＰモデルを基
準としている。以下にそれぞれのネットの機能及び特徴
を説明する。

（ａ）位置ネット二次元空間における画像情報を入力すれば、その中に存
在する、一つのパターンを抽出し、その位置座標（ｘ、
ｙ）を出力するネットワークが位置ネットである。ここ
で、位置ネットによって出力される”位置”とは、一般
にパターン認識で用いられる入力画像全体に対する”重
心”とは異なる。例えば、左上に大きく偏ったノイズが
重畳した場合、重心の座標は実際のパターンの位置より
も左上に大きくはずれたところになる。しかし、適正な
一般化が行われれば、ノイズがあっても提示されたパタ
ーンの存在位置に近づけることが可能である。

（ｂ）大きさネット二次元空間における画像情報を入力すれば、そこに存在
する一つのパターンを抽出し、それを取り囲むことがで
きるような大きさをもつ正方形の一辺の長さｄを出力す
るネットワークが、大きさネットである。この大きさネ
ットの出力に基づき、入カバターンに対して正方形の枠
をはめる。このとき、縦長、横長のパターンについても
正方形の枠を与えたが、必要ならば、大きさネットの出
力を長方形の縦、横の辺の長さ（２出力）とすればよい
ことも確認している。

（Ｃ）枠取りネット位置ネッと、大きさネットの出力に基づいて生成された
枠の補正を行い、パターンの存在範囲を絞りこんでいく
機能をもつネットワークが枠取りネットである。枠内の
画像情報を入力とし、枠内に存在するパターンが、上下
左右各方向で枠に当たっているかどうか判定した結果を
出力する。各方向に対応するユニットの出力が１に近け
ればパターンが枠に当たっているので枠を内側へ移動さ
せ、それ以外ならば枠を外側に移動させる。

（ｄ）認識ネットはめられた枠の中に存在するパターンが何であるか、そ
のカテゴリー分けを行うネットワークが認識ネットであ
る。第４図の１０．１２の部分で作られた枠内の画像情
報を入力すれば、そこに存在するパターンのカテゴリー
を出力する。

ところで、位置ネッと、大きさネットを基本にしたパタ
ーン認識アーキテクチャの有効性を示すために、　１“
から５″までの手書き数字を認識させる、計算機シミュ
レーションを行ったので、以下にその結果を記述する。

このシミュレーションで用いたネットワークは、いずれ
も３層構造であり、中間層及び出力層においては、各ユ
ニットの出力関数をシグモイド関数ｆ　（ｘ）　　−１
／　　（１＋ｅｘｐ（−ｘ）１とした。そして、各層に
おけるユニット数は、−膜化能力の評価を行った結果を
もとに、表１のように選定した。

入力層　中間層　出力層位置ネット　　　３６４０２大きさネット　　３６４０１枠取りネット　　３６４０４認識ネット　　　６４５０５表　　　１ここで、位置ネッと、大きさネットでは入力画像を縦６
画素×横６画素、枠取りネットでは枠内の画像を６画素
×６画素、認識ネットでは枠内の画像を縦８画素Ｘ横８
画素に重みをつけて量子化を行ったものをそれぞれのネ
ットワークへの入力とする。

以上の設定によって、学習後のそれぞれのネットワーク
を用い、システムを構成した。位置、大きさを抽出した
後の枠取りネットによる補正の回数は１０回とした。そ
の後、枠取りと認識を交互に繰り返し、認識ネットが３
回続けて同じ出力を出した場合、それを答えとして１回
の認識作業を終了させた。

第６図はシミュレーション結果の例である。第６（ａ）
図はシステムへの入力、第６（ｂ）図はその入力に対す
る出力、即ち認識ネットの出力である。

この結果を見ると、位置、大きさ、変形、ノイズに対し
て不変の変換がなされていることがわかる。

また、従来のパターン認識手法では難しい塊状のノイズ
がのったものや、指定された領域外に書いたものにも対
応できていることがわかる。

「効　果」本発明によれば、二次元画面上に存在する任意の形状と
大きさを有するパターンのおおよその位置と大きさをそ
れぞれ検出する位置ネッと、大きさネットを設けたので
、ノイズの重畳、位置のずれ、大きさのずれに対して極
めてロバストで正確なパターンの認識が行える。

【図面の簡単な説明】

第１図は本発明の位置ネットの機能と構成を説明する図
、第２図は本発明の大きさネットの機能と構成を説明す
る図、第３図は本発明の枠取りネットの機能と構成を説
明する図、第４図は本発明のパターン認識アーキテクチ
ャの構成を説明する図、第５図は認識ネットの機能と構
成を説明する図、第６図は本発明の位置ネッと、大きさ
ネッと、枠取りネットを用いたパターン認識のシミュレ
ーション結果を示す図である。１０・・・位置ネットと大きさネットによる処理、１２
・・・枠取りネットによる処理、１４・・・認識ネットによる処理

Claims

【特許請求の範囲】

（１）ニューロン間の結合と学習則とを規定したＢＰモ
デルにおいて、格子状に分割された入力二次元画像を各
々の格子の強度信号として入力する入力層のニューロン
ユニットと、前記入力二次元画像の目的とするパターン
の位置を出力する出力層のニューロンユニットと、前記
入力層のニューロンユニットと前記出力層のニューロン
ユニット間に設けられた中間層のニューロンユニットと
からなり、前記入力二次元画像上に存在する任意の形状
と大きさを有する前記パターンの位置を検出することを
特徴とする目標物体の位置を表現するニューラルネット
ワーク。
（２）ニューロン間の結合と学習則とを規定したＢＰモ
デルにおいて、格子状に分割された入力二次元画像を各
々の格子の強度信号として入力する入力層のニューロン
ユニットと、前記入力二次元画像の目的とするパターン
の大きさを出力する出力層のニューロンユニットと、前
記入力層のニューロンユニットと前記出力層のニューロ
ンユニット間に設けられた中間層のニューロンユニット
とからなり、前記入力二次元画像上に存在する任意の形
状と大きさを有する前記パターンの大きさを検出するこ
とを特徴とする目標物体の大きさを表現するニューラル
ネットワーク。
（３）ニューロン間の結合と学習則とを規定したＢＰモ
デルにおいて、格子状に分割された入力二次元画像を各
々の格子の強度信号として入力する第１入力層のニュー
ロンユニットと、前記入力二次元画像の目的とするパタ
ーンの大きさを出力する第１出力層のニューロンユニッ
トと、前記第１入力層のニューロンユニットと前記第１
出力層のニューロンユニット間に設けられた第１中間層
のニューロンユニットとからなり、前記入力二次元画像
上に存在する任意の形状と大きさを有する前記パターン
の大きさを検出する位置ネットと、格子状に分割された
入力二次元画像を各々の格子の強度信号として入力する
第２入力層のニューロンユニットと、前記入力二次元画
像の目的とするパターンの大きさを出力する第２出力層
のニューロンユニットと、前記第１入力層のニューロン
ユニットと前記第２出力層のニューロンユニット間に設
けられた第２中間層のニューロンユニットとからなり、
前記入力二次元画像上に存在する任意の形状と大きさを
有する前記パターンの大きさを検出する大きさネットと
からなることを特徴とする目標物体の位置と大きさを表
現するニューラルネットワーク。
（４）ニューロン間の結合と学習則とを規定したＢＰモ
デルにおいて、格子状に分割された入力二次元画像を各
々の格子の強度信号として入力する第１入力層のニュー
ロンユニットと、前記入力二次元画像の目的とするパタ
ーンの大きさを出力する第１出力層のニューロンユニッ
トと、前記第１入力層のニューロンユニットと前記第１
出力層のニューロンユニット間に設けられた第１中間層
のニューロンユニットとからなり、前記入力二次元画像
上に存在する任意の形状と大きさを有する前記パターン
の大きさを検出する位置ネットと、格子状に分割された
入力二次元画像を各々の格子の強度信号として入力する
第２入力層のニューロンユニットと、前記入力二次元画
像の目的とするパターンの大きさを出力する第２出力層
のニューロンユニットと、前記第２入力層のニューロン
ユニットと前記第２出力層のニューロンユニット間に設
けられた第２中間層のニューロンユニットとからなり、
前記入力二次元画像上に存在する任意の形状と大きさを
有する前記パターンの大きさを検出する大きさネットと
、格子状に分割された入力二次元画像を各々の格子の強
度信号として入力する第３入力層のニューロンユニット
と、上下左右の４方向に対応した各ニューロンユニット
に対して枠を内側に動かす場合には０を、外側に動かす
場合には１を教師の値とする第３出力層のニューロンユ
ニットと、前記第３入力層のニューロンユニットと前記
第３出力層のニューロンユニット間に設けられた第３中
間層のニューロンユニットとからなり、前記位置ネット
と大きさネットの出力に基づいて生成された枠の補正を
行い前記パターンの存在範囲を絞り込むことができる枠
取りネットとからなることを特徴とする目標物体の位置
と大きさを表現するニューラルネットワーク。