JPH0736200B2 - 目標物体の位置と大きさを表現するニューラルネットワーク - Google Patents

目標物体の位置と大きさを表現するニューラルネットワーク

Info

Publication number
JPH0736200B2
JPH0736200B2 JP2018941A JP1894190A JPH0736200B2 JP H0736200 B2 JPH0736200 B2 JP H0736200B2 JP 2018941 A JP2018941 A JP 2018941A JP 1894190 A JP1894190 A JP 1894190A JP H0736200 B2 JPH0736200 B2 JP H0736200B2
Authority
JP
Japan
Prior art keywords
input
size
neuron unit
net
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2018941A
Other languages
English (en)
Other versions
JPH03225482A (ja
Inventor
嘉樹 内川
一寿 郷原
Original Assignee
名古屋大学長
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 名古屋大学長 filed Critical 名古屋大学長
Priority to JP2018941A priority Critical patent/JPH0736200B2/ja
Publication of JPH03225482A publication Critical patent/JPH03225482A/ja
Publication of JPH0736200B2 publication Critical patent/JPH0736200B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Description

【発明の詳細な説明】 「目的」 [産業上の利用分野] 本発明は、画像認識やパターン認識等に使用され、目標
物体の位置と大きさを表現するニューラルネットワーク
に関する。
[従来の技術] 近年、脳を模倣したニューラルネットワークの研究が盛
んになり、各方面で応用が試みられている。ニューラル
ネットワークのモデルの一つである階層型構造をもつバ
ックプロパゲーションモデル(以下BPモデルという)
は、その学習能力及び非線型関数の近似能力等のため
に、手書き文字等のパターン認識への応用が試みられて
いる。従来のBPモデルに基づくニューラルネットワーク
では、認識対象であるパターンの変形、ノイズ等に対し
ては強い、即ち補正が正しく行えるが、学習パターンか
らの位置ずれ、大きさのずれに対しては殆ど考慮されて
いない。即ち、従来のBPモデルでは、位置ずれ、大きさ
ずれの解消は達成されていない。
[当該発明が解決しようとする課題] 以上のようにBPモデルは、目標パターンの状態によって
は位置や大きさを正しく検出できないという問題があっ
た。
本発明は、二次元視野内にある目標パターンの位置と大
きさを正確に検出できるニューラルネットワークを提供
することを目的とする。
「構成」 [課題を解決するための手段] 本発明に係る目標物体の位置と大きさを表現するニュー
ラルネットワークは、ニューロン間の結合と学習則とを
規定したBPモデルにおいて、格子状に分割された入力二
次元画像を各々の格子の強度信号として入力する第1入
力層のニューロンユニットと、前記入力二次元画像の目
的とするパターンの位置を出力する第1出力層のニュー
ロンユニットと、前記第1入力層のニューロンユニット
と前記第1出力層のニューロンユニット間に設けられた
第1中間層のニューロンユニットとからなり、前記入力
二次元画像上に存在する任意の形状と大きさを有する前
記パターンの位置を検出する位置ネットと、格子状に分
割された入力二次元画像を各々の格子の強度信号として
入力する第2入力層のニューロンユニットと、前記入力
二次元画像の目的とするパターンの大きさを出力する第
2出力層のニューロンユニットと、前記第2入力層のニ
ューロンユニットと前記第2出力層のニューロンユニッ
ト間に設けられた第2中間層のニューロンユニットとか
らなり、前記入力二次元画像上に存在する任意の形状と
大きさを有する前記パターンの大きさを検出する大きさ
ネットとからなることを特徴とする。
本発明に係る目標物体の位置と大きさを表現するニュー
ラルネットワークは、ニューロン間の結合と学習則とを
規定したBPモデルにおいて、格子状に分割された入力二
次元画像を各々の格子の強度信号として入力する第1入
力層のニューロンユニットと、前記入力二次元画像の目
的とするパターンの位置を出力する第1出力層のニュー
ロンユニットと、前記第1入力層のニューロンユニット
と前記第1出力層のニューロンユニット間に設けられた
第1中間層のニューロンユニットとからなり、前記入力
二次元画像上に存在する任意の形状と大きさを有する前
記パターンの位置を検出する位置ネットと、格子状に分
割された入力二次元画像を各々の格子の強度信号として
入力する第2入力層のニューロンユニットと、前記入力
二次元画像の目的とするパターンの大きさを出力する第
2出力層のニューロンユニットと、前記第2入力層のニ
ューロンユニットと前記第2出力層のニューロンユニッ
ト間に設けられた第2中間層のニューロンユニットとか
らなり、前記入力二次元画像上に存在する任意の形状と
大きさを有する前記パターンの大きさを検出する大きさ
ネットと、格子状に分割された入力二次元画像を各々の
格子の強度信号として入力する第3入力層のニューロン
ユニットと、上下左右の4方向に対応した各ニューロン
ユニットに対して枠を内側に動かす場合には0を、外側
に動かす場合には1を教師の値とする第3出力層のニュ
ーロンユニットと、前記第3入力層のニューロンユニッ
トと前記第3出力層のニューロンユニット間に設けられ
た第3中間層のニューロンユニットとからなり、前記位
置ネットと大きさネットの出力に基づいて生成された枠
の補正を行い前記パターンの存在範囲を絞り込むことが
できる枠取りネットとからなることを特徴とする [作用] 位置、大きさ、枠取りは従来のパターン認識でも特徴抽
出の前処理に、正規化処理として考慮されていたもので
あるが、いづれも番地指定メモリーに対する逐次処理を
前提としている。本発明の大きな特徴は、これらの前処
理も並列処理に基づいたパターン変換の問題としてとら
え、それをネットワークの学習として実現している点に
ある。この特徴によって、変形、ノイズに対しては学習
パターンを工夫することで、人間の認識に近づけること
が可能となり、目標パターンの位置と大きさを正確に検
出できる。
即ち、本発明の位置ネットでは、視野内にあるパターン
の位置を検出する問題を、BPモデルによるパターン変換
として解くことができ、本発明の大きさネットでは、視
野内にあるパターンの大きさを検出する問題を、BPモデ
ルによるパターン変換として解くことができるので、目
標パターンの位置と大きさを正確に検出できる。
なお、本発明に使用している枠取りネットは、パターン
に外接するおおよその枠を設定し、生成された枠の補正
を行い、パターンの存在範囲を絞り込むことができるの
で、目標パターンの位置と大きさの補正を行う機能を学
習により獲得でき、ノイズによる影響を除去できる。
[実施例] 第1図を参照して、本発明の位置ネットの実施例を説明
する。第1(a)図は、入力二次元画像を示していて、
x方向に6分割、y方向に6分割されており、計36個の
格子に分割されている。この各格子からの入力信号は、
第1(b)図に示す36個の入力層のニューロンユニット
に入力される。中間層の40個のニューロンユニットは入
力層のニューロンユニットにネットワーク状に接続さ
れ、かつx−y直交座標に対応させた出力層の2個のニ
ューロンユニットにネットワーク状に接続されている。
この位置ネットはパターンの位置、例えば重心(x,y)
を検出するものである。
第2図を参照して、本発明の大きさネットの実施例を説
明する。第2図(a)図は、入力二次元画像を示してい
て、x方向に6分割、y方向に6分割されており、計36
個の格子に分割されている。この各格子からの入力信号
は、第2(b)図に示す36個の入力層のニューロンユニ
ットに入力される。中間層の40個のニューロンユニット
は入力層のニューロンユニットにネットワーク状に接続
され、かつ目標パターンに外接した正方形の一片に対応
させた出力層の1個のニューロンユニットに接続されて
いる。この大きさネットはパターンの大きさ、例えばパ
ターンを取り囲む正方形の一変の長さdを検出するもの
である。
第3図を参照して、本発明の枠取りネットの実施例を説
明する。第3図(a)図は、入力二次元画像を示してい
て、x方向に6分割、y方向に6分割されており、計36
個の格子に分割されている。この各格子からの入力信号
は、第3(b)図に示す36個の入力層のニューロンユニ
ットに入力される。中間層の40個のニューロンユニット
は入力層のニューロンユニットにネットワーク状に接続
され、かつ上下左右の4方向に対応させた出力層の4個
のニューロンユニットに接続されている。この枠取りネ
ットは上下左右4方向に対し、枠からはみ出していると
考えられる方向の成分を1とし、他を0として出力す
る。そして、1のときは枠を内側に移動させ、0のとき
は枠を外側に移動する。
第4図を参照して、位置ネット、大きさネットを応用し
たパターン認識アーキテクチャについて説明する。本発
明のパターン認識アーキテクチャは、第4図に示すよう
に、位置ネット、大きさネット、枠取りネット、認識ネ
ットという4つのネットワークを核として構成されるも
のである。
第4図の参照符号10の部分の2つのネットワークは、入
力画像に存在する1つのパターンの位置及び大きさをそ
れぞれ抽出する。2つのネットワークは並列に用いら
れ、位置ネットはパターンの位置を抽出する機能のみを
有し、大きさネットはパターンの大きさを抽出する機能
のみを有する。得られた位置ネット、大きさネットの出
力に基づいて入力画像に存在するパターンに枠をはめ
る。
次に、位置ネット、大きさネットの出力に基づいて生成
した枠の精度をさらに上げるために、参照符号12で示す
部分に於いて、枠取りネットを繰り返し数回用いること
により、パターンの存在範囲を少しずつ絞り込んでいく
処理を行う。その後、枠取りネットの出力に基づいて補
正した枠内の画像を認識ネットへの入力とする。
そして、そのパターンが何であるか認識を行うのが、参
照符号14の部分であり、認識ネットの出力に基づいた判
断の結果が最終的な答えとなる。このとき、枠取りネッ
トによって枠を変化させながら、数回認識ネットの出力
を見るのが望ましい。
ここで用いたアーキテクチャは、4つのネットワークの
機能を分化し、単純化したところが特徴である。個々の
ネットワークの構造については第1図、第2図、第3図
及び第5図に示すように、いずれも3層BPモデルを基準
としている。以下にそれぞれのネットの機能及び特徴を
説明する。
(a)位置ネット 二次元空間における画像情報を入力すれば、その中に存
在する、一つのパターンを抽出し、その位置座標(x,
y)を出力するネットワークが位置ネットである。ここ
で、位置ネットによって出力される“位置”とは、一般
にパターン認識で用いられる入力画像全体に対する“重
心”とは異なる。例えば、左上に大きく偏ったノイズが
重畳した場合、重心の座標は実際のパターンの位置より
も左上に大きくはずれたところになる。しかし、適正な
一般化が行われれば、ノイズがあっても提示されたパタ
ーンの存在位置に近づけることが可能である。
(b)大きさネット 二次元空間における画像情報を入力すれば、そこに存在
する一つのパターンを抽出し、それを取り囲むことがで
きるような大きさをもつ正方形の一辺の長さdを出力す
るネットワークが、大きさネットである。この大きさネ
ットの出力に基づき、入力パターンに対して正方形の枠
をはめる。このとき、縦長、横長のパターンについても
正方形の枠を与えたが、必要ならば、大きさネットの出
力を長方形の縦、横の辺の長さ(2出力)とすればよい
ことも確認している。
(c)枠取りネット 位置ネット、大きさネットの出力に基づいて生成された
枠の補正を行い、パターンの存在範囲を絞りこんでいく
機能をもつネットワークが枠取りネットである。枠内の
画像情報を入力とし、枠内に存在するパターンが、上下
左右各方向で枠に当たっているかどうか判定した結果を
出力する。各方向に対応するユニットの出力が1に近け
ればパターンが枠に当たっているので枠を内側へ移動さ
せ、それ以外ならば枠を外側に移動させる。
(d)認識ネット はめられた枠の中に存在するパターンが何であるか、そ
のカテゴリー分けを行うネットワークが認識ネットであ
る。第4図の10、12の部分で作られた枠内の画像情報を
入力すれば、そこに存在するパターンのカテゴリーを出
力する。
ところで、位置ネット、大きさネットを基本にしたパタ
ーン認識アーキテクチャの有効性を示すために、“1"か
ら“5"までの手書き数字を認識させる、計算機シミュレ
ーションを行ったので、以下にその結果を記述する。
このシミユレーションで用いたネットワークは、いずれ
も3層構造であり、中間層及び出力層においては、各ユ
ニットの出力関数をシグモイド関数 f(x)=1/{1+exp(−x)} とした、そして、各層におけるユニット数は、一般化能
力の評価を行った結果をもとに、表1のように選定し
た。
ここで、位置ネット、大きさネットでは入力画像を縦6
画素×横6画素、枠取りネットでは枠内の画像を6画素
×6画素、認識ネットでは枠内の画像を縦8画素×横8
画素に重みをつけて量子化を行ったものをそれぞれのネ
ットワークへの入力とする。
以上の設定によって、学習後のそれぞれのネットワーク
を用い、システムを構成した。位置、大きさを抽出した
後の枠取りネットによる補正の回数は10回とした。その
後、枠取りと認識を交互に繰り返し、認識ネットが3回
続けて同じ出力を出した場合、それを答えとして1回の
認識作業を終了させた。
第6図はシミュレーション結果の例である。第6(a)
図はシステムへの入力、第6(b)図はその入力に対す
る出力、即ち認識ネットの出力である。この結果を見る
と、位置、大きさ、変形、ノイズに対して不変の変換が
なされていることがわかる。また、従来のパターン認識
手法では難しい塊状のノイズがのったものや、指定され
た領域外に書いたものにも対応できていることがわか
る。
「効果」 本発明によれば、二次元画面上に存在する任意の形状と
大きさを有するパターンのおおよその位置と大きさをそ
れぞれ検出する位置ネット、大きさネットを設けたの
で、ノイズの重畳、位置のずれ、大きさのずれに対して
極めてロバストで正確なパターンの認識が行える。
【図面の簡単な説明】
第1図は本発明の位置ネットの機能と構成を説明する
図、第2図は本発明の大きさネットの機能と構成を説明
する図、第3図は本発明の枠取りネットの機能と構成を
説明する図、第4図は本発明のパターン認識アーキテク
チャの構成を説明する図、第5図は認識ネットの機能と
構成を説明する図、第6図は本発明の位置ネット、大き
さネット、枠取りネットを用いたパターン認識のシミュ
レーション結果を示す図である。 10……位置ネットと大きさネットによる処理、12……枠
取りネットによる処理、14……認識ネットによる処理

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】ニューロン間の結合と学習則とを規定した
    BPモデルにおいて、 格子状に分割された入力二次元画像を各々の格子の強度
    信号として入力する第1入力層のニューロンユニット
    と、前記入力二次元画像の目的とするパターンの位置を
    出力する第1出力層のニューロンユニットと、前記第1
    入力層のニューロンユニットと前記第1出力層のニュー
    ロンユニット間に設けられた第1中間層のニューロンユ
    ニットとからなり、前記入力二次元画像上に存在する任
    意の形状と大きさを有する前記パターンの位置を検出す
    る位置ネットと、 格子状に分割された入力二次元画像を各々の格子の強度
    信号として入力する第2入力層のニューロンユニット
    と、前記入力二次元画像の目的とするパターンの大きさ
    を出力する第2出力層のニューロンユニットと、前記第
    2入力層のニューロンユニットと前記第2出力層のニュ
    ーロンユニット間に設けられた第2中間層のニューロン
    ユニットとからなり、前記入力二次元画像上に存在する
    任意の形状と大きさを有する前記パターンの大きさを検
    出する大きさネットと、 からなることを特徴とする目標物体の位置と大きさを表
    現するニューラルネットワーク。
  2. 【請求項2】ニューロン間の結合と学習則とを規定した
    BPモデルにおいて、 格子状に分割された入力二次元画像を各々の格子の強度
    信号として入力する第1入力層のニューロンユニット
    と、前記入力二次元画像の目的とするパターンの位置を
    出力する第1出力層のニューロンユニットと、前記第1
    入力層のニューロンユニットと前記第1出力層のニュー
    ロンユニット間に設けられた第1中間層のニューロンユ
    ニットとからなり、前記入力二次元画像上に存在する任
    意の形状と大きさを有する前記パターンの位置を検出す
    る位置ネットと、 格子状に分割された入力二次元画像を各々の格子の強度
    信号として入力する第2入力層のニューロンユニット
    と、前記入力二次元画像の目的とするパターンの大きさ
    を出力する第2出力層のニューロンユニットと、前記第
    2入力層のニューロンユニットと前記第2出力層のニュ
    ーロンユニット間に設けられた第2中間層のニューロン
    ユニットとからなり、前記入力二次元画像上に存在する
    任意の形状と大きさを有する前記パターンの大きさを検
    出する大きさネットと、 格子状に分割された入力二次元画像を各々の格子の強度
    信号として入力する第3入力層のニューロンユニット
    と、上下左右の4方向に対応した各ニューロンユニット
    に対して枠を内側に動かす場合には0を、外側に動かす
    場合には1を教師の値とする第3出力層のニューロンユ
    ニットと、前記第3入力層のニューロンユニットと前記
    第3出力層のニューロンユニット間に設けられた第3中
    間層のニューロンユニットとからなり、前記位置ネット
    と大きさネットの出力に基づいて生成された枠の補正を
    行い前記パターンの存在範囲を絞り込むことができる枠
    取りネットと、 からなることを特徴とする目標物体の位置と大きさを表
    現するニューラルネットワーク。
JP2018941A 1990-01-31 1990-01-31 目標物体の位置と大きさを表現するニューラルネットワーク Expired - Lifetime JPH0736200B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018941A JPH0736200B2 (ja) 1990-01-31 1990-01-31 目標物体の位置と大きさを表現するニューラルネットワーク

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018941A JPH0736200B2 (ja) 1990-01-31 1990-01-31 目標物体の位置と大きさを表現するニューラルネットワーク

Publications (2)

Publication Number Publication Date
JPH03225482A JPH03225482A (ja) 1991-10-04
JPH0736200B2 true JPH0736200B2 (ja) 1995-04-19

Family

ID=11985669

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018941A Expired - Lifetime JPH0736200B2 (ja) 1990-01-31 1990-01-31 目標物体の位置と大きさを表現するニューラルネットワーク

Country Status (1)

Country Link
JP (1) JPH0736200B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06176159A (ja) * 1992-12-10 1994-06-24 Nec Corp カラー画像対応型物体認識装置
JP4978227B2 (ja) * 2007-02-15 2012-07-18 トヨタ自動車株式会社 画像検出装置
JP6826389B2 (ja) * 2016-07-29 2021-02-03 ヤフー株式会社 推定装置、推定方法、及び推定プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
電子情報通信学会技術研究報告Vol.89No.389PRU89−93「ニューラルネットワークによるパターン位置抽出と正規化」竹谷尚、岡崎耕三、光本浩士他3名

Also Published As

Publication number Publication date
JPH03225482A (ja) 1991-10-04

Similar Documents

Publication Publication Date Title
CN108229490B (zh) 关键点检测方法、神经网络训练方法、装置和电子设备
CN109664300B (zh) 一种基于力觉学习的机器人多风格书法临摹方法
JP6829575B2 (ja) 画像処理装置、画像処理システム及び画像処理方法
CN104680508A (zh) 卷积神经网络和基于卷积神经网络的目标物体检测方法
CN110070115B (zh) 一种单像素攻击样本生成方法、装置、设备及存储介质
CN101467160A (zh) Simd处理器上的模式检测
JP2002373333A (ja) 階層ネットワークを用いたパターン認識方法
Mani et al. Application of artificial neural network model for optical character recognition
CN111476188B (zh) 基于特征金字塔的人群计数方法、系统、介质及电子设备
JP7304235B2 (ja) 学習済みモデル、学習装置、学習方法、及び学習プログラム
WO2020105146A1 (ja) 情報処理装置、制御方法、及びプログラム
Al-Shaykh et al. Invariant image analysis based on Radon transform and SVD
CN112541504A (zh) 一种针对文本中单个字符目标的检测方法
JP6773825B2 (ja) 学習装置、学習方法、学習プログラム、及び対象物認識装置
CN114445876A (zh) 一种人脸多任务检测方法、装置、电子设备及存储介质
EP3671635B1 (en) Curvilinear object segmentation with noise priors
CN110738213B (zh) 一种包括周边环境的图像识别方法及装置
JPH0736200B2 (ja) 目標物体の位置と大きさを表現するニューラルネットワーク
EP3671634B1 (en) Curvilinear object segmentation with geometric priors
Bornet et al. Running large-scale simulations on the Neurorobotics Platform to understand vision–the case of visual crowding
CN113516676A (zh) 角点检测方法、脉冲神经网络处理器、芯片及电子产品
Fukushima et al. Symmetry axis extraction by a neural network
Li et al. A pyramidal approach for the recognition of neurons using key features
CN116958685A (zh) 基于信息融合的目标检测方法、装置、设备及存储介质
JPH02242488A (ja) 画像処理装置

Legal Events

Date Code Title Description
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term