JP3884103B2 - 入力パターンの変化の連続性を考慮したトポロジカル・マップ演算装置及び方法 - Google Patents
入力パターンの変化の連続性を考慮したトポロジカル・マップ演算装置及び方法 Download PDFInfo
- Publication number
- JP3884103B2 JP3884103B2 JP19487396A JP19487396A JP3884103B2 JP 3884103 B2 JP3884103 B2 JP 3884103B2 JP 19487396 A JP19487396 A JP 19487396A JP 19487396 A JP19487396 A JP 19487396A JP 3884103 B2 JP3884103 B2 JP 3884103B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- winner
- input
- calculated
- map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2137—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on criteria of topology preservation, e.g. multidimensional scaling or self-organising maps
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0895—Weakly supervised learning, e.g. semi-supervised or self-supervised learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Description
【発明の属する技術分野】
本発明は、移動ロボットのように環境(空間)内を移動する移動体のナビゲーションを行うための地図を表現するため等に用いられるトポロジカル・マップの学習技術に関する。
【0002】
【従来の技術】
移動体が、ある位置から別の位置へ移動するなどのナビゲーションを効率良く行うためには地図を利用することが必要であり、実際、人は目的に応じて様々な地図を利用している。
【0003】
人が使用する普通の地図は、多くの人が共有して利用できるように、方位、距離、高度などの情報を計器によって測量し、地形や道路などの情報を記号を使って紙などの媒体に記述して作成される。
【0004】
一方、人を含めた多くの生物は、環境内を動き回ることによって、脳内に認知地図(いわゆる土地勘)を学習によって獲得することができる。いわゆる普通の地図が万人向けであるのに対して、学習によって作られる生物の認知地図は個人用であり目的依存である。
【0005】
移動体が学習によって地図を作成できることには、
1)初めての環境で、かつ既存の地図を持っていないとき、学習によって独自に地図を作成できる。
【0006】
2)既存の地図がある目的に対して不適当なとき、目的に合った地図を学習できる。
3)使用可能なセンサー(受容器)の種類に基づいて、より効果的な地図を作成できる(例えば、超音波センサーしか持っていない移動ロボットにとっては、視覚に基づいた地図は役に立たない)。
等の利点がある。従って、学習によって地図を自己組織的に作成できることは、非常に重要な機能である。
【0007】
地図の表現方法には、普通の地図(方位、距離、高度などを記号を使って2次元上に表現したもの)、識別木(木構造)を利用した地図、座標を使って表現する地図などがある。本発明においては、特に、Teuvo Kohonen が、論文 "Self-Organized Formation of Topologically Correct Feature Maps, Biological Cybernetics 43, 59-69, 1982"、"The Self-Organizing Map, The Proceedings of IEEE, VOL.78, NO.9, 1464-1480, 1990" 等において提案したトポロジカル・マップ(topological map 又は topology preserving map)を利用して、地図を表現する。トポロジカル・マップは、ニューラル・ネットワーク(神経回路網)のひとつのモデルであり、入力パターンが相互に持つ類似性(位相構造)が発火するニューロンの位置関係に反映させられる「トポロジー保存写像」を、学習によって形成できるという特徴を有している。以下に、トポロジカル・マップについて説明する。
【0008】
(1)トポロジカル・マップの構造
トポロジカル・マップは、図19に示される1層構造を有するニューラル・ネットワークである。このニューラル・ネットワークは、2次元状に配置されたN(=N1 ×N2 )個のユニット(神経細胞)から構成される。そして、入力としてベクトルx∈RM が与えられる。ここで、Mは、入力の次元を示す。また、以下の説明で、下線付き記号はベクトル量を示す。i番目のユニットは、シナプス結合ベクトル(以下、シナプス荷重と呼ぶ)w i ∈RM (i=1,・・・,N)を介してセンサー情報を受け取るので、ユニットiへの入力ui は次式で計算される。
【0009】
【数7】
【0010】
ニューラル・ネットワークの出力yi (i=1,・・・,N)は、下記数8式と数9式に示されるように、最大入力を受けたユニットcがウィナー(winner:勝者)となり、ウィナー・ユニットのみが発火し(1を出力し)、残りのユニットは発火しない(0を出力する)ように、決定される。
【0011】
【数8】
【0012】
【数9】
【0013】
入力xとシナプス荷重w i が単位ベクトルに規格化されている時、ウィナー・ユニットは、下記数10式に示されるように、入力xに最も近い(最も類似する)シナプス荷重w i を有するユニットcとして決定することもできる。以後の説明では、簡単のために、入力xとシナプス荷重w i は、ともに単位ベクトルに規格化されているとする。
【0014】
【数10】
【0015】
(2)学習則
トポロジカル・マップの学習においては、ある環境(空間)上で互いに近接する入力xのパターンに対して、トポロジカル・マップ上で同様に互いに近接するユニットが発火するように、学習が行われる。
【0016】
この学習において、シナプス荷重w i の変化分Δw i は、下記数11式によって計算される。
【0017】
【数11】
【0018】
ここで、ηは、学習速度を決定する正の定数、L(c) は、ウィナー・ユニットcの周辺(近傍)のユニットの集合である。数11式は、数10式を満たすウィナー・ユニットcとその周辺の集合L(c) に属するユニットのシナプス荷重w i のみが学習により修正され、その他のユニットのシナプス荷重w i は変化させられないことを意味している。一般的に、学習の初期においては、ηの値は大きく、かつ集合L(c) の範囲は広く設定し、学習が進むにつれて、徐々に、ηの値は小さく、かつ集合L(c) の範囲は広く設定するのがよいと言われている。
【0019】
(3)性質と応用分野
上記(1)で説明した構造を有するトポロジカル・マップは、上記(2)で説明した学習則に基づく学習によって、入力xの類似性が発火するウィナー・ユニットcの位置の近接性に反映される写像、すなわち、入力のトポロジー(位相構造)を保存する写像を、獲得することができる。
【0020】
この性質を利用することによって、トポロジカル・マップは、入力の分類、運動制御、音声認識、ベクトル量子化、組合せ最適化問題など、多方面に応用されている。後述する本実施の形態が対象とする、学習による地図の自己組織的形成は、入力xの分類の応用のひとつである。すなわち、本実施の形態では、入力xが任意の空間内の位置を示している場合に、その空間内で互いに近接する各位置に対応する各入力xは、学習されたトポロジカル・マップ上で同様に互いに近接するウィナー・ユニットcに写像されるという性質を利用することにより、任意の位置検出センサーからの入力xに基づいて環境(空間)内の位置を特定する地図としての役割を有するトポロジカル・マップを実現することができる。これはちょうど、人が、目から得た視覚情報に基づいて現在の位置を特定する行動に対応する。
【0021】
【発明が解決しようとする課題】
上記「従来の技術」の項の(2)において説明した従来のトポロジカル・マップの学習則は、入力空間Xから入力(入力ベクトル)xが、ランダムに、或いはある確率分布に従って選択されることを前提としている。ここで、移動体が、環境(空間)内を移動しながらセンサーによって環境の情報を計測し、得られたセンサー情報から地図を形成する場合には、センサーから得られる入力情報は、ランダムに与えられるのではなく、移動経路に従って与えられる。しかし、上記従来の学習則は、一般的であって応用分野に特有の性質を利用しないため、入力xが移動経路に沿って与えられるという情報、すなわち、運動情報を利用することができない。
【0022】
そのため、上記従来の学習則は、学習定数ηや学習範囲L(c) を学習回数に応じて適切に調節する必要があり、また、学習に時間がかかるという問題点を有していた。更に、上記従来の学習則は、学習がうまく進まず、形成されたトポロジカル・マップによる地図がねじれてしまう事態も起こり得るという問題点を有していた。
【0023】
本発明の課題は、移動ロボットなどの移動体が環境内を動き回ることによって収集するセンサー情報と運動情報(移動の連続性、移動方向)等を利用することによって、トポロジカル・マップを効率的に学習することにある。
【0024】
【課題を解決するための手段】
図1は、本発明のブロック図である。本発明は、2次元状に配置されたN個のユニットから構成され、入力ベクトルが与えられたときに、各ユニットへの入力が入力ベクトルの各成分とシナプス荷重ベクトルの各成分との積の総和として決定され、その各ユニットへの入力のうち最大の入力を受けたユニットであるウィナー・ユニットのみが発火するように決定されるトポロジカル・マップの演算装置/方法を前提とする。
【0025】
まず、ウィナー・ユニット候補集合算出手段102は、現在の入力タイミングにおける入力ベクトルに対応するウィナー・ユニットの候補の集合であるウィナー・ユニット候補集合を算出する。
【0026】
次に、ウィナー・ユニット算出手段103は、現在の入力タイミングにおける入力ベクトルに対応するウィナー・ユニットを、ウィナー・ユニット候補集合算出手段102が算出したウィナー・ユニット候補集合に含まれるユニットのうち最大の入力を受けたユニットとして算出する。
【0027】
このように本発明では、学習モード又は参照モードにおいて、トポロジカル・マップ上でウィナー・ユニットが演算される場合に、予めその演算範囲をウィナー・ユニット候補集合として限定しておくことにより、効率的かつ精度の高いウィナー・ユニットの演算が可能となる。
【0028】
上述の発明の構成において、ウィナー・ユニット候補集合算出手段102は、現在の入力タイミングに近接する過去の入力タイミングにおいて算出されたウィナー・ユニットに基づいて、ウィナー・ユニット候補集合を算出するように構成することができる。
【0029】
或いは、上述の発明の構成において、現在の入力タイミングにおける入力ベクトルの変化方向を算出する入力ベクトル変化方向算出手段104を更に含み、ウィナー・ユニット候補集合算出手段102は、現在の入力タイミングに近接する過去の入力タイミングにおけるウィナー・ユニットと、入力ベクトル変化方向算出手段104が算出した現在の入力タイミングにおける入力ベクトルの変化方向とに基づいて、ウィナー・ユニット候補集合を算出するように構成することができる。
【0030】
このように、ウィナー・ユニット候補集合が、現在の入力タイミングに近接する過去(例えば1つ前)の入力タイミングにおいて算出されたウィナー・ユニットに基づいて、或いは、そのウィナー・ユニットと、入力ベクトル変化方向算出手段104が算出した現在の入力タイミングにおける入力ベクトルの変化方向とに基づいて、決定されることにより、入力ベクトルの変化状態をウィナー・ユニットの算出処理に反映させることができ、入力ベクトルの性質に応じた効率的かつ精度の高いウィナー・ユニットの算出が可能となる。
【0031】
ここで、ウィナー・ユニットは、トポロジカル・マップ101の各ユニットのシナプス荷重ベクトルを更新する学習処理のために算出されるように構成することができる。すなわち、本発明は、トポロジカル・マップ101の学習モードに対して適用されるように構成することができる。
【0032】
またこの場合において、トポロジカル・マップ101は、環境内での移動体の移動経路をナビゲートするための地図として使用され、入力ベクトルは移動体の環境内での位置を示すセンサー情報に対応するように構成することができる。
【0033】
このように、本発明が、トポロジカル・マップ101の学習モードに対して適用され、かつ環境内での移動体の移動経路をナビゲートするための地図として使用される場合に、移動体の移動経路及び移動方向に関する情報が、ウィナー・ユニット候補集合に反映されるため、学習時のウィナー・ユニットを移動体の移動経路及び移動方向による制約のもとで決定することができ、学習を効率的かつ正確に行うことが可能となる。
【0034】
本発明が、上述のように、トポロジカル・マップ101の学習モードに対して適用され、かつ環境内での移動体の移動経路をナビゲートするための地図として使用される場合の、より具体的な構成について以下に示す。
【0035】
ウィナー・ユニット候補集合算出手段102は、現在の入力タイミングの1つ前の入力タイミングで算出されたウィナー・ユニットの位置を(inw,jnw)、ウィナー・ユニット候補集合に含まれる各ユニットの位置を(in ,jn )、ウィナー・ユニット候補集合をC(nw )としたとき、前述の数1式又は数2式を満たすウィナー・ユニット候補集合C(nw )を算出する。
【0036】
或いは、入力ベクトル変化方向算出手段104は、現在の入力タイミングにおける入力ベクトルの変化方向を、前述の数3式又は数5式を満たす4方向dir1,dir2,dir3、dir4の何れかの方向として算出し、ウィナー・ユニット候補集合算出手段102は、現在の入力タイミングの1つ前の入力タイミングで算出されたウィナー・ユニットの位置を(inw,jnw)、ウィナー・ユニット候補集合をC(nw )としたとき、入力ベクトル変化方向算出手段104が算出した現在の入力タイミングにおける入力ベクトルの変化方向に応じて、前述の数4式(数3式た適用される場合)又は数6式(数5式が適用される場合)を満たすウィナー・ユニット候補集合C(nw )を算出する。
【0037】
また、本発明が、前述のように、トポロジカル・マップ101の学習モードに対して適用される場合において、ウィナー・ユニット算出手段103が算出したウィナー・ユニットと、入力ベクトル変化方向算出手段104が算出した現在の入力タイミングにおける入力ベクトルの変化方向とに基づき、シナプス荷重ベクトルが更新されるユニットの集合である学習対象ユニット集合を算出する学習対象ユニット集合算出手段と、その学習対象ユニット集合算出手段が算出した学習対象ユニット集合に含まれるユニットに対して、シナプス荷重ベクトルを更新する学習処理を実行するシナプス荷重ベクトル更新手段とを更に含むように構成することができる。
【0038】
このように、本発明が、トポロジカル・マップ101の学習モードに対して適用される場合に、移動体の移動経路及び移動方向に関する情報を、シナプス荷重ベクトルを更新すべき学習対象ユニット集合の決定に反映させることができ、やはり学習を効率的かつ正確に行うことが可能となる。
【0039】
一方、本発明において、ウィナー・ユニットは、トポロジカル・マップ101の参照処理のために算出されるように構成することができる。すなわち、本発明は、トポロジカル・マップ101の参照モードに対しても適用されるように構成することができる。
【0040】
また、この場合において、本発明は、環境内での移動体の移動経路をナビゲートするための地図として使用されるように構成することができる。
このように、本発明が、トポロジカル・マップ101の参照モードに対して適用され、かつ環境内での移動体の移動経路をナビゲートするための地図として使用される場合に、移動体の移動経路及び移動方向に関する情報が、ウィナー・ユニット候補集合に反映されるため、参照時のウィナー・ユニットを移動体の移動経路及び移動方向による制約のもとで決定することができ、参照を効率的かつ正確に行うことが可能となる。
【0041】
なお、本発明は、上述と同様の機能を実現する方法として構成することもできる。
【0042】
【発明の実施の形態】
以下、図面を参照しながら本発明の実施の形態について詳細に説明する。
移動体が、環境内を移動しながらセンサーによって環境の情報を計測し、得られたセンサー情報をトポロジカル・マップに入力して地図を学習するとき、センサー入力xは、ランダムに与えられるのではなく、移動体の移動経路に沿って入力される。そこで、本実施の形態では、入力xが移動経路に沿って与えられるという情報、すなわち、運動情報を利用して、トポロジカル・マップの学習を行うことを特徴とする。ここで、運動情報とは、
1)移動の連続性の情報:移動はある位置からその隣の位置へ連続的に行われるという性質を示す情報。
【0043】
2)移動方向:現在の位置から次に移動する方向を示す情報。
をいう。本実施の形態では、これらの運動情報を利用して、学習時におけるウィナー・ユニットの選択及び学習範囲の設定が行われ、学習が効率化される。
【0044】
図2は、本実施の形態における地図学習装置の構成図である。この地図学習装置は、センサー部201、移動駆動部202、センサー情報処理部203、地図表現部204、学習調節部205、及び学習実行部206から構成される。そして、この地図学習装置は、地図学習モードと地図参照モードの2つの動作モードで動作する。地図学習モードでは、この地図学習装置を搭載した移動体が、環境内を動き回り、環境情報を収集して、環境の地図を学習する。一方、地図参照モードでは、学習した地図をナビゲーション等に利用する。
<用語と記号の説明>
図2の構成について説明する前に、以下の説明において使用される用語と記号を定義する。
・n(1≦n≦N):トポロジカル・マップを構成するN(=N1 ×N2 )個のユニットの番号。
・k(1≦k≦K):移動経路に沿った学習位置の番号。この位置は、移動経路に沿って、所定時間間隔毎又は所定距離の移動毎或いはセンサー情報が所定閾値以上に変化する毎に決定される。
・d k :位置kにおいて、センサー部201により計測されるセンサー情報ベクトル。
・x k :位置kにおいて、センサー情報処理部203によって処理されトポロジカル・マップに入力される入力ベクトル。
・参照時ウィナー・ユニット:地図参照モードでのウィナー・ユニット。
・学習時ウィナー・ユニット:地図学習モードでのウィナー・ユニット。
・nw r (x k ):移動経路に沿った位置kでの入力x k に対する参照時ウィナー・ユニット番号。参照時ウィナー・ユニットnw r (x k )とも称する。
・nw l (x k ):移動経路に沿った位置kでの入力x k に対する学習時ウィナー・ユニット番号。学習時ウィナー・ユニットnw l (x k )とも称する。
・L(nw l (x k )):移動経路に沿った現在の位置kでの学習時ウィナー・ユニットnw l (x k )の周辺においてシナプス荷重の修正が行われるユニットの集合(学習対象ユニット集合)。L(nw )と称される場合もある。
・C(nw l (x k-1 )):移動経路に沿った1つ前の位置k−1における学習時ウィナー・ユニットがnw l (x k-1 )であるとき、現在の位置kにおける学習時ウィナー・ユニットnw l (x k )の候補になるユニットの集合(学習時ウィナー・ユニット候補集合)。C(nw )と称される場合もある。
・(in ,jn ):番号nのユニットのトポロジカル・マップ上での位置。
・(inw,jnw):番号nのウィナー・ユニットのトポロジカル・マップ上での位置。
次に、図2の各部の詳細について説明する。
<環境と移動ロボット>
図2の地図学習装置が搭載される移動ロボットが動き回る環境(動作範囲)として、例えば、図3に示されるような、平面上の円形の環境が想定される。この円形の環境は、平面上に定義されたxy座標系の原点に中心があり、半径がRである。環境には、M個のランドマークがあるとする。
<センサー部201の説明>
センサー部201は、移動体が環境内を移動して到達した位置において、環境からの情報を多種類のセンサーを利用して収集する。また、センサー部201は、移動駆動部202から移動距離、移動方向、消費エネルギー等の情報も収集する。それらの収集された情報を表現するセンサー情報d k は、センサー情報処理部203に伝達される。
【0045】
具体的には図3の例において、移動ロボットは、M個のランドマークからの距離を計測できるセンサーを有し、移動経路に沿った位置kにおいて、ランドマークからの距離d k =(dk (1) ,dk (2) ,・・,dk (m) ,・・dk (M) ),(1≦k≦K)を計測する。ここで、dk (m) は、位置kからランドマークmまでの距離を示す。
<移動駆動部202の説明>
移動駆動部202は、モーター等の駆動部を制御して移動体を移動させる。地図学習モードでは、移動駆動部202は、移動体が環境内を動き回るように、ランダム・ウォークをさせたり、行ったことがない場所へ移動させたり、環境の境界で移動方向を変更する等の機能を有する。地図の学習の終了後の地図参照モードでは、移動駆動部202は、地図表現部204が表現する地図を利用してナビゲーションを行い、環境内を効率的に移動する機能を有する。
【0046】
また、移動駆動部202は、移動経路に沿った位置kにおいて移動方向をセンサー部201に伝達する。
<センサー情報処理部203>
センサー情報処理部203は、センサー部201が収集したセンサー情報d k を規格化すると共に、地図表現部204であるトポロジカル・マップへの入力として適合した形式x k に変換する。また、移動駆動部202から運動情報(移動方向等)を受け取って、それを学習調節部205に伝達する。
【0047】
具体的には、センサー情報処理部203は、センサー情報d k を、下記数12式〜数14式によって、入力x k に変換する。
すなわち、まず、センサー情報d k の成分dk (m) (1≦m≦M)のそれぞれに対して、下記数12式で示されるバンド・パス・フィルタ(ガウシアン・フィルタの一種)の演算が実行される。
【0048】
【数12】
【0049】
ここで、μj (m) 及びσ(m) (1≦j≦G)は、それぞれランドマークmからの距離dk (m) に対するフィルタのパラメータ(ガウシアン・フィルタの平均と分散)であり、Gはdk (m) に対して演算されるフィルタの個数である。μj (m) 及びσ(m) の値は、移動ロボットとランドマークmの間の最大距離max(m)と最小距離min(m)とから、下記数13式に基づいて設定される。
【0050】
【数13】
【0051】
次に、センサー情報d k の成分dk (m) (1≦m≦M)のそれぞれに対する数12式の演算結果が、下記数14式に基づいて、1つのベクトルにまとめられて規格化されることにより、入力ベクトルx k が算出される。
【0052】
【数14】
【0053】
上記数14式の右辺の分母は、その右辺の分子によって得られるベクトルを、単位ベクトルに規格化するための項である。このようにして得られる入力x k が、図2の地図表現部204であるトポロジカル・マップに入力される。
【0054】
今、例えばセンサーが2個あり2つの場所で、センサー情報d 1 =(1.0,1.0),d 2 =(2.0,2.0) が得られたとする。これらの値を単純に規格化すれば(すなわち単位ベクトルに変換すれば)、共に(2-1/2,2-1/2)となって区別がつかなくなってしまう。そこで、センサー情報d k (k=1,2)の各成分に対して数12式に示されるバンド・パス・フィルタの演算が実行され、その演算結果を使用して数14式に基づくベクトル化及び規格化が行われる。ここで、センサー情報d k (k=1,2)の各成分に対してそれぞれG=11個のガウシアン・フィルタが演算されるとし、この場合に、μj (m) =σ(m) =0.27 (1≦j≦G,m=1,2)とすれば、上記センサー情報d 1 及びd 2 は、数12式及び数14式の演算によって、図4(a) 及び(b) に示される成分を有する入力x 1 及びx 2 に変換される。なお、入力x k =(第1成分の11個の値,第2成分の11個の値)(k=1,2)である。図4(a) 及び(b) から、数12式及び数14式に示される演算によって、センサー情報d 1 及びd 2 が、相互に区別できる形式で入力x 1 及びx 2 に変換されることがわかる。また、これらの演算は、トポロジカル・マップの各ユニットへの入力の最大値を、ある値で抑えることができるという利点も有している。
<地図表現部204の説明>
次に、図2の地図表現部204は、センサー情報処理部203においてセンサー情報d k から上述のようにして得られた入力x k を入力し、トポロジカル・マップを用いて環境地図を表現する。ここで、トポロジカル・マップには、N(=N(=N1 ×N2 )個のユニットが格子状に配置されている(後述する図14参照)。
【0055】
地図参照モードでは、地図表現部204は、移動経路に沿った位置kにおけるセンサー情報d k から算出された入力x k (1≦k≦K)を、シナプス荷重w n ∈RM*G (数14式参照)を介して、トポロジカル・マップのそれぞれのユニットに入力する。そして、地図表現部204は、トポロジカル・マップ上で、入力x k に対する参照時ウィナー・ユニットnw r (x k )と出力yn を、下記数15式及び数16式に基づいて算出する。
【0056】
【数15】
【0057】
【数16】
【0058】
図5は、地図参照モードにおける図2の地図学習装置の動作を示すフローチャートである。
まず、センサー部201が、現在の移動位置kにおけるセンサー情報d k を獲得する(図5の501)。
【0059】
次に、センサー情報処理部203が、数12式〜数14式に基づいて、現在の移動位置kにおけるセンサー情報d k に対応する入力x k を計算する(図5の502)。
【0060】
続いて、地図表現部204が、数15式及び数16式に基づいて、移動位置kにおける参照時ウィナー・ユニットnw r (x k )と出力yn を算出する(図5の503)。なお、これらの演算は、図13を用いて後述するように、並列計算が可能である。
【0061】
移動駆動部202等は、地図表現部204が算出した出力yn に基づいて、環境内での現在の位置を把握し、予めプログラムされた行動を実行する(マップの利用:図5の504)。
【0062】
そして、移動駆動部202は、現在の位置kが移動の終わり位置であるか否かを判定し(図5の505)、終わり位置でないと判定した場合には、次の位置k+1への移動制御を実行し(図5の505→506→501)、終わり位置になったと判定した場合には、移動制御を終了する。
<学習調節部205の説明>
学習調節部205は、地図学習モードにおいて、センサー情報処理部203がセンサー部201から取得するセンサー情報d k に基づいて算出した入力x k を用いて、現在の位置kにおける学習時ウィナー・ユニットnw l (x k )を決定する。
【0063】
この場合に、本発明に関連する特徴として、学習調節部205は、下記数17式の第2式に示されるように、移動経路に沿った1つ前の位置k−1における処理で算出された学習時ウィナー・ユニット候補集合C(nw l (x k-1 ))の範囲内のみから、現在の位置kにおける学習時ウィナー・ユニットnw l (x k )を算出する。なお、k=1(先頭位置)の場合には、学習調節部205は、数17式の第1式に示されるように、環境の全範囲から、先頭位置k=1における学習時ウィナー・ユニットnw l (x 1 )を算出する。
【0064】
【数17】
【0065】
この学習時ウィナー・ユニット候補集合C(nw l (x k-1 ))は、数18式〜数26式を用いて後述するように、1つ前の位置k−1における処理で算出された学習時ウィナー・ユニットnw l (x k-1 )に対して特定の範囲に存在するユニットの集合、或いは、1つ前の位置k−1における処理で算出された学習時ウィナー・ユニットnw l (x k-1 )に対して特定の範囲であって、かつ学習調節部205がセンサー情報処理部203を介して移動駆動部202から取得する運動情報(移動方向等)に基づいて決定される特定の範囲に存在するユニットの集合である。
【0066】
「従来の技術」の項で説明したように、入力x k (センサー情報d k )は、移動体の移動経路に沿って与えられるにもかかわらず、従来の学習則では、移動経路に沿った現在の位置kにおける学習時ウィナー・ユニットnw l (x k )は、1つ前の位置k−1における処理において算出された学習時ウィナー・ユニットnw l (x k-1 )の位置とは無関係に算出されていた。
【0067】
これに対して、本実施の形態では、現在の位置kにおける学習時ウィナー・ユニットnw l (x k )は、上述したように、移動体の移動経路による制約を受けて決定されるため、学習が効率的かつ正確に行われるという、大きな特徴を有するのである。
【0068】
学習調節部205は、上述したようにして現在の位置kにおける学習時ウィナー・ユニットnw l (x k )を決定した後、そのユニットの周辺においてシナプス荷重の修正が行われるべき学習対象ユニット集合L(nw l (x k ))を決定し、その集合を学習実行部206に伝達する。
【0069】
これと共に、学習調節部205は、学習時ウィナー・ユニットnw l (x k )に対して特定の範囲に存在するユニットの集合、或いは、学習時ウィナー・ユニットnw l (x k-1 )に対して特定の範囲であって、かつ学習調節部205がセンサー情報処理部203を介して移動駆動部202から取得する運動情報(移動方向等)に基づいて決定される特定の範囲に存在するユニットの集合として、学習時ウィナー・ユニット候補集合C(nw l (x k ))を算出する。これは、前述したように、移動経路に沿った次の位置での処理において、学習時ウィナー・ユニット候補集合C(nw l (x k-1 ))として参照されることになる。
【0070】
以下に、学習時ウィナー・ユニット候補集合C(nw l (x k-1 ))と、学習対象ユニット集合L(nw l (x k ))の具体的な設定例を示す。なお、表示の簡単のため、学習時ウィナー・ユニットnw l (x k )はnw と略す。従って、C(nw l (x k-1 ))はC(nw )と略され、また、L(nw l (x k ))はL(nw )と略される。また、<用語と記号の説明>において前述したように、(in ,jn )は番号nのユニットのトポロジカル・マップ上での位置を示し、(inw,jnw)は番号nの学習時ウィナー・ユニットnw のトポロジカル・マップ上での位置を示す。
設定例1
下記数18式に示されるように、C(nw ),L(nw )は共に、図6に示される位置(inw,jnw)に存在する学習時ウィナー・ユニットnw 自身と、それに隣接する8個のユニットの、計9個のユニットの集合として設定される。
【0071】
【数18】
【0072】
設定例2
下記数19式に示されるように、C(nw )は、図7に示される位置(inw,jnw)に存在する学習時ウィナー・ユニットnw 自身と、その上下左右に位置する4個のユニットの、計5個のユニットの集合として設定され、L(nw )は、図6に示されるユニットの集合として設定される。
【0073】
【数19】
【0074】
設定例3
下記数20式に示されるように、C(nw ),L(nw )は共に、図7に示される位置(inw,jnw)に存在する学習時ウィナー・ユニットnw 自身と、その上下左右に位置する4個のユニットの、計5個のユニットの集合として設定される。
【0075】
【数20】
【0076】
設定例4
上記設定例1〜3では、C(nw ),L(nw )は、移動経路に沿った1つ前の位置における処理で算出された学習時ウィナー・ユニットnw のみから、それぞれの範囲が決定されている。
【0077】
これに加えて、設定例4では、移動体の移動方向も考慮して、C(nw )及びL(nw )の範囲が設定される。
まず、移動体の移動方向が、90°間隔で、図8(a) 及び数21式に示される4方向に分類される。学習調節部205は、この移動方向情報(運動情報)を、センサー情報処理部203を介して移動駆動部202から受け取る。
【0078】
【数21】
【0079】
そして、下記数22式に示されるように、移動方向に応じて、C(nw )は、位置(inw,jnw)(図9(a) 〜(d) の黒丸)に存在する学習時ウィナー・ユニットnw を中心として、図9(a) 〜(d) に示されるユニットの集合として設定される。
【0080】
【数22】
【0081】
また、L(nw )は、数23式に示されるように、C(nw )と同じに設定されるか、或いは、数24式に示されるように、図6に示されるユニットの集合として設定される。
【0082】
【数23】
【0083】
【数24】
【0084】
設定例5
設定例5では、まず、移動体の移動方向が、90°間隔で、図8(b) 及び数25式に示される4方向に分類される。
【0085】
【数25】
【0086】
そして、下記数26式に示されるように、移動方向に応じて、C(nw )は、位置(inw,jnw)(図10(a) 〜(d) の黒丸)に存在する学習時ウィナー・ユニットnw を中心として、図10(a) 〜(d) に示されるユニットの集合として設定される。
【0087】
【数26】
【0088】
また、L(nw )は、設定例4の場合と同様に、数23式に示されるように、C(nw )と同じに設定されるか、或いは、数24式に示されるように、図6に示されるユニットの集合として設定される。
<学習実行部206の説明>
次に、図2に示される学習実行部206は、地図学習モードにおいて、上述の学習調節部205から移動経路に沿った現在の位置kにおける学習対象ユニット集合L(nw l (x k ))を受けて、下記数27式に従って、シナプス荷重w i の変化分Δw i を計算する。
【0089】
【数27】
【0090】
ここで、ηは、数11式の場合と同様である。
これにより、学習対象ユニット集合L(nw l (x k ))に属するユニットのシナプス荷重w i のみが学習によって修正され、その他のユニットのシナプス荷重w i は変化させられない。
【0091】
その後、数27式によって計算された変化分Δw i を用いて、下記数28式に基づいて、シナプス荷重w i が更新される。ここで、数28式の右辺の分母は、シナプス荷重w i のノルムが1となるように規格化を行うための項である。
【0092】
【数28】
【0093】
<地図学習モード時の全体動作の説明>
図11は、地図参照モードにおける図2の地図学習装置の動作を示すフローチャートである。
【0094】
まず、センサー部201が、現在の移動位置kにおけるセンサー情報d k を獲得する(図11の1101)。
次に、センサー情報処理部203が、数12式〜数14式に基づいて、現在の移動位置kにおけるセンサー情報d k に対応する入力x k を計算する(図11の1102)。
【0095】
次に、学習調節部205が、移動経路に沿った1つ前の位置k−1での処理で算出している学習時ウィナー・ユニット候補集合C(nw l (x k-1 ))の範囲内において、各ユニットの出力w i ・x k ,i∈C(nw l (x k-1 ))を計算する(図11の1103)。
【0096】
続いて、学習調節部205が、ステップ1103で計算した出力から、数17式に基づいて、移動経路に沿った現在の位置kにおける学習時ウィナー・ユニットnw l (x k )を決定する(図11の1104)。
【0097】
更に、学習調節部205が、数18式〜数26式に基づいて、現在の位置kにおける学習対象ユニット集合L(nw l (xk ))と、次の位置のための学習時ウィナー・ユニット候補集合C(nw l (x k ))を決定する(図11の1105)。このようにして決定されたL(nw l (x k ))は、学習実行部206に伝達される。また、C(nw l (x k ))は、移動経路に沿った次の位置での学習調節部205による処理(図11の1103)において、学習時ウィナー・ユニット候補集合C(nw l (x k-1 ))として参照される。
【0098】
次に、学習実行部206が、数27式及び数28式に基づいて、学習調節部205から伝達された学習対象ユニット集合L(nw l (x k ))に属するユニットのシナプス荷重w i に対して、学習処理を実行する(図11の1106)。
【0099】
そして、移動駆動部202は、現在の位置kが移動の終わり位置であるか否かを判定し(図11の1107)、終わり位置でないと判定した場合には、次の位置k+1への移動制御を実行し(図11の1107→1108→1101)、終わり位置になったと判定した場合には、移動制御及び地図学習モードの処理を終了する。
【0100】
以上の地図学習モードの処理が終了した後に、<地図表現部204の説明>の項で説明した図5の動作フローチャートで示される地図参照モードの処理が実行されると、図12に示されるように、現実の環境内の移動体の各位置k間の関係が、地図表現部204内のトポロジカル・マップにおいて計算される各参照時ウィナー・ユニットnw r (x k )間の位置関係と、良く一致するようになる。
<ハードウエア構成例の説明>
図13は、図2に示される本実施の形態における地図学習装置がハードウエアによって構成される場合の、構成例を示す図である。
【0101】
図13において、入力部1301は図2のセンサー部201及びセンサー情報処理部203に対応し、並列計算ユニット1302は図2の地図表現部204に対応し、地図学習の制御部1303は図2の学習調節部205及び学習実行部206に対応し、出力部1304は図2の移動駆動部202の一部の機能に対応する。また、表示部1305は、並列計算ユニット1302の出力に基づいて地図を表示する。そして、入力部1301、並列計算ユニット1302、地図学習の制御部1303、出力部1304、及び表示部1305は、バス1306によって相互に接続される。
【0102】
図13の特徴は、並列計算ユニット1302が、トポロジカル・マップの各ユニットに対応して並列に構成され、図5のステップ503、図11のステップ1103、図11のステップ1106として示されるトポロジカル・マップの各ユニットに依存する計算を並列に計算できる点である。これにより、地図参照モード及び地図学習モードでの各処理を、高速に実行することが可能となる。
<シミュレーション実験の結果の説明>
以上の本実施の形態の有効性を示すために、計算機シミュレーション実験を行った。まず、以下に、実験条件を示す。
【0103】
・トポロジカル・マップのユニット数:N=49(=7×7)。それぞれのユニットには、図14に示される番号が付加される。
・図3に示される円形環境の半径:R=1.0 m 。
【0104】
・図3に示される円形環境の中心位置(座標):原点(0,0) 。
・ランドマークの数:M=3。
・ランドマークの位置(座標):(1.0,0),(0,1.0),(-2/3,-2/3) 。
【0105】
・ランドマークからの各距離dk (m) (1≦k≦200,1≦m≦3)に対するガウシアン・フィルタの個数:G=11。
・ランドマークの距離の最大、最小:(max,min)=(2.0,0) 。
【0106】
・移動経路に沿った学習位置の総数:0.2 m 間隔の200 点。
・移動経路:移動体は、図15に示されるように、原点(0,0) から移動を開始し、ほぼランダムに環境内を動き回る。
【0107】
・学習前のシナプス荷重w i :ランダムに設定されるが、規格されている。
以下の説明では、まず、数10式及び数11式に基づく従来のトポロジカル・マップの学習則が採用された場合のシミュレーション結果を示し、次に、数17式、数27式、及び数28式に基づく本実施の形態によるトポロジカル・マップの学習則が採用された場合のシミュレーション結果を示す。
【0108】
(1)学習前の状態
図16は、学習前の地図(トポロジカル・マップ)の様子を示した図である。この図は、移動ロボットが円形環境内の0.1 m 間隔の格子上の位置(0.1x,0.1y) に存在すると仮定して、その位置で計測されるセンサー情報d k が入力x k に変換された上でトポロジカル・マップに入力された場合の参照時ウィナー・ユニットnw r (x k )の番号を、上記位置上に表記したものである。
【0109】
図16からわかるように、学習前のトポロジカル・マップのシナプス荷重w i はランダムであるため、図14に示されるように配置されているユニットの位置関係と、移動ロボットの図15に示される座標内での位置関係は、全く無関係になっている。
【0110】
(2)従来の学習則が採用された場合
図17は、数10式及び数11式に基づく従来のトポロジカル・マップの学習則に従って、2000回の学習が行われた後の地図(トポロジカル・マップ)の様子を示した図である。図17では、図14に示されるように配置されているユニットの位置関係と、移動ロボットの図15に示される座標内での位置関係は、相対的な位置関係において部分的には一致しているものの、ねじれが起きている部分もあり、全体としては正しい地図が得られていないことがわかる。
【0111】
(3)本実施の形態による学習則が採用された場合
図18は、数17式、数27式、及び数28式に基づく本実施の形態によるトポロジカル・マップの学習則に従い、かつ、C(nw )及びL(nw )が、数22式,数24式、及び図8(a) ,図9(a) 〜(d) に示されるように設定された場合において、2000回の学習が行われた後の地図(トポロジカル・マップ)の様子を示した図である。図18からわかるように、図14に示されるように配置されているユニットの位置関係と、移動ロボットの図15に示される座標内での位置関係は、非常に良く一致しており、センサー情報d k から地図が正確に作成されたことがわかる。
【0112】
なお、本シミュレーションでは、図3に示される円形の環境が図14に示される方形のトポロジカル・マップに写像されているが、両者の形状を一致させることにより、更に正確な地図を作成することが可能である。
<他の実施の形態の説明>
以上説明した実施の形態においては、地図学習モードにおいて、移動経路に沿った1つ前の位置k−1における処理によって得られる学習時ウィナー・ユニットnw l (x k-1 )に基づいて、現在の位置kにおける学習時ウィナー・ユニットnw l (x k )の範囲が限定されているが、1つ以上前の複数の位置における結果に基づいてその範囲が限定されてもよい。
【0113】
また、上述の実施の形態においては、移動方向に基づいて、現在の位置kにおける学習時ウィナー・ユニットnw l (x k )の範囲が限定される例も示されているが、そのほかにも、移動速度をはじめとする種々の運動情報に基づいてその範囲が限定されてもよい。
【0114】
更に、上述の実施の形態においては、地図学習モードにおける学習時ウィナー・ユニットnw l (x k )の範囲のみでなく、地図参照モードにおける参照時ウィナー・ユニットnw r (x k )の範囲も、移動経路に関連する情報に基づいて限定されてもよい。
【0115】
加えて、本実施の形態では、トポロジカル・マップが移動体の地図の用途で使用された場合における学習則を例として開示しているが、本発明はこれに限られるものではなく、入力の分類、運動制御、音声認識、ベクトル量子化、組合せ最適化問題などの、多方面へのトポロジカル・マップの応用分野において、学習時ウィナー・ユニット又は参照時ウィナー・ユニットを、パターンの変化の連続性を示す情報に基づいて限定することにより、学習処理及び参照処理の効率及び精度を飛躍的に向上させることができる。
【0116】
【発明の効果】
本発明によれば、学習モード又は参照モードにおいて、トポロジカル・マップ上でウィナー・ユニットが演算される場合に、予めその演算範囲をウィナー・ユニット候補集合として限定しておくことにより、効率的かつ精度の高いウィナー・ユニットの演算が可能となる。
【0117】
また、本発明において、ウィナー・ユニット候補集合が、現在の入力タイミングに近接する過去(例えば1つ前)の入力タイミングにおいて算出されたウィナー・ユニットに基づいて、或いは、そのウィナー・ユニットと、入力ベクトル変化方向算出手段が算出した現在の入力タイミングにおける入力ベクトルの変化方向とに基づいて決定されることにより、入力ベクトルの変化状態をウィナー・ユニットの算出処理に反映させることができ、入力ベクトルの性質に応じた効率的かつ精度の高いウィナー・ユニットの算出が可能となる。
【0118】
また、本発明が、トポロジカル・マップの学習モードに対して適用され、かつ環境内での移動体の移動経路をナビゲートするための地図として使用される場合に、移動体の移動経路及び移動方向に関する情報が、ウィナー・ユニット候補集合に反映されるため、学習時のウィナー・ユニットを移動体の移動経路及び移動方向による制約のもとで決定することができ、学習を効率的かつ正確に行うことが可能となる。
【0119】
更に、本発明が、トポロジカル・マップの学習モードに対して適用される場合に、移動体の移動経路及び移動方向に関する情報を、シナプス荷重ベクトルを更新すべき学習対象ユニット集合の決定に反映させることができ、やはり学習を効率的かつ正確に行うことが可能となる。
【0120】
加えて、本発明が、トポロジカル・マップの参照モードに対して適用され、かつ環境内での移動体の移動経路をナビゲートするための地図として使用される場合に、移動体の移動経路及び移動方向に関する情報が、ウィナー・ユニット候補集合に反映されるため、参照時のウィナー・ユニットを移動体の移動経路及び移動方向による制約のもとで決定することができ、参照を効率的かつ正確に行うことが可能となる。
【図面の簡単な説明】
【図1】本発明のブロック図である。
【図2】本実施の形態における地図学習装置の構成図である。
【図3】移動ロボットと円形環境を示す図である。
【図4】センサー情報処理部の説明図である。
【図5】地図参照モードでの動作フローチャートである。
【図6】C(nw ),L(nw )の設定例1,2を示す図である。
【図7】C(nw ),L(nw )の設定例2を示す図である。
【図8】移動方向の分類を示す図である。
【図9】C(nw ),L(nw )の設定例4を示す図である。
【図10】C(nw ),L(nw )の設定例5を示す図である。
【図11】地図学習モードでの動作フローチャートである。
【図12】学習後の地図(トポロジカル・マップ)の説明図である。
【図13】本実施の形態のハードウエア構成例を示す図である。
【図14】ユニットの番号を示す図である。
【図15】移動ロボットの移動経路を示す図である。
【図16】学習前の地図(ウィナー・ユニットの配置)を示す図である。
【図17】従来の学習則で学習が行われた後の地図(ウィナー・ユニットの配置)を示す図である。
【図18】本実施の形態における学習則で学習が行われた後の地図(ウィナー・ユニットの配置)を示す図(設定例4を使ってC,Lを決定した場合)である。
【図19】トポロジカル・マップの構成図である。
【符号の説明】
101 トポロジカル・マップ
102 ウィナー・ユニット候補集合算出手段
103 ウィナー・ユニット算出手段
104 入力ベクトル変化方向算出手段
201 センサー部
202 移動駆動部
203 センサー情報処理部
204 地図表現部
205 学習調節部
206 学習実行部
1301 入力部
1302 並列計算ユニット
1303 地図学習の制御部
1304 出力部
1305 表示部
1306 バス
Claims (13)
- 2次元状に配置されたN個のユニットから構成され、入力ベクトルが与えられたときに、前記各ユニットへの入力が前記入力ベクトルの各成分とシナプス荷重ベクトルの各成分との積の総和として決定され、該各ユニットへの入力のうち最大の入力を受けたユニットであるウィナー・ユニットのみが発火するように決定されるトポロジカル・マップの演算装置であって、
前記入力ベクトルはセンサーで計測された環境の情報であり、
現在の入力タイミングに近接する過去の入力タイミングにおいて算出されたウィナー・ユニットに基づいて、前記現在の入力タイミングにおける入力ベクトルに対応するウィナー・ユニットの候補の集合であるウィナー・ユニット候補集合を算出するウィナー・ユニット候補集合算出手段と、
前記現在の入力タイミングにおける入力ベクトルに対応するウィナー・ユニットを、前記ウィナー・ユニット候補集合算出手段が算出したウィナー・ユニット候補集合に含まれるユニットのうち最大の入力を受けたユニットとして算出するウィナー・ユニット算出手段と、
を含むことを特徴とするトポロジカル・マップ演算装置。 - 2次元状に配置されたN個のユニットから構成され、入力ベクトルが与えられたときに、前記各ユニットへの入力が前記入力ベクトルの各成分とシナプス荷重ベクトルの各成分との積の総和として決定され、該各ユニットへの入力のうち最大の入力を受けたユニットであるウィナー・ユニットのみが発火するように決定されるトポロジカル・マップの演算装置であって、
前記入力ベクトルはセンサーで計測された環境の情報であり、
現在の入力タイミングにおける入力ベクトルに対応するウィナー・ユニットの候補の集合であるウィナー・ユニット候補集合を算出するウィナー・ユニット候補集合算出手段と、
前記現在の入力タイミングにおける入力ベクトルに対応するウィナー・ユニットを、前記ウィナー・ユニット候補集合算出手段が算出したウィナー・ユニット候補集合に含まれるユニットのうち最大の入力を受けたユニットとして算出するウィナー・ユニット算出手段と、
前記現在の入力タイミングにおける入力ベクトルの変化方向を算出する入力ベクトル変化方向算出手段を含み、
前記ウィナー・ユニット候補集合算出手段は、前記現在の入力タイミングに近接する過去の入力タイミングにおけるウィナー・ユニットと、前記入力ベクトル変化方向算出手段が算出した前記現在の入力タイミングにおける入力ベクトルの変化方向とに基づいて、前記ウィナー・ユニット候補集合を算出する、
ことを特徴とするトポロジカル・マップ演算装置。 - 前記ウィナー・ユニットは、前記トポロジカル・マップの各ユニットのシナプス荷重ベクトルを更新する学習処理のために算出される、
ことを特徴とする請求項1乃至2の何れか1項に記載のトポロジカル・マップ演算装置。 - 前記トポロジカル・マップは、環境内での移動体の移動経路をナビゲートするための地図として使用され、
前記入力ベクトルは、前記移動体の前記環境内での位置を示すセンサー情報に対応する、
ことを特徴とする請求項3に記載のトポロジカル・マップ演算装置。 - 前記トポロジカル・マップは、環境内での移動体の移動経路をナビゲートするための地図として使用され、
前記入力ベクトルは、前記移動体の前記環境内での位置を示すセンサー情報に対応し、
前記ウィナー・ユニットは、前記トポロジカル・マップの各ユニットのシナプス荷重ベクトルを更新する学習処理のために算出され、
前記ウィナー・ユニット候補集合算出手段は、現在の入力タイミングの1つ前の入力タイミングで算出されたウィナー・ユニットの位置を(inw,jnw)、前記ウィナー・ユニット候補集合に含まれる各ユニットの位置を(in ,jn )、前記ウィナー・ユニット候補集合をC(nw )としたとき、下記数1式を満たすウィナー・ユニット候補集合C(nw )を算出する、
ことを特徴とする請求項1に記載のトポロジカル・マップ演算装置。 - 前記トポロジカル・マップは、環境内での移動体の移動経路をナビゲートするための地図として使用され、
前記入力ベクトルは、前記移動体の前記環境内での位置を示すセンサー情報に対応し、
前記ウィナー・ユニットは、前記トポロジカル・マップの各ユニットのシナプス荷重ベクトルを更新する学習処理のために算出され、
前記ウィナー・ユニット候補集合算出手段は、現在の入力タイミングの1つ前の入力タイミングで算出されたウィナー・ユニットの位置を(inw,jnw)、前記ウィナー・ユニット候補集合をC(nw )としたとき、下記数2式を満たすウィナー・ユニット候補集合C(nw )を算出する、
ことを特徴とする請求項1に記載のトポロジカル・マップ演算装置。 - 前記トポロジカル・マップは、環境内での移動体の移動経路をナビゲートするための地図として使用され、
前記入力ベクトルは、前記移動体の前記環境内での位置を示すセンサー情報に対応し、
前記ウィナー・ユニットは、前記トポロジカル・マップの各ユニットのシナプス荷重ベクトルを更新する学習処理のために算出され、
前記入力ベクトル変化方向算出手段は、前記現在の入力タイミングにおける入力ベクトルの変化方向を、下記数3式を満たす4方向dir1,dir2,dir3、dir4の何れかの方向として算出し、
前記ウィナー・ユニット候補集合算出手段は、現在の入力タイミングの1つ前の入力タイミングで算出されたウィナー・ユニットの位置を(inw,jnw)、前記ウィナー・ユニット候補集合をC(nw )としたとき、前記入力ベクトル変化方向算出手段が算出した前記現在の入力タイミングにおける入力ベクトルの変化方向に応じて、下記数4式を満たすウィナー・ユニット候補集合C(nw )を算出する、
ことを特徴とする請求項2に記載のトポロジカル・マップ演算装置。 - 前記トポロジカル・マップは、環境内での移動体の移動経路をナビゲートするための地図として使用され、
前記入力ベクトルは、前記移動体の前記環境内での位置を示すセンサー情報に対応し、
前記ウィナー・ユニットは、前記トポロジカル・マップの各ユニットのシナプス荷重ベクトルを更新する学習処理のために算出され、
前記入力ベクトル変化方向算出手段は、前記現在の入力タイミングにおける入力ベクトルの変化方向を、下記数5式を満たす4方向dir1,dir2,dir3、dir4の何れかの方向として算出し、
前記ウィナー・ユニット候補集合算出手段は、現在の入力タイミングの1つ前の入力タイミングで算出されたウィナー・ユニットの位置を(inw,jnw)、前記ウィナー・ユニット候補集合をC(nw )としたとき、前記入力ベクトル変化方向算出手段が算出した前記現在の入力タイミングにおける入力ベクトルの変化方向に応じて、下記数6式を満たすウィナー・ユニット候補集合C(nw )を算出する、
ことを特徴とする請求項2に記載のトポロジカル・マップ演算装置。 - 前記ウィナー・ユニットは、前記トポロジカル・マップの各ユニットのシナプス荷重ベクトルを更新する学習処理のために算出され、
前記ウィナー・ユニット算出手段が算出したウィナー・ユニットと、前記入力ベクトル変化方向算出手段が算出した前記現在の入力タイミングにおける入力ベクトルの変化方向とに基づき、シナプス荷重ベクトルが更新されるユニットの集合である学習対象ユニット集合を算出する学習対象ユニット集合算出手段と、
該学習対象ユニット集合算出手段が算出した学習対象ユニット集合に含まれるユニットに対して、前記シナプス荷重ベクトルを更新する学習処理を実行するシナプス荷重ベクトル更新手段と、
を更に含む、
ことを特徴とする請求項2に記載のトポロジカル・マップ演算装置。 - 前記ウィナー・ユニットは、前記トポロジカル・マップの参照処理のために算出される、
ことを特徴とする請求項1乃至2の何れか1項に記載のトポロジカル・マップ演算装置。 - 前記トポロジカル・マップは、環境内での移動体の移動経路をナビゲートするための地図として使用され、
前記入力ベクトルは、前記移動体の前記環境内での位置を示すセンサー情報に対応する、
ことを特徴とする請求項10に記載のトポロジカル・マップ演算装置。 - 2次元状に配置されたN個のユニットから構成され、入力ベクトルが与えられたときに、前記各ユニットへの入力が前記入力ベクトルの各成分とシナプス荷重ベクトルの各成分との積の総和として決定し、該各ユニットへの入力のうち最大の入力を受けたユニットであるウィナー・ユニットのみが発火するように決定するトポロジカル・マップ演算装置により実行されるトポロジカル・マップ演算方法であって、
前記入力ベクトルはセンサーで計測された環境の情報であり、
現在の入力タイミングに近接する過去の入力タイミングにおいて算出されたウィナー・ユニットに基づいて、現在の入力タイミングにおける入力ベクトルに対応するウィナー・ユニットの候補の集合であるウィナー・ユニット候補集合を算出し、
前記現在の入力タイミングにおける入力ベクトルに対応するウィナー・ユニットを、前記ウィナー・ユニット候補集合に含まれるユニットのうち最大の入力を受けたユニットとして算出する、
過程を含むことを特徴とするトポロジカル・マップ演算方法。 - 2次元状に配置されたN個のユニットから構成され、入力ベクトルが与えられたときに、前記各ユニットへの入力が前記入力ベクトルの各成分とシナプス荷重ベクトルの各成分との積の総和として決定し、該各ユニットへの入力のうち最大の入力を受けたユニットであるウィナー・ユニットのみが発火するように決定するトポロジカル・マップ演算装置により実行されるトポロジカル・マップ演算方法であって、
前記入力ベクトルはセンサーで計測された環境の情報であり、
現在の入力タイミングにおける入力ベクトルの変化方向を算出し、
前記現在の入力タイミングに近接する過去の入力タイミングにおけるウィナー・ユニットと、前記現在の入力タイミングにおける入力ベクトルの変化方向とに基づいて、前記現在の入力タイミングにおける入力ベクトルに対応するウィナー・ユニットの候補の集合であるウィナー・ユニット候補集合を算出し、
前記現在の入力タイミングにおける入力ベクトルに対応するウィナー・ユニットを、前記ウィナー・ユニット候補集合に含まれるユニットのうち最大の入力を受けたユニットとして算出する、
過程を含むことを特徴とするトポロジカル・マップ演算方法。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP19487396A JP3884103B2 (ja) | 1996-07-24 | 1996-07-24 | 入力パターンの変化の連続性を考慮したトポロジカル・マップ演算装置及び方法 |
| US08/828,693 US5937398A (en) | 1996-07-24 | 1997-03-31 | Topological map computation system and method in which the continuity of changes in input patterns is considered |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP19487396A JP3884103B2 (ja) | 1996-07-24 | 1996-07-24 | 入力パターンの変化の連続性を考慮したトポロジカル・マップ演算装置及び方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH1040231A JPH1040231A (ja) | 1998-02-13 |
| JP3884103B2 true JP3884103B2 (ja) | 2007-02-21 |
Family
ID=16331736
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP19487396A Expired - Fee Related JP3884103B2 (ja) | 1996-07-24 | 1996-07-24 | 入力パターンの変化の連続性を考慮したトポロジカル・マップ演算装置及び方法 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US5937398A (ja) |
| JP (1) | JP3884103B2 (ja) |
Families Citing this family (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE19734947B4 (de) * | 1997-08-13 | 2010-04-29 | Otte, Ralf, Dr. | Verfahren zur Steuerung von Prozeßvorgängen |
| US6996768B1 (en) * | 2000-06-15 | 2006-02-07 | International Business Machines Corporation | Electric publishing system and method of operation generating web pages personalized to a user's optimum learning mode |
| EP1554639B1 (de) * | 2002-10-23 | 2007-12-12 | Siemens Aktiengesellschaft | Verfahren und anordnung sowie computerprogramm mit programmcode-mitteln und computerprogramm-produkt zur bildung einer graphenstruktur zur beschreibung einer fläche mit einer freifläche und einer belegtfläche |
| KR100506097B1 (ko) * | 2004-02-04 | 2005-08-03 | 삼성전자주식회사 | 자기장 지도 생성 방법 및 장치와 이를 활용한 이동체의포즈 확인 방법 및 장치 |
| US7467115B2 (en) * | 2004-07-15 | 2008-12-16 | Neurosciences Research Foundation, Inc. | Mobile brain-based device having a simulated nervous system based on the hippocampus |
| KR100749923B1 (ko) | 2005-12-08 | 2007-08-21 | 한국전자통신연구원 | 카메라와 표식을 이용한 이동 로봇의 측위 시스템 및 방법 |
| JP5246751B2 (ja) * | 2008-03-31 | 2013-07-24 | 独立行政法人理化学研究所 | 情報処理装置、情報処理方法、およびプログラム |
| US8948913B2 (en) * | 2009-10-26 | 2015-02-03 | Electronics And Telecommunications Research Institute | Method and apparatus for navigating robot |
| US8655813B2 (en) | 2010-12-30 | 2014-02-18 | International Business Machines Corporation | Synaptic weight normalized spiking neuronal networks |
| KR20130021616A (ko) * | 2011-08-23 | 2013-03-06 | 삼성전자주식회사 | 다중 측위를 이용한 단말의 측위 장치 및 방법 |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH02210589A (ja) * | 1989-02-10 | 1990-08-21 | Nec Corp | 文字認識装置 |
| US5222210A (en) * | 1990-12-03 | 1993-06-22 | Motorola, Inc. | Method of displaying the state of an artificial neural network |
| US5416308A (en) * | 1991-08-29 | 1995-05-16 | Video Lottery Technologies, Inc. | Transaction document reader |
| US5461696A (en) * | 1992-10-28 | 1995-10-24 | Motorola, Inc. | Decision directed adaptive neural network |
| US5557686A (en) * | 1993-01-13 | 1996-09-17 | University Of Alabama | Method and apparatus for verification of a computer user's identification, based on keystroke characteristics |
| JP3037432B2 (ja) * | 1993-11-01 | 2000-04-24 | カドラックス・インク | 光波オーブンによる食物調理方法および調理装置 |
| JPH07177502A (ja) * | 1993-12-17 | 1995-07-14 | Sutajio Gen:Kk | 画像情報圧縮方法、圧縮画像情報記録媒体、圧縮画像情報再生装置 |
| JPH0850548A (ja) * | 1994-08-05 | 1996-02-20 | Nikon Corp | 経路学習方法及び装置 |
| US5727130A (en) * | 1995-08-31 | 1998-03-10 | Motorola, Inc. | Genetic algorithm for constructing and tuning fuzzy logic system |
-
1996
- 1996-07-24 JP JP19487396A patent/JP3884103B2/ja not_active Expired - Fee Related
-
1997
- 1997-03-31 US US08/828,693 patent/US5937398A/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| US5937398A (en) | 1999-08-10 |
| JPH1040231A (ja) | 1998-02-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Francis et al. | Long-range indoor navigation with PRM-RL | |
| CN108496127A (zh) | 集中于对象的有效三维重构 | |
| Menna et al. | Real-time autonomous 3D navigation for tracked vehicles in rescue environments | |
| JP3884103B2 (ja) | 入力パターンの変化の連続性を考慮したトポロジカル・マップ演算装置及び方法 | |
| Oliveira et al. | Three-dimensional mapping with augmented navigation cost through deep learning | |
| Dubrawski et al. | Learning locomotion reflexes: A self-supervised neural system for a mobile robot | |
| Poncela et al. | Efficient integration of metric and topological maps for directed exploration of unknown environments | |
| Qiu | Multi-agent navigation based on deep reinforcement learning and traditional pathfinding algorithm | |
| Velez et al. | Modelling observation correlations for active exploration and robust object detection | |
| Hong et al. | Obstacle avoidance of hexapod robots using fuzzy Q-learning | |
| McCammon et al. | Topology-aware self-organizing maps for robotic information gathering | |
| Yosif et al. | Artificial techniques based on neural network and fuzzy logic combination approach for avoiding dynamic Obstacles | |
| Xu et al. | Solo t-dirl: Socially-aware dynamic local planner based on trajectory-ranked deep inverse reinforcement learning | |
| Racz et al. | Artificial neural network for mobile robot topological localization | |
| Rottmann et al. | Adaptive autonomous control using online value iteration with gaussian processes | |
| Anarossi et al. | Deep segmented dmp networks for learning discontinuous motions | |
| Kaleci et al. | A probabilistic approach for semantic classification using laser range data in indoor environments | |
| Ray et al. | Human-centered autonomy for UAS target search | |
| Janét et al. | Global self-localization for autonomous mobile robots using self-organizing Kohonen neural networks | |
| Han et al. | A novel navigation scheme in dynamic environment using layered costmap | |
| Wurm et al. | Improved Simultaneous Localization and Mapping using a Dual Representation of the Environment. | |
| Kashyap et al. | Modified type-2 fuzzy controller for intercollision avoidance of single and multi-humanoid robots in complex terrains | |
| CN117270543A (zh) | 复杂障碍物环境下基于dibnn的多机器人协同区域搜索方法 | |
| Díaz-Toro et al. | Path planning for assisting blind people in purposeful navigation | |
| Janet et al. | Self-organizing geometric certainty maps: A compact and multifunctional approach to map building, place recognition and motion planning |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050621 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051018 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051207 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060328 |
|
| RD12 | Notification of acceptance of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7432 Effective date: 20060517 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060524 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20060517 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060829 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061005 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20061114 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20061116 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |
