WO2004033159A1

WO2004033159A1 - ロボット制御アルゴリズム構築装置、ロボット制御アルゴリズム構築プログラム、ロボット制御装置、ロボット制御プログラム、およびロボット

Info

Publication number: WO2004033159A1
Application number: PCT/JP2002/010622
Authority: WO
Inventors: Fumio Nagashima
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2002-10-11
Filing date: 2002-10-11
Publication date: 2004-04-22
Anticipated expiration: 2005-04-11
Also published as: EP1552908A4; US7072741B2; US20050119791A1; JPWO2004033159A1; EP1552908A1

Abstract

　本発明は、ロボットの運動を制御する制御アルゴリズムを構築する装置やその構築された制御アルゴリズムにしたがってロボットの運動を制御する装置等に関し、従来のＭＺＰ法等、力学的な方程式を解く方式と比べ制御アルゴリズム作成のコストや時間を大きく下げることを目的とし、入力に対すアナログ的な時間遅れを伴う出力を生成するニューロンを含むリカレントニューラルネットワーク（ＲＮＮ）により制御アルゴリズムを構成し、そのＲＮＮの係数を低次の項から高次の項に向かって順次決定していく。

Description

明細書ロボッ卜制御アルゴリズム構築装置、ロボット制御アルゴリズム構築プログラムロボット制御装置、口ポット制御プログラム、およびロボット技術分野

本発明は、ロボットの動作を制御するための制御アルゴリズムを構築するロボット制御アルゴリズム構築装置、コンピュータ等の情報処理装置をロポット制御アルゴリズム構築装置として動作させるロボット制御アルゴリズム構築プロダラム、ロボットの動作を制御するロボット制御装置、コンピュータ等の情報処理装置をロボット制御装置として動作させるロボット制御プログラム、および、ロボッ卜に関する。背景技術

近年、人間共存型の口ポットの研究が盛んに行なわれている（例えば非特許文献 1， 2参照）。近い将来、街にロボットが進出し、人間を助けるために働いている風景を想像することが容易になりつつある。また、それらのロボットは、各々まったく異なる作業をしていることであろうと想像できる。

ここで、近年開発が進んでいる二足歩行ロボットは、 ZMP法（Z o r o M omen t um Po i n t me t hod) と呼ばれる制御アルゴリズムで動作するように構成されている。

図 1は、 ZMP法の原理説明図である。

ロポッ卜が静止しているときは、そのロポッ卜の重心がちょうど足裏の真上に来るように上体を起こすことによって立ったままの姿勢を保つことができる。これに対し、その口ポットが例えば前進しょうとしたとき、重心が足裏の真上にあるままの状態では、後ろに倒れることになる。

これは、 ZMP (動的重心点）が後ろに位置してしまうためである。前進するときに倒れないようにするには、上体を前方に傾けて上体を加速するとそれに対し復元力が働き、また床からの反力やそのロボットの重心点も考慮し、目標点に Z MPが位置するように、上体の傾きの程度等が調節される。このようにして、 ZPM (動的重心点）が常に目標位置に来るように制御することにより、二足歩行ロボットは前進することができる。

この MZP法に基づく制御アルゴリズムは、極めて複雑な力学的、数学的演算を必要とする制御アルゴリズムであり、その開発にも多大のコストと時間を要する。また、この ZMP法を採用すると、完成されたいわば能役者の歩き方となり、歩き方 1つとつても '人間らしさ' とは少し異なる印象の歩き方となりがちである。

また、 ZMP法を採用した二足歩行口ポットに限らず、現在、大半のロボットは、手続き型言語によってある特定の作業を行うためのソフトウェアが作られている。そのため、まったく異なった作業を行うには、このソフトウェアを取り替える必要がある。要するに制御アルゴリズムを組み直すことが必要となる。作業に必要なアルゴリズムを作業毎に作っていては、多数のソフトウエアが必要になりコス卜が極めて高くつくことが予想される。ミドルウェアの開発等を行なうことによりコストダウンを図ることも 1つの方法ではあるが、またひとつの方法は、ロポットあるいはロポット制御装置が自ら学習して各々の作業を覚えることである。

この自ら学習する学習システムの代表例としてニューラルネットワークが知られている。

図 2は、階層化ニューラルネッ卜ワーク（LNN : Laye r ed Ne u r a 1 Ne two r k) のモデルを示した図である。

ここでは、入力層、中間層、出力層の各層にニューロンが配置されており、この LNNへの入力は全て入力層のニューロンで受け取られ、入力層の各ニューロンの出力が中間層の各ニューロンに伝えられ、中間層の各ニューロンの出力が出力層のニューロンに伝えられ、その出力層のニューロンからの出力がこの LNN の出力となる。

図 3は、図 2に示す LNNを構成する各ニューロンのモデルを示す図、図 4は、そのニューロンの入出力の関係を規定するシグモイド関数を示す図である。図 3に示すように、前段側から複数の入力 Xい X₂， X₃, ···, があると、各結合強度を Wい W₂， W₃， ···， Wiとし、このニューロンは、

^=2 ^x^ ― (1) を全体としての入力として受け取り、このニューロンでは、図 4のシグモイド関数 (^{Z) =} l ₊ exp(- ) …… ⁽²⁾

に従う出力 Y= f (X) が生成される。

この LNNに関しては、結合強度 \¥ぃ W₂， W₃, …，と呼ばれる各係数の値を決定する必要がある。この係数の決定方法として B P法（Ba c k P r o p ag a t i on法）が知られており、いわゆる教師付き、教師なし学習など様々な学習法が存在する。

この LNNは、基本的に入力にフィルタをかけて出力するものであり、 BP法によってフィル夕の係数（上記の結合係数 W₂, W₃， …， W,) を適切に定めることはできるものの、この LNNは、例えば周期運動、非周期運動に相当する出力を生成することはできず、ロポッ卜の動作制御には本質的に不向きであるニューラルネットワークのもう 1つのモデルとしてリカレントニューラルネットワーク（RNN : Re cu r r e n t Ne u r a l Ne two r k) が知られている。

図 5は、 RNNのモデルを示す図である。

図 2の LNNは、入力側から出力側に向かって整然と信号が流れて行くのに対し、図 5の RNNは、入力側のニューロンから出力側のニューロンに向かって信号が伝えられるだけでなく、出力側のニューロンから入力側のニューロンに向かつて信号が伝えられることにより、信号の流れのループが存在する。

この RNNは、盛んに研究されてはいるが、例えば上述の LNNや BP法のような、ニューロンの組合せ方（信号の伝搬のルートの決め方）や学習の仕方（係数の値の決め方）としての決定的な手法は従来見い出されていない。

(非特許文献 1 ) J i ang Sh an, Fumi o Nag a s h ima : B i o l og i c a 1 1 y I n s p i r e d Sp i n a l l o c omo t i on Co n t r o 1 1 e r f o r Human o i d R o b o t，第 19回日本ロボット学会学術講演会， P. 517 - 518 (2001)

(非特許文献 2 )

T a g a G. , M i yake Y. , Yamaguc h i Y. , S h imi z u H. ： Gen e r a t i on and Coo r d i n a t i on o f B i p e d a l Loc omo t i on t h r ough G 1 o b a 1 En t r a i nme n t (1991) 発明の開示

本発明は、上記事情に鑑み、従来の MZP法等、力学的な方程式を解く方式と比べ制御アルゴリズム作成のコス卜や時間を大きく下げることのできるロポッ卜制御アルゴリズム構築装置およびロポット制御アルゴリズム構築プログラム、およびコストの安い口ポット制御装置、ロボット制御プログラム、および口ポットを提供することを目的とする。

上記目的を達成する本発明のロボット制御アルゴリズム構築装置は、 2つの部材の相対的な位置もしくは姿勢を可変にそれら 2つの部材を結合する関節を少なくとも 1つ備えたロボッ卜の動作を制御するための制御アルゴリズムを構築するロポット制御アルゴリズム構築装置において、

入力に基づいて遅れゼロを含むアナログ的な遅れを伴う出力を生成するニュー口ンの定義を記憶する定義記憶部と、

定義記憶部に記憶された定義を用い、複数のニューロンを有しそれら複数の二ュ一ロンの中に遅れゼロを除くアナログ的な遅れを伴う出力を生成する遅れニュ —ロンを少なくとも 1つ含むとともに信号の流れのループが存在するリカレントニューラルネットワークにより構築された、値が未確定の係数を含む制御アルゴリズムを生成する制御アルゴリズム生成部と、

制御アルゴリズム生成部で生成された制御アルゴリズムの係数の値を決定する係数値決定部とを備えたことを特徴とする。ここで、上記の「ロボット」は、「2つの部材の相対的な位置もしくは姿勢を可変にそれら 2つの部材を結合する関節を少なくとも 1つ備えた」ものであればよく、例えばこの定義に合致するマニピュレータ等もここでいうロポッ卜に該当する。

また、上記の「アナログ的な遅れ」とは、入力の値変化に対して出力の値が滑らかに遅れて変化するという現象を伴う遅れをいう。

本発明のロボット制御アルゴリズム構築装置は、図 5を参照して説明した、信号のループを有するリカレントニューラルネッ卜ワークを採用した制御アルゴリズムを構築するものであるが、このリカレントニューラルネットワークを構成するニューロンの中に、入力に基づいて上記の定義におけるアナログ的な遅れを伴う出力を生成する遅れニューロンを含ませることにより、例えば様々な周期の三角関数を実現して任意の波形の周期信号を生成したり、多項式を実現して様々な波形の非周期信号を生成することができ、上記のように定義されたニューロンを用いて制御目的に合致したリカレントニューラルネットワークを構築することにより、例えば Z M P法等、愿大な力学的演算を行なう従来の制御アルゴリズムと比べ同等の制御を行なう制御アルゴリズムを極めて容易に構築することができるここで、上記制御アルゴリズム生成部は、上記制御アルゴリズムをオペレータの操作に応じて決定するものであってもよいが、例えば後述する実施形態で説明するように高次の項に対応する部分ネットワークを順次自動生成するなど、上記制御アルゴリズムを生成するための生成アルゴリズムをあらかじめ定めておいて、上記制御アルゴリズムを自動生成するものであってもよい。

また、上記係数値決定部は、上記係数の値を、ォペレ一夕の操作に応じて決定するものであってもよく、あるいは、上記係数の値を、制御対象の口ポットの動作を評価する評価関数に基づいて決定するものであってもよく、あるいはそれらの組合せであってもよい。

また、上記定義記憶部は、入力を V。、出力を V 遅れを _{£ l}としたとき、基本的に、

の式に従って出力を生成するというニューロンの定義を記憶するものであることが好ましい。

上記の定義における「アナログ的な遅れ」をできるだけ単純な数式で表現すると、上記（3 ) 式のように表現することができ、上記の定義における「アナログ的な遅れ」を表現するにあたり、上記（3 ) 式よりも複雑な式を採用する必要性も見あたらないことから、「アナログ的な遅れ」を伴う出力を生成するニューロンの定義として上記（3 ) 式を採用することが好ましい。

ここでのニューロンは、基本的には例えば上記（3 ) 式のように表現されるが、以下のようないくつかの変形を含ませることが好ましい。

すなわち、上記定義記憶部に記憶された定義には、複数の入力を受けそれら複数の入力の総和に基づいて、遅れゼロを含むアナログ的な遅れを伴う出力を生成するというニューロンの定義を含むものであり、上記制御アルゴリズム生成部は、その定義に従うニューロンを含む制御アルゴリズムの生成が自在なものであることが好ましく、また、

上記定義記憶部に記憶された定義には、入力に重みを付し重みを付した入力に基づいて、遅れゼロを含むアナログ的な遅れを伴う出力を生成するというニューロンの定義を含むものであり、上記制御アルゴリズム生成部は、その定義に従うニューロンを含む制御アルゴリズムの生成が自在なものであることが好ましい。上記定義記憶部に記憶された定義に、上記の、入力に重みを付するニューロンの定義を含む場合に、その定義記憶部に記憶された定義には、その重みを別の二ユーロンの出力に応じて変更する定義を含むものであって、上記制御アルゴリズム生成部は、入力に重みを付するニューロンを含むとともにその重みを変更する別のニューロンを含む制御アルゴリズムの生成が自在なものであることが、さらに好ましい。

また、上記定義記憶部に記憶された定義には、ニューロンの遅れを別のニューロンの出力に応じて変更する定義を含むものであって、上記制御アルゴリズム生成部は、その別のニューロンを含むとともにその別のニューロンの出力によって変更される遅れを伴う出力を生成するニューロンを含む制御アルゴリズムの生成が自在なものであることが好ましく、また、

上記定義記憶部に記憶された定義には、入力が閾値を越える場合に入力に代えて閾値を採用するニューロンの定義を含むものであって、上記制御アルゴリズム生成部は、その定義に従うニューロンを含む制御アルゴリズムの生成が自在なものであることが好ましい。

ここで、「入力が閾値を越える場合」には、複数の態様がある。すなわち、ここには、入力が閾値よりも小さい値のときに入力が有効となり、入力が閾値を小さい値から大きい値の方に越えると閾値が有効になるという、閾値が上限値となる態様や、これとは逆に、入力が閾値よりも大きい値のときに入力が有効となり、入力が閾値を大きい値から小さい値の方に越えると閾値が有効になるという、閾値が下限値となる態様がある。ここでは、これら双方の態様のニューロンを定義しておくことが好ましい。

さらに、上記定義記憶部に記憶された定義には、 2つのニューロン間の結合を別のニューロンの出力に応じて接断するスィッチの定義を含むものであって、上記制御アルゴリズム生成部は、その別のニューロンを含むとともにその別のニュ一ロンの出力に応じて接断するスィツチにより接断される結合が定義された 2つのニューロンを含む制御アルゴリズムの生成が自在なものであることが好ましいまた、上記本発明の口ポット制御アルゴリズム構築装置において、上記制御ァルゴリズム生成部は、周期関数を実現し周期信号を出力する部分ネットワークを含む制御アルゴリズムの生成が自在なものであり、この場合に、その周期関数は、相互に異なる周期の複数の単位周期関数の結合からなるものであって、上記制御アルゴリズム生成部は、上記部分ネットワークを生成するにあたり、複数の単位周期関数を実現し相互に異なる周期の複数の単位周期信号を出力する複数の単位ネットワークの結合からなる部分ネットワークを生成するものであることが好ましい。

上記係数値決定部は、上記制御アルゴリズム生成部により複数の単位ネットヮ —クの結合からなる部分ネットワークが生成される場合に、その部分ネットヮ一 200

8 クの係数の値を、その部分ネットワークを構成する複数の単位ネットワークのうちの、より長周期の単位周期信号を出力する単位ネットワークから、より短周期の単位周期信号を出力する単位ネットワークに向かって、例えば 1つの単位ネットワークずつなど順次に、各単位ネットワークの係数の値を決定していくものであることが好ましい。

ある程度複雑なロポットを制御するための制御アルゴリズムを構築すると、その制御アルゴリズム中には、非常に多くの係数が含まれ、制御アルゴリズムを完成させるには、それら非常に多数の係数の全てについて値を決定する必要がある。係数の値を決定する方法として例えば前述の L N Nの場合は B P法を採用することができるが、この B P法は L NNに限って適用可能なものであり、本発明で採用している R NN (リカレントニューラルネットワーク）の場合は適用不能である。

係数の値を決定する他の手法として、例えば二分法や遺伝的アルゴリズム（G A： G e n e t i c A l g o r i t h m) などが知られている。二分法は、基本的には、係数の値として取り得る第 1の範囲内のほぼ中央に位置する値を代入して動作させることにより、その係数の最適な値はその代入した値より大きい値であるか小さい値であるかを評価し、その係数に、今度は、その評価により得られた大きい値（あるいは小さい値）が存在する、上記の第 1の範囲の 1 / 2の第 2の範囲内のほぼ中央に位置する値を代入して評価し、これを繰り返すことにより範囲を狭めていき、最終的にその係数の値を決定する方法である。一方、遺伝的アルゴリズムは、係数に少しずつ異なる値を代入して評価したり、突然変異のように全く異なる値を代入して評価したり、あるいは、遺伝子が子供に遺伝するかのように、ある程度良好な評価が得られた 2つの値の中間的な値を代入して評価したりなど、生物の遺伝をモデルにして係数の値を様々に変化させて評価し、最終的に適切な値を決定する手法である。

これら二分法や G Aを適用した場合であっても、同時に決定すべき係数の数が多いと、それらの係数を決めるのに極めて多大の時間を要する結果とする。これに対し上記のように、周期の長い単位周期関数を実現する単位ネットヮークから周期の短い単位周期関数を実現する単位ネットワークへと順次に係数の値を決定していくことにより、同時に決定する必要のある係数の数を格段に減らすことができ、係数値決定のプロセスを単位ネットワークの数と同数繰り返したとしても、全ての係数の値を同時に決定しょうとした場合と比べ、それらの係数の決定に要する時間は、後述する例では 1 0 ^{5 7}倍程度もの天文学的な数字で表されるほどの差が生じることになる。また、このように、周期の長い単位周期関数を実現する単位ネットワークから周期の短い単位周期関数を実現する単位ネットヮークへと順次に係数の値を決定していくと、 1つの単位ネットワークの係数を決定していくたびに制御対象のロポッ卜の動きを所望の滑らかな動きに近づかせることができ、ロボッ卜の動きの精度を所望の精度まで順次向上させていくことができる。

また、上記本発明の口ポット制御アルゴリズム構築装置において、上記制御ァルゴリズム生成部は、多項式で表わされる非周期関数を実現し非周期信号を出力する部分ネットワークを含む制御アルゴリズムの生成が自在なものであり、この場合に、上記制御アルゴリズム生成部は、上記部分ネットワークを生成するにあたり、多項式の各項を実現し各項に対応する各単位信号を出力する複数の単位ネットワークの結合からなる部分ネットワークを生成するものであることが好ましい。

上記制御アルゴリズム生成部により上記複数の単位ネットワークの結合からなる部分ネットワークが生成される場合に、上記係数値決定部は、その部分ネットワークの係数の値を、その部分ネットワークを構成する複数の単位ネットワークのうちの、より次数の低い項に対応する単位信号を出力する単位ネットワークから、より次数の高い項に対応する単位信号を出力する単位ネットワークに向かつて順次に、各単位ネットワークの係数の値を決定していくものであることが好ましい。

周期関数（口ポットの周期的な動作）に関する上述の説明は、多項式で表現される非周期関数（ロボットの非周期的な動作）に関しても成り立つ。多項式の場合は、より次数の低い項に対応する単位ネットワークから、より次数の高い項に対応する単位ネットワークに向かって順次に、各単位ネットワークの係数値を決定していくことになる。また、上記目的を達成する本発明のロポット制御アルゴリズム構築プログラムは、プログラムを実行する情報処理装置内で実行され、その情報処理装置を、 2 つの部材の相対的な位置もしくは姿勢を可変にそれら 2つの部材を結合する関節を少なくとも 1つ備えたロポットの動作を制御するための制御アルゴリズムを構築するロボット制御アルゴリズム構築装置として動作させるロボット制御アルゴリズム構築プログラムであって、

上記情報処理装置を、

定義記憶部に記憶された定義を用い、複数のニューロンを有しそれら複数の二ユーロンの中に遅れゼロを除くアナログ的な遅れを伴う出力を生成する遅れニュ —ロンを少なくとも 1つ含むとともに信号の流れのループが存在するリカレントニューラルネットワークにより構築された、値が未確定の係数を含む制御アルゴリズムを生成する制御アルゴリズム生成部と、

制御アルゴリズム生成部で生成された制御アルゴリズムの係数の値を決定する係数値決定部とを備えたロボット制御アルゴリズム構築装置として動作させることを特徴とする。

本発明のロポット制御アルゴリズム構築プログラムは、コンピュータ等の情報処理装置を、本発明のロポッ卜制御アルゴリズム構築装置として動作させるものであり、本発明のロボット制御アルゴリズム構築装置の各種態様は、その態様を実現するための、本発明ロボット制御アルゴリズム構築プログラムの態様として成立する。

すなわち、上記本発明のロポット制御アルゴリズム構築プログラムにおいて、上記制御アルゴリズム生成部は、上記制御アルゴリズムをオペレータの操作に応じて決定するものであってもよいが、例えば後述する実施形態で説明するように高次の項に対応する部分ネットワークを順次自動生成するなど、上記制御アルゴリズムを生成するための生成アルゴリズムをあらかじめ定めておいて、上記制御アルゴリズムを自動生成するものであってもよい。

また、上記係数値決定部は、上記係数の値を、オペレータの操作に応じて決定するものであるものであってもよく、あるいは、上記係数値決定部は、上記係数の値を、制御対象のロボッ卜の動作を評価する評価関数に基づいて決定するものであってもよく、あるいはそれらの組合せであってもよい。

また、上記定義記憶部は、入力を V。、出力を v ₁ 遅れを _{£ l}としたとき、基本的に、 + 。 …… （^{3 )}

の式に従って出力を生成するというニューロンの定義を記憶するものであることが好ましく、また、

上記定義記憶部に記憶された定義には、複数の入力を受けそれら複数の入力の総和に基づいて、遅れゼロを含むアナログ的な遅れを伴う出力を生成するというニューロンの定義を含むものであり、上記制御アルゴリズム生成部は、その定義に従うニューロンを含む制御アルゴリズムの生成が自在なものであることが好ましく、. また、

上記定義記憶部に記憶された定義には、入力に重みを付し重みを付した入力に基づいて、遅れゼロを含むアナログ的な遅れを伴う出力を生成するというニューロンの定義を含むものであり、上記制御アルゴリズム生成部は、その定義に従うニューロンを含む制御アルゴリズムの生成が自在なものであることが好ましい。ここで、上記定義記憶部に記憶された定義に、上記の、入力に重みを付する二ユーロンの定義を含む場合に、その上記定義記憶部に記憶された定義には、その重みを別のニューロンの出力に応じて変更する定義を含むものであって、上記制御アルゴリズム生成部は、入力に重みを付するニューロンを含むとともにその重みを変更する別のニューロンを含む制御アルゴリズムの生成が自在なものであることが好ましい。

また、上記定義記憶部に記憶された定義には、ニューロンの遅れを別のニューロンの出力に応じて変更する定義を含むものであって、上記制御アルゴリズム生成部は、その別のニューロンを含むとともにその別のニューロンの出力によって変更される遅れを伴う出力を生成するニューロンを含む制御アルゴリズムの生成が自在なものであることが好ましく、また、上記定義記憶部に記憶された定義には、入力が閾値を越える場合に入力に代えて閾値を採用するニューロンの定義を含むものであって、上記制御アルゴリズム生成部は、その定義に従うニューロンを含む制御アルゴリズムの生成が自在なものであることが好ましく、さらに、

上記定義記憶部に記憶された定義には、 2つのニューロン間の結合を別のニュ一ロンの出力に応じて接断するスィツチの定義を含むものであつて、上記制御ァルゴリズム生成部は、その別のニューロンを含むとともにその別のニューロンの出力に応じて接断するスィッチにより接断される結合が定義された 2つのニューロンを含む制御アルゴリズムの生成が自在なものであることも好ましい形態である。

さらに、上記本発明のロボット制御アルゴリズム構築プログラムにおいて、上記制御アルゴリズム生成部は、周期関数を実現し周期信号を出力する部分ネットワークを含む制御アルゴリズムの生成が自在なものであり、この場合にその周期関数は、相互に異なる周期の複数の単位周期関数の結合からなるものであって、上記制御アルゴリズム生成部は、上記部分ネットワークを生成するにあたり、複数の単位周期関数を実現し相互に異なる周期の複数の単位周期信号を出力する複数の単位ネットワークの結合からなる部分ネットワークを生成するものであることが好ましく、さらに、上記係数値決定部は、上記制御アルゴリズム生成部により複数の単位ネットワークの結合からなる部分ネットワークが生成される場合に、その部分ネットワークの係数の値を、その部分ネットワークを構成する複数の単位ネッ卜ワークのうちの、より長周期の単位周期信号を出力する単位ネットヮークから、より短周期の単位周期信号を出力する単位ネットワークに向かって順次に、各単位ネットワークの係数の値を決定していくものであることが好ましいさらに、上記本発明のロボット制御アルゴリズム構築プログラムにおいて、上記制御アルゴリズム生成部は、多項式で表わされる非周期関数を実現し非周期信号を出力する部分ネットワークを含む制御アルゴリズムの生成が自在なものであり、この場合に上記制御アルゴリズム生成部は、上記部分ネットワークを生成するにあたり、多項式の各項を実現し各項に対応する各単位信号を出力する複数の単位ネットワークの結合からなる部分ネットワークを生成するものであることが好ましく、この場合にさらに、上記係数値決定部は、上記制御アルゴリズム生成部により複数の単位ネットワークの結合からなる部分ネットヮ一クが生成される場合に、その部分ネットワークの係数の値を、その部分ネットワークを構成する複数の単位ネットワークのうちの、より次数の低い項に対応する単位信号を出力する単位ネットワークから、より次数の高い項に対応する単位信号を出力する単位ネットワークに向かって順次に、各単位ネットワークの係数の値を決定していくものであることが好ましい。

また、本発明の口ポット制御装置は、 2つの部材の相対的な位置もしくは姿勢を可変にそれらの 2つの部材を結合する関節を少なくとも 1つ備えたロポッ卜の動作を制御するロポット制御装置において、

入力に基づいて遅れゼロを含むアナログ的な遅れを伴う出力を生成する複数のニューロンを有しそれら複数のニューロンの中に遅れゼロを除くアナログ的な遅れを伴う出力を生成する遅れニューロンを少なくとも 1つ含むとともに信号の流れのループが存在するリカレントニューラルネットワークにより構築された制御アルゴリズムを記憶する制御アルゴリズム記憶部と、

制御アルゴリズム記憶部に記憶された制御アルゴリズムに基づいて生成された制御信号を用いて制御対象のロボットを制御するロポット制御部とを備えたことを特徴とする。

本発明のロポット制御装置は、例えば本発明のロボット制御アルゴリズム構築装置等を用いて構築した制御アルゴリズム、すなわち、上述の定義における遅れニューロンを有する R N Nにより構築された制御アルゴリズムを記憶しておき、その記憶された制御アルゴリズムに基づいて生成された制御信号を用いて制御対象のロボットを制御するものであり、制御アルゴリズムが安価に供給できることから、このロポット制御装置も安価に構成することができる。

ここで、本発明の口ポット制御装置において、上記リカレントニューラルネットワークを構成するニューロンは、入力を V。、出力を V 遅れを £ェとしたとき、基本的に、 άν, 了,

^£i ^{+ = v}。 ······ ^{( 3 )}

の式に従う出力を生成するものであることが好ましく、また、

上記リカレントニューラルネットワークは、複数の入力を受けそれら複数の入力の総和に基づいて、遅れゼロを含むアナログ的な遅れを伴う出力を生成する二ユーロンの定義を含むものであって、制御アルゴリズム記憶部は、その定義に従うニューロンを含む制御アルゴリズムを記憶するものであることが好ましく、さらに、

上記リカレントニューラルネットワークは、入力に重みを付し、重みを付した入力に基づいて、遅れゼロを含むアナログ的な遅れを伴う出力を生成するニューロンの定義を含むものであって、制御アルゴリズム記憶部は、その定義に従う二ュ一ロンを含む制御アルゴリズムを記憶するものであることも好ましい態様である。

ここで、入力に重みを付するニューロンを含む場合に、上記リカレントニューラルネットワークは、その重みを別のニューロンの出力に応じて変更する定義を含むものであって、制御アルゴリズム記憶部は、入力に重みを付するニューロンを含むとともにその重みを変更する別のニューロンを含む制御アルゴリズムを記憶するものであることが好ましい。

また、本発明のロボット制御装置において、上記リカレントニューラルネットワークは、ニューロンの遅れを別のニューロンの出力に応じて変更する定義を含むものであって、制御アルゴリズム記憶部は、その別のニューロンを含むとともにその別のニューロンの出力によって変更される遅れを伴う出力を生成するニュ一ロンを含む制御アルゴリズムを記憶するものであることが好ましく、また、上記リカレントニューラルネットワークは、入力が閾値を越える場合に入力に代えて閾値を採用するニューロンの定義を含むものであって、制御アルゴリズム記憶部は、その定義に従うニューロンを含む制御アルゴリズムを記憶するものであることが好ましく、さらには、

上記リカレントニューラルネットワークは、 2つのニューロン間の結合を、別のニューロンの出力に応じて接断するスィッチの定義を含むものであって、制御アルゴリズム記憶部は、その別のニューロンを含むとともにその別のニューロンの出力に応じて接断するスィッチにより接断される結合が定義された 2つのニュ一ロンを含む制御アルゴリズムを記憶するものであるこも好ましい形態である。さらに、本発明のロボット制御装置において、上記制御アルゴリズム記憶部は、周期関数を実現し周期信号を出力する部分ネットワークを含む制御アルゴリズムを記憶するものであってもよく、その場合に、その周期関数は相互に異なる周期の複数の単位周期関数の結合からなるものであって、制御アルゴリズム記憶部は、上記複数の単位周期関数を実現する複数の単位ネットワークの結合からなる部分ネットワークを含む制御アルゴリズムを記憶するものであってもよい。また、本発明の口ポット制御装置において、上記制御アルゴリズム記憶部は、多項式で表わされる非周期関数を実現し非周期信号を出力する部分ネットワークを含む制御アルゴリズムを記憶するものであってもよく、その場合に、上記制御アルゴリズム記憶部は、多項式の各項を実現する複数の単位ネットワークの結合からなる部分ネットワークを含む制御アルゴリズムを記憶するものであってもよい。

尚、このロボット制御装置は、口ポットの動作シミュレーションを行なうロボットシミュレーシヨン装置内に実現されたアルゴリズムとしてのロポットを制御対象とするものであってもよく、あるいは、この口ポット制御装置は、ハードウエア的に製作された現実のロボットを制御対象とするものであってもよい。また、上記目的を達成する本発明のロボット制御プログラムは、プログラムを実行する情報処理装置内で実行され、その情報処理装置を、 2つの部材の相対的な位置もしくは姿勢を可変にそれらの部材を結合する関節を少なくとも 1つ備えたロポットの動作を制御するロボット制御装置として動作させるロポット制御プログラムであって、

上記情報処理装置を、

入力に基づいて遅れゼロを含むアナログ的な遅れを伴う出力を生成する複数のニューロンを有しそれらのニューロンの中に遅れゼロを除くアナログ的な遅れを伴う出力を生成する遅れニューロンを少なくとも 1つ含むとともに信号の流れのループが存在するリカレントニューラルネットワークにより構築された制御アルゴリズムを記憶する制御アルゴリズム記憶部と、

制御アルゴリズム記憶部に記憶された制御アルゴリズムに基づいて生成された制御信号を用いて制御対象のロボットを制御するロボット制御部とを備えたロボット制御装置として動作させることを特徴とする。

本発明のロボット制御プログラムは、コンピュータ等の情報処理装置を本発明のロポット制御装置として動作させるものであり、本発明のロボット制御装置の各種態様は、その各種態様を実現する、本発明のロボット制御プログラムの態様として成立する。

すなわち、本発明の口ポット制御プログラムにおいて、上記リカレントニューラルネットワークを構成するニューロンは、入力を V。、出力を V 遅れを £丄としたとき、基本的に、 …… （3 )

の式に従う出力ェを生成するものであることが好ましく、また、

上記リカレントニューラルネットワークは、入力に重みを付し、重みを付した入力に基づいて、遅れゼロを含むアナログ的な遅れを伴う出力を生成するニューロンの定義を含むものであって、制御アルゴリズム記憶部は、その定義に従う二ユーロンを含む制御アルゴリズムを記憶するものであることも好ましい態様である。

ここで、入力に重みを付するニューロンを含む場合に、上記リカレントニューラルネットワークは、その重みを別のニューロンの出力に応じて変更する定義を含むものであって、制御アルゴリズム記憶部は、入力に重みを付するニューロンを含むとともにその重みを変更する別のニューロンを含む制御アルゴリズムを記憶するものであることが好ましい。また、本発明のロボット制御プログラムにおいて、上記リカレントニューラルネットワークは、ニューロンの遅れを別のニューロンの出力に応じて変更する定義を含むものであって、制御アルゴリズム記億部は、その別のニューロンを含むとともにその別のニューロンの出力によって変更される遅れを伴う出力を生成するニューロンを含む制御アルゴリズムを記憶するものであることが好ましく、また、

上記リカレントニューラルネットワークは、入力が閾値を越える場合に入力に代えて閾値を採用するニューロンの定義を含むものであって、制御アルゴリズム記憶部は、その定義に従うニューロンを含む制御アルゴリズムを記憶するものであることが好ましく、さらには、

上記リカレントニューラルネットワークは、 2つのニューロン間の結合を、別のニューロンの出力に応じて接断するスィッチの定義を含むものであって、制御アルゴリズム記憶部は、その別のニューロンを含むとともにその別のニューロンの出力に応じて接断するスィッチにより接断される結合が定義された 2つのニュ —ロンを含む制御アルゴリズムを記憶するものであることも好ましい形態であるさらに、本発明の口ポット制御プログラムにおいて、上記制御アルゴリズム記憶部は、周期関数を実現し周期信号を出力する部分ネットワークを含む制御アルゴリズムを記憶するものであってもよく、その場合に、その周期関数は相互に異なる周期の複数の単位周期関数の結合からなるものであって、制御アルゴリズム記憶部は、上記複数の単位周期関数を実現する複数の単位ネットワークの結合からなる部分ネットワークを含む制御アルゴリズムを記憶するものであつてもよいまた、本発明のロボット制御プログラムにおいて、上記制御アルゴリズム記憶部は、多項式で表わされる非周期関数を実現し非周期信号を出力する部分ネットワークを含む制御アルゴリズムを記憶するものであってもよく、その場合に、上記制御アルゴリズム記憶部は、多項式の各項を実現する複数の単位ネットワークの結合からなる部分ネットワークを含む制御アルゴリズムを記憶するものであつてもよい。尚、この口ポット制御プログラムは、上記情報処理装置を、ロボットの動作シミュレ一シヨンを行なうロポットシミュレーション装置内に実現されたアルゴリズムとしてのロボットを制御対象とするロボット制御装置として動作させるものであってもよく、あるいは、このロボット制御プログラムは、上記情報処理装置を、ハードウェア的に製作された現実のロボットを制御対象とするロポット制御装置として動作させるものであってもよい。

さらに、上記目的を達成する本発明のロボットは、 2つの部材の相対的な位置もしくは姿勢を可変にそれら 2つの部材を結合する関節を少なくとも 1つ備えたロポッ卜において、

このロポッ卜の動作を制御するロポット制御装置を備え、

そのロポッ卜制御装置が、

制御アルゴリズム記憶部に記憶された制御アルゴリズムに基づいて生成された制御信号を用いてこのロボットの動作を制御するロポット制御部とを備えたことを特徴とする。

本発明のロポットは、本発明のロボット制御装置がそのロボット制御装置により制御される対象のロボッ卜に組み込まれた構成のものであり、本発明のロポッ卜には、本発明のロボット制御装置の各種態様がそのまま含まれる。

すなわち、本発明の口ポットにおいて、上記リカレントニューラルネットヮ一クを構成するニューロンは、入力を V ₀、出力を遅れを £ iとしたとき、基本的に、

⁼ …… （³ )

上記リカレントニューラルネットワークは、複数の入力を受けそれら複数の入力の総和に基づいて、遅れゼロを含むアナログ的な遅れを伴う出力を生成する二ユーロンの定義を含むものであって、制御アルゴリズム記億部は、その定義に従うニューロンを含む制御アルゴリズムを記憶するものであることが好ましく、さらに、

また、本発明のロボットにおいて、上記リカレントニューラルネットワークは、ニューロンの遅れを別のニューロンの出力に応じて変更する定義を含むものであって、制御アルゴリズム記憶部は、その別のニューロンを含むとともにその別のニューロンの出力によって変更される遅れを伴う出力を生成するニューロンを含む制御アルゴリズムを記憶するものであることが好ましく、また、

上記リカレントニューラルネットワークは、 2つのニューロン間の結合を、別のニューロンの出力に応じて接断するスィッチの定義を含むものであって、制御アルゴリズム記憶部は、その別のニューロンを含むとともにその別のニューロンの出力に応じて接断するスィッチにより接断される結合が定義された 2つのニュ一ロンを含む制御アルゴリズムを記憶するものであるこも好ましい形態である。さらに、本発明のロボットにおいて、上記制御アルゴリズム記憶部は、周期関数を実現し周期信号を出力する部分ネットワークを含む制御アルゴリズムを記憶するものであってもよく、その場合に、その周期関数は相互に異なる周期の複数の単位周期関数の結合からなるものであって、制御アルゴリズム記憶部は、上記複数の単位周期関数を実現する複数の単位ネットワークの結合からなる部分ネットワークを含む制御アルゴリズムを記憶するものであってもよい。

また、本発明のロボットにおいて、上記制御アルゴリズム記憶部は、多項式で表わされる非周期関数を実現し非周期信号を出力する部分ネットワークを含む制御アルゴリズムを記憶するものであってもよく、その場合に、上記制御アルゴリズム記憶部は、多項式の各項を実現する複数の単位ネットワークの結合からなる部分ネットワークを含む制御アルゴリズムを記憶するものであってもよい。図面の簡単な説明

図 1は、 Z MP法の原理説明図である。

図 2は、階層化ニューラルネットワーク '(LNN : L aye r e d Ne u r a 1 Ne two r k) のモデルを示した図である。

図 3は、図 2に示す LNNを構成する各ニューロンのモデルを示す図である。図 4は、そのニューロンの入出力の関係を規定するシグモイド関数を示す図である。

図 5は、 RNNのモデルを示す図である。

図 6は、コンピュータと、そのコンピュータとの間で通信を行なう口ポットの外観図である。

図 7は、図 1に示したコンピュータのハードウエア構成図である。

図 8は、本発明のロボッ卜制御アルゴリズム構築プログラムの一実施形態の概要を示す模式図である。

図 9は、本発明のロボット制御アルゴリズム構築装置の一実施形態を示すプロック図である。

図 10は、ニューロンの表記を示した図である。

図 11は、ニューロンどうしの接続の表記を示す図である。

図 12は、時間遅れのないニューロンを示す図である。図 1 3は、時間遅れのないニューロンの入出力の時間変化を示す図である。図 1 4は、 ε の遅れ ε ェを有するニューロンを示す図である。

図 1 5は、 ε の遅れ ε を有するニューロンの入出力の時間変化を示す図である。

図 1 6は、複数入力のニューロンを示す図である。

図 1 7は、上限閾値を持つニューロンを示す図である。

図 1 8は、下限閾値を持つニューロンを示す図である。

図 1 9は、図 1 6を参照して説明した重み付けと、図 1 7 , 図 1 8を参照して示した閾値との双方を含む一般的なニューロンを示した図である。

図 2 0は、スィッチを示す図である。

図 2 1は、ニューロンによる遅れの変更を示す図である。

図 2 2は、ニューロンによる結線の重みの変更を示す図である。

図 2 3は、 2つのニューロンの組合せの一例を示す図である。

図 2 4は、図 2 2に示す組合せの 2のニューロンの入出力を示す図である。図 2 5は、三角関数生成器の一例を示す図である。

図 2 6は、図 2 5に示す三角関数生成器を複数組み合わせた部分ネットワークを示す図である。

図 2 7は、三角関数生成器のもう 1つの例を示す図である。

図 2 8は、 n次多項式生成器を示す図である。

図 2 9は、運動の切り換えを行なうときのニューロンの組合せを示す図である図 3 0は、 2ニューロンからなる、正弦波出力を得る R NN (図 2 5参照）と、関節が 1つだけの口ポットを示す図である。

図 3 1は、口ポットのアームに任意周期運動を行なわさせる構成を示した図である。

図 3 2は、ロポッ卜のアームに非周期運動を行なわさせる構成を示した図である。

図 3 3は、積分（乗）を除く P D制御の一例を示す図である。

図 3 4は、 P I D制御の一例を示した図である。図 3 5は、 P I D制御のもう 1つの例を示した図である。

図 3 6は、ロボットおよびそのロポットを制御する制御アルゴリズム等を含む全体システムの概念図である。

図 3 7は、二足歩行ロボットの足とその足の運動を制御する R NNの模式図である。

図 3 8は、ロボットの運動学習システムの概要を示す図である。

図 3 9は、以上の学習プロセスをまとめたフローチャートである。

図 4 0は、本発明のロポット制御プログラムの一実施形態の概要を示す模式図である。

図 4 1は、本発明のロボット制御装置の一実施形態を示すブロック図である。図 4 2は、本発明の口ポットの一実施形態の外観図である。

図 4 3は、図 4 2のロボット 5 0 0の構成を示すブロック図である。発明を実施するための最良の形態

以下、本発明の実施形態について説明する。

以下に説明する本発明の各実施形態としてのロボット制御アルゴリズム構築装置およびロボット制御装置は、共通の一台のコンピュータと、そのコンピュータ内で動作する、本発明の各実施形態としてのロポット制御アルゴリズム構築プログラムおよびロボット制御プログラムとの組合せにより構成されたものである。以下では先ず、本発明の実施形態としてのロポット制御アルゴリズム構築装置およびロボット制御装置を構成するコンピュータのハードウェアについて説明する。

C P U (中央処理装置）、 R AM (ランダムアクセスメモリ）、ハードデイスク、通信ボード等が内蔵された本体部 1 0 1、本体部 1 0 1からの指示により表示画面 1 0 2 a上に画像や文字列を表示する表示装置 1 0 2、コンピュータ 1 0 0に操作者の指示を入力するためのキーボード 1 0 3、表示画面 1 0 2 a上の任意の位置を指定することにより、その指定時にその位置に表示されていたアイコン等に応じた指示を入力するマウス 104、およびロボット 200との間で通信を行なうためのアンテナ 105を備えている。

本体部 101は、さらに外観上、フレキシブルディスク（図示せず）、 CD— ROM 300がそれぞれ装填される FD装填口 101 a、 CD— ROM装填口 1 01 bを有しており、それらの内部には、それらの装填口 101 a, 101 から装填されたフレキシブルディスク（FD) や CD— ROM300をドライブしてアクセスする FDドライブや CD— ROMドライブも内蔵されている。

一方、ロボット 200は、人体に似せた形状を有し、人間の鉢の関節に相当する部分に 2つの部材どうしの間の角度の調節が自在な関節を有し、さらに人間の目に対応する部分にカメラ、人間の耳に対応する部分にマイクロホン、人間の手先に相当する部分に接触センサを備えるなど、このロボッ卜には各種のセンサが備えられている。また、このロボットには通信設備が内蔵されており、コンビュ一夕 100との間で通信を行ない、コンピュータ 100に向けて各種センサの情報を送信し、コンピュータ 100からは制御信号を受信してその制御信号に基づいて二足歩行などの動作を行なうように構成されている。

尚、このコンピュータ 100には、ロボット 200に相当する、アルゴリズム上で構築した口ポットが内蔵されており、このコンピュータ 100を用いて構築されたロポット 200の動作を制御するための制御アルゴリズムは、直ちにロボット 200の動作制御に用いるのではなく、先ずは、コンピュータ 100内に構築されたアルゴリズムとしての口ポットをその制御アルゴリズムで動作させることにより動作シミュレ一ションが行なわれ、意図した通りの動作を行なうことが確認された後、その制御アルゴリズムが、ハードウェア的に製作されたロボット 200に適用される。

図 7は、図 6に示したコンピュータのハードゥエァ構成図である。

このハードウェア構成図には、 CPU 1 1 1、 RAMI 12、ハードディスクコントローラ 113、 FDドライブ 114、 CD— ROMドライブ 1 15、マウスコントローラ 1 16、キ一ボードコントローラ 1 17、ディスプレイコント口ーラ 1 18、およびロボット 200 (図 6参照）との間で通信を行なうための通信ボード 1 19が示されており、それらはバス 110で相互に接続されている。 FDドライブ 1 14、 CD— ROMドライブ 1 15は、図 6を参照して説明したように、それぞれ FD装填口 101 aおよび CD— ROM装填口 101 から装填された FD310、 CD— ROM300をアクセスするものである。通信ポード 119はアンテナ 105を介して、ロボット 200と通信を行なう。

また、図 7には、ハードディスクコントローラ 1 13によりアクセスされる八ードディスク 120、マウスコントローラ 1 16により制御されるマウス 104 、キーボードコントローラ 1 17により制御されるキーボード 103、およびデイスプレイコントローラ 1 18により制御される表示装置 102も示されている図 8は、本発明のロポット制御アルゴリズム構築プログラムの一実施形態の概要を示す模式図である。

ここでは、このロボット制御アルゴリズム構築プログラム 400は CD— R〇 M300に記憶されており、この CD— ROM 300が図 6に示す C D— R OM 装填口 101 bから装填され図 7の CD— ROMドライブ 115によりアクセスされて、その CD— ROM 300に記憶されている口ポット制御アルゴリズム構築プログラム 400が、図 6，図 7に示すコンピュータ 100にインストールされる。そのコンピュータ 100内にインストールされたロボット制御アルゴリズム構築プログラムがそのコンピュータ 100内で実行されると、そのコンビュ一夕 100は、本発明のロボット制御アルゴリズム構築装置の一実施形態として動作する。

尚、このロボット制御アルゴリズム構築プログラム 400は、ここでは CD— ROM300に記憶されている例を示したが、 CD—ROMに記憶されている必要はなく、例えば FD等他の可搬型記憶媒体に記憶されてコンピュータ 100にインストールされてもよく、あるいは、他の装置等から通信網（図示せず）を介してコンピュータ 100にインストールされてもよく、あるいは、そのコンビュ —夕 100のハードディスク（図 7参照）等にはじめから記憶されていてもよく、最終的にコンピュータで実行可能となるものであればどのように保存あるいは記憶されていてもよい。

図 8に示すロボット制御アルゴリズム構築プログラム 400は、定義記憶部 4 0 1と、制御アルゴリズム生成部 4 0 2と、係数値決定部 4 0 3とからなる。このロボット制御アルゴリズム構築プログラム 4 0 0の各部 4 0 1〜4 0 3の作用は、図 9の説明と合わせて説明する。

この口ポット制御アルゴリズム構築装置 4 1 0は、図 6，図 7に示すコンピュ一夕 1 0 0内で図 8に示すロポット制御アルゴリズム構築プログラム 4 0 0が実行されることにより、図 6 , 図 7に示すコンピュータ 1 0 0内に実現するものである。

この図 9の口ポット制御アルゴリズム構築装置 4 1 0は、定義記憶部 4 1 1、制御アルゴリズム生成部 4 1 2、および係数値決定部 4 1 3から構成されている。これら定義記憶部 4 1 1、制御アルゴリズム生成部 4 1 2、および係数値決定部 4 1 3は、それぞれ、図 8に示すロボット制御アルゴリズム構築プログラム 4 0 0の、定義記憶部 4 0 1、制御アルゴリズム生成部 4 0 2、および係数値決定部 4 0 3に対応するが、図 8のロボット制御アルゴリズム構築装置 4 1 0の各部 4 1 1〜4 1 3は図 6，図 7のコンピュータ 1 0 0のハードウェアおよびそのコンピュー夕 1 0 0内で実行されるオペレーティングシステム（O S ) と、その O S上で動作する、図 8に示すロポット制御アルゴリズム構築プログラム 4 0 0の各部 4 0 1〜4 0 3との結合で構成されているのに対し、図 8に示すロポット制御アルゴリズム構築プログラム 4 0 0の各部 4 0 1〜4 0 3は、それらの複合のうちのアプリケーションプログラムの部分のみで構成されている。図 8に示す口ポット制御アルゴリズム構築プログラム 4 0 0を構成する各部 4 0 1〜4 0 3の、このロボット制御アルゴリズム構築プログラム 4 0 0が図 6 , 図 7のコンビュ一夕 1 0 0内で実行されたときの作用は、図 9に示すロポット制御アルゴリズム構築装置 4 1 0を構成する各部 4 1 1〜4 1 3の作用そのものであり、以下、図 9のロポット制御アルゴリズム構築装置 4 1 0の各部 4 1 1〜4 1 3の作用を説明することで、図 8のロポット制御アルゴリズム構築プログラム 4 0 0の各部 4 0 1〜4 0 3の作用の説明を兼ねるものとする。

図 9に示すロボット制御アルゴリズム構築装置 4 1 0は、 2つの部材の相対的な位置もしくは姿勢を可変にそれら 2つの部材を結合する関節を少なくとも 1つ備えたロボットの動作を制御するための制御アルゴリズムを構築する装置である。図 6に示す口ポット 2 0 0は人間の鉢の構造に似せた構造を有するヒユーマノィド型のロポットであり、人間の手足等に対応する部分に複数の関節を有する。この図 9のロボット制御アルゴリズム構築装置 4 1 0を構成する定義記憶部 4 1 1は、入力に基づいて遅れゼロを含むアナログ的な遅れを伴う出力を生成するニューロンの定義を記憶しておくものである。ここに記憶されているニューロンは、基本的には、入力を V ₀、出力を V ,、遅れを _{£ l}としたとき、 …… （3 )

の式に従って出力を生成するものである。

この（3 ) 式は、この（3 ) 式を積分することにより、

と表現することもできる。

このニューロンは上記（3 ) 式（あるいはその（3 ) 式と等価の（4 ) 式）を満足するように記述されたプログラム部品で構成されている。この定義記憶部 4 1 1には、そのプログラム部品としてのニューロンが記憶されていることのほか、さらにそのニューロンを表わすマークも記憶されていてもよい。この定義記憶部 4 1 1に記憶されたニューロンの他の定義、およびニューロン以外の、 R N N を構成するための他の定義については後述する。

図 9のロポット制御アルゴリズム構築装置 4 1 0を構成する制御アルゴリズム生成部 4 1 2では、定義記憶部 4 1 1に記憶された定義を用い、例えばオペレー夕による図 6，図 7に示すコンピュータ 1 0 0のキーボード 1 0 3やマウス 1 0 4を操作に応じて、口ポット 2 0 0 (図 6参照）を制御するための制御アルゴリズムが構築される。あるいは、制御アルゴリズムを生成するアルゴリズムをあらかじめ定めておいて、オペレータの操作を待つことなく、その生成アルゴリズムに基づいて制御アルゴリズムを自動的に生成してもよい。この制御アルゴリズムは、上記（3) 式の ε _tがゼロではない有限の値を持つ遅れニューロンを含む複数のニューロンを有し、さらに信号の流れのループが存在するリカレントニューラルネットワーク（RNN) により構築されたものである。ただし、この制御アルゴリズム生成部 412で構築される制御アルゴリズムは、各種の係数（例えば上記（3) , (4) 式中の遅れ _{£ l}や積分定数 Cなど）を変数のまま含んでおり、それらの係数の値は未決定の状態にある。

図 9に示すロボット制御アルゴリズム構築装置 410を構成する係数値決定部 413では、制御アルゴリズム生成部 412で生成された制御アルゴリズムの係数の値が決定される。

この係数値決定部 413は、係数の値を、もっぱらオペレータの操作に応じて決定するものであってもよいが、本実施形態では、図 9に示すように、ロボットの動作を評価する評価関数に基づいて算定された係数の値を変化させながらロボットを動作させたときの評価値が入力され、その評価値が最高の値になるように係数が決められる。評価関数は、口ポットの動作を、「エネルギー最小」、「口ポット本体の安定性」、「高速性」等その口ポットの特質等を考慮した 1つあるいは複数の項目からなる。係数の決定プロセスの詳細については後述する。

定義記憶部 41 1に記憶される定義は、基本的には上記（3) 式（あるいはそれと等価な（4) 式）に従うニューロンであるが、その定義記憶部 41 1に記憶される定義には、この他、そのニューロンを変形した、あるいはそのニューロンから派生したいくつかのニューロンの定義や、それらのニューロンに付随する定義が含まれている。すなわち、この定義記憶部 41 1には、

(a 1) 上記（3) 式（あるいは（4) 式）に従う基本的なニューロンの定義 (a 2) 複数の入力を受けそれら複数の入力の総和に基づいて、遅れゼロを含むアナログ的な遅れを伴う出力を生成するニューロンの定義

(a 3) 入力に重みを付し重みを付した入力に基づいて、遅れゼロを含むアナログ的な遅れを伴う出力を生成するニューロンの定義

(a 4) 上記の重みを別のニューロンの出力に応じて変更するという定義 (a 5) ニューロンの遅れを別のニューロンの出力に応じて変更するといぅ定 (a 6) 入力が閾値を越える場合に入力に代えて閾値を採用するニューロンの

(a 7) 2つのニューロン間の結合を別のニューロンの出力に応じて接断するスィッチの定義

が記憶されている。

これらの定義は、（3) 式あるいは（4) 式の定義の際に説明したとおり、プログラム部品の形で記憶されており、制御アルゴリズム生成部 412では、その定義記憶部 411に記憶された（a l) 〜（a7) の定義に従うプログラム部品が駆使されて、それらのプログラム部品が組み合わされた R N Nによる制御アルゴリズムが構築される。

すなわち、制御アルゴリズム生成部 412は、定義記憶部 411に記憶された定義を用い、複数のニューロンを有しそれら複数のニュ一ロンの中に遅れゼロを除くアナログ的な遅れを伴う出力を生成する遅れニューロンを少なくとも 1つ含むとともに信号の流れのループが存在するリカレントニューラルネットワーク（ RNN) により構築された、値が未確定の係数を含む制御アルゴリズムを生成するものであり、この制御アルゴリズム生成部 412では、

(b 1) 上記（3) 式（あるいは（4) 式）に従う基本的なニューロンのほか

(b 2) 複数の入力を受けそれら複数の入力の総和に基づいて、遅れゼロを含むアナログ的な遅れを伴う出力を生成するというニューロンの定義に従うニューロン

(a 3) 入力に重みを付し重みを付した入力に基づいて、遅れゼロを含むアナログ的な遅れを伴う出力を生成するというニューロンの定義に従うニューロン (a 4) 入力に重みを付するニューロンの、その重みを変更する別のニューロン

(a 5) アナログ的な遅れを伴う出力を生成するニューロンの遅れを変更する別のニューロン

(a 6) 入力が閾値を越える場合に入力に代えて閾値を採用するニューロンの定義に従うニューロン ( b 7 ) スィッチにより接断される結合が定義された 2つのニューロンとそのスィッチを接断する別のニューロン

を駆使することにより、制御対象の口ポットの動作制御に適合した、 R N Nからなる制御アルゴリズムが構築される。

さらに、その制御アルゴリズム生成部 4 1 2は、定義記憶部 4 1 1に記憶された定義に従うニューロンを接続することにより、周期関数を実現し周期信号を出力する部分ネットワークを含む制御アルゴリズムを生成することができ、その周期関数が、相互に異なる周期の複数の単位周期関数の結合からなるものである場合に、制御アルゴリズム生成部 4 1 2は、上記の部分ネットワークを生成するにあたり、複数の単位周期関数を実現し相互に異なる周期の複数の単位周期信号を出力する複数の単位ネットワークの結合からなる部分ネットワークを生成する。そして、係数決定部 4 1 3は、制御アルゴリズム生成部 4 1 2により生成された複数の単位ネットワークの結合からなる部分ネットワークの係数の値を、その部分ネットワークを構成する複数の単位ネットワークのうちの、より長周期の単位周期信号を出力する単位ネットワークから、より短周期の単位周期信号を出力する単位ネットワークに向かって、本実施形態では 1つの単位ネットワークずつ順次に、各単位ネットワークの係数の値を決定していく。

こうすることにより、全体の係数の値を短時間に決定することができる。また、これと同様に、その制御アルゴリズム生成部 4 1 2は、定義記憶部 4 1 1に記憶された定義に従うニューロンを接続することにより、多項式で表わされる非周期関数を実現し非周期信号を出力する部分ネットワークを含む制御アルゴリズムを生成することができ、その場合に、その制御アルゴリズム生成部 4 1 2 は、その部分ネットヮ一クを生成するにあたり、多項式の各項を実現しそれら各項に対応する各単位信号を出力する複数の単位ネットワークの結合からなる部分ネットワークを生成するものであり、そして係数値決定部 4 1 3は、制御アルゴリズム生成部 4 1 2により生成された複数の単位ネットワークの結合からなる部分ネットワークの係数の値を、その部分ネットワークを構成する複数の単位ネットワークのうちの、より次数の低い項に対応する単位信号を出力する単位ネットワークから、より次数の高い項に対応する単位信号を出力する単位ネットワークに向かって、本実施形態では 1つの単位ネットワークずつ順次に、各単位ネットワークの係数の値を決定していく。

係数値決定プロセスについての詳細はさらに後で説明する。

ここで、以下の説明のために、ニューロンとその結線の図面上の表記について説明しておく。 '

図 1 0は、ニューロンの表記を示した図である。

図 1 0 (A) 〜図 1 0 (E) は、いずれもニューロンを表わしており、そのうちの図 1 0 (A) には、丸印と二重丸印が示されている。それらは、いずれも、単にそこにニューロンが存在することを表わしている。ニューロンには遅れと初期値が定義されることがあるが、図 1 0 (A) の表記にはそれらの定義は含まれていない。

図 1 0 ( B) には、二重丸のうちの外側の丸の中（内側の丸の外）に V、内側の丸の中に εが記入されているニューロンが示されており、これは、遅れ ε、初期値 Vのニューロンであることを表わしている。

図 1 0 ( C) には、丸印の中に Vが記入されたニューロン、および二重丸印であって、外側の丸の中かつ内側の丸の外に Vが記入されたニューロンが示されている。これらの表記は、いずれも、初期値 Vのニューロンであることを示している。ここでは遅れは定義されていない。

図 1 0 (D) には、二重丸印のうちの内側の丸の中に εが記入されたニューロンが示されている。このニューロンは、遅れ εのニューロンであることを表わしている。初期値は定義されていない。

図 1 0 ( Ε) は、図 1 0 (D) の特別な場合として遅れゼロのニューロンを表わしている。遅れゼロのニューロンは、複数の入力があった場合、それら複数の入力の総和を求めるニューロンとなり、このため二重丸印の内側の丸の中に数字のゼロを記入する記号に代えて、丸印の中に加算を表わす ' + ' を記入した記号を用いることもある。

図 1 1は、ニューロンどうしの接続の表記を示す図である。

図 1 1 (Α) は、左側のニューロンから右側のニューロンに向かって信号が流れ、左側のニューロンの出力がそのまま右側のニューロンの入力となることを表わしている。

また図 11 (B) は、左側のニューロンの出力が右側のニューロンの入力となる点では図 1 1 (A) のニューロンと同じであるが、図 11 (B) の右側のニュ一ロンでは、その入力に重み Cが付され、その重みが付された入力を基に前述の (3) 式（あるいは（4) 式）に従う演算が行なわれることを示している。図 11 (C) は、右側のニューロンに、左側の複数のニューロンの複数の出力が入力されて重み C l， C2, C3， …でそれぞれ重み付けされ、かつ自分自身の出力も再度入力されて重み COで重み付けされ、右側のニューロンは、それら重み付けされた複数の入力の総和を基に、前述の（3) 式（あるいは（4) 式）に従う演算が行なわれることを示している。

次に、図 10および図 11に示した表記法を使いながら、ニューロンの定義とそのニューロンの振舞（入力と出力との関係、実現される関数等）について説明する。

図 12は、時間遅れのないニューロンを示しており、図 13は、その時間遅れのないニューロンの入出力の時間変化を示している。

前述の（3) 式を再度示すと、

dV_x 了, _τ/

^£i-T ^{+ V}i ^=Vo

dt …… （3) である。

ここで遅れ ε tをゼロとすると、上記（3) 式は、

V^Vo - (5)

となる。すなわち、遅れのときは、図 13に示すように出力は入力 V 。そのものとなる。

図 14は、 εェりの遅れ ε iを有するニューロンを示す図、図 15は、その遅れ ε を有するニューロンの入出力の時間変化を示す図である。

この場合、上記（3) 式の遅れ ε iを ε として取り扱い、その（3) 式を積分すると、前述の（4) 式となる。（4) 式をここに再度示しておく。

ここで、この（4) 式中の積分定数 Cは、初期値 V₁₀に依存しており、

C = V。- V₁₀ … (6)

の関係にある。

上記（4) 式の第 1項は、図 15に示すように出力が時間的に遅れて徐々に変化することを示している。

図 16は、複数入力のニューロンを示す図である。

この場合、複数の入力 Vj ( j =0, 1, …， n) を各入力に対応する各重み C _u (j =0， 1， …， n) で重み付けし、それらの重み付けされた各入力の総和が、上記（3) 式の入力 V。に相当するものとして取り扱われる。すなわち、図 1 6に示す記号を用いて表現すると、

となる。

図 17は、上限閾値を持つニューロンを示している。

ここではニューロン 1の出力が閾値 0に満たない値のときはそのニューロン 1 の出力がそのままニューロン 2に入力され、ニューロン 1の入力が閾値 0より大きいときは、ニューロン 2では、ニューロン 1の出力に代えてその閾値 0が入力として取り扱われる。

ニューロン 2では、ニューロン 1の出力の値に応じては閾値 0を入力として取り扱った上で、上述の（3) 式（あるいは（4) 式）に従う演算が行なわれる。尚、ここで閾値を、一般に角度を表現するときに用いられる 0で表わしたのは、口ポットの動作を制御するにあたっては、その口ポットの関節の角度を制御するケースが多いことを念頭に置いたことによる。

図 18は、下限閾値を持つニューロンを示している。

ここでは、ニューロン 1の出力が閾値 0より大きいときはそのニューロン 1の出力がそのままニューロン 2に入力され、ニューロン 1の出力が閾値より小さいときはニューロン 2はその閾値 6>を入力として取り扱う。

ここでも、図 17の場合と同様、ニューロン 2は、ニューロン 1の出力の値に応じて閾値を入力として取り扱うこと以外は基本のニューロンと同様であり、上述の（3) 式（あるいは（4) 式）に従う演算を行なう。

図 19は、図 16を参照して説明した重み付けと、図 17, 図 18を参照して説明した閾値との双方を含む一般的なニューロンを示した図である。

この図 19に示すニューロン iの入出力の関係を記述する式は、 τ_/

, 'min ( ， )

dt ノ=丄

+ ax ( ^mi ，

…… （8) となる。ここで、 Vj ( j = 1, 2, ···, n, …， m， …， N) は、ニューロン j の出力、 C_uはニューロン jからニューロン iに向かう結線に対応する重み、 Θ ^ma はニューロン jからニューロン iに向かう結線に対応する、最大値を決める閾値、 0^minjは、ニューロン jからニューロン iに向かう結線に対応する、最小値を決める閾値、 mi n (X, y) は xと yとのうちの小さい方の値をとる関数、 max (X, y) は xと yとのうちの大きい方の値をとる関数である。

ニューロン iはニューロン 1〜ニューロン Nのうちのいずれか 1つのニューロンであってもよく（この場合は、図 11 (c) に示すように、ニューロン iの出力がその同じニューロン iに戻るように記述することもできる）、あるいは、二ュ一ロン iは、ニューロン 1〜ニューロン Nのいずれとも異なるニューロンであつてもよい。

図 20は、スィッチを示す図である。

ニューロン 1とニューロン 2はスィッチを介して結合されており、そのスイツチの接断（接続および切断）は、別のニューロン 3の出力に応じて行なわれる。ここでは、ニューロン 3の出力が閾値 0未満のときはスイツチが接続されてニュ一ロン 1の出力がニューロン 2の入力となり、ニューロン 3の出力がちようど閾値 0と等しいときを含め閾値 0以上のときはスィッチが切断され、ニューロン 1 の出力はニューロン 2に入力されない。ここで、図 2 0中には「く」の記号が示されているが、これをに変更すると、ニューロン 3の出力がちょうど閾値 0に等しいときはスィッチが接続された状態にあることを意味している。また、図 2 0中の「ぐ 0」の記号を「> 0」に変更すると、ニューロン 3の出力が閾値 0を越えているときにスィッチが接続されており、ニューロン 3の出力が閾値 0を含む閾値以下になるとスィツチが切断され、ニューロン 1の出力が二ユーロン 2に伝わらなくなる。記号「〉0」を記号「≥0」に変更すると、ニュ —ロン 3の出力が閾値にちようど等しいときはスィツチは接続状態にあることを意味している。

図 2 1は、ニューロンによる遅れの変更を示す図である。

図 2 1 (A) と図 2 (B) は、異なる向きに描かれているだけであって、いずれも同じことを意味している。ここでは、ニューロン 1から、ニューロン 2を表わす二重丸のうちの内側の丸に矢印が引かれており、これは、ニューロン 1の出力がそのままニューロン 2の遅れ εとなる（ニューロン 1によってニューロン 2 の遅れが設定、変更される）ことを表わしている。このように、ここでは、あるニューロン（図 2 1の例ではニューロン 2 ) の遅れが別のニューロン（図 2 1の例ではニューロン 1 ) の出力によって変更することができるようにニューロンが定義されている。

図 2 1の場合と同様、図 2 2 (Α) と図 2 2 (Β ) は異なる向きに描かれているだけであり、いずれも同じ内容を意味している。ここでは、ニューロン 1の出力がニューロン 2に入力されてその入力に重みが付されるが、ニューロン 3の出力をその重みとすることを表わしている。このように、ここでは、あるニューロン（ここではニューロン 3 ) の出力を重みとすることにより、その重みを変化させることができるように、ニューロンが定義されている。

図 9に示すロポット制御アルゴリズム構築装置 4 1 0を構成する定義記憶部 4 1 1には、基本的には、これまで説明した様々なニューロン等の定義がそのニュ一ロン等の入出力の関係を記述したプログラム部品として記憶されており、制御アルゴリズム生成部 4 1 2では、それらのプログラム部品が組み合わされて R N Nによる制御アルゴリズムが構築されるが、制御アルゴリズムの構築をさらに容易にするために、定義記憶部 4 1 1には、これまで説明してきたニューロン等の定義を記憶しておくことのほか、以下に説明するような、高い頻度で利用される複数のニューロンの組合せを 1つのプログラム部品として記憶しておき、制御ァルゴリズム生成部 4 1 2では複数のニューロンの組合せとしてのプログラム部品を利用できるようにしてもよい。制御アルゴリズム生成部 4 1 2は、定義記憶部 4 1 1に記憶されたプログラム部品を組み立てるためのプログラム言語の入力により制御アルゴリズムを構築するように構成してもよいが、定義記憶部 4 1 1に、ニューロンの入出力の関係を記述したプログラム部品だけでなく、これまで説明してきたようなニューロンの表記の記号も記憶しておくとともに、そのニューロンの記号とそのニューロンを表わすプログラム部品とを対応づけておき、制御アルゴリズム生成部 4 1 2は、図 6に示すコンピュータ 1 0 0の表示画面 1 0 2 a上にニューロンの記号を表示しその表示されたニューロンを結線するといぅォペレ一夕操作の裏でその表示されたニューロンや結線に応じた制御アルゴリズムを構築するようにしてもよい。

以下では、複数のニューロンを組み合わせたときに生成される関数について説明する。

2つのニューロンを図 2 3のように組み合わせると、上側のニューロンに関し

_£l ^- _{+ Vl} = C_u V_{2 +} V₀ ...... ( _{9 )} が成立し、下側のニューロンに関しては、

_{£2 +} V_{2 =} C_{2l Vl} ···... ( _{1 0} )

が成立する。但し、 V。は下側のニューロンの出力を表わす。上記の（9) 式と（10) 式を組み合わせると、

なる 2階線形定係数微分方程式となる。

この 2階線形定係数微分方程式の一般解は、

d²V_r dK

ε,ε' (e_{1 +} s₂)- ₊ (l-C_u c_ly^v,

dt dt

,2

ε,ε^ + {ε + e₂)D + (l- ₁₂ C_2l)V_x = 0 一（ど i +ど 2) + (ど l ^{+ ε}ι)²- ^4fi^f ₂(! - C₁₂ C₂₁)

A =

2ε₁ε₂ 一（ど1 + f 2) + +ど 2)²— ⁴ど 2(1二 C₁₂ C₂₁)

2ε_λε₂

Vf= C exp(Z¾り + C₂ exp( )

(l 2) である。

図 24は、図 23に示す組合せの 2ニューロンの入出力を示す図である。

入力 V₀がステップ関数的に立ち上がったとき、その出力は、 1<C₁₂C₂₁ ， C₁₂C₂₁=1， 0<C₁₂C₂₁<1, C₁₂C₂₁<0に応じて、それぞれ、図 2 4 (a) , (b) , (c) ， (d) のように変化する。ここで注目すべき点は、入力 V。が定数であっても重み C₁₂， C₂₁の値によっては、出力が振動する（図 24 (d) 参照）ことと、ちょうど積分と遅れを重ね合わせた出力が存在する (図 24 (b) 参照）ことである。

図 25は、三角関数生成器の一例を示す図である。

ここには、図 23の 2ニューロンの結合と同様に結合された 2ニューロンが示されているが、図 23の 2ニューロンの結合と異なる点は、入力 Voが存在しないことと、重み C₂₁, C₁₂が、絶対値が同一であってかつ正負が異なる C, —じである点である。

図 25の出力ェは、 d²

+ ω ^ =0

dt

c

ω =——

ε

…… （13)

で表わされる。

上記（13) 式を積分すると、

V₁ = c_x cos ωί + s₁ sin cot

5, = ²⁰

c

…… （14)

となる。

すなわち上記（13) 式あるいは（14) 式は、角周波数 ωの三角関数を表わしており、正弦的に変化する出力ェが得られる。

この（13) 式および（14) 式から分かることは、重み Cや遅れ εの値を変えるとその正弦波出力ェの角周波数を変化させることができるとともに、重み C 、遅れ ε、および初期値 V₁₀, V₂₀を変えると（14) 式中の係数 cい S iが変化し、これによりその正弦波の位相や振幅変化させることができるという点である。

図 26は、図 25に示す三角関数生成器を複数組み合わせた部分ネットワークを示す図である。

この図 26の、一番右側に示された、 1つだけのニューロンは、その初期値（ここでは、下記の（15) 式との対応で c。とする）を出力し続けるニューロンである。

この図 26に示す部分ネットワークにより実現される関数は、 = c。 + cos ωί + Ξ_λ sin cot

+ c₂ cos 2ωΐ + s₂ sin 2wt

+ c₃ cos 3ωί + s₃ sin 3ωί

…… （15)

である。定数項 c。および cい s !, c₂， s ₂, ……等は、図 26を参照して説明したようにして（（13) 式および（14) 式参照）、各ニューロンの遅れ ε ，重み C, 2 C, 3 C, …，初期値（図 26には不図示）により決定される。

(15) 式はフーリエ級数を表わしている。任意の周期関数はフーリエ級数に展開することができ、したがって図 25のように組み合わされた 2ニューロンを図 26のように複数組み合わせることによって、任意の周期関数を構築することができる。

図 27は、三角関数発生器のもう 1つの例を示す図である。

この図 27に示す 3ニューロンの組合せにより生成される出力を式で表わすと、 ε 33εε ++ <<yy((33--CC²²))- dt³ dt²~ dt

(16) となる。ハ 12 -108 + 12 93

^C 2/3 …… （17)

12-(-108 + 12V93) のときに、（16) 式を解くと、 V_x = C_xe + C₂ cos(wり + C₃ sin(ft>i)

2c

ca

ω = 2 a

ε

_12α _

c =

12-a²

…… （18)

となる。ここで、 C₂， C₃はニューロンの初期値（図示せず）等により定まる積分定数である。

この（18) 式中のの式を見ると、第 1項は急速に減衰する項であり、第 2 項と第 3項は正弦振動の項である。

したがって、図 27のニューロンの組合せは、例えば、ある位置もしくは姿勢に静止していた関節を、その静止位置あるいは静止姿勢とは異なる位置もしくは姿勢（角度）に移動させて、その移動後の位置もしくは姿勢を中心して正弦的に振動させるときの、初期の過渡的な位置もしくは姿勢の移動およびその後の正弦振動を行なわせるための制御信号として利用することができる。

図 28は、 n次多項式生成器を示す図である。

この図 28には、この図 28に示すように接続された、 n次多項式の各項を生成する n+ 1個のニューロン（それぞれ 1個のニューロンからなる単位ネットヮーク）とそれらの出力を重み付け加算するための加算ニューロン（遅れゼロの二ュ一ロン；図 10 (E) 参照）との、合計 n + 2個のニューロンが示されているこの加算ニューロンの出力ェは、

V₁ = C₀ + C₁ t +C₂ t ² + - + C_n tⁿ ·'· (19)

となる。

図 26に示すように、の三角関数生成器を複数組み合わせると、任意の周期信号を作り出してロポットに周期的な運動を行なわさせることができるが、この図 28の多項式を用いると、非周期信号を作り出すことができ、口ポットに非周期的な運動（例えば立った姿勢から椅子に腰かけた姿勢への移行など）を行なわさせることができる。

図 2 9は、運動の切り換えを行なうときのニューロンの組合せを示す図である運動ニューロン 1 , 2は、ここではいずれも 1つのニューロンのように示されているが、その背後には、例えば図 2 6に示す、周期運動を指示する制御信号生成器や、例えば図 2 8に示す多項式生成器により構成された非周期運動を指示する制御信号生成器が存在する。運動ニューロン 1と運動ニューロン 2とでは相互に異なる運動（例えば運動ニューロン 1は椅子に腰かけた状態から立ち上がる運動、運動ニューロンは立った状態で行なう二足歩行運動）を行なわさせるものである。

スィッチニューロンは、その背後に、センサやその口ポットに一連の動作を行なわせるためのシーケンスプログラム等が存在し、運動を切り換えるタイミングで出力が変化するニューロンである。この図 2 9に示す構成の場合、スィッチ二ュ一ロンの出力に応じて、常に、運動ニューロン 1の出力と運動ニューロン 2の出力とのうちのいずれか一方が遅れニュ一ロンに入力される。遅れニューロンは、前述の（3 ) 式（あるいは（4 ) 式）に従って、入力をアナログ的に遅らせて出力するニューロンである。

従来から採用されている力学的な運動方程式を立ててその運動方程式に従って口ポットを動作させる制御アルゴリズムの場合、そのロボットに、ある 1つの運動から別の 1つの運動に移行させるには、それら 2つの運動の間をつなぐ別の運動方程式（プログラム）を必要とし、そのプログラムは、移行前の運動と移行後の運動との組合せによってそれぞれ異なり、したがって多数のプログラムを必要とし、その開発や動作テスト等にも多大の時間と労力を必要とする。

これに対し、ここで説明している R N Nを採用すると、移行可能な運動どうしの間ではどの運動からどの運動に移行するかを問わず、それら 2つの運動の間に、図 2 9に示すようなスィッチニューロンによってスィッチを切り換え、遅れ二ユーロンを介して出力する構成を配置すればよく、この一点をとつても制御アルゴリズムの開発の時間や労力が極めて大幅に軽減される。

次に、これまで説明してきたニューロンを用いた R NNからなる制御アルゴリズムと、ロポッ卜との簡単な組み合わせについていくつか説明する。

図 3 0には、 2ニューロンからなる、正弦波出力を得る R N N (図 2 5参照）と、関節が 1つだけのロボットが示されている。

このロポットは横に延びる台と、関節モータからの駆動力を受けて回動するァームとからなる。その台とそのアームとの連結部分が関節である。

図 3 0中の R N Nの出力をロポットの関節を動かす関節モータに供給すると、そのロボッ卜のアームを左右に正弦的に周期運動させることができる。

尚、 R NNの出力と関節モータとの間には、様々な回路要素、例えば R N Nは実際はプログラムで実現されたものであって、そのプログラムをコンピュータで実行するとデジタル出力が得られるが、これをアナログ信号に変換する DZA変換器や、関節モータに電力を供給するためのパワーアンプなどが介在するが、それらの回路要素はここで行なっている説明に関しては本質的ではないので全て省略している。

図 3 1は、ロボッ卜のアームに任意周期運動を行なわさせる構成を示した図である。

図 2 6を参照して説明した前述のように、周波数の異なる出力を生成する複数の三角関数生成器を用いることにより任意周期波形の周期信号を生成することがでさる。

この周期信号をロポッ卜の関節モータに供給することにより、そのアームにその周期信号に応じた周期運動を行なわさせることができる。

図 3 2は、ロボットのアームに非周期運動を行なわさせる構成を示した図である。

この図 3 2には、図 2 8に示した構成と同じ構成の R N Nと、関節が 1つだけの口ポットが示されている。

図 2 8に示した構成を用いると、任意次元（n次元）の多項式で表わされる非周期関数を実現することができ、その出力で図 3 2の口ポットを駆動することにより、そのロポッ卜のアームにその多項式で実現された非周期運動を行なわさせることができる。

次に、これまで説明したきたニューロンの組合せからなる R N Nにより、 P I D制御を実現した例について説明する。

P I D制御は、比例（P) と積分（I) と微分（D) とを組み合わせたフィ一ドバック制御であり、従前より広く使われている制御法である。

図 33は、積分（I) を除く PD制御の一例を示す図である。

この図 33にも、図 30〜図 32にも示した、関節が 1つだけのロボットが示されている。

ここでは、この関節の位置（角度）を測定するセンサと、その関節の動きの速度（角速度）を測定するセンサが備えられている。速度（角速度）センサを備える代わりに位置（角度）センサの出力を微分することにより速度（角速度）情報を得てもよい。

図 33の RNNを式で表わすと、

電流値 =C_PX (目標位置一測定位置） _C_VX測定速度 … （20) となる。

この（20) 式の右辺の第 1項は比例項（P) 、第 2項は微分項（D) である図 34は、 P I D制御の一例を示した図である。

この図 34では、図 32に示すRNNに、さらに積分（I) の構成が追加されている。この図 33の RNNを式で表わすと、

電流値 =C_PX (目標位置一測定位置）一 C_VX測定速度

+ C_SX S (目標位置一測定位置） ·'· （21) となる。この（21) 式の右辺の第 1項および第 2項は、図 33を参照して説明した（20) 式の第 1項、第 2項と同様、比例項（Ρ) および微分項（D) であり、（21) 式の右辺の第 3項は、積分項（I) である。

図 35は、 P I D制御のもう 1つの例を示した図である。

上述の図 34の場合、目標位置は固定値のように示されているが、図 35では、目標位置を周期的に変化させている。こうすることにより、関節モー夕は、 Ρ I Dフィードバック制御により、その周期的に変化する目標値に追随するように駆動される。

上記図 33〜図 35に示すように、これまで説明してきたニューロンを使った RNNにより、 P I D制御を実現することもできる。

図 36は、ロポットおよびその口ポットを制御する制御アルゴリズム等からなる全体システムの概念図である。

この図 36中の CPGは、 Cen t r a l Pa t t e rn Ge ne r a t o rの略であり、ここでは、 RNNによる部分ネットワークを指している。多数の CP Gが集まって、ロポットを制御するための制御アルゴリズムが構成されている。

この制御アルゴリズムを構成する多数の CP G (部分ネットワーク）は、それぞれが、制御対象の口ポットの、ある 1つの運動を分担している。具体例については次の図 37を参照して後に説明する。

CPGの、未決定の各種係数（各ニューロンの遅れ ε、重み (：、初期値等）を決定するにあたっては、ロポッ卜の動作が評価されてその評価値が学習システムに伝えられ、その学習システムで各係数値が決定される。係数値の決定手法については、もう少しあとで説明する。

ロポッ卜の動作は、センサシステムで計測されて制御アルゴリズムに伝えられ、その制御アルゴリズムは、センサシステムからの情報に基づいて口ポットが所望の動作を行なうよう、そのロボットを制御する。

図 37は、二足歩行ロポッ卜の足とその足の運動を制御する RNNの模式図である。

ここには、口ポットの関節が円柱で示されており、左右の両足のうちの右足の動きを制御する RNNが示されている。

ここには、 CPGとして、この二足歩行口ポットに前進歩行動作を行なわせるために必要となる、ロール CP Gと、リフト CPGと、ピッチ CP Gが示されている。

ロボットを前進歩行させるときには、左右の足への体重移動が行なわれるが、ロール C P Gは、その体重移動のための運動を制御する制御信号を生成する部分ネッ卜ワークである。

前進歩行時、左右の足への体重移動は、交互に周期的に行なわれるため、その運動を制御するロール CP Gは周期信号を生成するように構成されている。また、口ポットを前進歩行させるときには、左右の足を交互に上下運動させる必要がある。図 3 7に示すリフト C P Gは、右足を上下運動させるための部分ネッ卜ワークである。足の上下運動も周期運動であり、したがってリフト C P Gも周期信号を生成するように構成されている。

また、口ポットを前進歩行させるには、左右の足を交互に前進させる必要がある。図 3 7に示すピッチ C P Gは、右足を前進運動させるための部分ネットヮークである。足を 1回前進させる運動は非周期の動作であり、このためピッチ C P Gは、多項式による非周期信号を生成する部分ネットワークとして構成されている。

リフト C P Gの出力は、ロール C P Gの出力によりスィツチ制御されている。これは、例えば体重（重心）を十分に左足に移してからでないと右足を持ち上げることができないようにするためである。またこれと同様に、ピッチ C P Gの出力も、ロール C P Gの出力によりスィッチ制御されている。これも同様に、例えば体重（重心）を十分に左足に移してからでないと右足を前進させることができないようにするためのものである。さらに、リフト C P Gの出力やピッチ C P G の出力は閾値処理がなされている。これは、例えば右足を前進させて足裏が床に接触した後は、それ以上その右足を伸ばそうとしたり前進させたりするのを止めて、その右足が床に接触したときの右足の状態を保持するための措置である。このようにして周期運動を行なわさせるための C P Gや非周期運動を行なわさせるための C P Gを組み合わせることによって、全体として複雑な運動を実現することができる。

次に、口ポットの制御アルゴリズム構築の処理の流れについて説明する。制御アルゴリズムを構築するには、これまで説明してきた、 R N Nを組み立てるだけの処理では足りず、その R NNに含まれている各種係数（各ニューロンの遅れ、重み、初期値などに関係する係数）を決定する必要がある。ここでは、 R N Nからなる制御アルゴリズムを係数値の決定を含めて構築するシステムを、「学習システム」と称する（図 3 6参照）。

ここでは、 R NNの係数の値を決定するにあたり、考え方の前提として、運動、すなわち関節の位置や角度の時間変化は、非線形方程式の解であるという立場をとる。この非線形方程式の解を求めるために、新たな非線形方程式を利用する方法もある。しかしながら、非線形方程式を用いる方法は、解発生機構そのものに非線形要素が存在するため、上位判断機能などの処理系が意のままに制御することが難しい。そこで、ここでは、運動を逐次近似法で解くことを考える。天文力学や流体力学においては、非線形方程式を近似的に解く手法として摂動法が知られている。摂動法とは、天文力学等において、非線形方程式を解く際に、可解な線形微分方程式の解を第 1近似解としそれを逐次修正しながら近似解を求める手法である。この摂動法において、修正に必要な項を摂動項という。通常、ティラー展開に基づく計算を行なう。天文力学の場合、解くべき方程式は、あらかじめわかっているため、解くべき方程式に展開した解を直接代入し、各次数毎に解くことによって、逐次解を求める。通常の摂動法の揚合、近似度をあげると解は真の解に逐次近づく。

ここでは、上記の考えを口ポットの運動の方程式に当てはめて考える。ロボットの運動の非線形方程式は、歩行等の運動を考えると、口ポットの質量等の物性値、関節粘性、モータ最大トルク、床面の摩擦係数や傾斜、および部屋の形状等の非常に複雑な関係式となっていることが予想される。理想的な場合はこのような方程式を構築することができ、理論的に解析できる。しかしながら、口ポットが様々な運動を行うことを考えると、この方程式をすベてあらかじめ知ることは非常に難しい作業である。

そこで、ここでは、解くべき方程式があらかじめわかっている天文力学の場合とは異なり、解くべき方程式を構築しないで問題を解くことを考える。天文力学等で用いられている摂動法は、低い次数から順次に解が得られる。ここでは、これと同様に、解を以下のようにある固有関数で展開して、低い次数から逐次、試行錯誤によってその係数を数値的に求める。満足できる運動が得られるまで次数をあげていく。

y= S _Qy₀+ d ₁y₁+ 6₂y₂+ 6₃y₃ + (22)

y iは固有関数、 δ ,はその係数、 iは次数である。

この手法を、ここでは、 NP法（Nume r i c a l Pe r t u r b a t i on me t hod) と言うことにし、ここでは、 C P Gモデルと N P法を併用した運動学習システム（CPGZNP) を説明する。 CPGモデルは、前述したように、基本的な関数である三角関数や多項式を発生することができ、その他説明は省略するが数種の直交関数を発生することができる。これらの基本的な関数を用いて、運動を表現する未知非線形方程式の解を求める。

k番目の関節の運動（位置あるいは角度）を 0_k (t) としたとき、ここでは、ある 1つの CPGを、 n n

¾( = c₀ + > ( j ' cos j t + Sj - sin j t) + α ί〗 …… （_{2 3)} y≡i i と表現する。

c j, S j, a_;.は、ニューロンの遅れ、重み、および初期値に関係する係数である（（13) 式〜（15) 式、（19) 式を参照。）この（23) 式の右辺中の第 1項は定数項 c。であり、第 2項は周期関数の項であり、第 3項は非周期関数の項である。ここでは、（23) 式の∑による積算をばらばらに分解した各項それぞれに対応する各単位ネットワークが生成されているものとする。ここでは、 jの値の低い項（（23) 式の右辺中の第 2項については角周波数 j ωの低い（周期の長い項、（23) 式の右辺中の第 3項については、低次の項）から順に係数の値を求め、ネットワークを構成していく。ここでは、先ず、 c。を最初に決め、次に（23) 式中の係数 cい s ₁；を求める。このとき、他の係数 C j, s j, a j ( j = 2 , 3, …， n) を全て 0とおく。 sい丄が求められると

、次に c₂， s ₂， a₂を求める。このとき、先に求めたじい s！, は固定しておき、他の係数 C j， S j， a j ( j = 3 , 4, …， n) は全て 0にしておく。これを C j， s j, a』について繰り返す。

NP法では、以上のようにして係数を順次決めていく。

図 9に示すロポット制御アルゴリズム構築装置 410の定義記憶部 41 1には、上述の（23) 式の各項に相当する単位ネットワークが全てあらかじめ生成されて記憶されている。あるいは、定義記憶部 41 1には、それらの単位ネットヮーク生成のアルゴリズムが記憶されていて、制御アルゴリズム制御部 412で必要な単位アルゴリズムが自動生成されるように構成してもよい。図 38は、ロボッ卜の運動学習システムの概要を示す図である。

ここでは、先ずオペレータにより、基本運動タイプと初期係数値が与えられる。基本運動タイプとは、今回係数を決定しょうとしている CPGが、周期運動タイブの CPGであるが非周期運動タイプの CPGであるということである。周期運動の CPGであることが指示されると、（23) 式の右辺の第 1項と第 2項のみが有効となり第 3項は不要となる。一方、非周期運動の CP Gであることが指示されると（23) 式の右辺の第 1項と第 3項が有効となり、第 2項は不要となる。

この図 38中の「アドバイス」は評価関数である。評価関数は、満足できる運動かをどうかを決定するための関数である。複雑な系の場合、評価関数は、「ェネルギー最小」、「ロボット本体の安定性」、「高速性」等複数ある。極致問題とするために、ここでは、評価関数 Eを以下のように複数の評価関数の重み付線形和とする。 Eiは 2次形式で与えられる非負数であり、 C iは評価関数 Eiの重みである。ここでは、評価関数 Eをアドバイスと呼ぶことにする。

E= \ C. E_: (24) 図 9に示すロボット制御アルゴリズム構築装置 410の制御アルゴリズム生成部 412には、オペレータにより基本運動タイプと係数の初期値が指定される。先ず、関数 kの初期位置（初期角度） c。が指定される。この c。は、その関節が静止状態（運動を開始する前の状態）にあるとき、あるいはその直前の運動から引き継いだ初期状態にあるときの、その関節の初期位置あるいは初期角度である。次に、例えば基本運動タイプが周期運動タイプであることが指定される。すると、図 9の口ポット制御アルゴリズム構築装置 410の制御アルゴリズム生成部 412では、その指定を受け、定義記憶部 41 1から

C i C O S C t + S i S i nc t: "' (24)

の基本ネットワークを読み出す（あるいはその時点で生成する）。このときの運動の基本式は、初期位置（初期角度） c。を含め、

Θ,.= ο₀+ο ₁ ο ο 3 ω ί + 5 ₁5 i η ω t … (25) となる。

オペレータからは、その周期運動の基本的な周期（角周波数 ω) や、各係数 _{C l} ， S iの初期値が与えられ、図 9のロボット制御アルゴリズム構築装置 410の係数値決定部 413は、これら ω， _{C l}， s iによりその基本ネットワークを構築する各ニューロンの遅れ、重み、および初期値が仮決定される。

このようにして生成された、初期係数値を持つ基本ネットワークの出力がロボットに与えられ、そのときのロボットの運動が評価される。その評価に応じて係数値が少しずつ修正されその次数の段階での最高の評価が得られるように係数 c , ， s iが決定される。

口ポットの運動の評価は、オペレータが目視等により行ない、そのオペレータにより係数値を決定してもよいが、上述のァドバイスをあらかじめ決めておき、そのアドバイスに従って、係数値を自動で、あるいはオペレータの意見も含めて半自動で決定してもよい。

(25) 式における cい _{S l}が決定されると（c。はそれ以前に既に決定されている）、それに応じて、（24) 式で表わされる基本ネットワークを構成するニューロンの遅れ、重み、および初期値が決定される（（14) 式参照）。図 9 の制御アルゴリズム生成部 412は、定義記憶部 411から次の次数の項を実現する基本ネットワークを読み出し（あるいは生成し）これまでの低い次数の部分ネットワークに結合する。式で示すと、 θ,' =c₀ + ( cos cot + s₁ cos ωί) + 1 c₂ cos厶 cot + s₂ sm 2ωύ

…… （26) となる。係数 c ₀, c _{l t} S iは既に決定済であり、ここではオペレータにより新たな係数 c₂, s ₂の初期値が与えられる。これらの係数 c₂, s ₂は、その次数の項を実現する単位ネットワークを構成するニューロンの遅れ、重み、初期値に対応づけられている点は、係数 ^, S iの場合と同様である。図 9の係数値決定部 413では、係数 c₂， s ₂として初期値が与えられたときの（26) 式に相当する部分ネットワークの出力がロボットに与えられ、そのときのロボットの運動が評価され、その評価がより高まる方向に係数 c ₂, s ₂の値が調整され、その次数における最高の評価が得られるように係数 c ₂， s ₂が決定される。

係数 c ₂， s ₂が決定されると、図 9の制御アルゴリズム生成部 4 1 2は、定義記憶部 4 1 1から次の次数の項を実現する基本ネットワークを読み出し（あるいは生成し）、これまで評価の済んでいる（係数が決定されている）部分ネットヮ —クに結合される。式で示すと、 θ,. = c₀ + ( cos ωί + s_l sin ω + (c₂ cos 2wt + s₂ sm 2 ωί)

+ (c₃ cos3iyi + s₃ sin 3ωί)

…… ( 2 7 ) となる。

新たな係数 c ₃, s ₃について初期値が与えられ、上記と同様のプロセスを経ることによりその係数 c ₃, s ₃の値が決定される。

このようにして、ロボットが必要な精度の運動を行なうことができる次数まで、順次に係数が決定される。

ここでは周期関数を例に挙げて説明したが、非周期関数の係数決定プロセスも同様である。

以上の説明では、係数の初期値は全てオペレータが与えるものとして説明したが、例えば係数の値として任意に定めた初期値あるいは、あらかじめ決められた固定の初期値を自動で与え、その自動で与えた初期値から出発して係数値を順次変化させてその係数の値を決定してもよい。

その初期値の与え方だけでなく、基本運動タイプの指定、基本ネットワークの読み出し（あるいは生成）、および口ポットの運動の評価等の全てをあらかじめプログラムしておくことで、部分ネットワークの生成からその部分ネットワークの係数の決定までを全て自動化してもよい。あるいは、それらのうちの一部をォペレ一夕操作に委ね、あるいは自動生成の結果をオペレータに提示して承認を受けるなど半自動の装置として実現してもよい。

また、上記では、係数に初期値が与えられたばかりの部分ネットワークの出力をいきなり口ポットに与えるように説明したが、その出力を、先ずは図 6、図 7 に示すコンピュータ中に構築されているアルゴリズムとしてのロポットに与えて動作シミユレーションを行ない、ある程度十分な精度で動作することを確認してから、実際の口ポットを動かしてみることが好ましい。

図 39は、以上の学習プロセスをまとめたフローチヤ一トである。

先ず、基本運動タイプが与えられる。係数は初期値から出発する（ステップ S

1) 。

その初期値から出発した初期運動の係数を GA (遺伝的アルゴリズム）や二分法等、何らかの係数決定アルゴリズムを駆使して決定し（ステップ S 2) 、運動タイプに従つてより高次の項を付加してその付加した項の係数に初期値を与え（ステップ S 3) 、その高次の項の係数を GAや二分法等を用いて決定する（ステップ S4) 。制御対象の口ポットの運動の精度が未だ不充分のときは（ステップ S 5) 、その運動タイプに従ってさらに高次の項を付加するとともにその付加した高次項の係数に初期値を与え（ステップ S 3) 、その高次項の係数を GAや二分法等を用いて決定する（ステップ S 4) 。これを、口ポットが十分な精度の運動を行なうことができるようになるまで繰り返す。

次に、上記の CPGZNP (CPGの係数を上記の NP法で順次求める方法） . と CPGZGA (じ？0の係数を〇八（遺伝的アルゴリズム）を用いて、一度に求める方法）との比較結果を説明する。

CPGZGAでは、すべての係数が同時に求められる。そのため、すべての係数が相互に関係を持つ。動きを少しだけ変更したい場合でも、すべての係数が影響を受け変更に時間がかかることが予想される。ここではもつとも差が出ると考えられる場合として、解の全サーチを行った場合について簡単に考察する。ニュ一口ン値の解像度および結合重みの解像度を共に n、最終的なニューロン数と二ユーロン間の結合数の和を mとすると、全サーチを行った場合の計算量は、 n^m回の試行が必要である。仮に、 CPGZNPにおいて j次に分割して求めたとすると、計算量は、およそ j Xn^m/jである。具体的に n= 16， m=60, j =5 とすると、 n^m=l. 15 X 10⁷³, j x n^m/J= 1 - 4 X 10¹⁶とおよそ 10⁵ ⁷倍程度の差が出る。実機を用いた実証実験では、 CPGZGAでは、 CPGZN Pで得たものに相当する解を、現在までに、まだ見つけることができていない。さらに、 CPGZNP法では、 CPGZGAにはない特徴として、各摂動次数の区切りで評価関数を再設定したり、ニューロン数を変化することが容易である事があげられる。

このように、 CPGZNPの場合、従来法と比べ天文学的な桁数ほど違うレべルで極めて短時間に係数を決定することができる。

図 40は、本発明のロボット制御プログラムの一実施形態の概要を示す模式図である。

ここでは、このロボット制御プログラム 500は CD— ROM300に記憶されており、この CD— ROM 300が図 6に示す CD— ROM装填口 101 から装填され図 7の CD— ROMドライブ 1 15によりアクセスされて、その CD 一 ROM300に記憶されている口ポット制御プログラム 500が、図 6，図 7 に示すコンピュータ 100にインストールされる。そのコンピュータ 100内にインス 1 ^一ルされたロポット制御プログラムがそのコンピュータ 100内で実行されると、そのコンピュータ 100は、本発明のロボット制御装置の一実施形態として動作する。

尚、このロボット制御プログラム 500は、ここでは CD— ROM300に記憶されている例を示したが、前述のロボット制御アルゴリズム構築プログラム（図 8参照）の場合と同様、 CD— ROMに記憶されている必要はなく、例えば F D等他の可搬型記憶媒体に記憶されてコンピュータ 100にインストールされてもよく、あるいは、他の装置等から通信網（図示せず）を介してコンピュータ 1 00にインストールされてもよく、あるいは、そのコンピュータ 100のハードディスク（図 7参照）等にはじめから記憶されていてもよく、最終的にコンビュ一夕で実行可能となるものであればどのように保存あるいは記憶されていてもよい。

図 40に示すロボット制御プログラム 500は、制御アルゴリズム記憶部 50 1とロポット制御部 502とから構成されている。このロポット制御プログラム 500を構成する各部 501, 502の作用は、図 41の説明と合わせて説明する。

図 41は、本発明のロボット制御装置の一実施形態を示すブロック図である。この口ポット制御装置 5 1 0は、図 6 , 図 7に示すコンピュータ 1 0 0内で図 4 0に示すロボット制御プログラム 5 0 0が実行されることにより、図 6 , 図 7 に示すコンピュータ 1 0 0内に実現するものである。

この図 4 1のロポット制御装置 5 1 0は、制御アルゴリズム記憶部 5 1 1および口ポット制御部 5 1 2で構成されている。これら制御アルゴリズム記憶部 5 1 1およびロボット制御部 5 1 2は、それぞれ、図 4 0に示す口ポット制御プログラム 5 0 0の、制御アルゴリズム記憶部 5 0 1およびロポッ卜制御部 5 0 2に対するが、図 4 1のロボット制御装置 5 1 0の各部 5 1 1， 5 1 2は、図 6、図 7 のコンピュータ 1 0 0のハードウェアおよびそのコンピュータ 1 0 0内で実行されるオペレーティングシステム（O S ) およびその O S上で動作する、図 4 0に示すロボット制御プログラム 5 0 0の各部 5 0 1 , 5 0 2との複合で構成されているのに対し、図 4 0に示すロボット制御プログラム 5 0 0の各部 5 0 1， 5 0 2は、それらの複合のうちのアプリケ一ションプログラム部分のみで構成されている。図 4 0に示すロボット制御プログラム 5 0 0を構成する各部 5 0 1， 5 0 2の、その口ポット制御プログラム 5 0 0が図 6、図 7のコンピュータ 1 0 0内で実行されたときの作用は、図 4 1に示すロポット制御装置 5 1 0を構成する各部 5 1 1， 5 1 2の作用そのものであり、以下、図 4 1のロボット制御装置 5 1 0の各部 5 1 1， 5 1 2の作用を説明することで、図 4 0のロボット制御プログラム 5 0 0の各部 5 0 1 , 5 0 2の作用の説明を兼ねるものとする。

図 4 1のロボット制御装置 5 1 0は、 2つの部材の相対的な位置もしくは姿勢を可変にそれら 2つの部材を結合する関節を少なくとも 1つ備えたロボットの動作を制御する装置である。前述したように、図 6に示すロボット 2 0 0は人間の鉢の構造に似せた構造を有するヒユーマノィド型のロポットであり、人間の手足等に対応する部分に複数の関節を有する。

ここで、この図 4 1のロポット制御装置 5 1 0を構成する制御アルゴリズム記憶部 5 1 1は、入力に基づいて遅れゼロを含むアナログ的な遅れを伴う出力を生成する複数のニューロンを有しそれら複数のニューロンの中に遅れゼロを除くァナログ的な遅れを伴う出力を生成する遅れニューロンを少なくとも 1つ含むとともに信号の流れのループが存在するリカレントニューラルネットワーク（R N N ) により構築された制御アルゴリズムを記憶するものであり、ロボット制御部 5 1 2は、制御アルゴリズム記憶部 5 1 1に記憶された制御アルゴリズムに基づいて生成された制御信号を用いて制御対象の口ポットを制御するものである。制御アルゴリズム記憶部 5 1 1に記憶されている制御アルゴリズムは、前述のようにして構築され係数についても値が決定された後の制御アルゴリズムである。この制御アルゴリズム記憶部 5 1 1に記憶される制御アルゴリズムの詳細は既に説明済であるため、ここでは重複説明は省略する。

ロポット制御部 5 1 2には、ロボッ卜に備えられた各種センサによる測定値が入力され、ロポット制御部 5 1 2は、制御アルゴリズム記憶部 5 1 1に記憶された制御アルゴリズムに基づくとともにセンサからの測定値に基づいて制御対象のロボットの運動を制御する。

図 4 2は、本発明の口ポットの一実施形態の外観図である。

このロボット 6 0 0は、図 6のコンピュータ 1 0 0で実現しているロポット制御装置を図 6に示すロポット 2 0 0自身の内部に備えたものに相当する。

すなわち、このロボット 6 0 0は、このロボット自身を制御するロボット制御装置 6 1 0を内蔵している。

図 4 3は、図 4 2のロボット 6 0 0の構成を示すブロック図である。

このロボット 6 0 0は、ロポット制御装置 6 1 0とそのロボット制御装置 6 1 0により運動が制御される関節 6 2 0と、その関節の動作を計測するセンサ 6 3 0を備えている。

この口ポット 6 0 0のロボット制御装置 6 1 0は、制御アルゴリズム記憶部 6 1 1と口ポット制御部 6 1 2とからなる。このロボット制御装置 6 1 0は、このロボット制御装置 6 1 0がロポット 6 0 0に内蔵されていることを除き、図 4 1 に示すロボット制御装置 5 1 0と同一であり、このロボット制御装置 6 1 0を構成する制御アルゴリズム記憶部 6 1 1およびロポット制御部 6 1 2は、図 4 1に示すロポット制御装置 5 1 0を構成する制御アルゴリズム記憶部 5 1 1および口ボット制御部 5 1 2とそれぞれ同一の作用を成す。重複説明は省略する。

このように、ロボット制御装置を内蔵したロポットを構成してもよい。

Claims

請求の範囲

1 . 2つの部材の相対的な位置もしくは姿勢を可変に該 2つの部材を結合する関節を少なくとも 1つ備えたロポッ卜の動作を制御するための制御アルゴリズムを構築するロボット制御アルゴリズム構築装置において、

前記定義記憶部に記憶された定義を用い、複数のニューロンを有し該複数の二ユーロンの中に遅れゼロを除くアナログ的な遅れを伴う出力を生成する遅れニュ —ロンを少なくとも 1つ含むとともに信号の流れのループが存在するリカレントニューラルネットワークにより構築された、値が未確定の係数を含む制御アルゴリズムを生成する制御アルゴリズム生成部と、

前記制御アルゴリズム生成部で生成された制御アルゴリズムの係数の値を決定する係数値決定部とを備えたことを特徴とするロボット制御アルゴリズム構築装

2 . 前記定義記憶部は、入力を出力を遅れを _{£ l}としたとき、基本的に、ど¹ dt ^{1 0}

の式に従って出力を生成するというニューロンの定義を記憶するものであることを特徴とする請求の範囲第 1項記載のロボット制御アルゴリズム構築装置。

3 . 前記定義記憶部に記憶された定義には、複数の入力を受け該複数の入力の総和に基づいて、遅れゼロを含むアナログ的な遅れを伴う出力を生成するという二ユーロンの定義を含むものであり、前記制御アルゴリズム生成部は、該定義に従うニューロンを含む制御アルゴリズムの生成が自在なものであることを特徵とする請求の範囲第 1項記載の口ポット制御アルゴリズム構築装置。

4. 前記定義記憶部に記憶された定義には、入力に重みを付し重みを付した入力に基づいて、遅れゼロを含むアナログ的な遅れを伴う出力を生成するというニュ —ロンの定義を含むものであり、前記制御アルゴリズム生成部は、該定義に従うニューロンを含む制御アルゴリズムの生成が自在なものであることを特徴とする請求の範囲第 1項記載のロボット制御アルゴリズム構築装置。

5 . 前記定義記憶部に記憶された定義には、前記重みを別のニューロンの出力に応じて変更する定義を含むものであって、前記制御アルゴリズム生成部は、入力に重みを付するニューロンを含むとともに該重みを変更する別のニューロンを含む制御アルゴリズムの生成が自在なものであることを特徴とする請求の範囲第 1 項記載のロポット制御アルゴリズム構築装置。

6 . 前記定義記憶部に記憶された定義には、前記ニューロンの遅れを別のニューロンの出力に応じて変更する定義を含むものであって、前記制御アルゴリズム生成部は、該別のニューロンを含むとともに該別のニューロンの出力によって変更される遅れを伴う出力を生成するニューロンを含む制御アルゴリズムの生成が自在なものであることを特徴とする請求の範囲第 1項記載のロポット制御アルゴリズム構築装置。

7 . 前記定義記憶部に記憶された定義には、入力が閾値を越える場合に入力に代えて閾値を採用するニューロンの定義を含むものであって、前記制御アルゴリズム生成部は、該定義に従うニューロンを含む制御アルゴリズムの生成が自在なものであることを特徴とする請求の範囲第 1項記載のロポット制御アルゴリズム構

8 . 前記定義記憶部に記憶された定義には、 2つのニューロン間の結合を別の二ュ一ロンの出力に応じて接断するスィッチの定義を含むものであって、前記制御アルゴリズム生成部は、該別のニューロンを含むとともに該別のニューロンの出力に応じて接断するスィッチにより接断される結合が定義された 2つのニューロンを含む制御アルゴリズムの生成が自在なものであることを特徴とする請求の範囲第 1項記載のロポット制御アルゴリズム構築装置。

9 . 前記制御アルゴリズム生成部は、周期関数を実現し周期信号を出力する部分ネットワークを含む制御アルゴリズムの生成が自在なものであることを特徴とする請求の範囲第 1項記載のロボット制御アルゴリズム構築装置。

1 0 . 前記周期関数は、相互に異なる周期の複数の単位周期関数の結合からなるものであって、前記制御アルゴリズム生成部は、前記部分ネットワークを生成するにあたり、前記複数の単位周期関数を実現し相互に異なる周期の複数の単位周期信号を出力する複数の単位ネットワークの結合からなる部分ネットワークを生成するものであることを特徴とする請求の範囲第 9項記載のロポット制御アルゴリズム構築装置。

1 1 . 前記係数値決定部は、前記制御アルゴリズム生成部により前記複数の単位ネットワークの結合からなる部分ネットワークが生成される場合に、該部分ネットワークの係数の値を、該部分ネットワークを構成する複数の単位ネットワークのうちの、より長周期の単位周期信号を出力する単位ネットワークから、より短周期の単位周期信号を出力する単位ネットワークに向かって順次に、各単位ネットワークの係数の値を決定していくものであることを特徴とする請求の範囲第 1 0項記載のロボット制御アルゴリズム構築装置。

1 2 . 前記制御アルゴリズム生成部は、多項式で表わされる非周期関数を実現し非周期信号を出力する部分ネットワークを含む制御アルゴリズムの生成が自在なものであることを特徴とする請求の範囲第 1項記載のロボット制御アルゴリズム

1 3 . 前記制御アルゴリズム生成部は、前記部分ネットワークを生成するにあたり、前記多項式の各項を実現し該各項に対応する各単位信号を出力する複数の単位ネットワークの結合からなる部分ネットワークを生成するものであることを特徴とする請求の範囲第第 1 2項記載のロポット制御アルゴリズム構築装置。

1 4. 前記係数値決定部は、前記制御アルゴリズム生成部により前記複数の単位ネットワークの結合からなる部分ネットワークが生成される場合に、該部分ネットワークの係数の値を、該部分ネットワークを構成する複数の単位ネットワークのうちの、より次数の低い項に対応する単位信号を出力する単位ネットワークから、より次数の高い項に対応する単位信号を出力する単位ネットワークに向かつて順次に、各単位ネットワークの係数の値を決定していくものであることを特徴とする請求の範囲第 1 5項記載のロボッ卜制御アルゴリズム構築装置。

1 5 . プログラムを実行する情報処理装置内で実行され、該情報処理装置を、 2 つの部材の相対的な位置もしくは姿勢を可変に該 2つの部材を結合する関節を少なくとも 1つ備えたロポッ卜の動作を制御するための制御アルゴリズムを構築するロボット制御アルゴリズム構築装置として動作させるロポット制御アルゴリズム構築プログラムにおいて、

前記情報処理装置を、

入力に基づいて遅れゼロを含むアナログ的な遅れを伴う出力を生成するニューロンの定義を記憶する定義記憶部と、

前記定義記憶部に記憶された定義を用い、操作に応じて、複数のニューロンを有し該複数のニューロンの中に遅れゼロを除くアナログ的な遅れを伴う出力を生成する遅れニューロンを少なくとも 1つ含むとともに信号の流れのループが存在するリカレントニューラルネットワークにより構築された、値が未確定の係数を含む制御アルゴリズムを生成する制御アルゴリズム生成部と、

前記制御アルゴリズム生成部で生成された制御アルゴリズムの係数の値を決定する係数値決定部とを備えたロポット制御アルゴリズム構築装置として動作させることを特徴とするロボット制御アルゴリズム構築プログラム。

1 6 . 2つの部材の相対的な位置もしくは姿勢を可変に該 2つの部材を結合する関節を少なくとも 1つ備えたロボッ卜の動作を制御するロボット制御装置において、

入力に基づいて遅れゼロを含むアナログ的な遅れを伴う出力を生成する複数のニューロンを有し該複数のニューロンの中に遅れゼロを除くアナログ的な遅れを伴う出力を生成する遅れニューロンを少なくとも 1つ含むとともに信号の流れのル一プが存在するリカレントニューラルネットワークにより構築された制御アルゴリズムを記憶する制御アルゴリズム記憶部と、

前記制御アルゴリズム記憶部に記憶された制御アルゴリズムに基づいて生成された制御信号を用いて制御対象のロボットを制御するロボット制御部とを備えたことを特徴とするロポット制御装置。

1 7 . プログラムを実行する情報処理装置内で実行され、該情報処理装置を、 2 つの部材の相対的な位置もしくは姿勢を可変に該 2つの部材を結合する関節を少なくとも 1つ備えたロボットの動作を制御するロボット制御装置として動作させるロポット制御プログラムにおいて、

前記情報処理装置を、

入力に基づいて遅れゼロを含むアナ口グ的な遅れを伴う出力を生成する複数のニューロンを有し該複数のニューロンの中に遅れゼロを除くアナログ的な遅れを伴う出力を生成する遅れニューロンを少なくとも 1つ含むとともに信号の流れのループが存在するリカレントニューラルネットワークにより構築された制御アルゴリズムを記憶する制御アルゴリズム記憶部と、

前記制御アルゴリズム記億部に記憶された制御アルゴリズムに基づいて生成された制御信号を用いて制御対象のロボットを制御するロボット制御部とを備えたロポット制御装置として動作させることを特徴とするロボット制御プログラム。

1 8 . 2つの部材の相対的な位置もしくは姿勢を可変に該 2つの部材を結合する関節を少なくとも 1つ備えたロポッ卜において、

このロボットの動作を制御するロポット制御装置を備え、

該ロボット制御装置が、入力に基づいて遅れゼロを含むアナログ的な遅れを伴う出力を生成する複数のニューロンを有し該複数のニューロンの中に遅れゼロを除くアナログ的な遅れを伴う出力を生成する遅れニューロンを少なくとも 1つ含むとともに信号の流れのループが存在するリカレントニューラルネットワークにより構築された制御アルゴリズムを記憶する制御アルゴリズム記憶部と、

前記制御アルゴリズム記憶部に記憶された制御アルゴリズムに基づいて生成された制御信号を用いてこのロボッ卜の動作を制御するロボット制御部とを備えたことを特徴とするロボット。