JPH02299002A - 適応制御器 - Google Patents
適応制御器Info
- Publication number
- JPH02299002A JPH02299002A JP1119447A JP11944789A JPH02299002A JP H02299002 A JPH02299002 A JP H02299002A JP 1119447 A JP1119447 A JP 1119447A JP 11944789 A JP11944789 A JP 11944789A JP H02299002 A JPH02299002 A JP H02299002A
- Authority
- JP
- Japan
- Prior art keywords
- circuit
- model
- signal
- model identification
- control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Feedback Control In General (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[発明の目的]
(産業上の利用分野)
本発明は、未知のダイナミクスを有する制御対象システ
ムに対し、ある評価関数を最小にするような制御ゲイン
を適用して制御するとき、当該制御ゲインは一定時間ご
とに同定される制御対象システムのダイナミクスに基づ
いて随時更新されるようになされた適応制御器に関する
。
ムに対し、ある評価関数を最小にするような制御ゲイン
を適用して制御するとき、当該制御ゲインは一定時間ご
とに同定される制御対象システムのダイナミクスに基づ
いて随時更新されるようになされた適応制御器に関する
。
(従来の技術)
2次形式の評価関数を最小にするように制御ゲインを決
定する最適レギュレータの理論は、できあがった最適制
御器を含む閉ループシステムが安定となるばかりでなく
、ゲイン余裕や位相余裕が大きい。即ち、ロバスト性を
もっていることで制御方法として高く評価され、広い範
囲で実用化されている。
定する最適レギュレータの理論は、できあがった最適制
御器を含む閉ループシステムが安定となるばかりでなく
、ゲイン余裕や位相余裕が大きい。即ち、ロバスト性を
もっていることで制御方法として高く評価され、広い範
囲で実用化されている。
ところで、制御対象システムに対して最適制御器を構成
し、上述のような性質を得るためには、制御対象システ
ムのダイナミクスがある特定の線形微分方程式として厳
密に与えられることが必要である。
し、上述のような性質を得るためには、制御対象システ
ムのダイナミクスがある特定の線形微分方程式として厳
密に与えられることが必要である。
このため、実際上制御対象システムのダイナミクスが未
知の場合や当該ダイナミクスが時間に伴って変化する場
合には、例えば制御対象同定方法を用いて制御対象シス
テムのダイナミクスを同定する方法がとられている。こ
のような方法は、制御対象同定方法と呼ばれており、従
来より様々な方法が提案されている。
知の場合や当該ダイナミクスが時間に伴って変化する場
合には、例えば制御対象同定方法を用いて制御対象シス
テムのダイナミクスを同定する方法がとられている。こ
のような方法は、制御対象同定方法と呼ばれており、従
来より様々な方法が提案されている。
(発明が解決しようとする課題)
しかしながら、従来よりあるこれらの制御対象同定方法
では、適用できる制御対象システムに限界がある上、手
順が複雑で熟練した技術者に頼らざるを得なかった。ま
た、オンラインで常時同定を繰り返すことは困難であっ
た。
では、適用できる制御対象システムに限界がある上、手
順が複雑で熟練した技術者に頼らざるを得なかった。ま
た、オンラインで常時同定を繰り返すことは困難であっ
た。
本発明はこのような課題を解決するためになされたもの
で、未知のダイナミクスを有する種々の制御対象システ
ムに対して常にシステム同定を行い、ある評価関数を最
小化する安定化制御ゲインを更新し適用することが容易
に実現し得る適応制御器を提供することを目的としてい
る。
で、未知のダイナミクスを有する種々の制御対象システ
ムに対して常にシステム同定を行い、ある評価関数を最
小化する安定化制御ゲインを更新し適用することが容易
に実現し得る適応制御器を提供することを目的としてい
る。
[発明の構成]
(課題を解決するための手段)
本発明の適応制御器は上記した目的を達成するために、
未知のダイナミクスを有する制御対象システムに対し、
一定時間ごとに制御対象同定部によりモデル同定し、得
られたモデルに対し所定の評価関数を最小にするよう制
御ゲインを決定し、該制御ゲインにより前記制御対象シ
ステムを制御するように構成された適応制御器において
、前記制御対象同定部が、複数のユニット層から構成さ
れるニューラルネットワークからなり、中間ユニット層
の各ユニットの出力が下層ユニット層と共に、該中間ユ
ニット層自体にも入力されるように構成されたモデル同
定回路と、前記制御対象システムに対し所定の基準入力
信号を送出し、該基■人力信号に対する前記制御対象シ
ステムからのシステム応答信号を記のすると共に、前記
モデル同定回路に対し前記基準人力信号を送出し、該基
準入力信号に対する前記モデル同定回路からのモデル応
答信号を入力し、かつ該モデル応答信号と前記システム
応答信号との誤差に基づき前記モデル同定回路の内部状
態を前記誤差が減少するよう補正をするモデル同定制御
部とを備え、前記補正を複数種類の前記基準入力信号に
ついて繰返し行うことにより、前記モデル同定回路の内
部状態が前記制御対象システムのダイナミクスを実現す
るようにしたものである。
未知のダイナミクスを有する制御対象システムに対し、
一定時間ごとに制御対象同定部によりモデル同定し、得
られたモデルに対し所定の評価関数を最小にするよう制
御ゲインを決定し、該制御ゲインにより前記制御対象シ
ステムを制御するように構成された適応制御器において
、前記制御対象同定部が、複数のユニット層から構成さ
れるニューラルネットワークからなり、中間ユニット層
の各ユニットの出力が下層ユニット層と共に、該中間ユ
ニット層自体にも入力されるように構成されたモデル同
定回路と、前記制御対象システムに対し所定の基準入力
信号を送出し、該基■人力信号に対する前記制御対象シ
ステムからのシステム応答信号を記のすると共に、前記
モデル同定回路に対し前記基準人力信号を送出し、該基
準入力信号に対する前記モデル同定回路からのモデル応
答信号を入力し、かつ該モデル応答信号と前記システム
応答信号との誤差に基づき前記モデル同定回路の内部状
態を前記誤差が減少するよう補正をするモデル同定制御
部とを備え、前記補正を複数種類の前記基準入力信号に
ついて繰返し行うことにより、前記モデル同定回路の内
部状態が前記制御対象システムのダイナミクスを実現す
るようにしたものである。
(作 用)
本発明では、制御対象同定方法として中間ユニット層に
おける各ユニットの出力か下層のみならず中間ユニット
層自信にも入力されるように構成されたニューラルネッ
トワークを用いた手法を用いているので、未知のグイナ
ミクスを有する種々の制御対象システムに対して常にシ
ステム同定を行いある評価関数を最小化する安定化制御
ゲインを更新し適用する適応制御器を容易に実現し得る
。
おける各ユニットの出力か下層のみならず中間ユニット
層自信にも入力されるように構成されたニューラルネッ
トワークを用いた手法を用いているので、未知のグイナ
ミクスを有する種々の制御対象システムに対して常にシ
ステム同定を行いある評価関数を最小化する安定化制御
ゲインを更新し適用する適応制御器を容易に実現し得る
。
(実施例)
以下、本発明の実施例を図面に基づいて詳細に説明する
。
。
第1図は本発明の一実施例に係る適応制御器を採用した
制御システムの構成を説明するためのブロック図である
。
制御システムの構成を説明するためのブロック図である
。
同図において、10は全体として制御システムを示し、
動作として2つの機能を並列的に実行する。これはマル
チCPU構成により、容易に実現できる。即ち、第1の
機能は制御対象である制御対象システム3を適応制御器
11により制御する制御機能であり、第2の機能は制御
対象システム3のダイナミクスをモデル同定制御部1に
より同定し、モデル同定回路2に制御対象システム3の
モデルを形成するモデル同定機能である。
動作として2つの機能を並列的に実行する。これはマル
チCPU構成により、容易に実現できる。即ち、第1の
機能は制御対象である制御対象システム3を適応制御器
11により制御する制御機能であり、第2の機能は制御
対象システム3のダイナミクスをモデル同定制御部1に
より同定し、モデル同定回路2に制御対象システム3の
モデルを形成するモデル同定機能である。
制御システム10において、第1の機能即ち制御機能は
、第2の機能即ちモデル同定機能の動作/非動作にかか
わらずリアルタイムに継続される。
、第2の機能即ちモデル同定機能の動作/非動作にかか
わらずリアルタイムに継続される。
即ち、適応制御器11から出力された制御人力Uは制御
対象システム3に入力されると共に、モデル同定回路2
に入力される。ここで、モデル同定機能動作中は、モデ
ル同定制御部1から出力される基準入力信号REPが制
御人力Uに対して重畳される。制御対象システム3は入
力された制御人力Uに対する応答出力yを出力し、当該
応答出力yは適応制御器11にフィードバック人力され
る。
対象システム3に入力されると共に、モデル同定回路2
に入力される。ここで、モデル同定機能動作中は、モデ
ル同定制御部1から出力される基準入力信号REPが制
御人力Uに対して重畳される。制御対象システム3は入
力された制御人力Uに対する応答出力yを出力し、当該
応答出力yは適応制御器11にフィードバック人力され
る。
か(して、制御対象システム3及び適応制御器11によ
り閉ループ系が構成される。
り閉ループ系が構成される。
第2図は上述した適応制御器11の構成を詳細に示すブ
ロック図である。
ロック図である。
同図に示すように適応制御器11では、制御対象システ
ム3より入力された応答出力yは、状態合成回路12に
与えられる。状態合成回路12は、応答出力y及び状態
モデル回路13から出力されるモデル状態信号xMより
制御対象システム3の状態を推定し、当該推定結果を観
測状態信号マとして最適制御器14に入力する。
ム3より入力された応答出力yは、状態合成回路12に
与えられる。状態合成回路12は、応答出力y及び状態
モデル回路13から出力されるモデル状態信号xMより
制御対象システム3の状態を推定し、当該推定結果を観
測状態信号マとして最適制御器14に入力する。
ここで、状態合成回路12は、次のようにして観測状態
信号マを求める。即ち、r次元の応答出力yのうちi
(o≦i≦「)次元分はそのまま制御対象システム3
の状態を表しているという場合、このi次元分の応答出
力yをそのまま観測状態信号マのi次元分として。残る
次元の観測状態信号マについては、状態モデル回路13
からのモデル状態信号xMを適用する。状態モデル回路
13は、一定時間ごとに制御システム10のモデル同定
機能により同定された制御対象システムのダイナミクス
を示すパラメータ(ゲイン構成回路15から与えられる
。)から構成されており、制御対象システム3と同一の
制御人力Uを与えることにより制御対象システム3の状
態を表すと思われるモデル状態信号xMを出力する。
信号マを求める。即ち、r次元の応答出力yのうちi
(o≦i≦「)次元分はそのまま制御対象システム3
の状態を表しているという場合、このi次元分の応答出
力yをそのまま観測状態信号マのi次元分として。残る
次元の観測状態信号マについては、状態モデル回路13
からのモデル状態信号xMを適用する。状態モデル回路
13は、一定時間ごとに制御システム10のモデル同定
機能により同定された制御対象システムのダイナミクス
を示すパラメータ(ゲイン構成回路15から与えられる
。)から構成されており、制御対象システム3と同一の
制御人力Uを与えることにより制御対象システム3の状
態を表すと思われるモデル状態信号xMを出力する。
最適制御器14に内蔵される制御ゲインにはゲイン構成
回路15から一定時間ごとに与えられる。
回路15から一定時間ごとに与えられる。
最適制御器14はこの制御ゲインKを介して入力された
観Ap1状態信号マを制御人力Uに変換し出力する。
観Ap1状態信号マを制御人力Uに変換し出力する。
ゲイン構成回路15は、モデル同定回路2から一定時間
ごとに得られる制御対象システム3のダイナミクスを表
すパラメータ(φ、B)より、ある2次形式評価関数を
最小にするような安定化最適制御ゲインKを演算すると
共に、制御対象システム3の状態モデルφBを演算し、
それぞれにより一定時間ごとに最適制御器14及び状態
モデル回路13を更新する。
ごとに得られる制御対象システム3のダイナミクスを表
すパラメータ(φ、B)より、ある2次形式評価関数を
最小にするような安定化最適制御ゲインKを演算すると
共に、制御対象システム3の状態モデルφBを演算し、
それぞれにより一定時間ごとに最適制御器14及び状態
モデル回路13を更新する。
かくして、このよ、うな適応制御器11の構成によれば
、制御対象システム3のグイナミクスが変動した場合に
も、継続的に最適制御が可能な適応型最適制御が実現さ
れる。
、制御対象システム3のグイナミクスが変動した場合に
も、継続的に最適制御が可能な適応型最適制御が実現さ
れる。
ここで、適応型最適制御を実現する理論を以下で述べる
。
。
即ち、モデル同定回路2から得られる制御対象システム
のダイナミクスが次式、 )(j+1s*φxt+But =(1)Y
t −Cxt −(2)のような
離散形で表されるとする。ここで、x t+1(1=0
.1.2.− )は、t=t+iX△tにおける制御対
象システム3の状態を表すn次元ベクトル、utは制御
対象システム3に対する入力を表すm次元ベクトル、y
tは制御対象システム3の出力を表すr次元ベクトルで
あり、φ、B、C。
のダイナミクスが次式、 )(j+1s*φxt+But =(1)Y
t −Cxt −(2)のような
離散形で表されるとする。ここで、x t+1(1=0
.1.2.− )は、t=t+iX△tにおける制御対
象システム3の状態を表すn次元ベクトル、utは制御
対象システム3に対する入力を表すm次元ベクトル、y
tは制御対象システム3の出力を表すr次元ベクトルで
あり、φ、B、C。
はそれぞれnXn%nxm、rXn次元の定係数マトリ
クスである。このとき、次式、 J−Σ(x’ t Qxt +u’ t Rut )−
(3)IIO で表される2次形式評価関数Jを考える。ここで、Qは
半止定のnxn次元マトリクス、Rは止定のmXm次元
マトリクスで、オペレータが適当に選定する。いま(φ
、B)が可到達、即ち、rank [B 、 φB−
,φII−IB]=n −(4)及び、(Q)、φ
)が可観測、即ち、 rank[(Q’ ) ’ 、 φ′(Q’ ) ’
、 −−−−・−・・・、 (φ’)”(Qへ )’
)−n ・・・ (5)であれば、(3)式で表
される2次評価関数Jを最小にする制御入力11 tは
唯一に定まり、次式、ut −−Kxt
−(6)K−(R+B’ SB)”’ B’
SΦ ・・・(7)で与えられる。ここで、KはmX
nのマトリクスで表される安定化制御ゲインであり、S
は次式の離散型リカッチ方程式、 S−Q+Φ′ SΦ− Φ’ SB (R+B’ SB)”B’ SΦ・・・(
8) の唯−止定対称解を表すnXnのマトリクスである。即
ち、適応制御器11は内部の適応制御器14に(7)式
で表される安定化制御ゲインKを有し、(6)式を満足
するように、入力される状態xtを制御人力utに変換
し出力する。
クスである。このとき、次式、 J−Σ(x’ t Qxt +u’ t Rut )−
(3)IIO で表される2次形式評価関数Jを考える。ここで、Qは
半止定のnxn次元マトリクス、Rは止定のmXm次元
マトリクスで、オペレータが適当に選定する。いま(φ
、B)が可到達、即ち、rank [B 、 φB−
,φII−IB]=n −(4)及び、(Q)、φ
)が可観測、即ち、 rank[(Q’ ) ’ 、 φ′(Q’ ) ’
、 −−−−・−・・・、 (φ’)”(Qへ )’
)−n ・・・ (5)であれば、(3)式で表
される2次評価関数Jを最小にする制御入力11 tは
唯一に定まり、次式、ut −−Kxt
−(6)K−(R+B’ SB)”’ B’
SΦ ・・・(7)で与えられる。ここで、KはmX
nのマトリクスで表される安定化制御ゲインであり、S
は次式の離散型リカッチ方程式、 S−Q+Φ′ SΦ− Φ’ SB (R+B’ SB)”B’ SΦ・・・(
8) の唯−止定対称解を表すnXnのマトリクスである。即
ち、適応制御器11は内部の適応制御器14に(7)式
で表される安定化制御ゲインKを有し、(6)式を満足
するように、入力される状態xtを制御人力utに変換
し出力する。
因みに、安定化制御ゲインにとして(7)式で表される
ものを用いた場合、制御システム10が全体として安定
となるばかりでなく、低感度特性や大きなゲイン余裕を
もつといった、いわゆるロバスト性を有することが知ら
れており、制御系として優れた性質をもつこととなる。
ものを用いた場合、制御システム10が全体として安定
となるばかりでなく、低感度特性や大きなゲイン余裕を
もつといった、いわゆるロバスト性を有することが知ら
れており、制御系として優れた性質をもつこととなる。
さて、制御システム10の第2の機能であるモデル同定
機能は一定時間ごとに起動され、制御対象システム3の
ダイナミクスをモデルとして有するモデル同定回路2を
更新するようになされている。
機能は一定時間ごとに起動され、制御対象システム3の
ダイナミクスをモデルとして有するモデル同定回路2を
更新するようになされている。
このときモデル同定制御部1は以下のようにしてモデル
同定回路2に制御対象システム3のダイナミクスを実現
させる。
同定回路2に制御対象システム3のダイナミクスを実現
させる。
即ち、モデル同定機能動作時のモデル同定システムの構
成を示す第3図において、一定時間ごとにモデル同定機
能動作を開始させる制御回路4が、基準信号発生信号S
1を基準信号発生回路5に出力すると、基準信号発生回
路5は、基準信号REFを制御対象システム3に入力す
ると共に、モデル同定回路2に入力する。このとき、制
御対象システム3及びモデル同定回路2は、それぞれ基
準信号REPに対する応答である、応答信号I?ES及
びモデル応答信号17ESMを出力し、当該応答信号R
ES及びモデル応答信号RESMの差ERRが学習/判
定回路6に入力される。
成を示す第3図において、一定時間ごとにモデル同定機
能動作を開始させる制御回路4が、基準信号発生信号S
1を基準信号発生回路5に出力すると、基準信号発生回
路5は、基準信号REFを制御対象システム3に入力す
ると共に、モデル同定回路2に入力する。このとき、制
御対象システム3及びモデル同定回路2は、それぞれ基
準信号REPに対する応答である、応答信号I?ES及
びモデル応答信号17ESMを出力し、当該応答信号R
ES及びモデル応答信号RESMの差ERRが学習/判
定回路6に入力される。
学習/判定回路6は、制御回路4から学習/判定開始信
号S2を受けたとき、入力された誤差信号ERRを評価
する。そして、誤差信号ERRが十分少さいと判断され
た場合には、モデル同定回路2が学習が完了したとして
学習完了信号S3を制御回路4に出力する。これに対し
、誤差信号ERRが未だに大きいと判断された場合には
、モデル補正信号CORをモデル同定回路2に出力し、
例えばバックプロパゲーションの手法を用いてモデル同
定回路2の内部状態を補正する。
号S2を受けたとき、入力された誤差信号ERRを評価
する。そして、誤差信号ERRが十分少さいと判断され
た場合には、モデル同定回路2が学習が完了したとして
学習完了信号S3を制御回路4に出力する。これに対し
、誤差信号ERRが未だに大きいと判断された場合には
、モデル補正信号CORをモデル同定回路2に出力し、
例えばバックプロパゲーションの手法を用いてモデル同
定回路2の内部状態を補正する。
モデル同定回路2は、例えば第4図に示すようなニュー
ラルネットワークにより構成される。
ラルネットワークにより構成される。
即ち、入力層にm個のニューロンジ11、ν12゜・・
・、シ1.m、中間層にn個のニューロンジ21.ν2
2、・・・、シ2n、出力層に1個のニューロンジ31
.ν32、・・・、ν3rsを有する3層構造のネット
ワークで、m次元の学習基準信号REPX(rr +
、 =−、rf’i。
・、シ1.m、中間層にn個のニューロンジ21.ν2
2、・・・、シ2n、出力層に1個のニューロンジ31
.ν32、・・・、ν3rsを有する3層構造のネット
ワークで、m次元の学習基準信号REPX(rr +
、 =−、rf’i。
・・・、 rf’a)を受けたとき、r次元のモデル応
答信号RESM(031,−=、 03に、−、03r
)を出力する。
答信号RESM(031,−=、 03に、−、03r
)を出力する。
入力層のニューロンジ11(1≦l≦I)は人力された
学習基準信号rf’lをそのまま出力01j01i=r
fi(1≦I 5m) ・= (9)と
して中間層のニューロンジ21ν22・・・、ν2nに
送出する。
学習基準信号rf’lをそのまま出力01j01i=r
fi(1≦I 5m) ・= (9)と
して中間層のニューロンジ21ν22・・・、ν2nに
送出する。
中間層のニューロンジ2j(1≦j≦口)は入力net
2jとして次式、 (1≦j≦n) ・・・(10)を受は取る。
2jとして次式、 (1≦j≦n) ・・・(10)を受は取る。
(10)式において、W2jli(1≦i≦m)は入力
層のニューロンジ11の出力011に対する重みであり
、W2j2 (1≦j≦n)は中間層のニューロンジ2
1の出力021に対する重みである。
層のニューロンジ11の出力011に対する重みであり
、W2j2 (1≦j≦n)は中間層のニューロンジ2
1の出力021に対する重みである。
一般にW2j21≠0としているので、中間層のニュー
ロンジ2j (1≦j≦n)は入力層のみならず、自分
自身を含めて中間層の出力も入力として受は取ることに
なる。また、中間層のニューロンジ2jの出力02j(
1≦j≦n)は次式、 02j−f 2j(net2N
=・ (11)で表される。ここでf 2j (・)は
例えばs1gmoid関数を表す。
ロンジ2j (1≦j≦n)は入力層のみならず、自分
自身を含めて中間層の出力も入力として受は取ることに
なる。また、中間層のニューロンジ2jの出力02j(
1≦j≦n)は次式、 02j−f 2j(net2N
=・ (11)で表される。ここでf 2j (・)は
例えばs1gmoid関数を表す。
出力層のニューロンジ3k(1≦に≦「)は入力net
3にとして次式、 net3に一ΣW3に2j02j (1≦に≦r)−(
12)3為I を受は取る。
3にとして次式、 net3に一ΣW3に2j02j (1≦に≦r)−(
12)3為I を受は取る。
(12)式において、W3に2j (1≦j≦n)は中
間層のニューロンジ2jの出力02jに対する重みであ
る。−力出力層のニューロンジ3にの出力03k(l≦
に≦r)は次式、 03k −f3k(net3k) −(
1B )で表される。ここでf3k(・)は例えば51
g1oid関数である。
間層のニューロンジ2jの出力02jに対する重みであ
る。−力出力層のニューロンジ3にの出力03k(l≦
に≦r)は次式、 03k −f3k(net3k) −(
1B )で表される。ここでf3k(・)は例えば51
g1oid関数である。
いま、ベクトルx、x” 、us ySF2 (・)
、F3 (・)及びマトリクスφ、BSCを以下のよ
うに定義する。
、F3 (・)及びマトリクスφ、BSCを以下のよ
うに定義する。
x = [021,−102j、−・・、02n)’
eR”・・・(14) (以下、余白) X ” 1ml+ [net 21.−1net 2j、−・・、ne
t 2n] ’ E Rn・・・ (15) u = [rf’L 、・・・、rl’i ・・
・、r[’m]’−REFIER”
−(16)y −[031,−・・
、03に、−・・、03r]’−RESM(Rr
・・・ (17)F2
(・ ) − [f21(−) 、−f2j(−) −・・
、 f 2n (・ ) コ ′・・・ (
18) F3 (・ ) − [fll(−) 、−=f3k(−) ・・・
、 f 3r (・ ) コ ′・・・
(19) (以下、余白) (以下、余白) このとき、次式のような関係が得られる。ただし、X5
uSYに付随するFサフィックスtは、時刻tにおける
値を示し、同様にt+1は時刻を十Δt(△tは定数)
における値を示す。
eR”・・・(14) (以下、余白) X ” 1ml+ [net 21.−1net 2j、−・・、ne
t 2n] ’ E Rn・・・ (15) u = [rf’L 、・・・、rl’i ・・
・、r[’m]’−REFIER”
−(16)y −[031,−・・
、03に、−・・、03r]’−RESM(Rr
・・・ (17)F2
(・ ) − [f21(−) 、−f2j(−) −・・
、 f 2n (・ ) コ ′・・・ (
18) F3 (・ ) − [fll(−) 、−=f3k(−) ・・・
、 f 3r (・ ) コ ′・・・
(19) (以下、余白) (以下、余白) このとき、次式のような関係が得られる。ただし、X5
uSYに付随するFサフィックスtは、時刻tにおける
値を示し、同様にt+1は時刻を十Δt(△tは定数)
における値を示す。
X11t+1−mφXi +I3 ut
+++ (23)xt −F2 (x’ t)
−(24)y t −F 3 (Cx
t)−(25)F2 (・)、F3(・)が線形関
数であれば、式(23)、(24)、(25)は離散時
間システムの状態方程式と等価となる。F2 (・)
、F3 (・)として、例えば51gff1oid関
数を選んだ場合、バイアス点近接であれば十分線形であ
ると仮定できるので、結局モデル形式回路2は離散時間
システムのモデルとなることが可能である。
+++ (23)xt −F2 (x’ t)
−(24)y t −F 3 (Cx
t)−(25)F2 (・)、F3(・)が線形関
数であれば、式(23)、(24)、(25)は離散時
間システムの状態方程式と等価となる。F2 (・)
、F3 (・)として、例えば51gff1oid関
数を選んだ場合、バイアス点近接であれば十分線形であ
ると仮定できるので、結局モデル形式回路2は離散時間
システムのモデルとなることが可能である。
即ち、モデル同定回路2に対し、基準信号REFを時系
列的に与えてやることにより、応答信号RESを時系列
的に得られ、例えばパックプロパゲーションの手法を用
いて学習することにより、モデル同定回路2の内部状態
は、基準信号REF及び応答信号RESに対応する離散
時間システムのダイナミクスを実現することになる。基
準信号REFとしては、システムを表現するのに適して
いるM系列関数を用いるのが適当と思われる。
列的に与えてやることにより、応答信号RESを時系列
的に得られ、例えばパックプロパゲーションの手法を用
いて学習することにより、モデル同定回路2の内部状態
は、基準信号REF及び応答信号RESに対応する離散
時間システムのダイナミクスを実現することになる。基
準信号REFとしては、システムを表現するのに適して
いるM系列関数を用いるのが適当と思われる。
ここで、モデル同定回路2の内部状態を法定する要素は
、(18)〜(22)式で表されるマトリクスであるが
、これらは学習/判定回路6から送出されるモデル補正
信号COI?に基づいて修正される。代表的な修正方法
であるバックプロパゲーションでは、モデル補正信号C
ot?は2乗誤差を表す。
、(18)〜(22)式で表されるマトリクスであるが
、これらは学習/判定回路6から送出されるモデル補正
信号COI?に基づいて修正される。代表的な修正方法
であるバックプロパゲーションでは、モデル補正信号C
ot?は2乗誤差を表す。
因みに第4図のような構成のニューラルネットワークを
用いた場合、フィードフォワード型ニューラルネットワ
ークよりも広範囲のシステムが表現できることが知られ
ており、またフィードフォワード型ニューラルネットワ
ークで同等のものが実現し得たとしても、構成ユニット
であるニューロンの数が多く必要なことが知られている
。
用いた場合、フィードフォワード型ニューラルネットワ
ークよりも広範囲のシステムが表現できることが知られ
ており、またフィードフォワード型ニューラルネットワ
ークで同等のものが実現し得たとしても、構成ユニット
であるニューロンの数が多く必要なことが知られている
。
以上のように本発明によれば、制御対象同定方法として
中間ユニット層における各ユニットの出力が下層のみな
らず中間ユニット層自身にも入力されるように構成され
たニューラルネットワークを用いた手法を用いることに
より、未知のダイナミクスを有する種々の制御対象シス
テムに対して、常に制御対象を同定し、その同定モデル
を用いである2次評制関数を最小化する安定化制御ゲイ
ンを適用する適応型制御器を容易に実現し得る。
中間ユニット層における各ユニットの出力が下層のみな
らず中間ユニット層自身にも入力されるように構成され
たニューラルネットワークを用いた手法を用いることに
より、未知のダイナミクスを有する種々の制御対象シス
テムに対して、常に制御対象を同定し、その同定モデル
を用いである2次評制関数を最小化する安定化制御ゲイ
ンを適用する適応型制御器を容易に実現し得る。
なお、上述の実施例においては、最適制御器14に入力
する制御対象システム3の観測状態信号マとして、応答
出力y及び状態モデル回路13のモデル状態信号xMの
組合わせを用いたが、これに代え、オブザーバを用いて
応答出力y及び制御人力Uに基づいて状態Xを推定する
ようにしても良い。
する制御対象システム3の観測状態信号マとして、応答
出力y及び状態モデル回路13のモデル状態信号xMの
組合わせを用いたが、これに代え、オブザーバを用いて
応答出力y及び制御人力Uに基づいて状態Xを推定する
ようにしても良い。
[発明の効果]
上述したように本発明によれば、制御対象同定方法とし
て中間ユニット層における各ユニットの出力が下層のみ
ならず中間ユニット層自信にも人力されるように構成さ
れたニューラルネットワークを用いた手法を用いている
ので、未知のダイナミクスを有する種々の制御対象シス
テムに対して常にシステム同定を行いある評価関数を最
小化する安定化制御ゲインを更新じ適用する適応制御器
を容易に実現し得る。
て中間ユニット層における各ユニットの出力が下層のみ
ならず中間ユニット層自信にも人力されるように構成さ
れたニューラルネットワークを用いた手法を用いている
ので、未知のダイナミクスを有する種々の制御対象シス
テムに対して常にシステム同定を行いある評価関数を最
小化する安定化制御ゲインを更新じ適用する適応制御器
を容易に実現し得る。
第1図は本発明による最適制御器を適用した制御システ
ムの全体構成を示すブロック図、第2図はモデル同定モ
ードにおける制御システムの構成を示すブロック図、第
3図はモデル同定機能を説明するためのブロック図、第
4図はモデル同定回路の詳細構造を示す路線的系統図で
ある。 1・・・モデル同定制御部 2・・・モデル同定回路 3・・・制御対象システム 10・・・制御システム 11・・・適応制御器 12・・・状態合成回路 出願人 株式会社 東芝 代理人 弁理士 須 山 佐 − 第1図
ムの全体構成を示すブロック図、第2図はモデル同定モ
ードにおける制御システムの構成を示すブロック図、第
3図はモデル同定機能を説明するためのブロック図、第
4図はモデル同定回路の詳細構造を示す路線的系統図で
ある。 1・・・モデル同定制御部 2・・・モデル同定回路 3・・・制御対象システム 10・・・制御システム 11・・・適応制御器 12・・・状態合成回路 出願人 株式会社 東芝 代理人 弁理士 須 山 佐 − 第1図
Claims (1)
- 【特許請求の範囲】 未知のダイナミクスを有する制御対象システムに対し、
一定時間ごとに制御対象同定部によりモデル同定し、得
られたモデルに対し所定の評価関数を最小にするよう制
御ゲインを決定し、該制御ゲインにより前記制御対象シ
ステムを制御するように構成された適応制御器において
、 前記制御対象同定部が、 複数のユニット層から構成されるニューラルネットワー
クからなり、中間ユニット層の各ユニットの出力が下層
ユニット層と共に、該中間ユニット層自体にも入力され
るように構成されたモデル同定回路と、 前記制御対象システムに対し所定の基準入力信号を送出
し、該基準入力信号に対する前記制御対象システムから
のシステム応答信号を記憶すると共に、前記モデル同定
回路に対し前記基準入力信号を送出し、該基準入力信号
に対する前記モデル同定回路からのモデル応答信号を入
力し、かつ該モデル応答信号と前記システム応答信号と
の誤差に基づき前記モデル同定回路の内部状態を前記誤
差が減少するよう補正をするモデル同定制御部とを備え
、 前記補正を複数種類の前記基準入力信号について繰返し
行うことにより、前記モデル同定回路の内部状態が前記
制御対象システムのダイナミクスを実現するようにした
ことを特徴とする適応制御器。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1119447A JPH02299002A (ja) | 1989-05-12 | 1989-05-12 | 適応制御器 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1119447A JPH02299002A (ja) | 1989-05-12 | 1989-05-12 | 適応制御器 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH02299002A true JPH02299002A (ja) | 1990-12-11 |
Family
ID=14761624
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1119447A Pending JPH02299002A (ja) | 1989-05-12 | 1989-05-12 | 適応制御器 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH02299002A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0548391A (ja) * | 1991-01-23 | 1993-02-26 | Fujitsu Ltd | 適応等化器 |
| JPH05143108A (ja) * | 1991-11-20 | 1993-06-11 | Hitachi Ltd | プロセスの適応制御方法 |
-
1989
- 1989-05-12 JP JP1119447A patent/JPH02299002A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0548391A (ja) * | 1991-01-23 | 1993-02-26 | Fujitsu Ltd | 適応等化器 |
| JPH05143108A (ja) * | 1991-11-20 | 1993-06-11 | Hitachi Ltd | プロセスの適応制御方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Uykan et al. | Analysis of input-output clustering for determining centers of RBFN | |
| Fukumizu | Statistical active learning in multilayer perceptrons | |
| Rivals et al. | Nonlinear internal model control using neural networks: Application to processes with delay and design issues | |
| Tong et al. | Fuzzy adaptive sliding-mode control for MIMO nonlinear systems | |
| KR101935006B1 (ko) | 멀티 에이전트 시스템에 포함되는 추종 에이전트 및 이의 제어 방법 | |
| US5943660A (en) | Method for feedback linearization of neural networks and neural network incorporating same | |
| Yu et al. | Indirect adaptive control via parallel dynamic neural networks | |
| Ferreira et al. | Comparing recurrent networks for time-series forecasting | |
| Ahrns et al. | On-line learning with dynamic cell structures | |
| US6768927B2 (en) | Control system | |
| JPH02299002A (ja) | 適応制御器 | |
| JP2023502204A (ja) | クロスバー・アレイ構造を有するニューロモルフィック・デバイス | |
| EP1335320A2 (en) | Configuring learning petri nets | |
| Alihodzic et al. | Extreme learning machines for data classification tuning by improved bat algorithm | |
| Lima et al. | Fuzzy systems design via ensembles of ANFIS | |
| Gilmer et al. | Explaining the learning dynamics of direct feedback alignment | |
| Lamare et al. | Lyapunov techniques for stabilization of switched linear systems of conservation laws | |
| Saminathan et al. | Repetitive control design for switched neutral systems with input time‐delay | |
| Mkrttchian et al. | Application of neural network in sliding mode control | |
| Dogan et al. | Stable distributed adaptive systems for control of linear multiagent systems in the presence of heterogeneous actuator dynamics and unknown parameters | |
| Zhang et al. | Data-driven reinforcement learning for linear quadratic control of unknown systems over lossy channels | |
| Nikravesh et al. | Process control of nonlinear time variant processes via artificial neural network | |
| JPH0644207A (ja) | ニューラルネットワーク及びその構成方法 | |
| Garcia et al. | Adaptive stabilization of uncertain systems with model-based control and event-triggered feedback updates | |
| KR101790319B1 (ko) | 상호연결된 시간 지연 시스템의 최소 예측 기반 분산 제어를 위한 장치 및 방법 |