JPH0451372A - ニューロコンピュータを用いた動作認識装置 - Google Patents
ニューロコンピュータを用いた動作認識装置Info
- Publication number
- JPH0451372A JPH0451372A JP2161533A JP16153390A JPH0451372A JP H0451372 A JPH0451372 A JP H0451372A JP 2161533 A JP2161533 A JP 2161533A JP 16153390 A JP16153390 A JP 16153390A JP H0451372 A JPH0451372 A JP H0451372A
- Authority
- JP
- Japan
- Prior art keywords
- learning
- layer
- motion
- neurocomputer
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Processing (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[概要]
人間の3次元的で時系列的な1一つの動作を検出して動
作のもつ意味を認識するニューロコンピュータを用いた
動作認識装置に関し、 手話等の多種多様で個人差をもつ動作を正確に認識する
ことを目的とし、 データグローブ等から得られた1動作の時系列データか
ら学習データを生成して時系列データ処理構造を有する
ニューロコンピュータを学習させてネットワーク結合の
重みを求め、この重みを動作認識用のニューロコンピュ
ータに移植した後にデータグローブから得られた1動作
の時系列信号を入力して何の動作かを認識するように構
成する。
作のもつ意味を認識するニューロコンピュータを用いた
動作認識装置に関し、 手話等の多種多様で個人差をもつ動作を正確に認識する
ことを目的とし、 データグローブ等から得られた1動作の時系列データか
ら学習データを生成して時系列データ処理構造を有する
ニューロコンピュータを学習させてネットワーク結合の
重みを求め、この重みを動作認識用のニューロコンピュ
ータに移植した後にデータグローブから得られた1動作
の時系列信号を入力して何の動作かを認識するように構
成する。
[産業上の利用分野]
本発明は、手話等における3次元的な動きを時系列的に
検出して1つの動作のもつ意味を認識するニューロコン
ピュータを用いた動作認識装置に関する。
検出して1つの動作のもつ意味を認識するニューロコン
ピュータを用いた動作認識装置に関する。
人間とコンピュータとのマンマシンインタフェースにお
いて、人間からコンピュータへ情報を入力する手法とし
ては代表的なものとしてキーボードやマウスであるが、
これよりも機械を使わず人間の動作によってコンピュー
タに語りかけるほうがより自然であり、最近大変重要視
されてきている。
いて、人間からコンピュータへ情報を入力する手法とし
ては代表的なものとしてキーボードやマウスであるが、
これよりも機械を使わず人間の動作によってコンピュー
タに語りかけるほうがより自然であり、最近大変重要視
されてきている。
また最近、人間の手の形状、3次元位置を検出できるデ
ータグローブ、或いは人間のからだ全体の形状を検出で
きるボディスーツというセンサが開発されいる。従って
、これらのセンサーを用いることにより、人間の体の形
状、或いは動作を検出し、人間が今どういう動作をし、
何を言いたいのかを理解する装置ができれば極めて便利
である。
ータグローブ、或いは人間のからだ全体の形状を検出で
きるボディスーツというセンサが開発されいる。従って
、これらのセンサーを用いることにより、人間の体の形
状、或いは動作を検出し、人間が今どういう動作をし、
何を言いたいのかを理解する装置ができれば極めて便利
である。
この装置によって例えば手話の認識が可能となり、手話
を話す方と手話の分からない方とのコミュニケーション
を実現する。また、体の不自由な方が、この動作はこう
いう意味があると決めることにより、他の人に意思を告
げることができるなどが可能となる。更にまた、より自
然な人間にとって無理のないマンマシンインタフェース
を実現できる。
を話す方と手話の分からない方とのコミュニケーション
を実現する。また、体の不自由な方が、この動作はこう
いう意味があると決めることにより、他の人に意思を告
げることができるなどが可能となる。更にまた、より自
然な人間にとって無理のないマンマシンインタフェース
を実現できる。
[従来の技術]
従来のマンマシンインタフェースは、キーボード、マウ
ス、タブレットなどであり、これら操作装置を人間が使
うことでのみコンピュータに指示できる。しかし、これ
らの装置に慣れるには時間がかかり、また、使い易いも
のではない。
ス、タブレットなどであり、これら操作装置を人間が使
うことでのみコンピュータに指示できる。しかし、これ
らの装置に慣れるには時間がかかり、また、使い易いも
のではない。
一方、人間同志のコミュニケーションにあっては、相手
の動きからも今回をしているか、何をしたいのか等を理
解できるが、マンマシンインタフェースとして人間の動
きを認識して理解するものは、まだ世にあられれていな
い。
の動きからも今回をしているか、何をしたいのか等を理
解できるが、マンマシンインタフェースとして人間の動
きを認識して理解するものは、まだ世にあられれていな
い。
人間の形態を認識する方法として、手話における指文字
を例にとってみると、まず指の曲げ角度及び手のひねり
角度を検出し、この検出情報を使って手の形状を符号化
する規則を作り、この規則に基づいて検出情報に対し主
成分分析、クラスター分析を活用して手の形態を分類し
、認識するという方法である。しかし、この方法では認
識率が54%程度と実用認識レベルに至っていない。そ
こで、人間の形態を認識するためには、人間自身が、人
間の形態を符号化するために細かく規則を設定し、分類
し、認識するという方法が取られている。
を例にとってみると、まず指の曲げ角度及び手のひねり
角度を検出し、この検出情報を使って手の形状を符号化
する規則を作り、この規則に基づいて検出情報に対し主
成分分析、クラスター分析を活用して手の形態を分類し
、認識するという方法である。しかし、この方法では認
識率が54%程度と実用認識レベルに至っていない。そ
こで、人間の形態を認識するためには、人間自身が、人
間の形態を符号化するために細かく規則を設定し、分類
し、認識するという方法が取られている。
[発明が解決しようとする課題]
しかし、人間自身が形態を符号化するための規則を設定
し、分類する作業は大変面倒であり、なおかつ柔軟性に
欠け、人が変われば、符号化規則を設定し直すか、変更
、追加といったことをしなければならない。
し、分類する作業は大変面倒であり、なおかつ柔軟性に
欠け、人が変われば、符号化規則を設定し直すか、変更
、追加といったことをしなければならない。
そこで人間の神経細胞構造を似せて作ったニューラルネ
ットワークを使用したニューロコンピュータを動作認識
に使用することが考えられる。
ットワークを使用したニューロコンピュータを動作認識
に使用することが考えられる。
ところが動作認識には時間というものを考慮しなければ
ならず、それにはある時間間隔で動作を区切り、そのと
きの人間の形態データを収集し、それを時系列的に合わ
せたものが動作であるという仮定をたてなければならな
い。今までのニューロコンピュータは時間を考えていな
いため、動作を認識するためには、時系列データを扱え
るネットワーク構造に変換しなければならない。そのた
めには、ニューラルネットワーク自身をリカレント機能
を持つものにし、過去の履歴を保持できるようなものと
する必要がある。
ならず、それにはある時間間隔で動作を区切り、そのと
きの人間の形態データを収集し、それを時系列的に合わ
せたものが動作であるという仮定をたてなければならな
い。今までのニューロコンピュータは時間を考えていな
いため、動作を認識するためには、時系列データを扱え
るネットワーク構造に変換しなければならない。そのた
めには、ニューラルネットワーク自身をリカレント機能
を持つものにし、過去の履歴を保持できるようなものと
する必要がある。
第12図はりカレント機能を実現する従来のニューラル
ネットワーク構成を示し、通常のニューラルネットワー
クを構成する入力層22、かくれ層24及び出力層26
に加え、入力層22と並列に新たにコンテキスト層28
が設けられる。コンテキスト層28はかくれ層24と同
じ数のユニットを備え、全ユニットがかくれ層24のユ
ニットの1つ1つに結合され、かくれ層22の出力値を
コピーすることができる(1988年II月Ca+ne
gieMellon University 発行論
文 j ENCODINGSEQUENTIAL 5T
RIICTURE IN SIMPLE RECURR
ENTNHWORKS J参照)。
ネットワーク構成を示し、通常のニューラルネットワー
クを構成する入力層22、かくれ層24及び出力層26
に加え、入力層22と並列に新たにコンテキスト層28
が設けられる。コンテキスト層28はかくれ層24と同
じ数のユニットを備え、全ユニットがかくれ層24のユ
ニットの1つ1つに結合され、かくれ層22の出力値を
コピーすることができる(1988年II月Ca+ne
gieMellon University 発行論
文 j ENCODINGSEQUENTIAL 5T
RIICTURE IN SIMPLE RECURR
ENTNHWORKS J参照)。
リカレント型ニューラルネットワークのアルゴリズムは
、次のようになる。
、次のようになる。
[時刻t = 1 ]
最初の時刻1−1でデータが入力層22に入り、このと
きコンテキスト層28の出力値は0にセットされており
、 入力層−コンテキスト層28千入力層22としてかくれ
層24及び出力層26が動作する。
きコンテキスト層28の出力値は0にセットされており
、 入力層−コンテキスト層28千入力層22としてかくれ
層24及び出力層26が動作する。
ここでコンテキスト層28と入力層22を合せて大入力
層という。
層という。
ネットワーク出力が得られたら最終的に、かくれ層24
の出力値をコンテキスト総28にそのままコピーする。
の出力値をコンテキスト総28にそのままコピーする。
[時刻t−2]
次の時刻t=2で次のデータが入力層22に入り、前回
のかくれ層24の出力値をコピーしているコンテキスト
層28と加えた大入力層の出力に基づくネットワーク動
作が行われる。
のかくれ層24の出力値をコピーしているコンテキスト
層28と加えた大入力層の出力に基づくネットワーク動
作が行われる。
以後の時系列データの入力については時刻t2(!l:
同じ処理となる。勿論、1つの動作を現わす時系列デー
タの入力が終了して次に他の動作の時系列データが入力
する際には、コンテキスト層28は再び0にセットされ
る。
同じ処理となる。勿論、1つの動作を現わす時系列デー
タの入力が終了して次に他の動作の時系列データが入力
する際には、コンテキスト層28は再び0にセットされ
る。
しかし、第12図のりカレント型ニューラルネットワー
クにあっては、過去の履歴を保持できる機能を有するが
、同時に過去の履歴を忘れ易く、ごく最近のデータに大
きく依存しやすい問題点が1.2 指摘されており、時系列的に得られたデータの収集して
合わせたものとしての動作認識に問題を残している。
クにあっては、過去の履歴を保持できる機能を有するが
、同時に過去の履歴を忘れ易く、ごく最近のデータに大
きく依存しやすい問題点が1.2 指摘されており、時系列的に得られたデータの収集して
合わせたものとしての動作認識に問題を残している。
本発明は、このような従来の問題点に鑑みてなされたも
ので、手話等の多種多様で個人差をもつ動作を正確に認
識できるニューロコンピュータを用いた動作認識装置を
提供することを目的とする。
ので、手話等の多種多様で個人差をもつ動作を正確に認
識できるニューロコンピュータを用いた動作認識装置を
提供することを目的とする。
また本発明は、従来のりカレント型ニューラルネートワ
ークのもつ過去の履歴を忘れ安く最近のデータに依存し
易い問題を解決して認識率を向上できるニューロコンピ
ュータを用いた動作認識装置を提供することを目的とす
る。
ークのもつ過去の履歴を忘れ安く最近のデータに依存し
易い問題を解決して認識率を向上できるニューロコンピ
ュータを用いた動作認識装置を提供することを目的とす
る。
[課題を解決するための手段]
第1図は本発明の原理説明図である。
本発明は、コンピュータ等への指示を人間の動作で与え
るシステムにおいて、 手、指、腕等の人間の3次元的且時系列的な動きを測定
して時系列測定データとして出力する動作測定部1−0
と 動作測定部10から得られた1動作を示す入力時系列デ
ータとこの入力時系列データに対する教師信号から成る
学習データを生成する学習データ生成部14と、学習デ
ータ生成部]4の学習データを使用してネットワークの
結合の重みを学習させる時系列データ処理構造を有する
第1ニューロコンピュータi 6−1−を備えた動作学
習部1−2と;動作学習部1−2による学習が済んだ状
態で前記第1ニューロコンピュータ1.6−1がら得ら
れたネットワークの結合の重みを記憶する重み記憶部1
8と; 時系列データ処理構造を有する第2のニューロコンピュ
ータ16−2を備え、重み記憶部18に記憶されたネッ
トワークの結合の重みを第2ニューロコンピュータ16
−2に設定した後に動作測定部10からの時系列データ
を入力して動作を認識する動作認識部20と; を設けたことを特徴とする。
るシステムにおいて、 手、指、腕等の人間の3次元的且時系列的な動きを測定
して時系列測定データとして出力する動作測定部1−0
と 動作測定部10から得られた1動作を示す入力時系列デ
ータとこの入力時系列データに対する教師信号から成る
学習データを生成する学習データ生成部14と、学習デ
ータ生成部]4の学習データを使用してネットワークの
結合の重みを学習させる時系列データ処理構造を有する
第1ニューロコンピュータi 6−1−を備えた動作学
習部1−2と;動作学習部1−2による学習が済んだ状
態で前記第1ニューロコンピュータ1.6−1がら得ら
れたネットワークの結合の重みを記憶する重み記憶部1
8と; 時系列データ処理構造を有する第2のニューロコンピュ
ータ16−2を備え、重み記憶部18に記憶されたネッ
トワークの結合の重みを第2ニューロコンピュータ16
−2に設定した後に動作測定部10からの時系列データ
を入力して動作を認識する動作認識部20と; を設けたことを特徴とする。
ここで、動作学習部12に設けられた時系列データ処理
構造を有する第1ニューロコンピュータ16−1は、 1又は複数の時系列データを並列的に順次入力する複数
ユニットを備えた入力層22と;入力層22の全てのユ
ニットと結合するユニットを複数備えたかくれ層24と
; かくれ層24の全てのユニットと結合されるユニットを
複数備えた出力層26と; 人力層22と並列に設けられ、かくれ層24と同じ数の
ユニットを備えると共にユニットの全てをかくれ層24
のユニットの1つ1つに結合したコンテキスト層28と
; を備える。
構造を有する第1ニューロコンピュータ16−1は、 1又は複数の時系列データを並列的に順次入力する複数
ユニットを備えた入力層22と;入力層22の全てのユ
ニットと結合するユニットを複数備えたかくれ層24と
; かくれ層24の全てのユニットと結合されるユニットを
複数備えた出力層26と; 人力層22と並列に設けられ、かくれ層24と同じ数の
ユニットを備えると共にユニットの全てをかくれ層24
のユニットの1つ1つに結合したコンテキスト層28と
; を備える。
その学習時のアルゴリズムは、
■最初の時系列入力パターンによる重み学習時にはコン
テキスト層28のユニットに出力値Oをセットし、入力
層22にコンテキスト層28を加えた層を入力層として
重み学習を実行し、■2番目以降の時系列入力パターン
による重み学習時には、前回のかくれ層24の出力値に
所定の履歴係数を乗算した値をコンテキスト層28にコ
ピーして同様に重み学習を実行する。
テキスト層28のユニットに出力値Oをセットし、入力
層22にコンテキスト層28を加えた層を入力層として
重み学習を実行し、■2番目以降の時系列入力パターン
による重み学習時には、前回のかくれ層24の出力値に
所定の履歴係数を乗算した値をコンテキスト層28にコ
ピーして同様に重み学習を実行する。
また動作認識部20の時系列データ処理構造を有する第
2ニューロコンピュータ16−2は、第1ニューロコン
ピュータと同様に、入力層22、かくれ層24、出力層
26、コンテキスト層28を備え、そのアルゴリズムは
、 ■動作測定部10からの最初の時系列データの入力時に
はコンテキスト層28のユニットに出力値0をセットし
、入力層22にコンテキスト層28を加えた層を入力層
として動作し、 ■2番目以降の時系列データの入力時には、前回のかく
れ層24の出力値に所定の履歴係数を乗算した値をコン
テキスト層28にコピーして同様に動作する。
2ニューロコンピュータ16−2は、第1ニューロコン
ピュータと同様に、入力層22、かくれ層24、出力層
26、コンテキスト層28を備え、そのアルゴリズムは
、 ■動作測定部10からの最初の時系列データの入力時に
はコンテキスト層28のユニットに出力値0をセットし
、入力層22にコンテキスト層28を加えた層を入力層
として動作し、 ■2番目以降の時系列データの入力時には、前回のかく
れ層24の出力値に所定の履歴係数を乗算した値をコン
テキスト層28にコピーして同様に動作する。
一方、動作学習部12に設けた学習データ生成部14は
、 1動作当りの時系列データを正規化する第1手段と; 第1手段で得られた正規化時系列データにより認識され
る動作を示す教師信号を生成する第2手段と; バックプロパゲーション法による重み学習に使用する学
習パラメータを設定する第3手段と;第1乃至第3手段
で得られた正規化時系列データ、教師信号、学習パラメ
ータを学習データとして格納する第4手段と; を備える。ここで前記第3手段は、バックプロパゲーシ
ョン法に使用する学習パラメータとしてラニングレート
α及びモーメンタムηの多値を設定する。
、 1動作当りの時系列データを正規化する第1手段と; 第1手段で得られた正規化時系列データにより認識され
る動作を示す教師信号を生成する第2手段と; バックプロパゲーション法による重み学習に使用する学
習パラメータを設定する第3手段と;第1乃至第3手段
で得られた正規化時系列データ、教師信号、学習パラメ
ータを学習データとして格納する第4手段と; を備える。ここで前記第3手段は、バックプロパゲーシ
ョン法に使用する学習パラメータとしてラニングレート
α及びモーメンタムηの多値を設定する。
更に本発明の動作測定部10は、人間の時系列的な動作
を検出する複数のセンサを備えたデータグローブ又はボ
ディスーツを使用する。
を検出する複数のセンサを備えたデータグローブ又はボ
ディスーツを使用する。
[作用]
このような構成を備えた本発明によれば次の作用が得ら
れる。
れる。
まず、コンピュータに指示を与えるときに面倒な操作器
具は必要とせず、人間の動作を検出するためにデータグ
ローブやボディースーツを着用して動作を入力し、従っ
て、操作方法を取得する必要は全くない。
具は必要とせず、人間の動作を検出するためにデータグ
ローブやボディースーツを着用して動作を入力し、従っ
て、操作方法を取得する必要は全くない。
動作の測定により得られた時系列データは動作学習部に
送られ、時系列処理構造を有するニューロコンピュータ
に動作測定部から送られてくるデータの組で成る時系列
データが、何の動作かを学習すせる。ニューロコンピュ
ータは入出カバターンを与えるだけで、そのデータの特
長を自動的に抽出し、分類するという自己組織化の能力
を持っている。つまり、ニューロコンピュータを用いる
ことで、人間自身が、分類規則を作って与え、分類する
という非常に面倒臭い過程がなくなる。また、ニューロ
コンピュータは、学習していないデータに対しても柔軟
に対応できることから、人が変われば、規則を設定し直
さなければならないことがなくなる。
送られ、時系列処理構造を有するニューロコンピュータ
に動作測定部から送られてくるデータの組で成る時系列
データが、何の動作かを学習すせる。ニューロコンピュ
ータは入出カバターンを与えるだけで、そのデータの特
長を自動的に抽出し、分類するという自己組織化の能力
を持っている。つまり、ニューロコンピュータを用いる
ことで、人間自身が、分類規則を作って与え、分類する
という非常に面倒臭い過程がなくなる。また、ニューロ
コンピュータは、学習していないデータに対しても柔軟
に対応できることから、人が変われば、規則を設定し直
さなければならないことがなくなる。
動作認識の学習が済むと、学習結果から得られたネット
ワークの結合の重みを取出し、動作認識用のニューロコ
ンピュータに移植する。動作認識用のニューロコンピュ
ータも時系列データ処理構造により過去の履歴を保持で
き、1時刻のデータのみを見て今回をしたかを認識する
のではなく、過去の動作、即ち、今までの1時刻ごとの
データの積み重ねを考慮しながら、今のデータと照らし
合わせ、最終的に何の動作かを判断する。
ワークの結合の重みを取出し、動作認識用のニューロコ
ンピュータに移植する。動作認識用のニューロコンピュ
ータも時系列データ処理構造により過去の履歴を保持で
き、1時刻のデータのみを見て今回をしたかを認識する
のではなく、過去の動作、即ち、今までの1時刻ごとの
データの積み重ねを考慮しながら、今のデータと照らし
合わせ、最終的に何の動作かを判断する。
このようなニューロコンピュータを用いた動作認識によ
れば、学習によって確立された内部構造(ネットワーク
の結合の重み)を保持するで、学習済みデータに対する
認識結果の保証は勿論のこと、学習していないデータに
対してもそれなりの答を出すことができ、柔軟性に富む
。
れば、学習によって確立された内部構造(ネットワーク
の結合の重み)を保持するで、学習済みデータに対する
認識結果の保証は勿論のこと、学習していないデータに
対してもそれなりの答を出すことができ、柔軟性に富む
。
更に本発明の時系列データ処理構造を有するニューロコ
ンピュータにあっては、隠れ層の出力値をコンテキスト
層にそのままコピーするのではなく、ある履歴係数をか
け1時刻前の影響を少なくし、ごく最近のデータに依存
し易いという問題を解決する。
ンピュータにあっては、隠れ層の出力値をコンテキスト
層にそのままコピーするのではなく、ある履歴係数をか
け1時刻前の影響を少なくし、ごく最近のデータに依存
し易いという問題を解決する。
[実施例]
第2図は本発明の一実施例を示した実施例構成図である
。
。
第2図において、本発明のニューロコンピュータを用い
た動作認識装置は動作測定部1−0、動作学習部1−2
、重み記憶部及び動作認識部20で構成される。動作測
定部1−0は手、指、腕等の人間的な3次元的な動きを
ある一定時間毎に測定して時系列データとして出力する
測定機能を有する。
た動作認識装置は動作測定部1−0、動作学習部1−2
、重み記憶部及び動作認識部20で構成される。動作測
定部1−0は手、指、腕等の人間的な3次元的な動きを
ある一定時間毎に測定して時系列データとして出力する
測定機能を有する。
具体的には第3図に示すように複数のセンサを備えたデ
ータグローブやボディスーツ等の人体の動作部分に装着
できるものを使用し、手話等における手の動きを、例え
ばデータグローブのセンサで一定時間毎に検出して時系
列データとして出力する。例えばデータグローブを使用
して手話の際の動きを測定した場合には、10本の指の
曲げ角度、3次元的な位置座標(x、 y、 z)
、手のひねり角度等が一定時間毎に並列的に検出されて
順次−連の並列データで成る時系列データとして出力さ
れる。
ータグローブやボディスーツ等の人体の動作部分に装着
できるものを使用し、手話等における手の動きを、例え
ばデータグローブのセンサで一定時間毎に検出して時系
列データとして出力する。例えばデータグローブを使用
して手話の際の動きを測定した場合には、10本の指の
曲げ角度、3次元的な位置座標(x、 y、 z)
、手のひねり角度等が一定時間毎に並列的に検出されて
順次−連の並列データで成る時系列データとして出力さ
れる。
再び第2図を参照するに、動作学習部12は、学習デー
タ生成部14と時系列データ処理構造を有する第1ニュ
ーロコンピュータ16−1で構成される。学習データ生
成部14は動作測定部10から得られた1つの動作を示
す入力時系列データと、この入力時系列データから認識
される動作を示す教師信号、具体的には動作パターンと
で成る学習データを各動作毎に生成する。この学習デー
タ生成部14の詳細は第4図に示される。
タ生成部14と時系列データ処理構造を有する第1ニュ
ーロコンピュータ16−1で構成される。学習データ生
成部14は動作測定部10から得られた1つの動作を示
す入力時系列データと、この入力時系列データから認識
される動作を示す教師信号、具体的には動作パターンと
で成る学習データを各動作毎に生成する。この学習デー
タ生成部14の詳細は第4図に示される。
第4図において、動作学習部12に設けられた学習デー
タ生成部1−4では次の処理過程■〜■を通じて学習デ
ータを生成する。
タ生成部1−4では次の処理過程■〜■を通じて学習デ
ータを生成する。
処理過程■。
まず動作測定部10で測定された1つの動作を示す時系
列信号を学習データとして取込む。
列信号を学習データとして取込む。
処理過程■:
次に生データとしての時系列学習データをニューロコン
ピュータで処理可能な正規化された0〜1の値に変換す
る。即ち生データとしては指の曲げ角度、3次元的位置
座標、手のひねり角度であるが、このようなデータでは
ニューロコンピュータで扱うことができないため、各デ
ータを正規化してO〜1の範囲内の値とする。これを学
習データAとする。
ピュータで処理可能な正規化された0〜1の値に変換す
る。即ち生データとしては指の曲げ角度、3次元的位置
座標、手のひねり角度であるが、このようなデータでは
ニューロコンピュータで扱うことができないため、各デ
ータを正規化してO〜1の範囲内の値とする。これを学
習データAとする。
処理過程■;
学習データの正規化が終了したならば1−っの動作で得
られた時系列正規化データで与えられる動作が何の動作
であるかを示す教師信号、例えば3ビツトの教師ビット
パターンを生成して加え、正規化された時系列入力デー
タと教師信号の組合せで成る学習データBを生成する。
られた時系列正規化データで与えられる動作が何の動作
であるかを示す教師信号、例えば3ビツトの教師ビット
パターンを生成して加え、正規化された時系列入力デー
タと教師信号の組合せで成る学習データBを生成する。
処理過程■;
続いて学習データBに対しバックプロパゲーション法に
従ったニューロコンピュータの学習処理で使用する学習
パラメータの値を決め、正規化された入力時系列データ
と教師信号で成る学習データBに学習パラメータを加え
た学習データCを生成する。学習データとして設定する
バックプロパゲーション法における学習パラメータとし
ては、重み更新の演算に使用されるラーニングレートη
とモーメンタムαの2つとする。
従ったニューロコンピュータの学習処理で使用する学習
パラメータの値を決め、正規化された入力時系列データ
と教師信号で成る学習データBに学習パラメータを加え
た学習データCを生成する。学習データとして設定する
バックプロパゲーション法における学習パラメータとし
ては、重み更新の演算に使用されるラーニングレートη
とモーメンタムαの2つとする。
第5図は第4図の学習データ生成部14により最終的に
生成された学習データCを1つの動作についてテーブル
データとして示したもので、入力データは時刻t1〜t
5の5つの時刻に分割された時系列データであり、腕の
曲げ角度10データ、3次元位置3データ、手のひねり
角度3データで構成される。この時系列的な入力データ
については、その動作を示す教師信号、即ち教師ビット
パターン001が設定され、更に入力データと教師信号
を用いた学習の際に使用される学習パラメータとしてラ
ーニングレートη及びモーメンタムαのそれぞれが設定
されている。
生成された学習データCを1つの動作についてテーブル
データとして示したもので、入力データは時刻t1〜t
5の5つの時刻に分割された時系列データであり、腕の
曲げ角度10データ、3次元位置3データ、手のひねり
角度3データで構成される。この時系列的な入力データ
については、その動作を示す教師信号、即ち教師ビット
パターン001が設定され、更に入力データと教師信号
を用いた学習の際に使用される学習パラメータとしてラ
ーニングレートη及びモーメンタムαのそれぞれが設定
されている。
尚、第4図の学習データ生成部14にあっては、処理過
程■〜■においては予め測定された複数の動作について
の学習データを各過程でそれぞれ生成してから次の過程
に進む処理を行うようになる。
程■〜■においては予め測定された複数の動作について
の学習データを各過程でそれぞれ生成してから次の過程
に進む処理を行うようになる。
再び第2図を参照するに、第4図に示すようにして生成
された学習データ生成部14の学習データは第1ニュー
ロコンピュータ16−1に与えられ、時系列入力データ
に対し予め定めた動作であることを認識できるようにネ
ットワークの結合の重みを学習させる。
された学習データ生成部14の学習データは第1ニュー
ロコンピュータ16−1に与えられ、時系列入力データ
に対し予め定めた動作であることを認識できるようにネ
ットワークの結合の重みを学習させる。
第1ニューロコンピュータ16−1は過去の履歴を保持
できるリカレント機能を持っており、従って1つの動作
を示す時系列データを入力してその集積結果から何の動
作であるかを認識することができる。
できるリカレント機能を持っており、従って1つの動作
を示す時系列データを入力してその集積結果から何の動
作であるかを認識することができる。
このリカレント機能を備えた第1ニューロコンピュータ
16−1は第6図に示すネットワーク構成を有する。
16−1は第6図に示すネットワーク構成を有する。
第6図において、入力層22、かくれ層24及び出力層
26で成る多層ネットワーク構造は通常のニューラルネ
ットワークと同じであるが、リカレント機能を持たせる
ために入力層22と並列にコンテキスト層28を設けて
いる。コンテキスト層28はかくれ層24と同じ数のユ
ニット構成を持ち、入力層22と同様、コンテキスト層
28のユニットの全てをかくれ層24のユニットの1つ
1つに結合している。コンテキスト層28は最初の時系
列データの入力時には0にセットされているが、2回目
以降の時系列データの入力時にはがくれ層24の出力値
がコピーされており、入力層22とコンテキスト層28
を1つの入力層、即ち大入力層とし、かくれ層24及び
出力層26の処理が行われる。
26で成る多層ネットワーク構造は通常のニューラルネ
ットワークと同じであるが、リカレント機能を持たせる
ために入力層22と並列にコンテキスト層28を設けて
いる。コンテキスト層28はかくれ層24と同じ数のユ
ニット構成を持ち、入力層22と同様、コンテキスト層
28のユニットの全てをかくれ層24のユニットの1つ
1つに結合している。コンテキスト層28は最初の時系
列データの入力時には0にセットされているが、2回目
以降の時系列データの入力時にはがくれ層24の出力値
がコピーされており、入力層22とコンテキスト層28
を1つの入力層、即ち大入力層とし、かくれ層24及び
出力層26の処理が行われる。
このような時系列データの2番目以降におけるコンテキ
スト層28に対する前回のかくれ層24の出力のコピー
につき、第12図に示した従来のりカレント型ニューラ
ルネットワークにあってはかくれ層24の出力値をその
ままコピーしているが、本発明のりカレント型ニューラ
ルネットワークにあっては、かくれ層24の出力値に所
定の履歴係数Kを乗算した値をコピーし、履歴係数Kを
1以下の値とすることで1時刻前の影響を少なくし、ご
く最近のデータに依存しやすいというリカレント型のニ
ューラルネットワークの問題を解決している。
スト層28に対する前回のかくれ層24の出力のコピー
につき、第12図に示した従来のりカレント型ニューラ
ルネットワークにあってはかくれ層24の出力値をその
ままコピーしているが、本発明のりカレント型ニューラ
ルネットワークにあっては、かくれ層24の出力値に所
定の履歴係数Kを乗算した値をコピーし、履歴係数Kを
1以下の値とすることで1時刻前の影響を少なくし、ご
く最近のデータに依存しやすいというリカレント型のニ
ューラルネットワークの問題を解決している。
第6図のネットワーク構成を持つ第1ニューロコンピュ
ータにおけるアルゴリズムは、例えば学習用の時系列デ
ータが時刻t1〜t5の5つに時間的に分かれて入力す
るものとすると、■最初の時刻t1の時系列入力パター
ンによる重み学習時には、コンテキスト層28の各ユニ
ットに出力値0をセットし、入力層22にコンテキスト
層28を加えた層を入力層(大入力層)として重み学習
を実行する。
ータにおけるアルゴリズムは、例えば学習用の時系列デ
ータが時刻t1〜t5の5つに時間的に分かれて入力す
るものとすると、■最初の時刻t1の時系列入力パター
ンによる重み学習時には、コンテキスト層28の各ユニ
ットに出力値0をセットし、入力層22にコンテキスト
層28を加えた層を入力層(大入力層)として重み学習
を実行する。
■時刻t2以降の時系列入力パターンによる重み学習時
には、前回のかくれ層24の出力値に所定の履歴係数K
を乗算した値をコンテキスト層28にコピーして同様に
重み学習を実行する。
には、前回のかくれ層24の出力値に所定の履歴係数K
を乗算した値をコンテキスト層28にコピーして同様に
重み学習を実行する。
勿論、1つの動作を示す時刻t1〜t5の時系列データ
による学習が終了して次の動作の時系列データを入力し
て学習する際には、当然にコンテキスト層28は出力値
Oの状態にセットされる。
による学習が終了して次の動作の時系列データを入力し
て学習する際には、当然にコンテキスト層28は出力値
Oの状態にセットされる。
再び第2図を参照するに、動作学習部12の学習データ
生成部14で生成された学習データに基づき第1ニュー
ロコンピュータ16−1の学習が実行され、教師信号と
ネットワーク出力との誤差がある値に収束したならば学
習終了を判定し、その時、第1ニューロコンピュータ1
6−1のネットワークの結合の重みを取出して重み記憶
部18に格納する。即ち、重み記憶部1−8は動作学習
部12で1.つの動作毎の学習が終了すると各動作毎に
得られたネットワークの結合の重みを記憶するようにな
る。
生成部14で生成された学習データに基づき第1ニュー
ロコンピュータ16−1の学習が実行され、教師信号と
ネットワーク出力との誤差がある値に収束したならば学
習終了を判定し、その時、第1ニューロコンピュータ1
6−1のネットワークの結合の重みを取出して重み記憶
部18に格納する。即ち、重み記憶部1−8は動作学習
部12で1.つの動作毎の学習が終了すると各動作毎に
得られたネットワークの結合の重みを記憶するようにな
る。
次にバックプロパゲーション法によるニューロコンピュ
ータの学習原理を説明する。
ータの学習原理を説明する。
バックプロパゲーション法を適用するネットワークは、
第8図に示すように多層ネットワークであり、各層は多
くのユニットで構成されており、各ユニットは互いにあ
る重みで結合されている。
第8図に示すように多層ネットワークであり、各層は多
くのユニットで構成されており、各ユニットは互いにあ
る重みで結合されている。
このネットワークに入力パターンと、望ましい出カバタ
ーンの組を与えることによって、ネットワークの重みを
学習させることができる。
ーンの組を与えることによって、ネットワークの重みを
学習させることができる。
学習は以下のように進められる。ネットワークに成る入
力パターンを与え、出力を得る。その出力が正しくなけ
れば、正しい又は望ましい出力値(教師信号)をネット
ワークに教える。すると、ネットワークは正しい出力と
実際の出力値の差が減少するように、ネットワークの内
部構造(結合の重み)を調整する。これを何度も繰り返
すことによって、ネットワークは成る入出力関係を満た
ずような重みを、自動的に学習していくのである。
力パターンを与え、出力を得る。その出力が正しくなけ
れば、正しい又は望ましい出力値(教師信号)をネット
ワークに教える。すると、ネットワークは正しい出力と
実際の出力値の差が減少するように、ネットワークの内
部構造(結合の重み)を調整する。これを何度も繰り返
すことによって、ネットワークは成る入出力関係を満た
ずような重みを、自動的に学習していくのである。
この学習アルゴリズムをバックプロパゲーション法とい
う。
う。
このようにして学習したネットワークを用いると、学習
させた入力パターンについては教示した正しい出力を返
すが、更に学習させていない入力パターンについても学
習した入出カバターンを補間した出カバターンを返す。
させた入力パターンについては教示した正しい出力を返
すが、更に学習させていない入力パターンについても学
習した入出カバターンを補間した出カバターンを返す。
これが、ニューラルネットの大きな特徴となっている。
以下に、この学習原理を詳細に説明する。
まず学習対象となるニューラルネットワークは多層ネッ
トワーク構造になっている。各層は多くのユニットで構
成されており、各ユニット間には、各々結合の重みWが
定義される。各ユニットは以下に示すようにしてネット
ワークの出力値を計算する。
トワーク構造になっている。各層は多くのユニットで構
成されており、各ユニット間には、各々結合の重みWが
定義される。各ユニットは以下に示すようにしてネット
ワークの出力値を計算する。
第7図に示すように、あるユニットが複数のユニットか
ら入力を受けた場合、その総和に各ユニットの閾値θを
加えたものが、入力値netになる。
ら入力を受けた場合、その総和に各ユニットの閾値θを
加えたものが、入力値netになる。
net−Σw、、O,十〇
Wt ・ユニットU からユニットUlへの結合の重
み O5:ユニットU、の出力 ユニットの出力値はこの入力の総和netに、活性化関
数を適用して計算される。活性化関数には微分可能な非
線型関数であるシグモイド関数を用いると、ユニットU
、の出力値O1はOr =1−/ (1−+exp(−
netl) )になる。
み O5:ユニットU、の出力 ユニットの出力値はこの入力の総和netに、活性化関
数を適用して計算される。活性化関数には微分可能な非
線型関数であるシグモイド関数を用いると、ユニットU
、の出力値O1はOr =1−/ (1−+exp(−
netl) )になる。
バックプロパゲーション法で用いるネットワークは、−
船釣には多層のネットワークであるが、ここでは通常よ
く用いられる、第8図に示すような3層のネットワーク
の場合について述べる。3つの層は入力層22、隠れ層
24、出力層26と呼ばれており、各層は多くのユニッ
トて構成される。隠れ層24の各ユニットは、入力層2
2の全てのユニットと結合している。出力層26の各ユ
ニットは、隠れ層24の全てのユニットと結合している
。各層内での結合は無い。
船釣には多層のネットワークであるが、ここでは通常よ
く用いられる、第8図に示すような3層のネットワーク
の場合について述べる。3つの層は入力層22、隠れ層
24、出力層26と呼ばれており、各層は多くのユニッ
トて構成される。隠れ層24の各ユニットは、入力層2
2の全てのユニットと結合している。出力層26の各ユ
ニットは、隠れ層24の全てのユニットと結合している
。各層内での結合は無い。
入力層22の各ユニットには、ネットワークへの入力デ
ータが与えられる。
ータが与えられる。
従って、隠れ層24の各ユニットの出力値1〕は、ne
t、=ΣW l k d k+θ+ (1
)h + = 1. / (]−+exp(−net、
) ) (2)dk :]c番目の入カユニ
ットの出力り、:j番目の隠れユニットの出力値 W 1y ; l(番目の入カニニットと、j番目の隠
れユニット間の結合の重み θ、=j番目の隠れユニットの閾値 になる。
t、=ΣW l k d k+θ+ (1
)h + = 1. / (]−+exp(−net、
) ) (2)dk :]c番目の入カユニ
ットの出力り、:j番目の隠れユニットの出力値 W 1y ; l(番目の入カニニットと、j番目の隠
れユニット間の結合の重み θ、=j番目の隠れユニットの閾値 になる。
また、出力層の各ユニットの出力値Oは、前記(1)、
(2)式より ne t+ −ΣW + h d k+ΣW 、 、
h + +θ1 (3)ト 0、−= 1−/ (1+exp(−net+ ) )
(4)hl:j番目の隠れユニットの出力値 o、:i番目の出カニニットの出力値 w、1:j番目の隠れユニットと、1番目の出カニニッ
ト間の結合の重み δ1 :1番目の出カニニットの閾値 衣にネットワークの出力が、望ましい出力になるように
、ネットワークの重みを変える。あるパターンpを与え
た時の実際の出力値(0,、)と、望ましい出力値(t
い1)の平均2乗誤差をとる。
(2)式より ne t+ −ΣW + h d k+ΣW 、 、
h + +θ1 (3)ト 0、−= 1−/ (1+exp(−net+ ) )
(4)hl:j番目の隠れユニットの出力値 o、:i番目の出カニニットの出力値 w、1:j番目の隠れユニットと、1番目の出カニニッ
ト間の結合の重み δ1 :1番目の出カニニットの閾値 衣にネットワークの出力が、望ましい出力になるように
、ネットワークの重みを変える。あるパターンpを与え
た時の実際の出力値(0,、)と、望ましい出力値(t
い1)の平均2乗誤差をとる。
Ep−(t、l−0,l)2/2 (5)学習
させるためには、この誤差を減らすように、次の学習規
則に従ってネットワーク中の全ての重みを変える。
させるためには、この誤差を減らすように、次の学習規
則に従ってネットワーク中の全ての重みを変える。
[出力層についての学習規則]
■隠れ層のユニット−出力層のユニットの間の重みの変
化 ΔW++ (n) −77ΣδpH1,1−1−αΔW
、、(n 1)■入力層のユニット−出力層のユニッ
トの間の重みの変化 ΔWlk (n) =77Σδ1ll11pk+αΔW
、k(n−1)但し、n:学習回数
(7)α;モーメンタム δ、、== (tp+−Op+) Σδ、、W、、
、(S)[隠れ層についての学習規則] 入力層のユニット−隠れ層のユニットの間の重みの変化 ΔW、k (n) −77Σδ、、11.I+αΔw+
k(n−i−)δ1” b n+ (I It p+
)Σδ、、W、、 (In)以上の学習により、
重み記憶部18ではネットワークの重みを学習終了或い
は任意の学習段階で保存する。
化 ΔW++ (n) −77ΣδpH1,1−1−αΔW
、、(n 1)■入力層のユニット−出力層のユニッ
トの間の重みの変化 ΔWlk (n) =77Σδ1ll11pk+αΔW
、k(n−1)但し、n:学習回数
(7)α;モーメンタム δ、、== (tp+−Op+) Σδ、、W、、
、(S)[隠れ層についての学習規則] 入力層のユニット−隠れ層のユニットの間の重みの変化 ΔW、k (n) −77Σδ、、11.I+αΔw+
k(n−i−)δ1” b n+ (I It p+
)Σδ、、W、、 (In)以上の学習により、
重み記憶部18ではネットワークの重みを学習終了或い
は任意の学習段階で保存する。
再び第2図を参照して次に動作認識部20を説明する。
動作認識部20には第2ニューロコンピューター 6−
2が設けられ、第2ニューロコンピュータ16−2は第
6図に示した第1ニューロコンピュータ16−1と同じ
ネットワーク自身が過去の経歴を保持できるリカレント
機能を有する。
2が設けられ、第2ニューロコンピュータ16−2は第
6図に示した第1ニューロコンピュータ16−1と同じ
ネットワーク自身が過去の経歴を保持できるリカレント
機能を有する。
即ち、第2ニューロコンピュータ16−2の入力層22
、かくれ層24、出力層26及びコンテキスト層28で
成るネットワーク構成を有する。
、かくれ層24、出力層26及びコンテキスト層28で
成るネットワーク構成を有する。
第2ニューロコンピュータ16−2は初期状態でネット
ワークの重みの結線は全て0であるが、動作認識に先立
ち重み記憶部18に記憶されている動作学習部12の学
習により得られた同じ第1ニューロコンピュータ16−
1から取出されたネットワークの結線の重みを読出して
設定(移植)する。この重み記憶部18に記憶されたネ
ットワークの結合の重みの第2ニューロコンピュータ1
6−2に対する移植により、第2ニューロコンピュータ
16−2は学習データ生成部14で生成された学習デー
タにより学習が済んだと同じネットワークの結合の重み
状態を実現することができる。
ワークの重みの結線は全て0であるが、動作認識に先立
ち重み記憶部18に記憶されている動作学習部12の学
習により得られた同じ第1ニューロコンピュータ16−
1から取出されたネットワークの結線の重みを読出して
設定(移植)する。この重み記憶部18に記憶されたネ
ットワークの結合の重みの第2ニューロコンピュータ1
6−2に対する移植により、第2ニューロコンピュータ
16−2は学習データ生成部14で生成された学習デー
タにより学習が済んだと同じネットワークの結合の重み
状態を実現することができる。
このような学習結果から得られた重み設定を受けた第2
ニューロコンピュータ16−2による動作認識は、動作
測定部10からある動作を示す時系列データが入力され
ると、第6図に示したと同じ構造のりカレント型のニュ
ーラルネットワークは次のアルゴリズムを実行する。
ニューロコンピュータ16−2による動作認識は、動作
測定部10からある動作を示す時系列データが入力され
ると、第6図に示したと同じ構造のりカレント型のニュ
ーラルネットワークは次のアルゴリズムを実行する。
■動作測定部から最初の時刻t1の時系列データ入力時
には、コンテキスト層28のユニットに出力値Oをセッ
トし、入力層22にコンテキスト層28を加えた層を入
力層としてネットワーク動作を行う。
には、コンテキスト層28のユニットに出力値Oをセッ
トし、入力層22にコンテキスト層28を加えた層を入
力層としてネットワーク動作を行う。
■時刻t1以降の時系列データ入力時には前回のかくれ
層24の出力値に所定の履歴係数Kを乗算した値をコン
テキスト層28にコピーして同様にネットワーク動作を
行う。
層24の出力値に所定の履歴係数Kを乗算した値をコン
テキスト層28にコピーして同様にネットワーク動作を
行う。
そして順次入力する時系列データに対するネットワーク
出力は格別な意味を持たないが、最後に入力した時系列
データに対するネットワーク出力がそれまでの時系列デ
ータの集積結果としてもたらされた何の動作であるかを
示す認識された動作のビットパターンであり、この最後
に出力されたネットワーク出力のビットパターンにより
動作の認識結果を得ることができる。
出力は格別な意味を持たないが、最後に入力した時系列
データに対するネットワーク出力がそれまでの時系列デ
ータの集積結果としてもたらされた何の動作であるかを
示す認識された動作のビットパターンであり、この最後
に出力されたネットワーク出力のビットパターンにより
動作の認識結果を得ることができる。
第9図は本発明の動作測定部10から得られる時系列デ
ータの具体例を示した説明図であり、この測定データに
あっては時刻t=1から時刻t5までの5段階の各時刻
で検出された測定データの時系列を示しており、データ
グローブを使用して手話による手の動きを測定したもの
で、10本の指の曲げ角度(10データ)、3次元位置
(X。
ータの具体例を示した説明図であり、この測定データに
あっては時刻t=1から時刻t5までの5段階の各時刻
で検出された測定データの時系列を示しており、データ
グローブを使用して手話による手の動きを測定したもの
で、10本の指の曲げ角度(10データ)、3次元位置
(X。
Y、Zの3データ)及び手のひねり角度(3データ)を
測定している。
測定している。
第10図は第9図の測定データから本発明の動作学習部
]2に設けた学習データ生成部1−4で生成された入力
時系列データと教師信号(教師ビットパターン)を示す
。即ち、時刻t−1−〜t=5までの5つの時系列デー
タのそれぞれにおける測定データを入力データとして、
この入力データに対応して何の動作であるかを示す教師
ビットパターン001を生成している。尚、実際に生成
される学習用の入力データは第1−0図に示す生データ
ではなく0〜1の範囲に正規化された値となる。
]2に設けた学習データ生成部1−4で生成された入力
時系列データと教師信号(教師ビットパターン)を示す
。即ち、時刻t−1−〜t=5までの5つの時系列デー
タのそれぞれにおける測定データを入力データとして、
この入力データに対応して何の動作であるかを示す教師
ビットパターン001を生成している。尚、実際に生成
される学習用の入力データは第1−0図に示す生データ
ではなく0〜1の範囲に正規化された値となる。
そして、この第10図に示す学習データを使用してバッ
クプロパゲーション法に従った第1ニューロコンピュー
タ]−6−1の学習を行う。
クプロパゲーション法に従った第1ニューロコンピュー
タ]−6−1の学習を行う。
第11−図は第10図の学習データを使用して第1ニュ
ーロコンピュータ16−1−の学習を行い、その学習結
果から得られたネットワークの内部結合の重みを動作認
識部20の第2ニューロコンピュータ16−2に移植し
て動作測定部10より時刻t=1〜t=5に示す同じ測
定データを時系列的に入力した場合の認識結果を示す。
ーロコンピュータ16−1−の学習を行い、その学習結
果から得られたネットワークの内部結合の重みを動作認
識部20の第2ニューロコンピュータ16−2に移植し
て動作測定部10より時刻t=1〜t=5に示す同じ測
定データを時系列的に入力した場合の認識結果を示す。
この第11−図の認識結果から明らかなように、時刻1
−]〜t=4までのネットワーク出力は不定であるが、
最後のj = 5の測定データの入力に対しネッ)・ワ
ークの出力として動作ビットパターン001が得られ、
本発明による動作認識機能が確実に行われることが確認
されている。
−]〜t=4までのネットワーク出力は不定であるが、
最後のj = 5の測定データの入力に対しネッ)・ワ
ークの出力として動作ビットパターン001が得られ、
本発明による動作認識機能が確実に行われることが確認
されている。
[発明の効果]
以上説明してきたように本発明によれば、より自然なコ
ンピュータ等への入力ができるマンマシンインタフェー
スを実現することができる。
ンピュータ等への入力ができるマンマシンインタフェー
スを実現することができる。
また手話等の多種多様で個人差の大きい(手話等による
)手の動きを正確に認識することができ、手話のできる
人と手話のできない人の間でコミュニケーションを行う
ための有用な装置を実現できる。
)手の動きを正確に認識することができ、手話のできる
人と手話のできない人の間でコミュニケーションを行う
ための有用な装置を実現できる。
更に人が代わって学習データとは動きが若干界なる動作
の時系列データを入力しても、学習済みデータの場合に
近い認識結果を得ることができ、その都度プログラムを
組み直す必要はなく高い柔軟性を有する。
の時系列データを入力しても、学習済みデータの場合に
近い認識結果を得ることができ、その都度プログラムを
組み直す必要はなく高い柔軟性を有する。
第1図は本発明の原理説明図;
第2図は本発明の実施例構成図;
第3図は本発明の動作測定部の実施例構成図;第4図は
本発明の学習データ生成部の実施例構成図; 第5図は本発明の学習データ説明図; 第6図は本発明のりカレント型ニューロコンピュータ構
成図; 第7図はニューラルネットワークのユニット説明図; 第8図はニューラルネットワーク構成図;第9図は本発
明の動作測定部からのデータ説明図;第10図は本発明
の動作学習部のデータ説明図;第1J図は本発明の動作
認識部のデータ説明図;第1−2図は従来のりカレント
型ニューラルネットワーク構成図である。 図中、 10・ 12: 14: 18: 20: 22: 24: 26: 28: 動作測定部 動作学習部 学習データ生成部 1:第1−ニューロコンピュータ 2:第2ニューロコンピュータ 重み記憶部 動作認識部 入力層 かくれ層 出力層 コンテキスト層
本発明の学習データ生成部の実施例構成図; 第5図は本発明の学習データ説明図; 第6図は本発明のりカレント型ニューロコンピュータ構
成図; 第7図はニューラルネットワークのユニット説明図; 第8図はニューラルネットワーク構成図;第9図は本発
明の動作測定部からのデータ説明図;第10図は本発明
の動作学習部のデータ説明図;第1J図は本発明の動作
認識部のデータ説明図;第1−2図は従来のりカレント
型ニューラルネットワーク構成図である。 図中、 10・ 12: 14: 18: 20: 22: 24: 26: 28: 動作測定部 動作学習部 学習データ生成部 1:第1−ニューロコンピュータ 2:第2ニューロコンピュータ 重み記憶部 動作認識部 入力層 かくれ層 出力層 コンテキスト層
Claims (6)
- (1)コンピュータ等への指示を人間の動作で与えるシ
ステムにおいて、 手、指、腕等の人間の3次元的な動きをある一定時間毎
に測定して時系列データとして出力する動作測定部(1
0)と; 該動作測定部から得られた1動作を示す入力時系列デー
タと該入力時系列データに対する教師信号とでなる学習
データを生成する学習データ生成部(14)と、該学習
データ生成部(14)の学習データを使用してネットワ
ークの結合の重みを学習させる時系列データ処理構造を
有する第1ニューロコンピュータ(16−1)を備えた
動作学習部(12)と;該動作学習部(12)による学
習が済んだ状態で前記第1ニューロコンピュータ(16
−1)から得られたネットワークの結合の重みを記憶す
る重み記憶部(18)と; 時系列データ処理構造を有する第2のニューロコンピュ
ータ(16−2)を備え、前記重み記憶部(18)に記
憶されたネットワークの結合の重みを前記第2ニューロ
コンピュータに設定した後に前記動作測定部(10)か
らの時系列データを入力して動作パターンを認識する動
作認識部(20)と; を備えたことを特徴とするニューロコンピュータを用い
た動作認識装置。 - (2)請求項1記載のニューロコンピュータを用いた動
作認識装置に於いて、 前記動作学習部(12)に設けられた時系列データ処理
構造を有する第1ニューロコンピュータ(16−1)は
、 1又は複数の時系列データを並列的に順次入力する複数
ユニットを備えた入力層(22)と;該入力層(22)
の全てのユニットと結合するユニットを複数備えたかく
れ層(24)と; 前記かくれ層(24)の全てのユニットと結合されるユ
ニットを複数備えた出力層(26)と;前記入力層(2
2)と並列に設けられ、前記かくれ層(24)と同じ数
のユニットを備えると共に該ユニットの全てを前記かく
れ層(24)のユニットの1つ1つに結合したコンテキ
スト層(28)と;を備え、最初の時系列入力データに
よる重み学習時には前記コンテキスト層(28)のユニ
ットに出力値0をセットし、前記入力層(22)にコン
テキスト層(28)を加えた層を入力層として重み学習
を実行し、2番目以降の時系列入力パターンによる重み
学習時には、前回のかくれ層(24)の出力値に所定の
履歴係数を乗算した値をコンテキスト層(28)にコピ
ーして同様に重み学習を実行することを特徴とするニュ
ーロコンピュータを用いた動作認識装置。 - (3)請求項1記載のニューロコンピュータを用いた動
作認識装置に於いて、 前記動作認識部(20)に設けられた時系列データ処理
構造を有する第2ニューロコンピュータ(16−2)は
、 1又は複数の時系列データを並列的に順次入力する複数
ユニットを備えた入力層(22)と;該入力層(22)
の全てのユニットと結合するユットを複数備えたかくれ
層(24)と; 前記かくれ層(24)の全てのユニットと結合されるユ
ニットを複数備えた出力層(26)と;前記入力層(2
2)と並列に設けられ、前記かくれ層(24)と同じ数
のユニットを備えると共に該ユニットの全てを前記かく
れ層(24)のユニットの1つ1つに結合したコンテキ
スト層(28)と;を備え、前記動作測定部(10)か
らの最初の時系列データの入力時には前記コンテキスト
層(28)のユニットに出力値0をセットし、前記入力
層(22)にコンテキスト層(28)を加えた層を入力
層として動作し、2番目以降の時系列データの入力時に
は、前回のかくれ層(24)の出力値に所定の履歴係数
を乗算した値をコンテキスト層(28)にコピーして同
様に動作することを特徴とするニューロコンピュータを
用いた動作認識装置。 - (4)請求項1記載のニューロコンピュータを用いた動
作認識装置に於いて、 前記動作学習部(12)に設けた学習データ生成部(1
4)は、 1動作当りの時系列データを正規化する第1手段と; 該第1手段で得られた正規化時系列データにより認識さ
れる動作を示す教師信号を生成する第2手段と; バックプロパゲーション法による重み学習に使用する学
習パラメータを設定する第3手段と;前記第1乃至第3
手段で得られた正規化時系列データ、教師信号、学習パ
ラメータを学習データとして格納する第4手段と; を備えたことを特徴とするニューロコンピュータを用い
た動作認識装置。 - (5)請求項4記載のニューロコンピュータを用いた動
作認識装置に於いて、 前記第3手段は、バックプロパゲーション法に使用する
学習パラメータとしてラーニングレートα及びモーメン
タムηの各値を設定することを特徴とするニューロコン
ピュータを用いた動作認識装置。 - (6)請求項1記載のニューロコンピュータを用いた動
作認識装置に於いて、 前記動作測定部(10)は、人間の時系列的な動作を検
出する複数のセンサを備えたデータグローブ又はボディ
スーツであることを特徴とするニューロコンピュータを
用いた動作認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2161533A JPH0451372A (ja) | 1990-06-20 | 1990-06-20 | ニューロコンピュータを用いた動作認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2161533A JPH0451372A (ja) | 1990-06-20 | 1990-06-20 | ニューロコンピュータを用いた動作認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0451372A true JPH0451372A (ja) | 1992-02-19 |
Family
ID=15736907
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2161533A Pending JPH0451372A (ja) | 1990-06-20 | 1990-06-20 | ニューロコンピュータを用いた動作認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0451372A (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH05250407A (ja) * | 1992-03-10 | 1993-09-28 | Hitachi Ltd | 手話変換装置および方法 |
| US5659764A (en) * | 1993-02-25 | 1997-08-19 | Hitachi, Ltd. | Sign language generation apparatus and sign language translation apparatus |
| US5887069A (en) * | 1992-03-10 | 1999-03-23 | Hitachi, Ltd. | Sign recognition apparatus and method and sign translation system using same |
| JP2002519720A (ja) * | 1998-06-24 | 2002-07-02 | フォニックス コーポレイション | 多層ネットワークを用いた信号分類の方法と装置 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0281160A (ja) * | 1988-09-17 | 1990-03-22 | Sony Corp | 信号処理装置 |
-
1990
- 1990-06-20 JP JP2161533A patent/JPH0451372A/ja active Pending
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0281160A (ja) * | 1988-09-17 | 1990-03-22 | Sony Corp | 信号処理装置 |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH05250407A (ja) * | 1992-03-10 | 1993-09-28 | Hitachi Ltd | 手話変換装置および方法 |
| US5887069A (en) * | 1992-03-10 | 1999-03-23 | Hitachi, Ltd. | Sign recognition apparatus and method and sign translation system using same |
| US5659764A (en) * | 1993-02-25 | 1997-08-19 | Hitachi, Ltd. | Sign language generation apparatus and sign language translation apparatus |
| US5953693A (en) * | 1993-02-25 | 1999-09-14 | Hitachi, Ltd. | Sign language generation apparatus and sign language translation apparatus |
| JP2002519720A (ja) * | 1998-06-24 | 2002-07-02 | フォニックス コーポレイション | 多層ネットワークを用いた信号分類の方法と装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Karsoliya | Approximating number of hidden layer neurons in multiple hidden layer BPNN architecture | |
| Jain et al. | Artificial neural networks: A tutorial | |
| Fels et al. | Glove-TalkII-a neural-network interface which maps gestures to parallel formant speech synthesizer controls | |
| EP0526504B1 (en) | Artificial neural device | |
| CN107102727A (zh) | 基于elm神经网络的动态手势学习与识别方法 | |
| CN110008839A (zh) | 一种自适应手势识别的智能手语交互系统及方法 | |
| CN118861805A (zh) | 基于脉冲神经网络和注意力机制的多模态情绪识别方法 | |
| CN111914553A (zh) | 一种基于机器学习的金融信息负面主体判定的方法 | |
| Salvi et al. | Language bootstrapping: Learning word meanings from perception–action association | |
| Fu et al. | Gesture recognition based on BP neural network and data glove | |
| CN114758676A (zh) | 一种基于深度残差收缩网络的多模态情感识别方法 | |
| CN110163098A (zh) | 基于分层深度网络的人脸表情识别模型构建及识别方法 | |
| CN118606800A (zh) | 一种基于生物可解释性的触觉纹理识别方法、系统及终端 | |
| Ahsan et al. | The use of artificial neural network in the classification of EMG signals | |
| Abdelaziz et al. | Hand gesture recognition based on electromyography signals and deep learning techniques | |
| Cabrera et al. | Glove-based gesture recognition system | |
| Lin et al. | Fusion inception and transformer network for continuous estimation of finger kinematics from surface electromyography | |
| Joshi et al. | MATLAB based back-propagation neural network for automatic speech recognition | |
| Wang | Multi-associative neural networks and their applications to learning and retrieving complex spatio-temporal sequences | |
| Sarawate et al. | A real-time American Sign Language word recognition system based on neural networks and a probabilistic model. | |
| JPH0451372A (ja) | ニューロコンピュータを用いた動作認識装置 | |
| CN108664129A (zh) | 一种基于手势识别手套的可学习数据采集系统及实现方法 | |
| Di Nuovo | A developmental neuro-robotics approach for boosting the recognition of handwritten digits | |
| Hasebrook et al. | Knowledge robots for knowledge workers: Self-learning agents connecting information and skills | |
| JPH04548A (ja) | ニューラルネットワーク装置 |