JP2005199403A - 情動認識装置及び方法、ロボット装置の情動認識方法、ロボット装置の学習方法、並びにロボット装置 - Google Patents

情動認識装置及び方法、ロボット装置の情動認識方法、ロボット装置の学習方法、並びにロボット装置 Download PDF

Info

Publication number
JP2005199403A
JP2005199403A JP2004009690A JP2004009690A JP2005199403A JP 2005199403 A JP2005199403 A JP 2005199403A JP 2004009690 A JP2004009690 A JP 2004009690A JP 2004009690 A JP2004009690 A JP 2004009690A JP 2005199403 A JP2005199403 A JP 2005199403A
Authority
JP
Japan
Prior art keywords
emotion
recognition
modal
time
estimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004009690A
Other languages
English (en)
Inventor
Kuniaki Noda
邦昭 野田
Masahiro Fujita
雅博 藤田
Tsutomu Sawada
務 澤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2004009690A priority Critical patent/JP2005199403A/ja
Publication of JP2005199403A publication Critical patent/JP2005199403A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Manipulator (AREA)

Abstract

【課題】 コンテキストを考慮することで認識対象の情動の状態を安定的に推定する。
【解決手段】 情動推定システム50は、時系列のセンサ情報に基づき、センサ情報のコンテキストを考慮してユーザの情動を推定した推定情動Esを出力する情動推定装置1と、行動のコンテキストを考慮して学習された予想情動変化データベースを参照し、行動実行後に変化するとされる予想情動変化dEbを求め、行動前における情動推定装置1の推定結果Es’とから予測情動Ebを出力する情動予測装置40と、推定情動Esと予測情動Ebを、予測情動Ebの時間的な減衰を考慮したパラメータηにより融合して最終的な推定情動Eを出力する情動統合部52とを有する。
【選択図】 図11

Description

本発明は、情動を認識するための認識対象の情動を、センサ情報から抽出した認識対象の特徴量に基づき認識する情動認識装置及び方法、この情動認識装置を搭載したロボット装置の学習方法、並びに、インタラクション対象の情動を認識するロボット装置及びその情動認識方法に関する。
従来の感情認識技術やそれを応用したシステムとしては、下記特許文献1乃至特許文献4などがある。例えば特許文献1には、ユーザの音声に含まれる感情に反応してストリーが展開される対話型映画システムの技術が開示されている。また、特許文献2には、音声から感情を認識する認識器と、画像から感情を認識する認識器とを用意し、認識器が認識した感情に応じて重み付けして統合する階層的感情認識装置の技術が開示されている。
また、特許文献3には、学会などの発表者に対して発表者自身の感情を聴衆の反応に応じて認識し、フィードバックさせる発表支援装置の技術が開示されている。更に、特許文献4には、複数の感情認識器の認識結果を重み付けして統合することで人間の感情を認識し、認識した感情を考慮した行動パターンを提案するための行動パターン処理装置が開示されている。
これら下記特許文献1乃至特許文献4における感情認識技術には下記のような特徴がある。すなわち、
各感情に専用のサブ認識器を設け、出力を論理合成して最終的な出力とする
複数の特徴量に基づく認識結果を重み付けによって組み合わせ、最終的な出力とする
認識結果を統合する重み付けパラメータは実験的に採取した教師データを元に算出している
各認識器で利用するパラメータは認識対象の各個人毎に準備されている。
特許2874858号公報 特許2967058号公報 特許2960029号公報 特開2002−73634号公報
しかしながら、これら特許文献1乃至特許文献4に記載の技術においては、下記のような問題点がある。すなわち、各認識器はその瞬間のセンサ入力情報のベクトルのみに依存してその出力を決定するものである。したがって、感情認識装置が例えば、表情、音声、ジェスチャなどに関するセンサ入力のベクトル情報と、それに対応する感情との写像関係を学習するようなモデルで構成されている場合、そのときのセンサ入力情報、すなわち認識対象の表面的な状態変化のみを絶対的なものとして信頼し、出力を決定するため、少しのセンサ入力の変化で容易に認識結果が変化してしまい、安定することがない。
例えば、機嫌よく話をしている最中に、考え事をして少し顔をしかめただけでその一瞬は嫌悪感を表出していると判断されるようなものである。従来の技術では、上記のような脆弱な認識器から得られた情報をそのまま機器の機能選択やロボット装置の行動選択に利用することが提案されているが、実際のシステムを構築した場合、ちょっとした出力の変化で機能を選択していては、頻繁に機能選択が起こり機器の利用上の支障をきたす。機器の機能選択やロボット装置の行動選択、又はコミュニケーションにおいて重要なのは、認識対象の根底に定常的にある感情の状態である。一瞬の表情の変化や、発話のちょっとした語調の変化から生じる認識結果のブレは何らかの処理によってスムージングされることが必要である。
本発明は、このような従来の実情に鑑みて提案されたものであり、コンテキストを考慮することで認識対象の情動の状態を安定的に推定する情動推定装置及び方法、そのような情動推定装置を搭載したロボット装置及びその情動認識方法、並びに情動推定装置を搭載したロボット装置及びその学習方法を提供することを目的とする。
上述した目的を達成するために、本発明に係る情動認識装置は、時系列のセンサ情報から、情動を認識するための認識対象に関する時系列の特徴量を抽出する特徴量抽出手段と、上記時系列の特徴量に基づき、上記センサ情報のコンテキストを考慮して上記認識対象の情動を推定する情動推定手段とを有することを特徴とする。
本発明においては、時系列の特徴量に基づき認識対象の情動を推定する、すなわちセンサ情報のコンテキストを考慮して情動推定を行うため、例えば認識対象の一瞬の情動変化又は瞬間的なセンサ情報から抽出した特徴量に基づく推定結果の誤りなどを反映してしまうことがなく、認識対象の情動推定結果を平滑化したものとして認識することができる。
また、上記特徴量抽出手段は、複数のモーダルについて各モーダル毎の上記時系列の特徴量をモーダル別特徴量列として抽出し、上記情動推定手段は、上記モーダル別特徴量列に基づき各モーダル毎に上記情動を認識する複数のモーダル別情動認識手段と、上記各モーダル別情動認識手段の認識結果に基づき上記情動を推定する認識結果統合手段とを有することにより、例えば認識対象の表情、ジェスチャ、音声などのモーダル別に時系列の特徴量を抽出し、モーダル別に情動を認識することができ、認識結果統合手段は、1つのモーダルについて推定された情動を認識結果としたり、複数のモーダルについて推定された情動を統合して認識結果としたりすることができる。
更に、上記情動推定手段は、上記モーダル別情動認識手段により得られた認識結果の予測誤差を算出する予測誤差算出手段を有し、上記認識結果統合手段は、上記各モーダル別情動認識手段により得られた認識結果及びその予測誤差に基づき上記情動を推定することができ、モーダルに応じて異なる情動認識率などを有する場合にこれを上記予測誤差に反映させることで更に情動推定手段の情動推定率(情動認識率)を向上することができる。
更にまた、上記認識結果統合手段は、上記予測誤差算出手段により得られた予測誤差を信頼度に変換し、各モーダル別情動認識手段により得られた認識結果にその信頼度を重み付けした重み付け認識結果に基づき上記情動を推定することができ、予測誤差をある程度平均化するなどして信頼度とし、重み付け認識結果を求めることで、情動推定手段が推定結果を更に平滑化することができる。
また、上記情動推定手段は、時系列のセンサ情報から抽出した認識対象に関する時系列の特徴量を入力データとしたとき、上記時系列のセンサ情報を取得した際の上記認識対象の情動が出力データとなるよう、再帰的学習により予め学習されたものとすることができ、情動推定手段を例えばリカレントネットワークとして学習することができる。
本発明に係るロボット装置は、内部状態及び/又は外部刺激に基づき自律的に行動するロボット装置において、インタラクション対象に関する情報を取得する1以上のセンサと、上記センサから時系列のセンサ情報を受け取り、上記インタラクション対象に関する時系列の特徴量を抽出する特徴量抽出手段と、上記時系列の特徴量に基づき、上記センサ情報のコンテキストを考慮して上記インタラクション対象の情動を推定する情動推定手段とを有することを特徴とする。
本発明においては、ロボット装置のインタラクション対象となるユーザなどの情動を、ユーザの特徴量の時系列データに基づき推定する情動推定手段を有するため、ユーザの情動を誤認識や一時的な認識結果によらないものとしてより確実に推定することができる。
また、複数の行動から一の行動を選択して実行する行動実行手段と、上記行動実行手段により実行された行動の種類に応じて上記インタラクション対象の情動を予測する情動予測手段と、上記情動推定手段により得られた推定結果と上記情動予測手段により得られた予測結果とに基づき上記インタラクション対象の情動を推定する情動統合手段とを有することができ、更に安定かつ正確に情動を推定することができる。
更に、上記情動予測手段は、一の行動と、該一の行動の実行後に変化すると予想される予想情動変化とが対応づけられた予想情動変化データベースを参照して行動実行後の情動変化を予想し、該予想結果と行動実行前に上記情動推定手段により推定された推定結果とに基づき行動実行後の上記情動を予測することができ、行動実行前後に変化すると考えられるインタラクション対象の情動変化を予測することができる。
更にまた、上記予想情動変化データベースは、各行動に対してその実行前後の上記インタラクション対象の情動変化に基づき上記予想情動変化が学習されたものとすることができ、例えば一の行動が実行された際の行動実行前後における上記情動推定手段による推定結果や、外部から与えられた行動実行前後における情動変化に基づき、一の行動を実行する毎に更新して上記予想情動データベースを逐次更新することで、行動のコンテキストを考慮した予想情動データベースを構築することができる。
また、上記情動統合手段は、行動実行後から時間が経過するに従って上記情動予測手段による予測結果より上記情動推定手段による推定結果を重視するように変化するパラメータにより、上記推定結果及び予測結果に重み付けし、該重み付けした結果に基づき上記情動を推定することができ、情動推定手段における推定結果に対して情動予測手段の予測結果によりトップダウンの補正を行うと共に、行動の実行に関わらず常に得られる情動推定手段の推定結果を、行動実行後の経過時間が長くなるほど重視させるようにすることができる。
本発明に係るロボット装置の学習方法は、与えられた入力データから、インタラクション対象の情動を認識する情動認識装置を搭載したロボット装置の学習方法において、時系列のセンサ情報から抽出したインタラクション対象に関する時系列の特徴量を入力データとし、当該時系列のセンサ情報を取得した際の上記インタラクション対象の情動を出力の目標値として上記情動認識装置の学習をする学習工程を有することを特徴とする。
本発明においては、ロボット装置の情動認識装置を、例えばリカレントネットワークなどにより構成することで、時系列の特徴量を入力データとして情動を認識するものとして学習することで、インタラクション対象の情動を、センサ情報のコンテキストを考慮して推定することが可能な情動認識装置を搭載したロボット装置を得ることができる。
本発明に係る情動認識装置及び方法によれば、時系列のセンサ情報から、インタラクション対象に関する時系列の特徴量を抽出し、これに基づき、上記センサ情報のコンテキストを考慮して上記インタラクション対象の情動を推定するので、例えば瞬間的なセンサ情報に基づいてインタラクション対象の一瞬の表情の変化や、発話の際の一瞬の語調の変化を認識結果に反映させてしまうことを防止し、インタラクション対象の情動推定結果を平滑化してより自然なものとして認識することができる。
更に、本発明に係るロボット装置及びその情動認識方法によれば、時系列のセンサ情報から、インタラクション対象に関する時系列の特徴量を抽出し、これに基づき、上記センサ情報のコンテキストを考慮して上記インタラクション対象の情動を推定する情動認識装置を搭載することで、ロボット装置が、ユーザの一瞬の表情変化や、発話の一瞬の語調の変化に左右されることなく、インタラクション対象となるユーザなどの情動をより正しく認識することができ、ユーザとのインタラクションをより上手に行うことができ、また、時系列のセンサ情報に加え、自身の行動履歴に基づきユーザの情動変化を予測した結果を考慮すれば、センサ情報に基づく認識結果を補正して更に正確にユーザの情動を認識し、より生物らしい振る舞いを行わせることが可能となる。
また、本発明に係るロボット装置及びその学習方法によれば、時系列のセンサ情報から抽出したインタラクション対象の時系列の特徴量を入力とし、その際の実際のインタラクション対象の情動を出力目標値として、例えばリカレントネットワークなどの再帰学習により学習を行うことで、センサ情報のコンテキストを考慮してインタラクション対象の情動を認識することが可能な情動認識装置の学習をロボット装置が行うことができる。
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、コンテキストを考慮して、認識対象の情動を認識する情動認識システムを搭載したロボット装置に適用したものである。本実施の形態におけるロボット装置は、外部環境(外部刺激)の時系列データと、行動履歴とから情動の認識対象となるインタラクション対象(以下、ユーザという。)の情動を安定的かつ正しく推定するものである。ここでは、先ず、情動認識システムについて説明し、その後、この情動認識装置を搭載するに好適なロボット装置の一構成例について説明する。
A:情動認識システム
上述した如く、従来の情動認識器は、例えばユーザなどのインタラクション対象の瞬間的な音声や画像から得られる特徴量から、インタラクション対象の情動を認識するものであって、コンテキスト情報を無視しているため認識結果が不安定となってしまう。ここでいうコンテキストとは具体的には、インタラクション対象がたった今どのような情動状態であったか、インタラクション対象に対してたった今、ロボット装置自身がどのような行動を行ったのかなどである。
そこで、本実施の形態におけるロボット装置は、コンテキストを考慮して情動認識を行うため、それまでの状態を基準とし、次の状態を予測するアルゴリズムの1つとしてリカレントニューラルネットワークなどを利用することによって、入力情報、本実施の形態においては、センサ情報から抽出される特徴量の時間的な変化(コンテキスト)を考慮して情動を推定するものである。
さらに、ロボット装置自らが行う行動選択と、当該選択した行動によるインタラクション対象の情動変化の対応関係を予測するモデルを準備し、これによりロボット装置がどのような行動を取るとインタラクション対象にどのような情動変化が起こるかを予測して、センサ情報から推定される情動推定結果にトップダウンの補正をかけることにより、情動推定結果を更に平滑化するものである。
すなわち、本実施の形態における情動認識システムは、時系列のセンサ情報からユーザの情動を推定する情動推定装置と、実行した行動の種類に応じてユーザの情動変化を予測するための情動予測装置と、情動推定装置が推定した推定結果(以下、推定情動Esという。)及び情動予測装置が予測した予測結果(以下、予測情動Ebという。)に、行動履歴の時間減衰を考慮した重みを乗算して足し合わせたものを最終的に得られた認識結果(以下、認識情動Eという。)として出力する情動統合部とから構成される。
(1)情動推定装置
先ず、センサ情報の時系列データからセンサ情報のコンテキストを考慮した推定情動Esを出力する情動推定装置について説明する。図1は、本実施の形態における情動推定装置を示すブロック図である。図1に示すように、この情動推定装置1は、外部の状況を検出するセンサ部2と、ジェスチャ、発話、人間の表情などの各モーダル毎にセンサ部2からのセンサ情報から前処理として特徴量を抽出する特徴量抽出部3と、同じく各モーダル毎に推定情動Es及び後述する予測誤差x^(x^は、xハットを示す、以下同様。)を算出するモーダル別情動推定部4と、予測誤差x^から推定情動Esに対する信頼度λを算出するソフトマックス演算器7と、推定情動Esと信頼度λとを乗算する乗算器8と、乗算器8の出力の総和を求め、推定情動Esを出力する加算器9とを有する。
センサ部2は、例えば、周囲の画像を撮像する撮像手段としてのカメラ2、周囲の音声を入力する音声入力手段としてのマイクロホン2などからなり、時系列のセンサ情報(以下、センサ情報列ともいう。)を出力する。
特徴量抽出部3は、モーダル毎に前処理を行うもので、例えば表情分析部3、ジェスチャ分析部3、発話分析部3などを有し、時系列のセンサ情報から、モーダル毎に、認識対象の時系列の特徴量ベクトルを抽出し、モーダル別特徴量列として出力する。
情動推定部4は、モーダル毎に用意され、各モーダルに対応した特徴量抽出部3にて前処理され得られた特徴量ベクトル列が入力され、この特徴量ベクトル列から推定情動Esを推定して出力するものである。この情動推定部4は、過去の情動を考慮して現在の情動を予測する情動フォアードモデル(forward model:フォワードモデル又は順モデル)により情動を推定して、モーダル別推定情動Esとして出力するモーダル別情動認識手段としての情動認識器5と、この情動認識器5が出力した推定情動Esの予測誤差x^を算出する誤差予測器6とを有している。誤差予測器6においても、過去の予測誤差x^を考慮して現在の予測誤差x^を算出するフォワードモデルにより推定情動Esの予測誤差x^を算出するものとすることができる。
フォワードモデルは、入出力の写像関係、すなわち本実施の形態においては、時系列の特徴量ベクトルを入力した場合に、推定情動Esを出力とする写像関係を実現していればよく、数式、パラメータマトリクス、対応表など、どのような表現方法であってもよい。また、本実施の形態においては、センサ入力から情動を予測する方向、すなわちここでは、特徴量ベクトル列を入力とし、推定情動Esを出力とする方向を順方向(情動フォワードモデル)という。なお、フォワードモデルと入出力データが逆になるモデルをインバースモデル又は逆モデルという。
ソフトマックス演算部7は、ソフトマックスを求める後述する関数を用いて予測誤差x^を、各情動推定器5が算出する推定情動Esに対する信頼度λに変換し、乗算器8は、推定情動Esに信頼度λを乗算する。加算器9は、乗算器8にて信頼度λで重み付けされた重み付き推定情動λEsの総和を求めて推定情動Esとして出力する。これらソフトマックス演算部7、乗算器8及び加算器9により、モーダル別情動認識器5の認識結果を統合するための認識結果統合手段が構成される。
ここで、本実施の形態においては、この情動認識器(情動フォワードモデル)及び誤差予測器として、例えばリカレントニューラルネットワークなどを利用して予め学習されたものを使用する。すなわち、情動認識器5は、時系列の特徴量ベクトルs とそれに対応する予め感情が分類された教師データである時系列の感情分類情報Es とからなる学習データを使用し、入力として与えられる時系列の特徴量ベクトルから時系列の感情情報を出力する情動認識器5を学習するものである。すなわち、学習データのうち、時系列の特徴量ベクトルs を入力データとし、教師データである時系列の感情情報Es を出力データの目標値としてモーダル毎に予め学習する。
また、誤差予測器6は、時系列の特徴量ベクトルs とそれに対応する予め感情が分類された教師データである時系列の感情分類情報Es とからなる学習データを使用して、入力として与えられる情動認識器5の出力(推定情動Es)及び/又は特徴量ベクトルs から予測誤差を出力する誤差予測器6を情動認識器5毎に学習する。ここではまずこれらの学習方法について説明し、次に学習された情動認識器5及び誤差予測器6を有する情動推定部4を使用した情動推定装置における情動推定方法(再現方法)について説明する。
(2)モーダル別情動認識器の学習方法
本実施の形態においては、モーダル毎に情動推定部4、すなわち情動認識器5を用意する。情動認識器5は、1つの情動認識器により、例えば「喜び(joy)」、「悲しみ(sadness)」、「怒り(anger)」、「驚き(surprise)」、「嫌悪(disgust)」、及び「恐れ(fear)」などの複数の情動を認識することができ、ある一のモーダルにおいて各感情に対応する特徴量を予め学習しておき、認識の際には、モーダル毎にセンサ入力から特徴量を抽出する前処理を行って、抽出した特徴量に基づきユーザの情動を推定して出力するものである。なお、本実施の形態における情動認識器は、上記6つの基本6感情を認識するものとし、したがってモーダル別情動認識器5が出力する推定情動Es及び情動推定装置1が出力する推定情動Esは、6種類の感情を要素とするベクトルとするが、認識する感情の種類はこれに限らない。
情動認識器5が考慮するモーダルとしては、例えば表情、ジェスチャ、発話などがある。学習では、先ず、情動認識器5の学習を行うための学習データを用意し、次に、モーダル毎に情動認識器5の学習を行う。
情動認識器5の学習を行うために必要な学習データは、入力データとなる時系列の特徴量ベクトルと、出力データの目標値となる、上記入力データを取得した際のインタラクション対象、本実施の形態においてはユーザの情動である。なお、ユーザの情動は適当に数値化されているものとする。
入力データは、表情分析部3、及びジェスチャ分析部3などからなる特徴量抽出部3に、画像などの時系列のセンサ情報を供給し、発話分析部3などからなる特徴量抽出部3に音声などの時系列のセンサ情報を供給し、この時系列のセンサ情報に基づいて、それぞれのモーダルに対応した、時系列のユーザの特徴量(フィーチャー)ベクトルを集める。
例えば、表情分析部3であれば、画像全体の周波数成分や方向成分を抽出するフィルタリング処理を行った結果が特徴量として抽出されたり、例えば額や眉間、頬のしわの密度や方向、目の見開き具合、唇の形など、顔に視覚的に表れている要素の特徴を数値的に現したベクトルデータなどが特徴量として抽出されたりして、特徴量ベクトルの時系列データ(特徴量ベクトル列)が出力される。
また、ジェスチャ分析部3であれば、手先位置の移動量、移動速度、手先軌道の切り返しの周波数などが特徴量として抽出され特徴量ベクトル列が出力される。
また、発話分析部3であれば、認識した発話の平均音圧(パワー)、基本周波数(相似的な波の繰り返しのパターンが現れる周波数)、及びスペクトルなどのデータを特徴量として、抽出された特徴量ベクトル列が出力される。
それぞれのモーダルに対応した情動認識器5の学習データの収集は、例えば次のように実験的に行うことができる。すなわち、特徴量抽出部3の前で、決められたシナリオ通りの演技を人間に実際に演じてもらい、その際に観測されたデータ(センサ情報列)から特徴量抽出部3により各モーダルに対応した時系列の特徴量ベクトル(フィーチャーベクトル)を抽出し、そのときの人間の感情を示す情報と共に記録することで学習データを収集することができる。また、後述するロボット装置に情動認識システムを搭載する場合には、少なくとも特徴量抽出部3が搭載されたロボット装置の前で、同様に人間に演技を演じてもらって学習データを収集すればよい。ここで、特徴量ベクトルを抽出した際の人間の感情を示す情報は、上述の基本6感情が数値化されたたベクトル(感情分類情報)であり、認識時において情動認識器5が出力する推定情動の教師データとなるものである。以下では、この学習データを推定情動(教師)Es と記載するものとする。また、学習データのうち、学習に使用する特徴量ベクトルを特徴量ベクトル(教師)s と記載する。
こうしてこの特徴量抽出部3により収集された入力データとなる時系列の特徴量ベクトル(教師)s 及び、出力の目標値とする、特徴量ベクトル(教師)s を取得した際のユーザの推定情動(教師)Es からなる学習データを使用して、各情動認識器5の学習を行う。
なお、情動推定部4の学習は各モーダル毎に個別に行われ、特徴量抽出部3、情動推定部4、は各モーダル毎に用意され、情動認識器5、誤差予測器6は各情動推定部4毎に設けられるものであるが、以下の説明においては、特に必要がないときは特徴量抽出部3、情動推定部4、情動認識器5、誤差予測器6ということとする。
図2は、学習時の情動推定部5を模式的に示す図である。図2に示すように、学習時には、一のモーダル、ここでは「表情」より情動認識する表情用情動認識器5に対して、この「表情」について前処理により得られた学習データが格納されたデータベース10が接続される。情動認識器5は、データベース10から供給される学習データ、すなわち時系列の特徴量ベクトル(教師)s とそのときの時系列の推定情動(教師)Es とにより、与えられた時系列の特徴量ベクトルから情動を推定するための情動モデルの学習を行う。すなわち、学習データの特徴量ベクトル(教師)s を入力としたとき、推定情動(教師)Es を出力するよう、モーダル毎に情動認識器(情動フォワードモデル)5を学習させる。
本実施の形態においては、時系列データから情動を推定する情動認識器(情動フォワードモデル)5を、リカレントニューラルネットワークにより構成する。なお、情動を学習、認識する際に用いるアルゴリズムはリカレントニューラルネットワークに限らず、時系列のデータを出力に反映させることができるものであれば、どのようなアルゴリズムであってもよい。例えば、ある時間幅を有する情報をクラスタリングする手法としては、DP(Dynamic Programming)マッチング(動的計画法)、隠れマルコフモデル(Hidden Markov Model:HMM)などの手法がある。本実施の形態におけるコンテキストとは、その時の状態ベクトルだけではなく、過去を遡り、時間幅を有する状態ベクトルデータ列を指すものであり、このようなデータを入力として出力(推定情動)を得ることができればよい。
図2の情動認識器5には、それぞれのモーダルに対する、前処理によって抽出された字系列の学習データのうち、特徴量ベクトル(教師)s がリカレントニューラルネットワークの入力データとして与えられる。そして、入力データを収集した際の推定情動(教師)Es が出力データとして与えられ、情動フォワードモデルとしての情動認識器5の学習が行われる。リカレントニューラルネットワークには、図3に示すように、対応するモーダルにおける特徴量ベクトルが入力される入力層11aと、1以上の層からなる中間層12と、対応するモーダルに関する推定情動を出力する出力層13a、13bと、出力層13bの推定情動が入力される入力層11bとを有する。すなわち、入力層11a、11bには、あるタイミングにおける特徴量ベクトル、前のタイミングにて出力層13bから出力された推定情動が入力され、これが中間層12を介して出力層13a、13bから出力され、そのうちの一部が次のタイミングにおいて入力層11bへ戻される。
このように、リカレントニューラルネットワークには出力層から入力層(または中間層)にフィードバックする一群のユニット(入力層11b、出力層13b)があり、これらは時系列入力に基づく文脈情報(コンテキスト)を内部表現している。出力層13bから入力層11bへのフィードバックはコンテキストループと呼ばれる。このリカレントニューラルネットワークを利用することで、瞬間的な入出力情報の写像関係ではなく、文脈情報を考慮した現在の情動推定を実現することができる。なお、リカレントニューラルネットワークについての詳細は後述する。
(3)誤差予測器の学習方法
人間が各モーダルを通じで表現する情動には、必ずしも各感情に相当する表現が平均的に含まれていないことが実験により知られている。例えば上記特許文献2においては、音声又は画像により感情を認識する際、「悲しみ」、及び「恐怖」は、音声のみで認識される度合いが高く、「怒り」、「幸福」、及び「驚き」は、画像のみで認識される度合いが高いことを利用し、音声データ及び画像データからそれぞれ感情認識する感情認識部を設けたとき、例えば音声データから感情認識する感情認識部にて「悲しみ」、又は「恐怖」が認識された場合はその重みを大きくし、画像データから感情認識する感情認識部にて「怒り」、「幸福」、又は「驚き」が認識された場合はその重みを大きくして、これら2つの感情認識部の認識結果を統合するものである。
このように、感情に応じて、認識を得意とするセンサ情報が異なるため、各感情についてモーダル毎の認識結果がどの程度信頼できるかには差が生じる。この差を各認識器の信頼度として予めの学習によって獲得しておき、認識時に各モーダルの認識結果に重み付けして最終的な認識結果とすることで、認識結果の信頼性を高めることができる。
上述の図1にて説明したように、本実施の形態の情動推定装置においては、マルチモーダルなセンサ情報から情動を推定するものであり、各モーダルに対応した情動認識器5が要素認識器(情動フォワードモデル)として用いられている。また、それぞれの情動認識器5が出力する情動認識結果を、そのコンテキストでの認識結果の信頼度に応じて重み付けして最終的な出力を決定している。このため、各モーダルに対応したモジュール(情動推定部4)において、情動認識器5と対になって信頼度を算出するための誤差予測器6を有している。ここでいうコンテキストとは、センサ入力状態(時系列のセンサ情報列)、または感情認識状態(時系列の推定情動)などを想定することができる。それぞれの想定に応じて、誤差予測器6への入力データを設定し、例えばセンサ情報のコンテキストを考慮する場合には、入力データとして時系列のセンサ情報から抽出した時系列の特徴量ベクトルを使用したり、感情認識状態のコンテキストを考慮する場合には、入力データとして、情動認識器5の出力を使用するようにすればよい。
上述した如く、各モーダルに対して個別に学習された要素認識器(情動認識器)の出力をどの程度信頼するかを出力する誤差予測器6の学習においても、センサ入力情報もしくは感情認識状態の履歴情報を元に算出するモデルを適用することができ、センサ情報(またはこれらから抽出された特徴量)、及び/又は感情認識状態を入力として対となる要素認識器の誤差を予測するモデルがリカレントニューラルネットワークによって実現される。ここでは、時系列のセンサ情報から抽出された時系列の特徴量ベクトルと、感情認識器により認識されたモーダル別推定情動とを入力とするモデルについて説明する。
すなわち、誤差予測器6は、図4に示すように、各モーダルについて収集された上述の学習データを再度用い、特徴量ベクトル(教師)s 及びこの特徴量ベクトル(教師)s を入力としたときの情動認識器5の出力データである推定情動Es を入力データとし、情動認識器5の出力Esと特徴量ベクトルs に対応する推定情動(教師)Es との差分である誤差情報を理想出力x とし、この理想出力力x を出力の目標値として各モーダルに対応した誤差予測器6の学習を行う。なお、特徴量ベクトル(教師)s は複数の特徴量を要素とするベクトルであり、推定情動Es 、推定情動Es、理想出力x は、上述の6種類の情動を要素とするベクトルである。また、学習に使用する学習データは、情動認識器5の学習に用いた学習データとは異なるものを用意してもよく、このことによりより汎化能力が高い誤差予測器6を得ることができる。
図5は、リカレントニューラルネットワークを用いた誤差予測器の学習方法を示す。誤差予測器の学習の場合には、対応するモーダルの時系列の特徴量ベクトルs、対応するモーダルにおける情動予測データである推定情動Esが入力層21a、21bに入力され、出力層23aから情動予測誤差x^が出力される。また、出力層23bから出力される予測誤差x^がコンテキストループによりフィードバックされて入力層11cに供給される。すなわち、時刻t+1における予測誤差x^は、特徴量ベクトルs、及び推定情動Es、並びに時刻tで出力された予測誤差x^から出力される。
(4)リカレントニューラルネットワーク
次に、リカレントニューラルネットワークの一例について説明しておく。なお、次に説明する特開平8−6916号公報に記載のリカレント型ニューラルネットワークに限らず、上述したように、時系列データを入力とし、コンテキストを考慮した学習、認識を行うことができるものであればよい。
ニューラルネットワークとは、人間の脳における神経回路網を簡略化したモデルであり、それは神経細胞ニューロンが、一方向にのみ信号が通過するシナプスを介して結合されているネットワークである。ニューロン間の信号の伝達は、このシナプスを通して行われ、シナプスの抵抗、すなわち、重みを適当に調整することにより、様々な情報処理が可能となる。各ニューロンでは、結合されている他のニューロンからの出力をシナプスの重み付けをして入力し、それらの総和を非線形応答関数の変形を加えて、再度、他のニューロンへ出力する。
ニューラルネットワークの構造の一つに、図6に示すような多層型ネットワークがある。このタイプのネットワークは層構造を有し、層間の結合のみが許され、層内の結合や自己回帰的な結合は存在しない。この多層型ネットワークは、空間的に広がるパターンの認識や、情報圧縮に適していると考えられている。
一方、図7に示すように、ネットワークの構造にそのような制限を設けず、各ユニット間で任意の結合を許すものが、リカレント型ネットワークとよばれる。厳密に言うと、リカレント型ネットワークには層の概念はないが、ここでは多層型ネットワークとの対応をとるために、便宜的に層という概念を取り入れる。以下では、入力データが入力されるユニット群を入力層、ネットワークの出力を出すユニット群を出力層、その他のユニット群を中間層と呼ぶ。
リカレント型ネットワークでは、各ユニットの過去の出力がネットワーク内の他のユニット、または自分自身に戻される結合がある。そのため、時間に依存して各ニューロンの状態が変化するダイナミックスをネットワークの内部に有する。このように、ネットワーク内に時間を有するシステムであるので、リカレント型ネットワークは、時系列パターンの認識や予測に適していると考えられている。なお、多層型ネットワークは、リカレント型ネットワークの特別な場合と見ることができる。
リカレント型ニューラルネットワークの各ニューロンの従う状態方程式は下記式(1)、式(2)で与えられる。
Figure 2005199403
Figure 2005199403
ここで、x(t)は時刻tにおけるユニットiの内部状態であり、出力値yは内部状態を非線形変換して決められる。また、τ,Xはそれぞれユニットiの時定数、外部入力であり、wijはユニットjからユニットiへの結合の重みである。Nは総ユニット数である。
時刻tから時刻tまでの各時刻におけるネットワークの状態を求める場合は次の手順により求めることができる。まず、初期状態として時刻tにおけるネットワークの内部状態と出力値を適当に設定する。その後、上記式(1)及び式(2)を時間の順方向にtからtまで解く。
本実施の形態のように、時系列パターンの認識や予測に、リカレント型ニューラルネットワークを用いる場合、ネットワークが正しい出力を出すように、上述したように、特徴量ベクトル列などの時系列データである入力データと、推定情動などの時系列データである教師データ(出力データ)とが対になった学習データを用意し、それらを用いてネットワークの重み値、時定数、初期状態を予め学習しておく必要がある。これには通常、バックプロパゲーション法と呼ばれる最適化手法を用いて行われる。
この手法の特徴は、下記式(3)で与えられるようなtからtにわたる有限時間区間における誤差を小さくするように、最急降下法に基づき重みを修正することである。
Figure 2005199403
ここで、Y(t)は時刻tにおけるユニットkに提示される教師データである。但し、kは出力層に属するユニット群、Nは出力層に属するユニット数を示す。
重み値、時定数、初期状態の修正量を計算する際に用いられる最急降下方向は下記式(4)、式(5)、式(6)で与えられる。
Figure 2005199403
Figure 2005199403
Figure 2005199403
ここでP(t)はそれぞれユニットiの逆伝搬誤差である。逆伝搬誤差は下記式(7)に従って計算される。
Figure 2005199403
ここで、δikはクロネッカーのデルタ記号である。上記式(7)では、出力層に属するニューロンの逆伝搬誤差は、他のニューロンからの逆伝搬誤差と重みの総和以外に、各時刻毎に出力値の誤差が加算される形になっている。また、df(x)/dx、(y(t)−Y(t))は、x(t)、y(t)が決まらないと計算できない。そこで、x(t)、y(t)を時間の順方向に計算した後、時刻tでは逆伝搬誤差は0であると仮定して、下記式(8)で与えられる境界条件を設定し、逆伝搬誤差をt→tの時間の逆方向に計算する。
Figure 2005199403
最急降下方向の計算の手順は以下のように行う。すなわち、まず時刻tにおける各ユニットの初期状態を適当に設定した後、上記式(1)及び式(2)に従って各時刻の内部状態と出力値を計算し、その値を保存しておく。次に、時刻tにおける上記式(8)で与えられる逆伝搬誤差の境界条件を設定する。その後、先程計算した内部状態と出力値を用いて、上記式(7)に従って時間に逆行しながら各時刻の逆伝搬誤差を計算し保存する。最後に、求められた各時刻の出力値と逆伝搬誤差を用いて上記式(4)乃至式(6)で与えられる最急降下方向を計算する。
バックプロパゲーション学習の処理手順の詳細を、図8を用いて示す。
まず、図8における学習データは、例えば、図7のような二つの入力層ニューロンと、一つの出力層ニューロンとを有するネットワークに対する学習データとする。学習データは図9に示すように、入力データと教師データとからなり、それぞれ(入力層ニューロン数×時系列サンプル点数)、(出力層ニューロン数×時系列サンプル点数)だけのデータ数を有する。
まず、適当な乱数などを用いて重み値、時定数、及び初期状態の初期値を設定する(ステップS1)。そして、逆伝搬誤差が収束するまで次のステップS2からステップS7までの処理を繰り返す。
まず、適当にネットワークの初期状態、すなわち、ネットワークの内部状態と出力値を設定した後、上記式(1)及び式(2)に従い入力データを用いて時間の順方向に各ユニットの内部状態、出力値を計算してそれを保存する(ステップS2)。
そして、上記式(8)の境界条件を設定し、その後、上記式(7)に従い、教師データを使用して時間の逆方向に各ユニットの逆伝搬誤差P(t)を計算し、それを保存する(ステップS3)。
次いで、ステップ2で求めた内部状態及び出力値と、ステップ3で求めた逆伝搬誤差を用いて、上記式(4)乃至式(6)に従い最急降下方向を計算する(ステップS4)。
そして、ステップ24で求めた最急降下方向と、前回の重みの修正量により下記式(9)乃至式(11)に従って今回の重みの修正量を計算する(ステップS5)。
Figure 2005199403
Figure 2005199403
Figure 2005199403
ここでγは学習係数、αはモーメント係数、nは学習回数である。右辺第2項はモーメント項と呼ばれ、学習を加速するために経験的に加える項である。
次いで、下記式(12)乃至式(14)に従い、各ユニットの重みを修正する(ステップS26)。
Figure 2005199403
Figure 2005199403
Figure 2005199403
そして、ステップ7にて、誤差が一定の値以下に収束するか否かが判断され、誤差が一定値より大きい場合は、ステップ2からステップ6の処理を繰り返す。以上のようにして、情動認識器5や誤差予測器6の学習を行なうことができ、学習された情動認識器5及び誤差予測器6からなる情動推定部4を用いて情動推定装置1が構成される。
(5)各モーダル別の認識結果の統合(再現方法)
次に、情動推定装置1の情動推定方法について説明する。先ず、ロボット装置が有するカメラ2やマイクロホン2などの各種センサ手段が時系列のセンサ情報を取得する。そして、特徴量抽出部3は、この時系列のセンサ情報から、前処理として時系列の特徴量ベクトルを抽出する。すなわち、特徴量抽出部3により、表情、ジェスチャ、発話などのモーダル毎にモーダル別特徴量列として、時系列の特徴量ベクトルを抽出する。
次に、抽出された特徴量を対応する情動推定部4へ供給する。例えば、表情の特徴量であれば、表情用情動推定部4へ、ジェスチャの特徴量であればジェスチャ用情動推定部4へ、発話の特徴量であれば発話用情動推定部4へ、特徴量ベクトル列が供給される。
各情動推定部4は、情動認識器5により時系列の特徴量ベクトルsから推定情動Esを出力し、誤差予測器6により予測誤差x^を算出して出力する。なお、特徴量抽出部3は、情動認識器5や誤差予測器6内に配置に配置してもよい。上述したように、モーダル別推定情動Esはモーダル毎に設けられた情動認識器5毎に算出された情動推定ベクトルであり、情動の要素として定義した各感情(例えば、基本6感情)のそれぞれの値が含まれる。また、最終的な出力となる推定情動Esも同じく各感情の値が含まれたベクトル情報である。
誤差予測器6により算出された予測誤差x^は、対応するモーダルにソフトマックス演算器7に供給される。ソフトマックス演算器7は、誤差予測器6から出力された予測誤差x^を元に下記式(15)のソフトマックス関数に従って情動認識器5の信頼度λを算出する。ここでx^、x^は各誤差予測器の出力、σは各認識器の誤差をどの程度平均化して責任信号(信頼度)を算出するかを決定するパラメータである。
Figure 2005199403
それぞれの信頼度λは、下記式(16)に示すように、対応する各情動認識器5が出力する推定情動Esに乗算され、これらを加算した総和が、時系列のセンサ入力情報を元に推定された最終的な情動認識結果ベクトルとしての推定情動Esとなる。
Figure 2005199403
このように、本実施の形態における情動推定装置1は、各モーダルに対応した情動認識器(要素認識器)5が、瞬間のセンサ情報のみから情動を推定するのではなく、それ以前の過去のセンサ情報も考慮し、時間的な広がりを持ったセンサ情報(時系列のセンサ情報)から特徴量を抽出して情動を推定することで、センサ情報のコンテキストを考慮して情動を認識することができる。すなわち、予め、情動認識器5及び誤差予測器6を再帰的学習方法、例えばリカレントニューラルネットワークなどのアルゴリズムを用いて、それぞれ時系列の特徴量ベクトルから推定情動を出力するフォワードモデル及び時系列の特徴量ベクトル及び/又は推定情動から予測誤差を出力するフォワードモデルを学習しておくことにより、各センサの入力情報から得られる特徴量ベクトルの時系列データを入力とし、コンテキストを考慮して情動を推定する情動推定装置を得ることができる。
また、誤差予測器から得られた予測誤差をソフトマックス関数の処理によって信頼度に変換し、モーダルごとの認識結果に重み付けすることにより、各感情に対してより正確に判定を行うことができると予想されるモーダルの出力を重視した統合結果として推定情動Esを出力することができる。
(6)情動予測装置
次に、ロボット装置が実行した行動のコンテキストを考慮し、その行動に応じてユーザの情動を予測する情動予測装置について説明する。情動予測装置は、上記のセンサ入力情報の履歴を元に現在のインタラクション対象の情動推定を行うモジュール(情動推定装置)と並列に、ロボット装置自らの行動とそれに対応するインタラクション対象(ユーザ)の情動変化を推定するモジュールである。この情動予測装置は、実行した行動kに応じて、行動実行後のユーザの情動変化を予想し、この予想した情動変化(以下、予想情動変化dEbという。)と、行動の実行前の上述の情動推定装置における推定結果Es’とを統合し、予測情動Ebを出力する。
図10(a)は、ロボット装置における情動予測装置に関わる要部を示す図である。図10(a)に示すように、ロボット装置は、内部状態31及び/又は外部刺激32に基づき自律的に行動を実行するものであって、複数の要素行動(スキーマ)33が木構造に構成されたスキーマツリーを有する行動制御器30を供える。スキーマ33は、内部状態31及び外部刺激32が入力されると、これらから各スキーマが自身に記述された行動の実行優先度を示す行動価値(アクティベーションレベル:Activation level)ALを算出し、この行動価値ALに基づき実行する行動を選択するモジュール(行動記述モジュール)であり、各モジュール毎にステートマシンを用意しており、それ以前の行動(動作)や状況に依存して、センサ入力された外部情報の認識結果を分類し、動作を機体上で発現する。各スキーマ33は、自身に記述された行動に応じて所定の内部状態及び外部刺激が定義されている。
ここで外部刺激32とは、ロボット装置の知覚情報等であり、例えばカメラから入力された画像に対して処理された色情報、形情報、顔情報等の対象物情報等が挙げられる。具体的には、例えば、色、形、顔、3D一般物体、及びハンドジェスチャー、その他、動き、音声、接触、距離、場所、時間、及びユーザとのインタラクション回数等が挙げられる。
また、内部状態31とは、内部状態管理部(図示せず)にて管理される本能や感情といった情動であり、例えば、疲れ(FATIGUE)、痛み(PAIN)、栄養状態(NOURISHMENT)、乾き(THURST)、愛情(AFFECTION)、好奇心(CURIOSITY)等がある。例えば、内部状態「栄養状態」は、バッテリの残量を基に決定し、内部状態「疲れ」は、消費電力を基に決定することができる。
そして、例えば行動出力が「食べる」であるスキーマ33は、外部刺激32として対象物の種類、対象物の大きさ、対象物の距離等を扱い、内部状態31として「NOURISHMENT」(「栄養状態」)、「FATIGUE」(「疲れ」)等を扱う。このように、各スキーマ33毎に、扱う外部刺激32及び/及び内部状態31の種類が定義され、該当する外部刺激32及び/又は内部状態31に対応する行動(要素行動)の行動価値ALが算出される。なお、1つの内部状態、又は外部刺激は、1つの要素行動だけでなく、複数の要素行動に対応付けられていてもよいことはもちろんである。
行動価値ALとは、スキーマ33をロボット装置がどれくらいやりたいか(実行優先度)を示すものである。この行動価値ALに基づき、選択されたスキーマ33は自身に記述された行動を出力する。この行動価値ALは、内部状態31及び外部刺激32から算出される。具体的には、例えば、内部状態31から、該当する行動について、どれだけやりたいかを示すモチベーションベクトル(Motivation Vector)が算出され、内部状態31及び外部刺激32から、該当する行動をやれるか否か示すリリーシングベクトル(Releasing Vector)が算出され、これら2つのベクトルから行動価値ALを算出することができる。そして、例えば、アクティベーションレベルが最も高いスキーマを選択したり、アクティベーションレベルが所定の閾値を超えた2以上のスキーマを選択して並列的に行動実行するようにすることができる。但し、並列実行するときは各スキーマ同士でハードウェア・リソースの競合がないことを前提とする。
行動制御器30は、選択されたスキーマ33を識別する識別ID(スキーマID)を出力し、このスキーマIDは情動予想装置40に入力される。
情動予測装置40は、予想情動変化の値が格納された予想情動変化データベース41を有し、入力されるスキーマIDが示す行動に基づき、当該行動の実行後に変化すると予想される情動変化(予想情動変化)を出力する。予想情動変化は、ロボット装置の行動制御器30における行動制御アルゴリズムと密接な関係を持っており、行動制御アルゴリズムに定義された全てのスキーマ33に対応した予想情動変化の値が定義されている。
予想情動変化データベース41は、実際のインタラクションを通じて観測された値を用いて動的に更新することができる。通常は、全てのインタラクション対象の人物について共通の予想情動変化データベースを構築するが、それまでにロボット装置が実際にインタラクションを行い、顔、声、名前などを記憶した人物毎にデータを保持することによって、人物毎に予測モデルとなる予想情動変化データベースを切り替え可能なように、予想情動変化データベースを構築してもよい。また、これらを組み合わせて、よく知っている人物に対しては人物毎に予想情動変化データベースを構築し、初対面の人物など用の共通に使用可能な予想情動データベースを構築しておいてもよい。
そして、行動単位(スキーマ)k毎に定義された予想情動変化ベクトル(予測情動変化)をdEbとし、当該行動実行前の情動を、その行動を実行する前に観測されたセンサ情報から推定された推定情動Es’、すなわち上述の情動推定装置にて算出された行動実行前の推定情動としたとき、これらを組み合わせ、行動履歴の情報を元に推定される下記式(17)に示す予測情動Ebが求められる。予測情動Ebも上記基本6感情を要素とするベクトルである。
Figure 2005199403
(7)予想情動変化データベースの学習方法
次に、情動予測装置における予想情動変化データベースの構築方法(学習方法)について説明する。予想情動変化データベースは、行動を実行する前と後との情動の差分を表現したデータベースであり、初期状態の情動予測装置40の予想情動変化データベース41は全て0で初期化されており、センサ情報から推定された推定情動Esのみを利用してインタラクション対象の情動が判断される。その後は、実際にロボット装置が行動選択を行ってインタラクションした結果、行動前後におけるインタラクション対象の情動推定結果が得られた場合には、下記式(18)に示すように、行動を実行した後の最終的な情動予測結果Eと行動を実行した後の行動履歴に基づく推定情動Ebとの差分の値を用いて予想情動変化データベースは更新される。
Figure 2005199403
ここで、dEbは各行動単位kに対応した予測情動変化ベクトル、Eはセンサ情報から推定された推定情動Esと、行動履歴の情報を元に推定される予測情動Ebとから得られる後述する最終的な出力としての推定情動E、αは学習係数、時刻T’は前回行動kを行った時間、時刻Tは次回、同一の行動kを行う時間を示し、dEbの値は、行動kに対応した値のみが更新される。また、時刻T’における推定情動Eを示すE T’は、例えば行動実行後(時刻T’)に時系列のセンサ情報から抽出したユーザの時系列の特徴量に基づき推定された推定情動Esとして予測情動変化データベースを更新してもよい。また、例えば人為的にデータベースを作成したいときなどにおいては、時刻T’におけるユーザの情動を、教師データとして外部から供給したり、ロボット装置に教えたりすればよい。
ここで、予想情動変化dEb を更新しようとした場合、目標とする値が推定情動Eであり、それに対して前回の予測情動変化dEb T’を考慮して算出された値が今回の予測情動Eb となるため、上記式(18)の右辺に示すように推定情動E T’と予測情動Eb T’との差分をとり、この値が正ならば予想情動変化dEb をより大きくする必要があり、負ならば予想情動変化dEb をより小さくする必要があることを示す。
このように、時刻Tにおける予想情動変化dEb は、時刻T’における予想情動変化dEb T’に、時刻T’におけるユーザの情動E T’と時刻T’における予測情動Eb T’との差に学習係数αを乗算した値を加算したものとなっており、行動履歴、すなわち行動のコンテキストを考慮したものとなっている。
例えば、図10(b)に示すように、ある時点における予想情動変化データベース41においては、例えばスキーマID(k)=1に記述された行動を実行すると、内部状態「JOY」が上昇し(10)、内部状態「DISGUST」が減少している(−25)。また、スキーマID(k)=6に記述された行動を実行すると、内部状態「JOY」が上昇し(+5)、内部状態「DISGUST」が減少する(−10)ことを示している。
こうしてロボット装置は、行動を実行することで予想情動変化の値を更新し、予想情動変化データベース41を学習することができる。なお、予想情動変化データベース41は、常に更新し続けるものとしてもよいが、所定期間の行動実行結果に応じて更新した後に更新を終了してもよく、予め行動実行後の予想情動変化dEbが定義された予想情動変化データベースを使用してもよい。
(8)情動認識システムにおける推定情動Eの推定方法
次に、時系列のセンサ入力情報に基づく認識結果と行動履歴に基づく情動予測結果の融合方法について説明する。上述した情動推定装置により、センサ入力情報に基づく認識結果として得られる推定情動Esは、センサ入力の時系列情報に従って逐次出力されるものであるが、情動予測装置により、行動履歴に基づく認識結果として得られる推定情動Ebは、ある要素行動を完了した瞬間に得られる値である。したがって、行動履歴に基づいて予測された予測情動の信頼性は、行動完了後から時間の経過とともに低下する。この効果を反映させた上で、センサ入力に基づいて算出された情動認識結果(推定情動Es)に対するトップダウンの補正を行うアルゴリズムを下記式(19)及び式(20)によって定式化する。これらの式(19)、(20)は、行動完了すぐの段階では、行動履歴に基づく情動予測結果である予測情動Ebを重視し、行動完了から時間が経過するに従ってセンサ情報に基づく情動認識結果である推定情動Esを重視するように変化することを意味している。ここでtはある行動が完了してからの経過時間(異なる行動が完了すると、0にリセットされる)、τ及びτは時間経過に対する減衰の度合を決定するパラメータである。
Figure 2005199403
Figure 2005199403
図11は、情動認識システムのうち、情動推定装置1の推定結果である推定情動Esと、情動予測装置40の予測結果である予測情動Ebとを統合する情動統合部52に関する部分を示す図である。図11に示すように、結果統合部52は、情動推定装置1からの推定情動Esと情動予測装置40からの予測情動Ebとが入力され、上記式(19)、(20)に従って推定情動Eを出力する。
ここで、情動推定装置1は、上述したように、時系列のセンサ情報列から時系列の特徴量を抽出し、コンテキストを考慮して推定した推定結果を推定情動Esとして出力するセンサ情報分析システムとして作用する。
また情動予測装置40は、行動実行後に、行動履歴、すなわち行動のコンテキストを考慮して学習された予想情動変化データベース41を参照して予想情動変化dEbを出力する情動変化予測部(行動履歴分析システム)42と、この予想情動変化dEb及び行動実行前の情動推定装置1’の推定情動Es’から予測情動を算出する予測情動算出部43とを有する。この情動予測装置40は、行動実行後に予測情動Ebを出力するもので、情動推定装置1’から行動実行前の推定情動Es’を受け取り、情動予測部42から実行した行動kに対応づけられた予想情動変化dEbを受け取り、これらを加算して推定情動Ebを出力する。なお、図11には、推定情動Es’を出力する情動推定装置1’を記載しているが、情動推定装置1から行動開始前の推定情動Es’を入力するようにすればよい。
これらの出力データは、図12のようになる。図12は、ロボット装置が3つの行動B1〜B3を実行した際の推定情動の変化を示すグラフであって、上段から、時系列のセンサ情報に基づき、情動推定装置にて算出された推定情動Es、次段は、この推定情動Esの時間減衰を考慮した値=(1−η)Esを示す。
また、3段目は、行動履歴に基づき予測された予測情動Ebを示し、その後段は、この予測情動Ebの時間減衰を考慮した値=ηEbを示す。そして、5段目は、(1−η)Es及びηEbを統合して得られる情動認識装置50の認識結果である推定情動Eを示す。
本実施の形態においては、複数のモーダルについて、モーダル毎に情動認識器を用意し、入力されるモーダル別の時系列のセンサ情報から抽出した時系列の特徴量ベクトルにより推定情動を算出し、更に、認識結果の予測誤差を求めて信頼度パラメータに変換し、認識結果に重み付けするため、センサ入力情報の時系列(コンテキスト)を考慮した情動を推定することができる。このことにより、センサのノイズによって推定情動が不安定になる、すなわち認識結果が支離滅裂に変化することを抑えて、極めて安定な認識結果とすることができると共に、信頼度λにより認識器の認識結果に重み付けして統合して推定情動Esとすることで極めて正確に情動を推定することができる。
更に、センサ入力情報から認識器によって得られた推定情動Esだけではなく、ロボット装置自身の行動のコンテキストから情動変化を予測した予測情動Ebを求め、推定情動Esにトップダウンの補正をかけると共に、センサ情報が入力され次第得ることができる推定情動Esと、行動結果後にのみ出力される予測情動Ebの時間的な誤差を考慮する、すなわち、行動完了すぐの段階では、行動履歴に基づく予測情動Ebの結果を重視し、行動完了から時間が経過するに従ってセンサ情報に基づく情動認識結果(推定情動Es)を重視するようにパラメータηを変化させ、センサ入力に基づく認識結果(推定情動Es)と、行動履歴に基づく情動予測結果(予測情動Eb)とを融合させることで、情動推定システムにて最終的に得られる推定情動を、ユーザの情動変化に対する、生物により近い自然な認識を可能する。
また、自らの行動がインタラクション対象のどのような情動変化をもたらすかを推定するための予想情動変化データベース(フォワードモデル)は、情動推定装置1から得られた結果を教師データとして逐次的に、行動−情動予測モデルのリアルタイム学習を行うことができ、その予測精度を向上させることができる。
このように、センサ情報から得られる推定情動Esだけではなく、それまでの人間とのインタラクション経験から、自らの行動が相手の情動に対してどのような変化をもたらすかの経験、すなわちロボット装置自身の行動のコンテキストを考慮し他者の情動遷移モデルとなる予想情動変化データベースを構築して予測情動Ebを求め、情動推定装置1からの推定情動Esと合わせて判断することで推定情動Eの推定精度を向上することができる。したがって、ロボット装置は、インタラクション対象の情動を示すこの推定情動Eに応じて行動を選択することができ、例えばインタラクション対象を喜ばせたり、楽しませたりといった行動を発現してよりエンターテイメント性を向上することができる。
B:ロボット装置
次に、上述した情動認識システムを搭載したロボット装置の一具体例について説明する。本実施の形態においては、2足歩行型のロボット装置を例にとって説明するが、2足歩行のロボット装置に限らず、4足又は車輪等により移動可能なロボット装置に適用できることはいうまでもない。
この人間型のロボット装置は、住環境その他の日常生活上の様々な場面における人的活動を支援する実用ロボットであり、内部状態(怒り、悲しみ、喜び、楽しみ等)に応じて行動できるほか、人間が行う基本的な動作を表出できるエンターテインメントロボットである。また、自身の内部状態ではなく、上述の情動認識システムにおいて認識したユーザの情動に応じて行動を発現することも可能である。図13は、本実施の形態におけるロボット装置の概観を示す斜視図である。
図13に示すように、ロボット装置101は、体幹部ユニット102の所定の位置に頭部ユニット103が連結されると共に、左右2つの腕部ユニット104R/Lと、左右2つの脚部ユニット105R/Lが連結されて構成されている(但し、R及びLの各々は、右及び左の各々を示す接尾辞である。以下において同じ。)。
このロボット装置101が具備する関節自由度構成を図14に模式的に示す。頭部ユニット103を支持する首関節は、首関節ヨー軸111と、首関節ピッチ軸112と、首関節ロール軸113という3自由度を有している。
また、上肢を構成する各々の腕部ユニット104R/Lは、肩関節ピッチ軸117と、肩関節ロール軸118と、上腕ヨー軸119と、肘関節ピッチ軸120と、前腕ヨー軸121と、手首関節ピッチ軸122と、手首関節ロール輪123と、手部124とで構成される。手部124は、実際には、複数本の指を含む多関節・多自由度構造体である。ただし、手部124の動作は、ロボット装置101の姿勢制御や歩行制御に対する寄与や影響が少ないので、本明細書では簡単のため、ゼロ自由度と仮定する。したがって、各腕部は7自由度を有するとする。
また、体幹部ユニット102は、体幹ピッチ軸114と、体幹ロール軸115と、体幹ヨー軸116という3自由度を有する。
また、下肢を構成する各々の脚部ユニット105R/Lは、股関節ヨー軸125と、股関節ピッチ軸126と、股関節ロール軸127と、膝関節ピッチ軸128と、足首関節ピッチ軸129と、足首関節ロール軸130と、足部131とで構成される。本明細書中では、股関節ピッチ軸126と股関節ロール軸127の交点は、ロボット装置101の股関節位置を定義する。人体の足部131は、実際には多関節・多自由度の足底を含んだ構造体であるが、本明細書においては、簡単のためロボット装置101の足底は、ゼロ自由度とする。したがって、各脚部は、6自由度で構成される。
以上を総括すれば、ロボット装置101全体としては、合計で3+7×2+3+6×2=32自由度を有することになる。ただし、エンターテインメント向けのロボット装置1が必ずしも32自由度に限定されるわけではない。設計・制作上の制約条件や要求仕様等に応じて、自由度すなわち関節数を適宜増減することができることはいうまでもない。
上述したようなロボット装置101がもつ各自由度は、実際にはアクチュエータを用いて実装される。外観上で余分な膨らみを排してヒトの自然体形状に近似させること、2足歩行という不安定構造体に対して姿勢制御を行うこと等の要請から、アクチュエータは小型且つ軽量であることが好ましい。
このようなロボット装置は、ロボット装置全体の動作を制御する制御システムを例えば体幹部ユニット102等に備える。図15は、ロボット装置101の制御システム構成を示す模式図である。図15に示すように、制御システムは、ユーザ入力等に動的に反応して情緒判断や感情表現を司る思考制御モジュール300と、アクチュエータ450の駆動等ロボット装置1の全身協調運動を制御する運動制御モジュール400とで構成される。
思考制御モジュール300は、情緒判断や感情表現に関する演算処理を実行するCPU(Central Processing Unit)311や、RAM(Random Access Memory)312、ROM(Read Only Memory)313及び外部記憶装置(ハード・ディスク・ドライブ等)314等で構成され、モジュール内で自己完結した処理を行うことができる、独立駆動型の情報処理装置である。
この思考制御モジュール300は、画像入力装置351から入力される画像データや音声入力装置352から入力される音声データ等、外界からの刺激等に従って、ロボット装置101の現在の感情や意思を決定する。すなわち、上述したように、入力される画像データからユーザの表情を認識し、その情報をロボット装置101の感情や意思に反映させることで、ユーザの表情に応じた行動を発現することができる。ここで、画像入力装置351は、例えばCCD(Charge Coupled Device)カメラを複数備えており、また、音声入力装置352は、例えばマイクロホンを複数備えている。
また、思考制御モジュール300は、意思決定に基づいた動作又は行動シーケンス、すなわち四肢の運動を実行するように、運動制御モジュール300に対して指令を発行する。
一方の運動制御モジュール400は、ロボット装置101の全身協調運動を制御するCPU411や、RAM412、ROM413及び外部記憶装置(ハード・ディスク・ドライブ等)414等で構成され、モジュール内で自己完結した処理を行うことができる独立駆動型の情報処理装置である。また、外部記憶装置414には、例えば、オフラインで算出された歩行パターンや目標とするZMP軌道、その他の行動計画を蓄積することができる。
この運動制御モジュール400には、図14に示したロボット装置101の全身に分散するそれぞれの関節自由度を実現するアクチュエータ450、対象物との距離を測定する距離計測センサ(図示せず)、体幹部ユニット102の姿勢や傾斜を計測する姿勢センサ451、左右の足底の離床又は着床を検出する接地確認センサ452,453、足底131の足底131に設けられる荷重センサ、バッテリ等の電源を管理する電源制御装置454等の各種の装置が、バス・インターフェース(I/F)401経由で接続されている。ここで、姿勢センサ451は、例えば加速度センサとジャイロ・センサの組み合わせによって構成され、接地確認センサ452,453は、近接センサ又はマイクロ・スイッチ等で構成される。
思考制御モジュール300と運動制御モジュール400は、共通のプラットフォーム上で構築され、両者間はバス・インターフェース301,401を介して相互接続されている。
運動制御モジュール400では、思考制御モジュール300から指示された行動を体現すべく、各アクチュエータ450による全身協調運動を制御する。すなわち、CPU411は、思考制御モジュール300から指示された行動に応じた動作パターンを外部記憶装置414から取り出し、又は、内部的に動作パターンを生成する。そして、CPU411は、指定された動作パターンに従って、足部運動、ZMP軌道、体幹運動、上肢運動、腰部水平位置及び高さ等を設定するとともに、これらの設定内容に従った動作を指示する指令値を各アクチュエータ450に転送する。
また、CPU411は、姿勢センサ451の出力信号によりロボット装置101の体幹部ユニット102の姿勢や傾きを検出するとともに、各接地確認センサ452,453の出力信号により各脚部ユニット105R/Lが遊脚又は立脚のいずれの状態であるかを検出することによって、ロボット装置101の全身協調運動を適応的に制御することができる。更に、CPU411は、ZMP位置が常にZMP安定領域の中心に向かうように、ロボット装置101の姿勢や動作を制御する。
また、運動制御モジュール400は、思考制御モジュール300において決定された意思通りの行動がどの程度発現されたか、すなわち処理の状況を、思考制御モジュール300に返すようになっている。このようにしてロボット装置101は、制御プログラムに基づいて自己及び周囲の状況を判断し、自律的に行動することができる。
このようなロボット装置には、動的に変化する作業環境下で一定時間内に応答できるようなヒューマン・インターフェース技術が要求されている。本実施の形態に係るロボット装置101は、情動推定システムを搭載することにより、周囲のユーザ(飼い主又はともだち、若しくは正当なユーザ)の情動を認識すると共に、認識結果に基づいてリアクションを制御することによって、より高いエンターテイメント性を実現することができる。
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。また、上述の実施の形態における情動認識システムは、ハードウェアにより実現しても、任意の処理を、演算器にコンピュータプログラムを実行させることにより実現してもよいことは勿論である。この場合、コンピュータプログラムは、記録媒体に記録して提供することも可能であり、また、インターネットその他の伝送媒体を介して伝送することにより提供することも可能である。
本発明の実施の形態における情動推定装置を示すブロック図である。 上記情動推定装置における、学習時の情動推定部5を模式的に示す図である。 上記情動推定装置における情動推定部のリカレントニューラルネットワークにおける学習方法を説明するための図である。 上記情動推定装置における、学習時の誤差予測器を模式的に示す図である 上記情動推定装置における誤差予測器のリカレントニューラルネットワークにおける学習方法を説明するための図である。 多層型ニューラルネットワークの一例を示す図である。 リカレント型ネットワークの一例を示す図である リカレント型ネットワークにおける重み値、時定数、初期状態に対するバックプロバケーション学習方法を示すフローチャートである。 学習データの一例を示す図である。 (a)は、ロボット装置における予測情動装置に関わる要部を示す図、(b)は、予想情動変化データベースの一具体例を示す図である。 本発明の実施の形態における情動認識装置の要部を説明する図である。 本発明の実施の形態における情動推定結果、情動予測結果、及びこれらを統合した結果の一例を示す図である。 本発明の実施の形態におけるロボット装置の概観を示す斜視図である。 同ロボット装置が具備する関節自由度構成を模式的に示す図である。 同ロボット装置の制御システム構成を示す模式図である。
符号の説明
1 情動推定装置、2 センサ部、3 特徴量抽出部、4 モーダル別情動推定部、7 ソフトマックス演算器、8 乗算器、9 加算器、5 情動認識器、6 誤差予測器、10 データベース、31 内部状態、32 外部刺激、30 行動制御器、33 スキーマ、40 情動予測装置、41 予想情動変化データベース、42 予想情動算出部、50 情動推定システム、52 情動統合部

Claims (28)

  1. 時系列のセンサ情報から、情動を認識するための認識対象に関する時系列の特徴量を抽出する特徴量抽出手段と、
    上記時系列の特徴量に基づき、上記センサ情報のコンテキストを考慮して上記認識対象の情動を推定する情動推定手段と
    を有することを特徴とする情動推定装置。
  2. 上記特徴量抽出手段は、複数のモーダルについて各モーダル毎の上記時系列の特徴量をモーダル別特徴量列として抽出し、
    上記情動推定手段は、上記モーダル別特徴量列に基づき各モーダル毎に上記情動を認識する複数のモーダル別情動認識手段と、該各モーダル別情動認識手段の認識結果に基づき上記情動を推定する認識結果統合手段とを有する
    ことを特徴とする請求項1記載の情動推定装置。
  3. 上記情動推定手段は、上記モーダル別情動認識手段により得られた認識結果の予測誤差を算出する予測誤差算出手段を有し、
    上記認識結果統合手段は、上記各モーダル別情動認識手段により得られた認識結果及びその予測誤差に基づき上記情動を推定する
    ことを特徴とする請求項2記載の情動推定装置。
  4. 上記予測誤差算出手段は、上記モーダル別特徴量列及び/又は上記モーダル別情動認識手段により得られた認識結果に基づき、該認識結果の予測誤差を算出する
    ことを特徴とする請求項3記載の情動推定装置。
  5. 上記認識結果統合手段は、上記予測誤差算出手段により得られた予測誤差を信頼度に変換し、各モーダル別情動認識手段により得られた認識結果にその信頼度を重み付けした重み付け認識結果に基づき上記情動を推定する
    ことを特徴とする請求項3記載の情動推定装置。
  6. 上記情動推定手段は、時系列のセンサ情報から抽出した上記認識対象に関する時系列の特徴量を入力データとしたとき、上記時系列のセンサ情報を取得した際の上記認識対象の情動が出力データとなるよう、再帰的学習により予め学習されたものである
    ことを特徴とする請求項1記載の情動推定装置。
  7. 上記予測誤差算出手段は、時系列のセンサ情報から抽出した認識対象に関するモーダル毎の時系列の特徴量及び/又は上記モーダル別情動認識手段により得られた認識結果を入力データとしたとき、当該時系列のセンサ情報を取得した際の認識対象の情動と上記モーダル別情動認識手段により得られた認識結果との差分が出力データとなるよう、再帰的学習により予め学習されたものであり、
    上記モーダル別情動認識手段は、時系列のセンサ情報から抽出した認識対象に関するモーダル毎の時系列の特徴量を入力データとしたとき、当該時系列のセンサ情報を取得した際の認識対象の情動が出力データとなるよう、再帰的学習により予め学習されたものである
    ことを特徴とする請求項3記載の情動推定装置。
  8. 上記再帰的学習には、ニューラルネットワークを使用する
    ことを特徴とする請求項6記載の情動推定装置。
  9. 時系列のセンサ情報から、情動を認識するための認識対象に関する時系列の特徴量を抽出する特徴量抽出工程と、
    上記時系列の特徴量に基づき、上記センサ情報のコンテキストを考慮して上記認識対象の情動を推定する情動推定工程と
    を有することを特徴とする情動推定方法。
  10. 上記特徴量抽出工程では、複数のモーダルについて各モーダル毎の上記時系列の特徴量をモーダル別特徴量列として抽出し、
    上記情動推定工程は、上記モーダル別特徴量列に基づき各モーダル毎に上記情動を認識するモーダル別情動認識工程と、上記モーダル別情動認識工程にて得られたモーダル別認識結果に基づき上記情動を推定する認識結果統合工程とを有する
    ことを特徴とする請求項9記載の情動推定方法。
  11. 上記モーダル別情動認識工程にて得られた認識結果の予測誤差を算出する予測誤差算出工程を有し、
    上記認識結果統合工程では、上記モーダル別情動認識工程にて得られたモーダル別認識結果及びその予測誤差に基づき上記情動を推定する
    ことを特徴とする請求項10記載の情動推定方法。
  12. 上記認識結果統合工程では、上記予測誤差算出工程にて算出された予測誤差を信頼度に変換し、各モーダル別情動認識工程にて得られた認識結果にその信頼度を重み付けした重み付け認識結果に基づき上記情動を推定する
    ことを特徴とする請求項11記載の情動推定方法。
  13. 内部状態及び/又は外部刺激に基づき自律的に行動するロボット装置において、
    インタラクション対象に関する情報を取得する1以上のセンサと、
    上記センサから時系列のセンサ情報を受け取り、上記インタラクション対象に関する時系列の特徴量を抽出する特徴量抽出手段と、
    上記時系列の特徴量に基づき、上記センサ情報のコンテキストを考慮して上記インタラクション対象の情動を推定する情動推定手段とを有する
    ことを特徴とするロボット装置。
  14. 上記特徴量抽出手段は、複数のモーダルについて各モーダル毎の上記時系列の特徴量をモーダル別特徴量列として抽出し、
    上記情動推定手段は、上記モーダル別特徴量列に基づき各モーダル毎に上記情動を認識する複数のモーダル別情動認識手段と、該各モーダル別情動認識手段により得られた認識結果に基づき上記情動を推定する認識結果統合手段とを有する
    ことを特徴とする請求項13記載のロボット装置。
  15. 上記情動推定手段は、上記モーダル別情動認識手段により得られた認識結果の予測誤差を算出する予測誤差算出手段を有し、
    上記認識結果統合手段は、上記各モーダル別情動認識手段により得られた認識結果及びその予測誤差に基づき上記情動を推定する
    ことを特徴とする請求項14記載のロボット装置。
  16. 複数の行動から一の行動を選択して実行する行動実行手段と、
    上記行動実行手段により実行された行動の種類に応じて上記インタラクション対象の情動を予測する情動予測手段と、
    上記情動推定手段により得られた推定結果と上記情動予測手段により得られた予測結果とに基づき上記インタラクション対象の情動を推定する情動統合手段と
    を有することを特徴とする請求項13記載のロボット装置。
  17. 上記情動予測手段は、一の行動と、該一の行動の実行後に変化すると予想される予想情動変化とが対応づけられた予想情動変化データベースを参照して行動実行後の情動変化を予想し、該予想結果と行動実行前に上記情動推定手段により推定された推定結果とに基づき行動実行後の上記情動を予測する
    ことを特徴とする請求項16記載のロボット装置。
  18. 上記予想情動変化データベースは、各行動に対してその実行前後の上記インタラクション対象の情動変化に基づき上記予想情動変化が学習されたものである
    ことを特徴とする請求項17記載のロボット装置。
  19. 上記行動実行手段により行動が実行される毎に、上記情動推定手段により推定された行動実行前後の上記インタラクション対象の情動の差分に基づき、上記予想情動変化データベースの上記予想情動変化を更新するデータベース学習手段を有する
    ことを特徴とする請求項17記載のロボット装置。
  20. 上記情動統合手段は、行動実行後から時間が経過するに従って上記情動予測手段による予測結果より上記情動推定手段による推定結果を重視するように変化するパラメータにより、上記推定結果及び予測結果に重み付けし、該重み付けした結果に基づき上記情動を推定する
    ことを特徴とする請求項16記載のロボット装置。
  21. 内部状態及び/又は外部刺激に基づき自律的に行動するロボット装置の情動認識方法において、
    時系列のセンサ情報から、インタラクション対象に関する時系列の特徴量を抽出する特徴量抽出工程と、
    上記時系列の特徴量に基づき、上記センサ情報のコンテキストを考慮して上記インタラクション対象の情動を推定する情動推定工程と
    ことを特徴とするロボット装置の情動認識方法。
  22. 上記特徴量抽出工程では、複数のモーダルについて各モーダル毎の上記時系列の特徴量をモーダル別特徴量列として抽出し、
    上記情動推定工程は、上記モーダル別特徴量列に基づき各モーダル毎に上記情動を認識するモーダル別情動認識工程と、上記モーダル別情動認識工程にて得られたモーダル別認識結果に基づき上記情動を推定する認識結果統合工程とを有する
    ことを特徴とする請求項21記載のロボット装置の情動認識方法。
  23. 上記モーダル別情動認識工程にて得られた認識結果の予測誤差を算出する予測誤差算出工程を有し、
    上記認識結果統合工程では、上記各モーダル別情動認識工程にて得られた認識結果及びその予測誤差に基づき上記情動を推定する
    ことを特徴とする請求項22記載のロボット装置の情動認識方法。
  24. 複数の行動から一の行動を選択して実行する行動実行手段により一の行動が実行された場合に、該実行された行動の種類に応じて上記インタラクション対象の情動を予測する情動予測工程と、
    上記情動推定工程にて得られた推定結果と上記情動予測工程にて得られた予測結果とに基づき上記インタラクション対象の情動を推定する情動統合工程と
    を有することを特徴とする請求項21記載のロボット装置の情動認識方法。
  25. 上記情動予測工程では、一の行動と、該一の行動実行後に変化すると予想される予想情動とが対応づけられた予想情動変化データベースを参照して行動実行後の情動変化を予想し、該予想結果と行動実行前に上記情動推定工程にて得られた推定結果とに基づき行動実行後の情動を予測する
    ことを特徴とする請求項24記載のロボット装置の情動認識方法。
  26. 上記情動統合工程では、行動実行後から時間が経過するに従って上記情動予測工程にて得られた予測結果より上記情動推定工程にて推定された推定結果を重視するように変化するパラメータにより、上記推定結果及び予測結果に重み付けし、該重み付けした結果に基づき上記情動を推定する
    ことを特徴とする請求項24記載のロボット装置の情動認識方法。
  27. 与えられた入力データから、インタラクション対象の情動を認識する情動認識装置を搭載したロボット装置の学習方法において、
    時系列のセンサ情報から抽出したインタラクション対象に関する時系列の特徴量を入力データとし、当該時系列のセンサ情報を取得した際の上記インタラクション対象の情動を出力の目標値として上記情動認識装置の学習をする学習工程を有する
    ことを特徴とするロボット装置の学習方法。
  28. 内部状態及び/又は外部刺激に基づき自律的に行動するロボット装置において、
    与えられた入力データから、インタラクション対象の情動を認識する情動認識装置と、
    インタラクション対象に関する情報を取得する1以上のセンサと、
    上記センサから時系列のセンサ情報を受け取り、上記インタラクション対象に関する時系列の特徴量を抽出する特徴量抽出手段と、
    上記時系列のセンサ情報から抽出したインタラクション対象に関する時系列の特徴量を入力データとし、当該時系列のセンサ情報を取得した際の上記インタラクション対象の情動を出力の目標値として上記情動認識装置の学習をする学習手段とを有し、
    上記情動認識装置は、上記特徴量抽出手段により抽出された上記時系列の特徴量を上記入力データとして上記情動を認識する
    ことを特徴とするロボット装置。

JP2004009690A 2004-01-16 2004-01-16 情動認識装置及び方法、ロボット装置の情動認識方法、ロボット装置の学習方法、並びにロボット装置 Withdrawn JP2005199403A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004009690A JP2005199403A (ja) 2004-01-16 2004-01-16 情動認識装置及び方法、ロボット装置の情動認識方法、ロボット装置の学習方法、並びにロボット装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004009690A JP2005199403A (ja) 2004-01-16 2004-01-16 情動認識装置及び方法、ロボット装置の情動認識方法、ロボット装置の学習方法、並びにロボット装置

Publications (1)

Publication Number Publication Date
JP2005199403A true JP2005199403A (ja) 2005-07-28

Family

ID=34822652

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004009690A Withdrawn JP2005199403A (ja) 2004-01-16 2004-01-16 情動認識装置及び方法、ロボット装置の情動認識方法、ロボット装置の学習方法、並びにロボット装置

Country Status (1)

Country Link
JP (1) JP2005199403A (ja)

Cited By (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009245236A (ja) * 2008-03-31 2009-10-22 Institute Of Physical & Chemical Research 情報処理装置、情報処理方法、およびプログラム
JP2009288934A (ja) * 2008-05-28 2009-12-10 Sony Corp データ処理装置、データ処理方法、及びプログラム
JP2011090408A (ja) * 2009-10-20 2011-05-06 Canon Inc 情報処理装置、その行動推定方法及びプログラム
JP2011232822A (ja) * 2010-04-23 2011-11-17 Canon Inc 情報処理装置、情報処理方法及びプログラム
US8583282B2 (en) * 2005-09-30 2013-11-12 Irobot Corporation Companion robot for personal interaction
US8780221B2 (en) 2008-04-09 2014-07-15 Canon Kabushiki Kaisha Facial expression recognition apparatus, image sensing apparatus, facial expression recognition method, and computer-readable storage medium
JP2015114987A (ja) * 2013-12-13 2015-06-22 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 処理装置、処理方法、およびプログラム
JP2015171737A (ja) * 2014-03-11 2015-10-01 本田技研工業株式会社 ロボット、およびロボットの制御方法
KR20160066526A (ko) * 2014-12-02 2016-06-10 삼성전자주식회사 사용자의 상태를 나타내는 상태 데이터를 획득하는 방법 및 디바이스
US20160180722A1 (en) * 2014-12-22 2016-06-23 Intel Corporation Systems and methods for self-learning, content-aware affect recognition
JP2017087344A (ja) * 2015-11-10 2017-05-25 株式会社国際電気通信基礎技術研究所 アンドロイドロボットの制御システム、装置、プログラムおよび方法
WO2017175447A1 (ja) * 2016-04-05 2017-10-12 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
JP2018072876A (ja) * 2016-10-24 2018-05-10 富士ゼロックス株式会社 感情推定システム、感情推定モデル生成システム
CN108229640A (zh) * 2016-12-22 2018-06-29 深圳光启合众科技有限公司 情绪表达的方法、装置和机器人
US10013892B2 (en) 2013-10-07 2018-07-03 Intel Corporation Adaptive learning environment driven by real-time identification of engagement level
JP2018152004A (ja) * 2017-03-15 2018-09-27 富士ゼロックス株式会社 情報処理装置及びプログラム
CN109002887A (zh) * 2018-08-10 2018-12-14 华北理工大学 生物启发式好奇心认知发育系统及其运行方法
JP2019508072A (ja) * 2016-12-02 2019-03-28 アヴェント インコーポレイテッド 医用撮像に基づく処置における標的の解剖学的対象物へのナビゲーションのためのシステムおよび方法
JP2020075385A (ja) * 2018-11-06 2020-05-21 株式会社東芝 製品状態推定装置
CN111190484A (zh) * 2019-12-25 2020-05-22 中国人民解放军军事科学院国防科技创新研究院 一种多模态交互系统和方法
KR20200103421A (ko) * 2019-02-25 2020-09-02 군산대학교산학협력단 기억 모델을 형성하는 방법 및 장치
JP2021030433A (ja) * 2020-07-21 2021-03-01 株式会社DailyColor ロボット制御装置
JPWO2021095211A1 (ja) * 2019-11-14 2021-05-20
JP6972434B1 (ja) * 2020-07-30 2021-11-24 三菱電機株式会社 行動特定装置、行動特定方法及び行動特定プログラム
JPWO2021240715A1 (ja) * 2020-05-28 2021-12-02
JP2022512233A (ja) * 2018-12-10 2022-02-02 インタラクティブ-エーアイ,エルエルシー 多言語スタイル依存音声言語処理のためのニューラル調整コード
US11272888B1 (en) 2021-06-22 2022-03-15 Nft Ip Holdings Llc Devices and systems that measure, quantify, compare, package, and capture human content in databases
WO2022054292A1 (ja) * 2020-09-14 2022-03-17 三菱電機株式会社 ロボット制御装置
CN114926837A (zh) * 2022-05-26 2022-08-19 东南大学 一种基于人-物时空交互行为的情感识别方法
JP2022539333A (ja) * 2019-07-03 2022-09-08 ソウル マシーンズ リミティド 哺乳動物モデル及び人工神経系の運動状態、又は挙動間の動態を模擬するアーキテクチャ、システム、並びに方法
US11511414B2 (en) 2019-08-28 2022-11-29 Daily Color Inc. Robot control device
CN115496113A (zh) * 2022-11-17 2022-12-20 深圳市中大信通科技有限公司 一种基于智能算法的情绪行为分析方法
US11551708B2 (en) * 2017-11-21 2023-01-10 Nippon Telegraph And Telephone Corporation Label generation device, model learning device, emotion recognition apparatus, methods therefor, program, and recording medium
CN116061210A (zh) * 2018-11-21 2023-05-05 索尼集团公司 信息处理装置、信息处理方法和计算机存储介质
WO2023166979A1 (ja) * 2022-03-01 2023-09-07 ソニーグループ株式会社 情報処理装置、情報処理方法、およびプログラム
CN117523664A (zh) * 2023-11-13 2024-02-06 书行科技(北京)有限公司 人体动作预测模型的训练方法、相关方法及相关产品
CN117909883A (zh) * 2024-01-15 2024-04-19 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 基于自适应交互图网络的情绪分类方法
JP2024116021A (ja) * 2023-02-15 2024-08-27 国立大学法人横浜国立大学 感情推定装置及び感情情報取得装置
US12171592B2 (en) 2019-08-30 2024-12-24 Avent, Inc. System and method for identification, labeling, and tracking of a medical instrument
US12307774B2 (en) 2019-09-18 2025-05-20 Sony Group Corporation Crewless aircraft and control method

Cited By (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9878445B2 (en) 2005-09-30 2018-01-30 Irobot Corporation Displaying images from a robot
US8583282B2 (en) * 2005-09-30 2013-11-12 Irobot Corporation Companion robot for personal interaction
US10661433B2 (en) 2005-09-30 2020-05-26 Irobot Corporation Companion robot for personal interaction
JP2009245236A (ja) * 2008-03-31 2009-10-22 Institute Of Physical & Chemical Research 情報処理装置、情報処理方法、およびプログラム
US9258482B2 (en) 2008-04-09 2016-02-09 Canon Kabushiki Kaisha Facial expression recognition apparatus, image sensing apparatus, facial expression recognition method, and computer-readable storage medium
US8780221B2 (en) 2008-04-09 2014-07-15 Canon Kabushiki Kaisha Facial expression recognition apparatus, image sensing apparatus, facial expression recognition method, and computer-readable storage medium
US9147107B2 (en) 2008-04-09 2015-09-29 Canon Kabushiki Kaisha Facial expression recognition apparatus, image sensing apparatus, facial expression recognition method, and computer-readable storage medium
JP2009288934A (ja) * 2008-05-28 2009-12-10 Sony Corp データ処理装置、データ処理方法、及びプログラム
JP2011090408A (ja) * 2009-10-20 2011-05-06 Canon Inc 情報処理装置、その行動推定方法及びプログラム
JP2011232822A (ja) * 2010-04-23 2011-11-17 Canon Inc 情報処理装置、情報処理方法及びプログラム
US11610500B2 (en) 2013-10-07 2023-03-21 Tahoe Research, Ltd. Adaptive learning environment driven by real-time identification of engagement level
US12183218B2 (en) 2013-10-07 2024-12-31 Tahoe Research, Ltd. Adaptive learning environment driven by real-time identification of engagement level
US10013892B2 (en) 2013-10-07 2018-07-03 Intel Corporation Adaptive learning environment driven by real-time identification of engagement level
JP2015114987A (ja) * 2013-12-13 2015-06-22 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 処理装置、処理方法、およびプログラム
JP2015171737A (ja) * 2014-03-11 2015-10-01 本田技研工業株式会社 ロボット、およびロボットの制御方法
KR20160066526A (ko) * 2014-12-02 2016-06-10 삼성전자주식회사 사용자의 상태를 나타내는 상태 데이터를 획득하는 방법 및 디바이스
US10878325B2 (en) 2014-12-02 2020-12-29 Samsung Electronics Co., Ltd. Method and device for acquiring state data indicating state of user
JP2016110631A (ja) * 2014-12-02 2016-06-20 三星電子株式会社Samsung Electronics Co.,Ltd. 状態推定装置、状態推定方法およびプログラム
KR102572698B1 (ko) * 2014-12-02 2023-08-31 삼성전자주식회사 사용자의 상태를 나타내는 상태 데이터를 획득하는 방법 및 디바이스
US20160180722A1 (en) * 2014-12-22 2016-06-23 Intel Corporation Systems and methods for self-learning, content-aware affect recognition
JP2017087344A (ja) * 2015-11-10 2017-05-25 株式会社国際電気通信基礎技術研究所 アンドロイドロボットの制御システム、装置、プログラムおよび方法
WO2017175447A1 (ja) * 2016-04-05 2017-10-12 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
JP2018072876A (ja) * 2016-10-24 2018-05-10 富士ゼロックス株式会社 感情推定システム、感情推定モデル生成システム
JP2019508072A (ja) * 2016-12-02 2019-03-28 アヴェント インコーポレイテッド 医用撮像に基づく処置における標的の解剖学的対象物へのナビゲーションのためのシステムおよび方法
US10657671B2 (en) 2016-12-02 2020-05-19 Avent, Inc. System and method for navigation to a target anatomical object in medical imaging-based procedures
CN108229640A (zh) * 2016-12-22 2018-06-29 深圳光启合众科技有限公司 情绪表达的方法、装置和机器人
CN108229640B (zh) * 2016-12-22 2021-08-20 山西翼天下智能科技有限公司 情绪表达的方法、装置和机器人
JP2018152004A (ja) * 2017-03-15 2018-09-27 富士ゼロックス株式会社 情報処理装置及びプログラム
US11551708B2 (en) * 2017-11-21 2023-01-10 Nippon Telegraph And Telephone Corporation Label generation device, model learning device, emotion recognition apparatus, methods therefor, program, and recording medium
CN109002887A (zh) * 2018-08-10 2018-12-14 华北理工大学 生物启发式好奇心认知发育系统及其运行方法
JP2020075385A (ja) * 2018-11-06 2020-05-21 株式会社東芝 製品状態推定装置
JP7021052B2 (ja) 2018-11-06 2022-02-16 株式会社東芝 製品状態推定装置
CN116061210A (zh) * 2018-11-21 2023-05-05 索尼集团公司 信息处理装置、信息处理方法和计算机存储介质
CN116061210B (zh) * 2018-11-21 2025-10-24 索尼集团公司 信息处理装置、信息处理方法和计算机存储介质
JP2022512233A (ja) * 2018-12-10 2022-02-02 インタラクティブ-エーアイ,エルエルシー 多言語スタイル依存音声言語処理のためのニューラル調整コード
KR20200103421A (ko) * 2019-02-25 2020-09-02 군산대학교산학협력단 기억 모델을 형성하는 방법 및 장치
KR102158989B1 (ko) 2019-02-25 2020-09-23 군산대학교 산학협력단 기억 모델을 형성하는 방법 및 장치
JP2022539333A (ja) * 2019-07-03 2022-09-08 ソウル マシーンズ リミティド 哺乳動物モデル及び人工神経系の運動状態、又は挙動間の動態を模擬するアーキテクチャ、システム、並びに方法
JP7781645B2 (ja) 2019-07-03 2025-12-08 ソウル マシーンズ リミティド コンピュータ実装方法
US11511414B2 (en) 2019-08-28 2022-11-29 Daily Color Inc. Robot control device
US12171592B2 (en) 2019-08-30 2024-12-24 Avent, Inc. System and method for identification, labeling, and tracking of a medical instrument
US12307774B2 (en) 2019-09-18 2025-05-20 Sony Group Corporation Crewless aircraft and control method
JPWO2021095211A1 (ja) * 2019-11-14 2021-05-20
JP7205646B2 (ja) 2019-11-14 2023-01-17 富士通株式会社 出力方法、出力プログラム、および出力装置
CN111190484A (zh) * 2019-12-25 2020-05-22 中国人民解放军军事科学院国防科技创新研究院 一种多模态交互系统和方法
CN111190484B (zh) * 2019-12-25 2023-07-21 中国人民解放军军事科学院国防科技创新研究院 一种多模态交互系统和方法
JP7400965B2 (ja) 2020-05-28 2023-12-19 日本電信電話株式会社 気分予測方法、気分予測装置及びプログラム
JPWO2021240715A1 (ja) * 2020-05-28 2021-12-02
JP2021030433A (ja) * 2020-07-21 2021-03-01 株式会社DailyColor ロボット制御装置
WO2022024294A1 (ja) * 2020-07-30 2022-02-03 三菱電機株式会社 行動特定装置、行動特定方法及び行動特定プログラム
JP6972434B1 (ja) * 2020-07-30 2021-11-24 三菱電機株式会社 行動特定装置、行動特定方法及び行動特定プログラム
JPWO2022054292A1 (ja) * 2020-09-14 2022-03-17
JP7301238B2 (ja) 2020-09-14 2023-06-30 三菱電機株式会社 ロボット制御装置
WO2022054292A1 (ja) * 2020-09-14 2022-03-17 三菱電機株式会社 ロボット制御装置
US11382570B1 (en) 2021-06-22 2022-07-12 Nft Ip Holdings Llc Encrypted securitized databases for devices and systems that measure, quantify, compare, package, and capture data
US11272888B1 (en) 2021-06-22 2022-03-15 Nft Ip Holdings Llc Devices and systems that measure, quantify, compare, package, and capture human content in databases
WO2023166979A1 (ja) * 2022-03-01 2023-09-07 ソニーグループ株式会社 情報処理装置、情報処理方法、およびプログラム
CN114926837A (zh) * 2022-05-26 2022-08-19 东南大学 一种基于人-物时空交互行为的情感识别方法
CN114926837B (zh) * 2022-05-26 2023-08-04 东南大学 一种基于人-物时空交互行为的情感识别方法
CN115496113A (zh) * 2022-11-17 2022-12-20 深圳市中大信通科技有限公司 一种基于智能算法的情绪行为分析方法
JP2024116021A (ja) * 2023-02-15 2024-08-27 国立大学法人横浜国立大学 感情推定装置及び感情情報取得装置
CN117523664A (zh) * 2023-11-13 2024-02-06 书行科技(北京)有限公司 人体动作预测模型的训练方法、相关方法及相关产品
CN117909883A (zh) * 2024-01-15 2024-04-19 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 基于自适应交互图网络的情绪分类方法
CN117909883B (zh) * 2024-01-15 2025-11-07 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 基于自适应交互图网络的情绪分类方法

Similar Documents

Publication Publication Date Title
JP2005199403A (ja) 情動認識装置及び方法、ロボット装置の情動認識方法、ロボット装置の学習方法、並びにロボット装置
US8145492B2 (en) Robot behavior control system and method, and robot apparatus
KR100864339B1 (ko) 로봇 장치 및 로봇 장치의 행동 제어 방법
JP7520123B2 (ja) 人間-ロボット混在製造プロセスにおける自動異常検出のためのシステムおよび方法
EP4144425A1 (en) Behavior control device, behavior control method, and program
US8484146B2 (en) Interaction device implementing a bayesian's estimation
US7133744B2 (en) Information processing apparatus and method, program storage medium, and program
JP4179230B2 (ja) ロボット装置及びその動作制御方法
JPWO2002099545A1 (ja) マン・マシン・インターフェースユニットの制御方法、並びにロボット装置及びその行動制御方法
KR20020008848A (ko) 로봇 장치, 로봇 장치의 행동 제어 방법, 외력 검출 장치및 외력 검출 방법
CN120095830B (zh) 机器人控制方法、计算机设备及计算机可读存储介质
JP2005238422A (ja) ロボット装置、並びにその状態遷移モデル構築方法及び行動制御方法
JP2007280053A (ja) データ処理装置、データ処理方法、およびプログラム
Xu et al. Turn-taking prediction for human–robot collaborative assembly considering human uncertainty
JP4296736B2 (ja) ロボット装置
JP2004302644A (ja) 顔識別装置、顔識別方法、記録媒体、及びロボット装置
Woo et al. Emotional empathy model for robot partners using recurrent spiking neural network model with Hebbian-LMS learning
JP2009140454A (ja) データ処理装置、データ処理方法、及びプログラム
CN121034556A (zh) 虚拟现实环境下面向共情交互的自适应情绪调节方法
JP2002205289A (ja) ロボット装置の動作制御方法、プログラム、記録媒体及びロボット装置
JP2009053782A (ja) データ処理装置、データ処理方法、及びプログラム
Esau et al. Emotional communication with the robot head MEXI
Policastro et al. Learning of shared attention in sociable robotics
Esau et al. Integration of emotional reactions on human facial expressions into the robot head MEXI
JP4552490B2 (ja) ロボット装置及びその情動制御方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070403