JPH11272293A - 遠隔制御装置 - Google Patents
遠隔制御装置Info
- Publication number
- JPH11272293A JPH11272293A JP10076178A JP7617898A JPH11272293A JP H11272293 A JPH11272293 A JP H11272293A JP 10076178 A JP10076178 A JP 10076178A JP 7617898 A JP7617898 A JP 7617898A JP H11272293 A JPH11272293 A JP H11272293A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- voice
- remote control
- control device
- outputs
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
Abstract
(57)【要約】
【構成】 遠隔制御装置10は、入力音声を認識する音
声認識処理装置12、身振り等の入力動作を認識する動
作認識処理装置14およびこれら認識処理装置12およ
び14からの出力を演算する演算処理装置16を含み、
この演算制御装置16から制御信号を被制御機器へ出力
する。 【効果】 音声認識処理装置12と身振り等の動作認識
処理装置14とを組み合わすことにより、認識率が格段
に向上し、被制御機器を正確に制御する。
声認識処理装置12、身振り等の入力動作を認識する動
作認識処理装置14およびこれら認識処理装置12およ
び14からの出力を演算する演算処理装置16を含み、
この演算制御装置16から制御信号を被制御機器へ出力
する。 【効果】 音声認識処理装置12と身振り等の動作認識
処理装置14とを組み合わすことにより、認識率が格段
に向上し、被制御機器を正確に制御する。
Description
【0001】
【産業上の利用分野】この発明は、遠隔制御装置に関
し、特にたとえばビデオテープレコーダ(VTR)等を
遠隔制御する、遠隔制御装置に関する。
し、特にたとえばビデオテープレコーダ(VTR)等を
遠隔制御する、遠隔制御装置に関する。
【0002】
【従来の技術】従来、この種の遠隔制御装置としては、
音声認識技術を利用してカーステレオ等を遠隔制御する
ものが実用化されている。
音声認識技術を利用してカーステレオ等を遠隔制御する
ものが実用化されている。
【0003】
【発明が解決しようとする課題】従来の音声認識技術に
よる遠隔制御では、騒音下や被制御機器等から発せられ
る音声による誤認識のために、正確な遠隔制御ができな
いという問題があった。それゆえに、この発明の主たる
目的は、音声認識技術を用いてより確実に被制御機器を
遠隔制御ができる、遠隔制御装置を提供することであ
る。
よる遠隔制御では、騒音下や被制御機器等から発せられ
る音声による誤認識のために、正確な遠隔制御ができな
いという問題があった。それゆえに、この発明の主たる
目的は、音声認識技術を用いてより確実に被制御機器を
遠隔制御ができる、遠隔制御装置を提供することであ
る。
【0004】
【課題を解決するための手段】この発明は、入力音声を
認識する音声認識手段、入力動作を認識する動作認識手
段、および音声認識手段および動作認識手段の出力に基
づいて制御信号を出力する制御手段を備える、遠隔制御
装置である。
認識する音声認識手段、入力動作を認識する動作認識手
段、および音声認識手段および動作認識手段の出力に基
づいて制御信号を出力する制御手段を備える、遠隔制御
装置である。
【0005】
【作用】たとえば、音声認識手段によって認識した音声
による制御内容と、動作認識手段によって認識した動作
による制御内容が一致したとき、制御手段が制御信号を
出力して被制御機器を遠隔制御する。
による制御内容と、動作認識手段によって認識した動作
による制御内容が一致したとき、制御手段が制御信号を
出力して被制御機器を遠隔制御する。
【0006】
【発明の効果】この発明によれば、音声認識手段と動作
認識手段を組み合わせたことにより、音声認識のみによ
るものに比較して認識率を向上させることができる。そ
のため、被制御機器を正確に制御することができる。こ
の発明の上述の目的,その他の目的,特徴および利点
は、図面を参照して行う以下の実施例の詳細な説明から
一層明らかとなろう。
認識手段を組み合わせたことにより、音声認識のみによ
るものに比較して認識率を向上させることができる。そ
のため、被制御機器を正確に制御することができる。こ
の発明の上述の目的,その他の目的,特徴および利点
は、図面を参照して行う以下の実施例の詳細な説明から
一層明らかとなろう。
【0007】
【実施例】図1に示すこの実施例の遠隔制御装置10
は、入力音声を認識する音声認識処理装置12,身振り
等の入力動作(ジェスチャ)を認識する動作認識処理装
置14およびこれら認識処理装置12および14の出力
に基づいて被制御機器(図示せず)を遠隔制御する演算
結果(制御信号)を出力する演算制御装置16を含む。
音声認識処理装置12は、音声を入力するマイク18,
アンプ20,A/D変換22,予め複数の認識対象語を
登録した音声データベース24およびその音声データベ
ース24を参照してマイク18からの入力音声を認識す
る音声認識処理26を含む。
は、入力音声を認識する音声認識処理装置12,身振り
等の入力動作(ジェスチャ)を認識する動作認識処理装
置14およびこれら認識処理装置12および14の出力
に基づいて被制御機器(図示せず)を遠隔制御する演算
結果(制御信号)を出力する演算制御装置16を含む。
音声認識処理装置12は、音声を入力するマイク18,
アンプ20,A/D変換22,予め複数の認識対象語を
登録した音声データベース24およびその音声データベ
ース24を参照してマイク18からの入力音声を認識す
る音声認識処理26を含む。
【0008】また、動作認識処理装置14は、身振り等
の動作を入力するレンズ28を有するCCDカメラ3
0,予め複数の認識対象動作を登録した動作データベー
ス32およびその動作データベース32を参照してCC
Dカメラ30で撮影した動作(ジェスチャ)を認識する
動作認識処理34とで構成している。さらに、演算制御
装置16は、音声認識処理装置12および動作認識処理
装置14の双方からの出力を演算して、その演算結果を
制御信号として出力する演算部36を含む。
の動作を入力するレンズ28を有するCCDカメラ3
0,予め複数の認識対象動作を登録した動作データベー
ス32およびその動作データベース32を参照してCC
Dカメラ30で撮影した動作(ジェスチャ)を認識する
動作認識処理34とで構成している。さらに、演算制御
装置16は、音声認識処理装置12および動作認識処理
装置14の双方からの出力を演算して、その演算結果を
制御信号として出力する演算部36を含む。
【0009】図1に示す演算結果は、別のCPUやマイ
コンに入力されることもあるが、被制御機器、たとえば
VTRにこのような遠隔制御装置10が一体に組み込ま
れている場合、図1の各認識処理26および34ならび
に演算部36がその被制御機器のCPUやマイコンで構
成される。この場合、演算結果出力が、制御信号、たと
えば、テープの巻き戻し、早送り、プレイなどになる。
コンに入力されることもあるが、被制御機器、たとえば
VTRにこのような遠隔制御装置10が一体に組み込ま
れている場合、図1の各認識処理26および34ならび
に演算部36がその被制御機器のCPUやマイコンで構
成される。この場合、演算結果出力が、制御信号、たと
えば、テープの巻き戻し、早送り、プレイなどになる。
【0010】図2を参照して、図1実施例の遠隔制御装
置10において、まず、ステップS1で音声入力の有無
を判断し、同時にステップS2で動作入力の有無を判断
する。その結果、“NO”であればステップS1および
ステップS2にそれぞれ戻り、“YES”の場合、ステ
ップS3とステップS4とにおいて、それぞれ、入力音
声と音声データベースに予め登録した音声とを比較し、
入力動作と動作データベースに予め登録した動作とを比
較する。つぎに、ステップS5およびステップS6でそ
れぞれの比較結果(A、B)を出力し、ステップS7で
これらの出力(A、B)を演算し、ステップS9で演算
結果を出力する。そして一連の動作を終了する。
置10において、まず、ステップS1で音声入力の有無
を判断し、同時にステップS2で動作入力の有無を判断
する。その結果、“NO”であればステップS1および
ステップS2にそれぞれ戻り、“YES”の場合、ステ
ップS3とステップS4とにおいて、それぞれ、入力音
声と音声データベースに予め登録した音声とを比較し、
入力動作と動作データベースに予め登録した動作とを比
較する。つぎに、ステップS5およびステップS6でそ
れぞれの比較結果(A、B)を出力し、ステップS7で
これらの出力(A、B)を演算し、ステップS9で演算
結果を出力する。そして一連の動作を終了する。
【0011】ここで、入力動作および入力音声が各認識
処理34および26でどのように認識されかつ演算部3
6がどのような演算結果を出力するかを説明する。たと
えば、指をぐるぐる回す入力動作は、その方向のいかん
に拘わらず、動作認識処理34では、予め登録された動
作データベースを参照して「巻戻しまたは早送り」と認
識する。他方、巻戻しまたは早送りの入力音声は音声認
識処理26では、予め登録された音声データベースを参
照してそれぞれ「巻戻し」または「早送り」と認識され
る。この動作認識結果および音声認識結果を演算部36
が演算し、制御信号として「巻戻し」または「早送り」
を出力する。
処理34および26でどのように認識されかつ演算部3
6がどのような演算結果を出力するかを説明する。たと
えば、指をぐるぐる回す入力動作は、その方向のいかん
に拘わらず、動作認識処理34では、予め登録された動
作データベースを参照して「巻戻しまたは早送り」と認
識する。他方、巻戻しまたは早送りの入力音声は音声認
識処理26では、予め登録された音声データベースを参
照してそれぞれ「巻戻し」または「早送り」と認識され
る。この動作認識結果および音声認識結果を演算部36
が演算し、制御信号として「巻戻し」または「早送り」
を出力する。
【0012】また、指を立てただけの入力動作は、動作
認識処理34では「プレイ」または「録画」と認識さ
れ、入力音声が「プレイ」であれば、音声認識処理26
は「プレイ」と認識し、演算部36で演算されて演算結
果として「プレイ」を出力する。もし、入力音声が「録
画」であれば、音声認識処理26は「録画」と認識し、
演算部36で演算されて演算結果として「録画」を出力
する。
認識処理34では「プレイ」または「録画」と認識さ
れ、入力音声が「プレイ」であれば、音声認識処理26
は「プレイ」と認識し、演算部36で演算されて演算結
果として「プレイ」を出力する。もし、入力音声が「録
画」であれば、音声認識処理26は「録画」と認識し、
演算部36で演算されて演算結果として「録画」を出力
する。
【0013】このように、動作認識処理34で認識され
る認識対象動作の数は、音声認識処理26で認識される
認識対象語の数よりも少ないので、1つの認識対象動作
に対して複数の認識対象語を共通にする。また、音声認
識処理26および動作認識処理34からの認識出力をア
ナログ値として、たとえば、百分率(%)を出力する。
る認識対象動作の数は、音声認識処理26で認識される
認識対象語の数よりも少ないので、1つの認識対象動作
に対して複数の認識対象語を共通にする。また、音声認
識処理26および動作認識処理34からの認識出力をア
ナログ値として、たとえば、百分率(%)を出力する。
【0014】この場合、たとえば、音声認識処理26は
40%の確率で「早送り」を出力、動作認識処理34は
60%の確率で「指を回す」を出力したとする。演算部
36では、双方の確率が50%以上の場合に正常な演算
結果を出力するものとすれば、この場合演算部36は演
算結果を出力しない。また、演算部36が双方の確率を
合計し、その合計値が100%を超えた場合に正常な演
算結果を出力するものとすると、どちらか一方の認識率
さえ高ければこの場合認識できる。たとえば、2つの同
音異義語の場合、最高に明瞭に認識できても音声認識出
力の確率は50%となり、この場合、動作認識がどちら
か50%を超えていたら100%となる。
40%の確率で「早送り」を出力、動作認識処理34は
60%の確率で「指を回す」を出力したとする。演算部
36では、双方の確率が50%以上の場合に正常な演算
結果を出力するものとすれば、この場合演算部36は演
算結果を出力しない。また、演算部36が双方の確率を
合計し、その合計値が100%を超えた場合に正常な演
算結果を出力するものとすると、どちらか一方の認識率
さえ高ければこの場合認識できる。たとえば、2つの同
音異義語の場合、最高に明瞭に認識できても音声認識出
力の確率は50%となり、この場合、動作認識がどちら
か50%を超えていたら100%となる。
【0015】しかし、希には3つの同音異義語を認識す
る場合は音声認識処理26では一つの音声に対して3
3.3%の確率が最高となる。他方、動作認識処理34
の認識結果が66.7%を超えていれば何れか一つを認
識できることになる。なお、この実施例に示す遠隔制御
装置10は、被制御機器と分離して別体のリモコン装置
としてもよいが、被制御機器に一体に組み込んでもよ
い。
る場合は音声認識処理26では一つの音声に対して3
3.3%の確率が最高となる。他方、動作認識処理34
の認識結果が66.7%を超えていれば何れか一つを認
識できることになる。なお、この実施例に示す遠隔制御
装置10は、被制御機器と分離して別体のリモコン装置
としてもよいが、被制御機器に一体に組み込んでもよ
い。
【0016】また、被制御機器としては、VTR以外に
DVD(デジタルビデオディスク),テレビ,ゲーム機
器等に適用できるが、特に限定されるものではない。
DVD(デジタルビデオディスク),テレビ,ゲーム機
器等に適用できるが、特に限定されるものではない。
【図1】この発明の一実施例を示す電気ブロック図であ
る。
る。
【図2】図1実施例における動作を示すフローチャート
である。
である。
10 …遠隔制御装置 12 …音声認識処理装置 14 …動作認識処理装置 16 …演算制御装置
Claims (6)
- 【請求項1】入力音声を認識する音声認識手段、 入力動作を認識する動作認識手段、および前記音声認識
手段および前記動作認識手段の出力に基づいて制御信号
を出力する制御手段を備える、遠隔制御装置。 - 【請求項2】前記制御手段は前記音声認識手段の出力お
よび前記動作認識手段の出力を演算する演算手段を含
む、請求項1記載の遠隔制御装置。 - 【請求項3】前記音声認識手段は予め登録された複数の
認識対象語との比較で入力音声が認識される確率を出力
し、 前記動作認識手段は予め登録された複数の認識対象動作
との比較で入力動作が認識される確率を出力し、 前記演算手段は前記2つの確率を演算して演算結果を出
力する、請求項2記載の遠隔制御装置。 - 【請求項4】前記演算手段は前記2つの確率を合計し、
その合計確率が所定値を超えたとき前記制御手段は前記
制御信号を出力する、請求項3記載の遠隔制御装置。 - 【請求項5】前記演算手段は前記2つの確率を重み付け
して合計確率を演算する、請求項4記載の遠隔制御装
置。 - 【請求項6】前記音声認識手段に予め登録された認識対
象語の数が、前記動作認識手段に予め登録された認識対
象動作の数より多くかつ1つの認識動作対象は複数の認
識対象語に共通する、請求項3ないし5のいずれかに記
載の遠隔制御装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10076178A JPH11272293A (ja) | 1998-03-24 | 1998-03-24 | 遠隔制御装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10076178A JPH11272293A (ja) | 1998-03-24 | 1998-03-24 | 遠隔制御装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH11272293A true JPH11272293A (ja) | 1999-10-08 |
Family
ID=13597865
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP10076178A Pending JPH11272293A (ja) | 1998-03-24 | 1998-03-24 | 遠隔制御装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH11272293A (ja) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000148183A (ja) * | 1998-11-06 | 2000-05-26 | Sanyo Electric Co Ltd | 音声認識装置 |
| EP1104922A3 (de) * | 1999-11-26 | 2005-06-22 | Robert Bosch Gmbh | Vorrichtung und Verfahren zur Fernbedienung eines Autoradios |
| KR100527512B1 (ko) * | 2002-12-13 | 2005-11-09 | 현대자동차주식회사 | 차량 전자장비의 제어 방법 및 시스템 |
| JP2011128766A (ja) * | 2009-12-16 | 2011-06-30 | Canon Inc | 入力装置及び方法 |
| JP2013539565A (ja) * | 2010-06-22 | 2013-10-24 | マイクロソフト コーポレーション | ユーザー追跡フィードバック |
Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6120887B2 (ja) * | 1979-12-04 | 1986-05-24 | Dainippon Printing Co Ltd | |
| JPH01259414A (ja) * | 1988-04-06 | 1989-10-17 | Res Triangle Inst | 視聴覚発話認識装置 |
| JPH0782353B2 (ja) * | 1991-03-28 | 1995-09-06 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 音声及び手書き動作の統合型情報を用いたメッセージ認識システム及び方法 |
| JPH08234789A (ja) * | 1995-02-27 | 1996-09-13 | Sharp Corp | 統合認識対話装置 |
| JPH0934863A (ja) * | 1995-07-14 | 1997-02-07 | Hitachi Ltd | ニューラルネットワークによる情報統合処理方法 |
| JPH09325793A (ja) * | 1996-06-05 | 1997-12-16 | Oki Electric Ind Co Ltd | 音声認識方法及び装置 |
| JPH1031551A (ja) * | 1996-07-15 | 1998-02-03 | Mitsubishi Electric Corp | ヒューマンインターフェースシステムおよびこれを使用した高速移動物体位置検出装置 |
-
1998
- 1998-03-24 JP JP10076178A patent/JPH11272293A/ja active Pending
Patent Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6120887B2 (ja) * | 1979-12-04 | 1986-05-24 | Dainippon Printing Co Ltd | |
| JPH01259414A (ja) * | 1988-04-06 | 1989-10-17 | Res Triangle Inst | 視聴覚発話認識装置 |
| JPH0782353B2 (ja) * | 1991-03-28 | 1995-09-06 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 音声及び手書き動作の統合型情報を用いたメッセージ認識システム及び方法 |
| JPH08234789A (ja) * | 1995-02-27 | 1996-09-13 | Sharp Corp | 統合認識対話装置 |
| JPH0934863A (ja) * | 1995-07-14 | 1997-02-07 | Hitachi Ltd | ニューラルネットワークによる情報統合処理方法 |
| JPH09325793A (ja) * | 1996-06-05 | 1997-12-16 | Oki Electric Ind Co Ltd | 音声認識方法及び装置 |
| JPH1031551A (ja) * | 1996-07-15 | 1998-02-03 | Mitsubishi Electric Corp | ヒューマンインターフェースシステムおよびこれを使用した高速移動物体位置検出装置 |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000148183A (ja) * | 1998-11-06 | 2000-05-26 | Sanyo Electric Co Ltd | 音声認識装置 |
| EP1104922A3 (de) * | 1999-11-26 | 2005-06-22 | Robert Bosch Gmbh | Vorrichtung und Verfahren zur Fernbedienung eines Autoradios |
| KR100527512B1 (ko) * | 2002-12-13 | 2005-11-09 | 현대자동차주식회사 | 차량 전자장비의 제어 방법 및 시스템 |
| US9898675B2 (en) | 2009-05-01 | 2018-02-20 | Microsoft Technology Licensing, Llc | User movement tracking feedback to improve tracking |
| JP2011128766A (ja) * | 2009-12-16 | 2011-06-30 | Canon Inc | 入力装置及び方法 |
| JP2013539565A (ja) * | 2010-06-22 | 2013-10-24 | マイクロソフト コーポレーション | ユーザー追跡フィードバック |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8381238B2 (en) | Information processing apparatus, information processing method, and program | |
| WO2017154282A1 (ja) | 音声処理装置および音声処理方法 | |
| EP1085500B1 (en) | Voice recognition for controlling a device | |
| US20240292174A1 (en) | Audio rendering method, audio rendering apparatus and electronic apparatus | |
| CN101902559A (zh) | 图像音响处理装置及摄像装置 | |
| TWI790236B (zh) | 音量調節方法、裝置、電子設備及存儲介質 | |
| US20250350793A1 (en) | Systems and methods for handling audio disruptions | |
| WO2019184517A1 (zh) | 一种音频指纹提取方法及装置 | |
| JPH11272293A (ja) | 遠隔制御装置 | |
| US12051412B2 (en) | Control device, system, and control method | |
| US10747494B2 (en) | Robot and speech interaction recognition rate improvement circuit and method thereof | |
| KR102556815B1 (ko) | 전자 장치 및 이의 제어 방법 | |
| US11895479B2 (en) | Steering of binauralization of audio | |
| CN112243182A (zh) | 拾音电路、方法及装置 | |
| KR20230032426A (ko) | 음성 인식을 기반으로 경기 영상으로부터 타겟 영상을 검출하기 위한 컴퓨터 시스템 및 그의 방법 | |
| CN2854961Y (zh) | 声音控制的电视机 | |
| US20030101057A1 (en) | Method for serving user requests with respect to a network of devices | |
| CN112711392A (zh) | 多通道交互系统通道的置信度计算方法 | |
| CN114666667B (zh) | 视频关键点的生成方法、装置、电子设备及存储介质 | |
| EP4407618A1 (en) | Dynamic selection of appropriate far-field signal separation algorithms | |
| CN112689193A (zh) | 根据影像资讯判断是否播放音乐的音乐播放方法及其所对应的音乐播放系统 | |
| US11741967B2 (en) | Systems and methods for automatic speech recognition based on graphics processing units | |
| JP2000155595A (ja) | 撮像装置 | |
| JP3169667B2 (ja) | 音声信号選択回路 | |
| JP2007079416A (ja) | 画像データ作成装置、画像データ作成方法及びプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20030708 |