JPH01195499A - 音声入力装置 - Google Patents

音声入力装置

Info

Publication number
JPH01195499A
JPH01195499A JP63020291A JP2029188A JPH01195499A JP H01195499 A JPH01195499 A JP H01195499A JP 63020291 A JP63020291 A JP 63020291A JP 2029188 A JP2029188 A JP 2029188A JP H01195499 A JPH01195499 A JP H01195499A
Authority
JP
Japan
Prior art keywords
speaker
microphone
mouth
voice
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63020291A
Other languages
English (en)
Inventor
Kensuke Uehara
上原 堅助
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63020291A priority Critical patent/JPH01195499A/ja
Priority to US07/302,264 priority patent/US4961177A/en
Priority to GB8901828A priority patent/GB2215092B/en
Publication of JPH01195499A publication Critical patent/JPH01195499A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C9/00Individual registration on entry or exit
    • G07C9/30Individual registration on entry or exit not involving the use of a pass
    • G07C9/32Individual registration on entry or exit not involving the use of a pass in combination with an identity check
    • G07C9/37Individual registration on entry or exit not involving the use of a pass in combination with an identity check using biometric data, e.g. fingerprints, iris scans or voice recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Collating Specific Patterns (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は音声認識に供せられる音声を発話者から離れた
位置に設けられたマイクロフォンにて確実に入力するこ
とのできる音声入力装置に関する。
(従来の技術) 近時、音声認識技術を応用して重要施設への入退出を監
視・管理するシステムが種々開発されている。この種の
システムは、従来、専らIDカードを用いてゲート(ド
ア)の開閉を制御していたときの不具合(IDカード携
帯の必要性、  IDカードセット等の操作性の悪さ)
を解消し、対象者が発声した音声が示す!D番号を認識
したり、また入力音声の個人的特徴から発話者を同定す
る等して上記ゲート(゛ドア)の開閉を制御しようとす
るものである。このような音声認識技術を用いてシステ
ムによれば、例えばIDカードを常に携帯している必要
がない、また本人を確実に同定することができる等の効
果が奏せられる。
ところが入力音声を精度良く認識処理するには、周囲の
雑音の混入を防いで発話者が発声した音声のみをS/N
良く収集することが必要である。そこで従来では、ハン
ドセット形式のマイクロフォンや接話形のマイクロフォ
ンを用い、発話者の口元にマイクロフォンを十分近付け
た状態で音声入力することにより、入力音声のS/Nを
高めることが等が考えられている。しかしその為には、
−々マイクロフォンを把持する必要があり、操作性の点
で新たな問題が生じる。
そこで防音壁を設備することで周囲の騒音を遮ったり、
また指向性の鋭いマイクロフォンを用いることで発話者
の音声だけを拾うことが検討されている。しかし防音壁
等を設備することは経費がかさみ、音声入力装置の利用
対象分野が大幅に制限されてしまう等の問題がある。ま
た指向性の鋭いマイクロフォンを用いた場合には、その
指向性ビームの向きが発話者の口元からずれると、逆に
周囲の雑音を多く拾うようになり、そのS/Nが大幅に
劣化すると云う問題がある。
(発明が解決しようとする課題) このように音声認識処理技術を用いた種々のシステムで
用いられる従来の音声入力装置にあっては、発話者が発
声する音声を如何にしてS / N良く収集して音声入
力するかと云う点で問題があった。
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、発話者が発声する音声をS/N
良く確実に収集して音声入力し、認識処理等に供するこ
とのできる音声入力装置を提供することにある。
[発明の構成コ (課題を解決するための手段) 本発明は、指向性の鋭いマイクロフォンを、その指向性
ビームの向きを可変設定可能に所定の位置に取付け、こ
のマイクロフォンの指向性ビームの向きを発話者の口元
に向けて発話者が発声する音声を収集しようとするもの
であり、カメラにて撮像入力された発話者の像からその
発話者の口の位置を検出し、検出された発話者の口の位
置と前記マイクロフォンの取付は位置とから前記マイク
ロフォンの指向性ビームが前記発話者の口に向く向きを
求め、この向きの情報に従って前記マイクロフォンの指
向性ビームの向きを可変制御するようにしたことを特徴
とするものである。
(作用) 本発明によれば、発話者が予め定められた音声入力領域
に入り、システムに対して音声入力しようとすると、そ
の発話者の像がカメラにて撮像入力され、所定の画像処
理技術を用いて発話者の口の位置が検出される。すると
この検出された口の位置情報とマイクロフォンが取付け
られた位置の情報とから該マイクロフォンの指向性ビー
ムが発話者の口元に向く向きが計算され、その情報に従
って前記マイクロフォンの指向性ビームの向きが制御さ
れ、発話者の口元に向けられる。
この結果、指向性の鋭いマイクロフォンを用いて発話者
が発声する音声を確実に、S/N良く入力することが可
能となり、音声認識処理等に効果的に供することが可能
となる。
(実施例) 以下、図面を参照して本発明の一実施例につき説明する
第1図は本発明の一実施例に係る音声入力装置の概略的
な構成を示すブロック図であり、第2図はその作用を模
式的に示す図である。この実施例装置は音声認識技術を
用いてドアの開閉を制御し、ドアを通過する入退出者を
監視・管理するシステムに組込まれる。尚、音声入力に
よる自動券売機等、その他のシステムにも適宜適用可能
なことは勿論のことである。
しかしてここで用いられるマイクロフォンlは鋭い単一
指向性を有するもので、マイクロフォン駆動サーボ機構
2により支持されて、例えばドア近傍の壁面Aの上方部
に取付けられる。そしてマイクロフォン駆動サーボ機構
2の動作により、マイクロフォンlの指向性ビームの向
きが、上記壁面Aの前方の音声入力領域Bを指向する範
囲において可変制御されるものとなっている。このマイ
クロフォン1を介して収集された音声が、音声認識装置
3に入力されて音声認識処理に供される。
そして音声認識結果は制御器4に与えられ、ドア開閉機
構5の駆動によるドアの開閉制御等に用いられる。
また上記壁面Aには、上記音声入力領域Bに入り込んで
音声を発声する発話者Cを撮像する為のカメラ6が設け
られており、発話者Cの像を第3図に示すように撮像入
力している。このカメラ6にて撮像入力された発話者C
の像が画像処理装置7にて処理され、後述するようにそ
の発話者Cの口の位置が求められる。そしてその口の位
置の情報が前記制御器4に与えられ、前記マイクロフォ
ン1の指向性ビームの向きの制御に用いられる。
尚、前記壁面Aに対向して音声人力領域Bの後方に設け
られたパネルDは、発話者Cの後方の不要な背景部の前
記カメラ6による写り込みを防止するものであるが、例
えばカメラ6のレンズ系における焦点深度等を利用して
背景画にボケを与えるような場合には、発話者Cの像と
その背景部との識別が容易であるから上記パネルDを省
略することも可能である。
また前記壁面Aに組込まれたスピーカ8は、システム側
から発話者Cに対して種々の音声メツセージを出力する
ものである。制御器4の制御を受けて起動される音声応
答装置9は、システム側から与えられるメツセージ情報
に従ってその音声信号を規則合成法等により音声合成し
、」二足スピーカ8を駆動して音声メツセージの出力を
行なう。
また壁面Aに取付けられた超音波センサ10は、距離検
出回路11による付勢を受けて超音波を前記発話者Cに
向けて送波し、発話者Cにより反射された」二足超音波
を受波する。距離検出回路11は上記超音波の送波タイ
ミングから受波タイミングまでの時間を計測し、前記音
声入力領域Bに入込んだ発話者Cの壁面Aからの距離を
検出するものである。このようにして検出された発話者
Cまでの距離情報も前記制御器4に入力され、前述した
マイクロフォン1の指向性ビームの向きの制御に用いら
れる。
尚、12は制御器4に接続されたホスト計算機である。
このホスト計算機12にて、例えば前記音声認識装置3
で求められた入力音声に対する認識結果と、予め登録さ
れている管理情報との照合等が行なわれる。また入力音
声に対する回答メツセージの生成や、発話者Cに対する
ガイダンス・メツセージ等の生成等が行なわれる。
さて次に本装置の特徴的な作用であるマイクロフォン■
の指向性ビームの向きの制御について説明する。この制
御は前記カメラ6を介して撮像入力された発話者Cの像
から求められる口の位置の情報、超音波センサ10を用
いて検出される発話者までの距離の情報、そして前記マ
イクロフォン1の取付は位置の情報に従って行なわれる
即ち、画像処理装置7はカメラ6にて撮像入力された画
像信号中から背景画部分の情報を除去し、残された発話
者Cの像について第3図に示すように水平方向の射影X
を求めている。そしてその射影Xの成分を画像の上側a
から調べ、その輝度の射影値が最初に変化する部分すを
発話者の頭頂として検出している。その後、上記輝度の
射影値の変化を順に調べ、額部分d、目の部分01口の
部分21首の部分りをそれぞれ求める。つまり発話者C
の顔の像において、はぼ均一な輝度として求められる肌
の部分に比較して、髪(頭)の部分。
目の部分および口の部分の輝度が大きく異なることから
、その輝度差と検出位置の関係から発話者Cの像中の口
の高さ位fi M xを検出している。
その後、上述した如く検出される顔の部分について水平
方向の輝度変化Yを求め、画像中における両耳の位置を
検出し、顔が存在する水平方向の位置F1.F2をそれ
ぞれ求めている。この顔の位置Fl、F2から水平方向
における口の位置Myを、My −(Fl +F2 )
÷2 として求めている。
このようにしてカメラ6にて撮像入力された発話者Cの
画像中の、その画面上における発話者の口の位置が求め
られると、前記カメラ6のレンズ系によって規定される
光学系位置と、前記超音波センサ10を用いて検出され
た発話者Cまでの距離の情報とから前記音声入力領域B
を構成する3次光空間上における発話者Cの口の位置が
計算される。この口の位置情報と、同じ3次元空間に設
けられた前記マイクロフォン1の位置とから、該マイク
ロフォン1から発話者Cの口に向かう上記3次元空間上
での向き(相対角度)が計算される。
そしてマイクロフォン1の指向性ビームの向きが、この
計算された向きに向かうように前記マイクロフォン駆動
サーボ機構2が駆動され、指向性ビームの向きが調整さ
れる。
この結果、マイクロフォン1はそのビームの向きを発話
者Cの口に向けることになり、発話者Cが発声する音声
をS/N良く収集することが可能となる。
このように構成され、作用する本装置を用いたゲートの
入退出管理システムにおける処理動作の一例を示すと、
先ず前記超音波を利用して音声入力領域Bに発話者が進
入したか否かを検出することから行なわれる。このよう
な発話者Cの検出により、本装置が起動される。
しかして先ず、前記音声応答装置9を起動し、発話者C
に対して 「カメラに向かって下さい。」 なる音声メツセージを出力し、カメラ6に向かった発話
者Cを撮像入力する。どうどに前記超音波を用いて発話
者Cまでの距離を求める。その誤前述したようにして発
話者Cの口の位置を求め、マイクロフォンlの指向性ビ
ームを発話者の口に向ける。
以上の処理手続きによって音声入力の為の”Gfが整え
られる。しかる後、発話者Cに対してrID番号を発声
して下さい。」 なる音声メツセージを出力し、発話者Cが発声する音声
を前記マイクロフォン1にて収集する。このようにして
収集された入力音声を前記音声認識部3にて認識処理し
、その認識結果を制御器4を介してホスト計算機12に
与える。
ここで入力音声の認識処理に失敗する等した場合には、
例えば 「−語一語区切ってID番号を発声して下さい。」等の
音声メツセージを適宜出力して音声の再入力を促し、再
入力された音声を認識処理する。
その後、音声認識して求められたID番号を予め登録さ
れている管理データと照合し、入退出が許可されている
場合には前記ドア開閉機構5を駆動してドアを開ける。
この場合には、 「ドアを開けますので、お入り下さい1rID番号が登
録されていませんので、ドアは開けられません。   
   」等の音声メツセージを出力し、一連の処理を終
了する。
尚、上記音声認識処理に際しては、入力音声の個人的特
徴を抽出して個人同定するようにしても良いことは勿論
のことである。
以上のように本装置によれば、鋭い指向性を持つマイク
ロフォン1の指向方向を発話者Cの口に効果的に向ける
ことができるので、発話者が発声する音声を確実に、し
かもS/N良く入力することができる。またこのような
指向性の鋭いマイクロフォン1を用いるので、そのS/
Nを十分に確保したままマイクロフォン1を発話者Cか
ら離れた位置に設けることができる。この結果、マイク
ロフォン1の存在を意識することなく自然発声すること
ができ、異和感なく音声入力することが可能となる。し
かも手が塞がった状態でも、音声により簡易にID番号
等の情報を入力することが可能となる。
また上述したように自然性良く発声することが可能とな
るので、その入力音声中に個人的特徴が良く反映される
ようになり、従って個人同定の精度を高めることが可能
となる等の効果も期待できる。
尚、本発明は上述した実施例に限定されるものではない
。ここではドアの開閉制御による大退出管理システムに
組込まれる音声人力装置につき説明したが、その他のシ
ステムについても同様に適用可能である。また画像処理
の形態も特に限定されるものではなく、この画像処理に
よって発話者Cまでの距離を求めるようにしても良い。
この場合には、超音波を用いた距離計測が不要となる。
まな音声入力領域の床面に所謂踏み板スィッチを設けて
発話者の入り込みやその距離検出を行なうようにしても
良い。その他、本発明はその要旨を逸脱しない範囲で種
々変形して実施することができる。
[発明の効果] 以上説明したように本発明によれば、指向性の鋭いマイ
クロフォンを用い、カメラを用いて撮像された発話者の
像を画像処理して求められる発話者の口に向けて上記マ
イクロフォンの指向ビームの向きを合せるので、発話者
が発声する音声を確実に、しかもS/N良く収集して音
声入力することができる。更にはマイクロフォンを発話
者から離して設けることができるので、自然性の良い音
声入力環境を形成することができ、またマイクロフォン
を把持しなければならない等の不具合を効果的に回避す
ることができる等の実用上多大なる効果が奏せられる。
【図面の簡単な説明】
第1図は本発明の一実施例に係る音声入力装置の概略的
な機能ブロック図、第2図は実施例装置における各部の
作用を模式的に示す図、第3図は画像処理による発話者
の口の位置の検出作用を説明する為の図である。 l・・・マイクロフォン、2・・・マイクロフォン駆動
サーボ機構、3・・・音声認識装置、4・・・制御器、
5・・・ドア開閉機構、6・・・カメラ、7・・・画像
処理装置、8・・・スピーカ、9・・・音声応答装置、
10・・・超音波センサ、11・・・距離検出回路、1
2・・・ホスト計算機。 出願人代理人 弁理士 鈴江武彦 ′I 第1図 第2図 第3図

Claims (1)

    【特許請求の範囲】
  1. 所定の位置に取付けられた指向性の鋭いマイクロフォン
    と、発話者を撮像するカメラと、このカメラにて撮像入
    力された像から上記発話者の口の位置を検出する手段と
    、この手段により検出された発話者の口の位置と前記マ
    イクロフォンの取付け位置とから前記マイクロフォンの
    指向性ビームが前記発話者の口に向く向きを求める手段
    と、この向きの情報に従って前記マイクロフォンの指向
    性ビームの向きを可変制御する手段とを具備し、前記マ
    イクロフォンの指向性ビームを前記発話者の口に向けた
    状態で前記発話者が発声する音声を前記マイクロフォン
    にて収集することを特徴とする音声入力装置。
JP63020291A 1988-01-30 1988-01-30 音声入力装置 Pending JPH01195499A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP63020291A JPH01195499A (ja) 1988-01-30 1988-01-30 音声入力装置
US07/302,264 US4961177A (en) 1988-01-30 1989-01-27 Method and apparatus for inputting a voice through a microphone
GB8901828A GB2215092B (en) 1988-01-30 1989-01-27 Method of, and apparatus for, receiving voice input from a person in a voice input area

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63020291A JPH01195499A (ja) 1988-01-30 1988-01-30 音声入力装置

Publications (1)

Publication Number Publication Date
JPH01195499A true JPH01195499A (ja) 1989-08-07

Family

ID=12023062

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63020291A Pending JPH01195499A (ja) 1988-01-30 1988-01-30 音声入力装置

Country Status (3)

Country Link
US (1) US4961177A (ja)
JP (1) JPH01195499A (ja)
GB (1) GB2215092B (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6583723B2 (en) 2001-02-23 2003-06-24 Fujitsu Limited Human interface system using a plurality of sensors
JP2004504743A (ja) * 2000-07-13 2004-02-12 フランス テレコム 双方向性のマルチメディアステーションの起動
JP2007531029A (ja) 2004-03-31 2007-11-01 スイスコム モービル アーゲー 音響通信のための方法およびシステム
JP2015506491A (ja) * 2011-12-29 2015-03-02 インテル・コーポレーション 音響信号の修正
JP2016200858A (ja) * 2015-04-07 2016-12-01 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
WO2024190485A1 (ja) * 2023-03-15 2024-09-19 ヤマハ株式会社 収音設定方法及び収音装置

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3138058B2 (ja) * 1992-05-25 2001-02-26 東芝キヤリア株式会社 換気扇の制御装置
US5224173A (en) * 1991-10-29 1993-06-29 Kuhns Roger J Method of reducing fraud in connection with employment, public license applications, social security, food stamps, welfare or other government benefits
WO1993014454A1 (en) * 1992-01-10 1993-07-22 Foster-Miller, Inc. A sensory integrated data interface
US5323470A (en) * 1992-05-08 1994-06-21 Atsushi Kara Method and apparatus for automatically tracking an object
US5687280A (en) * 1992-11-02 1997-11-11 Matsushita Electric Industrial Co., Ltd. Speech input device including display of spatial displacement of lip position relative to predetermined position
US5473726A (en) * 1993-07-06 1995-12-05 The United States Of America As Represented By The Secretary Of The Air Force Audio and amplitude modulated photo data collection for speech recognition
US5635981A (en) * 1995-07-10 1997-06-03 Ribacoff; Elie D. Visitor identification system
US5832440A (en) * 1996-06-10 1998-11-03 Dace Technology Trolling motor with remote-control system having both voice--command and manual modes
US5784446A (en) * 1996-11-01 1998-07-21 Cms Investors Method and apparatus for installing telephone intercom-voice messaging apparatus at doorbell for dwelling
US5991726A (en) * 1997-05-09 1999-11-23 Immarco; Peter Speech recognition devices
US5990579A (en) * 1998-04-03 1999-11-23 Ricci; Russell L. Remote controlled door strike plate
DE19854373B4 (de) * 1998-11-25 2005-02-24 Robert Bosch Gmbh Verfahren zur Steuerung der Empfindlichkeit eines Mikrofons
US6243683B1 (en) * 1998-12-29 2001-06-05 Intel Corporation Video control of speech recognition
GB9911935D0 (en) * 1999-05-21 1999-07-21 British Broadcasting Corp Tracking of moving objects
EP1157360A1 (en) * 1999-12-15 2001-11-28 Koninklijke Philips Electronics N.V. Speech command-controllable electronic apparatus preferably provided for co-operation with a data network
US6751589B1 (en) * 2000-09-18 2004-06-15 Hewlett-Packard Development Company, L.P. Voice-actuated generation of documents containing photographic identification
US20020085738A1 (en) * 2000-12-28 2002-07-04 Peters Geoffrey W. Controlling a processor-based system by detecting flesh colors
US6952672B2 (en) * 2001-04-25 2005-10-04 International Business Machines Corporation Audio source position detection and audio adjustment
KR100480781B1 (ko) * 2002-12-28 2005-04-06 삼성전자주식회사 치아영상으로부터 치아영역 추출방법 및 치아영상을이용한 신원확인방법 및 장치
JP4847022B2 (ja) * 2005-01-28 2011-12-28 京セラ株式会社 発声内容認識装置
JP2007208535A (ja) * 2006-01-31 2007-08-16 Aiphone Co Ltd 集合住宅インターホンシステム
US7535367B2 (en) * 2006-04-12 2009-05-19 Nitesh Ratnakar Airplane lavatory reservation system
US20080278007A1 (en) * 2007-05-07 2008-11-13 Steven Clay Moore Emergency shutdown methods and arrangements
EP2304647B1 (en) 2008-05-08 2018-04-11 Nuance Communication, Inc. Localizing the position of a source of a voice signal
TWI450202B (zh) * 2010-04-14 2014-08-21 Hon Hai Prec Ind Co Ltd 麥克風控制裝置及方法
CN102378097B (zh) * 2010-08-25 2016-01-27 赛恩倍吉科技顾问(深圳)有限公司 麦克风控制系统及方法
US20140098233A1 (en) * 2012-10-05 2014-04-10 Sensormatic Electronics, LLC Access Control Reader with Audio Spatial Filtering
CN103716446B (zh) * 2012-10-09 2016-12-21 中兴通讯股份有限公司 一种提高移动终端通话音质的方法及装置
US9414144B2 (en) 2013-02-21 2016-08-09 Stuart Mathis Microphone positioning system
CN106292732A (zh) * 2015-06-10 2017-01-04 上海元趣信息技术有限公司 基于声源定位和人脸检测的智能机器人转动方法
WO2018175959A1 (en) * 2017-03-23 2018-09-27 Joyson Safety Systems Acquisition Llc System and method of correlating mouth images to input commands
CN108615534B (zh) * 2018-04-04 2020-01-24 百度在线网络技术(北京)有限公司 远场语音降噪方法及系统、终端以及计算机可读存储介质
US10540139B1 (en) * 2019-04-06 2020-01-21 Clayton Janes Distance-applied level and effects emulation for improved lip synchronized performance

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4912778B1 (ja) * 1969-11-05 1974-03-27
JPS5688506A (en) * 1979-12-21 1981-07-18 Matsushita Electric Ind Co Ltd Heater
DE3009404A1 (de) * 1980-03-12 1981-09-17 Philips Patentverwaltung Gmbh, 2000 Hamburg Vorrichtung zum einstellen eines bewegbaren elektroakutischen schallwandlers
US4449189A (en) * 1981-11-20 1984-05-15 Siemens Corporation Personal access control system using speech and face recognition
JPS58162470A (ja) * 1982-03-24 1983-09-27 三菱電機株式会社 エレベ−タの呼び登録装置
JPS62239231A (ja) * 1986-04-10 1987-10-20 Kiyarii Rabo:Kk 口唇画像入力による音声認識方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004504743A (ja) * 2000-07-13 2004-02-12 フランス テレコム 双方向性のマルチメディアステーションの起動
US6583723B2 (en) 2001-02-23 2003-06-24 Fujitsu Limited Human interface system using a plurality of sensors
US6686844B2 (en) 2001-02-23 2004-02-03 Fujitsu Limited Human interface system using a plurality of sensors
JP2007531029A (ja) 2004-03-31 2007-11-01 スイスコム モービル アーゲー 音響通信のための方法およびシステム
JP2014063166A (ja) * 2004-03-31 2014-04-10 Swisscom Ag 移動無線デバイスと通信するための組み込まれた音響通信システムを有する眼鏡フレーム、及び対応する方法
JP2015506491A (ja) * 2011-12-29 2015-03-02 インテル・コーポレーション 音響信号の修正
JP2016200858A (ja) * 2015-04-07 2016-12-01 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
WO2024190485A1 (ja) * 2023-03-15 2024-09-19 ヤマハ株式会社 収音設定方法及び収音装置

Also Published As

Publication number Publication date
US4961177A (en) 1990-10-02
GB8901828D0 (en) 1989-03-15
GB2215092B (en) 1992-01-02
GB2215092A (en) 1989-09-13

Similar Documents

Publication Publication Date Title
JPH01195499A (ja) 音声入力装置
JP7337699B2 (ja) 口の画像を入力コマンドと相互に関連付けるシステム及び方法
CN106251874B (zh) 一种语音门禁和安静环境监控方法及系统
EP4002363B1 (en) Method and apparatus for detecting an audio signal, and storage medium
US5806036A (en) Speechreading using facial feature parameters from a non-direct frontal view of the speaker
JP2000112496A (ja) ビデオ・イメ―ジ及びビデオ・デ―タの獲得装置及び方法
WO2007138503A1 (en) Method of driving a speech recognition system
CN103460718A (zh) 电子设备以及信息传递系统
JP2007329702A (ja) 受音装置と音声認識装置とそれらを搭載している可動体
TW200411627A (en) Robottic vision-audition system
KR20130046759A (ko) 차량에서 운전자 명령 인지장치 및 방법
US20080289002A1 (en) Method and a System for Communication Between a User and a System
US20240119684A1 (en) Display control apparatus, display control method, and program
JP3838159B2 (ja) 音声認識対話装置およびプログラム
KR100822880B1 (ko) 지능형 로봇 환경에서 오디오-비디오 기반 음원추적을 통한화자 인식 시스템 및 방법
US20210020179A1 (en) Information processing apparatus, information processing system, information processing method, and program
JP2017204231A (ja) 情報処理装置、情報処理方法、および情報処理プログラム
CN115002598B (zh) 耳机模式控制方法、耳机设备、头戴式设备及存储介质
JPH02131300A (ja) 音声認識装置
KR20060044008A (ko) 다수의 화자 분별을 위한 음성 인식장치
KR102399728B1 (ko) 리모컨부를 구비하는 키오스크 단말장치
JP7545267B2 (ja) 対話型応対装置
JP2603975B2 (ja) 音声入力装置
JP2023180935A (ja) 認証装置および認証方法
JP2877350B2 (ja) 環境モニタ付音声認識装置