DE60217444T2 - Sprachgesteuertes elektronisches Gerät - Google Patents

Sprachgesteuertes elektronisches Gerät Download PDF

Info

Publication number
DE60217444T2
DE60217444T2 DE60217444T DE60217444T DE60217444T2 DE 60217444 T2 DE60217444 T2 DE 60217444T2 DE 60217444 T DE60217444 T DE 60217444T DE 60217444 T DE60217444 T DE 60217444T DE 60217444 T2 DE60217444 T2 DE 60217444T2
Authority
DE
Germany
Prior art keywords
audio signal
signal
sound
external sound
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE60217444T
Other languages
English (en)
Other versions
DE60217444D1 (de
Inventor
c/o Audio Lab Yoon-hark Paldal-gu Suwon-city Oh
Soon-back Sangju-city Cha
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Application granted granted Critical
Publication of DE60217444D1 publication Critical patent/DE60217444D1/de
Publication of DE60217444T2 publication Critical patent/DE60217444T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Selective Calling Equipment (AREA)
  • Details Of Television Systems (AREA)

Description

  • Die vorliegende Erfindung bezieht sich auf ein elektronisches Gerät, wie etwa ein Fernsehgerät, und genauer auf ein elektronisches Gerät, das zum Steuern des Betriebs davon durch Spracherkennung fähig ist.
  • Während sich Spracherkennungstechnologie entwickelt hat, wurde ein elektronisches Gerät entwickelt, das zum Steuern des Betriebs davon durch Erkennen von Sprache eines Benutzers und Eingeben eines entsprechenden Befehls fähig ist. Wenn ein Benutzer den Ton "Abspielen" oder "Aufzeichnen" ausspricht, erkennt das Gerät das Tonmuster der Sprache, erzeugt einen entsprechenden Befehlscode und steuert den Betrieb gemäß dem Befehlscode.
  • 1 zeigt ein kurz dargestelltes Bild eines Fernsehgerätes als ein Beispiel des elektronischen Gerätes an, das zum Steuern des Betriebs davon durch Spracherkennung fähig ist. Ein konventionelles Fernsehgerät hat einen Tuner 1 zum Empfangen von Rundfunksignalen, eine externe Signaleingabeeinheit zum Empfangen der Signale, die von einem Bildwiedergabegerät wiedergegeben werden, wie etwa einem VTR (Videoband-Aufzeichnungsgerät), einen Mikroprozessor 3 zum selektiven Ausgeben der Signale, die von dem Tuner 1 und der externen Signaleingabeeinheit 2 eingegeben werden, einen Videoverstärker 4 zum Verstärken der Videosignale unter den Signalen, die von dem Mikroprozessor 3 ausgegeben werden, einen Bildschirm 7 zum Anzeigen des verstärkten Videosignals und einen Audioverstärker 5 zum Verstärken der Audiosignale unter den Signalen, die von dem Mikroprozessor 3 ausgegeben werden, und einen Laut sprecher 6 zum Verstärken und Ausgeben der verstärkten Audiosignale so, damit sie hörbar sind. Auch hat das konventionelle Fernsehgerät eine Tasteneingabeeinheit 8, um einem Benutzer zu erlauben, die Steuersignale einzugeben.
  • Auch hat das Fernsehgerät eine Spracherkennungsvorrichtung 9 zum Erkennen von Sprache eines Benutzers und Senden eines Befehls entsprechend dem Mikroprozessor 3, und ein drahtloses Mikrofon 10 zum Empfangen des Tons, der durch den Benutzer ausgesprochen wird, und Übertragen dessen zu der Spracherkennungsvorrichtung 9 auf eine drahtlose Weise. In dieser Situation hat die Spracherkennungsvorrichtung 9 die Frequenzbandinformation der Sprache des Benutzers. Die Spracherkennungsvorrichtung 9 hat ein Filter (nicht gezeigt), das die Tonsignale weitergibt, die zu dem Frequenzband der Sprache des Benutzers gehören, und die Töne blockiert, die zu dem Frequenzband außer dem Band der Sprache des Benutzers gehören. Unterdessen hat das drahtlose Mikrofon 10 eine Fernsteuerungsfunktion, da es eine Tasteneingabekonsole (nicht gezeigt) hat, die Fernsehgerätbetrieb drahtlos steuern kann. Das drahtlose Mikrofon 10 enthält eine Moduswandlungstaste, die Wandlung zwischen einem allgemeinen Modus einem Spracherkennungsmodus eines Fernsehgerätes ermöglicht.
  • In der konventionellen Fernsehgerätsteuerung, die Spracherkennung verwendet, wandelt der Benutzer den Modus eines Fernsehgerätes in den Spracherkennungsmodus durch Auswählen der Moduswandlungstaste, die an dem drahtlosen Mikrofon 10 vorgesehen ist, während ferngesehen wird. Wenn das Fernsehgerät in den Spracherkennungsmodus gewandelt wird, spricht der Benutzer einen Ton entsprechend einem gewünschten Befehl in das drahtlose Mikrofon 10 aus. In diesem Moment empfängt das drahtlose Mikrofon 10 nicht nur menschliche Sprache, sondern auch den Ton, der von einem Lautsprecher 6 ausgegeben wird, und diese zwei Typen von Signalen, die empfangen werden, wer den der Spracherkennungsvorrichtung 9 vorgelegt. Die Spracherkennungsvorrichtung 9 gibt das Signal weiter, das zu dem Frequenzband des Tons des Benutzers gehört, und blockiert den Rest der Signale, die die Audiosignale enthalten, die von dem Lautsprecher 6 ausgegeben werden. Dann erkennt die Spracherkennungsvorrichtung 9 das Sprachmuster der empfangenen Sprache des Benutzers, erfasst den Befehl entsprechend dem erkannten Sprachmuster und überträgt es zu dem Mikroprozessor 3.
  • In einem derartigen konventionellen Fernsehgerät ist es für die Spracherkennungsvorrichtung 9 schwierig, alle Audiosignale zu erfassen und aus den empfangenen Tönen zu entfernen, wenn das Tonfrequenzband der Audiosignale, die von dem Lautsprecher 6 ausgegeben werden, das der Sprache des Benutzers überlappt. Falls der Ton der Audiosignale, die von dem Lautsprecher 6 ausgegeben werden, zu dem Durchlassband der Spracherkennungsvorrichtung 9 gehört, und dem Ton entspricht, der das Fernsehgerät steuern kann, fasst die Spracherkennungsvorrichtung 9 den Ton, der von dem Lautsprecher 6 ausgegeben wird, als ein Steuersignal falsch auf, was zu einem Problem führt, die Fehlfunktion des Fernsehgerätes zu verursachen.
  • Um das obige Problem zu vermeiden, kann der Benutzer einen Ton entsprechend dem Betriebsbefehl in das drahtlose Mikrofon 10 aussprechen, nachdem der Lautsprecher 6 stumm geschaltet ist, während ferngesehen wird. Dann empfängt die Spracherkennungsvorrichtung 9 nur die Sprache des Benutzers, was ermöglicht, den entsprechenden Befehl zu dem Mikroprozessor 3 zu übertragen. Es ist jedoch für den Benutzer unmöglich, den Ton von dem Lautsprecher 6 zu hören, während der Befehl zu der Spracherkennungsvorrichtung 9 gegeben wird, wobei es dadurch zum Komfortverlust beim Fernsehen kommt.
  • Diese Art von Problemen tritt gleichermaßen zwischen beliebigen elektronischen Geräten, die Ton erzeugen können, und denen auf, die in Übereinstimmung mit einem empfangenen Sprachbefehl betrieben werden können. Die Beispiele der elektronischen Geräte, die Töne generieren können, sind ein Fernsehgerät und ein Radio, und die Beispiele, die gemäß empfangenen Tönen betrieben werden können, sind alle elektronischen Einrichtungen, wie etwa ein Fernsehgerät, ein Radio, ein VTR, ein elektrischer Reiskocher, ein Staubsauger, eine Klimaanlage und ein elektrischer Lüfter.
  • Um die konventionellen Operationen, die durch Spracherkennung aktiviert werden, mit den Beispielen eines Radios, das Töne ausgeben kann, und eines elektrischen Lüfters, der eine entsprechende Aktion durch Empfangen von Sprache durchführen kann, zu erläutern, wenn ein Ton, der zu dem Frequenzband gehört, das ein elektrischer Lüfter erkennen kann und den elektrischen Lüfter betreiben kann, durch das Radio erzeugt wird, fasst der Lüfter den Ton als eine Sprache von Benutzersteuerung falsch auf, und als ein Ergebnis kann ein Befehl entsprechend dem Ton, der durch das Radio gegeben wird, ausgeführt werden. Entsprechend führt der elektronische Lüfter eine Operation durch, die nicht durch den Benutzer beabsichtigt ist. Falls der Ton, der von dem Radio ausgegeben wird, und Sprache des Benutzers gleichlaufend eingegeben werden, kann außerdem der Sprachbefehl nicht richtig durchgeführt werden, da es eine Schwierigkeit beim Trennen und Entfernen des Audiosignals von dem Lautsprecher gibt.
  • Tsuyoshi Usagawa, Yuji Morita, Masanao Ebata: Remote Control System of Known Noise, Proceedings of the International Conference on Spoken Language Processing (ICSLP), Kobe, 18.-22. Nov. 1990, Tokyo, ASJ, JP, 1990-11-18, XP 000503367 offenbart die Verwendung eines adaptiven Filters, um Umgebungsrauschen aus einem Audiosignal zu entfernen.
  • Ein Ziel der vorliegenden Erfindung besteht darin, ein elektronisches Gerät vorzusehen, das durch Spracherkennung betrieben wird, was eine Fehlfunktion verhindern kann, die durch Empfangen von Hintergrundrauschen verursacht wird, wie etwa ein Ton, der von einem Lautsprecher ausgegeben wird. Ein anderes Ziel besteht darin, ein elektronisches Gerät vorzusehen, das Töne von einem Lautsprecher darin generieren kann, während unbeabsichtigtes Hintergrundrauschen minimiert wird, das eine Spracherkennungsfunktion dieses oder anderer Geräte beeinträchtigt.
  • Die Erfindung wird wie sie ist in unabhängigen Ansprüchen 1 und 5 dargelegt.
  • Gemäß einem ersten Aspekt der vorliegenden Erfindung wird ein elektronisches Gerät vorgesehen, umfassend: einen Lautsprecher zum Ausgeben eines Audiosignals; einen Tonempfänger zum Empfangen eines externen Tons; eine Bestimmungseinrichtung zum Bestimmen, ob ein Signal des externen Tons, der in dem Tonempfänger empfangen wird, das Audiosignal ist, das von dem Lautsprecher ausgegeben wird; eine Spracherkennungseinrichtung zum Erkennen des externen Tons und Ausgeben eines Befehls entsprechend dem externen Ton, wenn die Bestimmungseinrichtung bestimmt, dass sich das Signal des externen Tons von dem Audiosignal unterscheidet; und eine Steuereinheit zum Empfangen des Befehls und Durchführen einer Operation entsprechend dem Befehl, ferner umfassend eine Identifikationsinformations-Bereitstellungseinrichtung zum Hinzufügen vorbestimmter Identifikationsinformation zu dem Audiosignal, wobei die Bestimmungseinrichtung bestimmt, ob das Signal des externen Tons das Audiosignal ist, basierend auf Vorhandensein der Identifikationsinformation in den Signalen des externen Tons, die durch die Spracherkennungseinrichtung empfangen werden.
  • Vorzugsweise umfasst das elektronische Gerät gemäß der vorliegenden Erfindung ferner einen Wasserzeichengenerator zum Hinzufügen einer vorbestimmten Identifikationsinformation, die eine Identifikationsinformation des Audiosignals ist. In einer derartigen Situation bestimmt die Bestimmungseinrichtung, ob das Signal des externen Tons das Audiosignal ist, basierend auf Vorhandensein der Identifikationsinformation in den Signalen des externen Tons, die durch die Spracherkennungsvorrichtung empfangen werden.
  • Unterdessen umfasst die Bestimmungseinrichtung vorzugsweise: einen Detektor zum Suchen nach der Wasserzeicheninformation, die in dem Signal des externen Tons eingefügt ist, das in dem Tonempfänger empfangen wird; eine Tonentfernungseinrichtung zum Entfernen des Audiosignals, das die Wasserzeicheninformation enthält, unter Verwendung der Spektrumsinformation, die in dem Detektor erfasst wird, in dem Fall, dass die Wasserzeicheninformation erfasst wird; und eine Sprachsignal-Erkennungseinrichtung zum Identifizieren des Vorhandenseins eines Sprachsignals basierend auf einem Energiepegel des Signals des externen Tons, woraus das Audiosignal entfernt ist.
  • In dem elektronischen Gerät gemäß der vorliegenden Erfindung ist es möglich, den Betriebsmodus davon einzustellen, wodurch durch den Benutzer ausgewählt werden kann, ob die Identifikationsinformations-Bereitstellungseinrichtung arbeitet oder nicht.
  • Die Identifikationsinformation ist Wasserzeicheninformation, die Spektrumsinformation des Signals des externen Tons enthält. Die Bestimmungseinrichtung bestimmt Vorhandensein der Identifikationsinformation basierend auf Vorhandensein der Wasserzeicheninformation in dem Signal des externen Tons, das in der Spracherkennungseinrichtung empfangen wird.
  • Die Bestimmungseinrichtung umfasst vorzugsweise: einen Detektor zum Suchen nach der Wasserzeicheninformation, die in dem Signal externen Tons eingefügt ist, das in dem Tonempfänger empfangen wird; eine Tonentfernungseinrichtung zum Entfernen des Audiosignals, das die Wasserzeicheninformation enthält, unter Verwendung der Spektrumsinformation, die in dem Detektor erfasst wird, in dem Fall, dass die Wasserzeicheninformation erfasst ist; und eine Sprachsignal-Erkennungseinrichtung zum Identifizieren des Vorhandenseins eines Sprachsignals basierend auf einem Energiepegel des Signals des externen Tons, woraus das Audiosignal entfernt ist.
  • Gemäß einem anderen Aspekt der vorliegenden Erfindung wird ein Verfahren zum Empfangen von Ton vorgesehen, umfassend die Schritte zum: a) Ausgeben eines Audiosignals durch einen Lautsprecher; b) Entfernen des Audiosignals aus einem Signal eines externen Tons in einem Fall, in dem das Audiosignal in dem Signal des externen Tons enthalten ist; Ausgeben eines Befehls entsprechend dem externen Ton durch Erkennen des externen Tons; und Empfangen des Befehls und Steuern einer Operation entsprechend dem Befehl, ferner umfassend einen Schritt zum Hinzufügen vorbestimmter Identifikationsinformation zu dem Audiosignal vor dem Schritt a), wobei in dem Schritt b) Vorhandensein des Audiosignals basierend auf Vorhandensein der Identifikationsinformation in dem Signal des externen Tons bestimmt wird.
  • Vorteilhafter Weise kann die Fehlfunktion des elektronischen Gerätes verhindert werden, da die Wasserzeicheninformation dem Audiosignal hinzugefügt wird, das von dem Lautsprecher in dem Spracherkennungsmodus eines Fernsehgerätes ausgegeben wird, und das Vorhandensein von Wasserzeicheninformation in dem empfangenen externen Tonsignal durch den Detektor erfasst wird.
  • Für ein besseres Verständnis der Erfindung, und um zu zeigen, wie Ausführungsformen der gleichen zur Wirkung gebracht werden können, wird nun auf dem Weg eines Beispiels auf die begleitenden schematische Zeichnungen verwiesen, in denen:
  • 1 eine schematische Ansicht ist, die ein Fernsehgerät zeigt, das seinen Betrieb durch Spracherkennung steuern kann;
  • 2 ein elektronisches Gerät zeigt, das Fehlfunktion in Spracherkennung verhindern und eine Spracherkennungsrate verbessern kann in Übereinstimmung mit einer bevorzugten Ausführungsform der vorliegenden Erfindung;
  • 3 ein detailliertes Blockdiagramm einer Bestimmungseinrichtung in 2 ist; und
  • 4 ein Flussdiagramm ist, das das Verfahren zum Verhindern von Fehlfunktion in Spracherkennung und Verbessern einer Spracherkennungsrate in Übereinstimmung mit der bevorzugten Ausführungsform der vorliegenden Erfindung zeigt.
  • 2 zeigt ein elektronisches Gerät, das Fehlfunktion in Spracherkennung verhindern und eine Spracherkennungsrate verbessern kann in Übereinstimmung mit einer bevorzugten Ausführungsform der vorliegenden Erfindung. Die vorliegende Erfindung wird mit einem Fernsehgerät als ein Beispiel des elektronischen Gerätes veranschaulicht. Bezug nehmend auf 2 umfasst das elektronische Gerät einen Tuner 21 zum Empfangen der Rundfunksignale, eine Eingabeeinheit eines externen Signals 22 zum Empfangen der Wiedergabesignale von einer Bildwiedergabeeinrichtung, wie etwa einem VTR oder einem DVDP, einen Mikroprozessor 24 zum selektiven Ausgeben der Signale, die von dem Tuner 21 und der Eingabeeinheit eines externen Signals 22 eingegeben werden, eine Leistungsversorgung 23 zum Zuführen elektrischer Leistung zu dem Mikroprozessor 24, eine Tasteneingabeeinheit 25 zum Eingeben der Steuerbefehle in Bezug auf die gewünschte Operation zu dem Mikroprozessor 24 und eine Tonempfangssteuereinheit 50 zum Steuern des Mikroprozessors 24 in Bezug auf die entsprechende Operation durch die Spracherkennung.
  • Das Fernsehgerät in der Zeichnung besteht aus einem Videoverstärker 26 zum Verstärken der Videosignale unter den Signalen, die von dem Mikroprozessor 24 ausgegeben werden, einer Visualisierungseinheit 27 zum Wandeln der verstärkten Videosignale in ein Format, das für eine Anzeige möglich ist, und einem Bildschirm 28 zum Anzeigen der neu formatierten Videosignale. Außerdem umfasst das Fernsehgerät einen Audioverstärker 30 zum Verstärken der Audiosignale unter den Signalen, die von dem Mikroprozessor 24 ausgegeben werden, einen Wasserzeichengenerator 50 zum Extrahieren von Spektrumsinformation der verstärkten Audiosignale und Hinzufügen der extrahierten Spektrumsinformation zu den verstärkten Audiosignalen, und einen Lautsprecher 31 zum Verstärken und Ausgeben von Audiosignalen, denen die Spektrumsinformation hinzugefügt ist, als die hörbaren Töne.
  • Unterdessen besteht die Tonempfangssteuereinheit 50 aus einem Tonempfänger 52 zum Empfangen eines eingegebenen Audiosignals, wie etwa von einem drahtlosen Mikrofon 60, einer Bestimmungseinrichtung 54 zum Bestimmen, ob die Audiosignale, die in dem Tonempfänger 52 empfangen werden, die Töne sind, die von dem Lautsprecher 31 ausgegeben werden, oder Sprachsignale eines Benutzers, und einer Spracherkennungseinrichtung 56 zum Erfassen des Befehls entsprechend dem Ergebnis der Sprachmustererkennung des empfangenen Tons und Übertragen des Befehls zu dem Mikroprozessor 24, nachdem das Tonsignal als das Sprachsignal des Benutzers in der Bestimmungseinrichtung 54 erkannt ist.
  • 3 ist ein detailliertes Blockdiagramm der in 2 gezeigten Bestimmungseinrichtung 54. Wie in 3 gezeigt, umfasst die Bestimmungseinrichtung 54 einen Detektor 54a zum Suchen nach der eingefügten Wasserzeicheninformation von dem Audiosignal, das in dem Tonempfänger 52 empfangen wird, eine Tonentfernungseinrichtung 54b zum Entfernen der Audiosignale, die die Wasserzeicheninformation enthalten, durch Verwenden eines Audiospektrums, das in dem Detektor 54a erkannt wird, wenn die Wasserzeicheninformation erfasst wird, und eine Sprachsignal-Erkennungseinrichtung 54c zum Erkennen des Vorhandenseins eines Sprachsignals durch den Energiepegel eines Audiosignals unter den Tonsignalen, aus denen die Audiosignale entfernt sind.
  • In der bevorzugten Ausführungsform hat das drahtlose Mikrofon 60 auch eine drahtlose Fernsteuerungsfunktion, da es mit einer Tasteneingabekonsole (nicht gezeigt) versehen ist, die die Operation des Fernsehgerätes drahtlos steuern kann. Das Mikrofon 60 ist mit einer Moduswandlungstaste zum Umschalten zwischen einem allgemeinen Modus für das Fernsehen und einem Spracherkennungsmodus versehen. Der allgemeine Modus ist ein Modus, in dem das Fernsehen durch Steuern der Operation des Mikroprozessors 24 gemäß der Tastenauswahl des drahtlosen Mikrofons 60 und der Tasteneingabeeinheit 25 betrachtet werden kann. Der Spracherkennungsmodus ist ein Modus, in dem der Mikroprozessor durch Empfangen von Sprache durch die Tonempfangssteuereinheit 50 gesteuert werden kann.
  • Unterdessen ist die Operation des Wasserzeichengenerators 40 eingestellt, selektiv nur zu arbeiten, wenn der Spracherkennungsmodus durch das drahtlose Mikrofon 60 ausgewählt ist. Falls ein Benutzer den Modus zu dem Spracherkennungsmodus durch Auswählen der Moduswandlungstaste an dem drahtlosen Mikrofon 60 wandelt, überträgt die Tonempfangssteuereinheit 50 vorzugsweise das Signal, das auf die Wandlung in den Spracherkennungsmodus hinweist, zu dem Mikroprozessor 24. Entsprechend gibt der Mikroprozessor 24 in dem allgemeinen Modus die Audiosignale, die ohne die Operation des Wasserzeichengenerators 40 verstärkt werden, durch den Lautsprecher 31 aus. Wenn ein Signal, das die Moduswandlung zu dem Spracherkennungsmodus meldet, von der Tonempfangssteuereinheit 50 empfangen wird, steuert der Mikroprozessor 24 den Wasserzeichengenerator 40 so, um die Spektrumsinformation des Audiosignals zu dem verstärkten Audiosignal hinzuzufügen und es durch den Lautsprecher 31 auszugeben. Die Spektrumsinformation des Audiosignals wird Wasserzeicheninformation genannt. Die Wasserzeicheninformation ist verborgene Information, die die Information über das ursprüngliche Information enthält, ohne irgendeinen Einfluss auf die Qualität des ursprünglichen Signals zu ergeben. Entsprechend hört der Benutzer nur den Ton entsprechend dem Audiosignal, obwohl das Audiosignal, das die Wasserzeicheninformation enthält, durch den Lautsprecher 31 ausgegeben wird.
  • Unterdessen verwendet Wasserzeicheninformationserkennung durch Erfassen der Spektrumsinformation des Audiosignals in dem Wasserzeichengenerator 40 allgemein die lineare vorhersagende Kodierung (LPC, Linear Predicting Coding), die das Audiosignal abtastet und die Koeffizienten durch Spektrumstransformation kalkuliert. Entsprechend sucht der Detektor 54a nach der Spektrumsinformation, die als die Wasserzeicheninformation eingefügt ist, von dem Audiosignal, das in dem Tonempfänger 52 empfangen wird, und die Tonentfernungseinrichtung 54b entfernt das Audiosignal, das die Wasserzeicheninformation enthält, unter Verwendung der Spektrumsinformation des Tons, der in dem Detektor 54a erfasst wird. In diesem Punkt lässt die Sprachsignal-Erkennungseinrichtung 54c die verbleibenden Tonsignale außer Acht. D.h. die Sprachsignal-Erkennungseinrichtung 54c entfernt jene Signale des externen Tons, von denen erachtet wird, keinerlei Sprachsignale zu enthalten, da sie einen Energiepegel kleiner als ein Schwellwert haben und überträgt jene Signale, von denen erachtet wird, Sprachsignale zu enthalten, da sie einen Energiepegel höher als der Schwellwert haben. Die Spracherkennungseinrichtung 56 erkennt die eingegebenen Sprachsignale durch Sprachmustererkennung und erfasst den entsprechenden Befehl. Der erfasste Befehl wird zu dem Mikroprozessor 24 so übertragen, dass der Mikroprozessor 24 die Operation entsprechend dem Befehl durchführt.
  • Entsprechend kann in dem Spracherkennungsmodus das Audiosignal durch die Wasserzeicheninformation während Spracherkennung in der Bestimmungseinrichtung 54 durch Erfassen der Wasserzeicheninformation des Audiosignals, die in dem Wasserzeichengenerator 40 generiert und dem Audiosignal hinzugefügt wird, bevor das Audiosignal durch den Lautsprecher 31 generiert wird, erfasst werden.
  • Folglich kann die Spracherkennungseinrichtung 56 die entsprechenden Befehle durch Sprachmustererkennung nur des Sprachsignals unter den Signalen des externen Tons erfassen, und der Mikroprozessor 24 kann die unbeabsichtigte Operation des elektronischen Gerätes verhindern, die durch Fehler in Spracherkennung verursacht wird.
  • Unterdessen sind einige Beispiele der Befehle, die durch die Sprache eines Benutzers gesteuert werden können, Leistung-Ein/Aus, Kanalauswahl, Lautstärkesteuerung und Stummschaltung-Ein/Aus. Leistung-Ein/Aus steuert die Zufuhr von Leistung von der Leistungsversorgung 23 zu den jeweiligen Teilen des Fernsehgerätes, und die Kanalauswahl steuert den Mikroprozessor 24, um einen Kanal auszuwählen, wenn die Zahl des entsprechenden Kanals ausgesprochen wird. Lautstärkesteuerung steuert den Audioverstärker 30 zum Abstimmen der Lautstärke in Übereinstimmung mit den Worten "Lautstärke hoch" oder "Lautstärke herunter", die durch den Benutzer ausgesprochen werden. Stummschaltung-Ein/Aus steuert die Ausgabe des Audiosignals durch Steuern des Audioverstärkers 31 in Übereinstimmung mit dem Wort "Stummschaltung ein", das durch den Benutzer ausgesprochen wird.
  • 4 ist ein Flussdiagramm einer bevorzugten Ausführungsform des Verfahrens zum Verhindern von Fehlern in Spracherkennung eines elektronischen Gerätes gemäß der vorliegenden Erfindung. Bezug nehmend auf die Zeichnung bestimmt der Mikroprozessor 24 zuerst, ob der vorliegende Steuersignal-Eingabemodus der Sprachsteuerungsmodus ist gemäß der Auswahl der Modustaste an dem drahtlosen Mikrofon 60, während das Wiedergabesignal empfangen wird, das von dem Rundfunksignal oder der Wiedergabeeinrichtung eingegeben wird, wenn die Leistung ein ist (Schritt 42). Falls in dem Schritt (S42) erkannt wird, in dem Nicht-Sprachsteuermodus zu sein, ermöglicht der Mikroprozessor 24, dass das empfangene Rundfunksignal und das Wiedergabesignal durch den Bildschirm 28 und den Lautsprecher 31 in dem allgemeinen Modus ausgegeben werden (S44). Falls in dem Schritt (S42) erkannt wird, in dem Sprachsteuerungsmodus zu sein, steuert der Mikroprozessor 24 den Wasserzeichengenerator 40 und ermöglicht, Wasserzeicheninformation zu den verstärkten Audiosignalen hinzuzufügen (S46). Das Audiosignal mit der hinzugefügten Wasserzeicheninformation wird verstärkt und durch den Lautsprecher 31 ausgegeben (S48).
  • Unterdessen erfasst der Detektor 54a das Vorhandensein der Wasserzeicheninformation von den Signalen des externen Tons (S52). Falls ein Signal, das die Wasserzeicheninformation enthält, von dem Signal des externen Tons in Schritt (S52) erfasst wird, kann identifiziert werden, dass unter den Signalen des externen Tons ein Audiosignal von dem Lautsprecher 31 enthalten ist. Entsprechend entfernt die Tonentfernungseinrichtung 54b die erfassten Signale, die die Wasserzeichen information enthalten, die die Audiosignale sind, die von dem Lautsprecher 31 ausgegeben werden, aus den Signalen des externen Tons (S54).
  • Außerdem identifiziert die Sprachsignal-Erkennungseinrichtung 54c das Vorhandensein des Sprachsignals durch Vergleichen des Energiepegels der Tonsignale, die nach Entfernen des Audiosignals aus den Signalen des externen Tons verbleiben, mit dem Schwellwert (S56). Falls die Tonsignale, die nach Entfernen des Audiosignals aus den Signalen des externen Tons verbleiben, ihren Energiepegel kleiner als den Schwellwert haben, werden sie identifiziert, keinerlei Sprachsignale zu enthalten und verworfen, und falls höher, werden sie identifiziert, die Sprachsignale zu enthalten und zu der Spracherkennungseinrichtung 56 übertragen (S58).
  • Falls die Wasserzeicheninformation unter den Signalen des externen Tons in dem Schritt (S52) nicht erfasst wird, werden die Signale unterdessen zu der Sprachsignal-Erkennungseinrichtung 54c übertragen, und die Sprachsignal-Erkennungseinrichtung 54c identifiziert das Vorhandensein des Sprachsignals durch Vergleichen des Energiepegels der Signale mit dem Schwellwert (S56). Falls die Energiepegel der Tonsignale kleiner als der Schwellwert sind, werden sie identifiziert, keinerlei Sprachsignale zu enthalten und die Signale werden verworfen, und falls höher, werden sie identifiziert, das Sprachsignal zu enthalten, und werden zu der Spracherkennungseinrichtung 56 übertragen (S58).
  • Hinsichtlich der empfangenen Sprachsignale, die als Sprachsignale in dem Schritt S58 erkannt werden, gibt die Spracherkennungseinrichtung 56 einen Befehl, der für das Sprachsignal relevant ist, durch den Mikroprozessor 24 durch Sprachmustererkennung der empfangenen Sprachsignale aus (S60). Entspre chend steuert der Mikroprozessor 24 das Fernsehgerät in Bezug auf die empfangenen Befehle (S62).
  • Folglich können Fehler beim Betrieb des Fernsehgerätes wegen fehlerhafter Spracherkennung verhindert, oder mindestens beträchtlich reduziert werden, durch Hinzufügen der Wasserzeicheninformation zu dem Audiosignal, das von dem Lautsprecher 31 ausgegeben wird, und Identifizieren des Vorhandenseins der Wasserzeicheninformation des Signals des externen Tons, die durch das drahtlose Mikrofon 60 übertragen werden, und Erfassen des Sprachsignals des Benutzers.
  • Unterdessen zeigt die Ausführungsform der vorliegenden Erfindung ein einzelnes elektronisches Gerät, das mit sowohl dem Wasserzeichengenerator 40 als auch der Tonempfangssteuereinheit 50 ausgerüstet ist. Die vorliegende Erfindung kann jedoch in dem Fall angewendet werden, dass der Wasserzeichengenerator 40 und die Tonempfangssteuereinheit 50 getrennt in zwei unterschiedlichen elektronischen Geräten existieren. D.h. die vorliegende Ausführungsform kann gleichermaßen angewendet werden, falls der Wasserzeichengenerator 40 vor dem Lautsprecher eines elektronischen Gerätes eingesetzt wird, das zum Ausgeben von Rudiosignalen durch den Lautsprecher fähig ist, und falls die Tonempfangssteuereinheit 50 zu einem elektronischen Gerät eingesetzt wird, das zum Betreiben durch Spracherkennung fähig ist.
  • In der vorliegenden Erfindung kann ein Audiosignal auf der Basis der Wasserzeicheninformation erfasst werden, wenn die Bestimmungseinrichtung 54 das Sprachsignal bestimmt, da die Wasserzeicheninformation des Audiosignals den Audiosignalen hinzugefügt und dann durch den Lautsprecher 31 ausgegeben wird. Entsprechend erfasst die Spracherkennungseinrichtung 56 die entsprechenden Befehle durch Erkennen des Musters nur der Sprachsignale unter den Signalen des externen Tons und der Mikroprozessor 24 kann folglich eine falsche Operation des elektronischen Gerätes verhindern, die durch Fehler bei Spracherkennung verursacht werden.
  • Obwohl die bevorzugte Ausführungsform der vorliegenden Erfindung beschrieben wurde, wird durch einen Fachmann verstanden, dass die vorliegende Erfindung nicht auf die beschriebene bevorzugte Ausführungsform begrenzt werden sollte. Innerhalb des Bereiches der vorliegenden Erfindung, wie durch die angefügten Ansprüche definiert, können verschiedene Änderungen und Modifikationen durchgeführt werden.

Claims (6)

  1. Ein elektronisches Gerät, umfassend: einen Lautsprecher (31) zum Ausgeben eines Audiosignals; einen Tonempfänger (52) zum Empfangen eines externen Tons; eine Bestimmungseinrichtung (54) zum Bestimmen, ob ein Signal des externen Tons, der in dem Tonempfänger empfangen wird, das Audiosignal ist, das von dem Lautsprecher ausgegeben wird; eine Spracherkennungseinrichtung (56) zum Erkennen des externen Tons und Ausgeben eines Befehls entsprechend dem externen Ton, wenn die Bestimmungseinrichtung bestimmt, dass sich das Signal des externen Tons von dem Audiosignal unterscheidet; und eine Steuereinheit (24) zum Empfangen des Befehls und Steuern einer Operation entsprechend dem Befehl, gekennzeichnet ferner zu umfassen eine Identifikationsinformations-Bereitstellungseinrichtung (40) zum Hinzufügen vorbestimmter Identifikationsinformation zu dem Audiosignal, wobei die Bestimmungseinrichtung (54) bestimmt, ob das Signal des externen Tons das Audiosignal ist, basierend auf Vorhandensein der Identifikationsinformation in den Signalen des externen Tons, der durch die Spracherkennungseinrichtung empfangen wird.
  2. Das elektronische Gerät nach Anspruch 1, wobei die Identifikationsinformation Wasserzeicheninformation ist, die Spektrumsinformation über das Audiosignal enthält, die Identifikationsinformations-Bereitstellungseinrichtung ein Wasserzeichengenerator (40) zum Hinzufügen der Wasserzeicheninformation zu dem Audiosignal ist und die Bestimmungseinrichtung (54) das Vorhandensein des Audiosignals basierend auf dem Vorhandensein der Wasserzeicheninformation in dem Signal des externen Tons bestimmt, der in der Spracherkennungseinrichtung empfangen wird.
  3. Das elektronische Gerät nach Anspruch 2, wobei die Bestimmungseinrichtung umfasst: einen Detektor (54a) zum Suchen nach der Wasserzeicheninformation, die in das Signal des externen Tons eingefügt ist, der in dem Tonempfänger empfangen wird; eine Tonentfernungseinrichtung (54b) zum Entfernen des Audiosignals, das die Wasserzeicheninformation enthält, unter Verwendung der Spektrumsinformation, die in dem Detektor erfasst wird, in einem Fall, in dem die Wasserzeicheninformation erfasst wird; und eine Sprachsignal-Erkennungseinrichtung (54c) zum Identifizieren des Vorhandenseins von einem Sprachsignal basierend auf einem Energiepegel des Signals des externen Tons, aus dem das Audiosignal entfernt ist.
  4. Das elektronische Gerät nach einem beliebigen vorangehenden Anspruch, wobei ein Operationsmodus der Identifikationsinformations-Bereitstellungseinrichtung (40) gemäß einer Auswahl eines Benutzers gesetzt wird.
  5. Ein Verfahren zum Empfangen von Ton, die Schritte umfassend: a) Ausgeben eines Audiosignals durch einen Lautsprecher (31); b) Entfernen des Audiosignals aus einem Signal eines externen Tons in einem Fall, in dem das Audiosignal in dem Signal des externen Tons enthalten ist; Ausgeben eines Befehls entsprechend dem externen Ton durch Erkennen des externen Tons; und Empfangen des Befehls und Steuern einer Operation entsprechend dem Befehl, gekennzeichnet ferner zu umfassen einen Schritt zum Hinzufügen vorbestimmter Identifikationsinformation zu dem Audiosignal vor dem Schritt a), wobei in dem Schritt b) Vorhandensein des Audiosignals basierend auf Vorhandensein der Identifikationsinformation in dem Signal des externen Tons bestimmt wird.
  6. Das Verfahren zum Empfangen von Ton nach Anspruch 5, wobei die Identifikationsinformation Wasserzeicheninformation ist, die Spektrumsinformation über das Audiosignal enthält, die Wasserzeicheninformation dem Audiosignal in dem Hinzufügungsschritt hinzugefügt wird und das Vorhandensein des Audiosignals basierend auf Vorhandensein der Wasserzeicheninformation in dem Signal des externen Tons in dem Schritt b) bestimmt wird.
DE60217444T 2001-07-19 2002-04-24 Sprachgesteuertes elektronisches Gerät Expired - Fee Related DE60217444T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR2001043581 2001-07-19
KR1020010043581A KR100552468B1 (ko) 2001-07-19 2001-07-19 음성인식에 따른 오동작을 방지 및 음성인식율을 향상 할수 있는 전자기기 및 방법

Publications (2)

Publication Number Publication Date
DE60217444D1 DE60217444D1 (de) 2007-02-22
DE60217444T2 true DE60217444T2 (de) 2007-05-24

Family

ID=19712317

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60217444T Expired - Fee Related DE60217444T2 (de) 2001-07-19 2002-04-24 Sprachgesteuertes elektronisches Gerät

Country Status (6)

Country Link
US (1) US20030018479A1 (de)
EP (1) EP1278183B1 (de)
JP (1) JP2003044069A (de)
KR (1) KR100552468B1 (de)
CN (1) CN1188829C (de)
DE (1) DE60217444T2 (de)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7324947B2 (en) 2001-10-03 2008-01-29 Promptu Systems Corporation Global speech user interface
DE10251209A1 (de) * 2002-10-31 2004-05-19 Sennheiser Electronic Gmbh & Co. Kg Mikrofonsystem
KR20040048435A (ko) * 2002-12-03 2004-06-10 조미화 음성 제어 텔레비젼 수상기 및 음성 제어 방법
JP2005338454A (ja) * 2004-05-27 2005-12-08 Toshiba Tec Corp 音声対話装置
US10032452B1 (en) 2016-12-30 2018-07-24 Google Llc Multimodal transmission of packetized data
CN100426768C (zh) * 2004-12-16 2008-10-15 智捷科技股份有限公司 无线网络传输发送器与接收器及建立无线网络传输的方法
US20080086311A1 (en) * 2006-04-11 2008-04-10 Conwell William Y Speech Recognition, and Related Systems
US10013986B1 (en) 2016-12-30 2018-07-03 Google Llc Data structure pooling of voice activated data packets
US11017428B2 (en) 2008-02-21 2021-05-25 Google Llc System and method of data transmission rate adjustment
JP2010164992A (ja) * 2010-03-19 2010-07-29 Toshiba Tec Corp 音声対話装置
TWI412019B (zh) * 2010-12-03 2013-10-11 Ind Tech Res Inst 聲音事件偵測模組及其方法
US9922334B1 (en) 2012-04-06 2018-03-20 Google Llc Providing an advertisement based on a minimum number of exposures
US10152723B2 (en) 2012-05-23 2018-12-11 Google Llc Methods and systems for identifying new computers and providing matching services
US10776830B2 (en) 2012-05-23 2020-09-15 Google Llc Methods and systems for identifying new computers and providing matching services
US9065971B2 (en) * 2012-12-19 2015-06-23 Microsoft Technology Licensing, Llc Video and audio tagging for active speaker detection
CN104956436B (zh) 2012-12-28 2018-05-29 株式会社索思未来 带有语音识别功能的设备以及语音识别方法
JP6115152B2 (ja) * 2013-01-29 2017-04-19 コニカミノルタ株式会社 情報処理システム、情報処理装置、情報処理端末及びプログラム
US10735552B2 (en) 2013-01-31 2020-08-04 Google Llc Secondary transmissions of packetized data
US10650066B2 (en) 2013-01-31 2020-05-12 Google Llc Enhancing sitelinks with creative content
US9384754B2 (en) 2013-03-12 2016-07-05 Comcast Cable Communications, Llc Removal of audio noise
CN104238379B (zh) * 2013-06-07 2017-07-28 艾默生过程控制流量技术有限公司 变送器、现场仪表以及用于控制变送器的方法
CN103366744B (zh) * 2013-07-04 2015-10-14 三星半导体(中国)研究开发有限公司 基于语音控制便携式终端的方法和装置
CN104135619A (zh) * 2014-08-12 2014-11-05 广东欧珀移动通信有限公司 一种摄像头控制方法及装置
CN104456830A (zh) * 2014-10-29 2015-03-25 无锡悟莘科技有限公司 一种智能空调的声音控制方法
US9818414B2 (en) 2015-06-04 2017-11-14 Intel Corporation Dialogue system with audio watermark
US10074364B1 (en) * 2016-02-02 2018-09-11 Amazon Technologies, Inc. Sound profile generation based on speech recognition results exceeding a threshold
JP6810527B2 (ja) * 2016-03-11 2021-01-06 パイオニア株式会社 再生制御装置、再生制御システム、並びに再生制御方法、プログラム及び記録媒体
US11138987B2 (en) 2016-04-04 2021-10-05 Honeywell International Inc. System and method to distinguish sources in a multiple audio source environment
US10708313B2 (en) 2016-12-30 2020-07-07 Google Llc Multimodal transmission of packetized data
US10593329B2 (en) 2016-12-30 2020-03-17 Google Llc Multimodal transmission of packetized data
US10395650B2 (en) * 2017-06-05 2019-08-27 Google Llc Recorded media hotword trigger suppression
CN107464560A (zh) * 2017-08-14 2017-12-12 广东九联科技股份有限公司 一种智能语音回采方法及其系统
JP7227140B2 (ja) * 2017-09-15 2023-02-21 ソニーグループ株式会社 情報処理装置、情報処理方法、音声処理装置、及び音声処理方法
US10276175B1 (en) 2017-11-28 2019-04-30 Google Llc Key phrase detection with audio watermarking
JP7013093B2 (ja) * 2018-05-01 2022-01-31 アルパイン株式会社 故障検出装置、移動体搭載装置、故障検出方法
US10692496B2 (en) 2018-05-22 2020-06-23 Google Llc Hotword suppression
JP7106120B2 (ja) * 2018-11-22 2022-07-26 国立大学法人東北大学 音声対話装置および音声対話システム
CN113168834A (zh) * 2018-12-18 2021-07-23 日产自动车株式会社 声音识别装置、声音识别装置的控制方法、内容播放装置以及内容发送接收系统
KR102693751B1 (ko) * 2018-12-19 2024-08-13 삼성전자주식회사 전자 장치 및 그의 제어 방법
KR102584588B1 (ko) 2019-01-21 2023-10-05 삼성전자주식회사 전자 장치 및 전자 장치의 제어 방법
KR102860422B1 (ko) 2019-02-11 2025-09-16 삼성전자주식회사 전자 장치 및 그 제어 방법
CN114730562A (zh) * 2019-11-21 2022-07-08 索尼集团公司 信息处理系统、信息处理设备、信息处理方法及程序
KR102911299B1 (ko) * 2020-04-03 2026-01-12 삼성전자주식회사 음성 명령에 대응하는 태스크를 수행하는 전자 장치 및 그 동작 방법
CN116959438A (zh) * 2022-04-18 2023-10-27 华为技术有限公司 唤醒设备的方法、电子设备和存储介质

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3004104A (en) * 1954-04-29 1961-10-10 Muzak Corp Identification of sound and like signals
JPS60193000A (ja) * 1984-03-14 1985-10-01 富士重工業株式会社 自動車の音声認識装置
JPS63171071A (ja) * 1987-01-08 1988-07-14 Matsushita Commun Ind Co Ltd 音声制御装置
US5267323A (en) * 1989-12-29 1993-11-30 Pioneer Electronic Corporation Voice-operated remote control system
JPH05197385A (ja) * 1992-01-20 1993-08-06 Sanyo Electric Co Ltd 音声認識装置
US5452289A (en) * 1993-01-08 1995-09-19 Multi-Tech Systems, Inc. Computer-based multifunction personal communications system
US5765130A (en) * 1996-05-21 1998-06-09 Applied Language Technologies, Inc. Method and apparatus for facilitating speech barge-in in connection with voice recognition systems
WO1998024225A1 (en) * 1996-11-28 1998-06-04 British Telecommunications Public Limited Company Interactive apparatus
EP0896712A4 (de) * 1997-01-31 2000-01-26 T Netix Inc System und verfahren zum entdecken von aufgezeichneter sprache
JPH10257583A (ja) * 1997-03-06 1998-09-25 Asahi Chem Ind Co Ltd 音声処理装置およびその音声処理方法
DE19712632A1 (de) * 1997-03-26 1998-10-01 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Sprachfernsteuerung von Geräten
US6385176B1 (en) * 1998-06-04 2002-05-07 Lucent Technologies Inc. Communication system based on echo canceler tap profile
JP2000132200A (ja) * 1998-10-27 2000-05-12 Matsushita Electric Ind Co Ltd 音声認識機能付きオーディオ/ビデオ装置および音声認識方法
US6522769B1 (en) * 1999-05-19 2003-02-18 Digimarc Corporation Reconfiguring a watermark detector
KR20010004832A (ko) * 1999-06-30 2001-01-15 구자홍 음성인식을 이용한 기기 제어장치
JP4554044B2 (ja) * 1999-07-28 2010-09-29 パナソニック株式会社 Av機器用音声認識装置
WO2001050665A1 (en) * 1999-12-30 2001-07-12 Digimarc Corporation Watermark-based personal audio appliance
EP2352120B1 (de) * 2000-01-13 2016-03-30 Digimarc Corporation Netzbasierter Zugriff auf Zusatzdaten basierend auf steganografischer Information
US6737957B1 (en) * 2000-02-16 2004-05-18 Verance Corporation Remote control signaling using audio watermarks
KR20020058116A (ko) * 2000-12-29 2002-07-12 조미화 음성 제어 텔레비젼 수상기 및 음성 제어 방법
WO2004103773A2 (en) * 2003-05-19 2004-12-02 Gentex Corporation Rearview mirror assemblies incorporating hands-free telephone components

Also Published As

Publication number Publication date
KR100552468B1 (ko) 2006-02-15
JP2003044069A (ja) 2003-02-14
CN1188829C (zh) 2005-02-09
EP1278183B1 (de) 2007-01-10
US20030018479A1 (en) 2003-01-23
KR20030008726A (ko) 2003-01-29
DE60217444D1 (de) 2007-02-22
CN1399247A (zh) 2003-02-26
EP1278183A1 (de) 2003-01-22

Similar Documents

Publication Publication Date Title
DE60217444T2 (de) Sprachgesteuertes elektronisches Gerät
DE4029697A1 (de) Sprachgesteuertes fernbedienungssystem
DE60123747T2 (de) Spracherkennungsbasiertes Untertitelungssystem
DE10002321C2 (de) Sprachgesteuerte Vorrichtung und System mit einer derartigen sprachgesteuerten Vorrichtung
DE60120062T2 (de) Sprachsteuerung von elektronischen Geräten
DE60214489T2 (de) Abnehmbare Frontplatte für ein Gerät der Unterhaltungselektronik
DE69734430T2 (de) Informationsaufzeichnung und -wiedergabe
DE102005000818A1 (de) Rauschunterdrückungssystem, Spracherkennungssystem und Fahrzeug-Navigationssystem
KR20060123072A (ko) 오디오 신호의 재생을 제어하는 방법 및 장치
DE102007037598A1 (de) Vorrichtung, Verfahren und Programm zur Verarbeitung von Audiosignalen
US7027832B2 (en) Providing custom audio profile in wireless device
US5878392A (en) Speech recognition using recursive time-domain high-pass filtering of spectral feature vectors
JP4253934B2 (ja) 信号処理装置及び方法
EP0772375A2 (de) Hörgerät und Zusatzgerät
DE60213905T2 (de) Verfahren und Gerät zur Kontrolle der Anzeige einer Zusatzvideoinformation
CN110503975B (zh) 基于多麦克风降噪的智能电视语音增强控制方法及系统
EP0467157B1 (de) Sprachgesteuertes Gerät der Unterhaltungselektronik, insbesondere Videorecorder
DE60022269T2 (de) Sprachbasiertes Manipulationsverfahren und -gerät
US5083493A (en) Electronic musical instrument having key transpose function and a method therefor
DE112020005717T5 (de) Erkennung von live-sprache
EP0241683B1 (de) Einrichtung zur Untertitelung von Fernsehsignalen
JP4587916B2 (ja) 音声信号判別装置、音質調整装置、コンテンツ表示装置、プログラム、及び記録媒体
JP3958009B2 (ja) 音声認識装置
DE112019007263T5 (de) Anzeigegerät
JPH05197385A (ja) 音声認識装置

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee