DE69817844T2 - Verfahren und vorrichtung zur spracherkennungscomputereingabe - Google Patents
Verfahren und vorrichtung zur spracherkennungscomputereingabe Download PDFInfo
- Publication number
- DE69817844T2 DE69817844T2 DE69817844T DE69817844T DE69817844T2 DE 69817844 T2 DE69817844 T2 DE 69817844T2 DE 69817844 T DE69817844 T DE 69817844T DE 69817844 T DE69817844 T DE 69817844T DE 69817844 T2 DE69817844 T2 DE 69817844T2
- Authority
- DE
- Germany
- Prior art keywords
- spoken
- steps
- word
- user
- letter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 17
- 230000005236 sound signal Effects 0.000 claims description 6
- 238000004883 computer application Methods 0.000 claims 3
- 230000006870 function Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 208000027418 Wounds and injury Diseases 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 208000014674 injury Diseases 0.000 description 2
- 238000013479 data entry Methods 0.000 description 1
- 230000003292 diminished effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/24—Speech recognition using non-acoustical features
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Input From Keyboards Or The Like (AREA)
Description
- HINTERGRUND DER ERFINDUNG
- 1. Gebiet der Erfindung
- Die vorliegende Endung betrifft ein Verfahren und eine Vorrichtung für eine Computer-Schnittstelle, in welcher die Stimme eines Benutzers verwendet wird, um Daten in einen Computer einzugeben. Insbesondere betrifft die vorliegende Efindung ein Verfahren und eine Vorrichtung, in denen die Stimme eines Benutzers in Verbindung mit einer Tastatur verwendet wird, um Anweisungen oder Daten in einen Computer einzugeben. Insbesondere besonders betrifft die vorliegende Erfindung ein Verfahren und eine Vorrichtung zur Eingabe in einen Spracherkennungscomputer, bei der ein Benutzer Daten in einen Computer eingibt, indem er jedes Wort ausspricht, während er es über eine Tastatur eintippt, wobei der erste Buchstabe eines jeden gesprochenen Wortes den Computer bei der Identifizierung oder dem Erkennen der gesprochenen Worte unterstützt.
- 2. Beschreibung des Standes der Technik
- Gegenwärtig gibt es verschiedene preisgünstige Software-Programme zur Verwendung mit Personal Computern, die eine Eingabe von Text und Anweisungen über die Stimme gestatten. Einige solcher Programme werden von Dragon Systems, IBM und Kurzweil angeboten. Diese Programme ermöglichen es, das von einem Benutzer Gesprochene zum Beispiel über eine Audio-Eingabe-Vorrichtung in einen Computer einzugeben, woraufhin die gesprochenen Worte identifiziert und für verschiedene Anwendungen, zum Beispiel für die Texteingabe oder für die Ausführung von Befehlen, verwendet werden. Wie einzusehen ist, sparen solche Mensch/Computer-Diktierprogramme Zeit des Benutzers, indem sie die Notwendigkeit, Daten über eine Tastatur für die Erzeugung von Dokumenten einzugeben, vermindern.
- Zum Beispiel offenbart das Dokument US-A-5027406ein bekanntes Spracherkennungsverfahren, das in einem Diktier-Software-Programm verwendet wird.
- Unter Bezugnahme auf
1 ist ein Diagramm der Schritte, die in einem Programm zur Ausführung einer Spracheingabe in einen Computer nach dem Stand der Technik verwendet werden, abgebildet. Wie gezeigt, ist das Programm gemäß dem Stand der Technik in fünf getrennte Schritte unterteilt. Der erste Schritt schließt ein, dass der Benutzer in der Nähe des Computers spricht, so dass ein Klangdetektor das gesprochene Audio-Signal empfangen kann. Der Computer bestimmt dann, wann jedes Wort beginnt. Für jedes gesprochene Wort wird eine Suche in einem Wörterbuch ausgeführt, um mögliche Übereinstimmungen zwischen den gespeicherten Wörterbuchwörtern und jedem gesprochenen Wort zu lokalisieren. Aus den potenziellen Übereinstimmungen wird dann die beste Übereinstimmung mit dem Wörterbuchwort ausgewählt, und das ausgewählte Wort wird an eine Anwendung weitergeleitet. - Unglücklicherweise besitren solche Programme nach dem Stand der Technik einige Nachteile. Besonders die Fehlerrate solcher Programme bleibt hoch. Darüber hinaus bestehen Probleme bei der kontinuierlichen Spracheingabe, so dass ein unzweckmäßiger Spracheingabestil erforderlich ist, indem an Intervallen pausiert werden muss, um es dem Programm zu gestatten, die gesprochenen Wörter zu identifizieren und die Informationen zu verarbeiten. Auch müssen solche Programme nach dem Stand der Technik vor der Verwendung trainiert werden. Anders ausgedrückt muss ein Benutzer vor der Verwendung Zeit zur Aufnahme eines umfangreichen Muster-Vokabulars für die Maschine aufwenden, damit diese sie mit den Eingaben vergleichen kann.
- Als ein Ergebnis der Schwierigkeiten von Programmen nach dem Stand der Technik stehen die Benutzer der Situation gegenüber, dass sie sich für eine genaue und bequeme Texteingabe weiterhin auf alte Verfahren verlassen müssen, welche entweder beinhalten, dass jemand ein Diktat aufnehmen und dann die gesprochenen Wörter über eine Tastatur in den Computer eingeben muss, oder schnell Maschineschreiben kann. Ausserdem führt die fortgesetzte und regelmäßige Verwendung einer Tastatur zu einem Risiko von Verletzungen und Ermüdung durch wiederholte Belastung.
- KURZE BESCHREIBUNG DER ZEICHNUNGEN
- In den Zeichnungen ist:
-
1 ein Blockdiagramm, welches die Schritte eines Stimmeingabeverfahrens nach dem Stand der Technik darstellt; -
2 ein Blockdiagramm, welches die Schritte einer Ausführungsform des Verfahrens und der Vorrichtung zur Eingabe in einen Spracherkennungs-Computer gemäß der vorliegenden Erfindung darstellt; und -
3 ein Blockdiagramm, welches die Schritte einer weiteren Ausführungsform des Verfahrens und der Vorrichtung zur Eingabe in einen Spracherkennungs-Computer gemäß der vorliegenden Erfindung darstellt. - DETAILLIERTE BESCHIREIBUNG DER GEGENWÄRTIG BEVORZUGTEN AUSFÜHRUNGSFORMEN
- Die vorliegende Erfindung verwendet eine bekannte Stimmerkennungstechnologie, um es dem Benutrer zu gestatten, den Anfangsbuchstaben eines jeden gesprochenen Wortes über eine Tastatur, im Wesentlichen gleichzeitig mit dem gesprochenen Wort, einzugeben, wodurch die Verarbeitungsleistung und die Zeit, die von einem Computer benötigt werden, verringert werden. Die Erfindung überwindet die Nachteile des Standes der Technik in mehreren Beziehungen. Erstens wird ein kontinuierliches Sprechen möglich, da dem Computer – durch Eingabe des Anfangsbuchstabens eines jeden Wortes mittels Tastatur – exakt mitgeteilt, wann ein neues Wort beginnt, wodurch die Verarbeitungsleistung, die in Systemen nach dem Stand der Technik erforderlich war, um zu bestimmen, wann ein Wort geendet und das nächste begonnen hat, in großem Ausmaß verringert wird. Des Weiteren wird die mögliche Auswahl von Wörtern in großem Ausmaß verringert, da der Anfangsbuchstabe über die Eingabe mittels Tastatur bekannt ist. Diese Eigenschaft verringert des Weiteren die erforderliche Verarbeitungsleistung und -zeit, da weniger Wörter aus dem Wörterbuch lokalisiert und abgefragt werden müssen. Diese Eigenschaft erhöht auch die Genauigkeit des ausgewählten oder abgefragten Wortes, da der Anfangsbuchstabe des gesprochenen Wortes an den Computer geliefert wird.
- Zusätrlich zu den vorangegangenen Vorteilen benötigt die vorliegende Erfindung deutlich weniger Eintippen als die standardmäßige Eingabe über eine Tastatur. Als ein Ergebnis können kleinere Tastaturen im Vergleich zu Tastaturen in Standard-Größen verwendet werden, wodurch die Oberfläche- des Benutrer-Arbeitsplatres vergrößert wird, der früher von einer Tastatur in Standard-Größe beansprucht wurde. Überdies ist die vorliegende Erfindung besonders gut geeignet für die Verwendung von Computern im Palm-Format oder Persönliche digitale Assistenten (Personal Digital Assistants = PDA's). Außerdem wird, da weniger Tippen für die Dateneingabe erforderlich ist, das Risiko verringert, dass Verletzungen, Müdigkeit oder Fehler auftreten.
- Als ein Ergebnis der vorliegenden Erfindung können sprecherunabhängige Programme leichter hergestellt werden, da die Notwendigkeit, sich auf die Fähigkeit des Computers zu verlassen, Abweichungen in der Aussprache zu unterscheiden, beträchtlich vermindert wird.
- Die vorliegende Erfindung ist in
2 dargestellt. Wie gezeigt, werden die Schritte1A und1B im Wesentlichen gleichzeitig miteinander ausgeführt. In der Alternative kann ein Puffer-Register eingesetzt werden, um temporär entweder das gesprochene Wort oder den getippten Buchstaben zu speichern, während die Eingabe des jeweils anderen von gesprochenem Wort oder eingetipptem Buchstaben erwartet wird. Wenn sowohl ein gesprochenes Wort als auch ein Buchstabe in den Computer eingegeben worden sind, wird eine Suche in den Wörterbuch-Eintragungen ausgeführt, beginnend mit dem getippten Buchstaben, um mögliche Übereinstimmungen zu lokalisieren. Die beste Übereinstimmung wird dann ausgewählt, und das ausgewählte Wort wird an eine Anwendung weitergeleitet. - Zusätrlich zu dem oben Erwähnten zeigt
3 , dass die vorliegende Erfindung einzelne Wörter oder ein Vielzahl von Wörtern spezifischen Funktionen zuordnen oder für diese bezeichnen kann, welche ausgeführt werden, wenn das bestimmte Wort gesprochen wird, ohne dass der Anfangsbuchstabe des Wortes getippt wird, wie in den Schritten5 und6 von3 . Als eine Veranschaulichung kann dem Wort "löschen" die Funktion zugewiesen werden, das zuletzt getippte Wort zu löschen, wenn das Wort "löschen" gesprochen wird, ohne den Buchstaben "1" zu tippen. Wenn daher der Computer ein Wort auf Basis des gesprochenen Wortes und des getippten Anfangsbuchstaben des gesprochenen Wortes nicht korrekt identifiziert, kann der Benutzer das nicht korrekte Wort anschlagen oder löschen in dem er das Wort "löschen" ausspricht. Selbstverständlich wird, wenn das Wort "löschen" eingegeben werden soll, das Wort ausgesprochen und der Buchstabe "1" auf der Tastatur gedrückt. Eine solche Funktion kann an jedem beliebigen nicht korrekten Wort ausgeführt werden, indem einfach der Cursor zu dem nicht korrekten Wort bewegt und "löschen" gesagt wird. Schritt5 umfasst den Schritt, dass das gesprochene Audiosignal mit einer Liste vorbestimmter Funktionen verglichen wird. Optional kann Schritt5 die Schritte umfassen, dass bestimmt wird, ob der Benutrer einen Anfangsbuchstaben tippt, und dass dann das gesprochene Audiosignal mit der Liste vorbestimmter Funktionen verglichen wird. - Die Erfindung wird durch die oben beschriebenen Ausführungsformen, welche nur als Beispiele gezeigt werden, nicht eingeschränkt, sondern kann auf verschiedene Weise abgewandelt werden, wie für den Fachmann leicht ersichtlich ist. Zum Beispiel können, anstatt dass nur der Anfangsbuchstabe jedes gesprochenen Wortes getippt wird, der erste und der letzte Buchstabe getippt werden, oder alternativ, die ersten beiden Buchstaben getippt werden, wodurch die Zeit und Energie für die Computerverarbeitung weiter verringert wird.
Claims (4)
- Verfahren zur Erleichterung der Identifizierung von gesprochenen Wörtern durch eine Spracherkennungs-Computeranwendung, die auf eine Speichervorrichtung zugreift, welche Wörterbucheinträge von gespeicherten Wörterbuch-Wörtern enthält und welche identifizierte Wörter in eine gleichzeitig laufende Computeranwendung eingibt, wobei das Verfahren die Schritte umfasst, dass: a. ein Audiosignal empfangen wird, das ein von einem Benutzer gesprochenes Wort darstellt; b. eine von einem Benutrer über Tasten eines von einem Benutzer bedienbaren Tastenfeldes eingegebene Eingabe empfangen wird, welche zumindest den ersten Buchstaben des gesprochenen Wortes darstellt; c. nach Schritt a. und b. automatisch eine Übereinstimmung zwischen dem gesprochenen Wort und den Wörterbucheinträgen durch Vergleichen des Audiosignals nur mit jenen Wörterbucheinträgen ausgewählt wird, die den zumindest ersten Buchstaben enthalten; und d. danach die Übereinstimmung in die gegenwärtig laufende Computer-Anwendung eingefügt wird, ohne weitere Benutzereingaben zu erfordern.
- Verfahren nach Anspruch 1, worin die Schritte a. und b. im Wesentlichen zeitgleich ausgeführt werden.
- Verfahren nach Anspruch 1, worin einer der Schritte a. und b. vor dem anderen der Schritte a. und b. ausgeführt wird, und das Computer-Schnittstellen-Verfahren des Weiteren den Schritt umfasst, dass der eine der Schritte a. und b. in einem Puffer-Register gespeichert wird, bis der andere der Schritte a. und b. ausgeführt wird.
- Verfahren nach einem der Ansprüche 1–3, des Weiteren umfassend die Schritte, dass: e. bestimmt wird, ob das gesprochene Audiosignal eine vorbestimmte Funktion umfasst; f. die vorbestimmte Funktion ausgeführt wird, wenn in Schritt e. bestimmt wird, dass das gesprochene Audiosignal die vorbestimmte Funktion umfasst; und g. Schritt c. ausgeführt wird, wenn die gesprochene Audio-Schnittstelle nicht die vorbestimmte Funktion ist.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US5099897P | 1997-06-27 | 1997-06-27 | |
| US50998P | 1997-06-27 | ||
| PCT/US1998/013118 WO1999000790A1 (en) | 1997-06-27 | 1998-06-26 | Speech recognition computer input and device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| DE69817844D1 DE69817844D1 (de) | 2003-10-09 |
| DE69817844T2 true DE69817844T2 (de) | 2004-05-06 |
Family
ID=21968753
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE69817844T Expired - Fee Related DE69817844T2 (de) | 1997-06-27 | 1998-06-26 | Verfahren und vorrichtung zur spracherkennungscomputereingabe |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US5937380A (de) |
| EP (1) | EP1016078B1 (de) |
| DE (1) | DE69817844T2 (de) |
| WO (1) | WO1999000790A1 (de) |
Families Citing this family (50)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6163768A (en) | 1998-06-15 | 2000-12-19 | Dragon Systems, Inc. | Non-interactive enrollment in speech recognition |
| US6064965A (en) * | 1998-09-02 | 2000-05-16 | International Business Machines Corporation | Combined audio playback in speech recognition proofreader |
| AU2153100A (en) * | 1998-11-20 | 2000-06-13 | Eric J. Peter | Digital dictation card and method of use in business |
| US7679534B2 (en) | 1998-12-04 | 2010-03-16 | Tegic Communications, Inc. | Contextual prediction of user words and user actions |
| US7712053B2 (en) | 1998-12-04 | 2010-05-04 | Tegic Communications, Inc. | Explicit character filtering of ambiguous text entry |
| US7881936B2 (en) | 1998-12-04 | 2011-02-01 | Tegic Communications, Inc. | Multimodal disambiguation of speech recognition |
| US7720682B2 (en) * | 1998-12-04 | 2010-05-18 | Tegic Communications, Inc. | Method and apparatus utilizing voice input to resolve ambiguous manually entered text input |
| US8938688B2 (en) | 1998-12-04 | 2015-01-20 | Nuance Communications, Inc. | Contextual prediction of user words and user actions |
| US6401065B1 (en) * | 1999-06-17 | 2002-06-04 | International Business Machines Corporation | Intelligent keyboard interface with use of human language processing |
| US10173128B2 (en) | 2000-06-02 | 2019-01-08 | Milestone Entertainment Llc | Games, and methods for improved game play in games of chance and games of skill |
| US6565084B1 (en) | 2000-06-02 | 2003-05-20 | Milestone Entertainment | Games, and methods for improved game play in games of chance and games of skill |
| WO2002005263A1 (de) * | 2000-07-07 | 2002-01-17 | Siemens Aktiengesellschaft | Verfahren zur spracheingabe und -erkennung |
| US20020078445A1 (en) * | 2000-07-11 | 2002-06-20 | Imran Sharif | Internet appliance for interactive audio/video display using a remote control unit for user input |
| US20030115167A1 (en) * | 2000-07-11 | 2003-06-19 | Imran Sharif | Web browser implemented in an Internet appliance |
| US7245291B2 (en) | 2000-07-11 | 2007-07-17 | Imran Sharif | System and method for internet appliance data entry and navigation |
| US6980313B2 (en) * | 2000-07-11 | 2005-12-27 | Imran Sharif | Fax-compatible internet appliance |
| US7798896B2 (en) | 2000-09-27 | 2010-09-21 | Milestone Entertainment Llc | Apparatus, systems and methods for implementing enhanced gaming and prizing parameters in an electronic environment |
| US8393946B2 (en) | 2001-09-26 | 2013-03-12 | Milestone Entertainment Llc | Apparatus and method for game play in an electronic environment |
| US8727853B2 (en) | 2000-09-27 | 2014-05-20 | Milestone Entertainment, LLC | Methods and apparatus for enhanced play in lottery and gaming environments |
| DE10129005B4 (de) * | 2001-06-15 | 2005-11-03 | Harman Becker Automotive Systems Gmbh | Verfahren zur Spracherkennung und Spracherkennungssystem |
| US7194513B2 (en) * | 2001-07-08 | 2007-03-20 | Imran Sharif | System and method for using an internet appliance to send/receive digital content files as E-mail attachments |
| US9626837B2 (en) | 2001-09-26 | 2017-04-18 | Milestone Entertainment Llc | System for game play in an electronic environment |
| DE10204924A1 (de) * | 2002-02-07 | 2003-08-21 | Philips Intellectual Property | Verfahren und Vorrichtung zur schnellen mustererkennungsunterstützten Transkription gesprochener und schriftlicher Äußerungen |
| DE10207895B4 (de) | 2002-02-23 | 2005-11-03 | Harman Becker Automotive Systems Gmbh | Verfahren zur Spracherkennung und Spracherkennungssystem |
| EP1363271A1 (de) | 2002-05-08 | 2003-11-19 | Sap Ag | Verfahren und System zur Verarbeitung und Speicherung von Sprachinformationen eines Dialogs |
| DE10220524B4 (de) | 2002-05-08 | 2006-08-10 | Sap Ag | Verfahren und System zur Verarbeitung von Sprachdaten und zur Erkennung einer Sprache |
| US8583440B2 (en) | 2002-06-20 | 2013-11-12 | Tegic Communications, Inc. | Apparatus and method for providing visual indication of character ambiguity during text entry |
| US7392182B2 (en) | 2002-12-18 | 2008-06-24 | Harman International Industries, Inc. | Speech recognition system |
| US7363224B2 (en) | 2003-12-30 | 2008-04-22 | Microsoft Corporation | Method for entering text |
| US8095364B2 (en) | 2004-06-02 | 2012-01-10 | Tegic Communications, Inc. | Multimodal disambiguation of speech recognition |
| US7574356B2 (en) * | 2004-07-19 | 2009-08-11 | At&T Intellectual Property Ii, L.P. | System and method for spelling recognition using speech and non-speech input |
| US9773373B2 (en) | 2004-09-01 | 2017-09-26 | Milestone Entertainment Llc | Systems for implementing enhanced gaming and prizing parameters in an electronic environment |
| US11875642B2 (en) | 2004-09-01 | 2024-01-16 | Milestone Entertainment, LLC | Systems for implementing enhanced gaming and prizing parameters in an electronic environment |
| DE102004045111A1 (de) * | 2004-09-17 | 2006-04-06 | Daimlerchrysler Ag | Verfahren zum gezielten Abspeichern und Wiederauffinden von Listenelementen bei einem Sprachdialogsystem |
| CN102272827B (zh) * | 2005-06-01 | 2013-07-10 | 泰吉克通讯股份有限公司 | 利用语音输入解决模糊的手工输入文本输入的方法和装置 |
| WO2007017883A1 (en) * | 2005-08-05 | 2007-02-15 | Hewlett-Packard Development Company L.P. | System and method for voice assisted inputting of syllabic characters into a computer |
| US9508225B2 (en) | 2006-10-11 | 2016-11-29 | Milestone Entertainment Llc | Methods and apparatus for enhanced interactive game play in lottery and gaming environments |
| US7904298B2 (en) * | 2006-11-17 | 2011-03-08 | Rao Ashwin P | Predictive speech-to-text input |
| US8571862B2 (en) * | 2006-11-30 | 2013-10-29 | Ashwin P. Rao | Multimodal interface for input of text |
| WO2008067562A2 (en) * | 2006-11-30 | 2008-06-05 | Rao Ashwin P | Multimodal speech recognition system |
| US9830912B2 (en) * | 2006-11-30 | 2017-11-28 | Ashwin P Rao | Speak and touch auto correction interface |
| TWI336048B (en) * | 2007-05-11 | 2011-01-11 | Delta Electronics Inc | Input system for mobile search and method therefor |
| US8535134B2 (en) | 2008-01-28 | 2013-09-17 | Milestone Entertainment Llc | Method and system for electronic interaction in a multi-player gaming system |
| DE102008007699A1 (de) * | 2008-02-06 | 2009-08-13 | Siemens Aktiengesellschaft | Verfahren zur Eingabe von Wörtern in ein Gerät |
| US9922640B2 (en) | 2008-10-17 | 2018-03-20 | Ashwin P Rao | System and method for multimodal utterance detection |
| US8494852B2 (en) | 2010-01-05 | 2013-07-23 | Google Inc. | Word-level correction of speech input |
| JP6427755B2 (ja) * | 2014-02-24 | 2018-11-28 | パナソニックIpマネジメント株式会社 | データ入力装置、データ入力方法、プログラム及び車載機 |
| US10726197B2 (en) * | 2015-03-26 | 2020-07-28 | Lenovo (Singapore) Pte. Ltd. | Text correction using a second input |
| CN106601254B (zh) | 2016-12-08 | 2020-11-06 | 阿里巴巴(中国)有限公司 | 信息输入方法和装置及计算设备 |
| US10811009B2 (en) * | 2018-06-27 | 2020-10-20 | International Business Machines Corporation | Automatic skill routing in conversational computing frameworks |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4866778A (en) * | 1986-08-11 | 1989-09-12 | Dragon Systems, Inc. | Interactive speech recognition apparatus |
| DE3879028T2 (de) * | 1987-07-16 | 1993-06-24 | Fujitsu Ltd | Spracherkennungseinrichtung. |
| US5022081A (en) * | 1987-10-01 | 1991-06-04 | Sharp Kabushiki Kaisha | Information recognition system |
| US5027406A (en) * | 1988-12-06 | 1991-06-25 | Dragon Systems, Inc. | Method for interactive speech recognition and training |
| US5144672A (en) * | 1989-10-05 | 1992-09-01 | Ricoh Company, Ltd. | Speech recognition apparatus including speaker-independent dictionary and speaker-dependent |
| US5329609A (en) * | 1990-07-31 | 1994-07-12 | Fujitsu Limited | Recognition apparatus with function of displaying plural recognition candidates |
| US5546499A (en) * | 1994-05-27 | 1996-08-13 | Kurzweil Applied Intelligence, Inc. | Speech recognition system utilizing pre-calculated similarity measurements |
| US5500919A (en) * | 1992-11-18 | 1996-03-19 | Canon Information Systems, Inc. | Graphics user interface for controlling text-to-speech conversion |
| US5799267A (en) * | 1994-07-22 | 1998-08-25 | Siegel; Steven H. | Phonic engine |
-
1998
- 1998-06-26 WO PCT/US1998/013118 patent/WO1999000790A1/en not_active Ceased
- 1998-06-26 US US09/105,662 patent/US5937380A/en not_active Expired - Fee Related
- 1998-06-26 EP EP98931545A patent/EP1016078B1/de not_active Expired - Lifetime
- 1998-06-26 DE DE69817844T patent/DE69817844T2/de not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| EP1016078A4 (de) | 2000-07-05 |
| EP1016078B1 (de) | 2003-09-03 |
| DE69817844D1 (de) | 2003-10-09 |
| EP1016078A1 (de) | 2000-07-05 |
| US5937380A (en) | 1999-08-10 |
| WO1999000790A1 (en) | 1999-01-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE69817844T2 (de) | Verfahren und vorrichtung zur spracherkennungscomputereingabe | |
| DE69923379T2 (de) | Nicht-interaktive Registrierung zur Spracherkennung | |
| DE69632517T2 (de) | Erkennung kontinuierlicher Sprache | |
| DE69634239T2 (de) | Erkennung kontinuierlich gesprochener Texte und Befehle | |
| DE69834553T2 (de) | Erweiterbares spracherkennungssystem mit einer audio-rückkopplung | |
| DE69914131T2 (de) | Positionshandhabung bei der Spracherkennung | |
| DE69607601T2 (de) | System und verfahren zur spracherkennung mit automatischer erzeugung einer syntax | |
| DE69330427T2 (de) | Spracherkennungssystem für sprachen mit zusammengesetzten wörtern | |
| Halverson et al. | The beauty of errors: Patterns of error correction in desktop speech systems. | |
| DE60033106T2 (de) | Korrektur der Betriebsartfehler, Steuerung oder Diktieren, in die Spracherkennung | |
| DE60318544T2 (de) | Sprachmodell für die Spracherkennung | |
| DE60215272T2 (de) | Verfahren und Vorrichtung zur sprachlichen Dateneingabe bei ungünstigen Bedingungen | |
| DE69829235T2 (de) | Registrierung für die Spracherkennung | |
| DE69818231T2 (de) | Verfahren zum diskriminativen training von spracherkennungsmodellen | |
| DE60122352T2 (de) | Augenverfolgung für kontextabhängige spracherkennung | |
| DE60012655T2 (de) | Audiowiedergabe von einem geschriebenen Dokument aus mehreren Quellen | |
| DE10040214B4 (de) | Verfahren und System zur automatischen Erkennung einer Aktualisierung eines Sprachmodells in einem Spracherkennungssystem | |
| DE3788488T2 (de) | Sprachenübersetzungssystem. | |
| DE69129163T2 (de) | Verfahren und Vorrichtung zur Texteingabe | |
| US5970448A (en) | Historical database storing relationships of successively spoken words | |
| DE60207742T2 (de) | Korrektur eines von einer spracherkennung erkannten textes mittels vergleich der phonemfolgen des erkannten textes mit einer phonetischen transkription eines manuell eingegebenen korrekturwortes | |
| EP0994461A2 (de) | Verfahren zur automatischen Erkennung einer buchstabierten sprachlichen Äusserung | |
| DE69613556T2 (de) | Schlüsselworterkennung | |
| DE3910467A1 (de) | Verfahren und vorrichtung zur erzeugung von berichten | |
| DE4109785C2 (de) | Verfahren zur Aufbereitung von Wörterbuchdateien und zur Erstellung von Anwendungsprogrammen sowie System zur Durchführung dieses Verfahrens |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 8364 | No opposition during term of opposition | ||
| 8339 | Ceased/non-payment of the annual fee |