DE60201907T2 - Darstellung einer komprimierten liste für sprachgesteuerte benutzerschnittstellen - Google Patents

Darstellung einer komprimierten liste für sprachgesteuerte benutzerschnittstellen Download PDF

Info

Publication number
DE60201907T2
DE60201907T2 DE60201907T DE60201907T DE60201907T2 DE 60201907 T2 DE60201907 T2 DE 60201907T2 DE 60201907 T DE60201907 T DE 60201907T DE 60201907 T DE60201907 T DE 60201907T DE 60201907 T2 DE60201907 T2 DE 60201907T2
Authority
DE
Germany
Prior art keywords
items
group
list
common
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60201907T
Other languages
English (en)
Other versions
DE60201907D1 (de
Inventor
Ciprian Agapi
Robert James LEWIS
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nuance Communications Inc
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Application granted granted Critical
Publication of DE60201907D1 publication Critical patent/DE60201907D1/de
Publication of DE60201907T2 publication Critical patent/DE60201907T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/0024Services and arrangements where telephone services are combined with data services
    • H04M7/0036Services and arrangements where telephone services are combined with data services where the data service is an information service
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)
  • Telephonic Communication Services (AREA)

Description

  • HINTERGRUND DER ERFINDUNG
  • Technisches Gebiet
  • Die vorliegende Erfindung betrifft das Gebiet sprachgesteuerter Online-Antwortsysteme und insbesondere sprachgesteuerte Benutzerschnittstellen zur Verwendung in sprachgesteuerten Online-Antwortsystemen.
  • Beschreibung der zugrunde liegenden Technik
  • In Sprachverarbeitungssystemen kann Sprache sowohl eingegeben als auch ausgegeben werden. Durch bekannte Spracherkennungsverfahren können Sprachausgaben in einen für einen Computer verständlichen Text umgesetzt werden. Ebenso können durch bekannte Sprachsyntheseverfahren Sprachausgaben erzeugt werden. In den vergangenen Jahren hat besonders eine Art von Sprachverarbeitungssystemen, das Online-Sprachverarbeitungssystem, breite Anwendung gefunden. Online-Sprachverarbeitungssysteme sind Datenverarbeitungssysteme, welche über eine sprachgesteuerte Benutzerschnittstelle sowohl Spracheingaben verarbeiten als auch Sprachausgaben erzeugen können. Typische Online-Sprachverarbeitungssysteme sind in einer Telefonanlage installiert, in welcher Benutzer mittels eines Telefons mit dem Online-Sprachverarbeitungssystem in Verbindung treten. Ein solches System ist von Bennacef et al. in „Dialog in the RAILTEL Telephone-based system", ICSLP, 96, S. 550 bis 553, beschrieben worden.
  • Im Allgemeinen können Online-Sprachverarbeitungssysteme auf Anforderung durch das Datenverarbeitungssystem gesprochene Aufforderungen an einen Benutzer richten, indem sie gesprochene Texte synthetisieren und über ein öffentliches Telefonnetz (Public Switched Telephone Network, PSTN) zum Benutzer übertragen. Allerdings sind Online-Sprachverarbeitungssysteme nicht auf die Verwendung in einem öffentlichen Telefonnetz beschränkt, sondern sind auch schon in solche Sprachübermittlungsverfahren in Paketvermittlungsnetzen wie zum Beispiel VoIP (Sprache über Internet) integriert worden. In jedem Fall können Benutzer auf gesprochene Aufforderungen eines Online-Sprachverarbeitungssystems antworten, indem sie über das öffentliche Telefonnetz mit dem Online-Sprachverarbeitungssysteme „sprechen". Online-Sprachverarbeitungssysteme können die Benutzersprache analysieren und in Text umsetzen, der durch das Datenverarbeitungssystem verarbeitet werden kann.
  • Online-Sprachverarbeitungssysteme bieten Benutzern des Öfteren eine Liste mit einem Auswahlmenü an. Zum Beispiel können Benutzern in einem Online-Sprachverarbeitungssystem, das in einem rechnergestützten Bibliothekskatalog eingesetzt wird, Bücherlisten angeboten werden, welche Suchkriterien wie zum Beispiel „Fiktion" oder „Sport" erfüllen. Der Nutzen eines solchen Online-Sprachverarbeitungssystems, das Listen mit vielen Posten enthält, kann jedoch durch die beschränkte Merkfähigkeit der Benutzer begrenzt sein. Wenn die Bücherliste beispielsweise mehr als ein Dutzend Posten enthält, können sich Benutzer in den meisten Fällen nicht an alle Posten in der Liste erinnern. Deshalb wird ein Verfahren zum Komprimieren der Darstellung längerer Listen in einem Online-Sprachverarbeitungssystem benötigt, um die Auswahl von Posten aus einer Liste durch Benutzer zu erleichtern.
  • ÜBERBLICK ÜBER DIE ERFINDUNG
  • Die vorliegende Erfindung löst das Problem der Darstellung von Posten in einer Liste über eine sprachgesteuerte Benutzerschnittstelle durch Bereitstellen eines Systems, einer Vorrichtung und eines Verfahrens zur Darstellung einer komprimierten Liste, durch welche die Nachteile beim Stand der Technik beseitigt werden. Insbesondere kann die vorliegende Erfindung ein Verfahren zum automatischen Komprimieren der Darstellung von langen Listen in einem interaktiven sprachgesteuerten Antwortsystem beinhalten, um die Benutzerauswahl von Posten aus einer Liste zu erleichtern. Insbesondere kann ein Verfahren zur Darstellung einer Liste gemäß den erfindungsgemäßen Anordnungen die folgenden Schritte umfassen: dynamisches Zusammenfassen von Posten in einer Liste zu Gruppen anhand nacheinander angeordneter Symbole in den Posten, welche allen gemeinsam sind; Markieren jeder Gruppe der ausgewählten Posten; gesprochene Darstellung jeder Gruppenmarkierung über eine sprachgesteuerte Benutzerschnittstelle; und, als Reaktion auf eine Auswahl einer der dargestellten Gruppenmarkierungen, Darstellung der Posten in einer der ausgewählten Gruppenmarkierung entsprechenden Gruppe durch die sprachgesteuerte Benutzerschnittstelle.
  • Gemäß einem Aspekt der vorliegenden Erfindung kann der Schritt des Zusammenfassens zu Gruppen die folgenden Schritte beinhalten: Analysieren einer Liste von Posten nach Komponentensymbolen; Kennzeichnen von nacheinander angeordneten Komponentensymbolen, welche mindestens zwei der Posten gemeinsam sind, in den Posten der Liste; und Zusammenfassen der mindestens zwei Posten zu einer Gruppe. Außerdem kann der Markierungsschritt die folgenden Schritte beinhalten: Erzeugen einer Markierung anhand der nacheinander angeordneten Komponentensymbole, welche mindestens zwei der Posten gemeinsam sind; und Zuweisen der erzeugten Markierung zu der zusammengefassten Gruppe.
  • Gemäß einem anderen Aspekt der vorliegenden Erfindung kann der Schritt der Zusammenfassung zu einer Gruppe die folgenden Schritte beinhalten: alphabetisches Sortieren der Liste auf der Grundlage der Anfangssymbole der Posten in der Liste; ferner alphabetisches Sortieren der Liste auf der Grundlage der folgenden nacheinander angeordneten Symbole in den Posten der Liste; und Erzeugen von Gruppen auf der Grundlage der Anfangssymbole und der folgenden nacheinander angeordneten Symbole in den Posten der Liste, welche mindestens zwei der Posten gemeinsam sind. Außerdem kann das Verfahren den Schritt des Überspringens von Produktsymbolen während des Ausführens der Sortierschritte beinhalten. Und schließlich kann der Markierungsschritt den Schritt des Erzeugens einer Markierung beinhalten, welche die Anfangssymbole und die folgenden nacheinander angeordneten Symbole in den Posten der Liste umfasst, die mindestens zwei der Posten gemeinsam sind. Wichtig ist, dass das Verfahren mehrfach (rekursiv) auf Gruppen von Posten angewendet werden kann. Insbesondere kann das Verfahren, wenn eine durch das Verfahren erzeugte Gruppe zu viele Posten enthält, erneut auf die Gruppe angewendet werden, um die Gruppe zu verkleinern.
  • Ein System zur Darstellung einer Liste gemäß der erfindungsgemäßen Anordnung kann Folgendes beinhalten: eine Gruppierungskomponente zum dynamischen Zusammenfassen ausgewählter Posten einer Liste zu einer Gruppe auf der Grundlage nacheinander angeordneter Symbole in den Posten, welche allen Posten gemeinsam sind; einen Gruppenmarkierer zum Markieren jeder Gruppe von ausgewählten Posten; und eine Darstellungskomponente zur sprachlichen Darstellung jeder Gruppenmarkierung und aller Posten in der einer ausgewählten Gruppenmarkierung entsprechenden Gruppe mittels einer sprachgesteuerten Benutzerschnittstelle. Die Gruppierungskomponente kann Folgendes beinhalten: eine Analyseeinheit zum Analysieren der Posten einer Liste nach Komponentensymbolen; einen Komparator zum Identifizieren nacheinander angeordneter Komponentensymbole der Posten in einer sortierten Liste, welche mindestens zwei der Posten gemeinsam sind; und eine Zusammenfassungseinheit zum Zusammenfassen der mindestens zwei Posten zu einer Gruppe. Alternativ kann die Gruppierungskomponente Folgendes beinhalten: eine Sortiereinheit zum alphabetischen Sortieren der Posten einer Liste auf der Grundlage von Anfangssymbolen der Posten dieser Liste und auf der Grundlage von folgenden nacheinander angeordneten Symbolen der Posten dieser Liste; und eine Zusammenfassungseinheit zum Zusammenfassen der Posten in der sortierten Liste mit gemeinsamen Anfangs- und folgenden nacheinander angeordneten Symbolen zu einer Gruppe. Und schließlich kann das System zur Listendarstellung eine Komponente zum Überspringen von Symbolen beinhalten, um zu verhindern, dass die Sortiereinheit beim Sortieren der Posten der Liste solche Symbole wie zum Beispiel Artikel berücksichtigt.
  • Ferner wird gemäß der Erfindung ein maschinenlesbarer Speicher nach Anspruch 8 bereitgestellt.
  • KURZBESCHREIBUNG DER ZEICHNUNGEN
  • In den vorliegenden Zeichnungen sind bevorzugte Ausführungsarten dargestellt, wobei jedoch klar ist, dass die Erfindung nicht genau auf die gezeigten Anordnungen und Vorrichtungen beschränkt ist.
  • 1A bis 1F stellen in ihrer Gesamtheit ein Verfahren und ein System zur Darstellung einer komprimierten Liste gemäß den Anordnungen der Erfindung bildlich dar.
  • 2 ist ein Ablaufdiagramm, welches ein gemäß einem Aspekt der vorliegenden Erfindung konfiguriertes Verfahren zur Darstellung einer Liste zeigt.
  • 3 ist ein Verfahren zum Erzeugen von Gruppen, das gemeinsamen mit dem Verfahren zur Darstellung einer Liste von 2 eingesetzt wird.
  • DETAILLIERTE BESCHREIBUNG DER ERFINDUNG
  • Bei der vorliegenden Erfindung handelt es sich um ein System, ein Verfahren und eine Vorrichtung zur Darstellung einer komprimierten Liste zur Verwendung mit einer sprachgesteuerten Benutzerschnittstelle. Die vorliegende Erfindung kann eine Liste von Posten, welche einem Benutzer über eine sprachgesteuerte Benutzerschnittstelle vorgestellt wird, wirksam bearbeiten. Im Gegensatz zu Verfahren nach dem Stand der Technik zur nichtdynamischen Darstellung von Listen über eine sprachgesteuerte Benutzerschnittstelle fasst die vorliegende Erfindung ausgewählte Posten einer Liste auf intelligente und dynamische Weise zu Gruppen zusammen, formuliert für jede Gruppe eine Gruppenmarkierung und bietet diese Gruppenmarkierungen dem Benutzer über die sprachgesteuerte Benutzerschnittstelle dar. Anschließend werden die in der Gruppe befindlichen Posten der Liste dem Benutzer nur dann über die sprachgesteuerte Benutzerschnittstelle dargeboten, wenn dieser durch Angeben einer entsprechenden Gruppenmarkierung eine bestimmte Gruppe auswählt. Auf diese Weise werden den Benutzern über die sprachgesteuerte Benutzerschnittstelle kürzere, komprimierte Listen dargeboten, wodurch sich der Gebrauchswert eines sprachgesteuerten Systems erhöht, welches die vorliegende Erfindung anwendet.
  • Die 1A bis 1F zeigen zusammen ein System und ein Verfahren zur Darstellung einer Liste gemäß der erfindungsgemäßen Anordnung. In 1A tritt ein Benutzer 102 mit einem Sprachverarbeitungssystem in Verbindung, welches einen Sprachserver 112 und ein Back-End-Datenverarbeitungssystem 114 beinhaltet, welche zur Datenübertragung durch ein Paketvermittlungsnetz 110 miteinander verbunden sind. Obwohl dieses in 1A bis 1F speziell als „Internet" bezeichnet wird, ist die Erfindung nicht darauf beschränkt, sondern es eignet sich jede Netztopologie wie zum Beispiel ein privates lokales Netzwerk. Außerdem kann die Erfindung in einem eigenständigen (Stand-Alone) System oder in einem eingebetteten System angewendet werden. Auf jeden Fall kann das Back-End-Datenverarbeitungssystem 114 eine oder mehrere Datenbanken enthalten, in denen Daten zur Verwendung durch das Datenverarbeitungssystem 114 gespeichert sein können. Der Benutzer 102 kann mittels eines üblichen Telefonapparates 104 über ein öffentliches Telefonnetz (PSTN) 106 mit dem Sprachverarbeitungssystem in Verbindung treten. Insbesondere kann ein Telefonvermittlungsrechner (Gateway) 108 die Verbindung zwischen dem Paketvermittlungsnetz 110 und dem PSTN 106 herstellen.
  • Der Benutzer 102 kann dadurch in Aktion treten, dass er über das PSTN 106 eine Verbindung zum Sprachserver 112 herstellt. Insbesondere kann der Telefonvermittlungsrechner 108 einen Telefonanruf vom Benutzer 102 konfigurieren und so lange aufrechterhalten, wie dies erforderlich ist. Der Telefonvermittlungsrechner 108 kann darüber hinaus sowohl über das PSTN 106 empfangene Daten zu den Einheiten des Paketvermittlungsnetzes 110 als auch über das Paketvermittlungsnetz 110 empfangene Daten zu den Knoten des PSTN 106 weiterleiten. Dem Fachmann ist klar, dass es sich bei den Telefonvermittlungsrechnern um herkömmliche Einheiten handelt, die in der Technik gut bekannt sind und normalerweise zum Herstellen und Aufrechterhalten von Telefonanrufen zwischen einem PSTN-Knoten und einer Einheit im Paketvermittlungsnetz dienen. Außerdem sind alternative Gateway-Konfigurationen möglich, in denen beispielsweise ein Gatekeeper (Rechner zur Adressverwaltung und Zugriffssteuerung) die Anrufe verwaltet und der Vermittlungsrechner die Audiodatenströme digitalisiert und in Pakete aufteilt.
  • 1A zeigt. ein Sprachverarbeitungssystem, welches den Benutzer 102 nach Informationen abfragen kann. Bei dem Sprachverarbeitungssystem kann es sich zum Beispiel um einen Bibliothekskatalog handeln, und der Sprachserver 112 kann den Benutzer 102 auffordern, ein Sachgebiet anzugeben, nach welchem das Datenverarbeitungssystem 114 in der Datenbank 116 suchen kann. Insbesondere kann der Sprachserver 112 eine synthetische Sprachausgabe erzeugen und über das Netzwerk 110 zum Telefonvermittlungsrechner 108 übertragen. Dieser wiederum kann die Sprachausgabe über das PSTN 106 und den Telefonhörer 104 zum Benutzer 102 übertragen.
  • Der Benutzer kann dann in 1B auf die Aufforderung reagieren, indem er vom Sprachserver verlangt, dass das Datenverarbeitungssystem nach allen Bestandseinheiten sucht, die sich auf „Gebrauchswert" beziehen. Die gesprochene Anforderung kann über das PSTN 106 zum Telefonvermittlungsrechner 108 übertragen werden, der die gesprochene Audioanforderung digitalisieren und in Pakete aufteilen kann. Der Telefonvermittlungsrechner 108 kann die in Pakete aufgeteilte gesprochene Audioanforderung über das Paketvermittlungsnetz 110 zum Sprachserver 112 weiterleiten, der mit den empfangenen gesprochenen Audiodaten Spracherkennungsoperationen durchführen kann. Nach der Umwandlung in einen für den Computer verständlichen Text kann die Anforderung des Benutzers zum Back-End-Datenverarbeitungssystem 114 weitergeleitet werden, welches die Benutzeranforderung bearbeitet, indem es die Datenbank 116 durchsucht.
  • 1C zeigt, dass die Datenbank 116 daraufhin eine Anzahl von Ergebnissen in Form einer vollständigen Liste 120 bereitstellen kann, in welcher alle Bestandseinheiten enthalten sind, die mit den durch den Benutzer 102 angegebenen Suchbegriffen übereinstimmen. Beim vorliegenden Beispiel kann die vollständige Liste 120 alle Sachgebiete zum Begriff „Gebrauchswert" enthalten. Die vollständige Liste 120 kann umfangreich sein und viele Posten enthalten, die sich ohne die vorliegende Erfindung nur schwierig über eine sprachgesteuerte Benutzerschnittstelle darbieten ließe. Diese vollständige Liste 120 kann daher gemäß den erfindungsgemäßen Anordnungen durch ein Listendarstellungssystem 118 bearbeitet werden, das im Folgenden als CLP (Compressed List Processor, Prozessor zur Listenkomprimierung) bezeichnet wird.
  • Der CLP 118 kann ausgewählte Posten in der vollständigen Liste 120 auf der Grundlage von Symbolen zu einer Gruppe zusammenfassen, welche diesen ausgewählten Posten gemeinsam sind. Bei diesen Symbolen kann es sich um grafische Elemente, Wörter, Zahlen und andere Zeichen oder um eine Kombination solcher Zeichen handeln. Gemäß einem Aspekt der Erfindung kann der CLP 118 Wörter identifizieren, die den in der vollständigen Liste 120 enthaltenen Posten gemeinsam sind. Auf der Grundlage dieser gemeinsamen Wörter können Untergruppen erzeugt werden, für die wiederum Gruppenmarkierungen 122 erzeugt werden können. Die Gruppenmarkierungen können insbesondere die gemeinsamen Wörter enthalten, die für jede Gruppe identifiziert werden.
  • Ungeachtet dessen unterliegt die Erfindung in dieser Hinsicht keiner Einschränkung; es sind auch andere Verfahren zum Erzeugen einer Gruppenmarkierung geeignet, wobei zur Ermittlung einer geeigneten Gruppenmarkierung zum Beispiel Metadaten der Posten in der Gruppe verwendet werden können.
  • Auf jeden Fall kann der Sprachserver 112 nach der Erzeugung der Gruppenmarkierungen 122 aus diesen eine Sprachausgabe synthetisieren und über das Netzwerk 110 zum Telefonvermittlungsrechner 108 senden. Vom Telefonvermittlungsrechner 108 können die Gruppenmarkierungen über das PSTN 106 und den Telefonhörer 104 dem Benutzer 102 dargeboten werden.
  • 1D zeigt, dass der Benutzer 102 aus den dargebotenen Gruppenmarkierungen 122 eine bestimmte Gruppenmarkierung auswählen kann, indem er diese ansagt; allerdings ist die Erfindung in dieser Hinsicht nicht auf ein bestimmtes Verfahren zum Auswählen einer Gruppenmarkierung beschränkt. Nach dieser Auswahl kann der CLP 118 in 1E eine entsprechende Liste 124 mit den Posten der ausgewählten Gruppe erzeugen. Ebenso wie bei den Gruppenmarkierungen 122 kann auch hier durch den Sprachserver 112 eine Sprachausgabe synthetisiert und über das Netzwerk 110 zum Telefonvermittlungsrechner 108 gesendet werden. Wenn also der Benutzer beim vorliegenden Beispiel aus den Gruppenmarkierungen „Menschliche Faktoren" ausgewählt hatte, kann dem Benutzer 102 über das PSTN 106 und den Telefonhörer 104 eine Liste mit Posten der Gruppe „Menschliche Faktoren" (siehe Anhang C) dargeboten werden. Zum Schluss kann der Benutzer 102 gemäß 1F aus dieser Liste 124 einen Posten auswählen, zum Beispiel „Menschliche Faktoren beim Produktdesign".
  • 2 ist ein Ablaufdiagramm, welches ein Verfahren 200 zur Darstellung einer Liste zeigt, das durch den CLP 118 von 1 durchgeführt werden kann. Zuerst kann in Schritt 202 eine Abfrage durchgeführt werden, worauf in Schritt 204 eine vollständige Liste mit Abfrageergebnissen ausgegeben werden kann. Die Posten dieser Liste können in Schritt 206 in Gruppen zusammengefasst, und in Schritt 208 kann für jede Gruppe eine Gruppenmarkierung erzeugt werden. Die Gruppenmarkierungen können in Schritt 210 über eine sprachgesteuerte Benutzerschnittstelle einem Benutzer dargeboten werden. Der Benutzer kann in Schritt 212 eine bestimmte Gruppenmarkierung auswählen. Als Reaktion darauf können in Schritt 214 die Posten der Gruppe mit der entsprechenden ausgewählten Gruppenmarkierung über die sprachgesteuerte Benutzerschnittstelle dem Benutzer dargeboten werden.
  • Wichtig ist dabei, dass das Verfahren 200 zur Darstellung einer Liste durch die Zusammenfassung zu Gruppen die Liste mit mehreren Posten einem Benutzer über eine sprachgesteuerte Benutzerschnittstelle in einer Weise darbieten kann, wie dies bei herkömmlichen Sprachverarbeitungssystemen bisher nicht möglich war. 3 ist ein Ablaufdiagramm, welches ein mögliches Verfahren zum Zusammenfassen der Posten einer Liste zu Gruppen zeigt. In Zusammenhang mit 1A bis 1F kann im CLP 118 ein Verfahren 300 zum Zusammenfassen zu Gruppen durchgeführt werden, das in Schritt 302 beginnen kann, wenn eine vollständige Liste 120 empfangen wird. In diesem Schritt 302 kann die vollständige Liste 120 zum Beispiel alphabetisch nach dem ersten Symbol sortiert werden. Wie oben erwähnt, kann das Symbol nicht nur ein Wort, sondern auch ein Zeichen, eine Gruppe von Zeichen oder ein grafisches Symbol sein. In Schritt 304 können die beiden ersten Posten der vollständigen Liste 120 geladen werden. Anschließend können in Schritt 306 die beiden ersten Symbole geladen werden.
  • In Schritt 308 kann in den beiden Symbolen nach grammatischen Artikeln gesucht werden, die dann in Schritt 310 übersprungen werden können. Auf diese Weise können Symbole wie der Artikel „der", „ein" oder Ähnliche, die nur geringe inhaltliche Bedeutung haben, bei der Zusammenfassung zu einer Gruppe weggelassen werden. In Schritt 312 können die Symbole miteinander verglichen werden. Wenn in Schritt 314 eine Übereinstimmung festgestellt wird, können in Schritt 316 die entsprechenden Posten zu einer Gruppe zusammengefasst werden. Wenn keine Übereinstimmung festgestellt wird, kann in Schritt 318 eine neue Gruppe erzeugt werden. Auf jeden Fall kann in Schritt 320, wenn in der vollständigen Liste 120 noch Posten übrig sind, der nächste Posten geladen werden, um ihn mit dem vorangehenden Posten in der Liste zu vergleichen. Anschließend kann der Prozess so lange wiederholt werden, bis keine Posten mehr übrig sind, woraufhin das Verfahren der Gruppenbildung in Schritt 324 beendet werden kann.
  • Dabei ist anzumerken, dass das Verfahren weder auf das anfängliche Laden der beiden ersten Wörter noch auf das Laden der beiden ersten Posten der Liste beschränkt ist. Desgleichen ist die Erfindung nicht auf das alphabetische Sortieren beschränkt. Es ist vielmehr so, dass der Gruppenbildungsprozess durch die alphabetische Sortierung zwar erleichtert werden kann, das wirksame Zusammenfassen zu einer Gruppe beim Fehlschlagen der Sortierung aber nicht verhindert wird. Dabei können andere Gruppenbildungsverfahren, beispielsweise die dynamische Identifizierung gemeinsamer Symbole in jedem Posten der Liste durch Analysieren einzelner Posten und Speichern der sortierten Symbole für den nachfolgenden Vergleich ausreichend sein. Auch hier kann aus Sicht der Verarbeitungsleistung die Identifizierung gemeinsamer Wörter durch die alphabetische Sortierung nach dem ersten Wort und durch den anschließenden Vergleich der Wörter in zwei Posten erleichtert werden.
  • Die vorliegende Erfindung kann durch Hardware, Software oder eine Kombination aus Hardware und Software realisiert werden. Außerdem kann die vorliegende Erfindung entweder zentral in einem Computersystem oder verteilt realisiert werden, indem verschiedene Elemente über mehrere miteinander verbundene Computersysteme verteilt sind. Jede Art von Computersystem oder jede Vorrichtung, welche zur Ausführung der hier beschriebenen Verfahren eingerichtet ist, ist geeignet. Eine typische Komponenten von Hardware und Software könnte ein Mehrzweck-Computersystem mit einem Computerprogramm darstellen, welches in das Computersystem geladen wird und dieses so steuert, dass es die hier beschriebenen Verfahren ausführt. Die vorliegende Erfindung kann auch in ein Computerprogrammprodukt integriert sein, das alle Merkmale zum Ausführen der hier beschriebenen Verfahren umfasst und alle diese Verfahren durchführen kann, wenn es in ein Computersystem geladen wurde. Unter dem Computerprogrammprodukt oder dem Computerprogramm ist im vorliegenden Zusammenhang jeder Ausdruck in einer beliebigen Sprache, Notation oder einem beliebigen Code formulierte Satz von Anweisungen zu verstehen, der ein System mit einem Mittel zur Datenverarbeitung entweder direkt oder a) nach der Umwandlung in eine andere Sprache, Notation oder einen anderen Code und/oder b) nach der Wiedergabe in einer anderen materiellen Form zum Ausführen einer bestimmten Funktion veranlasst.
  • Wichtig ist, dass die vorliegende Erfindung in anderen speziellen Formen realisiert werden kann, ohne von den in der obigen Beschreibung dargestellten wesentlichen Eigenschaften abzuweichen; vielmehr sollten die beiliegenden Ansprüche beachtet werden, welche den Geltungsbereich der Erfindung definieren.

Claims (10)

  1. Verfahren, welches die folgenden Schritte umfasst: dynamisches Gruppieren ausgewählter Posten in einer Liste anhand von Merkmalen in diesen Posten, welche diesen gemeinsam sind. Markieren jeder Gruppe ausgewählter Posten; akustische Darstellung jeder Gruppenmarkierung mittels einer sprachgesteuerten Benutzerschnittstelle; und Darstellen der Posten in einer der ausgewählten Gruppenmarkierung entsprechenden Gruppe mittels der sprachgesteuerten Benutzerschnittstelle als Reaktion auf eine Auswahl einer der akustisch dargestellten Gruppenmarkierungen.
  2. Verfahren nach Anspruch 1, wobei der Gruppierungsschritt die folgenden Schritte umfasst: Aufgliedern einer Liste von Posten in Komponentensymbole; Erkennen derjenigen aufgegliederten Posten, von denen mindestens zwei gemeinsame Merkmale aufweisen; und Zuordnen dieser mindestens zwei Posten mit den als gemeinsam erkannten Merkmalen zu einer Gruppe.
  3. Verfahren nach Anspruch 2, wobei der Markierungsschritt die folgenden Schritte umfasst: Bilden einer Markierung anhand der den mindestens zwei Posten gemeinsamen Merkmale; und Zuordnen dieser gebildeten Markierung zu der Zusammenfassung.
  4. Verfahren nach Anspruch 1, wobei der Gruppierungsschritt die folgenden Schritte umfasst: alphabetisches Sortieren der Liste anhand der ursprünglichen Merkmale der Posten in der Liste; ferner alphabetisches Sortieren der Liste anhand aufeinanderfolgender Merkmale der Posten in der Liste; und Bilden von Gruppen anhand der ursprünglichen aufeinanderfolgenden Merkmale der Posten in der Liste, welche den mindestens zwei Posten gemeinsam sind.
  5. Verfahren nach Anspruch 4, welches ferner den Schritt des Ignorierens von Artikelsymbolen beim Ausführen der Sortierschritte umfasst.
  6. Verfahren nach Anspruch 4, wobei der Markierungsschritt den Schritt der Bildung einer Markierung umfasst, welche die ursprünglichen aufeinanderfolgenden Merkmale der Posten in der Liste umfasst, welche den mindestens zwei Posten gemeinsam sind.
  7. System, welches Folgendes umfasst: eine Gruppierungskomponente zum dynamischen Gruppieren ausgewählter Posten in einer Liste anhand von Merkmalen dieser Posten, welche diesen gemeinsam sind; eine Gruppenmarkierungsvorrichtung zum Markieren jeder Gruppe der ausgewählten Posten; und eine Darstellungskomponente zum akustischen Darstellen jeder Gruppenmarkierung mittels einer sprachgesteuerten Benutzerschnittstelle und der Posten in einer Gruppe, die einer ausgewählten Gruppenmarkierung entspricht.
  8. Maschinenlesbare Speichervorrichtung mit einem darin gespeicherten Computerprogramm, welches eine Vielzahl von Codefolgen aufweist, die durch eine Maschine ausgeführt werden können, um die folgenden Schritte durch die Maschine auszuführen: dynamisches Gruppieren ausgewählter Posten in einer Liste anhand von Merkmalen, welche diesen Posten gemeinsam sind; Markieren jeder Gruppe ausgewählter Posten; akustisches Darstellen jeder Gruppenmarkierung mittels einer sprachgesteuerten Benutzerschnittstelle; und Darstellen der Posten in einer der ausgewählten Gruppenmarkierung entsprechenden Gruppe mittels der sprachgesteuerten Benutzerschnittstelle als Reaktion auf eine Auswahl einer der akustisch dargestellten Gruppenmarkierungen.
  9. Maschinenlesbare Speichervorrichtung nach Anspruch 9, wobei der Gruppierungsschritt die folgenden Schritte umfasst: Aufgliedern einer Liste von Posten in Komponentensymbole; Erkennen derjenigen nacheinander angeordneten Komponentenmerkmale in den aufgegliederten Posten, welche den mindestens zwei Posten gemeinsam sind; und Zusammenfassen dieser mindestens zwei Posten zu einer Gruppe, welchen diese erkannten Komponentenmerkmale gemeinsam sind.
  10. Maschinenlesbare Speichervorrichtung nach Anspruch 9, wobei der Markierungsschritt die folgenden Schritte umfasst: Bilden einer Markierung anhand der nacheinander angeordneten Komponentenmerkmale, welche den mindestens zwei Posten gemeinsam sind; und Zuordnen dieser gebildeten Markierung zu der Zusammenfassung.
DE60201907T 2001-06-28 2002-05-30 Darstellung einer komprimierten liste für sprachgesteuerte benutzerschnittstellen Expired - Lifetime DE60201907T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/894,608 US7289962B2 (en) 2001-06-28 2001-06-28 Compressed list presentation for speech user interfaces
US894608 2001-06-28
PCT/GB2002/002566 WO2003003346A1 (en) 2001-06-28 2002-05-30 Compressed list presentation for speech user interfaces

Publications (2)

Publication Number Publication Date
DE60201907D1 DE60201907D1 (de) 2004-12-16
DE60201907T2 true DE60201907T2 (de) 2005-11-10

Family

ID=25403311

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60201907T Expired - Lifetime DE60201907T2 (de) 2001-06-28 2002-05-30 Darstellung einer komprimierten liste für sprachgesteuerte benutzerschnittstellen

Country Status (5)

Country Link
US (1) US7289962B2 (de)
EP (1) EP1399914B1 (de)
AT (1) ATE282236T1 (de)
DE (1) DE60201907T2 (de)
WO (1) WO2003003346A1 (de)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7552221B2 (en) 2003-10-15 2009-06-23 Harman Becker Automotive Systems Gmbh System for communicating with a server through a mobile communication device
ATE378674T1 (de) * 2004-01-19 2007-11-15 Harman Becker Automotive Sys Betätigung eines sprachdialogsystems
EP1560200B8 (de) * 2004-01-29 2009-08-05 Harman Becker Automotive Systems GmbH Verfahren und System zur Sprachdialogschnittstelle
ATE400871T1 (de) 2004-01-29 2008-07-15 Harman Becker Automotive Sys Multimodale dateneingabe
CN102455997A (zh) * 2010-10-27 2012-05-16 鸿富锦精密工业(深圳)有限公司 元件名称提取系统及方法
US20120290984A1 (en) * 2011-05-10 2012-11-15 Qing Gong Computer-Implemented Systems And Methods For Data Item Interface Processing

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5220625A (en) * 1989-06-14 1993-06-15 Hitachi, Ltd. Information search terminal and system
US5864819A (en) * 1996-11-08 1999-01-26 International Business Machines Corporation Internal window object tree method for representing graphical user interface applications for speech navigation
US6567800B1 (en) * 1998-10-01 2003-05-20 At&T Corp. System and method for searching information stored on a network
US6385602B1 (en) * 1998-11-03 2002-05-07 E-Centives, Inc. Presentation of search results using dynamic categorization
US6522738B1 (en) * 1998-12-16 2003-02-18 Nortel Networks Limited Web site content control via the telephone
US20030158738A1 (en) * 1999-11-01 2003-08-21 Carolyn Crosby System and method for providing travel service information based upon a speech-based request
US20020010000A1 (en) * 2000-01-25 2002-01-24 Vincent Chern Knowledge-based information retrieval system and method for wireless communication device
US6772173B1 (en) * 2000-12-02 2004-08-03 Oracle International Corporation System and method for dynamically presenting a list of items
US6658386B2 (en) * 2000-12-12 2003-12-02 International Business Machines Corporation Dynamically adjusting speech menu presentation style
US6957384B2 (en) * 2000-12-27 2005-10-18 Tractmanager, Llc Document management system
US6985950B1 (en) * 2001-03-06 2006-01-10 Microsoft Corporation System for creating a space-efficient document categorizer for training and testing of automatic categorization engines

Also Published As

Publication number Publication date
US7289962B2 (en) 2007-10-30
US20030004725A1 (en) 2003-01-02
EP1399914B1 (de) 2004-11-10
WO2003003346A1 (en) 2003-01-09
EP1399914A1 (de) 2004-03-24
DE60201907D1 (de) 2004-12-16
ATE282236T1 (de) 2004-11-15

Similar Documents

Publication Publication Date Title
EP0802522B1 (de) Anordnung und Verfahren zur Aktionsermittlung, sowie Verwendung der Anordnung und des Verfahrens
DE69726499T2 (de) Verfahren und Vorrichtung zur Kodierung von Aussprache-Prefix-Bäumen
DE69525178T2 (de) Ansagedienste mit spracheingabe
DE69607601T2 (de) System und verfahren zur spracherkennung mit automatischer erzeugung einer syntax
DE10235548B4 (de) Verfahren und Vorrichtung für die Prädiktion einer Textnachrichteneingabe
DE69932344T2 (de) Zugriff zu hierarchischem datenspeicher via sql-eingabe
DE60202847T2 (de) Abfragesystem in natürlicher sprache für den zugriff auf ein informationssystem
DE69523944T2 (de) System zur informationsverarbeitung
DE60123153T2 (de) Sprachgesteuertes Browsersystem
DE69719702T2 (de) Ein automatisches Auskunftssystem welches ein heuristisches Modell zur Vorhersage der am wahrscheinlichsten erfragten Nummer verwendet
DE69633595T2 (de) Verfahren und Gerät zur Erweiterung und Wiedergewinnung von ähnlichen Zeichenfolgen.
DE19922974A1 (de) Verfahren und Vorrichtung zur Bearbeitung eines Dokuments
EP1361737A1 (de) Verfahren und System zur Verarbeitung von Sprachdaten und Klassifizierung von Gesprächen
DE19910234A1 (de) Verfahren mit mehreren Spracherkennern
EP1361740A1 (de) Verfahren und System zur Verarbeitung von Sprachinformationen eines Dialogs
DE60201907T2 (de) Darstellung einer komprimierten liste für sprachgesteuerte benutzerschnittstellen
DE102013101871A1 (de) Wortwahlbasierte Sprachanalyse und Sprachanalyseeinrichtung
DE4243181C2 (de) Sprachgesteuerte Vorrichtung und Verfahren zu deren Betrieb
DE3750199T2 (de) System zur Erkennung kontinuierlicher Sprache.
EP1340169B1 (de) Verfahren und vorrichtung zur automatischen auskunfterleitung mittels einer suchmaschine
DE112014006957B4 (de) Informations-Bereitstellsystem
EP1361738A1 (de) Verfahren und System zur Verarbeitung von Sprachdaten mittels Spracherkennung und Frequenzanalyse
DE102017104094B4 (de) Sprachverarbeitungssystem und sprachverarbeitungsverfahren
DE102015212650B4 (de) Verfahren und System zum rechnergestützten Verarbeiten einer Spracheingabe
DE60126948T2 (de) Interaktive dialoge

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8320 Willingness to grant licences declared (paragraph 23)
8327 Change in the person/name/address of the patent owner

Owner name: NUANCE COMMUNICATIONS,INC., BURLINGTON, MASS., US

8328 Change in the person/name/address of the agent

Representative=s name: VOSSIUS & PARTNER, 81675 MUENCHEN