ES2236483T3 - Sistema de consulta de lenguaje natural para acceder a un sistema de informacion. - Google Patents

Sistema de consulta de lenguaje natural para acceder a un sistema de informacion.

Info

Publication number
ES2236483T3
ES2236483T3 ES02703402T ES02703402T ES2236483T3 ES 2236483 T3 ES2236483 T3 ES 2236483T3 ES 02703402 T ES02703402 T ES 02703402T ES 02703402 T ES02703402 T ES 02703402T ES 2236483 T3 ES2236483 T3 ES 2236483T3
Authority
ES
Spain
Prior art keywords
user
information
intended
module
domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES02703402T
Other languages
English (en)
Inventor
Charles Voice-Insight KEMPER
Francois Voice-Insight Leger
Aart Voice-Insight Den Ouden
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Voice Insight Belgian Corp
Original Assignee
Voice Insight Belgian Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Voice Insight Belgian Corp filed Critical Voice Insight Belgian Corp
Application granted granted Critical
Publication of ES2236483T3 publication Critical patent/ES2236483T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24522Translation of natural language queries to structured queries
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • G10L15/193Formal grammars, e.g. finite state automata, context free grammars or word networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Stored Programmes (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Telephone Function (AREA)

Abstract

Sistema de interacción (5) ppara permitir a un usuario (4) de un sistema de información (1), que pertenece a un dominio de aplicación de sistemas de información similares, interactuar con dicho sistema de información (1), estando destinado dicho sistema de interacción (5) ppara ser conectado al sistema de información (1), y a un sistema de reconocimiento (2) ppara permitir a dicho usuario (4) interactuar con dicho sistema de información (1) por medio de frases generadas por dicho usuario (4) y procesadas por el sistema de reconocimiento (2), cparacterizado porque dicho sistema de interacción (5) comprende al menos un módulo de dominio (5a) que está destinado ppara tener definidas en el mismo módulo unas estructuras de frases que están construidas sobre la base de las clases de objetos, clases de atributos y clases de acciones que son comunes a dicho sistema de información del dominio de aplicación considerado y que están previstas ppara ser individualizadas con tipos de objetos específicos,tipos de acciones, tipos de atributos y sus instancias, proporcionadas a partir del sistema de información (1), con el fin de definir una gramática de frases que están previstas ppara ser generadas por el usuario (4) para interactuar con el sistema de información (1).

Description

Sistema de consulta de lenguaje natural para acceder a un sistema de información.
La presente invención se refiere a un sistema de interacción que está destinado para permitir a un usuario entrar en interacción con un sistema de información por medio de un sistema de reconocimiento.
Los sistemas de reconocimiento comprenden habitualmente dos módulos: un módulo de reconocimiento que convierte frases generadas por el usuario en una representación textual asistida por ordenador de dichas frases y un módulo de generación de texto, que puede convertir una representación textual asistida por ordenador en una grase generada no comprensible por el usuario. En efecto, entre los sistemas de reconocimiento se encuentran sistemas de reconocimiento de voz, con los que el usuario puede generar frases por medio de la pronunciación y que pueden generar frases en voz alta para el usuario, y sistemas de reconocimiento de texto, tales como los sistemas de escaneo de texto, con los que el usuario puede generar frases por medio de un texto escrito y que pueden generar frases para el usuario en una forma escrita.
Los sistemas de información gestionan datos que son almacenados usualmente en bases de datos. Estas bases de datos son personalizadas comúnmente por sus usuarios, de la misma manera que los sistemas de información que están destinados para la utilización de dichas bases de datos. Un ejemplo de un sistema de información conocido se describe en el documento de patente WO-A-0065814.
En las bases de datos, los datos, también llamados objetos, con recopilados en tipos de objetos identificados por un código. Cada tipo de objeto recopila instancias de objetos, es decir, datos u objetos específicos, del tipo considerado. Con cada tipo de objeto están asociados un cierto número de atributos que caracterizan las instancias del tipo de objeto. De una manera similar a los objetos, se pueden recopilar atributos en tipos de atributos. Un tipo de atributos agrupa atributos que tienen características similares, por ejemplo atributos textuales o atributos de datos.
Cada sistema de información está adaptado a las bases de datos que debe manipular y, por lo tanto, puede direccionar los tipos de objetos, tipos de atributos, e instancias de objetos de un tipo de objeto que tiene ciertas instancias de atributos. Por lo tanto, los códigos utilizados por una base de datos para identificar tipos de objetos y tipos de atributos son reconocidos por el sistema de información que debe manipular dicha base de datos.
Además, cada sistema de información contiene tipos de acción que recopilan acciones que pueden ser aplicadas sobre los objetos de una base de datos por el sistema. Cada tipo de acción se ajusta a uno o más tipos de objetos.
Los sistemas de información son recopilados en diferentes dominios de aplicaciones tales como Sistemas de Información Geográfica (GIS), Sistemas de Planificación de Recursos de Empresas (ERP), Sistemas de Gestión de Documentos (DM) o Sistemas de Gestión de Datos de Productos (PDM) por nombrar solamente unos pocos dominios de aplicación de negocios bien conocidos.
Tradicionalmente, los usuarios de un sistema de información específico tienen que interactuar con este sistema por medio de una interfaz especialmente desarrollada para el sistema, que será diferente de un sistema a otro incluso en el mismo dominio de aplicaciones. Además, dicho usuario tendrá que interactuar con un sistema de información utilizando el teclado y/o el ratón del ordenador, que accede al sistema de información.
La presente invención soluciona estos problemas proporcionando un sistema de interacción, llamado Voice Query Language, que permite interacciones de un usuario con diferentes sistemas de información pre-existentes de un dominio de aplicaciones utilizando diferentes sistemas de reconocimiento pre-existente. Por lo tanto, esta invención permite al usuario aplicar, por medio de la generación de frases, las llamadas consultas, acciones definidas por el sistema de información con relación a objetos memorizados en las bases de datos manipuladas por el sistema de información e identificados por medio de atributos.
El inventor ha descubierto que se pueden definir todos los sistemas de información de un dominio de aplicaciones, clases de objetos comunes, clases de atributos y clases de acciones. Estas clases recopilan, respectivamente, objetos, atributos y acciones que presentan una característica común que define la clase considerada, siendo dicha característica específica de todos los sistemas de información del dominio. Un ejemplo de este tipo de un objeto puede ser parte de varias clases de objetos si presenta al mismo tiempo las características de estas clases diferentes. Sobre la base de dichas clases de objetos, de atributos y de acciones, se pueden definir estructuras de frases de acción, que constituirán modelos que pueden ser individualizados con tipos de objetos específicos, tipos de atributos y tipos de acciones de un sistema de información específico del dominio considerado de aplicaciones y las instancias de los objetos con sus instancias de atributos son memorizadas en las bases de datos manipuladas por dicho sistema de información. Las estructuras de frases de actuación referidas, que se utilizan para formar frases reales, definen de esta manera una gramática que está constituida esencialmente por tipos de objetos, tipos de atributos, tipos de acciones y se proporcionan reglas de producción que deben utilizarse en las interacciones del usuario con un sistema de información del dominio considerado, cuando el sistema presenta al usuario las diferentes consultas que puede realizar y también cuando el usuario dirige una consulta de este tipo al sistema de información.
Por lo tanto, la invención proporciona un sistema de interacción para permitir a un usuario de un sistema de información, que pertenece a un dominio de aplicación de sistemas de información similares, interactuar con dicho sistema de información, estando destinado dicho sistema de interacción para ser conectado al sistema de información, estando destinado, además, el sistema de interacción para ser conectado a un sistema de reconocimiento para permitir al usuario interactuar con el sistema de información por medio de frases generadas por dicho usuario y procesadas por el sistema de reconocimiento, comprendiendo dicho sistema de interacción al menos un módulo de dominio que está destinado para tener definidas en el mismo módulo unas estructuras de frases que están construidas sobre la base de las clases de objetos, clases de atributos y clases de acciones que son comunes a dicho sistema de información del dominio de aplicación considerado y que están previstas para ser individualizadas con tipos de objetos específicos, tipos de acciones, tipos de atributos y sus instancias, proporcionadas a partir del sistema de información, con el fin de definir una gramática de frases que están previstas para ser generadas por el usuario para interactuar con el sistema de información.
De una manera preferida, el sistema de interacción de acuerdo con la invención comprende un módulo genérico conectado al menos a un módulo de domino y destinado para ser conectado al sistema de reconocimiento, estando destinado dicho módulo genérico para convertir dichas frases, que pueden ser generadas por el usuario, en una representación textual asistida por ordenador que es utilizable por el sistema de reconocimiento para el reconocimiento de dichas frases cuando son generadas por el usuario y estando destinado para convertir una representación textual asistida por ordenador producida por el sistema de reconocimiento, después de que se ha producido el reconocimiento de una frase generada por el usuario, en una frase definida por dicha gramática.
Es más preferido que dicho módulo genérico comprenda un elemento que contiene información que permite la configuración del sistema de reconocimiento.
En otra configuración preferida del sistema de interacción de acuerdo con la invención, comprende un módulo adaptador que está conectado al menos a un módulo de dominio y que está destinado para ser conectado al sistema de información, estando destinado dicho módulo adaptador para extraer tipos de objetos, de atributos, de acción y sus instancias a partir del sistema de información y para pasarlos al menos a un módulo de dominio y que está destinado para dividir el sistema de información para que este último ejecute una demanda de acción contenida en una frase generada por el usuario.
De una manera preferida, el al menos un módulo de dominio comprende un elemento que contiene información sobre nociones generales de objetos y atributos que identifican objetos que son comunes a varios dominios de aplicación.
Se prefiere también que el al menos un módulo de dominio esté destinado para ser conectado a un analista y lingüista del sistema destinado a definir clases de objetos, clases de atributos, clases de acción y estructuras de frases que dicho al menos un módulo de dominio está destinado a tener definidas en el mismo.
De una manera más específica, el sistema de reconocimiento mencionado anteriormente es un sistema de reconocimiento de voz y las frases generadas por el usuario son generadas por medio de la pronunciación de dicho usuario.
Esto permite al usuario interactuar con un sistema de información por medio del lenguaje natural de dicho usuario.
De una manera alternativa, dicho sistema de reconocimiento es un sistema de reconocimiento de texto y las frases generadas por el usuario son escritas por dicho usuario.
A continuación se describirá la invención con más detalle con referencia a la figura 1 que representa un sistema de interacción de acuerdo con la invención integrado en su entorno.
Con referencia a la figura 1, el entorno que comprende un sistema de interacción de acuerdo con la invención se compone de los siguientes elementos:
1: Un sistema de información destinado para manipular varios tipos de objetos que se caracterizad por varios atributos que son parte de tipos de atributos, siendo realizada la manipulación por medio de varios tipos de acciones. Los tipos de objetos y de atributos tienen instancias que se pueden encontrar en las bases de datos manipuladas por el sistema de información,
2: Un sistema de reconocimiento que comprende dos módulos:
2a:
El módulo de reconocimiento que convierte frases generadas por el usuario en una representación textual asistida por ordenador.
2b:
El módulo de generación de texto, que puede convertir una representación textual asistida por ordenador en una frase generada que puede ser comprendida por el usuario.
3: Un analista y lingüista del sistema que proporciona las clases de objetos, de atributos y de acciones así como las estructuras de frases que serán utilizadas para ejecutar las acciones del sistema de información sobre los tipos de objetos. Los analistas y lingüistas del sistema son seres humanos que son capaces de analizar cómo debería interrogar el usuario vocalmente al sistema. El resultado de este análisis será una colección de estructuras de frases de actuación que son típicas de un dominio de aplicaciones.
4: Un usuario que utilizará el sistema por medio de la gramática definida por las estructuras de frases individualizadas con las instancias de objetos, atributos y acciones manipuladas por el sistema de información.
5: El sistema de interacción de acuerdo con la invención, que permite al usuario interactuar con el sistema de información en la generación de frases que dicho sistema puede procesar, sobre la base de las estructuras de frases individualizadas mencionadas anteriormente. El sistema consta de tres módulos:
5b:
un módulo genérico que puede convertir una gramática del lenguaje, es decir, un conjunto de tipos de objetos, tipos de acciones y reglas de producción de frases válidas que pueden ser generadas por el usuario con vistas a interactuar con un sistema de información, en una representación asistida por ordenador que puede ser utilizada por el sistema de reconocimiento y convertir una representación asistida por ordenador que resulta a partir de un reconocimiento, en una frase definida por una gramática. Dicho módulo genérico comprende un elemento c1 que contiene información que permite la configuración del sistema de reconocimiento, a saber:
-
El software de reconocimiento utilizado,
-
El lenguaje utilizado,
-
Los dispositivos de comunicación utilizados, tales como, por ejemplo, micrófonos o dispositivos telefónicos.
5a:
Un módulo de dominio que es capaz de recibir elementos tales como tipos de objetos, tipos de atributos y tipos de acciones así como instancias de estos últimos que son manipuladas por sistemas de información de un dominio predeterminado de aplicaciones. El módulo de dominio comprende definiciones de clases de objetos, acciones y atributos que son típicas de dicho dominio y que se utilizan para combinar los elementos mencionados anteriormente recibidos con las estructuras de frases de acción mencionadas anteriormente para producir la gramática que es requerida por el módulo genérico 5b. Las estructuras de frases de acción son recibidas desde el analista y lingüista del sistema con el fin de que puedan ser generadas consultas por el usuario en un lenguaje natural. Si se dispone de sistemas de información múltiples al mismo tiempo, se pueden generar y activar múltiples gramáticas. El sistema de interacción de acuerdo con la invención conmutará entre los sistemas de información. Se podría realizar una conmutación similar entre un sistema de interacción de acuerdo con la invención para un dominio tal como GIS y un sistema de interacción de acuerdo con la invención para otro dominio tal como DM. El módulo de dominio puede tomar, por lo tanto, una frase producida por el módulo genérico después de que se ha producido el reconocimiento y generar una descripción de una acción sobre objetos específicos identificados por valores de atributos específicos que deben ser ejecutados por el sistema de información 1. Las definiciones mencionadas anteriormente están comprendidas dentro de un elemento c2 del módulo de dominio, que contiene:
-
Información común a varios dominios tales como nociones generales de objetos y atributos que identifican objetos.
-
La identificación del dominio que comprende elementos de configuración que identifican un dominio de sistemas de información, tal como por ejemplo sistemas de información GIS,
-
Las clases de objetos, que pertenecen a este dominio. Cada clase representa un conjunto de objetos con una característica común. Por ejemplo, en aplicaciones GIS, clases de objetos tales como clase de la superficie (países, condados), clases lineales (ríos, carreteras), clases puntuales (ciudades), clases gráficas (fotografía aérea referenciada geográficamente, mapas). Un objeto real puede ser parte de varias clases de objetos. Por ejemplo en el dominio GIS, un objeto típico tal como una calle de una ciudad pertenecerá a la clase de objeto representable, clase de objeto seleccionable, clase de objeto espacial y clase de objeto lineal.
-
Las clases de acciones que pueden ser aplicadas a las clases de objetos. En efecto, asociada con cada clase de objeto, se puede definir, para un dominio dado, una clase de acción que se puede aplicar a esa clase de objeto. Por ejemplo, en un dominio GIS, un objeto que pertenece a la clase de objeto representable puede ser representado u ocultado, un objeto que pertenece a la clase de objetos espaciales puede ser proyectado sobre un mapa o puede ser intersectado con otro objeto que pertenece a la misma clase, un objeto que pertenece a la clase de objetos seleccionables puede ser seleccionado o deseleccionado, un objeto que pertenece a la clase de objetos lineales puede ser movido a lo largo de una cierta distancia para proporcionar una localización específica. Cualquiera que sean los tipos específicos de objetos y las instancias, siempre es posible manipular (mostrar, seleccionar, resalta,...) objetos puntuales, lineales y superficiales contenidos por otro objeto superficial, manipular objetos superficiales cruzados por objetos lineales y manipular objetos puntuales a lo largo de un objeto lineal dado.
-
Las clases de atributos que pueden ser fijadas a los objetos. Una clase de atributos recopila atributos con un significado común hacia los objetos de todas las clases de objetos. En efecto, los atributos que pertenecen a la clase "nombrar instancia" son utilizados para identificar una instancia particular de un tipo de objeto. Por ejemplo, en el dominio GIS, si las carreteras tienen un atributo que es "número de carretera", cuyas instancias son números, el "número de carretera" es, por lo tanto, del tipo de atributo "numérico", pero también es parte de la clase de atributos "nombre de instancia" debido a que las carreteras pueden ser referidas por voz por medio de su número.
-
Las diversas estructuras de frases que se pueden utilizar para solicitar la ejecución de las acciones. Asociado con cada clase de acción se puede definir un conjunto de estructuras de frases que se pueden utilizar para solicitar la clase de acción a realizar. Por ejemplo, en el dominio GIS, se pueden definir estructuras de frases tales como representar "xyz" o pasar a "abc". Como "xyz" o "abc" se puede referenciar la clase de atributo utilizada para identificar los tipos de objetos, sobre los que se realizará la acción. Estas estructuras serán individualizadas por instancias de objetos que pertenecen a estos tipos manipulados por el sistema de información con el que el usuario entrará en contacto interactivo. Además, las acciones tales como "representar" o "pasar a" pueden tener sinónimos que se podrían intercambiar fácilmente con los términos originales. Esto significa que pueden existir múltiples variantes de la misma estructura de frase sin cambios substanciales en su estructura gramatical.
-
Los elementos de términos que se combinan en secuencias componen frases a generar por el usuario. Se encuentran elementos de términos estáticos, cuyas instancias no tienen que ser extraídas del sistema de información, tales como números, operadores de comparación, y elementos dinámicos, cuyas instantes tienen que se extraídas desde el sistema de información, tales como las de tipos de objetos o tipos de atributos. Los elementos de términos definidos estáticos son listas directas de términos, cuyos elementos se pueden predeterminar durante la configuración del módulo de dominio.
Cada uno de estos elementos puede ser marcado como opcional; esto significa que pueden ser omitidos en la generación sin perjudicar el significado de la frase, tales como expresiones de cortesía.
Cada uno de estos elementos puede ser marcado también como repetitivo, tal como para la composición de valores numéricos, deletreo de códigos de identificación o especificación de posiciones geográficas.
Por ejemplo, en el dominio GIS, se puede obtener la siguiente secuencia de elementos de términos estáticos: [-1] [2] [+3] [-4], en la que [-1] marcan una lista de términos opcionales que está compuesta por los términos "por favor", "puede Ud.", [2] marca una lista de términos obligatorios que está compuesta por "pasar a" o "mover a", [+3] marca una lista de términos repetitivos que está compuesta por los términos "norte", "este", "oeste", "sur"; [-4] marca una lista de términos opcionales que está compuesta por los términos "por favor". Por consiguiente, las siguientes son frases válidas basadas en estos elementos: pasar al nordeste, puede desplazarse al sur sur buscar por favor.
También se pueden formar frases tales como [1] [2] [3] y [1] [4] [3] [5] [2], en las que [1] es o bien "mostrar" o "representar", [2] es un nombre de una instancia de objeto relacionado, [3] es un nombre del tipo de objeto espacial, [4] es "el", [5] es "de". [2] y [3] son elementos de términos dinámicos. Entonces, si los elementos dinámicos extraídos desde el sistema de información son dos objetos espaciales llamados ciudad y estado y dos nombres de instancias llamados Nueva York y Washington para la ciudad y Nueva York e Idaho para el estado, entonces la generación combinada generará las frases siguientes:
[1]
[2a] [3a]
[1]
[2b] [3b]
[1]
[4] [3a] [5] [2a]
[1]
[4] [3b] [5] [3b]
en las que
[2a]
será o bien Nueva York o Washington
[3a]
será ciudad
[2b]
será Nueva York o Idaho
[3b]
será estado
resultando, en particular, frases tales como "mostrar la ciudad de Nueva York" o "representar el estado de Idaho".
5c:
Un módulo adaptador del sistema de información que se crea para una aplicación de un sistema de información específico. Este módulo adaptador está destinado para extraer los tipos de objetos, de atributos y de acciones así como sus instancias a partir del sistema de información considerado y para pasarlos al módulo de domino 5a, donde son referenciados en clases de objetos, de atributos y de acciones que definen el dominio del sistema de información. Por otra parte, dichos módulos adaptadores son capaces de accionar el sistema de información con el fin de que ejecute la demanda de acción contenida en una frase generada por el usuario. Esto requiere que el módulo traslade la descripción de la acción proporcionada por el módulo de dominio 5a a la lógica de aplicación del sistema de información.
La transmisión de información entre diferentes elementos del entorno definido aquí más arriba se realiza de la siguiente manera:
-
Desde 5b hacia 2a: una lista de palabras y una definición de las reglas de producción que controlan la combinación de estas palabras en frases aceptables en una representación asistida por ordenador adaptada para el sistema de reconocimiento.
-
Desde 2a hacia 5b: una frase reconocida en una representación asistida por ordenador adaptada para el sistema de reconocimiento. Esta frase corresponde a una secuencia válida de palabras.
-
Desde 5b hacia 2b: una representación textual asistida por ordenador que debe ser leída en voz alta para el usuario.
-
Desde 5a hacia 5b: un conjunto de listas de términos y un conjunto de reglas de combinación que utilizan las listas de términos para formar estructuras de frases que representan las frases válidas que pueden ser generadas por el usuario.
-
Desde 5b hacia 5a: una frase generada por el usuario descompuesta en una identificación de reglas de combinación con la identificación de las listas de términos asociados y los elementos de las listas de términos generados por el usuario.
-
Desde 5c hacia 5a: una lista de tipos de objetos con sus clases correspondientes, instancias de objetos, tipos de atributos con sus clases correspondientes e instancias de atributos.
-
Desde 5a hacia 5c: una acción con parámetros relacionados que debe ser ejecutada por el sistema de información. Estos parámetros pueden incluir instancias de objetos y de atributos. En los casos ambiguos en los que podría accederse a dos acciones diferentes o a dos objetos diferentes por el mismo comando de usuario, las diferentes posibilidades retornarán al sistema de información por el módulo de dominio, con la esperanza de que el módulo adaptador sea capaz de eliminar la ambigüedad utilizando información de contexto del sistema de información o solicitando una reacción desde el usuario.
-
Desde 1 hacia 5c: lo mismo que desde 5c hacia 5a, pero en el lenguaje lógico de 1, por lo tanto en función de 1.
-
Desde 5c hacia 1: lo mismo que desde 5a hacia 5c, pero trasladado al lenguaje lógico de 1, por lo tanto, en función de 1.
El uso del sistema de interacción de acuerdo con esta invención implica las siguientes secuencias de eventos:
-
Se identifica un dominio que reagrupa las clases comunes de objetos, de atributos y de acciones de una clase de sistemas de información.
-
El analista y lingüista del sistema 3 define las clases de objetos, atributos y acciones y las estructuras de frases de acciones relacionadas requeridas por el dominio.
-
La información es codificada en un formato interno que es utilizable por el módulo de dominio 5a.
-
Un módulo adaptador 5c es definido para un sistema de información específico 1 que pertenece al dominio identificado.
-
El usuario 4 pone en marcha el sistema de información.
-
El sistema de información pone en marcha el módulo adaptador.
-
El módulo adaptador utiliza el sistema de información para extraer los objetos que pueden ser utilizados por el usuario y pasa esta información al módulo de dominio.
-
El módulo de dominio utiliza las clases de objetos, las clases de atributos y las estructuras de las frases de acciones mencionadas anteriormente para formar las listas de términos y las reglas de combinación para el módulo genérico 5b.
-
El módulo genérico convierte las listas de términos y las reglas de combinación en una forma aceptable para el sistema de reconocimiento y pone en marcha este último sistema.
-
El usuario genera una frase.
-
El sistema de reconocimiento 2, después de que ha sido reconocida una frase factible, retorna la frase reconocida al módulo genérico.
-
El módulo genérico analiza gramaticalmente las frases en unas listas de reglas de combinación y de términos y la retorna al módulo de dominio.
-
El módulo de dominio proporciona la información necesaria para realizar la acción al módulo adaptador.
-
El módulo adaptador llama entonces el sistema de información para que realice la acción.
Ejemplo de clasificación de información tratada por un sistema de interacción de acuerdo con la invención, que permite a un usuario entrar en contacto interactivo con un sistema de información de dominio GIS:
Tenemos un sistema de información capaz de representar o seleccionar objetos espaciales ya sea por valores de propiedad o por relaciones espaciales.
Asociados con este sistema, tenemos tipos de objetos que son países y ciudades; las instancias de los objetos de estos tipos de objetos tienen dos atributos asociados que son nombre y población. El nombre es del tipo de atributo textual, la población es del tipo de atributo numérico.
Para los países, tenemos dos instancias: los U. S. A. y Francia.
Sus poblaciones respectivas son 250000000 y 60000000 de habitantes.
Para las ciudades tenemos seis instancias: Nueva York, Los Ángeles, Dallas, París, Lyón, Marsella.
Sus poblaciones respectivas son 1200000, 10000000, 500000, 600000, 1000000, 800000 habitantes.
En lenguaje inglés se pueden definir las siguientes frases para acceder a los objetos por el sistema:
Operaciones genéricas de representación / ocultación:
Representar los países
Ocultar los países
Representar las ciudades
Ocultar las ciudades
Operación de selección global:
Seleccionar todos los países
Seleccionar todas las ciudades
Operación de selección de atributo de nombre:
Seleccionar el país llamado Francia
Seleccionar la ciudad llamada Los Ángeles
Expresiones de condiciones de atributos:
Que tiene el nombre de U. S. A.
Con una población que excede de 1000000
Selección relacionada con los atributos:
Seleccionar el país, cuyo nombre es U. S. A.
Seleccionar la ciudad con una población de 12000000 de habitantes
Expresiones de condiciones espaciales:
Dentro de los U. S. A.
Selección relacionada con el espacio:
Seleccionar las ciudades dentro de los U. S. A.
Seleccionar el país en el que se encuentra París.
Por lo tanto, definiremos los siguientes elementos de la configuración a partir del elemento c2 del módulo de dominio del sistema:
Definición de dominio:
Dominio X
Clases de objetos:
Objetos representables
Objeto seleccionables
Objetos que incluyen en el espacio
Objetos incluidos en el espacio
Objetos discriminados numéricamente
Objetos nombrados por instancias
Clases de acciones (ejemplos)
Para objetos representables:
Representar (presentación de los objetos al usuario)
Ocultar (ocultación de los objetos al usuario)
Para objetos seleccionables
Seleccionar todo (selección de los objetos)
deseleccionar (de-selección de los objetos)
Clases de atributos
Atributos de nombres de instancias de objetos
Atributo consultable
Tipos de atributos
Atributo de valor numérico
Atributo de valor textual
Estructuras de frases de acción
Listar todo ("Listar todos los países", "Listar todas las ciudades")
Seleccionar todo ("Seleccionar todos los países")
Condición ("Con una población que excede de 5 millones")
\newpage
Secuencias de elementos de términos (ejemplo)
Comando de condición = [1] [2] [3] [4] [5]
Elementos de términos dinámicos
[3]
atributos numéricos consultables, tales como "población".
Elementos de términos estáticos
[1]
con I que tiene
[2]
un
[4]
menor que I mayor que I igual a
[5]
valores numéricos.

Claims (8)

1. Sistema de interacción (5) para permitir a un usuario (4) de un sistema de información (1), que pertenece a un dominio de aplicación de sistemas de información similares, interactuar con dicho sistema de información (1), estando destinado dicho sistema de interacción (5) para ser conectado al sistema de información (1), y a un sistema de reconocimiento (2) para permitir a dicho usuario (4) interactuar con dicho sistema de información (1) por medio de frases generadas por dicho usuario (4) y procesadas por el sistema de reconocimiento (2), caracterizado porque dicho sistema de interacción (5) comprende al menos un módulo de dominio (5a) que está destinado para tener definidas en el mismo módulo unas estructuras de frases que están construidas sobre la base de las clases de objetos, clases de atributos y clases de acciones que son comunes a dicho sistema de información del dominio de aplicación considerado y que están previstas para ser individualizadas con tipos de objetos específicos, tipos de acciones, tipos de atributos y sus instancias, proporcionadas a partir del sistema de información (1), con el fin de definir una gramática de frases que están previstas para ser generadas por el usuario (4) ara interactuar con el sistema de información (1).
2. Un sistema de interacción (5) de acuerdo con la reivindicación 1, caracterizado porque comprende un módulo genérico (5b) conectado a dicho al menos un módulo de domino (5a) y destinado para ser conectado a dicho sistema de reconocimiento, estando destinado dicho módulo genérico (5b) para convertir dichas frases, que pueden ser generadas por dicho usuario (4), en una representación textual asistida por ordenador que es utilizable por el sistema de reconocimiento (2) para el reconocimiento de dichas frases cuando son generadas por dicho usuario (4) y estando destinado para convertir una representación textual asistida por ordenador producida por el sistema de reconocimiento (2), después de que se ha producido el reconocimiento de una frase generada por dicho usuario (4), en una frase definida por dicha gramática.
3. Un sistema de interacción (5) de acuerdo con la reivindicación 2, caracterizado porque dicho módulo genérico (5b) comprenda un elemento (c1) que contiene información que permite la configuración de dicho sistema de reconocimiento.
4. Un sistema de interacción (5) de acuerdo con una de las reivindicaciones anteriores, caracterizado porque comprende un módulo adaptador (5c) que está conectado a dicho al menos un módulo de dominio (5a) y que está destinado para ser conectado a dicho sistema de información (1), estando destinado dicho módulo adaptador (5c) para extraer tipos de objetos, de atributos, de acción y sus instancias a partir del sistema de información (1) y para pasarlos al menos a un módulo de dominio (5a) y que está destinado para dividir el sistema de información (1) para que este último ejecute una demanda de acción contenida en una frase generada por el usuario (4).
5. Un sistema de interacción (5) de acuerdo con una de las reivindicaciones anteriores, caracterizado porque dicho al menos un módulo de dominio (5a) comprende un elemento (c2) que contiene información sobre nociones generales de objetos y atributos que identifican objetos que es común a varios dominios de aplicación.
6. Un sistema de interacción (5) de acuerdo con una de las reivindicaciones anteriores, caracterizado porque dicho al menos un módulo de dominio (5a) está destinado para ser conectado a un analista y lingüista del sistema (3), que está destinado a definir clases de objetos, clases de atributos, clases de acción y estructuras de frases que dicho al menos un módulo de dominio (5a) está destinado a tener definidas en el mismo.
7. Un sistema de interacción (5) de acuerdo con una de las reivindicaciones anteriores, caracterizado porque dicho sistema de reconocimiento (2) es un sistema de reconocimiento de voz y porque las frases generadas por dicho usuario (4) son generadas por medio de la pronunciación de dicho usuario (4).
8. Un sistema de interacción (5) de acuerdo con una de las reivindicaciones anteriores, caracterizado porque dicho sistema de reconocimiento (2) es un sistema de reconocimiento de texto y porque las frases generadas por dicho usuario (4) son escritas por dicho usuario (4).
ES02703402T 2001-02-28 2002-02-28 Sistema de consulta de lenguaje natural para acceder a un sistema de informacion. Expired - Lifetime ES2236483T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP01200749 2001-02-28
EP01200749 2001-02-28

Publications (1)

Publication Number Publication Date
ES2236483T3 true ES2236483T3 (es) 2005-07-16

Family

ID=8179950

Family Applications (1)

Application Number Title Priority Date Filing Date
ES02703402T Expired - Lifetime ES2236483T3 (es) 2001-02-28 2002-02-28 Sistema de consulta de lenguaje natural para acceder a un sistema de informacion.

Country Status (18)

Country Link
US (2) US20040064323A1 (es)
EP (1) EP1366491B1 (es)
JP (1) JP4334227B2 (es)
KR (1) KR100885033B1 (es)
CN (1) CN1232948C (es)
AT (1) ATE288614T1 (es)
BR (1) BR0207642A (es)
CA (1) CA2437614C (es)
DE (1) DE60202847T2 (es)
DK (1) DK1366491T3 (es)
ES (1) ES2236483T3 (es)
IL (2) IL157454A0 (es)
MX (1) MXPA03007724A (es)
OA (1) OA12495A (es)
PT (1) PT1366491E (es)
RU (1) RU2269164C2 (es)
WO (1) WO2002071393A1 (es)
ZA (1) ZA200307267B (es)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1676189A4 (en) 2003-08-27 2008-01-02 Equifax Inc APPLICATION PROCESSING AND DECISION-MAKING SYSTEMS AND PROCESSES
US11132183B2 (en) 2003-08-27 2021-09-28 Equifax Inc. Software development platform for testing and modifying decision algorithms
FR2862780A1 (fr) * 2003-11-25 2005-05-27 Thales Sa Procede d'elaboration d'une grammaire specifique a un domaine a partir d'une grammaire sous-specifiee
US7529733B2 (en) * 2004-11-10 2009-05-05 International Business Machines Corporation Query builder using context sensitive grids
KR100718147B1 (ko) * 2005-02-01 2007-05-14 삼성전자주식회사 음성인식용 문법망 생성장치 및 방법과 이를 이용한 대화체음성인식장치 및 방법
JP4901736B2 (ja) * 2005-07-26 2012-03-21 本田技研工業株式会社 ユーザと機械とのインタラクションを実施するための装置、方法、およびプログラム
US8229745B2 (en) * 2005-10-21 2012-07-24 Nuance Communications, Inc. Creating a mixed-initiative grammar from directed dialog grammars
US20070136222A1 (en) * 2005-12-09 2007-06-14 Microsoft Corporation Question and answer architecture for reasoning and clarifying intentions, goals, and needs from contextual clues and content
US8368749B2 (en) * 2006-03-27 2013-02-05 Ge Inspection Technologies Lp Article inspection apparatus
DE102006029755A1 (de) * 2006-06-27 2008-01-03 Deutsche Telekom Ag Verfahren und Vorrichtung zur natürlichsprachlichen Erkennung einer Sprachäußerung
US8625434B2 (en) * 2006-12-29 2014-01-07 Ge Inspection Technologies Lp IP based voice communication enabled inspection system
CA2695898C (en) * 2007-08-07 2016-12-20 Equifax, Inc. Systems and methods for managing statistical expressions
US8219407B1 (en) 2007-12-27 2012-07-10 Great Northern Research, LLC Method for processing the output of a speech recognizer
US9978365B2 (en) * 2008-10-31 2018-05-22 Nokia Technologies Oy Method and system for providing a voice interface
US20100198876A1 (en) * 2009-02-02 2010-08-05 Honeywell International, Inc. Apparatus and method of embedding meta-data in a captured image
US9519814B2 (en) 2009-06-12 2016-12-13 Hand Held Products, Inc. Portable data terminal
EP2341450A1 (en) * 2009-08-21 2011-07-06 Mikko Kalervo Väänänen Method and means for data searching and language translation
US20110106779A1 (en) * 2009-10-30 2011-05-05 Research In Motion Limited System and method to implement operations, administration, maintenance and provisioning tasks based on natural language interactions
US9679561B2 (en) 2011-03-28 2017-06-13 Nuance Communications, Inc. System and method for rapid customization of speech recognition models
US9069814B2 (en) * 2011-07-27 2015-06-30 Wolfram Alpha Llc Method and system for using natural language to generate widgets
GB2523028A (en) * 2012-10-25 2015-08-12 Walker Reading Technologies Inc Sentence parsing correction system
US10650089B1 (en) * 2012-10-25 2020-05-12 Walker Reading Technologies Sentence parsing correction system
RU2737598C1 (ru) * 2020-02-04 2020-12-01 Павел Андреевич Морозов Способ формирования оперативной информации на основе формализованной концептуальной модели предметной области
US12360988B1 (en) * 2024-11-22 2025-07-15 Anomali Incorporated Automatic query language generation for specialized query language based on natural language search

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4688195A (en) * 1983-01-28 1987-08-18 Texas Instruments Incorporated Natural-language interface generating system
US5083268A (en) * 1986-10-15 1992-01-21 Texas Instruments Incorporated System and method for parsing natural language by unifying lexical features of words
EP0505621A3 (en) * 1991-03-28 1993-06-02 International Business Machines Corporation Improved message recognition employing integrated speech and handwriting information
JP2818362B2 (ja) * 1992-09-21 1998-10-30 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声認識装置のコンテキスト切換えシステムおよび方法
JPH06202688A (ja) * 1992-12-28 1994-07-22 Sony Corp 音声認識装置
US5642519A (en) * 1994-04-29 1997-06-24 Sun Microsystems, Inc. Speech interpreter with a unified grammer compiler
RU2096825C1 (ru) * 1996-10-14 1997-11-20 Общество с ограниченной ответственностью "Информбюро" Устройство обработки информации для информационного поиска
US6157935A (en) * 1996-12-17 2000-12-05 Tran; Bao Q. Remote data access and management system
US6023697A (en) * 1997-02-24 2000-02-08 Gte Internetworking Incorporated Systems and methods for providing user assistance in retrieving data from a relational database
US6192338B1 (en) * 1997-08-12 2001-02-20 At&T Corp. Natural language knowledge servers as network resources
JPH11224265A (ja) * 1998-02-06 1999-08-17 Pioneer Electron Corp 情報検索装置及び情報検索方法並びに情報検索プログラムを記録した記録媒体
JPH11231894A (ja) * 1998-02-18 1999-08-27 Denso Corp 音声認識装置
US7082391B1 (en) * 1998-07-14 2006-07-25 Intel Corporation Automatic speech recognition
RU2138076C1 (ru) * 1998-09-14 1999-09-20 Закрытое акционерное общество "МедиаЛингва" Система поиска информации в компьютерной сети
JP2001034292A (ja) * 1999-07-26 2001-02-09 Denso Corp 単語列認識装置
US6314402B1 (en) * 1999-04-23 2001-11-06 Nuance Communications Method and apparatus for creating modifiable and combinable speech objects for acquiring information from a speaker in an interactive voice response system
US6356869B1 (en) * 1999-04-30 2002-03-12 Nortel Networks Limited Method and apparatus for discourse management
JP3980791B2 (ja) * 1999-05-03 2007-09-26 パイオニア株式会社 音声認識装置を備えたマンマシンシステム
KR100332966B1 (ko) * 1999-05-10 2002-05-09 김일천 음성인식 대화형 인형완구 및 그 제어방법

Also Published As

Publication number Publication date
IL157454A0 (en) 2004-03-28
KR100885033B1 (ko) 2009-02-20
RU2269164C2 (ru) 2006-01-27
WO2002071393A8 (en) 2003-11-20
JP4334227B2 (ja) 2009-09-30
HK1062497A1 (en) 2004-11-05
OA12495A (en) 2006-05-24
CA2437614A1 (en) 2002-09-12
BR0207642A (pt) 2004-06-01
EP1366491B1 (en) 2005-02-02
ZA200307267B (en) 2004-05-03
EP1366491A1 (en) 2003-12-03
US20060184476A1 (en) 2006-08-17
US7653604B2 (en) 2010-01-26
CN1232948C (zh) 2005-12-21
RU2003128960A (ru) 2005-03-27
PT1366491E (pt) 2005-06-30
US20040064323A1 (en) 2004-04-01
DE60202847T2 (de) 2006-02-09
CN1494713A (zh) 2004-05-05
DK1366491T3 (da) 2005-05-09
IL157454A (en) 2008-07-08
WO2002071393A1 (en) 2002-09-12
JP2004526196A (ja) 2004-08-26
MXPA03007724A (es) 2004-11-12
ATE288614T1 (de) 2005-02-15
CA2437614C (en) 2011-06-14
KR20040028722A (ko) 2004-04-03
DE60202847D1 (de) 2005-03-10

Similar Documents

Publication Publication Date Title
ES2236483T3 (es) Sistema de consulta de lenguaje natural para acceder a un sistema de informacion.
Vasardani et al. From descriptions to depictions: A conceptual framework
Goddeau et al. GALAXY: a human-language interface to on-line travel information.
Horák et al. Debvisdic-first version of new client-server wordnet browsing and editing tool
Wang et al. Semantic search on internet tabular information extraction for answering queries
Flycht-Eriksson et al. Dialogue and domain knowledge management in dialogue systems
CN101470701A (zh) 支持基于有限状态机的语义规则的文本分析器及其方法
Dyer et al. Urban narrative: Computational linguistic interpretation of large format public participation for urban infrastructure
Shi et al. Extraction of geospatial information on the Web for GIS applications
Kanis et al. Czech-sign speech corpus for semantic based machine translation
CN109344341A (zh) 一种中文地理信息查询方法及系统
Shi et al. Thematic data extraction from Web for GIS and applications
Suga et al. Experimental release of “Japan map in multilingual notation” using vector tile data
HK1062497B (en) Natural language query system for accessing an information system
Shih et al. The construction of a Chinese named entity tagged corpus: CNEC1. 0
Niimi et al. A task-independent dialogue controller based on the extended frame-driven method.
Suzuki et al. Bilingual Sign Language Dictionary to Learn the Second Sign Language without Learning a Target Spoken Language
Mengistu et al. Hierarchical HMM-based semantic concept labeling model
Evans et al. Access to graphical information for blind people through speech and touch
Ali Issues in English to Indian sign generation and translation model and developed corpus based translation system to tackle those issues
Chauhan et al. A noval hindi language interface for databases
Wandl-Vogt Point and find: the intuitive user experience in accessing spatially structured dialect dictionaries
Suyitno The Persons Pronouns of Using Language and Its Use in Banyuwangi Speech Community
Turton et al. Visualizing unstructured text documents using trees and maps
Christian et al. Information retrieval and visualization based on documents geospatial semantics