ES2236483T3 - Sistema de consulta de lenguaje natural para acceder a un sistema de informacion. - Google Patents
Sistema de consulta de lenguaje natural para acceder a un sistema de informacion.Info
- Publication number
- ES2236483T3 ES2236483T3 ES02703402T ES02703402T ES2236483T3 ES 2236483 T3 ES2236483 T3 ES 2236483T3 ES 02703402 T ES02703402 T ES 02703402T ES 02703402 T ES02703402 T ES 02703402T ES 2236483 T3 ES2236483 T3 ES 2236483T3
- Authority
- ES
- Spain
- Prior art keywords
- user
- information
- intended
- module
- domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2452—Query translation
- G06F16/24522—Translation of natural language queries to structured queries
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
- G10L15/193—Formal grammars, e.g. finite state automata, context free grammars or word networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Stored Programmes (AREA)
- Memory System Of A Hierarchy Structure (AREA)
- Telephone Function (AREA)
Abstract
Sistema de interacción (5) ppara permitir a un usuario (4) de un sistema de información (1), que pertenece a un dominio de aplicación de sistemas de información similares, interactuar con dicho sistema de información (1), estando destinado dicho sistema de interacción (5) ppara ser conectado al sistema de información (1), y a un sistema de reconocimiento (2) ppara permitir a dicho usuario (4) interactuar con dicho sistema de información (1) por medio de frases generadas por dicho usuario (4) y procesadas por el sistema de reconocimiento (2), cparacterizado porque dicho sistema de interacción (5) comprende al menos un módulo de dominio (5a) que está destinado ppara tener definidas en el mismo módulo unas estructuras de frases que están construidas sobre la base de las clases de objetos, clases de atributos y clases de acciones que son comunes a dicho sistema de información del dominio de aplicación considerado y que están previstas ppara ser individualizadas con tipos de objetos específicos,tipos de acciones, tipos de atributos y sus instancias, proporcionadas a partir del sistema de información (1), con el fin de definir una gramática de frases que están previstas ppara ser generadas por el usuario (4) para interactuar con el sistema de información (1).
Description
Sistema de consulta de lenguaje natural para
acceder a un sistema de información.
La presente invención se refiere a un sistema de
interacción que está destinado para permitir a un usuario entrar en
interacción con un sistema de información por medio de un sistema de
reconocimiento.
Los sistemas de reconocimiento comprenden
habitualmente dos módulos: un módulo de reconocimiento que convierte
frases generadas por el usuario en una representación textual
asistida por ordenador de dichas frases y un módulo de generación de
texto, que puede convertir una representación textual asistida por
ordenador en una grase generada no comprensible por el usuario. En
efecto, entre los sistemas de reconocimiento se encuentran sistemas
de reconocimiento de voz, con los que el usuario puede generar
frases por medio de la pronunciación y que pueden generar frases en
voz alta para el usuario, y sistemas de reconocimiento de texto,
tales como los sistemas de escaneo de texto, con los que el usuario
puede generar frases por medio de un texto escrito y que pueden
generar frases para el usuario en una forma escrita.
Los sistemas de información gestionan datos que
son almacenados usualmente en bases de datos. Estas bases de datos
son personalizadas comúnmente por sus usuarios, de la misma manera
que los sistemas de información que están destinados para la
utilización de dichas bases de datos. Un ejemplo de un sistema de
información conocido se describe en el documento de patente
WO-A-0065814.
En las bases de datos, los datos, también
llamados objetos, con recopilados en tipos de objetos identificados
por un código. Cada tipo de objeto recopila instancias de objetos,
es decir, datos u objetos específicos, del tipo considerado. Con
cada tipo de objeto están asociados un cierto número de atributos
que caracterizan las instancias del tipo de objeto. De una manera
similar a los objetos, se pueden recopilar atributos en tipos de
atributos. Un tipo de atributos agrupa atributos que tienen
características similares, por ejemplo atributos textuales o
atributos de datos.
Cada sistema de información está adaptado a las
bases de datos que debe manipular y, por lo tanto, puede direccionar
los tipos de objetos, tipos de atributos, e instancias de objetos de
un tipo de objeto que tiene ciertas instancias de atributos. Por lo
tanto, los códigos utilizados por una base de datos para identificar
tipos de objetos y tipos de atributos son reconocidos por el sistema
de información que debe manipular dicha base de datos.
Además, cada sistema de información contiene
tipos de acción que recopilan acciones que pueden ser aplicadas
sobre los objetos de una base de datos por el sistema. Cada tipo de
acción se ajusta a uno o más tipos de objetos.
Los sistemas de información son recopilados en
diferentes dominios de aplicaciones tales como Sistemas de
Información Geográfica (GIS), Sistemas de Planificación de Recursos
de Empresas (ERP), Sistemas de Gestión de Documentos (DM) o Sistemas
de Gestión de Datos de Productos (PDM) por nombrar solamente unos
pocos dominios de aplicación de negocios bien conocidos.
Tradicionalmente, los usuarios de un sistema de
información específico tienen que interactuar con este sistema por
medio de una interfaz especialmente desarrollada para el sistema,
que será diferente de un sistema a otro incluso en el mismo dominio
de aplicaciones. Además, dicho usuario tendrá que interactuar con un
sistema de información utilizando el teclado y/o el ratón del
ordenador, que accede al sistema de información.
La presente invención soluciona estos problemas
proporcionando un sistema de interacción, llamado Voice Query
Language, que permite interacciones de un usuario con diferentes
sistemas de información pre-existentes de un dominio
de aplicaciones utilizando diferentes sistemas de reconocimiento
pre-existente. Por lo tanto, esta invención permite
al usuario aplicar, por medio de la generación de frases, las
llamadas consultas, acciones definidas por el sistema de información
con relación a objetos memorizados en las bases de datos manipuladas
por el sistema de información e identificados por medio de
atributos.
El inventor ha descubierto que se pueden definir
todos los sistemas de información de un dominio de aplicaciones,
clases de objetos comunes, clases de atributos y clases de acciones.
Estas clases recopilan, respectivamente, objetos, atributos y
acciones que presentan una característica común que define la clase
considerada, siendo dicha característica específica de todos los
sistemas de información del dominio. Un ejemplo de este tipo de un
objeto puede ser parte de varias clases de objetos si presenta al
mismo tiempo las características de estas clases diferentes. Sobre
la base de dichas clases de objetos, de atributos y de acciones, se
pueden definir estructuras de frases de acción, que constituirán
modelos que pueden ser individualizados con tipos de objetos
específicos, tipos de atributos y tipos de acciones de un sistema de
información específico del dominio considerado de aplicaciones y las
instancias de los objetos con sus instancias de atributos son
memorizadas en las bases de datos manipuladas por dicho sistema de
información. Las estructuras de frases de actuación referidas, que
se utilizan para formar frases reales, definen de esta manera una
gramática que está constituida esencialmente por tipos de objetos,
tipos de atributos, tipos de acciones y se proporcionan reglas de
producción que deben utilizarse en las interacciones del usuario con
un sistema de información del dominio considerado, cuando el sistema
presenta al usuario las diferentes consultas que puede realizar y
también cuando el usuario dirige una consulta de este tipo al
sistema de información.
Por lo tanto, la invención proporciona un sistema
de interacción para permitir a un usuario de un sistema de
información, que pertenece a un dominio de aplicación de sistemas de
información similares, interactuar con dicho sistema de información,
estando destinado dicho sistema de interacción para ser conectado al
sistema de información, estando destinado, además, el sistema de
interacción para ser conectado a un sistema de reconocimiento para
permitir al usuario interactuar con el sistema de información por
medio de frases generadas por dicho usuario y procesadas por el
sistema de reconocimiento, comprendiendo dicho sistema de
interacción al menos un módulo de dominio que está destinado para
tener definidas en el mismo módulo unas estructuras de frases que
están construidas sobre la base de las clases de objetos, clases de
atributos y clases de acciones que son comunes a dicho sistema de
información del dominio de aplicación considerado y que están
previstas para ser individualizadas con tipos de objetos
específicos, tipos de acciones, tipos de atributos y sus instancias,
proporcionadas a partir del sistema de información, con el fin de
definir una gramática de frases que están previstas para ser
generadas por el usuario para interactuar con el sistema de
información.
De una manera preferida, el sistema de
interacción de acuerdo con la invención comprende un módulo genérico
conectado al menos a un módulo de domino y destinado para ser
conectado al sistema de reconocimiento, estando destinado dicho
módulo genérico para convertir dichas frases, que pueden ser
generadas por el usuario, en una representación textual asistida por
ordenador que es utilizable por el sistema de reconocimiento para el
reconocimiento de dichas frases cuando son generadas por el usuario
y estando destinado para convertir una representación textual
asistida por ordenador producida por el sistema de reconocimiento,
después de que se ha producido el reconocimiento de una frase
generada por el usuario, en una frase definida por dicha
gramática.
Es más preferido que dicho módulo genérico
comprenda un elemento que contiene información que permite la
configuración del sistema de reconocimiento.
En otra configuración preferida del sistema de
interacción de acuerdo con la invención, comprende un módulo
adaptador que está conectado al menos a un módulo de dominio y que
está destinado para ser conectado al sistema de información, estando
destinado dicho módulo adaptador para extraer tipos de objetos, de
atributos, de acción y sus instancias a partir del sistema de
información y para pasarlos al menos a un módulo de dominio y que
está destinado para dividir el sistema de información para que este
último ejecute una demanda de acción contenida en una frase generada
por el usuario.
De una manera preferida, el al menos un módulo de
dominio comprende un elemento que contiene información sobre
nociones generales de objetos y atributos que identifican objetos
que son comunes a varios dominios de aplicación.
Se prefiere también que el al menos un módulo de
dominio esté destinado para ser conectado a un analista y lingüista
del sistema destinado a definir clases de objetos, clases de
atributos, clases de acción y estructuras de frases que dicho al
menos un módulo de dominio está destinado a tener definidas en el
mismo.
De una manera más específica, el sistema de
reconocimiento mencionado anteriormente es un sistema de
reconocimiento de voz y las frases generadas por el usuario son
generadas por medio de la pronunciación de dicho usuario.
Esto permite al usuario interactuar con un
sistema de información por medio del lenguaje natural de dicho
usuario.
De una manera alternativa, dicho sistema de
reconocimiento es un sistema de reconocimiento de texto y las frases
generadas por el usuario son escritas por dicho usuario.
A continuación se describirá la invención con más
detalle con referencia a la figura 1 que representa un sistema de
interacción de acuerdo con la invención integrado en su entorno.
Con referencia a la figura 1, el entorno que
comprende un sistema de interacción de acuerdo con la invención se
compone de los siguientes elementos:
1: Un sistema de información destinado para
manipular varios tipos de objetos que se caracterizad por varios
atributos que son parte de tipos de atributos, siendo realizada la
manipulación por medio de varios tipos de acciones. Los tipos de
objetos y de atributos tienen instancias que se pueden encontrar en
las bases de datos manipuladas por el sistema de información,
2: Un sistema de reconocimiento que comprende dos
módulos:
- 2a:
- El módulo de reconocimiento que convierte frases generadas por el usuario en una representación textual asistida por ordenador.
- 2b:
- El módulo de generación de texto, que puede convertir una representación textual asistida por ordenador en una frase generada que puede ser comprendida por el usuario.
3: Un analista y lingüista del sistema que
proporciona las clases de objetos, de atributos y de acciones así
como las estructuras de frases que serán utilizadas para ejecutar
las acciones del sistema de información sobre los tipos de objetos.
Los analistas y lingüistas del sistema son seres humanos que son
capaces de analizar cómo debería interrogar el usuario vocalmente al
sistema. El resultado de este análisis será una colección de
estructuras de frases de actuación que son típicas de un dominio de
aplicaciones.
4: Un usuario que utilizará el sistema por medio
de la gramática definida por las estructuras de frases
individualizadas con las instancias de objetos, atributos y acciones
manipuladas por el sistema de información.
5: El sistema de interacción de acuerdo con la
invención, que permite al usuario interactuar con el sistema de
información en la generación de frases que dicho sistema puede
procesar, sobre la base de las estructuras de frases
individualizadas mencionadas anteriormente. El sistema consta de
tres módulos:
- 5b:
- un módulo genérico que puede convertir una gramática del lenguaje, es decir, un conjunto de tipos de objetos, tipos de acciones y reglas de producción de frases válidas que pueden ser generadas por el usuario con vistas a interactuar con un sistema de información, en una representación asistida por ordenador que puede ser utilizada por el sistema de reconocimiento y convertir una representación asistida por ordenador que resulta a partir de un reconocimiento, en una frase definida por una gramática. Dicho módulo genérico comprende un elemento c1 que contiene información que permite la configuración del sistema de reconocimiento, a saber:
- -
- El software de reconocimiento utilizado,
- -
- El lenguaje utilizado,
- -
- Los dispositivos de comunicación utilizados, tales como, por ejemplo, micrófonos o dispositivos telefónicos.
- 5a:
- Un módulo de dominio que es capaz de recibir elementos tales como tipos de objetos, tipos de atributos y tipos de acciones así como instancias de estos últimos que son manipuladas por sistemas de información de un dominio predeterminado de aplicaciones. El módulo de dominio comprende definiciones de clases de objetos, acciones y atributos que son típicas de dicho dominio y que se utilizan para combinar los elementos mencionados anteriormente recibidos con las estructuras de frases de acción mencionadas anteriormente para producir la gramática que es requerida por el módulo genérico 5b. Las estructuras de frases de acción son recibidas desde el analista y lingüista del sistema con el fin de que puedan ser generadas consultas por el usuario en un lenguaje natural. Si se dispone de sistemas de información múltiples al mismo tiempo, se pueden generar y activar múltiples gramáticas. El sistema de interacción de acuerdo con la invención conmutará entre los sistemas de información. Se podría realizar una conmutación similar entre un sistema de interacción de acuerdo con la invención para un dominio tal como GIS y un sistema de interacción de acuerdo con la invención para otro dominio tal como DM. El módulo de dominio puede tomar, por lo tanto, una frase producida por el módulo genérico después de que se ha producido el reconocimiento y generar una descripción de una acción sobre objetos específicos identificados por valores de atributos específicos que deben ser ejecutados por el sistema de información 1. Las definiciones mencionadas anteriormente están comprendidas dentro de un elemento c2 del módulo de dominio, que contiene:
- -
- Información común a varios dominios tales como nociones generales de objetos y atributos que identifican objetos.
- -
- La identificación del dominio que comprende elementos de configuración que identifican un dominio de sistemas de información, tal como por ejemplo sistemas de información GIS,
- -
- Las clases de objetos, que pertenecen a este dominio. Cada clase representa un conjunto de objetos con una característica común. Por ejemplo, en aplicaciones GIS, clases de objetos tales como clase de la superficie (países, condados), clases lineales (ríos, carreteras), clases puntuales (ciudades), clases gráficas (fotografía aérea referenciada geográficamente, mapas). Un objeto real puede ser parte de varias clases de objetos. Por ejemplo en el dominio GIS, un objeto típico tal como una calle de una ciudad pertenecerá a la clase de objeto representable, clase de objeto seleccionable, clase de objeto espacial y clase de objeto lineal.
- -
- Las clases de acciones que pueden ser aplicadas a las clases de objetos. En efecto, asociada con cada clase de objeto, se puede definir, para un dominio dado, una clase de acción que se puede aplicar a esa clase de objeto. Por ejemplo, en un dominio GIS, un objeto que pertenece a la clase de objeto representable puede ser representado u ocultado, un objeto que pertenece a la clase de objetos espaciales puede ser proyectado sobre un mapa o puede ser intersectado con otro objeto que pertenece a la misma clase, un objeto que pertenece a la clase de objetos seleccionables puede ser seleccionado o deseleccionado, un objeto que pertenece a la clase de objetos lineales puede ser movido a lo largo de una cierta distancia para proporcionar una localización específica. Cualquiera que sean los tipos específicos de objetos y las instancias, siempre es posible manipular (mostrar, seleccionar, resalta,...) objetos puntuales, lineales y superficiales contenidos por otro objeto superficial, manipular objetos superficiales cruzados por objetos lineales y manipular objetos puntuales a lo largo de un objeto lineal dado.
- -
- Las clases de atributos que pueden ser fijadas a los objetos. Una clase de atributos recopila atributos con un significado común hacia los objetos de todas las clases de objetos. En efecto, los atributos que pertenecen a la clase "nombrar instancia" son utilizados para identificar una instancia particular de un tipo de objeto. Por ejemplo, en el dominio GIS, si las carreteras tienen un atributo que es "número de carretera", cuyas instancias son números, el "número de carretera" es, por lo tanto, del tipo de atributo "numérico", pero también es parte de la clase de atributos "nombre de instancia" debido a que las carreteras pueden ser referidas por voz por medio de su número.
- -
- Las diversas estructuras de frases que se pueden utilizar para solicitar la ejecución de las acciones. Asociado con cada clase de acción se puede definir un conjunto de estructuras de frases que se pueden utilizar para solicitar la clase de acción a realizar. Por ejemplo, en el dominio GIS, se pueden definir estructuras de frases tales como representar "xyz" o pasar a "abc". Como "xyz" o "abc" se puede referenciar la clase de atributo utilizada para identificar los tipos de objetos, sobre los que se realizará la acción. Estas estructuras serán individualizadas por instancias de objetos que pertenecen a estos tipos manipulados por el sistema de información con el que el usuario entrará en contacto interactivo. Además, las acciones tales como "representar" o "pasar a" pueden tener sinónimos que se podrían intercambiar fácilmente con los términos originales. Esto significa que pueden existir múltiples variantes de la misma estructura de frase sin cambios substanciales en su estructura gramatical.
- -
- Los elementos de términos que se combinan en secuencias componen frases a generar por el usuario. Se encuentran elementos de términos estáticos, cuyas instancias no tienen que ser extraídas del sistema de información, tales como números, operadores de comparación, y elementos dinámicos, cuyas instantes tienen que se extraídas desde el sistema de información, tales como las de tipos de objetos o tipos de atributos. Los elementos de términos definidos estáticos son listas directas de términos, cuyos elementos se pueden predeterminar durante la configuración del módulo de dominio.
Cada uno de estos elementos puede ser marcado
como opcional; esto significa que pueden ser omitidos en la
generación sin perjudicar el significado de la frase, tales como
expresiones de cortesía.
Cada uno de estos elementos puede ser marcado
también como repetitivo, tal como para la composición de valores
numéricos, deletreo de códigos de identificación o especificación de
posiciones geográficas.
Por ejemplo, en el dominio GIS, se puede obtener
la siguiente secuencia de elementos de términos estáticos: [-1] [2]
[+3] [-4], en la que [-1] marcan una lista de términos opcionales
que está compuesta por los términos "por favor", "puede
Ud.", [2] marca una lista de términos obligatorios que está
compuesta por "pasar a" o "mover a", [+3] marca una lista
de términos repetitivos que está compuesta por los términos
"norte", "este", "oeste", "sur"; [-4] marca una
lista de términos opcionales que está compuesta por los términos
"por favor". Por consiguiente, las siguientes son frases
válidas basadas en estos elementos: pasar al nordeste, puede
desplazarse al sur sur buscar por favor.
También se pueden formar frases tales como [1]
[2] [3] y [1] [4] [3] [5] [2], en las que [1] es o bien
"mostrar" o "representar", [2] es un nombre de una
instancia de objeto relacionado, [3] es un nombre del tipo de objeto
espacial, [4] es "el", [5] es "de". [2] y [3] son
elementos de términos dinámicos. Entonces, si los elementos
dinámicos extraídos desde el sistema de información son dos objetos
espaciales llamados ciudad y estado y dos nombres de instancias
llamados Nueva York y Washington para la ciudad y Nueva York e Idaho
para el estado, entonces la generación combinada generará las frases
siguientes:
- [1]
- [2a] [3a]
- [1]
- [2b] [3b]
- [1]
- [4] [3a] [5] [2a]
- [1]
- [4] [3b] [5] [3b]
en las
que
- [2a]
- será o bien Nueva York o Washington
- [3a]
- será ciudad
- [2b]
- será Nueva York o Idaho
- [3b]
- será estado
resultando, en particular, frases tales como
"mostrar la ciudad de Nueva York" o "representar el estado de
Idaho".
- 5c:
- Un módulo adaptador del sistema de información que se crea para una aplicación de un sistema de información específico. Este módulo adaptador está destinado para extraer los tipos de objetos, de atributos y de acciones así como sus instancias a partir del sistema de información considerado y para pasarlos al módulo de domino 5a, donde son referenciados en clases de objetos, de atributos y de acciones que definen el dominio del sistema de información. Por otra parte, dichos módulos adaptadores son capaces de accionar el sistema de información con el fin de que ejecute la demanda de acción contenida en una frase generada por el usuario. Esto requiere que el módulo traslade la descripción de la acción proporcionada por el módulo de dominio 5a a la lógica de aplicación del sistema de información.
La transmisión de información entre diferentes
elementos del entorno definido aquí más arriba se realiza de la
siguiente manera:
- -
- Desde 5b hacia 2a: una lista de palabras y una definición de las reglas de producción que controlan la combinación de estas palabras en frases aceptables en una representación asistida por ordenador adaptada para el sistema de reconocimiento.
- -
- Desde 2a hacia 5b: una frase reconocida en una representación asistida por ordenador adaptada para el sistema de reconocimiento. Esta frase corresponde a una secuencia válida de palabras.
- -
- Desde 5b hacia 2b: una representación textual asistida por ordenador que debe ser leída en voz alta para el usuario.
- -
- Desde 5a hacia 5b: un conjunto de listas de términos y un conjunto de reglas de combinación que utilizan las listas de términos para formar estructuras de frases que representan las frases válidas que pueden ser generadas por el usuario.
- -
- Desde 5b hacia 5a: una frase generada por el usuario descompuesta en una identificación de reglas de combinación con la identificación de las listas de términos asociados y los elementos de las listas de términos generados por el usuario.
- -
- Desde 5c hacia 5a: una lista de tipos de objetos con sus clases correspondientes, instancias de objetos, tipos de atributos con sus clases correspondientes e instancias de atributos.
- -
- Desde 5a hacia 5c: una acción con parámetros relacionados que debe ser ejecutada por el sistema de información. Estos parámetros pueden incluir instancias de objetos y de atributos. En los casos ambiguos en los que podría accederse a dos acciones diferentes o a dos objetos diferentes por el mismo comando de usuario, las diferentes posibilidades retornarán al sistema de información por el módulo de dominio, con la esperanza de que el módulo adaptador sea capaz de eliminar la ambigüedad utilizando información de contexto del sistema de información o solicitando una reacción desde el usuario.
- -
- Desde 1 hacia 5c: lo mismo que desde 5c hacia 5a, pero en el lenguaje lógico de 1, por lo tanto en función de 1.
- -
- Desde 5c hacia 1: lo mismo que desde 5a hacia 5c, pero trasladado al lenguaje lógico de 1, por lo tanto, en función de 1.
El uso del sistema de interacción de acuerdo con
esta invención implica las siguientes secuencias de eventos:
- -
- Se identifica un dominio que reagrupa las clases comunes de objetos, de atributos y de acciones de una clase de sistemas de información.
- -
- El analista y lingüista del sistema 3 define las clases de objetos, atributos y acciones y las estructuras de frases de acciones relacionadas requeridas por el dominio.
- -
- La información es codificada en un formato interno que es utilizable por el módulo de dominio 5a.
- -
- Un módulo adaptador 5c es definido para un sistema de información específico 1 que pertenece al dominio identificado.
- -
- El usuario 4 pone en marcha el sistema de información.
- -
- El sistema de información pone en marcha el módulo adaptador.
- -
- El módulo adaptador utiliza el sistema de información para extraer los objetos que pueden ser utilizados por el usuario y pasa esta información al módulo de dominio.
- -
- El módulo de dominio utiliza las clases de objetos, las clases de atributos y las estructuras de las frases de acciones mencionadas anteriormente para formar las listas de términos y las reglas de combinación para el módulo genérico 5b.
- -
- El módulo genérico convierte las listas de términos y las reglas de combinación en una forma aceptable para el sistema de reconocimiento y pone en marcha este último sistema.
- -
- El usuario genera una frase.
- -
- El sistema de reconocimiento 2, después de que ha sido reconocida una frase factible, retorna la frase reconocida al módulo genérico.
- -
- El módulo genérico analiza gramaticalmente las frases en unas listas de reglas de combinación y de términos y la retorna al módulo de dominio.
- -
- El módulo de dominio proporciona la información necesaria para realizar la acción al módulo adaptador.
- -
- El módulo adaptador llama entonces el sistema de información para que realice la acción.
Ejemplo de clasificación de información tratada
por un sistema de interacción de acuerdo con la invención, que
permite a un usuario entrar en contacto interactivo con un sistema
de información de dominio GIS:
Tenemos un sistema de información capaz de
representar o seleccionar objetos espaciales ya sea por valores de
propiedad o por relaciones espaciales.
Asociados con este sistema, tenemos tipos de
objetos que son países y ciudades; las instancias de los objetos de
estos tipos de objetos tienen dos atributos asociados que son nombre
y población. El nombre es del tipo de atributo textual, la población
es del tipo de atributo numérico.
Para los países, tenemos dos instancias: los U.
S. A. y Francia.
Sus poblaciones respectivas son 250000000 y
60000000 de habitantes.
Para las ciudades tenemos seis instancias: Nueva
York, Los Ángeles, Dallas, París, Lyón, Marsella.
Sus poblaciones respectivas son 1200000,
10000000, 500000, 600000, 1000000, 800000 habitantes.
En lenguaje inglés se pueden definir las
siguientes frases para acceder a los objetos por el sistema:
Operaciones genéricas de representación /
ocultación:
- Representar los países
- Ocultar los países
- Representar las ciudades
- Ocultar las ciudades
Operación de selección global:
- Seleccionar todos los países
- Seleccionar todas las ciudades
Operación de selección de atributo de nombre:
- Seleccionar el país llamado Francia
- Seleccionar la ciudad llamada Los Ángeles
Expresiones de condiciones de atributos:
- Que tiene el nombre de U. S. A.
- Con una población que excede de 1000000
Selección relacionada con los atributos:
- Seleccionar el país, cuyo nombre es U. S. A.
- Seleccionar la ciudad con una población de 12000000 de habitantes
Expresiones de condiciones espaciales:
- Dentro de los U. S. A.
Selección relacionada con el espacio:
- Seleccionar las ciudades dentro de los U. S. A.
- Seleccionar el país en el que se encuentra París.
Por lo tanto, definiremos los siguientes
elementos de la configuración a partir del elemento c2 del módulo de
dominio del sistema:
Definición de dominio:
- Dominio X
Clases de objetos:
- Objetos representables
- Objeto seleccionables
- Objetos que incluyen en el espacio
- Objetos incluidos en el espacio
- Objetos discriminados numéricamente
- Objetos nombrados por instancias
Clases de acciones (ejemplos)
- Para objetos representables:
- Representar (presentación de los objetos al usuario)
- Ocultar (ocultación de los objetos al usuario)
- Para objetos seleccionables
- Seleccionar todo (selección de los objetos)
- deseleccionar (de-selección de los objetos)
Clases de atributos
- Atributos de nombres de instancias de objetos
- Atributo consultable
Tipos de atributos
- Atributo de valor numérico
- Atributo de valor textual
Estructuras de frases de acción
- Listar todo ("Listar todos los países", "Listar todas las ciudades")
- Seleccionar todo ("Seleccionar todos los países")
- Condición ("Con una población que excede de 5 millones")
\newpage
Secuencias de elementos de términos (ejemplo)
- Comando de condición = [1] [2] [3] [4] [5]
Elementos de términos dinámicos
- [3]
- atributos numéricos consultables, tales como "población".
Elementos de términos estáticos
- [1]
- con I que tiene
- [2]
- un
- [4]
- menor que I mayor que I igual a
- [5]
- valores numéricos.
Claims (8)
1. Sistema de interacción (5) para permitir a un
usuario (4) de un sistema de información (1), que pertenece a un
dominio de aplicación de sistemas de información similares,
interactuar con dicho sistema de información (1), estando destinado
dicho sistema de interacción (5) para ser conectado al sistema de
información (1), y a un sistema de reconocimiento (2) para permitir
a dicho usuario (4) interactuar con dicho sistema de información (1)
por medio de frases generadas por dicho usuario (4) y procesadas por
el sistema de reconocimiento (2), caracterizado porque dicho
sistema de interacción (5) comprende al menos un módulo de dominio
(5a) que está destinado para tener definidas en el mismo módulo unas
estructuras de frases que están construidas sobre la base de las
clases de objetos, clases de atributos y clases de acciones que son
comunes a dicho sistema de información del dominio de aplicación
considerado y que están previstas para ser individualizadas con
tipos de objetos específicos, tipos de acciones, tipos de atributos
y sus instancias, proporcionadas a partir del sistema de información
(1), con el fin de definir una gramática de frases que están
previstas para ser generadas por el usuario (4) ara interactuar con
el sistema de información (1).
2. Un sistema de interacción (5) de acuerdo con
la reivindicación 1, caracterizado porque comprende un módulo
genérico (5b) conectado a dicho al menos un módulo de domino (5a) y
destinado para ser conectado a dicho sistema de reconocimiento,
estando destinado dicho módulo genérico (5b) para convertir dichas
frases, que pueden ser generadas por dicho usuario (4), en una
representación textual asistida por ordenador que es utilizable por
el sistema de reconocimiento (2) para el reconocimiento de dichas
frases cuando son generadas por dicho usuario (4) y estando
destinado para convertir una representación textual asistida por
ordenador producida por el sistema de reconocimiento (2), después de
que se ha producido el reconocimiento de una frase generada por
dicho usuario (4), en una frase definida por dicha gramática.
3. Un sistema de interacción (5) de acuerdo con
la reivindicación 2, caracterizado porque dicho módulo
genérico (5b) comprenda un elemento (c1) que contiene información
que permite la configuración de dicho sistema de reconocimiento.
4. Un sistema de interacción (5) de acuerdo con
una de las reivindicaciones anteriores, caracterizado porque
comprende un módulo adaptador (5c) que está conectado a dicho al
menos un módulo de dominio (5a) y que está destinado para ser
conectado a dicho sistema de información (1), estando destinado
dicho módulo adaptador (5c) para extraer tipos de objetos, de
atributos, de acción y sus instancias a partir del sistema de
información (1) y para pasarlos al menos a un módulo de dominio (5a)
y que está destinado para dividir el sistema de información (1) para
que este último ejecute una demanda de acción contenida en una frase
generada por el usuario (4).
5. Un sistema de interacción (5) de acuerdo con
una de las reivindicaciones anteriores, caracterizado porque
dicho al menos un módulo de dominio (5a) comprende un elemento (c2)
que contiene información sobre nociones generales de objetos y
atributos que identifican objetos que es común a varios dominios de
aplicación.
6. Un sistema de interacción (5) de acuerdo con
una de las reivindicaciones anteriores, caracterizado porque
dicho al menos un módulo de dominio (5a) está destinado para ser
conectado a un analista y lingüista del sistema (3), que está
destinado a definir clases de objetos, clases de atributos, clases
de acción y estructuras de frases que dicho al menos un módulo de
dominio (5a) está destinado a tener definidas en el mismo.
7. Un sistema de interacción (5) de acuerdo con
una de las reivindicaciones anteriores, caracterizado porque
dicho sistema de reconocimiento (2) es un sistema de reconocimiento
de voz y porque las frases generadas por dicho usuario (4) son
generadas por medio de la pronunciación de dicho usuario (4).
8. Un sistema de interacción (5) de acuerdo con
una de las reivindicaciones anteriores, caracterizado porque
dicho sistema de reconocimiento (2) es un sistema de reconocimiento
de texto y porque las frases generadas por dicho usuario (4) son
escritas por dicho usuario (4).
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP01200749 | 2001-02-28 | ||
| EP01200749 | 2001-02-28 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2236483T3 true ES2236483T3 (es) | 2005-07-16 |
Family
ID=8179950
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES02703402T Expired - Lifetime ES2236483T3 (es) | 2001-02-28 | 2002-02-28 | Sistema de consulta de lenguaje natural para acceder a un sistema de informacion. |
Country Status (18)
| Country | Link |
|---|---|
| US (2) | US20040064323A1 (es) |
| EP (1) | EP1366491B1 (es) |
| JP (1) | JP4334227B2 (es) |
| KR (1) | KR100885033B1 (es) |
| CN (1) | CN1232948C (es) |
| AT (1) | ATE288614T1 (es) |
| BR (1) | BR0207642A (es) |
| CA (1) | CA2437614C (es) |
| DE (1) | DE60202847T2 (es) |
| DK (1) | DK1366491T3 (es) |
| ES (1) | ES2236483T3 (es) |
| IL (2) | IL157454A0 (es) |
| MX (1) | MXPA03007724A (es) |
| OA (1) | OA12495A (es) |
| PT (1) | PT1366491E (es) |
| RU (1) | RU2269164C2 (es) |
| WO (1) | WO2002071393A1 (es) |
| ZA (1) | ZA200307267B (es) |
Families Citing this family (24)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP1676189A4 (en) | 2003-08-27 | 2008-01-02 | Equifax Inc | APPLICATION PROCESSING AND DECISION-MAKING SYSTEMS AND PROCESSES |
| US11132183B2 (en) | 2003-08-27 | 2021-09-28 | Equifax Inc. | Software development platform for testing and modifying decision algorithms |
| FR2862780A1 (fr) * | 2003-11-25 | 2005-05-27 | Thales Sa | Procede d'elaboration d'une grammaire specifique a un domaine a partir d'une grammaire sous-specifiee |
| US7529733B2 (en) * | 2004-11-10 | 2009-05-05 | International Business Machines Corporation | Query builder using context sensitive grids |
| KR100718147B1 (ko) * | 2005-02-01 | 2007-05-14 | 삼성전자주식회사 | 음성인식용 문법망 생성장치 및 방법과 이를 이용한 대화체음성인식장치 및 방법 |
| JP4901736B2 (ja) * | 2005-07-26 | 2012-03-21 | 本田技研工業株式会社 | ユーザと機械とのインタラクションを実施するための装置、方法、およびプログラム |
| US8229745B2 (en) * | 2005-10-21 | 2012-07-24 | Nuance Communications, Inc. | Creating a mixed-initiative grammar from directed dialog grammars |
| US20070136222A1 (en) * | 2005-12-09 | 2007-06-14 | Microsoft Corporation | Question and answer architecture for reasoning and clarifying intentions, goals, and needs from contextual clues and content |
| US8368749B2 (en) * | 2006-03-27 | 2013-02-05 | Ge Inspection Technologies Lp | Article inspection apparatus |
| DE102006029755A1 (de) * | 2006-06-27 | 2008-01-03 | Deutsche Telekom Ag | Verfahren und Vorrichtung zur natürlichsprachlichen Erkennung einer Sprachäußerung |
| US8625434B2 (en) * | 2006-12-29 | 2014-01-07 | Ge Inspection Technologies Lp | IP based voice communication enabled inspection system |
| CA2695898C (en) * | 2007-08-07 | 2016-12-20 | Equifax, Inc. | Systems and methods for managing statistical expressions |
| US8219407B1 (en) | 2007-12-27 | 2012-07-10 | Great Northern Research, LLC | Method for processing the output of a speech recognizer |
| US9978365B2 (en) * | 2008-10-31 | 2018-05-22 | Nokia Technologies Oy | Method and system for providing a voice interface |
| US20100198876A1 (en) * | 2009-02-02 | 2010-08-05 | Honeywell International, Inc. | Apparatus and method of embedding meta-data in a captured image |
| US9519814B2 (en) | 2009-06-12 | 2016-12-13 | Hand Held Products, Inc. | Portable data terminal |
| EP2341450A1 (en) * | 2009-08-21 | 2011-07-06 | Mikko Kalervo Väänänen | Method and means for data searching and language translation |
| US20110106779A1 (en) * | 2009-10-30 | 2011-05-05 | Research In Motion Limited | System and method to implement operations, administration, maintenance and provisioning tasks based on natural language interactions |
| US9679561B2 (en) | 2011-03-28 | 2017-06-13 | Nuance Communications, Inc. | System and method for rapid customization of speech recognition models |
| US9069814B2 (en) * | 2011-07-27 | 2015-06-30 | Wolfram Alpha Llc | Method and system for using natural language to generate widgets |
| GB2523028A (en) * | 2012-10-25 | 2015-08-12 | Walker Reading Technologies Inc | Sentence parsing correction system |
| US10650089B1 (en) * | 2012-10-25 | 2020-05-12 | Walker Reading Technologies | Sentence parsing correction system |
| RU2737598C1 (ru) * | 2020-02-04 | 2020-12-01 | Павел Андреевич Морозов | Способ формирования оперативной информации на основе формализованной концептуальной модели предметной области |
| US12360988B1 (en) * | 2024-11-22 | 2025-07-15 | Anomali Incorporated | Automatic query language generation for specialized query language based on natural language search |
Family Cites Families (19)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4688195A (en) * | 1983-01-28 | 1987-08-18 | Texas Instruments Incorporated | Natural-language interface generating system |
| US5083268A (en) * | 1986-10-15 | 1992-01-21 | Texas Instruments Incorporated | System and method for parsing natural language by unifying lexical features of words |
| EP0505621A3 (en) * | 1991-03-28 | 1993-06-02 | International Business Machines Corporation | Improved message recognition employing integrated speech and handwriting information |
| JP2818362B2 (ja) * | 1992-09-21 | 1998-10-30 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 音声認識装置のコンテキスト切換えシステムおよび方法 |
| JPH06202688A (ja) * | 1992-12-28 | 1994-07-22 | Sony Corp | 音声認識装置 |
| US5642519A (en) * | 1994-04-29 | 1997-06-24 | Sun Microsystems, Inc. | Speech interpreter with a unified grammer compiler |
| RU2096825C1 (ru) * | 1996-10-14 | 1997-11-20 | Общество с ограниченной ответственностью "Информбюро" | Устройство обработки информации для информационного поиска |
| US6157935A (en) * | 1996-12-17 | 2000-12-05 | Tran; Bao Q. | Remote data access and management system |
| US6023697A (en) * | 1997-02-24 | 2000-02-08 | Gte Internetworking Incorporated | Systems and methods for providing user assistance in retrieving data from a relational database |
| US6192338B1 (en) * | 1997-08-12 | 2001-02-20 | At&T Corp. | Natural language knowledge servers as network resources |
| JPH11224265A (ja) * | 1998-02-06 | 1999-08-17 | Pioneer Electron Corp | 情報検索装置及び情報検索方法並びに情報検索プログラムを記録した記録媒体 |
| JPH11231894A (ja) * | 1998-02-18 | 1999-08-27 | Denso Corp | 音声認識装置 |
| US7082391B1 (en) * | 1998-07-14 | 2006-07-25 | Intel Corporation | Automatic speech recognition |
| RU2138076C1 (ru) * | 1998-09-14 | 1999-09-20 | Закрытое акционерное общество "МедиаЛингва" | Система поиска информации в компьютерной сети |
| JP2001034292A (ja) * | 1999-07-26 | 2001-02-09 | Denso Corp | 単語列認識装置 |
| US6314402B1 (en) * | 1999-04-23 | 2001-11-06 | Nuance Communications | Method and apparatus for creating modifiable and combinable speech objects for acquiring information from a speaker in an interactive voice response system |
| US6356869B1 (en) * | 1999-04-30 | 2002-03-12 | Nortel Networks Limited | Method and apparatus for discourse management |
| JP3980791B2 (ja) * | 1999-05-03 | 2007-09-26 | パイオニア株式会社 | 音声認識装置を備えたマンマシンシステム |
| KR100332966B1 (ko) * | 1999-05-10 | 2002-05-09 | 김일천 | 음성인식 대화형 인형완구 및 그 제어방법 |
-
2002
- 2002-02-28 BR BR0207642-0A patent/BR0207642A/pt not_active IP Right Cessation
- 2002-02-28 CA CA2437614A patent/CA2437614C/en not_active Expired - Fee Related
- 2002-02-28 DK DK02703402T patent/DK1366491T3/da active
- 2002-02-28 RU RU2003128960/09A patent/RU2269164C2/ru not_active IP Right Cessation
- 2002-02-28 AT AT02703402T patent/ATE288614T1/de active
- 2002-02-28 OA OA1200300217A patent/OA12495A/en unknown
- 2002-02-28 ES ES02703402T patent/ES2236483T3/es not_active Expired - Lifetime
- 2002-02-28 WO PCT/BE2002/000024 patent/WO2002071393A1/en not_active Ceased
- 2002-02-28 KR KR1020037011359A patent/KR100885033B1/ko not_active Expired - Fee Related
- 2002-02-28 CN CNB028057120A patent/CN1232948C/zh not_active Expired - Fee Related
- 2002-02-28 EP EP02703402A patent/EP1366491B1/en not_active Expired - Lifetime
- 2002-02-28 DE DE60202847T patent/DE60202847T2/de not_active Expired - Lifetime
- 2002-02-28 MX MXPA03007724A patent/MXPA03007724A/es active IP Right Grant
- 2002-02-28 JP JP2002570229A patent/JP4334227B2/ja not_active Expired - Fee Related
- 2002-02-28 IL IL15745402A patent/IL157454A0/xx unknown
- 2002-02-28 PT PT02703402T patent/PT1366491E/pt unknown
-
2003
- 2003-08-05 US US10/634,354 patent/US20040064323A1/en not_active Abandoned
- 2003-08-18 IL IL157454A patent/IL157454A/en not_active IP Right Cessation
- 2003-09-17 ZA ZA200307267A patent/ZA200307267B/en unknown
-
2006
- 2006-04-06 US US11/399,053 patent/US7653604B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| IL157454A0 (en) | 2004-03-28 |
| KR100885033B1 (ko) | 2009-02-20 |
| RU2269164C2 (ru) | 2006-01-27 |
| WO2002071393A8 (en) | 2003-11-20 |
| JP4334227B2 (ja) | 2009-09-30 |
| HK1062497A1 (en) | 2004-11-05 |
| OA12495A (en) | 2006-05-24 |
| CA2437614A1 (en) | 2002-09-12 |
| BR0207642A (pt) | 2004-06-01 |
| EP1366491B1 (en) | 2005-02-02 |
| ZA200307267B (en) | 2004-05-03 |
| EP1366491A1 (en) | 2003-12-03 |
| US20060184476A1 (en) | 2006-08-17 |
| US7653604B2 (en) | 2010-01-26 |
| CN1232948C (zh) | 2005-12-21 |
| RU2003128960A (ru) | 2005-03-27 |
| PT1366491E (pt) | 2005-06-30 |
| US20040064323A1 (en) | 2004-04-01 |
| DE60202847T2 (de) | 2006-02-09 |
| CN1494713A (zh) | 2004-05-05 |
| DK1366491T3 (da) | 2005-05-09 |
| IL157454A (en) | 2008-07-08 |
| WO2002071393A1 (en) | 2002-09-12 |
| JP2004526196A (ja) | 2004-08-26 |
| MXPA03007724A (es) | 2004-11-12 |
| ATE288614T1 (de) | 2005-02-15 |
| CA2437614C (en) | 2011-06-14 |
| KR20040028722A (ko) | 2004-04-03 |
| DE60202847D1 (de) | 2005-03-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2236483T3 (es) | Sistema de consulta de lenguaje natural para acceder a un sistema de informacion. | |
| Vasardani et al. | From descriptions to depictions: A conceptual framework | |
| Goddeau et al. | GALAXY: a human-language interface to on-line travel information. | |
| Horák et al. | Debvisdic-first version of new client-server wordnet browsing and editing tool | |
| Wang et al. | Semantic search on internet tabular information extraction for answering queries | |
| Flycht-Eriksson et al. | Dialogue and domain knowledge management in dialogue systems | |
| CN101470701A (zh) | 支持基于有限状态机的语义规则的文本分析器及其方法 | |
| Dyer et al. | Urban narrative: Computational linguistic interpretation of large format public participation for urban infrastructure | |
| Shi et al. | Extraction of geospatial information on the Web for GIS applications | |
| Kanis et al. | Czech-sign speech corpus for semantic based machine translation | |
| CN109344341A (zh) | 一种中文地理信息查询方法及系统 | |
| Shi et al. | Thematic data extraction from Web for GIS and applications | |
| Suga et al. | Experimental release of “Japan map in multilingual notation” using vector tile data | |
| HK1062497B (en) | Natural language query system for accessing an information system | |
| Shih et al. | The construction of a Chinese named entity tagged corpus: CNEC1. 0 | |
| Niimi et al. | A task-independent dialogue controller based on the extended frame-driven method. | |
| Suzuki et al. | Bilingual Sign Language Dictionary to Learn the Second Sign Language without Learning a Target Spoken Language | |
| Mengistu et al. | Hierarchical HMM-based semantic concept labeling model | |
| Evans et al. | Access to graphical information for blind people through speech and touch | |
| Ali | Issues in English to Indian sign generation and translation model and developed corpus based translation system to tackle those issues | |
| Chauhan et al. | A noval hindi language interface for databases | |
| Wandl-Vogt | Point and find: the intuitive user experience in accessing spatially structured dialect dictionaries | |
| Suyitno | The Persons Pronouns of Using Language and Its Use in Banyuwangi Speech Community | |
| Turton et al. | Visualizing unstructured text documents using trees and maps | |
| Christian et al. | Information retrieval and visualization based on documents geospatial semantics |