ES2692828T3

ES2692828T3 - Procedimiento de asistencia en el seguimiento de una conversación para una persona con problemas de audición

Info

Publication number: ES2692828T3
Application number: ES15770906.4T
Authority: ES
Inventors: Christophe Guedon
Original assignee: Individual
Current assignee: Individual
Priority date: 2014-09-29
Filing date: 2015-09-29
Publication date: 2018-12-05
Anticipated expiration: 2035-09-29
Also published as: FR3026543A1; FR3026543B1; EP3149968A1; EP3149968B1; WO2016050724A1

Abstract

Procedimiento de asistencia en el seguimiento de una conversación con una pluralidad de interlocutores (1) para una persona con problemas de audición (2) provista de un equipo informático (3), estando dicho equipo informático unido a por lo menos un módulo de emisión de voz (4), a por lo menos un dispositivo de visualización (5) y a por lo menos un módulo de conversión (6) de señales de voz en señales de texto, comprendiendo dicho procedimiento las etapas siguientes: - adquisición de una pluralidad de señales de voz y de una pluralidad de señales de texto procedentes de una pluralidad de interlocutores, siendo dichas señales de texto obtenidas por conversión de dichas señales de voz por el módulo de conversión (6) de señales; - selección de por lo menos una primera señal de voz de entre la pluralidad de señales de voz adquiridas; - selección de por lo menos una primera señal de texto de entre la pluralidad de señales de texto adquiridas, procediendo la señal de voz y la señal de texto seleccionadas de interlocutores diferentes; - transmisión al módulo de emisión de voz (4) de las primeras señales de voz seleccionadas para la emisión de dichas primeras señales de voz; - orden de la visualización en el dispositivo de visualización (5) de las primeras señales de texto seleccionadas.

Description

5

10

15

20

25

30

35

40

45

50

55

60

65

DESCRIPCION

Procedimiento de asistencia en el seguimiento de una conversacion para una persona con problemas de audicion.

Campo tecnico general

La invencion tiene por objeto el campo de la asistencia a las personas con problemas de audicion, y se refiere de manera mas precisa a un procedimiento de asistencia en el seguimiento de una conversacion que mejora la seleccion de los interlocutores para una persona con problemas de audicion.

Estado de la tecnica

Las personas con problemas de audicion estan equipadas generalmente con protesis auditivas que realizan una amplificacion de los sonidos con el fin de compensar sus dificultades de audicion.

Unas protesis de este tipo estan adaptadas al seguimiento de una conversacion con un numero restringido de interlocutores en un entorno silencioso pero una persona con problemas de audicion puede continuar teniendo problemas para seguir una conversacion, a pesar de la utilizacion de este tipo de protesis, en un entorno en el que se pueden superponer a la conversacion numerosos ruidos parasitos. Este tipo de situacion puede presentarse cuando la conversacion tiene lugar en un entorno ruidoso, por ejemplo en la calle o en una sala en la que numerosas personas hablan de manera simultanea, tal como una cafeteria.

Algunos sistemas de asistencia a las personas con problemas de audicion existentes como el propuesto en la solicitud de patente US 2008295040 proponen proporcionar a su usuario una transcripcion textual de las palabras de los interlocutores, con el fin de que el usuario pueda leer sus expresiones. Sin embargo, este tipo de sistema es eficaz unicamente cuando el numero de interlocutores es pequeno y puede resultar inaprovechable cuando el aparato capta las voces de interlocutores que participan en varias conversaciones.

Algunas protesis disponen de microfonos direccionales o de un sistema de seleccion que permite amplificar preferentemente la voz de algunos interlocutores que participan en la conversacion que el usuario con problemas de audicion desea escuchar. Unos sistemas de este tipo presentan sin embargo el fallo de no permitir que una persona con problemas de audicion siga una primera conversacion y continue escuchando al mismo tiempo en un plano secundario el desarrollo de una segunda conversacion. Ademas, en los casos de microfonos direccionales, a una persona con problemas de audicion usuaria le resulta imposible seguir las expresiones simultaneas de personas situadas en direcciones opuestas que participan en la misma conversacion.

Existe por lo tanto una necesidad de un procedimiento de asistencia en el seguimiento de una conversacion que permita que un usuario con problemas de audicion siga eficazmente una primera conversacion entre varios interlocutores incluso si estos estan dispuestos en direcciones opuestas, sin ser molestado por el ruido ambiental, y continue conociendo al mismo tiempo el desarrollo de por lo menos una segunda conversacion que se desarrolla en segundo plano.

Presentacion de la invencion

La presente invencion se refiere asf segun un primer aspecto a un procedimiento de asistencia en el seguimiento de una conversacion segun la reivindicacion 1 con una pluralidad de interlocutores para una persona con problemas de audicion provista de un equipo informatico, estando dicho equipo informatico unido a por lo menos un modulo de emision de voz, a por lo menos un dispositivo de visualizacion y a por lo menos un modulo de conversion de senales de voz en senales de texto, comprendiendo dicho procedimiento las etapas siguientes:

- adquisicion de una pluralidad de senales de voz y de una pluralidad de senales de texto procedentes de una pluralidad de interlocutores, siendo dichas senales de texto obtenidas por conversion de dichas senales de voz por el modulo de conversion de senales;

- seleccion de por lo menos una primera senal de voz de entre la pluralidad de senales de voz adquiridas;

- seleccion de por lo menos una primera senal de texto de entre la pluralidad de senales de texto adquiridas, procediendo la senal de voz y la senal de texto seleccionadas de interlocutores diferentes;

- transmision al modulo de emision de voz de las primeras senales de voz seleccionadas para la emision de dichas primeras senales de voz;

- orden de visualizacion en el dispositivo de visualizacion de las primeras senales de texto seleccionadas.

La persona con problemas de audicion puede seguir asf eficazmente varias conversaciones, en particular una conversacion principal en forma de audio y/o unas conversaciones secundarias en forma de texto.

5

10

15

20

25

30

35

40

45

50

55

60

65

Segun un primer modo de realizacion, estando por lo menos uno de dichos interlocutores equipado con un equipo informatico de interlocutor que comprende por lo menos un microfono y dicho modulo de conversion de senales de voz en senales de texto, el procedimiento segun el primer aspecto comprende las etapas siguientes realizadas por dicho por lo menos un equipo informatico de interlocutor:

- captura de senales de voz del interlocutor con la ayuda del microfono de dicho equipo informatico de interlocutor,

- conversion de las senales de voz capturadas en senales de texto por el modulo de conversion de dicho equipo informatico de interlocutor,

- transmision a dicho equipo informatico de la persona con problemas de audicion de las senales de voz capturadas y de las senales de texto obtenidas por conversion.

Como el equipo informatico de la persona con problemas de audicion comprende un modulo de recepcion de senales y es susceptible de ser conectado a una red de comunicacion de voz y a una red de comunicacion de datos, dicha etapa de adquisicion de senales de interlocutores puede comprender entonces la recepcion de las senales de voz y de las senales de texto de la pluralidad de interlocutores por el modulo de recepcion de senales por medio de las redes de comunicaciones de voz y de datos.

De esta manera, si cada interlocutor dispone de su propio equipo informatico, las expresiones de cada interlocutor pueden ser capturadas localmente por su equipo, en forma de voz y de texto, y puestas a disposicion de los equipos de los demas interlocutores y de la persona con problemas de audicion que participa en la conversacion.

Segun un segundo modo de realizacion, como el equipo informatico de la persona con problemas de audicion comprende por lo menos un microfono y dicho modulo de conversion de senales de voz en senales de texto, dicha etapa de adquisicion de senales de interlocutores comprende las etapas siguientes:

- adquisicion de las senales de voz de la pluralidad de interlocutores con la ayuda del microfono de dicho equipo informatico de la persona con problemas de audicion,

- conversion de las senales de voz adquiridas en senales de texto por dicho modulo de conversion.

El equipo informatico puede ser asf perfectamente autonomo y adquirir las senales de voz y de texto del conjunto de los interlocutores sin que cualquier otra persona que no sea la persona con problemas de audicion necesite estar equipado. La persona con problemas de audicion puede asf seguir cualquier conversacion en cualquier entorno con cualquier interlocutor.

Segun una primera variante, como el equipo informatico de la persona con problemas de audicion esta unido a una base de datos de firmas vocales de interlocutores conocidos, las selecciones de las primeras senales de voz y de texto se realizan con la ayuda de un reconocimiento de las senales de voz de los interlocutores conocidos de entre las senales de voz adquiridas a partir de dicha base de datos.

El reconocimiento vocal permite que el equipo informatico distinga a los diferentes interlocutores de una conversacion y proponga a la persona con problemas de audicion las palabras de estos interlocutores en forma de senales de voz y de texto separadas para cada interlocutor. Aunque las senales de varios interlocutores puedan ser adquiridas al mismo tiempo por el mismo microfono, la persona con problemas de audicion puede elegir asf seguir las expresiones solamente de una parte de los interlocutores.

Segun una segunda variante, la etapa de seleccion de primeras senales de voz, respectivamente de primeras senales de texto, comprende:

- una etapa previa de preseleccion por parte del equipo informatico de la persona con problemas de audicion de senales de voz, respectivamente de senales de texto, de entre la pluralidad de senales de voz, respectivamente de senales de texto, adquiridas en funcion de la distancia entre el interlocutor emisor de dicha senal de voz, respectivamente senal de texto, y la persona con problemas de audicion,

- una etapa de seleccion de primeras senales de voz, respectivamente senales de texto, de entre la pluralidad de senales de voz, respectivamente senales de texto, preseleccionadas.

La seleccion de los interlocutores puede resultar asf mas sencilla para la persona con problemas de audicion preseleccionando los interlocutores en un intervalo de distancia particular, por ejemplo los mas cercanos a la persona con problemas de audicion.

Segun una tercera variante, como el equipo como el equipo informatico de la persona con problemas de audicion

5

10

15

20

25

30

35

40

45

50

55

60

65

esta unido a un dispositivo de deteccion de movimientos de la persona con problemas de audicion, la etapa de seleccion de primeras senales de voz, respectivamente de primeras senales de texto, comprende:

- una etapa previa de preseleccion por parte del equipo informatico de la persona con problemas de audicion de senales de voz, respectivamente de senales de texto, de entre la pluralidad de senales de voz, respectivamente de senales de texto, adquiridas en funcion de un movimiento de la persona con problemas de audicion detectado por el dispositivo de deteccion de movimientos,

La persona con problemas de audicion puede hacer evolucionar asf simplemente la preseleccion de los interlocutores gracias a unos movimientos sencillos, tal como unos movimientos de cabeza, sin tener que introducir una orden.

Segun una cuarta variante, como el equipo informatico de la persona con problemas de audicion esta unido a por lo menos una camara que captura una imagen de los interlocutores en el campo de vision de la persona con problemas de audicion y comprende un modulo de reconocimiento de imagen que permite identificar a dichos interlocutores en dicha imagen capturada por dicha camara, la etapa de seleccion de primeras senales de voz, respectivamente de senales de texto, comprende:

- una etapa previa de preseleccion por parte del equipo informatico de la persona con problemas de audicion de senales de voz, respectivamente de senales de texto, de interlocutores, denominados interlocutores preseleccionados, presentes en el campo de vision de la persona con problemas de audicion de entre la pluralidad de senales de voz, respectivamente de senales de texto, adquiridas,

- una etapa de identificacion, por parte del modulo de reconocimiento, de dichos interlocutores preseleccionados,

- una etapa de visualizacion en el dispositivo de visualizacion de la imagen de dichos interlocutores preseleccionados en el campo de vision de la persona con problemas de audicion, asociados a su identificacion,

- una etapa de seleccion por parte de la persona con problemas de audicion de primeras senales de voz, respectivamente de primeras senales de texto, de entre la pluralidad de senales de voz, respectivamente de senales de texto, de los interlocutores preseleccionados visualizados e identificados.

La persona con problemas de audicion puede asf conocer inmediatamente la identidad de los interlocutores seleccionables y realizar su seleccion en funcion de su interes por las expresiones de un interlocutor particular al que ya conoce.

Segun una quinta variante, el procedimiento segun el primer aspecto comprende:

- una etapa de recepcion de una orden vocal de la persona con problemas de audicion relativa a un interlocutor y a un tipo de senales a seleccionar;

- una etapa de seleccion de primeras senales de voz o de texto del interlocutor en funcion de dicha orden vocal, comprendiendo el equipo informatico de la persona con problemas de audicion un modulo de reconocimiento vocal configurado para analizar dicha orden vocal.

La persona con problemas de audicion puede ordenar asf la seleccion de interlocutores mediante una sencilla orden vocal, sin tener que manipular el equipo informatico o cualquier interfaz de introduccion de datos manual.

Segun una sexta variante, la seleccion de por lo menos una primera senal de voz y/o de una primera senal de texto se realiza en funcion de preferencias y/o usos de la persona con problemas de audicion.

Una seleccion se puede realizar asf automaticamente de manera que se seleccionen los interlocutores que la persona con problemas de audicion ha seleccionado con mas frecuencia en el pasado. Esto permite proponer automaticamente a la persona con problemas de audicion que siga las expresiones de los interlocutores que presentan a priori el mayor interes para ella.

Como el equipo informatico de la persona con problemas de audicion esta unido a por lo menos una camara que captura una imagen de por lo menos un interlocutor de la persona con problemas de audicion, tras la seleccion de primeras senales de voz, respectivamente de primeras senales de texto, de dicho interlocutor, dicho procedimiento puede comprender ademas una etapa de visualizacion de la imagen de dicho interlocutor situado fuera del campo de vision de la persona con problemas de audicion en una vineta insertada en la imagen visualizada en dicho dispositivo de visualizacion.

5

10

15

20

25

30

35

40

45

50

55

60

65

La persona con problemas de audicion puede tener asf permanentemente en su campo de vision una imagen de cada uno de los interlocutores de una conversacion en la que toma parte, incluso si estos interlocutores estan situados en direcciones opuestas. La comprension de las expresiones de estos interlocutores mejora asf gracias a la posibilidad de tener en cuenta las expresiones corporales, en particular faciales, de estos interlocutores.

Segun una septima variante, la etapa de seleccion de primeras senales de voz, respectivamente de primeras senales de texto, comprende la determinacion de un primer numero predeterminado, respectivamente de un segundo numero predeterminado, y la seleccion de dicho primer numero predeterminado de primeras senales de voz, respectivamente de dicho segundo numero predeterminado de primeras senales de texto, por orden de recepcion.

Esto permitira que una persona con problemas de audicion siga una conversacion entre numerosos interlocutores en la que el interlocutor que tiene la palabra cambia con mucha frecuencia, sin que la persona con problemas de audicion deba corregir manualmente en cada momento su seleccion de interlocutores.

Por otro lado, la etapa de emision de las primeras senales de voz seleccionadas puede comprender previamente una etapa de filtrado del ruido y/o de las senales de voz no seleccionadas.

La calidad de las senales de voz suministradas a la persona con problemas de audicion puede aumentar asf de manera que se mejore la comprension de la conversacion.

Como el equipo informatico de la persona con problemas de audicion comprende un modulo de reconocimiento vocal, la etapa de filtrado puede comprender una etapa de filtrado de las senales de voz seleccionadas con la ayuda del resultado de un reconocimiento vocal por parte del modulo de reconocimiento vocal.

Este tipo de filtrado permite tratar de manera diferente las senales de voz de interlocutores deseados y de interlocutores no deseados de manera que se mejore la comprension de las expresiones de los interlocutores deseados.

Segun un segundo aspecto, la invencion se refiere a un producto de programa de ordenador segun la reivindicacion 15 que comprende unas instrucciones de codigo para la realizacion de un procedimiento segun el primer aspecto cuando este programa es ejecutado por un procesador.

Segun un tercer aspecto, la invencion se refiere a un equipo informatico, segun la reivindicacion 16, para la asistencia en el seguimiento de una conversacion con una pluralidad de interlocutores, en posesion de una persona con problemas de audicion y unido a por lo menos un modulo de emision de voz, a por lo menos un dispositivo de visualizacion y a por lo menos un modulo de conversion de senales de voz en senales de texto, estando dicho equipo informatico configurado para:

- adquirir una pluralidad de senales de voz y una pluralidad de senales de texto procedentes de una pluralidad de interlocutores, siendo dichas senales de texto obtenidas por conversion de dichas senales de voz por el modulo de conversion de senales;

- seleccionar por lo menos una primera senal de voz de entre la pluralidad de senales de voz adquiridas;

- seleccionar por lo menos una primera senal de texto de entre la pluralidad de senales de texto adquiridas, procediendo la senal de voz y la senal de texto de interlocutores diferentes;

- transmitir al modulo de emision de voz unas primeras senales de voz seleccionadas para la emision de dichas primeras senales de voz;

- ordenar la visualizacion en el dispositivo de visualizacion de las primeras senales de texto seleccionadas.

Segun un cuarto aspecto, la invencion se refiere a unas gafas de realidad aumentada que comprenden un equipo informatico segun el tercer aspecto.

Dichos producto de programa de ordenador, equipo informatico, y gafas, presentan las mismas ventajas que las mencionadas para el procedimiento segun el primer aspecto.

Presentacion de las figuras

Otras caractensticas y ventajas apareceran con la lectura de la descripcion siguiente de un modo de realizacion. Esta descripcion se dara haciendo referencia a los dibujos adjuntos, en los que:

- la figura 1 ilustra un ejemplo de arquitectura para la realizacion del procedimiento segun un primer modo de realizacion;

5

10

15

20

25

30

35

40

45

50

55

60

65

- la figura 2 ilustra un ejemplo de arquitectura para la realizacion del procedimiento segun un segundo modo de realizacion;

- la figura 3 ilustra un ejemplo de arquitectura para la realizacion de una etapa de filtrado segun un modo de realizacion de la invencion.

Descripcion detallada

Con referencia a la figura 1, una forma de realizacion de la invencion se refiere a un procedimiento de asistencia en el seguimiento de una conversacion con una pluralidad de interlocutores 1 para una persona con problemas de audicion 2 provista de un equipo informatico 3.

Este procedimiento tiene por objetivo permitir que la persona con problemas de audicion seleccione de entre la pluralidad de interlocutores aquellos cuya voz quiere escuchar y aquellos cuyas palabras transcritas quiere leer en forma de texto, de manera que pueda seguir una primera conversacion en forma oral y una o varias conversaciones diferentes en forma de texto.

Para ello, este equipo informatico 3 es susceptible de estar unido a por lo menos un modulo de emision de voz 4, tal como un altavoz o un casco de audio, a por lo menos un dispositivo de visualizacion 5, a por lo menos un modulo de conversion de senales de voz en senales de texto 6, y a por lo menos un microfono 7. Se entendera por microfono un modulo de adquisicion de senales sonoras, cualquiera que sea la tecnologfa empleada para realizar este tipo de adquisicion. Un microfono de este tipo puede ser direccional para reducir la captacion de las voces de interlocutores no deseados o ruido, o bien bidireccional u omnidireccional con el fin de capturar el conjunto de un ambiente sonoro. El equipo informatico 3 puede comprender asimismo un modulo de tratamiento 8 tal como un microprocesador, y una interfaz de introduccion de datos 9 que permite que la persona con problemas de audicion 2 realice una seleccion o introduzca una orden. Segun un modo de realizacion, la interfaz de introduccion de datos esta incluida en el dispositivo de visualizacion 5 en forma de una pantalla tactil.

El equipo informatico 3 adquiere, en primer lugar, una pluralidad de senales de voz y una pluralidad de senales de texto procedentes de la pluralidad de interlocutores 1, siendo dichas senales de texto obtenidas por conversion de dichas senales de voz por el modulo de conversion de senales 6.

A continuacion, la persona con problemas de audicion 2 selecciona con la ayuda de su equipo informatico 3 por lo menos una primera senal de voz de entre la pluralidad de senales de voz adquiridas. La persona con problemas de audicion selecciona asf los interlocutores cuyas expresiones desea ofr en forma vocal con el fin de seguir su conversacion.

La persona con problemas de audicion 2 selecciona ademas con la ayuda de su equipo informatico 3 por lo menos una primera senal de texto de entre la pluralidad de senales de texto adquiridas. La persona con problemas de audicion selecciona asf los interlocutores de los cuales desea obtener una transcripcion de las palabras en forma de texto, con el fin de poder seguir sus conversaciones en segundo plano sin obstaculizar su comprension de la conversacion seguida en forma oral.

Por ultimo, el equipo informatico 3 transmite a dicho por lo menos un modulo de emision de voz 4 las primeras senales de voz seleccionadas para que estas sean emitidas, y ordena la visualizacion en el dispositivo de visualizacion 5 de las primeras senales de texto seleccionadas.

A continuacion de la adquisicion de las senales de voz y de texto de la pluralidad de interlocutores, estos pueden ser presentados a la persona con problemas de audicion 2, por ejemplo por medio de la pantalla de visualizacion, en forma de lista o de imagen, para permitir que haga sus selecciones de primeras senales de voz y de primeras senales de texto.

Segun un primer modo de realizacion representado en la figura 1, cada interlocutor, incluida la persona con problemas de audicion 2, dispone de su propio equipo informatico 3 dedicado a la captura y a la transcripcion de sus palabras. Cada equipo informatico 3 comprende entonces su modulo de conversion de senales de voz en senales de texto 6 y utiliza una etapa de captura de senales de voz de su usuario con la ayuda de por lo menos un microfono 7 del equipo informatico 3, una etapa de conversion de las senales de voz capturadas en senales de texto por el modulo de conversion 6, y una etapa de transmision a los demas equipos informaticos, incluyendo el equipo informatico de la persona con problemas de audicion, de las senales de voz capturadas y de las senales de texto obtenidas.

En este modo de realizacion, el equipo informatico 3 de la persona con problemas de audicion 2 comprende un modulo de recepcion de senales 10 y esta conectado a una red de comunicacion de voz y a una red de comunicacion de datos. La etapa de adquisicion de senales de interlocutores puede entonces comprender una etapa de recepcion de senales durante la cual el modulo de recepcion de senales 10 recibe las senales de voz y de texto de la pluralidad de interlocutores por medio respectivamente de la red de comunicacion de voz y de la

5

10

15

20

25

30

35

40

45

50

55

60

65

red de comunicacion de datos.

Las senales de voz de cada interlocutor son asf capturadas y transcritas en texto por su equipo informatico 3, y despues las senales de voz capturadas y las senales de texto correspondientes son transmitidas al equipo de la persona con problemas de audicion 2 por medio de las redes de voz y de datos. En el caso de que varias personas con problemas de audicion participen en una conversacion, cada una puede disponer de un equipo que realiza al mismo tiempo por un lado la captura, la transcripcion y la emision de sus expresiones, y por otra parte la recepcion de las senales que proceden de los otros equipos informaticos.

Las redes de comunicacion de voz y de datos pueden consistir en unas redes alambricas tales como unas redes Ethernet, o unas redes inalambricas tales como unas redes Wifi, Bluetooth 3G o 4G o tambien en una combinacion de las dos.

La persona con problemas de audicion 2 puede proponer a la seleccion las senales de voz y de texto adquiridas en funcion de un identificador del equipo que ha realizado la adquisicion de estas senales. Un identificador de este tipo puede ser arbitrario o corresponder a un parametro tal como una direccion IP. En el caso de una instalacion fija, que equipa por ejemplo una sala de reuniones o una mesa de comedor, la persona con problemas de audicion 2 puede seleccionar asf las senales de voz y de texto procedentes de un sitio particular en esta sala o en esta mesa, independientemente de la identidad de la persona que ocupa este sitio.

Segun un segundo modo de realizacion representado en la figura 2, el equipo informatico 3 de la persona con problemas de audicion 2 es autonomo y realiza el mismo la adquisicion y el tratamiento de las palabras de los interlocutores 1. El equipo informatico 3 de la persona con problemas de audicion 2 comprende entonces el modulo de conversion de senales de voz en senales de texto 6. La etapa de adquisicion de las senales de interlocutores comprende entonces una etapa de adquisicion de las senales de voz de la pluralidad de interlocutores con la ayuda del por lo menos un microfono 7 del equipo informatico de la persona con problemas de audicion 3, y una etapa de conversion de las senales de voz adquiridas en senales de texto por dicho modulo de conversion 6.

En este modo de realizacion, con el fin de distinguir las palabras de los diferentes interlocutores de entre el conjunto de los sonidos capturados por el o los microfonos 7, el equipo informatico 3 puede estar unido a una base de datos de firmas vocales de interlocutores conocidos y el equipo informatico de la persona con problemas de audicion 3 puede comprender un modulo de reconocimiento vocal 11. Las selecciones de las primeras senales de voz y de texto se pueden realizar entonces con la ayuda de un reconocimiento de las senales de voz de los interlocutores conocidos de entre las senales de voz adquiridas a partir de dicha base de datos, realizado por el modulo de reconocimiento vocal 11. Cada senal de voz capturada por el microfono 7 en un instante determinado puede ser comparada con las firmas de interlocutores conocidos almacenadas en la base de datos de firmas con el fin de presentar separadamente a la persona con problemas de audicion 2 las palabras de cada interlocutor 1 asf como su identidad, si esta estuviera memorizada en la base de datos de firmas.

Es posible combinar los dos modos de realizacion descritos anteriormente con el fin de que las senales de voz de cada interlocutor sean capturadas al mismo tiempo a nivel del interlocutor y a nivel de la persona con problemas de audicion. Las senales de voz capturadas de cada interlocutor, o las senales de texto correspondientes, pueden ser comparadas entonces con las senales de voz o de texto adquiridas a nivel de la persona con problemas de audicion y distinguidas unas de otras por reconocimiento vocal. Una comparacion de este tipo permite determinar si la voz de un interlocutor puede ser escuchada de manera inteligible a nivel de la persona con problemas de audicion. Se puede emplear este tipo de determinacion para detectar una toma de palabra por parte de un interlocutor remoto destinada a toda una asamblea, por ejemplo en el marco de una conferencia o de una asamblea. Cuando este interlocutor toma la palabra hablando con una voz fuerte, su voz resulta inteligible a nivel de la persona con problemas de audicion mientras que este interlocutor no formaba parte antes de los interlocutores cercanos a la persona con problemas de audicion y que su voz no llegaba hasta esta. En caso de deteccion de este tipo de toma de palabra, un mensaje puede ser visualizado por el equipo informatico en el dispositivo de visualizacion con el fin de prevenir a la persona con problemas de audicion y se puede visualizar una transcripcion de las palabras de este nuevo interlocutor.

Independientemente del modo de realizacion empleado de entre los modos descritos anteriormente, el equipo informatico 3 puede consistir en un dispositivo portatil tal como un telefono inteligente ("smartphone") o una tableta. Como alternativa, el equipo informatico 3 puede estar integrado en unas gafas en forma de gafas de visualizacion de realidad aumentada. En este caso, las informaciones suministradas a la persona con problemas de audicion 2 pueden ser visualizadas en los cristales de las gafas utilizados como dispositivo de visualizacion 5. La persona con problemas de audicion puede entonces ver al mismo tiempo las informaciones visualizadas y su entorno en transparencia. Segun otra variante, el equipo informatico 3 esta compartido entre unas gafas utilizadas para la visualizacion y que llevan algunos sensores, y un dispositivo portatil que comprende la unidad de tratamiento, la interfaz de introduccion de datos y el resto de los elementos del equipo informatico 3.

Segun un modo de realizacion alternativo, las senales de texto no se obtienen por conversion de las senales de voz sino por reconocimiento labial. Las senales de texto que corresponden a las palabras de un interlocutor se

5

10

15

20

25

30

35

40

45

50

55

60

65

pueden obtener entonces mediante el modulo de conversion de senales a partir de una senal de v^deo de la cara del interlocutor capturada por lo menos por una camara de v^deo unida a dicho modulo de conversion. Este tipo de conversion permite que la determinacion de las senales de texto sea independiente de las perturbaciones acusticas que pueden afectar a la senal de voz correspondiente.

Cuando la cantidad de senales de texto a visualizar en el dispositivo de visualizacion es importante, el equipo informatico puede sustituir la totalidad o parte del texto a visualizar por un resumen de este. El texto puede ser resumido mediante unas frases sencillas o incluso mediante palabras aisladas que expresen conceptos. Este tipo de modificacion del texto puede ser iniciada manualmente por el usuario del equipo informatico, para uno o varios de sus interlocutores, o bien de manera automatica cuando la cantidad de texto a visualizar sobrepasa un umbral determinado. La visualizacion de un texto resumido puede permitir disminuir el cansancio de la persona con problemas de audicion en conversaciones rapidas o con numerosos interlocutores durante las cuales puede resultar diffcil leer la totalidad de las expresiones durante largo tiempo.

Segun un modo de realizacion, el equipo informatico de la persona con problemas de audicion 3 pude comprender un modulo de reconocimiento vocal 11. Se puede realizar entonces una etapa de recepcion de una orden vocal de la persona con problemas de audicion 2 relativa a un interlocutor y a un tipo de senales a seleccionar y una etapa de seleccion de primeras senales de voz o de texto del interlocutor en funcion de dicha orden vocal, estando entonces el modulo de reconocimiento vocal 11 configurado para analizar dicha orden vocal. La persona con problemas de audicion puede interactuar asf vocalmente con el equipo informatico 3 para ordenar la seleccion de senales de voz o de texto relativas a un interlocutor particular. El reconocimiento por parte del equipo informatico 3 de una orden vocal emitida por la persona con problemas de audicion puede ser efectiva unicamente si la persona con problemas de audicion ha efectuado previamente una accion particular, como realizar un movimiento particular o presionar un boton de interfaz, o mientras la persona con problemas de audicion efectua una accion de este tipo.

Como alternativa, la persona con problemas de audicion puede interactuar con el equipo informatico 3 mediante el pensamiento. El equipo informatico puede estar unido por ejemplo a un casco neuronal colocado en el craneo de la persona con problemas de audicion y configurado para realizar un electroencefalograma de esta. El usuario puede asf someter al equipo informatico unas ordenes mediante el pensamiento, por ejemplo unas ordenes sencillas tales como la seleccion de un interlocutor particular. La persona con problemas de audicion puede asf interactuar con su equipo informatico sin utilizar las manos y sin molestar a las personas de su entorno como podna hacerlo una orden vocal.

Con el fin de facilitar la seleccion de las senales de voz y de texto de interes para la persona con problemas de audicion 2 de entre el conjunto de las senales de voz y de texto adquiridas, se puede realizar una etapa de preseleccion durante la cual se seleccionan una o varias senales de voz o de texto de interlocutores automaticamente o en funcion de acciones de la persona con problemas de audicion. Si esta preseleccion le conviene, la persona con problemas de audicion puede ordenar a continuacion simplemente la seleccion de las senales de voz y/o de texto de los interlocutores preseleccionados con una simple orden, por ejemplo una orden vocal tal como se ha descrito anteriormente o por medio de la interfaz de introduccion de datos del equipo informatico 3. En los parrafos siguientes un interlocutor, respectivamente un equipo remoto, cuyas senales de voz o de texto estan preseleccionadas, se denominara interlocutor, respectivamente equipo, preseleccionado. La preseleccion de uno o varios interlocutores o equipos puede ser comunicada a la persona con problemas de audicion 2 por medio del dispositivo de visualizacion 5. Por ejemplo, en el caso de una visualizacion en forma de lista se pueden poner en alta intensidad unos elementos de la lista, en el caso de una visualizacion en forma de mapa los interlocutores preseleccionados pueden estar representados por un icono particular, en el caso de una visualizacion de realidad aumentada los interlocutores preseleccionados pueden estar rodeados por un contorno.

Unas senales de voz, respectivamente de texto, se pueden preseleccionar de entre la pluralidad de senales de voz, respectivamente de senales de texto, adquiridas en funcion de la distancia entre el interlocutor emisor de dicha senal de voz, respectivamente senal de texto, y la persona con problemas de audicion. Unas primeras senales de voz, respectivamente de texto, pueden ser seleccionadas a continuacion de entre la pluralidad de senales de voz, respectivamente senales de texto, preseleccionadas. La persona con problemas de audicion puede asf proponer para la seleccion de senales de voz o de texto los interlocutores mas proximos o bien, en un segundo tiempo por ejemplo, los interlocutores situados en un intervalo de distancia predeterminado. Con el fin de proponer este tipo de preseleccion en funcion de la distancia, el equipo informatico 3 debe tener conocimiento de la distancia que separa cada interlocutor o equipo remoto de la persona con problemas de audicion. Para ello, la posicion de cada interlocutor o equipo remoto puede ser determinada con respecto a la persona con problemas de audicion por geolocalizacion.

Se puede realizar este tipo de geolocalizacion de manera absoluta con la ayuda de dispositivos de geolocalizacion externos tales como unos receptores GPS. Una geolocalizacion de este tipo se puede realizar asimismo con la ayuda de una instalacion local. Por ejemplo, diferentes equipos pueden ser posicionados por triangulacion con respecto a los puntos de acceso de una red local inalambrica a la que estan conectados, tal como una red Wifi. La geolocalizacion de un equipo tambien se puede realizar de manera relativa con respecto a otros objetos cuya posicion absoluta es conocida. La posicion de estos objetos se puede registrar por ejemplo en

5

10

15

20

25

30

35

40

45

50

55

60

65

una base de datos de coordenadas de objetos y el equipo a geolocalizar puede determinar su posicion con respecto a estos objetos con la ayuda de un detector de tipo radar. Estos objetos pueden ser unos objetos conectados que declinan su identidad por medio de una red inalambrica. Segun otra variante, cada elemento a geolocalizar esta equipado con un dispositivo de deteccion de movimiento que puede comprender por ejemplo un acelerometro de tres ejes y/o un girometro de tres ejes y/o un giroscopio. Cuando tiene lugar una inicializacion, se puede registrar la posicion de cada elemento a geolocalizar con respecto a un punto de referencia. La evolucion de cada elemento con respecto a este punto de referencia puede ser seguida a continuacion gracias a la deteccion de los movimientos de estos elementos por su dispositivo de deteccion de movimiento. La geolocalizacion a partir de una base de coordenadas de objetos o con la ayuda de un dispositivo de deteccion de movimiento puede permitir obtener una precision de localizacion mas importante que la obtenida por una localizacion GPS o Wifi. Esta precision puede mejorar la eficacia de los tratamientos utilizados en funcion de esta localizacion.

Esta geolocalizacion se puede emplear asimismo con el fin de visualizar automaticamente en el dispositivo de visualizacion 5 las senales de texto correspondientes a los interlocutores mas cercanos a la persona con problemas de audicion. Este tipo de visualizacion automatica se puede utilizar por ejemplo mientras la persona con problemas de audicion no haya seleccionado ninguna senal de texto. Al llegar a una estancia en la que se desarrolla una conversacion puede tener asf una vision general de las palabras de los interlocutores en su entorno cercano sin tener que realizar una seleccion. Esta visualizacion se actualiza de manera dinamica y permite asf que la persona con problemas de audicion conozca las expresiones de personas en movimiento que se encuentran en su entorno cercano unicamente durante un breve periodo.

Se pueden preseleccionar senales de voz, respectivamente de texto, de entre la pluralidad de senales de voz, respectivamente de senales de texto, adquiridas en funcion de un movimiento de la persona con problemas de audicion. Se pueden seleccionar a continuacion unas primeras senales de voz, respectivamente senales de texto de entre la pluralidad de senales de voz, respectivamente senales de texto, preseleccionadas. Para ello, el equipo informatico 3 de la persona con problemas de audicion puede estar unido a un dispositivo de deteccion de movimientos de la persona con problemas de audicion, tal como el dispositivo de deteccion de movimiento descrito anteriormente. A tftulo de ejemplo, dicho dispositivo puede detectar los movimientos de la cabeza o de cualquier otra parte del cuerpo de la persona con problemas de audicion.

Se pueden combinar los dos modos de preseleccion descritos anteriormente. Por ejemplo, los movimientos verticales de la cabeza pueden ser detectados para seleccionar un intervalo de distancia con respecto a la persona con problemas de audicion, en funcion del angulo de la cabeza de la persona con problemas de audicion con respecto a la horizontal. Los interlocutores situados en este intervalo de distancia pueden ser identificados en el dispositivo de visualizacion 5, por ejemplo visualizando un plano de la zona situada en el intervalo de distancia seleccionado que indica la posicion de los interlocutores. Los movimientos horizontales de la cabeza pueden ser detectados asimismo con el fin de preseleccionar el interlocutor situado enfrente de la persona con problemas de audicion en el intervalo de distancia seleccionado. La persona con problemas de audicion puede modificar el interlocutor preseleccionado girando la cabeza hacia un lado o inclinandola hacia arriba o abajo. El usuario puede asf preseleccionar facilmente un interlocutor, incluso lejano, sin tener que introducir ninguna orden, sin necesitar incluso ver al interlocutor preseleccionado.

Con el fin de facilitar la seleccion de interlocutores, el equipo informatico 3 puede proceder por otra parte a una identificacion de los interlocutores presentes cerca del usuario. Para ello, el equipo informatico de la persona con problemas de audicion 3 puede estar unido a por lo menos una camara de video que captura una imagen de los interlocutores en el campo de vision de la persona con problemas de audicion 2 y puede comprender un modulo de reconocimiento de imagen que permite identificar a dichos interlocutores en dicha imagen capturada por dicha camara. La seleccion de primeras senales de voz, respectivamente de primeras senales de texto, puede comprender entonces una etapa previa de preseleccion por parte del equipo informatico 3 de senales de voz, respectivamente de senales de texto, de interlocutores, denominados interlocutores preseleccionados, presentes en el campo de vision de la persona con problemas de audicion de entre la pluralidad de senales de voz, respectivamente senales de texto, adquiridas, una etapa de identificacion, por parte del modulo de reconocimiento, de dichos interlocutores preseleccionados, una etapa de visualizacion en el dispositivo de visualizacion 5 de la imagen de dichos interlocutores preseleccionados en el campo de vision de la persona con problemas de audicion, asociados a su identificacion, y una etapa de seleccion por parte de la persona con problemas de audicion de primeras senales de voz, respectivamente de primeras senales de texto, de entre la pluralidad de senales de voz, respectivamente de senales de texto, de los interlocutores preseleccionados visualizados e identificados.

Para ello, el equipo informatico 3 puede estar unido a una base de datos de huellas faciales que almacena unos retratos de interlocutores conocidos asociados a su identidad. El equipo informatico 3 puede utilizar las imagenes procedentes de su o sus camaras de video para intentar reconocer interlocutores registrados en la base de datos de huellas faciales aplicando un algoritmo de reconocimiento de imagen. Cuando cada interlocutor de la persona con problemas de audicion 2 dispone de su propio equipo informatico 3 remoto, el equipo informatico 3 puede utilizar asimismo los datos de la base de datos de firmas vocales para intentar identificar al interlocutor usuario de cada equipo remoto mediante un algoritmo de reconocimiento vocal. La identidad de cada interlocutor

5

10

15

20

25

30

35

40

45

50

55

60

65

identificado puede ser visualizada a continuacion en el dispositivo de visualizacion 5 para ayudar a la persona con problemas de audicion a realizar su seleccion.

Segun una variante, se captura una imagen de cada interlocutor presente cerca del usuario y se visualiza en el dispositivo de visualizacion del equipo informatico del usuario, ya esten estos interlocutores presentes o no en el campo de vision del usuario. Se puede visualizar una pluralidad de vinetas, correspondientes cada una a una imagen de la cara de un interlocutor, conjuntamente en forma de mosaico. En el caso de que cada interlocutor este equipado con su propio equipo informatico, tal como un telefono movil, dichas imagenes pueden ser capturadas por ejemplo por los captadores de fotograffas instalados en estos equipos y enviadas por estos equipos al equipo informatico del usuario.

El equipo informatico de la persona con problemas de audicion 3 puede estar unido a una base de datos de conversacion que almacena unos datos relativos a conversaciones anteriores seguidas por la persona con problemas de audicion de manera vocal o textual. Este tipo de base de datos puede memorizar por ejemplo para estas conversaciones la identidad de los interlocutores identificados, las elecciones de seleccion realizadas por la persona con problemas de audicion, datos de localizacion de la conversacion, etc. A partir de estos datos, en una situacion determinada en la que la persona con problemas de audicion esta rodeada de diversos interlocutores, el equipo informatico 3 puede preseleccionar automaticamente los interlocutores seleccionados con mas frecuencia en el pasado por la persona con problemas de audicion. El equipo informatico 3 puede iniciar asimismo automaticamente la reproduccion vocal, respectivamente la visualizacion en modo texto, palabras de los interlocutores presentes cuyas senales de voz, respectivamente de texto, han sido seleccionadas con mas frecuencia en el pasado por la persona con problemas de audicion. Esto permite proponer automaticamente a la persona con problemas de audicion los interlocutores mas interesantes para ella, incluso si estos no son los mas cercanos. La seleccion de por lo menos una primera senal de voz y/o de una primera senal de texto se realiza asf en funcion de preferencias y/o usos de la persona con problemas de audicion. La actualizacion al final de cada conversacion de la base de datos de conversacion permite que el equipo informatico 3 reaccione de manera personalizada mediante un aprendizaje basado en un analisis del comportamiento de la persona con problemas de audicion.

En ciertas situaciones, la persona con problemas de audicion puede estar implicada en una conversacion con varios interlocutores que no pueden encontrarse todos simultaneamente en su campo de vision. Es el caso por ejemplo de la persona con problemas de audicion que esta conversando en la mesa con unos interlocutores situados a su derecha o su izquierda. Como las personas con problemas de audicion compensan a menudo sus problemas de audicion mediante informaciones visuales, tales como las expresiones faciales, es primordial para una persona con problemas de audicion poder ver a sus interlocutores. El equipo informatico 3 puede estar unido a por lo menos una camara que captura una imagen de uno o varios interlocutores de la persona con problemas de audicion. Tras la seleccion de primeras senales de voz, respectivamente de primeras senales de texto, de este o estos interlocutores, el equipo informatico 3 puede visualizar una imagen de aquellos interlocutores filmados por lo menos por una camara y situados fuera del campo de vision de la persona con problemas de audicion en una vineta insertada en la imagen visualizada en dicho dispositivo de visualizacion 5. La persona con problemas de audicion puede percibir asf las informaciones visuales que proceden de estos interlocutores incluso si no se encuentran en su campo de vision. Con el fin de visualizar unicamente la imagen de la cara de estos interlocutores, el equipo informatico 3 puede comprender un sistema de reconocimiento de imagen o de tratamiento de imagen aislando la cara de los interlocutores en las imagenes capturadas por la por lo menos una camara. Este tipo de visualizacion puede ser actualizado de manera dinamica con el fin de detectar a los interlocutores que se incorporan o que salen del campo de vision de la persona con problemas de audicion en funcion de los movimientos de estos y de esta. Las imagenes de los interlocutores visualizadas en el dispositivo de visualizacion 5 pueden ser actualizadas en funcion de esta deteccion para que la persona con problemas de audicion pueda visualizar permanentemente una imagen del conjunto de estos interlocutores.

Algunas conversaciones pueden hacer intervenir un gran numero de locutores, que se expresan en un tiempo corto, a unas distancias variables de la persona con problemas de audicion 2. La seleccion manual en cada momento por la persona con problemas de audicion de los interlocutores a seguir puede resultar entonces fastidiosa. La seleccion de los interlocutores se puede realizar entonces no en base a sus caractensticas individuales (identidad, posicion, distancia, etc.), sino en funcion del orden de recepcion de las senales de voz y de texto. El equipo informatico 3 puede estar configurado por ejemplo para seleccionar automaticamente en cada momento un numero predeterminado de interlocutores mas recientes de entre el conjunto de los interlocutores. De esta manera, la etapa de seleccion de primeras senales de voz, respectivamente de primeras senales de texto, puede comprender la determinacion de un primer numero predeterminado, respectivamente de un segundo numero predeterminado, y la seleccion de dicho primer numero predeterminado de primeras senales de voz, respectivamente de dicho segundo numero predeterminado de primeras senales de texto, por orden de recepcion. En el caso de la seleccion de las senales de texto, la persona con problemas de audicion puede asf leer en cada momento las expresiones de los N ultimos interlocutores que han tomado la palabra, siendo N el segundo numero descrito anteriormente.

Las dos ultimas funciones descritas anteriormente pueden ser combinadas de manera que se visualice en el dispositivo de visualizacion 5 la cara de los interlocutores situados fuera del campo de vision de la persona con

5

10

15

20

25

30

35

40

45

50

55

60

65

problemas de audicion y seleccionados de entre los interlocutores que han tornado la palabra recientemente.

El equipo informatico 3 puede estar provisto de una funcion de grabacion de las conversaciones y puede proponer a la persona con problemas de audicion una visualizacion del historial de las conversaciones grabadas. La persona con problemas de audicion puede interactuar con el equipo informatico 3 para recorrer estos datos del historial con la ayuda de botones de interfaz o por medio de una pantalla tactil. En el caso de una visualizacion 3D o en realidad aumentada, las senales de voz y de texto adquiridas pueden estar escalonadas en el eje de la profundidad de la visualizacion en funcion de su fecha de adquisicion. En el caso de un numero importante de interlocutores, esta visualizacion, que combina una visualizacion segun la profundidad para visualizar el historial de las expresiones y una visualizacion con diferentes angulos de visualizacion para diferenciar a los interlocutores, asegura una mejor visibilidad de las conversaciones reproducidas.

La emision de las senales de voz seleccionadas por la persona con problemas de audicion puede estar precedida de un tratamiento o de un filtrado con el fin de suprimir los ruidos o las senales de voz no seleccionadas por la persona con problemas de audicion.

Este filtrado se puede realizar con la ayuda del resultado de un reconocimiento vocal mediante un modulo de reconocimiento vocal 11 unido al equipo informatico 3 o comprendido en este. El reconocimiento vocal permite disociar a partir de una senal de audio capturada las senales de voz correspondientes a diversos interlocutores. Las expresiones de un interlocutor deseado pueden ser extrafdas asf a partir del resultado del reconocimiento vocal. Estas expresiones se pueden utilizar a continuacion para sintetizar una senal de voz reconstituida por smtesis vocal. Esta smtesis se puede realizar con la ayuda de una firma vocal del locutor previamente grabada con el fin de reproducir una senal de voz del interlocutor mas cercano. Esta senal de voz reconstituida puede ser sustrafda de la senal de audio capturada con el fin de deducir de la misma la componente de la senal correspondiente a los otros interlocutores y al ruido. Una senal de voz filtrada puede ser reconstituida por el interlocutor, por ejemplo atenuando, de manera mas o menos fuerte, en la senal capturada la componente de la senal capturada correspondiente a los otros interlocutores y al ruido, o tambien mezclando esta componente con la senal obtenida por smtesis vocal. Esto permite realizar una correccion fina de la senal, independientemente de la acustica, pudiendo conservar al mismo tiempo a voluntad una parte del ambiente sonoro del entorno.

Se puede realizar asimismo un filtrado para limitar en una senal de audio las contribuciones debidas a un interlocutor no deseado lejano. Como se ha representado en la figura 3, el equipo informatico 3 puede estar unido a dos microfonos Ml y M2, respectivamente cercanos a un interlocutor deseado I1 y a un interlocutor no deseado I2. La senal de voz correspondiente al interlocutor no deseado I2 capturada por el microfono M1 puede ser estimada por correlacion con la senal de voz correspondiente al interlocutor no deseado I2 capturada por el microfono M2. Como alternativa, al conocer la distancia D que separa los microfonos M1 y M2, el equipo informatico 3 puede determinar en una fase de calibrado la funcion de transformacion que une la senal de voz del interlocutor no deseado I2 adquirida por el microfono M1 y la senal de voz de este interlocutor adquirida por el microfono M2. La distancia D puede ser determinada por geolocalizacion. La funcion de transformacion puede ser determinada de manera separada para diferentes frecuencias. Esta fase de calibrado se puede realizar cuando el interlocutor I2 es el unico que habla o cuando varias personas hablan al mismo tiempo pero de manera constante. Cuando tiene lugar una adquisicion posterior de la senal de voz del locutor deseado I1 a nivel del microfono M1, la senal adquirida puede ser corregida sustrayendo la contribucion de los interlocutores no deseados tales como el interlocutor I2. A la senal capturada por el microfono M1 en un instante t se le puede sustraer la senal de voz del interlocutor no deseado I2 capturada en un instante (t - At) por el microfono M2 multiplicada por su funcion de transformacion, correspondiendo At al tiempo de propagacion del sonido del microfono M1 al microfono M2. Esta funcion de transformacion permite tener en cuenta la atenuacion y el desfase de la voz del interlocutor I2 durante su propagacion entre M2 y M1, asf como las diferencias de ganancia entre el microfono M1 y el microfono M2.

Este filtrado se puede mejorar asociando a cada interlocutor un microfono direccional y un microfono de otro tipo tal como un microfono omnidireccional o bidireccional. El microfono direccional puede ser utilizado para determinar los rangos de frecuencia cubiertos por la voz de cada interlocutor. Las funciones de transformacion de cada interlocutor pueden ser definidas frecuencia por frecuencia en funcion de los rangos de frecuencias cubiertos. La contribucion de un interlocutor a las senales de voz de los otros interlocutores puede asf ser suprimida en cada rango de frecuencia que solo el cubre. Esto permite una mejor robustez del calibrado asf como una mejor tolerancia al ruido ambiental.

La fase de calibrado se puede realizar cuando varios interlocutores estan hablando utilizando en las senales capturadas una etapa de reconocimiento vocal tal como la descrita anteriormente. El calibrado converge asf sobre la marcha, a medida que se tienen en cuenta a los diferentes interlocutores. La funcion de transformacion que une la senal de voz del interlocutor no deseado I2 adquirida por el microfono M2 y la senal de voz de este interlocutor adquirida por el microfono M1 puede ser determinada entonces comparando las senales de voz que corresponden al locutor no deseado I2 capturadas por el microfono M1 y por el microfono M2.

Se pueden realizar asimismo unos tratamientos con el fin de filtrar en las senales de audio capturadas los sonidos indirectos procedentes de una o varias reflexiones, por ejemplo en las paredes de una estancia.

5

10

15

20

25

30

35

40

45

50

55

60

65

Una senal de audio capturada por un microfono puede ser analizada con el fin de diferenciar la componente de la senal procedente de la propagacion directa del sonido entre el interlocutor y el microfono y las otras componentes procedentes de reflexiones del sonido. Dicho analisis puede ser realizado de manera separada para diferentes frecuencias.

Este analisis puede buscar una subida brutal de amplitud seguida por un penodo con una senal de amplitud constante. La llegada de los ecos sucesivos de la senal directa produce a continuacion unas variaciones sucesivas de la amplitud de la senal capturada, por etapas, que produce una senal cuya primera etapa corresponde a la senal directa a aislar.

Las caractensticas de los ecos generados en un lugar pueden ser determinadas previamente en una fase de calibrado, con el fin de sustraer estos ecos de una senal de voz capturada posteriormente. En esta fase de calibrado, el ambiente sonoro habitual de este lugar puede ser utilizado para esta determinacion. Como alternativa, se puede emplear por lo menos un generador de sonido con el fin de generar unos sonidos utilizados espedficamente para el calibrado. Las senales utilizadas para el calibrado, por ejemplo las senales generadas por un generador de sonidos, pueden ser de diferentes tipos, por ejemplo rectangulares o por impulsos, o tambien una sucesion de variaciones transitorias y de rangos de senal de amplitud constante. En el caso de una senal por impulsos, los ecos del lugar corresponden a la respuesta impulsional capturada como respuesta a la emision de una senal por impulsos.

Otro analisis puede consistir en buscar los extremos de la derivada de una senal de voz capturada. Estos extremos pueden corresponder a unos aumentos brutales de la amplitud de la senal, cuando llega un eco. En la deteccion de un extremo, la variacion de la senal puede ser comparada con la senal en propagacion directa medida anteriormente. El analisis de este eco puede dar asimismo informaciones sobre las caractensticas de eco de la sala tales como el tiempo de retardo y la funcion de transformacion de la senal debida al eco.

Si un eco esta bien detectado y es analizado, podra ser anulado en una conversacion posterior. Otro analisis puede ser realizado con la ayuda de por lo menos dos microfonos direccionales alejados entre sf en una distancia L y posicionados en fila frente a un interlocutor. La senal capturada por el microfono mas alejado puede ser sustrafda de la senal capturada por el microfono mas cercano de manera que se minimicen los sonidos indirectos procedentes de interlocutores no deseados. Esta correccion se puede realizar separadamente para cada frecuencia. Se puede realizar un tratamiento de manera que se corrija la diferencia de fase entre las dos senales capturadas por los dos microfonos.

Las senales de voz correspondientes a unos interlocutores no deseados capturadas por un microfono de un equipo informatico pueden ser determinadas a partir de las senales de voz de estos interlocutores capturadas por lo microfonos de los equipos informaticos de estos interlocutores mediante un calculo de simulacion acustica que estima la propagacion, la atenuacion, las reflexiones, etc., de estas senales en una estancia. Con el fin de realizar dicho calculo, el equipo informatico puede estar unido a una base de datos que almacena informaciones referentes a las caractensticas acusticas de esta estancia, tales como su geometna o los coeficientes de reflexion o de absorcion de los materiales que componen sus diferentes muros. Dichos coeficientes pueden ser proporcionados en funcion de la frecuencia. Esta base de datos puede comprender asimismo informaciones referentes a los principales objetos o locutores presentes en la estancia, tales como su posicion y su geometna. Las senales de voz parasitas generadas por las palabras de los usuarios no deseados a nivel del microfono del equipo informatico pueden ser determinadas asf por calculo y sustracciones de la senal de audio capturada por el equipo informatico. Esta simulacion puede aprovechar asimismo informaciones obtenidas a partir de pruebas de audio y/o acusticas que se pueden realizar en una sala o interlocutores dedicados. De esta manera se pueden tomar unas mediciones en una sala vada con el fin de determinar las caractensticas acusticas de la sala. Tambien se pueden realizar unas mediciones relativas a un interlocutor dedicado en una sala dedicada para determinar las caractensticas sonoras de la senal de voz de este interlocutor en dicha sala dedicada tales como la reflexion de la senal de voz del interlocutor en esta sala, o tambien las alteraciones de sonidos en la estancia, tales como reflexiones o atenuaciones, debidas a la presencia de este interlocutor en la estancia. Estas caractensticas sonoras seran espedficas del interlocutor ya que dependen de la geometna del interlocutor. Estas caractensticas pueden ser anadidas a continuacion al modulo de calculo de simulacion acustica con el fin de afinar mas el tratamiento del ruido.

Los sonidos no deseados pueden ser anulados en la fuente por interferencia destructiva siendo capturados y reemitidos en oposicion de fase. Esta anulacion puede ser realizada por la persona con problemas de audicion utilizando unos altavoces de manera que se anulen las voces de los interlocutores no deseados a nivel del microfono unido al equipo informatico 3 de la persona con problemas de audicion. A tttulo de ejemplo, en el caso de una sala muy ruidosa o con mucha reverberacion, la activacion de dicha anulacion de sonidos para todos los interlocutores permitina restringir la transmision del sonido de cualquier interlocutor hacia los microfonos de los otros interlocutores. Cada microfono captana entonces unicamente la voz del interlocutor que lleve el microfono y cada interlocutor equipado con un equipo informatico escuchana entonces unicamente las senales de voz de los interlocutores seleccionados.

5

10

15

20

25

30

35

40

45

50

55

60

65

El equipo informatico 3 puede estar unido a un primer microfono que capta la totalidad del entorno sonoro, es decir el ruido ambiental complejo (las senales sonoras de los multi-locutores, los ecos, etc.) y la senal util, y a un segundo microfono que capta unicamente el ruido ambiental complejo. Para que el segundo microfono capte unicamente el ruido ambiental complejo sin la senal util, se realiza un montaje particular. Un tercer microfono direccional que capta unicamente la senal de voz del locutor esta unido a un modulo de supresion activa de esta senal de voz que reemite una senal en oposicion de fase a esta senal de voz de manera que la senal util, es decir la senal de voz del locutor, se anule a nivel del segundo microfono. El segundo microfono capta entonces unicamente el ruido ambiental complejo. La senal util del locutor puede entonces ser obtenida sustrayendo de la senal relativa a la totalidad del entorno sonoro captado por el primer microfono, la senal relativa al ruido ambiental complejo captada por el segundo microfono. Los primer y segundo microfonos pueden ser unos microfonos omnidireccionales de manera que se obtenga una mejor calidad de toma de este sonido. Dichos microfonos son efectivamente menos sensibles a las perturbaciones que un microfono direccional aprovechando al mismo tiempo la poca sensibilidad al ruido de un microfono direccional. Este modo de realizacion es independiente del tipo de ruido y permite asf el tratamiento de ruidos complejos aprovechando al mismo tiempo una mejor calidad de toma de sonido que con un microfono direccionar. Como variante, el modulo de supresion activa puede ser omitido y la senal de voz del locutor captada por el tercer microfono direccional puede ser sustrafda de la senal captada por el segundo microfono con el fin de determinar el ruido ambiental complejo.

Los ruidos emitidos de manera recurrente en el entorno de la persona con problemas de audicion pueden ser detectados en unas grabaciones con el fin de suprimirlos. Para ello, los sonidos no reconocidos por reconocimiento vocal por el equipo informatico 3 pueden ser analizados con el fin de determinar si se han emitido de manera repetida unos sonidos cercanos. Se puede realizar un calculo de autocorrelacion de la senal para determinar una emision repetida de sonidos cercanos. Si es el caso, la senal grabada puede ser filtrada con el fin de hacerlos desaparecer, por ejemplo filtrando las frecuencias a las que se ha emitido este sonido.

Unos ruidos caractensticos, por ejemplo de una sala, pueden ser grabados asimismo en una base de datos de ruidos. Un sonido de una senal capturada no reconocido por reconocimiento vocal pero identificado como un ruido en la base de datos de ruido puede ser filtrado con el fin de corregir la senal capturada.

Se puede realizar asimismo un tratamiento con el fin de filtrar las resonancias que aparecen cuando un sonido es emitido a una frecuencia de resonancia de una sala. Las frecuencias de resonancia de las salas frecuentadas por la persona con problemas de audicion pueden ser grabadas en una base de datos de resonancia. Cuando el equipo informatico 3 detecta por geolocalizacion que la persona con problemas de audicion se encuentra en una estancia en la que las frecuencias de resonancia estan registradas en la base de datos de resonancia, estas frecuencias pueden ser filtradas con el fin de suprimir las resonancias de las senales de voz adquiridas.

Cuando unos equipos presentes cerca de la persona con problemas de audicion pueden emitir unos ruidos molestos, se pueden posicionar unos microfonos cerca de estos equipos de manera que detecten la emision de tales ruidos. Cuando se detecta un ruido de este tipo, las frecuencias en las que este ruido es emitido pueden ser filtradas por el equipo informatico 3 de manera que se suprima este ruido de las senales de voz adquiridas. Este tipo de sistema dedicado permite tratar los ruidos emitidos por un equipo conocido de manera irregular. Segun una variante, dichos equipos pueden estar equipados con altavoces destinados a emitir un sonido en oposicion de fase a estos ruidos, permanentemente o en el momento de la deteccion de la emision de un ruido de este tipo.

Los sonidos reemitidos por los altavoces unidos al equipo informatico 3 pueden ser emitidos de manera que recreen para la persona con problemas de audicion una impresion de espacializacion. Para ello, la amplitud de los sonidos reemitidos con destino a la oreja izquierda de la persona con problemas de audicion puede ser diferente de la amplitud de los sonidos reemitidos con destino a la oreja derecha. La diferencia de amplitud puede ser determinada en funcion del angulo entre la direccion situada frente a la persona con problemas de audicion y la recta que va de la persona con problemas de audicion hacia el micro que ha capturado los sonidos reemitidos. Los sonidos capturados por unos microfonos situados a la izquierda de la persona con problemas de audicion pueden ser asf reemitidos con una mayor amplitud con destino a la oreja izquierda que a la oreja derecha de manera que den a la persona con problemas de audicion la impresion de que el sonido reemitido procede del emplazamiento del microfono que ha capturado el sonido. Una espacializacion de este tipo se puede realizar independientemente para diferentes frecuencias. Dicha espacializacion puede ser adaptada de forma dinamica de manera que siga los movimientos de la cabeza de la persona con problemas de audicion.

De la misma manera, la fase de las senales reemitidas puede ser modulada de manera que reproduzca las diferencias de fase entre las senales que llegan a las dos orejas de la persona con problemas de audicion. Para ello, por lo menos dos microfonos pueden estar colocados en fila con respecto a un interlocutor de manera que determinen la diferencia de fase correspondiente a la diferencia de recorrido de un sonido entre la oreja derecha y la oreja izquierda de la persona con problemas de audicion.

En el caso de la utilizacion de un casco para reproducir los sonidos, este puede estar equipado con un sistema de supresion activa de ruido por oposicion de fase con el fin de reducir la amplitud de los ruidos que pasan a traves del casco.

La persona con problemas de audicion puede as^ seguir eficazmente una primera conversacion entre varios interlocutores incluso si estos estan dispuestos en unas direcciones opuestas, sin ser molestada por los ruidos ambientales, mientras continua conociendo al mismo tiempo el desarrollo de por lo menos un segunda conversacion que se desarrolla en segundo plano.

5

Claims

5

10

15

20

25

30

35

40

45

50

55

60

65

REIVINDICACIONES

1. Procedimiento de asistencia en el seguimiento de una conversacion con una pluralidad de interlocutores (1) para una persona con problemas de audicion (2) provista de un equipo informatico (3),

estando dicho equipo informatico unido a por lo menos un modulo de emision de voz (4), a por lo menos un dispositivo de visualizacion (5) y a por lo menos un modulo de conversion (6) de senales de voz en senales de texto,

comprendiendo dicho procedimiento las etapas siguientes:

- adquisicion de una pluralidad de senales de voz y de una pluralidad de senales de texto procedentes de una pluralidad de interlocutores, siendo dichas senales de texto obtenidas por conversion de dichas senales de voz por el modulo de conversion (6) de senales;

- seleccion de por lo menos una primera senal de voz de entre la pluralidad de senales de voz adquiridas;

- seleccion de por lo menos una primera senal de texto de entre la pluralidad de senales de texto adquiridas, procediendo la senal de voz y la senal de texto seleccionadas de interlocutores diferentes;

- transmision al modulo de emision de voz (4) de las primeras senales de voz seleccionadas para la emision de dichas primeras senales de voz;

- orden de la visualizacion en el dispositivo de visualizacion (5) de las primeras senales de texto seleccionadas.
2. Procedimiento segun la reivindicacion anterior, estando por lo menos uno de dichos interlocutores equipado con un equipo informatico de interlocutor (3) que comprende por lo menos un microfono (7) y dicho modulo de conversion (6) de senales de voz en senales de texto, que comprende las etapas siguientes realizadas por dicho por lo menos un equipo informatico de interlocutor:

- captura de senales de voz del interlocutor con la ayuda del microfono (7) de dicho equipo informatico de interlocutor,

- conversion de las senales de voz capturadas en senales de texto por el modulo de conversion de dicho equipo informatico de interlocutor (6),

- transmision a dicho equipo informatico de la persona con problemas de audicion de las senales de voz capturadas y de las senales de texto obtenidas por conversion.
3. Procedimiento segun la reivindicacion anterior, en el que, comprendiendo el equipo informatico de la persona con problemas de audicion (3) un modulo de recepcion de senales (10) y siendo susceptible de ser conectado a una red de comunicacion de voz y a una red de comunicacion de datos, dicha etapa de adquisicion de senales de interlocutores comprende la recepcion de las senales de voz y de las senales de texto de la pluralidad de interlocutores por el modulo de recepcion de senales (10) por medio de las redes de comunicaciones de voz y de datos.
4. Procedimiento segun la reivindicacion 1, en el que, comprendiendo el equipo informatico de la persona con problemas de audicion (3) por lo menos un microfono (7) y dicho modulo de conversion (6) de senales de voz en senales de texto, dicha etapa de adquisicion de senales de interlocutores comprende las etapas siguientes:

- adquisicion de las senales de voz de la pluralidad de interlocutores con la ayuda del microfono (7) de dicho equipo informatico de la persona con problemas de audicion,

- conversion de las senales de voz adquiridas en senales de texto por dicho modulo de conversion (6).
5. Procedimiento segun una de las reivindicaciones anteriores, en el que, estando el equipo informatico de la persona con problemas de audicion (3) unido a una base de datos de firmas vocales de interlocutores conocidos, las selecciones de las primeras senales de voz y de texto se realizan con la ayuda de un reconocimiento de las senales de voz de los interlocutores conocidos de entre las senales de voz adquiridas a partir de dicha base de datos.
6. Procedimiento segun una de las reivindicaciones anteriores, en el que la etapa de seleccion de primeras senales de voz, respectivamente de primeras senales de texto, comprende:

- una etapa previa de preseleccion por parte del equipo informatico de la persona con problemas de audicion de senales de voz, respectivamente de senales de texto, de entre la pluralidad de senales de

5

10

15

20

25

30

35

40

45

50

55

60

65

voz, respectivamente de senales de texto, adquiridas en funcion de la distancia entre el interlocutor emisor de dicha senal de voz, respectivamente senal de texto, y la persona con problemas de audicion,

- una etapa de seleccion de primeras senales de voz, respectivamente senales de texto, de entre la pluralidad de senales de voz, respectivamente senales de texto, preseleccionadas.
7. Procedimiento segun una de las reivindicaciones anteriores, en el que, estando el equipo informatico (3) de la persona con problemas de audicion unido a un dispositivo de deteccion de movimientos de la persona con problemas de audicion (2), la etapa de seleccion de primeras senales de voz, respectivamente de primeras senales de texto, comprende:

- una etapa previa de preseleccion por parte del equipo informatico (3) de la persona con problemas de audicion de senales de voz, respectivamente de senales de texto, de entre la pluralidad de senales de voz, respectivamente de senales de texto, adquiridas en funcion de un movimiento de la persona con problemas de audicion detectado por el dispositivo de deteccion de movimientos,

- una etapa de seleccion de primeras senales de voz, respectivamente senales de texto, de entre la pluralidad de senales de voz, respectivamente senales de texto, preseleccionadas.
8. Procedimiento segun una de las reivindicaciones anteriores, en el que, estando el equipo informatico (3) de la persona con problemas de audicion unido a por lo menos una camara que captura una imagen de los interlocutores en el campo de vision de la persona con problemas de audicion (2) y que comprende un modulo de reconocimiento de imagen que permite identificar a dichos interlocutores en dicha imagen capturada por dicha camara, la etapa de seleccion de primeras senales de voz, respectivamente de primeras senales de texto, comprende:

- una etapa previa de preseleccion por parte del equipo informatico (3) de la persona con problemas de audicion de senales de voz, respectivamente de senales de texto, de interlocutores, denominados interlocutores preseleccionados, presentes en el campo de vision de la persona con problemas de audicion de entre la pluralidad de senales de voz, respectivamente de senales de texto, adquiridas,

- una etapa de identificacion, por medio del modulo de reconocimiento, de dichos interlocutores preseleccionados,

- una etapa de visualizacion en el dispositivo de visualizacion (5) de la imagen de dichos interlocutores preseleccionados en el campo de vision de la persona con problemas de audicion, asociados a su identificacion,

- una etapa de seleccion por parte de la persona con problemas de audicion de primeras senales de voz, respectivamente de primeras senales de texto, de entre la pluralidad de senales de voz, respectivamente de senales de texto, de los interlocutores preseleccionados visualizados e identificados.
9. Procedimiento segun una de las reivindicaciones anteriores, que comprende:

- una etapa de recepcion de una orden vocal de la persona con problemas de audicion (2) relativa a un interlocutor y a un tipo de senales a seleccionar;

- una etapa de seleccion de primeras senales de voz o de texto del interlocutor en funcion de dicha orden vocal, comprendiendo el equipo informatico de la persona con problemas de audicion (3) un modulo de reconocimiento vocal (11) configurado para analizar dicha orden vocal.
10. Procedimiento segun una de las reivindicaciones anteriores, en el que la seleccion de por lo menos una primera senal de voz y/o de una primera senal de texto se realiza en funcion de preferencias y/o usos de la persona con problemas de audicion (2).
11. Procedimiento segun una de las reivindicaciones anteriores, en el que, estando el equipo informatico (3) de la persona con problemas de audicion unido a por lo menos una camara que captura una imagen de por lo menos un interlocutor (1) de la persona con problemas de audicion (2), tras la seleccion de primeras senales de voz, respectivamente de primeras senales de texto, de dicho interlocutor, dicho procedimiento comprende una etapa de visualizacion de la imagen de dicho interlocutor situado fuera del campo de vision de la persona con problemas de audicion (2) en una vineta insertada en la imagen visualizada en dicho dispositivo de visualizacion (5).
12. Procedimiento segun una de las reivindicaciones anteriores, en el que la etapa de seleccion de primeras senales de voz, respectivamente de primeras senales de texto, comprende la determinacion de un primer numero predeterminado, respectivamente de un segundo numero predeterminado, y la seleccion de dicho primer numero predeterminado de primeras senales de voz, respectivamente de dicho segundo numero predeterminado

5

10

15

20

25

30

35

de primeras senales de texto, por orden de recepcion.
13. Procedimiento segun una de las reivindicaciones anteriores, en el que la etapa de emision de las primeras senales de voz seleccionadas comprende previamente una etapa de filtrado del ruido y/o de las senales de voz no seleccionadas.
14. Procedimiento segun la reivindicacion anterior, en el que, comprendiendo el equipo informatico (3) de la persona con problemas de audicion un modulo de reconocimiento vocal, la etapa de filtrado comprende una etapa de filtrado de las senales de voz seleccionadas con la ayuda del resultado de un reconocimiento vocal por parte del modulo de reconocimiento vocal (11).
15. Producto de programa de ordenador que comprende unas instrucciones de codigo para la realizacion de un procedimiento segun cualquiera de las reivindicaciones anteriores cuando este programa es ejecutado por un procesador.
16. Equipo informatico (3), para la asistencia en el seguimiento de una conversacion con una pluralidad de interlocutores (1), en posesion de una persona con problemas de audicion (2) y unido a por lo menos un modulo de emision de voz (4), a por lo menos un dispositivo de visualizacion (5) y a por lo menos un modulo de conversion de senales de voz en senales de texto (6),

estando dicho equipo (3) configurado para:

- adquirir una pluralidad de senales de voz y una pluralidad de senales de texto procedentes de una pluralidad de interlocutores, siendo dichas senales de texto obtenidas por conversion de dichas senales de voz por el modulo de conversion de senales (6);

- seleccionar por lo menos una primera senal de voz de entre la pluralidad de senales de voz adquiridas;

- seleccionar por lo menos una primera senal de texto de entre la pluralidad de senales de texto adquiridas, procediendo la senal de voz y la senal de texto de interlocutores diferentes;

- transmitir al modulo de emision de voz (4) unas primeras senales de voz seleccionadas para la emision de dichas primeras senales de voz;

- ordenar la visualizacion en el dispositivo de visualizacion (5) de las primeras senales de texto seleccionadas.
17. Gafas de realidad aumentada que comprenden un equipo informatico (3) segun la reivindicacion 16.