ES2988668T3 - Evaluación médica basada en la voz - Google Patents
Evaluación médica basada en la voz Download PDFInfo
- Publication number
- ES2988668T3 ES2988668T3 ES18794955T ES18794955T ES2988668T3 ES 2988668 T3 ES2988668 T3 ES 2988668T3 ES 18794955 T ES18794955 T ES 18794955T ES 18794955 T ES18794955 T ES 18794955T ES 2988668 T3 ES2988668 T3 ES 2988668T3
- Authority
- ES
- Spain
- Prior art keywords
- user
- module
- medical
- medical condition
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H80/00—ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/103—Measuring devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
- A61B5/11—Measuring movement of the entire body or parts thereof, e.g. head or hand tremor or mobility of a limb
- A61B5/1123—Discriminating type of movement, e.g. walking or running
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/40—Detecting, measuring or recording for evaluating the nervous system
- A61B5/4076—Diagnosing or monitoring particular conditions of the nervous system
- A61B5/4088—Diagnosing of monitoring cognitive diseases, e.g. Alzheimer, prion diseases or dementia
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/48—Other medical applications
- A61B5/4803—Speech analysis specially adapted for diagnostic purposes
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
- A61B5/7264—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
- A61B5/7267—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/66—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/20—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/60—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
- G16H40/67—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/10—Numerical modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Physics & Mathematics (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Epidemiology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Animal Behavior & Ethology (AREA)
- Heart & Thoracic Surgery (AREA)
- Surgery (AREA)
- Veterinary Medicine (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Neurology (AREA)
- Physiology (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Psychiatry (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Hospice & Palliative Care (AREA)
- Developmental Disabilities (AREA)
- Psychology (AREA)
Abstract
Se describen aparatos, sistemas, métodos y productos de programas informáticos para la evaluación médica basada en la voz. Un módulo de consulta 1102 está configurado para interrogar de forma audible a un usuario desde un altavoz de un dispositivo informático móvil 102. Un módulo de respuesta 1104 está configurado para recibir una respuesta verbal de un usuario desde un micrófono de un dispositivo informático móvil 102. Un módulo de detección 1106 está configurado para proporcionar una evaluación de un estado médico a un usuario basándose en un análisis de una respuesta verbal recibida del usuario. (Traducción automática con Google Translate, sin valor legal)
Description
DESCRIPCIÓN
Evaluación médica basada en la voz
Campo
Esta invención se refiere al análisis de voz y más particularmente se refiere a la evaluación y diagnóstico automatizados de una o más afecciones médicas basada en muestras de voz recopiladas.
Antecedentes
La evaluación de lesiones y enfermedades neurológicas y otras afecciones médicas a menudo la realiza manualmente un profesional médico y puede basarse en un formulario completado a mano con lápiz y papel. La evaluación manual puede ser inexacta y/o inconsistente, y es posible que un profesional médico no siempre esté disponible cuando ocurren lesiones u otras afecciones médicas.
El documento US2016/022193 A1 divulga grabación biométrica en tiempo real, sistemas de seguimiento y análisis de información para el manejo de la salud conductual. El documento US2014/073993 A1 divulga sistemas y métodos para usar sonidos vocálicos aislados para la evaluación de una lesión cerebral traumática leve. Ninguno de estos documentos divulga una selección automatizada de mensajes para interrogar al usuario.
Sumario
Se presentan aparatos para evaluación médica basados en la voz. De acuerdo con un primer aspecto de la presente invención, se proporciona un aparato de acuerdo con la reivindicación 1.
Se presentan sistemas para valoración médica basados en la voz. De acuerdo con un segundo aspecto de la presente invención, se proporciona un sistema de acuerdo con la reivindicación 13.
Se presentan productos de programas informáticos que comprenden un medio de almacenamiento legible por ordenador. En determinadas realizaciones, un medio de almacenamiento legible por ordenador almacena un código del programa utilizable por ordenador ejecutable para realizar operaciones de evaluación médica basadas en la voz. En algunas realizaciones, una o más de las operaciones pueden ser sustancialmente similares a una o más etapas descritas anteriormente con respecto a los aparatos, sistemas y/o métodos divulgados.
Breve descripción de los dibujos
Para que las ventajas de la invención se comprendan fácilmente, se presentará una descripción más particular de la invención, descrita anteriormente con brevedad, con referencia a realizaciones específicas de la misma que se ilustran en los dibujos adjuntos. Entendiendo que estos dibujos representan solo realizaciones típicas de la invención y, por lo tanto, no deben considerarse como una limitación de su alcance, se describirá y explicará la invención con especificidad y detalle adicionales mediante el uso de los dibujos adjuntos, en los que:
La Figura 1A es un diagrama de bloques esquemático que ilustra una realización de un sistema para evaluación médica basado en la voz;
La Figura 1B es un diagrama de bloques esquemático que ilustra una realización adicional de un sistema para evaluación médica basado en la voz;
La Figura 2 es un diagrama de bloques esquemático que ilustra una realización de un sistema para procesar datos del habla con un modelo matemático para realizar un diagnóstico médico;
La Figura 3 es un diagrama de bloques esquemático que ilustra una realización de un corpus de entrenamiento de datos del habla;
La Figura 4 es un diagrama de bloques esquemático que ilustra una realización de una lista de mensajes para usar en el diagnóstico de una afección médica;
La Figura 5 es un diagrama de bloques esquemático que ilustra una realización de un sistema para seleccionar rasgos distintivos para entrenar un modelo matemático para diagnosticar una afección médica;
La Figura 6A es un diagrama de bloques esquemático que ilustra una realización de un gráfico de pares de valores de rasgos distintivos característicos y valores de diagnóstico;
La Figura 6B es un diagrama de bloques esquemático que ilustra una realización adicional de un gráfico de pares de valores de rasgos distintivos característicos y valores de diagnóstico;
La Figura 7 es un diagrama de flujo esquemático que ilustra una realización de un método para seleccionar rasgos distintivos para entrenar un modelo matemático para diagnosticar una afección médica;
La Figura 8 es un diagrama de flujo esquemático que ilustra una realización de un método para seleccionar mensajes para su uso con un modelo matemático para diagnosticar una afección médica;
La Figura 9 es un diagrama de flujo esquemático que ilustra una realización de un método para entrenar un modelo matemático para diagnosticar una afección médica que se adapta a un conjunto de mensajes seleccionados;
La Figura 10 es un diagrama de bloques esquemático que ilustra una realización de un dispositivo informático que puede usarse para entrenar e implementar un modelo matemático para diagnosticar una afección médica;
La Figura 11 es un diagrama de bloques esquemático que ilustra una realización de un módulo de voz;
La Figura 12 es un diagrama de flujo esquemático que ilustra una realización de un método para evaluación médica basada en la voz; y
La Figura 13 es un diagrama de flujo esquemático que ilustra una realización adicional de un método para evaluación médica basada en la voz.
Descripción detallada
A lo largo de esta memoria descriptiva, la referencia a "una realización", o lenguaje similar significa que un rasgo distintivo, estructura o característica particular descritos en relación con la realización está incluido en al menos una realización. Por tanto, cuando aparece la expresión "en una realización", y un lenguaje similar a lo largo de esta memoria descriptiva puede, pero no necesariamente, referirse a la misma realización, pero significa "una o más, pero no todas las realizaciones", a menos que se especifique expresamente lo contrario. Las expresiones "que incluye", "que comprende" "que tiene", y sus variaciones significan "incluido, entre otros", a menos que se especifique expresamente lo contrario. Una lista enumerada de elementos no implica que alguno o todos los elementos sean mutuamente excluyentes y/o mutuamente inclusivos, a menos que se especifique lo contrario. Los términos "un" "una", y "el", "la" también se refieren a "uno o más" a menos que se especifique expresamente lo contrario.
Asimismo, los rasgos distintivos, ventajas y características descritos de las realizaciones se pueden combinar de cualquier manera adecuada. Un experto en la materia relevante reconocerá que las realizaciones se pueden practicar sin uno o más de los rasgos distintivos o ventajas específicas de una realización particular. En otros casos, se pueden reconocer rasgos distintivos y ventajas adicionales en ciertas realizaciones que pueden no estar presentes en todas las realizaciones.
Estos rasgos distintivos y ventajas de las realizaciones resultarán más evidentes a partir de la siguiente descripción y las reivindicaciones adjuntas, o podrán aprenderse mediante la práctica de las realizaciones como se establece a continuación. Como resultará evidente para una persona experta en la materia, los aspectos de la presente invención pueden materializarse como un sistema, método y/o producto de programa informático. En consecuencia, los aspectos de la presente invención pueden adoptar la forma de una realización completa de soporte físico(hardware),una realización completa de programa informáticosoftware(que incluye soporte lógico inalterable(firmware),programa informático residente, microcódigo, etc.) o una realización que combina aspectos de programa informático y soporte físico a los que se puede hacer referencia en general en el presente documento como un "circuito", "modulo", o "sistema". Asimismo, los aspectos de la presente invención pueden adoptar la forma de un producto de programa informático materializado en uno o más medios legibles por ordenador que tienen un código del programa incorporado en ellos.
Muchas de las unidades funcionales descritas en esta memoria descriptiva han sido etiquetadas como módulos (o componentes), para enfatizar más particularmente su independencia de implementación. Por ejemplo, un módulo puede implementarse como un circuito de soporte físico que comprende circuitos VLSI personalizados o matrices de compuertas, semiconductores disponibles en el mercado, como chips lógicos, transistores u otros componentes discretos. También se puede implementar un módulo en dispositivos de soporte físico programables tales como matrices de compuertas programables en campo, lógica de matriz programable, dispositivos lógicos programables o similares.
Los módulos también pueden implementarse en un programa informático para su ejecución mediante varios tipos de procesadores. Un módulo identificado de código del programa puede, a modo de ejemplo, comprender uno o más bloques físicos o lógicos de instrucciones informáticas que pueden, a modo de ejemplo, estar organizado como un objeto, procedimiento o función. No obstante, los ejecutables de un módulo identificado no necesitan estar ubicados físicamente juntos, pero pueden comprender instrucciones dispares almacenadas en diferentes ubicaciones que, cuando se unen lógicamente, componen el módulo y logran el propósito establecido para el módulo.
De hecho, un módulo de código del programa puede ser una sola instrucción o muchas instrucciones, e incluso puede estar distribuido en varios segmentos de código diferentes, entre diferentes programas y en varios dispositivos de memoria. De manera similar, los datos operativos pueden identificarse e ilustrarse en el presente documento dentro de módulos, y pueden incorporarse en cualquier forma adecuada y organizarse dentro de cualquier tipo adecuado de estructura de datos. Los datos operativos pueden recopilarse como un único conjunto de datos o pueden distribuirse en diferentes ubicaciones, incluidos diferentes dispositivos de almacenamiento, y pueden existir, al menos parcialmente, simplemente como señales electrónicas en un sistema o red. Cuando un módulo o partes de un módulo se implementan en un programa informático, el código del programa puede almacenarse y/o propagarse en uno o más medios legibles por ordenador.
El producto de programa informático puede incluir un medio (o medios) de almacenamiento legible por ordenador que tiene instrucciones de programa legibles por ordenador en su interior para hacer que un procesador lleve a cabo aspectos de la presente invención.
El medio de almacenamiento legible por ordenador puede ser un dispositivo tangible que puede retener y almacenar instrucciones para que las utilice un dispositivo de ejecución de instrucciones. El medio de almacenamiento legible por ordenador puede ser, por ejemplo, aunque no de forma limitativa, un dispositivo de almacenamiento electrónico, un dispositivo de almacenamiento magnético, un dispositivo de almacenamiento óptico, un dispositivo de almacenamiento electromagnético, un dispositivo de almacenamiento semiconductor o cualquier combinación apropiada de los anteriores. Una lista no exhaustiva de ejemplos más específicos del medio de almacenamiento legible por ordenador incluye lo siguiente: un disquete de ordenador portátil, un disco duro, una memoria de acceso aleatorio ("RAM"), una memoria de solo lectura ("ROM"), una memoria de solo lectura programable y borrable ("EPROM" o memoria flash), una memoria estática de acceso aleatorio ("SRAM"), una memoria de solo lectura de disco compacto portátil ("CD-ROM"), un disco versátil digital ("DVD"), una memoria extraíble, un disquete, un dispositivo codificado mecánicamente, tal como tarjetas perforadas o estructuras en relieve en una ranura que tiene instrucciones grabadas en su interior, y cualquier combinación adecuada de los anteriores. Un medio de almacenamiento legible por ordenador, como se utiliza en el presente documento, no debe interpretarse como señales transitorias propiamente dichas, tales como ondas de radio u otras ondas electromagnéticas que se propagan libremente, ondas electromagnéticas que se propagan a través de una guía de ondas u otros medios de transmisión (p. ej., pulsos de luz que pasan a través de un cable de fibra óptica) o señales eléctricas transmitidas a través de un cable.
Las instrucciones de programa legibles por ordenador descritas en el presente documento se pueden descargar en los respectivos dispositivos informáticos/de procesamiento desde un medio de almacenamiento legible por ordenador o en un ordenador externo o dispositivo de almacenamiento externo a través de una red, por ejemplo, Internet, una red de área local, una red de área amplia y/o una red inalámbrica. La red puede comprender cables de transmisión de cobre, fibras de transmisión óptica, transmisión inalámbrica, enrutadores, cortafuegos, interruptores, ordenadores de puerta de enlace y/o servidores periféricos. Una tarjeta adaptadora de red o interfaz de red en cada dispositivo informático/de procesamiento recibe instrucciones de programa legibles por ordenador desde la red y envía las instrucciones de programa legibles por ordenador para su almacenamiento en un medio de almacenamiento legible por ordenador dentro del dispositivo informático/de procesamiento respectivo.
Las instrucciones de programa legibles por ordenador para llevar a cabo las operaciones de la presente invención pueden ser instrucciones de ensamblador, instrucciones de arquitectura de conjunto de instrucciones (ISA), instrucciones de máquina, instrucciones dependientes de la máquina, microcódigo, instrucciones de soporte lógico inalterable, datos de configuración de estado, o código fuente o código objeto escrito en cualquier combinación de uno o más lenguajes de programación, incluidos un lenguaje de programación orientado a objetos, tal como Smalltalk, C++ u otro similar, y lenguajes de programación por procedimientos convencionales, tales como el lenguaje de programación "C" u otros lenguajes de programación similares. Las instrucciones de programa legibles por ordenador pueden ejecutarse completamente en el ordenador del usuario, parcialmente en el ordenador del usuario, como un paquete de programa informático independiente, parcialmente en el ordenador del usuario y parcialmente en un ordenador remoto, o completamente en el ordenador remoto o servidor. En el último caso, el ordenador remoto puede estar conectado al ordenador del usuario a través de cualquier tipo de red, incluyendo una red de área local (LAN) o red de área amplia (WAN), o la conexión se puede realizar con un ordenador externo (p. ej., a través de Internet, utilizando un proveedor de servicios de Internet). En algunas realizaciones, los circuitos electrónicos que incluyen, por ejemplo, circuitos lógicos programables, matrices de compuertas programables en campo (FPGA) o matrices lógicas programables (PLA) pueden ejecutar las instrucciones del programa legibles por ordenador utilizando información de estado de las instrucciones del programa legibles por ordenador para personalizar los circuitos electrónicos, para ejecutar aspectos de la presente invención.
Los aspectos de la presente invención se describen en el presente documento haciendo referencia a las ilustraciones del diagrama de flujo y/o a los diagramas de bloques de los métodos, aparatos (sistemas) y productos de programa informático de acuerdo con las realizaciones de la invención. Se entenderá que cada bloque de las ilustraciones del diagrama de flujo y/o diagramas de bloques, y las combinaciones de bloques en las ilustraciones del diagrama de flujo y/o diagramas de bloques, se puede implementar mediante instrucciones de programa legibles por ordenador.
Estas instrucciones de programa legibles por ordenador pueden enviarse a un procesador de un ordenador de uso general, ordenador de uso especial u otros aparatos de procesamiento de datos programares para elaborar una máquina, de tal manera que las instrucciones, que se ejecutan a través del procesador del ordenador u otro aparato de procesamiento de datos programable, creen medios para implementar las funciones/acciones especificadas en el bloque o bloques del diagrama de flujo y/o diagrama de bloques. Estas instrucciones de programa legibles por ordenador también se pueden almacenar en un medio de almacenamiento legible por ordenador que pueda hacer que un ordenador, un aparato de procesamiento de datos programable y/u otros dispositivos actúen de una forma en particular, de manera que el medio de almacenamiento legible por ordenador que tiene instrucciones almacenadas en su interior comprenda un artículo de fabricación que incluya instrucciones que implementen aspectos de la función/acción especificados en el bloque o bloques del diagrama de flujo y/o diagrama de bloques.
Las instrucciones de programa legibles por ordenador también pueden cargarse en un ordenador, otro aparato de procesamiento de datos programable u otro dispositivo, para así hacer que se lleven a cabo una serie de etapas operativas en el ordenador, otro aparato programable u otro dispositivo, con el fin de generar un proceso implementado por ordenador, de modo que las instrucciones que se ejecutan en el ordenador, otro aparato programable u otro dispositivo implementen las funciones/acciones especificados en el bloque o bloques del diagrama de flujo y/o diagrama de bloques.
Los diagramas de flujo esquemáticos y/o los diagramas de bloques esquemáticos de las figuras ilustran la arquitectura, funcionalidad y funcionamiento de posibles implementaciones de aparatos, sistemas, métodos y productos de programas informáticos de acuerdo con diversas realizaciones de la presente invención. A este respecto, cada bloque en los diagramas de flujo esquemáticos y/o diagramas de bloques esquemáticos puede representar un módulo, segmento o porción de código, que comprende una o más instrucciones ejecutables del código del programa para implementar la función o funciones lógicas especificadas.
Cabe señalar también que, en algunas implementaciones alternativas, las funciones indicadas en el bloque pueden producirse fuera del orden indicado en las figuras. Por ejemplo, dos bloques mostrados en sucesión pueden, en efecto, ejecutarse sustancialmente al mismo tiempo o los bloques pueden ejecutarse en ocasiones en el orden inverso, dependiendo de la funcionalidad prevista. Pueden concebirse otras etapas y métodos que sean equivalentes en función, lógica, o efecto a uno o más bloques, o partes de los mismos, de las figuras ilustradas.
Aunque se pueden emplear varios tipos de flechas y tipos de líneas en el diagrama de flujo y/o diagrama de bloques, se entiende que no limitan el alcance de las realizaciones correspondientes. De hecho, se pueden usar algunas flechas u otros conectores para indicar solo el flujo lógico de la realización representada. A modo de ejemplo, una flecha puede indicar un período de espera o control de duración no especificada entre las etapas enumeradas de la realización representada. También se observará que cada bloque de los diagramas de bloques y/o diagramas de flujo, y las combinaciones de bloques en los diagramas de bloques y/o diagramas de flujo, puede implementarse mediante sistemas basados en soporte físico de uso especial que realizan las funciones o actos especificados, o combinaciones de soporte físico de uso especial y código del programa.
La Figura 1A representa una realización de un sistema 100 para recopilación de voz y/o evaluación médica basada en la voz. En una realización, el sistema 100 incluye uno o más dispositivos de soporte físico 102, uno o más módulos de voz 104 (p. ej., uno o más módulos de voz 104a dispuestos en uno o más dispositivos de soporte físico 102, uno o más módulos de voz de un sistema de interfaz de administración(backend)104b, o similares), una o más redes de datos 106 u otros canales de comunicación, y/o uno o más servidores de un sistema de interfaz de administración 108. En determinadas realizaciones, aunque un número específico de dispositivos de soporte físico 102, módulos de voz 104, redes de datos 106 y/o los servidores de un sistema de interfaz de administración 108 se representan en la Figura 1, un experto en la materia reconocerá, a la luz de esta divulgación, que cualquier número de dispositivos de soporte físico 102, módulos de voz 104, redes de datos 106 y/o servidores de un sistema de interfaz de administración 108 pueden incluirse en el sistema 100 para la recopilación de voz y/o evaluación médica basada en la voz.
En general, un módulo de voz 104, en diversas realizaciones, está configurado para recibir y/o grabar datos de audio de voz de un usuario (p. ej., un paciente, un atleta, otro usuario, o similar) y/o para evaluar y/o diagnosticar la presencia y/o gravedad de una o más afecciones médicas (p. ej., lesiones, dolencias, enfermedades, o similares) basándose en datos de audio de voz recopilados. Un módulo de voz 104 puede interrogar o consultar a un usuario (p. ej., audiblemente a través de un altavoz, auriculares o similares; visualmente con texto escrito en un dispositivo de visualización de soporte físico; y/o usar de otro modo uno o más elementos de interfaz de usuario de un dispositivo de soporte físico 102) para obtener una respuesta verbal del usuario, que el módulo de voz 104 recibe y/o graba. Un módulo de voz 104 puede proporcionar una evaluación a un usuario, puede proporcionar una evaluación y/o datos de audio de voz a un módulo de voz de un sistema de interfaz de administración 104b, o similar.
Un módulo de voz 104 puede interactuar con un usuario, hacer preguntas verbalmente, grabar las respuestas vocales del usuario, determinar si una respuesta es precisa, o similares. Para ciertos protocolos, un módulo de voz 104 puede hacer una o más preguntas varias veces (p. ej., dos veces, tres veces, o algo así) antes de pasar a la siguiente pregunta, o algo similar. Según los datos de audio de voz, un módulo de voz 104 puede evaluar y/o diagnosticar una o más enfermedades u otras afecciones médicas (p. ej., conmoción cerebral, depresión, estrés, ictus, bienestar cognitivo, estado de ánimo, sinceridad, enfermedad de Alzheimer (EA), enfermedad de Parkinson, cáncer, o similares).
Por ejemplo, después de capturar el audio, un módulo de voz 104 puede puntuar respuestas (p. ej., mediante un módulo de voz del dispositivo 104a en un dispositivo de soporte físico 102) y proporcionar una o más puntuaciones iniciales a un usuario, y el audio puede analizarse más a fondo (p. ej., mediante un módulo de voz de un sistema de interfaz de administración 104b en un dispositivo servidor 108) y se puede proporcionar una puntuación secundaria a un usuario con respecto a una conmoción cerebral y/u otra enfermedad o afección médica específica. Un módulo de voz 104 puede extraer una o más señales y/o rasgos distintivos verbales y pasar las señales y/o rasgos distintivos verbales extraídos a uno o más modelos de aprendizaje automático entrenados para una determinada enfermedad y/u otra afección médica.
Un módulo de voz 104 puede comparar las respuestas de un usuario con respuestas anteriores de cuando el usuario estaba sano (p. ej., con las respuestas iniciales). Un módulo de voz 104 puede normalizar los resultados basándose en la demografía de un usuario (p. ej., edad, sexo o similares). Un módulo de voz 104 puede determinar datos de normalización como parte del proceso de entrenamiento, determinar un intervalo de puntuaciones esperadas para cada grupo demográfico, o similares.
En determinadas realizaciones, en lugar de proporcionar una evaluación, además de proporcionar una evaluación, como parte de una evaluación, o similar, un módulo de voz 104 puede evaluar la eficacia y/o el éxito de un ensayo clínico, un proceso de aprobación de fármacos, o similares. Por ejemplo, en lugar de o además de un cuestionario para los participantes del ensayo, que puede ser subjetivo, un módulo de voz 104 puede evaluar y/o modelar objetivamente cambios en la voz de un participante del ensayo durante el transcurso del ensayo clínico. Por ejemplo, un módulo de voz 104 puede recopilar audio de participantes de ensayos y/o estudios clínicos (p. ej., en una visita al médico, en casa, o similares) y puede crear uno o más modelos para un grupo de placebo y/o para un grupo de prueba. En algunas realizaciones, un módulo de voz 104 puede comparar resultados de una evaluación y/o modelo de voz para ensayos clínicos y/o participantes en estudios con resultados de un cuestionario u otra prueba, puede proporcionar una puntuación similar y/o en la misma escala que un cuestionario u otra prueba, o similar. Un módulo de voz 104, en determinadas realizaciones, puede proporcionar una evaluación médica basada en la voz para validar un protocolo de tratamiento (p. ej., un medicamento y/u otro tratamiento terapéutico) para el cual no se conoce ninguna prueba química, para verificar y/o validar una prueba química, o similares.
El módulo de voz 104, en determinadas realizaciones, puede proporcionar una evaluación en la interfaz de usuario de los participantes en un ensayo y/o estudio clínico. Por ejemplo, un módulo de voz 104 puede calificar a un individuo que demuestra biomarcadores en su habla concordantes con un individuo deprimido para un estudio de depresión, o similar. La detección de participantes de un ensayo y/o estudio clínico usando un módulo de voz 104 que identifica biomarcadores en su habla puede ser más objetiva y/o precisa que usar un cuestionario escrito o una herramienta similar para identificar a los participantes de un ensayo clínico de manera subjetiva. Otros métodos que puedan lograr objetividad y/o precisión, como análisis de sangre, imagen de resonancia magnética (RM) o similares, en determinadas realizaciones, puede ser más costoso e invasivo que un análisis del habla mediante un módulo de voz 104. Un módulo de voz 104, en una realización, puede proporcionar objetividad y/o precisión similar a otras pruebas, aunque no es invasiva, tiene un coste menor, o similares. La identificación de participantes en ensayos clínicos utilizando un módulo de voz 104, en una realización, es una herramienta objetiva basada en datos de biomarcador.
Un módulo de voz 104, en algunas realizaciones, puede diferenciar y/o calificar uno o más fármacos nuevos (p. ej., medicaciones) utilizando parámetros de comportamiento (p. ej., parámetros de comportamiento que han sido medidos y que se ha determinado objetivamente que contribuyen a la calidad de vida, en lugar de simplemente la aprobación de fármacos por su prevención eficaz de la morbilidad o similares). Un módulo de voz 104, en una realización, utiliza biomarcadores vocales para identificar condiciones humanas (p. ej., fatiga física, cansancio, fatiga mental, estrés, ansiedad, depresión, deterioro cognitivo, o similares) para medir la calidad de vida y/o uno o más parámetros de comportamiento diferentes. Las condiciones específicas y/o parámetros de comportamiento que indican una calidad de vida pueden variar según el tratamiento médico, la afección médica asociada, o similares. Por ejemplo, un paciente oncológico puede experimentar "quimiocerebro" como efecto secundario de un tratamiento contra el cáncer, y un módulo de voz 104 puede detectar el pensamiento cognitivo deteriorado del paciente basándose en un análisis de la voz del paciente, indicando la presencia de "quimiocerebro", reduciendo la calidad de vida del paciente.
Por ejemplo, una farmacoterapia contra el cáncer puede ser eficaz, sin embargo, puede ser perjudicial para la calidad de vida del individuo que utiliza la farmacoterapia contra el cáncer. Un paciente que recibe farmacoterapia contra el cáncer puede sobrevivir, por ejemplo, durante 5 años después de un diagnóstico inicial, pero los 5 años durante los cuales el paciente recibe tratamiento pueden ser miserables debido a los cambios en la calidad de vida debido a la farmacoterapia contra el cáncer, que puede no haber sido identificado o tratado como resultado de que la farmacoterapia no haya sido calificada por un módulo de voz 104, o similar. En el ejemplo, una nueva farmacoterapia que se está probando puede tener una eficacia similar o incluso ligeramente inferior, pero una calidad de vida mucho mayor, pero no sería aprobada ni seleccionada de otro modo para su uso a menos que la calidad de vida también se mida mediante un módulo de voz 104 y se considere como un factor en el ensayo del fármaco y/o estudio clínico.
En lugar de medir subjetivamente la calidad de vida y/o las consecuencias comportamentales de recibir tratamiento o fármacos mediante un cuestionario o herramienta similar, en determinadas realizaciones, un módulo de voz 104 puede identificar uno o más cambios en la calidad de vida de un paciente objetivamente usando biomarcadores u otros indicadores en los datos de voz del paciente. La identificación de la calidad de vida y/u otros parámetros de comportamiento relacionados con el tratamiento farmacológico o del cáncer utilizando un módulo de voz 104, en una realización, es una herramienta objetiva basada en datos de biomarcador. Como se describe con mayor detalle a continuación, un módulo de voz 104 puede evaluar una calidad de vida, una afección médica o similar basada en un análisis de las respuestas de un usuario a una o más indicaciones. Por ejemplo, en el ejemplo del "quimiocerebro" descrito anteriormente, un módulo de voz 104 puede proporcionar a un usuario una serie de indicaciones seleccionadas para evaluar un estado actual de uno o más síntomas asociados con el "quimiocerebro", como la pérdida de memoria. Para controlar la pérdida de memoria, en determinadas realizaciones, un módulo de voz 104 puede enumerar de forma audible palabras y/o números a un usuario y pedirle que los repita, puede mostrar una serie de imágenes al usuario y pedirle que repita una descripción de la serie de imágenes, o similar, y controlar los cambios en la precisión de las respuestas del usuario a lo largo del tiempo, indicando pérdida de memoria y una disminución de la calidad de vida.
En una realización, el sistema 100 incluye uno o más dispositivos de soporte físico 102. Los dispositivos de soporte físico 102 y/o el uno o más servidores de un sistema de interfaz de administración 108 (p. ej., dispositivos informáticos, dispositivos de manejo de información, o similares) pueden incluir uno o más de un ordenador de escritorio, un ordenador portátil, un dispositivo móvil, una tableta, un teléfono inteligente, un decodificador, una consola de juegos, un televisor inteligente, un reloj inteligente, una pulsera de actividad, una pantalla óptica montada en la cabeza (p. ej., un casco de realidad virtual, gafas inteligentes o similares), un HDMI u otro adaptador de pantalla electrónica, un asistente digital personal y/u otro dispositivo informático que comprende un procesador (p. ej., una unidad de procesamiento central (CPU), un núcleo de procesador, matriz de compuertas programable en campo (FPGA) u otros dispositivos lógicos programables, un circuito integrado de aplicación específica (ASIC), un controlador, un microcontrolador y/u otro dispositivo semiconductor de circuito integrado), una memoria volátil y/o un medio de almacenamiento no volátil. En determinadas realizaciones, los dispositivos de soporte físico 102 están en comunicación con uno o más servidores de un sistema de interfaz de administración 108 a través de una red de datos 106, descrito más adelante. Los dispositivos de soporte físico 102, en una realización adicional, son capaces de ejecutar varios programas, código de programación, aplicaciones, instrucciones, funciones, o similares.
En diversas realizaciones, un módulo de voz 104 puede estar materializado como soporte físico, programa informático o una combinación de soporte físico y programa informático. En una realización, un módulo de voz 104 puede comprender un código del programa ejecutable almacenado en un medio de almacenamiento no transitorio legible por ordenador para su ejecución en un procesador de un dispositivo de soporte físico 102; un servidor de un sistema de interfaz de administración 108; o similares. Por ejemplo, un módulo de voz 104 puede incorporarse como código del programa ejecutable que se ejecuta en uno o más de un dispositivo de soporte físico 102; un servidor de un sistema de interfaz de administración 108; una combinación de dos o más de los anteriores; o similares. En una realización de este tipo, los diversos módulos que realizan las operaciones de un módulo de voz 104, como se describe a continuación, puede estar ubicado en un dispositivo de soporte físico 102; un servidor de un sistema de interfaz de administración 108; una combinación de los dos; y/o similares.
En diversas realizaciones, un módulo de voz 104 puede incorporarse como un dispositivo de soporte físico que puede instalarse o implementarse en un servidor de un sistema de interfaz de administración 108, en el dispositivo de soporte físico de un usuario 102 (p. ej., una llave electrónica, una funda protectora para un teléfono 102 o tableta 102 que incluye uno o más dispositivos semiconductores de circuito integrado dentro de la funda en comunicación con el teléfono 102 o tableta 102 de forma inalámbrica y/o a través de un puerto de datos tal como USB o un puerto de comunicaciones patentado, u otro dispositivo periférico), o en otro lugar de la red de datos 106 y/o colocado con el dispositivo de soporte físico 102 de un usuario. En determinadas realizaciones, un módulo de voz 104 puede comprender un dispositivo de soporte físico tal como un adaptador de soporte físico seguro u otro dispositivo soporte físico (p. ej., un decodificador, un dispositivo de red, o similar) que se conecta a otro dispositivo de soporte físico 102, como un ordenador portátil, un servidor, una tableta, un teléfono inteligente o similar, ya sea mediante una conexión por cable (p. ej., una conexión USB) o una conexión inalámbrica (p. ej., Bluetooth®, WiFi®, comunicación de campo cercano (NFC), o similares); que se conecta a un dispositivo de visualización electrónico (p. ej., un televisor o monitor usando un puerto HDMI, un puerto DisplayPort, un puerto Mini DisplayPort, puerto VGA, puerto DVI o similar); que opera sustancialmente de forma independiente en una red de datos 106; o similares. Un dispositivo de soporte físico de un módulo de voz 104 puede comprender una interfaz de alimentación, una interfaz de red cableada y/o inalámbrica, una interfaz gráfica (p. ej., una tarjeta gráfica y/o GPU con uno o más puertos de visualización) que sale a un dispositivo de visualización y/o un dispositivo de circuito integrado semiconductor como se describe a continuación, configurado para realizar las funciones descritas en el presente documento con respecto a un módulo de voz 104.
Un módulo de voz 104, en una realización de este tipo, puede comprender un dispositivo de circuito integrado semiconductor (p. ej., uno o más chips, pastilla, u otro soporte físico de lógica discreta), o similar, como una matriz de compuertas programables en campo (FPGA) u otra lógica programable, soporte lógico inalterable para una FPGA u otra lógica programable, microcódigo para ejecución en un microcontrolador, un circuito integrado para aplicaciones específicas (ASIC), un procesador, un núcleo de procesador, o similar. En una realización, un módulo de voz 104 puede montarse en una placa de circuito impreso con una o más líneas o conexiones eléctricas (p. ej., a la memoria volátil, un medio de almacenamiento no volátil, una interfaz de red, un dispositivo periférico, una interfaz gráfica/de visualización. El dispositivo de soporte físico puede incluir uno o más lectores de tarjetas u otras conexiones eléctricas configuradas para enviar y recibir datos (p. ej., en comunicación con una o más líneas eléctricas de una placa de circuito impreso o similar), y uno o más circuitos de soporte físico y/u otros circuitos eléctricos configurados para realizar diversas funciones de un módulo de voz 104.
El dispositivo de circuito integrado semiconductor u otro dispositivo de soporte físico de un módulo de voz 104, en determinadas realizaciones, comprende y/o está acoplado comunicativamente a uno o más medios de memoria volátil, que puede incluir, entre otros: memoria de acceso aleatorio (RAM), RAM dinámica (DRAM), caché, o similares. En una realización, el dispositivo de circuito integrado semiconductor u otro dispositivo de soporte físico de un módulo de voz 104 comprende y/o está acoplado comunicativamente a uno o más medios de memoria no volátiles, que puede incluir pero no se limita a: memoria flash NAND, memoria flash NOR, nano memoria de acceso aleatorio (nano RAM o NRAM), memoria basada en cables de nanocristales, memoria de proceso de menos de 10 nanómetros basada en óxido de silicio, memoria de grafeno, Óxido de silicio-Nitruro-Óxido-Silicio (SONOS), RAM resistiva (RRAM), celda de metalización programable (PMC), RAM de puente conductivo (CBRAM), RAM magnetorresistiva (MrAm ), RAM dinámica (DRAM), RAM de cambio de fase (PRAM o PCM), medios de almacenamiento magnéticos (p. ej., disco duro, cinta), medios de almacenamiento óptico, o similares.
La red de datos 106, en una realización, incluye una red de comunicación digital que transmite comunicaciones digitales. La red de datos 106 puede incluir una red inalámbrica, como una red celular inalámbrica, una red inalámbrica local, como una red Wi-Fi, una red Bluetooth®, una red de comunicación de campo cercano (NFC), una red ad hoc, y/o similares. La red de datos 106 puede incluir una red de área amplia (WAN), una red de área de almacenamiento (SAN), una red de área local (LAN), una red de fibra óptica, Internet u otra red de comunicación digital. La red de datos 106 puede incluir dos o más redes. La red de datos 106 puede incluir uno o más servidores, enrutadores, conmutadores y/u otros equipos de red. La red de datos 106 también puede incluir uno o más medios de almacenamiento legibles por ordenador, tal como una unidad de disco duro, una unidad óptica, memoria no volátil, RAM, o similar.
El uno o más servidores de un sistema de interfaz de administración 108, en una realización, puede incluir uno o más sistemas informáticos accesibles en red, como uno o más servidores web que alojan uno o más sitios web, un sistema de intranet empresarial, un servidor de aplicaciones, un servidor de interfaz de programación de aplicaciones (API), un servidor de autenticación, o similar. Un servidor de un sistema de interfaz de administración 108 puede incluir uno o más servidores ubicados remotamente de los dispositivos de soporte físico 102. Un servidor de un sistema de interfaz de administración 108 puede incluir al menos una parte de los módulos de voz 104, puede comprender soporte físico de un módulo de voz 104, puede almacenar código del programa ejecutable de un módulo de voz 104 en uno o más medios de almacenamiento no transitorios legibles por ordenador, y/o puede realizar de otro modo una o más de las diversas operaciones de un módulo de voz 104 descrito en el presente documento para seguimiento y atribución de contenido compartido.
La Figura 1B es un sistema de ejemplo 109 para diagnosticar una afección médica usando el habla de una persona. La Figura 1B incluye un servicio de diagnóstico de afección médica 140 que puede recibir datos del habla de una persona y procesar los datos del habla para determinar si una persona tiene una afección médica. Por ejemplo, el servicio de diagnóstico de afección médica 140 puede procesar los datos del habla para calcular una determinación de sí o no en cuanto a si la persona tiene la afección médica o para calcular una puntuación que indica una probabilidad o probabilidad de que la persona tenga la afección médica y/o una gravedad de la afección.
Como se utiliza en el presente documento, un diagnóstico se refiere a cualquier determinación sobre si una persona puede tener una afección médica o cualquier determinación sobre la posible gravedad de la afección médica. Un diagnóstico puede incluir cualquier forma de evaluación, conclusión, opinión o determinación relacionada con una afección médica. En algunos casos, un diagnóstico puede ser incorrecto y es posible que una persona diagnosticada con una afección médica en realidad no la tenga.
El servicio de diagnóstico de afección médica 140 puede recibir los datos del habla de una persona usando cualquier técnica apropiada. Por ejemplo, una persona puede hablar con un dispositivo móvil 110 y el dispositivo móvil 110 puede grabar el habla y transmitir los datos del habla grabados al servicio de diagnóstico de afección médica 140 a través de la red 130. Se puede utilizar cualquier técnica apropiada y cualquier red apropiada para que el dispositivo móvil 110 transmita los datos del habla grabados al servicio de diagnóstico de afección médica 140. Por ejemplo, se puede instalar una aplicación o "app" en el dispositivo móvil 110 que utiliza una llamada API (interfaz de programación de aplicaciones) REST (transferencia de estado representacional) para transmitir los datos del habla a través de Internet o una red de telefonía móvil. En otro ejemplo, un proveedor médico puede tener un ordenador 120 de proveedor médico que se usa para grabar el habla de una persona y transmitir datos del habla al servicio de diagnóstico de afección médica 140.
En algunas implementaciones, el servicio de diagnóstico de afección médica 140 puede instalarse en el dispositivo móvil 110 o en el ordenador del proveedor médico 120 de manera que no sea necesario transmitir los datos del habla a través de una red. El ejemplo de la Figura 1B no es limitativo y se puede utilizar cualquier técnica apropiada para transmitir datos del habla para su procesamiento mediante un modelo matemático.
La salida del servicio de diagnóstico de afección médica 140 puede entonces usarse para cualquier propósito apropiado. Por ejemplo, la información puede presentarse a la persona que proporcionó los datos del habla o a un profesional médico que esté tratando a la persona.
La Figura 2 es un sistema de ejemplo 200 para procesar datos del habla con un modelo matemático para realizar un diagnóstico médico. Al procesar los datos del habla, se pueden calcular los rasgos distintivos a partir de los datos del habla y luego el modelo matemático puede procesar los rasgos distintivos. Se puede utilizar cualquier tipo apropiado de rasgos distintivos.
Los rasgos distintivos pueden incluir rasgos distintivos acústicos, donde los rasgos distintivos acústicos son cualquier rasgo distintivo calculado a partir de los datos del habla que no involucran ni dependen de la realización de reconocimiento del habla en los datos del habla (p. ej., los rasgos distintivos acústicos no utilizan información sobre las palabras pronunciadas en los datos del habla). Por ejemplo, los rasgos distintivos acústicos pueden incluir coeficientes cepstrales de frecuencia mel, rasgos distintivos de predicción lineal perceptiva, perturbación en la frecuencia o perturbación en la amplitud.
Los rasgos distintivos pueden incluir rasgos distintivos del lenguaje donde los rasgos distintivos del lenguaje se calculan utilizando los resultados de un reconocimiento del habla. Por ejemplo, los rasgos distintivos del lenguaje pueden incluir una velocidad de habla (p. ej., el número de vocales o sílabas por segundo), una serie de muletillas (p. ej., "ums" y "ahs"), la dificultad de las palabras (p. ej., palabras menos comunes), o las partes del habla de las palabras que siguen a las muletillas.
En la Figura 2, los datos del habla son procesados por el componente de cálculo de rasgo distintivo acústico 210 y el componente de reconocimiento del habla 220. El componente de cálculo de rasgo distintivo acústico 210 puede calcular rasgos distintivos acústicos a partir de los datos del habla, como cualquiera de los rasgos distintivos acústicos descritos en el presente documento. El componente de reconocimiento del habla 220 puede realizar un reconocimiento del habla automático en los datos del habla usando cualquier técnica apropiada (p. ej., modelos de mezcla gaussiana, modelado acústico, modelado del lenguaje y redes neuronales).
Debido a que el componente de reconocimiento del habla 220 puede usar rasgos distintivos acústicos al realizar el reconocimiento del habla, parte del procesamiento de estos dos componentes puede superponerse y, por lo tanto, son posibles otras configuraciones. Por ejemplo, el componente de rasgo distintivo acústico 210 puede calcular los rasgos distintivos acústicos que necesita el componente de reconocimiento del habla 220 y, por lo tanto, es posible que el componente de reconocimiento del habla 220 no necesite calcular ningún rasgo distintivo acústico.
El componente de cálculo de rasgo distintivo del lenguaje 230 puede recibir resultados de reconocimiento del habla del componente de reconocimiento del habla 220 y procesar los resultados del reconocimiento del habla para determinar rasgos distintivos del lenguaje, como cualquiera de los rasgos distintivos del lenguaje descritos en el presente documento. Los resultados del reconocimiento del habla pueden estar en cualquier formato apropiado e incluir cualquier información apropiada. Por ejemplo, los resultados del reconocimiento del habla pueden incluir una red de palabras que incluye múltiples secuencias posibles de palabras, información sobre muletillas y los tiempos de las palabras, sílabas, vocales, muletillas o cualquier otra unidad de habla.
El clasificador de afección médica 240 puede procesar los rasgos distintivos acústicos y los rasgos distintivos del lenguaje con un modelo matemático para generar una o más puntuaciones de diagnóstico que indican si la persona tiene la afección médica, tal como una puntuación que indica una probabilidad o verosimilitud de que la persona tenga la afección médica y/o una puntuación que indique la gravedad de la afección médica. El clasificador de afección médica 240 puede usar cualquier técnica apropiada, como un clasificador implementado con una máquina de soporte vectorial o una red neuronal, como un perceptrón multicapa.
El rendimiento del clasificador de afección médica 240 puede depender de los rasgos distintivos calculados por el componente de cálculo de rasgo distintivo acústico 210 y el componente de cálculo de rasgo distintivo del lenguaje 230. Además, un conjunto de rasgos distintivos que funcionan bien para una afección médica puede no funcionar bien para otra afección médica. Por ejemplo, la dificultad para expresar palabras puede ser un rasgo distintivo importante para diagnosticar la enfermedad de Alzheimer, pero puede no ser útil para determinar si una persona tiene una conmoción cerebral. Por poner otro ejemplo, rasgos distintivos relacionadas con la pronunciación de las vocales, sílabas o palabras pueden ser importantes para la enfermedad de Parkinson, pero pueden ser menos importantes para otras afecciones médicas. En consecuencia, se necesitan técnicas para determinar un primer conjunto de rasgos distintivos que funciona bien para una primera afección médica, y es posible que sea necesario repetir este proceso para determinar un segundo conjunto de rasgos distintivos que funciona bien para una segunda afección médica.
En algunas implementaciones, el clasificador de afección médica 240 puede usar otros rasgos distintivos, que pueden denominarse rasgos distintivos ajenos al habla, además de los rasgos distintivos acústicos y los rasgos distintivos del lenguaje. Por ejemplo, los rasgos distintivos pueden obtenerse o calcularse a partir de la información demográfica de una persona (p. ej., sexo, edad o lugar de residencia), información de un historial médico (p. ej., peso, lecturas recientes de presión arterial, o diagnósticos previos), o cualquier otra información apropiada.
La selección de rasgos distintivos para diagnosticar una afección médica puede ser más importante en situaciones donde la cantidad de datos de entrenamiento para entrenar el modelo matemático es relativamente pequeña. Por ejemplo, para entrenar un modelo matemático para diagnosticar conmociones cerebrales, los datos de entrenamiento necesarios pueden incluir datos del habla de varios individuos poco después de experimentar una conmoción cerebral. Estos datos pueden existir en pequeñas cantidades y obtener más ejemplos de dichos datos puede llevar un período de tiempo considerable.
Entrenar modelos matemáticos con una cantidad menor de datos de entrenamiento puede resultar en un sobreajuste donde el modelo matemático se adapta a los datos de entrenamiento específicos, pero debido a la pequeña cantidad de datos de entrenamiento, es posible que el modelo no funcione bien con datos nuevos. Por ejemplo, el modelo puede ser capaz de detectar todas las conmociones cerebrales en los datos de entrenamiento, pero puede tener una alta tasa de error al procesar datos de producción de personas que pueden sufrir conmociones cerebrales.
Una técnica para evitar el sobreajuste al entrenar un modelo matemático es reducir la cantidad de rasgos distintivos utilizadas para entrenar el modelo matemático. La cantidad de datos de entrenamiento necesarios para entrenar un modelo sin sobreajuste aumenta a medida que aumenta la cantidad de rasgos distintivos. En consecuencia, el uso de una menor cantidad de rasgos distintivos permite construir modelos con una menor cantidad de datos de entrenamiento.
Cuando sea necesario entrenar un modelo con una menor cantidad de rasgos distintivos, es más importante seleccionar los rasgos distintivos que permitirán que el modelo funcione bien. Por ejemplo, cuando hay una gran cantidad de datos de entrenamiento disponibles, se pueden utilizar cientos de rasgos distintivos para entrenar el modelo y es más probable que se hayan utilizado los rasgos distintivos adecuados. A la inversa, donde hay una pequeña cantidad de datos de entrenamiento disponibles, solo se pueden utilizar unos 10 rasgos distintivos para entrenar un modelo, y es más importante seleccionar los rasgos distintivos que son más importantes para diagnosticar la afección médica.
Ahora se presentan ejemplos de rasgos distintivos que pueden usarse para diagnosticar una afección médica.
Los rasgos distintivos acústicos se pueden calcular utilizando rasgos distintivos de segmentos de tiempo corto. Al procesar datos del habla, la duración de los datos del habla puede variar. Por ejemplo, en algunos casos el habla puede durar uno o dos segundos y en otros puede durar varios minutos o más. Para lograr coherencia en el procesamiento de datos del habla, puede procesarse en segmentos de tiempo corto (a veces denominados marcos). Por ejemplo, cada segmento de tiempo corto puede ser de 25 milisegundos y los segmentos pueden avanzar en incrementos de 10 milisegundos de modo que haya una superposición de 15 milisegundos entre dos segmentos sucesivos.
Los siguientes son ejemplos no limitativos de rasgos distintivos de segmento de tiempo corto: rasgos distintivos espectrales (tales como coeficientes cepstrales de frecuencia mel o predictivos lineales perceptivos); rasgos distintivos prosódicos (como el tono, energía o probabilidad de expresión); rasgos distintivos de calidad de voz (como perturbación en la frecuencia, perturbación en la frecuencia, eliminación de perturbación en la frecuencia, perturbación en la amplitud o relación armónicos-ruido); entropía (p. ej., para capturar con qué precisión se pronuncia un enunciado donde la entropía se puede calcular a partir de la parte posterior de un modelo acústico entrenado con datos del habla natural).
Los rasgos distintivos del segmento de corta duración se pueden combinar para calcular los rasgos distintivos acústicos del habla. Por ejemplo, una muestra de habla de dos segundos puede producir 200 rasgos distintivos de segmentos de tiempo corto para el tono que pueden combinarse para calcular uno o más rasgos distintivos acústicos para el tono.
Los rasgos distintivos del segmento de tiempo corto se pueden combinar para calcular un rasgo distintivo acústico para una muestra de habla usando cualquier técnica apropiada. En algunas implementaciones, un rasgo distintivo acústico se puede calcular utilizando estadísticos de los rasgos distintivos del segmento de tiempo corto (p. ej., media aritmética, desviación estándar, asimetría, curtosis, primer cuartil, segundo cuartil, tercer cuartil, el segundo cuartil menos el primer cuartil, el tercer cuartil menos el primer cuartil, el tercer cuartil menos el segundo cuartil, percentil 0,01, percentil 0,99, percentil 0,99 menos el percentil 0,01, el porcentaje de segmentos de corto tiempo cuyos valores están por encima de un umbral (p. ej., donde el umbral es el 75 % del intervalo más el mínimo), el porcentaje de segmentos cuyos valores están por encima de un umbral (p. ej., donde el umbral es el 90 % del intervalo más el mínimo), la pendiente de una aproximación lineal de los valores, la desviación de una aproximación lineal de los valores, el error lineal calculado como la diferencia de la aproximación lineal y los valores reales, o el error cuadrático calculado como la diferencia de la aproximación lineal y los valores reales. En algunas implementaciones, un rasgo distintivo acústico se puede calcular como un i-vector o vector de identidad de los rasgos distintivos del segmento de corto tiempo. Un vector de identidad se puede calcular usando cualquier técnica apropiada, como realizar una conversión de matriz a vector utilizando una técnica de análisis factorial y un modelo de mezcla gaussiana.
Los siguientes son ejemplos no limitativos de rasgos distintivos del lenguaje. La velocidad de hablar, como por ejemplo calculando la duración de todas las palabras habladas dividida por el número de vocales o cualquier otra medida apropiada de la velocidad de hablar. Una serie de pausas que pueden indicar vacilación en el habla, como (1) un número de muletillas dividido por la duración de las palabras habladas o (2) un número de muletillas dividido por el número de palabras habladas. Una medida de la dificultad de las palabras o el uso de palabras menos comunes. Por ejemplo, la dificultad de las palabras se puede calcular utilizando estadísticos de probabilidades de 1 gramo de las palabras habladas, como clasificando palabras según sus percentiles de frecuencia (p. ej., 5 %, 10 %, 15 %, 20 %, 30 % o 40 %). Las partes del habla de palabras que siguen a las muletillas, tales como (1) los recuentos de cada clase de parte del habla divididos por el número de palabras habladas o (2) los recuentos de cada clase de parte del habla divididos por la suma de los recuentos de todas las partes del habla.
En algunas implementaciones, los rasgos distintivos del lenguaje pueden incluir la determinación de si una persona respondió correctamente a una pregunta. Por ejemplo, se le puede preguntar a una persona cuál es el año actual o quién es el presidente de los Estados Unidos. El habla de la persona puede procesarse para determinar lo que dijo en respuesta a la pregunta y para determinar si respondió la pregunta correctamente.
Para entrenar un modelo para diagnosticar una afección médica, se puede recopilar un corpus de datos de entrenamiento. El corpus de entrenamiento podrá incluir ejemplos de habla donde se conozca el diagnóstico de la persona. Por ejemplo, se puede saber que la persona no tuvo conmoción cerebral, o una conmoción cerebral leve, moderada o grave.
La Figura 3 ilustra un ejemplo de un corpus de entrenamiento que incluye datos del habla para entrenar un modelo para diagnosticar conmociones cerebrales. Por ejemplo, las filas de la tabla de la Figura 3 pueden corresponder a entradas de la base de datos. En este ejemplo, cada entrada incluye un identificador de una persona, el diagnóstico conocido de la persona (p. ej., sin conmoción cerebral o una conmoción cerebral leve, media o grave), un identificador de una indicación o pregunta que se presentó a una persona (p. ej., "¿Cómo está hoy?") y el nombre de un archivo que contiene los datos del habla. Los datos de entrenamiento pueden almacenarse en cualquier formato apropiado utilizando cualquier tecnología de almacenamiento adecuada.
El corpus de entrenamiento puede almacenar una representación del habla de una persona utilizando cualquier formato apropiado. Por ejemplo, un elemento de datos del habla del corpus de entrenamiento puede incluir muestras digitales de una señal de audio recibida en un micrófono o puede incluir una versión procesada de la señal de audio, como los coeficientes cepstrales de frecuencia de mel.
Un único corpus de entrenamiento puede contener datos del habla relacionados con múltiples afecciones médicas, o se puede usar un corpus de entrenamiento separado para cada afección médica (p. ej., un primer corpus de entrenamiento para conmociones cerebrales y un segundo corpus de entrenamiento para la enfermedad de Alzheimer). Se puede utilizar un corpus de entrenamiento separado para almacenar datos del habla para personas sin ninguna afección médica conocida o diagnosticada, ya que este corpus de entrenamiento puede usarse para modelos de entrenamiento para múltiples afecciones médicas.
La Figura 4 ilustra un ejemplo de indicaciones almacenadas que pueden usarse para diagnosticar afecciones médicas. Cada indicación puede presentarse a una persona, ya sea por una persona (p. ej., un profesional médico) o un ordenador, para obtener el habla de la persona en respuesta a la indicación. Cada indicación puede tener un identificador de indicación para que pueda tener una referencia cruzada con el identificador de indicación del corpus de entrenamiento. Las indicaciones de la Figura 4 pueden almacenarse usando cualquier tecnología de almacenamiento apropiada, como por ejemplo una base de datos.
La Figura 5 es un sistema de ejemplo 500 que puede usarse para seleccionar rasgos distintivos para entrenar un modelo matemático para diagnosticar una afección médica y luego usar los rasgos distintivos seleccionados para entrenar el modelo matemático. El Sistema 500 se puede utilizar varias veces para seleccionar rasgos distintivos para diferentes afecciones médicas. Por ejemplo, un primer uso del sistema 500 puede seleccionar rasgos distintivos para diagnosticar conmociones cerebrales y un segundo uso del sistema 500 puede seleccionar rasgos distintivos para diagnosticar la enfermedad de Alzheimer.
La Figura 5 incluye un corpus de entrenamiento 510 de elementos de datos del habla para entrenar un modelo matemático para diagnosticar una afección médica. El corpus de entrenamiento 510 puede incluir cualquier información apropiada, como datos del habla de varias personas con y sin la afección médica, un marcador que indique si la persona tiene o no la afección médica y cualquier otra información descrita en el presente documento.
El componente de cálculo de rasgo distintivo acústico 210, el componente de reconocimiento del habla 220 y el componente de cálculo de rasgo distintivo de lenguaje 230 pueden implementarse como se ha descrito anteriormente para calcular rasgos distintivos acústicos y de lenguaje para los datos del habla en el corpus de entrenamiento. El componente de cálculo de rasgo distintivo acústico 210 y el componente de cálculo de rasgo distintivo del lenguaje 230 pueden calcular un gran número de rasgos distintivos de modo que se puedan determinar los rasgos distintivos de mejor rendimiento. Esto puede contrastar con la Figura 2, donde estos componentes se utilizan en un sistema de producción y, por lo tanto, estos componentes pueden calcular solo los rasgos distintivos que se seleccionaron previamente.
El componente de cálculo de la puntuación de selección de rasgo distintivo 520 puede calcular una puntuación de selección para cada rasgo distintivo (que puede ser un rasgo distintivo acústico, un rasgo distintivo del lenguaje, o cualquier otro rasgo distintivo descrito en el presente documento). Para calcular una puntuación de selección para un rasgo distintivo, se puede crear un par de números para cada elemento de datos del habla en el corpus de entrenamiento, donde el primer número del par es el valor del rasgo distintivo y el segundo número del par es un indicador del diagnóstico de la afección médica. El valor del indicador del diagnóstico de afección médica puede tener dos valores (p. ej., 0 si la persona no tiene la afección médica y 1 si la persona tiene la afección médica) o puede tener un número mayor de valores (p. ej., un número real entre 0 y 1 o varios números enteros que indican una probabilidad o gravedad de la afección médica).
En consecuencia, para cada rasgo distintivo, se puede obtener un par de números para cada elemento de datos del habla del corpus de entrenamiento. Las Figuras 6a y 6B ilustran dos gráficos conceptuales de los pares de números para un primer rasgo distintivo y un segundo rasgo distintivo. Para la Figura 6A, no parece haber un patrón o correlación entre los valores del primer rasgo distintivo y los valores de diagnóstico correspondientes, pero para la Figura 6B, parece haber un patrón o correlación entre los valores del segundo rasgo distintivo y los valores de diagnóstico. En consecuencia, se puede concluir que el segundo rasgo distintivo es probablemente útil para determinar si una persona tiene la afección médica y que el primer rasgo distintivo no.
El componente de cálculo de la puntuación de selección de rasgo distintivo 520 puede calcular una puntuación de selección para un rasgo distintivo usando los pares de valores de rasgo distintivo y valores de diagnóstico. El componente de cálculo de la puntuación de selección de rasgo distintivo 520 puede calcular cualquier puntuación apropiada que indique un patrón o correlación entre los valores de rasgo distintivo y los valores de diagnóstico. Por ejemplo, el componente de cálculo de puntuación de selección de rasgo distintivo 520 puede calcular un índice Rand, un índice Rand ajustado, información mutua, información mutua ajustada, una correlación de Pearson, una correlación absoluta de Pearson, una correlación de Spearman o una correlación absoluta de Spearman.
La puntuación de selección puede indicar la utilidad de la función para detectar una afección médica. Por ejemplo, una puntuación de selección alta puede indicar que se debe usar un rasgo distintivo en el entrenamiento del modelo matemático, y una puntuación de selección baja puede indicar que el rasgo distintivo no se debe usar en el entrenamiento del modelo matemático.
El componente de determinación de estabilidad de rasgo distintivo 530 puede determinar si un rasgo distintivo (que puede ser un rasgo distintivo acústico, un rasgo distintivo de lenguaje, o cualquier otro rasgo distintivo descrito en el presente documento) es estable o inestable. Para hacer una determinación de estabilidad, los elementos de datos del habla se pueden dividir en múltiples grupos, que pueden denominarse subconjuntos. Por ejemplo, los elementos de datos del habla se pueden dividir en cinco subconjuntos. En algunas implementaciones, los elementos de datos del habla se pueden dividir en subconjuntos de modo que cada subconjunto tenga un número aproximadamente igual de elementos de datos del habla para diferentes sexos y grupos de edad.
Los estadísticos de cada subconjunto se pueden comparar con los estadísticos de los otros subconjuntos. Por ejemplo, para un primer subconjunto, se puede determinar la mediana (o media o cualquier otro estadístico relacionado con el<centro o la mitad de una distribución) del valor del rasgo distintivo (indicado como M>1<). También se pueden calcular>estadísticos para la combinación de los otros subconjuntos. Por ejemplo, para la combinación de los otros subconjuntos, se puede calcular la mediana de los valores de rasgo distintivo (indicada como Mo) y una medición estadística de la variabilidad de los valores de rasgo distintivo (indicada como V0), como el intervalo intercuartil, varianza o desviación estándar. Se puede determinar que el rasgo distintivo es inestable si la mediana del primer subconjunto difiere demasiado de la mediana del segundo subconjunto. Por ejemplo, se puede determinar que el rasgo distintivo es inestable si
donde C es un factor de escala. A continuación, se puede repetir el proceso para cada uno de los otros subconjuntos. Por ejemplo, la mediana de un segundo subconjunto se puede comparar con la mediana y la variabilidad de los otros subconjuntos como se ha descrito anteriormente.
En algunas implementaciones, si, después de comparar cada subconjunto con los otros subconjuntos, la mediana de cada subconjunto no está demasiado lejos de la mediana de los otros subconjuntos, entonces se puede determinar que el rasgo distintivo es estable. A la inversa, si la mediana de cualquier subconjunto está demasiado lejos de la mediana de los otros subconjuntos, entonces se puede determinar que el rasgo distintivo es inestable.
En algunas implementaciones, el componente de determinación de estabilidad de rasgo distintivo 530 puede generar un valor booleano para cada rasgo distintivo para indicar si el rasgo distintivo es estable o no. En algunas implementaciones, el componente de determinación de estabilidad 530 puede generar una puntuación de estabilidad para cada rasgo distintivo. Por ejemplo, una puntuación de estabilidad se puede calcular como la distancia más grande entre la mediana de un subconjunto y los otros subconjuntos (p. ej., una distancia de Mahalanobis).
El componente de selección de rasgo distintivo 540 puede recibir las puntuaciones de selección del componente de cálculo de puntuación de selección de rasgo distintivo 520 y las determinaciones de estabilidad del componente de determinación de estabilidad de rasgo distintivo 530 y seleccionar un subconjunto de rasgos distintivos que se usarán para entrenar el modelo matemático. El componente de selección de rasgo distintivo 540 puede seleccionar una serie de rasgos distintivos que tengan las puntuaciones de selección más altas y que también sean suficientemente estables.
En algunas implementaciones, la cantidad de rasgos distintivos que se seleccionarán (o un número máximo de rasgos distintivos que se seleccionarán) se puede establecer con anticipación. Por ejemplo, se puede determinar un número N en función de la cantidad de datos de entrenamiento y se pueden seleccionar N rasgos distintivos. Los rasgos distintivos seleccionados pueden determinarse eliminando rasgos distintivos inestables (p. ej., rasgos distintivos determinados como inestables o rasgos distintivos con una puntuación de estabilidad por debajo de un umbral) y luego seleccionar los N rasgos distintivos con las puntuaciones de selección más altos.
En algunas implementaciones, el número de rasgos distintivos a seleccionar puede basarse en las puntuaciones de selección y las determinaciones de estabilidad. Por ejemplo, los rasgos distintivos seleccionados se pueden determinar eliminando los rasgos distintivos inestables y luego seleccionando todos los rasgos distintivos con una puntuación de selección por encima de un umbral.
En algunas implementaciones, las puntuaciones de selección y las puntuaciones de estabilidad se pueden combinar al seleccionar rasgos distintivos. Por ejemplo, para cada rasgo distintivo se puede calcular una puntuación combinada (tal como sumando o multiplicando la puntuación de selección y la puntuación de estabilidad del rasgo distintivo) y los rasgos distintivos se pueden seleccionar usando la puntuación combinada.
El componente de entrenamiento de modelo 550 puede entonces entrenar un modelo matemático usando los rasgos distintivos seleccionados. Por ejemplo, el componente de entrenamiento del modelo 550 puede iterar los elementos de datos del habla del corpus de entrenamiento, obtener los rasgos distintivos seleccionados para los elementos de datos del habla y luego entrenar el modelo matemático usando los rasgos distintivos seleccionados. En algunas implementaciones, se pueden aplicar técnicas de reducción de dimensiones, como el análisis de componentes principales o el análisis discriminante lineal, a los rasgos distintivos seleccionados como parte del entrenamiento del modelo. Se puede entrenar cualquier modelo matemático apropiado, como cualquiera de los modelos matemáticos descritos en el presente documento.
En algunas implementaciones, pueden usarse otras técnicas, como métodos envolventes, para la selección de rasgo distintivo o puede usarse en combinación con las técnicas de selección de rasgo distintivo presentadas anteriormente. Los métodos envolventes pueden seleccionar un conjunto de rasgos distintivos, entrenar un modelo matemático utilizando el conjunto de rasgos distintivos seleccionado y luego evaluar el rendimiento del conjunto de rasgos distintivos utilizando el modelo entrenado. Cuando el número de rasgos distintivos posibles es relativamente pequeño y/o el tiempo de entrenamiento es relativamente corto, se pueden evaluar todos los conjuntos posibles de rasgos distintivos y se puede seleccionar el conjunto de mejor rendimiento. Cuando el número de rasgos distintivos posibles es relativamente grande y/o el tiempo de entrenamiento es un factor importante, se pueden utilizar técnicas de optimización para encontrar de forma iterativa un conjunto de rasgos distintivos que funcionen bien. En algunas implementaciones, se puede seleccionar un conjunto de rasgos distintivos usando el sistema 500, y luego se puede seleccionar un subconjunto de estos rasgos distintivos usando métodos envolventes como el conjunto final de rasgos distintivos.
La Figura 7 es un diagrama de flujo de una implementación de ejemplo de selección de rasgos distintivos para entrenar un modelo matemático para diagnosticar una afección médica. En la Figura 7 y otros diagramas de flujo del presente documento, el orden de las etapas es ilustrativo y otros órdenes son posibles, no todas las etapas son necesarias, las etapas pueden combinarse (en su totalidad o en parte) o subdividirse y, en algunas implementaciones, es posible que se omitan algunas etapas o que se agreguen otras. Se pueden implementar los métodos descritos en cualquier diagrama de flujo descrito en el presente documento, por ejemplo, por cualquiera de los ordenadores o sistemas descritos en el presente documento.
En la etapa 710, se obtiene un corpus de entrenamiento de elementos de datos del habla. El corpus de entrenamiento puede incluir una representación de una señal de audio del habla de una persona, una indicación del diagnóstico médico de la persona de quien se obtuvo el habla, y cualquier otra información apropiada, como cualquier información descrita en el presente documento.
En la etapa 720, los resultados del reconocimiento del habla se obtienen para cada elemento de datos del habla del corpus de entrenamiento. Es posible que los resultados del reconocimiento del habla se hayan calculado de antemano y se hayan almacenado con el corpus de entrenamiento o se hayan almacenado en otra ubicación. Los resultados del reconocimiento del habla pueden incluir cualquier información apropiada, como una transcripción, una lista de transcripciones con la puntuación más alta (p. ej., una lista N-mejor), un entramado de posibles transcripciones e información de tiempo, como la hora de inicio y finalización de las palabras, muletillas u otras unidades del habla.
En la etapa 730, los rasgos distintivos acústicos se calculan para cada elemento de datos del habla del corpus de entrenamiento. Los rasgos distintivos acústicos pueden incluir cualquier rasgo distintivo que se calcule sin utilizar los resultados del reconocimiento del habla de un elemento de datos del habla, como cualquiera de los rasgos distintivos acústicos descritos en el presente documento. Los rasgos distintivos acústicos pueden incluir o calcularse a partir de datos utilizados en el proceso de reconocimiento del habla (p. ej., coeficientes cepstrales de frecuencia mel o predictores lineales perceptivos), pero los rasgos distintivos acústicos no utilizan resultados de reconocimiento del habla, como información sobre las palabras o muletillas presentes en un elemento de datos del habla.
En la etapa 740, los rasgos distintivos del lenguaje se calculan para cada elemento de datos del habla del corpus de entrenamiento. Los rasgos distintivos del lenguaje pueden incluir cualquier rasgo distintivo que se calcule utilizando los resultados del reconocimiento del habla, como cualquiera de los rasgos distintivos del lenguaje descritos en el presente documento.
En la etapa 750, se calcula una puntuación de selección de rasgo distintivo para cada rasgo distintivo acústico y cada rasgo distintivo del lenguaje. Para calcular una puntuación de selección de rasgo distintivo para el rasgo distintivo, el valor del rasgo distintivo para cada elemento de datos del habla en el corpus de entrenamiento puede usarse junto con otra información, como un valor de diagnóstico conocido correspondiente al elemento de datos del habla. La puntuación de selección de rasgo distintivo se puede calcular utilizando cualquiera de las técnicas descritas en el presente documento, como por ejemplo calculando una correlación absoluta de Pearson. En algunas implementaciones, las puntuaciones de selección de rasgo distintivo también se pueden calcular para otros rasgos distintivos, tales como rasgos distintivos relacionadas con la información demográfica de una persona.
En la etapa 760, se selecciona una pluralidad de rasgos distintivos usando las puntuaciones de selección de rasgo distintivo. Por ejemplo, se pueden seleccionar varios rasgos distintivos que tengan las puntuaciones de selección más altas. En algunas implementaciones, se puede calcular una determinación de estabilidad para cada rasgo distintivo y la pluralidad de rasgos distintivos se puede seleccionar usando tanto las puntuaciones de selección de rasgo distintivo como las determinaciones de estabilidad, tal como mediante el uso de cualquiera de las técnicas descritas en el presente documento.
En la etapa 770, se entrena un modelo matemático utilizando los rasgos distintivos seleccionados. Se puede entrenar cualquier modelo matemático apropiado, como una red neuronal o una máquina de soporte vectorial. Una vez entrenado el modelo matemático, puede implementarse en un sistema de producción, tal como un módulo de voz 104, un sistema 109 de la Figura 1B, o similar para realizar diagnósticos de afecciones médicas.
Las etapas de la Figura 7 se pueden realizar de diversas maneras. Por ejemplo, en algunas implementaciones, las etapas 730 y 740 se pueden realizar en un bucle que recorre cada uno de los elementos de datos del habla en el corpus de entrenamiento. Para una primera iteración, se pueden calcular rasgos distintivos acústicos y del lenguaje para un primer elemento de datos del habla, para una segunda iteración, se pueden calcular rasgos distintivos acústicos y de lenguaje para un segundo elemento de datos del habla, y así sucesivamente.
Cuando se utiliza un modelo implementado para diagnosticar una afección médica, a la persona que está siendo diagnosticada se le puede presentar una secuencia de indicaciones o preguntas para obtener el habla de la persona. Se puede utilizar cualquier indicación apropiada, como cualquiera de las indicaciones de la Figura 4. Una vez seleccionados los rasgos distintivos, como se ha descrito anteriormente, se pueden seleccionar indicaciones para que las indicaciones seleccionadas proporcionen información útil sobre los rasgos distintivos seleccionados.
Por ejemplo, supongamos que un rasgo distintivo seleccionado es el tono. Si bien se ha determinado que el tono es un rasgo distintivo útil para diagnosticar una afección médica, algunas indicaciones pueden ser mejores que otras para obtener un rasgo distintivo de tono útil. Enunciados muy breves (p. ej., respuestas sí/no) pueden no proporcionar datos suficientes para calcular con precisión el tono y, por lo tanto, las indicaciones que generan respuestas más largas pueden ser más útiles para obtener información sobre el tono.
Por poner otro ejemplo, supongamos que un rasgo distintivo seleccionado es la dificultad de las palabras. Si bien se ha determinado que la dificultad de las palabras es un rasgo distintivo útil para diagnosticar una afección médica, algunas indicaciones pueden ser mejores que otras para obtener un rasgo distintivo útil de dificultad de palabras. Las indicaciones que solicitan a un usuario que lea un pasaje presentado generalmente darán como resultado el habla de las palabras del pasaje y, por lo tanto, el rasgo distintivo de dificultad de la palabra tendría el mismo valor cada vez que se presente esta indicación y, por lo tanto, esta indicación no sería útil para obtener información sobre la dificultad de las palabras. Por el contrario, preguntas abiertas, como "¿Qué tal te ha ido el día?", puede dar lugar a una mayor variabilidad del vocabulario en las respuestas y, por tanto, puede proporcionar información más útil sobre la dificultad de las palabras.
Seleccionar un conjunto de indicaciones también puede mejorar el rendimiento de un sistema para diagnosticar afecciones médicas y brindar una mejor experiencia a la persona que está siendo evaluada. Al utilizar el mismo conjunto de indicaciones para cada persona evaluada, el sistema para diagnosticar afecciones médicas puede proporcionar resultados más precisos, ya que los datos recopilados de varias personas pueden ser más comparables que si se utilizaran diferentes indicaciones con cada persona. Además, la utilización de un conjunto definido de indicaciones, permite que la evaluación de una persona sea más predecible y de una duración deseada que sea apropiada para la evaluación de la afección médica. Por ejemplo, para evaluar si una persona tiene la enfermedad de Alzheimer, puede ser aceptable utilizar más indicaciones para recopilar una mayor cantidad de datos, pero para evaluar si una persona sufre una conmoción cerebral durante un acontecimiento deportivo, puede que sea necesario utilizar un número menor de indicaciones para obtener un resultado más rápidamente.
Las indicaciones se seleccionan calculando las puntuaciones de selección de indicación. Un corpus de entrenamiento puede tener múltiples o incluso muchos elementos de datos del habla para una única indicación. Por ejemplo, el corpus de entrenamiento puede incluir ejemplos de la indicación utilizada con diferentes personas o la misma indicación puede usarse con la misma persona varias veces.
La Figura 8 es un diagrama de flujo de una implementación de ejemplo de selección de indicaciones para su uso con un modelo implementado para diagnosticar una afección médica.
Las etapas 810 a 840 se pueden realizar para cada indicación (o un subconjunto de las indicaciones) en el corpus de entrenamiento para calcular una puntuación de selección de indicación para cada indicación.
En la etapa 810 se obtiene una indicación y en la etapa 820 se obtienen del corpus de entrenamiento elementos de datos del habla correspondientes a la indicación.
En la etapa 830, se calcula una puntuación de diagnóstico médico para cada elemento de datos del habla correspondiente a la indicación. Por ejemplo, una puntuación de diagnóstico médico para un elemento de datos del habla puede ser un número generado por un modelo matemático (p. ej., el modelo matemático entrenado en la Figura 7) que indica una probabilidad de que una persona tenga la afección médica y/o la gravedad de la afección médica.
En la etapa 840, se calcula una puntuación de selección de indicación para la indicación utilizando las puntuaciones de diagnóstico médico calculadas. El cálculo de una puntuación de selección de indicación puede ser similar al cálculo de una puntuación de selección de rasgo distintivo, como se ha descrito anteriormente. Para cada elemento de datos del habla correspondiente a la indicación, se puede obtener un par de números. Para cada par, el primer número del par puede ser la puntuación de diagnóstico médico calculada a partir del elemento de datos del habla, y el segundo número del par puede ser un diagnóstico de afección médica conocida de la persona (p. ej., se sabe que la persona tiene la afección médica o la gravedad de la afección médica). Trazar estos pares de números puede dar como resultado un gráfico similar a la Figura 6A o la Figura 6B y, según la indicación, puede haber o no un patrón o correlación en los pares de números.
Una puntuación de selección de indicación para una indicación puede incluir cualquier puntuación que indique un patrón o correlación entre las puntuaciones de diagnóstico médico calculadas y los diagnósticos de afección médica conocida. Por ejemplo, una puntuación de selección de indicación puede incluir un índice Rand, un índice Rand ajustado, información mutua, información mutua ajustada, una correlación de Pearson, una correlación absoluta de Pearson, una correlación de Spearman o una correlación absoluta de Spearman.
En la etapa 850 se determina si quedan otras indicaciones por procesar. Si quedan indicaciones por procesar, entonces el procesamiento puede continuar hasta la etapa 810 para procesar indicaciones adicionales. Si se han procesado todas las indicaciones, entonces el procesamiento puede continuar hasta la etapa 860.
En la etapa 860, se selecciona una pluralidad de indicaciones utilizando las puntuaciones de selección de indicación. Por ejemplo, se pueden seleccionar varias indicaciones que tengan las puntuaciones de selección de indicación más altas. En algunas implementaciones, se puede calcular una determinación de estabilidad para cada indicación y se puede seleccionar la pluralidad de indicaciones usando tanto las puntuaciones de selección de indicación como las determinaciones de estabilidad de indicación, tal como mediante el uso de cualquiera de las técnicas descritas en el presente documento.
En la etapa 870, las indicaciones seleccionadas se utilizan con un servicio de diagnóstico de afección médica implementado. Por ejemplo, al diagnosticar a una persona, las indicaciones seleccionadas pueden presentarse a una persona para obtener el habla de la persona en respuesta a cada una de las indicaciones.
En algunas implementaciones, pueden usarse otras técnicas, como métodos envolventes, para la selección de indicación o puede usarse en combinación con las técnicas de selección de indicación presentadas anteriormente. En algunas implementaciones, se puede seleccionar un conjunto de indicaciones usando el proceso de la Figura 8, y luego se puede seleccionar un subconjunto de estas indicaciones usando métodos envolventes como el conjunto final de rasgos distintivos.
En algunas implementaciones, una persona involucrada en la creación del servicio de diagnóstico de afección médica puede ayudar en la selección de indicaciones. La persona puede utilizar su conocimiento o experiencia para seleccionar indicaciones basadas en los rasgos distintivos seleccionados. Por ejemplo, donde un rasgo distintivo seleccionado es la dificultad de las palabras, la persona puede revisar las indicaciones y seleccionar las que tengan más probabilidades de proporcionar información útil relacionada con la dificultad de las palabras. La persona puede seleccionar una o más indicaciones que probablemente proporcionen información útil para cada uno de los rasgos distintivos seleccionados.
En algunas implementaciones, la persona puede revisar las indicaciones seleccionadas mediante el proceso de la Figura 8 y agregar o eliminar indicaciones para mejorar el rendimiento de un sistema de diagnóstico de afección médica. Por ejemplo, dos indicaciones pueden proporcionar cada una información útil sobre la dificultad de las palabras, pero la información proporcionada por las dos indicaciones puede ser en gran medida redundante, y el uso de ambas indicaciones puede no proporcionar un beneficio significativo en comparación con el uso de solo una de ellas.
En algunas implementaciones, se puede entrenar un segundo modelo matemático después de la selección de indicaciones que se adapta a las indicaciones seleccionadas. El modelo matemático entrenado en la Figura 7 puede procesar un solo enunciado (en respuesta a una indicación) para generar una puntuación de diagnóstico médico. Cuando el proceso de realizar un diagnóstico comprende procesar múltiples enunciados correspondientes a múltiples indicaciones, entonces, cada uno de los enunciados puede ser procesado por el modelo matemático de la Figura 7 para generar múltiples puntuaciones de diagnóstico médico. Para determinar un diagnóstico médico general, es posible que sea necesario combinar las múltiples puntuaciones de diagnóstico médico de alguna manera. En consecuencia, es posible que el modelo matemático entrenado en la Figura 7 no se adapte a un conjunto seleccionado de indicaciones.
Cuando las indicaciones seleccionadas se utilizan en una sesión para diagnosticar a una persona, cada una de las indicaciones puede presentarse a la persona para obtener un enunciado correspondiente a cada una de las indicaciones. En lugar de procesar los enunciados por separado, los enunciados pueden ser procesados simultáneamente por el modelo para generar una puntuación de diagnóstico médico. En consecuencia, un modelo puede adaptarse a las indicaciones seleccionadas porque está entrenado para procesar simultáneamente enunciados correspondientes a cada una de las indicaciones seleccionadas.
La Figura 9 es un diagrama de flujo de una implementación de ejemplo que entrena un modelo matemático que se adapta a un conjunto de indicaciones seleccionadas. En la etapa 910, se obtiene un primer modelo matemático, como por ejemplo utilizando el proceso de la Figura 7. En la etapa 920, se seleccionan una pluralidad de indicaciones usando el primer modelo matemático, como en el proceso de la Figura 8.
En la etapa 930, se entrena un segundo modelo matemático que procesa simultáneamente múltiples elementos de datos del habla correspondientes a la pluralidad de indicaciones seleccionadas para generar una puntuación de diagnóstico médico. Al entrenar el segundo modelo matemático, se puede utilizar un corpus de entrenamiento que incluya sesiones con elementos de datos del habla correspondientes a cada una de la pluralidad de indicaciones seleccionadas. Al entrenar el modelo matemático, la entrada al modelo matemático puede fijarse en los elementos de datos del habla de la sesión y correspondiente a cada una de las indicaciones seleccionadas. El resultado del modelo matemático puede fijarse en un diagnóstico médico conocido.
Los parámetros del modelo pueden luego entrenarse para procesar de manera óptima el elemento de datos del habla simultáneamente para generar una puntuación de diagnóstico médico. Se puede utilizar cualquier técnica de entrenamiento apropiada, como el descenso de gradiente estocástico.
El segundo modelo matemático podrá entonces implementarse como parte de un servicio de diagnóstico de afección médica, tal como un módulo de voz 104, el servicio de la Figura 1, o similar. El segundo modelo matemático puede proporcionar un mejor rendimiento que el primer modelo matemático porque ha sido entrenado para procesar los enunciados simultáneamente en lugar de individualmente y, por lo tanto, el entrenamiento puede combinar mejor la información de todos los enunciados para generar la puntuación del diagnóstico de la afección médica.
La Figura 10 ilustra componentes de una implementación de un dispositivo informático 1000 para implementar cualquiera de las técnicas descritas anteriormente. En la Figura 10, los componentes se muestran como si estuvieran en un solo dispositivo informático, pero los componentes pueden distribuirse entre múltiples dispositivos informáticos, como un sistema de dispositivos informáticos, incluyendo, por ejemplo, un dispositivo informático de usuario final (p. ej., un teléfono inteligente o una tableta) y/o un dispositivo informático de servidor (p. ej., un dispositivo en la nube).
El dispositivo informático 1000 puede incluir cualquier componente típico de un dispositivo informático, tales como memoria volátil o no volátil 1010, uno o más procesadores 1011, y una o más interfaces de red 1012. El dispositivo informático 1000 también puede incluir cualquier componente de entrada y salida, como pantallas, teclados y pantallas táctiles. El dispositivo informático 1000 también puede incluir una variedad de componentes o módulos que proporcionan una funcionalidad específica, y estos componentes o módulos pueden implementarse en el programa informático, el soporte físico, o una combinación de los mismos. A continuación, se describen varios ejemplos de componentes para una implementación de ejemplo, y otras implementaciones pueden incluir componentes adicionales o excluir algunos de los componentes que se describen a continuación.
El dispositivo informático 1000 puede tener un componente de cálculo de rasgo distintivo acústico 1021 que puede calcular rasgos distintivos acústicos para un elemento de datos del habla como se ha descrito anteriormente. El dispositivo informático 1000 puede tener un componente de cálculo de rasgo distintivo del lenguaje 1022 que puede calcular rasgos distintivos del lenguaje para un elemento de datos del habla como se ha descrito anteriormente. El dispositivo informático 1000 puede tener un componente de reconocimiento del habla 1023 que puede generar resultados de reconocimiento del habla para un elemento de datos del habla como se ha descrito anteriormente. El dispositivo informático 1000 puede tener un componente de cálculo de puntuación de selección de rasgo distintivo 1031 que puede calcular puntuaciones de selección para rasgos distintivos como se ha descrito anteriormente. El dispositivo informático 1000 puede tener un componente de cálculo de puntuación de estabilidad de rasgo distintivo 1032 que puede realizar determinaciones de estabilidad o calcular puntuaciones de estabilidad como se ha descrito anteriormente. El dispositivo informático 1000 puede tener un componente de selección de rasgo distintivo 1033 que puede seleccionar rasgos distintivos usando puntuaciones de selección y/o determinaciones de estabilidad como se ha descrito anteriormente. El dispositivo informático 1000 puede tener un componente de cálculo de puntuación de selección de indicación 1041 que puede calcular puntuaciones de selección para indicaciones como se ha descrito anteriormente. El dispositivo informático 1000 puede tener un componente de cálculo de puntuación de estabilidad de indicación 1042 que puede realizar determinaciones de estabilidad o calcular puntuaciones de estabilidad como se ha descrito anteriormente. El dispositivo informático 1000 puede tener un componente de selección de indicación 1043 que puede seleccionar indicaciones usando puntuaciones de selección y/o determinaciones de estabilidad como se ha descrito anteriormente. El dispositivo informático 1000 puede tener un componente de entrenamiento de modelo 1050 que puede entrenar modelos matemáticos como se ha descrito anteriormente. El dispositivo informático 1000 puede tener un componente de diagnóstico de afección médica 1060 que puede procesar elementos de datos del habla para determinar una puntuación de diagnóstico médico como se ha descrito anteriormente.
El dispositivo informático 1000 puede incluir o tener acceso a varios almacenes de datos, tal como el almacén de datos del corpus de entrenamiento 1070. Los almacenes de datos pueden utilizar cualquier tecnología de almacenamiento conocida, como archivos, bases de datos relacionales o no relacionales, o cualquier medio no transitorio legible por ordenador.
La Figura 11 representa una realización de un módulo de voz 104. El módulo de voz 104, en determinadas realizaciones, puede ser sustancialmente similar a uno o más de un módulo de voz de dispositivo 104a y/o un módulo de voz de un sistema de interfaz de administración 104b, como se ha descrito anteriormente con referencia a la Figura 1A. El módulo de voz 104, en la realización representada, incluye un módulo de pregunta 1102, un módulo de respuesta 1104, un módulo de detección 1106 y un módulo de interfaz 1108.
El módulo de pregunta 1102 interroga sobre y/o pregunta a un usuario una o más preguntas, indicaciones, solicitudes, o similares. El módulo de pregunta 1102 interroga de forma audible y/o verbal a un usuario (p. ej., usando un altavoz de un dispositivo informático 102 tal como un altavoz integrado, auriculares, un altavoz o auriculares Bluetooth®, o similares). Por ejemplo, debido a ciertas afecciones médicas potenciales, como una conmoción cerebral, puede resultar difícil para un usuario leer una pregunta y/o indicación, e interrogar al usuario de forma audible puede simplificar y/o acelerar un diagnóstico. En una realización adicional, el módulo de pregunta 1102 puede mostrar una o más preguntas y/u otras indicaciones a un usuario (p. ej., en una pantalla de visualización electrónica de un dispositivo informático 102, o similar), otro usuario (p. ej., un entrenador, un progenitor, un profesional médico, un administrador, o similar) puede leer una o más preguntas y/u otras indicaciones a un usuario, o similar. La una o más preguntas o indicaciones se seleccionan como se ha descrito anteriormente con respecto al componente de selección de indicación 1043, o similar, para facilitar el diagnóstico de una o más afecciones médicas.
En determinadas realizaciones, una pluralidad de módulos de pregunta 1102 dispuestos en una pluralidad de dispositivos informáticos diferentes 102 pueden preguntar y/o interrogar a una pluralidad de usuarios diferentes. Por ejemplo, una pluralidad de módulos de pregunta 1102 distribuidos pueden recopilar muestras de voz para un ensayo clínico, entrenar un modelo de aprendizaje automático para diagnosticar una afección médica, para recopilar datos de prueba para facilitar la selección de indicación, o similares.
El módulo de pregunta 1102, en una realización, interroga y/o de otro modo pregunta a un usuario en un estado de salud predefinido, como un estado de salud conocido, una etapa predefinida de una afección médica, o similar, para recopilar una o más grabaciones de voz de referencia, datos de entrenamiento u otros datos. En determinadas realizaciones, el módulo de pregunta 1102 interroga y/o de otro modo pregunta a un usuario en respuesta a un acontecimiento médico potencial u otro desencadenante. El módulo de pregunta 1102 puede interrogar a un usuario para recopilar grabaciones de voz de caso de prueba u otros datos de caso de prueba en respuesta a que un usuario solicite una evaluación médica, basado en datos de un sensor de un dispositivo informático 102 tal como un dispositivo portátil o móvil, y/o basado en recibir otro desencadenante que indique que puede haber ocurrido una lesión, que se han detectado uno o más síntomas de una enfermedad, o similares. Por ejemplo, en respuesta a un golpe, una caída, un accidente y/u otro acontecimiento potencial de conmoción cerebral (p. ej., en un acontecimiento deportivo u otra actividad), un usuario (p. ej., un jugador lesionado u otra persona, un entrenador, un progenitor, un profesional médico, un administrador, o similar) puede solicitar una evaluación médica (p. ej., usando una interfaz gráfica de usuario del módulo de interfaz 1108 para activar una o más preguntas desde el módulo de pregunta 1102, recopilación de datos de voz y/u otros datos del módulo de respuesta 1104, y/o una evaluación médica desde el módulo de detección 1106, o similar). Una conmoción cerebral, en determinadas realizaciones, puede comprender una alteración en la función cerebral causada por una fuerza directa o indirecta en la cabeza de un usuario. Una conmoción cerebral puede causar dolor de cabeza, inestabilidad, confusión u otra función cerebral alterada, comportamiento y/o personalidad anormal, o similares.
Por ejemplo, en realizaciones en las que la afección médica comprende una conmoción cerebral, el módulo de pregunta 1102 puede interrogar de forma audible a un usuario y/o recopilar datos de sensor asociados con el usuario para detectar si los ojos del usuario se están abriendo, si los ojos del usuario se abren en respuesta al dolor, si los ojos del usuario se abren en respuesta al habla, si los ojos del usuario se abren espontáneamente, si el usuario puede proporcionar una respuesta verbal, si el usuario emite sonidos incomprensibles, si el usuario responde a preguntas u otras indicaciones con palabras inapropiadas, si el usuario está confundido, si el usuario está desorientado, si el usuario proporciona poca o ninguna respuesta motora, si el usuario muestra extensión al dolor (p. ej., abducción del brazo, supinación del antebrazo, o similares), si el usuario presenta una flexión anormal ante el dolor (p. ej., pronación del antebrazo, postura flexora, o similares), si el usuario se retira del dolor, si el usuario localiza el dolor (p. ej., movimiento intencionado hacia el dolor), si el usuario obedece órdenes verbales/audibles desde el módulo de pregunta 1102, o similares. El módulo de pregunta 1102, en algunas realizaciones, puede dirigir algunas preguntas a un usuario que está siendo evaluado y/o diagnosticado, y otras a un administrador (p. ej., un profesional médico, un entrenador, un progenitor, un entrenador, o similar). Por ejemplo, el módulo de pregunta 1102 puede interrogar a un administrador sobre uno o más signos que el administrador puede haber observado en el usuario que está siendo evaluado y/o diagnosticado, como la falta de equilibrio, incoordinación motora, desorientación, confusión, pérdida de memoria, una mirada en blanco o vacía, una lesión facial visible u otra lesión, resultados observados de un examen físico (p. ej., amplitud de movimiento, sensibilidad, sensación, resistencia, un examen de equilibrio, un examen de coordinación, o similar), y/u otra observación.
En determinadas realizaciones, el módulo de pregunta 1102 puede interrogar y/o preguntar a un usuario sobre el acontecimiento deportivo en el que el usuario estaba participando cuando ocurrió el posible acontecimiento médico, el equipo del usuario, la fecha y/u hora, preguntas de prueba de memoria, o similares. Por ejemplo, el módulo de pregunta 1102 puede preguntar de forma audible y/o textual al usuario "¿en qué lugar estamos hoy?", "¿en qué mitad estamos ahora?", "¿quién ha marcado el último en este partido?", "¿con qué equipo jugó la última semana/el último partido?", "¿su equipo ganó el último partido?", "¿en qué mes estamos?", "¿cuál es la fecha de hoy?", "¿en qué día de la semana estamos?", "¿en qué año estamos?", "¿qué hora es ahora?", puede enumerar de forma audible palabras y/o números para el usuario y pedirle que los repita, puede mostrar una serie de imágenes al usuario y pedirle que repita una descripción de la serie de imágenes, o similares. Una o más preguntas y/o indicaciones del módulo de pregunta 1102 pueden permitir que el módulo de detección 1106 determine una puntuación de la herramienta de evaluación de la conmoción cerebral estandarizada (SCAT), una puntuación SCAT2, una puntuación SCAT3, una puntuación SCAT5, una puntuación de coma de Glasgow (GCS), una puntuación de Maddocks, una puntuación de la herramienta de reconocimiento de la conmoción cerebral (CRT) y/u otra puntuación de conmoción cerebral.
El módulo de respuesta 1104 está configurado para recibir datos de respuesta (p. ej., datos de voz de una respuesta verbal, datos de texto de una respuesta escrita, datos de sensor, datos de imagen y/o vídeo de una cámara u otro sensor de imagen, entrada táctil desde una pantalla táctil y/o panel táctil, información de movimiento de un acelerómetro y/o giroscopio, o similar), en respuesta a una o más preguntas y/u otras consultas del módulo de pregunta 1102. Por ejemplo, en realizaciones de acuerdo con las reivindicaciones, el módulo de respuesta 1104 usa un micrófono de un dispositivo informático 102 (p. ej., un dispositivo informático móvil 102 que puede transportarse a un campo de fútbol, otro acontecimiento deportivo, o similar) para registrar respuestas verbales (p. ej., respuestas) de un usuario a una o más preguntas u otras indicaciones del módulo de pregunta 1102.
El módulo de respuesta 1104, en una realización, puede almacenar datos de respuesta recibidos, como grabaciones de voz, datos de sensor, o similares en un medio de almacenamiento legible por ordenador de un dispositivo informático 102, 110, para que el módulo de detección 1106 pueda acceder y/o procesar los datos de respuesta recibidos para diagnosticar y/o evaluar una afección médica, entrenar un modelo para diagnosticar y/o evaluar una afección médica, o similar; para que el módulo de interfaz 1108 pueda proporcionar los datos de respuesta recibidos a uno o más usuarios autorizados; y/o para que los datos de respuesta recibidos sean accesibles para su uso. En otra realización, el módulo de respuesta 1104 puede proporcionar datos de respuesta recibidos directamente al módulo de detección 1106 para diagnosticar y/o evaluar una afección médica (p. ej., sin almacenar los datos de otra manera, almacenar temporalmente y/o almacenar en caché los datos, o similares).
El módulo de respuesta 1104 puede recibir y/o almacenar por separado datos de respuesta de referencia (p. ej., en respuesta a una o más preguntas o indicaciones de referencia del módulo de pregunta 1102) y datos de respuesta de caso de prueba (p. ej., en respuesta a una o más preguntas de caso de prueba o indicaciones del módulo de pregunta basadas en un posible acontecimiento médico, o similares). En determinadas realizaciones, el módulo de respuesta 1104 solo puede recibir datos de respuesta de caso de prueba, y el módulo de detección 1106 puede basar una evaluación u otro diagnóstico de una afección médica en los datos de caso de prueba y un análisis de datos de diferentes usuarios (p. ej., diferentes usuarios que se sabe que tienen la afección médica, o similar). El módulo de respuesta 1104 puede almacenar y/u organizar datos de respuesta recibidos en una base de datos y/u otra estructura de datos predefinida accesible por el módulo de detección 1106, el módulo de interfaz 1108, o similar.
Al almacenar un historial de las respuestas de un usuario (p. ej., datos de respuesta de referencia, datos de respuesta de caso de prueba, evaluaciones, puntuaciones, o similares), en determinadas realizaciones, el módulo de respuesta 1104 puede permitir que el módulo de detección 1106 evalúe dinámicamente una afección médica para el usuario en respuesta a un acontecimiento médico. Por ejemplo, el módulo de respuesta 1104 puede almacenar datos de respuesta para un usuario en un dispositivo informático móvil 102, en un servidor de un sistema de interfaz de administración 108 en comunicación con un dispositivo informático móvil 102 a través de una red de datos 106, 130 o similar, permitir que el módulo de detección 1106 determine una evaluación de una afección médica en el lugar en respuesta a un acontecimiento médico potencial (p. ej., en la banda o en el terreno de juego en un partido de fútbol u otro acontecimiento deportivo en respuesta a un posible acontecimiento de conmoción cerebral, en respuesta a un accidente automovilístico, o similar).
El módulo de detección 1106 está configurado para proporcionar una evaluación y/u otro diagnóstico para un usuario de una afección médica basándose en un análisis de una o más respuestas recibidas de un usuario desde el módulo de respuesta 1104. El módulo de detección 1106, en diversas realizaciones, puede comprender, estar en comunicación con, y/o ser sustancialmente similar al componente de cálculo de rasgo distintivo acústico 210, el componente de reconocimiento del habla 220, el componente de cálculo de rasgo distintivo del lenguaje 230, y/o el clasificador de afección médica 240 descritos anteriormente.
En una realización, el módulo de detección 1106 puede determinar una evaluación u otro diagnóstico de una afección médica para un usuario (p. ej., indicando si el usuario tiene o no la afección médica, una probabilidad de que el usuario tenga la afección médica, una gravedad estimada de la afección médica, o similar) basándose tanto en los datos de respuesta de caso de prueba para el usuario como en los datos de respuesta de referencia recibidos previamente para el mismo usuario (p. ej., para determinar cambios en la voz del usuario, cambios en las respuestas del usuario, o similares). En otras realizaciones, el módulo de detección 1106 puede determinar una evaluación u otro diagnóstico de una afección médica para un usuario basándose en los datos de respuesta del caso de prueba para el usuario y basándose en los datos de respuesta para diferentes usuarios (p. ej., diferentes usuarios previamente diagnosticados con la afección médica, o similares). En una realización adicional, el módulo de detección 1106 puede determinar una evaluación u otro diagnóstico de una afección médica para un usuario basándose en los datos de respuesta de caso de prueba para el usuario, datos de respuesta de referencia para el mismo usuario y datos de respuesta para diferentes usuarios, o similares.
Como se ha descrito anteriormente con respecto al componente de cálculo de rasgo distintivo acústico 210, el componente de reconocimiento del habla 220, el componente de cálculo de rasgo distintivo del lenguaje 230, y/o el clasificador de afección médica 240, en determinadas realizaciones, el módulo de detección 1106 puede extraer uno o más rasgos distintivos de voz (p. ej., rasgos distintivos acústicos y/o rasgos distintivos del lenguaje) de una grabación de voz (p. ej., datos de respuesta de referencia y/o datos de respuesta de caso de prueba) y puede introducir uno o más rasgos distintivos de voz extraídos en un modelo asociado con una afección médica (p. ej., un modelo de aprendizaje automático como un modelo de mezcla gaussiana, un modelo acústico, un modelo de lenguaje, una red neuronal, una red neuronal profunda, un clasificador, una máquina de soporte vectorial, un perceptrón multicapa, o similar), que puede generar una evaluación u otro diagnóstico de la afección médica basándose en uno o más rasgos distintivos de voz extraídos.
En una realización adicional, además de introducir rasgos distintivos de voz extraídos en un modelo para diagnosticar una afección médica, el módulo de detección 1106 puede introducir otros datos suplementarios asociados con el usuario en el modelo y puede diagnosticar la afección médica basándose en el resultado. Por ejemplo, el módulo de detección 1106 puede introducir datos de sensor desde un dispositivo informático 102 de un usuario en un modelo (p. ej., junto con rasgos distintivos de voz extraídos u otros datos del habla) para determinar una evaluación u otros diagnósticos de una afección médica de un usuario.
En una realización, el módulo de detección 1106 puede extraer uno o más rasgos distintivos de imagen a partir de datos de imagen (p. ej., una o más imágenes, vídeo, o similar del usuario, de la cara del usuario, de otra parte del cuerpo del usuario asociada con una afección médica, o similar) desde un sensor de imagen tal como una cámara de un dispositivo informático 102, y puede introducir uno o más rasgos distintivos de imagen en un modelo (p. ej., con rasgos distintivos de voz extraídos o similares). En una realización adicional, el módulo de detección 1106 puede basar una evaluación u otro diagnóstico al menos parcialmente en entradas táctiles recibidas de un usuario en una pantalla táctil, panel táctil, o similar de un dispositivo informático 102.
Por ejemplo, el módulo de pregunta 1102 puede proporcionar un videojuego interactivo o similar en una pantalla electrónica de un dispositivo informático 102, y el videojuego interactivo puede configurarse para probar a un usuario para detectar uno o más síntomas de una afección médica (p. ej., prueba de reflejos, destreza, tiempo de reacción, o similares) y el módulo de detección 1106 puede extraer uno o más rasgos distintivos de las entradas táctiles recibidas del usuario durante el videojuego interactivo (p. ej., una puntuación en el videojuego, tiempos de reacción del usuario, métricas de precisión táctil para el usuario, o similares) y puede introducir el uno o más rasgos distintivos extraídos en un modelo para diagnosticar una afección médica (p. ej., con uno o más rasgos distintivos de voz extraídos, o similares). En determinadas realizaciones, el módulo de detección 1106 puede extraer uno o más rasgos distintivos de la información de movimiento medida por un acelerómetro, un giroscopio y/u otro sensor de movimiento de un dispositivo informático móvil 102 para un usuario, y puede introducir uno o más rasgos distintivos extraídos en un modelo para diagnosticar una afección médica (p. ej., con uno o más rasgos distintivos de voz extraídos, o similares).
Como se ha descrito anteriormente, el módulo de detección 1106 determina una evaluación u otro diagnóstico para una afección médica que comprende una afección neurológica tal como una conmoción cerebral, o una o más de depresión, estrés, ictus, bienestar cognitivo, estado de ánimo, sinceridad, enfermedad de Alzheimer (EA), enfermedad de Parkinson y opcionalmente cáncer o similares.
En determinadas realizaciones, el módulo de detección 1106 puede configurarse para determinar una evaluación u otro diagnóstico de una afección médica basándose en uno o más rasgos distintivos acústicos de los datos de respuesta verbal recibidos, sin tener en cuenta uno o más rasgos distintivos de lenguaje de los datos de respuesta verbal recibidos (p. ej., sin ningún rasgo distintivo de lenguaje, con solo uno o más rasgos distintivos de lenguaje predefinidos, sin ningún reconocimiento automático de habla, o similares). De este modo, en algunas realizaciones, la evaluación y/o el diagnóstico del módulo de detección pueden ser independientes de un lenguaje y/o un dialecto de la respuesta verbal recibida, de modo que el módulo de detección 1106 puede proporcionar evaluaciones y/o diagnósticos para usuarios en diferentes idiomas utilizando rasgos distintivos acústicos de los datos de respuesta verbal recibidos. En otras realizaciones, el módulo de detección 1106 puede basar una evaluación y/o diagnóstico de una afección médica tanto en rasgos distintivos acústicos como en rasgos distintivos de lenguaje de los datos de respuesta verbal recibidos.
En determinadas realizaciones, el módulo de detección 1106 puede determinar una evaluación y/o diagnóstico de una afección médica exclusivamente en un dispositivo informático móvil 102 de un usuario. Por ejemplo, en una situación de emergencia, o similar, puede ser necesario un diagnóstico lo antes posible, y puede que no haya tiempo para cargar respuestas verbales grabadas a un servidor de un sistema de interfaz de administración 108 para su procesamiento, o un dispositivo informático móvil 102 puede no tener una conexión a una red de datos 106, 130, o puede no tener una conexión lo suficientemente rápida. El módulo de detección 1106, en una realización, puede utilizar uno o más modelos configurados para ejecutarse utilizando potencia de procesamiento, capacidad de memoria volátil y/o capacidad de almacenamiento no volátil disponible en un dispositivo informático móvil 102. Por ejemplo, un modelo utilizado por un módulo de detección 1106 en un dispositivo informático móvil puede minimizar el tamaño de los clasificadores (p. ej., la capacidad de almacenamiento volátil y/o no volátil requerida) limitando la multiplicación de matrices en el modelo (p. ej., sin multiplicación de matrices, solo un número predefinido de multiplicaciones de matrices, o similares), incluso si el uso de una multiplicación de matrices adicional puede mejorar la precisión de la evaluación y/o el diagnóstico.
En una realización, el módulo de detección 1106 determina la evaluación y/o diagnóstico único y/o exclusivo en un dispositivo informático móvil 102. En una realización adicional, un módulo de detección 1106 puede determinar una primera evaluación y/o diagnóstico (p. ej., una primera puntuación) en un dispositivo informático móvil 102, y otro módulo de detección 1106 puede determinar una segunda evaluación y/o diagnóstico (p. ej., una segunda puntuación, una evaluación más precisa y/o más detallada, o similares). En otra realización, el módulo de detección 1106 puede determinar la evaluación y/o diagnóstico único y/o exclusivo en un dispositivo de servidor de un sistema de interfaz de administración 108.
En determinadas realizaciones, se puede configurar una pluralidad de módulos de voz 104 para realizar uno o más ensayos clínicos con usuarios que comprenden participantes del ensayo clínico (p. ej., determinar la eficacia de un tratamiento médico basándose en un análisis de los datos del habla de los participantes). En dichas realizaciones, el módulo de detección 1106 puede determinar una evaluación de la eficacia de un tratamiento médico para la afección médica asociada con el ensayo clínico. Por ejemplo, los usuarios, como los participantes en ensayos clínicos, pueden dividirse en al menos un grupo de placebo que no recibe el tratamiento médico y un grupo diferente que recibe el tratamiento médico, o en múltiples grupos que reciben diferentes tratamientos médicos, o similares.
Se puede configurar una pluralidad de módulos de detección 1106 distribuidos para proporcionar evaluaciones con ocultación de una afección médica tanto para un grupo de placebo como para uno o más grupos que reciben un tratamiento médico, lo que permite que uno o más administradores del ensayo clínico determinen la eficacia del tratamiento médico. Por ejemplo, el módulo de detección 1106 puede determinar la gravedad de una afección médica, la gravedad de uno o más síntomas de una afección médica, o similar para el grupo de placebo y para el grupo que recibe el tratamiento médico y comparar los dos. Una evaluación "con ocultación", como se utiliza en el presente documento, es una evaluación que no se basa en si un participante está o no en un grupo de placebo o en un grupo que recibe un tratamiento médico. Por ejemplo, en determinadas realizaciones, un módulo de detección 1106 puede usar el mismo modelo, el mismo análisis, o similar, tanto para los participantes de un ensayo clínico en un grupo de placebo como para los participantes de un ensayo clínico en un grupo que recibe un tratamiento médico.
En determinadas realizaciones, en lugar de basar una evaluación únicamente en la eficacia de un tratamiento médico para tratar la afección médica asociada con el ensayo clínico, el módulo de detección 1106 está configurado para basar una evaluación al menos parcialmente en uno o más biomarcadores de datos de respuesta recibidos (p. ej., datos de respuesta verbal, datos de sensores, o similares) que indican una calidad de vida para el usuario. Por ejemplo, además de evaluar la afección médica asociada con un ensayo clínico, el módulo de detección 1106 puede evaluar uno o más biomarcadores de calidad de vida que indican fatiga física, cansancio, fatiga mental, estrés, ansiedad, depresión, y/u otros parámetros asociados con la calidad de vida del usuario. Un biomarcador, como se utiliza en el presente documento, comprende un indicador medible de un usuario de algún estado biológico y/o estado del usuario (p. ej., presencia de una enfermedad y/o lesión, presencia de uno o más síntomas, una calidad de vida actual de un usuario, o similares). Un biomarcador, en determinadas realizaciones, puede comprender una característica objetivamente identificable por el módulo de detección 1106 en datos de respuesta de un usuario, como un rasgo distintivo acústico, un rasgo distintivo de lenguaje, una característica identificable en los datos de sensor, o similares.
El módulo de detección 1106, en determinadas realizaciones, puede utilizar inicialmente datos de respuesta de referencia de los usuarios (p. ej., posibles participantes de un ensayo clínico) para seleccionar a los participantes para un ensayo clínico (p. ej., determinar una evaluación que comprende la idoneidad de un usuario para participar en el ensayo clínico por una afección médica, o similar). Por ejemplo, una farmacoterapia contra el cáncer puede ser eficaz, sin embargo, puede ser perjudicial para la calidad de vida del individuo que utiliza la farmacoterapia contra el cáncer. En lugar de medir subjetivamente la calidad de vida y/o las consecuencias comportamentales de recibir tratamiento o fármacos mediante un cuestionario o herramienta similar, en determinadas realizaciones, el módulo de detección 1106 puede identificar uno o más cambios en la calidad de vida de un usuario (p. ej., un participante de un ensayo clínico) utilizando objetivamente biomarcadores u otros indicadores en los datos de respuesta verbal del usuario.
El módulo de interfaz 1108, en determinadas realizaciones, coopera con el módulo de pregunta 1102 para mostrar una o más preguntas y/o indicaciones a un usuario (p. ej., en lugar de interrogar audiblemente al usuario, además de interrogar audiblemente al usuario, o similares). El módulo de respuesta 1104 puede mostrar uno o más elementos de interfaz de usuario (p. ej., un botón de reproducción, un botón de repetición, un botón de siguiente pregunta, un botón de pregunta anterior, o similar) que permite a un usuario navegar a través de una o más preguntas del módulo de pregunta 1102. En una realización, el módulo de determinación 1106 puede determinar si una respuesta de un usuario a una pregunta del módulo de pregunta 1102 es correcta o incorrecta (p. ej., basado en un análisis de voz usando un<modelo de aprendizaje automático, o similar) y el módulo de interfaz>1108<puede marcar gráficamente la respuesta>correcta o incorrecta (p. ej., dinámicamente, durante la administración de una evaluación por parte del módulo de pregunta 1102, o similar). En una realización adicional, el módulo de determinación 1106 puede usar reconocimiento automático del habla para traducir respuestas de voz grabadas de un usuario desde el módulo de respuesta 1104 a texto, que el módulo de interfaz 1108 puede mostrar al usuario (p. ej., dinámicamente, en tiempo real, o similares).
En determinadas realizaciones, el módulo de interconexión del sensor 1108 (p. ej., en cooperación con el módulo de pregunta 1102), puede solicitar al usuario que recite un pasaje (p. ej., un pasaje que incluye oraciones, conjuntos de palabras, letras, números, monosílabos, o similares). El módulo de interfaz 1108 puede solicitar al usuario que recite el mismo pasaje y/o conjunto de pasajes cada vez que se recopilan datos (p. ej., recopilación de datos de respuesta de referencia, recopilación de datos de respuesta de caso de prueba, recopilación de datos de detección de ensayos clínicos, recopilación de datos de ensayos clínicos, o similares).
El módulo de interfaz 1108, en algunas realizaciones, puede solicitarle a un administrador una evaluación (p. ej., un entrenador, un progenitor, un profesional médico, o similar) con instrucciones para realizar uno o más exámenes físicos de un usuario que está siendo evaluado. Por ejemplo, el módulo de interfaz 1108 puede proporcionar instrucciones para un examen de equilibrio, un examen de coordinación motora, un examen de amplitud de movimiento, un examen de sensibilidad, un examen de sensación táctil, un examen de fuerza, o similar, y puede proporcionar una interfaz para que el administrador registre los resultados (p. ej., observaciones del administrador) para el módulo de respuesta 1104.
En una realización, el módulo de interfaz 1108 proporciona a uno o más usuarios acceso a los datos de respuesta recibidos desde el módulo de respuesta 1104 (p. ej., grabaciones de voz, datos de respuesta de referencia, datos de respuesta de caso de prueba, datos de sensor, o similares), a evaluaciones y/u otros diagnósticos desde el módulo de detección 1106, o similares. El módulo de interfaz 1108 puede permitir a un usuario acceder a los datos de respuesta recibidos, evaluaciones y/u otros diagnósticos, o similares desde múltiples ubicaciones (p. ej., desde una aplicación móvil en un dispositivo informático móvil 102, desde un navegador web de un dispositivo informático diferente 102 accediendo a un servidor web de un servidor de un sistema de interfaz de administración 108, o similar).
Por ejemplo, el módulo de interfaz 1108 puede proporcionar a un usuario una evaluación de referencia y/o puntuación basada en datos de respuesta de referencia, una evaluación y/o puntuación de un caso de prueba basada en los datos de respuesta del caso de prueba, una evaluación de seguimiento y/o puntuación basada en respuestas posteriores (p. ej., una evaluación de seguimiento en casa durante la recuperación de una afección médica previamente evaluada/diagnosticada), o similar, cada uno a través de la misma interfaz gráfica de usuario en uno o más dispositivos informáticos 102, junto con los datos de respuesta asociados para cada evaluación y/o puntuación, o similares. El módulo de interfaz 1108 puede mostrar una evaluación y/o puntuación de referencia junto con una evaluación y/o puntuación actual (p. ej., caso de prueba) como comparación (p. ej., una al lado de la otra), puede mostrar una diferencia entre una evaluación y/o puntuación inicial y una evaluación y/o puntuación actual (p. ej., caso de prueba), o similares. En una realización, el módulo de interfaz 1108 puede mostrar un desglose de una evaluación y/o puntuación, con subpuntuaciones en diferentes categorías, o similares.
El módulo de interfaz 1108, en algunas realizaciones, puede agregar datos de respuesta, puntuaciones u otras evaluaciones, o similares para un usuario de múltiples deportes, equipos, escuelas, o similares, y mostrarlos en una única interfaz gráfica de usuario. De este modo, el módulo de interfaz 1108 puede proporcionar profesionales médicos, entrenadores, administradores, o similares, un historial y/o estado de salud más completo del usuario, historial de lesiones, o similares, para tomar decisiones médicas más informadas.
En determinadas realizaciones, el módulo de interfaz 1108 puede imponer permisos de control de acceso (p. ej., para privacidad, por seguridad, para el cumplimiento de la HIPAA, o similares) mediante la autenticación de usuarios (p. ej., con un nombre de usuario y contraseña u otras credenciales de autenticación) y proporcionar a los usuarios acceso a grabaciones de voz u otros datos de respuesta, evaluaciones u otros diagnósticos, o similares basados en los permisos de control de acceso asociados con el usuario. En determinadas realizaciones, el módulo de interfaz 1108 impone permisos de control de acceso jerárquico para diferentes usuarios, y los usuarios de cada nivel de la jerarquía tienen acceso a los datos asociados con cualquier nivel inferior a su nivel en la jerarquía.
Por ejemplo, en una realización donde el módulo de voz 104 está configurado para diagnosticar conmociones cerebrales y/u otra afección médica para atletas, los padres y/o tutores pueden tener permisos de acceso a los datos de respuesta personal de los atletas (p. ej., grabaciones de voz), evaluaciones y/u otros diagnósticos; un entrenador puede tener acceso a datos similares para cada miembro del equipo (p. ej., múltiples atletas u otros usuarios); un administrador de una escuela o liga puede tener acceso a datos similares de miembros de varios equipos (p. ej., cada equipo de la escuela, cada equipo de la liga, o similares); un administrador de distrito o región puede tener acceso a datos similares de miembros de equipos de varias escuelas o ligas; o similares. En determinadas realizaciones, el módulo de interfaz 1108 puede anonimizar los datos (p. ej., datos de respuesta, como grabaciones de voz y/o datos de sensores, evaluaciones y/u otros diagnósticos, o similares) para ciertos usuarios, como proporcionar información personalizada para un individuo y su entrenador, pero datos promediados o de otra manera anonimizados (p. ej., por equipo, por escuela, por posición, por liga, o similar) para otros niveles en una jerarquía.
En una realización donde el módulo de voz 104 está realizando un ensayo clínico, el módulo de interfaz 1108 puede bloquear que usuarios individuales (p. ej., participantes del ensayo clínico) accedan al menos a una parte de sus propios datos (p. ej., datos de respuesta, evaluaciones u otros diagnósticos, tanto datos de respuesta como evaluaciones, o similares), mientras que el módulo de interfaz 1108 puede proporcionar a uno o más administradores del ensayo clínico permisos de control de acceso jerárquico con acceso a los datos almacenados para los usuarios (p. ej., respuestas verbales registradas de referencia almacenadas, respuestas verbales registradas de caso de prueba, evaluaciones u otros diagnósticos, o similares).
La Figura 12 representa una realización de un método 1200 para evaluación médica basada en la voz. El método 1200 comienza y un módulo de pregunta 1102 interroga 1202 a un usuario (p. ej., audiblemente desde un altavoz de un dispositivo informático 102, textualmente en una pantalla electrónica de un dispositivo informático 102, o similar).
Un módulo de respuesta 1104 recibe 1204 una respuesta del usuario (p. ej., una respuesta verbal de un micrófono de un dispositivo informático 102, una respuesta táctil desde una pantalla táctil y/o panel táctil de un dispositivo informático 102, entrada de sensor desde uno o más sensores de un dispositivo informático 102, una selección o clic de un ratón u otro dispositivo de entrada de un dispositivo informático 102, una respuesta de texto introducida por el usuario en un teclado y/o pantalla táctil de un dispositivo informático 102, o similar). Un módulo de detección 1106 evalúa 1206 al usuario en busca de una afección médica basándose en un análisis de la respuesta 1204 recibida del usuario y finaliza el método 1200.
La Figura 13 representa una realización de un método 1300 para evaluación médica basada en la voz. Un módulo de pregunta 1102 interroga 1302 a un usuario con una o más preguntas usando una interfaz de usuario de un dispositivo informático 102 (p. ej., un micrófono, una pantalla de visualización electrónica, una pantalla táctil y/o uno o más sensores). Un módulo de respuesta 1104 registra 1304 una o más respuestas de referencia (p. ej., respuestas verbales como grabaciones de audio, respuestas de texto y/o datos de sensor como un archivo de datos u otra estructura de datos, o similar) del usuario interrogado 1302 con una o más preguntas en un dispositivo informático 102, 108.
Un módulo de detección 1106 detecta 1306 un acontecimiento médico potencial (p. ej., basado en la solicitud por un usuario de una evaluación médica, basado en datos de un sensor y/o basado en la recepción de otro desencadenante). Si el módulo de detección 1106 no detecta 1306 un acontecimiento médico potencial, el método 1300 continúa hasta que el módulo de detección 1106 detecta 1306 un acontecimiento médico potencial.
En respuesta a que el módulo de detección 1106 detecte 1306 un acontecimiento médico potencial (p. ej., un impacto u otro acontecimiento que pueda haber causado una conmoción cerebral; un indicador de una posible afección médica como depresión, estrés, ictus, bienestar cognitivo, estado de ánimo, sinceridad, enfermedad de Alzheimer (EA), enfermedad de Parkinson o similares; una solicitud de un usuario; y/u otro desencadenante), el módulo de pregunta 1102 vuelve a interrogar 1308 al usuario con una o más preguntas usando una interfaz de usuario de un dispositivo informático 102.
Un módulo de respuesta 1104 registra 1310, en un dispositivo informático 102, 108, una o más respuestas de caso de prueba del usuario tras ser interrogado 1308 con la una o más preguntas nuevas. Un módulo de detección 1106 evalúa 1312, en un dispositivo informático 102, 108, una probabilidad de que el usuario tenga una afección médica (p. ej., conmoción cerebral, depresión, estrés, ictus, bienestar cognitivo, estado de ánimo, sinceridad, enfermedad de Alzheimer (EA), enfermedad de Parkinson, o similar) basado en un análisis de voz de la una o más respuestas de referencia registradas 1304 y la una o más respuestas de caso de prueba registradas 1310. El método 1300 continúa hasta que el módulo de detección 1106 detecta 1306 un acontecimiento médico potencial posterior.
Un medio para interrogar a un usuario (p. ej., audible y/o de otro modo) desde un dispositivo informático 102, en diversas realizaciones, puede comprender un módulo de voz 104, un módulo de voz de dispositivo 104a, un módulo de voz de un sistema de interfaz de administración 104b, un módulo de pregunta 1102, un dispositivo informático móvil 102, un dispositivo informático de un servidor de un sistema de interfaz de administración 108, un altavoz electrónico de un dispositivo informático 102, 108, auriculares, una pantalla de visualización electrónica de un dispositivo informático 102, 108, un dispositivo de interfaz de usuario, una interfaz de red, una aplicación móvil, un procesador, un circuito integrado de aplicación específica (ASIC), una matriz de puertas programables en campo (FPGA), lógica programable, otro soporte físico lógico y/u otro código del programa ejecutable almacenado en un medio de almacenamiento no transitorio legible por ordenador. Otras realizaciones pueden comprender medios sustancialmente similares o equivalentes para interrogar a un usuario.
Un medio para recibir una respuesta (p. ej., una respuesta verbal, una respuesta textual, datos de sensor, o similares)<de un usuario en un dispositivo informático 102,>108<, en diversas realizaciones, puede comprender un módulo de voz>104, un módulo de voz de dispositivo 104a, un módulo de voz de un sistema de interfaz de administración 104b, un módulo de respuesta 1104, un dispositivo informático móvil 102, un dispositivo informático de un servidor de un sistema<de interfaz de administración>108<, un micrófono, un dispositivo de entrada de usuario, una pantalla táctil, un panel>táctil, un teclado, un ratón, un acelerómetro, un giroscopio, un sensor de imagen, una aplicación móvil, un procesador, un circuito integrado de aplicación específica (ASIC), una matriz de puertas programables en campo (FPGA), lógica programable, otro soporte físico lógico y/u otro código del programa ejecutable almacenado en un medio de almacenamiento no transitorio legible por ordenador. Otras realizaciones pueden comprender medios sustancialmente similares o equivalentes para recibir una respuesta.
Un medio para evaluar a un usuario para detectar una afección médica basándose en una respuesta recibida del usuario, en diversas realizaciones, puede comprender un módulo de voz 104, un módulo de voz de dispositivo 104a, un módulo de voz de un sistema de interfaz de administración 104b, un módulo de detección 1106, un dispositivo informático móvil 102, un dispositivo informático de un servidor de un sistema de interfaz de administración 108, una aplicación móvil, aprendizaje automático, inteligencia artificial, un componente de cálculo de rasgo distintivo acústico 210, un componente de reconocimiento del habla 220, un modelo de mezcla gaussiana, un modelo acústico, un modelo de lenguaje, una red neuronal, una red neuronal profunda, un clasificador de afección médica 240, un clasificador, una máquina de soporte vectorial, un perceptrón multicapa, un procesador, un circuito integrado de aplicación específica (ASIC), una matriz de puertas programables en campo (FPGA), lógica programable, otro soporte físico lógico y/u otro código del programa ejecutable almacenado en un medio de almacenamiento no transitorio legible por ordenador. Otras realizaciones pueden comprender medios sustancialmente similares o equivalentes para evaluar una afección médica de un usuario.
Un medio para autenticar diferentes usuarios en una jerarquía de usuarios, en diversas realizaciones, puede comprender un módulo de voz 104, un módulo de voz de dispositivo 104a, un módulo de voz de un sistema de interfaz de administración 104b, un módulo de interfaz 1108, un dispositivo informático móvil 102, un dispositivo informático de un servidor de un sistema de interfaz de administración 108, una aplicación móvil, un procesador, un circuito integrado de aplicación específica (ASIC), una matriz de puertas programables en campo (FPGA), lógica programable, otro soporte físico lógico y/u otro código del programa ejecutable almacenado en un medio de almacenamiento no transitorio legible por ordenador. Otras realizaciones pueden comprender medios sustancialmente similares o equivalentes para autenticar a diferentes usuarios.
Un medio para proporcionar acceso a diferentes grabaciones y/o diferentes evaluaciones a diferentes usuarios (p. ej., basado en permisos de control de acceso jerárquico para la jerarquía de usuarios, o similares), en diversas realizaciones, puede comprender un módulo de voz 104, un módulo de voz de dispositivo 104a, un módulo de voz de un sistema de interfaz de administración 104b, un módulo de interfaz 1108, un dispositivo informático móvil 102, un dispositivo informático de un servidor de un sistema de interfaz de administración 108, una aplicación móvil, un procesador, un circuito integrado de aplicación específica (ASIC), una matriz de puertas programables en campo (FPGA), lógica programable, otro soporte físico lógico y/u otro código del programa ejecutable almacenado en un medio de almacenamiento no transitorio legible por ordenador. Otras realizaciones pueden comprender medios sustancialmente similares o equivalentes para proporcionar acceso a diferentes grabaciones y/o diferentes evaluaciones a diferentes usuarios.
Los métodos y sistemas descritos en el presente documento pueden implementarse en parte o en su totalidad a través de una máquina que ejecuta un programa informático, códigos de programa y/o instrucciones en un procesador. "Procesador", tal como se utiliza en el presente documento, incluye al menos un procesador y, a menos que el contexto indique claramente lo contrario, el plural y el singular deben entenderse intercambiables. Cualquier aspecto de la presente divulgación puede implementarse como un método en la máquina, como un sistema o aparato como parte de o en relación con la máquina, o como un producto de programa informático incorporado en un medio legible por ordenador que se ejecuta en una o más de las máquinas. El procesador puede ser parte de un servidor, cliente, infraestructura de red, plataforma informática móvil, plataforma informática estacionaria u otra plataforma informática. Un procesador puede ser cualquier tipo de dispositivo de cálculo o de procesamiento capaz de ejecutar instrucciones de un programa, códigos, instrucciones binarias y similares. El procesador puede ser o incluir un procesador de señal, procesador digital, procesador integrado, microprocesador o cualquier variante como un coprocesador (coprocesador matemático, coprocesador gráfico, coprocesador de comunicación y similares) y similares que puedan facilitar directa o indirectamente la ejecución del código del programa o de las instrucciones del programa almacenadas en el mismo. De forma adicional, el procesador puede permitir la ejecución de múltiples programas, hilos y códigos. Los subprocesos pueden ejecutarse simultáneamente para mejorar el rendimiento del procesador y facilitar las operaciones simultáneas de la aplicación. A modo de implementación, métodos, códigos de programa, instrucciones de programa y similares descritos en el presente documento en uno o más subprocesos. El hilo puede generar otros hilos a los que se les pueden asignar prioridades asociadas; el procesador puede ejecutar estos subprocesos según la prioridad o cualquier otro orden según las instrucciones proporcionadas en el código del programa. El procesador puede incluir memoria que almacena métodos, códigos, instrucciones y programas descritos en el presente documento y en otros lugares. El procesador puede acceder a un medio de almacenamiento a través de una interfaz que puede almacenar métodos, códigos e instrucciones como se describen en el presente documento y en otros lugares. El medio de almacenamiento asociado con el procesador para almacenar métodos, programas, códigos, instrucciones del programa u otro tipo de instrucciones capaces de ser ejecutadas por el dispositivo informático o de procesamiento pueden incluir, entre otros, uno o más CD-ROM, DVD, memoria, disco duro, unidad flash, RAM, ROM, caché y similares.
Un procesador puede incluir uno o más núcleos que pueden mejorar la velocidad y el rendimiento de un multiprocesador. En realizaciones, el proceso puede ser un procesador de doble núcleo, procesadores de cuatro núcleos, otros multiprocesadores a nivel de chip y similares que combinan dos o más núcleos independientes (llamados troquel).
Los métodos y sistemas descritos en el presente documento pueden implementarse en parte o en su totalidad a través de una máquina que ejecuta un programa informático en un servidor, cliente, cortafuego, puerta de enlace, conector, enrutador u otro ordenador y/o soporte físico de red. El programa informático puede estar asociado con un servidor que puede incluir un servidor de archivos, servidor de impresión, servidor de dominio, servidor de Internet, servidor de intranet y otras variantes como servidor secundario, servidor huésped, servidor distribuido y similares. El servidor puede incluir una o más memorias, procesadores, medios legibles por ordenador, medios de almacenamiento, puertos (físicos y virtuales), dispositivos de comunicación e interfaces capaces de acceder a otros servidores, clientes, máquinas y dispositivos a través de un medio cableado o inalámbrico, y similares. Los métodos, programas o códigos como se describe en el presente documento y en otros lugares pueden ser ejecutados por el servidor. De forma adicional, otros dispositivos necesarios para la ejecución de los métodos descritos en esta solicitud pueden considerarse parte de la infraestructura asociada con el servidor.
El servidor puede proporcionar una interfaz para otros dispositivos, incluidos, sin limitación, clientes, otros servidores, impresoras, servidores de bases de datos, servidores de impresión, servidores de archivos, servidores de comunicación, servidores distribuidos y similares. Adicionalmente, este acoplamiento y/o conexión puede facilitar la ejecución remota del programa a través de la red. La conexión en red de algunos o todos estos dispositivos puede facilitar el procesamiento paralelo de un programa o método en una o más ubicaciones sin desviarse del alcance de la divulgación. De forma adicional, cualquiera de los dispositivos conectados al servidor a través de una interfaz puede incluir al menos un medio de almacenamiento capaz de almacenar métodos, programas, código y/o instrucciones. Un repositorio central puede proporcionar instrucciones de programa para ejecutar en diferentes dispositivos. En esta implementación, el repositorio remoto puede actuar como un medio de almacenamiento para el código del programa, instrucciones y programas.
El programa informático puede estar asociado con un cliente que puede incluir un cliente de archivo, cliente de impresión, cliente de dominio, cliente de Internet, cliente de intranet y otras variantes como cliente secundario, cliente anfitrión, cliente distribuido y similares. El cliente puede incluir una o más memorias, procesadores, medios legibles por ordenador, medios de almacenamiento, puertos (físicos y virtuales), dispositivos de comunicación e interfaces capaces de acceder a otros clientes, servidores, máquinas y dispositivos a través de un medio cableado o inalámbrico, y similares. Los métodos, programas o códigos como se describe en el presente documento y en otros lugares pueden ser ejecutados por el cliente. De forma adicional, otros dispositivos necesarios para la ejecución de los métodos descritos en esta solicitud pueden considerarse parte de la infraestructura asociada con el cliente.
El cliente puede proporcionar una interfaz para otros dispositivos, incluidos, sin limitación, servidores, otros clientes, impresoras, servidores de bases de datos, servidores de impresión, servidores de archivos, servidores de comunicación, servidores distribuidos y similares. Adicionalmente, este acoplamiento y/o conexión puede facilitar la ejecución remota del programa a través de la red. La conexión en red de algunos o todos estos dispositivos puede facilitar el procesamiento paralelo de un programa o método en una o más ubicaciones sin desviarse del alcance de la divulgación. De forma adicional, cualquiera de los dispositivos conectados al cliente a través de una interfaz puede incluir al menos un medio de almacenamiento capaz de almacenar métodos, programas, aplicaciones, código y/o instrucciones. Un repositorio central puede proporcionar instrucciones de programa para ejecutar en diferentes dispositivos. En esta implementación, el repositorio remoto puede actuar como un medio de almacenamiento para el código del programa, instrucciones y programas.
Los métodos y sistemas descritos en el presente documento pueden implementarse en parte o en su totalidad a través de infraestructuras de red. La infraestructura de red puede incluir elementos tales como dispositivos informáticos, servidores, enrutadores, nodos, cortafuegos, clientes, ordenadores personales, dispositivos de comunicación, dispositivos de enrutamiento y otros dispositivos activos y pasivos, módulos y/o componentes conocidos en la técnica. El o los dispositivos informáticos y/o no informáticos asociados con la infraestructura de red pueden incluir, aparte de otros componentes, un medio de almacenamiento como memoria flash, buffer, pila, RAM, ROM y similares. Los procesos, métodos, códigos de programa, instrucciones descritos en el presente documento y en otros lugares pueden ser ejecutados por uno o más de los elementos de infraestructura de la red.
Los métodos, los códigos de programa y las instrucciones descritos en el presente documento y en otros lugares pueden implementarse en una red celular que tenga múltiples celdas. La red celular puede ser una red de acceso múltiple por división de frecuencia (FDMA) o una red de acceso múltiple por división de código (CDMA). La red celular puede incluir dispositivos móviles, sitios de celda, estaciones base, repetidores, antenas, torres y similares. La red celular puede ser GSM, GPRS, 3G, EVDO, malla u otros tipos de redes.
Los métodos, los códigos de programas y las instrucciones descritos en el presente documento y en otros lugares pueden implementarse en o a través de dispositivos móviles. Los dispositivos móviles pueden incluir dispositivos de navegación, teléfonos celulares, teléfonos móviles, asistentes digitales personales móviles, ordenadores portátiles, ordenadores de mano, netbooks, localizadores, lectores de libros electrónicos, reproductores de música y similares. Estos dispositivos pueden incluir, aparte de otros componentes, un medio de almacenamiento como una memoria flash, buffer, RAM, ROM y uno o más dispositivos informáticos. Los dispositivos informáticos asociados con dispositivos móviles pueden estar habilitados para ejecutar códigos de programa, métodos e instrucciones almacenados en ellos. Como alternativa, los dispositivos móviles pueden configurarse para ejecutar instrucciones en colaboración con otros dispositivos. Los dispositivos móviles pueden comunicarse con estaciones base interconectadas con servidores y configuradas para ejecutar códigos de programa. Los dispositivos móviles pueden comunicarse en una red de pares, red de malla u otra red de comunicaciones. El código del programa puede almacenarse en el medio de almacenamiento asociado con el servidor y ejecutarse mediante un dispositivo informático integrado dentro del servidor. La estación base puede incluir un dispositivo informático y un medio de almacenamiento. El dispositivo de almacenamiento puede almacenar códigos de programa e instrucciones ejecutadas por los dispositivos informáticos asociados con la estación base.
El programa informático, los códigos de programa y/o las instrucciones pueden almacenarse y/o acceder a ellos en medios legibles por máquina que pueden incluir: componentes de ordenador, dispositivos y medios de grabación que retienen datos digitales utilizados para cálculo durante algún intervalo de tiempo; almacenamiento de semiconductores conocido como memoria de acceso aleatorio (RAM); almacenamiento masivo generalmente para almacenamiento más permanente, como discos ópticos, formas de almacenamiento magnético como discos duros, cintas, tambores, tarjetas y otros tipos; registros de procesador, memoria caché, memoria volátil, memoria no volátil; almacenamiento óptico como CD, DVD; medios extraíbles como memoria flash (p. ej., memorias USB o llaves), disquetes, cinta magnética, cintas de papel, tarjetas perforadas, discos RAM independientes, unidades zip, almacenamiento masivo extraíble, fuera de línea y similares; otra memoria de ordenador como memoria dinámica, memoria estática, almacenamiento de lectura/escritura, almacenamiento mutable, solo lectura, acceso aleatorio, acceso secuencial, ubicación direccionable, archivo direccionable, contenido direccionable, almacenamiento conectado a la red, red de área de almacenamiento, códigos de barras, tinta magnética y similares.
Los métodos y sistemas descritos en el presente documento pueden transformar elementos físicos y/o intangibles de un estado a otro. Los métodos y sistemas descritos en el presente documento también pueden transformar datos que representan elementos físicos y/o intangibles de un estado a otro.
Las realizaciones descritas deben considerarse únicamente ilustrativas y no restrictivas a todos los respectos. El alcance de la invención, por lo tanto, está indicado por las reivindicaciones adjuntas y no por la descripción anterior. Estarán abarcados dentro de su alcance todos los cambios que entren dentro del significado y el alcance de equivalencia de las reivindicaciones.
Claims (13)
1. Un aparato, que comprende:
un módulo de pregunta (1102) configurado para interrogar de forma audible a un usuario desde un altavoz de un dispositivo informático móvil (110) con un subconjunto de indicaciones previamente seleccionadas:
calculando una puntuación de diagnóstico médico para cada elemento de datos del habla de un corpus de entrenamiento (510) procesando los elementos de datos del habla con un modelo de aprendizaje automático, correspondiendo cada elemento de datos del habla del corpus de entrenamiento (510) a una indicación de una pluralidad de indicaciones,
calculando una puntuación de selección de indicación para cada indicación de la pluralidad de indicaciones utilizando las puntuaciones de diagnóstico médico, y
seleccionando el subconjunto de indicaciones de la pluralidad de indicaciones utilizando las puntuaciones de selección de indicación;
un módulo de respuesta (1104) configurado para recibir una respuesta verbal del usuario desde un micrófono del dispositivo informático móvil en respuesta al subconjunto de indicaciones; y
un módulo de detección (1106) configurado para proporcionar una evaluación para el usuario de una afección médica basada en un análisis de la respuesta verbal recibida del usuario, comprendiendo la afección médica una afección neurológica o una o más de depresión, estrés, ictus, bienestar cognitivo, estado de ánimo, sinceridad, enfermedad de Alzheimer o enfermedad de Parkinson.
2. El aparato de la reivindicación 1, en donde el módulo de detección está configurado para determinar la evaluación basándose en uno o más rasgos distintivos acústicos de la respuesta verbal recibida sin tener en cuenta los rasgos distintivos del lenguaje de la respuesta verbal recibida de manera que la evaluación es independiente de uno o más de un lenguaje y un dialecto de la respuesta verbal recibida.
3. El aparato de la reivindicación 1, en donde el usuario comprende un participante de un ensayo clínico y la evaluación comprende una evaluación de la eficacia de un tratamiento médico para la afección médica.
4. El aparato de la reivindicación 3, en donde el módulo de detección comprende uno de una pluralidad de módulos de detección distribuidos dispuestos en dispositivos informáticos móviles para una pluralidad de participantes del ensayo clínico que comprende al menos un grupo de placebo que no recibe el tratamiento médico y un grupo que recibe el tratamiento médico, la pluralidad de módulos de detección distribuidos configurados para proporcionar evaluaciones con ocultación de la afección médica tanto para el grupo de placebo como para el grupo que recibe el tratamiento médico.
5. El aparato de la reivindicación 3, en donde la evaluación de la eficacia del tratamiento médico se basa al menos parcialmente en uno o más biomarcadores de la respuesta verbal recibida que indica una calidad de vida para el usuario.
6. El aparato de la reivindicación 5, en donde el uno o más biomarcadores indican uno o más de fatiga física, cansancio, fatiga mental, estrés, ansiedad y depresión.
7. El aparato de la reivindicación 1, en donde el usuario comprende un posible participante en un ensayo clínico y la evaluación comprende la idoneidad del usuario para participar en un ensayo clínico por la afección médica.
8. El aparato de la reivindicación 1, en donde la evaluación comprende una primera puntuación determinada para el usuario en el dispositivo informático móvil.
9. El aparato de la reivindicación 8, en donde la evaluación comprende además una segunda puntuación determinada para el usuario en un servidor de un sistema de interfaz de administración (108) en comunicación con el dispositivo informático móvil a través de una red (106).
10. El aparato de la reivindicación 1, en donde la afección médica comprende una conmoción cerebral.
11. El aparato de la reivindicación 1, que comprende además un módulo de interfaz (1108) configurado para reproducir una grabación de la respuesta verbal recibida del usuario y grabaciones de respuestas verbales recibidas de una pluralidad de otros usuarios a un usuario diferente basándose en permisos de control de acceso jerárquico para el usuario diferente.
12. El aparato de la reivindicación 1, en donde el módulo de respuesta está configurado además para recibir datos de uno o más sensores del dispositivo informático móvil y el módulo de detección está configurado además para basar el análisis al menos parcialmente en los datos recibidos.
13. Un sistema (100) que comprende:
una pluralidad de módulos de voz (104) distribuidos dispuestos en dispositivos informáticos (102) para una pluralidad de usuarios, la pluralidad de módulos de voz distribuidos configurados para interrogar de forma audible a la pluralidad de usuarios desde los altavoces de los dispositivos informáticos con un subconjunto de indicaciones y para grabar respuestas verbales de la pluralidad de usuarios en los dispositivos informáticos; y
un dispositivo de servidor de un sistema de interfaz de administración (108) configurado para almacenar al menos respuestas verbales grabadas de referencia de la pluralidad de usuarios, respuestas verbales grabadas de caso de prueba de la pluralidad de usuarios, y las evaluaciones de una afección médica para al menos las respuestas verbales grabadas de caso de prueba y para proporcionar las respuestas verbales grabadas de referencia almacenadas, respuestas verbales grabadas de caso de prueba y evaluaciones de al menos un subconjunto de la pluralidad de usuarios en los dispositivos informáticos a través de la pluralidad de módulos de voz distribuidos, comprendiendo la afección médica una afección neurológica o una o más de depresión, estrés, ictus, bienestar cognitivo, estado de ánimo, sinceridad, enfermedad de Alzheimer o enfermedad de Parkinson, el dispositivo servidor de un sistema de interfaz de administración del ordenador configurado además para seleccionar el subconjunto de indicaciones:
calculando una puntuación de diagnóstico médico para cada elemento de datos del habla de un corpus de entrenamiento (510) procesando los elementos de datos del habla con un modelo de aprendizaje automático, correspondiendo cada elemento de datos del habla del corpus de entrenamiento a una indicación de una pluralidad de indicaciones,
calculando una puntuación de selección de indicación para cada indicación de la pluralidad de indicaciones utilizando las puntuaciones de diagnóstico médico, y
seleccionando el subconjunto de indicaciones de la pluralidad de indicaciones utilizando las puntuaciones de selección de indicación.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201762502584P | 2017-05-05 | 2017-05-05 | |
| US201862614192P | 2018-01-05 | 2018-01-05 | |
| PCT/US2018/031461 WO2018204935A1 (en) | 2017-05-05 | 2018-05-07 | Medical assessment based on voice |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2988668T3 true ES2988668T3 (es) | 2024-11-21 |
Family
ID=64014871
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES18794955T Active ES2988668T3 (es) | 2017-05-05 | 2018-05-07 | Evaluación médica basada en la voz |
| ES18794118T Active ES2992090T3 (es) | 2017-05-05 | 2018-05-07 | Seleccionar características del habla para construir modelos para detectar condiciones médicas |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES18794118T Active ES2992090T3 (es) | 2017-05-05 | 2018-05-07 | Seleccionar características del habla para construir modelos para detectar condiciones médicas |
Country Status (5)
| Country | Link |
|---|---|
| US (8) | US10311980B2 (es) |
| EP (4) | EP4471801A3 (es) |
| JP (8) | JP7208977B2 (es) |
| ES (2) | ES2988668T3 (es) |
| WO (2) | WO2018204934A1 (es) |
Families Citing this family (97)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10939821B2 (en) * | 2017-03-20 | 2021-03-09 | Applications Technology (Apptek), Llc | Systems and methods for diagnosing and analyzing concussions |
| US10311980B2 (en) | 2017-05-05 | 2019-06-04 | Canary Speech, LLC | Medical assessment based on voice |
| US10910105B2 (en) * | 2017-05-31 | 2021-02-02 | International Business Machines Corporation | Monitoring the use of language of a patient for identifying potential speech and related neurological disorders |
| WO2018230562A1 (ja) * | 2017-06-14 | 2018-12-20 | 日本電気株式会社 | 通知システム、通知方法およびプログラムが格納された非一時的なコンピュータ可読媒体 |
| US20190043623A1 (en) * | 2017-08-04 | 2019-02-07 | Thomas W. WATLINGTON, IV | System and method for physiological and psychological support in home healthcare |
| US11436549B1 (en) | 2017-08-14 | 2022-09-06 | ClearCare, Inc. | Machine learning system and method for predicting caregiver attrition |
| US11508479B2 (en) * | 2017-10-16 | 2022-11-22 | Optum, Inc. | Automated question generation and response tracking |
| JP7608171B2 (ja) | 2018-06-19 | 2025-01-06 | エリプシス・ヘルス・インコーポレイテッド | 精神的健康評価のためのシステム及び方法 |
| US20190385711A1 (en) | 2018-06-19 | 2019-12-19 | Ellipsis Health, Inc. | Systems and methods for mental health assessment |
| CA3105425A1 (en) * | 2018-07-05 | 2020-01-09 | Highmark Innovations Inc. | System for generating indications of neurological impairment |
| US12205348B2 (en) * | 2018-08-02 | 2025-01-21 | Veritone, Inc. | Neural network orchestration |
| US11633103B1 (en) | 2018-08-10 | 2023-04-25 | ClearCare, Inc. | Automatic in-home senior care system augmented with internet of things technologies |
| US11120226B1 (en) | 2018-09-04 | 2021-09-14 | ClearCare, Inc. | Conversation facilitation system for mitigating loneliness |
| EP3841570A4 (en) * | 2018-08-26 | 2021-10-27 | Beyond Verbal Communication Ltd. | SYSTEM AND METHOD FOR MEASURING VOCAL BIOMARKERS OF VITALITY AND BIOLOGICAL AGING |
| US11631401B1 (en) * | 2018-09-04 | 2023-04-18 | ClearCare, Inc. | Conversation system for detecting a dangerous mental or physical condition |
| US11380351B2 (en) * | 2018-09-20 | 2022-07-05 | Samsung Electronics Co., Ltd. | System and method for pulmonary condition monitoring and analysis |
| US10847177B2 (en) | 2018-10-11 | 2020-11-24 | Cordio Medical Ltd. | Estimating lung volume by speech analysis |
| US11159510B2 (en) | 2018-12-05 | 2021-10-26 | Bank Of America Corporation | Utilizing federated user identifiers to enable secure information sharing |
| US11036838B2 (en) | 2018-12-05 | 2021-06-15 | Bank Of America Corporation | Processing authentication requests to secured information systems using machine-learned user-account behavior profiles |
| US11120109B2 (en) | 2018-12-05 | 2021-09-14 | Bank Of America Corporation | Processing authentication requests to secured information systems based on machine-learned event profiles |
| US11048793B2 (en) | 2018-12-05 | 2021-06-29 | Bank Of America Corporation | Dynamically generating activity prompts to build and refine machine learning authentication models |
| US11113370B2 (en) | 2018-12-05 | 2021-09-07 | Bank Of America Corporation | Processing authentication requests to secured information systems using machine-learned user-account behavior profiles |
| US11176230B2 (en) | 2018-12-05 | 2021-11-16 | Bank Of America Corporation | Processing authentication requests to secured information systems based on user behavior profiles |
| EP3899938B1 (en) * | 2018-12-18 | 2023-10-04 | Szegedi Tudományegyetem | Automatic detection of neurocognitive impairment based on a speech sample |
| US10943588B2 (en) * | 2019-01-03 | 2021-03-09 | International Business Machines Corporation | Methods and systems for managing voice response systems based on references to previous responses |
| US11133026B2 (en) * | 2019-01-04 | 2021-09-28 | International Business Machines Corporation | Natural language processor for using speech to cognitively detect and analyze deviations from a baseline |
| US11350885B2 (en) * | 2019-02-08 | 2022-06-07 | Samsung Electronics Co., Ltd. | System and method for continuous privacy-preserved audio collection |
| EP3931844A1 (en) * | 2019-02-26 | 2022-01-05 | Flatiron Health, Inc. | Prognostic score based on health information |
| US11011188B2 (en) * | 2019-03-12 | 2021-05-18 | Cordio Medical Ltd. | Diagnostic techniques based on speech-sample alignment |
| KR20210137503A (ko) * | 2019-03-12 | 2021-11-17 | 코디오 메디칼 리미티드 | 음성 모델에 기반한 진단 기법 |
| US12512114B2 (en) | 2019-03-12 | 2025-12-30 | Cordio Medical Ltd. | Analyzing speech using speech models and segmentation based on acoustic features |
| US12494224B2 (en) | 2019-03-12 | 2025-12-09 | Cordio Medical Ltd. | Analyzing speech using speech-sample alignment and segmentation based on acoustic features |
| US11024327B2 (en) | 2019-03-12 | 2021-06-01 | Cordio Medical Ltd. | Diagnostic techniques based on speech models |
| US12488805B2 (en) | 2019-03-12 | 2025-12-02 | Cordio Medical Ltd. | Using optimal articulatory event-types for computer analysis of speech |
| US20210373596A1 (en) * | 2019-04-02 | 2021-12-02 | Talkgo, Inc. | Voice-enabled external smart processing system with display |
| WO2020212843A1 (en) * | 2019-04-15 | 2020-10-22 | Janssen Pharmaceutica Nv | System and method for detecting cognitive decline using speech analysis |
| JP7327987B2 (ja) * | 2019-04-25 | 2023-08-16 | キヤノン株式会社 | 医療診断支援システム、医療診断支援装置、医療診断支援方法及びプログラム |
| US11547345B2 (en) * | 2019-05-04 | 2023-01-10 | Intraneuron | Dynamic neuropsychological assessment tool |
| CN110263641B (zh) * | 2019-05-17 | 2026-03-10 | 原力图新(重庆)科技有限公司 | 疲劳检测方法、装置及可读存储介质 |
| EP3745412A1 (en) * | 2019-05-28 | 2020-12-02 | Corti ApS | An intelligent computer aided decision support system |
| EP3977215A1 (en) | 2019-05-30 | 2022-04-06 | ABB Schweiz AG | Method and system for monitoring condition of drives |
| WO2020243701A1 (en) * | 2019-05-30 | 2020-12-03 | Insurance Services Office, Inc. | Systems and methods for machine learning of voice attributes |
| US20220328172A1 (en) * | 2019-09-04 | 2022-10-13 | Ontact Health Co., Ltd. | Optimal transfer hospital determining method and server |
| US11114113B2 (en) | 2019-10-18 | 2021-09-07 | LangAware, Inc. | Multilingual system for early detection of neurodegenerative and psychiatric disorders |
| EP3809411B1 (en) * | 2019-10-18 | 2025-03-26 | LangAware, Inc. | Multi-lingual system for early detection of alzheimer's disease |
| JP2022553749A (ja) | 2019-10-25 | 2022-12-26 | エリプシス・ヘルス・インコーポレイテッド | 速度ベースのスクリーニング及び挙動の健康状態の監視のための音響及び自然言語処理モデル |
| JPWO2021111964A1 (es) * | 2019-12-04 | 2021-06-10 | ||
| CN112908317B (zh) * | 2019-12-04 | 2023-04-07 | 中国科学院深圳先进技术研究院 | 一种针对认知障碍的语音识别系统 |
| US20210182696A1 (en) * | 2019-12-11 | 2021-06-17 | International Business Machines Corporation | Prediction of objective variable using models based on relevance of each model |
| WO2021127348A1 (en) * | 2019-12-18 | 2021-06-24 | Darroh Steven | Voice training therapy app system and method |
| US11232570B2 (en) | 2020-02-13 | 2022-01-25 | Olympus Corporation | System and method for diagnosing severity of gastritis |
| US11484211B2 (en) | 2020-03-03 | 2022-11-01 | Cordio Medical Ltd. | Diagnosis of medical conditions using voice recordings and auscultation |
| JP7539105B2 (ja) * | 2020-03-24 | 2024-08-23 | パナソニックIpマネジメント株式会社 | 認知機能判定システム、及びプログラム |
| JP7450216B2 (ja) * | 2020-03-24 | 2024-03-15 | パナソニックIpマネジメント株式会社 | 認知機能判定システム、及びプログラム |
| US20210298711A1 (en) * | 2020-03-25 | 2021-09-30 | Applications Technology (Apptek), Llc | Audio biomarker for virtual lung function assessment and auscultation |
| US20210315500A1 (en) * | 2020-04-10 | 2021-10-14 | döTERRA International LLC | Systems and methods for determining wellness using a mobile application |
| CN112133284B (zh) * | 2020-04-23 | 2023-07-07 | 中国医学科学院北京协和医院 | 一种医疗语音对话方法及装置 |
| AU2021277202A1 (en) * | 2020-05-16 | 2022-12-22 | Insurance Services Office, Inc. | Machine learning systems and methods for multiscale alzheimer's dementia recognition through spontaneous speech |
| JP7410516B2 (ja) * | 2020-06-19 | 2024-01-10 | 国立大学法人北海道大学 | 親子健康管理システム、親子健康分析装置、及び親子健康管理方法 |
| US11417342B2 (en) | 2020-06-29 | 2022-08-16 | Cordio Medical Ltd. | Synthesizing patient-specific speech models |
| KR102659616B1 (ko) * | 2020-07-10 | 2024-04-23 | 주식회사 이모코그 | 음성 특성 기반 알츠하이머병 예측 방법 및 장치 |
| CN115955932A (zh) * | 2020-07-10 | 2023-04-11 | 伊莫克有限公司 | 基于语音特征的阿尔茨海默病预测方法和装置 |
| US11526796B2 (en) * | 2020-07-15 | 2022-12-13 | International Business Machines Corporation | Qubit pulse calibration via canary parameter monitoring |
| JP7850135B2 (ja) * | 2020-08-03 | 2026-04-22 | ザ コヴィット ディテクション ファンデーション(ディー.ビー.エー. ヴィルフィー) | 呼吸器症候群を検出するためのアンサンブル機械学習モデル |
| EP3965116A1 (en) * | 2020-09-02 | 2022-03-09 | Koninklijke Philips N.V. | Responding to emergency calls |
| WO2022055798A1 (en) * | 2020-09-08 | 2022-03-17 | Lifeline Systems Company | Cognitive impairment detected through audio recordings |
| JP7655927B2 (ja) * | 2020-09-08 | 2025-04-02 | テルモ株式会社 | プログラム、情報処理装置及び情報処理方法 |
| US12205582B2 (en) | 2020-10-08 | 2025-01-21 | Mastercard International Incorporated | System and method for implementing a virtual caregiver |
| US11495211B2 (en) | 2020-10-29 | 2022-11-08 | International Business Machines Corporation | Memory deterioration detection and amelioration |
| US12334105B2 (en) | 2020-11-23 | 2025-06-17 | Cordio Medical Ltd. | Detecting impaired physiological function by speech analysis |
| GB202019000D0 (en) * | 2020-12-02 | 2021-01-13 | Accexible Impacto S L | Detection of cognitive impairment |
| WO2022212740A2 (en) * | 2021-03-31 | 2022-10-06 | Aural Analytics, Inc. | Systems and methods for digital speech-based evaluation of cognitive function |
| US11887583B1 (en) * | 2021-06-09 | 2024-01-30 | Amazon Technologies, Inc. | Updating models with trained model update objects |
| KR102640314B1 (ko) * | 2021-07-12 | 2024-02-23 | (주)휴톰 | 인공지능 수술 시스템 및 그것의 제어방법 |
| US20230018524A1 (en) * | 2021-07-19 | 2023-01-19 | Modality.Ai, Inc. | Multimodal conversational platform for remote patient diagnosis and monitoring |
| CN113838450B (zh) * | 2021-08-11 | 2022-11-25 | 北京百度网讯科技有限公司 | 音频合成及相应的模型训练方法、装置、设备及存储介质 |
| US12125497B2 (en) | 2021-09-07 | 2024-10-22 | Canary Speech, LLC | Paired neural networks for diagnosing health conditions via speech |
| WO2023095136A1 (en) * | 2021-11-24 | 2023-06-01 | B.G. Negev Technologies And Applications Ltd., At Ben-Gurion University | Subject diagnosis using speech analysis |
| US20250046335A1 (en) * | 2021-11-29 | 2025-02-06 | Corti Aps | Spoken language understanding by means of representations learned unsupervised |
| JP7509878B2 (ja) | 2021-12-08 | 2024-07-02 | セブンポイントワン インコーポレイテッド | 人工知能コールを利用した質疑応答基盤の認知症検査方法及びサーバ |
| KR102380376B1 (ko) * | 2021-12-08 | 2022-04-01 | 주식회사 세븐포인트원 | 인공지능 콜을 이용한 음성 질의응답 기반의 치매 검사 방법 및 서버 |
| KR102755040B1 (ko) * | 2021-12-29 | 2025-01-21 | 서울대학교병원 | 기계학습을 기반으로 하는 문진 텍스트를 이용한 우울증 예측 장치 및 그 방법 |
| EP4493045A4 (en) * | 2022-03-13 | 2026-03-25 | Sonaphi Llc | SYSTEMS AND METHOD FOR PROVIDING HEALTH INFORMATION THROUGH THE USE OF A PERSON'S VOICE |
| US12008921B2 (en) * | 2022-04-22 | 2024-06-11 | 617 Education Inc. | Systems and methods for grapheme-phoneme correspondence learning |
| US12190062B2 (en) | 2022-04-28 | 2025-01-07 | Optum, Inc. | Natural language processing techniques using hybrid reason code prediction machine learning frameworks |
| US12537018B2 (en) * | 2022-08-31 | 2026-01-27 | Eleos Mental Systems Ltd. | Method and system for predicting a mental condition of a speaker |
| JP2024065641A (ja) * | 2022-10-31 | 2024-05-15 | キヤノンメディカルシステムズ株式会社 | 医用情報処理装置、医用情報処理システム及びプログラム |
| KR20240062495A (ko) * | 2022-11-01 | 2024-05-10 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
| CN115736830A (zh) * | 2022-11-16 | 2023-03-07 | 平安银行股份有限公司 | 短期记忆测试方法、装置、设备及计算机可读存储介质 |
| US12518774B2 (en) | 2023-02-05 | 2026-01-06 | Cordio Medical Ltd. | Identifying optimal articulatory event-types for computer analysis of speech |
| IL322559A (en) | 2023-02-05 | 2025-10-01 | Cordio Medical Ltd | Identification of expressive event types for computer speech analysis |
| US12597512B2 (en) | 2023-05-15 | 2026-04-07 | HealthGPT, Inc. | Real-time use of multiple parallel automatic speech recognition (ASR) modules in a conversational artificial intelligence (AI) architecture |
| US12555595B2 (en) | 2023-05-18 | 2026-02-17 | Cordio Medical Ltd. | Converting a sequence of speech records of a human subject into a sequence of indicators of a physiological state of the subject |
| US20250140402A1 (en) | 2023-10-26 | 2025-05-01 | Canary Speech, Inc. | Techniques for speech language model training and application |
| WO2025221739A1 (en) * | 2024-04-15 | 2025-10-23 | Linus Health, Inc. | Estimating memory impairment from a mobile multimodal digital screening |
| US20250364134A1 (en) * | 2024-05-22 | 2025-11-27 | Sorenson Ip Holdings, Llc | Health assessment |
| WO2026080579A1 (en) * | 2024-10-08 | 2026-04-16 | Sonovoice, Inc. | Systems and methods for voice evaluation |
Family Cites Families (67)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6067516A (en) | 1997-05-09 | 2000-05-23 | Siemens Information | Speech and text messaging system with distributed speech recognition and speaker database transfers |
| JPH11197116A (ja) | 1998-01-08 | 1999-07-27 | Mitsubishi Electric Corp | 健康管理装置 |
| US6507790B1 (en) * | 1998-07-15 | 2003-01-14 | Horton, Inc. | Acoustic monitor |
| US7725307B2 (en) * | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
| US7062443B2 (en) | 2000-08-22 | 2006-06-13 | Silverman Stephen E | Methods and apparatus for evaluating near-term suicidal risk using vocal parameters |
| US20030105638A1 (en) | 2001-11-27 | 2003-06-05 | Taira Rick K. | Method and system for creating computer-understandable structured medical data from natural language reports |
| US20030115214A1 (en) | 2001-12-17 | 2003-06-19 | Nir Essar | Medical reporting system and method |
| US7315821B2 (en) | 2002-01-31 | 2008-01-01 | Sanyo Electric Co., Ltd. | System and method for health care information processing based on acoustic features |
| US6804654B2 (en) | 2002-02-11 | 2004-10-12 | Telemanager Technologies, Inc. | System and method for providing prescription services using voice recognition |
| US7483868B2 (en) | 2002-04-19 | 2009-01-27 | Computer Associates Think, Inc. | Automatic neural-net model generation and maintenance |
| US7825488B2 (en) * | 2006-05-31 | 2010-11-02 | Advanced Analogic Technologies, Inc. | Isolation structures for integrated circuits and modular methods of forming the same |
| US6696339B1 (en) * | 2002-08-21 | 2004-02-24 | Micron Technology, Inc. | Dual-damascene bit line structures for microelectronic devices and methods of fabricating microelectronic devices |
| US20040210159A1 (en) | 2003-04-15 | 2004-10-21 | Osman Kibar | Determining a psychological state of a subject |
| US9240188B2 (en) | 2004-09-16 | 2016-01-19 | Lena Foundation | System and method for expressive language, developmental disorder, and emotion assessment |
| US20120277594A1 (en) | 2009-01-23 | 2012-11-01 | Pryor Timothy R | Mental health and well-being |
| TW200735878A (en) | 2005-11-18 | 2007-10-01 | Astrazeneca Ab | Pharmaceutical compositions |
| US8478596B2 (en) * | 2005-11-28 | 2013-07-02 | Verizon Business Global Llc | Impairment detection using speech |
| US20070226012A1 (en) * | 2005-12-13 | 2007-09-27 | Naryx Pharma, Inc. | Methods of measuring symptoms of chronic rhinosinusitis |
| US20100286490A1 (en) * | 2006-04-20 | 2010-11-11 | Iq Life, Inc. | Interactive patient monitoring system using speech recognition |
| US7884727B2 (en) * | 2007-05-24 | 2011-02-08 | Bao Tran | Wireless occupancy and day-light sensing |
| RU2530709C2 (ru) | 2008-11-07 | 2014-10-10 | Конинклейке Филипс Электроникс, Н.В. | Управление больничным устройством отображения телевизора/монитора с управлением иерархическим доступом |
| US9390167B2 (en) | 2010-07-29 | 2016-07-12 | Soundhound, Inc. | System and methods for continuous audio matching |
| US8494857B2 (en) | 2009-01-06 | 2013-07-23 | Regents Of The University Of Minnesota | Automatic measurement of speech fluency |
| WO2010132541A2 (en) | 2009-05-14 | 2010-11-18 | University Of Delaware | Electromagnetic detection apparatus and methods |
| US20120116186A1 (en) * | 2009-07-20 | 2012-05-10 | University Of Florida Research Foundation, Inc. | Method and apparatus for evaluation of a subject's emotional, physiological and/or physical state with the subject's physiological and/or acoustic data |
| US9087320B2 (en) * | 2009-09-15 | 2015-07-21 | Korrio, Inc. | Sports collaboration and communication platform |
| JP4876207B2 (ja) * | 2010-06-11 | 2012-02-15 | 国立大学法人 名古屋工業大学 | 認知機能障害危険度算出装置、認知機能障害危険度算出システム、及びプログラム |
| AU2010357179A1 (en) | 2010-07-06 | 2013-02-14 | Rmit University | Emotional and/or psychiatric state detection |
| US8784311B2 (en) | 2010-10-05 | 2014-07-22 | University Of Florida Research Foundation, Incorporated | Systems and methods of screening for medical states using speech and other vocal behaviors |
| US20120310670A1 (en) | 2011-06-01 | 2012-12-06 | nPruv, Inc. | Systems and methods for automated informed consent |
| US9055861B2 (en) | 2011-02-28 | 2015-06-16 | Samsung Electronics Co., Ltd. | Apparatus and method of diagnosing health by using voice |
| US9514281B2 (en) | 2011-05-03 | 2016-12-06 | Graeme John HIRST | Method and system of longitudinal detection of dementia through lexical and syntactic changes in writing |
| US9763617B2 (en) | 2011-08-02 | 2017-09-19 | Massachusetts Institute Of Technology | Phonologically-based biomarkers for major depressive disorder |
| JP2013073509A (ja) | 2011-09-28 | 2013-04-22 | Sapporo City Univ | 通信システム、通信方法、プログラムおよび通信装置 |
| US20130158434A1 (en) * | 2011-12-20 | 2013-06-20 | Delta Electronics, Inc. | Apparatus for voice assisted medical diagnosis |
| EP2830496B1 (en) * | 2012-03-29 | 2023-04-26 | The University of Queensland | A method and apparatus for processing sound recordings of a patient |
| US9517373B2 (en) * | 2012-07-06 | 2016-12-13 | Danny Rendon | Sprinkler head removal system and method |
| US20140073993A1 (en) | 2012-08-02 | 2014-03-13 | University Of Notre Dame Du Lac | Systems and methods for using isolated vowel sounds for assessment of mild traumatic brain injury |
| WO2014062441A1 (en) | 2012-10-16 | 2014-04-24 | University Of Florida Research Foundation, Inc. | Screening for neurologial disease using speech articulation characteristics |
| US20140113263A1 (en) | 2012-10-20 | 2014-04-24 | The University Of Maryland, Baltimore County | Clinical Training and Advice Based on Cognitive Agent with Psychological Profile |
| US9135571B2 (en) * | 2013-03-12 | 2015-09-15 | Nuance Communications, Inc. | Methods and apparatus for entity detection |
| US9295423B2 (en) | 2013-04-03 | 2016-03-29 | Toshiba America Electronic Components, Inc. | System and method for audio kymographic diagnostics |
| US9495646B2 (en) | 2013-06-05 | 2016-11-15 | The Trustees Of Columbia University In The City Of New York | Monitoring health of dynamic system using speaker recognition techniques |
| WO2015107681A1 (ja) * | 2014-01-17 | 2015-07-23 | 任天堂株式会社 | 情報処理システム、情報処理サーバ、情報処理プログラム、および情報提供方法 |
| US9685174B2 (en) | 2014-05-02 | 2017-06-20 | The Regents Of The University Of Michigan | Mood monitoring of bipolar disorder using speech analysis |
| US12191030B2 (en) * | 2014-07-07 | 2025-01-07 | Zoll Medical Corporation | Medical device with natural language processor |
| US9952685B2 (en) * | 2014-07-22 | 2018-04-24 | Logitech Europe S.A. | Input device with means for altering the operating mode of the input device |
| US10874340B2 (en) | 2014-07-24 | 2020-12-29 | Sackett Solutions & Innovations, LLC | Real time biometric recording, information analytics and monitoring systems for behavioral health management |
| JP2017532082A (ja) * | 2014-08-22 | 2017-11-02 | エスアールアイ インターナショナルSRI International | 患者の精神状態のスピーチベース評価のためのシステム |
| WO2016077786A1 (en) | 2014-11-14 | 2016-05-19 | Zoll Medical Corporation | Medical premonitory event estimation |
| US20160135737A1 (en) | 2014-11-17 | 2016-05-19 | Elwha Llc | Determining treatment compliance using speech patterns captured during use of a communication system |
| US20160140986A1 (en) * | 2014-11-17 | 2016-05-19 | Elwha Llc | Monitoring treatment compliance using combined performance indicators |
| WO2016145372A1 (en) * | 2015-03-12 | 2016-09-15 | Akili Interactive Labs, Inc. | Processor implemented systems and methods for measuring congnitive abilities |
| US20160335399A1 (en) | 2015-03-16 | 2016-11-17 | Outside The Leather, Llc | System and method for a patient initiated medical interview using a voice-based medical history questionnaire |
| US20160278633A1 (en) * | 2015-03-23 | 2016-09-29 | International Business Machines Corporation | Monitoring a person for indications of a brain injury |
| US11638550B2 (en) | 2015-07-07 | 2023-05-02 | Stryker Corporation | Systems and methods for stroke detection |
| WO2017021944A2 (en) | 2015-08-06 | 2017-02-09 | Avishai Abrahami | Cognitive state alteration system integrating multiple feedback technologies |
| US10127929B2 (en) * | 2015-08-19 | 2018-11-13 | Massachusetts Institute Of Technology | Assessing disorders through speech and a computational model |
| EP3350806A4 (en) | 2015-09-14 | 2019-08-07 | Cogito Corporation | SYSTEMS AND METHODS FOR IDENTIFYING HUMAN EMOTIONS AND / OR STATES OF PSYCHICAL HEALTH BASED ON ANALYSIS OF AUDIO INPUTS AND / OR COMPUTER STATEMENTS OF COLLECTED BEHAVIOR DATA |
| US9899035B2 (en) | 2015-11-04 | 2018-02-20 | Ioannis Kakadiaris | Systems for and methods of intelligent acoustic monitoring |
| CN108352182A (zh) * | 2015-11-12 | 2018-07-31 | 阿文特公司 | 患者结果跟踪平台 |
| US11164596B2 (en) | 2016-02-25 | 2021-11-02 | Samsung Electronics Co., Ltd. | Sensor assisted evaluation of health and rehabilitation |
| US11404170B2 (en) | 2016-04-18 | 2022-08-02 | Soap, Inc. | Method and system for patients data collection and analysis |
| US10796715B1 (en) * | 2016-09-01 | 2020-10-06 | Arizona Board Of Regents On Behalf Of Arizona State University | Speech analysis algorithmic system and method for objective evaluation and/or disease detection |
| US10939821B2 (en) * | 2017-03-20 | 2021-03-09 | Applications Technology (Apptek), Llc | Systems and methods for diagnosing and analyzing concussions |
| US10311980B2 (en) | 2017-05-05 | 2019-06-04 | Canary Speech, LLC | Medical assessment based on voice |
| US10614689B2 (en) | 2017-09-07 | 2020-04-07 | Ridgewood Technology Partners, LLC | Methods and systems for using pattern recognition to identify potential security threats |
-
2018
- 2018-05-07 US US15/973,504 patent/US10311980B2/en active Active
- 2018-05-07 WO PCT/US2018/031460 patent/WO2018204934A1/en not_active Ceased
- 2018-05-07 EP EP24206768.4A patent/EP4471801A3/en active Pending
- 2018-05-07 WO PCT/US2018/031461 patent/WO2018204935A1/en not_active Ceased
- 2018-05-07 EP EP24202331.5A patent/EP4468206A3/en active Pending
- 2018-05-07 ES ES18794955T patent/ES2988668T3/es active Active
- 2018-05-07 JP JP2020511875A patent/JP7208977B2/ja active Active
- 2018-05-07 EP EP18794118.2A patent/EP3619657B1/en active Active
- 2018-05-07 US US15/973,498 patent/US10152988B2/en active Active
- 2018-05-07 JP JP2020511874A patent/JP7208224B2/ja active Active
- 2018-05-07 EP EP18794955.7A patent/EP3618698B1/en active Active
- 2018-05-07 ES ES18794118T patent/ES2992090T3/es active Active
- 2018-11-13 US US16/189,997 patent/US10896765B2/en active Active
-
2019
- 2019-05-24 US US16/422,718 patent/US11348694B2/en active Active
-
2021
- 2021-01-18 US US17/151,632 patent/US11749414B2/en active Active
-
2022
- 2022-05-30 US US17/827,970 patent/US11756693B2/en active Active
- 2022-09-21 JP JP2022149805A patent/JP7812763B2/ja active Active
-
2023
- 2023-01-05 JP JP2023000544A patent/JP7566939B2/ja active Active
- 2023-07-05 US US18/347,382 patent/US12051513B2/en active Active
-
2024
- 2024-06-13 US US18/742,032 patent/US12444510B2/en active Active
- 2024-10-02 JP JP2024173193A patent/JP7804736B2/ja active Active
-
2025
- 2025-11-10 JP JP2025189216A patent/JP2026021546A/ja active Pending
- 2025-12-01 JP JP2025210605A patent/JP2026048727A/ja active Pending
-
2026
- 2026-01-09 JP JP2026002712A patent/JP2026050462A/ja active Pending
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2988668T3 (es) | Evaluación médica basada en la voz | |
| ES2983529T3 (es) | Sistema y método para evaluar el estado fisiológico | |
| Arif et al. | Classification of anxiety disorders using machine learning methods: a literature review | |
| US20200388287A1 (en) | Intelligent health monitoring | |
| US10376197B2 (en) | Diagnosing system for consciousness level measurement and method thereof | |
| Usha et al. | Speech assessment tool methods for speech impaired children: a systematic literature review on the state-of-the-art in speech impairment analysis | |
| Vick et al. | Data-driven subclassification of speech sound disorders in preschool children | |
| ES3051515T3 (en) | Detection of cognitive impairment | |
| Tröger et al. | Telephone-based dementia screening I: automated semantic verbal fluency assessment | |
| US20130241719A1 (en) | Virtual communication platform for healthcare | |
| CN103251386A (zh) | 用于语音辅助医疗诊断的装置与方法 | |
| Poellabauer et al. | Challenges in concussion detection using vocal acoustic biomarkers | |
| Marks et al. | Psychometric analysis of an ecological vocal effort scale in individuals with and without vocal hyperfunction during activities of daily living | |
| Yamada et al. | Automatic assessment of loneliness in older adults using speech analysis on responses to daily life questions | |
| Woodard et al. | The human-computer interface in computer-based concussion assessment | |
| US10820851B2 (en) | Diagnosing system for consciousness level measurement and method thereof | |
| HK40120187A (en) | Medical assessment based on voice | |
| Mallikarjun et al. | Manoglanistara-emotional wellness phases prediction of adolescent female students by using brain waves | |
| Toki et al. | Automated Detection of Neurodevelopmental Disorders Using Face-to-Face Mobile Technology Among Typically Developing Greek Children: Randomized Controlled Trial | |
| US20250140402A1 (en) | Techniques for speech language model training and application | |
| Karolus | Proficiency-aware systems: designing for user skill and expertise | |
| Daudet et al. | Experiences in Designing a Mobile Speech-Based Assessment Tool for Neurological Diseases |