ES2848852T3 - Procedimiento para la generación de una respuesta vocal acústica - Google Patents

Procedimiento para la generación de una respuesta vocal acústica Download PDF

Info

Publication number
ES2848852T3
ES2848852T3 ES18172586T ES18172586T ES2848852T3 ES 2848852 T3 ES2848852 T3 ES 2848852T3 ES 18172586 T ES18172586 T ES 18172586T ES 18172586 T ES18172586 T ES 18172586T ES 2848852 T3 ES2848852 T3 ES 2848852T3
Authority
ES
Spain
Prior art keywords
template
voice
segment
segments
remote
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18172586T
Other languages
English (en)
Inventor
Wenjie Yan
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vorwerk and Co Interholding GmbH
Original Assignee
Vorwerk and Co Interholding GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vorwerk and Co Interholding GmbH filed Critical Vorwerk and Co Interholding GmbH
Application granted granted Critical
Publication of ES2848852T3 publication Critical patent/ES2848852T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/027Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47JKITCHEN EQUIPMENT; COFFEE MILLS; SPICE MILLS; APPARATUS FOR MAKING BEVERAGES
    • A47J27/00Cooking-vessels
    • A47J27/004Cooking-vessels with integral electrical heating means
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47JKITCHEN EQUIPMENT; COFFEE MILLS; SPICE MILLS; APPARATUS FOR MAKING BEVERAGES
    • A47J43/00Implements for preparing or holding food, not provided for in other groups of this subclass
    • A47J43/04Machines for domestic use not covered elsewhere, e.g. for grinding, mixing, stirring, kneading, emulsifying, whipping or beating foodstuffs, e.g. power-driven
    • A47J43/046Machines for domestic use not covered elsewhere, e.g. for grinding, mixing, stirring, kneading, emulsifying, whipping or beating foodstuffs, e.g. power-driven with tools driven from the bottom side
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47JKITCHEN EQUIPMENT; COFFEE MILLS; SPICE MILLS; APPARATUS FOR MAKING BEVERAGES
    • A47J43/00Implements for preparing or holding food, not provided for in other groups of this subclass
    • A47J43/04Machines for domestic use not covered elsewhere, e.g. for grinding, mixing, stirring, kneading, emulsifying, whipping or beating foodstuffs, e.g. power-driven
    • A47J43/07Parts or details, e.g. mixing tools, whipping tools
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47JKITCHEN EQUIPMENT; COFFEE MILLS; SPICE MILLS; APPARATUS FOR MAKING BEVERAGES
    • A47J43/00Implements for preparing or holding food, not provided for in other groups of this subclass
    • A47J43/04Machines for domestic use not covered elsewhere, e.g. for grinding, mixing, stirring, kneading, emulsifying, whipping or beating foodstuffs, e.g. power-driven
    • A47J43/07Parts or details, e.g. mixing tools, whipping tools
    • A47J43/0716Parts or details, e.g. mixing tools, whipping tools for machines with tools driven from the lower side
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback

Landscapes

  • Engineering & Computer Science (AREA)
  • Food Science & Technology (AREA)
  • Mechanical Engineering (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Electric Ovens (AREA)
  • Selective Calling Equipment (AREA)

Abstract

Procedimiento (100) para generar una respuesta vocal acústica en un electrodoméstico (10), preferentemente en un electrodoméstico de cocina accionado por motor eléctrico (10) con un recipiente de mezcla (24) y un agitador en el recipiente de mezcla (24), con las etapas siguientes: a) identificación de al menos un segmento de voz almacenado previamente (120) en función de una plantilla vocal digital (110) con al menos un segmento de plantilla (115), b) ejecución del segmento de voz identificado (120), c) salida acústica del segmento de voz recuperado (120), donde varios segmentos de voz (120) se almacenan previamente en un objeto de información persistente (130), y cada uno se identifica y/o ejecuta utilizando al menos una información de posición (140) en el objeto de información (130), donde el objeto de información (130) está diseñado como un solo fichero (130), donde los segmentos de voz (120) corresponden a los segmentos de plantilla (115) con el fin de reproducir verbalmente etapas de receta o instrucciones proporcionadas por los segmentos de plantilla (115), donde cada uno de los segmentos de voz (120) comprende una reproducción acústica de un segmento de plantilla (115), donde los segmentos de voz individuales (120) comprenden al menos frases y/o palabras cuyos segmentos de voz (120) se emiten uno tras otro en un orden definido en función de una receta, donde la plantilla vocal (110) está almacenada en uno o más ficheros de especificación, y la receta con la plantilla vocal (110) se almacena en una unidad de almacenamiento de datos móvil (60), donde la plantilla vocal (110) comprende palabras y/o frases predeterminadas, donde mediante la ejecución según la etapa b) y la recombinación de los segmentos de voz (120) según la etapa b) se pueden generar frases y/o palabras acústicas sintetizadas y/o combinaciones de frases correspondientes a la plantilla vocal (110) como respuesta vocal.

Description

DESCRIPCIÓN
Procedimiento para la generación de una respuesta vocal acústica
La presente invención se refiere a un procedimiento para generar una respuesta vocal acústica, en particular en un electrodoméstico, preferentemente en un robot de cocina accionado por motor eléctrico con un recipiente de mezcla y un agitador en el recipiente de mezcla. La invención también se refiere a un dispositivo, un robot de cocina y una unidad móvil de almacenamiento de datos.
La generación de una respuesta vocal acústica, en particular en el caso de un electrodoméstico, es conocida por el estado de la técnica, por ejemplo, a partir del documento DE 102008 034 144 A1. La respuesta vocal acústica para recetas de cocina se describe en los documentos US 2014/0108010 A1 o US 2010/0042411 A1, por ejemplo. Además, US 2009/0254345 A1 y US 2008/0086303 A1 muestran más ejemplos para la respuesta vocal de textos. En general, los sistemas denominados texto a voz (TTS, del inglés Text-to-Speech) se utilizan para la síntesis de voz con el fin de convertir cualquier texto continuo en una respuesta vocal acústica. La síntesis de voz, especialmente de cualquier texto, permite un funcionamiento simplificado y ofrece una enorme flexibilidad y una mayor facilidad de uso.
Sin embargo, la síntesis de voz, es decir, la generación artificial de voz humana, es técnicamente compleja y cara. Los procedimientos modernos de síntesis de voz o texto a voz también utilizan datos de audio extensos, que se procesan de manera compleja. Esto requiere una memoria de datos adecuadamente dimensionada y una infraestructura de TI o hardware potentes. Con respecto al uso en electrodomésticos como electrodomésticos de cocina o robot de cocina, tal esfuerzo técnico a menudo no es posible o útil. Los sistemas de procesamiento utilizados en los electrodomésticos (por ejemplo, sistemas integrados, microprocesadores, memorias y similares) normalmente no tienen el rendimiento necesario para generar una respuesta vocal flexible y de alta calidad utilizando procedimientos de síntesis de voz conocidos. Por lo tanto, el uso de procedimientos de síntesis de voz a menudo todavía requiere un elevado gasto de fabricación y costes. Debido a las posibilidades limitadas para la respuesta vocal, el funcionamiento de los electrodomésticos, en particular también para usuarios con discapacidad visual, a menudo se dificulta aún más y se reduce la comodidad.
Por lo tanto, un objeto de la presente invención es remediar al menos parcialmente las desventajas descritas anteriormente. En particular, el objeto de la presente invención es proporcionar un procedimiento mejorado para la respuesta vocal acústica que también se pueda operar con una base de hardware de rendimiento limitado. Además, en particular, se deberá mejorar y/o simplificar el funcionamiento de un dispositivo, en particular un electrodoméstico y/o un robot de cocina. Además, en particular, deberían reducirse los costes y el esfuerzo para la producción del dispositivo y/o para la provisión de una respuesta vocal acústica.
El objeto anterior se logra mediante un procedimiento con las características de la reivindicación 1 y un dispositivo con las características de la reivindicación 12. Otras características y detalles de la invención serán evidentes a partir de las respectivas reivindicaciones dependientes, la descripción y los dibujos. En este caso, las características y detalles que se describen en relación con el procedimiento según la invención también se aplican naturalmente en relación con el dispositivo según la invención, el robot de cocina según la invención y la unidad de almacenamiento de datos según la invención, y en cada caso, en sentido inverso, de modo que con respecto a la divulgación de los aspectos individuales de la invención, la referencia es o puede ser siempre recíproca. El objeto se logra en particular mediante un procedimiento para generar una respuesta vocal acústica según la reivindicación 1.
En particular, aquí se prevé que al menos uno o más segmentos de voz estén almacenados previamente en al menos un objeto de información, en particular persistente, y cada uno de ellos se identifique y/o ejecute utilizando al menos una información de posición en el objeto de información. La información de posición es preferentemente información asignada al objeto de información, que permite la identificación (inequívoca) y/o ejecución y/o localización de información y/o datos del objeto de información. La identificación (por ejemplo mediante una búsqueda) y/o la ejecución (lectura de los datos) se realiza, por ejemplo, a través de un sistema de ficheros y/o una base de datos. La ejecución según la etapa b) puede incluir, por ejemplo, extraer los segmentos de voz, en particular datos (de audio), del objeto de información mediante la información de posición. La respuesta según la etapa c) incluye, por ejemplo, el procesamiento de los segmentos de voz, en particular datos de audio y/o determinación de una señal de audio mediante los segmentos de voz y/o la transmisión de la señal de audio a un altavoz. El objeto de información comprende preferentemente la pluralidad de segmentos de voz almacenados previamente, preferentemente datos, en particular preferentemente (al menos parcialmente) datos de audio. Los segmentos de voz se corresponden, por ejemplo, con los segmentos de plantilla para reproducir verbalmente la información proporcionada por los segmentos de plantilla (por ejemplo, textos y/o etapas o instrucciones de recetas). Los segmentos de voz incluyen en particular una reproducción acústica de un módulo de texto o segmento de plantilla. El procedimiento según la invención tiene la ventaja particular de que se puede generar una respuesta vocal rápidamente y de una manera que ahorra recursos (también ahorra espacio en la memoria). En particular, el almacenamiento previo de la pluralidad de segmentos de voz en el único objeto de información (en particular, el único) asegura que la disponibilidad y la velocidad de ejecución de la información relevante, es decir, de los segmentos de voz relevantes para la respuesta vocal, aumente. El esfuerzo administrativo se puede reducir aún más, a diferencia del caso de los datos distribuidos. Además, la seguridad y la fiabilidad en particular aumentan mediante el almacenamiento central en el objeto de información. En particular, el procedimiento según la invención permite la respuesta vocal en electrodomésticos, como el robot de cocina. Por tanto, el procedimiento según la invención también tiene la ventaja de que se puede facilitar y mejorar el funcionamiento y el uso del electrodoméstico.
El objeto de información se utiliza aquí preferentemente para el almacenamiento de información y/o datos persistente, es decir, en particular permanente y, por lo tanto, no volátil. En particular, la información del objeto de información, en particular los segmentos de voz almacenados previamente, se retiene incluso después de que no haya suministro de energía a una memoria para el objeto de información. Por tanto, el objeto de información persistente está diseñado, por ejemplo, como un fichero (individual) de un sistema de ficheros y/o bloque de datos y/u objeto de datos en una base de datos. El objeto de información se almacena preferentemente en una memoria no volátil, en particular preferentemente semipermanente o permanente, tal como una unidad de almacenamiento de datos de un electrodoméstico, por ejemplo. La memoria es, por ejemplo, un disco duro y/o un medio de almacenamiento extraíble y/o una memoria SSD y/o una memoria semiconductora, p. ej., EPROM, Ee PROM o memoria Flash. El uso de una memoria semipermanente permite, a diferencia de la memoria permanente, que se pueda cambiar la información del objeto de información. También es concebible que el objeto de información se almacene/guarde adicionalmente (al menos parcialmente) en una memoria intermedia volátil (caché) para mejorar los tiempos de acceso. Para este propósito, la memoria puede presentar un caché determinado, por ejemplo. El objeto de información es preferentemente un fichero que se gestiona a partir de un sistema de ficheros. El almacenamiento previo de los segmentos de voz juntos en el fichero individual reduce el esfuerzo administrativo del sistema de ficheros, aumenta la velocidad de acceso y mejora la seguridad y fiabilidad de la respuesta vocal.
Opcionalmente, se puede prever que el objeto de información se gestione a partir de un sistema de ficheros, y en particular la identificación (es decir, en particular también la localización) según la etapa a) y/o la ejecución según la etapa b) de los segmentos de voz respectivos se realice directamente a través del sistema de ficheros mediante la información de posición. La información de posición incluye, por ejemplo, al menos una marca de tiempo o al menos una información de tiempo para un fichero de audio como objeto de información. La marca de tiempo incluye, por ejemplo, una ventana de tiempo, es decir, una hora de inicio y una hora de finalización (por ejemplo, en el fichero de audio), de modo que el segmento de voz está definido por este intervalo. La información de posición también incluye, por ejemplo, una o más información del sistema de ficheros para la localización, como una dirección de fichero y/o una dirección física. La información de posición también puede incluir ventajosamente una indexación de datos o bytes del objeto de información, es decir, del fichero o fichero de audio. El sistema de ficheros se puede diseñar preferentemente como un sistema de ficheros específico para una memoria del objeto de información. Además, se puede proporcionar que el sistema de ficheros esté diseñado como un sistema de ficheros jerárquico y/o como un sistema de ficheros de red y/o como un sistema de ficheros de la familia FAT (del inglés, file allocation table). Para la identificación según la etapa a) se puede prever que el sistema de ficheros gestione las entradas y/o datos de la base de datos que permitan una asignación de al menos un segmento de plantilla de la plantilla vocal a la información de posición asignada. Para la ejecución según la etapa b) se puede prever que el sistema de ficheros lea los datos, en particular bloques de datos, en función de la información de posición. La información de posición aquí incluye, por ejemplo, al menos una ubicación de almacenamiento en el sistema de ficheros o memoria para el segmento de voz identificado. También es concebible que el segmento de voz se almacene de forma distribuida y, en particular, se pueda identificar y/o ejecutar mediante una pluralidad de informaciones de posición. El uso de un sistema de ficheros tiene la ventaja de que los segmentos de voz se pueden leer rápida y fácilmente. Además, en determinadas circunstancias, se puede utilizar un sistema de ficheros ya presente en el electrodoméstico para ahorrar costes y recursos.
Dentro del alcance de la invención se puede prever que el al menos un objeto de información esté diseñado como un solo fichero, en particular como un fichero de audio, donde la información de posición sea preferentemente información de indexación y/o información de tiempo, en particular al menos una marca de tiempo, para los segmentos de voz, en particular los datos de audio, que sea un fichero. En particular, se entiende por «fichero» una base de datos gestionada por un sistema de ficheros, que se identifica preferentemente por un nombre de fichero. El fichero incluye preferentemente información digital, en particular como secuencias de bits y/o bytes y también puede tener otros atributos, como el tipo de fichero y/o el tamaño del fichero y/o derechos de escritura y lectura y/o un momento de creación y/o modificación. Además, el fichero se puede comprimir y/o cifrar opcionalmente en la memoria. El fichero también está disponible preferentemente como un fichero de audio, en particular como un fichero OGG (es decir, en el formato de fichero OGG o según una especificación OGG) y/o fichero MP3 y/o fichero MP4. Los datos en el fichero son, por ejemplo, datos de audio que en particular incluyen datos en bruto PCM (del inglés, Puls-Code-Modulation) y/o datos de audio comprimidos. Además, el fichero también puede contener preferentemente metadatos que, por ejemplo, tengan información sobre la frecuencia de muestreo de los segmentos de voz y/o sobre la información de posición. Se puede prever que la información de posición se calcule y/o determine en función de los metadatos del fichero respectivo. También es posible que todos los segmentos de voz se almacenen en un solo fichero. Esto reduce enormemente el esfuerzo administrativo.
También es posible, opcionalmente, que se ejecute al menos un segmento de plantilla de la plantilla vocal para su identificación según la etapa a) y, en particular, que el segmento de plantilla se asigne a la información de posición para identificar el al menos un segmento de voz. El segmento de plantilla es, por ejemplo, información de texto, donde el segmento de voz correspondiente (identificado) preferentemente reproduce verbalmente el texto contenido. Como alternativa o adicionalmente, el segmento de plantilla también puede incluir una característica de identificación, por ejemplo un código y/o una cadena de caracteres única. Para este propósito, puede ser necesaria una definición previa de qué característica de identificación puede asignarse claramente a un segmento de voz correspondiente. La identificación tiene lugar, por ejemplo, mediante la ejecución del segmento de plantilla y/o buscando (posteriormente) la información de posición asociada y/o comparando el segmento de plantilla con la información de posición (o toda la existente), por ejemplo, mediante el sistema de ficheros y/o mediante una base de datos. Para ello, la base de datos puede tener, por ejemplo, una tabla que asigne segmentos de plantilla (conocidos) a la información de posición (disponible localmente) y/o segmentos de voz. Esto asegura que la respuesta vocal pueda tener lugar de manera fiable según la plantilla vocal.
De manera ventajosa, se puede prever dentro del alcance de la invención que, para la identificación según la etapa a), la identificación local tenga lugar asignando el segmento de plantilla a la información de posición de un objeto de información local para determinar la información de posición local, donde el objeto de información local se almacena en particular en una unidad de almacenamiento de datos no volátil del dispositivo según la invención, en particular del electrodoméstico. En este sentido, se puede prever que el objeto de información local esté almacenado, por ejemplo, espacialmente localmente en al menos una memoria en el dispositivo según la invención y/o en o en el electrodoméstico y, por lo tanto, comprenda segmentos de voz locales. Dado que posiblemente solo haya un espacio de memoria limitado disponible localmente, es concebible que durante la identificación según la etapa a) el segmento de plantilla no pueda asignarse a ninguno de los segmentos de voz disponibles localmente, ya que el segmento de voz no está disponible localmente. En este caso, la identificación local no se realiza correctamente. En particular, además de la identificación local, se lleva a cabo una identificación remota adicional, preferentemente solo entonces, según la etapa a). Por tanto, es posible utilizar una memoria (tal como la unidad de almacenamiento de datos no volátil) con solo una pequeña capacidad de almacenamiento para el dispositivo según la invención, en particular el electrodoméstico. Por tanto, se pueden reducir los costes y los gastos de fabricación del dispositivo.
Además, es concebible que, según la etapa a), se lleve a cabo una identificación y/o generación remota del segmento de voz mediante el segmento de plantilla, en particular solo si la identificación local es infructuosa, donde preferentemente según la etapa b) el segmento de voz identificado o generado remotamente está conectado en red, es decir, en particular, se accede a través de la nube. La identificación remota y/o la generación remota tiene lugar, por ejemplo, en al menos una unidad de procesamiento remota. En este contexto, el término «remoto» se refiere en particular al hecho de que la transmisión de datos en red, por ejemplo a través de una red, es necesaria y/o que la identificación y/o generación no es local (por ejemplo, por medio del dispositivo según la invención), si no que están separadas espacialmente, en particular por la unidad de procesamiento remota, por ejemplo, un servidor. El intercambio de datos necesario para esto (es decir, por ejemplo, la transmisión del segmento de plantilla) se conecta preferentemente en red a través de una red, en particular a través de Internet y/o a través de una LAN (red de área local) y/o a través de una red celular. Se puede prever que la unidad de procesamiento remota proporcione sus servicios, es decir, en particular la identificación remota o la generación del segmento de voz, para un gran número de dispositivos distintos, en particular dispositivos según la invención, a través de la red. Esto significa que los segmentos de voz se pueden identificar o generar de una manera flexible y que ahorra recursos, especialmente si no están (todavía) disponibles localmente.
Además, puede ser ventajoso dentro del alcance de la invención que, según la etapa a), se lleve a cabo una identificación remota asignando el segmento de plantilla a la información de posición de un objeto de información remoto para determinar información de posición remota, preferentemente solo si la identificación local es infructuosa. La identificación local es en particular infructuosa si el segmento de voz y/o la información de posición que se asigna al segmento de plantilla no está disponible localmente. El objeto de información remota se almacena en una memoria remota de la unidad de procesamiento remota, por ejemplo, y preferentemente se gestiona mediante un sistema de ficheros remoto de la unidad de procesamiento remota. Esto permite una identificación remota y/o ejecución remota en particular simple y rápida del segmento de voz identificado por la unidad de procesamiento remota.
También es ventajoso que, según la etapa a) y/o b), se identifique y/o ejecute un segmento de voz del objeto de información remoto utilizando la información de posición remota y, en particular, se transmita en red al dispositivo según la invención, en particular el electrodoméstico. Para la transmisión en red, el dispositivo según la invención y/o el electrodoméstico tiene en particular una interfaz, preferentemente una interfaz de transmisión, para una red. Preferentemente, está previsto que el segmento de voz identificado y/o ejecutado a distancia se almacene localmente en una memoria del dispositivo según la invención, en particular en el objeto de información local, después de la transmisión al dispositivo según la invención. Esto permite ampliar de forma flexible las existencias de segmentos de voz locales.
Según un desarrollo ventajoso de la invención, se puede prever que la identificación y/o asignación se realice mediante entradas de la base de datos local de una base de datos local y/o mediante entradas de la base de datos remota de una base de datos remota, donde las entradas de la base de datos en particular proporcionan una primera información sobre un segmento de plantilla con una segunda información a una información de posición. Es concebible que el dispositivo según la invención evalúe y/o procese y/o almacene la base de datos local y/o la base de datos remota de la unidad de procesamiento remota. La primera información se almacena en una tabla en la base de datos, por ejemplo, junto con la segunda información. Por tanto, el segmento de plantilla se puede vincular a la información de posición de forma sencilla. Además, se puede proporcionar que la unidad de procesamiento remota pueda cambiar las entradas de la base de datos en la base de datos local (conectadas en red) para una fácil gestión de esta información.
Se puede lograr otra ventaja dentro del alcance de la invención si, según la etapa b), después de una identificación local fructuosa, se ejecuta al menos un segmento de voz identificado localmente, y después de una identificación local infructuosa y/o una identificación remota fructuosa, se ejecuta al menos un segmento de voz identificado de forma remota, y/o después de una identificación remota infructuosa se ejecuta al menos un segmento de voz generado de forma remota, en particular el segmento de voz identificado o generado de forma remota que se integra en el objeto de información local. También es concebible que el segmento de voz generado de forma remota esté integrado en el objeto de información remota. La integración puede incluir preferentemente como primera etapa que los datos del segmento de voz correspondiente se almacenen en el objeto de información, por ejemplo, el fichero. Para ello, los datos se escriben, por ejemplo, en una posición específica, preferentemente al final, del objeto de información. Como segunda etapa, se puede prever que, según este almacenamiento de los datos, se genere una nueva información de posición, que, por ejemplo, se vuelva a almacenar en la base de datos, en particular como una entrada de la base de datos. Además, como tercera etapa, los datos que ya no sean necesarios en el objeto de información se pueden eliminar para liberar espacio de almacenamiento adicional. Esto permite optimizar el espacio de almacenamiento necesario.
También es concebible que, durante la integración, al menos un nuevo elemento de información de posición se genere y/o almacene preferentemente en una base de datos local, a partir de la cual el segmento de voz integrado se pueda claramente identificar y/o ejecutar en el objeto de información local. Esto asegura que cuando el segmento de voz generado se vuelva a identificar, a partir de ahora se pueda ejecutar y/o identificar localmente y no tenga que volver a generarse.
Opcionalmente, puede ser posible que la información de posición local y/o remota se combine y/o almacene en una base de datos local después de la etapa a) o b), y preferentemente con el objeto de información local en una unidad de almacenamiento de datos del dispositivo según la invención, en particular el electrodoméstico, se guarde. También es concebible que varios segmentos de voz se identifiquen y/o ejecuten a distancia al mismo tiempo y, en particular, que todos estos segmentos de voz se transmitan posteriormente juntos al dispositivo local según la invención. Para poder diferenciar entre distintos segmentos de voz transmitidos, también se transmite la información de posición asociada (asignada). Si es necesario, estos se pueden modificar y guardar localmente. Esto permite que la información necesaria para la respuesta vocal se genere y esté disponible de manera en particular eficiente.
Además, es posible opcionalmente dentro del alcance de la invención que según la etapa c) para la salida acústica, el al menos un segmento de voz se convierta en ondas sonoras a través de un dispositivo de salida, en particular con un altavoz. Para ello, el dispositivo de salida y/o el dispositivo según la invención comprende preferentemente al menos un dispositivo de procesamiento. El dispositivo de procesamiento puede comprender, por ejemplo, al menos un procesador, en particular al menos un procesador de señales digitales y/o al menos un microprocesador y/o al menos un microcontrolador, y/o memoria y/u otros componentes electrónicos. Además, el dispositivo de procesamiento se puede diseñar preferentemente como un sistema integrado del dispositivo según la invención. Preferentemente, el dispositivo de procesamiento está conectado eléctricamente directa o indirectamente a al menos un altavoz y/o al menos un convertidor de digital a analógico y/o al menos un amplificador. Además, el dispositivo de procesamiento puede ser adecuado para ejecutar al menos parcialmente el procedimiento según la invención y/o el producto de programa informático. En particular, el dispositivo de procesamiento y/o el dispositivo de salida son adecuados para convertir los segmentos de voz y/o los ficheros de audio en ondas sonoras acústicas con el fin de efectuar una respuesta vocal de la información contenida en los segmentos de voz. De esta manera, por ejemplo, se puede simplificar y mejorar el funcionamiento del dispositivo según la invención. Preferentemente, el al menos un dispositivo de procesamiento puede estar al menos parcialmente conectado eléctricamente a la electrónica adicional del dispositivo según la invención y/o al menos parcialmente integrado en él y/o al menos parcialmente dispuesto en una placa de circuito común.
También es concebible dentro del alcance de la invención que los segmentos de voz incluyan cada uno datos de audio que estén diseñados preferentemente para emitirse a través de un dispositivo de salida. Por ejemplo, también se puede prever que los datos de audio y/o los objetos de información, o el objeto de información, comprendan metadatos que contengan información sobre el dispositivo de salida. Esto también permite una adaptación flexible a distintos dispositivos de salida, por ejemplo.
Además, puede ser posible que el segmento de voz, en particular el segmento de voz generado de forma remota, comprenda datos de audio generados por un sistema de texto a voz o grabados por lenguaje natural. Para este propósito, la unidad de procesamiento remota tiene un sistema de conversión de texto a voz, por ejemplo, para generar los segmentos de voz generados a partir de los segmentos de plantilla si es necesario. Esto tiene la ventaja de que el sistema de conversión de texto a voz solo tiene que ser implementado por la unidad de procesamiento remota. Como resultado, se puede proporcionar un dispositivo de procesamiento especialmente económico y/o que ahorre energía para el dispositivo según la invención.
La invención puede prever ventajosamente que los segmentos de voz individuales y/o los datos de audio respectivos comprendan al menos frases y/o palabras y/o fonemas y/o difonos y/o sílabas y/o morfemas y/o frases. Además, es concebible que el dispositivo según la invención presente al menos un dispositivo de procesamiento que sea adecuado para volver a enlazar los segmentos de voz y/o los datos de audio y de ese modo producir una respuesta vocal natural. Los segmentos de voz y/o los datos de audio respectivos se pueden generar, por ejemplo, al menos parcialmente a partir de una grabación de voz previamente grabada.
Según otra posibilidad, se puede prever que la plantilla vocal comprenda palabras y/o frases predeterminadas, donde mediante la ejecución según la etapa b) y/o mediante la nueva combinación de los segmentos de voz, en particular según la etapa b) se generan palabras acústicas sintetizadas y/o frases y/o combinaciones de frases según la plantilla vocal como respuesta vocal. También es concebible que la plantilla vocal incluya más información de plantilla además de los segmentos de plantilla, donde la recombinación se realice en función de esta información de plantilla. Además, también es concebible que la unidad de procesamiento remota transmita información adicional de plantilla y/o toda la información la plantilla. Esto permite que la síntesis de voz tenga lugar de forma especialmente flexible.
Opcionalmente, se puede prever que los segmentos de voz individuales y/o los datos de audio respectivos y/o la plantilla vocal, en particular los segmentos de plantilla individuales, incluyan exclusivamente frases y/o palabras predeterminadas, donde las frases y/o palabras estén en particular relacionadas con la receta. El dispositivo según la invención y/o el electrodoméstico se pueden configurar, por ejemplo, como un robot de cocina. Es concebible que el procesador de alimentos pueda procesar distintas informaciones de recetas. La información de receta incluye, por ejemplo, instrucciones para el funcionamiento del robot de cocina y/o para preparar una receta específica y/o información de funcionamiento para el robot de cocina. Sobre la base de esta información operativa, es posible una ejecución al menos parcialmente automatizada de las recetas por parte del robot de cocina. Es concebible que las recetas incluyan instrucciones para un operador (usuario) del robot de cocina, que deberán emitirse verbalmente, por ejemplo, en función de un estado operativo del robot de cocina. El estado operativo es, en particular, un momento determinado, por ejemplo, en la secuencia de recetas y/o tiempos de preparación por parte del robot de cocina (por ejemplo, la fase de calentamiento) y/o en función del funcionamiento del robot de cocina (por ejemplo, en base al encendido y/o apagado del agitador, distintas fases de funcionamiento o similares). Las instrucciones deberán entenderse en el sentido, por ejemplo, de frases y/o palabras relacionadas con recetas. Las frases y/o palabras relacionadas con la receta incluyen preferentemente instrucciones de funcionamiento del robot de cocina (por ejemplo, la temperatura de calentamiento a ajustar y/o la velocidad del agitador) y/o dimensiones (por ejemplo, añadir una cierta cantidad de un ingrediente). En particular, es la información la que se reproduce al menos parcialmente en función de la receta o en una pantalla del procesador de alimentos. Esto mejora y simplifica enormemente el funcionamiento del procesador de alimentos.
Dentro del alcance de la invención se puede prever que la plantilla vocal se almacene en uno o más ficheros de especificación, en particular en y/o con y/o asignada a una receta para el procesador de alimentos, donde preferentemente la receta está guardada con la plantilla vocal en una unidad de almacenamiento de datos móvil. La unidad de almacenamiento de datos móvil comprende, por ejemplo, una unidad de interfaz que está diseñada para la comunicación y/o transmisión de datos con una interfaz, en particular una interfaz de transmisión de datos, del dispositivo según la invención. También es concebible que una memoria de la unidad de almacenamiento de datos móvil comprenda al menos una receta y/o al menos una plantilla vocal y/o al menos un segmento de voz adicional y/o al menos una información de posición adicional. Se puede prever que si una identificación local es infructuosa, primero (en particular antes de una identificación remota) se lleve a cabo en la memoria de datos una identificación de los segmentos de voz y/o información de posición proporcionada en la unidad de almacenamiento de datos móvil, y preferentemente la identificación solo tiene lugar si la identificación en la memoria de datos es infructuosa. Para la identificación en el lado del almacenamiento de datos, en particular los segmentos de voz de la unidad de almacenamiento de datos móvil pueden transmitirse, por ejemplo, al dispositivo según la invención a través de la interfaz y/o integrarse posteriormente en el objeto de información local. Esto permite una expansión flexible de los segmentos de voz locales.
Además, es concebible que los segmentos de voz se emitan uno tras otro en una secuencia definida en función de una receta, donde la plantilla vocal comprende en particular al menos un segmento de plantilla que comprende al menos una instrucción o una nota para un usuario (operador) del dispositivo según la invención, en particular del electrodoméstico. La secuencia se puede especificar, por ejemplo, por medio de la receta y/o por medio de la información de la unidad de almacenamiento de datos móvil. Esto mejora el funcionamiento del electrodoméstico y aumenta aún más la comodidad.
También es concebible que la generación de la respuesta vocal, en particular la salida temporal de los segmentos de voz y/o la ejecución repetitiva de las etapas a) a c), en función de los parámetros de funcionamiento del dispositivo según la invención, en particular el electrodoméstico, y/o acciones de funcionamiento de un usuario, de como resultado el dispositivo según la invención, en particular el electrodoméstico. Los parámetros de funcionamiento influyen preferentemente en el estado operativo, donde los parámetros de funcionamiento también pueden incluir, por ejemplo, distintas funciones, ajustes predeterminados y/o secuencias de programas (programas) para el funcionamiento del electrodoméstico. Los parámetros de funcionamiento permiten, en particular, operar de forma automatizada varios procesos del electrodoméstico, como, por ejemplo, el funcionamiento del agitador con una velocidad ajustada en función del tiempo y/o una temperatura de calentamiento ajustada como una función del tiempo. Es concebible, por ejemplo, que la respuesta vocal tenga lugar cuando sea necesaria una interacción y/o acción por parte de un usuario (operador) después de que se haya realizado un determinado programa. Esto también mejora la comodidad.
La invención también se refiere a un dispositivo según la reivindicación 12.
Preferentemente también se proporcionan componentes electrónicos, en particular con un dispositivo de procesamiento. En particular, se prevé además que el dispositivo de salida acústica y/o el dispositivo de procesamiento estén diseñados de tal manera que
- se pueda identificar al menos un segmento de voz almacenado previamente en función de una plantilla vocal digital, - el segmento de voz identificado se pueda ejecutar, y en particular
- el segmento de voz ejecutado se pueda emitir acústicamente,
donde preferentemente una pluralidad de segmentos de voz pueda almacenarse previamente en el objeto de información y cada uno pueda identificarse y/o ejecutarse mediante al menos una información de posición en el objeto de información. Por lo tanto, el dispositivo según la invención aporta las mismas ventajas que se han descrito en detalle con referencia a un procedimiento según la invención. Además, el dispositivo según la invención se puede operar preferentemente según un procedimiento según la invención. El electrodoméstico puede estar configurado, por ejemplo, como una aspiradora y/o un electrodoméstico de cocina o similar. El dispositivo según la invención y/o el robot de cocina según la invención se utiliza en particular en el sector doméstico para procesar alimentos, preferentemente también para la producción de alimentos (en particular parcialmente automatizada). Además, el dispositivo según la invención tiene preferentemente al menos un elemento calefactor (calentador) para calentar los alimentos. Para procesar el alimento, el dispositivo según la invención comprende preferentemente el recipiente de agitación, que preferentemente (en particular en el fondo) tiene el agitador y/o el elemento calefactor. También se proporciona un motor eléctrico, en particular, que acciona el agitador. El elemento calefactor se utiliza en particular para calentar los alimentos en el recipiente de mezcla y puede funcionar preferentemente con una temperatura de calentamiento ajustable. Se proporciona un panel de control, en particular con una pantalla, para establecer varios parámetros operativos, como, por ejemplo, una velocidad del agitador y/o la temperatura de calentamiento y/o varios programas operativos. La pantalla está diseñada, por ejemplo, como una pantalla táctil, a través de la cual un operador del dispositivo y/o el robot de cocina puede configurar los parámetros operativos y/o activar la operación. Para apoyar el funcionamiento, en particular el ajuste y la activación de los parámetros de funcionamiento, se pueden proporcionar recetas que, por ejemplo, incluyan ajustes predeterminados para los parámetros de funcionamiento y contengan las instrucciones de funcionamiento correspondientes para su salida en la pantalla. Las recetas se pueden almacenar, por ejemplo, en una unidad de almacenamiento de datos móvil fuera del dispositivo según la invención y/o en la unidad de almacenamiento de datos dentro del dispositivo según la invención.
Preferentemente, dentro del alcance de la invención se puede prever que el dispositivo comprenda una interfaz, donde la interfaz está diseñada de manera que la comunicación de datos con una unidad de almacenamiento de datos móvil se pueda llevar a cabo para ejecutar la plantilla vocal digital de la unidad de almacenamiento de datos móvil. La interfaz está configurada preferentemente como una interfaz de transmisión de datos, la cual presenta elementos de contacto eléctricamente conductores dispuestos en particular en una superficie exterior de la carcasa del dispositivo, en particular el robot de cocina. Además, la interfaz está diseñada, por ejemplo, como una interfaz en serie y/o una interfaz de sistema de bus, preferentemente como una interfaz USB (del inglés, Universal Serial Bus). La interfaz está diseñada, por ejemplo, como una interfaz USB y/o como una interfaz de telefonía celular móvil y/o como una interfaz de red. Además, se puede prever que el dispositivo según la invención presente una interfaz adicional, en particular una interfaz de red, en particular para la comunicación y/o transmisión de datos con la unidad de procesamiento remota, en particular para las etapas a) y/o b) y/o c) de un procedimiento según la invención. Esto tiene la ventaja de que se puede realizar una generación de voz especialmente fiable y que, además, ahorre recursos. También es concebible que cuando la interfaz esté conectada a la unidad de almacenamiento de datos móvil, se lean al menos una receta o todas las recetas de la unidad de almacenamiento de datos móvil. Además, se puede prever que cuando se ejecute una receta, se lean y/o evalúen una individual, algunas o todas las plantillas de voz y/o segmentos de plantilla de la receta. Por ejemplo, aquí se puede realizar la identificación local y, si es necesario, la identificación remota.
La invención también se refiere a un procesador de alimentos, preferentemente con un recipiente de mezcla y un agitador en el recipiente de mezcla, preferentemente que tenga al menos una unidad de almacenamiento de datos no volátil, donde pueda almacenarse al menos un objeto de información persistente en la unidad de almacenamiento de datos, y/o al menos un dispositivo de salida acústica, en particular con un altavoz. En particular, se prevé que el robot de cocina pueda funcionar según un procedimiento según la invención. Por lo tanto, el procedimiento según la invención aporta las mismas ventajas que se han descrito en detalle con referencia a un dispositivo de prueba según la invención y/o un sistema según la invención.
Un ejemplo se refiere a un producto de programa informático, en particular para el funcionamiento de un dispositivo según la invención, preferentemente según un procedimiento según la invención, en particular para generar una respuesta vocal acústica. En particular, se prevé que el producto de programa informático esté diseñado para realizar al menos una de las etapas siguientes:
a) identificación de al menos un segmento de voz prealmacenado en función de una plantilla vocal digital, b) ejecución del segmento de voz identificado,
c) salida acústica del segmento de voz recuperado,
donde uno o más segmentos de voz están almacenados previamente en al menos un objeto de información persistente, y cada uno de ellos se identifique y/o ejecute utilizando al menos una información de posición en el objeto de información. El producto de programa informático incluye, por ejemplo, software (en particular ejecutable por un dispositivo de procesamiento) y/o firmware y/o un soporte de datos, como una memoria de datos o una unidad de almacenamiento de datos móvil o un disco duro o similar, y/o al menos un fichero, en cada caso en particular con la secuencia del programa para la realización del procedimiento según la invención. Por lo tanto, el programa informático aporta las mismas ventajas que se han descrito en detalle con referencia a un dispositivo de prueba según la invención y/o un sistema según la invención y/o un robot de cocina según la invención.
T ambién se describe una unidad de almacenamiento de datos móvil, en particular con recetas para un robot de cocina según la invención, que se puede manejar en particular mediante el procedimiento según la invención. También se describe un sistema con el dispositivo según la invención y/o con el producto de programa informático y/o con la unidad de almacenamiento de datos móvil, donde preferentemente el sistema se puede operar según un procedimiento según la invención.
Otras ventajas, características y detalles de la invención se harán evidentes a partir de la siguiente descripción en la que, con referencia a los dibujos, se describen en detalle realizaciones ejemplares de la invención. Las características mencionadas en la descripción pueden ser esenciales para la invención individualmente o en cualquier combinación, siempre que estén dentro del alcance de las reivindicaciones. Muestran:
la figura 1 una representación esquemática de un dispositivo según la invención, en particular un robot de cocina, las figuras 2 y 3 una representación esquemática para visualizar un procedimiento según la invención,
la figura 4 muestra una representación esquemática para la visualización de un procedimiento según la invención, en particular una identificación local,
la figura 5 una representación esquemática para visualizar un procedimiento según la invención, en particular una identificación remota y
la figura 6 una representación esquemática para visualizar un procedimiento según la invención.
La figura 1 muestra un dispositivo 10 según la invención, que está configurado como un robot de cocina 10 en el ejemplo de realización mostrado. Por supuesto, las características descritas a continuación también se aplican en relación con otros dispositivos, en particular a un electrodoméstico 10, por ejemplo, una aspiradora o similar. El dispositivo 10 comprende una carcasa 20, que comprende un receptáculo 22 para un recipiente de agitación 24. El recipiente de agitación 24 puede cerrarse, por ejemplo, mediante una tapa 21, presenta un asa 23, por ejemplo, y un agitador (no mostrado) y/o un elemento calefactor se pueden colocar y/o disponer preferentemente dentro del recipiente de agitación 24. El dispositivo 10 según la invención también presenta un panel de control 26 que en particular comprende una pantalla 25, preferentemente una pantalla táctil 25. La pantalla 25 funciona de esta manera, por ejemplo, como medio de entrada y salida. Se puede proporcionar un control giratorio, un interruptor de ajuste o similar, por ejemplo, como medio de entrada adicional. En particular, el panel de control 26 permite a un operador del dispositivo 10 configurar y/o activar y/o desactivar parámetros operativos tales como la velocidad del agitador, la temperatura de calentamiento y/o la duración y/o varios programas del dispositivo 10. Además, a través de la pantalla 25 también se pueden emitir instrucciones y/o información y/o elementos operativos gráficos relacionados con la receta. El dispositivo 10 se puede operar como medio de entrada a través de los elementos operativos gráficos, que preferentemente forman parte de una interfaz gráfica de usuario. Las recetas, que incluyen, por ejemplo, las instrucciones relacionadas con la receta y/o los segmentos de plantilla relacionados con la receta, se almacenan previamente, por ejemplo, en una unidad de almacenamiento de datos móvil 60. La unidad de almacenamiento de datos móvil 60 está diseñada preferentemente para ser portátil y está diseñada por separado del dispositivo 10 según la invención. El dispositivo 10 según la invención presenta un receptáculo 31 en el exterior para recibir la unidad de almacenamiento de datos móvil 60. Este receptáculo 31 comprende, por ejemplo, elementos de contacto por medio de los cuales es posible una conexión eléctrica separable o contacto con una unidad de interfaz de la unidad de almacenamiento de datos móvil 60 para la transmisión de datos. De esta manera, los datos de la unidad de almacenamiento de datos móvil 60, por ejemplo, las recetas, pueden transmitirse al dispositivo 10 según la invención y almacenarse, por ejemplo, en una unidad de almacenamiento de datos 50 del dispositivo 10 según la invención. Además, la unidad 50 de almacenamiento de datos puede presentar o representar el programa informático con el procedimiento 100 según la invención. Además, la unidad de almacenamiento de datos 50 está conectada eléctricamente a un dispositivo de salida 40 y/o a una interfaz 32. La interfaz 32 se utiliza preferentemente para la transmisión de datos y/o para la conexión a la unidad de almacenamiento de datos móvil 60 y está configurada en particular como una interfaz de radio y/o USB. La interfaz 32 está, por ejemplo, conectada eléctricamente a los elementos de contacto en la zona del receptáculo 31. Además, la interfaz 32 o una interfaz 32 adicional puede presentar una interfaz de red para permitir la transmisión de datos y/o la comunicación digital a una unidad de procesamiento remota.
En las figuras 2 a 6, se visualiza esquemáticamente un procedimiento 100 según la invención. Inicialmente, se proporciona una plantilla vocal 110, por ejemplo, mediante la unidad de almacenamiento de datos móvil 60 y/o las recetas. La plantilla vocal 110 comprende varios segmentos de plantilla 115, que se pueden asignar a los correspondientes segmentos de voz 120. Los segmentos de plantilla 115 y/o los segmentos de voz correspondientes 120 incluyen preferentemente información relacionada con la receta, por ejemplo, instrucciones de la receta para un operador (usuario) del dispositivo 10 según la invención. El segmento 115 de plantilla es, por ejemplo, información de texto, donde la plantilla vocal 110 preferentemente está almacenada en forma de fichero y de forma especialmente preferente en la unidad de almacenamiento de datos móvil 60. Por ejemplo, un primer segmento de plantilla 115.1 presenta la información (de texto) de que se va a preparar un primer ingrediente. Un primer segmento de voz asignado 120.1 tiene, por ejemplo, una respuesta vocal en forma de datos de audio de que se va a preparar el primer ingrediente. En consecuencia, un segundo segmento de plantilla 115.2 y/o un tercer segmento de plantilla 115.3 comprenden, por ejemplo, instrucciones similares, tales como la configuración de un parámetro operativo específico (por ejemplo, establecer el nivel de agitación, colocar la tapa 21 o similar). Un segundo segmento de voz 120.2 y un tercer segmento de voz 120.3 incluyen las correspondientes salidas de voz. El primer segmento de voz 120.1 y/o el segundo segmento de voz 120.2 y/o el tercer segmento de voz 120.3 y/o todos los segmentos de voz 120 pueden almacenarse en un único objeto de información 130, en particular un fichero, preferentemente un fichero de audio. Por tanto, el objeto 130 de información contiene preferentemente toda la información de voz que es necesaria para la salida acústica verbal de la información de los segmentos de plantilla 115. Para poder ejecutar los segmentos de voz 120 del objeto de información 130, se requiere información de posición 140, donde, por ejemplo, se asigna una primera información de posición 140.1 al primer segmento de voz 120.1, una segunda información de posición 140.2 al segundo segmento de voz 120.2 y una tercera información de posición 140.3 al tercer segmento de voz 120.3.
Los segmentos de plantilla 115 se llaman, por ejemplo, a partir de la plantilla vocal 110 de manera relacionada con la receta al ejecutar una receta, por ejemplo, en función del tiempo. La llamada o ejecución de los segmentos de plantilla 115 de la plantilla vocal 110 tiene lugar inicialmente según una primera etapa del procedimiento 100.1. Para ejecutar ahora un segmento 120 de voz correspondiente para un segmento 115 de plantilla dado y/o emitirlo acústicamente, deberá determinarse la posición correcta del segmento de voz 120 asignado en el objeto de información 130. Para este propósito, según una segunda etapa del procedimiento 100.2, el segmento de voz 120 prealmacenado se identifica en función de la plantilla vocal digital 110. La identificación se lleva a cabo preferentemente por medio de una base de datos 150 que comprende entradas de la base de datos 160 que enlazan el segmento de plantilla 115 dado con la correspondiente información de posición 140. Esto también se muestra con más detalle en la figura 3. Mediante información de posición 140, el segmento de voz 120 se puede encontrar ahora en el objeto de información 130 y de esta manera identificarse y, según una tercera etapa del procedimiento 100.3, el segmento de voz identificado 120 se puede ejecutar en la posición correcta. En la figura 2 también se ilustra que los segmentos de voz identificados 120 recuperados de esta manera se emiten a continuación acústicamente por medio del dispositivo de salida 40 según una quinta etapa del procedimiento 100.5.
En la figura 3 se muestra además que antes de la salida acústica de los segmentos de voz 120 ejecutados, los segmentos de voz 120 identificados se combinan según una cuarta etapa del procedimiento 100.4 para permitir una respuesta vocal fluida. Esto tiene lugar, por ejemplo, porque los segmentos de voz 120 se escriben en un nuevo fichero de audio en el orden de salida y/o preparación digital para salida combinada.
Se prevé además que se lleve a cabo primero una identificación local según una sexta etapa de procedimiento 100.6 y solo si la identificación local según una séptima etapa de procedimiento 100.7 es infructuosa se lleva a cabo una identificación remota de los segmentos de voz 120. Puede verse en la figura 4 que se utiliza una base de datos local 153 para la identificación local, que incluye entradas 163 de la base de datos local almacenadas localmente. Según las entradas 163 de la base de datos local, se puede asignar un segmento de plantilla 115 dado a la información de posición local 143. Entonces se puede identificar localmente un segmento de voz 120 en función de esta información de posición local 143, y este segmento de voz 123 identificado localmente se puede ejecutar de un objeto de información local 133, en particular un fichero local.
La figura 5 muestra que en el caso de una identificación local infructuosa, es decir, si no hay ningún segmento de voz 120 disponible en el objeto de información local 133 para un segmento de plantilla 115 dado, esta consulta de búsqueda se transfiere en red a una unidad de procesamiento remota según una octava etapa de procedimiento 100.8. De manera correspondiente, aquí se accede a las entradas de la base de datos remota 165 de esta base de datos remota 155 en una base de datos remota 155. El acceso a la base de datos y/o la transmisión de datos y/o la transmisión de las instrucciones correspondientes para la identificación remota se realiza, por ejemplo, a través de una red. Si un segmento de voz remoto 120 está disponible para el segmento de plantilla dado 115, la información de posición remota 145 correspondiente se encuentra para este segmento de voz 120 en la base de datos remota 155 o en la entrada de base de datos correspondiente. Esta información de posición remota 145 permite ejecutar el segmento de voz identificado 125 de forma remota en el objeto de información remota 135. Si el segmento de voz 120 aún no está disponible, la unidad de procesamiento remota puede generar un nuevo segmento de voz 120. El segmento de voz remotamente identificado 125 o el segmento de voz remotamente generado 125 se ejecuta y/o transmite al dispositivo 10 según la invención a través de la red.
La figura 6 muestra además que el segmento de voz remotamente identificado 125 y/o el segmento de voz remotamente generado 125 pueden integrarse entonces en el objeto de información local 133. Para ello, se genera nueva información de posición 141, que especifica la nueva posición del segmento de voz integrado 125 en el objeto de información local 133.
La explicación anterior de las realizaciones describe la presente invención únicamente a modo de ejemplo. Por supuesto, las características individuales de las realizaciones se pueden combinar libremente entre sí, siempre que sean técnicamente sensibles, siempre que se incluyan en la definición de las reivindicaciones.
Lista de referencias
10 Robot de cocina, electrodoméstico, dispositivo
20 Carcasa
21 Tapa
22 Receptáculo para el recipiente de agitación
23 Asa
24 Recipiente de agitación
25 Visualización
26 Panel de control
31 Receptáculo para 60
32 Interfaz
40 Altavoz, dispositivo de salida
50 Unidad de almacenamiento de datos
60 Unidad de almacenamiento de datos móvil
100 Procedimiento
100.1 Primera etapa del procedimiento, ejecución de la plantilla vocal
100.2 Segunda etapa del procedimiento, identificación
100.3 Tercera etapa del procedimiento, ejecución del segmento de voz
100.4 Cuarta etapa del procedimiento, combinación del segmento de voz
100.5 Quinta etapa del procedimiento, salida
100.6 Sexta etapa del procedimiento, identificación local
100.7 Séptima etapa del procedimiento, identificación remota
100.8 Octava etapa del procedimiento, transferencia de la consulta de búsqueda
110 Plantilla vocal
115 Segmento de plantilla
115.1 Primer segmento de plantilla
115.2 Segundo segmento de plantilla
115.3 Tercer segmento de plantilla
120 Segmento de voz
120.1 Primer segmento de voz
120.2 Segundo segmento de voz
120.3 Tercer segmento de voz
123 Segmento de voz identificado local
125 Segmento de voz identificado remoto, segmento de voz generado remoto
130 Objeto de información, fichero, fichero de audio
133 Objeto de información local
135 Objeto de información remoto
140 Información de posición, Información de tiempo, información de indexación
140.1 Primera información de posición
140.2 Segunda información de posición
140.3 Tercera información de posición
141 Información de posición nueva
143 Información de posición local
145 Información de posición remota
150 Base de datos
153 Base de datos local
155 Base de datos remota
Entrada de la base de datos Entrada de la base de datos local Entrada de la base de datos remota

Claims (13)

REIVINDICACIONES
1. Procedimiento (100) para generar una respuesta vocal acústica en un electrodoméstico (10), preferentemente en un electrodoméstico de cocina accionado por motor eléctrico (10) con un recipiente de mezcla (24) y un agitador en el recipiente de mezcla (24), con las etapas siguientes:
a) identificación de al menos un segmento de voz almacenado previamente (120) en función de una plantilla vocal digital (110) con al menos un segmento de plantilla (115),
b) ejecución del segmento de voz identificado (120),
c) salida acústica del segmento de voz recuperado (120),
donde varios segmentos de voz (120) se almacenan previamente en un objeto de información persistente (130), y cada uno se identifica y/o ejecuta utilizando al menos una información de posición (140) en el objeto de información (130), donde el objeto de información (130) está diseñado como un solo fichero (130), donde
los segmentos de voz (120) corresponden a los segmentos de plantilla (115) con el fin de reproducir verbalmente etapas de receta o instrucciones proporcionadas por los segmentos de plantilla (115), donde cada uno de los segmentos de voz (120) comprende una reproducción acústica de un segmento de plantilla (115), donde los segmentos de voz individuales (120) comprenden al menos frases y/o palabras cuyos segmentos de voz (120) se emiten uno tras otro en un orden definido en función de una receta, donde la plantilla vocal (110) está almacenada en uno o más ficheros de especificación, y la receta con la plantilla vocal (110) se almacena en una unidad de almacenamiento de datos móvil (60), donde la plantilla vocal (110) comprende palabras y/o frases predeterminadas, donde mediante la ejecución según la etapa b) y la recombinación de los segmentos de voz (120) según la etapa b) se pueden generar frases y/o palabras acústicas sintetizadas y/o combinaciones de frases correspondientes a la plantilla vocal (110) como respuesta vocal.
2. Procedimiento (100) según la reivindicación 1,
caracterizado porque
el objeto de información (130) se gestiona a partir de un sistema de ficheros, y en particular la identificación según la etapa a) y/o la ejecución según la etapa b) de los segmentos de voz respectivos (120) se realiza directamente a través del sistema de ficheros mediante la información de posición (140), y/o porque el al menos un objeto de información (130) está diseñado como un único fichero de audio (130), donde la información de posición (140) es preferentemente información de indexación (140) y/o información de tiempo (140) para los segmentos de voz (120), en particular los datos de audio, del fichero (130).
3. Dispositivo (100) según cualquiera de las reivindicaciones anteriores,
caracterizado porque
para la identificación según la etapa a) se ejecuta al menos un segmento de plantilla (115) de la plantilla vocal (110), y en particular el segmento de plantilla (115) se asigna a la información de posición (140) para identificar el al menos un segmento de voz (120), donde preferentemente para la identificación según la etapa a), la identificación local se lleva a cabo mediante la asignación del segmento de plantilla (115) a la información de posición (140) de un objeto de información local (133) con el fin de determinar la información de posición local (143), donde el objeto de información local (133) en particular se almacena en una unidad de almacenamiento de datos no volátil (50) del electrodoméstico (10).
4. Procedimiento (100) según la reivindicación 3,
caracterizado porque
según la etapa a) se realiza una identificación y/o generación remota del segmento de voz (120) mediante el segmento de plantilla (115), en particular solo si una identificación local ha sido infructuosa, donde preferentemente según la etapa b) el segmento de voz identificado remoto o generado remoto (125) conectado en red, es decir, basado en la nube, se ejecuta, donde se realiza la identificación remota y/o la generación remota en al menos una unidad de procesamiento remota, donde es necesaria la transmisión de datos en red a través de una red y/o la identificación y/o generación no es local, sino que tiene lugar espacialmente separada mediante la unidad de procesamiento remota.
5. Dispositivo (100) según cualquiera de las reivindicaciones 3 a 4,
caracterizado porque
según la etapa a) tiene lugar una identificación remota mediante la asignación el segmento de plantilla (115) a la información de posición (140) de un objeto de información remoto (135) con el fin de determinar una información de posición remota (145), preferentemente solo si la identificación local ha sido infructuosa, donde el objeto de información remota (135) se almacena en una memoria remota de una unidad de procesamiento remota y se administra a partir de un sistema de ficheros remoto de la unidad de procesamiento remota, y preferentemente según la etapa a) y/o b) un segmento de voz (120) del objeto de información remota (135) se identifica y/o ejecuta mediante la información de posición remota (145) y, en particular, se transmite al electrodoméstico (10) en red.
6. Dispositivo (100) según cualquiera de las reivindicaciones anteriores,
caracterizado porque
la identificación y/o asignación se realiza mediante las entradas de la base de datos local (163) de una base de datos local (153) y/o mediante las entradas de base de datos remota (165) de una base de datos remota (155), donde las entradas de la base de datos (160) en particular proporcionar información inicial sobre un segmento de plantilla (115) con una segunda información para vincular una información de posición (140) entre sí, donde desde una unidad de procesamiento remota, la base de datos remota se evalúa y/o procesa y/o guarda.
7. Dispositivo (100) según cualquiera de las reivindicaciones anteriores,
caracterizado porque
según la etapa b) después de una identificación local fructuosa se ejecuta al menos un segmento de voz identificado localmente (123), y después de una identificación local infructuosa y/o una identificación remota fructuosa se ejecuta al menos un segmento de voz identificado remotamente (125), y/o después de una identificación remota infructuosa, se ejecuta al menos un segmento de voz generado de forma remota (125), donde, en particular, el segmento de voz identificado de forma remota o generado de forma remota (125) se integra en el objeto de información local (133), y durante la integración preferentemente se genera y/o se almacena al menos una nueva información de posición (140) en una base de datos local (153) mediante la cual el segmento de voz integrado (125) se puede identificar y/o ejecutar de forma inequívoca en el objeto de información local (133).
8. Dispositivo (100) según cualquiera de las reivindicaciones anteriores,
caracterizado porque
después de la etapa a) o b) la información de posición local y/o remota (143, 145) se combinan y/o almacenan en una base de datos local (153), y preferentemente se almacenan con el objeto de información local (133) en una unidad de almacenamiento de datos (50) del electrodoméstico (10).
9. Dispositivo (100) según cualquiera de las reivindicaciones anteriores,
caracterizado porque
los segmentos de voz individuales (120) y/o los datos de audio respectivos y/o la plantilla vocal (110), en particular los segmentos de plantilla individuales (115), comprenden exclusivamente frases y/o palabras predeterminadas, donde las frases y/o palabras están relacionadas con la receta.
10. Dispositivo (100) según cualquiera de las reivindicaciones anteriores,
caracterizado porque la plantilla vocal (110) está almacenada en la receta del robot de cocina (10) en uno o más ficheros de especificación, donde la plantilla vocal (110) comprende preferentemente al menos un segmento de plantilla (115) que contiene al menos una instrucción o nota para un usuario del electrodoméstico (10).
11. Dispositivo (100) según cualquiera de las reivindicaciones anteriores,
caracterizado porque
la generación de la respuesta vocal, en particular la salida temporal de los segmentos de voz (120) y/o la ejecución repetida de las etapas a) a c), se realiza en función de los parámetros de funcionamiento del electrodoméstico (10) y/o las acciones de funcionamiento de un usuario del electrodoméstico (10).
12. Dispositivo (10), a saber, un robot de cocina (10) accionado por motor eléctrico y/o un electrodoméstico (10), preferentemente con un recipiente de agitación (24) y un agitador en el recipiente de agitación (24), que comprende:
- al menos una unidad de almacenamiento de datos no volátil (50), donde al menos un objeto de información persistente (130) está almacenado en la unidad de almacenamiento de datos (50),
- al menos un dispositivo de salida acústica (40), en particular con un altavoz (40),
donde el dispositivo de salida acústica (40) está diseñado de tal manera que al menos un segmento de voz prealmacenado (120) se identifica como una función de una plantilla vocal digital (110) con al menos un segmento de plantilla (115), donde se ejecuta el segmento de voz identificado (120), y
el segmento de voz ejecutado (120) se emite acústicamente, donde varios segmentos de voz (120) se almacenan previamente en el objeto de información (130),y
se identifican y/o ejecutan en cada caso utilizando al menos una información de posición (140) del objeto de información (130), donde
el objeto de información (130) está configurado como un solo fichero (130), donde
los segmentos de voz (120) corresponden a los segmentos de plantilla (115) con el fin de reproducir verbalmente etapas de receta o instrucciones proporcionadas por los segmentos de plantilla (115), donde cada uno de los segmentos de voz (120) comprende una reproducción acústica de un segmento de plantilla (115), donde los segmentos de voz individuales (120) comprenden al menos frases y/o palabras que emiten segmentos de voz (120) en una secuencia definida en el tiempo en función de una receta, donde la plantilla vocal (110) se almacena en uno o varios ficheros de especificación asignados a la receta para el robot de cocina o electrodoméstico, y la receta se almacena con la plantilla vocal (110) en una unidad de almacenamiento de datos móvil (60), donde
la plantilla vocal (110) comprende palabras y/o frases predefinidas, donde mediante la ejecución de un segmento de voz identificado y mediante la recombinación de segmentos de voz (120) según la ejecución de segmentos de voz identificados, se generan frases y/o palabras acústicas sintetizadas y/o combinaciones de frases según la plantilla vocal (110) como respuesta vocal.
13. Dispositivo (10) según la reivindicación 12,
caracterizado porque
el dispositivo (10) comprende una interfaz (32), donde la interfaz (32) está diseñada de tal manera que se puede realizar una comunicación de datos con la unidad de almacenamiento de datos móvil (60) para ejecutar la plantilla vocal digital (110) de la unidad de almacenamiento de datos móvil (60).
ES18172586T 2015-09-22 2015-09-22 Procedimiento para la generación de una respuesta vocal acústica Active ES2848852T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP18172586.2A EP3382693B1 (de) 2015-09-22 2015-09-22 Verfahren zur erzeugung einer akustischen sprachausgabe
PCT/EP2015/071752 WO2017050354A1 (de) 2015-09-22 2015-09-22 Verfahren zur erzeugung einer akustischen sprachausgabe

Publications (1)

Publication Number Publication Date
ES2848852T3 true ES2848852T3 (es) 2021-08-12

Family

ID=54238409

Family Applications (5)

Application Number Title Priority Date Filing Date
ES18172597T Active ES2848836T3 (es) 2015-09-22 2015-09-22 Procedimiento para la generación de una respuesta vocal acústica
ES18172591T Active ES2802483T3 (es) 2015-09-22 2015-09-22 Procedimiento para generar una emisión vocal acústica
ES18172594T Active ES2810930T3 (es) 2015-09-22 2015-09-22 Procedimiento para generar una emisión vocal acústica
ES15771898T Active ES2759313T3 (es) 2015-09-22 2015-09-22 Procedimiento para generar una emisión vocal acústica
ES18172586T Active ES2848852T3 (es) 2015-09-22 2015-09-22 Procedimiento para la generación de una respuesta vocal acústica

Family Applications Before (4)

Application Number Title Priority Date Filing Date
ES18172597T Active ES2848836T3 (es) 2015-09-22 2015-09-22 Procedimiento para la generación de una respuesta vocal acústica
ES18172591T Active ES2802483T3 (es) 2015-09-22 2015-09-22 Procedimiento para generar una emisión vocal acústica
ES18172594T Active ES2810930T3 (es) 2015-09-22 2015-09-22 Procedimiento para generar una emisión vocal acústica
ES15771898T Active ES2759313T3 (es) 2015-09-22 2015-09-22 Procedimiento para generar una emisión vocal acústica

Country Status (6)

Country Link
EP (5) EP3382693B1 (es)
ES (5) ES2848836T3 (es)
PL (5) PL3353775T3 (es)
PT (5) PT3382695T (es)
TW (1) TWI621117B (es)
WO (1) WO2017050354A1 (es)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108451400A (zh) * 2018-01-19 2018-08-28 浙江绍兴苏泊尔生活电器有限公司 料理机及其控制方法、系统
CN112716329A (zh) * 2021-01-29 2021-04-30 广东科学技术职业学院 一种智能调料盒

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6950792B1 (en) * 2000-10-25 2005-09-27 Cisco Technology, Inc. Arrangement for providing international prompts in a unified messaging system
US7653542B2 (en) * 2004-05-26 2010-01-26 Verizon Business Global Llc Method and system for providing synthesized speech
US9087507B2 (en) * 2006-09-15 2015-07-21 Yahoo! Inc. Aural skimming and scrolling
US20090171665A1 (en) * 2007-12-28 2009-07-02 Garmin Ltd. Method and apparatus for creating and modifying navigation voice syntax
US8996376B2 (en) * 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US20090300503A1 (en) * 2008-06-02 2009-12-03 Alexicom Tech, Llc Method and system for network-based augmentative communication
DE102008034144B4 (de) * 2008-07-22 2013-10-10 Rational Ag Verfahren zur Audio-Signaleinstellung und Gargerät
US8112279B2 (en) * 2008-08-15 2012-02-07 Dealer Dot Com, Inc. Automatic creation of audio files
US8898568B2 (en) * 2008-09-09 2014-11-25 Apple Inc. Audio user interface
RU2421827C2 (ru) * 2009-08-07 2011-06-20 Общество с ограниченной ответственностью "Центр речевых технологий" Способ синтеза речи
US20140108010A1 (en) * 2012-10-11 2014-04-17 Intermec Ip Corp. Voice-enabled documents for facilitating operational procedures

Also Published As

Publication number Publication date
PT3382694T (pt) 2020-07-16
PL3353775T3 (pl) 2020-03-31
TWI621117B (zh) 2018-04-11
EP3382693A1 (de) 2018-10-03
PL3382693T3 (pl) 2021-05-31
PT3382693T (pt) 2021-01-04
EP3382693B1 (de) 2020-11-04
PT3385945T (pt) 2020-12-24
EP3382695A1 (de) 2018-10-03
WO2017050354A1 (de) 2017-03-30
PT3382695T (pt) 2020-07-29
ES2802483T3 (es) 2021-01-19
EP3382694B1 (de) 2020-03-25
EP3385945B1 (de) 2020-11-04
EP3353775A1 (de) 2018-08-01
PL3382694T3 (pl) 2021-02-08
PL3382695T3 (pl) 2020-11-02
TW201719630A (zh) 2017-06-01
PT3353775T (pt) 2019-12-17
PL3385945T3 (pl) 2021-05-17
ES2810930T3 (es) 2021-03-09
ES2848836T3 (es) 2021-08-12
EP3382695B1 (de) 2020-05-13
EP3353775B1 (de) 2019-09-11
EP3385945A1 (de) 2018-10-10
EP3382694A1 (de) 2018-10-03
ES2759313T3 (es) 2020-05-08

Similar Documents

Publication Publication Date Title
BR112014010748B1 (pt) sistema e método para configuração ativada por voz de um dispositivo de controle
EP3575005B1 (en) Method and apparatus for providing vibration in electronic device
CN104616678A (zh) 一种音乐播放控制方法及装置
ES2848852T3 (es) Procedimiento para la generación de una respuesta vocal acústica
CN107968828B (zh) 家电语音播报方法、装置及设备
JP7340764B2 (ja) 音声制御システム
CN103049192A (zh) 一种应用程序开启方法及装置
JP2013178510A (ja) 電子装置及びプログラム
CN103106895A (zh) 一种音乐蜂鸣的控制方法、系统及对应电子产品
CN114822492B (zh) 语音合成方法及装置、电子设备、计算机可读存储介质
JP2019016206A (ja) 音声認識文字表示プログラム、情報処理装置、及び、音声認識文字表示方法
JP6124844B2 (ja) サーバ、データベースを利用する方法、プログラム、システム、端末、端末プログラムおよび音声データ出力装置
KR20150066917A (ko) 장치간 동기화 기반 원격 협업 장치
JP2006047831A (ja) 電子音楽装置及びプログラム
JP4239952B2 (ja) 自動伴奏装置およびその制御方法を実現するためのプログラム
RU2004105022A (ru) Система справочно-информационной поддержки пользователя эвм, способ ее формирования и применения
CN118689547A (zh) 一种bios定制化方法及装置
CN106782661B (zh) 一种手动式prom数据固化装置
JP2016001840A (ja) 制御システム、サーバ装置、家電、制御方法、およびプログラム
CN120455271A (zh) 配置方法、目标对象、服务器及介质
Feiler Using CocoaPods
JP4486041B2 (ja) カラオケイベント情報表示システム
CN116303514A (zh) 用户手册推送方法、装置、设备以及存储介质
Gençalves Rediscovering an Analogue Heritage: Digitally Driven Voltage-Controlled Synthesizer Modules: Digitally Driven Voltage-Controlled Synthesizer Modules
CN115828015A (zh) 一种数据处理方法、装置、服务器和存储介质