ES2305539T3 - Metodo y sistema para aumentar una señal de audio. - Google Patents

Metodo y sistema para aumentar una señal de audio. Download PDF

Info

Publication number
ES2305539T3
ES2305539T3 ES03778627T ES03778627T ES2305539T3 ES 2305539 T3 ES2305539 T3 ES 2305539T3 ES 03778627 T ES03778627 T ES 03778627T ES 03778627 T ES03778627 T ES 03778627T ES 2305539 T3 ES2305539 T3 ES 2305539T3
Authority
ES
Spain
Prior art keywords
dramatic
media
audio signal
parameters
fragments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES03778627T
Other languages
English (en)
Inventor
David A. Philips Int. Property & Standards EVES
Richard S. Philips Int. Property & Standards COLE
C. Philips Int. Property & Standards THORNE
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Application granted granted Critical
Publication of ES2305539T3 publication Critical patent/ES2305539T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Auxiliary Devices For Music (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Stereo-Broadcasting Methods (AREA)

Abstract

Método para aumentar una señal de audio que comprende: recibir una señal de audio, extraer características de dicha señal de audio, generar una tabla ordenada en el tiempo de parámetros dramáticos según las características extraídas, obtener fragmentos de medios que incluyen datos de vídeo, al menos en parte en función de la tabla de parámetros dramáticos, y emitir dichos fragmentos de medios junto con dicha señal de audio.

Description

Método y sistema para aumentar una señal de audio.
La presente invención se refiere a un método y a un sistema para aumentar una señal de audio según características extraídas de dicha señal de audio. La presente invención tiene aplicación particular, pero no exclusiva, en sistemas que determinan y extraen características musicales de una señal de audio tal como el compás y el tono.
Se conoce aumentar una señal de audio con una señal de vídeo. Donde más ocurre esto es en la industria de los vídeos musicales, en la que una canción o álbum particular tiene una secuencia de vídeo creada para la música, normalmente con el fin de emitir el audio y vídeo combinados a través de una red de televisión. La señal de vídeo se crea de forma manual, empleando la experiencia y el talento de una serie de personas para seleccionar y/o crear secuencias de vídeo adecuadas que mejoren lo mejor posible la música. La habilidad de las personas implicadas es un factor crucial en la calidad del producto final. También sucede que tal aumento es un proceso largo y caro, sin garantía real de la adecuación del producto final para un gran número de usuarios.
También se conocen herramientas de software de consumo que permiten a un consumidor doméstico crear presentaciones de música y vídeo, según entradas de usuario. La solicitud de patente europea EP0403118 describe una compilación audiovisual en un sistema de procesamiento de datos tal como un ordenador personal (PC) doméstico. El sistema comprende módulos de biblioteca, audio, y creación y edición de guiones que permiten a un usuario compilar una presentación audiovisual y emitirla. La solicitud de patente internacional WO01/18655 da a conocer un método y un sistema para generación de vídeos musicales en un ordenador que comprende una interfaz de edición que incluye una selección de botones de primer plano, segundo plano, capacidad de importación y efectos especiales, una línea temporal para crear un texto de instrucciones para el montaje de imágenes gráficas, en sincronía con la música, para de este modo producir un proyecto de vídeo musical.
Tales sistemas domésticos/de consumo conocidos permiten a un consumidor producir su propio vídeo para aumentar una señal de audio. Sin embargo, como en la creación de vídeo en el ámbito profesional, tal creación lleva tiempo y se basa nuevamente en la habilidad del consumidor implicado.
El documento US 5.005.459 da a conocer un método para la visualización de tonos musicales que implica analizar el contenido espectral de una señal de audio y seleccionar una fuente de señal de vídeo apropiada para su presentación con la obra musical. Una posible aplicación es la visualización de la imagen de uno o más instrumentes que estén tocándose en ese momento.
El documento US 5.898.119 da a conocer la selección de segmentos de vídeo que tienen un ambiente que coincide con el ambiente de la música que está interpretándose. En este documento tanto los datos de audio como los musicales están previamente clasificados en diferentes categorías de ambientes.
Normalmente, tales sistemas de la técnica anterior sólo tienen capacidades de automatización limitadas, en caso de tenerlas, y en general son incapaces de aumentar automáticamente una señal de audio de entrada ad hoc con una secuencia de historia de vídeo en función de y siguiendo el contenido semántico de la señal de audio.
Por lo tanto un objeto de la presente invención es proporcionar un método y sistema mejorados para aumentar una señal de audio.
Según un primer aspecto de la presente invención se proporciona un método según la reivindicación 1.
Según un segundo aspecto de la presente invención se proporciona un sistema según la reivindicación 16.
Según un tercer aspecto de la presente invención se proporciona un programa informático según la reivindicación 20.
Conforme a lo anterior, características musicales extraídas de una señal de audio tales como tono y compás se asocian con parámetros dramáticos que representan una visión general de un fragmento de medios que puede contener un archivo de datos de audio/vídeo. Por ejemplo, un compás rápido puede encajar bien con un fragmento de medios que tenga una escena de caza que sea muy rápida y violenta.
Los parámetros dramáticos representan ventajosamente características de una historia tal como ambiente, ritmo, episodios etcétera. Los parámetros dramáticos también se correlacionan con características extraídas de la señal de audio tales como tono y compás.
Ventajosamente, los fragmentos de medios están almacenados en una base de datos desde la que se obtienen. Alternativamente, los fragmentos pueden generarse durante la ejecución según una plantilla de historia que comprende una descripción general o estructura narrativa para una historia, y parámetros dramáticos apropiados.
Por ejemplo, una plantilla de historia romántica puede tener ciertos requisitos tales como tonos musicales asociados con la felicidad (tonos mayores) o la tristeza (tonos menores). En la plantilla de historia está representado un arco narrativo que describe la progresión de una historia romántica. Un arco de ejemplo para una historia romántica puede comprender lo siguiente, un encuentro casual, desarrollo de una relación, tragedia y final feliz o triste.
Por tanto, resulta posible generar, obtener y presentar una historia a un consumidor, basándose la historia en una selección musical del consumidor.
Por ejemplo, un consumidor puede seleccionar cuatro pistas de música que se analizan para determinar por ejemplo el género (o el consumidor puede introducir un género preferido) y se extraen características musicales de las pistas. Las características se emplean para determinar una plantilla de historia que coincida bastante que se emplea entonces para obtener fragmentos de medios coincidentes apropiados. Por ejemplo, fragmentos de medios que tienen parámetros dramáticos que indican tonos mayores (felices), o tonos menores (tristeza) y que también contienen contenido romántico pueden obtenerse entonces para construir la historia.
Los fragmentos de medios se presentan entonces al consumidor junto con su selección musical. Por tanto, un consumidor experimenta una experiencia de historia junto con, y siendo informado por la música seleccionada.
Ventajosamente, combinaciones de tonos musicales (tal vez un cambio de tono dentro de una pista musical o un cambio de tono entre una pista musical y otra) también pueden emplearse para determinar momentos dramáticos tales como una acumulación y posterior explosión de tensión.
En una realización el sistema comprende un ordenador personal conectado a una base de datos que almacena fragmentos de medios y plantillas de guiones. El ordenador está dotado de un código de programa, que extrae características musicales de señales de audio que representan una selección musical, y también de un código de programa que representa un módulo de construcción de guiones, que selecciona plantillas y obtiene fragmentos de medios apropiados en función de determinados parámetros dramáticos relativos a las características musicales extraídas. Los parámetros dramáticos están representados en un metalenguaje configurable tal como el lenguaje de marcación extendido (XML). El programa informático hace corresponder las plantillas de guiones y los fragmentos de medios que tienen etiquetas de parámetros dramáticos asociadas y presenta la historia al consumidor.
Ventajosamente, el ordenador forma parte de una red doméstica que tiene dispositivos de salida por lo que puede cambiarse la luminosidad en momentos dramáticos identificados, y otros aspectos del entorno de experiencia que rodea al consumidor pueden controlarse para proporcionar una experiencia narrativa absorbente junto con la selección musical. El lenguaje de marcación físico (PML) puede utilizarse para conseguir lo anteriormente mencionado.
Conforme a la invención, es posible aumentar una señal de audio, sin necesidad de entradas por parte de la persona, de manera que no obstante se produce un aumento que está relacionado y complementa al audio.
La presente invención se describirá a continuación, únicamente a modo de ejemplo, y con referencia a los dibujos adjuntos en los que:
La figura 1 es una representación esquemática de un sistema para aumentar una señal de audio,
La figura 2 es una tabla que relaciona características musicales con parámetros dramáticos,
La figura 3 es un ejemplo de una lista de parámetros dramáticos generada,
La figura 4 es un ejemplo ilustrativo de plantillas de guiones almacenadas,
La figura 5 ilustra una base de datos que almacena fragmentos de medios,
La figura 6 es un diagrama de flujo de un método para aumentar una señal de audio,
La figura 7 es un diagrama de flujo de un método PML para aumentar una señal de audio.
Ha de observarse que las figuras son esquemáticas y no están dibujadas a escala. Las dimensiones y proporciones relativas de partes de estas figuras se han mostrado con un tamaño exagerado o reducido, por motivos de claridad y comodidad en los dibujos. Generalmente se utilizan los mismos signos de referencia para referirse a características correspondientes o similares en realizaciones modificadas y diferentes.
La figura 1 muestra una representación esquemática de un sistema 100 para aumentar una señal de audio. El sistema 100 consiste en una unidad 102 de procesamiento central (CPU) conectada a una memoria 104 (ROM) y a una memoria 106 (RAM) a través de un bus 108 de datos general. Puede cargarse un código informático o software 110 sobre un soporte 112 en la RAM 106 (o alternativamente estar previsto en la ROM 104), haciendo el código que la CPU 102 lleve a cabo instrucciones que implementan un método o métodos según la invención. La CPU 102 está conectada a un almacén 114 y a dispositivos 116, 118 de salida. Se proporciona una interfaz 120 de usuario (UI).
El sistema 100 puede implementarse como un ordenador personal (PC) doméstico convencional con el dispositivo 116 de salida con la forma de un monitor o pantalla de ordenador. El almacén 114 puede ser una base de datos remota disponible a través de una conexión de red (LAN o WAN). De manera similar en una red doméstica (LAN) los dispositivos 116, 118 de salida pueden estar distribuidos por la casa y comprender por ejemplo una pantalla plana instalada en la pared, unidades de iluminación doméstica controladas por ordenador, altavoces de audio dispuestos por la casa, etcétera. Las conexiones entre la CPU 102 y otros dispositivos 116, 118 pueden ser inalámbricas (por ejemplo comunicaciones a través de normas de radio IEEE802.11, Zig- Bee IEE802.15.4 o Bluetooth) o por cable (por ejemplo comunicaciones a través de normas de cable Ethernet, USB), o una combinación de ambas.
El sistema 100 requiere la entrada de señales de audio de las que se extraen características. La extracción de características musicales de señales de audio se describe en el documento "Querying large collections of music for similarity" (Matt Welsh et al, UC Berkeley Technical Report UCB/CSD-00-1096, noviembre de 1999) cuyo contenido se incorpora por la presente. El documento describe cómo pueden determinarse características tales como un compás medio, volumen, ruido y transiciones tonales a partir del análisis de una señal de audio de entrada. Un método para determinar el tono musical de una señal de audio se describe en la patente estadounidense US5.038.658 a nombre de Tsuruta et al, incorporada por la presente y a la que remite al lector.
Por tanto, en el sistema 100 se introducen señales de audio a la CPU 102 por el dispositivo 122 de entrada. La CPU 102 recibe las señales de audio y extrae características musicales tales como volumen, compás y tono tal como se describe en las referencias anteriormente mencionadas. En esta realización, la señal de audio se proporciona a través de un dispositivo 122 de entrada interno del PC tal como una unidad de CD/DVD o disco duro. Alternativamente, las señales de audio pueden introducirse a través de una conexión a un sistema de entretenimiento doméstico en red (Hi-Fi, home cinema, etc.).
Los expertos en la técnica se percatarán de que la configuración exacta de hardware/software y el mecanismo de provisión de la señal de audio de entrada no es importante, y que más bien tales señales se ponen a disposición de dicho sistema 100.
Estructuras de datos de ejemplo y métodos de funcionamiento se describirán a continuación para ilustrar aspectos de la presente invención con respecto a, por motivos de simplicidad y a modo de ejemplo únicamente, una realización de PC del sistema 100.
La figura 2 muestra una tabla 200 de ejemplo para su uso por el programa 110 informático. La tabla ilustra una relación no exhaustiva de características 204 (MF) musicales extraídas con parámetros 206 (DP) dramáticos predeterminados y definidos. Por ejemplo, se conoce bien que en general la música que tiene un tono mayor (tono MAY) se asocia a sentimientos felices o animados, mientras que la música interpretada en tono menor (tono MEN) tiende a ser más afligida y triste.
Además, empleando un círculo de diagrama de quintas (muy conocido por los que estudian música) es posible determinar tonos musicales relacionados, que sean armoniosos para que una transición de un tono a otro no resulte alarmante para un consumidor. En general, una transición de un tono a otro tono adyacente en el círculo produce para un consumidor una transición armoniosa aceptable, mientras que un salto de un tono a otro tono no adyacente en el diagrama produce una disonancia audible para un usuario. Por ejemplo, tonos muy relacionados (adyacentes) de Do Mayor/La Menor son Fa Mayor/Re Menor y Sol Mayor/Mi Menor. Por tanto, un cambio de tono de, digamos, Do Mayor (ya sea dentro de una pista de música o de una pista a otra) a Mi Mayor (no adyacente) resultaría en que el usuario escucharía una disonancia audible. Tal conocimiento es útil a la hora de desarrollar reglas para saber qué pistas de música son adecuadas para encadenarse unas con otras en una aplicación de DJ automática.
Tal conocimiento puede usarse para indicar un cambio dramático en una historia (por ejemplo, de una escena de boda feliz a una escena trágica triste, sumándose la música a la experiencia de la historia). Por tanto, en la figura 2 una característica musical correspondiente a tal combinación de cambios de tono no adyacentes está representada por (CNA) con el parámetro dramático DISONANCIA. La tabla también ilustra que un parámetro dramático de RÁPIDO o LENTO puede asociarse con un resultado de COMPÁS extraído (pulsos por minuto - b pm). Por ejemplo, un bpm superior a 120 puede asignarse a un parámetro dramático RÁPIDO, mientras que una canción o pista con un compás más lento puede asignarse a un parámetro dramático LENTO. Por tanto, de forma general el ambiente, los cambios de ritmo y los episodios según una selección musical pueden determinarse y representarse.
Los ejemplos de parámetros dramáticos se dan únicamente con fines ilustrativos, con numerosos parámetros dramáticos posibles en forma de etiquetas de lenguaje de marcación (realizadas en XML por ejemplo) u otros atributos. Por ejemplo, otras características musicales tales como el tipo de instrumento (un chelo puede asignarse a un atributo TRISTE/LENTO), y puede definirse una etiqueta descriptiva de género de alto nivel. Numerosos archivos de CD o MP3 tienen descriptores de género asociados a una pista o CD, por ejemplo rock, romántica, trance, etc., y estos pueden recuperarse y asignárseles parámetros dramáticos. www.gracenote.com es un ejemplo de base de datos de música y proveedor de servicios en la que la música se clasifica como rock, electrónica/dance, jazz, etcétera. La música electrónica/dance seleccionada de un servicio de este tipo puede asociarse con un parámetro dramático <FUTURE> o <CYBER> que generalmente indica el género de una historia que puede ser adecuada.
A modo de ejemplo se ilustra ahora cómo tales etiquetas se utilizan para ayudar a construir una historia acompañada por la información de la música. Un consumidor que busca entretenimiento, selecciona tres pistas de música para reproducir¡, pista 1 (TR1), pista 2 (TR2) y pista 3 (TR3) en su PC. Las señales de audio de las pistas se introducen por el dispositivo 122 de entrada a la CPU 102, que determina y extrae características musicales de las señales de audio. La CPU 102, que actúa según instrucciones del programa 110 informático, correlaciona las características (MF) 204 musicales determinadas con parámetros (DP) 206 dramáticos asociados utilizando la tabla 200 (figura 2) y posteriormente construye una tabla 300 tal como se muestra en la figura 3.
La tabla 300, ordenada en el tiempo (para crear una línea TL 304 de tiempo), indica que la CPU 102 ha determinado que la pista 1 empieza con un compás RÁPIDO y tiene un parámetro dramático FELIZ asociado (es decir un tono mayor). Tras esto, la TR2 desentona (característica CNA determinada) y está en un tono menor (con un parámetro dramático TRISTE correspondiente). La pista 3, similar a la pista 1 se ha determinado que sea en general RÁPIDA (compás alto), y en un tono mayor (FELIZ).
Por tanto, se crea una visión general de nivel alto de la selección musical en la que la música envuelve de manera dramática como rápido (COMPÁS TR1), FELIZ (tono mayor), una disonancia (indicando CNA y tono menor tristeza TR2) y un aumento del compás y ambiente feliz para la pista 3. Una vez construida esta visión general dramática de alto nivel, la CPU 102 se conecta entonces al almacén 114 para buscar una estructura de datos de contenga una plantilla de historia con una visión general dramática que coincida aproximadamente.
La figura 4 muestra ejemplos ilustrativos de una colección de plantillas de guiones construidas para su uso con el sistema 100. La colección puede disponerse tal como se muestra en el diagrama según el género (GEN 1, GEN 2, GEN 3). El género puede haberse indicado por el consumidor (a través de la UI 120) o determinarse por ejemplo leyendo etiquetas descriptoras de la música seleccionada tal como se conoce en la técnica. GEN1 puede representar por ejemplo sencillas historias para niños, o de terror, o románticas o cualquier otro género de clasificación de guiones considerado como adecuado. Las plantillas 404 también pueden almacenar otra información tal como cuántos personajes principales o protagonistas son adecuados (tal vez sólo se necesitan 3 para una breve historia romántica que implique un triángulo amoroso).
Las plantillas 404 de guiones tienen asociadas cada una parámetros dramáticos relativos a una estructura narrativa. Por ejemplo, numerosos guiones (en particular películas de Hollywood) siguen una estructura en tres actos en la que el acto I introduce a los personales y la historia, el acto II desarrolla la historia y en el acto III se resuelve la historia. A menudo, al final del acto I hay un episodio instigador que permite la revelación del desarrollo de un personaje. Por tanto, los solicitantes se han dado cuenta de que las transiciones musicales, o cambios de pista pueden emplearse (a través de una detección de CNA, por ejemplo) para desalinear fases de la historia o guión. Por tanto, en la figura 4 la plantilla 1 (ST1) de historia tiene una sencilla estructura narrativa en la que los parámetros dramáticos indican un arco de historia en el que por ejemplo el primer acto es rápido, pasa al acto II feliz y termina con una escena o escenas rápidas para el acto III. Una historia de ejemplo que puede adecuarse a una plantilla de este tipo sería una sencilla para niños en la que unos animales amigos compiten en una carrera, celebran la victoria del ganador, y a continuación vuelven corriendo a casa.
La historia ST2 tiene sin embargo un arco de historia diferente en el que el acto II tiene parámetros dramáticos asociados con escenas tristes y lentas. La variabilidad de las plantillas de historias depende del número de parámetros dramáticos que pueden determinarse por las características musicales en la fase 122. Además, las plantillas de historias pueden almacenar información relativa a la longitud en tiempo de cada acto (y por tanto de la historia global), teniendo las historias breves, digamos, actos aproximadamente iguales a una o dos pistas musicales (6-8 minutos o así de media) mientras que historias más largas pueden tener actos más largos con más parámetros DP dramáticos que indiquen cambios de escena dentro de un acto. Quienes tengan experiencia en la técnica de redacción de historias y guiones pueden definir otros parámetros y reglas de personajes pertenecientes a las plantillas de historias.
En funcionamiento, la CPU 102 compara los DP de las plantillas de historias con los determinados a partir de la selección musical (figura 3) y selecciona una plantilla que se corresponde bastante. Por ejemplo, la comparación de los DP determinados en la figura 3 con la ST2 de la figura 4 revela una coincidencia y por tanto se selecciona ST2. Una vez seleccionada una plantilla 404 de historia la CPU 102 debe entonces rellenar la plantilla ST2 con el contenido real de la historia.
La figura 5 muestra un almacén 114 de ejemplo en forma de una base de datos 500 que almacena una multitud de fragmentos 502 de medios. Un fragmento de medios es una entidad de datos que comprende por ejemplo un segmento codificado de película (en ocasiones denominado toma y en el que varias tomas constituyen una escena). Por tanto el fragmento de medios tiene una cierta duración temporal asociada cuando se reproduce. Los fragmentos 502 están caracterizados por atributos etiquetados relativos a parámetros dramáticos.
El fragmento de medios puede almacenarse como, a modo de ejemplo, un registro XML que comprende una descripción del contenido audiovisual de la escena (por ejemplo género-acción, acto 1, inicio de persecución de coches, 4 minutos) y parámetros dramáticos asociados al contenido de la escena. Por supuesto, al crear los fragmentos una historia global puede desarrollarse con diferentes finales e inicios (por ejemplo, una historia puede empezar con una escena de persecución de coches, o bicicletas) cada uno adecuado para diferentes parámetros dramáticos (COMPÁS). Esto permite el mantenimiento de un cierto presagio de la historia mientras que todavía se permite mostrar diferentes fragmentos dependiendo de determinados parámetros dramáticos de la música. También pueden crearse escenas similares con diferentes duraciones.
Por tanto, el programa informático da instrucciones a la CPU 102 para que busque en la base de datos fragmentos 502 de medios, que se corresponden aproximadamente en cuanto a duración, actos y parámetros dramáticos con la plantilla de historia seleccionada. Los fragmentos se obtienen, ordenan y almacenan en caché en la memoria 106 (o la unidad de disco duro), y posteriormente se emiten con la música. La base de datos 500 también puede almacenar opcionalmente, para mayor comodidad, las plantillas 400 de historias tal como se ilustra en la figura 5.
Por ejemplo, con referencia a la lista de DP generada en la figura 3 y la plantilla de historia (ST2) seleccionada de la figura 4, y en la que se ha indicado un género infantil (tal vez por el propio niño a través de la UI 120). Se buscan fragmentos de historias que tengan la etiqueta de género infantil que coincidan con la línea (TL) de tiempo y los parámetros (DP) dramáticos determinados. Supongamos que la pista 1 (TR1) dura 4 minutos, entonces se busca un fragmento de medios inicial que tenga una combinación DP (RÁPIDO-FELIZ) y que dure aproximadamente 4 minutos. De manera similar, se busca un fragmento de medios (relacionado con el primer fragmento seleccionado) para el acto II que tenga un ritmo más lento y un tema triste y que dure aproximadamente la duración de la pista 2. Finalmente se seleccionan fragmentos de medios etiquetados como que tienen un final rápido/feliz y relacionados con el primer fragmento para su presentación con la pista 3.
Por tanto, una vez identificados y obtenidos fragmentos 502 de medios adecuados, se emite la historia, en esta realización de PC, en el monitor 116 de visualización.
La figura 6 ilustra un diagrama de flujo que muestra las etapas descritas anteriormente. En la etapa 602 se introduce una señal de audio que representa la selección musical (IAS) y se extraen las características musicales (EMF) en la etapa 604. Se genera una lista de parámetros dramáticos que caracterizan la música (GEN DP) en la etapa 606 tras lo cual en la etapa 608 se selecciona una plantilla de historia (ST) y se utiliza junto con los parámetros dramáticos para obtener fragmentos de medios (OMF) apropiados. Finalmente en la etapa 610, se emite la historia (O/P) junto con la selección musical.
Los expertos en la técnica se percatarán de que la historia no tiene que ser contigua. Puede emplearse contenido en forma de viñetas de cómic estilizadas en fragmentos de medios, facilitando así los requisitos de coincidencia en la duración temporal y permitiendo una coincidencia más fácil de la emisión de escenas con momentos dramáticos identificados en la música seleccionada. Tal contenido visual generado por ordenador o de dibujos animados o cómic "pre-enlatado" puede crearse e indexarse de manera relativamente rápida, permitiendo un rápido establecimiento de una base de datos importante que tenga numerosas plantillas de historias y fragmentos de medios disponibles. Los fragmentos pueden almacenarse de manera conveniente, por ejemplo como archivos MPEG enlazados con registros que indexan los archivos en cuanto a parámetros dramáticos, género, personajes, etc.
En el ejemplo anterior, se recuperaba contenido preenlatado para un usuario en función de una plantilla de historia con una línea de tiempo que coincidía aproximadamente con la duración de la selección musical. Sin embargo, una vez seleccionada una plantilla de historia particular, los fragmentos de medios pueden generarse por ordenador durante la ejecución por el procesador 102. Por ejemplo, un fragmento de medios puede contener contenido generado por ordenador en forma de un sencillo dibujo animado para un niño. La correspondencia de los fragmentos con la línea de tiempo de la selección musical se entonces relativamente sencilla puesto que el procesador 102 genera el propio fragmento de medios y su contenido. Por supuesto, la necesidad de plantillas de historias puede obviarse en tal caso, con sencillas reglas (ACT 1, ACT 2, ACT 3, DP- FELIZ, RÁPIDO, FELIZ) facilitando la generación de los fragmentos de los medios que conforman la historia.
En otra realización que ilustra aspectos ventajosos de un sistema con inteligencia ambiental, el módulo representado por la línea discontinua 124 en la figura 1 se implementa como un módulo de inserción en red doméstico 124 con enlaces de red a varios dispositivos 116, 118 de salida que son compatibles con un lenguaje de marcación y un conjunto de instrucciones diseñado para proporcionar experiencias del mundo real. Un ejemplo de un lenguaje de marcación físico (PML) de este tipo se describe en la solicitud de los solicitantes WO 02/092183 en tramitación junto con la presente. El PML comprende medios para crear, comunicar y presentar experiencias a un usuario final de manera que el usuario final experimente un cierto nivel de inmersión en un espacio físico real. Por ejemplo, dispositivos de consumo habilitados para PML tales como HI-FI y sistema de iluminación pueden recibir instrucciones de un dispositivo de red central (las instrucciones pueden estar insertadas en un flujo de vídeo DVD por ejemplo) que hagan que se modifique la emisión de luces o sonido de los dispositivos. Así una escena oscura en una película hace que las luces en casa del consumidor se atenúen apropiadamente.
El PML es en general un lenguaje de marcación descriptivo de alto nivel que puede implementarse en XML con descriptores que se refieren a eventos del mundo real (<luz tenue>). Por tanto, el PML permite que los dispositivos en el hogar aumenten una experiencia para un consumidor de un modo normalizado.
La figura 7 ilustra un diagrama de flujo de PML de ejemplo que implementa aspectos de la presente invención. Se introducen señales (IAS) 700 de audio y se analizan para detectar características (EMF) 702 musicales. Las características se proporcionan al módulo 124 de construcción de historias que genera una tabla de parámetros dramáticos y una línea de tiempo tal como se ha descrito anteriormente. El módulo 124 selecciona una plantilla 400 de historia en función de la tabla generada y obtiene fragmentos 502 de medios adecuados. Los fragmentos (que pueden ser preenlatados o generados durante la ejecución) incluyen descriptores PML así como parámetros dramáticos. Los fragmentos se montan entonces por el módulo 124, y se proporcionan a un interpretador PML (PMLI) 704.
Por tanto, se interpretan las órdenes PML asociadas con los fragmentos y posteriormente se dirigen a dispositivos 706, 708, 710 con PML habilitado en la red doméstica. Por ejemplo, los dispositivos 706, 708 pueden representar un sistema de iluminación PML y un proyector PML. Los dispositivos responden a órdenes PML para así por ejemplo, proyectar niveles de luz cambiante y colores sobre una pared en determinados momentos en la experiencia narrativa y de audio asociada con la música seleccionada y los fragmentos de medios obtenidos. Otros dispositivos 710 tales como ventiladores de sobremesa, o sistemas de aire acondicionado y calefacción pueden controlarse en función de las características dramáticas para aumentar adicionalmente las señales de audio de entrada y la experiencia de historia emitida.
Anteriormente se ha descrito un sistema adecuado para aumentar señales de audio proporcionando una experiencia de historia narrativa. El sistema puede ser en forma de un módulo 124 dedicado, o un ordenador de uso general, que funcione sólo o junto con otros dispositivos en una red doméstica. Características musicales extraídas tales como tono, cambios de tono, compás, etcétera se introducen en el ordenador que relaciona entonces las características con parámetros dramáticos. Se obtienen entonces fragmentos de medios apropiados y posteriormente se emiten y presentan a un usuario. Otros dispositivos de salida pueden utilizarse para mejorar y aumentar adicionalmente la historia.
De la lectura de la presente descripción resultarán evidentes otras modificaciones para los expertos en la técnica. Tales modificaciones pueden implicar otras características que ya se conocen en el diseño, fabricación y uso de sistemas multimedia y piezas componentes de los mismos y que pueden utilizarse en lugar de o además de características ya descritas en la presente memoria sin alejarse del espíritu y alcance de la presente invención. Además, las estructuras narrativas y fragmentos de medios pueden variar de los ejemplos explícitos descritos en la presente memoria sin alejarse del alcance de la presente invención tal como se define por las reivindicaciones adjuntas.

Claims (20)

1. Método para aumentar una señal de audio que comprende:
recibir una señal de audio,
extraer características de dicha señal de audio,
generar una tabla ordenada en el tiempo de parámetros dramáticos según las características extraídas,
obtener fragmentos de medios que incluyen datos de vídeo, al menos en parte en función de la tabla de parámetros dramáticos, y
emitir dichos fragmentos de medios junto con dicha señal de audio.
2. Método según la reivindicación 1, en el que dichas características extraídas de dicha señal de audio incluyen una o más de compás, tono, volumen.
3. Método según la reivindicación 1 ó 2, en el que la generación de dicha tabla de parámetros dramáticos comprende recuperar una lista parámetros dramáticos y características de audio asociadas, comparar y hacer corresponder las características extraídas con las características de audio asociadas recuperadas, e insertar una entrada que comprende el parámetro dramático asociado con la característica de audio.
4. Método según la reivindicación 1, 2 ó 3, en el que dichos parámetros dramáticos incluyen ambiente, cambios de ritmo, episodios.
5. Método según cualquier reivindicación anterior, en el que dicha obtención de dichos fragmentos de medios comprende seleccionar un fragmento de un almacén, estando dicho fragmento almacenado con un parámetro dramático asociado que se corresponde con la respectiva entrada en la tabla de parámetros dramáticos.
6. Método según cualquier reivindicación anterior, en el que dicha obtención de dichos fragmentos de medios comprende generar un fragmento.
7. Método según la reivindicación 5 ó 6, y que comprende además recibir entradas de usuario, afectando dichas entradas de usuario a dicha obtención.
8. Método según cualquier reivindicación anterior, en el que dicha emisión comprende almacenar dichos fragmentos de medios y dicha señal de audio.
9. Método según cualquier reivindicación anterior, en el que dicha emisión comprende presentar dichos fragmentos de medios y dicha señal de audio.
10. Método según cualquier reivindicación anterior, y que comprende además, antes de obtener dichos fragmentos de medios, seleccionar una plantilla de historia al menos en parte en función de dicha tabla de parámetros dramáticos, afectando dicha plantilla de historia a dicha obtención de fragmentos de medios.
11. Método según la reivindicación 10, en el que dicha plantilla de historia comprende datos de parámetros dramáticos relativos a una estructura de historia narrativa.
12. Método según la reivindicación 11, en el que la selección de fragmentos de medios comprende hacer corresponder los parámetros dramáticos de la plantilla de historia seleccionada con los de los fragmentos de medios.
13. Método según la reivindicación 10, 11 ó 12, en el que la plantilla de historia para la selección se genera según las normas de estructura lógica de guiones y la lista de parámetros dramáticos.
14. Método según cualquier reivindicación anterior, en el que los parámetros dramáticos están representados por etiquetas de lenguaje de marcación físicas.
15. Método según cualquier reivindicación anterior, en el que las combinaciones de características extraídas tienen parámetros dramáticos asociados.
16. Sistema para aumentar una señal de audio, que comprende un dispositivo de entrada para recibir una señal de audio y medios de procesamiento para extraer características de dicha señal de audio recibida, para generar una tabla ordenada en el tiempo de parámetros dramáticos asociados con dichas características extraídas, para obtener fragmentos de medios que incluyen datos de vídeo, al menos en parte en función de dicha tabla de parámetros dramáticos generada, y al menos un dispositivo de salida para emitir dichos fragmentos de medios junto con dicha señal de audio.
17. Sistema según la reivindicación 16, que comprende además almacenamiento para almacenar dichos fragmentos de medios.
18. Sistema según la reivindicación 16 ó la reivindicación 17, en el que dicho al menos un dispositivo de salida comprende medios de visualización en los que se visualizan dichos fragmentos de medios.
19. Sistema según cualquiera de las reivindicaciones 16, 17 ó 18, en el que dicho al menos un dispositivo de salida responde a instrucciones asociadas con dichos parámetros dramáticos.
20. Código de programa sobre un soporte que cuando se ejecuta por un procesador hace que dicho procesador realice todas las etapas de cualquiera de los métodos de las reivindicaciones 1 a 15.
ES03778627T 2002-12-24 2003-12-10 Metodo y sistema para aumentar una señal de audio. Expired - Lifetime ES2305539T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GBGB0230097.8A GB0230097D0 (en) 2002-12-24 2002-12-24 Method and system for augmenting an audio signal
GB0230097 2002-12-24

Publications (1)

Publication Number Publication Date
ES2305539T3 true ES2305539T3 (es) 2008-11-01

Family

ID=9950380

Family Applications (1)

Application Number Title Priority Date Filing Date
ES03778627T Expired - Lifetime ES2305539T3 (es) 2002-12-24 2003-12-10 Metodo y sistema para aumentar una señal de audio.

Country Status (13)

Country Link
US (1) US8433575B2 (es)
EP (1) EP1579698B1 (es)
JP (2) JP2006512820A (es)
KR (1) KR20050086942A (es)
CN (2) CN100438633C (es)
AT (1) ATE395789T1 (es)
AU (1) AU2003285635A1 (es)
BR (1) BR0317713A (es)
DE (1) DE60321044D1 (es)
ES (1) ES2305539T3 (es)
GB (2) GB0230097D0 (es)
RU (1) RU2322654C2 (es)
WO (1) WO2004059986A1 (es)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3987025B2 (ja) * 2002-12-12 2007-10-03 シャープ株式会社 マルチメディアデータ処理装置およびマルチメディアデータ処理プログラム
JP4513644B2 (ja) * 2005-05-13 2010-07-28 ヤマハ株式会社 コンテンツ配信サーバ
KR20090029721A (ko) * 2006-05-19 2009-03-23 에이엠비엑스 유케이 리미티드 주위 경험 명령 생성
US8285654B2 (en) * 2006-06-29 2012-10-09 Nathan Bajrach Method and system of providing a personalized performance
KR101138396B1 (ko) 2007-09-11 2012-04-26 삼성전자주식회사 Iptv 단말기에서 컨텐츠 재생 방법 및 장치
US9251776B2 (en) 2009-06-01 2016-02-02 Zya, Inc. System and method creating harmonizing tracks for an audio input
US9177540B2 (en) 2009-06-01 2015-11-03 Music Mastermind, Inc. System and method for conforming an audio input to a musical key
US8779268B2 (en) 2009-06-01 2014-07-15 Music Mastermind, Inc. System and method for producing a more harmonious musical accompaniment
US9257053B2 (en) * 2009-06-01 2016-02-09 Zya, Inc. System and method for providing audio for a requested note using a render cache
US8785760B2 (en) 2009-06-01 2014-07-22 Music Mastermind, Inc. System and method for applying a chain of effects to a musical composition
US9310959B2 (en) 2009-06-01 2016-04-12 Zya, Inc. System and method for enhancing audio
CA2996784A1 (en) 2009-06-01 2010-12-09 Music Mastermind, Inc. System and method of receiving, analyzing, and editing audio to create musical compositions
WO2013130841A1 (en) * 2012-02-29 2013-09-06 Wayans Damon Kyle Editing storyboard templates for customizing of segments of a video
US9431002B2 (en) 2014-03-04 2016-08-30 Tribune Digital Ventures, Llc Real time popularity based audible content aquisition
US9798509B2 (en) 2014-03-04 2017-10-24 Gracenote Digital Ventures, Llc Use of an anticipated travel duration as a basis to generate a playlist
US9454342B2 (en) 2014-03-04 2016-09-27 Tribune Digital Ventures, Llc Generating a playlist based on a data generation attribute
EP2963651A1 (en) * 2014-07-03 2016-01-06 Samsung Electronics Co., Ltd Method and device for playing multimedia
CN105224581B (zh) * 2014-07-03 2019-06-21 北京三星通信技术研究有限公司 在播放音乐时呈现图片的方法和装置
EP3175418A4 (en) 2014-07-31 2018-03-28 Mindsightmedia Inc. Method, apparatus and article for delivering media content via a user-selectable narrative presentation
WO2016115154A1 (en) 2015-01-14 2016-07-21 MindsightMedia, Inc. Data mining, influencing viewer selections, and user interfaces
US10261964B2 (en) 2016-01-04 2019-04-16 Gracenote, Inc. Generating and distributing playlists with music and stories having related moods
US10419508B1 (en) 2016-12-21 2019-09-17 Gracenote Digital Ventures, Llc Saving media for in-automobile playout
US10019225B1 (en) 2016-12-21 2018-07-10 Gracenote Digital Ventures, Llc Audio streaming based on in-automobile detection
US10565980B1 (en) 2016-12-21 2020-02-18 Gracenote Digital Ventures, Llc Audio streaming of text-based articles from newsfeeds
US11915722B2 (en) 2017-03-30 2024-02-27 Gracenote, Inc. Generating a video presentation to accompany audio
JP7121988B2 (ja) * 2018-09-10 2022-08-19 株式会社クロスフェーダー 動画コンテンツ生成方法および生成プログラム
EP4243014A4 (en) 2021-01-25 2024-07-17 Samsung Electronics Co., Ltd. DEVICE AND METHOD FOR PROCESSING A MULTI-CHANNEL AUDIO SIGNAL
US20220405982A1 (en) * 2021-06-21 2022-12-22 Lemon Inc. Spectrum algorithm with trail renderer
CN115243087B (zh) * 2022-07-04 2025-09-09 北京小糖科技有限责任公司 音视频合拍处理方法、装置、终端设备及存储介质

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5005459A (en) * 1987-08-14 1991-04-09 Yamaha Corporation Musical tone visualizing apparatus which displays an image of an animated object in accordance with a musical performance
US5038658A (en) * 1988-02-29 1991-08-13 Nec Home Electronics Ltd. Method for automatically transcribing music and apparatus therefore
CA2015215C (en) 1989-06-16 1994-01-11 Bradley James Beitel Computer-based, audio/visual creation and presentation system and method
JPH0668168A (ja) * 1992-08-17 1994-03-11 Nippon Telegr & Teleph Corp <Ntt> 音響キーワードによる映像検索方法および装置
NZ258398A (en) * 1992-11-16 1997-06-24 Multimedia Systems Corp Optimal transmission of multimedia entertainment information
JP3506410B2 (ja) * 1997-04-23 2004-03-15 日本電信電話株式会社 劇的映像制作支援方法および装置
US5898119A (en) * 1997-06-02 1999-04-27 Mitac, Inc. Method and apparatus for generating musical accompaniment signals, and method and device for generating a video output in a musical accompaniment apparatus
US6052657A (en) * 1997-09-09 2000-04-18 Dragon Systems, Inc. Text segmentation and identification of topic using language models
US5913259A (en) * 1997-09-23 1999-06-15 Carnegie Mellon University System and method for stochastic score following
US6504089B1 (en) * 1997-12-24 2003-01-07 Canon Kabushiki Kaisha System for and method of searching music data, and recording medium for use therewith
US6067126A (en) * 1998-01-05 2000-05-23 Intel Corporation Method and apparatus for editing a video recording with audio selections
US6201176B1 (en) * 1998-05-07 2001-03-13 Canon Kabushiki Kaisha System and method for querying a music database
US6714909B1 (en) * 1998-08-13 2004-03-30 At&T Corp. System and method for automated multimedia content indexing and retrieval
AUPP624698A0 (en) * 1998-09-29 1998-10-22 Canon Kabushiki Kaisha Method and apparatus for multimedia editing
JP3434223B2 (ja) * 1998-11-19 2003-08-04 日本電信電話株式会社 音楽情報検索装置,音楽情報蓄積装置,音楽情報検索方法,音楽情報蓄積方法およびそれらのプログラムを記録した記録媒体
JP3252282B2 (ja) * 1998-12-17 2002-02-04 松下電器産業株式会社 シーンを検索する方法及びその装置
JP2000221988A (ja) * 1999-01-29 2000-08-11 Sony Corp データ処理装置、データ処理方法、プログラム提供媒体及び記録媒体
US6434520B1 (en) * 1999-04-16 2002-08-13 International Business Machines Corporation System and method for indexing and querying audio archives
JP2000305578A (ja) * 1999-04-26 2000-11-02 Nippon Telegr & Teleph Corp <Ntt> 音楽データベース作成装置、作成方法およびそのプログラム記録媒体
KR100853951B1 (ko) * 1999-05-19 2008-08-25 디지맥 코포레이션 오디오를 처리하는 방법들 및 장치들
US6321200B1 (en) * 1999-07-02 2001-11-20 Mitsubish Electric Research Laboratories, Inc Method for extracting features from a mixture of signals
GB9918611D0 (en) * 1999-08-07 1999-10-13 Sibelius Software Ltd Music database searching
US6355869B1 (en) * 1999-08-19 2002-03-12 Duane Mitton Method and system for creating musical scores from musical recordings
JP4491700B2 (ja) * 1999-08-26 2010-06-30 ソニー株式会社 音響検索処理方法、音響情報検索装置、音響情報蓄積方法、音響情報蓄積装置および音響映像検索処理方法、音響映像情報検索装置、音響映像情報蓄積方法、音響映像情報蓄積装置
AU7329400A (en) 1999-09-03 2001-04-10 Benson, Iritte Method and system for music video generation
JP2001118689A (ja) * 1999-10-15 2001-04-27 Matsushita Electric Ind Co Ltd 照明制御方法
US7022905B1 (en) * 1999-10-18 2006-04-04 Microsoft Corporation Classification of information and use of classifications in searching and retrieval of information
JP4438144B2 (ja) * 1999-11-11 2010-03-24 ソニー株式会社 信号分類方法及び装置、記述子生成方法及び装置、信号検索方法及び装置
JP3757719B2 (ja) * 1999-11-19 2006-03-22 松下電器産業株式会社 音響データ分析方法及びその装置
US6678680B1 (en) * 2000-01-06 2004-01-13 Mark Woo Music search engine
KR100694028B1 (ko) * 2000-01-25 2007-03-12 삼성전자주식회사 멀티미디어 파일 작성용 저작장치 및 방법
US6308154B1 (en) * 2000-04-13 2001-10-23 Rockwell Electronic Commerce Corp. Method of natural language communication using a mark-up language
ATE539593T1 (de) * 2000-06-21 2012-01-15 Philips Solid State Lighting Verfahren und vorrichtung zum steuern eines beleuchtungssystems in abhängigkeit einer audioeingabe
US7065416B2 (en) * 2001-08-29 2006-06-20 Microsoft Corporation System and methods for providing automatic classification of media entities according to melodic movement properties
GB0023930D0 (en) * 2000-09-29 2000-11-15 Canon Kk Database annotation and retrieval
JP2002117407A (ja) * 2000-10-10 2002-04-19 Satake Corp 動画像検索方法及びその装置
US6778226B1 (en) * 2000-10-11 2004-08-17 Koninklijke Philips Electronics N.V. Device cabinet with dynamically controlled appearance
JP2002215195A (ja) * 2000-11-06 2002-07-31 Matsushita Electric Ind Co Ltd 音楽信号処理装置
DE10164686B4 (de) * 2001-01-13 2007-05-31 Native Instruments Software Synthesis Gmbh Automatische Erkennung und Anpassung von Tempo und Phase von Musikstücken und darauf aufbauender interaktiver Musik-Abspieler
US8949878B2 (en) * 2001-03-30 2015-02-03 Funai Electric Co., Ltd. System for parental control in video programs based on multimedia content information
US7039585B2 (en) * 2001-04-10 2006-05-02 International Business Machines Corporation Method and system for searching recorded speech and retrieving relevant segments
GB0111431D0 (en) 2001-05-11 2001-07-04 Koninkl Philips Electronics Nv A real-world representation system and language
JP2002341888A (ja) * 2001-05-18 2002-11-29 Pioneer Electronic Corp ビート密度検出装置と情報再生装置
US6740803B2 (en) * 2001-11-21 2004-05-25 Line 6, Inc Computing device to allow for the selection and display of a multimedia presentation of an audio file and to allow a user to play a musical instrument in conjunction with the multimedia presentation
US20030107592A1 (en) * 2001-12-11 2003-06-12 Koninklijke Philips Electronics N.V. System and method for retrieving information related to persons in video programs
US6967275B2 (en) * 2002-06-25 2005-11-22 Irobot Corporation Song-matching system and method
JP4313563B2 (ja) * 2002-12-04 2009-08-12 パイオニア株式会社 楽曲検索装置及び方法

Also Published As

Publication number Publication date
DE60321044D1 (de) 2008-06-26
GB0320578D0 (en) 2003-10-01
JP2006512625A (ja) 2006-04-13
RU2322654C2 (ru) 2008-04-20
CN100438633C (zh) 2008-11-26
ATE395789T1 (de) 2008-05-15
CN1732510A (zh) 2006-02-08
US20060085182A1 (en) 2006-04-20
JP4871592B2 (ja) 2012-02-08
GB0230097D0 (en) 2003-01-29
CN1732692A (zh) 2006-02-08
AU2003285635A1 (en) 2004-07-22
US8433575B2 (en) 2013-04-30
JP2006512820A (ja) 2006-04-13
EP1579698B1 (en) 2008-05-14
KR20050086942A (ko) 2005-08-30
WO2004059986A1 (en) 2004-07-15
BR0317713A (pt) 2005-11-22
EP1579698A1 (en) 2005-09-28
RU2005123387A (ru) 2006-03-20
CN100559460C (zh) 2009-11-11

Similar Documents

Publication Publication Date Title
ES2305539T3 (es) Metodo y sistema para aumentar una señal de audio.
CN112530470B (zh) 媒体内容增强系统,以及组成媒体产品的方法
CN110603537B (zh) 增强的内容跟踪系统和方法
US8542982B2 (en) Image/video data editing apparatus and method for generating image or video soundtracks
US9753925B2 (en) Systems, methods, and apparatus for generating an audio-visual presentation using characteristics of audio, visual and symbolic media objects
JP5457676B2 (ja) デジタル画像の内容特徴およびメタデータを使って関係したオーディオ随伴物をみつけるシステムおよび方法
ES2779994T3 (es) Determinación de un conjunto de parámetros ambientales
US20110161348A1 (en) System and Method for Automatically Creating a Media Compilation
JP4243862B2 (ja) コンテンツ利用装置およびコンテンツ利用方法
KR20080043129A (ko) 음악의 무드를 이용한 사진 추천 방법 및 그 시스템
CN110495180A (zh) 生成用于伴随音频的视频呈现
CN111666445A (zh) 一种情景歌词的显示方法、装置及音箱设备
CN111625685A (zh) 音乐电台呈现方法与装置、视频数据分类方法与装置
JP2006127574A (ja) コンテンツ利用装置、コンテンツ利用方法、配信サーバー装置、情報配信方法および記録媒体
CN101094469A (zh) 移动终端提示信息的生成方法和装置
CN102447785A (zh) 移动终端提示信息的生成方法和装置
CN117726716A (zh) 一种多媒体数据处理方法、装置、电子设备及存储介质
JP2008299411A (ja) マルチメディア再生機器
US20060016321A1 (en) Apparatus and method for controlling sounds and images
JP2023162958A (ja) カラオケ装置
JP2001331187A (ja) カラオケ装置
Falconer Reviews: Exhibitions-Christian Marclay