ES2305539T3 - Metodo y sistema para aumentar una señal de audio. - Google Patents
Metodo y sistema para aumentar una señal de audio. Download PDFInfo
- Publication number
- ES2305539T3 ES2305539T3 ES03778627T ES03778627T ES2305539T3 ES 2305539 T3 ES2305539 T3 ES 2305539T3 ES 03778627 T ES03778627 T ES 03778627T ES 03778627 T ES03778627 T ES 03778627T ES 2305539 T3 ES2305539 T3 ES 2305539T3
- Authority
- ES
- Spain
- Prior art keywords
- dramatic
- media
- audio signal
- parameters
- fragments
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 44
- 238000000034 method Methods 0.000 title claims abstract description 33
- 239000012634 fragment Substances 0.000 claims abstract description 60
- 238000013515 script Methods 0.000 claims description 12
- 239000000284 extract Substances 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 4
- 230000033764 rhythmic process Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000012467 final product Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000011435 rock Substances 0.000 description 2
- 208000023514 Barrett esophagus Diseases 0.000 description 1
- 102100031102 C-C motif chemokine 4 Human genes 0.000 description 1
- 101100054773 Caenorhabditis elegans act-2 gene Proteins 0.000 description 1
- 101100000858 Caenorhabditis elegans act-3 gene Proteins 0.000 description 1
- 102100024058 Flap endonuclease GEN homolog 1 Human genes 0.000 description 1
- 101000833646 Homo sapiens Flap endonuclease GEN homolog 1 Proteins 0.000 description 1
- HEFNNWSXXWATRW-UHFFFAOYSA-N Ibuprofen Chemical compound CC(C)CC1=CC=C(C(C)C(O)=O)C=C1 HEFNNWSXXWATRW-UHFFFAOYSA-N 0.000 description 1
- 230000002745 absorbent Effects 0.000 description 1
- 239000002250 absorbent Substances 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000007654 immersion Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/44—Receiver circuitry for the reception of television signals according to analogue transmission standards
- H04N5/60—Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/034—Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Electrophonic Musical Instruments (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Auxiliary Devices For Music (AREA)
- Electrically Operated Instructional Devices (AREA)
- Stereo-Broadcasting Methods (AREA)
Abstract
Método para aumentar una señal de audio que comprende: recibir una señal de audio, extraer características de dicha señal de audio, generar una tabla ordenada en el tiempo de parámetros dramáticos según las características extraídas, obtener fragmentos de medios que incluyen datos de vídeo, al menos en parte en función de la tabla de parámetros dramáticos, y emitir dichos fragmentos de medios junto con dicha señal de audio.
Description
Método y sistema para aumentar una señal de
audio.
La presente invención se refiere a un método y a
un sistema para aumentar una señal de audio según características
extraídas de dicha señal de audio. La presente invención tiene
aplicación particular, pero no exclusiva, en sistemas que
determinan y extraen características musicales de una señal de audio
tal como el compás y el tono.
Se conoce aumentar una señal de audio con una
señal de vídeo. Donde más ocurre esto es en la industria de los
vídeos musicales, en la que una canción o álbum particular tiene una
secuencia de vídeo creada para la música, normalmente con el fin de
emitir el audio y vídeo combinados a través de una red de
televisión. La señal de vídeo se crea de forma manual, empleando la
experiencia y el talento de una serie de personas para seleccionar
y/o crear secuencias de vídeo adecuadas que mejoren lo mejor posible
la música. La habilidad de las personas implicadas es un factor
crucial en la calidad del producto final. También sucede que tal
aumento es un proceso largo y caro, sin garantía real de la
adecuación del producto final para un gran número de usuarios.
También se conocen herramientas de software de
consumo que permiten a un consumidor doméstico crear presentaciones
de música y vídeo, según entradas de usuario. La solicitud de
patente europea EP0403118 describe una compilación audiovisual en
un sistema de procesamiento de datos tal como un ordenador personal
(PC) doméstico. El sistema comprende módulos de biblioteca, audio,
y creación y edición de guiones que permiten a un usuario compilar
una presentación audiovisual y emitirla. La solicitud de patente
internacional WO01/18655 da a conocer un método y un sistema para
generación de vídeos musicales en un ordenador que comprende una
interfaz de edición que incluye una selección de botones de primer
plano, segundo plano, capacidad de importación y efectos especiales,
una línea temporal para crear un texto de instrucciones para el
montaje de imágenes gráficas, en sincronía con la música, para de
este modo producir un proyecto de vídeo musical.
Tales sistemas domésticos/de consumo conocidos
permiten a un consumidor producir su propio vídeo para aumentar una
señal de audio. Sin embargo, como en la creación de vídeo en el
ámbito profesional, tal creación lleva tiempo y se basa nuevamente
en la habilidad del consumidor implicado.
El documento US 5.005.459 da a conocer un método
para la visualización de tonos musicales que implica analizar el
contenido espectral de una señal de audio y seleccionar una fuente
de señal de vídeo apropiada para su presentación con la obra
musical. Una posible aplicación es la visualización de la imagen de
uno o más instrumentes que estén tocándose en ese momento.
El documento US 5.898.119 da a conocer la
selección de segmentos de vídeo que tienen un ambiente que coincide
con el ambiente de la música que está interpretándose. En este
documento tanto los datos de audio como los musicales están
previamente clasificados en diferentes categorías de ambientes.
Normalmente, tales sistemas de la técnica
anterior sólo tienen capacidades de automatización limitadas, en
caso de tenerlas, y en general son incapaces de aumentar
automáticamente una señal de audio de entrada ad hoc con una
secuencia de historia de vídeo en función de y siguiendo el
contenido semántico de la señal de audio.
Por lo tanto un objeto de la presente invención
es proporcionar un método y sistema mejorados para aumentar una
señal de audio.
Según un primer aspecto de la presente invención
se proporciona un método según la reivindicación 1.
Según un segundo aspecto de la presente
invención se proporciona un sistema según la reivindicación 16.
Según un tercer aspecto de la presente invención
se proporciona un programa informático según la reivindicación
20.
Conforme a lo anterior, características
musicales extraídas de una señal de audio tales como tono y compás
se asocian con parámetros dramáticos que representan una visión
general de un fragmento de medios que puede contener un archivo de
datos de audio/vídeo. Por ejemplo, un compás rápido puede encajar
bien con un fragmento de medios que tenga una escena de caza que
sea muy rápida y violenta.
Los parámetros dramáticos representan
ventajosamente características de una historia tal como ambiente,
ritmo, episodios etcétera. Los parámetros dramáticos también se
correlacionan con características extraídas de la señal de audio
tales como tono y compás.
Ventajosamente, los fragmentos de medios están
almacenados en una base de datos desde la que se obtienen.
Alternativamente, los fragmentos pueden generarse durante la
ejecución según una plantilla de historia que comprende una
descripción general o estructura narrativa para una historia, y
parámetros dramáticos apropiados.
Por ejemplo, una plantilla de historia romántica
puede tener ciertos requisitos tales como tonos musicales asociados
con la felicidad (tonos mayores) o la tristeza (tonos menores). En
la plantilla de historia está representado un arco narrativo que
describe la progresión de una historia romántica. Un arco de ejemplo
para una historia romántica puede comprender lo siguiente, un
encuentro casual, desarrollo de una relación, tragedia y final feliz
o triste.
Por tanto, resulta posible generar, obtener y
presentar una historia a un consumidor, basándose la historia en
una selección musical del consumidor.
Por ejemplo, un consumidor puede seleccionar
cuatro pistas de música que se analizan para determinar por ejemplo
el género (o el consumidor puede introducir un género preferido) y
se extraen características musicales de las pistas. Las
características se emplean para determinar una plantilla de historia
que coincida bastante que se emplea entonces para obtener
fragmentos de medios coincidentes apropiados. Por ejemplo,
fragmentos de medios que tienen parámetros dramáticos que indican
tonos mayores (felices), o tonos menores (tristeza) y que también
contienen contenido romántico pueden obtenerse entonces para
construir la historia.
Los fragmentos de medios se presentan entonces
al consumidor junto con su selección musical. Por tanto, un
consumidor experimenta una experiencia de historia junto con, y
siendo informado por la música seleccionada.
Ventajosamente, combinaciones de tonos musicales
(tal vez un cambio de tono dentro de una pista musical o un cambio
de tono entre una pista musical y otra) también pueden emplearse
para determinar momentos dramáticos tales como una acumulación y
posterior explosión de tensión.
En una realización el sistema comprende un
ordenador personal conectado a una base de datos que almacena
fragmentos de medios y plantillas de guiones. El ordenador está
dotado de un código de programa, que extrae características
musicales de señales de audio que representan una selección musical,
y también de un código de programa que representa un módulo de
construcción de guiones, que selecciona plantillas y obtiene
fragmentos de medios apropiados en función de determinados
parámetros dramáticos relativos a las características musicales
extraídas. Los parámetros dramáticos están representados en un
metalenguaje configurable tal como el lenguaje de marcación
extendido (XML). El programa informático hace corresponder las
plantillas de guiones y los fragmentos de medios que tienen
etiquetas de parámetros dramáticos asociadas y presenta la historia
al consumidor.
Ventajosamente, el ordenador forma parte de una
red doméstica que tiene dispositivos de salida por lo que puede
cambiarse la luminosidad en momentos dramáticos identificados, y
otros aspectos del entorno de experiencia que rodea al consumidor
pueden controlarse para proporcionar una experiencia narrativa
absorbente junto con la selección musical. El lenguaje de marcación
físico (PML) puede utilizarse para conseguir lo anteriormente
mencionado.
Conforme a la invención, es posible aumentar una
señal de audio, sin necesidad de entradas por parte de la persona,
de manera que no obstante se produce un aumento que está relacionado
y complementa al audio.
La presente invención se describirá a
continuación, únicamente a modo de ejemplo, y con referencia a los
dibujos adjuntos en los que:
La figura 1 es una representación esquemática de
un sistema para aumentar una señal de audio,
La figura 2 es una tabla que relaciona
características musicales con parámetros dramáticos,
La figura 3 es un ejemplo de una lista de
parámetros dramáticos generada,
La figura 4 es un ejemplo ilustrativo de
plantillas de guiones almacenadas,
La figura 5 ilustra una base de datos que
almacena fragmentos de medios,
La figura 6 es un diagrama de flujo de un método
para aumentar una señal de audio,
La figura 7 es un diagrama de flujo de un método
PML para aumentar una señal de audio.
Ha de observarse que las figuras son
esquemáticas y no están dibujadas a escala. Las dimensiones y
proporciones relativas de partes de estas figuras se han mostrado
con un tamaño exagerado o reducido, por motivos de claridad y
comodidad en los dibujos. Generalmente se utilizan los mismos signos
de referencia para referirse a características correspondientes o
similares en realizaciones modificadas y diferentes.
La figura 1 muestra una representación
esquemática de un sistema 100 para aumentar una señal de audio. El
sistema 100 consiste en una unidad 102 de procesamiento central
(CPU) conectada a una memoria 104 (ROM) y a una memoria 106 (RAM) a
través de un bus 108 de datos general. Puede cargarse un código
informático o software 110 sobre un soporte 112 en la RAM 106 (o
alternativamente estar previsto en la ROM 104), haciendo el código
que la CPU 102 lleve a cabo instrucciones que implementan un método
o métodos según la invención. La CPU 102 está conectada a un
almacén 114 y a dispositivos 116, 118 de salida. Se proporciona una
interfaz 120 de usuario (UI).
El sistema 100 puede implementarse como un
ordenador personal (PC) doméstico convencional con el dispositivo
116 de salida con la forma de un monitor o pantalla de ordenador. El
almacén 114 puede ser una base de datos remota disponible a través
de una conexión de red (LAN o WAN). De manera similar en una red
doméstica (LAN) los dispositivos 116, 118 de salida pueden estar
distribuidos por la casa y comprender por ejemplo una pantalla
plana instalada en la pared, unidades de iluminación doméstica
controladas por ordenador, altavoces de audio dispuestos por la
casa, etcétera. Las conexiones entre la CPU 102 y otros dispositivos
116, 118 pueden ser inalámbricas (por ejemplo comunicaciones a
través de normas de radio IEEE802.11, Zig- Bee IEE802.15.4 o
Bluetooth) o por cable (por ejemplo comunicaciones a través de
normas de cable Ethernet, USB), o una combinación de ambas.
El sistema 100 requiere la entrada de señales de
audio de las que se extraen características. La extracción de
características musicales de señales de audio se describe en el
documento "Querying large collections of music for similarity"
(Matt Welsh et al, UC Berkeley Technical Report
UCB/CSD-00-1096, noviembre de 1999)
cuyo contenido se incorpora por la presente. El documento describe
cómo pueden determinarse características tales como un compás
medio, volumen, ruido y transiciones tonales a partir del análisis
de una señal de audio de entrada. Un método para determinar el tono
musical de una señal de audio se describe en la patente
estadounidense US5.038.658 a nombre de Tsuruta et al,
incorporada por la presente y a la que remite al lector.
Por tanto, en el sistema 100 se introducen
señales de audio a la CPU 102 por el dispositivo 122 de entrada. La
CPU 102 recibe las señales de audio y extrae características
musicales tales como volumen, compás y tono tal como se describe en
las referencias anteriormente mencionadas. En esta realización, la
señal de audio se proporciona a través de un dispositivo 122 de
entrada interno del PC tal como una unidad de CD/DVD o disco duro.
Alternativamente, las señales de audio pueden introducirse a través
de una conexión a un sistema de entretenimiento doméstico en red
(Hi-Fi, home cinema, etc.).
Los expertos en la técnica se percatarán de que
la configuración exacta de hardware/software y el mecanismo de
provisión de la señal de audio de entrada no es importante, y que
más bien tales señales se ponen a disposición de dicho sistema
100.
Estructuras de datos de ejemplo y métodos de
funcionamiento se describirán a continuación para ilustrar aspectos
de la presente invención con respecto a, por motivos de simplicidad
y a modo de ejemplo únicamente, una realización de PC del sistema
100.
La figura 2 muestra una tabla 200 de ejemplo
para su uso por el programa 110 informático. La tabla ilustra una
relación no exhaustiva de características 204 (MF) musicales
extraídas con parámetros 206 (DP) dramáticos predeterminados y
definidos. Por ejemplo, se conoce bien que en general la música que
tiene un tono mayor (tono MAY) se asocia a sentimientos felices o
animados, mientras que la música interpretada en tono menor (tono
MEN) tiende a ser más afligida y triste.
Además, empleando un círculo de diagrama de
quintas (muy conocido por los que estudian música) es posible
determinar tonos musicales relacionados, que sean armoniosos para
que una transición de un tono a otro no resulte alarmante para un
consumidor. En general, una transición de un tono a otro tono
adyacente en el círculo produce para un consumidor una transición
armoniosa aceptable, mientras que un salto de un tono a otro tono
no adyacente en el diagrama produce una disonancia audible para un
usuario. Por ejemplo, tonos muy relacionados (adyacentes) de Do
Mayor/La Menor son Fa Mayor/Re Menor y Sol Mayor/Mi Menor. Por
tanto, un cambio de tono de, digamos, Do Mayor (ya sea dentro de
una pista de música o de una pista a otra) a Mi Mayor (no adyacente)
resultaría en que el usuario escucharía una disonancia audible. Tal
conocimiento es útil a la hora de desarrollar reglas para saber qué
pistas de música son adecuadas para encadenarse unas con otras en
una aplicación de DJ automática.
Tal conocimiento puede usarse para indicar un
cambio dramático en una historia (por ejemplo, de una escena de
boda feliz a una escena trágica triste, sumándose la música a la
experiencia de la historia). Por tanto, en la figura 2 una
característica musical correspondiente a tal combinación de cambios
de tono no adyacentes está representada por (CNA) con el parámetro
dramático DISONANCIA. La tabla también ilustra que un parámetro
dramático de RÁPIDO o LENTO puede asociarse con un resultado de
COMPÁS extraído (pulsos por minuto - b pm). Por ejemplo, un bpm
superior a 120 puede asignarse a un parámetro dramático RÁPIDO,
mientras que una canción o pista con un compás más lento puede
asignarse a un parámetro dramático LENTO. Por tanto, de forma
general el ambiente, los cambios de ritmo y los episodios según una
selección musical pueden determinarse y representarse.
Los ejemplos de parámetros dramáticos se dan
únicamente con fines ilustrativos, con numerosos parámetros
dramáticos posibles en forma de etiquetas de lenguaje de marcación
(realizadas en XML por ejemplo) u otros atributos. Por ejemplo,
otras características musicales tales como el tipo de instrumento
(un chelo puede asignarse a un atributo TRISTE/LENTO), y puede
definirse una etiqueta descriptiva de género de alto nivel.
Numerosos archivos de CD o MP3 tienen descriptores de género
asociados a una pista o CD, por ejemplo rock, romántica, trance,
etc., y estos pueden recuperarse y asignárseles parámetros
dramáticos. www.gracenote.com es un ejemplo de base de datos de
música y proveedor de servicios en la que la música se clasifica
como rock, electrónica/dance, jazz, etcétera. La música
electrónica/dance seleccionada de un servicio de este tipo puede
asociarse con un parámetro dramático <FUTURE> o <CYBER>
que generalmente indica el género de una historia que puede ser
adecuada.
A modo de ejemplo se ilustra ahora cómo tales
etiquetas se utilizan para ayudar a construir una historia
acompañada por la información de la música. Un consumidor que busca
entretenimiento, selecciona tres pistas de música para reproducir¡,
pista 1 (TR1), pista 2 (TR2) y pista 3 (TR3) en su PC. Las señales
de audio de las pistas se introducen por el dispositivo 122 de
entrada a la CPU 102, que determina y extrae características
musicales de las señales de audio. La CPU 102, que actúa según
instrucciones del programa 110 informático, correlaciona las
características (MF) 204 musicales determinadas con parámetros (DP)
206 dramáticos asociados utilizando la tabla 200 (figura 2) y
posteriormente construye una tabla 300 tal como se muestra en la
figura 3.
La tabla 300, ordenada en el tiempo (para crear
una línea TL 304 de tiempo), indica que la CPU 102 ha determinado
que la pista 1 empieza con un compás RÁPIDO y tiene un parámetro
dramático FELIZ asociado (es decir un tono mayor). Tras esto, la
TR2 desentona (característica CNA determinada) y está en un tono
menor (con un parámetro dramático TRISTE correspondiente). La pista
3, similar a la pista 1 se ha determinado que sea en general RÁPIDA
(compás alto), y en un tono mayor (FELIZ).
Por tanto, se crea una visión general de nivel
alto de la selección musical en la que la música envuelve de manera
dramática como rápido (COMPÁS TR1), FELIZ (tono mayor), una
disonancia (indicando CNA y tono menor tristeza TR2) y un aumento
del compás y ambiente feliz para la pista 3. Una vez construida esta
visión general dramática de alto nivel, la CPU 102 se conecta
entonces al almacén 114 para buscar una estructura de datos de
contenga una plantilla de historia con una visión general dramática
que coincida aproximadamente.
La figura 4 muestra ejemplos ilustrativos de una
colección de plantillas de guiones construidas para su uso con el
sistema 100. La colección puede disponerse tal como se muestra en el
diagrama según el género (GEN 1, GEN 2, GEN 3). El género puede
haberse indicado por el consumidor (a través de la UI 120) o
determinarse por ejemplo leyendo etiquetas descriptoras de la
música seleccionada tal como se conoce en la técnica. GEN1 puede
representar por ejemplo sencillas historias para niños, o de terror,
o románticas o cualquier otro género de clasificación de guiones
considerado como adecuado. Las plantillas 404 también pueden
almacenar otra información tal como cuántos personajes principales
o protagonistas son adecuados (tal vez sólo se necesitan 3 para una
breve historia romántica que implique un triángulo amoroso).
Las plantillas 404 de guiones tienen asociadas
cada una parámetros dramáticos relativos a una estructura narrativa.
Por ejemplo, numerosos guiones (en particular películas de
Hollywood) siguen una estructura en tres actos en la que el acto I
introduce a los personales y la historia, el acto II desarrolla la
historia y en el acto III se resuelve la historia. A menudo, al
final del acto I hay un episodio instigador que permite la
revelación del desarrollo de un personaje. Por tanto, los
solicitantes se han dado cuenta de que las transiciones musicales,
o cambios de pista pueden emplearse (a través de una detección de
CNA, por ejemplo) para desalinear fases de la historia o guión. Por
tanto, en la figura 4 la plantilla 1 (ST1) de historia tiene una
sencilla estructura narrativa en la que los parámetros dramáticos
indican un arco de historia en el que por ejemplo el primer acto es
rápido, pasa al acto II feliz y termina con una escena o escenas
rápidas para el acto III. Una historia de ejemplo que puede
adecuarse a una plantilla de este tipo sería una sencilla para niños
en la que unos animales amigos compiten en una carrera, celebran la
victoria del ganador, y a continuación vuelven corriendo a casa.
La historia ST2 tiene sin embargo un arco de
historia diferente en el que el acto II tiene parámetros dramáticos
asociados con escenas tristes y lentas. La variabilidad de las
plantillas de historias depende del número de parámetros dramáticos
que pueden determinarse por las características musicales en la fase
122. Además, las plantillas de historias pueden almacenar
información relativa a la longitud en tiempo de cada acto (y por
tanto de la historia global), teniendo las historias breves,
digamos, actos aproximadamente iguales a una o dos pistas musicales
(6-8 minutos o así de media) mientras que historias
más largas pueden tener actos más largos con más parámetros DP
dramáticos que indiquen cambios de escena dentro de un acto. Quienes
tengan experiencia en la técnica de redacción de historias y
guiones pueden definir otros parámetros y reglas de personajes
pertenecientes a las plantillas de historias.
En funcionamiento, la CPU 102 compara los DP de
las plantillas de historias con los determinados a partir de la
selección musical (figura 3) y selecciona una plantilla que se
corresponde bastante. Por ejemplo, la comparación de los DP
determinados en la figura 3 con la ST2 de la figura 4 revela una
coincidencia y por tanto se selecciona ST2. Una vez seleccionada
una plantilla 404 de historia la CPU 102 debe entonces rellenar la
plantilla ST2 con el contenido real de la historia.
La figura 5 muestra un almacén 114 de ejemplo en
forma de una base de datos 500 que almacena una multitud de
fragmentos 502 de medios. Un fragmento de medios es una entidad de
datos que comprende por ejemplo un segmento codificado de película
(en ocasiones denominado toma y en el que varias tomas constituyen
una escena). Por tanto el fragmento de medios tiene una cierta
duración temporal asociada cuando se reproduce. Los fragmentos 502
están caracterizados por atributos etiquetados relativos a
parámetros dramáticos.
El fragmento de medios puede almacenarse como, a
modo de ejemplo, un registro XML que comprende una descripción del
contenido audiovisual de la escena (por ejemplo
género-acción, acto 1, inicio de persecución de
coches, 4 minutos) y parámetros dramáticos asociados al contenido
de la escena. Por supuesto, al crear los fragmentos una historia
global puede desarrollarse con diferentes finales e inicios (por
ejemplo, una historia puede empezar con una escena de persecución
de coches, o bicicletas) cada uno adecuado para diferentes
parámetros dramáticos (COMPÁS). Esto permite el mantenimiento de un
cierto presagio de la historia mientras que todavía se permite
mostrar diferentes fragmentos dependiendo de determinados parámetros
dramáticos de la música. También pueden crearse escenas similares
con diferentes duraciones.
Por tanto, el programa informático da
instrucciones a la CPU 102 para que busque en la base de datos
fragmentos 502 de medios, que se corresponden aproximadamente en
cuanto a duración, actos y parámetros dramáticos con la plantilla
de historia seleccionada. Los fragmentos se obtienen, ordenan y
almacenan en caché en la memoria 106 (o la unidad de disco duro), y
posteriormente se emiten con la música. La base de datos 500 también
puede almacenar opcionalmente, para mayor comodidad, las plantillas
400 de historias tal como se ilustra en la figura 5.
Por ejemplo, con referencia a la lista de DP
generada en la figura 3 y la plantilla de historia (ST2)
seleccionada de la figura 4, y en la que se ha indicado un género
infantil (tal vez por el propio niño a través de la UI 120). Se
buscan fragmentos de historias que tengan la etiqueta de género
infantil que coincidan con la línea (TL) de tiempo y los parámetros
(DP) dramáticos determinados. Supongamos que la pista 1 (TR1) dura 4
minutos, entonces se busca un fragmento de medios inicial que tenga
una combinación DP (RÁPIDO-FELIZ) y que dure
aproximadamente 4 minutos. De manera similar, se busca un fragmento
de medios (relacionado con el primer fragmento seleccionado) para
el acto II que tenga un ritmo más lento y un tema triste y que dure
aproximadamente la duración de la pista 2. Finalmente se
seleccionan fragmentos de medios etiquetados como que tienen un
final rápido/feliz y relacionados con el primer fragmento para su
presentación con la pista 3.
Por tanto, una vez identificados y obtenidos
fragmentos 502 de medios adecuados, se emite la historia, en esta
realización de PC, en el monitor 116 de visualización.
La figura 6 ilustra un diagrama de flujo que
muestra las etapas descritas anteriormente. En la etapa 602 se
introduce una señal de audio que representa la selección musical
(IAS) y se extraen las características musicales (EMF) en la etapa
604. Se genera una lista de parámetros dramáticos que caracterizan
la música (GEN DP) en la etapa 606 tras lo cual en la etapa 608 se
selecciona una plantilla de historia (ST) y se utiliza junto con
los parámetros dramáticos para obtener fragmentos de medios (OMF)
apropiados. Finalmente en la etapa 610, se emite la historia (O/P)
junto con la selección musical.
Los expertos en la técnica se percatarán de que
la historia no tiene que ser contigua. Puede emplearse contenido en
forma de viñetas de cómic estilizadas en fragmentos de medios,
facilitando así los requisitos de coincidencia en la duración
temporal y permitiendo una coincidencia más fácil de la emisión de
escenas con momentos dramáticos identificados en la música
seleccionada. Tal contenido visual generado por ordenador o de
dibujos animados o cómic "pre-enlatado" puede
crearse e indexarse de manera relativamente rápida, permitiendo un
rápido establecimiento de una base de datos importante que tenga
numerosas plantillas de historias y fragmentos de medios
disponibles. Los fragmentos pueden almacenarse de manera
conveniente, por ejemplo como archivos MPEG enlazados con registros
que indexan los archivos en cuanto a parámetros dramáticos, género,
personajes, etc.
En el ejemplo anterior, se recuperaba contenido
preenlatado para un usuario en función de una plantilla de historia
con una línea de tiempo que coincidía aproximadamente con la
duración de la selección musical. Sin embargo, una vez seleccionada
una plantilla de historia particular, los fragmentos de medios
pueden generarse por ordenador durante la ejecución por el
procesador 102. Por ejemplo, un fragmento de medios puede contener
contenido generado por ordenador en forma de un sencillo dibujo
animado para un niño. La correspondencia de los fragmentos con la
línea de tiempo de la selección musical se entonces relativamente
sencilla puesto que el procesador 102 genera el propio fragmento de
medios y su contenido. Por supuesto, la necesidad de plantillas de
historias puede obviarse en tal caso, con sencillas reglas (ACT 1,
ACT 2, ACT 3, DP- FELIZ, RÁPIDO, FELIZ) facilitando la generación
de los fragmentos de los medios que conforman la historia.
En otra realización que ilustra aspectos
ventajosos de un sistema con inteligencia ambiental, el módulo
representado por la línea discontinua 124 en la figura 1 se
implementa como un módulo de inserción en red doméstico 124 con
enlaces de red a varios dispositivos 116, 118 de salida que son
compatibles con un lenguaje de marcación y un conjunto de
instrucciones diseñado para proporcionar experiencias del mundo
real. Un ejemplo de un lenguaje de marcación físico (PML) de este
tipo se describe en la solicitud de los solicitantes WO 02/092183 en
tramitación junto con la presente. El PML comprende medios para
crear, comunicar y presentar experiencias a un usuario final de
manera que el usuario final experimente un cierto nivel de inmersión
en un espacio físico real. Por ejemplo, dispositivos de consumo
habilitados para PML tales como HI-FI y sistema de
iluminación pueden recibir instrucciones de un dispositivo de red
central (las instrucciones pueden estar insertadas en un flujo de
vídeo DVD por ejemplo) que hagan que se modifique la emisión de
luces o sonido de los dispositivos. Así una escena oscura en una
película hace que las luces en casa del consumidor se atenúen
apropiadamente.
El PML es en general un lenguaje de marcación
descriptivo de alto nivel que puede implementarse en XML con
descriptores que se refieren a eventos del mundo real (<luz
tenue>). Por tanto, el PML permite que los dispositivos en el
hogar aumenten una experiencia para un consumidor de un modo
normalizado.
La figura 7 ilustra un diagrama de flujo de PML
de ejemplo que implementa aspectos de la presente invención. Se
introducen señales (IAS) 700 de audio y se analizan para detectar
características (EMF) 702 musicales. Las características se
proporcionan al módulo 124 de construcción de historias que genera
una tabla de parámetros dramáticos y una línea de tiempo tal como
se ha descrito anteriormente. El módulo 124 selecciona una plantilla
400 de historia en función de la tabla generada y obtiene
fragmentos 502 de medios adecuados. Los fragmentos (que pueden ser
preenlatados o generados durante la ejecución) incluyen descriptores
PML así como parámetros dramáticos. Los fragmentos se montan
entonces por el módulo 124, y se proporcionan a un interpretador PML
(PMLI) 704.
Por tanto, se interpretan las órdenes PML
asociadas con los fragmentos y posteriormente se dirigen a
dispositivos 706, 708, 710 con PML habilitado en la red doméstica.
Por ejemplo, los dispositivos 706, 708 pueden representar un
sistema de iluminación PML y un proyector PML. Los dispositivos
responden a órdenes PML para así por ejemplo, proyectar niveles de
luz cambiante y colores sobre una pared en determinados momentos en
la experiencia narrativa y de audio asociada con la música
seleccionada y los fragmentos de medios obtenidos. Otros
dispositivos 710 tales como ventiladores de sobremesa, o sistemas
de aire acondicionado y calefacción pueden controlarse en función
de las características dramáticas para aumentar adicionalmente las
señales de audio de entrada y la experiencia de historia
emitida.
Anteriormente se ha descrito un sistema adecuado
para aumentar señales de audio proporcionando una experiencia de
historia narrativa. El sistema puede ser en forma de un módulo 124
dedicado, o un ordenador de uso general, que funcione sólo o junto
con otros dispositivos en una red doméstica. Características
musicales extraídas tales como tono, cambios de tono, compás,
etcétera se introducen en el ordenador que relaciona entonces las
características con parámetros dramáticos. Se obtienen entonces
fragmentos de medios apropiados y posteriormente se emiten y
presentan a un usuario. Otros dispositivos de salida pueden
utilizarse para mejorar y aumentar adicionalmente la historia.
De la lectura de la presente descripción
resultarán evidentes otras modificaciones para los expertos en la
técnica. Tales modificaciones pueden implicar otras características
que ya se conocen en el diseño, fabricación y uso de sistemas
multimedia y piezas componentes de los mismos y que pueden
utilizarse en lugar de o además de características ya descritas en
la presente memoria sin alejarse del espíritu y alcance de la
presente invención. Además, las estructuras narrativas y fragmentos
de medios pueden variar de los ejemplos explícitos descritos en la
presente memoria sin alejarse del alcance de la presente invención
tal como se define por las reivindicaciones adjuntas.
Claims (20)
1. Método para aumentar una señal de audio que
comprende:
recibir una señal de audio,
extraer características de dicha señal de
audio,
generar una tabla ordenada en el tiempo de
parámetros dramáticos según las características extraídas,
obtener fragmentos de medios que incluyen datos
de vídeo, al menos en parte en función de la tabla de parámetros
dramáticos, y
emitir dichos fragmentos de medios junto con
dicha señal de audio.
2. Método según la reivindicación 1, en el que
dichas características extraídas de dicha señal de audio incluyen
una o más de compás, tono, volumen.
3. Método según la reivindicación 1 ó 2, en el
que la generación de dicha tabla de parámetros dramáticos comprende
recuperar una lista parámetros dramáticos y características de audio
asociadas, comparar y hacer corresponder las características
extraídas con las características de audio asociadas recuperadas, e
insertar una entrada que comprende el parámetro dramático asociado
con la característica de audio.
4. Método según la reivindicación 1, 2 ó 3, en
el que dichos parámetros dramáticos incluyen ambiente, cambios de
ritmo, episodios.
5. Método según cualquier reivindicación
anterior, en el que dicha obtención de dichos fragmentos de medios
comprende seleccionar un fragmento de un almacén, estando dicho
fragmento almacenado con un parámetro dramático asociado que se
corresponde con la respectiva entrada en la tabla de parámetros
dramáticos.
6. Método según cualquier reivindicación
anterior, en el que dicha obtención de dichos fragmentos de medios
comprende generar un fragmento.
7. Método según la reivindicación 5 ó 6, y que
comprende además recibir entradas de usuario, afectando dichas
entradas de usuario a dicha obtención.
8. Método según cualquier reivindicación
anterior, en el que dicha emisión comprende almacenar dichos
fragmentos de medios y dicha señal de audio.
9. Método según cualquier reivindicación
anterior, en el que dicha emisión comprende presentar dichos
fragmentos de medios y dicha señal de audio.
10. Método según cualquier reivindicación
anterior, y que comprende además, antes de obtener dichos fragmentos
de medios, seleccionar una plantilla de historia al menos en parte
en función de dicha tabla de parámetros dramáticos, afectando dicha
plantilla de historia a dicha obtención de fragmentos de medios.
11. Método según la reivindicación 10, en el que
dicha plantilla de historia comprende datos de parámetros dramáticos
relativos a una estructura de historia narrativa.
12. Método según la reivindicación 11, en el que
la selección de fragmentos de medios comprende hacer corresponder
los parámetros dramáticos de la plantilla de historia seleccionada
con los de los fragmentos de medios.
13. Método según la reivindicación 10, 11 ó 12,
en el que la plantilla de historia para la selección se genera
según las normas de estructura lógica de guiones y la lista de
parámetros dramáticos.
14. Método según cualquier reivindicación
anterior, en el que los parámetros dramáticos están representados
por etiquetas de lenguaje de marcación físicas.
15. Método según cualquier reivindicación
anterior, en el que las combinaciones de características extraídas
tienen parámetros dramáticos asociados.
16. Sistema para aumentar una señal de audio,
que comprende un dispositivo de entrada para recibir una señal de
audio y medios de procesamiento para extraer características de
dicha señal de audio recibida, para generar una tabla ordenada en
el tiempo de parámetros dramáticos asociados con dichas
características extraídas, para obtener fragmentos de medios que
incluyen datos de vídeo, al menos en parte en función de dicha tabla
de parámetros dramáticos generada, y al menos un dispositivo de
salida para emitir dichos fragmentos de medios junto con dicha señal
de audio.
17. Sistema según la reivindicación 16, que
comprende además almacenamiento para almacenar dichos fragmentos de
medios.
18. Sistema según la reivindicación 16 ó la
reivindicación 17, en el que dicho al menos un dispositivo de salida
comprende medios de visualización en los que se visualizan dichos
fragmentos de medios.
19. Sistema según cualquiera de las
reivindicaciones 16, 17 ó 18, en el que dicho al menos un
dispositivo de salida responde a instrucciones asociadas con dichos
parámetros dramáticos.
20. Código de programa sobre un soporte que
cuando se ejecuta por un procesador hace que dicho procesador
realice todas las etapas de cualquiera de los métodos de las
reivindicaciones 1 a 15.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| GBGB0230097.8A GB0230097D0 (en) | 2002-12-24 | 2002-12-24 | Method and system for augmenting an audio signal |
| GB0230097 | 2002-12-24 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2305539T3 true ES2305539T3 (es) | 2008-11-01 |
Family
ID=9950380
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES03778627T Expired - Lifetime ES2305539T3 (es) | 2002-12-24 | 2003-12-10 | Metodo y sistema para aumentar una señal de audio. |
Country Status (13)
| Country | Link |
|---|---|
| US (1) | US8433575B2 (es) |
| EP (1) | EP1579698B1 (es) |
| JP (2) | JP2006512820A (es) |
| KR (1) | KR20050086942A (es) |
| CN (2) | CN100438633C (es) |
| AT (1) | ATE395789T1 (es) |
| AU (1) | AU2003285635A1 (es) |
| BR (1) | BR0317713A (es) |
| DE (1) | DE60321044D1 (es) |
| ES (1) | ES2305539T3 (es) |
| GB (2) | GB0230097D0 (es) |
| RU (1) | RU2322654C2 (es) |
| WO (1) | WO2004059986A1 (es) |
Families Citing this family (29)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3987025B2 (ja) * | 2002-12-12 | 2007-10-03 | シャープ株式会社 | マルチメディアデータ処理装置およびマルチメディアデータ処理プログラム |
| JP4513644B2 (ja) * | 2005-05-13 | 2010-07-28 | ヤマハ株式会社 | コンテンツ配信サーバ |
| KR20090029721A (ko) * | 2006-05-19 | 2009-03-23 | 에이엠비엑스 유케이 리미티드 | 주위 경험 명령 생성 |
| US8285654B2 (en) * | 2006-06-29 | 2012-10-09 | Nathan Bajrach | Method and system of providing a personalized performance |
| KR101138396B1 (ko) | 2007-09-11 | 2012-04-26 | 삼성전자주식회사 | Iptv 단말기에서 컨텐츠 재생 방법 및 장치 |
| US9251776B2 (en) | 2009-06-01 | 2016-02-02 | Zya, Inc. | System and method creating harmonizing tracks for an audio input |
| US9177540B2 (en) | 2009-06-01 | 2015-11-03 | Music Mastermind, Inc. | System and method for conforming an audio input to a musical key |
| US8779268B2 (en) | 2009-06-01 | 2014-07-15 | Music Mastermind, Inc. | System and method for producing a more harmonious musical accompaniment |
| US9257053B2 (en) * | 2009-06-01 | 2016-02-09 | Zya, Inc. | System and method for providing audio for a requested note using a render cache |
| US8785760B2 (en) | 2009-06-01 | 2014-07-22 | Music Mastermind, Inc. | System and method for applying a chain of effects to a musical composition |
| US9310959B2 (en) | 2009-06-01 | 2016-04-12 | Zya, Inc. | System and method for enhancing audio |
| CA2996784A1 (en) | 2009-06-01 | 2010-12-09 | Music Mastermind, Inc. | System and method of receiving, analyzing, and editing audio to create musical compositions |
| WO2013130841A1 (en) * | 2012-02-29 | 2013-09-06 | Wayans Damon Kyle | Editing storyboard templates for customizing of segments of a video |
| US9431002B2 (en) | 2014-03-04 | 2016-08-30 | Tribune Digital Ventures, Llc | Real time popularity based audible content aquisition |
| US9798509B2 (en) | 2014-03-04 | 2017-10-24 | Gracenote Digital Ventures, Llc | Use of an anticipated travel duration as a basis to generate a playlist |
| US9454342B2 (en) | 2014-03-04 | 2016-09-27 | Tribune Digital Ventures, Llc | Generating a playlist based on a data generation attribute |
| EP2963651A1 (en) * | 2014-07-03 | 2016-01-06 | Samsung Electronics Co., Ltd | Method and device for playing multimedia |
| CN105224581B (zh) * | 2014-07-03 | 2019-06-21 | 北京三星通信技术研究有限公司 | 在播放音乐时呈现图片的方法和装置 |
| EP3175418A4 (en) | 2014-07-31 | 2018-03-28 | Mindsightmedia Inc. | Method, apparatus and article for delivering media content via a user-selectable narrative presentation |
| WO2016115154A1 (en) | 2015-01-14 | 2016-07-21 | MindsightMedia, Inc. | Data mining, influencing viewer selections, and user interfaces |
| US10261964B2 (en) | 2016-01-04 | 2019-04-16 | Gracenote, Inc. | Generating and distributing playlists with music and stories having related moods |
| US10419508B1 (en) | 2016-12-21 | 2019-09-17 | Gracenote Digital Ventures, Llc | Saving media for in-automobile playout |
| US10019225B1 (en) | 2016-12-21 | 2018-07-10 | Gracenote Digital Ventures, Llc | Audio streaming based on in-automobile detection |
| US10565980B1 (en) | 2016-12-21 | 2020-02-18 | Gracenote Digital Ventures, Llc | Audio streaming of text-based articles from newsfeeds |
| US11915722B2 (en) | 2017-03-30 | 2024-02-27 | Gracenote, Inc. | Generating a video presentation to accompany audio |
| JP7121988B2 (ja) * | 2018-09-10 | 2022-08-19 | 株式会社クロスフェーダー | 動画コンテンツ生成方法および生成プログラム |
| EP4243014A4 (en) | 2021-01-25 | 2024-07-17 | Samsung Electronics Co., Ltd. | DEVICE AND METHOD FOR PROCESSING A MULTI-CHANNEL AUDIO SIGNAL |
| US20220405982A1 (en) * | 2021-06-21 | 2022-12-22 | Lemon Inc. | Spectrum algorithm with trail renderer |
| CN115243087B (zh) * | 2022-07-04 | 2025-09-09 | 北京小糖科技有限责任公司 | 音视频合拍处理方法、装置、终端设备及存储介质 |
Family Cites Families (47)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5005459A (en) * | 1987-08-14 | 1991-04-09 | Yamaha Corporation | Musical tone visualizing apparatus which displays an image of an animated object in accordance with a musical performance |
| US5038658A (en) * | 1988-02-29 | 1991-08-13 | Nec Home Electronics Ltd. | Method for automatically transcribing music and apparatus therefore |
| CA2015215C (en) | 1989-06-16 | 1994-01-11 | Bradley James Beitel | Computer-based, audio/visual creation and presentation system and method |
| JPH0668168A (ja) * | 1992-08-17 | 1994-03-11 | Nippon Telegr & Teleph Corp <Ntt> | 音響キーワードによる映像検索方法および装置 |
| NZ258398A (en) * | 1992-11-16 | 1997-06-24 | Multimedia Systems Corp | Optimal transmission of multimedia entertainment information |
| JP3506410B2 (ja) * | 1997-04-23 | 2004-03-15 | 日本電信電話株式会社 | 劇的映像制作支援方法および装置 |
| US5898119A (en) * | 1997-06-02 | 1999-04-27 | Mitac, Inc. | Method and apparatus for generating musical accompaniment signals, and method and device for generating a video output in a musical accompaniment apparatus |
| US6052657A (en) * | 1997-09-09 | 2000-04-18 | Dragon Systems, Inc. | Text segmentation and identification of topic using language models |
| US5913259A (en) * | 1997-09-23 | 1999-06-15 | Carnegie Mellon University | System and method for stochastic score following |
| US6504089B1 (en) * | 1997-12-24 | 2003-01-07 | Canon Kabushiki Kaisha | System for and method of searching music data, and recording medium for use therewith |
| US6067126A (en) * | 1998-01-05 | 2000-05-23 | Intel Corporation | Method and apparatus for editing a video recording with audio selections |
| US6201176B1 (en) * | 1998-05-07 | 2001-03-13 | Canon Kabushiki Kaisha | System and method for querying a music database |
| US6714909B1 (en) * | 1998-08-13 | 2004-03-30 | At&T Corp. | System and method for automated multimedia content indexing and retrieval |
| AUPP624698A0 (en) * | 1998-09-29 | 1998-10-22 | Canon Kabushiki Kaisha | Method and apparatus for multimedia editing |
| JP3434223B2 (ja) * | 1998-11-19 | 2003-08-04 | 日本電信電話株式会社 | 音楽情報検索装置,音楽情報蓄積装置,音楽情報検索方法,音楽情報蓄積方法およびそれらのプログラムを記録した記録媒体 |
| JP3252282B2 (ja) * | 1998-12-17 | 2002-02-04 | 松下電器産業株式会社 | シーンを検索する方法及びその装置 |
| JP2000221988A (ja) * | 1999-01-29 | 2000-08-11 | Sony Corp | データ処理装置、データ処理方法、プログラム提供媒体及び記録媒体 |
| US6434520B1 (en) * | 1999-04-16 | 2002-08-13 | International Business Machines Corporation | System and method for indexing and querying audio archives |
| JP2000305578A (ja) * | 1999-04-26 | 2000-11-02 | Nippon Telegr & Teleph Corp <Ntt> | 音楽データベース作成装置、作成方法およびそのプログラム記録媒体 |
| KR100853951B1 (ko) * | 1999-05-19 | 2008-08-25 | 디지맥 코포레이션 | 오디오를 처리하는 방법들 및 장치들 |
| US6321200B1 (en) * | 1999-07-02 | 2001-11-20 | Mitsubish Electric Research Laboratories, Inc | Method for extracting features from a mixture of signals |
| GB9918611D0 (en) * | 1999-08-07 | 1999-10-13 | Sibelius Software Ltd | Music database searching |
| US6355869B1 (en) * | 1999-08-19 | 2002-03-12 | Duane Mitton | Method and system for creating musical scores from musical recordings |
| JP4491700B2 (ja) * | 1999-08-26 | 2010-06-30 | ソニー株式会社 | 音響検索処理方法、音響情報検索装置、音響情報蓄積方法、音響情報蓄積装置および音響映像検索処理方法、音響映像情報検索装置、音響映像情報蓄積方法、音響映像情報蓄積装置 |
| AU7329400A (en) | 1999-09-03 | 2001-04-10 | Benson, Iritte | Method and system for music video generation |
| JP2001118689A (ja) * | 1999-10-15 | 2001-04-27 | Matsushita Electric Ind Co Ltd | 照明制御方法 |
| US7022905B1 (en) * | 1999-10-18 | 2006-04-04 | Microsoft Corporation | Classification of information and use of classifications in searching and retrieval of information |
| JP4438144B2 (ja) * | 1999-11-11 | 2010-03-24 | ソニー株式会社 | 信号分類方法及び装置、記述子生成方法及び装置、信号検索方法及び装置 |
| JP3757719B2 (ja) * | 1999-11-19 | 2006-03-22 | 松下電器産業株式会社 | 音響データ分析方法及びその装置 |
| US6678680B1 (en) * | 2000-01-06 | 2004-01-13 | Mark Woo | Music search engine |
| KR100694028B1 (ko) * | 2000-01-25 | 2007-03-12 | 삼성전자주식회사 | 멀티미디어 파일 작성용 저작장치 및 방법 |
| US6308154B1 (en) * | 2000-04-13 | 2001-10-23 | Rockwell Electronic Commerce Corp. | Method of natural language communication using a mark-up language |
| ATE539593T1 (de) * | 2000-06-21 | 2012-01-15 | Philips Solid State Lighting | Verfahren und vorrichtung zum steuern eines beleuchtungssystems in abhängigkeit einer audioeingabe |
| US7065416B2 (en) * | 2001-08-29 | 2006-06-20 | Microsoft Corporation | System and methods for providing automatic classification of media entities according to melodic movement properties |
| GB0023930D0 (en) * | 2000-09-29 | 2000-11-15 | Canon Kk | Database annotation and retrieval |
| JP2002117407A (ja) * | 2000-10-10 | 2002-04-19 | Satake Corp | 動画像検索方法及びその装置 |
| US6778226B1 (en) * | 2000-10-11 | 2004-08-17 | Koninklijke Philips Electronics N.V. | Device cabinet with dynamically controlled appearance |
| JP2002215195A (ja) * | 2000-11-06 | 2002-07-31 | Matsushita Electric Ind Co Ltd | 音楽信号処理装置 |
| DE10164686B4 (de) * | 2001-01-13 | 2007-05-31 | Native Instruments Software Synthesis Gmbh | Automatische Erkennung und Anpassung von Tempo und Phase von Musikstücken und darauf aufbauender interaktiver Musik-Abspieler |
| US8949878B2 (en) * | 2001-03-30 | 2015-02-03 | Funai Electric Co., Ltd. | System for parental control in video programs based on multimedia content information |
| US7039585B2 (en) * | 2001-04-10 | 2006-05-02 | International Business Machines Corporation | Method and system for searching recorded speech and retrieving relevant segments |
| GB0111431D0 (en) | 2001-05-11 | 2001-07-04 | Koninkl Philips Electronics Nv | A real-world representation system and language |
| JP2002341888A (ja) * | 2001-05-18 | 2002-11-29 | Pioneer Electronic Corp | ビート密度検出装置と情報再生装置 |
| US6740803B2 (en) * | 2001-11-21 | 2004-05-25 | Line 6, Inc | Computing device to allow for the selection and display of a multimedia presentation of an audio file and to allow a user to play a musical instrument in conjunction with the multimedia presentation |
| US20030107592A1 (en) * | 2001-12-11 | 2003-06-12 | Koninklijke Philips Electronics N.V. | System and method for retrieving information related to persons in video programs |
| US6967275B2 (en) * | 2002-06-25 | 2005-11-22 | Irobot Corporation | Song-matching system and method |
| JP4313563B2 (ja) * | 2002-12-04 | 2009-08-12 | パイオニア株式会社 | 楽曲検索装置及び方法 |
-
2002
- 2002-12-24 GB GBGB0230097.8A patent/GB0230097D0/en not_active Ceased
-
2003
- 2003-09-03 GB GBGB0320578.8A patent/GB0320578D0/en not_active Ceased
- 2003-12-10 AU AU2003285635A patent/AU2003285635A1/en not_active Abandoned
- 2003-12-10 ES ES03778627T patent/ES2305539T3/es not_active Expired - Lifetime
- 2003-12-10 DE DE60321044T patent/DE60321044D1/de not_active Expired - Lifetime
- 2003-12-10 CN CNB2003801074572A patent/CN100438633C/zh not_active Expired - Fee Related
- 2003-12-10 AT AT03778627T patent/ATE395789T1/de not_active IP Right Cessation
- 2003-12-10 US US10/540,315 patent/US8433575B2/en not_active Expired - Fee Related
- 2003-12-10 JP JP2004563455A patent/JP2006512820A/ja active Pending
- 2003-12-10 WO PCT/IB2003/005967 patent/WO2004059986A1/en not_active Ceased
- 2003-12-10 CN CNB2003801074093A patent/CN100559460C/zh not_active Expired - Fee Related
- 2003-12-10 RU RU2005123387/09A patent/RU2322654C2/ru not_active IP Right Cessation
- 2003-12-10 BR BR0317713-0A patent/BR0317713A/pt not_active IP Right Cessation
- 2003-12-10 EP EP03778627A patent/EP1579698B1/en not_active Expired - Lifetime
- 2003-12-10 KR KR1020057012029A patent/KR20050086942A/ko not_active Withdrawn
- 2003-12-10 JP JP2005509727A patent/JP4871592B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| DE60321044D1 (de) | 2008-06-26 |
| GB0320578D0 (en) | 2003-10-01 |
| JP2006512625A (ja) | 2006-04-13 |
| RU2322654C2 (ru) | 2008-04-20 |
| CN100438633C (zh) | 2008-11-26 |
| ATE395789T1 (de) | 2008-05-15 |
| CN1732510A (zh) | 2006-02-08 |
| US20060085182A1 (en) | 2006-04-20 |
| JP4871592B2 (ja) | 2012-02-08 |
| GB0230097D0 (en) | 2003-01-29 |
| CN1732692A (zh) | 2006-02-08 |
| AU2003285635A1 (en) | 2004-07-22 |
| US8433575B2 (en) | 2013-04-30 |
| JP2006512820A (ja) | 2006-04-13 |
| EP1579698B1 (en) | 2008-05-14 |
| KR20050086942A (ko) | 2005-08-30 |
| WO2004059986A1 (en) | 2004-07-15 |
| BR0317713A (pt) | 2005-11-22 |
| EP1579698A1 (en) | 2005-09-28 |
| RU2005123387A (ru) | 2006-03-20 |
| CN100559460C (zh) | 2009-11-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2305539T3 (es) | Metodo y sistema para aumentar una señal de audio. | |
| CN112530470B (zh) | 媒体内容增强系统,以及组成媒体产品的方法 | |
| CN110603537B (zh) | 增强的内容跟踪系统和方法 | |
| US8542982B2 (en) | Image/video data editing apparatus and method for generating image or video soundtracks | |
| US9753925B2 (en) | Systems, methods, and apparatus for generating an audio-visual presentation using characteristics of audio, visual and symbolic media objects | |
| JP5457676B2 (ja) | デジタル画像の内容特徴およびメタデータを使って関係したオーディオ随伴物をみつけるシステムおよび方法 | |
| ES2779994T3 (es) | Determinación de un conjunto de parámetros ambientales | |
| US20110161348A1 (en) | System and Method for Automatically Creating a Media Compilation | |
| JP4243862B2 (ja) | コンテンツ利用装置およびコンテンツ利用方法 | |
| KR20080043129A (ko) | 음악의 무드를 이용한 사진 추천 방법 및 그 시스템 | |
| CN110495180A (zh) | 生成用于伴随音频的视频呈现 | |
| CN111666445A (zh) | 一种情景歌词的显示方法、装置及音箱设备 | |
| CN111625685A (zh) | 音乐电台呈现方法与装置、视频数据分类方法与装置 | |
| JP2006127574A (ja) | コンテンツ利用装置、コンテンツ利用方法、配信サーバー装置、情報配信方法および記録媒体 | |
| CN101094469A (zh) | 移动终端提示信息的生成方法和装置 | |
| CN102447785A (zh) | 移动终端提示信息的生成方法和装置 | |
| CN117726716A (zh) | 一种多媒体数据处理方法、装置、电子设备及存储介质 | |
| JP2008299411A (ja) | マルチメディア再生機器 | |
| US20060016321A1 (en) | Apparatus and method for controlling sounds and images | |
| JP2023162958A (ja) | カラオケ装置 | |
| JP2001331187A (ja) | カラオケ装置 | |
| Falconer | Reviews: Exhibitions-Christian Marclay |