ES2330864T3 - Aparato de generacion de flujo de imagenes en movimiento, aparado de codificacion de imagenes en movimiento, aparato de multiplexado de imagenes en movimiento y aparato de descodificacion de imagenes en movimiento. - Google Patents
Aparato de generacion de flujo de imagenes en movimiento, aparado de codificacion de imagenes en movimiento, aparato de multiplexado de imagenes en movimiento y aparato de descodificacion de imagenes en movimiento. Download PDFInfo
- Publication number
- ES2330864T3 ES2330864T3 ES05736693T ES05736693T ES2330864T3 ES 2330864 T3 ES2330864 T3 ES 2330864T3 ES 05736693 T ES05736693 T ES 05736693T ES 05736693 T ES05736693 T ES 05736693T ES 2330864 T3 ES2330864 T3 ES 2330864T3
- Authority
- ES
- Spain
- Prior art keywords
- images
- image
- information
- unit
- aus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000033001 locomotion Effects 0.000 title claims description 97
- 239000012634 fragment Substances 0.000 claims abstract description 19
- 238000003860 storage Methods 0.000 claims abstract description 17
- 238000000034 method Methods 0.000 claims description 77
- 238000004458 analytical method Methods 0.000 claims description 7
- 238000007726 management method Methods 0.000 description 63
- 238000010586 diagram Methods 0.000 description 56
- 238000012545 processing Methods 0.000 description 28
- 208000031509 superficial epidermolytic ichthyosis Diseases 0.000 description 26
- 230000002441 reversible effect Effects 0.000 description 21
- 239000013598 vector Substances 0.000 description 17
- 230000006835 compression Effects 0.000 description 15
- 238000007906 compression Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 14
- 230000003287 optical effect Effects 0.000 description 11
- 230000010365 information processing Effects 0.000 description 10
- 238000011002 quantification Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 238000013139 quantization Methods 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000011049 filling Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000001094 photothermal spectroscopy Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 210000002747 omentum Anatomy 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/804—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
- H04N9/8042—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/005—Reproducing at a different information rate from the information rate of recording
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/426—Internal components of the client ; Characteristics thereof
- H04N21/42646—Internal components of the client ; Characteristics thereof for reading from or writing on a non-volatile solid state storage medium, e.g. DVD, CD-ROM
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/432—Content retrieval operation from a local storage medium, e.g. hard-disk
- H04N21/4325—Content retrieval operation from a local storage medium, e.g. hard-disk by playing back content from the storage medium
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/433—Content storage operation, e.g. storage operation in response to a pause request, caching operations
- H04N21/4332—Content storage operation, e.g. storage operation in response to a pause request, caching operations by placing content in organized collections, e.g. local EPG data repository
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/433—Content storage operation, e.g. storage operation in response to a pause request, caching operations
- H04N21/4334—Recording operations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44008—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8451—Structuring of content, e.g. decomposing content into time segments using Advanced Video Coding [AVC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/85406—Content authoring involving a specific file format, e.g. MP4 format
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/78—Television signal recording using magnetic recording
- H04N5/782—Television signal recording using magnetic recording on tape
- H04N5/783—Adaptations for reproducing at a rate different from the recording rate
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/804—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/20—Disc-shaped record carriers
- G11B2220/25—Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
- G11B2220/2537—Optical discs
- G11B2220/2541—Blu-ray discs; Blue laser DVR discs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/84—Television signal recording using optical recording
- H04N5/85—Television signal recording using optical recording on discs or drums
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/804—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
- H04N9/806—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal
- H04N9/8063—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal using time division multiplex of the PCM audio and PCM video signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/82—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
- H04N9/8205—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/82—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
- H04N9/8205—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
- H04N9/8227—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being at least another television signal
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Television Signal Processing For Recording (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Un aparato de generación de flujo de imágenes en movimiento para generar un flujo que incluye imágenes que tienen al menos una unidad de almacenamiento de información suplementaria y una unidad de almacenamiento de información de píxeles, comprendiendo dicho aparato: una unidad de información suplementaria utilizable para generar información suplementaria en cuanto a todas las imágenes incluidas en cada una de las unidades de acceso aleatorio en la cual se coloca una imagen intracodificada descodificable sin depender de otra imagen en una parte superior en el orden de descodificación, incluyendo la información suplementaria diversos fragmentos de información de tipo de imagen que indica tipos de todas las imágenes incluidas en la unidad de acceso aleatorio, estando colocados los diversos fragmentos de información de tipo de imagen en el orden de descodificación de las imágenes como información de identificación para identificar las imágenes a descodificar cuando las imágenes se reproducen trucadas, y una unidad de generación de flujo utilizable para generar el flujo almacenando la información suplementaria en la unidad de almacenamiento de información suplementaria de la imagen colocada en la parte superior de una unidad de acceso aleatorio correspondiente.
Description
Aparato de generación de flujo de imágenes en
movimiento, aparato de codificación de imágenes en movimiento,
aparato de multiplexado de imágenes en movimiento y aparato de
descodificación de imágenes en movimiento.
La presente invención se refiere a un aparato y
similar que genera un flujo de imágenes en movimiento codificadas,
especialmente a un aparato y similar que genera un flujo sobre el
cual se puede llevar a cabo una reproducción trucada tal como
reproducción a saltos, reproducción a velocidad variable,
reproducción inversa y similar.
\vskip1.000000\baselineskip
Recientemente, ha llegado la era multimedia en
la cual el sonido, las imágenes y otros valores de píxeles se
integran en un medio, los medios de información convencional como
herramientas de la comunicación como periódicos, revistas,
Televisión, radio y teléfono se consideran como objetivos
multimedia. Generalmente, la multimedia es una forma de
representación simultánea no solamente de caracteres sino también de
gráficos, sonido y especialmente imágenes. Con el fin de manejar
los medios de información convencionales anteriormente descritos
como la multimedia, es un requisito para representar la información
digitalmente.
Sin embargo, no es realista procesar
directamente una gran cantidad de información de manera digital
usando los medios de información convencionales anteriormente
descritos porque, cuando se calcula la cantidad de datos de cada
medio de información descrito anteriormente como cantidad de datos
digitales, la cantidad de datos por carácter es de 1 a 2 bytes
mientras que la de sonido por segundo no es inferior a 65 kbits
(calidad vocal telefónica) y la de las imágenes en movimiento por
segundo no es inferior a 100 Mbits (actual calidad de recepción de
televisión). Por ejemplo, ya es prácticamente disponible un
teléfono con televisión gracias a la Red Digital de Servicios
Integrados (ISDN) con una velocidad de transmisión de 64 kbps a 1,5
Mbps, pero es imposible transmitir imágenes de cámara de televisión
cuando se usa ISDN.
Por este motivo es necesaria la técnica de
compresión de la información. Por ejemplo, una norma de técnica de
compresión de imágenes en movimiento de H. 261 o H. 263 recomendadas
por la Unión Internacional de las
Telecomunicaciones-Sector de Normalización de las
Telecomunicaciones (ITU-T) se usa para los teléfonos
con televisión. Igualmente, con la técnica de compresión de la
información de la norma MPEG-1, es posible almacenar
información de imágenes, junto con información de sonido, en un CD
(disco compacto) normal para música.
Aquí, el Grupo de Expertos en Imágenes en
Movimiento (MPEG) es una norma internacional para comprimir
digitalmente señales de imágenes en movimiento, y ha sido
normalizado por la ISO/IEC. MPEG-1 es la norma para
comprimir señales de imágenes en movimiento a 1,5 MBPs, es decir,
para comprimir información de señal de televisión a aproximadamente
una centésima. Igualmente, la calidad que satisface la norma
MPEG-1 es el nivel medio que se puede realizar a
una velocidad de transmisión de aproximadamente 1,5 Mbps. De este
modo MPEG-2 se normaliza para satisfacer la
necesidad de una mayor calidad de imagen, y comprime las señales de
imágenes en movimiento de 2 a 15 Mbps. Actualmente, el grupo de
trabajo (ISO/IEC JTC1/SC29/WG11), que normaliza
MPEG-1 y MPEG-2, ha normalizado
MPEG-4 con una mayor velocidad de compresión. La
norma MPEG-4 (i) consigue una velocidad de
compresión superior a la norma MPEG-1 y la norma
MPEG-2, (ii) permite codificar, descodificar y
realizar operaciones sobre una base de
objeto-por-objeto, y (iii) realiza
nuevas funciones necesarias en esta era multimedia. El objeto
inicial de la norma MPEG-4 es normalizar un
procedimiento de codificación de imágenes con bajas velocidades
binarias, pero el objeto se extiende a un procedimiento de
codificación de propósito general de imágenes entrelazadas con
velocidades binarias elevadas. Después de esto, ISO/IEC y ITU/T, en
combinación, han normalizado las AVC MPEG-4
(codificación de vídeo avanzada) como un procedimiento de
codificación de imágenes de siguiente generación de imágenes con
una velocidad de compresión elevada. Se espera que se use para los
aparatos relacionados con los discos ópticos de siguiente
generación o en la radiodifusión para terminales móviles.
Generalmente, en la codificación de las imágenes
móviles, la cantidad de información se comprime reduciendo las
redundancias temporales y espaciales. En la codificación de
predicción interimágenes dirigida a reducir las redundancias
temporales, la generación de imágenes de predicción y estimación de
movimiento se lleva a cabo sobre una base de bloque por bloque con
referencia a una imagen anterior o una imagen posterior, y la
codificación se lleva a cabo sobre el valor diferencial entre la
imagen de predicción obtenida y la imagen a codificar. En esta
memoria, el término "Imagen" usado es un término que representa
una imagen. En una imagen progresiva, una imagen significa una
trama, pero en una imagen entrelazada, significa una trama o un
campo. Aquí el término "imagen entrelazada" describe una trama
compuesta por dos campos con un ligero tiempo diferido.
En los procedimientos de codificación y
descodificación de imágenes entrelazadas, en realidad es posible
procesar una trama, como dos campos, o sobre una trama por trama o
sobre un campo por campo de cada bloque en una trama.
La imagen para llevar a cabo la codificación
intrapredicción sin hacer referencia a ninguna imagen de referencia
se denomina Imagen Intracodificada (imagen I). Igualmente, la imagen
para llevar a cabo la codificación interpredicción que se refiere a
solamente una imagen se denomina Imagen predictiva codificada
(imagen P). Igualmente, la imagen para llevar a cabo la
codificación interpredicción que se refiere a dos imágenes de
referencia simultáneamente se denomina Imagen codificada
Bipredictiva (imagen B). Una imagen B se puede refiere a dos
imágenes seleccionadas como una combinación arbitraria de una
imagen anterior y una imagen posterior en la indicación. Tales dos
imágenes de referencia se pueden especificar sobre una base de
bloque por bloque, siendo el bloque una unidad básica de
codificación y descodificación. Estas imágenes de referencia se
distinguen las unas de las otras como sigue: la imagen de
referencia descrita anteriormente en el flujo binario codificado se
denomina primera imagen de referencia, y la otra imagen de
referencia se denomina más tarde segunda imagen de referencia.
Obsérvese que tales imágenes de referencia se deben haber sido
codificadas o descodificadas anteriormente para codificar o
descodificar imágenes P e imágenes B.
La codificación interpredicción de compensación
de movimiento se usa para codificar imágenes P e imágenes B. La
codificación intrapredicción de compensación de movimiento es un
procedimiento de codificación intrapredicción en el cual se aplica
la compensación de movimiento. La compensación de movimiento es un
procedimiento para mejorar una precisión de predicción y reducir la
cantidad de datos evaluando la cantidad de movimiento (en lo
sucesivo denominada vector de movimiento) de cada bloque de una
imagen y llevando a cabo la codificación de predicción que
considera el vector de movimiento. Por ejemplo, la cantidad de datos
se reduce evaluando los vectores de movimiento de las imágenes a
codificar y codificando cada resto de predicción entre cada valor
de predicción que se desplaza mediante la cantidad de cada vector de
movimiento y cada imagen actual a codificar. En el caso de este
procedimiento, puesto que la información de vector de movimiento es
necesaria en la descodificación, los vectores de movimiento también
se codifican y graban o se transmiten.
Los vectores de movimiento se evalúan sobre una
base de bloque de macros por bloque de macros. Más específicamente,
se evalúan los vectores de movimiento fijando el bloque de macros de
una imagen a codificar, moviendo el bloque de macros de una imagen
de referencia dentro del intervalo de búsqueda, y encontrando la
situación del bloque de referencia que es más cercano al bloque
estándar.
Las figuras 1A y 1B son diagramas estructurales
de flujos MPEG-2 convencionales respectivamente.
Como se muestra en la figura 1B, un flujo MPEG-2
tiene una estructura jerárquica como se describirá en lo sucesivo.
Un flujo se compone de un Grupo de Imágenes (denominado GOP en lo
sucesivo). El uso de un GOP como unidad básica en el procesamiento
de codificación permite editar una imagen en movimiento o llevar a
cabo un acceso aleatorio. Un GOP se constituye de imágenes I,
imágenes P e imágenes B. Un flujo, un GOP y una imagen incluyen
además, una señal síncrona (sync) que indica un borde de unidades y
un encabezamiento que indica los datos comunes en las unidades,
las unidades son aquí un flujo, un GOP y una imagen
respectivamente.
Las figuras 2A y 2B muestran respectivamente
ejemplos que indican la manera de llevar a cabo la codificación de
predicción interimagen que se usa en MPEG-2. Las
imágenes diagonalmente sombradas en la figura son las imágenes a
las que han de referirse otras imágenes. Como se muestra en la
figura 2A, en la codificación de predicción en
MPEG-2, las imágenes P (P0, P6, P9, P12 y P15) se
pueden referir a solamente una única imagen seleccionada como una
imagen I inmediatamente posterior o imagen P en el tiempo de
visualización. Igualmente, la imágenes B (B1, B2, B4, B5, B7, B8,
B10, B11, B13, B14, B16, B17, B19 y B20) se pueden referir a dos
imágenes seleccionadas como una combinación de una imagen I o
imagen P inmediatamente anterior y una imagen I o imagen P
inmediatamente anterior. Además, el orden de las imágenes a colocar
en un flujo es determinado. Las imágenes I y una imagen P se
colocan en el orden de del tiempo de visualización, y cada imagen B
se coloca inmediatamente después de una imagen I a visualizar
inmediatamente después de la imagen B o inmediatamente después de
una imagen P. Como ejemplo estructural de un GOP, como se muestra
en la figura 2B, las imágenes de I3 a B14 se agrupan en un solo
GOP.
La figura 3A es un diagrama estructural de un
flujo MPEG-4 AVC. No hay ningún concepto equivalente
a un GOP en el MPEG-4 AVC. Sin embargo, ya que es
posible construir una unidad accesible aleatoriamente equivalente a
un GOP segmentando los datos sobre la base de una imagen especial
que se puede descodificar sin depender de otras imágenes, la unidad
se denominará en lo sucesivo RAU (Unidad de Acceso Aleatorio). Dicho
de otro modo, una unidad de acceso aleatorio RAU es un grupo de
imágenes codificadas que empieza con una imagen intracodificada que
se puede descodificar sin depender de ninguna imagen.
A continuación, se describirá la unidad de
acceso que es una unidad básica en el manejo de un flujo
(denominado simplemente en lo sucesivo AU). Una AU es la unidad
para almacenar datos codificados equivalentes a una imagen, e
incluye un conjunto de parámetros PS, datos de segmentos y
similares. Hay dos tipos de conjuntos de parámetros PSs. Uno de
ellos es un conjunto de parámetros de imágenes PPs (denominados en
lo sucesivo simplemente PPS) que son datos equivalente al
encabezamiento de cada imagen. El otro es un conjunto de parámetros
de secuencias SPS (denominado en lo sucesivo simplemente SPS) que
es equivalente al encabezamiento incluido en una unidad de un GOP o
más en MPEG-2. Un SPS incluye el número máximo de
imágenes de referencia, una dimensión de imagen y similar. Por otra
parte, un PPS incluye un tipo de codificación de longitud variable,
un valor inicial de la etapa de cuantificación, el número de
imágenes de referencia y similar. A cada imagen se le asigna un
identificador al cual se refiere el PPS y SPS anteriormente
descrito. Igualmente, un número de trama FN que es el número de
identificación para identificar una imagen incluida en datos de
segmentos. Obsérvese que una secuencia empieza con una imagen
especial en la cual todos los estados necesarios para descodificar
se reajustan como se describirá más adelante, y se constituye de un
grupo de imágenes que empiezan con una imagen especial y termina
con una imagen que se coloca inmediatamente antes de la siguiente
imagen especial.
Hay dos tipos de imágenes I en
MPEG-4 AVC. Hay un Refresco de Descodificador
Instantáneo (IDR) y el resto. Una imagen de IDR es la imagen I que
puede descodificar todas las imágenes colocadas después de la imagen
IDR en un orden de descodificación, sin referirse a las imágenes
colocadas antes de la imagen IDR en el orden de descodificación,
dicho de otro modo, es la imagen I en la cual se reajustan los
estados necesarios para la descodificación. Una imagen IDR
corresponde a la imagen I superior de un GOP cerrado
MPEG-2 Una secuencia en MPEG-4 AVC
empieza con una imagen IDR. En el caso de una imagen I que no es una
imagen IDR, una imagen colocada después de la imagen I en el orden
de descodificación se puede referir a una imagen colocada antes de
la imagen I en el orden de descodificación. Los tipos de imágenes
respectivos se definirán en lo sucesivo. Una imagen IDR y una
imagen I son las imágenes que se componen de solamente segmentos I.
Una imagen P es la imagen que se puede componer de segmentos P y
segmentos I. Una imagen B es la imagen que se puede componer de
segmentos B, segmentos P y segmentos I. Obsérvese que los segmentos
de una imagen IDR se almacenan en una unidad NAL cuyo tipo es
diferente del de la unidad NAL donde se almacenan los segmentos de
una imagen no-IDR. Aquí, la unidad NAL es una
unidad de subimagen.
En una AU en MPEG-4 AVC, no
solamente se incluyen los datos necesarios para descodificar sino
también la información suplementaria y la información límite. Tal
información suplementaria se denomina Información Potenciadora
Suplementaria (SEI) y es innecesaria para descodificar datos de
segmentos. Todos los datos tales como un conjunto de parámetros PS,
datos de segmentos, un SEI se almacenan en una unidad Capa de
Abstracción de Red (NAL), que es la NALU. Una unidad NAL se compone
de un encabezamiento y una carga útil. Un encabezamiento incluye un
capo que indica el tipo de datos a almacenar (en lo sucesivo
denominado tipo de unidad NAL). Los valores de los tipos de unidad
NAL se definen respectivamente para los tipos de datos tales como un
segmento o un SEI. En referencia a tal valor de un tipo de unidad
NAL se permite identificar el tipo de datos a almacenar en la
unidad NAL. El encabezamiento de una unidad NAL incluye un campo
denominado nal-ref-idc. Se define
que un campo nal-ref-idc es un
campo de 2 bits y adopta un valor de 0, 1 ó más dependiendo de los
tipos de unidades NAL. Por ejemplo, la unidad NAL de un SPS o un
PPS adopta 1 o más. En el caso de la unidad NAL de un segmento, una
unidad a la que se refiere por otros segmentos adopta 1 o más,
mientras que el segmento al que no se refiere adopta 0. Igualmente,
la unidad Nal de un SEI siempre toma 0.
Uno o más mensajes SEI se pueden almacenar en la
unidad Nal de un SEI. Un mensaje SEI se compone de un encabezamiento
y una carga útil, y el tipo de información a almacenar en la carga
útil se identifica mediante el tipo de un mensaje SEI indicado en
el encabezamiento. La descodificación de una AU significa la
descodificación de los datos de segmentos en una AU, y la
visualización de una AU significa la visualización del resultado de
descodificación de los datos de segmentos en la AU en lo que
sigue.
Aquí, puesto que una unidad NAL no incluye
información para identificar un límite de unidad NAL, es posible
añadir información límite a la parte superior de cada unidad NAL en
el momento de almacenar una unidad NAL como una AU. En el manejo de
un flujo MPEG-4- AVC en un Flujo de Transporte
MPEG-2 (TS) o un Flujo de Programa
MPEG-2 (PS), un prefijo de código de inicio mostrado
como 3 bytes de 0x000001 se añade a la parte superior de una unidad
NAL. Igualmente se define que una unidad NAL que indica un límite AU
se debe insertar en la parte superior de una AU en un TS o PS
MPEG-2, tal como una AT denominada Delimitador de
unidad de Acceso.
Convencionalmente, diversos tipos de técnicas
relacionados con la codificación de imágenes en movimiento con las
propuestas (por ejemplo, en referencia al documento de patente
1).
El documento de patente 1: Publicación japonesa
de Patente abierta a inspección pública nº
2003-18549.
La figura 4 es un diagrama de bloques de un
aparato convencional de codificación de imágenes en movimiento.
El aparato 1 de codificación de imágenes en
movimiento es un aparato que produce un flujo codificado Str
obtenido convirtiendo, a través de la codificación por compresión,
una señal de vídeo de entrada Vin a introducir en un flujo binario
de un flujo codificado de longitud variable o similar. El aparato de
codificación de imágenes en movimiento incluye una unidad de
determinación de estructura de predicción PTYPe, una unidad de
estimación de vector de movimiento ME, una unidad de compensación
de movimiento MC, una unidad de sustracción Sub, una unidad de
transformada ortogonal T, una unidad de cuantificación Q, una unidad
de cuantificación inversa IQ, una unidad de transformada ortogonal
inversa IT, una unidad de adición Add, una memoria de imagen PicMem,
un conmutador y una unidad de codificación de longitud variable
VLC.
La señal de vídeo de entrada Vin se introduce en
la unidad de sustracción Sub y la unidad de estimación de vector de
movimiento ME. La unidad de sustracción Sub calcula el valor
diferencial entre la señal de vídeo de entrada introducida Vin y la
imagen de predicción, y la envía a la unidad de transformada
ortogonal. La unidad de transformada ortogonal T convierte el valor
diferencial en un coeficiente de frecuencias, y lo envía a la
unidad de cuantificación Q. La unidad de cuantificación Q lleva a
cabo la cuantificación sobre el coeficiente de frecuencia
introducido, y envía un valor de cuantificación Qcoef a la unidad de
codificación de longitud variable.
La unidad de cuantificación inversa IQ realiza
la cuantificación inversa sobre el valor de cuantificación Qcoef
para reconstruir el coeficiente de frecuencia, y lo envía a la
unidad de transformada ortogonal inversa IT. La unidad de
transformada ortogonal inversa IT lleva a cabo la transformada de
frecuencia inversa para transformar el coeficiente de frecuencia en
un valor diferencia de píxeles, y lo envía a la unidad de adición
Add. La unidad de adición Add añade el valor diferencia de píxeles a
la imagen de predicción a enviar desde la unidad de compensación de
movimiento MC para realizar una imagen descodificada. El conmutador
SW se enciende ON cuando se instruye el almacenamiento de la imagen
descodificada, y la imagen descodificada se almacena en la memoria
de imagen PicMem.
Por otra parte, la unidad de estimación de
vector de movimiento Me, en la cual se introduce una señal de vídeo
de entrada Vin sobre una base de bloque de macros por bloque de
macros, busca la imagen descodificada almacenada en la memoria de
imagen PicMem, y estima el área de imagen que es más cercano a la
señal de imagen de entrada, y en consecuencia determina el vector
de movimiento MV que indica la posición. La estimación de vector de
movimiento se lleva a cabo sobre una base de bloque por bloque,
siendo el bloque una parte segmentada de un bloque de macros.
Puesto que se pueden usar diversas imágenes como imágenes de
referencia en este omento, los números de identificación para
especificar imágenes a los cuales referirse (índices relativos) son
necesarios sobre una base de bloque por bloque. Es posible
especificar imágenes de referencia calculando los números de imagen
indicados por los índices relativos, siendo tales números de imagen
asignados a las imágenes respectivas en una memoria de imagen
PicMem.
La unidad de compensación de movimiento MC
selecciona el área de imagen que es óptima como imagen de predicción
a partir de las imágenes descodificadas almacenadas en la memoria
de imagen PicMem.
La unidad de determinación de estructura de
predicción PTYPe instruye la unidad de estimación de vector de
movimiento ME y la unidad de compensación de movimiento MC para
llevar a cabo la codificación intraimagen sobre la imagen objetivo
como imagen especial accesible aleatoriamente usando su tipo de
imagen Ptype, en el caso en que una imagen de inicio de unidad de
acceso aleatorio RAU indica que la unidad de acceso aleatorio RAU
empieza con la imagen actual, e instruye a la unidad de codificación
de longitud variable VLC para codificar el tipo de imagen
Ptype.
La unidad de codificación de longitud variable
VLC lleva a cabo la codificación de longitud variable sobre el
valor de cuantificación Qcoef, el índice relativo Index, el tipo de
imagen Ptype y el vector de movimiento MV para realizar el flujo
codificado Str.
La figura 5 es un diagrama de bloques de un
aparato 2 convencional de descodificación de imágenes en movimiento.
Este aparato 2 de descodificación de imágenes en movimiento
incluye una unidad de descodificación de longitud variable VLD, una
memoria de imagen PicMem, una unidad de compensación de movimiento
MC, una unidad de adición Add, una unidad de transformada ortogonal
inversa IT y una unidad de cuantificación inversa IQ. Obsérvese
que, en la figura, estas unidades de procesamiento que realizan las
mismas operaciones que las unidades de procesamiento en un aparato
convencional de codificación de imágenes en movimiento mostradas en
el diagrama de bloques de la figura 4 se les asigna los mismos
números de referencia, y se omiten las descripciones acerca de las
mismas.
La unidad de descodificación de longitud
variable VLD descodifica un flujo codificado Str, y envía el valor
de cuantificación Qcoef, el índice relativo Index, el tipo de imagen
Ptype y el vector de movimiento MV. El valor de cuantificación
Qcoef, el índice relativo Index y el vector de movimiento MV se
introducen en la memoria de imagen PicMem, la unidad de
compensación de movimiento MC y la unidad de cuantificación inversa
IQ respectivamente, y a continuación se lleva a cabo el
procesamiento de descodificación sobre los mismos. Tales
operaciones de un aparato convencional de codificación de imágenes
en movimiento ya se han descrito usando el diagrama de bloques de
la figura 4.
Una unidad de acceso aleatorio RAU muestra que
la descodificación se puede llevar a cabo empezando con la AU
superior en la unidad de acceso aleatorio. Sin embargo, puesto que
un flujo convencional MPEG-4 AVC permite
estructuras de predicción muy flexibles, un aparato de
almacenamiento con un disco óptico o un disco duro no puede obtener
información para determinar las Aus a descodificar o visualizar en
el momento de la reproducción a velocidad variable o reproducción
inversa.
La figura 6A y 6B son ejemplos de las
estructuras de predicción de Aus. Aquí, se almacena una imagen en
cada AU. La figura 6A es la estructura de predicción de AUs usada
en un flujo MPEG-2. Las figuras sombreadas
diagonalmente en la figura son imágenes a referir por otras Aus. En
el MPEG-2 las Aus de las imágenes P (P4 y P7) pueden
llevar a cabo la codificación de predicción refiriéndose solamente
a una única AU seleccionada como la AU de una imagen I o imagen P
inmediatamente posterior en el tiempo de visualización. Igualmente,
las Aus de las imágenes B (B1, B2, B3, B5 y B6) pueden llevar a
cabo la codificación de predicción refiriéndose a dos Aus
seleccionadas como una combinación de Aus de una imagen I o imagen P
inmediatamente posterior y una imagen I o imagen P inmediatamente
anterior en el tiempo de visualización. Además, el orden de las
imágenes a colocar en un flujo se predetermina como sigue: las Aus
de una imagen I o imágenes P se colocan en el orden del tiempo de
visualización; y cada una de las Aus de imágenes B se coloca
inmediatamente después de las Aus de la imagen i o una de las
imágenes P que se coloca inmediatamente después del AU de cada
imagen B. En consecuencia, la descodificación se puede llevar a
cabo de las tres siguientes maneras: (1) todas las imágenes se
descodifican; (2) solamente las Aus de una imagen I e imágenes P se
descodifican y visualizan; y (3) solamente la AU de una imagen I se
descodifica y visualiza. Por lo tanto, los tres siguientes tipos de
reproducción se pueden llevar a cabo fácilmente usando: (1)
reproducción normal, (2) reproducción de velocidad media, y (3)
reproducción a alta velocidad.
En el MPEG-4 AVC, se puede
llevar a cabo la predicción donde la AU de una imagen B se refiere a
la AU de una imagen B. La figura 6B es un ejemplo de estructura de
predicción en un flujo MPEG-4 AVC, y las AUs de
imágenes B (B1 y B3) se refieren a la AU (B2) de la imagen B. En
este ejemplo, se pueden llevar a cabo los cuatro siguientes tipos
de descodificación o visualización: (1) todas las imágenes se
descodifican; (2) solamente las Aus, de una imagen I, imágenes P e
imágenes B, a las que se refieren se descodifican y visualizan; (3)
solamente las Aus de una imagen I, y las imágenes P son
descodificadas y visualizadas; (4) solamente la AU de una imagen I
se descodifica y visualiza.
Además, en el MPEG-4 AVC, la AU
de una imagen P se puede referir a la AU de una imagen B. Como se
muestra en la figura 7, la AU de una imagen P (P7) se puede referir
a la AU de una imagen B (B2). En este caso, la AU de una imagen P
(P7) se puede descodificar solamente después de que se haya
descodificado la AU de una imagen B (B2). Por lo tanto, los tres
siguientes tipos de descodificación visualización se pueden llevar
a cabo: (1) todas las imágenes se descodifican; (2) solamente las
Aus, de una imagen I, imágenes P e imágenes B, a las que se refiere
se descodifican y visualizan; (3) solamente la AU de una imagen I se
codifica y visualiza.
De esta manera, puesto que se permiten diversas
estructuras de predicción en el MPEG-4 AVC, se debe
realizar el análisis de los datos de segmentos y la evaluación de
la estructura de la predicción para conocer la relación de
referencia entre la Aus. Esto conlleva un problema, el hecho de que
las Aus a descodificar o visualizar no se pueden determinar
basándose en una regla que se predetermina dependiendo de una
velocidad de reproducción en el momento de llevar a cabo la
reproducción a saltos, reproducción a velocidad variable y
reproducción inversa, a diferencia del caso del
MPEG-2. D1 revela un aparato de generación de flujo
de imágenes en movimiento en el cual en la formación de tramas I y
P, requeridas para modos de reproducciones trucada, se graba en un
sector de entrada formado en la parte superior de cada Gop.
\vskip1.000000\baselineskip
Un objeto de la presente invención es
proporcionar (i) un aparato y un procedimiento de generación de
flujo de imágenes en movimiento que generan un flujo de imagen en
movimiento que pueden llevar a cabo una reproducción trucada tal
como reproducción a saltos, reproducción a velocidad variable y
reproducción inversa incluso en el caso de un procedimiento de
codificación como el MPEG-4 AVC que permite
estructuras de predicción flexibles, y (ii) un aparato de
descodificación de imágenes en movimiento y similar que descodifica
tal flujo de imagen en movimiento.
La invención es un aparato de generación de
flujo en movimiento según la reivindicación 1, un procedimiento de
generación de flujo en movimiento según la reivindicación 2, un
aparto de descodificación de imágenes en movimiento según la
reivindicación 3, un procedimiento de descodificación de imágenes en
movimiento según la reivindicación 4, un soporte de grabación
legible por ordenador según la reivindicación 5, un procedimiento
de grabación según la reivindicación 6 y un sistema de
descodificación de imágenes en movimiento según la reivindicación
7.
Como se describe en este punto, con la presente
invención, se pueden determinar las Aus a descodificar en el tiempo
de la reproducción trucada tal como reproducción a velocidad
variable y reproducción inversa refiriéndose a una unidad
específica NAL en la AU superior de una unidad de acceso aleatorio
RAU. Por lo tanto, se puede realizar fácilmente un aparato de
descodificación de imágenes en movimiento con una función excelente
de reproducción trucada, y de este modo la presente invención es
altamente práctica.
\vskip1.000000\baselineskip
Estos y otros objetos, ventajas y
características de la invención irán apareciendo a partir de su
descripción conjuntamente con los dibujos anexos que ilustran una
realización específica de la invención en los dibujos:
Las figuras 1A y 1B son diagramas que muestran
estructuras de flujo MPEG-2 respectivamente de una
técnica anterior;
Las figuras 2A y 2B son diagramas que muestran
estructuras de flujo GOP MPEG-2 respectivamente de
una técnica anterior;
Las figuras 3A y 3B son diagramas que muestran
estructuras de flujo MPEG-4 respectivamente de una
técnica anterior;
La figura 4 es un diagrama de bloques que
muestran la estructura de un aparato de codificación
convencional;
La figura 5 es un diagrama de bloques que
muestran la estructura de un aparato de descodificación
convencional;
Las figuras 6A y 6B son diagramas que muestran
respectivamente ejemplos de la estructura de predicción en un
flujo convencional MPEG-4 AVC;
La figuras 7 es un diagrama que muestran otro
ejemplo de la estructura de predicción en un flujo convencional
MPEG-4 AVC;
Las figuras 8A y 8B son diagramas que muestran
estructuras de flujos MPEG-4 AVC respectivamente de
la presente invención;
Las figuras 9A a 9D son diagramas de un primer
ejemplo que muestran AUs a descodificar en una unidad de acceso
aleatorio RAU;
Las figuras 10A a 10D son diagramas de un
segundo ejemplo que muestra AUs a descodificar en una unidad de
acceso aleatorio RAU;
Las figuras 11A a 11C son diagramas de un tercer
ejemplo que muestra AUs a descodificar en una unidad de acceso
aleatorio RAU;
Las figuras 12A a 12F son diagramas de un
ejemplo que muestra el procedimiento para especificar las AUs a
descodificar en una unidad de acceso aleatorio RAU;
La figura 13A es un diagrama que muestra un
ejemplo de sintaxis de una tabla que muestra información de
reproducción a velocidad variable, y la figura 13B es un diagrama
que muestra una unidad de almacenamiento de datos;
La figura 14 es un diagrama de un ejemplo de
extensión de una tabla que indica información de reproducción a
velocidad variable;
Las figuras 15A a 15C son diagramas de un
ejemplo que muestra las AUs de la imagen I y la imagen P en una
unidad de acceso aleatorio RAU en forma de información de
reproducción a velocidad variable;
Las figuras 16A a 16C son diagramas de un
ejemplo donde el tiempo de detención de memoria intermedia se usa
como indicadores de propiedades en el momento de la utilización de
las propiedades de AUs en forma de información de reproducción a
velocidad variable.
Las figuras 17A y 17B son diagramas que
muestran respectivamente ejemplos en los cuales las AUs de
estructura de trama y las AUs de estructura de campo coexisten en
las RAUs respectivas; La figura 17C es un diagrama que muestra el
ejemplo de sintaxis del primer mapa (RAU_map1) que muestra la
estructura de cada AU en el RAU; La figura 17D es un diagrama que
muestra RAU_map1 de la RAU de la figura 17B; la figura 17E es un
diagrama que muestra RAU_map en cuanto a la unidad de acceso
aleatoria RAU de la figura 17B; la figura 17B es un diagrama que
muestra el ejemplo de sintaxis del segundo mapa (RAU_map2) que
muestra el tipo de codificación de cada trama o cada imagen de un
par de campos;
Las figuras 18A a 18C son diagramas que muestran
otro mapa ejemplar en forma de información de reproducción;
La figura 19 es un diagrama del procedimiento
para indicar la información límite en una unidad de acceso aleatorio
RAU;
Las figuras 20A y 20B son diagramas que muestran
ejemplos de estructuras de predicción de imágenes en una unidad de
acceso aleatorio RAU;
La figura 21 es un diagrama de bloques que
muestra la estructura de un aparato de codificación de imágenes en
movimiento de la presente invención;
La figura 22 es un diagrama de flujo de un
procedimiento de codificación de imágenes en movimiento;
La figura 23 es un diagrama de bloques que
muestra la estructura de un aparato de multiplexado de imágenes en
movimiento de la presente invención;
La figura 24A y 24B son diagramas que muestran
contenidos ejemplares de información de soporte HLP;
La figura 25 es un diagrama que muestra un
ejemplo de una unidad Nal en la cual la información de reproducción
trucada se almacena en la información de soporte HLP;
La figura 26 es un diagrama de flujo que muestra
la operación de un aparato de multiplexado de imágenes en
movimiento;
La figura 27 es un diagrama de bloques que
muestra la estructura de un aparato de descodificación de imágenes
en movimiento de la presente invención;
La figura 28 es un diagrama de flujo de un
procedimiento de descodificación de imágenes convencional;
La figura 29 es un diagrama de flujo de
determinación de las AUs a descodificar en el procedimiento de
imágenes en movimiento de la presente invención;
La figura 30 es un diagrama de flujo que muestra
el procesamiento realizado en el caso en el cual las AUs a
descodificar no coinciden con las AUs a visualizar en el
procedimiento de descodificación de imágenes en movimiento de la
presente invención;
La figura 31 es un diagrama que muestra una
jerarquía de datos de un HD-DVD;
La figura 32 es un diagrama estructural del
espacio lógico sobre un HD-DVD;
La figura 33 es un diagrama estructural de un
archivo de información VOB;
La figura 34 es un diagrama de un mapa de
tiempo;
La figura 35 es un diagrama estructural de un
archivo de lista de reproducción;
La figura 36 es un diagrama estructural de un
archivo de programa que corresponde a la lista de reproducción;
La figura 37 es un diagrama estructural que
muestra un archivo de información de gestión de todo el disco
BD;
La figura 38 es un diagrama estructural de un
archivo para grabar un gestor global de eventos;
La figura 39 es un diagrama de bloques que
muestra el contorno de un reproductor de HD-DVD;
Las figuras 40A a 40C son diagramas que muestran
un soporte de grabación para almacenar el programa para realizar el
procedimiento de codificación de imágenes en movimiento y el
procedimiento de descodificación de imágenes en movimiento de la
presente invención.
\vskip1.000000\baselineskip
Se describirá una realización de la presente
invención en lo sucesivo con referencia a las figuras.
En primer lugar, la estructura de un flujo AVC a
generar por un aparato de generación de flujo de imágenes en
movimiento, un aparato de codificación de imágenes en movimiento y
un aparato de multiplexado de imágenes en movimiento de la presente
invención, dicho de otro modo, se describirá un flujo AVC a
introducir en un aparato de descodificación de imágenes en
movimiento de la presente invención.
La figura 8A y la figura 8B muestran
respectivamente las estructuras de flujos AVC de la presente
invención. Obsérvese que la información límite a añadir a la parte
superior de una unidad NAL no se muestra en la figura. El flujo AVC
difiere de un flujo AVC convencional porque se añade información de
reproducción trucada, la información de reproducción trucada que
indica las AUS a descodificar en el momento de la reproducción
trucada tal como la reproducción a saltos la reproducción de
velocidad variable y la reproducción inversa. La información de
reproducción trucada se almacena en una unidad NAL para almacenar
la información de reproducción (figura 8A). En las
MPEG-4 VAC, la relación entre la información a
almacenar y el tipo de unidad NAL de una unidad NAL convencional se
puede establecer por aplicación. Más específicamente, los valores de
0 y 24 a 31 se pueden usar, y estos tipos de unidad NAL se
denominan tipos de unidad NAL ajustables de usuario. En
consecuencia, la información de reproducción trucada se almacena en
la unidad NAL que tiene tales tipos de unidad NAL ajustables de
usuario. Aquí, en el caso en el cual los tipos de Unidad Nal
específicos se reservan para almacenar la información distinta de
la información de reproducción trucada, los tipos de unidad NAL que
es diferentes de los tipos de unidad NAL se asignan a la
información de reproducción trucada. Las unidades NAL de la
información de reproducción trucada se almacenan en la AU superior
de una unidad de acceso aleatorio RAU. Tal unidad NAL se coloca
inmediatamente después de una unidad PPS NAL, si está presente, en
una AU, pero se puede colocar en otra posición mientras el orden
satisfaga el requisito de la AVC MPEG-4 u otra
norma. Igualmente, en e caso en el cual es imposible interpretar la
unidad NAL de información de reproducción trucada, los datos de la
unidad NAL se pueden saltar y reiniciar la descodificación desde la
parte superior de la siguiente unidad NAL. Por lo tanto, incluso un
terminal que no puede interpretar la unidad NAL de información de
reproducción trucada puede llevar a cabo el procesamiento de
descodificación sin fallos.
Obsérvese que tal unidad NAL de información de
reproducción trucada se puede incluir no en la AU superior de una
unidad de acceso aleatorio RAU sino en otra AU tal como la última
AU. Igualmente, tal unidad NAL de información de reproducción
trucada se puede incluir en cada AU que constituye una unidad de
acceso aleatoria RAU.
La figura 9 a la figura 11 muestran ejemplos de
AUs a descodificar en el momento de la reproducción a velocidad
variable. La figura 9A muestra el orden de visualización de AUs.
Aquí, las AUs sombreadas diagonalmente son las AUs a las que se
refieren por otras AUs, y las flechas muestran imágenes a las que
se refieren. Se asignan menos números de referencia a las AUs a
visualizar antes de I0, y se asignan más números de referencia a AUs
a visualizar después de B15. La figura 9B muestra el orden de
descodificación de AUs mostradas en la figura 9A, y I0 a B11
constituyen una unidad de acceso aleatorio RAU. En este momento,
I0, -B14, P4, B2, P8, P6, P12 y B10 se descodifican para llevar a
cabo una reproducción a doble velocidad (figura 9C), mientras I0,
P4, P8 y P12 se descodifican para llevar a cabo una reproducción de
cuádruplo velocidad (Figura 9D). Las figuras 9c y 9D muestran que
las AUs con un signo * se han de descodificar en el momento de una
reproducción a doble velocidad y reproducción de cuádruplo
velocidad, y estos fragmentos de información se almacenan en la
unidad NAL de la información de reproducción trucada. En el ejemplo
de la figura 10A a la figura 10D, las imágenes de I0 a B11 en el
orden de descodificación constituyen una unidad de acceso aleatorio
RAU. Aquí, I0, -B13, P3, B1, P6, B4, P9, B7, P12 y B10 se
descodifican para llevar a cabo una reproducción a una velocidad
multiplicada por 1,5 mientras I0, P3, P6, P9 y P12 se descodifican
para llevar a cabo una reproducción a triple velocidad. Igualmente,
en el ejemplo de la figuras 11A a 11C, I0, P3, P6, P9 y P12 se
descodifican para llevar a cabo una reproducción a triple
velocidad.
Aquí las velocidad de reproducción no necesitan
ser exactas porque se describen como directrices de las velocidades
de reproducción. Por ejemplo, en el ejemplo de la figura 11C, en el
caso en el cual todas las AUs mostradas como AUs a descodificar en
el momento de la reproducción a triple velocidad se descodifican, la
velocidad es 3,2 veces superior a la obtenida a partir de la
expresión : 16 : 5, dicho de otro modo, no es exactamente una
triple velocidad. Igualmente, en el momento de la reproducción
multiplicada por M, en el caso en el cual el menor valor sobre M es
N sobre las velocidades de reproducción mostradas como información
de reproducción trucada, es posible descodificar las AUs necesarias
para ser codificadas en el momento de reproducción multiplicada
por N y para determinar el modo en que el resto de las AUs se
deberían codificar dependiendo de la implementación del aparato de
descodificación. Igualmente, es posible colocar prioridades elevadas
sobre las AUs necesarias a descodificar en el caso en el cual la
velocidad de reproducción es rápida, y para determinar las AUs a
descodificar basadas en las prioridades.
Obsérvese que algunas AUs, entre las AUs a
descodificar en el momento de la reproducción de velocidad variable,
no se puede visualizar. Por ejemplo, se visualiza la eNésima AU en
el momento de la reproducción de doble velocidad, pero no se
visualiza la eMésima AU. En este momento, en el caso en el cual
existe una necesidad de descodificar la eMésima AU para
descodificar la eNésima AU, la Emésima AU se descodifica pero no
se visualiza en el momento de la reproducción a doble
velocidad.
A continuación, el procedimiento para
especificar las AUs a descodificar en el momento de reproducción a
velocidad variable se describirá con referencia a las figuras 12A a
12F. Las figuras 12A a 12F muestran los ejemplos de especificación
de AUs a descodificar e la misma unidad de acceso aleatorio RAU que
la de la figura 9. Como se muestra en la figura 12D, I0, -B14, P4,
B2, P8, P6, P12, B10 se descodifican en el momento de la
reproducción a doble velocidad. Estas AUs son la primera, segunda,
quinta, sexta, novena, décima, treceava y catorceava AUs cuando se
cuentan las Aus que empiezan con la AU superior de la unidad de
acceso aleatorio RAU. De esta manera, es posible especificar
únicamente AUs a descodificar en el momento de reproducción a
velocidad variable mostrando los números ordinales de AUs en una
unidad de acceso aleatorio RAU. Un delimitador de unidades de
acceso se coloca seguramente en la parte superior de una AU en el
momento de multiplexar un flujo AVC por un flujo de transporte
MPEG-2 (TS). Cuando se obtienen datos AU a
descodificar en el momento de reproducción a velocidad variable,
los delimitadores de unidades de acceso se buscan en secuencia para
conocer los límites AU. Esta manera de procedimiento de búsqueda
elimina la necesidad de analizar la carga útil de unidades NAL
tales como datos de segmentos, y de este modo es más fácil.
Obsérvese que es posible especificar AUs a
descodificar determinando que las AUs referidas por otras AUs tales
como AUs de una imagen I e imágenes P (tales AUs a referir se
denominan AUs de referencia) se descodifican en el momento de la
reproducción a velocidad variable y especificando los número
ordinales de las AUs de referencia en una unidad de acceso
aleatorio RAU. En la unidad de acceso aleatorio RAU de la figura
12B, como se muestra en las figuras 12C, I0, - B14, P4, B2, P8, P6,
P12, B10 son AUs de referencia. Igualmente, en el momento de la
reproducción a doble velocidad, I0., -B14, P4, B2, P8, P6, P12, B10
se descodifican, pero cuando se indican estas AUs en el orden de
AUs de referencia, corresponden a la primera, segunda, tercera,
cuarta, quinta, sexta, séptima y octava Aus de referencia como se
muestra en la figura 12F. Si una AU es una AU de referencia o no se
puede evaluar refiriéndose a un campo específico en el
encabezamiento de la unidad NAL en un segmento. Más
específicamente, en el caso en el que el valor de un campo
nal_ref_idc_ no es 0, la AU es una AU de referencia. Obsérvese que
una AU de referencia a descodificar se puede especificar basado en
un número de trama porque es posible identificar una AU de
referencia basada en un número de trama.
Además, es posible especificar las AUs a
descodificar especificando el valor desfasado equivalente a la
longitud de byte a partir de la posición de inicio de la AU
superior de una unidad de acceso aleatorio RAU a la posición de
inicio de la AU a descodificar. Por ejemplo, en las figuras 12A a
12F, en el caso en que I0 se inicie con la posición alejada de la
parte superior de un flujo por 10.000 bytes y P4 se inicia con la
posición alejada de P4 por 20.000 bytes; el valor desfasado en P4
es 10.000 bytes obtenido a partir de la expresión: 20.000 - 10.000.
En el caso en el cual se usa en MPEG-2 TS, es
posible especificar un valor desfasado que incluye la parte
superior del encabezamiento de un paquete TS o un paquete PES (Flujo
elemental de paquetes), o es posible especificar un valor desfasado
que la incluye en el momento de llevar a cabo el relleno de datos
por aplicación. Igualmente, es posible especificar una AU por un
número de trama FN.
Obsérvese que, en el caso de usar un flujo
multiplexado en MPEG-2 TS, es posible especificar
AUs basándose en el número de paquetes TS a partir de (i) el
paquete TS para almacenar el número de índice y la información de
dirección para identificar un paquete TS que incluye los datos
superiores de las AUs a descodificar, o los datos superiores de la
unidad de acceso aleatorio RAU a (ii) el paquete TS actual. Aquí, es
posible utilizar la información sobre el Paquete fuente a utilizar
para un formato de grabación de un disco Blu-rayl
(BD) en lugar de un paquete TS. El paquete fuente se obtiene
añadiendo, a un paquete TS, un encabezamiento de 4 bytes que
incluye información de tiempo del paquete TS, información de control
de copia y similar.
La figura 13A es un ejemplo de sintaxis de una
tabla que indica la información para reproducción a velocidad
variable. En la sintaxis, nuj_pic_in_RAU muestra el número de AUs
que constituyen una unidad de acceso aleatorio RAU, num_speed
muestra el número de velocidades de reproducción a las cuales AUS ha
de descodificarse, play_spedd muestra una velocidad de
reproducción, num_dec_pic muestra el número de AUs a descodificar en
el momento de la reproducción a una velocidad de reproducción
mostrada en el play_speed, dec_pic muestra los números ordinales
de AUs a descodificar en el caso de contar las AUs que empiezan con
la AU superior en una unidad de acceso aleatorio RAU. La figura 13B
es un ejemplo en el caso de almacenar información sobre AUs a
descodificar en una unidad de acceso aleatorio RAU mostrada en las
figuras 9A a 9D en el momento de una reproducción a doble
velocidad y una reproducción a cuádruplo velocidad. Obsérvese que
num_pic_in_RAU se usa en el momento de calcular una velocidad de
reproducción exacta basada en el número de AUs a descodificar y el
número total de AUs en una unidad de acceso aleatorio RAU o saltar
sobre una base de unidad de acceso aleatorio RAUs en secuencia. Sin
embargo, num_pic_in_RAU se puede omitir porque la misma información
se puede obtener buscando las AUs superiores de unidad de acceso
aleatorio RAUs. Igualmente, se puede añadir un campo que indica la
dimensión de una tabla a la tabla. Obsérvese que, en el ejemplo de
sintaxis de la figura 13ª, el número ordinal de una AU a
descodificar contando desde la parte superior de una unidad de
acceso aleatorio RAU, se muestra directamente, pero si se necesita
descodificar cada AU o no se puede mostrar encendiendo o apagando
los bits correspondientes a cada AU. Por ejemplo, una unidad de
acceso aleatorio RAU se compone de 16 AUs en el ejemplo de las
figuras 9A a 9D, se necesitan 16 bits cuando se asigna 1 bit a una
AU. En el momento de la reproducción a cuádruplo velocidad, se
muestra que la primera, quinta, novena y treceava AUs se
descodifican asignando información de 16 bits que se representa
como 0b1000100010001000 (0b muestra un número binario). Aquí, el bit
superior y el último bit corresponden a la AU superior y la última
AU de una unidad de acceso aleatorio RAU respectivamente.
Obsérvese que la dimensión de una tabla es
variable en el ejemplo de sintaxis de la figura 13A. El valor
máximo de la dimensión de tabla se determina en el caso donde se
prescribe el valor máximo del número de AUs que constituyen una
unidad de acceso aleatorio RAU y el valor máximo de num_speed. En
consecuencia, es posible fijar la dimensión de tabla en el valor
máximo determinado, y en el caso donde la dimensión de la
información para reproducción a velocidad variable no alcanza el
valor máximo, es posible llevar a cabo el relleno. La fijación de
la dimensión de tabla de esta manera hace posible obtener siempre
los datos de una dimensión fija cuando se obtiene la información de
reproducción a velocidad variable, que permite acelerar el
procedimiento de obtención de información. Obsérvese que la
dimensión de tabla o la dimensión de una unidad NAL para almacenar
la tabla se muestra como información de gestión. Igualmente, es
posible predeterminar la dimensión de una unidad NAL para almacenar
información de reproducción trucada, y, en el caso donde la
información no se puede almacenar en una única unidad NAL, es
posible almacenar la información para reproducción a velocidad
variable en diversas unidades NAL por separado. En este momento el
relleno se lleva a cabo sobre la carga útil de la última unidad
NAL de manera que la dimensión de la unidad NAL sea la dimensión
predeterminada. Igualmente, algunos valores prescritos se
determinan como los valores de la dimensión de tabla, y el número de
índice que indica un valor prescrito de la dimensión de tabla se
puede mostrar en la tablar o usar la información de gestión de la
aplicación.
Igualmente, es posible mostrar información
diferencial en lugar de listar todas las AUs a descodificar a cada
velocidad de reproducción. Como la información en el momento de la
reproducción a una velocidad multiplicada por M (<N), solamente
las AUs necesarias a descodificar se muestran además de las AUs a
descodificar en el momento de la reproducción a una velocidad
multiplicada por N en el ejemplo de la figura 13B, como la segunda,
sexta, décima y catorceava AUs, además, de las AUs a descodificar en
el momento de la reproducción a velocidad cuádruple, se
descodifican en el momento de la reproducción a doble velocidad, es
posible mostrar solamente la segunda, sexta, décima y catorceava
AUs como la información para reproducción a doble velocidad.
Obsérvese que, las AUs necesarias a descodificar
en el momento de reproducción a velocidad variable se muestran en
la descripción anterior, pero además, es posible mostrar la
información que indica el orden de visualización de las AUs
necesarias a descodificar. Por ejemplo, la información en el momento
de la reproducción a doble velocidad y la reproducción a velocidad
cuádruplo se muestra en el ejemplo de las figuras 9A a 9D, pero hay
un ejemplo de reproducción de esta unidad de acceso aleatorio RAU
a triple velocidad. La visualización de una parte de AUs a
visualizar en el momento de reproducción a doble velocidad, además
de las AUs a visualizar en el momento la reproducción a velocidad
cuádruplo, permite realizar una reproducción a triple velocidad.
Aquí, cuando se considera el caso donde se visualizan una o más AU
entre I0 y P4 que se han de visualizar en el momento de la
reproducción a cuádruplo velocidad, la información para la
reproducción a doble velocidad muestra que los candidatos son -B14,
B2, B6 y B10. Sin embargo, el orden de visualización de las cuatro
AUs se puede obtener solamente en el caso donde se analiza la
información de encabezamiento de un segmento. Aquí, puesto que la
información en el orden de visualización muestra que solamente -B14
se visualiza entre I0 y P4, es posible determinar que -B14 se
descodifica. La figura 14 es un ejemplo de sintaxis que indica la
información sobre el orden de visualización, y se obtiene añadiendo
la información sobre el orden de visualización a la sintaxis de la
figura 13A. Aquí, pts_dts_flag muestra si o no el orden de
descodificación de AUs a descodificar a la velocidad de
reproducción coincide con el orden de visualización de las AUs, y
solamente en el caso donde el orden de descodificación no coincide
con el orden de visualización, la información del orden de
visualización se muestra en un campos display_order.
Obsérvese que, en el caso de reproducción a una
velocidad de reproducción que no se muestra por la información de
reproducción a velocidad variable, es posible determinar las AUs a
descodificar y las AUs a visualizar basándose en la regla que se
predetermina en el terminal. Por ejemplo, en el caso de reproducción
a triple velocidad en el ejemplo de la figura 9, es posible
visualizar I0, B3, B9 y P12 además de las AUs a visualizar en el
momento de la reproducción a cuádruplo velocidad, en lugar de
visualizar una parte de las AUs a visualizar en el momento de
reproducción a doble velocidad. Aquí, como en las imágenes B, las
imágenes B en las AUs de referencia se pueden preferiblemente
descodificar o visualizar.
Igualmente, hay un caso donde la reproducción
trucada tal como la reproducción a velocidad variable se realiza
reproduciendo solamente la AU de una imagen I o solamente las AUs de
una imagen I e imágenes P. Por lo tanto, se puede almacenar una
lista de una imagen I e imágenes P como información de reproducción
trucada. Las figuras 15A a 15C muestran otro ejemplo. Aquí, las
imágenes a partir de I0 a B14 se incluyen en una unidad de acceso
aleatorio RAU como se muestra en la figura 15B, y entre estas, las
AUs de una imagen I e imágenes P son I0, P3, P6, P9, P12 y P15 como
se muestra en la figura 15C. Por lo tanto, se almacena la
información para identificar I0, P3, P6, P9, P12 y P15. En este
momento, es posible añadir la información para distinguir la AU de
una imagen I a partir de la AU de una imagen P. Igualmente, es
posible mostrar la información para distinguir las siguientes
imágenes las unas a partir de las otras, incluyendo las imágenes:
una imagen I, imágenes P, imágenes B referidas (denominadas en lo
sucesivo imágenes B de referencia), e imágenes b no referidas
(denominadas en lo sucesivo imágenes B de
no-referencia).
Además, es posible almacenar la información
prioritaria de las AUS respectivas como información de reproducción
trucada, y descodificar o visualizar las AUs según las prioridades
en el momento de reproducción a velocidad variable. Es posible
utilizar tipos de imágenes como información prioritaria como
información de prioridad. Por ejemplo, las prioridades de AUs se
pueden asignar en el siguiente orden de listado: (I) una imagen I;
(ii) imágenes P; (iii) imágenes B de referencia; y (iv) imágenes B
de no-referencia. Igualmente, es posible establecer
información de prioridad de la siguiente manera: cuando mayor es el
tiempo entre el tiempo después de la descodificación de una AU y el
tiempo de visualización de la AU, mayor es la prioridad. Las figuras
16A a 16C muestran un ejemplo de ajuste de las prioridades
dependiendo del tiempo de detención de memoria intermedia. La
figura 16A muestra la estructura de AUs y se refiere a P3 también
por B7 y P9. En este momento, en el caso donde la unidad de acceso
aleatorio RAU se compone de AUs a partir de I0 a B11 (figura 16B),
el tiempo de detención de memoria intermedia de cada AUs es como se
muestra en la figura 16C aquí, el tiempo de detección de memoria
intermedia se muestra basado en el número de tramas. Por ejemplo, P3
es necesario hasta que se descodifica P9, y el tiempo de detención
de memoria intermedia debe ser equivalente a seis imágenes. Por lo
tanto, la descodificación de las AUs cuyo tiempo de detención de
memoria intermedia es 3 o más significa la descodificación todo la
imagen I y todas las imágenes P, y se realiza la reproducción a
triple velocidad. Aquí, el tiempo de detención de memoria
intermedia de P3 es superior al de I0, pero es posible añadir un
valor desfasado a la AU de la imagen I para colocar la mayor
prioridad sobre la AU de la imagen I. Igualmente, es posible
colocar prioridades elevadas en las AUs necesarias a descodificar en
el momento de reproducción a alta velocidad y usar, como
información de prioridad, N en las AUs necesarias a descodificar en
el momento de la reproducción a velocidad multiplicada por N.
Obsérvese que, en el caso donde una AU es referida por otras Aus
después ser descodificada o visualizada, es posible mostrar el
periodo de tiempo durante el cual la AU es
referida.
referida.
Obsérvese que la información de reproducción
trucada se puede almacenar en un mensaje SEI (figura 8B) en este
caso, el tipo de mensaje SEI se define para la información de
reproducción trucada, y la información de reproducción trucada se
almacena en el mensaje SEI del tipo definido. El mensaje SEI para la
información de reproducción trucada se almacena en la unidad NAL
SEI solo o junto con otros mensajes. Obsérvese que es posible
almacenar información de reproducción trucada en el mensaje SEI
user_data_registered_itu_t_t35 o el mensaje SEI
user_data_unregistered que son mensajes SEI para almacenar la
información definida por un usuario. En el momento de usar estos
SEIs, es posible mostrar que la información de reproducción trucada
se almacene o que el tipo de información de reproducción trucada en
la parte de carga útil de un SEI añadiendo información de
identificación de la información a almacenar.
Obsérvese que es posible almacenar información
de reproducción trucada en AUs distintas de la AU superior en una
unidad de acceso aleatorio RAU. Igualmente, es posible predeterminar
los valores para identificar AUs necesarias a descodificar en el
momento de reproducción a una velocidad de reproducción específica y
añadir los valores determinados para cada AU. Por ejemplo, en lo
relativo a AUs a descodificar a una velocidad de reproducción que
es una velocidad multiplicada por N o inferior, N es dada como
información de velocidad de reproducción. Igualmente, es posible
mostrar lo siguiente en nal_ref_idc y similar de la unidad NAL de un
segmento: la estructura de la imagen en una AU, siendo la
estructura una estructura de trama o una estructura de campo, y
además, en el caso donde la imagen tiene una estructura de campo, es
posible mostrar el tipo de campo, que es un campo superior o un
campo inferior. Por ejemplo, como existe una necesidad de
visualización entrelazada, es deseable que si el campo a
descodificar a continuación es un campo superior o un campo inferior
se puede evaluar fácilmente en el momento de descodificar campos
saltando algunos campos en el momento de reproducción a alta
velocidad. En el caso donde el tipo de campo se puede evaluar a
partir del encabezamiento de una unidad NAL, no hay necesidad de
analizar el encabezamiento de segmentos y la cantidad de
procesamiento necesaria para tal evaluación se puede reducir.
Obsérvese que la información que indica si la AU
que constituye una unidad de acceso aleatorio RAU es un campo o una
trama que se puede almacenar en la AU superior de una unidad de
acceso aleatorio RAU. Igualmente, es posible determinar fácilmente
las AUs a descodificar en el momento de la reproducción trucada
incluso en el caso donde una estructura de campo y una estructura
de trama coexisten almacenando tal información en la AU superior de
la unidad de acceso aleatorio. Las figuras 17A y 17B son ejemplos
donde las AUs que tienen una estructura de trama y las AUs que
tienen una estructura de campo coexisten en la unidad de acceso
aleatorio RAU, y muestran el orden de visualización de las AUs y el
orden de descodificación de las AUs respectivamente. Las siguientes
imágenes se codifican como pares de campos respectivamente: B2 y B3;
I4 y P5; B9 y B10; B11 y B12; P13 y P14; B15 y B16; B17 y B18; y
P19 y P20. Igualmente, las otras Aus se codifican como las AUs que
tienen una estructura de trama en este momento, en el caso de
reproducción solamente las AUs de una imagen I e imágenes P, se
puede descodificar y reproducir lo siguiente en el siguiente orden
listado: el par de campos de I4 y P5; la trama de P8; el par de
campos de P13 y P14; y el par de campos de P19 y P20. Sin embargo,
la adición de tal información es efectiva porque hay una necesidad
de evaluación si cada AU es uno de los campos que constituyen un
par de campos o cada AU es una trama en el momento de determinar las
AUS a descodificar.
La figura 17C es un ejemplo de sintaxis del
primer mapa (RAU_map1) que indica si una AU en una unidad de acceso
aleatorio RAU es una trama o un campo. El número de AUs que
constituye una unidad de acceso aleatorio se muestra en
num_AU_in_RAU, y la información sobre cada AU se muestra en el
siguiente bucle en un orden de descodificación. Aquí,
frame_field_flag muestra si la imagen a almacenar en un AU es una
trama o un campo. Igualmente, pic_type muestra la información sobre
el tipo de codificación de una imagen. Los tipos de codificación que
se pueden mostrar incluyen: una imagen I; una imagen IDR; y
similar. Por lo tanto, es posible determinar las imágenes a
descodificar en el momento de la reproducción trucada refiriéndose a
este mapa. Obsérvese que es posible indicar si cada imagen I y cada
imagen P son referidas o no. Además, es posible indicar la
información para evaluar si se aplica un requisito predeterminado
en cuanto a las estructuras de predicción.
Las figuras 17D RAU_map1_ que se refiere a la
unidad de acceso aleatorio RAU de la figura 17B. Aquí, pic_type de
una imagen I, imágenes P, imágenes B de referencia, e imágenes B de
no-referencia son 0, 1, 2 y 3 respectivamente.
Aquí, es posible almacenar la información que indica los tipos de
codificación de imágenes sobre las bases anteriormente listadas
porque las imágenes se reproducen sobre una base de trama a trama, o
sobre una base de par de campos por par de campos en el momento de
reproducción trucada.
La figura 17F es un ejemplo de sintaxis del
segundo mapa (RAU-map2) que indica tipos de
codificación de imágenes sobre la base trama a trama o sobre la
base de par de campo por par de campo. Aquí, num_frame_in_RAU
muestra el número de tramas que constituyen una unidad de acceso
aleatorio RAU y el número de pares de campos. Igualmente,
frame_flag muestra si una imagen es una trama o no, y en el caso
donde es una trama, se establece 1 en el caso donde se establece 1
en frame_flag, la información sobre el tipo de codificación de una
trama se muestra en frame_type. En el caso donde se establece 0 en
frame_flag, dicho de otro modo, la imagen es uno de un par de
campos, el tipo de codificación de cada campo que constituye el par
de campo se muestra en field_pair_type.
La figura 17E muestra RAU_map2 en cuanto a la
unidad de acceso aleatorio RAU de la figura 17B. En la figura 17E,
los valores que indican frame_type de una imagen I, imágenes P,
imágenes B de referencia, imágenes B de
no-referencia son 0, 1, 2 y 3 respectivamente.
Igualmente, field_pair_type muestra el tipo de cada campo en un
orden de descodificación; Br para imágenes B de referencia; y Bn
para imágenes de no-referencia. Por ejemplo, se
muestra como IP en el caso donde el primer campo es una imagen I y
el segundo campo es una imagen P, y se muestra como BnBn en el caso
donde el primer campo y el segundo campo son imágenes B de
no-referencia. Aquí, los valores para indicar
combinaciones de IP, PP, PI BrBr, BnBn y similar se establecen
previamente. Obsérvese que la siguiente información se puede usar
como la información que indica el tipo de codificación de un par de
campos: información en cuanto a si el par de campos incluye una
imagen I o una o más imágenes P; información en cuanto a si el par
de campos incluye una o más imágenes B de referencia; e información
en cuanto a si el par de campos incluye una o más imágenes B de
no-referencia.
Por ejemplo, la información de reproducción
trucada puede ser el mapa de una unidad de acceso aleatorio RAU
como una sintaxis mostrada en la figura 18A. Este mapa incluye
picture_structure que indica la estructura de cada una de las
imágenes incluidas en la unidad de acceso aleatorio RAU y
picture_type que indica el tipo de imagen. Como se muestra en la
figura 18B, picture_structure muestra la estructura de cada imagen,
es decir una estructura de campo o una estructura de trama y
similar. Igualmente, como se muestra en la figura 18C, picture_type
muestra el tipo de imagen de cada imagen, es decir, una imagen I,
una imagen B de referencia, una imagen B de
no-referencia; y una imagen P. De este modo, el
aparato de descodificación de imágenes en movimiento que recibió
este mapa puede identificar fácilmente AUs sobre las cuales se
realiza la reproducción trucada refiriéndose a este mapa. Como
ejemplo, es posible descodificar y reproducir, en reproducción a
velocidad elevada, solamente una imagen I e imágenes P o imágenes B
de referencia además de una imagen I e imágenes P.
Obsérvese que en el caso donde la información
que indica la estructura de imagen tal como un avance
3-2 se incluye en una AU que constituye una unidad
de acceso aleatorio RAU, es posible incluir la información que
indica la estructura de imagen en el primer o segundo mapa
anteriormente descrito. Por ejemplo, es posible mostrar si cada
imagen tiene campos de visualización equivalente a tres imágenes o
cada imagen tiene campos de visualización equivalente a dos
imágenes, Además, en el caso donde tiene campos de visualización
equivalente a tres imágenes, es posible mostrar la información que
indica si el primer campo se visualiza repetidamente o la
información que indica si el primer campo es un campo superior.
Igualmente, en el caso donde tiene campos de visualización
equivalente a dos imágenes, es posible mostrar la información si el
primer campo es un campo superior. Aquí, en AVC
MPEG-4 si una imagen tiene una estructura de imagen
de manera que el avance 3-2 se puede mostrar
usando (i) pic_struct_-present_flag de un conjunto
de parámetros de secuencia (SPS) o (ii)
pictureto_display_conversion_flag y similar en la
temporización AVC y el descriptor HRD que se define en la norma del
sistema MPEG-2. Además, la estructura de cada
imagen se muestra por un campo pic_struct de una Temporización de
Imagen SEI. Por lo tanto, es posible mostrar la estructura de
imagen estableciendo un indicador solamente en el caso donde un
campo pic_struct tiene un valor específico, por ejemplo, una imagen
tiene campos de visualización equivalente a tres imágenes. Dicho de
otro modo, indicar los tres siguientes tipos de información en
cuanto a cada imagen es efectivo (i) en el caso donde la
reproducción a saltos se realiza en medio de una unidad de acceso
aleatorio RAU e (ii) en el momento de determinar el campo a
visualizar en un momento específico o la trama en la cual se
almacena un campo. Lo mismo se puede decir en el caso de determinar
imágenes a visualizar durante la reproducción a velocidad variable.
Los tres tipos de información son:
- (i)
- campo
- (ii)
- trama (que se usa en el momento de no usar un avance de 3-2, o que se usa también en el momento de usar un avance de 3-2. En el último caso, la trama tiene campos de visualización equivalente a dos imágenes).
- (iii)
- trama que tiene un campo de visualización equivalente a tres imágenes en el momento de usar un avance de 3-2.
Obsérvese que estos tipos de información se
pueden indicar en picture_structure de un mapa de RAU mostrado en
la figura 18A.
- \quad
- Indicar información de lista de tipos de imágenes de las imágenes respectivas que constituyen una RAU de esta manera hace que sea posible determinar fácilmente imágenes a descodificar o visualizar en el momento de realizar una reproducción trucada tal como reproducción a velocidad variable, reproducción a saltos y reproducción inversa. Esto es especialmente efectivo en los siguientes casos:
- (i)
- donde solamente una imagen I e imágenes P se reproducen;
- (ii)
- donde la reproducción a alta velocidad en la cual se realiza una imagen I, imágenes P e imágenes B de referencia; y
- (iii)
- donde imágenes sobre las cuales se colocan requisitos en cuanto a las estructuras de predicción se identifican basadas en los tipos de imagen, las imágenes necesarias a descodificar en el momento de la reproducción trucada se seleccionan, y las imágenes seleccionadas se reproducen en reproducción trucada.
\vskip1.000000\baselineskip
Además, es posible almacenar un valor por
defecto de información de reproducción trucada en una región, que
es diferente del flujo AVC, tal como información de gestión a nivel
de aplicación, e incluir información de reproducción trucada en una
unidad de acceso aleatorio RAU solamente en el caso donde la
información de reproducción trucada es diferente de la información
de reproducción trucada mostrada por el valor por defecto.
La información de reproducción trucada en cuanto
a reproducción a velocidad variable se ha descrito anteriormente,
pero es posible utilizar información similar como información
suplementaria en el omento de reproducción inversa. Es posible
completar la descodificación en un momento en el momento de la
reproducción inversa en el caso donde todas las imágenes a
visualizar se pueden almacenar en una memoria, la carga de
procesamiento necesaria para la descodificación se puede reducir.
Considerar un caso realización de reproducción inversa en el orden
listado de P12, P8, P4 e I0 en el ejemplo de las figuras 9A a 9D, a
condición de que todos los resultados de descodificación de las
cuatro AUs se almacenen, es posible descodificar I0, P4, P8 y P12 en
este orden en un momento y realizar reproducción inversa. Por lo
tanto, es posible evaluar si o no todos los datos descodificados de
las AUs se pueden almacenar basándose en el número de AUs a
descodificar o visualizar en el momento de reproducción a una
velocidad multiplicada por N, y determinar las AUs a visualizar en
el momento de la realización de la reproducción inversa basándose
en el resultado de la evaluación.
Igualmente, se puede usar información de
reproducción trucada como información suplementaria en el momento
de la reproducción a saltos. Aquí, la reproducción a saltos
significa avance rápido de una imagen en movimiento y realizar una
reproducción normal del inicio de las imágenes en movimiento con
la posición determinada al azar. Determinar imágenes de avance
rápido que usan tal información suplementaria incluso en el momento
de la reproducción a saltos hace que sea posible determinar la
imagen en la cual se inicia la reproducción a saltos.
Obsérvese que la AU a referir a cada AU que
constituye una unidad de acceso aleatorio se puede mostrar
directamente en la información trucada. En el caso donde hay
diversas AUs de referencia, se muestran todas ellas. Aquí, en el
caso donde una AU de referencia pertenece a una unidad de acceso
aleatorio diferente de la unidad de acceso aleatorio que incluye
una AU que se refiere a la AU de referencia, la AU se puede indicar
de la siguiente manera específica: la eMésima AU de la unidad de
acceso aleatorio que se coloca antes o después de n números de
unidades de acceso aleatorio, o la AU se puede indicar da la
siguiente sencilla manera: la AU que pertenece a la unidad de
acceso aleatorio que se coloca antes o después de N números de
unidades de acceso aleatorio. Obsérvese que es posible mostrar el
número ordinal, en el orden de descodificación, de la AU de
referencia en el caso de contar a partir de la AU que se refiere a
la AU de referencia. En ese momento, las AUs se cuentan sobre la
base de una de los siguiente: todas las AUs; AUs de referencia; AUs
de un tipo de imagen específico tal como I, P y B. Igualmente, es
posible mostrar que cada AU se puede referir a solamente AU de hasta
N números de AUs antes y después en un orden de descodificación.
Obsérvese que, en el caso de referirse a una AU que no se incluye
en las AUs de hasta N número de AUs antes y después en el orden de
descodificación, es posible añadir la información que indica el
hecho.
Obsérvese que es posible usar la información de
reproducción trucada anteriormente descrita de una manera similar
también en un formato de multiplexado tal como MP4 donde la
dimensión de una unidad NAL se usa en lugar de usar un prefijo de
código de inicio como la información límite de una unidad NAL.
Obsérvese que, en el momento de recibir y grabar
un flujo codificado que se paquetiza usando un paquete
MPEG-2 TS (Flujo de transporte) o un RTP (Protocolo
de transmisión en tiempo real), se produce una pérdida de paquetes.
De esta manera, en el caso de la grabación de los datos recibidos en
un entorno en el que se produce una pérdida de paquete, es posible
almacenar, en un flujo codificado como información suplementaria, o
una información de gestión, la información que indica que los datos
en un flujo se han perdido a causa de una pérdida de paquete. Es
posible mostrar una pérdida de datos debida a la pérdida de paquete
insertando la información de indicador que indica si los datos del
flujo se pierde o no o un código de notificación de error especial
para notificar la parte perdida. Obsérvese que, en el caso de la
realización del procedimiento de ocultación de error cuando se
pierden los datos, es posible almacenar información de
identificación que indica la presencia/ausencia o el procedimiento
de procedimiento de ocultación de error.
La información de reproducción trucada para
determinar las AUs a descodificar o visualizar en el momento de la
reproducción trucada se ha descrito hasta ahora. Aquí, la estructura
de datos para permitir la detección del borde de la unidad de
acceso aleatorio RAUs se describirá con referencia a la figura
19.
En la AU superior de una unidad de acceso
aleatorio RAU, la unidad NAL de un SPS referido por una AU que
constituye una unidad de acceso aleatorio RAU se almacena siempre.
Por otra parte, en la norma AVC MPEG-4, es posible
almacenar la unidad NAL del SPS referido por la eNésima AU en un
orden de descodificación en una AU que se selecciona
arbitrariamente a partir de entre la eNésima AU o las AUs colocadas
antes de la eNésima AU en un orden de descodificación. Tal unidad
NAL se almacena de manera que la unidad NAL de un SPS se puede
transmitir repetidamente, en preparación para el caso donde la
unidad NAL de un SPS se pierde a causa de una pérdida de paquete en
el momento de transmitir un flujo en comunicación o radiodifusión.
Sin embargo, la siguiente regla es efectiva para el uso de las
aplicaciones de almacenamiento. Solamente una única unidad NAL del
SPS referido por todas las AUs de la unidad de acceso aleatorio RAU
en la AU superior de una unidad de acceso aleatorio RAU, y la
unidad NAL del SPs no se almacena en las siguientes AUs en la unidad
de acceso aleatorio. Haciéndolo así es posible garantizar que la AU
es la AU superior de la unidad de acceso aleatorio RAU si incluye
la unidad NAL de un SPs. El inicio de la unidad de acceso aleatorio
RAU se puede encontrar buscando la unidad NAL del SPS. La
información de gestión de un flujo tal como un mapa de tiempo no
garantiza la provisión de información de acceso en cuanto a las
unidades de acceso aleatorio RAUs. Por lo tanto, es especialmente
efectivo que la posición de inicio de cada unidad de acceso
aleatorio RAU se pueda obtener buscando la unidad NAL de un SPS en
un flujo en el caso de, por ejemplo, realizar reproducción a saltos
sobre la imagen colocada en medio de la unidad de acceso aleatorio
RAU cuya información de acceso no se proporciona.
Aquí, en el caso donde la AU superior de la
unidad de acceso aleatorio RAU es la AU de una imagen IDR, la AU de
la unidad de acceso aleatorio RAU no se refiere a la AU en la unidad
de acceso aleatorio RAU que se coloca previamente en un orden de
descodificación. Este tipo de unidad de acceso aleatorio RAU se
denomina unidad de acceso aleatorio RAU de tipo cerrado. Por otra
parte, en el caso donde la AU superior de una unidad de acceso
aleatorio RAU es la AU de una imagen I que no es una imagen IDR, la
AU de la unidad de acceso aleatorio RAU puede referirse a la AU en
la unidad de acceso aleatorio RAU que se coloca previamente en un
orden de descodificación. Este tipo de unidad de acceso aleatorio
RAU se denomina unidad de acceso aleatorio RAU de tipo abierto. En
el momento que los ángulos se conmutan durante la reproducción en
un disco óptico o similar, la conmutación se realiza a partir de
una unidad de acceso aleatorio RAU de tipo cerrado. Por lo tanto, es
efectivo que la evaluación en cuanto a si una unidad de acceso
aleatorio RAU es una unidad de acceso aleatorio RAU de tipo abierto
se pueda hacer en la parte superior de la unidad de acceso aleatorio
RAU. Por ejemplo, es posible mostrar la información de indicador
para evaluar el tipo, es decir, un tipo abierto o un tipo cerrado m
en un campo nal_ref_idc de la unidad NAL de un SPS. Como se define
que el valor de nal_ref_idc es 1 o más en la unidad NAL de un SPS,
el bit de orden elevado se establece siempre en 1 y la información
de indicador se muestra mediante el bit de orden bajo. Obsérvese
que, una AU en una unidad de acceso aleatorio RAU puede no
referirse a una AU en una unidad de acceso aleatorio RAU que se
coloca previamente en un orden de descodificación incluso en el
caso donde la AU superior es la AU de una imagen I que no es una
IDR. Este tipo de unidad de acceso aleatorio RAU se puede
considerar como una unidad de acceso aleatorio RAU de tipo cerrado.
Obsérvese que la información de indicador se puede mostrar usando
un campo distinto de nal_ref_idc.
Obsérvese que es posible especificar la posición
de inicio de una unidad de acceso aleatorio RAU basada en la unidad
NAL distinta de un SPs a almacenar solamente en la AU superior de
una unidad de acceso aleatorio RAU. Igualmente, es posible mostrar
el tipo, es decir, el tipo abierto o el tipo cerrado, de cada una de
las unidades de acceso aleatorio RAUs usando el campo nal_ref_idc
de cada unidad de acceso aleatorio RAU.
Finalmente, las figuras 20A y 20B muestran
ejemplos de estructuras de predicción de AUs que constituyen una
unidad de acceso aleatorio RAU. La figura 20A muestra las posiciones
de AUs en un orden de visualización, y la figura 20B muestra las
posiciones de las AUs en el orden de descodificación. Como se
muestra en las figuras, B1 y B2 que se muestran antes de I3 que es
la AU superior de una unidad de acceso aleatorio RAU se puede
referir a AUs a visualizar después de I3. En la figura, B1 se
refiere a P6, Aquí, con el fin de garantizar que las AUs de I3 y
las siguientes imágenes en el orden de visualización se puede
descodificar correctamente, se prohíbe que las AUs de I3 y las
siguientes imágenes en el orden de visualización se refieran a las
AUs antes de I3 en el orden de visualización
La figura 21 es un diagrama de bloques del
aparato 100 de codificación de imágenes en movimiento que realiza
el procedimiento de codificación de imágenes en movimiento de la
presente invención. Este aparato 100 de codificación de imágenes en
movimiento genera un flujo codificado, mostrado en las figura 8 a
figuras 20, de una imagen en movimiento que se puede reproducir
usando una reproducción trucada tal como reproducción a saltos,
reproducción a velocidad variable y reproducción inversa. El
aparato 100 de codificación de imágenes en movimiento incluye una
unidad de generación de información de reproducción trucada
TrickPlay, además de las unidades de un aparato 1 codificación de
imágenes en movimiento mostrado en la figura 4. Obsérvese que las
unidades de procesamiento que realizan las mismas operaciones que
las unidades de procesamiento de un aparato codificación de imágenes
en movimiento mostrado en el diagrama de bloques de la figura 6 se
asignan a los mismos números de referencia en la figura, y sus
descripciones se omitirán.
La unidad de generación de información de
reproducción trucada TrickPlay es un ejemplo de una unidad que
genera, sobre la base de una unidad de acceso aleatorio una o más
imágenes, información suplementaria a referir a l tiempo de
reproducción de las unidades de acceso aleatorio. La unidad de
generación de información de reproducción trucada TrickPlay genera
información de reproducción trucada basada en tipos de imágenes
Ptype, y notifica la información de reproducción trucada a la
unidad de codificación de longitud variable VLC.
La unidad de codificación de longitud variable
VLC es un ejemplo de una unidad de generación de flujo que genera
un flujo que incluye información suplementaria e imágenes añadiendo
la información suplementaria generada a cada unidad de acceso
aleatorio correspondiente. La unidad de codificación de longitud
variable VLC codifica y coloca la unidad NAL para almacenar
información de reproducción trucada en la AU superior de una unidad
de acceso aleatorio RAU.
La figura 22 es un diagrama de flujo de cómo el
aparato 100 de codificación de imágenes en
movimiento(principalmente la unidad de generación de
información de reproducción trucada TrickPlay) mostrado en la
figura 21 realiza el procedimiento de generación de un flujo
codificado que incluye información de reproducción trucada.
En primer lugar, en la etapa 10, el aparato 100
de codificación de imágenes en movimiento evalúa si o no la AU a
codificar es la AU superior de una unidad de acceso aleatorio RAU.
En el caso donde es la AU superior, se pasa a la Etapa 11, mientras
que en el caso donde no es la AU superior, se pasa a la etapa 12 en
la etapa 11, el aparato 100 de codificación de imágenes en
movimiento realiza el procedimiento inicial para generar
información de reproducción trucada de la unidad de acceso aleatorio
RAU, e igualmente, si asegura el área para almacenar la información
de reproducción trucada en la AU superior de la unidad de acceso
aleatorio RAU. En la etapa 12, el aparato 100 de codificación de
imágenes en movimiento codifica los datos AU, y se pasa entonces a
la etapa 13. En la etapa 13, el aparato 100 de codificación de
imágenes en movimiento obtiene la información necesaria en el
momento de generar información de reproducción trucada. Tal
información es: los tipos de imágenes de la AU, es decir, una
imagen I, una imagen P, una imagen B de referencia, o una imagen B
de no-referencia, o si hay necesidad de descodificar
la AU en el momento de realizar la reproducción a una velocidad
multiplicada por N. Después de esto, el aparato 100 de codificación
de imágenes en movimiento pasa a la etapa 14. En la etapa 14, el
aparato 100 de codificación de imágenes en movimiento evalúa si la
AU es la última AU de la unidad de acceso aleatorio RAU. En el caso
donde es la última AU, el aparato 100 de codificación de imágenes
en movimiento pasa a la etapa 15, mientras que en el caso donde no
es la última AU, pasa a la etapa 16. En la etapa 15, el aparato 100
de codificación de imágenes en movimiento determina información de
reproducción trucada, genera la unidad NAL para almacenar la
información de reproducción trucada, y almacena la unidad NAL
generada en el área asegurada en la etapa 11. Después completar el
procedimiento de la etapa 15, el aparato 100 de codificación de
imágenes en movimiento pasa a la etapa 16. En la etapa 16, el
aparato 100 de codificación de imágenes en movimiento evalúa si o
no hay una AU a codificar a continuación. En el caso donde hay una
AU a codificar, se repite la etapa 10 y las siguientes etapas,
mientras que en el caso donde no hay AU a codificar, se completa el
procesamiento. Aquí, en el caso donde el aparato 100 de codificación
de imágenes en movimiento evalúa que no hay AUs a codificar en la
etapa 16, almacena información de reproducción trucada de la última
unidad de acceso aleatorio RAU, y a continuación completa el
procesamiento.
procesamiento.
Por ejemplo, cuando el aparato 100 de
codificación de imágenes en movimiento genera información de
reproducción trucada mostrada en la figura 18A, obtiene lo
siguiente en la etapa 13: el tipo de imagen; si la imagen tiene una
estructura de campo o la imagen tiene una estructura de trama; o/y
la información que indica si el campo de visualización de la
imagen es equivalente a dos imágenes o equivalente a tres imágenes
en el caso donde la información en cuanto a un avance
3-2 se incluye en el flujo codificado. En la etapa
15, el aparato 100 de codificación de imágenes en movimiento
establece picture_structure y picture_type de todas las imágenes en
la unidad de acceso aleatorio RAU en un orden de
descodificación.
Obsérvese que, en el caso donde la dimensión de
la unidad NAL para almacenar información de reproducción trucada no
se conoce en el momento de iniciar la codificación de la AU superior
de una unidad de acceso aleatorio RAU, el procesamiento para
asegurar el área para almacenar la información de reproducción
trucada se omitirá en la etapa 11. En este caso, la unidad NAL
generada para almacenar información de reproducción trucada se
inserta en la AU superior en la etapa 15.
Igualmente, almacenar o no almacenar la
información de reproducción trucada se puede conmutar sobre una base
de flujo codificado. Especialmente en el caso donde la estructura
de predicción entre AUs que constituyen una unidad de acceso
aleatorio se prescribe por aplicación, es posible determinar que la
información de reproducción trucada no se almacena. Por ejemplo, en
el caso donde un flujo codificado tiene la misma estructura de
predicción como en el caso de un flujo de MPEG-2,
no hay necesidad de almacenar información de reproducción trucada.
Esto es debido al hecho de que es posible determinar las AUs
necesarias a descodificar en el momento de la reproducción trucada
sin información de reproducción trucada. Obsérvese que tal
conmutación se puede llevar a cabo sobre la base de una unidad de
acceso aleatorio RAU.
La figura 23 es un diagrama de bloques que
muestra la estructura del aparato 108 de multiplexado de imágenes
en movimiento de la presente invención. Este aparato 108 de
multiplexado de imágenes en movimiento introduce datos de imágenes
en movimiento, codifica los datos de imágenes en movimiento para
realizar un flujo AVC MPEG-4, multiplexa el flujo
con la información de acceso a las AUs que constituyen el flujo y la
información de gestión que incluye la información suplementaria
para determinar operaciones realizadas en el momento de la
reproducción trucada, y graba el flujo multiplexado. El aparato 108
de multiplexado de imágenes en movimiento incluye una unidad 101 de
determinación de atributos de flujo, una unidad de codificación 102,
una unidad 103 de generación de información de gestión, una unidad
de multiplexado 106 y una unidad de almacenamiento 107. Aquí, la
unidad de codificación 102 tiene una función para añadir información
de reproducción trucada en el aparato 100 de codificación de
imágenes en movimiento mostrado en la figura 21.
La unidad 101 de determinación de atributos de
flujo determina los requisitos concernientes a la reproducción
trucada realizada en el momento de la codificación de un flujo
MPEG-4 AVC, y los envía a la unidad de codificación
102 y la unidad 105 de generación de información de soporte de
reproducción como información de atributo TYPE. Aquí, los
requisitos concernientes a la reproducción trucada incluyen
información que indica: si o no el requisito para constituir una
unidad de acceso aleatorio se aplica a un flujo
MPEG-4 AVC; si la información que indica las AUs a
descodificar o visualizar en el momento de reproducción a velocidad
variable o reproducción inversa se incluye en el flujo; o si o no
se establece un requisito sobre la estructura de predicción entre
AUs. La unidad 101 de determinación de atributos de flujo envía, a
la unidad de generación de información de gestión general 104, la
información de gestión general que es la información necesaria para
generar información de gestión tal como un formato de compresión
una resolución. La unidad de codificación 102 codifica los datos de
vídeo introducidos en el flujo MPEG-4 AVC basándose
en la información de atributo TYPE, envía los datos codificados a
la unidad de multiplexado 106, y envía la información de acceso en
el flujo a la unidad 104 de generación de información de gestión
general. Aquí, en el caso donde la información de atributo TYPE
muestra que la información que indica las AUs a descodificar o
visualizar en el momento de reproducción a velocidad variable o
reproducción inversa no se incluye en el flujo, la información de
reproducción trucada no se incluye en el flujo codificado.
Obsérvese que la información de acceso indica la información de una
de acceso que es la unidad básica accediendo al flujo, e incluye la
dirección de inicio, el tiempo de visualización y similar de la AU
superior en una unidad de acceso. La unidad 104 de generación de
información de gestión general genera los datos de tabla a referir
al tiempo de acceso a un flujo y los datos de tabla que almacenan
información de atributos tal como un formato de compresión basado
en la información de acceso y la información de gestión general, y
envía los datos de tabla a la unidad de multiplexado 106 como la
información de gestión INFO. La unidad 105 de generación de
información de soporte de reproducción genera información de soporte
HLP que indica si el flujo tiene una estructura de acceso aleatorio
basada en la información de atributo introducida TYPE, y envía la
información de soporte HLP a la unidad de multiplexado 106. La
unidad de multiplexado 106 genera datos codificados introducidos a
través de la unidad de codificación 102, la información de gestión
INFO, y los datos de multiplexado multiplexando la información de
soporte HLP, y los envía a la unidad de almacenamiento 107. La
unidad de almacenamiento 107 graba los datos de multiplexado
introducidos a través de la unidad de multiplexado 106 en un
soporte de grabación tal como un disco óptico, un disco duro y una
memoria. Obsérvese que la unidad de codificación 102 puede
paquetizar el flujo MPEG-4 AVC en, por ejemplo, un
TSs MPEG-2 (flujos de transporte) o un PSs
MPEG-2 (flujos de programa) y a continuación envía
los TSs o PSs MPEG-2 paquetizados. Igualmente, la
unidad de codificación 102 puede paquetizar el flujo que usa un
formato prescrito por la aplicación tal como un BD.
Obsérvese que los contenidos de la información
de gestión no necesitan depender de si la información de
reproducción trucada se almacena en el flujo codificado o no. En
ese momento, la información de soporte HLP se puede omitir.
Igualmente, el aparato 108 de multiplexado de imágenes en movimiento
puede tener la estructura sin una unidad 105 de generación de
información de soporte de reproducción.
Las figuras 24A y 24B muestran ejemplos de la
información mostrada por la información de soporte HLP. La
información de soporte HLP incluye el procedimiento que indica
directamente la información de un flujo como se muestra en la
figura 24A, y el procedimiento que indica si el flujo satisface el
requisito prescrito por una norma de aplicación específica, como se
muestra en la figura 24B.
La figura 24A muestra lo siguiente como
información concerniente a un flujo: información en cuanto a si el
flujo tiene una estructura de acceso aleatorio; información en
cuanto a si hay un requisito sobre la estructura de predicción
entre imágenes almacenadas en una AU; e información en cuanto a si
hay información que indica las AUs a descodificar o visualizar en
el momento de reproducción trucada,
Aquí la información relativa a las AUs a
descodificar o visualizar en el momento de reproducción trucada
puede indicar directamente AUs a descodificar o visualizar o indican
las prioridades en el momento de descodificar o visualizar. Por
ejemplo, se puede indicar que la información que indica que las AUs
a descodificar o visualizar sobre una base de unidad de acceso
aleatorio se almacena en una unidad NAL que tiene un tipo de unidad
NAL especial prescrito por aplicación. Un mensaje SEI o similar.
Obsérvese que es posible indicar si hay información que indica la
estructura de predicción entre las AUs que constituyen una unidad de
acceso aleatorio. Igualmente, la información relativa a las AUs a
descodificar o visualizar en el momento de reproducción trucada se
puede añadir sobre la base de una o más unidades de acceso
aleatorio o a cada una de las AUs que constituye la unidad de
acceso aleatorio.
Además, en el caso donde la información que
indica las AUs a descodificar o visualizar se almacena en la unidad
NAL que tiene un tipo especial, es posible mostrar el tipo de unidad
NAL. En el ejemplo de la figura 25, en la información de soporte
HLP, la información relativa a las AUs a descodificar o visualizar
en el momento de reproducción trucada se incluye en la unidad NAL
cuyo tipo de unidad NAL es 0. En ese momento, es posible obtener la
información relativa a la reproducción trucada desmultiplexando la
unidad Nal cuyo tipo de unidad NAL es 0 a partir de los datos AU
del flujo. En el caso donde la información relativa a la
reproducción trucada se almacena usando un mensaje SEI, es posible
indicar la información para identificar el mensaje SEI.
Igualmente, en cuanto a los requisitos sobre las
estructuras de predicción, es posible indicar si uno o más
requisitos predeterminados se satisfacen, o es posible indicar que
los siguientes requisitos respectivos se satisfacen
independientemente:
- (i)
- en cuanto a las AUs de una imagen I e imágenes P, el orden de descodificación deberían coincidir con el orden de visualización;
- (ii)
- la AU de una imagen P no se puede referir a la AU de una imagen B;
- (iii)
- las AUs después de la AU superior en un orden de visualización en una unidad de acceso aleatorio se puede referir solamente a las AUs incluidas en la unidad de acceso aleatorio; y
- (iv)
- cada AU se puede referir a solamente las AUs colocadas hasta Números antes y después en el orden de descodificación. En este caso, todas las AUs se cuentan juntas o las AUs se cuentan sobre una base de AU de referencia, y el valor de N se puede mostrar en la información de soporte HLP.
\vskip1.000000\baselineskip
Obsérvese que, en MPEG-4 AVC,
es posible utilizar, como imágenes de referencia, imágenes sobre las
cuales se realiza el procedimiento de filtrado (desbloqueo) para
eliminar la distorsión de bloque después de l descodificación para
mejorar la calidad de imagen, y es posible utilizar como imágenes
para visualización, imágenes antes del desbloqueo. En este caso, el
aparato de descodificación de imágenes en movimiento necesita
mantener los datos de imagen antes y después del desbloqueo. Por lo
tanto, es posible almacenar, en la información de soporte HLP, la
información que indica si hay una necesidad de mantener las imágenes
antes del desbloqueo para el uso de la visualización. La norma
MPEG-4 AVC define la dimensión máxima de una memoria
intermedia (DPB : Memoria intermedia de imágenes descodificadas)
necesaria para almacenar las imágenes de referencia o las imágenes
a visualizar como los resultados de descodificación. Por lo tanto,
con una memoria intermedia DPB que tiene la dimensión máxima o una
memoria intermedia que tiene la dimensión máxima prescrita por
aplicación, es posible indicar si el procedimiento de
descodificación se puede realizar sin fallo incluso en el caso de
almacenar las imágenes para visualización de las imágenes de
referencia. Obsérvese que, con el fin de almacenar las imágenes
antes del desbloqueo de las imágenes de referencia, es posible
indicar la dimensión de memoria intermedia a asegurar, además de la
dimensión necesaria como DPB, usando el número de bytes o el número
de tramas. Aquí, si se realiza el desbloqueo sobre cada imagen o no
se puede obtener a partir de la información en el flujo, o la
información exterior al flujo tal como información de gestión. En el
caso de obtener la información en el flujo, por ejemplo, se puede
obtener a partir de un SEI. Además, en el caso de la descodificación
de un flujo MPEG-4 AVC, es posible evaluar si las
imágenes antes del desbloqueo de las imágenes de referencia se
pueden usar para visualizar o no se pueden evaluar basándose en la
dimensión de la memoria intermedia que se puede usar en la unidad
de descodificación y la información anteriormente descrita, y
entonces es posible determinar como se visualizan las imágenes.
Obsérvese que toda la información o una parte de
la información se puede incluir como información de soporte HLP.
Igualmente, es posible incluir información necesaria basada en una
condición predeterminada, por ejemplo, para incluir información en
cuanto a la presencia o ausencia de información de reproducción
trucada solamente en el caso donde no hay requisito relativo a la
estructura de predicción. Igualmente, la información distinta de la
información anteriormente descrita se puede incluir en la
información de soporte HLP.
La figura 24B no indica directamente la
información relativa a la estructura de un flujo, pero indican si
un flujo satisface los requisitos sobre las estructuras de flujo
prescritas por la norma de disco Blu-ray
(BD-ROM) o la norma de DVD de Alta definición (HD)
que es la norma para almacenar imágenes de alta definición en un
DVD. Igualmente, en el caso donde se definen diversos modos como los
requisitos de un flujo en una norma de aplicación tal como la norma
BD-ROM o similar, la información que indica el modo
aplicado se puede almacenar. Por ejemplo, se usan los siguientes
modos: el modo 1 que indica que no hay ningún requisito; el modo 2
que indica que el flujo tiene una estructura de acceso aleatorio e
incluye la información para especificar AUs a descodificar en el
momento de reproducción trucada; y similar. Obsérvese que es posible
indicar si el flujo satisface los requisitos prescritos en el
servicio de comunicación tal como descarga o emisión, o una norma
de radiodifusión.
Obsérvese que es posible indicar tanto la
información mostrada en la figura 24A y la información mostrada en
la figura 24B. Igualmente, en el caso donde se conoce que el flujo
satisface los requisitos en una norma de aplicación específica, es
posible almacenar los requisitos en la norma de aplicación
convirtiendo la estructura de flujo en el formato para la
descripción directa como se muestra en la figura 24A, en lugar de
indicar si el flujo satisface la norma de aplicación
Obsérvese que es posible almacenar la
información que indica las AUs a descodificar o visualizar en el
momento de la reproducción trucada como información de gestión.
Igualmente, en el caso donde el contenido de la información de
soporte HLP se conmuta en un flujo, se puede indicar la información
de soporte HLP sobre una base de sección a sección.
La figura 26 es un diagrama de flujo que muestra
las operaciones del aparato 108 de multiplexado de imágenes en
movimiento. En la etapa 51, la unidad 101 de determinación de
atributo de flujo determina la información de atributo TYPE basada
en los ajustes de usuario las condiciones predeterminadas. En la
etapa 52, la unidad de codificación 102 codifica un flujo basado en
la información de atributo TYPE. En la etapa 53, la unidad 105 de
generación de información de soporte de reproducción genera la
información de soporte HLP basada en la información de atributo
TYPE. En consecuencia, en la etapa 54, la unidad de codificación 102
genera la información de acceso sobre la base de una unidad de
acceso del flujo codificado, y la unidad 104 de generación de
información de gestión general genera la información de gestión
INFO añadiendo información de acceso a la otra información
necesaria (información de gestión general). En la etapa 55, la
unidad de multiplexado 106 multiplexa un flujo, la información de
soporte HLP y la información de gestión INFO. En la etapa 56, la
unidad de almacenamiento 107 graba los datos multiplexados.
Obsérvese que la etapa 53 se puede realizar antes de la etapa 52, o
después de la etapa 54.
Obsérvese que la unidad de codificación 102
puede almacenar la información mostrada en la información de soporte
HLP en un flujo. En este caso, la información mostrada en la
información de soporte HLP se almacena en la unidad NAL para
almacenar reproducción trucada. Por ejemplo, en el caso donde las
imágenes P no se refiere a las imágenes B, es posible descodificar
solamente una imagen I ye imágenes P en el momento de la
reproducción a velocidad variable. Por lo tanto, se almacena la
indicación de indicador que indica si solamente una imagen I e
imágenes P se puede descodificar y visualizar. Igualmente, hay un
caso donde algunas AUs a descodificar en el momento de la
reproducción a velocidad variable no pueden obtener un SPs o un PPS
a partir de las AUs a las que se debería referir mediante las AUs
respectivas. En el caso donde el PPs referido por una imagen P se
almacena solamente en la AU de una imagen B en el caso de
descodificar solamente una imagen I e imágenes P. En este caso, hay
una necesidad de obtener el PPs necesario para descodificar la
imagen P a partir de la AU de una imagen B. Por lo tanto, es
posible incluir información de indicador que indica si el SPS o el
PPs referidos por cada AU a descodificar en el momento de
reproducción a velocidad variable se puede obtener seguramente a
partir de una de las otras AUs a descodificar en el momento de
reproducción a velocidad variable. Al hacerlo de este modo es
posible realizar la operación para de este modo detectar un SPs o un
PPS también a partir de la AU de una imagen no destinada a ser
descodificada en el momento de reproducción a velocidad variable
solamente en el caso donde no se establece un indicador. Igualmente,
en el momento cuando se muestra que solamente una imagen I e
imágenes P se puede descodificar y visualizar, es posible ajustar la
velocidad de reproducción descodificando también imágenes B,
especialmente imágenes B de referencia referidas por otras
imágenes.
Igualmente, es posible almacenar la información
de indicador en el encabezamiento de otra unida NAL tal como SPS,
PPS o un segmento, en lugar de usar cualquier unidad NAL para
almacenar reproducción trucada. Por ejemplo, en el caso donde un
SPs referido por una AU que constituye una unidad de acceso
aleatorio RAU se almacena en la AU superior en la unidad de acceso
aleatorio RAU, el campo nal_ref_idc de la unidad NAL de un SPS puede
indicar la información de indicador. Como se define que el valor de
nal_ref_idc es 1 o más en la unidad NAL de un SPS, es posible
establecer siempre el bit de orden elevada en 1 e indicar la
información de indicador mediante el bit de orden baja.
Obsérvese que, el contenido de la información de
soporte HLP se puede almacenar en un flujo o una información de
gestión, o ambas. Por ejemplo, el contenido se puede mostrar en
información de gestión en el caso donde el contenido de la
información de soporte HLP se fija en un flujo, mientras que el
contenido se puede mostrar en un flujo en el caso donde el
contenido es variable. Igualmente es posible almacenar la
información de indicador que indica si la información de soporte
HLP se fija o no en la información de gestión. Igualmente, en el
caso donde la información de soporte HLP se predetermina en una
norma de aplicación tal como un BD:ROM o una RAM, o en el caso
donde la información de soporte HLP es proporcionada por separado
por comunicación o radiodifusión, la información de soporte HLP no
se almacena.
La figura 27 es un diagrama de bloques del
aparato 200 de descodificación de imágenes en movimiento que realiza
el procedimiento de descodificación de imágenes en movimiento de la
presente invención. Este aparato 200 de descodificación de imágenes
en movimiento reproduce un flujo codificado mostrado en las figuras
8A y 8B a 20. Se puede realizar no solamente la reproducción sino
también la reproducción trucada tal como reproducción a saltos,
reproducción a velocidad variable y reproducción inversa. El aparato
200 de descodificación de imágenes en movimiento incluye, además,
una unidad de extracción de flujo EXT y una unidad de selección de
AUs a descodificar descodificada Ausel, además de las unidades de
un aparato 2 de descodificación convencional mostrado en la figura
5. Obsérvese que las unidades de procesamiento que realizan las
mismas operaciones que las unidades de procesamiento respectivas
del aparato 2 de descodificación convencional mostrado en el
diagrama de bloques de la figura 5 se les asignan los mismos
números de referencia y se omiten sus descripciones.
La unidad de selección de AUs a descodificar
Ausel determina las AUs necesarias a descodificar basadas en la
información de reproducción trucada Grpinf descodificada en la
unidad de descodificación de longitud variable VLD, según una
instrucción de reproducción trucada introducida desde el exterior.
Aquí, la instrucción que indica reproducción trucada se introduce
desde la unidad de selección de AUs a descodificar Ausel. Además,
la unidad de selección de AUs a descodificar Ausel notifica a la
unidad de extracción de flujo EXT de DecAU que es la información
que indica las AUs determinadas como AUS necesarias a descodificar.
La unidad de extracción de flujo EXT extrae solamente el flujo
correspondiente a las AUS que se evalúan como las AUs necesarias a
descodificar por la unidad de selección de AUS a descodificar Ausel,
y a continuación transmite el flujo a la unidad de descodificación
de longitud variable VLD.
La figura 28 es un diagrama de flujo de la
manera en que el aparato 200 de descodificación de imágenes en
movimiento (principalmente la unidad de selección de AUs a
descodificar Ausel) mostrado en la figura 27 realiza el
procedimiento de descodificación de un flujo que incluye información
de reproducción trucada en el momento de realizar la reproducción
trucada.
En primer lugar, en la etapa 20, la unidad de
selección de AUs a descodificar Ausel evalúa si la AU es la AU
superior de una unidad de acceso aleatorio RAU detectando un SPs o
similar en el flujo. En el caso donde la AU es la AU superior,
pasa a la etapa 21, mientras que en le caso donde la AU no es la AU
superior, pasa a la etapa 22. Aquí, la posición de inicio de la
unidad de acceso aleatorio RAU se puede obtener a partir de
información de gestión tal como mapa de tiempo. Especialmente en el
caso donde se determina, la posición de inicio de reproducción en
el momento de la reproducción por saltos o solamente se selecciona
la imagen superior de la unidad de acceso aleatorio RAU y se
realiza la reproducción a alta velocidad sobre la imagen superior
seleccionada, es posible determinar la posición de inicio de la
unidad de acceso aleatorio RAU referida al mapa de tiempo. En la
etapa 21, la unidad de selección de AUs a descodificar Ausel obtiene
la información de reproducción trucada a partir de los datos AU,
analiza los datos AU y determina los AUs a descodificar antes de
pasar a la etapa 22. En la etapa 22, la unidad de selección de AUs a
descodificar Ausel evalúa si la AU es la AU que se determina en la
etapa 21 como la AU a descodificar. En el caso donde es la AU
determinada, el aparato 200 de descodificación de imágenes en
movimiento descodifica la AU en la etapa 23, mientras que en el
caso donde no es la AU determinada, pasa a la etapa 24. En la etapa
24, el aparato 200 de descodificación de imágenes en movimiento
evalúa queda alguna AU a descodificar. En el caso donde hay una AU
el aparato 200 de descodificación de imágenes en movimiento repite
el proceso de la etapa 20, y las siguientes etapas, mientras que en
el caso donde no hay AU, se completa el proceso. Obsérvese que es
posible omitir el proceso de la etapa 21 y la etapa 22, u omitir el
proceso de determinación en la etapa 21, y enviar la información
que indica que todas las AUs se descodifican en el momento de la
reproducción normal donde todas las AUs se descodifican y
visualizan en orden.
La figura 29 es un diagrama de flujo que indica
el proceso (el proceso por la unidad de selección de AUs a
descodificar Ausel) en la etapa 21. En primer lugar, la unidad de
selección de AUs a descodificar Ausel detecta la posición de inicio
de una unidad NAL que constituye una AU buscando los datos AU para
un prefijo de código de inicio, empezando con el byte superior en
la etapa 30, y pasa a la etapa 31. Obsérvese que se puede buscar un
prefijo de código de inicio que empieza con no el byte superior de
los datos AU sino otra posición tal como la posición de extremo de
un Delimitador de Unidad de Acceso. En la etapa 31, la unidad de
selección de AUs a descodificar Ausel obtiene el tipo de unidad Nal
de una unidad NAL, y pasa a la etapa 32. En la etapa 32, la unidad
de selección de AUs a descodificar Ausel evalúa si el tipo de unidad
NAL obtenido en la etapa 31 es el tipo de unidad NAL para almacenar
información de reproducción trucada. En el caso donde la información
de reproducción trucada se almacena, se pasa a la etapa 33,
mientras que en el caso donde la información de reproducción
trucada no se almacena, se repite el procedimiento de la etapa 30 y
las siguientes etapas. Aquí, en el caso donde la información de
reproducción trucada se almacena en un mensaje SEI, la unidad de
selección de AUs a descodificar Ausel obtiene la unidad NAL de una
SEI en primer lugar, y evalúa, además, si el mensaje SEI para
almacenar la información de reproducción trucada se incluye en la
unidad Nal o no. En la etapa 33, la unidad de selección de AUs a
descodificar Ausel obtiene información de reproducción trucada, y se
pasa a la etapa 34. En la etapa 34, la unidad de selección de AUs a
descodificar Ausel determina las imágenes necesarias a descodificar
en el momento de realizar una operación de reproducción trucada
especificada. Por ejemplo siempre que se especifique la
reproducción a doble velocidad. En el caso donde la información de
reproducción trucada indica que es posible realizar la reproducción
a doble velocidad descodificando y reproduciendo solamente una
imagen I, imágenes P e imágenes B de referencia, se determina que
estos tres tipos de imágenes se descodifican y reproducen.
Obsérvese que, en el caso donde la información de reproducción
trucada no se detecta en la imagen superior de la unidad de acceso
aleatorio RAU en el proceso desde la etapa 30 a la etapa 32, las
imágenes necesarias a descodificar en orden para realizar la
operación de reproducción trucada se determinan según un
procedimiento predeterminado. Como ejemplo, es posible evaluar si la
imagen es una imagen de referencia o no por referencia al campo que
indica el tipo de imagen de una imagen en un Delimitador de Unidad
de Acceso, o comprobando nal_ref_idc del encabezamiento de la
unidad NAL. Por ejemplo, es posible distinguir imágenes B de
referencia de imágenes B de no-referencia por
referencia a ambas del campo que indica los tipos de imágenes y
nal_ref_idc.
La figura 30 es un diagrama de flujo que indica
el proceso (el procedimiento por la unidad de selección de AUs a
descodificar Ausel) en el caso donde todas las AUs a descodificar
no se visualizan siempre. Las etapas para realizar el mismo
proceso que las etapas en el diagrama de flujo de la figura 28 se
les asignan los mismos números de referencia, y se omite su
descripción. En la etapa 41, la unidad de selección de AUs a
descodificar Ausel obtiene y analiza información de reproducción
trucada, determina las AUs a descodificar y las AUs a visualizar en
una operación de reproducción trucada especificada, y se pasa a la
etapa 42. En la etapa 42, la unidad de selección de AUs a
descodificar Ausel evalúa si las AUs a descodificar coinciden
completamente con las AUs a visualizar. En el caso donde hay una
coincidencia completa, se pasa a la etapa 22, mientras que en caso
donde no hay coincidencia completa, se pasa a la etapa 43. En la
etapa 43, la unidad de selección de AUs a descodificar Ausel envía
información de lista de AUs a visualizar, y se pasa a la etapa 22.
La información de lista de las AUs enviadas se usa en una etapa (no
mostrada en una figura) para determinar AUs a visualizar de entre
las AUs descodificadas.
Obsérvese que, en AVCMPEG-4, es
posible usar, como imágenes de referencia, imágenes sobre las cuales
se realiza el procedimiento de filtrado (desbloqueo) para
eliminar la distorsión de bloque después de la descodificación para
mejorar la calidad de imagen, y es posible utilizar como imágenes
como imágenes de visualización, imágenes antes del desbloqueo. En
este caso, el aparato de descodificación de imágenes en movimiento
200 necesita mantener los datos de imagen antes y después del
desbloqueo. Aquí, a condición de que el aparato 200 de
descodificación de imágenes en movimiento tenga una memoria que
puede almacenar datos postdescodificación equivalentes a cuatro
imágenes, en el caso donde almacena los datos de imagen antes y
después del desbloqueo en la memoria. La memoria necesita almacenar
datos equivalente a dos imágenes para mantener imágenes antes del
desbloqueo de las imágenes de referencia. Sin embargo, como se ha
descrito anteriormente, es deseable que se puedan contener en la
memoria tantas imágenes como sea posible en el momento de la
reproducción inversa. A condición de que el aparato 200 de
descodificación de imágenes en movimiento utilice las imágenes
después del desbloqueo también para el uso de visualización, se
pueden contener datos de cuatro imágenes en una memoria porque no se
necesita almacenar imágenes antes del desbloqueo. Por lo tanto,
visualizar imágenes antes del desbloqueo para mejorar la calidad
de imagen en el momento de la reproducción en una dirección normal y
visualizar imágenes después del desbloqueo en el momento de la
reproducción inversa hace que sea posible contener más imágenes en
una memoria, y reducir la cantidad de procesamiento en el momento
de la reproducción inversa. Por ejemplo, en el ejemplo de las
figuras 15A a 15C que muestran una lista de AUS de una imagen I e
imágenes P como información de reproducción trucada, todos los
datos de cuatro imágenes se pueden contener en una memoria en el
momento de la reproducción inversa, mientras que los siguientes
conjuntos de dos imágenes, que se seleccionan arbitrariamente de
entre I0, P3, P6 y P9, se pueden contener en la memoria al mismo
tiempo en el momento de la reproducción en una dirección normal: I0
y P3; P3 y P6; y P6 y P9.
\vskip1.000000\baselineskip
Una función de reproducción trucada es
especialmente importante en un aparato de disco óptico que reproduce
soportes de paquetes. Aquí, se describirá un ejemplo de grabación
de información de reproducción trucada descrita anteriormente en un
disco Blu-ray (BD) que es un disco óptico de
siguiente generación.
En primer lugar, se describirá un formato de
grabación de un BD-ROM.
La figura 31 es un diagrama que indica la
estructura del BD-ROM especialmente las estructuras
de un disco BD 114 que es un soporte en disco, y los datos 111,
112 y 113 almacenados en el disco. Los datos almacenados en el
disco BD 114 incluye datos VA 113, información de gestión BD 112
tal como información de gestión relativa a los datos VA y una
secuencia de reproducción VA, y un programa de reproducción BD 111
que realiza interactividad. Aquí, por motivos de conveniencia, la
descripción del disco BD se hará enfocada sobre la aplicación VA
para reproducir contenidos de audio y visuales de películas pero se
puede hacer una descripción similar enfocada en otro uso.
La figura 32 es un diagrama que muestra la
estructura de un fichero directorio de datos lógicos almacenados en
el disco BD anteriormente descrito. Un disco BD tiene un área de
grabación desde su radio más interior a su radio más exterior como,
por ejemplo un DVD, un DC y similar, y tiene espacio de dirección
lógica para almacenar datos lógicos entre la entrada por lectura
en el radio más interno y la salida por lectura en el radio
exterior. Igualmente, en el interior de la entrada por lectura, hay
un área especial que se puede leer solamente mediante una unidad
denominada Area de corte de ráfaga (BCA). Como este área no se puede
leer a partir de la aplicación, se puede usar para, por ejemplo,
una técnica de protección de propiedad intelectual.
La información de sistema de fichero (volumen se
almacena en la parte superior del espacio de dirección lógica, y
datos de aplicación tales como datos de vídeo se almacenan también
ahí. Como se ha descrito en la técnica anterior, un sistema de
archivos es, por ejemplo, el UDF o la ISO9660, y permite la lectura
de los datos lógicos almacenados usando una estructura de
directorio o una estructura de ficheros como en el caso de un
ordenador personal normal.
En esta realización, como la estructura de
directorio y la estructura de ficheros sobre el disco BD, se coloca
el directorio BDVIDEO inmediatamente por debajo de un directorio
raíz (ROOT). Este directorio es un directorio que almacena datos
tales como contenido VA o información de gestión (101, 102 y 103 que
se describen en la figura 32) que se maneja en el BD.
Por debajo del directorio BDVIDEO, se graban los
siguientes siete archivos.
- (i)
- BD. INFO (el nombre de archivo es fijo) que es un fragmento de "información de gestión de BD" y es un archivo que almacena la información relativa a todo el disco BD. El reproductor de BD lee en primer lugar este archivo.
- (ii)
- BD. PROG (el nombre de archivo es fijo) que es uno de los "programas de reproducción de BD" y es un archivo que almacena la información de control de reproducción relativa a todo el disco BD.
- (iii)
- XXX. PL /"XXX" es variable, y la extensión "PL" es fija'') que es una pieza de "información de gestión de BD" y es un archivo que almacena la información de lista de reproducción que es un guión (secuencioa de reproducción). Cada lista de reproducción tiene un archivo.
- (iv)
- XXX. PROG ("XXX" es variable, y la extensión "PROGR" es fija) que es uno de los "programas de reproducción BD" y es un archivo que almacena la información de control de reproducción preparada sobre la base de listas de reproducción. La lista de reproducción correspondiente se identifica basada en un nombre de cuerpo de archivo (basado en la coincidencia de "XXX").
- (v)
- YYY. VOB ("YYY" es variable, y la extensión "VOB" es fija) que es uno de los "datos VA" y es un archivo que almacena el VOB (Lo mismo que el VOB descrito en la técnica anterior). Cada VOB tiene un archivo.
- (vi)
- YYY. VOBI("YYY" es variable, y la extensión "VOBI" es fija) que es un fragmento de la "información de gestión de BD" y es archivo que almacena la información de gestión de flujo relativo al VOB que es el dato Va. La lista de reproducción correspondiente se identifica basada en un nombre de cuerpo de archivo (basado en una coincidencia de "YYY").
- (vii)
- ZZZ. PNG ("ZZZ" es variable, y la extensión "PNG" es fija) que es uno de los "datos VA" y es un archivo que almacena datos de imagen PNG (que es un formato de imagen normalizado por W3C y denominado "ping" para constituir subtítulos y menús. Cada imagen PNG tiene un archivo.
La estructura de datos de navegación BD
(información de gestión BD) se describirá con referencia a las
figuras 33 a 38.
La figura 33 es un diagrama que muestra la
estructura interna de un archivo de información de gestión VOB
("YYY. VOBI". La información de gestión VOB tiene la
información de atributo de flujo (Attribute) de VOB y un mapa de
tiempo (TMAP). El atributo de flujo tiene atributo de vídeo (Video)
y atributo de audio (Audio#0 a Audio#m) por separado. Especialmente
en el caso de flujo de audio, como un VOB tiene diversos flujos de
audio al miso tiempo, la presencia o ausencia de un campo de datos
se indica por el número (Number) de flujos de audio.
Lo siguiente son atributos de vídeo (Video)
almacenados en campos respectivamente y los valores que los campos
respectivos pueden tener:
- (i)
- fomato de compresión (Coding): MPEG-1; MPEG-2; MPEG-4; y MPEG-4AVC (Codificación de vídeo avanzada)-
- (ii)
- Resolucion (Resolution): 1920 x 1080; 1440x1080; 1280x720; 720x480, y 720x565
- (iii)
- relación de aspecto (Aspect): 4 a 3; y 16 a 9.
- (iv)
- frecuencia de trama (Framerate): 60; 59,94 (60/1,.001), 50; 30; 29,97 (30/1,001), 25; 24; y 23,976 (24/1,001).
Lo siguiente son atributos de audio (Audio)
almacenados en campos respectivamente y los valores que los
respectivos campos pueden tener.
- (i)
- formato de compresión (Coding): AC3; MPEG-1; MPEG-2; y LPCM.
- (ii)
- el número de canales (Ch): 1 a 8
- (iii)
- atributo de idioma (Language):
El mapa de tiempo (TMAP) es una tabla para
almacenar la información sobre una base VOBU, y tiene el número de
VOBUs que el VOB tiene y los fragmentos respectivos de información
VOBU (VOBU#1 a VOBU#n). Los fragmentos respectivos de información
VOBU incluyen I_start que es la dirección (la dirección de inicio de
una imagen I) del paquete TS superior de un VOBU y una dirección
desfasada (I_end) hasta la dirección de extremo de la imagen I, y
el tiempo de inicio de reproducción (PTS) de la imagen I.
La figura 34 es un diagrama que ilustra los
detalles de la información VOBU. Como es ampliamente conocido, como
se puede realizar la compresión de velocidad binaria variable en el
flujo de vídeo MPEG para grabar el flujo de vídeo en alta calidad,
no hay proporcionalidad entre el tiempo de reproducción y la
dimensión de datos. Por otra parte, como se realiza una compresión
de velocidad binaria fija en AC3 que es una norma de compresión de
audio, la relación entre el tiempo y la dirección se puede obtener a
partir de una expresión primaria. Sin embargo, en el caso de datos
de vídeo MPEG, cada trama tiene un tiempo de visualización fijo,
por ejemplo, una trama tiene un tiempo de visualización de 1/29,97
segundos en el caso de NTSC, pero la dimensión de datos después de
comprimir cada cambio de trama depende en gran medida de la
característica de imagen, o del tipo de imagen usado en la
compresión, tal como una imagen I, una imagen P o una imagen B. Por
lo tanto, en el caso de un flujo de vídeo MPEG, es imposible
representar la relación entre el tiempo y la dirección usando una
expresión primaria.
Como se puede esperar, es imposible representar
la relación entre el tiempo y la dimensión de datos usando una
expresión primaria en un flujo de sistema MPEG donde los datos de
vídeo MPEG se multiplexan, es decir un VOB. Por lo tanto, un mapa
de tiempo (TMAP) asocia el tiempo a la dirección en un VOB.
De esta manera, en el caso donde se da
información de tiempo, el VOBU al cual pertenece el tiempo se busca
en primer lugar (siguiendo PTSs de VOBU en orden), el PTs
inmediatamente antes de que se salte el tiempo en el VOBU que un
TMPa tiene (la dirección especificada por I_start), la
decodificación se inicia con la imagen I superior del VOBU, y la
visualización se inicia con la imagen correspondiente al tiempo.
A continuación, la estructura interna de una
información de lista de reproducción ("XXX. PL") se describirá
con referencia a la figura 35. La información de lista de
reproducción incluye una lista de celdas (CellList) y una lista de
eventos (EventList).
La lista de celdas (CellList) es una secuencia
de celdas de reproducción en la lista de reproducción; y las celdas
se reproducen en el orden de descripción indicado en esta lista: el
contenido de la lista de celdas (CellList) es el número de celdas
(Number) y la información de cada celda (Cell#1 a Cell#n).
La información de celda (Cell#) tiene un número
de archivo VOB (VOBName), tiempo de inicio (In= y tiempo final
(Out) en el VOB, y subtítulos (SutitleTable), el tiempo de inicio
(In) y el tiempo final (Out) se representan como un número de trama
en cada VOB. Es posible obtener la dirección de los datos VOB
necesarios para reproducir usando el mapa de tiempo (TMAP)
anteriormente descrito.
La tabla de subtítulo (SubtitleTable) es una
tabla que almacena información de subtítulo que se reproduce
sincronizadamente con el VOB. Como en el caso del audio, se incluyen
diversos idiomas en los subtítulos. La primera información de la
tabla de subtítulo (SubtitleTable) incluye el número de idiomas
(Number) y las siguientes tablas (Language#1 to Language#k)
preparadas sobre una base de un idioma
Cada tabla de idioma (Language#) incluye
información de idioma (Lang), el número (Number) de fragmentos de
información de subtítulo de los subtítulos a visualizar por
separado, e información de subtítulo (Speech#1 to Speech3j) de
subtítulos a visualizar por separado. La información de subtítulo
(Speech#) incluye un nombre de archivo de datos de imagen (Name),
tiempo de inicio de visualización de subtítulo (In), tiempo de final
de visualización de subtítulo (Out) y una posición de visualización
de subtítulo (Position).
La lista de eventos (EventList) es una tabla que
define cada evento que se produce en la lista de reproducción. La
lista de eventos incluye el número de eventos (Number) y los eventos
respectivos (Event#1 to Event#m). Cada evento (Event#) incluye un
tipo de evento (Type), un evento ID (ID), un tiempo de ocurrencia de
evento (Time) y una duración de evento (Duration).
La figura 36 es una tabla de gestión de eventos
("XXX. PROG") que tiene un gestor de eventos (que es un evento
temporal y un evento para la selección de mus) preparado sobre una
base de lista de reproducción. La tabla de gestión de eventos
incluye el número de gestores/programas de eventos definidos
(Number) y los gestores/programas de eventos respectivos (Program#1
to Program#n). El contenido de cada gestor/programa de eventos
(Program#) es la definición del inicio de un gestor de evento
(<event_handler>tag) y el gestor de eventos ID (ID) que se
empareja con el evento previamente descrito ID y a continuación del
mismo, el programa descrito en "{}" que sigue Funcion. El
evento (Event#1 to Event#m) almacenado en la lista de eventos
(EventList) del ``XXX. PL previamente descrito se especifica usando
un ID (ID) del gestor de eventos de "XXX. PROG".
A continuación, la estructura interna de la
información relativa a todo el disco BD ("BD. INFO") se
describirá con referencia a la figura 37. La información relativa a
todo el disco BD incluye una lista de títulos (TitleList) y una
tabla de eventos para el evento global (EventList).
La lista de títulos (TitleList) incluye el
número de títulos de un disco (Number) y fragmentos de información
de título (Title#1 to Title#3) que sigue el número de títulos. Los
fragmentos respectivos de información de título (Title#) incluyen
una tabla de lista de reproducción en el título (PLTable) y una
lista de capítulos en el título (ChapterList). La tabla de lista de
reproducción (PLTable) incluye el número de listas de reproducción
en el título (Number) y nombres de listas de reproducción (Name) que
son los nombres de archivos de listas de reproducción.
La lista de capítulos (ChapterList) incluye el
número de capítulos incluidos en el título (Number) y fragmentos de
información de capítulo (Chapter#1 to Chapter#n). Cada fragmento de
información de capítulo (Chapter#) incluye una tabla de celdas
(CellTAble) incluida en el capítulo, y la tabla de celdas
(CellTable) incluye el números de celdas (Number) y fragmentos de
información de entrada de celdas (CellEntry#1 to CellEntry#k). La
información de entrada de celda (CellEntry#) incluye el nombre de
lista de reproducción que incluye la celda y un número de celdas en
la lista de reproducción.
La lista de eventos (EventList) incluye el
número de eventos globales (Number) y fragmentos de información de
evento global. Se ha de entender que el evento global a definir en
primer lugar se denomina primer evento (FistEvent), y es el evento
denominado en primer lugar después de la inserción del disco BD en
el reproductor. La información de evento para el evento global
tiene solamente un tipo de evento (Type) y un ID de evento
(ID).
La figura 38 es una tabla ("BD. PROG") de
un programa de un gestor de evento global. El contenido de esta
tabla es el mismo que el contenido de la tabla de gestión de eventos
descrita en la figura 36.
En el caso de almacenar la información de
reproducción trucada anteriormente descrita en el formato
BD-ROM descrito hasta ahora, se considera que un
VOBU incluye una o más unidades de acceso aleatorio RAU, y la
información de reproducción trucada se incluye en la AU superior de
VOBU. Obsérvese que, en MPEG-4 AVC, se incluye una
unidad NAL donde se almacena información de reproducción
trucada.
Obsérvese que la información de reproducción
trucada se puede almacenar en la información de gestión de BD. Por
ejemplo, es posible almacenar información de reproducción trucada
preparada en una base de VOBU extendiendo el mapa de tiempo de la
información de gestión de VOB. Igualmente, es posible definir un
nuevo mapa para almacenar la información de reproducción
trucada.
Igualmente, es posible almacenar la información
de reproducción trucada bien en VOBU o la información de gestión
de BD.
Igualmente es posible almacenar solamente el
valor por defecto de la información de reproducción trucada en la
información de gestión de BD, y solamente en el caso donde la
información de reproducción trucada en cuanto a VOBU es diferente
del valor por defecto, es posible almacenar la información de
reproducción trucada en VOBU.
Igualmente, es posible almacenar un conjunto de
uno o más fragmentos de información de reproducción trucada en la
información de gestión de BD como la información que es común entre
los flujos. VOBU se puede referir a un fragmento de información de
reproducción trucada entre los fragmentos de información de
reproducción trucada almacenada en la información de gestión de BD.
En este caso, la información de índice de la información de
reproducción trucada referida por VOBU se almacena en la información
de gestión de una unidad VOBU o el VOBU.
\vskip1.000000\baselineskip
La figura 39 es un diagrama de bloques que
muestra en líneas generales la estructura funcional de un
reproductor que reproduce un disco BD mostrado en la figura 31 y
similar. Los datos sobre el disco BD 201 le lee mediante un
reproductor óptico 202. Los datos de lectura se transmiten a una
memoria exclusiva que depende de los tipos de los datos
respectivos. El programa de reproducción BD (el contenido de "BD.
PROG" o "XXX. PROG") se transmite a una memoria de programa
203. Igualmente, la información de gestión de BD ("BD: INFO",
"XXX. PL" o "YYY. VOBI") se transmite a una memoria de
información de gestión 204. Igualmente los datos AV ("YYY. VOB"
o "ZZZ. PNG") se transmiten a una memoria AV 205.
El programa de reproducción de BD grabado en la
memoria de programa 203 se procesa mediante una unidad de
procesamiento de programa 206. Igualmente la información de gestión
de BD grabada en la memoria de información de gestión 204 se
procesa mediante la unidad de procesamiento 207 de información de
gestión. Igualmente, los datos AV grabados en la memoria AV 205 se
procesan mediante una unidad de procesamiento de presentación
208.
La unidad de procesamiento de programa 206
recibe la información de listas de reproducción a reproducir por la
unidad 207 de procesamiento de información de gestión y la
información de eventos tal como el tiempo de ejecución del programa
y realiza el procesamiento del programa. Igualmente, es posible
cambiar dinámicamente las listas de reproducción a reproducir por
el programa. Esto se puede lleva a cabo enviando una instrucción de
reproducción de las listas de reproducción a la unidad 207 de
procesamiento de información de gestión. La unidad 206 de
procesamiento de programa recibe un evento de un usuario, dicho de
otro modo, recibe una petición a través de un controlador remoto, y
en el caso donde hay un programa que corresponde al evento de
usuario, ejecuta el programa.
La unidad 207 de procesamiento de información de
gestión recibe una instrucción de la unidad de procesamiento de
programa 206, analiza las listas de reproducción y la información de
gestión de VOBs que corresponden a las listas de reproducción, e
instruye la unidad 208 de procesamiento de presentación para
reproducir los datos AV objetivo. Igualmente, la unidad 207 de
procesamiento de información de gestión recibe la información de
tiempo estándar a partir de la unidad de procesamiento de
presentación 208, instruye la unidad 208 de procesamiento de
presentación para detener la reproducción de los datos AV basándose
en la información de tiempo. Igualmente, la unidad 207 de
procesamiento de información de gestión genera un evento para
notificar la unidad de procesamiento de programa 206 del tiempo de
ejecución de programa.
La unidad de procesamiento de presentación 208
tiene un descodificador que puede procesar vídeo, audio,
subtítulos/imágenes (imágenes fijas) respectivamente. Descodifica y
produce los datos AV según una instrucción de la unidad de
procesamiento de información de gestión 207. En el caso de datos de
vídeo, y subtítulo/imágenes, se descodifican y a continuación se
dejan en los planos exclusivos respectivos, es decir, el plano de
vídeo 210 y el plano de imagen 209. Después esto, la unidad de
procesamiento de síntesis 211 lleva a cabo el procesamiento de
síntesis sobre el vídeo, y envía el vídeo a un dispositivo de
visualización tal como un televisor.
En el momento de la reproducción trucada tal
como reproducción a saltos, reproducción a velocidad variable y
reproducción inversa, la unidad 208 de procesamiento de presentación
interpreta la operación de reproducción trucada solicitada por el
usuario, y notifica la unidad de procesamiento de información de
gestión 207 de la información tal como la velocidad de
reproducción. La unidad 207 de procesamiento de información de
gestión analiza la información de reproducción trucada almacenada
en la AU superior de VOBU y determina las AUs a descodificar y
visualizar de manera que la operación de reproducción trucada
especificada por el usuario se puede realizar de manera segura.
Obsérvese que la unidad 207 de procesamiento de información de
gestión puede obtener la información de reproducción trucada,
enviarla a la unidad 208 de procesamiento de presentación y
determinar las AUs a descodificar y las AUs a visualizar en la
unidad 208 de procesamiento de presentación.
Obsérvese que un sistema informático autónomo
puede ejecutar fácilmente el procesamiento mostrado en esta
realización grabando el programa para realizar el procedimiento de
codificación de imágenes en movimiento y el procedimiento de
descodificación de imágenes en movimiento mostrado en esta
realización en un soporte de grabación tal como un disco
flexible.
Las figuras 40A a 40C son ilustraciones del modo
en que el sistema informático ejecuta el procedimiento de
codificación de imágenes en movimiento y el procedimiento de
descodificación de imágenes en movimiento de esta realización
usando un programa grabado en un soporte de grabación tal como un
disco flexible.
La figura 40A muestra un ejemplo de un formato
físico de un disco flexible como un soporte de grabación. La figura
40B muestra un disco flexible y la vista frontal y la vista en
sección transversal del aspecto del disco flexible. Un disco
flexible (FD) va contenido en una carcasa F, una pluralidad de
pistas (Tr) se forman concéntricamente sobre la superficie del
disco desde el radio exterior en el radio interior del disco, y cada
pista se divide en 16 sectores (Se) en la dirección angular. Por
lo tanto, en el caso del disco flexible que almacena el programa
anteriormente descrito, el programa se graba en un área asignada al
mismo sobre el disco flexible (FD).
Igualmente, la figura 40C muestra la estructura
para grabar y reproducir el programa sobre el disco flexible. En el
caso de grabar el programa anterior para realizar el programa de
codificación de imágenes en movimiento y el procedimiento de
descodificación de imágenes en movimiento sobre el disco flexible
FD, un sistema informático Cs escribe el programa sobre el disco
flexible a través de una unidad de disco flexible. Igualmente, en el
caso de construir el anterior aparato de codificación de imágenes
en movimiento y el anterior aparato de descodificación de imágenes
en movimiento para realizar el procedimiento de codificación de
imágenes en movimiento y el procedimiento de descodificación de
imágenes en movimiento usando el programa en el disco flexible, el
programa se lee a partir del disco flexible a través de la unidad de
disco flexible, y se transmite al sistema informático.
Obsérvese que la anterior descripción se ha
realizado usando un disco flexible como soporte de grabación, pero
el programa se puede grabar sobre un disco óptico. Igualmente, un
soporte de grabación no se limita a este, se puede usar otro
soporte de grabación tal como una tarjeta IC, una cassette ROM
siempre que grabe el programa.
En este punto, el aparato de generación de flujo
de imágenes en movimiento, el aparato de codificación de imágenes
en movimiento, el aparato de multiplexado de imágenes en movimiento
y el aparato de descodificación de imágenes en movimiento de la
presente invención se han descrito basándose en la realización, pero
la presente invención no se limita a esta realización. La presente
invención incluye las variaciones que un experto en la técnica
pudiese concebir basándose en esta realización, y tales variaciones
se encuentra dentro del alcance del objeto de la presente
invención.
Por ejemplo, la presente invención incluye lo
siguiente en esta realización: (i) un aparato de generación de
flujo de imágenes en movimiento; un aparato de grabación de disco
óptico que tiene uno de un aparato de codificación de imágenes en
movimiento y un aparato de descodificación de imágenes en
movimiento; un aparato de envió de imágenes en movimiento; un a
aparato de transmisión de difusión de televisión digital; un
servidor Web; un aparato de comunicación; un terminal de
información móvil; y similar; y (ii) un aparato de recepción de
imágenes en movimiento que tiene un aparato de descodificación de
imágenes en movimiento; un aparato de recepción de difusión de
televisión digital; un aparato de comunicación; un terminal de
información móvil; y similar.
Obsérvese que los bloques funcionales
respectivos mostrados en las figuras 21, 23, 27 y 39 se realizan
típicamente como un LSI que es un circuito de integración a gran
escala. Cada uno de los bloques funcionales se puede fabricar en un
único chip (por ejemplo, los bloques funcionales salvo una memoria
se pueden fabricar en un solo chip). El circuito integrado se
denomina LSI aquí, pero se puede denominar IC, sistema LSI, super
LSI o ultra LSI dependiendo de l nivel de integración. Igualmente,
el procedimiento de fabricación de los mismos en un circuito
integrado no se limita al procedimiento de su fabricación en un LSI,
se puede realizar mediante un circuito exclusivo o un procesador
genérico. Igualmente, es posible usar (i) un procesador
reconfigurable donde la conexión o el ajuste de células de circuito
se puede reconfoigurar o (ii) un FPGA programable (Sistema de
compuerta programable de campo), después de fabricarlo en un LSI.
Además, en el caso donde la técnica de su fabricación en un
circuito integrado en lugar de su fabricación en un LSI aparece
cuando se desarrolla, además, la técnica de semiconductores o
aparece cualquier técnica derivada, a su debido tiempo se pueden
fabricar bloques funcionales en un circuito integrado que usa tal
nueva técnica. La aplicación de biotécnica es probable. Igualmente,
entre los bloques funcionales respectivos, una unidad de
almacenamiento (una memoria de imagen) en la cual se almacenan los
datos de imagen a codificar o descodificar se pueden configurar por
separado en lugar de incluirse en un único chip.
Aunque solamente se ha descrito una realización
ejemplar de esta invención en detalle anteriormente, los expertos
en la técnica apreciarán fácilmente que son posibles muchas
modificaciones en la realización ejemplar sin salirse materialmente
de las nuevas enseñanzas y nuevas ventajas de la invención. En
consecuencia, todas tales modificaciones están destinadas a ser
incluidas dentro del alcance de la presente invención.
La presente invención se puede aplicar como: un
aparato de generación de flujo de imágenes en movimiento que genera
una imagen en movimiento a reproducir en reproducción trucada; un
aparato de codificación de imágenes en movimiento que genera, por
codificación, una imagen en movimiento a reproducir en reproducción
trucada; un aparato de multiplexado de imágenes en movimiento que
genera, por multiplexado de paquetes, una imagen en movimiento a
reproducir en reproducción trucada; y un aparato de descodificación
de imágenes en movimiento que reproduce la imagen en movimiento en
reproducción trucada; y especialmente, como un aparato para
construir el sistema para reproducir un flujo
MPEG-4 AVC que usa un modo de reproducción trucada
tal como reproducción a velocidad variable y reproducción inversa,
siendo tal aparato, por ejemplo, un aparato relacionado de disco
óptico sobre el cual se enfoca generalmente su función de
reproducción trucada m.
Claims (7)
1. Un aparato de generación de flujo de imágenes
en movimiento para generar un flujo que incluye imágenes que tienen
al menos una unidad de almacenamiento de información suplementaria y
una unidad de almacenamiento de información de píxeles,
comprendiendo dicho aparato:
una unidad de información suplementaria
utilizable para generar información suplementaria en cuanto a todas
las imágenes incluidas en cada una de las unidades de acceso
aleatorio en la cual se coloca una imagen intracodificada
descodificable sin depender de otra imagen en una parte superior en
el orden de descodificación, incluyendo la información
suplementaria diversos fragmentos de información de tipo de imagen
que indica tipos de todas las imágenes incluidas en la unidad de
acceso aleatorio, estando colocados los diversos fragmentos de
información de tipo de imagen en el orden de descodificación de las
imágenes como información de identificación para identificar las
imágenes a descodificar cuando las imágenes se reproducen trucadas,
y
una unidad de generación de flujo utilizable
para generar el flujo almacenando la información suplementaria en
la unidad de almacenamiento de información suplementaria de la
imagen colocada en la parte superior de una unidad de acceso
aleatorio correspondiente.
2. Un procedimiento de generación de flujo de
imágenes en movimiento para generar un flujo que incluye imágenes
que tienen al menos una unidad de almacenamiento de información
suplementaria y una unidad de almacenamiento de información de
píxeles, comprendiendo dicho procedimiento:
una etapa de generación de información
suplementaria para generar información suplementaria en cuanto a
todas las imágenes incluidas en cada una de las unidades de acceso
aleatorio en la cual se coloca una imagen intracodificada
descodificable sin depender de otras imágenes en una parte superior
en el orden de descodificación, incluyendo la información
suplementaria diversos fragmentos de información de tipo de imagen
que indica tipos de todas las imágenes incluidas en la unidad de
acceso aleatorio, estando colocados los diversos fragmentos de
información de tipo de imagen en el orden de descodificación de las
imágenes como información de identificación para identificar las
imágenes a descodificar cuando las imágenes se reproducen trucadas,
y
una etapa de generación de flujo para generar el
flujo almacenando la información suplementaria en la unidad de
almacenamiento de información suplementaria de la imagen colocada en
la parte superior de una unidad de acceso aleatorio
correspondiente.
3. Un aparato de descodificación de imágenes en
movimiento que descodifica un flujo que incluye imágenes
codificadas que constituyen una imagen en movimiento y reproduce el
flujo descodificado, comprendiendo dicho aparato de descodificación
de imágenes en movimiento:
una unidad de obtención de instrucciones
utilizable para obtener una instrucción que indica que se debería
llevar a cabo la reproducción trucada;
una unidad de análisis utilizable para extraer
y analizar información suplementaria sobre una base de unidad de
acceso aleatorio, constituyendo la unidad de acceso aleatorio el
flujo;
una unidad de especificación de imágenes de
reproducción utilizable para especificar imágenes, entre las
imágenes incluidas en la unidad de acceso aleatorio, que son
necesarias para la reproducción trucada indicada por la instrucción
obtenida por dicha unidad de obtención de instrucciones basada en un
resultado del análisis realizado por dicha unidad de análisis;
y
una unidad de descodificación utilizable para
descodificar las imágenes especificadas por dicha unidad de
especificación de imágenes de reproducción y reproducir las imágenes
descodificadas,
en el cual, en la unidad de acceso aleatorio, la
imagen intracodificada descodificable sin depender de otras
imágenes está colocada en una parte superior, y
la información suplementaria incluye diversos
fragmentos de información de tipo de imagen que indica tipos de
todas las imágenes incluidas en la unidad de acceso aleatorio,
estando colocados los diversos fragmentos de información de tipo de
imagen en el orden de descodificación de las imágenes como
información de identificación para identificar las imágenes a
descodificar cuando las imágenes se reproducen trucadas.
4. Un procedimiento de descodificación de
imágenes en movimiento para descodificar un flujo que incluye
imágenes codificadas que constituyen una imagen en movimiento y
reproducir el flujo descodificado, comprendiendo dicho
procedimiento de descodificación de imágenes en movimiento:
una etapa de obtención de instrucciones para
obtener una instrucción que indica que se debería llevar a cabo la
reproducción trucada;
una etapa de análisis para extraer y analizar
información suplementaria sobre una base de unidad de acceso
aleatorio, constituyendo la unidad de acceso aleatorio el flujo;
una etapa de especificación de imágenes de
reproducción para especificar imágenes, entre las imágenes incluidas
en la unidad de acceso aleatorio, que son necesarias para la
reproducción trucada indicada por la instrucción obtenida por dicha
unidad de obtención de instrucciones basada en un resultado del
análisis realizado por dicha unidad de análisis; y
una etapa de descodificación para descodificar
las imágenes especificadas por dicha unidad de especificación de
imágenes de reproducción y reproducir las imágenes
descodificadas,
en el cual, en la unidad de acceso aleatorio, la
imagen intracodificada descodificable sin depender de otras
imágenes está colocada en una parte superior, y
la información suplementaria incluye diversos
fragmentos de información de tipo de imagen que indica tipos de
todas las imágenes incluidas en la unidad de acceso aleatorio,
estando colocados los diversos fragmentos de información de tipo de
imagen en el orden de descodificación de las imágenes como
información de identificación para identificar las imágenes a
descodificar cuando las imágenes se reproducen trucadas.
5. Un soporte de grabación legible por ordenador
sobre el cual se graba un flujo, incluyendo el flujo imágenes que
constituyen una imagen en movimiento,
en el cual el flujo está estructurado de manera
que la información suplementaria se añade a una imagen colocada en
la parte superior de una unidad de acceso aleatorio,
incluyendo la información suplementaria diversos
fragmentos de información de tipo de imagen que indica tipos de
todas las imágenes incluidas en la unidad de acceso aleatorio,
estando colocados los diversos fragmentos de información de tipo de
imagen en el orden de descodificación de las imágenes como
información de identificación para identificar las imágenes a
descodificar cuando las imágenes se reproducen trucadas.
6. Un procedimiento de grabación para grabar un
flujo que incluye imágenes que constituyen una imagen en movimiento
sobre un soporte de grabación, comprendiendo dicho procedimiento de
grabación
una etapa de grabación para grabar el flujo
generado usando el procedimiento de generación de flujo de imágenes
según la reivindicación 2.
7. Un sistema de descodificación de imágenes en
movimiento que comprende el soporte de grabación según la
reivindicación 5, y el aparato de descodificación de imágenes en
movimiento según la reivindicación 3, que lee un flujo que incluye
imágenes que constituyen una imagen en movimiento del soporte de
grabación, descodifica y reproduce el flujo.
Applications Claiming Priority (6)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004134212 | 2004-04-28 | ||
| JP2004-134212 | 2004-04-28 | ||
| JP2004-165005 | 2004-06-02 | ||
| JP2004165005 | 2004-06-02 | ||
| JP2004251871 | 2004-08-31 | ||
| JP2004-251871 | 2004-08-31 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2330864T3 true ES2330864T3 (es) | 2009-12-16 |
Family
ID=34971443
Family Applications (7)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES10151438T Expired - Lifetime ES2383652T3 (es) | 2004-04-28 | 2005-04-25 | Aparato de generación de flujos de imágenes en movimiento, aparato de codificación de imágenes en movimiento, aparato multiplexador de imágenes en movimiento y aparato de descodificación de imágenes en movimiento |
| ES05736693T Expired - Lifetime ES2330864T3 (es) | 2004-04-28 | 2005-04-25 | Aparato de generacion de flujo de imagenes en movimiento, aparado de codificacion de imagenes en movimiento, aparato de multiplexado de imagenes en movimiento y aparato de descodificacion de imagenes en movimiento. |
| ES10151443T Expired - Lifetime ES2383654T3 (es) | 2004-04-28 | 2005-04-25 | Aparato de generación de flujos de imágenes en movimiento, aparato de codificaicón de imágenes en movimiento, aparato multiplexador de imágenes en movimiento y aparato de descodificación de imágenes en movimiento |
| ES10159158T Expired - Lifetime ES2388397T3 (es) | 2004-04-28 | 2005-04-25 | Aparato de generación de un flujo de imágenes en movimiento, aparato de codificación de imágenes en movimiento, aparato de multiplexado de imágenes en movimiento y aparato de descodificación de imágenes en movimiento |
| ES08158372T Expired - Lifetime ES2347385T3 (es) | 2004-04-28 | 2005-04-25 | Aparato de generacion de flujo de imagenes en movimiento, aparato de codificacion de imagenes en movimiento, aparato de multiplexado de imagenes en movimiento y aparato de descodificacion de imagenes en movimiento. |
| ES10159159T Expired - Lifetime ES2383655T3 (es) | 2004-04-28 | 2005-04-25 | Aparato de generación de flujos de imágenes en movimiento, aparato de codificación de imágenes en movimiento, aparato multiplexador de imágenes en movimiento y aparato de descodificación de imágenes en movimiento |
| ES10159160T Expired - Lifetime ES2383656T3 (es) | 2004-04-28 | 2005-04-25 | Aparato de generación de flujos de imágenes en movimiento, aparato de codificación de imágenes en movimiento, aparato multiplexador de imágenes en movimiento y aparato de descodificación de imágenes en movimiento |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES10151438T Expired - Lifetime ES2383652T3 (es) | 2004-04-28 | 2005-04-25 | Aparato de generación de flujos de imágenes en movimiento, aparato de codificación de imágenes en movimiento, aparato multiplexador de imágenes en movimiento y aparato de descodificación de imágenes en movimiento |
Family Applications After (5)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES10151443T Expired - Lifetime ES2383654T3 (es) | 2004-04-28 | 2005-04-25 | Aparato de generación de flujos de imágenes en movimiento, aparato de codificaicón de imágenes en movimiento, aparato multiplexador de imágenes en movimiento y aparato de descodificación de imágenes en movimiento |
| ES10159158T Expired - Lifetime ES2388397T3 (es) | 2004-04-28 | 2005-04-25 | Aparato de generación de un flujo de imágenes en movimiento, aparato de codificación de imágenes en movimiento, aparato de multiplexado de imágenes en movimiento y aparato de descodificación de imágenes en movimiento |
| ES08158372T Expired - Lifetime ES2347385T3 (es) | 2004-04-28 | 2005-04-25 | Aparato de generacion de flujo de imagenes en movimiento, aparato de codificacion de imagenes en movimiento, aparato de multiplexado de imagenes en movimiento y aparato de descodificacion de imagenes en movimiento. |
| ES10159159T Expired - Lifetime ES2383655T3 (es) | 2004-04-28 | 2005-04-25 | Aparato de generación de flujos de imágenes en movimiento, aparato de codificación de imágenes en movimiento, aparato multiplexador de imágenes en movimiento y aparato de descodificación de imágenes en movimiento |
| ES10159160T Expired - Lifetime ES2383656T3 (es) | 2004-04-28 | 2005-04-25 | Aparato de generación de flujos de imágenes en movimiento, aparato de codificación de imágenes en movimiento, aparato multiplexador de imágenes en movimiento y aparato de descodificación de imágenes en movimiento |
Country Status (13)
| Country | Link |
|---|---|
| US (5) | US7843994B2 (es) |
| EP (8) | EP2182521A1 (es) |
| JP (5) | JP4071811B2 (es) |
| KR (1) | KR101148765B1 (es) |
| CN (5) | CN101778235B (es) |
| AT (7) | ATE555476T1 (es) |
| CA (2) | CA2811897C (es) |
| DE (2) | DE602005021926D1 (es) |
| ES (7) | ES2383652T3 (es) |
| MY (2) | MY144441A (es) |
| PL (6) | PL2182519T3 (es) |
| TW (2) | TWI395207B (es) |
| WO (1) | WO2005106875A1 (es) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11792432B2 (en) * | 2020-02-24 | 2023-10-17 | Tencent America LLC | Techniques for signaling and identifying access unit boundaries |
Families Citing this family (103)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4002878B2 (ja) * | 2003-01-17 | 2007-11-07 | 松下電器産業株式会社 | 画像符号化方法 |
| US8514938B2 (en) * | 2004-10-07 | 2013-08-20 | Hewlett-Packard Development Company L.P. | Picture coding apparatus for a still picture sequence and picture decoding apparatus for a still picture sequence |
| ES2339587T3 (es) | 2005-01-10 | 2010-05-21 | Panasonic Corporation | Aparato de codificacion de imagenes y aparato de decodificacion de imagenes. |
| JP2006211274A (ja) * | 2005-01-27 | 2006-08-10 | Toshiba Corp | 記録媒体、この記録媒体を再生する方法並びにその再生装置及び記録媒体に映像データを記録する記録装置並びにその記録方法 |
| KR100770704B1 (ko) | 2005-08-04 | 2007-10-29 | 삼성전자주식회사 | 픽쳐 스킵 방법 및 장치 |
| US8229983B2 (en) | 2005-09-27 | 2012-07-24 | Qualcomm Incorporated | Channel switch frame |
| US8670437B2 (en) | 2005-09-27 | 2014-03-11 | Qualcomm Incorporated | Methods and apparatus for service acquisition |
| BRPI0520660A2 (pt) * | 2005-11-03 | 2009-05-19 | Thomson Licensing | dispositivo e método para gravação de vìdeo digital |
| US7903737B2 (en) * | 2005-11-30 | 2011-03-08 | Mitsubishi Electric Research Laboratories, Inc. | Method and system for randomly accessing multiview videos with known prediction dependency |
| US9516326B1 (en) * | 2005-12-09 | 2016-12-06 | Nvidia Corporation | Method for rotating macro-blocks of a frame of a video stream |
| FR2894739A1 (fr) * | 2005-12-12 | 2007-06-15 | Thomson Licensing Sa | Procede de codage, procede de decodage, dispositif de codage et dispositif de decodage de donnees video |
| JP4736918B2 (ja) * | 2006-04-11 | 2011-07-27 | パナソニック株式会社 | デジタル再生装置または再生プログラム |
| US8699583B2 (en) * | 2006-07-11 | 2014-04-15 | Nokia Corporation | Scalable video coding and decoding |
| US20080062869A1 (en) * | 2006-09-08 | 2008-03-13 | Edgeware Ab | Method and an apparatus for data streaming |
| US20080068993A1 (en) * | 2006-09-08 | 2008-03-20 | Edgeware Ab | Method and an apparatus for data streaming |
| US8826345B2 (en) * | 2006-09-08 | 2014-09-02 | Edgeware Ab | Method and an apparatus for data streaming |
| JP4947349B2 (ja) * | 2006-11-10 | 2012-06-06 | ソニー株式会社 | 画像処理装置、画像処理方法、およびプログラム |
| US8875199B2 (en) | 2006-11-13 | 2014-10-28 | Cisco Technology, Inc. | Indicating picture usefulness for playback optimization |
| US20080115175A1 (en) * | 2006-11-13 | 2008-05-15 | Rodriguez Arturo A | System and method for signaling characteristics of pictures' interdependencies |
| US8155207B2 (en) | 2008-01-09 | 2012-04-10 | Cisco Technology, Inc. | Processing and managing pictures at the concatenation of two video streams |
| US8416859B2 (en) * | 2006-11-13 | 2013-04-09 | Cisco Technology, Inc. | Signalling and extraction in compressed video of pictures belonging to interdependency tiers |
| CN101536523B (zh) * | 2006-11-14 | 2013-01-23 | 高通股份有限公司 | 用于信道切换的系统及方法 |
| CN101536524B (zh) | 2006-11-15 | 2012-06-13 | 高通股份有限公司 | 用于使用信道切换帧的应用的系统和方法 |
| KR101072341B1 (ko) | 2007-01-18 | 2011-10-11 | 노키아 코포레이션 | Rtp 페이로드 포맷에서의 sei 메시지들의 전송 |
| KR101396364B1 (ko) * | 2007-01-24 | 2014-05-19 | 삼성전자주식회사 | 컨텐츠를 저장한 정보저장매체, 재생 방법 및 장치 |
| US7995640B2 (en) * | 2007-04-30 | 2011-08-09 | Texas Instruments Incorporated | Dynamic interpolation location |
| JP2008294638A (ja) * | 2007-05-23 | 2008-12-04 | Sony Corp | 伝送システム、記録装置、伝送方法、記録方法、およびプログラム |
| US8804845B2 (en) | 2007-07-31 | 2014-08-12 | Cisco Technology, Inc. | Non-enhancing media redundancy coding for mitigating transmission impairments |
| US8958486B2 (en) | 2007-07-31 | 2015-02-17 | Cisco Technology, Inc. | Simultaneous processing of media and redundancy streams for mitigating impairments |
| US8718388B2 (en) | 2007-12-11 | 2014-05-06 | Cisco Technology, Inc. | Video processing with tiered interdependencies of pictures |
| KR100951008B1 (ko) * | 2007-12-17 | 2010-04-02 | 한국전자통신연구원 | 인터레이스 부호화에서의 실시간 비트율 제어 방법 및시스템 |
| US8731065B2 (en) | 2008-01-24 | 2014-05-20 | Nec Corporation | Dynamic image stream processing method and device, and dynamic image reproduction device and dynamic image distribution device using the same |
| US8416858B2 (en) | 2008-02-29 | 2013-04-09 | Cisco Technology, Inc. | Signalling picture encoding schemes and associated picture properties |
| JP4577409B2 (ja) * | 2008-06-10 | 2010-11-10 | ソニー株式会社 | 再生装置、再生方法、プログラム、及び、データ構造 |
| US8886022B2 (en) | 2008-06-12 | 2014-11-11 | Cisco Technology, Inc. | Picture interdependencies signals in context of MMCO to assist stream manipulation |
| US8971402B2 (en) | 2008-06-17 | 2015-03-03 | Cisco Technology, Inc. | Processing of impaired and incomplete multi-latticed video streams |
| US8699578B2 (en) | 2008-06-17 | 2014-04-15 | Cisco Technology, Inc. | Methods and systems for processing multi-latticed video streams |
| US8705631B2 (en) | 2008-06-17 | 2014-04-22 | Cisco Technology, Inc. | Time-shifted transport of multi-latticed video for resiliency from burst-error effects |
| EP2297964A4 (en) * | 2008-06-25 | 2017-01-18 | Cisco Technology, Inc. | Support for blocking trick mode operations |
| US8259817B2 (en) | 2008-11-12 | 2012-09-04 | Cisco Technology, Inc. | Facilitating fast channel changes through promotion of pictures |
| FR2940737A1 (fr) * | 2008-12-31 | 2010-07-02 | Thomson Licensing | Generation de flux de paquets de donnees video contenant des informations d'acceleration pour le decodage |
| EP2389000A4 (en) * | 2009-01-19 | 2014-04-02 | Panasonic Corp | Encoding method, decoding method, encoding device, decoding device, program, and integrated circuit |
| WO2010096767A1 (en) * | 2009-02-20 | 2010-08-26 | Cisco Technology, Inc. | Signalling of decodable sub-sequences |
| US20100218232A1 (en) * | 2009-02-25 | 2010-08-26 | Cisco Technology, Inc. | Signalling of auxiliary information that assists processing of video according to various formats |
| US8782261B1 (en) | 2009-04-03 | 2014-07-15 | Cisco Technology, Inc. | System and method for authorization of segment boundary notifications |
| US8949883B2 (en) | 2009-05-12 | 2015-02-03 | Cisco Technology, Inc. | Signalling buffer characteristics for splicing operations of video streams |
| US8279926B2 (en) | 2009-06-18 | 2012-10-02 | Cisco Technology, Inc. | Dynamic streaming with latticed representations of video |
| US9300969B2 (en) | 2009-09-09 | 2016-03-29 | Apple Inc. | Video storage |
| WO2011068807A1 (en) * | 2009-12-01 | 2011-06-09 | Divx, Llc | System and method for determining bit stream compatibility |
| TWI410135B (zh) * | 2009-12-08 | 2013-09-21 | Alticast Corp | 在數位廣播系統中傳送/接收傳輸流的裝置與方法 |
| US20110176611A1 (en) * | 2010-01-15 | 2011-07-21 | Yu-Wen Huang | Methods for decoder-side motion vector derivation |
| US8254453B2 (en) * | 2010-01-20 | 2012-08-28 | Himax Media Solutions, Inc. | Multi-format video decoder and related decoding method |
| JP5387430B2 (ja) * | 2010-01-28 | 2014-01-15 | 株式会社Jvcケンウッド | 動画像再生装置、動画像再生方法、及び、プログラム |
| US20110222837A1 (en) * | 2010-03-11 | 2011-09-15 | Cisco Technology, Inc. | Management of picture referencing in video streams for plural playback modes |
| US8259808B2 (en) * | 2010-03-25 | 2012-09-04 | Mediatek Inc. | Low complexity video decoder |
| EP3697089B1 (en) | 2010-04-13 | 2021-09-29 | GE Video Compression, LLC | Inheritance in sample array multitree subdivision |
| ES3053791T3 (en) | 2010-04-13 | 2026-01-26 | Ge Video Compression Llc | Video coding using multi-tree sub-divisions of images |
| BR122020007923B1 (pt) | 2010-04-13 | 2021-08-03 | Ge Video Compression, Llc | Predição interplano |
| CN102939754B (zh) | 2010-04-13 | 2016-09-07 | Ge视频压缩有限责任公司 | 样本区域合并技术 |
| JP5805991B2 (ja) * | 2010-05-07 | 2015-11-10 | トムソン ライセンシングThomson Licensing | ピクチャ・シーケンスを符号化する方法、それに対応する再構築方法、および当該シーケンスを表す符号化データのストリーム |
| JP2011259110A (ja) * | 2010-06-07 | 2011-12-22 | Panasonic Corp | 動画再生方法および動画再生装置 |
| JP2012018727A (ja) * | 2010-07-08 | 2012-01-26 | Sony Corp | 情報処理装置、および情報処理方法、並びにプログラム |
| JP5589654B2 (ja) * | 2010-08-04 | 2014-09-17 | 三菱電機株式会社 | 映像音声再生装置、および映像音声再生方法 |
| MX2013001051A (es) | 2011-02-22 | 2013-04-03 | Panasonic Corp | Metodo de codificacion de imagen, metodo de decodificacion de imagen, aparato de codificacion de imagen, aparato de decodificacion de imagen y aparato de codificacion/decidificacion de imagen. |
| JP5342069B2 (ja) | 2011-02-22 | 2013-11-13 | パナソニック株式会社 | フィルタ方法、画像符号化方法、画像処理システム及び画像符号化装置 |
| US9516379B2 (en) | 2011-03-08 | 2016-12-06 | Qualcomm Incorporated | Buffer management in video codecs |
| KR101803970B1 (ko) * | 2011-03-16 | 2017-12-28 | 삼성전자주식회사 | 컨텐트를 구성하는 장치 및 방법 |
| JP5341952B2 (ja) | 2011-05-30 | 2013-11-13 | 株式会社東芝 | ビデオサーバ及びデータ収録再生方法 |
| JP5318292B2 (ja) | 2011-06-23 | 2013-10-16 | パナソニック株式会社 | 画像復号方法及び画像復号装置 |
| USRE47366E1 (en) | 2011-06-23 | 2019-04-23 | Sun Patent Trust | Image decoding method and apparatus based on a signal type of the control parameter of the current block |
| CA2830046C (en) | 2011-06-24 | 2018-09-04 | Panasonic Corporation | Image decoding method, image coding method, image decoding apparatus, image coding apparatus, and image coding and decoding apparatus |
| WO2012176465A1 (ja) | 2011-06-24 | 2012-12-27 | パナソニック株式会社 | 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置及び画像符号化復号装置 |
| RU2608244C2 (ru) | 2011-06-27 | 2017-01-17 | Сан Пэтент Траст | Способ кодирования изображений, способ декодирования изображений, устройство кодирования изображений, устройство декодирования изображений и устройство кодирования и декодирования изображений |
| CN106878724B (zh) | 2011-06-28 | 2020-06-05 | 太阳专利托管公司 | 图像编码解码装置 |
| WO2013001767A1 (ja) | 2011-06-29 | 2013-01-03 | パナソニック株式会社 | 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置及び画像符号化復号装置 |
| KR102060619B1 (ko) | 2011-06-30 | 2019-12-30 | 선 페이턴트 트러스트 | 화상 복호 방법, 화상 부호화 방법, 화상 복호 장치, 화상 부호화 장치 및 화상 부호화 복호 장치 |
| WO2013001770A1 (ja) | 2011-06-30 | 2013-01-03 | パナソニック株式会社 | 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置及び画像符号化復号装置 |
| KR101457895B1 (ko) * | 2011-07-02 | 2014-11-04 | 삼성전자주식회사 | 비디오 복호화 방법 및 장치 |
| KR102404121B1 (ko) | 2011-07-11 | 2022-05-31 | 선 페이턴트 트러스트 | 화상 복호 방법, 화상 부호화 방법, 화상 복호 장치, 화상 부호화 장치 및 화상 부호화 복호 장치 |
| US8767824B2 (en) | 2011-07-11 | 2014-07-01 | Sharp Kabushiki Kaisha | Video decoder parallelization for tiles |
| ES2786503T3 (es) | 2011-07-19 | 2020-10-13 | Tagivan Ii Llc | Método de filtrado, método de decodificación de imágenes en movimiento, método de codificación de imágenes en movimiento, aparato de decodificación de imágenes en movimiento, aparato de codificación de imágenes en movimiento y aparato de codificación/decodificación de imágenes en movimiento |
| CN103369314B (zh) * | 2012-04-01 | 2018-02-16 | 中兴通讯股份有限公司 | 帧场信息的编码方法及解码方法、编码器和解码器 |
| US20150063463A1 (en) * | 2012-04-15 | 2015-03-05 | Samsung Electronics Co., Ltd. | Method and device for coding multi-layer video, and method and device for decoding multi-layer video |
| US9979959B2 (en) | 2012-04-20 | 2018-05-22 | Qualcomm Incorporated | Video coding with enhanced support for stream adaptation and splicing |
| KR102167096B1 (ko) * | 2012-09-13 | 2020-10-16 | 엘지전자 주식회사 | 영상 부호화/복호화 방법 및 장치 |
| US8989508B2 (en) * | 2012-09-28 | 2015-03-24 | Sharp Kabushiki Kaisha | Electronic device for signaling a sub-picture buffer parameter |
| JP6344392B2 (ja) * | 2013-08-22 | 2018-06-20 | ソニー株式会社 | 符号化装置、符号化方法、送信装置、復号化装置、復号化方法および受信装置 |
| EP3086559A4 (en) * | 2013-12-16 | 2017-08-02 | LG Electronics Inc. | Signal transmission/reception device and signal transmission/reception method for providing trick play service |
| JP6224522B2 (ja) * | 2014-05-22 | 2017-11-01 | 日本電信電話株式会社 | 映像配信装置、映像配信方法及び映像配信プログラム |
| US9729887B2 (en) | 2014-06-25 | 2017-08-08 | Qualcomm Incorporated | Multi-layer video coding |
| KR101528269B1 (ko) * | 2014-09-04 | 2015-06-16 | (주)브레인키즈 | 동영상 재생 방법 |
| EP3244615A4 (en) * | 2015-01-09 | 2018-06-20 | Sony Corporation | Image processing device, image processing method, and program, and recording medium |
| KR101868203B1 (ko) * | 2015-01-28 | 2018-07-20 | 한국전자통신연구원 | 스트림 처리 방법 및 장치 |
| WO2017047399A1 (ja) * | 2015-09-15 | 2017-03-23 | ソニー株式会社 | 受信装置および方法、送信装置および方法 |
| CN106792078A (zh) * | 2016-07-12 | 2017-05-31 | 乐视控股(北京)有限公司 | 视频处理方法及装置 |
| US10412383B2 (en) * | 2017-08-15 | 2019-09-10 | Google Llc | Compressing groups of video frames using reversed ordering |
| TWI659647B (zh) * | 2017-11-21 | 2019-05-11 | 晶睿通訊股份有限公司 | 影像播放設備及其影像播放方法 |
| TWI665663B (zh) * | 2018-08-22 | 2019-07-11 | 張維中 | 影音倒轉播放裝置與系統及其方法 |
| CN109618186B (zh) * | 2018-11-15 | 2021-01-01 | 中国航空工业集团公司洛阳电光设备研究所 | 一种采用fpga实现的h264/avc视频辅助增强信息封装电路 |
| CN119767032A (zh) * | 2019-12-23 | 2025-04-04 | Lg电子株式会社 | 图像解码和编码设备及用于图像的数据的发送设备 |
| KR20220156829A (ko) | 2020-03-20 | 2022-11-28 | 바이트댄스 아이엔씨 | 이웃 서브픽처의 코딩 |
| JP7529795B2 (ja) | 2020-04-20 | 2024-08-06 | バイトダンス インコーポレイテッド | 参照ピクチャリスト上の制約 |
| CN115943627A (zh) | 2020-06-08 | 2023-04-07 | 字节跳动有限公司 | 对编解码视频图片中条带计数的约束 |
Family Cites Families (34)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2158969C2 (ru) | 1994-02-28 | 2000-11-10 | Сони Корпорейшн | Способ и устройство записи данных, среда записи данных, способ и устройство воспроизведения данных |
| JP3365109B2 (ja) * | 1994-12-28 | 2003-01-08 | ソニー株式会社 | データ再生装置及びデータ再生方法 |
| JP3604186B2 (ja) | 1995-02-16 | 2004-12-22 | 三菱電機株式会社 | 記録媒体の記録方法及び再生方法 |
| JP3329979B2 (ja) * | 1995-02-24 | 2002-09-30 | 株式会社日立製作所 | 光ディスク及び光ディスク再生装置 |
| JPH08280009A (ja) | 1995-04-06 | 1996-10-22 | Matsushita Electric Ind Co Ltd | 画像符号化装置および画像復号化装置および光ディスク |
| JP3146937B2 (ja) * | 1995-07-13 | 2001-03-19 | 日本ビクター株式会社 | 高能率符号化された動画像情報から早送り,早戻し画像を再生する再生方法 |
| JP3484834B2 (ja) * | 1995-07-28 | 2004-01-06 | ソニー株式会社 | データ符号化/復号化方法および装置 |
| US5757435A (en) * | 1995-12-08 | 1998-05-26 | C-Cube Microsystems, Inc. | MPEG-2 inverse telecine circuit |
| JP4434326B2 (ja) | 1997-03-19 | 2010-03-17 | ソニー株式会社 | 映像再生方法及び映像再生装置 |
| EP0940982A1 (en) | 1997-08-21 | 1999-09-08 | Sony Corporation | Disc recording method and device, disc reproducing method and device, and recording medium |
| CA2289958C (en) * | 1998-11-19 | 2003-01-21 | Tomoyuki Okada | Information recording medium, apparatus and method for recording or reproducing data thereof |
| JP2000354224A (ja) * | 1999-01-01 | 2000-12-19 | Hitachi Ltd | 画像データ記録方法および光ディスク再生方法 |
| JP3805985B2 (ja) * | 1999-02-18 | 2006-08-09 | 株式会社東芝 | ストリームデータの情報記憶媒体、その記録方法、再生方法、記録装置および再生装置 |
| EP1148727A1 (en) | 2000-04-05 | 2001-10-24 | THOMSON multimedia | Method and device for decoding a digital video stream in a digital video system using dummy header insertion |
| KR100741433B1 (ko) * | 1999-10-07 | 2007-07-23 | 톰슨 라이센싱 | 디지털 비디오 시스템에서 트릭모드 생성을 위한 방법 및디바이스 |
| CA2434424C (en) * | 2001-01-16 | 2012-03-06 | Matsushita Electric Industrial Co., Ltd. | Recording apparatus, method and medium |
| JP3820155B2 (ja) | 2001-01-16 | 2006-09-13 | 松下電器産業株式会社 | 情報記録装置および方法、情報記録プログラム、および情報記録プログラムを記録した記録媒体 |
| JP2003009085A (ja) * | 2001-06-20 | 2003-01-10 | Mitsubishi Electric Corp | デジタル信号記録装置および方法、デジタル信号再生装置および方法 |
| US7218635B2 (en) * | 2001-08-31 | 2007-05-15 | Stmicroelectronics, Inc. | Apparatus and method for indexing MPEG video data to perform special mode playback in a digital video recorder and indexed signal associated therewith |
| US20030044166A1 (en) * | 2001-08-31 | 2003-03-06 | Stmicroelectronics, Inc. | System for multiplexing video data streams in a digital video recorder and method of operating the same |
| US6707984B2 (en) | 2001-10-31 | 2004-03-16 | Thomson Licensing S.A. | Changing a playback speed for video presentation recorded in a modified film format |
| US7496824B2 (en) * | 2002-04-02 | 2009-02-24 | Sony Corporation | Data recording device and method, data reproduction device and method, information recording medium, program-containing medium, and program |
| US8406301B2 (en) | 2002-07-15 | 2013-03-26 | Thomson Licensing | Adaptive weighting of reference pictures in video encoding |
| US7376186B2 (en) | 2002-07-15 | 2008-05-20 | Thomson Licensing | Motion estimation with weighting prediction |
| US7903742B2 (en) * | 2002-07-15 | 2011-03-08 | Thomson Licensing | Adaptive weighting of reference pictures in video decoding |
| JP4477295B2 (ja) | 2002-10-10 | 2010-06-09 | 古河電気工業株式会社 | 自動車ワイヤハーネス用アルミ電線 |
| JP3975889B2 (ja) | 2002-11-13 | 2007-09-12 | 松下電器産業株式会社 | 照光つまみ及びその製造方法 |
| JP3718499B2 (ja) * | 2002-11-29 | 2005-11-24 | シャープ株式会社 | 動画像記録方法 |
| JP4318478B2 (ja) | 2002-12-27 | 2009-08-26 | 原子燃料工業株式会社 | 沸騰水型軽水炉用燃料集合体 |
| KR20050088918A (ko) * | 2003-01-17 | 2005-09-07 | 마쯔시다덴기산교 가부시키가이샤 | 동화상 부호화 방법 및 동화상 복호화 방법 |
| JP2003303476A (ja) | 2003-03-03 | 2003-10-24 | Pioneer Electronic Corp | 情報記録媒体、その記録装置及び記録方法並びにその再生装置及び再生方法 |
| US8351514B2 (en) * | 2004-01-16 | 2013-01-08 | General Instrument Corporation | Method, protocol, and apparatus for transporting advanced video coding content |
| US8391672B2 (en) * | 2004-02-06 | 2013-03-05 | Panasonic Corporation | Recording medium, reproduction device, program, and reproduction method |
| TW200952462A (en) * | 2004-06-02 | 2009-12-16 | Panasonic Corp | Seamless switching between random access units multiplexed in a multi angle view multimedia stream |
-
2005
- 2005-04-25 CA CA 2811897 patent/CA2811897C/en not_active Expired - Lifetime
- 2005-04-25 EP EP20100151451 patent/EP2182521A1/en not_active Withdrawn
- 2005-04-25 JP JP2006515497A patent/JP4071811B2/ja not_active Expired - Lifetime
- 2005-04-25 CN CN200910207663XA patent/CN101778235B/zh not_active Expired - Fee Related
- 2005-04-25 WO PCT/JP2005/008319 patent/WO2005106875A1/en not_active Ceased
- 2005-04-25 AT AT10159159T patent/ATE555476T1/de active
- 2005-04-25 AT AT08158372T patent/ATE471562T1/de not_active IP Right Cessation
- 2005-04-25 AT AT10151438T patent/ATE555473T1/de active
- 2005-04-25 CN CN200910207661A patent/CN101707723A/zh active Pending
- 2005-04-25 EP EP20100159158 patent/EP2207181B1/en not_active Expired - Lifetime
- 2005-04-25 ES ES10151438T patent/ES2383652T3/es not_active Expired - Lifetime
- 2005-04-25 PL PL10151438T patent/PL2182519T3/pl unknown
- 2005-04-25 CN CN2009102076625A patent/CN101697575B/zh not_active Expired - Fee Related
- 2005-04-25 CA CA2542266A patent/CA2542266C/en not_active Expired - Lifetime
- 2005-04-25 KR KR1020067009657A patent/KR101148765B1/ko not_active Expired - Fee Related
- 2005-04-25 ES ES05736693T patent/ES2330864T3/es not_active Expired - Lifetime
- 2005-04-25 PL PL10151443T patent/PL2182520T3/pl unknown
- 2005-04-25 EP EP20100159160 patent/EP2207183B8/en not_active Expired - Lifetime
- 2005-04-25 PL PL10159158T patent/PL2207181T3/pl unknown
- 2005-04-25 ES ES10151443T patent/ES2383654T3/es not_active Expired - Lifetime
- 2005-04-25 PL PL05736693T patent/PL1743338T3/pl unknown
- 2005-04-25 EP EP20100159159 patent/EP2207182B1/en not_active Expired - Lifetime
- 2005-04-25 AT AT10159160T patent/ATE555477T1/de active
- 2005-04-25 DE DE200560021926 patent/DE602005021926D1/de not_active Expired - Lifetime
- 2005-04-25 EP EP20100151443 patent/EP2182520B1/en not_active Expired - Lifetime
- 2005-04-25 ES ES10159158T patent/ES2388397T3/es not_active Expired - Lifetime
- 2005-04-25 CN CN2009102076644A patent/CN101697576B/zh not_active Expired - Fee Related
- 2005-04-25 PL PL10159160T patent/PL2207183T3/pl unknown
- 2005-04-25 AT AT10159158T patent/ATE555475T1/de active
- 2005-04-25 ES ES08158372T patent/ES2347385T3/es not_active Expired - Lifetime
- 2005-04-25 ES ES10159159T patent/ES2383655T3/es not_active Expired - Lifetime
- 2005-04-25 AT AT10151443T patent/ATE555474T1/de active
- 2005-04-25 US US10/586,442 patent/US7843994B2/en active Active
- 2005-04-25 AT AT05736693T patent/ATE443327T1/de not_active IP Right Cessation
- 2005-04-25 EP EP20080158372 patent/EP1968063B1/en not_active Expired - Lifetime
- 2005-04-25 PL PL10159159T patent/PL2207182T3/pl unknown
- 2005-04-25 EP EP05736693A patent/EP1743338B1/en not_active Expired - Lifetime
- 2005-04-25 ES ES10159160T patent/ES2383656T3/es not_active Expired - Lifetime
- 2005-04-25 EP EP20100151438 patent/EP2182519B1/en not_active Expired - Lifetime
- 2005-04-25 DE DE602005016663T patent/DE602005016663D1/de not_active Expired - Lifetime
- 2005-04-25 CN CN2005800135722A patent/CN1950907B/zh not_active Expired - Lifetime
- 2005-04-27 MY MYPI20051862A patent/MY144441A/en unknown
- 2005-04-27 MY MYPI2010001994A patent/MY145551A/en unknown
- 2005-04-27 TW TW098125882A patent/TWI395207B/zh not_active IP Right Cessation
- 2005-04-27 TW TW094113458A patent/TWI324338B/zh not_active IP Right Cessation
-
2007
- 2007-06-27 JP JP2007169798A patent/JP4614991B2/ja not_active Expired - Fee Related
- 2007-10-31 US US11/980,486 patent/US7809060B2/en active Active
- 2007-10-31 US US11/980,615 patent/US8254447B2/en not_active Expired - Fee Related
- 2007-10-31 US US11/980,530 patent/US8254446B2/en not_active Expired - Fee Related
- 2007-10-31 US US11/980,487 patent/US8130843B2/en not_active Expired - Fee Related
-
2008
- 2008-06-09 JP JP2008150176A patent/JP4185567B1/ja not_active Expired - Fee Related
-
2009
- 2009-10-30 JP JP2009251461A patent/JP4763824B2/ja not_active Expired - Fee Related
-
2010
- 2010-08-31 JP JP2010195100A patent/JP4910065B2/ja not_active Expired - Fee Related
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11792432B2 (en) * | 2020-02-24 | 2023-10-17 | Tencent America LLC | Techniques for signaling and identifying access unit boundaries |
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2330864T3 (es) | Aparato de generacion de flujo de imagenes en movimiento, aparado de codificacion de imagenes en movimiento, aparato de multiplexado de imagenes en movimiento y aparato de descodificacion de imagenes en movimiento. | |
| ES2405131T3 (es) | Aparato de codificación de imagen y aparato de decodificación de imagen | |
| ES2364755T3 (es) | Aparato de generación de trenes de información , procedimiento de generación de trenes de información, aparato de codificación, procedimiento de codificación, medio de grabación y programa para los mismos. | |
| ES2368965T3 (es) | Aparato de generación de trenes de información, procedimiento de generación de trenes de información, aparato de codificación, procedimiento de codificación, medio de grabación y programa para los mismos. |