WO2010082508A1 - 符号化方法、復号方法、符号化装置、復号装置、プログラム、及び集積回路 - Google Patents

符号化方法、復号方法、符号化装置、復号装置、プログラム、及び集積回路 Download PDF

Info

Publication number
WO2010082508A1
WO2010082508A1 PCT/JP2010/000261 JP2010000261W WO2010082508A1 WO 2010082508 A1 WO2010082508 A1 WO 2010082508A1 JP 2010000261 W JP2010000261 W JP 2010000261W WO 2010082508 A1 WO2010082508 A1 WO 2010082508A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
unit
field
encoding
access unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2010/000261
Other languages
English (en)
French (fr)
Inventor
チョン スン リム
西孝啓
柴原陽司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to BRPI1009953-0A priority Critical patent/BRPI1009953A2/pt
Priority to CA2707045A priority patent/CA2707045C/en
Priority to RU2010129246/07A priority patent/RU2479936C2/ru
Priority to JP2010520368A priority patent/JP4560143B2/ja
Priority to KR1020117026935A priority patent/KR101440183B1/ko
Priority to BRPI1001229A priority patent/BRPI1001229A2/pt
Priority to BRPI1009952-2A priority patent/BRPI1009952A2/pt
Priority to KR1020117026937A priority patent/KR101440184B1/ko
Priority to CN2010800008431A priority patent/CN101884220B/zh
Application filed by Panasonic Corp filed Critical Panasonic Corp
Priority to MX2010007649A priority patent/MX2010007649A/es
Priority to EP10731177.1A priority patent/EP2389000A4/en
Priority to US12/792,899 priority patent/US8451890B2/en
Publication of WO2010082508A1 publication Critical patent/WO2010082508A1/ja
Anticipated expiration legal-status Critical
Priority to US13/249,459 priority patent/US8548040B2/en
Priority to US13/249,469 priority patent/US8553761B2/en
Ceased legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/30Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
    • G11B27/3027Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/32Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
    • G11B27/327Table of contents
    • G11B27/329Table of contents on a disc [VTOC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/172Processing image signals image signals comprising non-image signal components, e.g. headers or format information
    • H04N13/178Metadata, e.g. disparity information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/172Processing image signals image signals comprising non-image signal components, e.g. headers or format information
    • H04N13/183On-screen display [OSD] information, e.g. subtitles or menus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/189Recording image signals; Reproducing recorded image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/112Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • H04N9/8211Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being a sound signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • H04N9/8233Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being a character code signal
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/21Disc-shaped record carriers characterised in that the disc is of read-only, rewritable, or recordable type
    • G11B2220/213Read-only discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2541Blu-ray discs; Blue laser DVR discs

Definitions

  • the present invention can be used for any multimedia data encoding method and decoding method, in particular H.264. It can be used for the encoding method and the decoding method of H.264 / MPEG-4 AVC multi-view video.
  • One of the methods is to show two images separately to the left and right eyes of the viewer. This is called stereo imaging in which two images are taken using two cameras.
  • One of the techniques previously used to display stereoscopic images is to filter the color components so that they can be viewed with one eye at a time. Such techniques reduce the resolution of the image that reaches each eye.
  • H.264 / MPEG-4 AVC multi-view video coding is formulated for the compression of a three-dimensional image when each view is displayed at the maximum resolution.
  • H.264 / MPEG-4 AVC Multi-View Video Coding (MVC) video standard provides a set of compression tools that allow for efficient compression of moving images targeted to a set of multiple views .
  • the MVC video standard makes it possible to compress pictures using predictive coding from reconstructed pictures that belong to different sets of views. This “inter-viewpoint” prediction efficiently compresses pictures using correlation of images taken with different cameras at almost the same time.
  • inter-view prediction is performed only on pictures of different views having the same picture order count information.
  • the picture order count information is used to indicate the order of reconstructed pictures of the same viewpoint.
  • pictures of different viewpoints having the same picture order count information (that is, view components defined in the MVC standard) are grouped as a container called an access unit. At this time, the size of these access units is subject to the restrictions defined by the buffer model defined by the video standard. Such constraints are necessary to ensure the correct decoding of the compressed video.
  • the view component defined in the MVC standard and in this specification is a coded representation of one viewpoint in a single access unit. An example of the viewpoint is an image.
  • H. H.264 / MPEG-4 AVC high profile is widely used in various applications such as high resolution storage media and high definition digital broadcasting.
  • the multi-view high profile defined in the MVC video standard is as follows.
  • H.264 which is formulated by extending H.264 / MPEG-4 AVC high profile, and is already realized.
  • the H.264 / MPEG-4 AVC high profile decoder can support decoding of a compressed video stream using multi-view high profile with simple modification.
  • the implemented MVC standards are the implemented H.323. In some cases, decoding of each viewpoint can be achieved independently using the H.264 / MPEG-4 AVC decoder.
  • Video content can be captured with a progressive scan camera or an interlaced scan camera.
  • the H.264 system is used.
  • the H.264 / MPEG-4 AVC High Profile provides a set of coding tools specifically directed to the handling of moving images captured by interlaced scanning.
  • each image can be encoded as a frame or multiple fields.
  • FIG. 1A shows pixel sampling locations of a frame picture having two fields interlaced scanned.
  • FIG. 1B shows pixel sampling positions of a field picture in which each interlaced scanned field is encoded as one field picture. If two complementary fields are encoded as one frame as shown in FIG. 1A, the frame has two picture order counts that represent the order of each field.
  • FIG. 2 shows an example of an access unit with different picture coding structures for each viewpoint.
  • access unit container A shown in module 200 has one frame picture of viewpoint 2 and one field picture of viewpoint 1 while access unit container B shown in module 202.
  • the frame picture of the view 2 in the access unit A can not sufficiently use the inter-view prediction from the view 1 and the compression efficiency is reduced.
  • each access unit container does not always have all the pictures (ie view components) of different views. Therefore, the size of each access unit can not be constrained by the limitations defined by the buffer model defined in the video standard to ensure proper encoding of the compressed video.
  • Another problem of the prior art is the restriction set to limit the size of an access unit container having a picture with multiple views (that is, a view component defined in the MVC standard)
  • a view component defined in the MVC standard There is Even though the maximum size of the access unit is limited, the maximum size of each picture of each view (that is, the view component defined in the MVC standard) in the access unit container is not restricted. Therefore, each viewpoint is different from H.
  • decoding with the H.264 / MPEG-4 AVC decoder there may be problems with the implementation of the MVC decoder.
  • constraints defined to limit the maximum size of the access unit ensure that each view component in the access unit is properly decoded when each view is decoded separately at the independent decoder It is not a thing.
  • constraints include the maximum number of slices and the size of each picture in the access unit (ie, the view component defined in the MVC standard).
  • the present invention has been made in view of the above circumstances, and provides an encoding method and a decoding method which improve the encoding efficiency of a plurality of image groups having different viewpoints, and an encoding apparatus and a decoding apparatus for realizing these. , Program, and integrated circuit.
  • An encoding method encodes first and second image groups of an interlaced scheme captured from different viewpoints. Specifically, an access unit definition step of defining an access unit configured of mutually corresponding images in the first and second image groups, and for each of the access units defined in the access unit definition step, And an encoding step of encoding each image constituting the access unit.
  • the access unit definition step includes a coding unit determination step of determining whether each image included in the access unit is to be encoded in a unit of field or a unit of frame, and each image included in the access unit And a field type determining step of determining whether to encode the respective images into a top field or a bottom field in a case where it is determined on a field basis. Then, in the encoding step, each image in the format determined in the encoding unit determination step and the field type determination step is encoded for each access unit.
  • a value indicating whether the image is a field unit image or a frame unit image may be set in the reference field_pic_flag.
  • a value indicating whether it is a top field or a bottom field may be set in the reference bottom_field_flag.
  • the value of the reference field_pic_flag is set in the field_pic_flag included in the and the value indicating the field unit image is set in the reference field_pic_flag
  • the value of the reference bottom_field_flag is included in the bottom_field_flag included in the slice header. It may be set.
  • the encoding step further comprises a first encoding step of encoding an image belonging to the first image group using a predicted image generated from an image in the first image group; An image belonging to the second image group using a predicted image generated from an image in two image groups or a predicted image generated from an image belonging to the first image group included in the same access unit And a second encoding step of encoding. Since the formats of all the images included in the same access unit are unified, the coding efficiency is improved in the case of performing inter-view prediction coding in the second coding step.
  • the coding method may include a step of checking the suitability of the coding process in the coding step.
  • the compatibility check step includes a maximum slice number calculation step of calculating a maximum slice number of each image included in the access unit, and a maximum byte number calculation of calculating a maximum byte number of each image included in the access unit. Comparing the number of slices and the number of bytes of each image encoded in the encoding step with the corresponding maximum number of slices and the maximum number of bytes, and feeding back the comparison result to the encoding step And may be included. This makes it possible to prevent the output of a bit stream that can not be decoded.
  • the quantization step may be increased or decreased based on the comparison result fed back from the comparison step. By increasing or decreasing the quantization step, the code amount can be adjusted.
  • a decoding method decodes a coded stream obtained by coding first and second image groups having different viewpoints for each access unit configured with mutually corresponding images. Specifically, in the access unit, it is determined whether the image belonging to the first image group and the image belonging to the second image group are synchronized or not, and the judging step The decoding step includes performing different decoding processing depending on whether it is determined that the synchronization is achieved or not.
  • the decoding process is performed after confirming the presence or absence of synchronization, it is possible to effectively prevent the inter-view prediction decoding process from being performed based on, for example, a predicted image different from the original predicted image. .
  • the slice header of each image included in the access unit includes the field_pic_flag and the bottom_field_flag described above. Then, in the determination step, the values of the field_pic_flag included in the slice header of the image belonging to the first image group and the image belonging to the second image group match, and the field_pic_flag is an image in units of fields. Synchronization is achieved by matching the value of the bottom_field_flag included in the slice header of the image belonging to the first image group and the image belonging to the second image group, when the value indicating that is set. It may be determined that
  • the decoding step includes: a first decoding step of decoding an image belonging to the first image group using a predicted image generated from an image in the first image group; and the second image The image belonging to the second image group is decoded using a predicted image generated from an image in a group or a predicted image generated from an image belonging to the first image group included in the same access unit And a second decoding step. Then, in the second decoding step, when it is determined in the determination step that synchronization is not achieved, an image included in the first image group included in the same access unit may be output. .
  • the inter-view prediction decoding process can not be performed. Therefore, the decoding process is stopped, and the corresponding image decoded normally is output. As a result, it is possible to solve the problem that an unnatural image is displayed although it is temporarily a two-dimensional image.
  • An encoding apparatus encodes first and second image groups of an interlaced scheme captured from different viewpoints.
  • an access unit definition unit that defines an access unit configured by mutually corresponding images in the first and second image groups, and for each of the access units defined by the access unit definition unit, And an encoding unit configured to encode each image constituting the access unit.
  • the access unit definition unit determines a coding unit determination unit that determines whether each image included in the access unit is to be encoded in a unit of field or a unit of frame, and each image included in the access unit And a field type determination unit that determines whether to encode each of the images into a top field or a bottom field in a case where it is determined on a field basis. Then, the encoding unit encodes each image of the format determined in the encoding unit determination step and the field type determination step for each access unit.
  • a decoding apparatus decodes a coded stream obtained by coding first and second image groups having different viewpoints for each access unit configured with mutually corresponding images. Specifically, in the access unit, a determination unit that determines whether an image belonging to the first image group and an image belonging to the second image group are synchronized, and the determination unit And a decoding unit that executes different decoding processing depending on whether it is determined that synchronization is achieved or not.
  • a program causes a computer to encode interlaced first and second image groups captured from different viewpoints. Specifically, an access unit definition step of defining an access unit configured of mutually corresponding images in the first and second image groups, and for each of the access units defined in the access unit definition step, And an encoding step of encoding each image constituting the access unit.
  • the access unit definition step includes a coding unit determination step of determining whether each image included in the access unit is to be encoded in a unit of field or a unit of frame, and each image included in the access unit And a field type determining step of determining whether to encode the respective images into a top field or a bottom field in a case where it is determined on a field basis. Then, in the encoding step, each image in the format determined in the encoding unit determination step and the field type determination step is encoded for each access unit.
  • a program causes a computer to decode an encoded stream obtained by encoding first and second image groups having different viewpoints for each access unit configured with mutually corresponding images. . Specifically, in the access unit, it is determined whether the image belonging to the first image group and the image belonging to the second image group are synchronized or not, and the judging step The decoding step includes performing different decoding processing depending on whether it is determined that the synchronization is achieved or not.
  • An integrated circuit encodes interlaced first and second image groups captured from different viewpoints.
  • an access unit definition unit that defines an access unit configured by mutually corresponding images in the first and second image groups, and for each of the access units defined by the access unit definition unit, And an encoding unit configured to encode each image constituting the access unit.
  • the access unit definition unit determines a coding unit determination unit that determines whether each image included in the access unit is to be encoded in a unit of field or a unit of frame, and each image included in the access unit And a field type determination unit that determines whether to encode each of the images into a top field or a bottom field in a case where it is determined on a field basis. Then, the encoding unit encodes each image of the format determined in the encoding unit determination step and the field type determination step for each access unit.
  • An integrated circuit decodes a coded stream obtained by coding first and second image groups having different viewpoints for each access unit configured with mutually corresponding images. Specifically, in the access unit, a determination unit that determines whether an image belonging to the first image group and an image belonging to the second image group are synchronized, and the determination unit And a decoding unit that executes different decoding processing depending on whether it is determined that synchronization is achieved or not.
  • FIG. 1A shows an example of a frame picture.
  • FIG. 1B shows an example of a field picture.
  • FIG. 2 shows an example of an access unit with different picture coding structures for each viewpoint.
  • FIG. 3 is an example showing a data structure of an access unit.
  • FIG. 4 is a functional block diagram of the coding apparatus according to Embodiment 1 of the present invention.
  • FIG. 5 is a functional block diagram of a view component coding unit.
  • FIG. 6 is a functional block diagram of the compatibility check unit.
  • FIG. 7 is a flowchart showing the entire process of encoding an MVC access unit.
  • FIG. 8 is a flowchart illustrating encoding processing of view components of the MVC access unit.
  • FIG. 9 is a flowchart showing a process of determining the compatibility of the MVC access unit.
  • FIG. 10 is a functional block diagram of a decoding apparatus according to Embodiment 1 of the present invention.
  • FIG. 11 is a diagram showing a modification of the decoding apparatus shown in FIG.
  • FIG. 12 is a flowchart showing decoding processing of a view component of the MVC access unit.
  • FIG. 13 is a schematic view showing an example of the entire configuration of the content supply system for realizing the content distribution service.
  • FIG. 14 is a view showing the appearance of a mobile phone.
  • FIG. 15 is a block diagram showing a configuration example of a mobile phone.
  • FIG. 16 is a schematic view showing an example of the entire configuration of the digital broadcasting system.
  • FIG. 17 is a block diagram showing a configuration example of a television.
  • FIG. 18 is a block diagram showing a configuration example of an information reproduction and recording unit that reads and writes information on a recording medium which is an optical disk.
  • FIG. 19 is a view showing an example of the structure of a recording medium which is an optical disc.
  • FIG. 20 is a block diagram showing a configuration example of an integrated circuit for realizing the image coding method and the image decoding method according to each embodiment.
  • a new method is introduced that constrains the picture coding structure (frame / field picture coding) and the data size of each picture in the access unit (that is, the view component defined in the MVC standard).
  • the novelty of the present invention is that each viewpoint is an existing H.264.
  • the method of decoding separately using the H.264 / MPEG-4 AVC decoder is to ensure successful decoding of the video stream compressed using the MVC standard.
  • This new invention adds constraints to the data size and the value of the specific syntax of each picture in the access unit (ie, the view component defined in the MVC standard).
  • An advantage of the invention is the low cost implementation of the MVC standard encoders and decoders.
  • the present invention also helps to improve coding efficiency as "inter-view" prediction is available between field pictures of each view.
  • the present invention includes two main processes: encoding process of view component of access unit and decoding process of view component of access unit.
  • the present invention limits the values of the syntax in the slice header shown in FIG. 3, that is, the values of field_pic_flag and bottom_field_flag, in the slice header to be the same among all view components in the same access unit, in order to solve the problems described above.
  • the field_pic_flag of FIG. 3 is used to determine whether the slice associated with the view component is encoded as a field or as a frame. For example, if the value of field_pic_flag is "1", it indicates that the slice belongs to a view component encoded as one field, and if the value is "0", the slice is encoded as a frame. Indicates that it belongs to a view component.
  • the bottom_field_flag of FIG. 3 is used to determine whether the slice associated with the view component encoded as a field is a top field or a bottom field. Whether or not bottom_field_flag is present in the slice header depends on the value of field_pic_flag. For example, if the value of bottom_field_flag is “1”, it indicates that the slice belonging to the view component encoded as a field is a bottom field, and if the value of bottom_field_flag is “0”, it is encoded as a field Indicates that the slice belonging to the view component is the top field. However, when “0” is set in the field_pic_flag of the slice header output from the encoding apparatus, the bottom_field_flag of the slice header is omitted.
  • the invention also limits the total number of slices and the total number of bytes of each view component in the access unit.
  • FIG. 4 is a functional block diagram of the coding apparatus 10 according to Embodiment 1 of the present invention.
  • the encoding apparatus 10 is an apparatus for encoding an image of a viewpoint 1 and an image of a viewpoint 2 and includes an access unit definition unit 20 and a view component encoding unit 800 as shown in FIG. 4.
  • the image of the viewpoint 1 is a moving image (first image group) of an interlace method in which an object is captured from a first viewpoint.
  • the image of the viewpoint 2 is a moving image (second image group) of the interlace method in which the same object is captured from a second viewpoint different from the first viewpoint.
  • the access unit definition unit 20 includes an encoding unit determination unit 30 and a field type determination unit 40, and defines an access unit composed of images corresponding to each other of the viewpoint 1 and the viewpoint 2.
  • the “corresponding image” refers to, for example, an image captured at the same time, and the same PTS (Presentation Time Stamp) is added. Alternatively, the corresponding pictures are given the same picture order count.
  • the coding unit determination unit 30 determines whether each image included in the access unit is to be encoded in a unit of field or a unit of frame. More specifically, the coding unit determination unit 30 sets “0” to the reference field_pic_flag, which is an internal variable, when unifying the images included in the access unit in frame units. On the other hand, when making it unify to a field unit, "1" is set to reference field_pic_flag.
  • the field type determination unit 40 determines whether the images are to be unified into the top field or the bottom field and encoded. More specifically, when unifying the images included in the access unit into the top field, the field type determination unit 40 sets “0” to the reference bottom_field_flag which is an internal variable. On the other hand, in the case of unifying to the bottom field, the reference bottom_field_flag is set to “1”. However, this process is performed only when “1” is set in the reference field_pic_flag, and when “0” is set in the reference field_pic_flag, “0” is automatically set in the reference bottom_field_flag.
  • the view component encoding unit 800 encodes, for each access unit defined by the access unit definition unit 20, each image of the format determined by the encoding unit determination unit 30 and the field type determination unit 40.
  • FIG. 5 is a functional block diagram of the view component coding unit 800.
  • the view component coding unit 800 includes first and second view component coding units 900 and 904, and a storage unit 902. However, as a modification of the view component coding unit 800, the first and second view component coding units 800 and 900 may be integrated.
  • the first view component coding unit 900 reads out the image D 001 of the viewpoint 1.
  • the format of the image D001 read out at this time is either field unit or frame unit based on the determination contents of the coding unit determination unit 30 and the field type determination unit 40, and further (in the case of field unit) the top field or It is determined to be one of the bottom fields.
  • the first view component coding unit 900 codes the read image D 001 in slice units. For example, the first view component coding unit 900 subtracts the predicted image of the image D001 from the image D001, performs orthogonal transform (DCT transform), quantizes, and performs entropy coding to obtain the encoded view component D005 of the viewpoint 1 obtained. Is output to Vout. At this time, the predicted image of the image D 001 is generated (in-screen prediction or inter-screen prediction) using the already encoded image of the images of the viewpoint 1. That is, the viewpoint 1 in the first embodiment is the “Base view” which does not depend on other viewpoints (in this example, the viewpoint 2).
  • DCT transform orthogonal transform
  • the first view component coding unit 900 performs inverse quantization on the quantization coefficient obtained by quantization, performs inverse orthogonal transform, and outputs a reconstructed image D 003 obtained by adding the predicted image to the storage unit 902. Do. Furthermore, the first view component coding unit 900 outputs the value of bottom_field_flag and the value of field_pic_flag used for coding the coding view component D 005 to the second view component coding unit 904.
  • the second view component encoding unit 904 reads out the image D002 of viewpoint 2 included in the same access unit as the image D001 of viewpoint 1.
  • the format of the image D002 read out at this time is either field unit or frame unit, or further (in the case of field unit, based on the value of bottom_field_flag and the value of field_pic_flag acquired from the first view component encoding unit 900). ) Determined as either top field or bottom field. That is, the image D001 and the image D002 have the same format.
  • the second view component encoding unit 904 encodes the read image D002 in units of slices, and outputs the encoded view component D007 to Vout.
  • the specific encoding process is the same as that of the first view component encoding unit 900
  • the predicted image of the image D002 is generated using the already encoded image of the images of viewpoint 2 (in-screen prediction Alternatively, inter-screen prediction may be performed, or generation (inter-view prediction) may be performed using an image of viewpoint 1 (that is, a reconstructed image D003 of image D001) included in the same access unit. This is different from the view component coding unit 900 of FIG.
  • the encoding device 10 according to Embodiment 1 may further include the compatibility check unit 815.
  • FIG. 6 is a functional block diagram of the compatibility check unit 815.
  • Conformance check unit 815 includes slice number calculation unit 804, byte number calculation unit 802, maximum slice number calculation unit 806, comparison units 808 and 812, maximum byte number calculation unit 810, and switching unit 814. .
  • the conformance check unit 815 analyzes the result of the encoding process performed by the view component encoding unit 800, and feeds back the analysis result to the view component encoding unit 800.
  • the view component coding unit 800 outputs the coding view component D 005 of the viewpoint 1 to the slice number calculation unit 804, the byte number calculation unit 802, and the switching unit 814.
  • the process for the encoded view component D 007 of the viewpoint 2 is also the same, so in the following description, the process for the encoded view component D 005 of the viewpoint 1 will be mainly described.
  • the slice number calculation unit 804 outputs the acquired total number D011 of slices in the encoded view component D005 to the comparison unit 808.
  • the number-of-bytes calculation unit 802 outputs the obtained total number of bytes D012 in the encoded view component D005 to the comparison unit 812.
  • the maximum slice number calculation unit 806 outputs the maximum slice number D 014 for each view component to the comparison unit 808 based on the acquired profile information and level information input D 013.
  • the method of determining the maximum number of slices D014 for each view component is not particularly limited, for example, the maximum number of slices of the image belonging to the viewpoint 1 which is "Base view” is relatively increased, and the viewpoint 2 which is “Dependent view” The maximum number of slices of the belonging image may be relatively reduced.
  • the maximum byte number calculation unit 810 outputs the maximum byte number D015 for each view component to the comparison unit 808 based on the acquired profile information and level information input D013.
  • the method of determining the maximum number of bytes D015 for each view component is not particularly limited, for example, the maximum number of bytes of the image belonging to the viewpoint 1 which is "Base view” is relatively increased, and the viewpoint 2 which is “Dependent view” The maximum number of bytes of the belonging image may be relatively reduced.
  • the comparison unit 808 compares the total number of slices D011 with the maximum number of slices D014. Then, if the total number of slices D011 is equal to or less than the maximum number of slices D014, it is determined that the encoding process conforms to a predetermined condition, and the valid signal D016 is output to the switching unit 814. On the other hand, if the total number of slices D011 is larger than the maximum number of slices D014, the comparison unit 808 determines that the encoding process does not meet the predetermined condition, and outputs the control signal D017 to the view component encoding unit 800.
  • the comparison unit 812 compares the total number of bytes D012 with the maximum number of bytes D015. Then, if the total byte count D012 is equal to or less than the value of the maximum byte count D015, it is determined that the encoding processing conforms to a predetermined condition, and the valid signal D018 is output to the switching unit 814. On the other hand, if the total number of bytes D012 is larger than the maximum number of bytes D015, the comparison unit 812 determines that the encoding process does not meet the predetermined condition, and outputs the control signal D019 to the view component encoding unit 800.
  • the view component encoding unit 800 re-encodes the same input image when any of the control signals D017 and D019 is received.
  • the encoding process is performed using, for example, a quantization step larger than the quantization step used in the previous encoding process, in order to conform to a predetermined condition.
  • the switching unit 814 is enabled when both of the enabling signals D016 and D018 are received from the comparing units 808 and 812, and outputs the encoded view component D005 to Vout. When not received, the switching unit 814 does not output the encoded view component D 005 to Vout.
  • the view component coding unit 800 may output the coded view component D005 in units of pictures at the timing when all coding of the image D001 is completed. However, if it is found that the image D001 does not meet the predetermined conditions after the encoding of the image D001 is complete, the same image D001 needs to be re-encoded under different conditions (such as changing the quantization step). The processing load of the view component coding unit 800 is increased.
  • the view component coding unit 800 may output the slice view of the coding view component D 005 at the timing when the coding of each slice constituting the image D 001 is completed. Also, the number-of-bytes calculation unit 802 may output the total number of bytes D012 of the encoded view component D005 encoded up to now to the comparison unit 812 one by one.
  • the comparison unit 812 can predict in advance the possibility that the total number of bytes D012 exceeds the maximum number of bytes D015, and can transmit the control signal D019 to the view component encoding unit 800. Then, based on the control signal D019, the view component encoding unit 800 can make the encoding process conform to a predetermined condition by, for example, enlarging the quantization step during the encoding of the image D001. .
  • FIG. 7 is a flowchart showing the entire process of encoding an access unit using the MVC standard.
  • the view component coding unit 800 first codes all view components in the access unit (S700).
  • the conformance check unit 815 verifies the conformance of the access unit by determining the value of the parameter ConformanceFlag (S702). Does ConformanceFlag be less than or equal to the maximum value allowed for normal decoding of view components in the access unit by the typical decoder of the MVC standard, and the total number of slices in all view components and the total number of bytes in all access units? It is used to indicate whether or not.
  • ConformanceFlag Does ConformanceFlag be less than or equal to the maximum value allowed for normal decoding of view components in the access unit by the typical decoder of the MVC standard, and the total number of slices in all view components and the total number of bytes in all access units? It is used to indicate whether or not.
  • the conformance check unit 815 determines the total number of slices in all view components and all of them.
  • the view component coding unit 800 views the access unit in such a way that the total number of bytes in the access unit in the access unit is less than or equal to the maximum value allowed for normal decoding of the view component in the access unit by the normal decoder of the MVC standard.
  • the component is re-encoded to reduce either the total number of slices or the total number of bytes in the view component (S706).
  • the view component encoding unit 800 when the ConformanceFlag of the view component belonging to "Base view” becomes “0", the view component encoding unit 800 has already encoded among the other view components belonging to "Base view”. An encoded view component may be output. It is desirable that the coding view component selected at this time be immediately before (in order of reproduction time) the view component for which coding has failed (conformance violation). On the other hand, when the ConformanceFlag of a view component belonging to "Dependent view” becomes “0", view component encoding section 800 outputs an encoded view component belonging to "Base view” included in the same access unit. Good.
  • FIG. 8 is a flowchart showing an encoding process of view components of the access unit.
  • the coding unit determination unit 30 determines the value of the reference field_pic_flag (S502).
  • the method of determining the reference field_pic_flag is not particularly limited, and any conventional method can be used.
  • the field type determination unit 40 compares the value of the reference field_pic_flag with "0" (S504). If the value of field_pic_flag is equal to "0" (Yes in S504), the field type determination unit 40 sets the reference bottom_field_flag to "0" (S506). On the other hand, if the value of field_pic_flag is not equal to “0” (S504: No), field type determination unit 40 determines the value of reference bottom_field_flag (S508).
  • the determination method of reference bottom_field_flag is not specifically limited, All the conventional methods can be used.
  • the reference field_pic_flag is later used to set the values of all field_pic_flags of slices in the same access unit. Also, the reference bottom_field_flag is later used to set the value of all bottom_field_flag of the slice in the same access unit.
  • the access unit definition unit 20 refers to the value of field_pic_flag in the slice header of all slices for all slices (S512 to S528) in all view components (S510 to S530) of the same access unit. It is set to a value equal to the value of field_pic_flag (S514).
  • the access unit definition unit 20 sets the value of bottom_field_flag in the slice header of all slices in the same access unit to the value of reference bottom_field_flag. (S520). On the other hand, if the value of field_pic_flag is not equal to "1" (No in S516), access unit definition unit 20 sets the value of bottom_field_flag in the slice header of all slices in the same access unit to "0". (S518). Note that S516 and S518 may be omitted, and the value of bottom_field_flag in the slice header of all slices in the same access unit may be set as the value of reference bottom_field_flag.
  • the view component coding unit 800 executes coding of all slices in the same access unit based on the value of field_pic_flag and the value of bottom_field_flag (S526).
  • the details of the encoding process of the view component encoding unit 800 are as described with reference to FIG.
  • FIG. 9 is a flow chart showing the compatibility confirmation process of the access unit. This process can also be applied to the conformance check of view components in the access unit.
  • the maximum number-of-slices calculation unit 806 determines the maximum number of slices D014 permitted for each view component in one access unit (S600).
  • the allowable maximum number of slices D014 is calculated based on the profile information indicated by the syntax element transmitted by the compressed stream associated with the access unit and the limit defined by the level information D013.
  • Such syntax elements are, for example, profile_idc syntax and level_idc syntax in the sequence parameter set of the MVC encoded stream.
  • the maximum number of bytes calculating unit 810 determines the maximum number of bytes D015 allowed for each view component in one access unit (S602).
  • the allowable maximum number of bytes D015 is calculated based on the profile information indicated by the syntax element transmitted by the encoded video stream associated with the access unit and the restriction defined by the level information D013.
  • the compatibility check unit 815 determines the number of view components in one access unit (S604). Then, the conformance check unit 815 sets the parameter ConformanceFlag to "1" (S608). This parameter ConformanceFlag is a requirement for view components in the access unit to be correctly decoded by the video decoder by associating profile values and level values higher than the specified profile value and level value in the encoded video stream. It is used to determine if it is satisfied.
  • the byte number calculation unit 802 initializes the parameter NumBytesInViewComponent to “0” (S612).
  • the slice number calculation unit 804 also initializes the parameter NumOfSlices to “0” (S614).
  • the parameter NumBytesInViewComponent is a counter that counts the total number of bytes D012 in the view component.
  • the parameter NumOfSlices is a counter that counts the total number of slices D011 in the view component.
  • the number-of-bytes calculation unit 802 adds the total number of bytes represented by the parameter NumBytesInNALUnit to the parameter NumBytesInViewComponent (S618). That is, the parameter NumBytesInViewComponent has a value equal to the sum of the parameters NumBytesInNALUnit associated with that view component.
  • the NAL unit is based on H. It is defined as a network abstraction layer defined in the H.264 / MPEG-4 AVC standard, and has encoded video data.
  • the slice number calculation unit 804 increments the parameter NumOfSlices by one (S624). That is, the parameter NumOfSlices has a value equal to the total number of slices associated with the same view component.
  • the comparison units 808 and 812 compare the values of the parameter NumBytesInViewComponent and the parameter NumOfSlices with the maximum number of bytes D015 and the maximum number of slices D014 allowed in one view component (S628, S630).
  • the comparison unit 812 sets the parameter ConformanceFlag to “0” (S634). If the value of NumOfSlices is larger than the allowable maximum number of slices D014 (Yes in S630), the comparison unit 808 sets the parameter ConformanceFlag to “0” (S634).
  • the parameter ConformanceFlag is set to “0” because the view component in the access unit associates the profile value and level value higher than the specified profile value and level value in the encoded video stream and the video decoder Indicates that it may not be decoded correctly.
  • FIG. 10 is a functional block diagram of the decoding device 50 according to Embodiment 1 of the present invention.
  • the decoding device 50 includes a view component distribution unit 1000, first and second slice header analysis units 1002 and 1004, a comparison unit 1006, a switching unit 1010, and first and second.
  • the A-type view component decoding units 1008 and 1014, the B-type view component decoding unit 1016, and the storage unit 1012 are provided.
  • the view component distribution unit 1000 reads the coding access unit D021 and distributes it to two first and second view components D023 and D022.
  • the first view component D 023 is an image belonging to viewpoint 1 (Base view) which does not depend on the second view component D 022 when correctly reconstructing the image.
  • the second view component D022 is an image belonging to the viewpoint 2 (Dependent view) depending on the first view component D023 when correctly reconstructing the image.
  • the first slice header analysis unit 1002 reads the first view component D 023, and outputs bottom_field_flag and field_pic_flag information D 025 to the comparison unit 1006.
  • the second slice header analysis unit 1004 reads the second view component D 022, and outputs bottom_field_flag and field_pic_flag information D 026 to the comparison unit 1006.
  • the comparison unit 1006 compares the information D025 values of the bottom_field_flag and the field_pic_flag from the first slice header analysis unit 1002 with the information D026 of the bottom_field_flag and the field_pic_flag from the second slice header analysis unit 1004, and controls the comparison result Signal D 027 is output to switching unit 1010.
  • the comparison unit 1006 is a determination unit that determines whether or not the first view component D023 belonging to the viewpoint 1 and the second view component D022 belonging to the viewpoint 2 are synchronized in the same access unit. Function. That is, if the values of the bottom_field_flag and the field_pic_flag of the first and second view components D023 and D022 match, the comparison unit 1006 determines that the two are synchronized. On the other hand, if at least one of these values does not match, the comparison unit 1006 determines that synchronization is not achieved.
  • the parameter for determining whether or not synchronization is established is not limited to the above example. For example, if the PTS (Presentation Time Stamp) and the DTS (Decoding Time Stamp) held by the first and second view components D023 and D022 match, synchronization is achieved if they do not match. You may decide that you have not taken it.
  • PTS Presentation Time Stamp
  • DTS Decoding Time Stamp
  • the first A-type view component decoding unit 1008 reads the first view component D 023 and outputs an image D 031 of the viewpoint 1. Further, the first A-type view component decoding unit 1008 outputs the reconstructed image D 031 of the viewpoint 1 to the storage unit 1012. Specifically, the first A-type view component decoding unit 1008 entropy-decodes the first view component D 023, inversely quantizes it, performs inverse orthogonal transformation, and adds a predicted image to reconstruct an image D 031. Output.
  • the first view component D 023 belongs to “Base view”, the predicted image is generated (in-screen prediction or inter-screen prediction) using the already decoded image of the images of viewpoint 1. .
  • the switching unit 1010 outputs the second view component D 022 to either the second A-type view component decoding unit 1014 or the B-type view component decoding unit 1016 based on the control signal D 027 acquired from the comparison unit 1006. Do. Specifically, when the first and second view components D 023 and D 022 are synchronized, the switching unit 1010 outputs the second view component D 022 to the second A-type view component decoding unit 1014. . On the other hand, when the two are not synchronized, the second view component D 022 is output to the B-type view component decoding unit 1016.
  • the second A-type view component decoding unit 1014 When the second A-type view component decoding unit 1014 receives the second view component D022, the second A-type view component decoding unit 1014 decodes the second view component D022 using the reconstructed image D031 of the viewpoint 1 read from the storage unit 1012 Image of the viewpoint 2 is output.
  • the specific encoding process is the same as that of the first A-type view component decoding unit 1008, but a predicted image is generated using an already decoded image of the images of viewpoint 2 (in-screen prediction or screen Inter-prediction, or the first A-type view component decoding in that it may be generated (inter-view prediction) using an image of viewpoint 1 (that is, image D031) included in the same access unit. It differs from part 1008.
  • the B-type view component decoding unit 1016 When receiving the second view component D022, the B-type view component decoding unit 1016 outputs an image D035 of viewpoint 2.
  • the case where the decoding process is executed by the B-type view component decoding unit 1016 is a case where the first and second view components D 023 and D 022 are not synchronized, so decoding using at least “inter-view prediction” It is considered impossible to process. Therefore, when the second view component D 022 is a coded object using “inter-view prediction” and is an object, the B-type view component decoding unit 1016 collectively stores the decoding processing and is stored in the storage unit 1012.
  • the existing image D 031 is output as the image D 035 of the viewpoint 2 and encoded using “in-screen prediction” or “inter-frame prediction”
  • normal decoding processing may be performed.
  • the image D031 stored in the storage unit 1012 may be output as the image D035 of the viewpoint 2 regardless of the type of prediction.
  • decoding devices may not have the B-type view component decoding unit 1016.
  • FIG. 11 is a functional block diagram of a decoding device 60 which is a modification of the decoding device 50.
  • the decoding device 60 includes a field view component distribution unit 1100, first and second field view component decoding units 1102 and 1104, and a storage unit 1106.
  • the field view component distributor 1100 reads out the coded access unit D041 and distributes it to the first and second view components D044, D042. Then, the field view component distribution unit 1100 outputs the first view component D 044 to the first field view component decoding unit 1102 and the second view component D 042 to the second field view component decoding unit 1104.
  • the first view component D 044 is an image belonging to the viewpoint 1 (Base view) which does not depend on the second view component D 042 when the image is correctly reconstructed.
  • the second view component D042 is an image belonging to the viewpoint 2 (Dependent view) which depends on the first view component D044 when correctly reconstructing the image.
  • the view components D042 and D044 may be single field pictures.
  • the first field view component decoding unit 1102 decodes the field-based first view component D 044 belonging to the acquired viewpoint 1 and outputs an image D 051 of the viewpoint 1. Further, the reconstructed image D 051 of the viewpoint 1 is also stored in the storage unit 1106.
  • the storage unit 1106 includes a memory buffer for storing the reconstructed image D051 of the viewpoint 1 output from the first field view component decoding unit 1102.
  • the second field view component decoding unit 1104 decodes the second view component D042 of the field unit belonging to the acquired viewpoint 2 using the reconstructed image D051 of the viewpoint 1 acquired from the storage unit 1106, The two reconstructed images D054 are output.
  • FIG. 12 is a flowchart showing the decoding process of the view component of the access unit.
  • the comparison unit 1006 sets “0” to the parameter SpecialDecodingFlag (S400).
  • This SpecialDecodingFlag uses the normal decoding process defined in the MVC standard for the decoding process of all the second view components D022 in the access unit, or for the decoding of some view components in the access unit. It is used to decide whether to use a different decoding process. That is, it corresponds to the control signal D027 shown in FIG.
  • the first slice header analysis unit 1002 determines the value of the reference field_pic_flag from the slice header of one slice of the first view component D 023 belonging to "Base view” (S402).
  • the value of this reference field_pic_flag is later used to compare with the value of field_pic_flag in the slice header of other view components.
  • the first slice header analysis unit 1002 extracts the value of reference bottom_pic_flag from the slice header of one slice of the first view component D023. It decides (S408). On the other hand, if the value of the field_pic_flag is equal to “0” (Yes in S404), the first slice header analysis unit 1002 sets “0” to the value of the reference bottom_pic_flag (S406). The value of this reference bottom_pic_flag is later used to compare with the value of bottom_pic_flag in the slice header of other view components.
  • the second slice header analysis unit 1004 determines the value of field_pic_flag from the slice header of the slice (S414). If the value of field_pic_flag is not equal to “0” (No in S416), the second slice header analysis unit 1004 determines the value of bottom_pic_flag from the slice header of the slice (S420). On the other hand, if the value of field_pic_flag is equal to "0" (Yes in S416), the second slice header analysis unit 1004 sets "0" to the value of bottom_field_flag (S418).
  • the comparison unit 1006 compares the values of field_pic_flag and bottom_field_flag acquired from the second slice header analysis unit 1004 with the values of reference field_pic_flag and reference bottom_field_flag acquired from the first slice header analysis unit 1002 (S422, S 426).
  • the comparison unit 1006 sets “1” in the parameter SpecialDecodingFlag (S432). Similarly, if the value of bottom_field_flag is not equal to the value of reference bottom_field_flag (No in S428), the comparison unit 1006 sets “1” in the parameter SpecialDecodingFlag (S432). Then, the comparison unit 1006 outputs the value of the parameter SpecialDecodingFlag (that is, the control signal D027) to the switching unit 1010.
  • the switching unit 1010 compares the parameter SpecialDecodingFlag with “1” (S438). If this parameter SpecialDecodingFlag is not equal to “1” (S438: No), all view components in the access unit are decoded by the decoding process defined in the MVC standard (S440). On the other hand, if SpecialDecodingFlag is equal to "1" (Yes in S438), the view component belonging to "Dependent view” in the access unit is decoded by a decoding process different from the above (S442).
  • An example of a different decoding process is to correctly reconstruct only one view component in the access unit from the video decoder.
  • the present invention can also be used when encoding moving images captured from two or more different viewpoints.
  • the storage medium may be a magnetic disk, an optical disk, a magneto-optical disk, an IC card, a semiconductor memory, or the like as long as the program can be recorded.
  • FIG. 13 is a diagram showing an overall configuration of a content supply system ex100 for realizing content distribution service.
  • the area for providing communication service is divided into desired sizes, and base stations ex106 to ex110, which are fixed wireless stations, are installed in each cell.
  • This content supply system ex100 includes a computer ex111, a personal digital assistant (PDA) ex112, a camera ex113, a mobile phone ex114, and a game machine via the Internet ex101, the Internet service provider ex102 and the telephone network ex104, and the base stations ex106 to ex110. Each device such as ex115 is connected.
  • PDA personal digital assistant
  • each device may be directly connected to the telephone network ex104 without passing through the base stations ex106 to ex110, which are fixed wireless stations.
  • the devices may be directly connected to each other via near field communication or the like.
  • the camera ex113 is a device capable of shooting moving images such as a digital video camera
  • the camera ex116 is a device capable of shooting still images and moving images such as a digital camera.
  • the mobile phone ex114 is a GSM (Global System for Mobile Communications) system, a CDMA (Code Division Multiple Access) system, a W-CDMA (Wideband-Code Division Multiple Access) system, or an LTE (Long Term Evolution) system, HSPA ( It may be a High Speed Packet Access mobile phone, a PHS (Personal Handyphone System), or the like.
  • live distribution and the like become possible by connecting the camera ex113 and the like to the streaming server ex103 through the base station ex109 and the telephone network ex104.
  • live distribution encoding processing is performed on content (for example, video of music live, etc.) captured by the user using the camera ex113 as described in the above embodiment, and the encoded content is transmitted to the streaming server ex103.
  • the streaming server ex 103 streams the content data transmitted to the requested client.
  • the clients include the computer ex111, the PDA ex112, the camera ex113, the mobile phone ex114, the game machine ex115 and the like capable of decoding the above-mentioned encoded data.
  • Each device that has received the distributed data decrypts and reproduces the received data.
  • encoding processing of captured data may be performed by the camera ex 113, may be performed by the streaming server ex 103 that performs data transmission processing, or may be performed sharing each other.
  • the decryption processing of similarly distributed data may be performed by the client, may be performed by the streaming server ex 103, or may be performed sharing each other.
  • not only the camera ex113 but also still images and / or moving image data captured by the camera ex116 may be transmitted to the streaming server ex103 via the computer ex111.
  • the encoding process in this case may be performed by any of the camera ex 116, the computer ex 111, and the streaming server ex 103, or may be performed sharing each other.
  • the encoding process and the decoding process are generally performed by a computer ex 111 and a large scale integration (LSI) ex 500 included in each device.
  • the LSI ex 500 may be a single chip or a plurality of chips.
  • Software for image coding and image decoding is incorporated in any recording medium (CD-ROM, flexible disk, hard disk, etc.) readable by computer ex111 etc., and the coding process and decoding process are performed using the software. May be Furthermore, when the mobile phone ex114 is equipped with a camera, moving image data acquired by the camera may be transmitted. The moving image data at this time is data encoded by the LSI ex 500 included in the mobile phone ex 114.
  • the streaming server ex103 may be a plurality of servers or a plurality of computers, and may process, record, or distribute data in a distributed manner.
  • the client can receive and reproduce the encoded data.
  • the client can receive, decode, and reproduce the information transmitted by the user in real time, and even a user who does not have special rights or facilities can realize personal broadcasting.
  • the image encoding method or the image decoding method described in the above embodiment may be used for encoding and decoding of each device constituting the content supply system.
  • the mobile phone ex114 will be described as an example.
  • FIG. 14 is a diagram showing a cellular phone ex114 using the image coding method and the image decoding method described in the above embodiment.
  • the cellular phone ex114 is an antenna ex601 for transmitting and receiving radio waves to and from the base station ex110, a video such as a CCD camera, a camera unit ex603 capable of taking a still image, a video shot with the camera unit ex603, and the antenna ex601.
  • a display unit ex602 such as a liquid crystal display for displaying data obtained by decoding a received video or the like, a main body unit including operation keys ex604, an audio output unit ex608 such as a speaker for audio output, and audio input Audio input unit ex605 such as microphone, captured moving image or still image data, received mail data, moving image data or still image data, etc., for recording encoded data or decoded data
  • Media ex 607, recording media ex 607 can be attached to mobile phone ex 114 And a slot unit ex606 for.
  • the recording medium ex 607 stores a flash memory element, which is a type of EEPROM, which is a nonvolatile memory that can be electrically rewritten and erased, in a plastic case such as an SD card.
  • a mobile phone ex114 is provided with a power control circuit ex710, an operation input control unit ex704, an image encoding, and a main control unit ex711 that is configured to integrally control each unit of the main unit including the display unit ex602 and the operation key ex604.
  • Unit ex712, camera interface unit ex703, LCD (Liquid Crystal Display) control unit ex702, image decoding unit ex709, demultiplexing unit ex708, recording / reproduction unit ex707, modulation / demodulation circuit unit ex706, and audio processing unit ex705 are mutually connected via synchronization bus ex713 It is connected.
  • the power supply circuit unit ex710 activates the camera-equipped digital mobile phone ex114 to an operable state by supplying power from the battery pack to each unit when the end of the call and the power key are turned on by the operation of the user. .
  • the mobile phone ex114 converts the audio signal collected by the audio input unit ex605 into digital audio data by the audio processing unit ex705 based on the control of the main control unit ex711 including CPU, ROM, RAM, etc. This is spread spectrum processing in the modulation / demodulation circuit unit ex706, subjected to digital / analog conversion processing and frequency conversion processing in the transmission / reception circuit unit ex701, and then transmitted through the antenna ex601.
  • the cellular phone ex114 amplifies the reception data received by the antenna ex601, performs frequency conversion processing and analog-to-digital conversion processing, performs spectrum despreading processing in the modulation / demodulation circuit unit ex706, and performs analog sound processing in the sound processing unit ex705. After conversion into data, the data is output via the audio output unit ex 608.
  • text data of the electronic mail input by the operation of the operation key ex604 of the main unit is sent to the main control unit ex711 via the operation input control unit ex704.
  • the main control unit ex711 performs spread spectrum processing on the text data in the modulation / demodulation circuit unit ex706, performs digital / analog conversion processing and frequency conversion processing in the transmission / reception circuit unit ex701, and transmits the data to the base station ex110 via the antenna ex601.
  • the image data captured by the camera unit ex603 is supplied to the image coding unit ex712 via the camera interface unit ex703.
  • the image data captured by the camera unit ex603 can be directly displayed on the display unit ex602 via the camera interface unit ex703 and the LCD control unit ex702.
  • the image coding unit ex712 is configured to include the image coding apparatus described in the present invention, and uses the image data supplied from the camera unit ex603 for the image coding apparatus shown in the above embodiment.
  • the compression image data is converted into encoded image data by compression coding, and this is sent to the demultiplexing unit ex 708.
  • the cellular phone ex114 simultaneously transmits the sound collected by the audio input unit ex605 during imaging by the camera unit ex603 to the demultiplexing unit ex708 as digital audio data via the audio processing unit ex705.
  • the demultiplexing unit ex708 multiplexes the encoded image data supplied from the image coding unit ex712 and the audio data supplied from the audio processing unit ex705 according to a predetermined method, and the multiplexed data obtained as a result thereof is converted to a modulation / demodulation circuit unit
  • the spread spectrum processing is performed in ex706, the digital analog conversion processing and the frequency conversion processing are performed in the transmission / reception circuit unit ex701, and then transmission is performed via the antenna ex601.
  • the reception data received from base station ex110 via antenna ex601 is subjected to spectrum despreading processing by modulation / demodulation circuit unit ex706, and the resulting multiplex is obtained Integrated data to the demultiplexing unit ex 708.
  • the demultiplexing unit ex708 divides the multiplexed data into a bit stream of image data and a bit stream of audio data, and performs synchronization bus synchronization.
  • the encoded image data is supplied to the image decoding unit ex709 via the ex 713, and the audio data is supplied to the audio processing unit ex705.
  • the image decoding unit ex709 is configured to include the image decoding apparatus described in the present application, and is reproduced by decoding the bit stream of image data by the decoding method corresponding to the encoding method described in the above embodiment.
  • the moving image data is generated and supplied to the display unit ex602 via the LCD control unit ex702, whereby, for example, moving image data included in a moving image file linked to a home page is displayed.
  • the audio processing unit ex 705 simultaneously converts the audio data into analog audio data, and supplies this to the audio output unit ex 608, whereby the audio data included in, for example, the moving image file linked to the home page is reproduced. Ru.
  • the system for digital broadcasting is at least an image coding apparatus or image of the above embodiment.
  • a decryption device can be incorporated. Specifically, at the broadcast station ex201, audio data, video data, or a bit stream in which the data is multiplexed is transmitted to the communication or broadcast satellite ex202 via radio waves.
  • the broadcast satellite ex202 receiving this transmits a radio wave for broadcasting, and the antenna ex204 of the home having a satellite broadcasting reception facility receives this radio wave, and the television (receiver) ex300 or the set top box (STB) ex217 or the like
  • the device decodes the bitstream and reproduces it.
  • the reader / recorder ex 218 for reading and decoding the image data recorded in the recording media ex215 and ex216 such as CD and DVD as recording media and the audio data multiplexed is also shown in the above embodiment. It is possible to implement an image decoding device. In this case, the reproduced video signal is displayed on the monitor ex 219. Also, a configuration is conceivable in which the image decoding apparatus is mounted in the set top box ex217 connected to the cable ex203 for cable television or the antenna ex204 for satellite / terrestrial broadcast, and this is reproduced by the monitor ex219 of the television. At this time, the image decoding apparatus may be incorporated in the television instead of the set top box.
  • a car ex210 having an antenna ex205 can also receive a signal from the satellite ex202 or a base station and reproduce a moving image on a display device such as a car navigation system ex211 set in the car ex210.
  • the image decoding apparatus or the image encoding apparatus described in the above embodiment can also be implemented in a reader / recorder ex 218 that encodes the data of (1) and records it as multiplexed data.
  • the reproduced video signal is displayed on the monitor ex 219.
  • other devices and systems can reproduce video signals.
  • the other reproduction device ex212 can reproduce the video signal on the monitor ex213 using the recording medium ex214 to which the encoded bit stream is copied.
  • the image decoding apparatus may be mounted in the set top box ex217 connected to the cable ex203 for cable television or the antenna ex204 for satellite / terrestrial broadcast, and this may be displayed on the monitor ex219 of the television.
  • the image decoding apparatus may be incorporated in the television instead of the set top box.
  • FIG. 17 is a diagram showing a television (receiver) ex300 that uses the image decoding method and the image coding method described in the above embodiment.
  • the television ex300 acquires or outputs a bit stream of video information via the antenna ex204 or the cable ex203 which receives the broadcast, and demodulates or generates received encoded data.
  • a modulation / demodulation unit ex302 that modulates data to be transmitted to the outside, a multiplexing / demultiplexing unit ex303 that separates the demodulated video data and audio data, or multiplexes encoded video data and audio data Equipped with Further, the television ex300 decodes the audio data and the video data, or an audio signal processing unit ex304 that encodes each information, a signal processing unit ex306 having the video signal processing unit ex305, and the decoded audio signal. It has a speaker ex307 for outputting, and an output unit ex309 having a display unit ex308 such as a display for displaying a decoded video signal.
  • the television ex300 includes an interface unit ex317 including an operation input unit ex312 and the like that receive an input of a user operation. Furthermore, the television ex300 includes a control unit ex310 that centrally controls each unit, and a power supply circuit unit ex311 that supplies power to each unit.
  • the interface unit ex317 is, besides the operation input unit ex312, a bridge ex313 connected to an external device such as a reader / recorder ex218, a slot unit ex314 for enabling attachment of a recording medium ex216 such as an SD card, external recording such as a hard disk It may have a driver ex 315 for connecting to a medium, a modem ex 316 connected to a telephone network, and the like. Note that the recording medium ex216 can electrically record information by a nonvolatile / volatile semiconductor memory element to be stored.
  • the components of the television ex300 are connected to one another via a synchronization bus.
  • the television ex300 decodes data acquired from the outside with the antenna ex204 and the like and reproduces the data.
  • the television ex300 receives the user operation from the remote controller ex220 and the like, and demultiplexes the video data and audio data demodulated by the modulation / demodulation unit ex302 by the multiplexing / demultiplexing unit ex303 based on the control of the control unit ex310 having a CPU etc. .
  • the television ex300 decodes the separated audio data by the audio signal processing unit ex304, and decodes the separated video data by the video signal processing unit ex305 using the decoding method described in the above embodiment.
  • the decoded audio signal and video signal are output from the output unit ex309 to the outside.
  • these signals may be temporarily stored in the buffers ex318, ex319, etc. so that the audio signal and the video signal are reproduced synchronously.
  • the television ex300 may read the encoded bit stream not from the broadcast or the like, but from the recording media ex215 and ex216 such as a magnetic / optical disc and an SD card.
  • the recording media ex215 and ex216 such as a magnetic / optical disc and an SD card.
  • the television ex300 encodes an audio signal in the audio signal processing unit ex304 based on the control of the control unit ex310, and the video signal processing unit ex305 in the above embodiment. Encoding is performed using the described encoding method.
  • the encoded audio signal and video signal are multiplexed by multiplexer / demultiplexer ex303 and output to the outside. At the time of multiplexing, these signals may be temporarily stored in the buffers ex320, ex321, etc. so that the audio signal and the video signal are synchronized.
  • a plurality of buffers ex318 to ex321 may be provided as illustrated, or one or more buffers may be shared.
  • data may be stored in a buffer as a buffer material to avoid system overflow and underflow, for example, between the modulation / demodulation unit ex302 and the multiplexing / demultiplexing unit ex303.
  • television ex300 In addition to acquiring audio data and video data from broadcasts and recording media, etc., television ex300 is also configured to receive AV input from a microphone and a camera, and even if data acquired from them is encoded. Good. Although television ex300 is described here as a configuration capable of the above encoding processing, multiplexing, and external output, all of these processing can not be performed, and the above reception, decoding processing, and external processing can not be performed. Only one of the outputs may be possible.
  • the decoding process or the encoding process may be performed by one of the television ex300 and the reader / recorder ex218.
  • the television ex300 and the reader / recorder ex218 may share each other.
  • the information reproducing / recording unit ex400 includes elements ex401 to ex407 described below.
  • the optical head ex401 irradiates a laser spot on the recording surface of the recording medium ex215 which is an optical disk to write information, detects reflected light from the recording surface of the recording medium ex215, and reads the information.
  • the modulation recording unit ex402 electrically drives the semiconductor laser incorporated in the optical head ex401 and modulates the laser light according to the recording data.
  • the reproduction / demodulation unit ex403 amplifies the reproduction signal obtained by electrically detecting the reflected light from the recording surface by the photodetector incorporated in the optical head ex401, separates and demodulates the signal component recorded in the recording medium ex215, and Play back information.
  • the buffer ex 404 temporarily holds information to be recorded on the recording medium ex 215 and information reproduced from the recording medium ex 215.
  • the disk motor ex405 rotates the recording medium ex215.
  • the servo control unit ex406 moves the optical head ex401 to a predetermined information track while controlling the rotational drive of the disk motor ex405, and performs the laser spot tracking process.
  • the system control unit ex407 controls the entire information reproducing / recording unit ex400.
  • the system control unit ex407 uses various information held in the buffer ex404, and generates and adds new information as necessary.
  • the modulation recording unit ex402, reproduction demodulation This is realized by performing recording and reproduction of information through the optical head ex401 while cooperatively operating the unit ex403 and the servo control unit ex406.
  • the system control unit ex 407 is configured of, for example, a microprocessor, and executes the processing of reading and writing by executing the program.
  • the optical head ex401 may be configured to perform higher-density recording using near-field light.
  • FIG. 19 shows a schematic view of the recording medium ex 215 which is an optical disc.
  • Guide grooves grooves
  • address information indicating the absolute position on the disc is recorded in advance on the information track ex230 by the change of the groove shape.
  • This address information includes information for specifying the position of the recording block ex231, which is a unit for recording data, and the apparatus which performs recording and reproduction specifies the recording block by reproducing the information track ex230 and reading the address information. be able to.
  • the recording medium ex215 includes a data recording area ex233, an inner circumference area ex232, and an outer circumference area ex234.
  • An area used to record user data is data recording area ex233, and inner circumference area ex232 and outer circumference area ex234 arranged on the inner circumference or outer circumference of data recording area ex233 are used for specific applications other than user data recording. Used.
  • the information reproducing / recording unit ex400 reads / writes encoded audio data, video data, or encoded data obtained by multiplexing those data from / to the data recording area ex233 of such a recording medium ex215.
  • an optical disc such as a single layer DVD or BD has been described as an example, but the optical disc is not limited to these, and may be an optical disc having a multilayer structure and capable of recording other than the surface.
  • multi-dimensional recording / reproduction such as recording information in the same place of the disc using light of colors of different wavelengths, recording layers of information different from different angles, etc. It may be an optical disc.
  • the digital broadcasting system ex200 it is possible to receive data from the satellite ex202 and the like by the car ex210 having the antenna ex205 and reproduce a moving image on a display device such as a car navigation system ex211 which the car ex210 has.
  • the configuration of the car navigation system ex211 may be, for example, a configuration in which a GPS reception unit is added among the configurations shown in FIG.
  • the terminal such as the above-mentioned mobile phone ex114 is, like the television ex300, in addition to a transceiving type terminal having both an encoder and a decoder, a transmitter terminal of only an encoder and a receiver terminal of only a decoder.
  • the implementation style of can be considered.
  • FIG. 20 shows a configuration of an LSI ex 500 formed into one chip.
  • the LSI ex 500 includes elements ex 501 to ex 509 described below, and the elements are connected via a bus ex 510.
  • the power supply circuit unit ex505 starts up to an operable state by supplying power to each unit when the power is on.
  • the LSI ex500 receives an AV signal from the microphone ex117 and the camera ex113 by the AV I / O ex 509 based on the control of the control unit ex 501 having the CPU ex 502, the memory controller ex 503, the stream controller ex 504, and the like.
  • Accept The input AV signal is temporarily stored in an external memory ex 511 such as an SDRAM.
  • the accumulated data is appropriately divided into a plurality of times according to the processing amount and the processing speed, and the like, and is sent to the signal processing unit ex507.
  • the signal processing unit ex 507 performs coding of an audio signal and / or coding of a video signal.
  • the coding process of the video signal is the coding process described in the above embodiment.
  • the signal processing unit ex 507 further performs processing such as multiplexing of encoded audio data and encoded video data as needed, and outputs the multiplexed data from the stream I / O ex 506 to the outside.
  • the output bit stream is transmitted to the base station ex 107 or written to the recording medium ex 215. Note that data may be temporarily stored in the buffer ex 508 so as to be synchronized when multiplexing.
  • the LSI ex 500 is obtained by reading from the encoded data obtained by the stream I / O ex 506 via the base station ex 107 or from the recording medium ex 215 under the control of the control unit ex 501.
  • the encoded data is temporarily stored in the memory ex 511 or the like.
  • the accumulated data is appropriately divided into a plurality of times according to the processing amount and the processing speed and sent to the signal processing unit ex507.
  • the signal processing unit ex ⁇ b> 507 decodes audio data and / or video data.
  • the video signal decoding process is the decoding process described in the above embodiment.
  • each signal is temporarily store in a buffer ex508 or the like so that the decoded audio signal and the decoded video signal can be reproduced synchronously in some cases.
  • the decoded output signal is output from each output unit such as the mobile phone ex114, the game machine ex115, the television ex300 and the like via the memory ex511 and the like as appropriate.
  • the memory ex 511 has been described as an external configuration of the LSI ex 500, but may be included in the LSI ex 500.
  • the buffer ex 508 is not limited to one, and may have a plurality of buffers.
  • the LSI ex 500 may be integrated into one chip or a plurality of chips.
  • LSI LSI
  • IC system LSI
  • super LSI ultra LSI
  • the method of circuit integration is not limited to LSI's, and implementation using dedicated circuitry or general purpose processors is also possible.
  • a programmable FPGA or a reconfigurable processor capable of reconfigurable connection and setting of circuit cells in the LSI may be used after the LSI is manufactured.
  • the present invention is advantageously used in the encoding method and the decoding method.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Library & Information Science (AREA)
  • Human Computer Interaction (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

 符号化方法は、アクセスユニットを定義するアクセスユニット定義ステップ(S502~S508)と、アクセスユニット毎に、当該アクセスユニットを構成する各画像を符号化する符号化ステップ(S526)とを含む。アクセスユニット定義ステップ(S502~S508)は、アクセスユニットに含まれる各画像を、フィールド単位又はフレーム単位のいずれに統一して符号化するかを決定する符号化単位決定ステップ(S502)と、アクセスユニットに含まれる各画像がフィールド単位に決定された場合に、当該各画像をトップフィールド又はボトムフィールドのいずれに統一して符号化するかを決定するフィールド種別決定ステップ(S504~S508)とを含む。そして、符号化ステップ(S526)では、アクセスユニット毎に、符号化単位決定ステップ(S526)及びフィールド種別決定ステップ(S502~S508)で決定された形式の各画像を符号化する。

Description

符号化方法、復号方法、符号化装置、復号装置、プログラム、及び集積回路
 本発明は、あらゆるマルチメディアデータの符号化方法及び復号方法に用いることができ、特に、H.264/MPEG-4 AVC多視点映像の符号化方法及び復号方法に用いることができる。
 三次元映像が世に出て久しい。視聴者に対して三次元の視覚的効果を提供するにはいくつかの方法がある。その方法の一つは、視聴者の左右の目に二つの映像を別々に見せることである。これは、二つのカメラを用いて二つの映像を撮影する立体撮像と呼ばれる。立体映像を表示するために以前に用いられていた技術の一つに、片目ずつで見ることができるように色成分をフィルターにかける方法がある。そのような技術では、片目ずつに届く画像の解像度が低くなる。
 近年の表示技術の進歩により、今では視聴者は、片目ずつで最大解像度の映像を視聴することが可能である。H.264/MPEG-4 AVC多視点映像符号化(MVC)の映像規格は、そのような、各視点が最大解像度で表示される場合の、三次元画像の圧縮を対象として策定されている。
 H.264/MPEG-4 AVC多視点映像符号化(MVC)の映像規格は、複数の視点のセットを対象にした動画像を効率的に圧縮することを可能にする圧縮ツールのセットを提供している。MVCの映像規格により、異なる視点のセットに属する再構築ピクチャからの予測符号化を用いてピクチャを圧縮することが可能になる。この「視点間」予測は、ほぼ同時に異なるカメラで撮影された画像の相関関係を利用して、ピクチャを効率的に圧縮する。
 MVCの映像規格において、「視点間」予測は同一のピクチャ・オーダ・カウント情報を有する異なる視点のピクチャに対してのみ行われる。ピクチャ・オーダ・カウント情報は、同一の視点の再構築ピクチャの順番を示すために用いられる。MVCの映像規格では、同一のピクチャ・オーダ・カウント情報を有する異なる視点のピクチャ(つまり、MVC規格に定義されるビューコンポーネント)は、アクセスユニットと呼ばれるコンテナとしてまとめられる。このとき、それらのアクセスユニットのサイズは、その映像規格で規定されるバッファモデルが定義する制限の制約を受ける。そのような制約は、圧縮映像の正確な復号を保証するために必要である。MVC規格および本明細書に定義されるビューコンポーネントは、単一のアクセスユニット内の一つの視点を符号化して表示したものである。視点の一例としては、画像が挙げられる。
 H.264/MPEG-4 AVCハイプロファイルは、高解像度のストレージメディアやハイビジョンデジタル放送など、様々な用途で広く用いられている。MVC映像規格に定義される多視点ハイプロファイルは、H.264/MPEG-4 AVCハイプロファイルを拡張して策定されており、既に実現されているH.264/MPEG-4 AVCハイプロファイルデコーダは、簡単な修正により、多視点ハイプロファイルを用いた圧縮映像ストリームの復号に対応させることができる。実装されているMVC規格の中には、実装されているH.264/MPEG-4 AVCデコーダを利用して各視点の復号が独立して達成できるものもある。
 映像コンテンツは、プログレッシブ走査のカメラまたはインタレース走査のカメラで撮像できる。インタレース走査のカメラで映像を撮影する場合には、H.264/MPEG-4 AVCハイプロファイルは、特にインタレース走査で撮影された動画像の扱いを対象にした符号化ツールのセットを提供する。図1A及び図1Bに示すように、各画像は、フレームまたは複数のフィールドとして符号化できる。図1Aは、インタレース走査された二つのフィールドを有するフレームピクチャの、ピクセルサンプリング位置を示す。図1Bは、インタレース走査されたフィールドの各々が一つのフィールドピクチャとして符号化されたフィールドピクチャの、ピクセルサンプリング位置を示す。二つの補完的なフィールドが、図1Aに示すように一つのフレームとして符号化される場合、そのフレームは各フィールドの順番を表す二つのピクチャオーダカウントを有する。
 従来技術(多視点映像符号化規格)の課題の一つは、異なる視点のピクチャ(つまり、MVC規格に定義されるビューコンポーネント)が、フレーム符号化またはフィールド符号化の何れかを用いてそれぞれ別に符号化されるときの、コンテナつまりアクセスユニットの定義付けである。図2は、各視点用に異なるピクチャ符号化構造を備えるアクセスユニットの例を示す。図2に示すように、モジュール200に示されるアクセスユニットコンテナAは、視点2の一つのフレームピクチャと、視点1の一つのフィールドピクチャとを有し、一方、モジュール202に示されるアクセスユニットコンテナBは、視点1の一つのフィールドピクチャのみを有する。これにより、アクセスユニットA内の視点2のフレームピクチャは視点1からの視点間予測を十分に利用できないため、圧縮効率が低下する。
 これに伴う課題は、各アクセスユニットコンテナは異なる視点の全てのピクチャ(つまりビューコンポーネント)を常時有しているわけではないことである。そのため、圧縮映像の適切な符号化を保証するために映像規格で規定されているバッファモデルが定義する制限によっては、各アクセスユニットのサイズを制約することができない。
 従来技術(多視点映像符号化規格)のその他の課題は、複数の視点を有するピクチャ(つまり、MVC規格に定義されるビューコンポーネント)を有するアクセスユニットコンテナのサイズを制限するために設定された制約があることである。アクセスユニットの最大サイズが制限されていても、アクセスユニットコンテナ内の各視点の各ピクチャ(つまり、MVC規格に定義されるビューコンポーネント)の最大サイズは制約を受けない。そのため、各視点を別々のH.264/MPEG-4 AVCデコーダによって復号する場合に、MVCデコーダの実装に問題が生じることがある。
 アクセスユニットの最大サイズを制限するために定義された制約は、各視点が独立しているデコーダで別々に復号されるときに、アクセスユニット内の各ビューコンポーネントが適切に復号されることを保証するものではない。そのような制約には、最大スライス数、およびアクセスユニット内の各ピクチャ(つまり、MVC規格に定義されるビューコンポーネント)のサイズが含まれる。
 本発明は、上記の事情に鑑みてなされたものであり、視点の異なる複数の画像群をの符号化効率を向上させた符号化方法、復号方法、及びこれらを実現する符号化装置、復号装置、プログラム、及び集積回路を提供することを目的とする。
 本発明の一形態に係る符号化方法は、異なる視点で撮影されたインタレース方式の第1及び第2の画像群を符号化する。具体的には、前記第1及び第2の画像群中の互いに対応する画像で構成されるアクセスユニットを定義するアクセスユニット定義ステップと、前記アクセスユニット定義ステップで定義された前記アクセスユニット毎に、当該アクセスユニットを構成する各画像を符号化する符号化ステップとを含む。前記アクセスユニット定義ステップは、前記アクセスユニットに含まれる各画像を、フィールド単位又はフレーム単位のいずれに統一して符号化するかを決定する符号化単位決定ステップと、前記アクセスユニットに含まれる各画像がフィールド単位に決定された場合に、当該各画像をトップフィールド又はボトムフィールドのいずれに統一して符号化するかを決定するフィールド種別決定ステップとを含む。そして、前記符号化ステップでは、前記アクセスユニット毎に、前記符号化単位決定ステップ及び前記フィールド種別決定ステップで決定された形式の各画像を符号化する。
 上の方法によれば、同一のアクセスユニットに含まれる全ての画像の形式(フィールド/フレーム、トップ/ボトム)が統一されるので、視点間符号化する場合に符号化効率が向上する。
 また、前記符号化単位決定ステップでは、フィールド単位の画像であるかフレーム単位の画像であるかを示す値を、参照field_pic_flagに設定してもよい。前記フィールド種別決定ステップでは、トップフィールドであるかボトムフィールドであるかを示す値を、参照bottom_field_flagに設定してもよい。そして、前記符号化ステップでは、前記第1及び第2の画像群中の互いに対応する画像を、前記参照field_pic_flag及び前記参照bottom_field_flagに設定された値に基づいて取得し、取得した各画像のスライスヘッダに含まれるfield_pic_flagに前記参照field_pic_flagの値を設定し、前記参照field_pic_flagにフィールド単位の画像であることを示す値が設定されている場合に、前記スライスヘッダに含まれるbottom_field_flagに前記参照bottom_field_flagの値を設定してもよい。
 また、前記符号化ステップは、前記第1の画像群中の画像から生成された予測画像を用いて、前記第1の画像群に属する画像を符号化する第1の符号化ステップと、前記第2の画像群中の画像から生成された予測画像、又は同一のアクセスユニットに含まれる前記第1の画像群に属する画像から生成された予測画像を用いて、前記第2の画像群に属する画像を符号化する第2の符号化ステップとを含んでもよい。同一アクセスユニットに含まれる全ての画像の形式が統一されているので、第2の符号化ステップで視点間予測符号化する場合に符号化効率が向上する。
 さらに、該符号化方法は、前記符号化ステップでの符号化処理の適合性を確認する適合性確認ステップを含んでもよい。そして、前記適合性確認ステップは、前記アクセスユニットに含まれる各画像の最大スライス数を算出する最大スライス数算出ステップと、前記アクセスユニットに含まれる各画像の最大バイト数を算出する最大バイト数算出ステップと、前記符号化ステップで符号化された各画像のスライス数及びバイト数を、対応する前記最大スライス数及び前記最大バイト数と比較し、当該比較結果を前記符号化ステップにフィードバックする比較ステップとを含んでもよい。これにより、復号できないビットストリームが出力されるのを防止することができる。
 また、前記符号化ステップでは、前記比較ステップからフィードバックされた比較結果に基づいて、量子化ステップを増減させてもよい。量子化ステップを増減させることにより、符号量を調整することができる。
 本発明の一形態に係る復号方法は、視点の異なる第1及び第2の画像群を、互いに対応する画像で構成されるアクセスユニット毎に符号化して得られる符号化ストリームを復号する。具体的には、前記アクセスユニット内において、前記第1の画像群に属する画像と、前記第2の画像群に属する画像との間に同期が取れているかを判断する判断ステップと、前記判断ステップにおいて、同期が取れていると判断された場合と、同期が取れていないと判断された場合とで、異なる復号処理を実行する復号ステップとを含む。
 上記の方法によれば、同期の有無を確認してから復号処理を行うので、例えば、本来の予測画像と異なる予測画像に基づいて、視点間予測復号処理を行うようなことを有効に防止できる。
 また、前記アクセスユニットに含まれる各画像のスライスヘッダには、上記に記載のfield_pic_flag及びbottom_field_flagが含まれている。そして、前記判断ステップでは、前記第1の画像群に属する画像及び前記第2の画像群に属する画像のスライスヘッダに含まれる前記field_pic_flagの値が一致し、且つ前記field_pic_flagにフィールド単位の画像であることを示す値が設定されている場合に、前記第1の画像群に属する画像及び前記第2の画像群に属する画像のスライスヘッダに含まれる前記bottom_field_flagの値が一致することによって、同期が取れていると判断してもよい。
 また、前記復号ステップは、前記第1の画像群中の画像から生成された予測画像を用いて、前記第1の画像群に属する画像を復号する第1の復号ステップと、前記第2の画像群中の画像から生成された予測画像、又は同一のアクセスユニットに含まれる前記第1の画像群に属する画像から生成された予測画像を用いて、前記第2の画像群に属する画像を復号する第2の復号ステップとを含んでもよい。そして、前記第2の復号ステップでは、前記判断ステップにおいて同期が取れていないと判断された場合に、同一の前記アクセスユニットに含まれる前記第1の画像群に含まれる画像を出力してもよい。
 同一アクセスユニットに含まれる画像の同期が取れていない場合には、視点間予測復号処理を実行できないので、復号処理を諦めて、正常に復号された対応画像を出力する。これにより、一時的に2次元画像となるものの、不自然な画像が表示される等の不具合を解消することができる。
 本発明の一形態に係る符号化装置は、異なる視点で撮影されたインタレース方式の第1及び第2の画像群を符号化する。具体的には、前記第1及び第2の画像群中の互いに対応する画像で構成されるアクセスユニットを定義するアクセスユニット定義部と、前記アクセスユニット定義部で定義された前記アクセスユニット毎に、当該アクセスユニットを構成する各画像を符号化する符号化部とを備える。前記アクセスユニット定義部は、前記アクセスユニットに含まれる各画像を、フィールド単位又はフレーム単位のいずれに統一して符号化するかを決定する符号化単位決定部と、前記アクセスユニットに含まれる各画像がフィールド単位に決定された場合に、当該各画像をトップフィールド又はボトムフィールドのいずれに統一して符号化するかを決定するフィールド種別決定部とを備える。そして、前記符号化部は、前記アクセスユニット毎に、前記符号化単位決定ステップ及び前記フィールド種別決定ステップで決定された形式の各画像を符号化する。
 本発明の一形態に係る復号装置は、視点の異なる第1及び第2の画像群を、互いに対応する画像で構成されるアクセスユニット毎に符号化して得られる符号化ストリームを復号する。具体的には、前記アクセスユニット内において、前記第1の画像群に属する画像と、前記第2の画像群に属する画像との間に同期が取れているかを判断する判断部と、前記判断部において、同期が取れていると判断された場合と、同期が取れていないと判断されて場合とで、異なる復号処理を実行する復号部とを備える。
 本発明の一形態に係るプログラムは、コンピュータに、異なる視点で撮影されたインタレース方式の第1及び第2の画像群を符号化させる。具体的には、前記第1及び第2の画像群中の互いに対応する画像で構成されるアクセスユニットを定義するアクセスユニット定義ステップと、前記アクセスユニット定義ステップで定義された前記アクセスユニット毎に、当該アクセスユニットを構成する各画像を符号化する符号化ステップとを含む。前記アクセスユニット定義ステップは、前記アクセスユニットに含まれる各画像を、フィールド単位又はフレーム単位のいずれに統一して符号化するかを決定する符号化単位決定ステップと、前記アクセスユニットに含まれる各画像がフィールド単位に決定された場合に、当該各画像をトップフィールド又はボトムフィールドのいずれに統一して符号化するかを決定するフィールド種別決定ステップとを含む。そして、前記符号化ステップでは、前記アクセスユニット毎に、前記符号化単位決定ステップ及び前記フィールド種別決定ステップで決定された形式の各画像を符号化する。
 本発明の他の形態に係るプログラムは、コンピュータに、視点の異なる第1及び第2の画像群を、互いに対応する画像で構成されるアクセスユニット毎に符号化して得られる符号化ストリームを復号させる。具体的には、前記アクセスユニット内において、前記第1の画像群に属する画像と、前記第2の画像群に属する画像との間に同期が取れているかを判断する判断ステップと、前記判断ステップにおいて、同期が取れていると判断された場合と、同期が取れていないと判断された場合とで、異なる復号処理を実行する復号ステップとを含む。
 本発明の一形態に係る集積回路は、異なる視点で撮影されたインタレース方式の第1及び第2の画像群を符号化する。具体的には、前記第1及び第2の画像群中の互いに対応する画像で構成されるアクセスユニットを定義するアクセスユニット定義部と、前記アクセスユニット定義部で定義された前記アクセスユニット毎に、当該アクセスユニットを構成する各画像を符号化する符号化部とを備える。前記アクセスユニット定義部は、前記アクセスユニットに含まれる各画像を、フィールド単位又はフレーム単位のいずれに統一して符号化するかを決定する符号化単位決定部と、前記アクセスユニットに含まれる各画像がフィールド単位に決定された場合に、当該各画像をトップフィールド又はボトムフィールドのいずれに統一して符号化するかを決定するフィールド種別決定部とを備える。そして、前記符号化部は、前記アクセスユニット毎に、前記符号化単位決定ステップ及び前記フィールド種別決定ステップで決定された形式の各画像を符号化する。
 本発明の他の形態に係る集積回路は、視点の異なる第1及び第2の画像群を、互いに対応する画像で構成されるアクセスユニット毎に符号化して得られる符号化ストリームを復号する。具体的には、前記アクセスユニット内において、前記第1の画像群に属する画像と、前記第2の画像群に属する画像との間に同期が取れているかを判断する判断部と、前記判断部において、同期が取れていると判断された場合と、同期が取れていないと判断された場合とで、異なる復号処理を実行する復号部とを備える。
 上の方法によれば、同一のアクセスユニットに含まれる全ての画像の形式(フィールド/フレーム、トップ/ボトム)が統一されるので、視点間符号化する場合に符号化効率が向上する。
図1Aは、フレームピクチャの例を示す。 図1Bは、フィールドピクチャの例を示す。 図2は、各視点用に異なるピクチャ符号化構造を備えるアクセスユニットの例を示す。 図3は、アクセスユニットのデータ構造を示す例である。 図4は、本発明の実施の形態1に係る符号化装置の機能ブロック図である。 図5は、ビューコンポーネント符号化部の機能ブロック図である。 図6は、適合性確認部の機能ブロック図である。 図7は、MVCアクセスユニットを符号化する処理全体を示すフローチャートである。 図8は、MVCアクセスユニットのビューコンポーネントの符号化処理を示すフローチャートである。 図9は、MVCアクセスユニットの適合性を決定する処理を示すフローチャートである。 図10は、本発明の実施の形態1に係る復号装置の機能ブロック図である。 図11は、図10に示される復号装置の変形例を示す図である。 図12は、MVCアクセスユニットのビューコンポーネントの復号処理を示すフローチャートである。 図13は、コンテンツ配信サービスを実現するコンテンツ供給システムの全体構成の一例を示す模式図である。 図14は、携帯電話の外観を示す図である。 図15は、携帯電話の構成例を示すブロック図である。 図16は、デジタル放送用システムの全体構成の一例を示す模式図である。 図17は、テレビの構成例を示すブロック図である。 図18は、光ディスクである記録メディアに情報の読み書きを行う情報再生記録部の構成例を示すブロック図である。 図19は、光ディスクである記録メディアの構造例を示す図である。 図20は、各実施の形態に係る画像符号化方法および画像復号方法を実現する集積回路の構成例を示すブロック図である。
 上記課題を解決するため、ピクチャ符号化構造(フレーム/フィールドピクチャ符号化)、およびアクセスユニット内の各ピクチャ(つまり、MVC規格に定義されるビューコンポーネント)のデータサイズを制約する新たな方法を導入する。本発明の新規な点は、各視点を既存のH.264/MPEG-4 AVCデコーダを用いて別々に復号する方法により、MVC規格を用いて圧縮された映像ストリームの復号を確実に成功させることである。この新たな発明は、データサイズと、アクセスユニット内の各ピクチャ(つまり、MVC規格に定義されるビューコンポーネント)の特定のシンタックスの値とに確実に制約を加えるものである。
 本発明の効果は、MVC規格のエンコーダおよびデコーダを低コストで実装することである。本発明はまた、「視点間」予測が各視点のフィールドピクチャ間で利用できることから、符号化効率の向上に役立つ。
 本発明は、アクセスユニットのビューコンポーネントの符号化処理と、アクセスユニットのビューコンポーネントの復号処理との、二つの主要な処理を含む。本発明は、上述の課題を解決するため、図3に示すスライスヘッダ内のシンタックスであるfield_pic_flagおよびbottom_field_flagの値を、同一アクセスユニット内の全てのビューコンポーネント間で同一になるように制限する。
 図3のfield_pic_flagは、ビューコンポーネントに関連するスライスが、フィールドとして符号化されるか、フレームとして符号化されるかを決定するために用いられる。例えば、field_pic_flagの値が「1」であれば、そのスライスが一つのフィールドとして符号化されるビューコンポーネントに属することを示し、その値が「0」であれば、そのスライスがフレームとして符号化されるビューコンポーネントに属することを示す。
 また、図3のbottom_field_flagを用いて、フィールドとして符号化されるビューコンポーネントに関連するスライスが、トップフィールドであるかボトムフィールドであるかを決定する。スライスヘッダ内にbottom_field_flagが存在するか否かは、field_pic_flagの値に依存する。例えば、bottom_field_flagの値が「1」であれば、フィールドとして符号化されるビューコンポーネントに属するスライスはボトムフィールドであることを示し、bottom_field_flagの値が「0」であれば、フィールドとして符号化されるビューコンポーネントに属するスライスはトップフィールドであることを示す。ただし、符号化装置から出力されるスライスヘッダのfield_pic_flagに「0」が設定される場合、当該スライスヘッダのbottom_field_flagは、省略される。
 本発明はまた、アクセスユニット内の各ビューコンポーネントのスライス総数およびバイト総数を制限する。
(実施の形態1)
 図4は、本発明の実施の形態1に係る符号化装置10の機能ブロック図である。符号化装置10は、視点1の画像及び視点2の画像を符号化する装置であって、図4に示されるように、アクセスユニット定義部20と、ビューコンポーネント符号化部800とを備える。視点1の画像は、対象物を第1の視点から撮影したインタレース方式の動画像(第1の画像群)である。視点2の画像は、同一の対象物を第1の視点と異なる第2の視点から撮影したインタレース方式の動画像(第2の画像群)である。
 アクセスユニット定義部20は、符号化単位決定部30と、フィールド種別決定部40とを備え、視点1及び視点2の互いに対応する画像で構成されるアクセスユニットを定義する。ここでの「対応する画像」とは、例えば、同時刻に撮影された画像を指し、同一のPTS(Presentation Time Stamp)が付加される。または、対応する画像には、それぞれ同一のピクチャ・オーダ・カウントが付される。
 符号化単位決定部30は、アクセスユニットに含まれる各画像を、フィールド単位又はフレーム単位のいずれに統一して符号化するかを決定する。より具体的には、符号化単位決定部30は、アクセスユニットに含まれる各画像をフレーム単位に統一する場合、内部変数である参照field_pic_flagに「0」を設定する。一方、フィールド単位に統一する場合、参照field_pic_flagに「1」を設定する。
 フィールド種別決定部40は、アクセスユニットに含まれる各画像がフィールド単位に決定された場合に、当該各画像をトップフィールド又はボトムフィールドのいずれに統一して符号化するかを決定する。より具体的には、フィールド種別決定部40は、アクセスユニットに含まれる各画像をトップフィールドに統一する場合に、内部変数である参照bottom_field_flagに「0」を設定する。一方、ボトムフィールドに統一する場合、参照bottom_field_flagに「1」を設定する。ただし、この処理は、参照field_pic_flagに「1」が設定されている場合だけであり、参照field_pic_flagに「0」が設定されている場合には、参照bottom_field_flagに自動的に「0」を設定する。
 ビューコンポーネント符号化部800は、アクセスユニット定義部20で定義されたアクセスユニット毎に、符号化単位決定部30及びフィールド種別決定部40で決定された形式の各画像を符号化する。
 図5は、ビューコンポーネント符号化部800の機能ブロック図である。ビューコンポーネント符号化部800は、第1及び第2のビューコンポーネント符号化部900、904と、記憶部902とを備える。ただし、ビューコンポーネント符号化部800の変形例として、第1及び第2のビューコンポーネント符号化部800、900を統合してもよい。
 第1のビューコンポーネント符号化部900は、視点1の画像D001を読み出す。このとき読み出される画像D001の形式は、符号化単位決定部30及びフィールド種別決定部40の決定内容に基づいて、フィールド単位又はフレーム単位のいずれか、さらに(フィールド単位の場合には)トップフィールド又はボトムフィールドのいずれかに決定される。
 次に、第1のビューコンポーネント符号化部900は、読み出した画像D001をスライス単位で符号化する。例えば、第1のビューコンポーネント符号化部900は、画像D001から画像D001の予測画像を減算し、直交変換(DCT変換)し、量子化し、エントロピー符号化して得られる視点1の符号化ビューコンポーネントD005をVoutに出力する。このとき、画像D001の予測画像は、視点1の画像のうちの既に符号化された画像を用いて生成(画面内予測又は画面間予測)される。つまり、実施の形態1における視点1は、他の視点(この例では、視点2)に依存しない「Base view」である。
 また、第1のビューコンポーネント符号化部900は、量子化して得られる量子化係数を逆量子化し、逆直交変換し、さらに予測画像を加算して得られる再構築画像D003を記憶部902に出力する。さらに、第1のビューコンポーネント符号化部900は、符号化ビューコンポーネントD005の符号化に用いられたbottom_field_flagの値およびfield_pic_flagの値を第2のビューコンポーネント符号化部904へ出力する。
 第2のビューコンポーネント符号化部904は、視点1の画像D001と同一のアクセスユニットに含まれる視点2の画像D002を読み出す。このとき読み出される画像D002の形式は、第1のビューコンポーネント符号化部900から取得したbottom_field_flagの値およびfield_pic_flagの値に基づいて、フィールド単位又はフレーム単位のいずれか、さらに(フィールド単位の場合には)トップフィールド又はボトムフィールドのいずれかに決定される。つまり、画像D001と画像D002とは、同一形式となる。
 次に、第2のビューコンポーネント符号化部904は、読み出した画像D002をスライス単位で符号化し、符号化ビューコンポーネントD007をVoutに出力する。具体的な符号化処理は第1のビューコンポーネント符号化部900と同様であるが、画像D002の予測画像を、視点2の画像のうちの既に符号化された画像を用いて生成(画面内予測又は画面間予測)してもよいし、同一のアクセスユニットに含まれる視点1の画像(すなわち、画像D001の再構築画像D003)を用いて生成(視点間予測)してもよい点で、第1のビューコンポーネント符号化部900と異なる。
 また、実施の形態1に係る符号化装置10は、さらに、適合性確認部815を備えてもよい。図6は、適合性確認部815の機能ブロック図である。適合性確認部815は、スライス数計算部804と、バイト数計算部802と、最大スライス数算出部806と、比較部808、812と、最大バイト数算出部810と、切替部814とを備える。この適合性確認部815は、ビューコンポーネント符号化部800で実行された符号化処理の結果を解析し、この解析結果をビューコンポーネント符号化部800にフィードバックする。
 まず、ビューコンポーネント符号化部800は、視点1の符号化ビューコンポーネントD005を、スライス数計算部804、バイト数計算部802、および切替部814に出力する。なお、視点2の符号化ビューコンポーネントD007に対する処理も同様であるので、以降の説明では視点1の符号化ビューコンポーネントD005に対する処理を中心に説明する。
 スライス数計算部804は、取得した符号化ビューコンポーネントD005内のスライス総数D011を比較部808に出力する。バイト数計算部802は、取得した符号化ビューコンポーネントD005内のバイト総数D012を比較部812に出力する。
 最大スライス数算出部806は、取得したプロファイル情報およびレベル情報入力D013に基づいて、ビューコンポーネント毎の最大スライス数D014を比較部808に出力する。ビューコンポーネント毎の最大スライス数D014の決定方法は特に限定されないが、例えば、「Base view」である視点1に属する画像の最大スライス数を相対的に多くし、「Dependent view」である視点2に属する画像の最大スライス数を相対的に少なくしてもよい。
 最大バイト数算出部810は、取得したプロファイル情報およびレベル情報入力D013に基づいて、ビューコンポーネント毎の最大バイト数D015を比較部808に出力する。ビューコンポーネント毎の最大バイト数D015の決定方法は特に限定されないが、例えば、「Base view」である視点1に属する画像の最大バイト数を相対的に多くし、「Dependent view」である視点2に属する画像の最大バイト数を相対的に少なくしてもよい。
 比較部808は、スライス総数D011と、最大スライス数D014を比較する。そして、スライス総数D011が最大スライス数D014以下であれば、符号化処理が所定の条件に適合していると判断し、有効信号D016を切替部814に出力する。一方、比較部808は、スライス総数D011が最大スライス数D014よりも大きければ、符号化処理が所定の条件に適合していないと判断し、制御信号D017をビューコンポーネント符号化部800に出力する。
 比較部812は、バイト総数D012と、最大バイト数D015を比較する。そして、バイト総数D012が最大バイト数D015の値以下であれば、符号化処理が所定の条件に適合していると判断し、有効信号D018を切替部814に出力する。一方、比較部812は、バイト総数D012が最大バイト数D015よりも大きければ、符号化処理が所定の条件に適合していないと判断し、制御信号D019をビューコンポーネント符号化部800に出力する。
 ビューコンポーネント符号化部800は、制御信号D017、D019の何れかでも受信したときに、同一の入力画像を再符号化する。再符号化処理では、所定の条件に適合させるために、例えば、前回の符号化処理で使用した量子化ステップより大きな量子化ステップを用いて符号化処理を実行する。
 切替部814は、比較部808、812から有効化信号D016、D018の両方を受信したときに有効になり、符号化ビューコンポーネントD005をVoutに出力する。受信しなかったときは、切替部814は、符号化ビューコンポーネントD005をVoutに出力しない。
 なお、ビューコンポーネント符号化部800は、画像D001の符号化が全て完了したタイミングで、ピクチャ単位の符号化ビューコンポーネントD005を出力してもよい。しかしながら、画像D001の符号化が全て完了した後で所定の条件に適合していないことが判明した場合、同じ画像D001を異なる条件(量子化ステップを変更する等)で再符号化する必要が生じ、ビューコンポーネント符号化部800の処理負荷が大きくなる。
 そこで、ビューコンポーネント符号化部800は、画像D001を構成する各スライスの符号化が完了したタイミングで、スライス単位の符号化ビューコンポーネントD005を出力してもよい。また、バイト数計算部802は、現在までに符号化された符号化ビューコンポーネントD005のバイト総数D012を、比較部812に逐一出力するようにしてもよい。
 この場合、比較部812は、バイト総数D012が最大バイト数D015を超える可能性を事前に予測し、ビューコンポーネント符号化部800に制御信号D019を送信することができる。そうすると、ビューコンポーネント符号化部800は、当該制御信号D019に基づいて、画像D001の符号化の途中で量子化ステップを大きくする等して、当該符号化処理を所定の条件に適合させることができる。
 図7は、MVC規格を用いてアクセスユニットを符号化する処理全体を示すフローチャートである。図7に示すように、ビューコンポーネント符号化部800は、アクセスユニット内の全てのビューコンポーネントをまず符号化する(S700)。次に、適合性確認部815は、パラメータであるConformanceFlagの値を決定することにより、アクセスユニットの適合性を確認する(S702)。ConformanceFlagは、全てのビューコンポーネント内のスライス総数および全てのアクセスユニット内のバイト総数が、MVC規格の典型的なデコーダによるアクセスユニット内のビューコンポーネントの通常の復号で許容される最大値以下であるか否かを示すために用いられる。
 次に、適合性確認部815は、ConformanceFlagの値が「0」(つまり、符号化処理が所定の条件に適合しない)であれば(S704でYes)、全てのビューコンポーネント内のスライス総数および全てのアクセスユニット内のバイト総数が、MVC規格の通常のデコーダによるアクセスユニット内のビューコンポーネントの通常の復号で許容される最大値以下になるように、ビューコンポーネント符号化部800に、アクセスユニットのビューコンポーネントを再符号化させ、ビューコンポーネント内のスライス総数またはバイト総数の何れかを削減する(S706)。
 なお、S706では、ビューコンポーネントの再符号化処理に代えて、他の処理を実行することもできる。例えば、適切に符号化された(つまり、ConformanceFlagが「1」の)符号化ビューコンポーネントに置き換えることができる。
 具体的には、「Base view」に属するビューコンポーネントのConformanceFlagが「0」となった場合、ビューコンポーネント符号化部800は、「Base view」に属する他のビューコンポーネントのうち、既に符号化された符号化ビューコンポーネントを出力してもよい。このとき選択される符号化ビューコンポーネントは、符号化に失敗(Conformance違反)したビューコンポーネントの直前(再生時間順)であるのが望ましい。一方、「Dependent view」に属するビューコンポーネントのConformanceFlagが「0」となった場合、ビューコンポーネント符号化部800は、同一アクセスユニットに含まれる「Base view」に属する符号化ビューコンポーネントを出力してもよい。
 上記の各処理(S700、S702、S704、S706)は、アクセスユニットではなく、単一のビューコンポーネントにも適用できる。単一のビューコンポーネントに適用する場合、符号化処理、適合性確認処理、および再符号化処理をアクセスユニットの各ビューコンポーネントに対し順次行う。
 図8は、アクセスユニットのビューコンポーネントの符号化処理を示すフローチャートである。まず、符号化単位決定部30は、参照field_pic_flagの値を決定する(S502)。なお、参照field_pic_flagの決定方法は、特に限定されず、従来のあらゆる方法を用いることができる。
 次に、フィールド種別決定部40は、参照field_pic_flagの値を「0」と比較する(S504)。field_pic_flagの値が「0」と等しければ(S504でYes)、フィールド種別決定部40は、参照bottom_field_flagを「0」に設定する(S506)。一方、field_pic_flagの値が「0」と等しくなければ(S504でNo)、フィールド種別決定部40は、参照bottom_field_flagの値を決定する(S508)。なお、参照bottom_field_flagの決定方法は、特に限定されず、従来のあらゆる方法を用いることができる。
 なお、参照field_pic_flagは、同一アクセスユニット内のスライスの全てのfield_pic_flagの値を設定するために後で使用される。また、参照bottom_field_flagは、同一アクセスユニット内のスライスの全てのbottom_field_flagの値を設定するために後で使用される。
 次に、アクセスユニット定義部20は、同一アクセスユニットの全てのビューコンポーネント(S510~S530)内の全てのスライス(S512~S528)に対し、全てのスライスのスライスヘッダ内のfield_pic_flagの値を、参照field_pic_flagの値と等しい値に設定する(S514)。
 次に、field_pic_flagの値が「1」と等しければ(S516でYes)、アクセスユニット定義部20は、同一アクセスユニット内の全てのスライスのスライスヘッダ内のbottom_field_flagの値を、参照bottom_field_flagの値に設定する(S520)。一方、field_pic_flagの値が「1」と等しくなければ(S516でNo)、アクセスユニット定義部20は、同一アクセスユニット内の全てのスライスのスライスヘッダ内のbottom_field_flagの値を、「0」に設定する(S518)。なお、S516及びS518を省略して、同一アクセスユニット内の全てのスライスのスライスヘッダ内のbottom_field_flagの値を、参照bottom_field_flagの値に設定してもよい。
 そして、ビューコンポーネント符号化部800は、同一アクセスユニット内の全てのスライスの符号化を、field_pic_flagの値およびbottom_field_flagの値に基づいて実行する(S526)。ビューコンポーネント符号化部800の符号化処理の詳細は、図5を参照して説明した通りであるので、再度の説明は省略する。
 図9は、アクセスユニットの適合性確認処理を示すフローチャートである。この処理は、アクセスユニット内のビューコンポーネントの適合性確認にも適用できる。
 まず、最大スライス数算出部806は、一つのアクセスユニット内の各ビューコンポーネントで許容される最大スライス数D014を決定する(S600)。この許容される最大スライス数D014は、そのアクセスユニットに関連する圧縮ストリームが伝達するシンタックス要素が示すプロファイル情報およびレベル情報D013が定義する制限に基づいて計算される。そのようなシンタックス要素とは、例えば、MVC符号化ストリームのシーケンスパラメータセットの中のprofile_idcシンタックスおよびlevel_idcシンタックスである。
 次に、最大バイト数算出部810は、一つのアクセスユニット内の各ビューコンポーネントで許容される最大バイト数D015を決定する(S602)。この許容される最大バイト数D015は、そのアクセスユニットに関連する符号化映像ストリームが伝達するシンタックス要素が示すプロファイル情報およびレベル情報D013が定義する制限に基づいて計算される。
 次に、適合性確認部815は、一つのアクセスユニット内のビューコンポーネントの数を決定する(S604)。そして、適合性確認部815は、パラメータConformanceFlagを「1」に設定する(S608)。このパラメータConformanceFlagは、アクセスユニット内のビューコンポーネントが、その符号化映像ストリーム内の指定プロファイル値およびレベル値よりも高いプロファイル値およびレベル値を関連させて映像デコーダで正確に復号されるための要件を満たしているか否かを決定するために用いられる。
 次に、アクセスユニット内の各ビューコンポーネントに対して、以下の処理を実行する(S610~S632)。まず、バイト数計算部802は、パラメータNumBytesInViewComponentを「0」に初期化する(S612)。また、スライス数計算部804は、パラメータNumOfSlicesを「0」に初期化する(S614)。パラメータNumBytesInViewComponentは、ビューコンポーネント内のバイト総数D012を数えるカウンタである。パラメータNumOfSlicesは、ビューコンポーネント内のスライス総数D011を数えるカウンタである。
 次に、ビューコンポーネントに関連する各NALユニットに対して、以下の処理を実行する(S616~S620)。まず、バイト数計算部802は、パラメータNumBytesInNALUnitが表すバイト総数を、パラメータNumBytesInViewComponentに追加する(S618)。つまり、パラメータNumBytesInViewComponentは、そのビューコンポーネントに関連するパラメータNumBytesInNALUnitの合計に等しい値を有する。NALユニットは、H.264/MPEG-4 AVC規格で規定されているネットワーク抽象化レイヤとして定義されており、符号化映像データを有する。
 次に、ビューコンポーネントに関連する各スライスに対して、以下の処理を実行する(S622~S626)。まず、スライス数計算部804は、パラメータNumOfSlicesを1ずつインクリメントする(S624)。つまり、パラメータNumOfSlicesは、同一のビューコンポーネントに関連するスライスの総数に等しい値を有する。
 次に、比較部808、812は、パラメータNumBytesInViewComponentおよびパラメータNumOfSlicesの値を、一つのビューコンポーネント内で許容される最大バイト数D015および最大スライス数D014と比較する(S628、S630)。
 NumBytesInViewComponentの値が許容される最大バイト数D015よりも大きければ(S628でYes)、比較部812は、パラメータConformanceFlagを「0」に設定する(S634)。また、NumOfSlicesの値が許容される最大スライス数D014よりも大きければ(S630でYes)、比較部808は、パラメータConformanceFlagを「0」に設定する(S634)。
 パラメータConformanceFlagに「0」が設定されているのは、アクセスユニット内のビューコンポーネントが、その符号化映像ストリーム内の指定プロファイル値およびレベル値よりも高いプロファイル値およびレベル値を関連させて映像デコーダで正確に復号されない可能性があることを示す。
 図10は、本発明の実施の形態1に係る復号装置50の機能ブロック図である。復号装置50は、図10に示されるように、ビューコンポーネント分配部1000と、第1及び第2のスライスヘッダ解析部1002、1004と、比較部1006と、切替部1010と、第1及び第2のA型ビューコンポーネント復号部1008、1014と、B型ビューコンポーネント復号部1016と、記憶部1012とを備える。
 ビューコンポーネント分配部1000は、符号化アクセスユニットD021を読み出し、二つの第1及び第2のビューコンポーネントD023、D022に分配する。第1のビューコンポーネントD023は、その画像を正しく再構築する際に第2のビューコンポーネントD022に依存しない視点1(Base view)に属する画像である。一方、第2のビューコンポーネントD022は、その画像を正しく再構築する際に第1のビューコンポーネントD023に依存する視点2(Dependent view)に属する画像である。
 第1のスライスヘッダ解析部1002は、第1のビューコンポーネントD023を読み出し、bottom_field_flagおよびfield_pic_flagの情報D025を比較部1006へ出力する。第2のスライスヘッダ解析部1004は、第2のビューコンポーネントD022を読み出し、bottom_field_flagおよびfield_pic_flagの情報D026を比較部1006へ出力する。
 比較部1006は、第1のスライスヘッダ解析部1002からのbottom_field_flagおよびfield_pic_flagの情報D025値と、第2のスライスヘッダ解析部1004からのbottom_field_flagおよびfield_pic_flagの情報D026とを比較し、比較結果を含む制御信号D027を切替部1010へ出力する。
 この比較部1006は、同一のアクセスユニット内において、視点1に属する第1のビューコンポーネントD023と、視点2に属する第2のビューコンポーネントD022との同期が取れているか否かを判断する判断部として機能する。すなわち、比較部1006は、第1及び第2のビューコンポーネントD023、D022のbottom_field_flagおよびfield_pic_flagの値が一致していれば、両者の同期が取れていると判断する。一方、比較部1006は、これらの値の少なくとも一方が一致しなければ、同期が取れていないと判断する。
 ただし、同期が取れているか否かを判断するパラメータは、上記の例に限定されない。例えば、第1及び第2のビューコンポーネントD023、D022が保持しているPTS(Presentation Time Stamp)やDTS(Decoding Time Stamp)が一致している場合に同期が取れていると、一致しない場合に同期が取れていないと判断してもよい。
 第1のA型ビューコンポーネント復号部1008は、第1のビューコンポーネントD023を読み出し、視点1の画像D031を出力する。また、第1のA型ビューコンポーネント復号部1008は、視点1の再構築された画像D031を記憶部1012に出力する。具体的には、第1のA型ビューコンポーネント復号部1008は、第1のビューコンポーネントD023をエントロピー復号し、逆量子化し、逆直交変換し、予測画像を加算して再構築された画像D031を出力する。ここで、第1のビューコンポーネントD023は、「Base view」に属するので、予測画像は、視点1の画像のうちの既に復号された画像を用いて生成(画面内予測又は画面間予測)される。
 切替部1010は、比較部1006から取得した制御信号D027に基づいて、第2のビューコンポーネントD022を、第2のA型ビューコンポーネント復号部1014、またはB型ビューコンポーネント復号部1016の何れかに出力する。具体的には、切替部1010は、第1及び第2のビューコンポーネントD023、D022の同期が取れている場合に、第2のビューコンポーネントD022を第2のA型ビューコンポーネント復号部1014に出力する。一方、両者の同期が取れていない場合に、第2のビューコンポーネントD022をB型ビューコンポーネント復号部1016に出力する。
 第2のA型ビューコンポーネント復号部1014は、第2のビューコンポーネントD022を受け取ると、記憶部1012から読み出した視点1の再構築された画像D031を用いて、第2のビューコンポーネントD022を復号して、視点2の画像D034を出力する。具体的な符号化処理は、第1のA型ビューコンポーネント復号部1008と同様であるが、予測画像を、視点2の画像のうちの既に復号された画像を用いて生成(画面内予測又は画面間予測)してもよいし、同一のアクセスユニットに含まれる視点1の画像(すなわち、画像D031)を用いて生成(視点間予測)してもよい点で、第1のA型ビューコンポーネント復号部1008と異なる。
 B型ビューコンポーネント復号部1016は、第2のビューコンポーネントD022を受け取ると、視点2の画像D035を出力する。B型ビューコンポーネント復号部1016で復号処理が実行される場合とは、第1及び第2のビューコンポーネントD023、D022の同期が取れていない場合であるから、少なくとも「視点間予測」を用いた復号処理はできないものと考えられる。そこで、B型ビューコンポーネント復号部1016は、第2のビューコンポーネントD022が「視点間予測」を用いて符号化されて物である場合には、復号処理を諦めて、記憶部1012に記憶されている画像D031を視点2の画像D035として出力し、「画面内予測」又は「画面間予測」を用いて符号化されている場合には、通常の復号処理を実行してもよい。または、予測の種類に拘わらず、記憶部1012に記憶されている画像D031を視点2の画像D035として出力してもよい。
 なお、本発明の一形態に係る復号装置の中には、B型ビューコンポーネント復号部1016を有しないものがあってもよい。
 図11は、復号装置50の変形例である復号装置60の機能ブロック図である。復号装置60は、フィールドビューコンポーネント分配部1100と、第1及び第2のフィールドビューコンポーネント復号部1102、1104と、記憶部1106とを備える。
 フィールドビューコンポーネント分配部1100は、符号化アクセスユニットD041を読み出し、第1及び第2のビューコンポーネントD044、D042に分配する。そして、フィールドビューコンポーネント分配部1100は、第1のビューコンポーネントD044を第1のフィールドビューコンポーネント復号部1102に、第2のビューコンポーネントD042を第2のフィールドビューコンポーネント復号部1104に出力する。
 なお、第1のビューコンポーネントD044は、その画像を正しく再構築する際に第2のビューコンポーネントD042に依存しない視点1(Base view)に属する画像である。一方、第2のビューコンポーネントD042は、その画像を正しく再構築する際に第1のビューコンポーネントD044に依存する視点2(Dependent view)に属する画像である。また、ビューコンポーネントD042、D044は、単一のフィールドピクチャであってもよい。
 第1のフィールドビューコンポーネント復号部1102は、取得した視点1に属するフィールド単位の第1のビューコンポーネントD044を復号し、視点1の画像D051を出力する。また、視点1の再構築された画像D051は、記憶部1106にも格納される。記憶部1106は、第1のフィールドビューコンポーネント復号部1102から出力される視点1の再構築された画像D051を格納するメモリバッファを備える。
 第2のフィールドビューコンポーネント復号部1104は、取得した視点2に属するフィール単位の第2のビューコンポーネントD042を、記憶部1106から取得した視点1の再構築された画像D051を用いて復号し、視点2の再構築された画像D054を出力する。
 図12は、アクセスユニットのビューコンポーネントの復号処理を示すフローチャートである。まず、比較部1006は、パラメータSpecialDecodingFlagに「0」を設定する(S400)。このSpecialDecodingFlagは、アクセスユニット内の全ての第2のビューコンポーネントD022の復号処理に、MVC規格で規定されている通常の復号処理を用いるか、またはアクセスユニット内のいくつかのビューコンポーネントの復号には異なる復号処理を用いるかを決定するために用いられる。つまり、図10に示される制御信号D027に相当する。
 図12に示すように、第1のスライスヘッダ解析部1002は、参照field_pic_flagの値を、「Base view」に属する第1のビューコンポーネントD023の一つのスライスのスライスヘッダから決定する(S402)。この参照field_pic_flagの値は、他のビューコンポーネントのスライスヘッダ内のfield_pic_flagの値と比較するために後で用いられる。
 次に、field_pic_flagの値が「0」と等しくなければ(S404でNo)、第1のスライスヘッダ解析部1002は、参照bottom_pic_flagの値を、第1のビューコンポーネントD023の一つのスライスのスライスヘッダから決定する(S408)。一方、field_pic_flagの値が「0」と等しければ(S404でYes)、第1のスライスヘッダ解析部1002は、参照bottom_pic_flagの値に「0」を設定する(S406)。この参照bottom_pic_flagの値は、他のビューコンポーネントのスライスヘッダ内のbottom_pic_flagの値と比較するために後で用いられる。
 次に、同一アクセスユニット内の「Dependent view」に属する各ビューコンポーネント(S410~S436)の各スライス(S412~S434)に対して、以下の処理を実行する。まず、第2のスライスヘッダ解析部1004は、field_pic_flagの値を、そのスライスのスライスヘッダから決定する(S414)。field_pic_flagの値が「0」と等しくなければ(S416でNo)、第2のスライスヘッダ解析部1004は、bottom_pic_flagの値を、そのスライスのスライスヘッダから決定する(S420)。一方、field_pic_flagの値が「0」と等しければ(S416でYes)、第2のスライスヘッダ解析部1004は、bottom_field_flagの値に「0」を設定する(S418)。
 次に、比較部1006は、第2のスライスヘッダ解析部1004から取得したfield_pic_flagおよびbottom_field_flagの値を、第1のスライスヘッダ解析部1002から取得した参照field_pic_flagおよび参照bottom_field_flagの値と比較する(S422、S426)。
 field_pic_flagの値が参照field_pic_flagの値と等しくなければ(S424でNo)、比較部1006は、パラメータSpecialDecodingFlagに「1」を設定する(S432)。同様に、bottom_field_flagの値が参照bottom_field_flagの値と等しくなければ(S428でNo)、比較部1006は、パラメータSpecialDecodingFlagに「1」を設定する(S432)。そして、比較部1006は、パラメータSpecialDecodingFlagの値(つまり、制御信号D027)を、切替部1010に出力する。
 そして最後に、切替部1010は、パラメータSpecialDecodingFlagを「1」と比較する(S438)。このパラメータSpecialDecodingFlagが「1」と等しくなければ(S438でNo)、アクセスユニット内の全てのビューコンポーネントは、MVC規格で規定されている復号処理によって復号される(S440)。一方、SpecialDecodingFlagが「1」と等しければ(S438でYes)、アクセスユニット内の「Dependent view」に属するビューコンポーネントは、上記と異なる復号処理によって復号される(S442)。
 異なる復号処理の一例としては、映像デコーダからアクセスユニット内の一つのビューコンポーネントのみを正しく再構築することがある。
 なお、実施の形態1においては、2つの異なる視点1、2で撮影された動画像を符号化する例を示したが、視点の数は2つに限定されない。つまり、本発明は、2以上の異なる視点で撮影された動画像を符号化する際にも利用できる。
(実施の形態2)
 上記実施の形態で示した画像符号化方法または画像復号方法の構成を実現するためのプログラムを記憶メディアに記録することにより、上記実施の形態で示した処理を独立したコンピュータシステムにおいて簡単に実施することが可能となる。記憶メディアは、磁気ディスク、光ディスク、光磁気ディスク、ICカード、半導体メモリ等、プログラムを記録できるものであればよい。
 さらにここで、上記実施の形態で示した画像符号化方法および画像復号方法の応用例とそれを用いたシステムを説明する。
 図13は、コンテンツ配信サービスを実現するコンテンツ供給システムex100の全体構成を示す図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ex106~ex110が設置されている。
 このコンテンツ供給システムex100は、インターネットex101にインターネットサービスプロバイダex102および電話網ex104、および、基地局ex106~ex110を介して、コンピュータex111、PDA(Personal Digital Assistant)ex112、カメラex113、携帯電話ex114、ゲーム機ex115などの各機器が接続される。
 しかし、コンテンツ供給システムex100は図13のような構成に限定されず、いずれかの要素を組み合わせて接続するようにしてもよい。また、固定無線局である基地局ex106~ex110を介さずに、各機器が電話網ex104に直接接続されてもよい。また、各機器が近距離無線等を介して直接相互に接続されていてもよい。
 カメラex113はデジタルビデオカメラ等の動画撮影が可能な機器であり、カメラex116はデジタルカメラ等の静止画撮影、動画撮影が可能な機器である。また、携帯電話ex114は、GSM(Global System for Mobile Communications)方式、CDMA(Code Division Multiple Access)方式、W-CDMA(Wideband-Code Division Multiple Access)方式、もしくはLTE(Long Term Evolution)方式、HSPA(High Speed Packet Access)の携帯電話機、または、PHS(Personal Handyphone System)等であり、いずれでも構わない。
 コンテンツ供給システムex100では、カメラex113等が基地局ex109、電話網ex104を通じてストリーミングサーバex103に接続されることで、ライブ配信等が可能になる。ライブ配信では、ユーザがカメラex113を用いて撮影するコンテンツ(例えば、音楽ライブの映像等)に対して上記実施の形態で説明したように符号化処理を行い、ストリーミングサーバex103に送信する。一方、ストリーミングサーバex103は要求のあったクライアントに対して送信されたコンテンツデータをストリーム配信する。クライアントとしては、上記符号化処理されたデータを復号することが可能な、コンピュータex111、PDAex112、カメラex113、携帯電話ex114、ゲーム機ex115等がある。配信されたデータを受信した各機器では、受信したデータを復号処理して再生する。
 なお、撮影したデータの符号化処理はカメラex113で行っても、データの送信処理をするストリーミングサーバex103で行ってもよいし、互いに分担して行ってもよい。同様に配信されたデータの復号処理はクライアントで行っても、ストリーミングサーバex103で行ってもよいし、互いに分担して行ってもよい。また、カメラex113に限らず、カメラex116で撮影した静止画像および/または動画像データを、コンピュータex111を介してストリーミングサーバex103に送信してもよい。この場合の符号化処理はカメラex116、コンピュータex111、ストリーミングサーバex103のいずれで行ってもよいし、互いに分担して行ってもよい。
 また、これら符号化処理および復号処理は、一般的にコンピュータex111および各機器が有するLSI(Large Scale Integration)ex500において処理する。LSIex500は、ワンチップであっても複数チップからなる構成であってもよい。なお、画像符号化用および画像復号用のソフトウェアをコンピュータex111等で読み取り可能な何らかの記録メディア(CD-ROM、フレキシブルディスク、ハードディスクなど)に組み込み、そのソフトウェアを用いて符号化処理および復号処理を行ってもよい。さらに、携帯電話ex114がカメラ付きである場合には、そのカメラで取得した動画データを送信してもよい。このときの動画データは携帯電話ex114が有するLSIex500で符号化処理されたデータである。
 また、ストリーミングサーバex103は複数のサーバまたは複数のコンピュータであって、データを分散して処理したり記録したり配信するものであってもよい。
 以上のようにして、コンテンツ供給システムex100では、符号化されたデータをクライアントが受信して再生することができる。このようにコンテンツ供給システムex100では、ユーザが送信した情報をリアルタイムでクライアントが受信して復号し、再生することができ、特別な権利または設備を有さないユーザでも個人放送を実現できる。
 このコンテンツ供給システムを構成する各機器の符号化、復号には上記実施の形態で示した画像符号化方法あるいは画像復号方法を用いるようにすればよい。
 その一例として携帯電話ex114について説明する。
 図14は、上記実施の形態で説明した画像符号化方法と画像復号方法を用いた携帯電話ex114を示す図である。携帯電話ex114は、基地局ex110との間で電波を送受信するためのアンテナex601、CCDカメラ等の映像、静止画を撮ることが可能なカメラ部ex603、カメラ部ex603で撮影した映像、アンテナex601で受信した映像等が復号されたデータを表示する液晶ディスプレイ等の表示部ex602、操作キーex604群から構成される本体部、音声出力をするためのスピーカ等の音声出力部ex608、音声入力をするためのマイク等の音声入力部ex605、撮影した動画もしくは静止画のデータ、受信したメールのデータ、動画のデータもしくは静止画のデータ等、符号化されたデータまたは復号されたデータを保存するための記録メディアex607、携帯電話ex114に記録メディアex607を装着可能とするためのスロット部ex606を有している。記録メディアex607はSDカード等のプラスチックケース内に電気的に書換えおよび消去が可能な不揮発性メモリであるEEPROMの一種であるフラッシュメモリ素子を格納したものである。
 さらに、携帯電話ex114について図15を用いて説明する。携帯電話ex114は表示部ex602および操作キーex604を備えた本体部の各部を統括的に制御するようになされた主制御部ex711に対して、電源回路部ex710、操作入力制御部ex704、画像符号化部ex712、カメラインターフェース部ex703、LCD(Liquid Crystal Display)制御部ex702、画像復号部ex709、多重分離部ex708、記録再生部ex707、変復調回路部ex706および音声処理部ex705が同期バスex713を介して互いに接続されている。
 電源回路部ex710は、ユーザの操作により終話および電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することによりカメラ付デジタル携帯電話ex114を動作可能な状態に起動する。
 携帯電話ex114は、CPU、ROMおよびRAM等でなる主制御部ex711の制御に基づいて、音声通話モード時に音声入力部ex605で集音した音声信号を音声処理部ex705によってデジタル音声データに変換し、これを変復調回路部ex706でスペクトラム拡散処理し、送受信回路部ex701でデジタルアナログ変換処理および周波数変換処理を施した後にアンテナex601を介して送信する。また携帯電話ex114は、音声通話モード時にアンテナex601で受信した受信データを増幅して周波数変換処理およびアナログデジタル変換処理を施し、変復調回路部ex706でスペクトラム逆拡散処理し、音声処理部ex705によってアナログ音声データに変換した後、音声出力部ex608を介してこれを出力する。
 さらに、データ通信モード時に電子メールを送信する場合、本体部の操作キーex604の操作によって入力された電子メールのテキストデータは操作入力制御部ex704を介して主制御部ex711に送出される。主制御部ex711は、テキストデータを変復調回路部ex706でスペクトラム拡散処理し、送受信回路部ex701でデジタルアナログ変換処理および周波数変換処理を施した後にアンテナex601を介して基地局ex110へ送信する。
 データ通信モード時に画像データを送信する場合、カメラ部ex603で撮像された画像データを、カメラインターフェース部ex703を介して画像符号化部ex712に供給する。また、画像データを送信しない場合には、カメラ部ex603で撮像した画像データをカメラインターフェース部ex703およびLCD制御部ex702を介して表示部ex602に直接表示することも可能である。
 画像符号化部ex712は、本願発明で説明した画像符号化装置を備えた構成であり、カメラ部ex603から供給された画像データを上記実施の形態で示した画像符号化装置に用いた符号化方法によって圧縮符号化することにより符号化画像データに変換し、これを多重分離部ex708に送出する。また、このとき同時に携帯電話ex114は、カメラ部ex603で撮像中に音声入力部ex605で集音した音声を、音声処理部ex705を介してデジタルの音声データとして多重分離部ex708に送出する。
 多重分離部ex708は、画像符号化部ex712から供給された符号化画像データと音声処理部ex705から供給された音声データとを所定の方式で多重化し、その結果得られる多重化データを変復調回路部ex706でスペクトラム拡散処理し、送受信回路部ex701でデジタルアナログ変換処理および周波数変換処理を施した後にアンテナex601を介して送信する。
 データ通信モード時にホームページ等にリンクされた動画像ファイルのデータを受信する場合、アンテナex601を介して基地局ex110から受信した受信データを変復調回路部ex706でスペクトラム逆拡散処理し、その結果得られる多重化データを多重分離部ex708に送出する。
 また、アンテナex601を介して受信された多重化データを復号するには、多重分離部ex708は、多重化データを分離することにより画像データのビットストリームと音声データのビットストリームとに分け、同期バスex713を介して当該符号化画像データを画像復号部ex709に供給すると共に当該音声データを音声処理部ex705に供給する。
 次に、画像復号部ex709は、本願で説明した画像復号装置を備えた構成であり、画像データのビットストリームを上記実施の形態で示した符号化方法に対応した復号方法で復号することにより再生動画像データを生成し、これを、LCD制御部ex702を介して表示部ex602に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まれる動画データが表示される。このとき同時に音声処理部ex705は、音声データをアナログ音声データに変換した後、これを音声出力部ex608に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まれる音声データが再生される。
 なお、上記システムの例に限られず、最近は衛星、地上波によるデジタル放送が話題となっており、図16に示すようにデジタル放送用システムにも上記実施の形態の少なくとも画像符号化装置または画像復号装置を組み込むことができる。具体的には、放送局ex201では音声データ、映像データまたはそれらのデータが多重化されたビットストリームが電波を介して通信または放送衛星ex202に伝送される。これを受けた放送衛星ex202は、放送用の電波を発信し、衛星放送受信設備をもつ家庭のアンテナex204はこの電波を受信し、テレビ(受信機)ex300またはセットトップボックス(STB)ex217などの装置はビットストリームを復号してこれを再生する。また、記録媒体であるCDおよびDVD等の記録メディアex215、ex216に記録した画像データと、音声データが多重化されたビットストリームを読み取り、復号するリーダ/レコーダex218にも上記実施の形態で示した画像復号装置を実装することが可能である。この場合、再生された映像信号はモニタex219に表示される。また、ケーブルテレビ用のケーブルex203または衛星/地上波放送のアンテナex204に接続されたセットトップボックスex217内に画像復号装置を実装し、これをテレビのモニタex219で再生する構成も考えられる。このときセットトップボックスではなく、テレビ内に画像復号装置を組み込んでも良い。また、アンテナex205を有する車ex210で、衛星ex202または基地局等から信号を受信し、車ex210が有するカーナビゲーションex211等の表示装置に動画を再生することも可能である。
 また、DVD、BD等の記録メディアex215に記録した音声データ、映像データまたはそれらのデータが多重化された符号化ビットストリームを読み取り復号する、または、記録メディアex215に、音声データ、映像データまたはそれらのデータを符号化し、多重化データとして記録するリーダ/レコーダex218にも上記実施の形態で示した画像復号装置または画像符号化装置を実装することが可能である。この場合、再生された映像信号はモニタex219に表示される。また、符号化ビットストリームが記録された記録メディアex215により、他の装置およびシステム等は、映像信号を再生することができる。例えば、他の再生装置ex212は、符号化ビットストリームがコピーされた記録メディアex214を用いて、モニタex213に映像信号を再生することができる。
 また、ケーブルテレビ用のケーブルex203または衛星/地上波放送のアンテナex204に接続されたセットトップボックスex217内に画像復号装置を実装し、これをテレビのモニタex219で表示してもよい。このときセットトップボックスではなく、テレビ内に画像復号装置を組み込んでもよい。
 図17は、上記実施の形態で説明した画像復号方法および画像符号化方法を用いたテレビ(受信機)ex300を示す図である。テレビex300は、上記放送を受信するアンテナex204またはケーブルex203等を介して映像情報のビットストリームを取得、または、出力するチューナex301と、受信した符号化データを復調する、または、生成された符号化データを外部に送信するために変調する変調/復調部ex302と、復調した映像データと音声データとを分離する、または、符号化された映像データと音声データとを多重化する多重/分離部ex303を備える。また、テレビex300は、音声データ、映像データそれぞれを復号する、または、それぞれの情報を符号化する音声信号処理部ex304、映像信号処理部ex305を有する信号処理部ex306と、復号された音声信号を出力するスピーカex307、復号された映像信号を表示するディスプレイ等の表示部ex308を有する出力部ex309とを有する。さらに、テレビex300は、ユーザ操作の入力を受け付ける操作入力部ex312等を有するインターフェース部ex317を有する。さらに、テレビex300は、各部を統括的に制御する制御部ex310、各部に電力を供給する電源回路部ex311を有する。インターフェース部ex317は、操作入力部ex312以外に、リーダ/レコーダex218等の外部機器と接続されるブリッジex313、SDカード等の記録メディアex216を装着可能とするためのスロット部ex314、ハードディスク等の外部記録メディアと接続するためのドライバex315、電話網と接続するモデムex316等を有していてもよい。なお記録メディアex216は、格納する不揮発性/揮発性の半導体メモリ素子により電気的に情報の記録を可能としたものである。テレビex300の各部は同期バスを介して互いに接続されている。
 まず、テレビex300がアンテナex204等により外部から取得したデータを復号し、再生する構成について説明する。テレビex300は、リモートコントローラex220等からのユーザ操作を受け、CPU等を有する制御部ex310の制御に基づいて、変調/復調部ex302で復調した映像データ、音声データを多重/分離部ex303で分離する。さらにテレビex300は、分離した音声データを音声信号処理部ex304で復号し、分離した映像データを映像信号処理部ex305で上記実施の形態で説明した復号方法を用いて復号する。復号した音声信号、映像信号は、それぞれ出力部ex309から外部に向けて出力される。出力する際には、音声信号と映像信号が同期して再生するよう、バッファex318、ex319等に一旦これらの信号を蓄積するとよい。また、テレビex300は、放送等からではなく、磁気/光ディスク、SDカード等の記録メディアex215、ex216から符号化された符号化ビットストリームを読み出してもよい。次に、テレビex300が音声信号および映像信号を符号化し、外部に送信または記録メディア等に書き込む構成について説明する。テレビex300は、リモートコントローラex220等からのユーザ操作を受け、制御部ex310の制御に基づいて、音声信号処理部ex304で音声信号を符号化し、映像信号処理部ex305で映像信号を上記実施の形態で説明した符号化方法を用いて符号化する。符号化した音声信号、映像信号は多重/分離部ex303で多重化され外部に出力される。多重化する際には、音声信号と映像信号が同期するように、バッファex320、ex321等に一旦これらの信号を蓄積するとよい。なお、バッファex318~ex321は図示しているように複数備えていてもよいし、一つ以上のバッファを共有する構成であってもよい。さらに、図示している以外に、例えば変調/復調部ex302と多重/分離部ex303との間等でもシステムのオーバフローおよびアンダーフローを避ける緩衝材としてバッファにデータを蓄積することとしてもよい。
 また、テレビex300は、放送および記録メディア等から音声データおよび映像データを取得する以外に、マイクおよびカメラのAV入力を受け付ける構成を備え、それらから取得したデータに対して符号化処理を行ってもよい。なお、ここではテレビex300は、上記の符号化処理、多重化、および、外部出力ができる構成として説明したが、これらのすべての処理を行うことはできず、上記受信、復号処理、および、外部出力のうちいずれかのみが可能な構成であってもよい。
 また、リーダ/レコーダex218で記録メディアから符号化ビットストリームを読み出す、または、書き込む場合には、上記復号処理または符号化処理はテレビex300およびリーダ/レコーダex218のうちいずれかで行ってもよいし、テレビex300とリーダ/レコーダex218とが互いに分担して行ってもよい。
 一例として、光ディスクからデータの読み込みまたは書き込みをする場合の情報再生/記録部ex400の構成を図18に示す。情報再生/記録部ex400は、以下に説明する要素ex401~ex407を備える。光ヘッドex401は、光ディスクである記録メディアex215の記録面にレーザスポットを照射して情報を書き込み、記録メディアex215の記録面からの反射光を検出して情報を読み込む。変調記録部ex402は、光ヘッドex401に内蔵された半導体レーザを電気的に駆動し記録データに応じてレーザ光の変調を行う。再生復調部ex403は、光ヘッドex401に内蔵されたフォトディテクタにより記録面からの反射光を電気的に検出した再生信号を増幅し、記録メディアex215に記録された信号成分を分離して復調し、必要な情報を再生する。バッファex404は、記録メディアex215に記録するための情報および記録メディアex215から再生した情報を一時的に保持する。ディスクモータex405は記録メディアex215を回転させる。サーボ制御部ex406は、ディスクモータex405の回転駆動を制御しながら光ヘッドex401を所定の情報トラックに移動させ、レーザスポットの追従処理を行う。システム制御部ex407は、情報再生/記録部ex400全体の制御を行う。上記の読み出しおよび書き込みの処理は、システム制御部ex407が、バッファex404に保持された各種情報を利用し、また必要に応じて新たな情報の生成および追加を行うと共に、変調記録部ex402、再生復調部ex403およびサーボ制御部ex406を協調動作させながら、光ヘッドex401を通して、情報の記録再生を行うことにより実現される。システム制御部ex407は、例えばマイクロプロセッサで構成され、読み出し書き込みのプログラムを実行することでそれらの処理を実行する。
 以上では、光ヘッドex401はレーザスポットを照射するとして説明したが、近接場光を用いてより高密度な記録を行う構成であってもよい。
 図19に光ディスクである記録メディアex215の模式図を示す。記録メディアex215の記録面には案内溝(グルーブ)がスパイラル状に形成され、情報トラックex230には、あらかじめグルーブの形状の変化によってディスク上の絶対位置を示す番地情報が記録されている。この番地情報はデータを記録する単位である記録ブロックex231の位置を特定するための情報を含み、記録および再生を行う装置は、情報トラックex230を再生し番地情報を読み取ることで記録ブロックを特定することができる。また、記録メディアex215は、データ記録領域ex233、内周領域ex232、外周領域ex234を含んでいる。ユーザデータを記録するために用いる領域がデータ記録領域ex233であり、データ記録領域ex233の内周または外周に配置されている内周領域ex232と外周領域ex234は、ユーザデータの記録以外の特定用途に用いられる。情報再生/記録部ex400は、このような記録メディアex215のデータ記録領域ex233に対して、符号化された音声データ、映像データまたはそれらのデータを多重化した符号化データの読み書きを行う。
 以上では、1層のDVD、BD等の光ディスクを例に挙げ説明したが、これらに限ったものではなく、多層構造であって表面以外にも記録可能な光ディスクであってもよい。また、ディスクの同じ場所にさまざまな異なる波長の色の光を用いて情報を記録したり、さまざまな角度から異なる情報の層を記録したりするなど、多次元的な記録/再生を行う構造の光ディスクであってもよい。
 また、デジタル放送用システムex200において、アンテナex205を有する車ex210で衛星ex202等からデータを受信し、車ex210が有するカーナビゲーションex211等の表示装置に動画を再生することも可能である。なお、カーナビゲーションex211の構成は例えば図17に示す構成のうち、GPS受信部を加えた構成が考えられ、同様なことがコンピュータex111および携帯電話ex114等でも考えられる。また、上記携帯電話ex114等の端末は、テレビex300と同様に、符号化器および復号器を両方持つ送受信型端末の他に、符号化器のみの送信端末、復号器のみの受信端末という3通りの実装形式が考えられる。
 このように、上記実施の形態で示した画像符号化方法あるいは画像復号方法を上述したいずれの機器およびシステムに用いることは可能であり、そうすることで、上記実施の形態で説明した効果を得ることができる。
 また、本発明は、上記実施の形態に限定されるものではなく、本発明の範囲を逸脱することなく種々の変形または修正が可能である。
 (実施の形態3)
 上記各実施の形態で示した画像符号化方法および装置、画像復号方法および装置は、典型的には集積回路であるLSIで実現される。一例として、図20に1チップ化されたLSIex500の構成を示す。LSIex500は、以下に説明する要素ex501~ex509を備え、各要素はバスex510を介して接続している。電源回路部ex505は電源がオン状態の場合に各部に対して電力を供給することで動作可能な状態に起動する。
 例えば符号化処理を行う場合には、LSIex500は、CPUex502、メモリコントローラex503およびストリームコントローラex504等を有する制御部ex501の制御に基づいて、AV I/Oex509によりマイクex117およびカメラex113等からAV信号の入力を受け付ける。入力されたAV信号は、一旦SDRAM等の外部のメモリex511に蓄積される。制御部ex501の制御に基づいて、蓄積したデータは、処理量および処理速度に応じて適宜複数回に分けるなどされ、信号処理部ex507に送られる。信号処理部ex507は、音声信号の符号化および/または映像信号の符号化を行う。ここで映像信号の符号化処理は、上記実施の形態で説明した符号化処理である。信号処理部ex507ではさらに、場合により符号化された音声データと符号化された映像データを多重化するなどの処理を行い、ストリームI/Oex506から外部に出力する。この出力されたビットストリームは、基地局ex107に向けて送信されたり、または、記録メディアex215に書き込まれたりする。なお、多重化する際には同期するよう、一旦バッファex508にデータを蓄積するとよい。
 また、例えば復号処理を行う場合には、LSIex500は、制御部ex501の制御に基づいて、ストリームI/Oex506によって基地局ex107を介して得た符号化データ、または、記録メディアex215から読み出して得た符号化データを一旦メモリex511等に蓄積する。制御部ex501の制御に基づいて、蓄積したデータは、処理量および処理速度に応じて適宜複数回に分けるなどされ信号処理部ex507に送られる。信号処理部ex507は、音声データの復号および/または映像データの復号を行う。ここで映像信号の復号処理は、上記実施の形態で説明した復号処理である。さらに、場合により復号された音声信号と復号された映像信号を同期して再生できるようそれぞれの信号を一旦バッファex508等に蓄積するとよい。復号された出力信号は、メモリex511等を適宜介しながら、携帯電話ex114、ゲーム機ex115およびテレビex300等の各出力部から出力される。
 なお、上記では、メモリex511がLSIex500の外部の構成として説明したが、LSIex500の内部に含まれる構成であってもよい。バッファex508も一つに限ったものではなく、複数のバッファを備えていてもよい。また、LSIex500は1チップ化されてもよいし、複数チップ化されてもよい。
 なお、ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
 また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA、または、LSI内部の回路セルの接続および設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。
 さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
 以上、本発明に係る符号化方法、符号化装置、復号方法および復号装置について、実施の形態に基づいて説明したが、本発明は、これらの実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を当該実施の形態に施した形態、および、異なる実施の形態における構成要素およびステップ等を組み合わせて構築される別の形態も、本発明の範囲内に含まれる。
 本発明は、符号化方法及び復号方法に有利に利用される。
 10 符号化装置
 20 アクセスユニット定義部
 30 符号化単位決定部
 40 フィールド種別決定部
 50,60 復号装置
 200,202 モジュール
 800 ビューコンポーネント符号化部
 802 バイト数計算部
 804 スライス数計算部
 806 最大スライス数算出部
 808,812,1006 比較部
 810 最大バイト数算出部
 814,1010 切替部
 900 第1のビューコンポーネント符号化部
 902,1006,1012,1106 記憶部
 904 第2のビューコンポーネント符号化部
 1000 ビューコンポーネント分配部
 1002 第1のスライスヘッダ解析部
 1004 第2のスライスヘッダ解析部
 1008 第1のA型ビューコンポーネント復号部
 1014 第2のA型ビューコンポーネント復号部
 1016 B型ビューコンポーネント復号部
 1100 フィールドビューコンポーネント分配部
 1102 第1のフィールドビューコンポーネント復号部
 1104 第2のフィールドビューコンポーネント復号部
 ex100 コンテンツ供給システム
 ex101 インターネット
 ex102 インターネットサービスプロバイダ
 ex103 ストリーミングサーバ
 ex104 電話網
 ex106,ex107,ex108,ex109,ex110 基地局
 ex111 コンピュータ
 ex112 PDA
 ex113,ex116 カメラ
 ex114 カメラ付デジタル携帯電話(携帯電話)
 ex115 ゲーム機
 ex117 マイク
 ex200 デジタル放送用システム
 ex201 放送局
 ex202 放送衛星(衛星)
 ex203 ケーブル
 ex204,ex205,ex601 アンテナ
 ex210 車
 ex211 カーナビゲーション(カーナビ)
 ex212 再生装置
 ex213,ex219 モニタ
 ex214,ex215,ex216,ex607 記録メディア
 ex217 セットトップボックス(STB)
 ex218 リーダ/レコーダ
 ex220 リモートコントローラ
 ex230 情報トラック
 ex231 記録ブロック
 ex232 内周領域
 ex233 データ記録領域
 ex234 外周領域
 ex300 テレビ
 ex301 チューナ
 ex302 変調/復調部
 ex303 多重/分離部
 ex304 音声信号処理部
 ex305 映像信号処理部
 ex306,ex507 信号処理部
 ex307 スピーカ
 ex308,ex602 表示部
 ex309 出力部
 ex310,ex501 制御部
 ex311,ex505,ex710 電源回路部
 ex312 操作入力部
 x313 ブリッジ
 ex314,ex606 スロット部
 ex315 ドライバ
 ex316 モデム
 ex317 インターフェース部
 ex318,ex319,ex320,ex321,ex404,ex508 バッファ
 ex400 情報再生/記録部
 ex401 光ヘッド
 ex402 変調記録部
 ex403 再生復調部
 ex405 ディスクモータ
 ex406 サーボ制御部
 ex407 システム制御部
 ex500 LSI
 ex502 CPU
 ex503 メモリコントローラ
 ex504 ストリームコントローラ
 ex506 ストリームI/O
 ex509 AV I/O
 ex510 バス
 ex603 カメラ部
 ex604 操作キー
 ex605 音声入力部
 ex608 音声出力部
 ex701 送受信回路部
 ex702 LCD制御部
 ex703 カメラインターフェース部(カメラI/F部)
 ex704 操作入力制御部
 ex705 音声処理部
 ex706 変復調回路部
 ex707 記録再生部
 ex708 多重分離部
 ex709 画像復号部
 ex711 主制御部
 ex712 画像符号化部
 ex713 同期バス

Claims (14)

  1.  異なる視点で撮影されたインタレース方式の第1及び第2の画像群を符号化する符号化方法であって、
     前記第1及び第2の画像群中の互いに対応する画像で構成されるアクセスユニットを定義するアクセスユニット定義ステップと、
     前記アクセスユニット定義ステップで定義された前記アクセスユニット毎に、当該アクセスユニットを構成する各画像を符号化する符号化ステップとを含み、
     前記アクセスユニット定義ステップは、
     前記アクセスユニットに含まれる各画像を、フィールド単位又はフレーム単位のいずれに統一して符号化するかを決定する符号化単位決定ステップと、
     前記アクセスユニットに含まれる各画像がフィールド単位に決定された場合に、当該各画像をトップフィールド又はボトムフィールドのいずれに統一して符号化するかを決定するフィールド種別決定ステップとを含み、
     前記符号化ステップでは、前記アクセスユニット毎に、前記符号化単位決定ステップ及び前記フィールド種別決定ステップで決定された形式の各画像を符号化する
     符号化方法。
  2.  前記符号化単位決定ステップでは、フィールド単位の画像であるかフレーム単位の画像であるかを示す値を、参照field_pic_flagに設定し、
     前記フィールド種別決定ステップでは、トップフィールドであるかボトムフィールドであるかを示す値を、参照bottom_field_flagに設定し、
     前記符号化ステップでは、
     前記第1及び第2の画像群中の互いに対応する画像を、前記参照field_pic_flag及び前記参照bottom_field_flagに設定された値に基づいて取得し、
     取得した各画像のスライスヘッダに含まれるfield_pic_flagに前記参照field_pic_flagの値を設定し、
     前記参照field_pic_flagにフィールド単位の画像であることを示す値が設定されている場合に、前記スライスヘッダに含まれるbottom_field_flagに前記参照bottom_field_flagの値を設定する
     請求項1に記載の符号化方法。
  3.  前記符号化ステップは、
     前記第1の画像群中の画像から生成された予測画像を用いて、前記第1の画像群に属する画像を符号化する第1の符号化ステップと、
     前記第2の画像群中の画像から生成された予測画像、又は同一のアクセスユニットに含まれる前記第1の画像群に属する画像から生成された予測画像を用いて、前記第2の画像群に属する画像を符号化する第2の符号化ステップとを含む
     請求項1に記載の符号化方法。
  4.  該符号化方法は、さらに、前記符号化ステップでの符号化処理の適合性を確認する適合性確認ステップを含み、
     前記適合性確認ステップは、
     前記アクセスユニットに含まれる各画像の最大スライス数を算出する最大スライス数算出ステップと、
     前記アクセスユニットに含まれる各画像の最大バイト数を算出する最大バイト数算出ステップと、
     前記符号化ステップで符号化された各画像のスライス数及びバイト数を、対応する前記最大スライス数及び前記最大バイト数と比較し、当該比較結果を前記符号化ステップにフィードバックする比較ステップとを含む
     請求項1に記載の符号化方法。
  5.  前記符号化ステップでは、前記比較ステップからフィードバックされた比較結果に基づいて、量子化ステップを増減させる
     請求項4に記載の符号化方法。
  6.  視点の異なる第1及び第2の画像群を、互いに対応する画像で構成されるアクセスユニット毎に符号化して得られる符号化ストリームを復号する復号方法であって、
     前記アクセスユニット内において、前記第1の画像群に属する画像と、前記第2の画像群に属する画像との間に同期が取れているかを判断する判断ステップと、
     前記判断ステップにおいて、同期が取れていると判断された場合と、同期が取れていないと判断された場合とで、異なる復号処理を実行する復号ステップとを含む
     復号方法。
  7.  前記アクセスユニットに含まれる各画像のスライスヘッダには、請求項2に記載のfield_pic_flag及びbottom_field_flagが含まれており、
     前記判断ステップでは、
     前記第1の画像群に属する画像及び前記第2の画像群に属する画像のスライスヘッダに含まれる前記field_pic_flagの値が一致し、且つ
     前記field_pic_flagにフィールド単位の画像であることを示す値が設定されている場合に、前記第1の画像群に属する画像及び前記第2の画像群に属する画像のスライスヘッダに含まれる前記bottom_field_flagの値が一致することによって、同期が取れていると判断する
     請求項6に記載の復号方法。
  8.  前記復号ステップは、
     前記第1の画像群中の画像から生成された予測画像を用いて、前記第1の画像群に属する画像を復号する第1の復号ステップと、
     前記第2の画像群中の画像から生成された予測画像、又は同一のアクセスユニットに含まれる前記第1の画像群に属する画像から生成された予測画像を用いて、前記第2の画像群に属する画像を復号する第2の復号ステップとを含み、
     前記第2の復号ステップでは、前記判断ステップにおいて同期が取れていないと判断された場合に、同一の前記アクセスユニットに含まれる前記第1の画像群に含まれる画像を出力する
     請求項6に記載の復号方法。
  9.  異なる視点で撮影されたインタレース方式の第1及び第2の画像群を符号化する符号化装置であって、
     前記第1及び第2の画像群中の互いに対応する画像で構成されるアクセスユニットを定義するアクセスユニット定義部と、
     前記アクセスユニット定義部で定義された前記アクセスユニット毎に、当該アクセスユニットを構成する各画像を符号化する符号化部とを備え、
     前記アクセスユニット定義部は、
     前記アクセスユニットに含まれる各画像を、フィールド単位又はフレーム単位のいずれに統一して符号化するかを決定する符号化単位決定部と、
     前記アクセスユニットに含まれる各画像がフィールド単位に決定された場合に、当該各画像をトップフィールド又はボトムフィールドのいずれに統一して符号化するかを決定するフィールド種別決定部とを備え、
     前記符号化部は、前記アクセスユニット毎に、前記符号化単位決定ステップ及び前記フィールド種別決定ステップで決定された形式の各画像を符号化する
     符号化装置。
  10.  視点の異なる第1及び第2の画像群を、互いに対応する画像で構成されるアクセスユニット毎に符号化して得られる符号化ストリームを復号する復号装置であって、
     前記アクセスユニット内において、前記第1の画像群に属する画像と、前記第2の画像群に属する画像との間に同期が取れているかを判断する判断部と、
     前記判断部において、同期が取れていると判断された場合と、同期が取れていないと判断された場合とで、異なる復号処理を実行する復号部とを備える
     復号装置。
  11.  コンピュータに、異なる視点で撮影されたインタレース方式の第1及び第2の画像群を符号化させるプログラムであって、
     前記第1及び第2の画像群中の互いに対応する画像で構成されるアクセスユニットを定義するアクセスユニット定義ステップと、
     前記アクセスユニット定義ステップで定義された前記アクセスユニット毎に、当該アクセスユニットを構成する各画像を符号化する符号化ステップとを含み、
     前記アクセスユニット定義ステップは、
     前記アクセスユニットに含まれる各画像を、フィールド単位又はフレーム単位のいずれに統一して符号化するかを決定する符号化単位決定ステップと、
     前記アクセスユニットに含まれる各画像がフィールド単位に決定された場合に、当該各画像をトップフィールド又はボトムフィールドのいずれに統一して符号化するかを決定するフィールド種別決定ステップとを含み、
     前記符号化ステップでは、前記アクセスユニット毎に、前記符号化単位決定ステップ及び前記フィールド種別決定ステップで決定された形式の各画像を符号化する
     プログラム。
  12.  コンピュータに、視点の異なる第1及び第2の画像群を、互いに対応する画像で構成されるアクセスユニット毎に符号化して得られる符号化ストリームを復号させるプログラムであって、
     前記アクセスユニット内において、前記第1の画像群に属する画像と、前記第2の画像群に属する画像との間に同期が取れているかを判断する判断ステップと、
     前記判断ステップにおいて、同期が取れていると判断された場合と、同期が取れていないと判断された場合とで、異なる復号処理を実行する復号ステップとを含む
     プログラム。
  13.  異なる視点で撮影されたインタレース方式の第1及び第2の画像群を符号化する集積回路であって、
     前記第1及び第2の画像群中の互いに対応する画像で構成されるアクセスユニットを定義するアクセスユニット定義部と、
     前記アクセスユニット定義部で定義された前記アクセスユニット毎に、当該アクセスユニットを構成する各画像を符号化する符号化部とを備え、
     前記アクセスユニット定義部は、
     前記アクセスユニットに含まれる各画像を、フィールド単位又はフレーム単位のいずれに統一して符号化するかを決定する符号化単位決定部と、
     前記アクセスユニットに含まれる各画像がフィールド単位に決定された場合に、当該各画像をトップフィールド又はボトムフィールドのいずれに統一して符号化するかを決定するフィールド種別決定部とを備え、
     前記符号化部は、前記アクセスユニット毎に、前記符号化単位決定ステップ及び前記フィールド種別決定ステップで決定された形式の各画像を符号化する
     集積回路。
  14.  視点の異なる第1及び第2の画像群を、互いに対応する画像で構成されるアクセスユニット毎に符号化して得られる符号化ストリームを復号する集積回路であって、
     前記アクセスユニット内において、前記第1の画像群に属する画像と、前記第2の画像群に属する画像との間に同期が取れているかを判断する判断部と、
     前記判断部において、同期が取れていると判断された場合と、同期が取れていないと判断された場合とで、異なる復号処理を実行する復号部とを備える
     集積回路。
PCT/JP2010/000261 2009-01-19 2010-01-19 符号化方法、復号方法、符号化装置、復号装置、プログラム、及び集積回路 Ceased WO2010082508A1 (ja)

Priority Applications (14)

Application Number Priority Date Filing Date Title
CN2010800008431A CN101884220B (zh) 2009-01-19 2010-01-19 编码方法、解码方法、编码装置、解码装置、程序及集成电路
RU2010129246/07A RU2479936C2 (ru) 2009-01-19 2010-01-19 Способ кодирования, способ декодирования, устройство кодирования, устройство декодирования, программа и интегральная схема
JP2010520368A JP4560143B2 (ja) 2009-01-19 2010-01-19 符号化方法、復号方法、符号化装置、復号装置、プログラム、及び集積回路
KR1020117026935A KR101440183B1 (ko) 2009-01-19 2010-01-19 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 프로그램, 및 집적 회로
BRPI1001229A BRPI1001229A2 (pt) 2009-01-19 2010-01-19 método de codificação, método de decodificação, aparelho de codificação, aparelho de decodificação, programa e circuito integrado
BRPI1009952-2A BRPI1009952A2 (pt) 2009-01-19 2010-01-19 Método de codificação, método de decodificação, aparelho de codificação, aparelho de decodificação, programa e circuito integrado
KR1020117026937A KR101440184B1 (ko) 2009-01-19 2010-01-19 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 프로그램, 및 집적 회로
BRPI1009953-0A BRPI1009953A2 (pt) 2009-01-19 2010-01-19 Método de codificação, método de decodificação, aparelho de codificação, aparelho de decodificação, programa e circuito integrado
MX2010007649A MX2010007649A (es) 2009-01-19 2010-01-19 Metodo de codificacion, metodo de decodificacion, aparato de codificacion, aparato de decodificacion, programa y circuito integrado.
CA2707045A CA2707045C (en) 2009-01-19 2010-01-19 Coding method, decoding method, coding apparatus, decoding apparatus, program, and integrated circuit
EP10731177.1A EP2389000A4 (en) 2009-01-19 2010-01-19 Encoding method, decoding method, encoding device, decoding device, program, and integrated circuit
US12/792,899 US8451890B2 (en) 2009-01-19 2010-06-03 Coding method, decoding method, coding apparatus, decoding apparatus, program, and integrated circuit
US13/249,459 US8548040B2 (en) 2009-01-19 2011-09-30 Coding method, decoding method, coding apparatus, decoding apparatus, program, and integrated circuit
US13/249,469 US8553761B2 (en) 2009-01-19 2011-09-30 Coding method, decoding method, coding apparatus, decoding apparatus, program, and integrated circuit

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009009391 2009-01-19
JP2009-009391 2009-01-19

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US12/792,899 Continuation US8451890B2 (en) 2009-01-19 2010-06-03 Coding method, decoding method, coding apparatus, decoding apparatus, program, and integrated circuit

Publications (1)

Publication Number Publication Date
WO2010082508A1 true WO2010082508A1 (ja) 2010-07-22

Family

ID=42339761

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2010/000261 Ceased WO2010082508A1 (ja) 2009-01-19 2010-01-19 符号化方法、復号方法、符号化装置、復号装置、プログラム、及び集積回路

Country Status (13)

Country Link
US (3) US8451890B2 (ja)
EP (1) EP2389000A4 (ja)
JP (5) JP4560143B2 (ja)
KR (5) KR101011293B1 (ja)
CN (5) CN102427534B (ja)
AU (1) AU2010202485A1 (ja)
BR (3) BRPI1009953A2 (ja)
CA (1) CA2707045C (ja)
MX (1) MX2010007649A (ja)
MY (3) MY155999A (ja)
RU (3) RU2535176C2 (ja)
SG (1) SG166796A1 (ja)
WO (1) WO2010082508A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012124121A1 (ja) * 2011-03-17 2012-09-20 富士通株式会社 動画像復号方法、動画像符号化方法、動画像復号装置及び動画像復号プログラム
WO2013114887A1 (en) * 2012-02-02 2013-08-08 Panasonic Corporation Methods and apparatuses for 3d media data generation, encoding, decoding and display using disparity information
US12183354B2 (en) 2013-06-19 2024-12-31 Dolby Laboratories Licensing Corporation Audio encoder and decoder with dynamic range compression metadata

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2802984B2 (ja) 1994-07-15 1998-09-24 ハシモ株式会社 磁器タイル、石材等の化粧材に関する貼付け・目地の同時仕上げによる板材の製造方法
KR20160105203A (ko) 2015-02-27 2016-09-06 삼성전자주식회사 멀티미디어 코덱, 상기 멀티미디어 코덱을 포함하는 애플리케이션 프로세서, 및 상기 애플리케이션 프로세서의 동작 방법
WO2017014172A1 (ja) 2015-07-17 2017-01-26 凸版印刷株式会社 蒸着用メタルマスク基材、蒸着用メタルマスク、蒸着用メタルマスク基材の製造方法、および、蒸着用メタルマスクの製造方法
JP6432072B2 (ja) * 2015-07-17 2018-12-05 凸版印刷株式会社 メタルマスク基材、および、メタルマスクの製造方法
CN110117767A (zh) 2015-07-17 2019-08-13 凸版印刷株式会社 金属掩模用基材及其制造方法、蒸镀用金属掩模及其制造方法
KR102161734B1 (ko) 2017-04-11 2020-10-05 돌비 레버러토리즈 라이쎈싱 코오포레이션 계층화된 증강 엔터테인먼트 경험
US10922634B2 (en) * 2017-05-26 2021-02-16 General Electric Company Determining compliance of a target asset to at least one defined parameter based on a simulated transient response capability of the target asset and as a function of physical operation data measured during an actual defined event
GB2572770B (en) 2018-04-09 2022-11-02 Canon Kk Method and apparatus for encoding or decoding video data with frame portions

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007126508A2 (en) * 2006-03-29 2007-11-08 Thomson Licensing Multi-view video coding method and device
JP2007325289A (ja) * 2004-04-28 2007-12-13 Matsushita Electric Ind Co Ltd 動画像復号化装置、動画像復号化方法、動画像復号化システム、動画像ストリーム生成装置、動画像ストリーム生成方法、記録媒体および記録方法
JP2008022549A (ja) * 2006-07-12 2008-01-31 Mitsubishi Electric Research Laboratories Inc 或るシーンの複数のマルチビュービデオを処理する方法及びシステム
JP2009004941A (ja) * 2007-06-20 2009-01-08 Victor Co Of Japan Ltd 多視点画像受信方法、多視点画像受信装置及び多視点画像受信用プログラム

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5510840A (en) * 1991-12-27 1996-04-23 Sony Corporation Methods and devices for encoding and decoding frame signals and recording medium therefor
JPH07111652A (ja) * 1993-10-14 1995-04-25 Sony Corp 画像データの圧縮方法、伸長方法及び記録媒体
MY115648A (en) * 1995-08-23 2003-08-30 Sony Corp Encoding/decoding fields of predetermined field polarity apparatus and method
KR100397511B1 (ko) * 2001-11-21 2003-09-13 한국전자통신연구원 양안식/다시점 3차원 동영상 처리 시스템 및 그 방법
KR100450823B1 (ko) * 2001-11-27 2004-10-01 삼성전자주식회사 깊이 이미지 기반 3차원 물체의 표현을 위한 노드 구조
RU2237283C2 (ru) 2001-11-27 2004-09-27 Самсунг Электроникс Ко., Лтд. Устройство и способ представления трехмерного объекта на основе изображений с глубиной
JP4154569B2 (ja) * 2002-07-10 2008-09-24 日本電気株式会社 画像圧縮伸長装置
KR100475060B1 (ko) * 2002-08-07 2005-03-10 한국전자통신연구원 다시점 3차원 동영상에 대한 사용자 요구가 반영된 다중화장치 및 방법
KR100488804B1 (ko) * 2002-10-07 2005-05-12 한국전자통신연구원 Mpeg-4 기반의 양안식 3차원 동영상 데이터 처리시스템 및 그 방법
KR20040070490A (ko) 2003-02-03 2004-08-11 삼성전자주식회사 비월 주사 방식의 동영상 부호화/복호화 방법 및 그 장치
AU2004214313B2 (en) 2003-02-18 2010-05-20 Nokia Technologies Oy Picture coding method
JP2004328634A (ja) * 2003-04-28 2004-11-18 Sony Corp 画像復号化装置及び方法
US7650036B2 (en) 2003-10-16 2010-01-19 Sharp Laboratories Of America, Inc. System and method for three-dimensional video coding
CN1705374A (zh) * 2004-05-27 2005-12-07 建兴电子科技股份有限公司 整合性编译码装置及其方法
JP4361435B2 (ja) 2004-07-14 2009-11-11 株式会社エヌ・ティ・ティ・ドコモ 動画像復号方法、動画像復号プログラム、動画像復号装置、動画像符号化方法、動画像符号化プログラム及び動画像符号化装置
JP2006101323A (ja) 2004-09-30 2006-04-13 Toshiba Corp 情報処理装置および同装置で用いられるプログラム
US7728878B2 (en) * 2004-12-17 2010-06-01 Mitsubishi Electric Research Labortories, Inc. Method and system for processing multiview videos for view synthesis using side information
US7468745B2 (en) * 2004-12-17 2008-12-23 Mitsubishi Electric Research Laboratories, Inc. Multiview video decomposition and encoding
US8369406B2 (en) * 2005-07-18 2013-02-05 Electronics And Telecommunications Research Institute Apparatus of predictive coding/decoding using view-temporal reference picture buffers and method using the same
JP5017825B2 (ja) * 2005-09-15 2012-09-05 ソニー株式会社 復号装置および復号方法
US20070151251A1 (en) * 2006-01-03 2007-07-05 Haynes Joel M Counterflow injection mechanism having coaxial fuel-air passages
EP1982518A4 (en) 2006-01-12 2010-06-16 Lg Electronics Inc PROCESSING MORE VIEW VIDEO
WO2007114612A1 (en) * 2006-03-30 2007-10-11 Lg Electronics Inc. A method and apparatus for decoding/encoding a video signal
JP2008022383A (ja) * 2006-07-13 2008-01-31 Matsushita Electric Ind Co Ltd 画像符号化装置
JP4793366B2 (ja) * 2006-10-13 2011-10-12 日本ビクター株式会社 多視点画像符号化装置、多視点画像符号化方法、多視点画像符号化プログラム、多視点画像復号装置、多視点画像復号方法、及び多視点画像復号プログラム
CN101291434A (zh) * 2007-04-17 2008-10-22 华为技术有限公司 多视编解码方法及装置
EP2528345A1 (en) * 2007-04-18 2012-11-28 Thomson Licensing Coding system using supplemental sequence parameter set for multi-view coding
CN101094408A (zh) * 2007-07-20 2007-12-26 中兴通讯股份有限公司 一种通过分片场编码实现编码的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007325289A (ja) * 2004-04-28 2007-12-13 Matsushita Electric Ind Co Ltd 動画像復号化装置、動画像復号化方法、動画像復号化システム、動画像ストリーム生成装置、動画像ストリーム生成方法、記録媒体および記録方法
WO2007126508A2 (en) * 2006-03-29 2007-11-08 Thomson Licensing Multi-view video coding method and device
JP2008022549A (ja) * 2006-07-12 2008-01-31 Mitsubishi Electric Research Laboratories Inc 或るシーンの複数のマルチビュービデオを処理する方法及びシステム
JP2009004941A (ja) * 2007-06-20 2009-01-08 Victor Co Of Japan Ltd 多視点画像受信方法、多視点画像受信装置及び多視点画像受信用プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP2389000A4 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012124121A1 (ja) * 2011-03-17 2012-09-20 富士通株式会社 動画像復号方法、動画像符号化方法、動画像復号装置及び動画像復号プログラム
JP5664762B2 (ja) * 2011-03-17 2015-02-04 富士通株式会社 動画像復号方法、動画像符号化方法、動画像復号装置及び動画像復号プログラム
WO2013114887A1 (en) * 2012-02-02 2013-08-08 Panasonic Corporation Methods and apparatuses for 3d media data generation, encoding, decoding and display using disparity information
CN103959769A (zh) * 2012-02-02 2014-07-30 松下电器产业株式会社 用于使用视差信息的3d媒体数据产生、编码、解码和显示的方法和装置
CN103959769B (zh) * 2012-02-02 2016-12-14 太阳专利托管公司 用于使用视差信息的3d媒体数据产生、编码、解码和显示的方法和装置
US9769488B2 (en) 2012-02-02 2017-09-19 Sun Patent Trust Methods and apparatuses for 3D media data generation, encoding, decoding and display using disparity information
US12183354B2 (en) 2013-06-19 2024-12-31 Dolby Laboratories Licensing Corporation Audio encoder and decoder with dynamic range compression metadata

Also Published As

Publication number Publication date
CN102395032A (zh) 2012-03-28
JP2010220270A (ja) 2010-09-30
EP2389000A1 (en) 2011-11-23
CN102427534A (zh) 2012-04-25
CA2707045C (en) 2017-03-14
US8451890B2 (en) 2013-05-28
JP4628493B2 (ja) 2011-02-09
RU2010129246A (ru) 2013-02-27
US20100266010A1 (en) 2010-10-21
KR20110096006A (ko) 2011-08-26
KR20110127762A (ko) 2011-11-25
RU2479936C2 (ru) 2013-04-20
EP2389000A4 (en) 2014-04-02
KR100997366B1 (ko) 2010-11-29
BRPI1009953A2 (pt) 2020-02-18
BRPI1009952A2 (pt) 2020-02-18
CN102364951B (zh) 2013-12-18
MY155999A (en) 2015-12-31
RU2535176C2 (ru) 2014-12-10
CN102420986A (zh) 2012-04-18
KR101440184B1 (ko) 2014-09-17
US20120020414A1 (en) 2012-01-26
AU2010202485A1 (en) 2010-08-05
KR20110127761A (ko) 2011-11-25
JPWO2010082508A1 (ja) 2012-07-05
MX2010007649A (es) 2010-08-13
BRPI1001229A2 (pt) 2016-06-14
CN101884220B (zh) 2013-04-03
KR101011293B1 (ko) 2011-01-28
CN102395032B (zh) 2014-04-09
JP4628490B2 (ja) 2011-02-09
MY158446A (en) 2016-10-14
CN102420986B (zh) 2014-01-29
CN101884220A (zh) 2010-11-10
RU2010136919A (ru) 2012-03-10
JP2010268501A (ja) 2010-11-25
JP4647034B2 (ja) 2011-03-09
KR20100092467A (ko) 2010-08-20
KR101440183B1 (ko) 2014-09-17
RU2441340C1 (ru) 2012-01-27
SG166796A1 (en) 2010-12-29
US20120019618A1 (en) 2012-01-26
CN102427534B (zh) 2014-06-18
JP4560143B2 (ja) 2010-10-13
JP5318041B2 (ja) 2013-10-16
CA2707045A1 (en) 2010-07-19
US8553761B2 (en) 2013-10-08
MY165978A (en) 2018-05-18
KR20100112660A (ko) 2010-10-19
CN102364951A (zh) 2012-02-29
JP2010233246A (ja) 2010-10-14
US8548040B2 (en) 2013-10-01
JP2010213349A (ja) 2010-09-24

Similar Documents

Publication Publication Date Title
JP4628493B2 (ja) 符号化方法及び符号化装置
JP5574345B2 (ja) 符号化方法、エラー検出方法、復号方法、符号化装置、エラー検出装置及び復号装置
KR101097690B1 (ko) 화상 복호 방법 및 화상 복호 장치
AU2011250758B2 (en) Coding method, decoding method, coding apparatus, decoding apparatus, program, and integrated circuit

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201080000843.1

Country of ref document: CN

WWE Wipo information: entry into national phase

Ref document number: 2010520368

Country of ref document: JP

ENP Entry into the national phase

Ref document number: 20107011823

Country of ref document: KR

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 2707045

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: MX/A/2010/007649

Country of ref document: MX

WWE Wipo information: entry into national phase

Ref document number: PI 2010002757

Country of ref document: MY

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10731177

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2010731177

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2010129246

Country of ref document: RU

ENP Entry into the national phase

Ref document number: PI1001229

Country of ref document: BR

Kind code of ref document: A2

Effective date: 20100715