WO2020031782A1 - 受信装置、受信方法、送信装置および送信方法 - Google Patents

受信装置、受信方法、送信装置および送信方法 Download PDF

Info

Publication number
WO2020031782A1
WO2020031782A1 PCT/JP2019/029719 JP2019029719W WO2020031782A1 WO 2020031782 A1 WO2020031782 A1 WO 2020031782A1 JP 2019029719 W JP2019029719 W JP 2019029719W WO 2020031782 A1 WO2020031782 A1 WO 2020031782A1
Authority
WO
WIPO (PCT)
Prior art keywords
image data
frequency
layer
layers
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2019/029719
Other languages
English (en)
French (fr)
Inventor
塚越 郁夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to US17/264,994 priority Critical patent/US11483565B2/en
Priority to CN201980051631.7A priority patent/CN112534827B/zh
Priority to EP19846920.7A priority patent/EP3836556A4/en
Publication of WO2020031782A1 publication Critical patent/WO2020031782A1/ja
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display

Definitions

  • the present technology relates to a receiving apparatus, a receiving method, a transmitting apparatus, and a transmitting method, and more particularly, to a receiving apparatus, a receiving method, a transmitting apparatus, and a transmitting method that handle mixed image data.
  • the present applicant has previously proposed a technique of performing pixel mixing between a picture in a reference frame period and pictures before and after the picture (see Japanese Patent Application Laid-Open No. H10-157300). 1). In this case, even if time sub-sampling is performed in the conventional receiver, moving elements are reflected in the time samples to be partially decoded, so that deterioration in moving image quality due to strobing is reduced.
  • the basic principle is to transmit a video with a relatively small shutter angle using a short shutter, and then create a display image from partial decoding.
  • a method capable of reducing deterioration of moving image quality due to strobing is desired.
  • An object of the present technology is to reduce the deterioration of moving image quality due to strobing in a layer of a basic frame frequency, and to maintain high image quality when a layer of another frame frequency is included.
  • the concept of this technology is A receiving unit that receives image data of a plurality of frequency hierarchies obtained by hierarchically dividing image data of a predetermined frame frequency, Only the lowest frequency layer image data of the plurality of image data is subjected to a mixing process using image data of another frequency layer,
  • the receiving device further includes a processing unit that obtains display image data by using image data from the lowest frequency layer to the upper predetermined frequency layer among the image data of the plurality of frequency layers in accordance with the display capability.
  • the receiving unit receives image data of a plurality of frequency hierarchies obtained by classifying image data of a predetermined frame frequency.
  • the lowest frequency hierarchy means a hierarchy of lower frequency groups included in the basic display frequency.
  • the image data of the predetermined frame frequency may be image data having a shutter angle of 360 °.
  • the predetermined frame frequency is four times or more the frame frequency of the lowest frequency hierarchy, and the image data of a plurality of frequency hierarchies is obtained by dividing the image data of the predetermined frame frequency into three or more hierarchies. Things.
  • the predetermined frame frequency is 240 Hz
  • the frame frequency of the lowest frequency layer is 60 Hz
  • the image data of a plurality of frequency layers is obtained by dividing the image data of the 240 Hz frame frequency into three layers.
  • the image data may include image data of the 60 Hz layer, image data of the 120 Hz layer, and image data of the 240 Hz layer.
  • the processing unit uses the image data from the lowest frequency hierarchy to the upper predetermined frequency hierarchy among the image data of the plurality of frequency hierarchies according to the display capability to obtain display image data. For example, when the processing unit obtains the display image data using the image data of the higher frequency layer than the image data of the lowest frequency layer, the processing unit may perform the demixing process on the image data of the lowest frequency layer. Good.
  • the information of the mixing process is added to at least the image data of the lowest frequency hierarchy, and the processing unit performs the inverse mixing process on the image data of the lowest frequency hierarchy based on the information of the mixing process. And so on.
  • the information of the mixing process may include information of the mixing target image and information of the mixing ratio.
  • image data of a plurality of frequency layers obtained by classifying image data of a predetermined frame frequency (mixing processing using image data of another frequency layer only for image data of the lowest frequency layer) Is performed), and the image data for display is obtained using the image data from the lowest frequency hierarchy to the upper predetermined frequency hierarchy according to the display capability. Therefore, in the layer of the basic frame frequency (the frame frequency of the lowest frequency hierarchy), it is possible to reduce the deterioration of the moving image quality due to the strobing, and to maintain the high image quality in the layers of the other frame frequencies.
  • a processing unit that classifies image data of a predetermined frame frequency into layers, performs a mixing process with image data of other frequency layers only on image data of the lowest frequency layer, and obtains image data of a plurality of frequency layers;
  • the transmission device includes a transmission unit that transmits the image data of the plurality of frequency layers.
  • the processing unit classifies the image data of the predetermined frame frequency into layers, and performs the mixing process with the image data of the other frequency layers only on the image data of the lowest frequency layer to obtain a plurality of frequency layer images. Data is obtained. Then, the transmission unit transmits the image data of the plurality of frequency hierarchies.
  • the image data of the predetermined frame frequency may be image data having a shutter angle of 360 °.
  • the predetermined frame frequency is four times or more the frame frequency of the lowest frequency layer, and the processing unit divides the image data of the plurality of frequency layers into three or more layers of the image data of the predetermined frame frequency. May be obtained.
  • the predetermined frame frequency is 240 Hz
  • the frame frequency of the lowest frequency layer is 60 Hz
  • the image data of a plurality of frequency layers is obtained by dividing the image data of the 240 Hz frame frequency into three layers.
  • the image data may include image data of the 60 Hz layer, image data of the 120 Hz layer, and image data of the 240 Hz layer.
  • the image processing apparatus may further include an information adding unit that adds information of the mixing process to at least the lowest frequency hierarchical image data.
  • the information of the mixing process may include information of the mixing target image and information of the mixing ratio.
  • image data of a plurality of frequency layers obtained by classifying image data of a predetermined frame frequency has been done
  • image data of a predetermined frame frequency has been done
  • FIG. 1 is a block diagram illustrating a configuration example of a transmission / reception system as an embodiment. It is a figure which shows the outline
  • FIG. 3 is a block diagram illustrating a configuration example of a preprocessor of the transmission device.
  • FIG. 9 is a diagram for describing processing in a preprocessor. It is a figure showing the example of composition of a blending information SEI message. It is a figure which shows the content of the main information in the example of a structure of a blending information SEI message.
  • FIG. 14 is a diagram illustrating a specific example of each piece of information when mixed processing information is added to all pictures. It is a block diagram which shows the example of a structure of the post-processor of the television receiver which has the decoding capability which can process the image data of 240Hz. It is a figure for explaining the processing of the post-processor of the television receiver which has the decoding capability which can process the image data of 240Hz.
  • FIG. 3 is a block diagram illustrating a configuration example of a transmission device.
  • FIG. 29 is a diagram illustrating a configuration example of a transport stream TS in a case where mixed processing information is added to only a 60-Hz hierarchical picture. [Fig. 24] Fig.
  • FIG. 24 is a diagram illustrating a configuration example of a transport stream TS in a case where mixed processing information is added to only all pictures. It is a block diagram which shows the example of a structure of the television receiver which has the decoding capability which can process the image data of 240Hz / 120Hz. It is a block diagram which shows the example of a structure of the television receiver which has the decoding capability which can process 60 Hz image data. It is a block diagram showing another example of composition of a transmitting and receiving system.
  • FIG. 2 is a diagram illustrating a configuration outline of a transmission device, a set-top box, and a display. It is a figure showing the example of structure of HDMI blending information infoframe.
  • FIG. 1 shows a configuration example of a transmission / reception system 10 as an embodiment.
  • the transmission / reception system 10 includes a transmission device 100 and a television receiver 200.
  • the transmission device 100 transmits the transport stream TS as a container on a broadcast wave.
  • the transport stream TS includes a basic stream, a first extension stream, and a second extension stream obtained by processing image data of a predetermined frame frequency, in this embodiment, a frame frequency of 240 Hz, which is a high frame rate. Is included.
  • image data having a frame frequency of 240 Hz has a shutter angle of 360 °.
  • Each stream has a NAL (Network Abstraction Layer) unit structure.
  • Each stream includes coded image data of 60 Hz layer image data, 120 Hz layer image data, and 240 Hz layer image data obtained by dividing image data of 240 Hz frame frequency into three layers.
  • the image of the 60 Hz hierarchy constitutes the basic frame frequency, and is the frame frequency image of the lowest frequency hierarchy.
  • Only the image data of the 60 Hz layer is subjected to the mixing process using the image data of the 120 Hz layer and the image data of the 240 Hz layer.
  • information of the mixing process (information of the image to be mixed, information of the mixing ratio, etc.) is added to the image data of the 60 Hz hierarchy.
  • the receiving side can easily and appropriately perform the reverse mixing process (mixing release process) on the 60 Hz hierarchical image data based on the information of the mixing process.
  • FIG. 2 shows an outline of image data of each frequency layer obtained by classifying.
  • a 60 Hz image is constituted by the basic stream of the 60 Hz layer.
  • a 120 Hz image is composed of the first extension stream of the 120 Hz layer and the basic stream of the 60 Hz layer.
  • a 240 Hz image is composed of the second extension stream of the 240 Hz layer, the first extension stream of the 120 Hz layer, and the basic stream of the 60 Hz layer. Only the image data of the 60 Hz layer is subjected to the mixing process using the image data of the 120 Hz layer image data and the 240 Hz layer image data.
  • the television receiver 200 receives the above-described transport stream TS transmitted from the transmitting device 100 on a broadcast wave.
  • the television receiver 200 has a decoding capability capable of processing 60 Hz image data
  • the television receiver 200 processes only the basic stream included in the transport stream TS to obtain image data of each frame of the 60 Hz frame frequency image data. And play the image.
  • the television receiver 200 when the television receiver 200 has a decoding capability capable of processing image data having a frame frequency of 120 Hz or 240 Hz, the television receiver 200 processes both the basic stream and the extension stream included in the transport stream TS, and performs processing at 120 Hz or 240 Hz. The image data of each frame of the image data of the frame frequency is obtained, and the image is reproduced. In this case, the television receiver 200 appropriately performs an inverse mixing process on the image data of the 60 Hz hierarchy.
  • FIG. 3 shows an outline of the configuration of the transmitting apparatus 100 and the television receiver 200. Note that the image sequence of the output R of the preprocessor 102 of the transmitting device 100 and the image sequence of the output R of the decoder 204 of the television receiver 200A are the same in time series. Including different cases.
  • the preprocessor 102 classifies the image data P having a frame frequency of 240 Hz into three layers, and includes image data of a 60 Hz layer, image data of a 120 Hz layer, and image data of a 240 Hz layer including image data of a 240 Hz layer. Data R is obtained.
  • the preprocessor 102 performs a mixing process using the image data of the 120 Hz layer and the image data of the 240 Hz layer for the image data of the 60 Hz layer.
  • FIG. 4 shows a configuration example of the preprocessor 102 of the transmission device 100.
  • the preprocessor 102 has a 240 Hz hierarchical mixed operation unit 102a and a 120 Hz hierarchical mixed operation unit 102b.
  • the 240 Hz hierarchical mixing operation unit 102a receives the above-described image data P having a frame frequency of 240 Hz and outputs the image data Q having a frame frequency of 240 Hz.
  • FIG. 5A shows image data P having a frame frequency of 240 Hz.
  • the image data P has a configuration in which four frame sections of P1, P2, P3, and P4 are repeated.
  • FIG. 5B shows image data Q having a frame frequency of 240 Hz.
  • the image data Q has a configuration in which four frame sections Q1, Q2, Q3, and Q4 are repeated.
  • the 240 Hz hierarchical mixing operation unit 102a performs a process for directly outputting the image data of the P1, P2, and P4 frames of the image data P as the image data of the Q1, Q2, and Q4 frames of the image data Q. . Also, the 240 Hz hierarchical mixing operation unit 102a outputs mixed image data t (P2, P3, P4) of the image data of the frames of the image data P2, P3, and P4 as the image data of the frame of the image data Q3. (Mixing process) is performed.
  • the image data of the frame of Q3 is calculated based on the following equation (1) using the image data of the frames of P2, P3, and P4.
  • P3 is 60 Hz hierarchical image data
  • P2 and P4 are 240 Hz hierarchical image data.
  • Q3 c * P2 + d * P3 + e * P4 (1)
  • the current240 Hz hierarchical mixing operation unit 102a is provided with “current_picture_position”, “blend_coefficient_A”, “blend_coefficient_B”, and the like as 240 Hz hierarchical mixing parameters that are information for performing the above-described mixing processing. The details of this mixing parameter will be described later.
  • FIG. 5C shows image data R having a frame frequency of 240 Hz.
  • This image data R has a configuration in which four frame sections of R1, R2, R3, and R4 are repeated.
  • the 120 Hz hierarchical mixing operation unit 102b performs a process for directly outputting the image data of the Q1, Q2, and Q4 frames of the image data Q as the image data of the R1, R2, and R4 frames of the image data R. . Further, a process (mixing process) for outputting mixed image data t (Q1, Q3) of the image data of the frame of the image data Q1 and Q3 as the image data of the R3 frame of the image data R is performed.
  • the image data of the R3 frame is calculated based on the following equation (2) using the image data of the Q1 and Q3 frames.
  • Q3 is image data of a 60 Hz layer
  • Q1 is image data of a 120 Hz layer.
  • R3 a * Q1 + b * Q3 (1)
  • the “120 Hz hierarchical mixing operation unit 102b is provided with“ current_picture_position ”,“ blend_coefficient_A ”,“ blend_coefficient_B ”, and the like as 120 Hz hierarchical mixing parameters that are information for performing the above-described mixing processing. The details of this mixing parameter will be described later.
  • the image data of the R3 frame of the image data R constitutes 60 Hz hierarchical image data
  • the R1 image data of the image data R constitutes 120 Hz hierarchical image data of +60 Hz
  • the R2 and R4 image data of the image data R further constitute 120 Hz hierarchical image data.
  • the image data constitutes image data of a 240 Hz hierarchy of +120 Hz.
  • the image data of the R1, R2, and R4 frames of the image data R are the same as the image data of the P1, P2, and P4 frames of the image data P, respectively.
  • the image data of the R3 frame of the image data R is obtained by mixing the image data of the P1 to P4 frames of the image data P.
  • the mixing process is not performed on the image data of the 120 Hz layer and the image data of the 240 Hz layer, and only the image data of the 60 Hz layer is mixed using the image data of the 120 Hz layer image data and the image data of the 240 Hz layer. Has been done. Thereby, on the receiving side, it is possible to reduce deterioration of moving image quality due to strobing in the basic frame frequency (60 Hz) layer, and to maintain high image quality in other frame frequency (120 Hz, 240 Hz) layers. .
  • the encoder 103 performs hierarchical coding processing on the image data R output from the preprocessor 102 by, for example, HEVC (High Efficiency Video Coding), and outputs a basic stream STb and a first extension stream. STe1 and the second extension stream STe2 are obtained.
  • HEVC High Efficiency Video Coding
  • the basic stream STb includes encoded image data of 60 Hz hierarchical image data (see image data of R3 frame (picture) in FIG. 5C). Also, the first extension stream includes encoded image data of 120 Hz hierarchical image data (see image data of the R1 frame (picture) in FIG. 5C). In addition, the second extension stream includes coded image data of 240 Hz hierarchical image data (see image data of R2 and R4 frames (pictures) in FIG. 5C).
  • the encoder 103 adds information of the mixing process including the information of the mixing target image and the information of the mixing ratio to the image data of at least the 60 Hz hierarchy.
  • a newly defined blending information SEI message (Blending_information @ SEI @ message) is inserted into the "SEIs" portion of the access unit (AU).
  • FIG. 6 shows an example of the structure (Syntax) of the blending information / SEI message
  • FIG. 7 shows contents (Semantics) of main information in the example of the structure.
  • the field of “blending_information_id” is identification information indicating that the message is a blending information / SEI message.
  • the field of “number_of_blending_layers” indicates the number of frequency layers for performing the mixing process. The following fields are repeated by the number of the frequency layers.
  • the “framerate_layer” field indicates the target frequency hierarchy. For example, “1” indicates 50 Hz, “2” indicates 60 Hz, “3” indicates 100 Hz, “4” indicates 120 Hz, “5” indicates 200 Hz, and “6” indicates 240 Hz.
  • the “blend_flag” field indicates whether or not the picture is mixed. For example, “1” indicates that they are mixed, and “0” indicates that they are not mixed.
  • the “blend_target_flag” field indicates whether or not the picture is a target of the blending process. For example, “1” indicates a target, and “0” indicates a non-target.
  • “Shutter_angle” indicates the shutter angle (shutter aperture ratio with respect to the frame period) of the target layer. For example, “1” indicates 360 ° (100%), “2” indicates 270 ° (75%), “3” indicates 180 ° (50%), and “4” indicates 90 ° (25%).
  • “Temporal_filter_taps_minus2” indicates the number of pictures that contribute to the mixing process. The value obtained by adding 2 to the value of “temporal_filter_taps_minus2” is the number of pictures that contribute to the mixing process.
  • “Current_picture_position” indicates the temporal position of the current picture in a picture (“blend_target_flag” is “1”) contributing to the blending process. If the number of pictures contributing to the blending process is 2 (“temporal_filter_taps_minus2” is 0), “10” indicates that the temporal order is the earlier of the two pictures, and “01” indicates the earlier of the two pictures. Indicates that the chronological order is later.
  • temporal_filter_taps_minus2 When the number of pictures contributing to the blending process is 3 (“temporal_filter_taps_minus2” is 1), when the pictures are mixed (“blend_flag” is “1”), the temporal order of the three pictures is For example, it is "11" to indicate that it is the center.
  • temporary_filter_taps When the number of pictures contributing to the blending process is 3 (“temporal_filter_taps” is 3) and the picture is not blended (“blend_flag” is “0”), for example, “10” is 3 pictures Indicates that the temporal order is the earliest, “11” indicates that the time is the center of the three pictures, and “01” indicates that the temporal order is the latest of the three pictures.
  • the fields of “blend_coefficient_A” and “blend_coefficient_B” are repeated by the number of pictures that contribute to the mixing process.
  • the field of “blend_coefficient_A” indicates a numerator of the coefficient of the mixing operation.
  • the field of “blend_coefficient_B” indicates a denominator of the coefficient of the mixing operation.
  • FIG. 8 shows a specific example of each piece of information in the case where the mixed processing information is added only to the 60 Hz hierarchical picture (see the R3 frame (picture) in FIG. 5C).
  • “number_of_blending_layers” is set to 2, indicating that the number of frequency layers for performing the mixing process is 2.
  • “framerate_layer” is set to “6”, indicating that the target frequency layer is 240 Hz.
  • “blend_flag” is set to “1”, indicating that the picture is mixed.
  • “blend_target_flag” is set to “1”, indicating that the picture is a target of the blending process.
  • “shutter_angle” is set to “2”, which indicates that the shutter angle is 270 °.
  • “temporal_filter_taps_minus2” is set to 1 to indicate that the number of pictures that contribute to the mixing process is 3.
  • “current_picture_position” is set to “11”, which indicates that the temporal order of the three pictures is the center.
  • the first “blend_coefficient_A” and “blend_coefficient_B” are respectively set to 1 and 4, indicating that the mixture ratio of the picture with the earliest temporal order is 1/4.
  • the second “blend_coefficient_A” and “blend_coefficient_B” are set to 1 and 4, respectively, indicating that the mixing ratio of the picture in the temporal order (the picture concerned) is 1/2.
  • the third “blend_coefficient_A” and “blend_coefficient_B” are respectively 1 and 4, indicating that the mixture ratio of the picture with the slowest temporal order is 1/4.
  • “framerate_layer” is set to “4”, indicating that the target frequency layer is 120 Hz.
  • “blend_flag” is set to “1”, indicating that the picture is mixed.
  • “blend_target_flag” is set to “1”, indicating that the picture is a target of the blending process.
  • “Shutter_angle” is set to “1”, which indicates that the shutter angle is 360 °.
  • R3 transmitted in the base layer as the lowest frequency has a two-stage shutter angle.
  • “temporal_filter_taps_minus2” is set to 0, indicating that the number of pictures contributing to the mixing process is 2.
  • “current_picture_position” is set to “01”, which indicates that the picture is the one with the later temporal order among the two pictures.
  • the first “blend_coefficient_A” and “blend_coefficient_B” are respectively set to 1 and 5, indicating that the mixture ratio of the picture in the earlier temporal order is 1/5.
  • the second “blend_coefficient_A” and “blend_coefficient_B” are set to 4 and 5, respectively, indicating that the mixing ratio of the picture in the temporal order (the picture concerned) is 4/5.
  • FIG. 9 is different from the example of FIG. 5C in the case where the R2 frame of the image data R is subjected to the mixing process, and the specific information in the case where the mixing process information is added only to the 60 Hz hierarchical picture.
  • An example is shown.
  • “number_of_blending_layers” is set to 2, indicating that the number of frequency layers for performing the mixing process is 2.
  • “framerate_layer” is set to “6”, indicating that the target frequency layer is 240 Hz.
  • Each information in the 240 Hz frequency layer is the same as the example in FIG.
  • “framerate_layer” is set to “4”, indicating that the target frequency layer is 120 Hz.
  • “current_picture_position” is set to “10”, which indicates that the picture is the earlier of the two pictures in temporal order.
  • the first “blend_coefficient_A” and “blend_coefficient_B” are set to 4 and 5, respectively, indicating that the mixture ratio of the picture with the earlier temporal order (the picture concerned) is 4/5.
  • the second “blend_coefficient_A” and “blend_coefficient_B” are respectively set to 1 and 5, which indicates that the mixture ratio of the picture in the later temporal order is 1/5.
  • the detailed description is omitted, but the rest is the same as the example of FIG. 8 described above.
  • FIG. 10 shows a specific example of each piece of information when the mixed processing information is added to all pictures.
  • This example shows a case where the R3 frame of the image data R is mixed as in the example of FIG.
  • the mixed processing information added to the 60 Hz hierarchical picture (see the frame (picture) of R3 in FIG. 5C) is the same as in the example of FIG. 8, and the description thereof is omitted.
  • “framerate_layer” is set to “4”, indicating that the target frequency layer is 120 Hz.
  • the following is shown in the frequency hierarchy of 120 Hz. That is, “blend_flag” is set to “0”, indicating that the picture is not mixed. Also, “blend_target_flag” is set to “1”, indicating that the picture is a target of the blending process. Further, “shutter_angle” is set to “3”, which indicates that the shutter angle is 180 °.
  • “temporal_filter_taps_minus2” is set to 0, indicating that the number of pictures contributing to the mixing process is 2.
  • “current_picture_position” is set to “10”, which indicates that the picture is the earlier of the two pictures in temporal order.
  • the first “blend_coefficient_A” and “blend_coefficient_B” are respectively set to 1 and 5, which indicates that the mixture ratio of the picture in the temporal order (the picture concerned) is 1.
  • the second “blend_coefficient_A” and “blend_coefficient_B” are set to 4 and 5, respectively, indicating that the mixture ratio of the picture in the later temporal order is 4/5.
  • “framerate_layer” is set to “6”, indicating that the target frequency layer is 240 Hz.
  • the following is shown in the 240 Hz frequency hierarchy. That is, “blend_flag” is set to “0”, indicating that the picture is not mixed. Also, “blend_target_flag” is set to “1”, indicating that the picture is a target of the blending process.
  • “Shutter_angle” is set to “1”, which indicates that the shutter angle is 360 °.
  • “temporal_filter_taps_minus2” is set to 1 to indicate that the number of pictures that contribute to the mixing process is 3.
  • “current_picture_position” is set to “10”, which indicates that the picture has the earliest temporal order among the three pictures.
  • the first “blend_coefficient_A” and “blend_coefficient_B” are respectively set to 1 and 4, indicating that the mixture ratio of the picture (the picture concerned) having the earliest temporal order is 1.
  • the second “blend_coefficient_A” and “blend_coefficient_B” are respectively 1 and 2, indicating that the mixing ratio of the picture in the temporal order is 1/2.
  • the third “blend_coefficient_A” and “blend_coefficient_B” are respectively 1 and 4, indicating that the mixture ratio of the picture with the slowest temporal order is 1/4.
  • “framerate_layer” is set to “6”, indicating that the target frequency layer is 240 Hz.
  • the following is shown in the 240 Hz frequency hierarchy. That is, “blend_flag” is set to “0”, indicating that the picture is not mixed. Also, “blend_target_flag” is set to “1”, indicating that the picture is a target of the blending process.
  • “Shutter_angle” is set to “1”, which indicates that the shutter angle is 360 °.
  • “temporal_filter_taps_minus2” is set to 1 to indicate that the number of pictures that contribute to the mixing process is 3.
  • “current_picture_position” is set to “01”, indicating that the picture is the latest in temporal order among the three pictures.
  • the first “blend_coefficient_A” and “blend_coefficient_B” are respectively set to 1 and 4, indicating that the mixture ratio of the picture with the earliest temporal order is 1/4.
  • the second “blend_coefficient_A” and “blend_coefficient_B” are respectively 1 and 2, indicating that the mixing ratio of the picture in the temporal order is 1/2.
  • the third “blend_coefficient_A” and “blend_coefficient_B” are respectively set to 1 and 4, indicating that the mixture ratio of the picture (the picture) having the slowest temporal order is 4.
  • the decoder 204 performs a decoding process on the three streams STb, STe1, and STe2 to obtain image data R3 of the 60 Hz layer and image data R3 of the 120 Hz layer.
  • the image data R1 and the image data R having a frame frequency of 240 Hz including the image data R2 and R4 of the 240 Hz hierarchy are output.
  • the post-processor 205 processes the image data R having the frame frequency of 240 Hz, and outputs the image data P3 of the 60 Hz hierarchy, the image data P1 of the 120 Hz hierarchy, and the image data P2 and P4 of the 240 Hz hierarchy. , And image data P having a frame frequency of 240 Hz is obtained.
  • the post-processor 205 performs an inverse mixing process (mixing release process) on the 60 Hz layer image data using the 120 Hz layer image data and the 240 Hz layer image data.
  • FIG. 11 shows a configuration example of the post processor 205 of the television receiver 200A.
  • the post processor 205 includes a 120 Hz hierarchical inverse mixing operation unit 205a and a 240 Hz hierarchical inverse mixing operation unit 205b.
  • the image data R having the above-described 240 Hz frame frequency is input to the 120 Hz hierarchical inverse mixing operation unit 205a, and the image data Q having the 240 Hz frame frequency is output.
  • FIG. 12A shows image data R having a frame frequency of 240 Hz output from the decoder 204.
  • This image data R has a configuration in which four frame sections of R1, R2, R3, and R4 are repeated.
  • FIG. 12B shows image data Q having a frame frequency of 240 Hz output from the 120 Hz hierarchical inverse mixing operation unit 205a.
  • the image data Q has a configuration in which four frame sections Q1, Q2, Q3, and Q4 are repeated.
  • the 120 Hz hierarchical inverse mixing operation unit 205a performs a process for directly outputting the image data of the R1, R2, and R4 frames of the image data R as the image data of the Q1, Q2, and Q4 frames of the image data Q.
  • the image data of the frame of R1 from which the image data component of the frame of R1 is removed is obtained as the image data of the frame of Q3.
  • the image data of the frame of Q3 includes components of the image data of the frames of R2 and R4.
  • the image data of the frame of Q3 is calculated based on the following equation (3) using the image data of the frames of R1 and R3.
  • R3 is the image data of the 60 Hz hierarchy
  • R1 is the image data of the 120 Hz hierarchy.
  • You. Q3 (1 / b) ⁇ (-1) * a * R1 + R3 ⁇ (3)
  • the “120 Hz hierarchical inverse mixing operation unit 205a is provided with“ current_picture_position ”,“ blend_coefficient_A ”,“ blend_coefficient_B ”, and the like as 120 Hz hierarchical mixing parameters that are information for performing the above-described inverse mixing processing. As described above, the 120 Hz hierarchical mixed parameter is extracted and used by the decoder 204 added to the image data R on the transmission side.
  • FIG. 12C shows image data P having a frame frequency of 240 Hz output from the 240 Hz hierarchical inverse mixing operation unit 205b.
  • the image data P has a configuration in which four frame sections of P1, P2, P3, and P4 are repeated.
  • the 240 Hz hierarchical inverse mixing operation unit 205b performs a process for directly outputting the image data of the Q1, Q2, and Q4 frames of the image data Q as the image data of the P1, P2, and P4 frames of the image data P. . Also, a process for outputting image data t ′ (Q2, Q3, Q4) reversely mixed using the image data of the frame of the image data Q2, Q3, and Q4 as the image data of the frame of the P3 of the image data P. (Reverse mixing processing) is performed. In this case, as the image data of the frame of P3, the image data from which the image data components of the frames of Q2 and Q4 are removed is obtained. Accordingly, the image data P output from the 240 Hz hierarchical inverse mixing operation unit 205b is similar to the image data P having a frame frequency of 204 Hz input to the preprocessor 102 of the transmission device 100 described above.
  • the image data of the P3 frame is calculated based on the following equation (4) using the image data of the Q2, Q3, and Q4 frames.
  • Q3 is 60 Hz hierarchical image data
  • Q2 and Q4 are 240 Hz hierarchical image data.
  • P3 (1 / d) ⁇ (-1) * c * Q2 + Q3 + (-1) * e * Q4 ⁇ (4)
  • the “current_picture_position”, “blend_coefficient_A”, “blend_coefficient_B”, and the like are given to the 240 Hz hierarchical inverse mixing operation unit 205b as 240 Hz hierarchical mixing parameters that are information for performing the above-described inverse mixing processing.
  • the 240 Hz hierarchical mixing parameter is extracted and used by the decoder 204 added to the image data R on the transmitting side as described above.
  • the 240 Hz image data P obtained by the post processor 205 is subjected to frame interpolation as it is or by a frame interpolation (Motion Compensated Frame Insertion) unit 206 to increase the frame rate.
  • a frame interpolation (Motion Compensated Frame Insertion) unit 206 to increase the frame rate.
  • FIG. 12D shows a display sequence in the case where the image data P of 240 Hz is used as image data for display as it is.
  • the decoder 204 performs a decoding process on the two streams STb and STe1 to obtain 60 Hz layer image data R3 and 120 Hz layer image data R3.
  • Image data R ' having a frame frequency of 120 Hz including the image data R1 is obtained.
  • the post-processor 205 processes the image data R ′ having the frame frequency of 120 Hz, and outputs the image data Q3 of the 60 Hz hierarchy and the image data of the 120 Hz frame frequency including the image data Q1 of the 120 Hz hierarchy.
  • Q ′ is obtained.
  • the post-processor 205 performs an inverse mixing process (mixing release process) on the image data of the 60 Hz layer using the image data of the 120 Hz layer.
  • FIG. 13 shows a configuration example of the post processor 205 of the television receiver 200B.
  • the post processor 205 has a 120 Hz hierarchical inverse mixing operation unit 205a.
  • the above-mentioned image data R 'having a frame frequency of 120 Hz is input to the 120 Hz hierarchical inverse mixing operation unit 205a, and image data Q' having a frame frequency of 120 Hz is output.
  • FIG. 14A shows image data R ′ having a frame frequency of 120 Hz output from the decoder 204.
  • This image data R ' has a configuration in which two frame sections of R1 and R3 are repeated.
  • FIG. 14B shows image data Q ′ having a frame frequency of 120 Hz output from the 120 Hz hierarchical inverse mixing operation unit 205a.
  • the image data Q ′ has a configuration in which two frame sections of Q1 and Q3 are repeated.
  • the # 120 Hz hierarchical inverse mixing operation unit 205a performs a process for directly outputting the image data of the R1 frame of the image data R 'as the image data of the Q1 frame of the image data Q'. Processing for outputting image data t '(R1, R3) inversely mixed using the image data of the frame of image data R1, R3 as the image data of the frame of image data Q', Q3 (inverse mixing) Processing) is performed. In this case, the image data of the frame of R1 from which the image data component of the frame of R1 is removed is obtained as the image data of the frame of Q3.
  • the image data of the frame of Q3 includes components of the image data of the frames of R2 and R4.
  • the “120 Hz hierarchical inverse mixing operation unit 205a is provided with“ current_picture_position ”,“ blend_coefficient_A ”,“ blend_coefficient_B ”, and the like as 120 Hz hierarchical mixing parameters that are information for performing the above-described inverse mixing processing. As described above, the 120 Hz hierarchical mixing parameter is extracted and used by the decoder 204 added to the image data R 'on the transmission side.
  • the 120 Hz image data Q ′ obtained by the post-processor 205 is subjected to frame interpolation as it is or by a Motion Compensated Frame Insertion (MCFI) unit 206 to increase the frame rate.
  • MCFI Motion Compensated Frame Insertion
  • FIG. 14C shows a display sequence in a case where the image data Q ′ of 120 Hz is directly used as the display image data.
  • the stream STb is subjected to decoding processing in the decoder 204, and the image data of the 60 Hz frame frequency including the image data R3 of the 60 Hz hierarchy is output.
  • R ′′ is obtained.
  • the 60 Hz hierarchical image data R3 is obtained by mixing the image data of the frames P1, P2, P3, and P4 in the image data P having the frame frequency of 240 Hz.
  • FIG. Shows image data R ′′ having a frame frequency of 60 Hz and output from the CPU.
  • the image data R ′′ has a configuration in which the frame section of R3 is repeated.
  • FIG. 15B shows a display sequence when the 60 Hz image data R ′′ is used as the display image data as it is.
  • FIG. 16 illustrates a configuration example of the transmission device 100.
  • the transmission device 100 includes a control unit 101, a preprocessor 102, an encoder 103, a multiplexer 104, and a transmission unit 105.
  • the control unit 101 controls the operation of each unit of the transmission device 100.
  • the preprocessor 102 classifies the image data P having a frame frequency of 240 Hz into three layers, and outputs image data R having a frame frequency of 240 Hz including image data of a 60 Hz layer, image data of a 120 Hz layer, and image data of a 240 Hz layer. (See FIGS. 4 and 5). In this case, only the image data of the 60 Hz layer is subjected to the mixing process using the image data of the 120 Hz layer and the image data of the 240 Hz layer.
  • the encoder 103 performs a hierarchical encoding process on the image data R output from the preprocessor 102 by, for example, HEVC (High Efficiency Video Coding) to obtain a basic stream STb, a first extension stream STe1, and a second extension stream STe2.
  • the basic stream STb includes coded image data of 60 Hz hierarchical image data (see image data of R3 frame (picture) in FIG. 5C).
  • the first extension stream STe1 includes coded image data of the image data of the 120 Hz layer (see the image data of the frame (picture) of R1 in FIG. 5C). Also, the second extension stream STe2 includes encoded image data of 240 Hz hierarchical image data (see image data of R2 and R4 frames (pictures) in FIG. 5C).
  • the encoder 103 adds, to at least the image data of the 60 Hz hierarchy, information of the mixing process including information of the mixing target image and information of the mixing ratio. Specifically, a newly defined blending information SEI message (see FIG. 6) is inserted into the “SEIs” portion of the access unit (AU) of each picture.
  • the multiplexer 104 converts the basic stream STb, the first extended stream STe1, and the second extended stream STe2 generated by the encoder 103 into PES (Packetized ⁇ Elementary ⁇ Stream) packets, and further multiplexes them into transport packets to form a multiplexed stream.
  • PES Packetized ⁇ Elementary ⁇ Stream
  • Transmitting section 105 modulates transport stream TS by a modulation method suitable for broadcasting such as QPSK / OFDM, and transmits an RF modulated signal from a transmitting antenna.
  • FIG. 17 shows a configuration example of the transport stream TS.
  • This example shows a configuration example in a case where the mixed processing information is attached only to the picture of the 60 Hz layer.
  • the transport stream TS includes three streams (substreams) of a basic stream (base stream) STb, a first extended stream (first enhanced stream) STe1, and a second extended stream (second enhanced stream) STe2. )It is included.
  • the PES packet “video @ PES1” of the basic stream STb identified by the packet identifier “PID1” exists, and the PES packet “video @ PES2” of the first extension stream STe1 identified by the packet identifier “PID2”.
  • a blending information SEI message (see FIGS. 6, 8, and 9) is inserted into the coded image data of each picture of the 60 Hz layer that is containerized by the $ PES packet "video @ PES1".
  • the transport stream TS includes PMT (Program Map Table) as one of PSI (Program Specific Information).
  • PSI Program Specific Information
  • PMT has a program loop (Program $ loop) that describes information related to the entire program. Further, the PMT has a video elementary stream loop having information related to each video stream. In this configuration example, there is a video elementary stream loop "video @ ES1 @ loop” corresponding to the basic stream STb, a video elementary stream loop "video @ ES2 @ loop” corresponding to the first extension stream STe1, and further, There is a video elementary stream loop "video @ ES3 @ loop” corresponding to the second extension stream STe2.
  • the stream type is set to “0x24” indicating a basic stream.
  • the stream type is set to “0x25” indicating an extension stream.
  • the stream type is set to “0x25” indicating an extension stream.
  • FIG. 18 shows another configuration example of the transport stream TS.
  • This example shows a configuration example in which mixed processing information is added to all pictures.
  • a blending information / SEI message (see FIGS. 6 and 10) is inserted into the coded image data of each picture of the 240 Hz layer.
  • Other configurations are the same as those of the configuration example of the transport stream TS shown in FIG. 17, but detailed description thereof will be omitted.
  • Image data P (see FIG. 5A) having a frame frequency of 240 Hz is input to the preprocessor 102 (see FIG. 4).
  • the image data P is divided into three layers, and image data R having a frame frequency of 240 Hz including image data of a 60 Hz layer, image data of a 120 Hz layer, and image data of a 240 Hz layer (see FIG. 5C). ) Is obtained.
  • the mixing process using the image data of the 120 Hz layer and the image data of the 240 Hz layer is performed only for the image data of the 60 Hz layer (see the image data of the R3 frame (picture) in FIG. 5C).
  • the 240 Hz image data R obtained by the preprocessor 102 is supplied to the encoder 103.
  • the image data R is subjected to a hierarchical encoding process by, for example, HEVC, and a basic stream STb, a first extension stream STe1, and a second extension stream STe2 are obtained.
  • the basic stream STb includes encoded image data of 60 Hz hierarchical image data (see image data of R3 frame (picture) in FIG. 5C).
  • the first extension stream STe1 includes coded image data of the image data of the 120 Hz layer (see the image data of the frame (picture) of R1 in FIG. 5C).
  • the second extension stream STe2 includes encoded image data of 240 Hz hierarchical image data (see image data of R2 and R4 frames (pictures) in FIG. 5C).
  • the basic stream STb, the first extension stream STe1, and the second extension stream STe2 generated by the encoder 103 are supplied to the multiplexer 104.
  • each stream is converted into a PES packet, further converted into a transport packet, and multiplexed, to obtain a transport stream TS as a multiplexed stream.
  • the transport stream TS generated by the multiplexer 104 is sent to the transmitting unit 105.
  • the transport stream TS is modulated by a modulation method suitable for broadcasting, such as QPSK / OFDM, and the RF modulated signal is transmitted from a transmission antenna.
  • FIG. 19 shows a configuration example of a television receiver 200A having a decoding capability capable of processing image data of 240 Hz.
  • the television receiver 200A includes a control unit 201, a receiving unit 202, a demultiplexer 203, a decoder 204, a post processor 205, an MCFI unit 206, and a panel display unit 207.
  • the control unit 201 controls the operation of each unit of the television receiver 200A.
  • the receiving unit 202 demodulates the RF modulated signal received by the receiving antenna, and obtains the transport stream TS.
  • the demultiplexer 203 extracts the basic stream STb, the first extended stream STe1, and the second extended stream STe2 from the transport stream TS by PID filtering, and supplies the extracted streams to the decoder 204.
  • the decoder 204 performs a decoding process on the streams STb, STe1, and STe2, and outputs image data R having a frame frequency of 240 Hz including image data of the 60 Hz layer, image data of the 120 Hz layer, and image data of the 240 Hz layer (FIG. 12A). See). In this case, only the image data of the 60 Hz layer is subjected to the mixing process using the image data of the 120 Hz layer and the image data of the 240 Hz layer.
  • the decoder 204 extracts the parameter set and SEI inserted in each access unit constituting the streams STb, STe1, and STe2, and sends them to the control unit 201.
  • a blending information / SEI message (see FIG. 6) having information on the mixing process (including information on the image to be mixed and information on the mixing ratio) is also extracted.
  • the control unit 201 controls an inverse mixing process (mixing release process) for the 60 Hz hierarchical image data in the post processor 205 based on the information of the mixing process.
  • the post processor 205 processes the image data R having a frame frequency of 240 Hz, and outputs image data P having a frame frequency of 240 Hz including image data of a 60 Hz layer, image data of a 120 Hz layer, and image data of a 240 Hz layer (FIG. 11, see FIG. 12).
  • the image data of the 60 Hz hierarchy is subjected to the reverse mixing process (mixing release process) using the image data of the 120 Hz hierarchy and the image data of the 240 Hz hierarchy based on the information of the mixing process.
  • the MCFI unit 206 performs a frame interpolation process of motion compensation on the image data P having a frame frequency of 240 Hz obtained by the post processor 205 to obtain image data with a further increased frame rate. In some cases, the MCFI unit 206 is not provided.
  • the panel display unit 207 performs image display using 240 Hz image data obtained by the post processor 205 or image data whose frame rate has been increased by the MCFI unit 206.
  • the RF modulation signal received by the receiving antenna is demodulated, and a transport stream TS is obtained.
  • This transport stream TS is sent to the demultiplexer 203.
  • the basic stream STb, the first extended stream STe1, and the second extended stream STe2 are extracted from the transport stream TS by PID filtering, and supplied to the decoder 204.
  • the decoder 204 performs a decoding process on the streams STb, STe1, and STe2 to obtain image data R (see FIG. 12A) having a frame frequency of 240 Hz.
  • the image data R includes 60 Hz hierarchical image data (see image data of R3 frame (picture) in FIG. 12A) and 120 Hz hierarchical image data (R1 frame (picture) of FIG. 12A).
  • Image data (see image data) and 240 Hz hierarchical image data see image data of R2 and R4 frames (pictures) in FIG. 12A). Only the image data of the 60 Hz layer is subjected to the mixing process using the image data of the 120 Hz layer and the image data of the 240 Hz layer.
  • the decoder 204 extracts the parameter set and SEI inserted in each access unit constituting the streams STb, STe1, STe2, and sends them to the control unit 201.
  • a blending information / SEI message (see FIG. 6) having information on the mixing process (including information on the image to be mixed and information on the mixing ratio) is also extracted.
  • the control unit 201 controls the back-mixing process (mixing release process) for the 60-Hz hierarchical image data in the post-processor 205 based on the information of the mixing process.
  • the image data R having a frame frequency of 240 Hz obtained by the decoder 204 is supplied to the post processor 205.
  • the post-processor 205 processes the image data R to obtain image data P having a frame frequency of 240 Hz (see FIG. 12C).
  • This image data P includes image data of the 60 Hz layer (see the image data of the frame (picture) of P3 in FIG. 12C) and image data of the 120 Hz layer (the frame (picture) of P1 in FIG. 12C).
  • Image data) and image data of the 240 Hz hierarchy see image data of frames (pictures) of P2 and P4 in FIG. 12C).
  • the image data of the 60 Hz layer is subjected to the reverse mixing process (mixing release process) using the image data of the 120 Hz layer and the image data of the 240 Hz layer based on the information of the mixing process. Therefore, the image data P having a frame frequency of 240 Hz output from the post-processor 205 is obtained by demixing both the 120-Hz layer and the 240-Hz layer, and the 240-Hz frame input to the pre-processor 102 of the transmitting apparatus 100 described above. This is similar to the frequency image data P.
  • the image data of the frame frequency of 240 Hz obtained by the post processor 205 or the image data of which the frame rate is further increased by the MCFI unit 206 is supplied to the panel display unit 207, and the panel display unit 207 displays the image based on the image data. Is done.
  • the television receiver 200B having decoding capability capable of processing image data of $ 120 Hz is configured in the same manner as the television receiver 200A of FIG.
  • the demultiplexer 203 extracts the basic stream STb and the first extension stream STe1 from the transport stream TS by PID filtering, and supplies them to the decoder 204.
  • the decoder 204 performs a decoding process on the streams STb and STe1, and obtains image data R ′ having a frame frequency of 120 Hz (see FIG. 14A).
  • the image data R ′ includes 60 Hz hierarchical image data (see R3 frame (picture) image data in FIG. 14A) and 120 Hz hierarchical image data (R1 frame (picture) in FIG. 14A). Image data). Only the image data of the 60 Hz layer is subjected to the mixing process using the image data of the 120 Hz layer and the image data of the 240 Hz layer.
  • the post processor 205 processes the image data R 'to obtain image data Q' having a frame frequency of 120 Hz (see FIG. 14B).
  • the image data Q ′ includes 60-Hz hierarchical image data (see the image data of the frame (picture) of Q3 in FIG. 14B) and 120-Hz hierarchical image data (the Q1 frame (picture) of FIG. 14B). Image data).
  • the image data of the 60 Hz layer is subjected to the reverse mixing process (mixing release process) using the image data of the 120 Hz layer based on the information of the mixing process. Therefore, the image data Q ′ having a frame frequency of 120 Hz output from the post-processor 205 has been released from the mixing at the 120-Hz hierarchy.
  • the image data of the frame frequency of 120 Hz obtained by the host processor 205 or the image data of which the frame rate has been further increased by the MCFI unit 206 is supplied to the panel display unit 207.
  • the unit 207 displays an image based on the image data.
  • FIG. 20 shows a configuration example of a television receiver 200C having a decoding capability capable of processing 60 Hz image data.
  • the television receiver 200C includes a control unit 201, a receiving unit 202, a demultiplexer 203, a decoder 204, an MCFI unit 206, and a panel display unit 207.
  • the control unit 201 controls the operation of each unit of the television receiver 200C.
  • the receiving unit 202 demodulates the RF modulated signal received by the receiving antenna, and obtains the transport stream TS.
  • the demultiplexer 203 extracts the basic stream STb from the transport stream TS by PID filtering, and supplies the basic stream STb to the decoder 204.
  • the decoder 204 performs a decoding process on the basic stream STb to obtain image data R ′′ having a frame frequency of 60 Hz including image data of a 60 Hz layer (see FIG. 15A).
  • the mixing process using the image data of the 120 Hz layer and the image data of the 240 Hz layer is performed.
  • the MCFI unit 206 performs a motion compensation frame interpolation process on the image data having the frame frequency of 60 Hz to obtain image data with a higher frame rate. In some cases, the MCFI unit 206 is not provided.
  • the panel display unit 207 displays an image based on the image data of the frame frequency of 60 Hz obtained by the decoder 204 or the image data whose frame rate has been increased by the MCFI unit 206.
  • the RF modulation signal received by the receiving antenna is demodulated, and a transport stream TS is obtained.
  • This transport stream TS is sent to the demultiplexer 203.
  • the basic stream STb is extracted from the transport stream TS by PID filtering and supplied to the decoder 204.
  • the decoder 204 performs a decoding process on the basic stream STb to obtain image data R ′′ (see FIG. 15A) having a frame frequency of 60 Hz.
  • the image data R ′′ includes image data of a 60 Hz layer. (See image data of R3 frame (picture) in FIG. 15A).
  • the 60 Hz hierarchical image data is subjected to a mixing process using the 120 Hz hierarchical image data and the 240 Hz hierarchical image data.
  • the image data of the frame frequency of 60 Hz obtained by the decoder 204 or the image data whose frame rate has been further increased by the MCFI unit 206 is supplied to the panel display unit 207, and the panel display unit 207 displays the image based on the image data. Is done.
  • the transmission / reception system 10 shown in FIG. 1 on the transmission side, three frequency layers of a 60 Hz layer, a 120 Hz layer, and a 240 Hz layer obtained by dividing image data having a frame frequency of 240 Hz into three layers. Is transmitted (only the image data of the 60 Hz hierarchy is subjected to the mixing process using the image data of the other frequency hierarchy). Therefore, on the receiving side, the deterioration of the moving image quality due to the strobing can be reduced in the basic 60 Hz frame frequency layer, and the high image quality can be maintained in the 120 Hz or 240 Hz frame frequency layer.
  • image data of three frequency layers of 60 Hz, 120 Hz, and 240 Hz obtained by dividing image data of a 240 Hz frame frequency into three layers.
  • image data of the 60 Hz hierarchy is subjected to the mixing process using the image data of the other frequency hierarchy
  • the image data from the 60 Hz hierarchy to the upper predetermined frequency hierarchy is used in accordance with the display capability. Display image data is obtained. Therefore, deterioration of moving image quality due to strobing can be reduced in the basic 60 Hz frame frequency layer, and high image quality can be maintained in the 120 Hz or 240 Hz frame frequency layer.
  • the example of the transmission / reception system 10 including the transmission device 100 and the television receiver 200 has been described, but the configuration of the transmission / reception system to which the present technology can be applied is not limited thereto.
  • a transmission / reception system in which a television receiver 200 is a set-top box 200-1 and a display 200-2 connected by a digital interface such as HDMI (High-Definition Multimedia Interface), for example 10A is also conceivable.
  • HDMI High-Definition Multimedia Interface
  • HDMI High-Definition Multimedia Interface
  • FIG. 22 shows a schematic configuration of the transmission device 100, the set-top box 200A, and the display 200B in that case.
  • the operation is the same as the configuration of the transmission device 100 and the television receiver 200 shown in FIG.
  • the set top box 200A-1 to the display 200A-1 transmit image data R having a frame frequency of 240 Hz and information of a mixing process for performing a reverse mixing process (mixing release process) of the 60 Hz hierarchical image data.
  • the set-top box 200B-1 to the display 200B-1 information of the mixing process for performing the reverse mixing process (mixing release process) of the 60 Hz hierarchical image data together with the image data R 'having the frame frequency of 120 Hz.
  • the decoder 204 may have the function of the post processor 205.
  • the set-top boxes 200A-1 and 200B-1 insert the information of the mixing process to be added to each picture into, for example, a blanking period in the image data of each picture and transmit it.
  • a newly defined HDMI blending information infoframe HDMI @ blending_Information @ InfoFrame is used.
  • FIG. 23 shows a structural example (Syntax) of the HDMI blending information infoframe, which corresponds to the structural example (Syntax) of the blending information SEI message of FIG. 6 described above, and details of individual information. The description of is omitted.
  • the first three bytes of this info frame are a header part, in which information of an info frame type, a version number, and a byte length of a data byte are arranged.
  • 8 8-bit information of “number_of_blending_layers” is arranged in data byte 0 (N + 0). 8-bit information of “framerate_layer” is arranged in data byte 1 (N + 1). One bit information of “blending_flag” is arranged in the seventh bit of the data byte 2 (N + 2). Also, 1-bit information of “blend_target_flag” is arranged in the sixth bit of data byte 2 (N + 2). Also, 4-bit information of “shutter_angle” is arranged in the fifth to second bits of the data byte 2 (N + 2). Also, 2-bit information of “temporal_filter_taps_minus2” is arranged in the first bit to the 0th bit of the data byte 2 (N + 2).
  • the container is a transport stream (MPEG-2 @ TS).
  • MPEG-2 @ TS transport stream
  • MMT MPEG @ Media @ Transport
  • ISOBMFF MP4
  • the present technology can also have the following configurations.
  • a receiving unit that receives image data of a plurality of frequency hierarchies obtained by hierarchically dividing image data of a predetermined frame frequency; Only the image data of the lowest frequency layer among the image data of the plurality of frequency layers is subjected to a mixing process using image data of another frequency layer,
  • a receiving device further comprising: a processing unit that obtains display image data by using image data from the lowest frequency hierarchy to the upper predetermined frequency hierarchy among the image data of the plurality of frequency hierarchies according to the display capability.
  • the processing unit performs an inverse mixing process on the image data of the lowest frequency layer.
  • the receiving device according to (1).
  • (3) At least the information of the mixing process is added to the image data of the lowest frequency hierarchy, The receiving device according to (2), wherein the processing unit performs an inverse mixing process on the image data of the lowest frequency hierarchy based on the information of the mixing process.
  • the information of the mixing process includes information of a mixing target image and information of a mixing ratio.
  • the predetermined frame frequency is at least four times the frame frequency of the lowest frequency hierarchy, The receiving device according to any one of (1) to (4), wherein the image data of the plurality of frequency layers is obtained by dividing the image data of the predetermined frame frequency into three or more layers.
  • the predetermined frame frequency is 240 Hz
  • the frame frequency of the lowest frequency layer is 60 Hz
  • the image data of the plurality of frequency layers includes image data of a 60 Hz layer, image data of a 120 Hz layer, and image data of a 240 Hz layer obtained by dividing the image data of the 240 Hz frame frequency into three layers.
  • the receiving device according to (5).
  • (7) The receiving device according to any one of (1) to (6), wherein the image data having the predetermined frame frequency is image data having a shutter angle of 360 °.
  • a receiving method further comprising the step of obtaining display image data using image data from the lowest frequency layer to the upper predetermined frequency layer among the image data of the plurality of frequency layers according to the display capability.
  • the image data for display when the image data for display is obtained by using the image data of the higher frequency layer than the image data of the lowest frequency layer, the image data of the lower frequency layer is inverted. Performing the mixing process The receiving method according to (8).
  • the information of the mixing process is added to at least the image data of the frame frequency of the lowest frequency hierarchy,
  • the predetermined frame frequency is at least four times the frame frequency of the lowest frequency hierarchy, The receiving method according to any one of (8) to (11), wherein the image data of the plurality of frequency layers is obtained by dividing the image data of the predetermined frame frequency into three or more layers.
  • the predetermined frame frequency is 240 Hz
  • the frame frequency of the lowest frequency layer is 60 Hz
  • the image data of the plurality of frequency layers includes image data of a 60 Hz layer, image data of a 120 Hz layer, and image data of a 240 Hz layer obtained by dividing the image data of the 240 Hz frame frequency into three layers.
  • a processing unit that classifies image data of a predetermined frame frequency into layers, performs a mixing process on image data of the lowest frequency layer with image data of another frequency layer, and obtains image data of a plurality of frequency layers.
  • a transmission device comprising a transmission unit for transmitting the image data of the plurality of frequency layers.
  • a transmission method comprising transmitting the image data of the plurality of frequency layers.
  • the main feature of the present technology is that image data of a plurality of frequency layers obtained by classifying image data of a high frame rate (mixing processing using image data of another frequency layer only for image data of the lowest frequency layer) Is performed), and the display image data is obtained using the image data from the lowest frequency layer to the upper predetermined frequency layer according to the display capability. That is, it is possible to reduce the deterioration of the moving image quality due to the bing, and to maintain the high image quality in the layers of other frame frequencies (see FIGS. 2, 3, and 5).
  • transmission / reception system 100 transmission device 101: control unit 102: preprocessor 103: encoder 104: multiplexer 105: transmission unit 200, 200A, 200B, 200C ... ⁇ Television receiver 200-1, 200A-1, 200B-1, 200C-1 ... Set-top box 200-2, 200A-2, 200B-2, 200C-2 ... Display 201 ... Control Unit 202 ⁇ ⁇ ⁇ Receiving Unit 203 ⁇ ⁇ ⁇ Demultiplexer 204 ⁇ ⁇ ⁇ Decoder 205 ⁇ ⁇ ⁇ Post Processor 206 ⁇ ⁇ ⁇ MCFI Unit 207 ⁇ ⁇ ⁇ Panel Display Unit

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

基本となるフレーム周波数のレイヤではストロービングによる動画質劣化を低減可能で、かつ他のフレーム周波数のレイヤでは高画質を維持可能とする。 所定フレーム周波数の画像データを階層分けして得られた複数の周波数階層の画像データ(最下位周波数階層の画像データのみ他の周波数階層の画像データを用いた混合処理が行われている)を受信する。表示能力に応じて、最下位周波数階層から上位所定周波数階層までの画像データを用いて表示用画像データを得る。基本となるフレーム周波数(最下位周波数階層のフレーム周波数)のレイヤではストロービングによる動画質劣化を低減で、かつ他のフレーム周波数のレイヤでは高画質を維持できる。

Description

受信装置、受信方法、送信装置および送信方法
 本技術は、受信装置、受信方法、送信装置および送信方法に関し、詳しくは、混合処理された画像データを取り扱う受信装置、受信方法、送信装置および送信方法に関する。
 従来から放送されているフレームレートでデコードを行う受信機において、ハイフレームレート(High Frame Rate)の放送を受信する場合、ストリームの部分的なデコードを行うと動きの連続性が損なわれて動画質の劣化が生じる。この動画質の劣化の主な原因は、部分デコードされたピクチャ同士の時間連続性が粗くなるため、速い動きに対する人間の眼の網膜投影が間欠的になることで生ずるストロービング(Strobing)であるといわれている。
 ストロービングによる動画質の劣化を低減させるために、本出願人は、先に、基準となるフレーム周期でのピクチャについて、その前後のピクチャとの間で画素混合を行う技術を提案した(特許文献1参照)。この場合、従来の受信機において時間サブサンプルを行っても、動いた要素が部分デコードされる時間サンプルに反映されるので、ストロービングによる動画質劣化が低減される。
国際公開第2015/076277号
 従来の技術では、カメラ撮影で得られる最高周期(例えば240Hz以上)の画像出力に対して、その1/2の周期の全画像、そして1/4 周期の全画像が混合されるため、1/2の周期の画像再生時にカメラ撮影時点の高画質度が損なわれる。
 ハイフレームレート放送で鮮鋭度のある画質を維持するために、ショートシャッター(Short Shutter)によりシャッターアングルを比較的小さくとった動画を伝送することを基本とし、そのうえで、部分デコードから表示画を作成する受信機において、ストロービングによる動画質の劣化を低減できる方法が望まれる。
 本技術の目的は、基本となるフレーム周波数のレイヤではストロービングによる動画質劣化を低減可能で、かつ他のフレーム周波数のレイヤを含む場合では高画質を維持可能とすることにある。
 本技術の概念は、
 所定フレーム周波数の画像データを階層分けして得られた複数の周波数階層の画像データを受信する受信部を備え、
 上記複数の画像データのうち最下位周波数階層の画像データのみ他の周波数階層の画像データを用いた混合処理が行われており、
 表示能力に応じて、上記複数の周波数階層の画像データのうち上記最下位周波数階層から上位所定周波数階層までの画像データを用いて、表示用画像データを得る処理部をさらに備える
 受信装置にある。
 本技術において、受信部により、所定フレーム周波数の画像データを階層分けして得られた複数の周波数階層の画像データが受信される。ここで、複数の周波数階層の画像データのうち最下位周波数階層の画像データのみ他の周波数階層の画像データを用いた混合処理が行われている。ここで、最下位周波数階層は、基本表示周波数に含まれる下位周波数群の階層を意味する。
 例えば、所定フレーム周波数の画像データは、360°のシャッターアングルを持つ画像データである、ようにされてもよい。また、例えば、所定フレーム周波数は、最下位周波数階層のフレーム周波数の4倍以上であり、複数の周波数階層の画像データは、所定フレーム周波数の画像データが3階層以上に階層分けされて得られたものである、ようにされてもよい。この場合、例えば、所定フレーム周波数は240Hzであり、最下位周波数階層のフレーム周波数は60Hzであり、複数の周波数階層の画像データは、240Hzのフレーム周波数の画像データが3階層に階層分けされて得られた、60Hz階層の画像データ、120Hz階層の画像データおよび240Hz階層の画像データを含む、ようにされてもよい。
 処理部により、表示能力に応じて、複数の周波数階層の画像データのうち最下位周波数階層から上位所定周波数階層までの画像データが用いられて、表示用画像データが得られる。例えば、処理部は、表示用画像データを最下位周波数階層の画像データより上位周波数階層の画像データを用いて得る場合、最下位周波数階層の画像データに逆混合処理を行う、ようにされてもよい。この場合、例えば、少なくとも最下位周波数階層の画像データに混合処理の情報が付加されており、処理部は、その混合処理の情報に基づいて、最下位周波数階層の画像データに逆混合処理を行う、ようにされてもよい。この場合、例えば、混合処理の情報は、混合対象画像の情報と混合比の情報を含む、ようにされてもよい。
 このように本技術においては、所定フレーム周波数の画像データを階層分けして得られた複数の周波数階層の画像データ(最下位周波数階層の画像データのみ他の周波数階層の画像データを用いた混合処理が行われている)が受信され、表示能力に応じて、最下位周波数階層から上位所定周波数階層までの画像データが用いられて表示用画像データが得られる。そのため、基本となるフレーム周波数(最下位周波数階層のフレーム周波数)のレイヤではストロービングによる動画質劣化を低減可能で、かつ他のフレーム周波数のレイヤでは高画質を維持可能となる。
 また、本技術の他の概念は、
 所定フレーム周波数の画像データを階層分けし、最下位周波数階層の画像データにのみ他の周波数階層の画像データとの混合処理を行って、複数の周波数階層の画像データを得る処理部と、
 上記複数の周波数階層の画像データを送信する送信部を備える
 送信装置にある。
 本技術において、処理部により、所定フレーム周波数の画像データが階層分けされ、最下位周波数階層の画像データにのみ他の周波数階層の画像データとの混合処理が行われて、複数の周波数階層の画像データが得られる。そして、送信部により、この複数の周波数階層の画像データが送信される。
 例えば、所定フレーム周波数の画像データは、360°のシャッターアングルを持つ画像データである、ようにされてもよい。また、例えば、所定フレーム周波数は、最下位周波数階層のフレーム周波数の4倍以上であり、処理部は、複数の周波数階層の画像データを、所定フレーム周波数の画像データを3階層以上に階層分けして得る、ようにされてもよい。この場合、例えば、所定フレーム周波数は240Hzであり、最下位周波数階層のフレーム周波数は60Hzであり、複数の周波数階層の画像データは、240Hzのフレーム周波数の画像データが3階層に階層分けされて得られた、60Hz階層の画像データ、120Hz階層の画像データおよび240Hz階層の画像データを含む、ようにされてもよい。
 例えば、少なくとも最下位周波数階層の画像データに混合処理の情報を付加する情報付加部をさらに備える、ようにされてもよい。この場合、例えば、混合処理の情報は、混合対象画像の情報と混合比の情報を含む、ようにされてもよい。
 このように本技術においては、所定フレーム周波数の画像データが階層分けされ得られた複数の周波数階層の画像データ(最下位周波数階層の画像データのみ他の周波数階層の画像データを用いた混合処理が行われている)が送信される。そのため、受信側では、基本となるフレーム周波数(最下位階層のフレーム周波数)のレイヤではストロービングによる動画質劣化を低減可能で、かつ他のフレーム周波数のレイヤでは高画質を維持可能となる。
実施の形態としての送受信システムの構成例を示すブロック図である。 階層分けされて得られた各周波数階層の画像データの概要を示す図である。 送信装置およびテレビ受信機の構成概要を示す図である。 送信装置のプリプロセッサの構成例を示すブロック図である。 プリプロセッサにおける処理を説明するための図である。 ブレンディング・インフォメーション・SEIメッセージの構造例を示す図である。 ブレンディング・インフォメーション・SEIメッセージの構造例における主要な情報の内容を示す図である。 混合処理情報を60Hz階層のピクチャのみに付す場合における各情報の具体例を示す図である。 混合処理情報を60Hz階層のピクチャのみに付す場合における各情報の具体例を示す図である。 混合処理情報を全ピクチャに付す場合における各情報の具体例を示す図である。 240Hzの画像データを処理可能なデコード能力があるテレビ受信機のポストプロセッサの構成例を示すブロック図である。 240Hzの画像データを処理可能なデコード能力があるテレビ受信機のポストプロセッサの処理を説明するための図である。 120Hzの画像データを処理可能なデコード能力があるテレビ受信機のポストプロセッサの構成例を示すブロック図である。 120Hzの画像データを処理可能なデコード能力があるテレビ受信機のポストプロセッサの処理を説明するための図である。 120Hzの画像データを処理可能なデコード能力があるテレビ受信機の処理を説明するための図である。 送信装置の構成例を示すブロック図である。 混合処理情報を60Hz階層のピクチャのみに付す場合におけるトランスポートストリームTSの構成例を示す図である。 混合処理情報を全ピクチャのみに付す場合におけるトランスポートストリームTSの構成例を示す図である。 240Hz/120Hzの画像データを処理可能なデコード能力があるテレビ受信機の構成例を示すブロック図である。 60Hzの画像データを処理可能なデコード能力があるテレビ受信機の構成例を示すブロック図である。 送受信システムの他の構成例を示すブロック図である。 送信装置、セットトップボックスおよびディスプレイの構成概要を示す図である。 HDMI・ブレンディング・インフォメーション・インフォフレームの構造例を示す図である。
 以下、発明を実施するための形態(以下、「実施の形態」とする)について説明する。なお、説明は以下の順序で行う。
 1.実施の形態
 2.変形例
 <1.実施の形態>
 [送受信システム]
 図1は、実施の形態としての送受信システム10の構成例を示している。この送受信システム10は、送信装置100と、テレビ受信機200を有する構成となっている。
 送信装置100は、コンテナとしてのトランスポートストリームTSを放送波に載せて送信する。このトランスポートストリームTSには、所定フレーム周波数、この実施の形態においてはハイフレームレートである240Hzのフレーム周波数の画像データが処理されて得られた、基本ストリーム、第1拡張ストリームおよび第2拡張ストリームが含まれる。ここで、240Hzのフレーム周波数の画像データは、360°のシャッターアングルを持っている。また、各ストリームは、NAL(Network Abstraction Layer)ユニット構造を有するものとされる。
 各ストリームは、240Hzのフレーム周波数の画像データが3階層に階層分けされて得られた、60Hz階層の画像データ、120Hz階層の画像データおよび240Hz階層の画像データの符号化画像データを含んでいる。ここで、60Hz階層の画像は、基本となるフレーム周波数を構成しており、最下位周波数階層のフレーム周波数画像である。60Hz階層の画像データのみ、120Hz階層の画像データおよび240Hz階層の画像データを用いた混合処理が行われる。少なくとも、60Hz階層の画像データに混合処理の情報(混合対象画像の情報、混合比の情報など)が付加されている。これにより、受信側では、この混合処理の情報に基づいて、60Hz階層の画像データに対する逆混合処理(混合解除処理)を容易かつ適切に行い得るようになる。
 図2は、階層分けされて得られた各周波数階層の画像データの概要を示している。60Hz階層の基本ストリームにより60Hz画像が構成される。また、120Hz階層の第1拡張ストリームと60Hz階層の基本ストリームとで120Hzの画像が構成される。また、240Hz階層の第2拡張ストリームと120Hz階層の第1拡張ストリームと60Hz階層の基本ストリームとで240Hzの画像が構成される。60Hz階層の画像データのみ、120Hz階層の画像データおよび240Hz階層の画像データの画像データを用いた混合処理が行われている。
 図1に戻って、テレビ受信機200は、送信装置100から放送波に載せて送られてくる上述のトランスポートストリームTSを受信する。テレビ受信機200は、60Hzの画像データを処理可能なデコード能力がある場合、トランスポートストリームTSに含まれる基本ストリームのみを処理して、60Hzのフレーム周波数の画像データの各フレームの画像データを得て、画像再生をする。
 また、テレビ受信機200は、120Hzあるいは240Hzのフレーム周波数の画像データを処理可能なデコード能力がある場合、トランスポートストリームTSに含まれる基本ストリームおよび拡張ストリームの双方を処理して、120Hzあるいは240Hzのフレーム周波数の画像データの各フレームの画像データを得て、画像再生をする。この場合、テレビ受信機200は、60Hz階層の画像データに対しては、適宜、逆混合処理をする。
 図3は、送信装置100およびテレビ受信機200の構成概要を示している。なお、送信装置100のプリプロセッサ102の出力Rの画像シーケンスとテレビ受信機200Aのデコーダ204の出力Rの画像シーケンスとは、時系列的には同じものであるが、コーデックを通しているので両者の画質が異なる場合も含む。
 送信装置100では、プリプロセッサ102において、240Hzのフレーム周波数の画像データPが3階層に階層分けされ、60Hz階層の画像データ、120Hz階層の画像データおよび240Hz階層の画像データを含む240Hzのフレーム周波数の画像データRが得られる。この場合、プリプロセッサ102では、60Hz階層の画像データについて、120Hz階層の画像データおよび240Hz階層の画像データを用いた混合処理が行われる。
 図4は、送信装置100のプリプロセッサ102の構成例を示している。このプリプロセッサ102は、240Hz階層混合演算部102aと、120Hz階層混合演算部102bを有している。240Hz階層混合演算部102aに関しては、上述の240Hzのフレーム周波数の画像データPが入力され、240Hzのフレーム周波数の画像データQが出力される。
 図5(a)は、240Hzのフレーム周波数の画像データPを示している。この画像データPは、P1,P2,P3,P4の4フレーム区間が繰り返される構成となっている。図5(b)は、240Hzのフレーム周波数の画像データQを示している。この画像データQは、Q1,Q2,Q3,Q4の4フレーム区間が繰り返される構成となっている。
 240Hz階層混合演算部102aでは、画像データQのQ1,Q2,Q4のフレームの画像データとして、それぞれ、画像データPのP1,P2,P4のフレームの画像データをそのまま出力するための処理が行われる。また、240Hz階層混合演算部102aでは、画像データQのQ3のフレームの画像データとして、画像データP2,P3,P4のフレームの画像データの混合画像データt(P2,P3,P4)を出力するための処理(混合処理)が行われる。
 この場合、Q3のフレームの画像データは、P2,P3,P4のフレームの画像データを用いて、以下の数式(1)に基づいて演算される。ここで、P3は60Hz階層の画像データであり、P2,P4は240Hz階層の画像データである。また、c,d,eは、それぞれP2,P3,P4のフレームの画像データの混合比を示し、例えば、c=1/4、d=1/2、e=1/4とされる。
 Q3=c*P2+d*P3+e*P4   ・・・(1)
 240Hz階層混合演算部102aには、上述の混合処理を行うための情報である240Hz階層混合パラメータとして、“current_picture_position”、“blend_coefficient_A”、“blend_coefficient_B”などが与えられる。なお、この混合パラメータの詳細については後述する。
 また、120Hz階層混合演算部102bに関しては、上述の240Hz階層混合演算部102aから出力される240Hzのフレーム周波数の画像データQが入力され、240Hzのフレーム周波数の画像データRが出力される。図5(c)は、240Hzのフレーム周波数の画像データRを示している。この画像データRは、R1,R2,R3,R4の4フレーム区間が繰り返される構成となっている。
 120Hz階層混合演算部102bでは、画像データRのR1,R2,R4のフレームの画像データとして、それぞれ、画像データQのQ1,Q2,Q4のフレームの画像データをそのまま出力するための処理が行われる。また、画像データRのR3のフレームの画像データとして、画像データQ1,Q3のフレームの画像データの混合画像データt(Q1,Q3)を出力するための処理(混合処理)が行われる。
 この場合、R3のフレームの画像データは、Q1,Q3のフレームの画像データを用いて、以下の数式(2)に基づいて演算される。ここで、Q3は60Hz階層の画像データであり、Q1は120Hz階層の画像データである。また、a,bは、それぞれQ1,Q3のフレームの画像データの混合比を示し、例えば、a=1/5、b=4/5とされる。
 R3=a*Q1+b*Q3   ・・・(1)
 120Hz階層混合演算部102bには、上述の混合処理を行うための情報である120Hz階層混合パラメータとして、“current_picture_position”、“blend_coefficient_A”、“blend_coefficient_B”などが与えられる。なお、この混合パラメータの詳細については後述する。
 画像データRのR3のフレームの画像データは60Hz階層の画像データを構成し、画像データRのR1の画像データは+60Hzの120Hz階層の画像データを構成し、さらに、画像データRのR2,R4の画像データは+120Hzの240Hz階層の画像データを構成している。図5(c)に示すように、画像データRのR1,R2,R4のフレームの画像データはそれぞれ画像データPのP1,P2,P4のフレームの画像データと同じである。また、画像データRのR3のフレームの画像データは、画像データPのP1~P4のフレームの画像データを混合して得られたものとなる。
 つまり、120Hz階層の画像データおよび240Hz階層の画像データには混合処理は行われておらず、60Hz階層の画像データのみ、120Hz階層の画像データおよび240Hz階層の画像データの画像データを用いた混合処理が行われている。これにより、受信側では、基本となるフレーム周波数(60Hz)のレイヤではストロービングによる動画質劣化を低減で可能で、かつ他のフレーム周波数(120Hz、240Hz)のレイヤでは高画質を維持可能となる。
 また、送信装置100では、エンコーダ103において、プリプロセッサ102から出力される画像データRに対して例えばHEVC(High Efficiency Video Coding)による階層符号化処理が施されて、基本ストリームSTbと、第1拡張ストリームSTe1、第2拡張ストリームSTe2が得られる。
 基本ストリームSTbには、60Hz階層の画像データ(図5(c)のR3のフレーム(ピクチャ)の画像データ参照)の符号化画像データが含まれる。また、第1拡張ストリームには、120Hz階層の画像データ(図5(c)のR1のフレーム(ピクチャ)の画像データ参照)の符号化画像データが含まれる。また、第2拡張ストリームには、240Hz階層の画像データ(図5(c)のR2、R4のフレーム(ピクチャ)の画像データ参照)の符号化画像データが含まれる。
 また、送信装置100では、エンコーダ103において、少なくとも60Hz階層の画像データに、混合対象画像の情報と混合比の情報等を含む混合処理の情報が付加される。この実施の形態において、アクセスユニット(AU)の“SEIs”の部分に、新規定義する、ブレンディング・インフォメーション・SEIメッセージ(Blending_information SEI message)が挿入される。
 図6は、ブレンディング・インフォメーション・SEIメッセージの構造例(Syntax)を示し、図7は、その構造例における主要な情報の内容(Semantics)を示している。「blending_information_id」のフィールドは、ブレンディング・インフォメーション・SEIメッセージであることを示す識別情報である。「number_of_blending_layers」のフィールドは、混合処理を行う周波数階層の数を示す。この周波数階層の数だけ、以下のフィールドが繰り返される。
 「framerate_layer」のフィールドは、対象となる周波数階層を示す。例えば、“1”は50Hzを示し、“2”は60Hzを示し、“3”は100Hzを示し、“4”は120Hzを示し、“5”は200Hzを示し、“6”は240Hzを示す。「blend_flag」のフィールドは、当該ピクチャは混合されているか否かを示す。例えば、“1”は混合されていることを示し、“0”は混合されていないことを示す。「blend_target_flag」のフィールドは、当該ピクチャは混合処理の対象であるか否かを示す。例えば、“1”は対象であることを示し、“0”は対象でないことを示す。
 「shutter_angle」は、対象となる階層のシャッターアングル(フレーム期間に対するシャッター開口率)を示す。例えば、“1”は360°(100%)を示し、“2”は270°(75%を示し、“3”は180°(50%)を示し、“4”は90°(25%)を示す。「temporal_filter_taps_minus2」は、混合処理に寄与するピクチャ数を示す。この「temporal_filter_taps_minus2」の値に2を加えた値が混合処理に寄与するピクチャ数になる。
 「current_picture_position」は、混合処理に寄与するピクチャ(「blend_target_flag」が“1”)の中での現ピクチャの時間的位置を示す。混合処理に寄与するピクチャ数が2(「temporal_filter_taps_minus2」が0)である場合、“10”は2つのピクチャのうち時間的順序が早い方であることを示し、“01”は2つのピクチャのうち時間的順序が遅い方であることを示す。
 また、混合処理に寄与するピクチャ数が3(「temporal_filter_taps_minus2」が1)である場合、当該ピクチャが混合されているとき(「blend_flag」が“1”)は、3つのピクチャのうち時間的順序が中央であることを示す、例えば“11”となる。また、混合処理に寄与するピクチャ数が3(「temporal_filter_taps」が3)である場合、当該ピクチャが混合されていないとき(「blend_flag」が“0”)は、例えば、“10”は3つのピクチャのうち時間的順序が最も早いことを示し、“11”は3つのピクチャのうち時間が中央であることを示し、“01”は3つのピクチャのうち時間的順序が最も遅いことを示す。
 また、混合処理に寄与するピクチャ数だけ、「blend_coefficient_A」および「blend_coefficient_B」のフィールドが繰り返される。「blend_coefficient_A」のフィールドは、混合演算の係数の分子を示す。「blend_coefficient_B」のフィールドは、混合演算の係数の分母を示す。
 図8は、混合処理情報を60Hz階層のピクチャ(図5(c)のR3のフレーム(ピクチャ)参照)のみに付す場合における各情報の具体例を示している。この場合、「number_of_blending_layers」は2とされて、混合処理を行う周波数階層の数が2であることが示される。そして、1つ目の階層において、「framerate_layer」は“6”とされて、対象となる周波数階層が240Hzであることが示される。
 そして、この240Hzの周波数階層において、以下のことが示される。すなわち、「blend_flag」が“1”とされて、当該ピクチャは混合されていることが示される。また、「blend_target_flag」が“1”とされて、当該ピクチャは混合処理の対象であることが示される。また、「shutter_angle」が“2”とされて、シャッターアングルが270°であることが示される。ここで、R3は、120Hz再生の際に、120Hzの期間でみると、240Hz時間軸の75%にあたる期間の動き成分を持つので、「shutter_angle」は270°(=2)になる。
 また、「temporal_filter_taps_minus2」が1とされて、混合処理に寄与するピクチャ数が3であることが示される。また、「current_picture_position」が“11”とされて、当該ピクチャは3つのピクチャのうち時間的順序が中央であることが示される。また、1番目の「blend_coefficient_A」、「blend_coefficient_B」がそれぞれ1、4とされ、時間的順序が最も早いピクチャの混合比が1/4であることが示される。また、2番目の「blend_coefficient_A」、「blend_coefficient_B」がそれぞれ1、4とされ、時間的順序が中央のピクチャ(当該ピクチャ)の混合比が1/2であることが示される。また、3番目の「blend_coefficient_A」、「blend_coefficient_B」がそれぞれ1、4とされ、時間的順序が最も遅いピクチャの混合比が1/4であることが示される。
 また、2つ目の階層において、「framerate_layer」は“4”とされて、対象となる周波数階層が120Hzであることが示される。
 そして、この120Hzの周波数階層において、以下のことが示される。すなわち、「blend_flag」が“1”とされて、当該ピクチャは混合されていることが示される。また、「blend_target_flag」が“1”とされて、当該ピクチャは混合処理の対象であることが示される。また、「shutter_angle」が“1”とされて、シャッターアングルが360°であることが示される。ここで、R3は、60Hz再生の際に、60Hzの期間でみると、240Hz時間軸の100%にあたる期間の動き成分を持つので、「shutter_angle」は360°(=1)になる。このように、最下段周波数としてベースレイヤで伝送されるR3は、2段階のシャッターアングルを持つ。
 また、「temporal_filter_taps_minus2」が0とされて、混合処理に寄与するピクチャ数が2であることが示される。また、「current_picture_position」が“01”とされて、当該ピクチャは2つのピクチャのうち時間的順序が遅い方であることが示される。また、1番目の「blend_coefficient_A」、「blend_coefficient_B」がそれぞれ1、5とされ、時間的順序が早い方のピクチャの混合比が1/5であることが示される。また、2番目の「blend_coefficient_A」、「blend_coefficient_B」がそれぞれ4、5とされ、時間的順序が遅い方のピクチャ(当該ピクチャ)の混合比が4/5であることが示される。
 図9は、図5(c)の例とは異なって、画像データRのR2のフレームが混合処理された場合であって、混合処理情報を60Hz階層のピクチャのみに付す場合における各情報の具体例を示している。この場合、「number_of_blending_layers」は2とされて、混合処理を行う周波数階層の数が2であることが示される。そして、1つ目の階層において、「framerate_layer」は“6”とされて、対象となる周波数階層が240Hzであることが示される。この240Hzの周波数階層における各情報は、詳細説明は省略するが、上述の図8の例と同様である。
 また、2つ目の階層において、「framerate_layer」は“4”とされて、対象となる周波数階層が120Hzであることが示される。そして、この120Hzの周波数階層において、「current_picture_position」が“10”とされて、当該ピクチャは2つのピクチャのうち時間的順序が早い方であることが示される。また、1番目の「blend_coefficient_A」、「blend_coefficient_B」がそれぞれ4、5とされ、時間的順序が早い方のピクチャ(当該ピクチャ)の混合比が4/5であることが示される。また、2番目の「blend_coefficient_A」、「blend_coefficient_B」がそれぞれ1、5とされ、時間的順序が遅い方のピクチャの混合比が1/5であることが示される。詳細説明は省略するが、その他は、上述の図8の例と同様である。
 図10は、混合処理情報を全ピクチャに付す場合における各情報の具体例を示している。この例は、図8の例と同様に、画像データRのR3のフレームが混合処理された場合について示している。60Hz階層のピクチャ(図5(c)のR3のフレーム(ピクチャ)参照)付される混合処理情報については、図8の例と同様であるので、その説明は省略する。
 120Hz階層のピクチャ(図5(c)のR1のフレーム(ピクチャ)参照)付される混合処理情報について説明する。この場合、「number_of_blending_layers」は1とされて、混合処理を行う周波数階層の数が1であることが示される。
 その1つの階層において、「framerate_layer」は“4”とされて、対象となる周波数階層が120Hzであることが示される。そして、この120Hzの周波数階層において、以下のことが示される。すなわち、「blend_flag」が“0”とされて、当該ピクチャは混合されていないことが示される。また、「blend_target_flag」が“1”とされて、当該ピクチャは混合処理の対象であることが示される。また、「shutter_angle」が“3”とされて、シャッターアングルが180°であることが示される。ここで、R1は、120Hz再生に利用されるもので、120Hzの期間でみると、240Hz時間軸の50%にあたる期間の動き成分を持つので、「shutter_angle」は180°(=3)になる。
 また、「temporal_filter_taps_minus2」が0とされて、混合処理に寄与するピクチャ数が2であることが示される。また、「current_picture_position」が“10”とされて、当該ピクチャは2つのピクチャのうち時間的順序が早い方であることが示される。また、1番目の「blend_coefficient_A」、「blend_coefficient_B」がそれぞれ1、5とされ、時間的順序が早い方のピクチャ(当該ピクチャ)の混合比が1/5であることが示される。また、2番目の「blend_coefficient_A」、「blend_coefficient_B」がそれぞれ4、5とされ、時間的順序が遅い方のピクチャの混合比が4/5であることが示される。
 次に、240Hz階層のピクチャ(図5(c)のR2のフレーム(ピクチャ)参照)付される混合処理情報について説明する。この場合、「number_of_blending_layers」は1とされて、混合処理を行う周波数階層の数が1であることが示される。
 その1つの階層において、「framerate_layer」は“6”とされて、対象となる周波数階層が240Hzであることが示される。そして、この240Hzの周波数階層において、以下のことが示される。すなわち、「blend_flag」が“0”とされて、当該ピクチャは混合されていないことが示される。また、「blend_target_flag」が“1”とされて、当該ピクチャは混合処理の対象であることが示される。また、「shutter_angle」が“1”とされて、シャッターアングルが360°であることが示される。ここで、R2は、240Hz再生に利用されるもので、240Hzの期間でみると、240Hz時間軸に沿った動き成分を持つので、「shutter_angle」は360°(=1)になる。
 また、「temporal_filter_taps_minus2」が1とされて、混合処理に寄与するピクチャ数が3であることが示される。また、「current_picture_position」が“10”とされて、当該ピクチャは3つのピクチャのうち時間的順序が最も早いことが示される。また、1番目の「blend_coefficient_A」、「blend_coefficient_B」がそれぞれ1、4とされ、時間的順序が最も早いピクチャ(当該ピクチャ)の混合比が1/4であることが示される。また、2番目の「blend_coefficient_A」、「blend_coefficient_B」がそれぞれ1、2とされ、時間的順序が中央のピクチャの混合比が1/2であることが示される。また、3番目の「blend_coefficient_A」、「blend_coefficient_B」がそれぞれ1、4とされ、時間的順序が最も遅いピクチャの混合比が1/4であることが示される。
 次に、240Hz階層のピクチャ(図5(c)のR4のフレーム(ピクチャ)参照)付される混合処理情報について説明する。この場合、「number_of_blending_layers」は1とされて、混合処理を行う周波数階層の数が1であることが示される。
 その1つの階層において、「framerate_layer」は“6”とされて、対象となる周波数階層が240Hzであることが示される。そして、この240Hzの周波数階層において、以下のことが示される。すなわち、「blend_flag」が“0”とされて、当該ピクチャは混合されていないことが示される。また、「blend_target_flag」が“1”とされて、当該ピクチャは混合処理の対象であることが示される。また、「shutter_angle」が“1”とされて、シャッターアングルが360°であることが示される。ここで、R4は、240Hz再生に利用されるもので、240Hzの期間でみると、240Hz時間軸に沿った動き成分を持つので、「shutter_angle」は360°(=1)になる。
 また、「temporal_filter_taps_minus2」が1とされて、混合処理に寄与するピクチャ数が3であることが示される。また、「current_picture_position」が“01”とされて、当該ピクチャは3つのピクチャのうち時間的順序が最も遅いことが示される。また、1番目の「blend_coefficient_A」、「blend_coefficient_B」がそれぞれ1、4とされ、時間的順序が最も早いピクチャの混合比が1/4であることが示される。また、2番目の「blend_coefficient_A」、「blend_coefficient_B」がそれぞれ1、2とされ、時間的順序が中央のピクチャの混合比が1/2であることが示される。また、3番目の「blend_coefficient_A」、「blend_coefficient_B」がそれぞれ1、4とされ、時間的順序が最も遅いピクチャ(当該ピクチャ)の混合比が1/4であることが示される。
 240Hzの画像データを処理可能なデコード能力があるテレビ受信機200Aでは、デコーダ204において、3つのストリームSTb,STe1,STe2に復号化処理が施されて、60Hz階層の画像データR3と、120Hz階層の画像データR1と、240Hz階層の画像データR2,R4を含む240Hzのフレーム周波数の画像データRが出力される。
 そして、テレビ受信機200Aでは、ポストプロセッサ205において、240Hzのフレーム周波数の画像データRが処理されて、60Hz階層の画像データP3と、120Hz階層の画像データP1と、240Hz階層の画像データP2,P4を含む240Hzのフレーム周波数の画像データPが得られる。この場合、ポストプロセッサ205では、60Hz階層の画像データについて、120Hz階層の画像データおよび240Hz階層の画像データを用いた逆混合処理(混合解除処理)が行われる。
 図11は、テレビ受信機200Aのポストプロセッサ205の構成例を示している。このポストプロセッサ205は、120Hz階層逆混合演算部205aと、240Hz階層逆混合演算部205bを有している。120Hz階層逆混合演算部205aに関しては、上述の240Hzのフレーム周波数の画像データRが入力され、240Hzのフレーム周波数の画像データQが出力される。
 図12(a)は、デコーダ204から出力される240Hzのフレーム周波数の画像データRを示している。この画像データRは、R1,R2,R3,R4の4フレーム区間が繰り返される構成となっている。図12(b)は、120Hz階層逆混合演算部205aから出力される240Hzのフレーム周波数の画像データQを示している。この画像データQは、Q1,Q2,Q3,Q4の4フレーム区間が繰り返される構成となっている。
 120Hz階層逆混合演算部205aでは、画像データQのQ1,Q2,Q4のフレームの画像データとして、それぞれ、画像データRのR1,R2,R4のフレームの画像データをそのまま出力するための処理が行われる。また、画像データQのQ3のフレームの画像データとして、画像データR1,R3のフレームの画像データを用いて逆混合された画像データt´(R1,R3)を出力するための処理(逆混合処理)が行われる。この場合、Q3のフレームの画像データとして、R1のフレームの画像データ成分が除かれたものが得られる。なお、このQ3のフレームの画像データには、R2,R4のフレームの画像データの成分が含まれている。
 この場合、Q3のフレームの画像データは、R1,R3のフレームの画像データを用いて、以下の数式(3)に基づいて演算される。ここで、R3は60Hz階層の画像データであり、R1は120Hz階層の画像データである。また、a,bは、それぞれ、上述のプリプロセッサ102の120Hz階層混合演算部102bにおけるQ1,Q3のフレームの画像データの混合比を示し、例えば、a=1/5、b=4/5とされる。
 Q3=(1/b){(-1)*a*R1+R3}   ・・・(3)
 120Hz階層逆混合演算部205aには、上述の逆混合処理を行うための情報である120Hz階層混合パラメータとして、“current_picture_position”、“blend_coefficient_A”、“blend_coefficient_B”などが与えられる。この120Hz階層混合パラメータは、デコーダ204において、上述したように送信側で画像データRに付加したものが抽出されて利用される。
 また、240Hz階層逆混合演算部205bに関しては、上述の120Hz階層逆混合演算部205aから出力される240Hzのフレーム周波数の画像データQが入力され、240Hzのフレーム周波数の画像データPが出力される。図12(c)は、240Hz階層逆混合演算部205bから出力される240Hzのフレーム周波数の画像データPを示している。この画像データPは、P1,P2,P3,P4の4フレーム区間が繰り返される構成となっている。
 240Hz階層逆混合演算部205bでは、画像データPのP1,P2,P4のフレームの画像データとして、それぞれ、画像データQのQ1,Q2,Q4のフレームの画像データをそのまま出力するための処理行われる。また、画像データPのP3のフレームの画像データとして、画像データQ2,Q3,Q4のフレームの画像データを用いて逆混合された画像データt´(Q2,Q3,Q4)を出力するための処理(逆混合処理)が行われる。この場合、P3のフレームの画像データとして、Q2,Q4のフレームの画像データ成分が除かれたものが得られる。これにより、240Hz階層逆混合演算部205bから出力される画像データPは、上述した送信装置100のプリプロセッサ102に入力された204Hzのフレーム周波数の画像データPと同様のものとなる。
 この場合、P3のフレームの画像データは、Q2,Q3,Q4のフレームの画像データを用いて、以下の数式(4)に基づいて演算される。ここで、Q3は60Hz階層の画像データであり、Q2,Q4は240Hz階層の画像データである。また、c,d,eは、それぞれ、上述のプリプロセッサ102の240Hz階層混合演算部102aにおけるP2,P3,P4のフレームの画像データの混合比を示し、例えば、c=1/4、d=1/2、e=1/4とされる。
 P3=(1/d){(-1)*c*Q2+Q3+(-1)*e*Q4}   ・・・(4)
 240Hz階層逆混合演算部205bには、上述の逆混合処理を行うための情報である240Hz階層混合パラメータとして、“current_picture_position”、“blend_coefficient_A”、“blend_coefficient_B”などが与えられる。この240Hz階層混合パラメータは、デコーダ204において、上述したように送信側で画像データRに付加したものが抽出されて利用される。
 図3に戻って、テレビ受信機200Aでは、ポストプロセッサ205で得られた240Hzの画像データPが、そのまま、あるいはMCFI(Motion Compensated Frame Insertion)部206でフレーム補間がされてフレームレートが高められて、表示用画像データとなる。図12(d)は、240Hzの画像データPをそのまま表示用画像データとする場合の表示シーケンスを示している。
 また、120Hzの画像データを処理可能なデコード能力があるテレビ受信機200Bでは、デコーダ204において、2つのストリームSTb,STe1に復号化処理が施されて、60Hz階層の画像データR3と、120Hz階層の画像データR1を含む120Hzのフレーム周波数の画像データR´が得られる。
 そして、テレビ受信機200Bでは、ポストプロセッサ205において、120Hzのフレーム周波数の画像データR´が処理されて、60Hz階層の画像データQ3と、120Hz階層の画像データQ1を含む120Hzのフレーム周波数の画像データQ´が得られる。この場合、ポストプロセッサ205では、60Hz階層の画像データについて、120Hz階層の画像データを用いた逆混合処理(混合解除処理)が行われる。
 図13は、テレビ受信機200Bのポストプロセッサ205の構成例を示している。このポストプロセッサ205は、120Hz階層逆混合演算部205aを有している。120Hz階層逆混合演算部205aに関しては、上述の120Hzのフレーム周波数の画像データR´が入力され、120Hzのフレーム周波数の画像データQ´が出力される。
 図14(a)は、デコーダ204から出力される120Hzのフレーム周波数の画像データR´を示している。この画像データR´は、R1,R3の2フレーム区間が繰り返される構成となっている。図14(b)は、120Hz階層逆混合演算部205aから出力される120Hzのフレーム周波数の画像データQ´を示している。この画像データQ´は、Q1,Q3の2フレーム区間が繰り返される構成となっている。
 120Hz階層逆混合演算部205aでは、画像データQ´のQ1のフレームの画像データとして、それぞれ、画像データR´のR1のフレームの画像データをそのまま出力するための処理が行われる。また、画像データQ´のQ3のフレームの画像データとして、画像データR1,R3のフレームの画像データを用いて逆混合された画像データt´(R1,R3)を出力するための処理(逆混合処理)が行われる。この場合、Q3のフレームの画像データとして、R1のフレームの画像データ成分が除かれたものが得られる。なお、このQ3のフレームの画像データには、R2,R4のフレームの画像データの成分が含まれている。
 120Hz階層逆混合演算部205aには、上述の逆混合処理を行うための情報である120Hz階層混合パラメータとして、“current_picture_position”、“blend_coefficient_A”、“blend_coefficient_B”などが与えられる。この120Hz階層混合パラメータは、デコーダ204において、上述したように送信側で画像データR´に付加したものが抽出されて利用される。
 図3に戻って、テレビ受信機200Bでは、ポストプロセッサ205で得られた120Hzの画像データQ´が、そのまま、あるいはMCFI(Motion Compensated Frame Insertion)部206でフレーム補間がされてフレームレートが高められて、表示用画像データとなる。図14(c)は、120Hzの画像データQ´をそのまま表示用画像データとする場合の表示シーケンスを示している。
 また、60Hzの画像データを処理可能なデコード能力があるテレビ受信機200Cでは、デコーダ204において、ストリームSTbに復号化処理が施されて、60Hz階層の画像データR3を含む60Hzのフレーム周波数の画像データR”が得られる。この60Hz階層の画像データR3は、240Hzのフレーム周波数の画像データPにおけるP1,P2,P3,P4のフレームの画像データが混合されて得られたものである。
 そして、テレビ受信機200Cでは、この画像データR”が、そのまま、あるいはMCFI部206でフレーム補間がされてフレームレートが高められて、表示用画像データとなる。図15(a)は、デコーダ204から出力される60Hzのフレーム周波数の画像データR”を示している。この画像データR”は、R3のフレーム区間が繰り返される構成となっている。図15(b)は、60Hzの画像データR”をそのまま表示用画像データとする場合の表示シーケンスを示している。
 「送信装置の構成」
 図16は、送信装置100の構成例を示している。この送信装置100は、制御部101と、プリプロセッサ102と、エンコーダ103と、マルチプレクサ104と、送信部105を有している。制御部101は、送信装置100の各部の動作を制御する。
 プリプロセッサ102は、240Hzのフレーム周波数の画像データPを3階層に階層分けし、60Hz階層の画像データ、120Hz階層の画像データおよび240Hz階層の画像データを含む240Hzのフレーム周波数の画像データRを出力する(図4、図5参照)。この場合、60Hz階層の画像データのみ、120Hz階層の画像データおよび240Hz階層の画像データを用いた混合処理が行われる。
 エンコーダ103は、プリプロセッサ102から出力される画像データRに対して例えばHEVC(High Efficiency Video Coding)による階層符号化処理を施し、基本ストリームSTbと、第1拡張ストリームSTe1、第2拡張ストリームSTe2を得る。ここで、基本ストリームSTbには、60Hz階層の画像データ(図5(c)のR3のフレーム(ピクチャ)の画像データ参照)の符号化画像データが含まれる。
 また、第1拡張ストリームSTe1には、120Hz階層の画像データ(図5(c)のR1のフレーム(ピクチャ)の画像データ参照)の符号化画像データが含まれる。また、第2拡張ストリームSTe2には、240Hz階層の画像データ(図5(c)のR2、R4のフレーム(ピクチャ)の画像データ参照)の符号化画像データが含まれる。
 この際、エンコーダ103は、少なくとも60Hz階層の画像データに、混合対象画像の情報と混合比の情報等を含む混合処理の情報を付加する。具体的には、各ピクチャのアクセスユニット(AU)の“SEIs”の部分に、新規定義する、ブレンディング・インフォメーション・SEIメッセージ(図6参照)を挿入する。
 マルチプレクサ104は、エンコーダ103で生成された基本ストリームSTb、第1拡張ストリームSTe1および第2拡張ストリームSTe2を、PES(Packetized Elementary Stream)パケット化し、さらにトランスポートパケット化して多重し、多重化ストリームとしてのトランスポートストリームTSを得る。送信部105は、トランスポートストリームTSを、例えば、QPSK/OFDM等の放送に適した変調方式で変調し、RF変調信号を送信アンテナから送信する。
 図17は、トランスポートストリームTSの構成例を示している。この例は、混合処理情報を60Hz階層のピクチャのみに付す場合の構成例を示している。このトランスポートストリームTSには、基本ストリーム(ベースストリーム)STbと、第1拡張ストリーム(第1のエンハンスストリーム)STe1と、第2拡張ストリーム(第2のエンハンスストリーム)STe2の3つのストリーム(サブストリーム)が含まれている。
 すなわち、この構成例では、パケット識別子「PID1」で識別される基本ストリームSTbのPESパケット「video PES1」が存在し、パケット識別子「PID2」で識別される第1拡張ストリームSTe1のPESパケット「video PES2」が存在し、さらに、パケット識別子「PID3」で識別される第2拡張ストリームSTe2のPESパケット「video PES3」が存在する。
 PESパケット「video PES1」でコンテナされる60Hz階層の各ピクチャの符号化画像データには、ブレンディング・インフォメーション・SEIメッセージ(図6、図8、図9参照)が挿入されている。
 また、トランスポートストリームTSには、PSI(Program Specific Information)の一つとして、PMT(Program Map Table)が含まれている。このPSIは、トランスポートストリームに含まれる各エレメンタリストリームがどのプログラムに属しているかを記した情報である。
 PMTには、プログラム全体に関連する情報を記述するプログラムループ(Program loop)が存在する。また、PMTには、各ビデオストリームに関連した情報を持つビデオエレメンタリストリームループが存在する。この構成例では、基本ストリームSTbに対応したビデオエレメンタリストリームループ「video ES1 loop」が存在し、第1の拡張ストリームSTe1に対応したビデオエレメンタリストリームループ「video ES2 loop」が存在し、さらに、第2の拡張ストリームSTe2に対応したビデオエレメンタリストリームループ「video ES3 loop」が存在する。
 「video ES1 loop」には、基本ストリームSTb(video PES1)に対応して、ストリームタイプ、パケット識別子(PID)等の情報が配置されると共に、そのビデオストリームに関連する情報を記述するデスクリプタも配置される。ストリームタイプは、HEVC符号化の場合、基本ストリームを示す“0x24”とされる。
 また、「video ES2 loop」には、第1拡張ストリームSTe1(video PES2)に対応して、ストリームタイプ、パケット識別子(PID)等の情報が配置されると共に、そのビデオストリームに関連する情報を記述するデスクリプタも配置される。ストリームタイプは、HEVC符号化の場合、拡張ストリームを示す“0x25”とされる。
 また、「video ES3 loop」には、第2拡張ストリームSTe2(video PES3)に対応して、ストリームタイプ、パケット識別子(PID)等の情報が配置されると共に、そのビデオストリームに関連する情報を記述するデスクリプタも配置される。ストリームタイプは、HEVC符号化の場合、拡張ストリームを示す“0x25”とされる。
 図18は、トランスポートストリームTSの他の構成例を示している。この例は、混合処理情報を全ピクチャに付す場合の構成例を示している。PESパケット「video PES1」でコンテナされる60Hz階層の各ピクチャの符号化画像データ、PESパケット「video PES2」でコンテナされる120Hz階層の各ピクチャの符号化画像データおよびPESパケット「video PES3」でコンテナされる240Hz階層の各ピクチャの符号化画像データには、ブレンディング・インフォメーション・SEIメッセージ(図6、図10参照)が挿入されている。その他は、図17に示すトランスポートストリームTSの構成例と同様であるの、その詳細説明は省略する。
 図16に示す送信装置100の動作を簡単に説明する。240Hzのフレーム周波数の画像データP(図5(a)参照)がプリプロセッサ102(図4参照)に入力される。このプリプロセッサ102では、画像データPが3階層に階層分けされ、60Hz階層の画像データ、120Hz階層の画像データおよび240Hz階層の画像データを含む240Hzのフレーム周波数の画像データR(図5(c)参照)が得られる。そして、この場合、60Hz階層の画像データ(図5(c)のR3のフレーム(ピクチャ)の画像データ参照)のみ、120Hz階層の画像データおよび240Hz階層の画像データを用いた混合処理が行われる。
 プリプロセッサ102で得られた240Hzの画像データRは、エンコーダ103に供給される。エンコーダ103では、画像データRに対して例えばHEVCによる階層符号化処理が施され、基本ストリームSTbと、第1拡張ストリームSTe1、第2拡張ストリームSTe2が得られる。
 基本ストリームSTbには、60Hz階層の画像データ(図5(c)のR3のフレーム(ピクチャ)の画像データ参照)の符号化画像データが含まれる。第1拡張ストリームSTe1には、120Hz階層の画像データ(図5(c)のR1のフレーム(ピクチャ)の画像データ参照)の符号化画像データが含まれる。また、第2拡張ストリームSTe2には、240Hz階層の画像データ(図5(c)のR2、R4のフレーム(ピクチャ)の画像データ参照)の符号化画像データが含まれる。
 また、エンコーダ103では、少なくとも混合処理が施されている60Hz階層の画像データの各ピクチャの符号化画像データの混合処理の情報が付加される。具体的には、60Hz階層の画像データの各ピクチャのアクセスユニット(AU)の“SEIs”の部分に、新規定義する、ブレンディング・インフォメーション・SEIメッセージ(図6参照)が挿入される。
 エンコーダ103で生成された基本ストリームSTb、第1拡張ストリームSTe1および第2拡張ストリームSTe2は、マルチプレクサ104に供給される。マルチプレクサ104では、各ストリームが、PESパケット化され、さらにトランスポートパケット化されて多重され、多重化ストリームとしてのトランスポートストリームTSが得られる。
 マルチプレクサ104で生成されたトランスポートストリームTSは、送信部105に送られる。送信部105では、このトランスポートストリームTSが、例えば、QPSK/OFDM等の放送に適した変調方式で変調され、このRF変調信号が送信アンテナから送信される。
 「テレビ受信機の構成」
 図19は、240Hzの画像データを処理可能なデコード能力があるテレビ受信機200Aの構成例を示している。このテレビ受信機200Aは、制御部201と、受信部202と、デマルチプレクサ203と、デコーダ204と、ポストプロセッサ205と、MCFI部206と、パネル表示部207を有している。
 制御部201は、テレビ受信機200Aの各部の動作を制御する。受信部202は、受信アンテナで受信されたRF変調信号を復調し、トランスポートストリームTSを取得する。デマルチプレクサ203は、トランスポートストリームTSから、PIDのフィルタリングによって、基本ストリームSTb、第1拡張ストリームSTe1および第2拡張ストリームSTe2を取り出し、デコーダ204に供給する。
 デコーダ204は、ストリームSTb,STe1,STe2に復号化処理を施し、60Hz階層の画像データ、120Hz階層の画像データおよび240Hz階層の画像データを含む240Hzのフレーム周波数の画像データR(図12(a)参照)を得る。この場合、60Hz階層の画像データのみ、120Hz階層の画像データおよび240Hz階層の画像データを用いた混合処理が行われている。
 また、デコーダ204は、ストリームSTb,STe1,STe2を構成する各アクセスユニットに挿入されているパラメータセットやSEIを抽出し、制御部201に送る。この場合、混合処理の情報(混合対象画像の情報と混合比の情報等を含む)を持つブレンディング・インフォメーション・SEIメッセージ(図6参照)も抽出される。制御部201は、この混合処理の情報に基づいて、ポストプロセッサ205における60Hz階層の画像データに対する逆混合処理(混合解除処理)を制御する。
 ポストプロセッサ205は、240Hzのフレーム周波数の画像データRを処理して、60Hz階層の画像データ、120Hz階層の画像データおよび240Hz階層の画像データを含む240Hzのフレーム周波数の画像データPを出力する(図11、図12参照)。この場合、60Hz階層の画像データについては、混合処理の情報に基づいて、120Hz階層の画像データおよび240Hz階層の画像データを用いた逆混合処理(混合解除処理)が施される。
 MCFI部206は、ポストプロセッサ205で得られた240Hzのフレーム周波数の画像データPに、動き補償のフレーム補間処理を施して、フレームレートをさらに高めた画像データを得る。なお、このMCFI部206を有していない場合もある。パネル表示部207は、ポストプロセッサ205で得られた240Hzの画像データまたはMCFI部206でフレームレートが高められた画像データによる画像表示をする。
 図19に示すテレビ受信機200Aの動作を簡単に説明する。受信部202では、受信アンテナで受信されたRF変調信号が復調され、トランスポートストリームTSが取得される。このトランスポートストリームTSは、デマルチプレクサ203に送られる。デマルチプレクサ203では、トランスポートストリームTSから、PIDのフィルタリングによって、基本ストリームSTb、第1拡張ストリームSTe1および第2拡張ストリームSTe2が取り出され、デコーダ204に供給される。
 デコーダ204では、ストリームSTb,STe1,STe2に復号化処理が施され、240Hzのフレーム周波数の画像データR(図12(a)参照)が得られる。この画像データRには、60Hz階層の画像データ(図12(a)のR3のフレーム(ピクチャ)の画像データ参照)、120Hz階層の画像データ(図12(a)のR1のフレーム(ピクチャ)の画像データ参照)および240Hz階層の画像データ(図12(a)のR2、R4のフレーム(ピクチャ)の画像データ参照)が含まれている。そして、60Hz階層の画像データのみ、120Hz階層の画像データおよび240Hz階層の画像データを用いた混合処理が行われている。
 また、デコーダ204では、ストリームSTb,STe1,STe2を構成する各アクセスユニットに挿入されているパラメータセットやSEIが抽出され、制御部201に送られる。この場合、混合処理の情報(混合対象画像の情報と混合比の情報等を含む)を持つブレンディング・インフォメーション・SEIメッセージ(図6参照)も抽出される。制御部201では、この混合処理の情報に基づいて、ポストプロセッサ205における60Hz階層の画像データに対する逆混合処理(混合解除処理)を制御することが行われる。
 デコーダ204で得られた240Hzのフレーム周波数の画像データRは、ポストプロセッサ205に供給される。ポストプロセッサ205では、画像データRが処理されて、240Hzのフレーム周波数の画像データP(図12(c)参照)が得られる。この画像データPには、60Hz階層の画像データ(図12(c)のP3のフレーム(ピクチャ)の画像データ参照)、120Hz階層の画像データ(図12(c)のP1のフレーム(ピクチャ)の画像データ参照)および240Hz階層の画像データ(図12(c)のP2、P4のフレーム(ピクチャ)の画像データ参照)が含まれている。
 この場合、60Hz階層の画像データについては、混合処理の情報に基づいて、120Hz階層の画像データおよび240Hz階層の画像データを用いた逆混合処理(混合解除処理)が施される。そのため、ポストプロセッサ205から出力される240Hzのフレーム周波数の画像データPは、120Hz階層および240Hz階層の双方の混合が解除されたものとなり、上述した送信装置100のプリプロセッサ102に入力された240Hzのフレーム周波数の画像データPと同様のものとなる。
 ポストプロセッサ205で得られた240Hzのフレーム周波数の画像データ、あるいはさらにMCFI部206でフレームレートが高められた画像データはパネル表示部207に供給され、パネル表示部207には当該画像データによる画像表示がされる。
 120Hzの画像データを処理可能なデコード能力があるテレビ受信機200Bに関しても、図19のテレビ受信機200Aと同様に構成される。テレビ受信機200Bの場合、デマルチプレクサ203では、トランスポートストリームTSから、PIDのフィルタリングによって、基本ストリームSTbおよび第1拡張ストリームSTe1が取り出され、デコーダ204に供給される。
 また、テレビ受信機200Bの場合、デコーダ204では、ストリームSTb,STe1に復号化処理が施され、120Hzのフレーム周波数の画像データR´(図14(a)参照)が得られる。この画像データR´には、60Hz階層の画像データ(図14(a)のR3のフレーム(ピクチャ)の画像データ参照)および120Hz階層の画像データ(図14(a)のR1のフレーム(ピクチャ)の画像データ参照)が含まれている。そして、60Hz階層の画像データのみ、120Hz階層の画像データおよび240Hz階層の画像データを用いた混合処理が行われている。
 また、テレビ受信機200Bの場合、ポストプロセッサ205では、画像データR´が処理されて、120Hzのフレーム周波数の画像データQ´(図14(b)参照)が得られる。この画像データQ´には、60Hz階層の画像データ(図14(b)のQ3のフレーム(ピクチャ)の画像データ参照)および120Hz階層の画像データ(図14(b)のQ1のフレーム(ピクチャ)の画像データ参照)が含まれている。
 この場合、60Hz階層の画像データについては、混合処理の情報に基づいて、120Hz階層の画像データを用いた逆混合処理(混合解除処理)が施される。そのため、ポストプロセッサ205から出力される120Hzのフレーム周波数の画像データQ´は、120Hz階層での混合が解除されたものとなる。
 そして、テレビ受信機200Bの場合、ホストプロセッサ205で得られた120Hzのフレーム周波数の画像データ、あるいはさらにMCFI部206でフレームレートが高められた画像データはパネル表示部207に供給され、このパネル表示部207には当該画像データによる画像表示がされる。
 図20は、60Hzの画像データを処理可能なデコード能力があるテレビ受信機200Cの構成例を示している。このテレビ受信機200Cは、制御部201と、受信部202と、デマルチプレクサ203と、デコーダ204と、MCFI部206と、パネル表示部207を有している。
 制御部201は、テレビ受信機200Cの各部の動作を制御する。受信部202は、受信アンテナで受信されたRF変調信号を復調し、トランスポートストリームTSを取得する。デマルチプレクサ203は、トランスポートストリームTSから、PIDのフィルタリングによって、基本ストリームSTbを取り出し、デコーダ204に供給する。
 デコーダ204は、基本ストリームSTbに復号化処理を施して、60Hz階層の画像データを含む60Hzのフレーム周波数の画像データR”(図15(a)参照)を得る。この60Hz階層の画像データは、120Hz階層の画像データおよび240Hz階層の画像データを用いた混合処理が行われている。
 MCFI部206は、この60Hzのフレーム周波数の画像データに、動き補償のフレーム補間処理を施して、フレームレートをさらに高めた画像データを得る。なお、このMCFI部206を有していない場合もある。パネル表示部207は、デコーダ204で得られた60Hzのフレーム周波数の画像データまたはMCFI部206でフレームレートが高められた画像データによる画像表示をする。
 図20に示すテレビ受信機200Cの動作を簡単に説明する。受信部202では、受信アンテナで受信されたRF変調信号が復調され、トランスポートストリームTSが取得される。このトランスポートストリームTSは、デマルチプレクサ203に送られる。デマルチプレクサ203では、トランスポートストリームTSから、PIDのフィルタリングによって、基本ストリームSTbが取り出され、デコーダ204に供給される。
 デコーダ204では、基本ストリームSTbに復号化処理が施されて、60Hzのフレーム周波数の画像データR”(図15(a)参照)が得られる。この画像データR”には、60Hz階層の画像データ(図15(a)のR3のフレーム(ピクチャ)の画像データ参照)が含まれている。この60Hz階層の画像データは、120Hz階層の画像データおよび240Hz階層の画像データを用いた混合処理が行われている。
 デコーダ204で得られた60Hzのフレーム周波数の画像データ、あるいはさらにMCFI部206でフレームレートが高められた画像データはパネル表示部207に供給され、このパネル表示部207には当該画像データによる画像表示がされる。
 以上説明したように、図1に示す送受信システム10において、送信側では、240Hzのフレーム周波数の画像データが3階層に階層分けして得られた60Hz階層、120Hz階層、240Hz階層の3つの周波数階層の画像データ(60Hz階層の画像データのみ他の周波数階層の画像データを用いた混合処理が行われている)が送信される。そのため、受信側では、基本となる60Hzのフレーム周波数のレイヤではストロービングによる動画質劣化を低減でき、かつ120Hzや240Hzのフレーム周波数のレイヤでは高画質を維持できる。
 また、図1に示す送受信システム10においては、受信側では、240Hzのフレーム周波数の画像データを3階層に階層分けして得られた60Hz階層、120Hz階層、240Hz階層の3つの周波数階層の画像データ(60Hz階層の画像データのみ他の周波数階層の画像データを用いた混合処理が行われている)が受信され、表示能力に応じて、60Hz階層から上位所定周波数階層までの画像データが用いられて表示用画像データが得られる。そのため、基本となる60Hzのフレーム周波数のレイヤではストロービングによる動画質劣化を低減でき、かつ120Hzや240Hzのフレーム周波数のレイヤでは高画質を維持できる。
 <2.変形例>
 なお、上述実施の形態においては、240Hzのフレーム周波数の画像データを3階層に階層分けして得られた60Hz階層、120Hz階層、240Hz階層の3つの周波数階層の画像データを送受信する例を示したが、階層分けをする元の画像データのフレーム周波数や階層数、さらには各階層の周波数については、これに限定されない。
 また、上述実施の形態においては、送信装置100とテレビ受信機200からなる送受信システム10の例を示したが、本技術を適用し得る送受信システムの構成は、これに限定されない。例えば、図21に示すように、テレビ受信機200の部分が、例えばHDMI(High-Definition Multimedia Interface)などのデジタルインタフェースで接続されたセットトップボックス200-1およびディスプレイ200-2とされる送受信システム10Aも考えられる。なお、「HDMI」は登録商標である。
 図22は、その場合における送信装置100、セットトップボックス200Aおよびディスプレイ200Bの構成概要を示している。詳細説明は省略するが、図3に示す送信装置100およびテレビ受信機200の構成と同様に動作する。なお、セットトップボックス200A-1からディスプレイ200A-1には、240Hzのフレーム周波数の画像データRと共に、60Hz階層の画像データの逆混合処理(混合解除処理)を行うための混合処理の情報が送られる。同様に、セットトップボックス200B-1からディスプレイ200B-1には、120Hzのフレーム周波数の画像データR´と共に、60Hz階層の画像データの逆混合処理(混合解除処理)を行うための混合処理の情報が送られる。なお、ポストプロセッサ205の機能を、デコーダ204に持たせることも考えられる。
 セットトップボックス200A-1,200B-1は、各ピクチャに付加する混合処理の情報を、例えば、それぞれのピクチャの画像データにおけるブランキング期間に挿入して送信する。ここでは、新規定義するHDMI・ブレンディング・インフォメーション・インフォフレーム(HDMI blending_Information InfoFrame)を使用する。
 図23は、HDMI・ブレンディング・インフォメーション・インフォフレームの構造例(Syntax)を示し、上述の図6のブレンディング・インフォメーション・SEIメッセージの構造例(Syntax)に対応したものであり、個々の情報の詳細については、その説明を省略する。このインフォフレームの最初の3バイトはヘッダ部分であり、インフォフレームタイプ、バージョンナンバー、データバイトのバイト長の情報が配置されている。
 データバイト0(N+0)に「number_of_blending_layers」の8ビット情報が配置されている。データバイト1(N+1)に「framerate_layer」の8ビット情報が配置されている。データバイト2(N+2)の第7ビットに「blending_flag」の1ビット情報が配置されている。また、データバイト2(N+2)の第6ビットに「blend_target_flag」の1ビット情報が配置されている。また、データバイト2(N+2)の第5ビットから第2ビットに「shutter_angle」の4ビット情報が配置されている。また、データバイト2(N+2)の第1ビットから第0ビットに「temporal_filter_taps_minus2」の2ビット情報が配置されている。
 また、データバイト3(N+3)の第7ビットから第6ビットに「current_picture_position」の2ビット情報が配置されている。また、データバイト4(N+4)に「blend_coefficient_A」の8ビット情報が配置されている。また、データバイト5(N+5)に「blend_coefficient_B」の8ビット情報が配置されている。そして、「Temporal_filter_taps_minus2」に2を加えた値だけ、データバイト4,5と同様の空間が、データバイト6(N+6)以降に確保される。また、「number_of_blending_layers」の値だけ、データバイト1からデータバイト5(あるいは上述したようにデータバイト6以降に確保された空間)が繰り返される。
 また、上述実施の形態においては、コンテナがトランスポートストリーム(MPEG-2 TS)である例を示した。しかし、本技術は、インターネット等のネットワークを利用して受信端末に配信される構成のシステムにも同様に適用できる。インターネットの配信では、MP4やそれ以外のフォーマットのコンテナで配信されることが多い。つまり、コンテナとしては、デジタル放送規格で採用されているトランスポートストリーム(MPEG-2 TS)あるいはMMT(MPEG Media Transport)、インターネット配信で使用されているISOBMFF(MP4)などの種々のフォーマットのコンテナが該当する。
 また、本技術は、以下のような構成を取ることもできる。
 (1)所定フレーム周波数の画像データを階層分けして得られた複数の周波数階層の画像データを受信する受信部を備え、
 上記複数の周波数階層の画像データのうち最下位周波数階層の画像データのみ他の周波数階層の画像データを用いた混合処理が行われており、
 表示能力に応じて、上記複数の周波数階層の画像データのうち上記最下位周波数階層から上位所定周波数階層までの画像データを用いて、表示用画像データを得る処理部をさらに備える
 受信装置。
 (2)上記処理部は、上記表示用画像データを上記最下位周波数階層の画像データより上位周波数階層の画像データを用いて得る場合、上記最下位周波数階層の画像データに逆混合処理を行う
 前記(1)に記載の受信装置。
 (3)少なくとも上記最下位周波数階層の画像データに上記混合処理の情報が付加されており、
 上記処理部は、上記混合処理の情報に基づいて、上記最下位周波数階層の画像データに逆混合処理を行う
 前記(2)に記載の受信装置。
 (4)上記混合処理の情報は、混合対象画像の情報と混合比の情報を含む
 前記(3)に記載の受信装置。
 (5)上記所定フレーム周波数は、上記最下位周波数階層のフレーム周波数の4倍以上であり、
 上記複数の周波数階層の画像データは、上記所定フレーム周波数の画像データが3階層以上に階層分けされて得られたものである
 前記(1)から(4)のいずれかに記載の受信装置。
 (6)上記所定フレーム周波数は240Hzであり、上記最下位周波数階層のフレーム周波数は60Hzであり、
 上記複数の周波数階層の画像データは、上記240Hzのフレーム周波数の画像データが3階層に階層分けされて得られた、60Hz階層の画像データ、120Hz階層の画像データおよび240Hz階層の画像データを含む
 前記(5)に記載の受信装置。
 (7)上記所定フレーム周波数の画像データは、360°のシャッターアングルを持つ画像データである
 前記(1)から(6)のいずれかに記載の受信装置。
 (8)所定フレーム周波数の画像データを階層分けして得られた複数の周波数階層の画像データを受信する手順を有し、
 上記複数の階層の周波数階層の画像データのうち最下位周波数階層の画像データのみ他の周波数階層の画像データを用いた混合処理が行われており、
 表示能力に応じて、上記複数の周波数階層の画像データのうち上記最下位周波数階層から上位所定周波数階層までの画像データを用いて、表示用画像データを得る手順をさらに有する
 受信方法。
 (9)上記表示用画像データを得る手順において、上記表示用画像データを上記最下位周波数階層の画像データより上位周波数階層の画像データを用いて得る場合、上記最下位周波数階層の画像データに逆混合処理を行う
 前記(8)に記載の受信方法。
 (10)少なくとも上記最下位周波数階層のフレーム周波数の画像データに上記混合処理の情報が付加されており、
 上記表示用画像データを得る手順において、上記混合処理の情報に基づいて、上記最下位周波数階層の画像データに逆混合処理を行う
 前記(9)に記載の受信方法。
 (11)上記混合処理の情報は、混合対象画像の情報と混合比の情報を含む
 前記(10)に記載の受信方法。
 (12)上記所定フレーム周波数は、上記最下位周波数階層のフレーム周波数の4倍以上であり、
 上記複数の周波数階層の画像データは、上記所定フレーム周波数の画像データが3階層以上に階層分けされて得られたものである
 前記(8)から(11)のいずれかに記載の受信方法。
 (13)上記所定フレーム周波数は240Hzであり、上記最下位周波数階層のフレーム周波数は60Hzであり、
 上記複数の周波数階層の画像データは、上記240Hzのフレーム周波数の画像データが3階層に階層分けされて得られた、60Hz階層の画像データ、120Hz階層の画像データおよび240Hz階層の画像データを含む
 前記(12)に記載の受信方法。
 (14)上記所定フレーム周波数の画像データは、360°のシャッターアングルを持つ画像データである
 前記(1)から(13)のいずれかに記載の受信方法。
 (15)所定フレーム周波数の画像データを階層分けし、最下位周波数階層の画像データにのみ他の周波数階層の画像データとの混合処理を行って、複数の周波数階層の画像データを得る処理部と、
 上記複数の周波数階層の画像データを送信する送信部を備える
 送信装置。
 (16)所定フレーム周波数の画像データを階層分けし、最下位周波数階層の画像データにのみ他の周波数階層の画像データとの混合処理を行って、複数の周波数階層の画像データを得る手順と、
 上記複数の周波数階層の画像データを送信する手順を有する
 送信方法。
 本技術の主な特徴は、ハイフレームレートの画像データを階層分けして得られた複数の周波数階層の画像データ(最下位周波数階層の画像データのみ他の周波数階層の画像データを用いた混合処理が行われている)を受信し、表示能力に応じて、最下位周波数階層から上位所定周波数階層までの画像データを用いて表示用画像データを得ることで、基本となるフレーム周波数のレイヤではストロービングによる動画質劣化を低減でき、かつ他のフレーム周波数のレイヤでは高画質を維持できるようにしたことである(図2、図3、図5参照)。
 10,10A・・・送受信システム
 100・・・送信装置
 101・・・制御部
 102・・・プリプロセッサ
 103・・・エンコーダ
 104・・・マルチプレクサ
 105・・・送信部
 200,200A,200B,200C・・・テレビ受信機
 200-1,200A-1,200B-1,200C-1・・・・セットトップボックス
 200-2,200A-2,200B-2,200C-2・・・ディスプレイ
 201・・・制御部
 202・・・受信部
 203・・・デマルチプレクサ
 204・・・デコーダ
 205・・・ポストプロセッサ
 206・・・MCFI部
 207・・・パネル表示部

Claims (16)

  1.  所定フレーム周波数の画像データを階層分けして得られた複数の周波数階層の画像データを受信する受信部を備え、
     上記複数の周波数階層の画像データのうち最下位周波数階層の画像データのみ他の周波数階層の画像データを用いた混合処理が行われており、
     表示能力に応じて、上記複数の周波数階層の画像データのうち上記最下位周波数階層から上位所定周波数階層までの画像データを用いて、表示用画像データを得る処理部をさらに備える
     受信装置。
  2.  上記処理部は、上記表示用画像データを上記最下位周波数階層の画像データより上位周波数階層の画像データを用いて得る場合、上記最下位周波数階層の画像データに逆混合処理を行う
     請求項1に記載の受信装置。
  3.  少なくとも上記最下位周波数階層の画像データに上記混合処理の情報が付加されており、
     上記処理部は、上記混合処理の情報に基づいて、上記最下位周波数階層の画像データに逆混合処理を行う
     請求項2に記載の受信装置。
  4.  上記混合処理の情報は、混合対象画像の情報と混合比の情報を含む
     請求項3に記載の受信装置。
  5.  上記所定フレーム周波数は、上記最下位周波数階層のフレーム周波数の4倍以上であり、
     上記複数の周波数階層の画像データは、上記所定フレーム周波数の画像データが3階層以上に階層分けされて得られたものである
     請求項1に記載の受信装置。
  6.  上記所定フレーム周波数は240Hzであり、上記最下位周波数階層のフレーム周波数は60Hzであり、
     上記複数の周波数階層の画像データは、上記240Hzのフレーム周波数の画像データが3階層に階層分けされて得られた、60Hz階層の画像データ、120Hz階層の画像データおよび240Hz階層の画像データを含む
     請求項5に記載の受信装置。
  7.  上記所定フレーム周波数の画像データは、360°のシャッターアングルを持つ画像データである
     請求項1に記載の受信装置。
  8.  所定フレーム周波数の画像データを階層分けして得られた複数の周波数階層の画像データを受信する手順を有し、
     上記複数の階層の周波数階層の画像データのうち最下位周波数階層の画像データのみ他の周波数階層の画像データを用いた混合処理が行われており、
     表示能力に応じて、上記複数の周波数階層の画像データのうち上記最下位周波数階層から上位所定周波数階層までの画像データを用いて、表示用画像データを得る手順をさらに有する
     受信方法。
  9.  上記表示用画像データを得る手順において、上記表示用画像データを上記最下位周波数階層の画像データより上位周波数階層の画像データを用いて得る場合、上記最下位周波数階層の画像データに逆混合処理を行う
     請求項8に記載の受信方法。
  10.  少なくとも上記最下位周波数階層のフレーム周波数の画像データに上記混合処理の情報が付加されており、
     上記表示用画像データを得る手順において、上記混合処理の情報に基づいて、上記最下位周波数階層の画像データに逆混合処理を行う
     請求項9に記載の受信方法。
  11.  上記混合処理の情報は、混合対象画像の情報と混合比の情報を含む
     請求項10に記載の受信方法。
  12.  上記所定フレーム周波数は、上記最下位周波数階層のフレーム周波数の4倍以上であり、
     上記複数の周波数階層の画像データは、上記所定フレーム周波数の画像データが3階層以上に階層分けされて得られたものである
     請求項8に記載の受信方法。
  13.  上記所定フレーム周波数は240Hzであり、上記最下位周波数階層のフレーム周波数は60Hzであり、
     上記複数の周波数階層の画像データは、上記240Hzのフレーム周波数の画像データが3階層に階層分けされて得られた、60Hz階層の画像データ、120Hz階層の画像データおよび240Hz階層の画像データを含む
     請求項12に記載の受信方法。
  14.  上記所定フレーム周波数の画像データは、360°のシャッターアングルを持つ画像データである
     請求項8に記載の受信方法。
  15.  所定フレーム周波数の画像データを階層分けし、最下位周波数階層の画像データにのみ他の周波数階層の画像データとの混合処理を行って、複数の周波数階層の画像データを得る処理部と、
     上記複数の周波数階層の画像データを送信する送信部を備える
     送信装置。
  16.  所定フレーム周波数の画像データを階層分けし、最下位周波数階層の画像データにのみ他の周波数階層の画像データとの混合処理を行って、複数の周波数階層の画像データを得る手順と、
     上記複数の周波数階層の画像データを送信する手順を有する
     送信方法。
PCT/JP2019/029719 2018-08-10 2019-07-29 受信装置、受信方法、送信装置および送信方法 Ceased WO2020031782A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US17/264,994 US11483565B2 (en) 2018-08-10 2019-07-29 Receiving apparatus, receiving method, transmitting apparatus, and transmitting method
CN201980051631.7A CN112534827B (zh) 2018-08-10 2019-07-29 接收装置、接收方法、发送装置和发送方法
EP19846920.7A EP3836556A4 (en) 2018-08-10 2019-07-29 RECEIVING DEVICE, RECEPTION PROCESS, TRANSMISSION DEVICE, AND TRANSMISSION PROCESS

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018152086 2018-08-10
JP2018-152086 2018-08-10

Publications (1)

Publication Number Publication Date
WO2020031782A1 true WO2020031782A1 (ja) 2020-02-13

Family

ID=69415195

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/029719 Ceased WO2020031782A1 (ja) 2018-08-10 2019-07-29 受信装置、受信方法、送信装置および送信方法

Country Status (4)

Country Link
US (1) US11483565B2 (ja)
EP (1) EP3836556A4 (ja)
CN (1) CN112534827B (ja)
WO (1) WO2020031782A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015076277A1 (ja) 2013-11-22 2015-05-28 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
WO2017065128A1 (ja) * 2015-10-13 2017-04-20 ソニー株式会社 送信装置、送信方法、受信装置および受信方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5852565A (en) * 1996-01-30 1998-12-22 Demografx Temporal and resolution layering in advanced television
US6816552B2 (en) * 2001-07-11 2004-11-09 Dolby Laboratories Licensing Corporation Interpolation of video compression frames
WO2006007527A2 (en) * 2004-07-01 2006-01-19 Qualcomm Incorporated Method and apparatus for using frame rate up conversion techniques in scalable video coding
US8619083B2 (en) * 2009-01-06 2013-12-31 Microsoft Corporation Multi-layer image composition with intermediate blending resolutions
JP5338394B2 (ja) * 2009-03-10 2013-11-13 日本電気株式会社 映像配信システム、映像配信方法、映像配信装置及び映像配信プログラム
US9554132B2 (en) * 2011-05-31 2017-01-24 Dolby Laboratories Licensing Corporation Video compression implementing resolution tradeoffs and optimization
MY186153A (en) * 2012-12-26 2021-06-28 Sony Corp Image processing device and method
JP5947269B2 (ja) * 2013-09-24 2016-07-06 ソニー株式会社 符号化装置、符号化方法、送信装置および受信装置
JP2015080034A (ja) * 2013-10-15 2015-04-23 キヤノン株式会社 画像処理装置、画像処理方法、プログラム
CN107925766B (zh) * 2015-09-01 2022-05-10 索尼公司 发送装置、发送方法、接收装置和接收方法
JP6694280B2 (ja) * 2016-01-22 2020-05-13 日本放送協会 映像信号送信装置、映像信号受信装置及び映像信号送受信システム
JP6740533B2 (ja) * 2016-05-25 2020-08-19 日本放送協会 符号化装置、復号装置及びプログラム
WO2018123542A1 (en) * 2016-12-31 2018-07-05 Sharp Kabushiki Kaisha Systems and methods for reducing artifacts in temporal scalable layers of video

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015076277A1 (ja) 2013-11-22 2015-05-28 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
WO2017065128A1 (ja) * 2015-10-13 2017-04-20 ソニー株式会社 送信装置、送信方法、受信装置および受信方法

Also Published As

Publication number Publication date
US20210329247A1 (en) 2021-10-21
CN112534827A (zh) 2021-03-19
EP3836556A4 (en) 2021-09-29
CN112534827B (zh) 2023-07-14
US11483565B2 (en) 2022-10-25
EP3836556A1 (en) 2021-06-16

Similar Documents

Publication Publication Date Title
JP6809471B2 (ja) 送信装置、送信方法、受信装置および受信方法
KR102561506B1 (ko) 송신 장치, 송신 방법, 수신 장치 및 수신 방법
WO2015076277A1 (ja) 送信装置、送信方法、受信装置および受信方法
EP3261352B1 (en) Transmission device, transmission method, reception device, and reception method
RU2767300C2 (ru) Высокоуровневая передача служебных сигналов для видеоданных типа "рыбий глаз"
US12120380B2 (en) Transmission apparatus, transmission method, encoding apparatus, encoding method, reception apparatus, and reception method
JP6930419B2 (ja) 画像処理装置、画像処理方法、受信装置および送信装置
EP3668102A1 (en) Transmission device, transmission method, reception device, and reception method
KR20200077517A (ko) 송신 장치, 송신 방법, 수신 장치 및 수신 방법
JP6982990B2 (ja) 送信装置、送信方法、受信装置および受信方法
US11956496B2 (en) Reception device, reception method, transmission device, and transmission method
WO2020031782A1 (ja) 受信装置、受信方法、送信装置および送信方法
WO2020039973A1 (ja) 受信装置、受信方法、送信装置および送信方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19846920

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2019846920

Country of ref document: EP

Effective date: 20210310

NENP Non-entry into the national phase

Ref country code: JP