JP7439251B2 - Adjustable tradeoff between quality and computational complexity in video codecs - Google Patents

Adjustable tradeoff between quality and computational complexity in video codecs Download PDF

Info

Publication number
JP7439251B2
JP7439251B2 JP2022522878A JP2022522878A JP7439251B2 JP 7439251 B2 JP7439251 B2 JP 7439251B2 JP 2022522878 A JP2022522878 A JP 2022522878A JP 2022522878 A JP2022522878 A JP 2022522878A JP 7439251 B2 JP7439251 B2 JP 7439251B2
Authority
JP
Japan
Prior art keywords
image
dynamic range
backward
reshaping
luminance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022522878A
Other languages
Japanese (ja)
Other versions
JP2023501885A (en
Inventor
ソーン,チーン
ラージ,アルン
スゥ,グワン-ミーン
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2023501885A publication Critical patent/JP2023501885A/en
Application granted granted Critical
Publication of JP7439251B2 publication Critical patent/JP7439251B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Description

関連出願の相互参照
本出願は、2019年10月17日に出願された米国仮特許出願第62/916,579号、および2019年10月17日に出願された欧州特許出願第19203773.7号の優先権を主張するものであり、各出願は、その全体が参照により本明細書に組み込まれる。
Cross-reference to related applications This application is based on U.S. Provisional Patent Application No. 62/916,579, filed on October 17, 2019, and European Patent Application No. 19203773.7, filed on October 17, 2019. each of which is incorporated herein by reference in its entirety.

技術
本開示は、概して画像に関する。より詳細には、本開示の一実施形態は、ビデオコーデックにおける品質と計算の複雑さとの間の調整可能なトレードオフに関する。
TECHNICAL FIELD This disclosure relates generally to images. More particularly, one embodiment of the present disclosure relates to an adjustable trade-off between quality and computational complexity in video codecs.

本明細書で使用する場合、用語「ダイナミックレンジ」(DR)は、例えば、最も暗い黒(ダーク)から最も明るい白(ハイライト)までの、画像での強度(例えば、輝度、ルマ)の範囲を知覚する人間の視覚システム(HVS)の能力に関連してもよい。この意味で、DRは「シーン基準」強度に関する。また、DRは、特定の幅の強度範囲を十分にまたは近似的にレンダリングするディスプレイデバイスの能力にも関連し得る。この意味で、DRは「ディスプレイ基準」強度に関する。本明細書の記載のいずれかの時点において、特定の意味が特定の意義を有するように明示的に規定されていない限り、この用語は、いずれの意味においても、例えば、互換的に使用され得ると推測されるべきである。 As used herein, the term "dynamic range" (DR) refers to the range of intensities (e.g., luminance, luma) in an image, e.g., from the darkest black (dark) to the brightest white (highlight). It may be related to the ability of the human visual system (HVS) to perceive. In this sense, DR relates to "scene reference" intensity. DR may also relate to the ability of a display device to fully or approximately render an intensity range of a particular width. In this sense, DR relates to "display reference" intensity. Unless a specific meaning is explicitly provided at any point in the description to have a specific meaning, the terms may be used interchangeably in either sense, e.g. It should be assumed that

本明細書で使用する場合、用語「高ダイナミックレンジ(HDR)」は、人間の視覚システム(HVS)のおよそ14~15桁以上の大きさに及ぶDR幅に関連する。実際には、人間が同時に強度範囲中の広い範囲を知覚できるDRは、HDRとの関係でいくぶん切り捨てられる可能性がある。本明細書で使用する場合、強化ダイナミックレンジ(EDR)または視覚ダイナミックレンジ(VDR)という用語は、シーンまたは画像を横切る光順応変化を許容して、目の動きを含む人間の視覚システム(HVS)によってシーンまたは画像内で知覚可能なDRに個別にまたは交換可能に関連することができる。本明細書中で使用される場合、EDRは、5~6桁の大きさのDRに関することができる。したがって、EDRは、真のシーン基準HDRとの関連ではおそらく多少狭いが、EDRは、それにもかかわらず、広いDR幅を表し、HDRと呼んでもよい。 As used herein, the term "high dynamic range (HDR)" refers to the DR width of the human visual system (HVS), which spans approximately 14-15 orders of magnitude or more. In practice, DR, which allows humans to simultaneously perceive a wide range of intensities, may be somewhat truncated in relation to HDR. As used herein, the term enhanced dynamic range (EDR) or visual dynamic range (VDR) refers to the human visual system (HVS), which allows light adaptation changes across a scene or image to include eye movements. can be individually or interchangeably related to the DR perceptible within a scene or image. As used herein, EDR can refer to 5-6 orders of magnitude DR. Therefore, although EDR is probably somewhat narrow in relation to true scene-based HDR, EDR nevertheless represents a wide DR width and may be referred to as HDR.

実際には、画像は、色空間の1つ以上の色成分(例えば、輝度Yおよび色度CbおよびCr)を含み、各色成分は、画素当たりnビットの精度(例えば、n=8)によって表される。非線形輝度コーディング(例えば、ガンマエンコーディング)を用いて、n≦8の画像(例えば、カラー24ビットJPEG画像)を標準ダイナミックレンジの画像とみなし、n>8の画像を強化ダイナミックレンジの画像とみなすことができる。 In reality, an image contains one or more color components of a color space (e.g. luminance Y and chroma Cb and Cr), each color component represented by n bits of precision per pixel (e.g. n=8). be done. Using nonlinear intensity coding (e.g., gamma encoding), images with n≦8 (e.g., color 24-bit JPEG images) are considered standard dynamic range images, and images with n>8 are considered as enhanced dynamic range images. I can do it.

所与のディスプレイのための基準電気光学伝達関数(EOTF)は、入力ビデオ信号のカラー値(例えば、輝度)とディスプレイによって生成されたスクリーンのカラー値(例えば、スクリーン輝度)との間の関係を特徴付ける。例えば、ITU Rec. ITU-R BT. 1886 「Reference electro-optical transfer function for flat panel displays used in HDTV studio production」(2011年3月)は、その全体が参照により本明細書に組み込まれているが、それはフラットパネルディスプレイのための基準EOTFを定義する。ビデオストリームが与えられた場合、そのEOTFに関する情報は(画像)メタデータとしてビットストリームに埋め込まれる可能性がある。本明細書での用語「メタデータ」は、コーディングされたビットストリームの一部として送信される任意の補助情報に関し、デコーダがデコードされた画像を描画するのを支援する。そのようなメタデータは、本明細書に記載されるように、色空間または色域情報、参照表示パラメータ、および補助信号パラメータを含み得るが、これらに限定されない。 The reference electro-optic transfer function (EOTF) for a given display describes the relationship between the color values of the input video signal (e.g., luminance) and the color values of the screen produced by the display (e.g., screen luminance). characterize. For example, ITU Rec. ITU-R BT. 1886 "Reference electro-optical transfer function for flat panel displays used in HDTV studio production" (March 2011), which is incorporated herein by reference in its entirety. It is incorporated into the EOTF standard for flat panel displays. Define. Given a video stream, information about its EOTF may be embedded in the bitstream as (image) metadata. The term "metadata" herein refers to any auxiliary information sent as part of a coded bitstream that assists a decoder in rendering the decoded image. Such metadata may include, but is not limited to, color space or gamut information, reference display parameters, and auxiliary signal parameters, as described herein.

本明細書で使用される用語「PQ」は、知覚的輝度振幅量子化を指す。人間の視覚系は、光レベルの増加に非常に非線形的に応答する。刺激を見る人間の能力は、その刺激の輝度、刺激の大きさ、刺激を構成する空間周波数、および刺激を見るときに眼が適応した輝度レベルによって影響される。いくつかの実施形態では、知覚量子化関数は、線形入力グレーレベルを、人間の視覚システムにおけるコントラスト感度しきい値により良くマッチングする出力グレーレベルにマッピングする。例示的なPQマッピング関数は、SMPTE ST 2084:2014「High Dynamic Range EOTF of Mastering Reference Displays」(以下、「SMPTE」)に記載されており、その全体が参照により本明細書に組み込まれ、ここで、一定の刺激サイズが与えられると、各輝度レベル(例えば、刺激レベルなど)について、その輝度レベルでの最小可視コントラストステップは、最も感度の高い順応レベルおよび最も感度の高い空間周波数に従って(HVSモデルに従って)選択される。 The term "PQ" as used herein refers to perceptual luminance amplitude quantization. The human visual system responds to increases in light level in a highly non-linear manner. A person's ability to see a stimulus is influenced by the brightness of the stimulus, the size of the stimulus, the spatial frequencies that make up the stimulus, and the brightness level to which the eye has adapted when viewing the stimulus. In some embodiments, the perceptual quantization function maps linear input gray levels to output gray levels that better match contrast sensitivity thresholds in the human visual system. Exemplary PQ mapping functions are described in SMPTE ST 2084:2014 “High Dynamic Range EOTF of Mastering Reference Displays” (“SMPTE”), which is incorporated herein by reference in its entirety and herein incorporated by reference. , given a fixed stimulus size, for each luminance level (e.g. stimulus level), the minimum visible contrast step at that luminance level is determined according to the most sensitive adaptation level and the most sensitive spatial frequency (HVS model ) is selected.

200~1,000cd/mまたはニトの輝度をサポートするディスプレイは、より低いダイナミックレンジ(LDR)を典型的に示しEDR (またはHDR)に関連して、標準ダイナミックレンジ(SDR)とも呼ばれる。EDRの内容は、より高いダイナミックレンジ(例えば、1000から5000ニト以上)をサポートするEDRディスプレイに表示することができる。そのようなディスプレイは、高輝度能力(例えば、0~10,000ニト以上)をサポートする代替EOTFを使用して定義され得る。そのようなEOTFの例は、SMPTE 2084およびRec. ITU-R BT.2100「Image parameter values for high dynamic range television for use in production and international programme exchange」(2017年6月)において定義される。ここでの発明者らによって高評価されるように、広範なSDRおよびHDR表示デバイスの表示能力をサポートするために使用することができるビデオコンテンツデータを構成するための改良された技術が望まれている。 Displays that support brightness between 200 and 1,000 cd/m 2 or nits typically exhibit lower dynamic range (LDR), also referred to as standard dynamic range (SDR) in conjunction with EDR (or HDR). EDR content can be displayed on an EDR display that supports higher dynamic range (eg, 1000 to 5000 nits or more). Such displays may be defined using alternative EOTFs that support high brightness capabilities (eg, 0 to 10,000 nits or more). Examples of such EOTFs are SMPTE 2084 and Rec. ITU-R BT. 2100 “Image parameter values for high dynamic range television for use in production and international program exchange” (2 (June 2017). As appreciated by the inventors herein, improved techniques for structuring video content data that can be used to support the display capabilities of a wide range of SDR and HDR display devices are desired. There is.

本セクションに記載されているアプローチは、追求でき得たアプローチであるが、必ずしも以前に考案または追求されたアプローチではない。したがって、別段の記載がない限り、本セクションに記載されているいずれのアプローチも、単に本セクションに含まれているという理由のみで先行技術であると仮定するべきではない。同様に、特に断らない限り、1つ以上のアプローチに関して特定された問題点は、本セクションに基づいていかなる先行技術においても認識されていたと仮定すべきではない。 The approaches described in this section are approaches that could be pursued, but are not necessarily approaches that have been previously devised or pursued. Therefore, unless otherwise noted, it should not be assumed that any approach described in this section is prior art simply by virtue of its inclusion in this section. Similarly, unless specifically stated, it should not be assumed that any problems identified with respect to one or more approaches were recognized in any prior art based on this section.

本発明の一実施形態が、添付の図面において、限定としてではなく例示として説明される。図面においては、同様の参照番号は同様の要素を指す。 An embodiment of the invention is illustrated by way of example, and not by way of limitation, in the accompanying drawings, in which: FIG. In the drawings, like reference numbers refer to like elements.

ビデオ配信パイプラインの例示的プロセスを示す。3 illustrates an example process of a video distribution pipeline. 再構成画像の品質と、再構成画像を作成するための生成マッピングの計算上の複雑さとの間のトレードオフの例を示す。An example of the trade-off between the quality of the reconstructed image and the computational complexity of the generative mapping to create the reconstructed image is shown. 例示的なコーデックを示す。An example codec is shown. 例示的なコーデックを示す。An example codec is shown. 例示的なコーデックを示す。An example codec is shown. 予測誤差の例を示す。An example of prediction error is shown. 異なるカラーグレードを生成するための画像処理操作のセットの例を示す。Figure 3 shows an example set of image processing operations to generate different color grades. 異なるカラーグレードに適用可能な色補正の例を示す。An example of color correction that can be applied to different color grades is shown. マッピングテーブル更新操作と関連して実行される色補正の例を示す。3 illustrates an example of color correction performed in conjunction with a mapping table update operation. 輝度更新、バックアップルックアップテーブル修正、および色補正を伴う後方再整形マッピング生成の例を示す。An example of backward reshaping mapping generation with brightness update, backup lookup table modification, and color correction is shown. 例示的なプロセスフローを示す。3 illustrates an example process flow. 例示的なプロセスフローを示す。3 illustrates an example process flow. 例示的なプロセスフローを示す。3 illustrates an example process flow. 本明細書に記載されるコンピュータまたはコンピュータデバイスが実装され得る例示的なハードウェアプラットフォームの簡略化されたブロック図を示す。1 depicts a simplified block diagram of an example hardware platform on which a computer or computing device described herein may be implemented. FIG.

実施例の説明
以下の説明において、説明の目的で、本開示の完全な理解を提供するために、多数の具体的な詳細が記載される。しかしながら、本開示は、これらの具体的な詳細なしに実施することができることは明らかであろう。他の例では、本開示を不必要に閉塞、不明瞭化、または不明確化することを避けるために、周知の構造およびデバイスは、徹底的に詳細には記載されていない。
DESCRIPTION OF THE EMBODIMENTS In the following description, numerous specific details are set forth for purposes of explanation and to provide a thorough understanding of the disclosure. However, it will be obvious that the present disclosure may be practiced without these specific details. In other instances, well-known structures and devices have not been described in exhaustive detail to avoid unnecessarily obscuring, obscuring, or obscuring the present disclosure.

比較的狭いダイナミックレンジのベースレイヤ(BL)画像データ(例えば、比較的低いビット深度、8ビット、10ビットなど)は、BL画像データからHDR画像データを生成/再構成するために使用される画像メタデータと共に、コーディングされたビットストリーム中にエンコードしてもよい。BL画像データ及び画像メタデータは、受信するデコード及び再生デバイスに提供することができ、比較的低いダイナミックレンジのディスプレイ(例えば、SDRディスプレイ等)上でデコードした後にBL画像データ(例えば、SDR画像データ等)を直接レンダリングすることができるか、あるいはデコードしたBL画像データ及び画像メタデータからHDR画像データを再構成し、比較的高いダイナミックレンジのディスプレイ(例えば、HDRディスプレイ等)上でHDR画像データをレンダリングすることができる。 Base layer (BL) image data with a relatively narrow dynamic range (e.g., relatively low bit depth, 8 bits, 10 bits, etc.) is used to generate/reconstruct HDR image data from the BL image data. It may be encoded into the coded bitstream along with metadata. The BL image data and image metadata can be provided to a receiving decoding and playback device, and the BL image data (e.g., SDR image data etc.), or reconstruct HDR image data from decoded BL image data and image metadata and display HDR image data on a relatively high dynamic range display (e.g., an HDR display). can be rendered.

一例(例えば、高忠実度等)のアプローチでは、再構成されたHDR画像データの品質は、計算コストおよびビデオ配信遅延を著しく増加させることを犠牲にして最大化され得る。別の例(例えば、高効率等)のアプローチでは、HDR画像データを再構成するために使用される画像メタデータを生成するための計算コストは、再構成されたHDR画像データの品質を著しく低下させることを犠牲にして最小化され得る。再構成されたHDR画像のレンダリングのデコーダ側品質およびエンコーダ側計算コスト(または効率)の点で、高忠実度アプローチと高効率アプローチの間には比較的大きなギャップが存在する。例示的な高忠実度および高効率画像メタデータ生成は、2019年5月9日に出願されたPCT特許出願第PCT/US2019/031620号に記載されており、その内容全体は、本明細書に完全に記載されているかのように、参照により本明細書に組み込まれる。 In one example (eg, high fidelity, etc.) approach, the quality of the reconstructed HDR image data may be maximized at the expense of significantly increasing computational cost and video delivery delay. In another example (e.g., high efficiency, etc.) approach, the computational cost of generating the image metadata used to reconstruct HDR image data significantly reduces the quality of the reconstructed HDR image data. can be minimized at the expense of allowing A relatively large gap exists between high-fidelity and high-efficiency approaches in terms of decoder-side quality and encoder-side computational cost (or efficiency) of rendering reconstructed HDR images. Exemplary high-fidelity and high-efficiency image metadata generation is described in PCT Patent Application No. PCT/US2019/031620, filed May 9, 2019, the entire contents of which are incorporated herein by reference. Incorporated herein by reference as if fully set forth.

種々のコーデック及び媒体処理システムの能力をより良く活用し、また、最大限実現可能な品質で種々の媒体消費アプリケーションをタイムリーにサポートする柔軟性をより良く提供するために、品質と計算の複雑さとの間のトレードオフを実装するコーディングツールが、前述の高忠実度及び高効率アプローチの間の比較的大きなギャップを埋めるために、本明細書に記載される技術の下で提供される。例えば、これらのコーディングツールは、再構成されたHDR画像データのデコーダ側の達成可能な品質と、再構成されたHDR画像を生成するために使用される画像メタデータを生成するエンコーダ側計算コストとの間のトレードオフを提供するために使用することができる。 quality and computational complexity in order to better utilize the capabilities of different codecs and media processing systems, and also to provide greater flexibility to support different media consuming applications in a timely manner at the highest achievable quality. Coding tools that implement trade-offs between high-fidelity and high-efficiency approaches are provided under the techniques described herein to fill the relatively large gap between the aforementioned high-fidelity and high-efficiency approaches. For example, these coding tools assess the achievable decoder-side quality of reconstructed HDR image data and the encoder-side computational cost of producing the image metadata used to generate the reconstructed HDR image. can be used to provide a trade-off between

コンテンツプロバイダおよび/またはコンテンツ消費者は、リソース予算(計算コスト予算、エンドツーエンド又は個々のシステムの待ち時間予算、エンドツーエンド又は個々の遅延予算など)および再構成されたHDR画像データの視覚的な品質目標または目的に基づいて、コーディングツールの一部または全部を選択することができる。 The content provider and/or content consumer has a resource budget (computation cost budget, end-to-end or individual system latency budget, end-to-end or individual delay budget, etc.) and a visual budget for the reconstructed HDR image data. Some or all of the coding tools can be selected based on specific quality goals or objectives.

これらのコーディングツールのいくつかまたは全ては、BL画像データ及び再構成されたHDR画像データの両方において色精度を達成するための技術を実装することができる。さらに、任意に、または代替的に、これらのコーディングツールの一部または全部は、いくつかの動作シナリオ(例えば、SDR画像データなど)で起こりやすいバンディングアーチファクトのリスクを軽減または低減する技術を実装することができる。PCT/US2019/054299に対してWO/2020/072651としても公開されている2019年8月13日に出願された米国仮特許出願第62/885,921号に記載されているようなバンディング低減をさらに改善するために、この技術を使用することができ、その全内容は、参照により本明細書に組み込まれる。 Some or all of these coding tools may implement techniques to achieve color accuracy in both BL image data and reconstructed HDR image data. Additionally, optionally or alternatively, some or all of these coding tools implement techniques that reduce or reduce the risk of banding artifacts that are likely to occur in some operating scenarios (e.g., SDR image data, etc.) be able to. Banding reduction as described in U.S. Provisional Patent Application No. 62/885,921 filed August 13, 2019, also published as WO/2020/072651 in response to PCT/US2019/054299. For further improvements, this technique can be used, the entire contents of which are incorporated herein by reference.

動的(例えば、画像依存的、画像特異的、シーン依存的、シーン特異的など)な三次元マッピングテーブル(d3DMT)のような前方マッピングテーブル(例えば、HDRコードワードを対応するSDRコードワードにマッピングするマッピング対などを含む)を使用して、前方再整形マッピング(例えば、前方再整形関数/曲線または多項式セット、前方ルックアップテーブルまたはFLUT、前方再整形多変量重回帰(MMR)係数など)を生成して、ソースHDR画像をSDR画像(またはBL画像データ)に前方再整形することができる。 Dynamic (e.g. image-dependent, image-specific, scene-dependent, scene-specific, etc.) forward mapping tables (e.g. mapping HDR codewords to corresponding SDR codewords) such as three-dimensional mapping tables (d3DMT) Forward reshaping mappings (e.g., forward reshaping functions/curves or polynomial sets, forward lookup tables or FLUTs, forward reshaping multivariate multiple regression (MMR) coefficients, etc.) A source HDR image can be generated and forward reshaped into an SDR image (or BL image data).

後方d3DMTのような後方マッピングテーブル(例えば、SDRコードワードを対応するHDRコードワードにマッピングするマッピング対などを含む)を使用して、後方再整形マッピング(例えば、後方再整形関数/曲線または多項式セット、後方ルックアップテーブルまたはBLUT、後方再整形MMR係数など)を生成して、SDR画像を、ソースHDR画像を近似するHDR画像(または再構成されたHDR画像データ)に後方再整形することができる。 A backward mapping table (e.g. containing mapping pairs mapping an SDR codeword to a corresponding HDR codeword, etc.), such as a backward d3DMT, is used to create a backward reshaping mapping (e.g. backward reshaping function/curve or polynomial set). , backward lookup table or BLUT, backward reshaping MMR coefficients, etc.) to backward reshape the SDR image into an HDR image (or reconstructed HDR image data) that approximates the source HDR image. .

前方再整形されたSDR画像および後方再整形マッピングを指定する画像メタデータは、コーディングされたビットストリーム中にエンコードされて、受信するデコード/再生デバイスが直接SDR画像をレンダリングすること、またはSDR画像および後方再整形マッピングから構築された(後方再整形された)HDRをレンダリングすることを可能にする。 Image metadata specifying the forward reshaped SDR image and the backward reshaping mapping is encoded into the coded bitstream so that a receiving decoding/playback device can directly render the SDR image or Allows to render HDR constructed from backward reshaping mappings (backward reshaping).

後方d3DMTは、対応する前方マッピングテーブル(前方d3DMT)から計算的に効率的に構築することができる。さらに、任意にまたは代替として、後方d3DMTは、ソースHDR画像および前方再整形されたSDR画像(一旦、前方再整形されたSDR画像が利用可能になると)を用いて直接構築されて、再整形マッピング精度を向上させることができる。 The backward d3DMT can be constructed computationally efficiently from the corresponding forward mapping table (forward d3DMT). Additionally, optionally or alternatively, the posterior d3DMT is constructed directly using the source HDR image and the anterior reshaped SDR image (once the anterior reshaped SDR image is available) to map the reshaped Accuracy can be improved.

本明細書に記載されるd3DMTは、後方再整形マッピングを生成するために使用される前に、色空間のすべてのチャネルまたは平面のセットにおけるチャネルまたは平面の適切なサブセットの1つで更新され得る。いくつかの動作シナリオでは、d3DMTは、色空間の輝度(または輝度)チャネル/平面のみで更新され得、それによって、BLおよび/または再構成されたHDR画像データの色精度をある程度改善する。いくつかの動作シナリオでは、d3DMTは、輝度および色度(または色度)チャネル/平面(例えば、すべてなど)で更新され得、それによって、BLおよび/または再構成されたHDR画像データの色精度を比較的有意に改善する。 The d3DMT described herein may be updated with one of the appropriate subsets of channels or planes in the set of all channels or planes of the color space before being used to generate the backward reshaping mapping. . In some operational scenarios, the d3DMT may be updated only in the luminance (or luminance) channel/plane of the color space, thereby improving the color accuracy of the BL and/or reconstructed HDR image data to some extent. In some operational scenarios, the d3DMT may be updated with luminance and chromaticity (or chroma) channels/planes (e.g., all, etc.), thereby improving the color accuracy of the BL and/or reconstructed HDR image data. relatively significantly.

従って、色精度を含むがこれに限定されない再整形マッピング精度および対応する計算コストは、前方d3DMTの輝度チャネル/平面のみを更新することによって、または前方d3DMTの輝度および色度平面の両方を更新することによって、またはソースHDR画像および前方再整形SDR画像から後方d3DMTを直接構築することによって、調整可能とすることができる。 Therefore, the reshaping mapping accuracy, including but not limited to color accuracy and corresponding computational cost, can be reduced by updating only the luma channel/plane of the forward d3DMT or by updating both the luma and chroma planes of the forward d3DMT. or by directly constructing the posterior d3DMT from the source HDR image and the anterior reshaped SDR image.

バンディングアーチファクトを軽減するために、ノイズ注入、BLUT修正などの一部または全部を実施することができる。例示的なノイズ注入および/またはBLUT修正は、前述の米国仮特許出願第62/885,921号に記載されている。 Some or all of noise injection, BLUT modification, etc. may be performed to reduce banding artifacts. Exemplary noise injection and/or BLUT modifications are described in the aforementioned US Provisional Patent Application No. 62/885,921.

輝度BLUTのような輝度後方再整形マッピングの修正/更新は、再構成HDR画像の色精度に影響を与え、再構成HDR画像の色外観の意図しない変化を引き起こす可能性があることが観察される。 It is observed that the modification/update of luminance backward reshaping mapping like luminance BLUT may affect the color accuracy of the reconstructed HDR image and cause unintended changes in the color appearance of the reconstructed HDR image. .

本明細書に記載されるような色補正操作は、再構成されたHDR画像内の色(例えば、バンディングアーチファクトを緩和した後など)がソースHDR画像内の色により近づくように、BLUT修正(例えば、バンディングアーチファクトを緩和するために使用される)によって影響を受ける画素の色を補正するために実施または実行することができる。さらに、任意または代替的に、ノイズ注入動作は、注入されたノイズをより視覚的に楽しめるように改善される。 Color correction operations as described herein include BLUT corrections (e.g., after mitigating banding artifacts) such that the colors in the reconstructed HDR image (e.g., after mitigating banding artifacts) more closely resemble the colors in the source HDR image. , used to mitigate banding artifacts) can be implemented or performed to correct the color of pixels affected by the banding artifacts. Additionally, optionally or alternatively, the noise injection operation is improved to make the injected noise more visually pleasing.

本明細書に記載する例示的な実施形態は、画像再構成のための後方再整形マッピングを生成し、及びエンコードすることに関する。後方再整形マッピングテーブルは、前方再整形マッピングテーブルの逆として初めに生成される。前方再整形テーブルは、第2のダイナミックレンジのソース画像から第1のダイナミックレンジの前方再整形画像を生成するために前方再整形マッピングを生成するために使用される。第1のダイナミックレンジは、第2のダイナミックレンジよりも低い。前方再整形マッピングテーブルは、第2のダイナミックレンジのサンプリングされた輝度コードワード、第2のダイナミックレンジのサンプリングされた色度コードワード、第2のダイナミックレンジのサンプリングされた輝度コードワードに対応する第1のダイナミックレンジのコンテンツマッピングされた輝度コードワード、及び第2のダイナミックレンジのサンプリングされた色度コードワードに対応する第1のダイナミックレンジのコンテンツマッピングされた色度コードワードを含む。後方再整形マッピングテーブルは、コンテンツマッピング輝度コードワードを前方再整形輝度コードワードで置き換えることによって更新される。前方に再構成された輝度コードワードは、第2のダイナミックレンジのサンプリングされた輝度コードワードに輝度前方マッピングを適用することによって生成される。輝度の前方マッピングは、前方再整形マッピングテーブルから構成される。後方再整形マッピングテーブルと輝度前方マッピングを用いて、第1のダイナミックレンジの前方再整形画像から第2のダイナミックレンジの再構築画像を作成するための後方再整形マッピングを生成する。前方再整形画像は、後方再整形マッピングを指定する画像メタデータと共に、ビデオ信号内にエンコードされる。ビデオ信号の受信側デバイスは、後方再整形マッピングを前方再整形画像に適用し、第2のダイナミックレンジの再構成画像を生成する。 Example embodiments described herein relate to generating and encoding backward reshaping mappings for image reconstruction. The backward reshape mapping table is initially generated as the inverse of the forward reshape mapping table. The forward reshape table is used to generate a forward reshape mapping to generate a first dynamic range forward reshape image from a second dynamic range source image. The first dynamic range is lower than the second dynamic range. The forward reshaping mapping table includes a second dynamic range sampled luma codeword, a second dynamic range sampled chroma codeword, and a second dynamic range sampled luma codeword corresponding to the second dynamic range sampled luma codeword. a content-mapped luma codeword of one dynamic range; and a content-mapped chroma codeword of a first dynamic range corresponding to a sampled chroma codeword of a second dynamic range. The backward reshaping mapping table is updated by replacing the content mapping intensity codeword with the forward reshaping intensity codeword. The forward reconstructed luminance codeword is generated by applying luminance forward mapping to the sampled luminance codeword of the second dynamic range. The brightness forward mapping consists of a forward reshaping mapping table. A backward reshaping mapping table for creating a second dynamic range reconstructed image from the first dynamic range forward reshaping image is generated using the backward reshaping mapping table and the luminance forward mapping. The forward reshaping image is encoded within the video signal along with image metadata that specifies the backward reshaping mapping. A device receiving the video signal applies the backward reshaping mapping to the forward reshaping image to generate a second dynamic range reconstructed image.

本明細書に記載される例示的な実施形態は、画像再構成およびレンダリングのための後方再整形マッピングのデコーディングに関する。第1のダイナミックレンジの前方再整形画像は、ビデオ信号からデコードされる。後方再整形マッピングを含む画像メタデータは、ビデオ信号からデコードされる。後方再整形マッピングは、後方再整形マッピングテーブルと輝度前方マッピングから上流画像処理デバイスによって生成した。後方再整形マッピングテーブルは、輝度前方マッピングを生成する前方再整形マッピングテーブルの逆数として、上流の画像処理デバイスによって最初に生成された。後方再整形マッピングテーブル中のコンテンツマッピング輝度コードワードは、前方再整形輝度コードワードで更新された。前方再整形輝度コードワードは、輝度前方マッピングをソース画像中のサンプリングされたソース輝度コードワードに適用することによって生成された。後方再整形マッピングを前方再整形画像に適用し、再構成画像を生成する。表示画像は、表示デバイスを用いて描画される再構成画像から導出される。 Example embodiments described herein relate to decoding backward reshaping mappings for image reconstruction and rendering. A first dynamic range forward reshaped image is decoded from the video signal. Image metadata including backward reshaping mapping is decoded from the video signal. The backward reshaping mapping was generated by an upstream image processing device from the backward reshaping mapping table and the luminance forward mapping. The backward reshaping mapping table was initially generated by an upstream image processing device as the inverse of the forward reshaping mapping table that generates the luminance forward mapping. The content mapping intensity codeword in the backward reshaping mapping table has been updated with the forward reshaping intensity codeword. The forward reshaped luminance codeword was generated by applying luminance forward mapping to the sampled source luminance codeword in the source image. Apply backward reshaping mapping to the forward reshape image to generate a reconstructed image. The displayed image is derived from a reconstructed image rendered using a display device.

ビデオ配信処理パイプラインの例
図1Aは、ビデオキャプチャからビデオコンテンツディスプレイまでの様々な段階を示す、ビデオ配信パイプライン(100)の例示的なプロセスを示す。一連のビデオフレーム(102)は、画像生成ブロック(105)を用いて捕捉または生成される。ビデオフレーム(102)は、ビデオデータ(107)を提供するために、デジタル的に(例えば、デジタルカメラによって)キャプチャされるか、またはコンピュータによって(例えば、コンピュータアニメーションを使用して)生成され得る。さらに、任意にまたは代替として、ビデオフレーム(102)は、フィルムカメラによってフィルム上に捕捉されてもよい。フィルムは、ビデオデータ(107)を提供するためにデジタルフォーマットに変換される。制作フェーズ(110)では、ビデオデータ(107)は、ビデオ制作ストリーム(112)を提供するように編集される。
Example Video Distribution Processing Pipeline FIG. 1A shows an example process of a video distribution pipeline (100) showing various stages from video capture to video content display. A series of video frames (102) are captured or generated using an image generation block (105). Video frames (102) may be captured digitally (eg, by a digital camera) or generated by a computer (eg, using computer animation) to provide video data (107). Further, optionally or alternatively, the video frames (102) may be captured on film by a film camera. The film is converted to digital format to provide video data (107). In the production phase (110), video data (107) is edited to provide a video production stream (112).

次に、制作ストリーム(112)のビデオデータが、制作後編集(115)のためにプロセッサに提供される。ポストプロダクション編集(115)は、ビデオ作成者の創造的意図に従って、画像の画質を向上させるか、または画像の特定の外観を達成するために、画像の特定の領域における色または輝度を調整または修正することを含んでもよい。これは、「カラータイミング」または「カラーグレーディング」と呼ばれることがある。他の編集(例えば、シーン選択およびシーケンス、手動および/または自動シーンカット情報生成、画像クロッピング、コンピュータ生成された視覚的特殊効果の追加など)は、HDR画像(117-1)またはSDR(または比較的狭いダイナミックレンジ)画像(117)のリリースバージョン(例えば、SDRなど)を生成するために、制作後編集(115)で実行され得る。いくつかの実施態様において、生産後編集(115)の間に、HDR画像(117-1)は、HDR画像(117-1)上で生産後編集操作を実行しているカラリストによって、高いダイナミックレンジをサポートする基準HDRディスプレイ上で観察される。さらに、任意に、または代替として、生産後編集(115)中に、SDR画像(117)は、SDR画像(117)上で生産後編集操作を実行しているカラリストによって、標準ダイナミックレンジ(または比較的狭いダイナミックレンジ)をサポートする参照ディスプレイ(125)上で観察される。さらに、任意にまたは代替として、SDR画像(117)は、HDR画像(117-1)からコンテンツマッピングされてもよい。 The video data of the production stream (112) is then provided to a processor for post-production editing (115). Post-production editing (115) adjusts or modifies the color or brightness in specific areas of the image to improve the quality of the image or achieve a particular look of the image, according to the creative intent of the video creator. It may also include doing. This is sometimes called "color timing" or "color grading." Other edits (e.g., scene selection and sequencing, manual and/or automatic scene cut information generation, image cropping, addition of computer-generated visual special effects, etc.) may be performed on HDR images (117-1) or SDR (or comparison Post-production editing (115) may be performed to generate a release version (e.g., SDR, etc.) of the image (117). In some embodiments, during post-production editing (115), the HDR image (117-1) is highly dynamically edited by a colorist performing post-production editing operations on the HDR image (117-1). Viewed on a reference HDR display that supports range. Additionally, optionally, or in the alternative, during post-production editing (115), the SDR image (117) is configured to have a standard dynamic range (or the reference display (125) supporting a relatively narrow dynamic range). Additionally, optionally or alternatively, the SDR image (117) may be content mapped from the HDR image (117-1).

いくつかの実施形態では、コーディングブロック(120)は、デコードされたHDR画像データのデコーダ側品質と、後方再整形マッピングのエンコーダ側の計算の複雑性との間の種々の調整可能なトレードオフの一部または全部を実装することができる。コーディングブロック(120)は、制作後編集(115)からHDR画像(117-1)を受信し、HDR画像(117-1)を(前方)再整形されたSDR画像に前方再整形する。。 In some embodiments, the coding block (120) provides various adjustable trade-offs between the decoder-side quality of the decoded HDR image data and the encoder-side computational complexity of the backward reshaping mapping. Can be implemented in part or in full. The coding block (120) receives the HDR image (117-1) from the post-production edit (115) and forwardly reshapes the HDR image (117-1) into a (forward)reformed SDR image. .

再整形されたSDR画像は、コーディングブロック(120)によって、コーディングされたビットストリーム(122)に、例えば、単一層に、圧縮/エンコードすることができる。例示的な単一層ビデオコーディング操作は、2017年3月22日に出願され、米国特許出願公開第2019/0110054号として公開された米国特許出願第16/087,241号に記載されており、その全内容は、参照により本明細書に組み込まれる。 The reshaped SDR image may be compressed/encoded by a coding block (120) into a coded bitstream (122), eg, in a single layer. Exemplary single-layer video coding operations are described in U.S. patent application Ser. The entire contents are incorporated herein by reference.

いくつかの実施形態では、コーディングブロック(120)は、コーディングされたビットストリーム(122)を生成するために、ATSC、DVB、DVD、Blu-Ray、および他の配信フォーマットによって定義されるものなどのオーディオおよびビデオエンコーダを含んでもよい。 In some embodiments, the coding block (120) is configured to generate a coded bitstream (122), such as those defined by ATSC, DVB, DVD, Blu-Ray, and other distribution formats. May include audio and video encoders.

再整形されたSDR画像は、広範なSDRディスプレイデバイス(例えば、SDRディスプレイ等)と後方互換性のあるビデオ信号(例えば、8ビットSDRビデオ信号、10ビットSDRビデオ信号等)においてビデオデータにエンコードすることができる。非限定的な例では、再整形されたSDR画像でエンコードされたビデオ信号は、単一層の後方互換性ビデオ信号であってもよい。本明細書において、「単一層の後方互換ビデオ信号」は、単一信号層におけるSDRディスプレイ用に特に最適化された、またはカラーグレード付けされたSDR画像を搬送するビデオ信号を指すことができる。 The reshaped SDR image is encoded into video data in a video signal (e.g., 8-bit SDR video signal, 10-bit SDR video signal, etc.) that is backward compatible with a wide range of SDR display devices (e.g., SDR displays, etc.) be able to. In a non-limiting example, the video signal encoded with the reshaped SDR image may be a single layer backward compatible video signal. As used herein, a "single layer backward compatible video signal" may refer to a video signal that carries an SDR image that is specifically optimized for SDR display or color graded in a single signal layer.

いくつかの実施形態では、コーディングブロック(120)によって出力されるコーディングされたビットストリーム(122)は、コーディングブロック(120)によって生成される後方再整形マッピングを含むが、これに限定されない、画像メタデータと共に出力8ビットSDRビデオ信号を表すことができる。本明細書に記載される技術の下では、後方再整形マッピング(または構成者メタデータ)は、再構成されたHDR画像データのデコーダ側品質と後方再整形マッピングのエンコーダ側の計算の複雑性との間の調整可能なトレードオフオプションの特定のセット(例えば、コーディングブロック(120)を含むエンドツーエンドの単一レイヤ後方互換性エンコーディングパイプラインのコンテンツプロバイダおよび/またはコンテンツ消費者によって作成または選択される)に基づいて生成される。 In some embodiments, the coded bitstream (122) output by the coding block (120) includes image metadata, including, but not limited to, a backward reshaping mapping produced by the coding block (120). An output 8-bit SDR video signal can be represented along with the data. Under the techniques described herein, the backward reshaping mapping (or compositor metadata) is based on the decoder-side quality of the reconstructed HDR image data and the encoder-side computational complexity of the backward reshaping mapping. A particular set of adjustable trade-off options between generated based on

後方再整形マッピングは、HDR(例えば、参照など)ディスプレイ上のレンダリングのために最適化され得る後方再整形画像を生成するために、再整形されたSDR画像上で後方再整形(例えば、逆トーンマッピングなど)を実行するために、下流のデコーダによって使用され得る。いくつかの実施形態では、後方再整形画像は、少なくとも部分的に後方再整形マッピング(または構成者メタデータ)に基づく逆トーンマッピングを実行する1つ以上のSDR-HDR変換ツールを使用して、再整形されたSDR画像(またはそのデコードされたバージョン)から生成されてもよい。本明細書で使用される、後方再整形は、再量子化された画像を元のEOTFドメイン(例えば、ガンマ、PQ、ハイブリッドログガンマまたはHLGなど)に戻し、ディスプレイ管理などのさらなる下流処理のために変換する画像処理操作を指す。例示的な後方再整形動作は、2015年3月20日に出願された米国仮出願第62/136,402号(米国特許出願公開第2018/0020224号として、2018年1月18日にも公開された)に記載されており、その内容全体は、本明細書に完全に記載されているかのように、参照により本明細書に組み込まれる。 Backward reshaping mapping involves performing backward reshaping (e.g., inverse toning) on the reshaped SDR image to produce a backward reshaping image that can be optimized for rendering on HDR (e.g., reference) displays. mapping, etc.) by a downstream decoder. In some embodiments, the backward reshaping image is processed using one or more SDR-to-HDR conversion tools that perform inverse tone mapping based at least in part on the backward reshaping mapping (or composer metadata). It may be generated from a reshaped SDR image (or a decoded version thereof). As used herein, backward reshaping returns the requantized image to its original EOTF domain (e.g., gamma, PQ, hybrid log gamma or HLG, etc.) for further downstream processing such as display management. Refers to image processing operations that convert images into images. An exemplary posterior reshaping operation is described in U.S. Provisional Application No. 62/136,402, filed March 20, 2015 (also published January 18, 2018, as U.S. Patent Application Publication No. 2018/0020224). ), the entire contents of which are incorporated herein by reference as if fully set forth herein.

さらに、任意に、または代替的に、コーディングされたビットストリーム(122)は、下流のデコーダによって使用され、HDR参照ディスプレイのための後方再整形画像上の表示管理動作を実行して、非基準HDRディスプレイなどの他のディスプレイ上のレンダリングに最適化された表示画像を生成することができる表示管理メタデータを含むが、これらに限定されない付加的な画像メタデータとともにエンコードされる。 Additionally, optionally or alternatively, the coded bitstream (122) is used by a downstream decoder to perform display management operations on the backward reshaped image for HDR reference display and to perform non-reference HDR The images are encoded with additional image metadata including, but not limited to, display management metadata that can generate display images that are optimized for rendering on other displays, such as a display.

次いで、コーディングされたビットストリーム(122)は、デコードおよび再生デバイス、メディアソースデバイス、メディアストリーミングクライアントデバイス、テレビジョンセット、セットトップボックス、映画館などの受信機に下流に送られる。受信機(または下流デバイス)において、コーディングされたビットストリーム(122)は、デコーディングブロック(130)によってデコードされ、デコードされた画像182を生成する。これは、再整形されたSDR画像と同じであってもよく、コーディングブロック(120)によって実行される圧縮およびデコーディングブロック(130)によって実行される復元において発生される量子化エラーを条件とする。 The coded bitstream (122) is then sent downstream to a receiver such as a decoding and playback device, media source device, media streaming client device, television set, set-top box, movie theater, etc. At the receiver (or downstream device), the coded bitstream (122) is decoded by a decoding block (130) to produce a decoded image 182. This may be the same as the reshaped SDR image, subject to quantization errors caused in the compression performed by the coding block (120) and the decompression performed by the decoding block (130). .

受信機が、標準ダイナミックレンジ又は標準ダイナミックレンジと同等以下の比較的狭いダイナミックレンジをサポートするターゲットディスプレイ140と共に動作する(又は取り付けられる)動作シナリオにおいて、デコーディングブロック(130)は、コーディングされたビットストリーム(122)から再整形SDR画像をデコードし、ターゲットディスプレイ(140)上のレンダリングのために、デコードされた再整形SDR画像を直接的又は間接的に使用することができる。ターゲットディスプレイ(140)がSDRリファレンスディスプレイ(125)と同様の特性を有する実施形態では、再整形されたSDR画像は、ターゲットディスプレイ(140)上で直接観察可能である。 In an operating scenario in which the receiver operates with (or is attached to) a target display 140 that supports a standard dynamic range or a relatively narrow dynamic range equal to or less than the standard dynamic range, the decoding block (130) decodes the coded bits. A reshaped SDR image can be decoded from the stream (122) and used directly or indirectly for rendering on a target display (140). In embodiments where the target display (140) has similar characteristics to the SDR reference display (125), the reshaped SDR image is directly viewable on the target display (140).

いくつかの実施形態では、受信機は、高いダイナミックレンジ(例えば、400ニト、1000ニト、4000ニト、10000ニト以上など)をサポートするHDRターゲットディスプレイ140-1と共に動作する(またはこれに取り付けられる)ことにより、コード化されたビットストリーム(122)から構成者メタデータを抽出し、後方再整形メタデータ(構成者メタデータ)を使用して、後方再整形メタデータ(構成者メタデータ)に基づいて再整形されたSDR画像を後方再整形することによって、再整形されたSDR画像から後方再整形画像132-1を作製し、後方再整形画像(132-1)を直接または間接的にHDRターゲットディスプレイ(140-1)上のレンダリングに使用することができる。 In some embodiments, the receiver operates with (or is attached to) an HDR target display 140-1 that supports high dynamic range (e.g., 400 nits, 1000 nits, 4000 nits, 10,000 nits or more). By extracting the constructor metadata from the encoded bitstream (122) and using the backward reshaping metadata (composer metadata), A backward reshaped image 132-1 is created from the reshaped SDR image by rearwardly reshaping the SDR image reshaped, and the backward reshaped image (132-1) is directly or indirectly set as an HDR target. It can be used for rendering on the display (140-1).

後方再整形画像(132-1)は、同一ではなく、HDRターゲットディスプレイ(140-1)の最大輝度値またはピーク輝度値よりも大きい値をサポートするHDRディスプレイ(例えば、基準など)上で表示するために最適化することができる。受信機、HDRターゲットディスプレイ(140-1)内、または別のデバイス内にあるディスプレイ管理ブロック(135-1など)は、HDRターゲットディスプレイ(140-1)の特性に適合したディスプレイマップ信号(137-1)を生成することにより、HDRターゲットディスプレイ(140-1)の特性に合わせて、後方再整形画像(132-1)をさらに調整する。 The backward reshaped image (132-1) is displayed on an HDR display (e.g., a reference) that is not identical and supports a value greater than the maximum or peak brightness value of the HDR target display (140-1). can be optimized for A display management block (such as 135-1) in the receiver, HDR target display (140-1), or another device generates a display map signal (137-1) adapted to the characteristics of the HDR target display (140-1). 1), the backward reshaped image (132-1) is further adjusted to match the characteristics of the HDR target display (140-1).

ビデオコーデックと品質と複雑さのトレードオフ
図1Bは、再構成されたHDR画像の品質のデコーダ側と、後方再整形マッピングの生成のエンコーダ側計算複雑性との間のトレードオフの例を示す。本明細書に記載するコーディングブロック(例えば、ビデオエンコーダ、ビデオトランスコーダ、メディアストリーミングシステム、コンテンツ提供システムなど)は、コンテンツプロバイダおよび/またはコーディングブロックを含むビデオ処理システムで動作するコンテンツ消費者によって選択される特定のトレードオフオプションのセットで構成することができる(例えば、動的に、静的に、適応的に、スケジュールされるように、独立に、など)。
Video Codecs and Quality-Complexity Tradeoffs FIG. 1B shows an example of the tradeoff between the decoder side of the quality of the reconstructed HDR image and the encoder side computational complexity of the generation of the backward reshaping mapping. The coding blocks described herein (e.g., video encoders, video transcoders, media streaming systems, content delivery systems, etc.) may be selected by content providers and/or content consumers operating on video processing systems that include the coding blocks. (e.g., dynamically, statically, adaptively, scheduled, independently, etc.).

図1Bに示すように、例示的なトレードオフは、(a)ノイズ注入、(b) BLUT修正、(c)色補正などのいずれかを可能にまたは無効にする(オンまたはオフにする)こと、ならびに(d)d3DMTを更新(または構築)する際の異なるオプションを選択することを含むが、これらに限定されるものではない。いくつかの運用シナリオでは、BLUTの修正と色補正を可能にすることで、バンディングアーチファクトを緩和し、色の外観を改善し、再構成されたHDR画像の全体的な品質を改善することができる。 As shown in Figure 1B, example tradeoffs include enabling or disabling (turning on or off) any of (a) noise injection, (b) BLUT modification, (c) color correction, etc. , and (d) selecting different options in updating (or building) the d3DMT. In some operational scenarios, enabling BLUT modification and color correction can alleviate banding artifacts, improve color appearance, and improve the overall quality of reconstructed HDR images. .

d3DMTの更新(または構築)における例示的なトレードオフオプション(例えば、コーディングブロックにおいて選択可能または調整可能)は、必ずしも限定されるものではないが、(1)d3DMTの前方への更新を行わない、(2)d3DMTの前方における輝度チャネル/平面の更新、(3)d3DMTの前方における輝度チャネル/平面および色度チャネル/平面の更新、(4)ソースHDR画像および前方再整形SDR画像に基づくd3DMTの後方の構築などを含むことができる。図1Bに示すように、これらの異なるオプションは、デコードされたHDR画像のデコーダ側品質の異なるカラーグレード、及び/又は後方再整形マッピングのエンコーダ側生成の異なる計算量(又は効率)を提供する。 Exemplary trade-off options (e.g., selectable or adjustable in coding blocks) in updating (or constructing) a d3DMT include, but are not necessarily limited to: (1) not performing a forward update of the d3DMT; (2) updating the luma channels/planes in front of the d3DMT; (3) updating the luma channels/planes and chroma channels/planes in front of the d3DMT; (4) updating the d3DMT based on the source HDR image and the forward reshaped SDR image. This can include backward construction, etc. As shown in FIG. 1B, these different options provide different color grades of decoder-side quality of the decoded HDR image and/or different complexity (or efficiency) of encoder-side generation of the backward reshaping mapping.

図2Aおよび図2Bは、エンドツーエンドビデオ配信パイプラインにおけるビデオエンコーダ(例えば、図1Aのコーディングブロック(120)など)などの例示的なビデオコーデックを示す。本明細書に記載されるようなエンドツーエンドのビデオ送達パイプライン、またはその中のデバイスは、ソフトウェア、ハードウェア、ソフトウェアとハードウェアの組み合わせなどの1つ以上のコンピューティングデバイスを備えた本明細書に示されるものよりも多くても少なくてもよい処理ブロックによって実現されてもよい。限定ではなく例示として、いくつかまたはすべての処理フローおよび/またはデータフローは、括弧内に数字またはアルファベットでマークされる。図2Aおよび図2Bに示すように、これらの処理ブロックのいずれか、一部または全部は、エンドツーエンドのビデオ配信パイプライン内のビデオコードを構成するために、選択または(例えば、コンテンツプロバイダユーザ、コンテンツコンシューマユーザなどによって)選択または作成される(例えば、図1Bに示すような)トレードオフオプションの特定のセットに応じて、任意であってもよい。 2A and 2B illustrate an example video codec, such as a video encoder (eg, coding block (120) of FIG. 1A) in an end-to-end video distribution pipeline. An end-to-end video delivery pipeline as described herein, or a device therein, comprises one or more computing devices, such as software, hardware, or a combination of software and hardware. It may be implemented with more or fewer processing blocks than those shown in this document. By way of example and not limitation, some or all processing flows and/or data flows are marked with numbers or letters in parentheses. As shown in FIGS. 2A and 2B, any, some, or all of these processing blocks may be selected or selected (e.g., by a content provider user) to configure the video code within an end-to-end video delivery pipeline. may be arbitrary, depending on the particular set of trade-off options (e.g., as shown in FIG. 1B) selected or created (e.g., by a content consumer user, etc.).

図2A及び図2Bに示すように、本明細書に記載のビデオエンコーダは、HDRからSDRへのマッピング情報を生成するための「マッピング情報」ブロック、可逆SDR画像(又は前方再整形SDR画像)を生成するための「前方再整形」ブロック、画像メタデータ(「RPU」又は「rpu」と称する)を生成するための「後方再整形」ブロックを含み、これらのブロックは、可能な限り入力又は基準HDR画像に近いHDR画像(例えば、可逆SDRから後方再整形されたもの)を再構成するために受信デバイスによって使用されるべき後方再整形マッピングを含み得る。 As shown in FIGS. 2A and 2B, the video encoder described herein uses a "mapping information" block, a reversible SDR image (or forward reshaped SDR image), to generate HDR to SDR mapping information. a "forward reshape" block for generating image metadata (referred to as "RPU" or "rpu"); It may include a backward reshaping mapping to be used by the receiving device to reconstruct an HDR image that approximates the HDR image (eg, backward reshaping from reversible SDR).

図2Aのビデオエンコーダでは、図1Bに示されるような(a)ノイズ注入、(b)BLUT修正、および(c)色補正の一部または全部を有効にすることができ、図1Bに示されるようなd3DMT更新のオプション(d)(2)または(d)(3)のうちの1つを選択することができる。前述のように、図1Bのオプション(d)(2)は、前方d3DMTにおける輝度チャネル/平面の更新(例えば、のみ)に対応し、図1Bのオプション(d)(3)は、前方d3DMTにおける輝度チャネル/平面および色度チャネル/平面の更新に対応する。 In the video encoder of Figure 2A, some or all of (a) noise injection, (b) BLUT modification, and (c) color correction as shown in Figure 1B may be enabled, as shown in Figure 1B. One of options (d)(2) or (d)(3) for d3DMT update may be selected. As mentioned above, option (d)(2) in FIG. 1B corresponds to updating (e.g. only) the luminance channel/plane in the forward d3DMT, and option (d)(3) in FIG. Corresponds to updates of luma channel/plane and chroma channel/plane.

図2Aの「マッピング情報」ブロックは、基準HDR画像からHDRカラーサンプルをサンプリング(または抽出)し、コンテンツマッピング(CM;例えば、芸術的な、またはカラリストの意図に基づいて実行される操作/動作、カラーグレーディング操作など)をこれらのHDRカラーサンプルに適用して、対応するSDRカラーサンプルなどを生成することを含む。ソースまたは基準HDR画像からHDRカラーサンプルをサンプリングするために使用されるサンプリング戦略の例には、以下のいずれかが含まれるが、これらに限定されるわけではない:基準HDR画像のすべての画素をサンプリングすること、基準HDR画像の比較的小さなセット(例えば、1/2、1/4、1/8、1/16など)をサンプリングすること、基準HDR画像の空間的寸法において均一または不均一にサンプリングすること、基準HDR画像の輝度コードワード/値の輝度分布において均一または不均一にサンプリングすること、など。 The "Mapping Information" block of FIG. 2A samples (or extracts) HDR color samples from a reference HDR image, and content mapping (CM; operations/actions performed based on artistic or colorist intent, for example). , color grading operations, etc.) to these HDR color samples to generate corresponding SDR color samples, etc. Examples of sampling strategies used to sample HDR color samples from a source or reference HDR image include, but are not limited to, any of the following: sampling, sampling a relatively small set of reference HDR images (e.g., 1/2, 1/4, 1/8, 1/16, etc.) uniformly or non-uniformly in the spatial dimensions of the reference HDR image; sampling, uniformly or non-uniformly sampling in the luminance distribution of the luminance codewords/values of the reference HDR image, etc.

マッピング情報ステージでは、少なくとも部分的にサンプリング戦略に基づいて、3Dサンプリンググリッド(例えば、直線的な3Dグリッド、疎な3Dグリッド、頂点の均一または不均一な分布/密度を有する3Dグリッドなど)を構築することができる。様々な実施形態では、サンプルポイントは、3Dサンプリンググリッドに基づいて選択されても、されなくてもよい。いくつかの実施形態において、サンプルポイントは、密度分布に基づいて選択されてもよく、例えば、サンプルポイントは、密度分布に示されるように、画像に存在する色の有無に基づいて選択されてもよい。CMは、HDRサンプルポイントから対応するSDRサンプルポイントへのコンテンツマッピング(例えば、それだけ、等)を生成するために使用され得る。コンテンツマッピングは、すべての対応するSDR画素へのすべてのHDR画素(例えば、1920x1080空間分解能の画像の場合、200万画素以上)からのコンテンツマッピングではなく、比較的少数のサンプルポイント(例えば、10,000サンプルポイントなど)でのコンテンツマッピングのセットを含むことができ、従って、すべての画素に対するすべてのコンテンツマッピングよりもずっと軽く生成することができる。 The mapping information stage constructs a 3D sampling grid (e.g., a linear 3D grid, a sparse 3D grid, a 3D grid with uniform or non-uniform distribution/density of vertices, etc.) based at least in part on the sampling strategy. can do. In various embodiments, sample points may or may not be selected based on a 3D sampling grid. In some embodiments, sample points may be selected based on a density distribution, e.g., sample points may be selected based on the presence or absence of color present in the image, as indicated by the density distribution. good. The CM may be used to generate a content mapping (eg, only, etc.) from HDR sample points to corresponding SDR sample points. Content mapping is not content mapping from all HDR pixels (e.g. 2 million pixels or more for a 1920x1080 spatial resolution image) to all corresponding SDR pixels, but rather a relatively small number of sample points (e.g. 10, 000 sample points) and can therefore be much lighter to generate than all content mappings for all pixels.

HDR(例えば、カラー、コードワードなど)サンプルおよび対応するSDR(例えば、カラー、コードワードなど)サンプルは、前方d3DMT(例えば、多次元マッピングテーブル、ヒストグラムなど)を構築または生成するサンプルとして使用されるマッピング対を形成するために使用される。図2Aの「マッピング情報」ブロックは、さらに、文字ボックスがHDR画像内に存在するか否か、存在する場合には、文字ボックスの画素値を含むが、これらに限定されない、HDR画像からの文字ボックス情報を収集することを含んでもよい。 HDR (e.g., color, codeword, etc.) samples and corresponding SDR (e.g., color, codeword, etc.) samples are used as samples to construct or generate forward d3DMT (e.g., multidimensional mapping table, histogram, etc.) Used to form mapping pairs. The "Mapping Information" block of FIG. 2A further includes information on whether the character box is present in the HDR image and, if so, the pixel values of the character box. It may include collecting box information.

ビデオエンコーダは、PCT/US2019/031620に記載されているように、高効率低減基準(HERR)コーデックアーキテクチャを実装して、計算の複雑さを低減することができる。マッピング側の情報(マッピングサイド情報)-個々の画素の画素値(例えば、全て、実質的に全て、等々)を含む基準SDR画像の代わりに-が、マッピング情報ステージからビデオエンコーダの前方再整形ステージ、後方再整形ステージ等のその後の処理ステージへ送られることができる。HERRエンコード動作では、ソース(または基準)HDR画像とソース(または基準)HDR画像に関連するマッピング側の情報とを後の処理段階で使用して、前方再整形関数(例えば、FLUT、MMR係数など)を構築し、前方再整形関数に基づいてソースHDR画像を前方に再整形することによって(前方)再整形されたSDR画像を生成し、ソースHDR画像を近似する再構成されたHDR画像を生成するために、受信デバイス(または受信者ビデオデコーダ)によって使用される後方再整形画像メタデータを生成し、SLBCビデオ信号内の後方再整形画像メタデータとともに、再整形されたSDR画像をエンコードする。いくつかの運用シナリオでは、マッピング側の情報は、完全参照(フルリファレンス)SDR画像で表されるものと比較して、色の数を減らすことができる。 A video encoder may implement a High Efficiency Reduction Reference (HERR) codec architecture to reduce computational complexity, as described in PCT/US2019/031620. Mapping side information - instead of a reference SDR image containing pixel values of individual pixels (e.g. all, substantially all, etc.) - is transferred from the mapping information stage to the forward reshaping stage of the video encoder. , to a subsequent processing stage, such as a posterior reshaping stage. In a HERR encoding operation, the source (or reference) HDR image and the mapping side information related to the source (or reference) HDR image are used in a later processing step to perform a forward reshaping function (e.g., FLUT, MMR coefficients, etc.). ) and generate a (forward) reshaped SDR image by forwardly reshaping the source HDR image based on a forward reshaping function, and generate a reconstructed HDR image that approximates the source HDR image. generate backward reshaped image metadata for use by a receiving device (or receiver video decoder) to encode the reshaped SDR image along with the backward reshaped image metadata in the SLBC video signal. In some operational scenarios, the information on the mapping side can reduce the number of colors compared to what is represented in a full reference SDR image.

PCT/US2019/031620に記載されている高忠実度フルリファレンス(HFFR)モードでは、基準SDR画像は、ソースHDR画像の各画素にコンテンツマッピング(カラーマッピングなど)を適用することによって生成され、色度前方再整形のためのd3DMTを構築するために使用される。HFFRモードでは、基準SDR画像はSLBCビデオ信号にエンコードされず、色度前方再整形のためのd3DMTを構築するための近似基準として働く。従って、HFFRモードでは、各個々の画素レベル(例えば、画像中の百万画素の各々)で実行される多くのエンコーディング関連操作がある。 In High Fidelity Full Reference (HFFR) mode, described in PCT/US2019/031620, a reference SDR image is generated by applying content mapping (e.g. color mapping) to each pixel of the source HDR image, and the chromaticity Used to construct d3DMT for anterior reshaping. In HFFR mode, the reference SDR image is not encoded into the SLBC video signal and serves as an approximate reference for constructing the d3DMT for chromatic forward reshaping. Therefore, in HFFR mode, there are many encoding-related operations performed at each individual pixel level (eg, each of the million pixels in the image).

対照的に、PCT/US2019/031620に記載されているHERRモードでは、d3DMTは、各個々の画素レベルで完全参照SDR画像を生成又は操作することなく、低減された数の点(例えば、10,000点、100万点よりはるかに少ない点など)で、コンテンツマッピング情報(例えば、カラーマッピング情報など)のようなマッピング側の情報から生成することができる。その結果、大量の計算または関連する演算を節約または回避することができる。 In contrast, in the HERR mode described in PCT/US2019/031620, d3DMT generates a reduced number of points (e.g., 10, 000 points, much less than 1 million points, etc.) and can be generated from information on the mapping side, such as content mapping information (eg, color mapping information, etc.). As a result, large amounts of computation or related operations can be saved or avoided.

フルリファレンスモードの場合と同様に、縮小リファレンスモードのマッピング情報段階でマッピング側の情報を生成するために、ソースHDR画像(フレームtと称する)中のコードワードは、各カラーチャネルについて、そのような各チャネルの最小および最大コードワード値に基づいてQ個のビンに分割することができる。全体として、

Figure 0007439251000001
個の3Dビンがある。正規化されていない最小コードワード値を、
Figure 0007439251000002
と示し、正規化されていない最大コードワード値を、
Figure 0007439251000003
と示し、ここで
Figure 0007439251000004
である。ビン
Figure 0007439251000005
の範囲は次のように表される。
Figure 0007439251000006
ここで、
Figure 0007439251000007
であり、
Figure 0007439251000008
であり、
Figure 0007439251000009
はHDR(またはEDR)のビット深度である。 As in the full reference mode, to generate the mapping side information in the mapping information stage of the reduced reference mode, the codewords in the source HDR image (referred to as frame t) are It can be divided into Q bins based on the minimum and maximum codeword values for each channel. as a whole,
Figure 0007439251000001
There are 3D bins. The minimum unnormalized codeword value is
Figure 0007439251000002
, and the maximum unnormalized codeword value is
Figure 0007439251000003
and here
Figure 0007439251000004
It is. bottle
Figure 0007439251000005
The range of is expressed as follows.
Figure 0007439251000006
here,
Figure 0007439251000007
and
Figure 0007439251000008
and
Figure 0007439251000009
is the HDR (or EDR) bit depth.

HDR画素値(またはコードワード値)に対する3Dヒストグラム(

Figure 0007439251000010
として示される)は、ビンインデックス
Figure 0007439251000011
によって指定される3Dヒストグラム内の各3Dビンとともに収集される。各3DビンにおけるHDR画素値のチャネル固有の和(
Figure 0007439251000012
として示される)がそれぞれ計算される。(3Dヒストグラム
Figure 0007439251000013
非ゼロの画素数を有する空でないビンについては、チャネル固有の平均HDR画素値(またはコードワード値)(
Figure 0007439251000014
として示される)は、それぞれ、すべてのカラーチャネルについて計算することができ、空でないビンに表されるHDR画素値についてのマッピングされたSDR画素値は、それぞれ、すべてのカラーチャネルについての平均HDR画素値におけるコンテンツマッピングを用いて決定または計算することもできる。
Figure 0007439251000015
をKt個のビンとして示し、ここで、
Figure 0007439251000016
である。マッピングされたSDR画素値を
Figure 0007439251000017
として示し、チャネル固有の平均HDR画素値
Figure 0007439251000018
およびマッピングされたSDR画素値
Figure 0007439251000019
などのマッピング統計を収集するための例示的な手順を、下記の表1に示す。
Figure 0007439251000020
Figure 0007439251000021
Figure 0007439251000022
3D histogram (
Figure 0007439251000010
) is the bin index
Figure 0007439251000011
is collected with each 3D bin in the 3D histogram specified by . Channel-specific sum of HDR pixel values in each 3D bin (
Figure 0007439251000012
) are calculated respectively. (3D histogram
Figure 0007439251000013
For non-empty bins with non-zero number of pixels, the channel-specific average HDR pixel value (or codeword value) (
Figure 0007439251000014
) can be computed for all color channels, respectively, and the mapped SDR pixel values for HDR pixel values represented in non-empty bins are the average HDR pixel values for all color channels, respectively. It can also be determined or calculated using content mapping in values.
Figure 0007439251000015
is denoted as Kt bins, where
Figure 0007439251000016
It is. The mapped SDR pixel value
Figure 0007439251000017
and the channel-specific average HDR pixel value
Figure 0007439251000018
and the mapped SDR pixel value
Figure 0007439251000019
An exemplary procedure for collecting mapping statistics such as is shown in Table 1 below.
Figure 0007439251000020
Figure 0007439251000021
Figure 0007439251000022

上記の表1に見られるように、フルリファレンスモードとは異なり、縮小リファレンスモードにおけるマッピングされたSDR画素値は、参照SDR画像における個々のSDR画素値を平均する代わりに、サンプリングされたポイントにおけるHDR画素値にコンテンツマッピング(カラーマッピングなど)を適用することによって得られる。このようなコンテンツマッピングは、d3DMTを表す3Dヒストグラム

Figure 0007439251000023
の非ゼロのビンにのみ適用される可能性がある。サンプリングされたHDR及びSDRコードワード統計
Figure 0007439251000024
を含む3Dヒストグラム
Figure 0007439251000025
によって表されるd3DMTは、ヒストグラム
Figure 0007439251000026
と共に、マッピング情報ステージから前方再整形ステージ及び/又は後方再整形ステージへのマッピング側情報として送られ、前方再整形ステージ及び後方再整形ステージにおける前方及び後方再整形関数を構築するために使用され得る。 As seen in Table 1 above, unlike the full reference mode, the mapped SDR pixel values in the reduced reference mode are calculated using the HDR pixel values at the sampled points instead of averaging the individual SDR pixel values in the reference SDR image. Obtained by applying content mapping (such as color mapping) to pixel values. Such content mapping is a 3D histogram representing d3DMT.
Figure 0007439251000023
May only apply to non-zero bins. Sampled HDR and SDR codeword statistics
Figure 0007439251000024
3D histogram including
Figure 0007439251000025
The d3DMT represented by the histogram
Figure 0007439251000026
and may be sent as mapping side information from the mapping information stage to the forward reshaping stage and/or the backward reshaping stage and used to construct the forward and backward reshaping functions in the forward reshaping stage and the backward reshaping stage. .

図2Aの「前方再整形」ブロックは、前方d3DMTを用いて、前方d3DMTから得られたHDR輝度サンプル(例えば、HDRサンプルの輝度成分など)およびSDR輝度サンプル(例えば、対応するSDRサンプルの輝度成分など)の輝度ヒストグラムを構築し、累積密度関数(CDF)マッチングを適用して、輝度チャネル/プレーンなどのための前方ルックアップテーブル(FLUT)を形成または生成することを含む。例示的なCDFマッチング操作は、2017年9月11日に出願されたPCT出願第PCT/US2017/50980号、2016年10月5日に出願された米国仮出願第62/404,307号(米国特許出願公開第2018/0098094号として2018年4月5日にも公開されている)に記載されており、その全内容は、参照により本明細書に組み入れられる。 The "forward reshaping" block of FIG. 2A uses the forward d3DMT to analyze the HDR luminance samples (e.g., the luminance components of the HDR samples) obtained from the forward d3DMT and the SDR luminance samples (e.g., the luminance components of the corresponding SDR samples). etc.) and applying cumulative density function (CDF) matching to form or generate forward look-up tables (FLUTs) for the luminance channels/planes, etc. Exemplary CDF matching operations include PCT Application No. PCT/US2017/50980, filed on September 11, 2017; (also published on April 5, 2018 as Patent Application Publication No. 2018/0098094), the entire contents of which are incorporated herein by reference.

いくつかの実施形態では、CDFマッチングを使用して、前方再整形ルックアップテーブルを構築することができる。1D輝度ヒストグラムは、ソースHDR画像および各未サンプリングレベルの基準SDR画像からではなく、サンプリングポイント(例えば、HDRおよびSDR画像フレームの各々におけるサンプリンググリッドなど)におけるソースHDRコードワード値およびSDRコードワード値から生成されたd3DMTを使用して構築されてもよい。d3DMTを表す3Dヒストグラムは、マッピング情報ステージからマッピング側の情報で既に利用可能であるため、前方変更ステージは、輝度値が1D輝度ヒストグラムの同じ輝度ビンに対応する3Dヒストグラムのすべての3Dビンを合計することによって、1D輝度ヒストグラムを構築することができる。 In some embodiments, CDF matching may be used to construct a forward reshaping lookup table. The 1D intensity histogram is generated from source HDR codeword values and SDR codeword values at sampling points (e.g., sampling grids in each of the HDR and SDR image frames), rather than from the source HDR image and the reference SDR image at each unsampled level. It may be constructed using the generated d3DMT. Since the 3D histogram representing the d3DMT is already available in the mapping side information from the mapping information stage, the forward modification stage sums all 3D bins of the 3D histogram whose luminance values correspond to the same luminance bin of the 1D luminance histogram. By doing so, a 1D brightness histogram can be constructed.

CDFマッチングは、1D輝度ヒストグラムに基づいて補間FLUTを生成するために、CDFマッチングブロックによって実行され得る。補間されたFLUTは、平滑化されたFLUTを生成するために平滑化されてもよい。さらに、後方再整形LUT(BLUT)は、平滑化されたFLUTに表されるコードワードマッピングまたは曲線(例えば、8ピースの2次多項式など)を使用して、BLUT構成ブロック456によって構成されてもよい。 CDF matching may be performed by a CDF matching block to generate an interpolated FLUT based on the 1D intensity histogram. The interpolated FLUT may be smoothed to produce a smoothed FLUT. Additionally, a backward reshaping LUT (BLUT) may be constructed by the BLUT construction block 456 using a codeword mapping or a curve (e.g., an 8-piece quadratic polynomial, etc.) represented in the smoothed FLUT. good.

異なる計算コストを伴う1D輝度ヒストグラムを構築するための2つの例示的な方法または手順は、以下の表2および3に示されている。表2に示す第1の方法では、各ビンの重心が計算される。CDFマッチングは、セントロイドを使用して実行される。これは、比較的高コストの計算を必要とするが、比較的高精度のマッピングを生成する。表3に示す第2の方法では、各ビンは、その中間点で表され、これは、比較的低コストの計算で容易に決定することができる。2つの方法を以下に示す。

Figure 0007439251000027
Figure 0007439251000028
Figure 0007439251000029
Figure 0007439251000030
Figure 0007439251000031
Figure 0007439251000032
Two exemplary methods or procedures for constructing 1D intensity histograms with different computational costs are shown in Tables 2 and 3 below. In the first method, shown in Table 2, the centroid of each bin is calculated. CDF matching is performed using centroids. This requires relatively expensive computation, but produces a relatively accurate mapping. In the second method, shown in Table 3, each bin is represented by its midpoint, which can be easily determined with relatively low cost calculations. Two methods are shown below.
Figure 0007439251000027
Figure 0007439251000028
Figure 0007439251000029
Figure 0007439251000030
Figure 0007439251000031
Figure 0007439251000032

いくつかの運用シナリオでは、ブロック標準偏差(「BLKSTD」と表記)がHDR画像から計算される。バンディングアーチファクトのリスクは、BLKSTD(HDR画像から計算)およびFLUT(CDFマッチングで作成)から推定される。HDR画像のバンディングアーチファクトおよび/または輝度レベルのリスクに依存するノイズは、HDR画像の暗部またはHDR輝度チャネル/平面のサブレンジに(「(a)ノイズ注入」サブブロックで)注入されることがある。 In some operational scenarios, block standard deviation (denoted "BLKSTD") is calculated from HDR images. The risk of banding artifacts is estimated from BLKSTD (calculated from HDR images) and FLUT (created with CDF matching). Banding artifacts and/or noise depending on the risk of brightness levels of the HDR image may be injected (in the "(a) Noise injection" sub-block) into the dark areas of the HDR image or into subranges of the HDR brightness channels/planes.

例示的なブロック標準偏差計算およびバンディングアーチファクトリスク推定は、米国特許第10,032,262号に記載されており、その全体の内容は、本明細書に完全に記載されているかのように、参照により本明細書に組み込まれる。 Exemplary block standard deviation calculations and banding artifact risk estimation are described in U.S. Pat. No. 10,032,262, the entire contents of which are incorporated herein by reference. incorporated herein by.

さらに、レターボックス操作は、レターボックス処理操作を実行して、基準HDR画像内に存在し得る任意のレターボックスを処理して、前方に再整形されたSDR画像および/または再構成されたHDR画像内の正確な色を確実にするのを助けることができる。レターボックス処理操作の例は、前述のPCT特許出願第PCT/US2019/031620号に記載されている。 Additionally, the letterboxing operation performs a letterboxing operation to process any letterboxing that may be present in the reference HDR image to forward the reshaped SDR image and/or the reconstructed HDR image. We can help ensure accurate colors within. Examples of letterboxing operations are described in the aforementioned PCT Patent Application No. PCT/US2019/031620.

HDR画像のディザリングされた(またはノイズ注入された)HDR輝度チャネル/プレーンにFLUTを適用することにより、対応する前方再整形SDR画像のBL輝度チャネル/プレーン/コンポーネントを生成することができる。 By applying a FLUT to the dithered (or noise-injected) HDR luminance channels/planes of the HDR image, the BL luminance channels/planes/components of the corresponding forward reshaped SDR image can be generated.

HDR画像のHDR色度チャネル/平面に前方MMR係数を適用することにより、対応する前方再整形SDR画像のBL色度チャネル/平面/コンポーネントを生成することができる。前方MMR係数(色度前方再整形マッピングを表す)は、前方d3DMTおよび文字ボックス情報から計算することができる。 By applying the forward MMR coefficients to the HDR chroma channels/planes of the HDR image, the BL chroma channels/planes/components of the corresponding forward reshaped SDR image can be generated. Forward MMR coefficients (representing chromatic forward reshaping mapping) can be calculated from the forward d3DMT and character box information.

マッピング情報ステージからのd3DMTは、前方再整形ステージにおける無制約MMRマトリックス構築によって受信され得る。無制約最小二乗問題は、ソースHDR画像内の色度コードワード(該当する場合、任意のレターボックスソースHDR色度コードワードを含む)を再整形SDR画像内の再整形色度コードワード(該当する場合、任意のレターボックスリ成形SDR色度コードワードを含む)に転送するために使用されるMMR係数を解くために定式化することができる。 The d3DMT from the mapping information stage may be received by unconstrained MMR matrix construction in the forward reshaping stage. The unconstrained least squares problem combines the chroma codewords in the source HDR image (including any letterboxed source HDR chroma codewords, if applicable) with the reshaped chroma codewords in the reshaped SDR image (including any letterboxed source HDR chroma codewords, if applicable). can be formulated to solve for the MMR coefficients used to transfer any letterbox-reformed SDR (including chroma codewords).

マッピングサイド情報で提供されるd3DMTから、2つのベクトルは、d3DMTを表す3Dヒストグラムの非ゼロのビン(または空でないビン)のSDR色度値を用いて、以下のように構成することができる:

Figure 0007439251000033
From the d3DMT provided in the mapping side information, two vectors can be constructed as follows using the SDR chroma values of the non-zero (or non-empty) bins of the 3D histogram representing the d3DMT:
Figure 0007439251000033

さらに、以下のように、非ゼロのビンの平均HDR画素値を用いて行列を構成することができる:

Figure 0007439251000034
ここで、
Figure 0007439251000035
これには、サポートされるすべてのMMR項が含まれている。 Additionally, a matrix can be constructed using the average HDR pixel values of non-zero bins as follows:
Figure 0007439251000034
here,
Figure 0007439251000035
This includes all supported MMR terms.

以下の関係式が成り立つとする。

Figure 0007439251000036
Assume that the following relational expression holds.
Figure 0007439251000036

無制約のMMR係数は、次のように、無制約のMMR行列を用いて無制約の最小二乗問題を解くことによって、閉じた形で得られる:

Figure 0007439251000037
The unconstrained MMR coefficients are obtained in closed form by solving an unconstrained least squares problem with the unconstrained MMR matrix as follows:
Figure 0007439251000037

図2Aの「後方再整形」ブロックは、前述のPCT特許出願第PCT/US2019/031620号に記載されたヒストグラム強調BLUT構築法のようなヒストグラムベースの方法を用いて、FLUTから輝度チャネル/平面に対する後方ルックアップテーブルを構築し、BLUT修正(「(b)」と称する)を実行して、前方再整形されたSDR画像の後方再整形から生成された再構築されたHDR画像におけるバンディングアーチファクトのリスクを軽減または低減する。 The "backwards reshaping" block of FIG. 2A uses a histogram-based method, such as the histogram-enhanced BLUT construction method described in the aforementioned PCT patent application no. Build a backward lookup table and perform BLUT correction (referred to as "(b)") to reduce the risk of banding artifacts in the reconstructed HDR image generated from backward reshaping of the forward reshape SDR image reduce or reduce

図2Aの「前方再整形」ブロックによって生成されたFLUTおよび前方MMR係数は、(「(d)d3DMT更新」サブブロックにおいて)前方d3DMTから生成された後方d3DMTの(例えば、逆等としての)輝度および/または色度チャネル/平面におけるSDRコードワード/サンプルを更新するために使用される。修正されたBLUT(「(b)BLUT修正」サブブロックで生成された)は、「(c)色補正」サブブロックで使用され、色を修正するために、後方d3DMT内のHDR色度コードワード(例えば、値、サンプルなど)を修正し、それによって、再構成されたHDR画像の色の外観を改善する。後方再整形MMR係数は、更新された後方d3DMTと文字ボックス情報から計算することができる。 The FLUT and forward MMR coefficients generated by the "Forward Reshaping" block of FIG. and/or used to update SDR codewords/samples in chroma channels/planes. The modified BLUT (generated in the "(b) BLUT modification" sub-block) is used in the "(c) Color correction" sub-block to modify the HDR chroma codeword in the backward d3DMT. (e.g., values, samples, etc.), thereby improving the color appearance of the reconstructed HDR image. The backward reshaping MMR coefficient can be calculated from the updated backward d3DMT and character box information.

d3DMTは、後方再整形ステージにおける無制約MMRマトリックス構成によって受信され得る。無制約最小二乗問題は、再構成されたSDR画像内の色度コードワード(該当する場合、レターボックス再構成されたSDR色度コードワードを含む)を再構成されたHDR画像内の色度コードワード(該当する場合、レターボックス再構成されたHDR色度コードワードを含む)に戻すために使用されるMMR係数を解くために定式化され得る。 The d3DMT may be received by an unconstrained MMR matrix configuration in the backward reshaping stage. The unconstrained least squares problem combines the chromaticity codewords in the reconstructed SDR image (including the letterboxed SDR chromaticity codeword, if applicable) with the chromaticity code in the reconstructed HDR image. can be formulated to solve for the MMR coefficients used to restore the word (including the letterbox reconstructed HDR chroma codeword, if applicable).

d3DMTから、d3DMTを表す3Dヒストグラムの非ゼロのビン(または空でないビン)の平均HDR色度値を用いて、2つのベクトルを次のように構成することができる:

Figure 0007439251000038
From the d3DMT, two vectors can be constructed using the average HDR chroma values of the non-zero (or non-empty) bins of the 3D histogram representing the d3DMT as follows:
Figure 0007439251000038

さらに、以下のように、非ゼロのビンのSDR画素値を用いて行列を構成することができる:

Figure 0007439251000039
ここで、
Figure 0007439251000040
これには、サポートされるすべてのMMR項が含まれている。 Additionally, a matrix can be constructed using the SDR pixel values of non-zero bins as follows:
Figure 0007439251000039
here,
Figure 0007439251000040
This includes all supported MMR terms.

以下の関係式が成り立つとしよう。

Figure 0007439251000041
Figure 0007439251000042
Suppose that the following relational expression holds.
Figure 0007439251000041
Figure 0007439251000042

無制約のMMR係数は、次のように、無制約のMMR行列を用いて無制約の最小二乗問題を解くことによって、閉じた形で得られる:

Figure 0007439251000043
The unconstrained MMR coefficients are obtained in closed form by solving an unconstrained least squares problem with the unconstrained MMR matrix as follows:
Figure 0007439251000043

BLUTと後方再整形MMR係数を含む(または指定する)後方再整形マッピングは、再整形されたSDR画像に付随する画像メタデータ(例えば、「rpu」など)の一部として、コード化されたビットストリームに出力されてもよい。 The backward reshape mapping, which includes (or specifies) the BLUT and the backward reshape MMR coefficients, is a bit coded as part of the image metadata (e.g., "rpu", etc.) that accompanies the reshaped SDR image. May be output to a stream.

図1Bに示すいくつかの又は全てのトレードオフオプションの各々は、復号化されたHDR画像のデコーダ側品質とエンコーダ側計算コストとの間の特定の調整可能なトレードオフを達成するために、ビデオエンコーダを構成するように個別に選択又は作製することができる。第1のトレードオフオプションは、図2Aの処理サブブロック(a)を保持/除去することによって、ノイズ注入を有効/無効にするために行われてもよい。第2のトレードオフオプションは、図2Aの処理サブブロック(b)を保持/除去することによって、BLUT変更を有効/無効にするために行うことができる。第3のトレードオフオプションは、図2Aの処理サブブロック(c)を保持/除去することによって、色補正を有効/無効にするようにすることができる。d3DMT更新に関して、いくつかのトレードオフオプションを行うことができる。例えば、図2Aの処理サブブロック(d)を有効/無効にするために、第4のトレードオフオプションを行うことができる。第5のトレードオフオプションは、図2Aのデータフロー(2)および処理サブブロック(d)を維持するために行われてもよい。第6のトレードオフオプションは、図2Aのデータフロー(3)および処理サブブロック(d)を維持するために行われてもよい。 Each of some or all of the trade-off options shown in FIG. They can be individually selected or fabricated to configure the encoder. A first trade-off option may be made to enable/disable noise injection by retaining/removing processing subblock (a) of FIG. 2A. A second trade-off option can be made to enable/disable BLUT modification by retaining/removing processing subblock (b) of FIG. 2A. A third trade-off option may be to enable/disable color correction by retaining/removing processing sub-block (c) of FIG. 2A. Several trade-off options can be made regarding d3DMT updates. For example, a fourth trade-off option can be made to enable/disable processing sub-block (d) of FIG. 2A. A fifth trade-off option may be made to preserve data flow (2) and processing sub-block (d) of FIG. 2A. A sixth trade-off option may be made to preserve data flow (3) and processing sub-block (d) of FIG. 2A.

第7のトレードオフオプションが図2Bに示されている。このオプションの下では、後方再整形マッピングを生成するために使用される後方d3DMTは、基準HDR画像と、図2Bの(4)として示されるデータフローで提供される前方再整形SDR画像とから構成される。 A seventh trade-off option is shown in Figure 2B. Under this option, the backward d3DMT used to generate the backward reshaping mapping consists of the reference HDR image and the forward reshaping SDR image provided in the data flow shown as (4) in Figure 2B. be done.

要約すると、本明細書に記載されるような調整可能なトレードオフ技術は、後方再整形マッピングを生成し、ビデオコーデック間のエンドツーエンドビデオ配信をサポートするために使用され得る。エンコーダ側の計算リソースの利用可能性に従い、再構成されたHDR画像のデコーダ側の最適な品質を達成するために、ビデオエンコーダを構成するために、様々なトレードオフオプションを選択または作成することができる。 In summary, adjustable tradeoff techniques as described herein may be used to generate backward reshaping mappings and support end-to-end video delivery between video codecs. According to the availability of computational resources on the encoder side, various trade-off options can be selected or made to configure the video encoder to achieve the optimal quality on the decoder side of the reconstructed HDR image. can.

エンコーダ側および/またはデコーダ側の計算リソースの利用可能性は、特定の調整可能なトレードオフオプションを選択または作成するために(例えば、動的に、静的に、適応的に、など)使用され得る。本明細書に記載の例示的な計算リソースには、CPU消費量、DSP処理能力、メモリサイズ、キャッシュ、データストア、ネットワークリソース、レイテンシー、エンドツーエンドビデオ配信パイプラインの遅延などが含まれるが、これらに限定されない。 The availability of computational resources on the encoder side and/or the decoder side is used (e.g., dynamically, statically, adaptively, etc.) to select or create certain adjustable trade-off options. obtain. Exemplary computational resources described herein include CPU consumption, DSP processing power, memory size, cache, data stores, network resources, latency, end-to-end video delivery pipeline delay, etc. Not limited to these.

図2Cは、ビデオデコーダ(例えば、図1Aのデコーディングブロック(130)など)のような例示的なビデオコーデックを示し、これは、下流のビデオデコーダ(例えば、受信機など)内の1つ以上のコンピューティングプロセッサで実装することもできる。 FIG. 2C shows an example video codec, such as a video decoder (e.g., decoding block (130) of FIG. 1A), that may be used in one or more downstream video decoders (e.g., a receiver, etc.). It can also be implemented with several computing processors.

図2Cに示すようないくつかの動作シナリオでは、単一層144内の(前方)再整形されたSDR画像及び画像メタデータ152によって符号化されたビデオ信号は、ビデオデコーダによる入力として、必ずしも上流のビデオエンコーダによって生成された後方整形マッピングのみを含むが、これに限定されない。 In some operating scenarios, such as shown in FIG. 2C, the video signal encoded by the (forward) reshaped SDR image and image metadata 152 in the single layer 144 is not necessarily used as input by the video decoder upstream. Including, but not limited to, backward shaping mappings generated by video encoders.

復元ブロック154(例えば、図1Aの解読ブロック(130)の一部など)は、ビデオ信号の単一層(144)内の圧縮ビデオデータを解読SDR画像(182)に解読/解読する。デコードされたSDR画像(182)は、コーディングブロック(120)および復元ブロック(154)における量子化誤差に従い、再整形されたSDR画像と同一であってもよく、これはSDRディスプレイデバイスに対して最適化されていた可能性がある。デコードされたSDR画像(182)は、出力SDRビデオ信号156に出力され、SDRディスプレイデバイスにレンダリングされる。 The decompression block 154 (eg, part of the decoding block (130) of FIG. 1A) decodes/decodes compressed video data within a single layer (144) of the video signal into a decoded SDR image (182). The decoded SDR image (182) may be identical to the reshaped SDR image, subject to quantization errors in the coding block (120) and restoration block (154), which is optimal for SDR display devices. It is possible that it may have been morphed. The decoded SDR image (182) is output to an output SDR video signal 156 and rendered to an SDR display device.

さらに、後方再整形ブロック158は、入力ビデオ信号から後方再整形マッピングを抽出し、画像メタデータ(152)において抽出された後方再整形マッピングに基づく最適後方再整形関数を構築し、再構築HDR画像(例えば、後方再整形HDR画像、図1Aの132-1、HDR参照画像の近似など)を生成するために、最適後方再整形関数に基づく再整形SDR画像に対する後方再整形操作を実行する。 Further, a backward reshaping block 158 extracts a backward reshaping mapping from the input video signal, constructs an optimal backward reshaping function based on the extracted backward reshaping mapping in the image metadata (152), and generates a reconstructed HDR image. A backward reshaping operation is performed on the reshaped SDR image based on the optimal backward reshaping function to generate a backward reshaped HDR image (eg, 132-1 of FIG. 1A, approximation of the HDR reference image, etc.).

いくつかの実施態様において、後方再整形されたHDR画像は、HDRターゲット/リファレンス表示デバイスに対して最適化された、生産品質又は生産品質に近いHDR画像を表す。後方再整形されたHDR画像は、出力HDRビデオ信号160に出力され、HDRディスプレイデバイスにレンダリングされる。一部の動作では、DMは、コストまたは待ち時間を低減するために受信機に実装されない場合がある。 In some implementations, the backward reshaped HDR image represents a production quality or near production quality HDR image that is optimized for an HDR target/reference display device. The backward reshaped HDR image is output to an output HDR video signal 160 and rendered to an HDR display device. In some operations, DM may not be implemented at the receiver to reduce cost or latency.

さらに、任意に、または代替として、いくつかの動作シナリオにおいて、DMメタデータは、画像メタデータ(152)および再整形されたSDR画像内で受信機に送信され得る。HDR表示デバイスに特有の表示管理動作は、画像メタデータ(152)内のDMメタデータに少なくとも部分的に基づいて、例えば、HDR表示デバイス上にレンダリングされるHDR表示画像を生成するために、後方再整形されたHDR画像に対して実行されてもよい。 Additionally, optionally or alternatively, in some operational scenarios, DM metadata may be transmitted to the receiver within the image metadata (152) and the reshaped SDR image. HDR display device-specific display management operations may be performed based at least in part on DM metadata within the image metadata (152), e.g., to generate an HDR display image to be rendered on the HDR display device. It may also be performed on a reshaped HDR image.

説明のために、単一層コーデックアーキテクチャが記載されている。本明細書に記載した技術は、図2Aから図2Cに示すもの以外の異なる単層コーデックアーキテクチャで使用することができることに留意されたい。さらに、任意にまたは代替として、これらの技術は、多層コーデックアーキテクチャにおいて使用することができる。従って、単層または多層コーデックアーキテクチャのこれらおよび他のバリエーションは、本明細書に記載の技術の一部または全部と共に動作可能である。 For purposes of illustration, a single layer codec architecture is described. Note that the techniques described herein can be used with different single-layer codec architectures than those shown in FIGS. 2A-2C. Additionally, optionally or alternatively, these techniques can be used in a multi-layer codec architecture. Accordingly, these and other variations of single-layer or multi-layer codec architectures are operable with some or all of the techniques described herein.

後方再整形のためのd3DMTの更新
前述のPCT特許出願第PCT/US2019/031620号に記載されているような高忠実度アプローチと高効率アプローチとの間の比較的大きなギャップの多くは、再構成HDR画像のデコーダ側品質及びエンコーダ側計算コスト(又は効率)に関して、色度チャネル/平面におけるSDR画像の後方再整形のための後方再整形MMR係数のような後方再整形マッピング(又は関数)を計算又は生成するために使用される方法に起因することができる。
Updating d3DMT for Posterior Reshaping Many of the relatively large gaps between high-fidelity and high-efficiency approaches, such as those described in the aforementioned PCT Patent Application No. PCT/US2019/031620, are due to reconstruction Compute backward reshaping mappings (or functions) such as backward reshaping MMR coefficients for backward reshaping of SDR images in chroma channels/planes in terms of decoder side quality and encoder side computational cost (or efficiency) of HDR images. or may be due to the method used to generate it.

一方、高効率アプローチは、前方d3DMTから直接後方再整形MMR係数を計算し、それによって、復号器側の再構成HDR画像の品質に著しい影響を与える誤差を導入する。これは、前方d3DMTが前方再整形に対して十分に正確であるが、後方再整形に対して十分に正確でない可能性があるためである。 On the other hand, high-efficiency approaches calculate the backward reshaping MMR coefficients directly from the forward d3DMT, thereby introducing errors that significantly affect the quality of the reconstructed HDR image at the decoder side. This is because the anterior d3DMT is accurate enough for anterior reshaping, but may not be accurate enough for posterior reshaping.

色空間の単一(輝度)チャネル/平面で実行されるため、輝度の再整形は、再整形されたコードワード/値にある程度の誤差を生じやすい可能性がある。色度再整形のMMR予測では、さらなるエラーが発生する可能性がある。 Since it is performed in a single (luminance) channel/plane of color space, luminance reshaping may be prone to some error in the reshaped codeword/value. Additional errors may occur in MMR prediction for chroma reshaping.

図3Aは、前方d3DMT内の各エントリに対する前方再整形によって引き起こされるY、Cb(C0またはC0として示される)およびCr(C1またはC1として示される)の予測誤差の例を示す。これらの予測誤差は、前方d3DMTにおけるオリジナルのコードワード/値とFLUT/MMR予測コードワード/値との間の差異または偏差を表す。輝度予測誤差は、色度予測誤差よりも顕著である可能性がある。これらの予測誤差は、さらに後方再整形に伝播し、それにより、再構成されたHDR画像に比較的重大な誤差を生じる。 FIG. 3A shows an example of prediction errors in Y, Cb (denoted as C0 or C0) and Cr (denoted as C1 or C1) caused by forward reshaping for each entry in the forward d3DMT. These prediction errors represent the difference or deviation between the original codeword/value in the forward d3DMT and the FLUT/MMR predicted codeword/value. Luminance prediction errors can be more significant than chromaticity prediction errors. These prediction errors further propagate to the backward reshaping, thereby causing relatively significant errors in the reconstructed HDR image.

他方、高忠実度アプローチは、基準(またはソース)HDRおよび対応するSDR画像(例えば、前方再整形SDR画像など)から新しい後方d3DMTを構築し、それにより、かなりの計算コストおよび待ち時間を負う。 On the other hand, high-fidelity approaches construct a new posterior d3DMT from a reference (or source) HDR and a corresponding SDR image (eg, a forward reshaped SDR image, etc.), thereby incurring significant computational cost and latency.

輝度チャネル/平面におけるSDRコードワード/値を予測するために使用されるFLUTと色度チャネル/平面におけるSDRコードワード/値を予測するために使用される前方MMR係数を最初に解いた/得た。次いで、後方再整形マッピングにおける前方再整形によって導入される予測誤差を修正または最小化するために、前方d3DMTに対応する後方d3DMTを、FLUT予測輝度SDRコードワード/値および前方MMR予測色度コードワード/値を用いた前方d3DMTのSDRエントリ内のコンテンツマッピングされたSDRコードワード/値(図2Aまたは図2Bの「マッピング情報」ブロック内のHDRコードワード/値/サンプルを、コンテンツマッピングすることによって生成された)を置換または修正することによって生成することができる。 First solved/obtained the FLUT used to predict the SDR codeword/value in the luma channel/plane and the forward MMR coefficients used to predict the SDR codeword/value in the chroma channel/plane. . The backward d3DMT corresponding to the forward d3DMT is then combined with the FLUT predicted luma SDR codeword/value and the forward MMR predicted chroma codeword to correct or minimize the prediction error introduced by the forward reshaping in the backward reshape mapping. /value (generated by content mapping the HDR codeword/value/sample in the "Mapping Information" block of FIG. 2A or FIG. 2B) in the SDR entry of the forward d3DMT using can be generated by replacing or modifying the

以下のように、t番目のHDR基準画像(またはフレーム)のHDRサンプル(またはY、C0およびC1チャネル/平面のソースHDR値)から生成された前方d3DMT内のマッピング対と、HDRサンプルのコンテンツマッピングから生成された対応するSDRサンプル(またはコンテンツマッピングSDR値)のマッピング対を記述する:

Figure 0007439251000044
ここでKは、前方d3DMTのエントリまたは行の総数であり、
Figure 0007439251000045
は、マッピングテーブルのk番目のエントリのY、C0およびC1チャネル/平面におけるソースHDR値をそれぞれ示し、
Figure 0007439251000046
は、前方d3DMTのk番目のエントリのY、C0およびC1チャネル/平面におけるコンテンツマッピングSDR値を示す。kは0と(K-1)の間の整数である。 The mapping pair in the forward d3DMT generated from the HDR samples (or source HDR values of Y, C0 and C1 channels/planes) of the tth HDR reference image (or frame) and the content mapping of the HDR samples as follows: Describe the mapping pair of corresponding SDR samples (or content mapping SDR values) generated from:
Figure 0007439251000044
where K is the total number of entries or rows in the forward d3DMT,
Figure 0007439251000045
denote the source HDR values in the Y, C0 and C1 channels/planes of the kth entry of the mapping table, respectively;
Figure 0007439251000046
denotes the content mapping SDR values in the Y, C0 and C1 channels/planes of the kth entry of the forward d3DMT. k is an integer between 0 and (K-1).

本明細書に記載されているマッピングテーブルのマッピング対は、HDR値のエントリ(例えば、上記式(1)の左側)のペア、およびSDR値の対応するエントリ(例えば、上記式(1)の右側)のペアを指す。本明細書に記載される技術の下では、マッピング対におけるこれらの値は、比較的高品質の後方再整形マッピングを生成する目的で更新され得る。 A mapping pair in the mapping table described herein is a pair of entries for HDR values (e.g., the left side of equation (1) above) and a corresponding entry for SDR values (e.g., the right side of equation (1) above). ) refers to the pair. Under the techniques described herein, these values in the mapping pair may be updated for the purpose of producing a relatively high quality backward reshaping mapping.

輝度チャネル/平面内のHDRコードワード/値からSDRコードワード/値を予測するために使用される前方FLUT(前方d3DMTから生成される)を、

Figure 0007439251000047
と記す。色度チャネル/平面C0およびC1におけるHDRコードワード/値からSDRコードワード/値を予測するために使用される前方MMR係数(前方d3DMTから生成される)を、それぞれ、
Figure 0007439251000048
と記すと、以下のようになる:
Figure 0007439251000049
ここで、MはMMRに基づく前方再整形マッピングにおける項の総数を表す。 The forward FLUT (generated from the forward d3DMT) used to predict the SDR codeword/value from the HDR codeword/value in the luminance channel/plane,
Figure 0007439251000047
It is written as The forward MMR coefficients (generated from the forward d3DMT) used to predict the SDR codewords/values from the HDR codewords/values in the chroma channels/planes C0 and C1, respectively, are
Figure 0007439251000048
, it becomes as follows:
Figure 0007439251000049
Here, M represents the total number of terms in the MMR-based forward reshaping mapping.

SDRからHDRへのペアのマッピングを含む後方d3DMTは、最初、前方d3DMTの逆数として生成することができる。例えば、後方d3DMTを最初に前方d3DMTの逆数として構築する目的のために、前方d3DMT内のSDR値にマップされるHDR値を、後方d3DMT内のSDR値がマップされる対応するHDR値として使用することができる。 The backward d3DMT containing the SDR to HDR pair mapping can initially be generated as the inverse of the forward d3DMT. For example, for the purpose of constructing the backward d3DMT as the inverse of the forward d3DMT first, use the HDR values mapped to the SDR values in the forward d3DMT as the corresponding HDR values to which the SDR values in the backward d3DMT are mapped. be able to.

輝度チャネル/平面において、コンテンツマッピングされたSDRコードワード/値を、後方d3DMTにおけるFLUTで予測された前方に再構成されたSDRコードワード/値と置き換える例示的な手順を、以下の表4に示す。

Figure 0007439251000050
An exemplary procedure for replacing content-mapped SDR codewords/values in the luminance channel/plane with FLUT-predicted forward reconstructed SDR codewords/values in the backward d3DMT is shown in Table 4 below. .
Figure 0007439251000050

いくつかの運用シナリオでは、最初に前方d3DMTの逆数として生成された後方d3DMTのSDR輝度コード/値を更新した後、HDRからSDRへの修正後方d3DMTを次のように生成できる:

Figure 0007439251000051
In some operational scenarios, after updating the SDR brightness code/value of the backward d3DMT, which is first generated as the inverse of the forward d3DMT, a modified backward d3DMT from HDR to SDR can be generated as follows:
Figure 0007439251000051

前述したように、この後方d3DMTを構築するために、前方d3DMT内のSDR値にマップされるHDR値は、後方d3DMT内のSDR値がマップされる対応するHDR値として使用され得る。 As mentioned above, to construct this backward d3DMT, the HDR values mapped to the SDR values in the forward d3DMT may be used as the corresponding HDR values to which the SDR values in the backward d3DMT are mapped.

色度チャネル/平面において、コンテンツマッピングされたSDRコードワード/値を、後方d3DMTにおける前方MMR係数で予測された前方再整形されたSDRコードワード/値と置き換える例示的な手順を、以下の表5に示す。

Figure 0007439251000052
An exemplary procedure for replacing content-mapped SDR codewords/values in chroma channels/planes with forward reshaped SDR codewords/values predicted with forward MMR coefficients in the backward d3DMT is shown in Table 5 below. Shown below.
Figure 0007439251000052

一部の運用シナリオでは、最初に前方d3DMTの逆として生成された後方d3DMT内のSDR色度コードワード/値を更新した後、SDRからHDRへの修正後方d3DMTを次のように生成することができる:

Figure 0007439251000053
In some operational scenarios, after updating the SDR chroma codewords/values in the backward d3DMT, which was first generated as the inverse of the forward d3DMT, a modified backward d3DMT from SDR to HDR may be generated as follows: can:
Figure 0007439251000053

さらに、任意にまたは代替として、後方d3DMTのSDR輝度および色度コードワード/値を更新した後、SDRからHDRへの修正後の後方d3DMTを次のように生成することができる:

Figure 0007439251000054
Additionally, optionally or alternatively, after updating the SDR luminance and chroma codewords/values of the backward d3DMT, an SDR to HDR modified backward d3DMT can be generated as follows:
Figure 0007439251000054

再構成されたHDRコードワード/値を予測するために使用される後方MMR係数は、式(3)から(5)で表されるように修正された後方d3DMTから計算され得る。式(5)の更新された後方d3DMTを例にとる。行列を次のように構成する:

Figure 0007439251000055
ここで、
Figure 0007439251000056
は、MMR予測演算でサポートされるすべての(M個の)項を含む。 The backward MMR coefficients used to predict the reconstructed HDR codeword/value may be calculated from the modified backward d3DMT as expressed in equations (3) to (5). Take the updated backward d3DMT in equation (5) as an example. Construct the matrix as follows:
Figure 0007439251000055
here,
Figure 0007439251000056
contains all (M) terms supported in the MMR prediction operation.

以下の関係式が成り立つとする:

Figure 0007439251000057
Figure 0007439251000058
Figure 0007439251000059
Figure 0007439251000060
Figure 0007439251000061
Assume that the following relational expression holds:
Figure 0007439251000057
Figure 0007439251000058
Figure 0007439251000059
Figure 0007439251000060
Figure 0007439251000061

後方再整形のための後方MMR係数は、以下のように計算できる:

Figure 0007439251000062
Figure 0007439251000063
The posterior MMR coefficient for posterior reshaping can be calculated as follows:
Figure 0007439251000062
Figure 0007439251000063

いくつかの運用シナリオでは、輝度チャネル/平面における後方再整形における予測誤差は、後方再整形色度チャネル/平面における予測誤差よりも重要である。さらに、後方d3DMTの更新/修正におけるSDR輝度コードまたは値の生成および更新は、SDR色度コードまたは値の生成および更新よりも計算的に効率的である。これらの運用シナリオでは、表4に示される処理は、表5に示される処理よりも高い優先度を与えられてもよい。 In some operational scenarios, the prediction error in the backward reshaping in the luma channel/plane is more important than the prediction error in the backward reshaping chroma channel/plane. Furthermore, generating and updating SDR luma codes or values in backward d3DMT updates/modifications is computationally more efficient than generating and updating SDR chroma codes or values. In these operational scenarios, the processes shown in Table 4 may be given higher priority than the processes shown in Table 5.

図4Aは、再構成されたHDR画像のデコーダ側品質と、後方再構成マッピングを生成するためにd3DMTを更新または構築するエンコーダ側計算コストとの間の調整可能なトレードオフのための例示的なプロセスフローを示す。いくつかの実施形態では、1つ以上の計算デバイスで実装されたビデオエンコーダは、このプロセスフローを実行することができる。 Figure 4A shows an example for an adjustable trade-off between the decoder-side quality of the reconstructed HDR image and the encoder-side computational cost of updating or constructing the d3DMT to generate the backward reconstruction mapping. Show the process flow. In some embodiments, a video encoder implemented on one or more computing devices can perform this process flow.

ブロック402は、前方d3DMTの更新/構築(または、その逆として最初に生成された対応する後方d3DMTの更新/構築)をサポートするために、デコーダ/再生デバイス等にビデオデータを配信することに関与する1つ以上のビデオコーデックの(例えば、ビデオエンコーダ、コーディングブロックのビデオエンコーダの)計算リソースが利用可能であるかどうかを判断することを含む。 Block 402 is responsible for delivering video data to a decoder/playback device, etc. to support updating/building a forward d3DMT (or vice versa, updating/building a corresponding backward d3DMT that was originally generated). determining whether computational resources of one or more video codecs (e.g., a video encoder, a video encoder of a coding block) are available.

ブロック404は、計算リソースが前方d3DMT(または後方d3DMT)のアップデート/ビルドをサポートするために利用できないという決定に応答して、後方MMR係数を計算するために後方d3DMTとして前方d3DMTの逆数を直接使用して、前方d3DMTに変更を加えることを回避することを含む。再構成されたHDR画像の第1のカラーグレードは、前方再整形されたSDR画像と、少なくとも部分的には後方MMR係数によって生成された対応する後方再整形マッピングを受信するビデオデコーダによって生成することができる。 Block 404 directly uses the inverse of the forward d3DMT as the backward d3DMT to calculate backward MMR coefficients in response to a determination that computational resources are not available to support an update/build of the forward d3DMT (or backward d3DMT). d3DMT to avoid making changes to the forward d3DMT. A first color grade of the reconstructed HDR image is generated by a video decoder receiving the forward reshaped SDR image and a corresponding backward reshaping mapping generated at least in part by the backward MMR coefficients. I can do it.

第1のカラーグレードを生成するために、図3Bに示すように、ビデオエンコーダは、最初に、各ソース(または入力)HDR画像のHDRサンプル、およびソースHDR画像に対応するコンテンツマップSDR画像の対応するSDRサンプルから前方d3DMTを作成する。次いで、ビデオエンコーダは、後方d3DMTから導出された後方再整形MMR係数によって表される色度後方再整形関数を含むが、これに限定されない後方再整形マッピングを、前方d3DMTの逆数として計算する(前方d3DMTまたは後方d3DMTへの更なる更新なしに)。 To generate the first color grade, as shown in Figure 3B, the video encoder first maps the HDR samples of each source (or input) HDR image and the corresponding content map of the SDR image corresponding to the source HDR image. A forward d3DMT is created from the SDR samples. The video encoder then computes a backward reshaping mapping, including but not limited to a chromatic backward reshaping function represented by the backward reshaping MMR coefficients derived from the backward d3DMT, as the inverse of the forward d3DMT (the forward without further updates to d3DMT or backward d3DMT).

本明細書中で使用されるように、異なる色グレードが、同じ視覚的意味内容を描写するために生成され得る。カラーグレードは、同一の視覚的意味内容を描写する再構成されたHDR画像の特定のバージョン(例えば、エンコーダ生成等)を参照することができる。 As used herein, different color grades may be generated to depict the same visual semantic content. A color grade may refer to a particular version of the reconstructed HDR image (eg, encoder generated, etc.) that depicts the same visual semantic content.

ブロック406は、前方d3DMT(または後方d3DMT)の更新/構築をサポートするために計算リソースが利用可能であることを決定することに応答して、利用可能な計算リソースの特定のレベルを決定することを含む。 Block 406 includes determining a particular level of available computational resources in response to determining that computational resources are available to support forward d3DMT (or backward d3DMT) updates/builds. including.

いくつかの動作シナリオでは、複数の計算リソースレベルしきい値がビデオエンコーダのために構成され、利用可能な計算リソースの特定のレベルと比較するためにビデオエンコーダによって使用されてもよい。 In some operational scenarios, multiple computational resource level thresholds may be configured for a video encoder and used by the video encoder to compare to a particular level of available computational resources.

ブロック408は、利用可能なコンピューティングリソースの特定のレベルおよび複数のコンピューティングリソースレベル閾値に基づいて、d3DMTを更新/構築するための、複数のトレードオフオプションの中の対応する特定のトレードオフオプションを決定することを含む。 Block 408 identifies a corresponding particular trade-off option among the plurality of trade-off options for updating/building the d3DMT based on the particular level of available computing resources and the plurality of computing resource level thresholds. including determining the

例えば、利用可能なコンピューティングリソースの特定レベルを決定することに応答して、第1のコンピューティングリソースレベル閾値を超えるが第2のコンピューティングリソースレベル閾値を下回る場合(第1のコンピューティングリソースレベル閾値を上回る)、ビデオエンコーダは、表4に示すように、前方d3DMT(または対応する後方d3DMT)のSDR輝度コード/値を更新することができる。再構成されたHDR画像の第2のカラーグレードは、前方再整形されたSDR画像と、少なくとも部分的には更新されたd3DMTから導出された後方MMR係数によって生成された対応する後方再整形マッピングとを受信するビデオデコーダによって生成することができる。 For example, in response to determining a particular level of available computing resources, if the first computing resource level threshold is exceeded but below the second computing resource level threshold (the first computing resource level threshold), the video encoder may update the SDR luminance code/value of the forward d3DMT (or the corresponding backward d3DMT) as shown in Table 4. A second color grade of the reconstructed HDR image includes a forward reshaped SDR image and a corresponding backward reshaped mapping generated by backward MMR coefficients derived at least in part from the updated d3DMT. can be generated by a receiving video decoder.

第2のカラーグレードを生成するために、図3Bに示すように、ビデオエンコーダは、最初に、各ソース(または入力) HDR画像のHDRサンプル、およびソースHDR画像に対応するコンテンツマップSDR画像の対応するSDRサンプルから前方d3DMTを作成する。ビデオエンコーダは、前方d3DMTに基づく輝度前方再整形関数を生成し、前方d3DMT内の輝度コードワード/値(ただし、色度コード/値を更新しない)を更新するために輝度前方再整形関数を使用します。次に、ビデオエンコーダは、更新された後方d3DMTから導出された後方再整形MMR係数によって表される色度後方再整形関数を含むが、これに限定されない後方再整形マッピングを計算する。 To generate the second color grade, as shown in Figure 3B, the video encoder first extracts the HDR samples of each source (or input) HDR image, and the content map SDR image correspondence corresponding to the source HDR image. A forward d3DMT is created from the SDR samples. The video encoder generates a luma forward reshaping function based on the forward d3DMT and uses the luma forward reshaping function to update the luma codewords/values (but not update the chroma codes/values) in the forward d3DMT. To do. The video encoder then computes a backward reshaping mapping including, but not limited to, a chromatic backward reshaping function represented by backward reshaping MMR coefficients derived from the updated backward d3DMT.

利用可能なコンピューティングリソースの特定レベルが第2のコンピューティングリソースレベル閾値を上回るが、第3のコンピューティングリソースレベル閾値(第2のコンピューティングリソースレベル閾値を上回る)を下回る場合、ビデオエンコーダは、表4および5に示すように、前方d3DMT (または対応する後方d3DMT)のSDR輝度および色度コードワード/値を更新することができる。再構成されたHDR画像の第3のカラーグレードは、前方再整形されたSDR画像および対応する後方再整形マッピングを受信するビデオデコーダによって、少なくとも部分的に、更新されたd3DMTから導出された後方MMR係数によって生成することができる。 If the particular level of available computing resources is above a second computing resource level threshold but below a third computing resource level threshold (above the second computing resource level threshold), the video encoder: The SDR luminance and chroma codewords/values of the forward d3DMT (or corresponding backward d3DMT) may be updated as shown in Tables 4 and 5. A third color grade of the reconstructed HDR image is a backward MMR derived from the updated d3DMT, at least in part, by a video decoder that receives the forward reshaped SDR image and the corresponding backward reshaped mapping. It can be generated by a coefficient.

第3のカラーグレードを生成するために、図3Bに示すように、ビデオエンコーダは、最初に、各ソース(または入力) HDR画像のHDRサンプル、およびソースHDR画像に対応するコンテンツマップSDR画像の対応するSDRサンプルから前方d3DMTを作成する。ビデオエンコーダは、前方d3DMTに基づく輝度前方再整形関数を生成し、前方d3DMTに基づく色度前方再整形関数(例えば、前方再整形MMR係数など)を生成する。ビデオエンコーダは、輝度および色度前方再構成関数を使用して、前方d3DMTまたは前方d3DMTから後方として最初に生成された後方d3DMT内の輝度コード/値だけでなく、輝度コード/値を更新する。次に、ビデオエンコーダは、更新された後方d3DMTから導出された後方再整形MMR係数によって表される色度後方再整形関数を含むが、これに限定されない後方再整形マッピングを計算する。 To generate the third color grade, as shown in Figure 3B, the video encoder first extracts the HDR samples of each source (or input) HDR image, and the content map SDR image correspondence corresponding to the source HDR image. A forward d3DMT is created from the SDR samples. The video encoder generates a luma forward reshaping function based on the forward d3DMT and a chroma forward reshaping function (eg, forward reshaping MMR coefficients, etc.) based on the forward d3DMT. The video encoder uses the luma and chroma forward reconstruction functions to update the luma codes/values as well as the luma codes/values in the forward d3DMT or the backward d3DMT that was originally generated as backward from the forward d3DMT. The video encoder then computes a backward reshaping mapping including, but not limited to, a chromatic backward reshaping function represented by backward reshaping MMR coefficients derived from the updated backward d3DMT.

利用可能な計算リソースの特定のレベルが第3の計算リソースレベルしきい値を上回ることに応答して、ビデオエンコーダは、HDRソース(または参照)画像および対応する前方再整形SDR画像を使用して、後方再整形のための(新規)後方d3DMT (例えば、前方d3DMTの逆数などを使用せずに)を構築し、構築された後方d3DMTに基づいて後方MMR係数を計算することができる。再構成されたHDR画像の第4のカラーグレードは、前方再整形されたSDR画像と、少なくとも部分的に、構築された後方d3DMTから導出された後方MMR係数によって生成された対応する後方再整形マッピングを受信するビデオデコーダによって生成することができる。 In response to the particular level of available computational resources being above a third computational resource level threshold, the video encoder uses the HDR source (or reference) image and the corresponding forward reshaped SDR image to , one can construct a (new) backward d3DMT for backward reshaping (e.g., without using the inverse of the forward d3DMT, etc.) and calculate the backward MMR coefficients based on the constructed backward d3DMT. The fourth color grade of the reconstructed HDR image is a forward reshaped SDR image and a corresponding backward reshaped mapping generated, at least in part, by the backward MMR coefficients derived from the constructed backward d3DMT. can be generated by a receiving video decoder.

第4のカラーグレードを生成するために、図3Bに示すように、ビデオエンコーダは、最初に、各ソース(または入力) HDR画像のHDRサンプル、およびソースHDR画像に対応するコンテンツマップSDR画像の対応するSDRサンプルから前方d3DMTを作成する。ビデオエンコーダは、前方d3DMTに基づく輝度前方再整形関数を生成し、前方d3DMTに基づく色度前方再整形関数(例えば、前方再整形MMR係数など)を生成する。ビデオエンコーダは、輝度と色度の前方再整形関数を使用して、前方再整形SDR画像を生成する。次に、ビデオエンコーダは、ソースHDR画像及び前方再整形SDR画像に基づいて直接構築された後方d3DMTから導出された後方再整形MMR係数によって表される色度後方再整形関数を含むが、これに限定されない後方再整形マッピングを計算する。 To generate the fourth color grade, as shown in Figure 3B, the video encoder first extracts the HDR samples of each source (or input) HDR image and the content maps of the SDR image corresponding to the source HDR image. A forward d3DMT is created from the SDR samples. The video encoder generates a luma forward reshaping function based on the forward d3DMT and a chroma forward reshaping function (eg, forward reshaping MMR coefficients, etc.) based on the forward d3DMT. The video encoder uses forward reshaping functions of luminance and chroma to generate a forward reshape SDR image. The video encoder then includes a chromatic backward reshaping function, represented by backward reshaping MMR coefficients derived from a backward d3DMT constructed directly based on the source HDR image and the forward reshaping SDR image. Compute an unbounded backward reshaping mapping.

BLUT修正
いくつかの動作シナリオでは、例示的なトレードオフオプションは、図1Bに示されるようなBLUT修正である。バンディングアーチファクトを示さずにSDRビンの利用可能なコードワードで表現できる最大輝度範囲をBLKSTDを用いて推定した。利用可能なコードワードによって表される実際の輝度範囲(例えば、バンディングアーチファクトなどを示す可能性がある)は、BLUTから計算される。特定の輝度コードワード/値(例えば、として示されるなど)の上のBLUT部分(例えば、最も明るい、天井の輝度コードワード/値の下の最も明るいなど)は、最大輝度範囲と実際の輝度範囲の間の比に基づいて修正されることがある。さらに、任意にまたは代替的に、暗(例えば、最も暗く、床の輝度コード/値より上で最も暗い) BLUT部分は、ノイズ注入操作の一部として変更されてもよい。例示的なBLUT修正およびノイズ注入は、前述の米国仮特許出願第62/885,921号に記載されている。
BLUT Modification In some operational scenarios, an example trade-off option is BLUT modification as shown in FIG. 1B. The maximum brightness range that can be represented by the available codewords of the SDR bin without exhibiting banding artifacts was estimated using BLKSTD. The actual brightness range represented by the available codewords (which may exhibit banding artifacts, etc., for example) is calculated from the BLUT. The BLUT portion (e.g. brightest, brightest below ceiling brightness codeword/value, etc.) above a particular brightness codeword/value (e.g., denoted as ) is the maximum brightness range and the actual brightness range may be modified based on the ratio between. Additionally, optionally or alternatively, the dark (eg, darkest and darkest above the floor brightness code/value) BLUT portion may be modified as part of the noise injection operation. Exemplary BLUT modifications and noise injection are described in the aforementioned US Provisional Patent Application No. 62/885,921.

本明細書に記載されるように、ビデオエンコーダにおけるBLUTの変更を可能にすることは、再構成されたHDR画像の明るい領域におけるバンディングアーチファクトを緩和または低減することができ、それによって、これらの再構成されたHDR画像の視覚品質を大幅に改善することができる。 As described herein, enabling BLUT modification in the video encoder can alleviate or reduce banding artifacts in bright regions of reconstructed HDR images, thereby reducing these reconstructions. The visual quality of the constructed HDR images can be significantly improved.

BLUT修正のための色補正
いくつかの運用シナリオでは、BLUT修正は明るい領域のバンディングアーチファクトを緩和することができるが、例えば、BLUT修正によって輝度コード/値が変化するような、衝突した画素の色の外観が変化する可能性があることが観察される。例えば、バンディングアーチファクトが、BLUTの変更によって再構成されたHDR画像の太陽周囲の空から除去された場合、再構成されたHDR画像の空の色は、BLUTの変更を伴わない再構成されたHDR画像よりも飽和して見える可能性がある。
Color Correction for BLUT Correction In some operational scenarios, BLUT correction can alleviate banding artifacts in bright areas, but the color of collided pixels may change, for example, where the brightness code/value changes due to BLUT correction. It is observed that the appearance of may change. For example, if banding artifacts are removed from the sky around the sun in a reconstructed HDR image by changing the BLUT, the sky color in the reconstructed HDR image will be different from that of the reconstructed HDR without changing the BLUT. It may appear more saturated than the image.

一般に、画素の輝度値を減少させると、画素の色がより飽和して見えるようになる可能性があり、画素の輝度値を増加させると、画素の色度値が変わらない場合、画素の色がより飽和して見えなくなる可能性があります。 In general, decreasing a pixel's luminance value can make the pixel's color appear more saturated, and increasing a pixel's luminance value can make the pixel's color appear more saturated if the pixel's chromaticity value remains the same. may become more saturated and invisible.

サチュレーションが実際に変化することを意味しないかもしれませんが、視聴者が視覚的に知覚する画素の色の外観は、同じ色度値に対して異なる輝度値で異なります。 Although it may not mean that the saturation actually changes, the appearance of a pixel's color visually perceived by the viewer is different for different luminance values for the same chromaticity value.

いくつかの運用シナリオでは、画素の対応する色度値(BLUT修正によって変更された画素の輝度値に対応する)は、これらの画素の色の外観が、ソース(例えば、参照、入力など) HDR画像の色に比較的近く見えるように修正されてもよい。変更されたBLUTと元のBLUT(BLUTの変更によって変更されない)との比率は、彩度値を調整するための不飽和(または色度スケーリング)関数として使用される。 In some operational scenarios, the corresponding chromaticity values of the pixels (corresponding to the luminance values of the pixels changed by the BLUT modification) are determined by the color appearance of these pixels from the source (e.g. reference, input, etc.) HDR The color may be modified to appear relatively close to the color of the image. The ratio of the modified BLUT to the original BLUT (unchanged by the BLUT modification) is used as a desaturation (or chromaticity scaling) function to adjust the chroma value.

元のBLUTを、

Figure 0007439251000064
と記し、バンディングアーチファクトを抑制する改良型BLUTを、
Figure 0007439251000065
と記すことにする。BLUTは(例えば、正規化、非正規化等された)SDR輝度値を(例えば、正規化、非正規化等された)HDR輝度値にマッピングする。 The original BLUT,
Figure 0007439251000064
, an improved BLUT that suppresses banding artifacts,
Figure 0007439251000065
I will write this as BLUT maps SDR luminance values (eg, normalized, denormalized, etc.) to HDR luminance values (eg, normalized, denormalized, etc.).

例示のみを目的として、色度値は、YCbCr、ICtCp、IPTPQなどを含むが、これらに限定されない色空間で表現され、正規化ドメイン[0 1]の色度値は、オフセット0.5で表現される。したがって、色度値が0.5の場合、ニュートラルカラー(グレイスケール)を意味します。色度値(またはその彩度/色の外観)を調整するために、オフセットを色度値から除去することができる。 For illustrative purposes only, chromaticity values are expressed in color spaces including, but not limited to, YCbCr, ICtCp, IPTPQ, etc., and chromaticity values in the normalized domain [0 1] are expressed with an offset of 0.5. be done. Therefore, a chromaticity value of 0.5 means a neutral color (grayscale). To adjust the chromaticity value (or its saturation/color appearance), an offset can be removed from the chromaticity value.

色度チャネル/平面において、入力(または参照) HDR色度コードワード/値を、後方d3DMT内の不飽和HDRコードワード/値で置き換える例示的な手順を、以下の表6に示す。これにより、入力(または参照) HDR色度コードワード/値の代わりに、不飽和HDRコードワード/値が、本明細書に記載されるような後方再構成マッピングによって生成される再構成HDRコードワード/値によって近似される。

Figure 0007439251000066
An exemplary procedure for replacing an input (or reference) HDR chroma codeword/value in a chroma channel/plane with an unsaturated HDR codeword/value in the backward d3DMT is shown in Table 6 below. This ensures that instead of the input (or reference) HDR chroma codeword/value, the unsaturated HDR codeword/value is the reconstructed HDR codeword produced by backward reconstruction mapping as described herein. / value.
Figure 0007439251000066

一部の運用シナリオでは、前方d3DMTの後方として最初に生成された後方d3DMTにおいて、HDR色度コードワード/値を更新した後(およびコンテンツマッピングされたSDRコードワード/値を前方再構成されたSDRコードワード/値に置き換えた後)、HDRからSDRへの修正後の後方d3DMTを次のように生成することができる:

Figure 0007439251000067
In some operational scenarios, after updating the HDR chroma codewords/values (and updating the content-mapped SDR codewords/values) in the backward d3DMT, which was originally generated as backward of the forward d3DMT, (after replacing codewords/values), the modified backward d3DMT from HDR to SDR can be generated as follows:
Figure 0007439251000067

次いで、後方再整形マッピングにおける後方MMR係数を、後方d3DMTから計算することができる。 The backward MMR coefficients in the backward reshaping mapping can then be calculated from the backward d3DMT.

表6に示されるような不飽和関数

Figure 0007439251000068
のパラメータβは、元の(例えば、トレーニング中などの)HDR画像のカラー外観と、色度値が不飽和で色度値が不飽和でない対応する再構成されたHDR画像のカラー外観の経験的研究を通して、実際の値が決定またはチューニングされ得るチューニングパラメータを表す。パラメータβの値の例としては、1.5、2、2.5、3、3.5などのうちの1つが挙げられるが、必ずしもこれらに限定されない。 Unsaturated functions as shown in Table 6
Figure 0007439251000068
The parameter β is the empirical difference between the color appearance of the original (e.g., during training) HDR image and the corresponding reconstructed HDR image with unsaturated chromaticity values and unsaturated chromaticity values. represents a tuning parameter whose actual value may be determined or tuned through research. Examples of the value of the parameter β include, but are not necessarily limited to, one of 1.5, 2, 2.5, 3, 3.5, etc.

表6に示すように、C0またはCbチャネルの不飽和色度値

Figure 0007439251000069
は、2つの項を含む。第1項
Figure 0007439251000070
は、ニュートラルグレー値0.5からの不飽和色度値の偏差を表す。したがって、C0またはCbチャネルの不飽和色度値
Figure 0007439251000071
の第1項が比較的小さい場合、不飽和色度値
Figure 0007439251000072
は、ニュートラルグレー値0.5に比較的近い値に調整される。その結果、この非飽和色度値
Figure 0007439251000073
を有する画素の色は、ニュートラルグレー値0.5に比較的近く調整されたので、対応する調整前の色度値
Figure 0007439251000074
を有する画素よりも不飽和化される。 Unsaturated chromaticity value of C0 or Cb channel as shown in Table 6
Figure 0007439251000069
contains two terms. Section 1
Figure 0007439251000070
represents the deviation of the unsaturated chromaticity value from the neutral gray value of 0.5. Therefore, the unsaturated chromaticity value of the C0 or Cb channel
Figure 0007439251000071
If the first term of is relatively small, the unsaturated chromaticity value
Figure 0007439251000072
is adjusted to a value relatively close to the neutral gray value of 0.5. As a result, this unsaturated chromaticity value
Figure 0007439251000073
The color of the pixel with has been adjusted relatively close to the neutral gray value of 0.5, so the corresponding unadjusted chromaticity value
Figure 0007439251000074
It is less saturated than a pixel with .

同様に、C1またはCrチャネルの不飽和色度値

Figure 0007439251000075
は、2つの項を含む。第1項
Figure 0007439251000076
は、ニュートラルグレー値0.5からの不飽和色度値の偏差を表す。したがって、C1またはCbチャネルの不飽和色度値
Figure 0007439251000077
の第1項が比較的小さい場合、不飽和色度値
Figure 0007439251000078
は、ニュートラルグレー値0.5に比較的近い値に調整される。その結果、この非飽和色度値
Figure 0007439251000079
を有する画素の色は、ニュートラルグレー値0.5に比較的近く調整されたので、対応する調整前の色度値
Figure 0007439251000080
を有する画素よりも不飽和化される。 Similarly, the unsaturated chromaticity value of the C1 or Cr channel
Figure 0007439251000075
contains two terms. Section 1
Figure 0007439251000076
represents the deviation of the unsaturated chromaticity value from the neutral gray value of 0.5. Therefore, the unsaturated chromaticity value of C1 or Cb channel
Figure 0007439251000077
If the first term of is relatively small, the unsaturated chromaticity value
Figure 0007439251000078
is adjusted to a value relatively close to the neutral gray value of 0.5. As a result, this unsaturated chromaticity value
Figure 0007439251000079
The color of the pixel with has been adjusted relatively close to the neutral gray value of 0.5, so the corresponding unadjusted chromaticity value
Figure 0007439251000080
It is less saturated than a pixel with .

図3Cは、様々な色グレード(例えば、図3Bに示されるような色グレード2~4など)における任意の色グレードに適用可能な色補正の例を示す。一例として、ビデオエンコーダは、本明細書に記載されているように、後方d3DMTに基づいて(例えば、修正前の、等)BLUTのような輝度後方再整形関数を生成する。次に、ビデオエンコーダは、バンディングアーチファクト(例えば、そのリスク等)を低減するためにBLUTを修正する。ビデオエンコーダは、修正前のBLUTおよび修正されたBLUTを使用して、後方d3DMT内のHDR色度コードワード/値を更新するために、不飽和関数を生成する(例えば、上記の表6に示される比率などとして)。次に、ビデオエンコーダは、更新された後方d3DMTから導出された後方再整形MMR係数によって表される色度後方再整形関数を含むが、これに限定されない後方再整形マッピングを計算する。 FIG. 3C shows an example of color correction that can be applied to any color grade in various color grades (eg, color grades 2-4 as shown in FIG. 3B). As an example, a video encoder generates a luminance backward reshaping function, such as a BLUT (eg, before modification, etc.) based on the backward d3DMT, as described herein. The video encoder then modifies the BLUT to reduce banding artifacts (eg, the risk thereof, etc.). The video encoder uses the unmodified BLUT and the modified BLUT to generate an unsaturated function (e.g., as shown in Table 6 above) to update the HDR chroma codeword/value in the backward d3DMT. (as a percentage). The video encoder then computes a backward reshaping mapping including, but not limited to, a chromatic backward reshaping function represented by backward reshaping MMR coefficients derived from the updated backward d3DMT.

図3Dは、(図3Bに示されるように)カラーグレード2に対するd3DMTアップデート動作と関連して実行される例示的な色補正を示す。ビデオエンコーダは、最初に、各ソース(または入力) HDR画像のHDRサンプル、およびソースHDR画像に対応するコンテンツマップSDR画像の対応するSDRサンプルから前方d3DMTを構築する。ビデオエンコーダは、前方d3DMTに基づく輝度前方再整形関数を構築または生成します。ビデオエンコーダは、前方d3DMTまたは前方d3DMTから逆変換として最初に生成された後方d3DMTの輝度コード/値を更新するために、輝度前方再編成関数を使用します。次いで、ビデオエンコーダは、後方d3DMTに基づく輝度後方再整形関数を構築または生成する。ビデオエンコーダは、バンディングアーチファクトを低減するためにBLUTをさらに修正する。ビデオエンコーダは、予め修正されたBLUTおよび修正されたBLUTを使用して、後方d3DMT内のHDR色度コードワード/値を更新するために、不飽和関数を生成する(例えば、上記の表6に示される比率など)。続いて、ビデオエンコーダは、更新された後方d3DMTから導出された後方再整形MMR係数によって表される色度後方再整形関数を含むが、これに限定されない後方再整形マッピングを計算する。 FIG. 3D shows an example color correction performed in conjunction with a d3DMT update operation for color grade 2 (as shown in FIG. 3B). The video encoder first constructs a forward d3DMT from the HDR samples of each source (or input) HDR image and the corresponding SDR samples of the content map SDR image corresponding to the source HDR image. The video encoder constructs or generates a luminance forward reshaping function based on the forward d3DMT. The video encoder uses the luminance forward reorganization function to update the luminance codes/values of the forward d3DMT or the backward d3DMT that were originally generated as an inverse transform from the forward d3DMT. The video encoder then constructs or generates a luminance backward reshaping function based on the backward d3DMT. The video encoder further modifies the BLUT to reduce banding artifacts. The video encoder uses the pre-modified BLUT and the modified BLUT to generate an unsaturated function to update the HDR chroma codeword/value in the backward d3DMT (e.g., in Table 6 above). ratios shown). Subsequently, the video encoder calculates a backward reshaping mapping including, but not limited to, a chromatic backward reshaping function represented by backward reshaping MMR coefficients derived from the updated backward d3DMT.

後方再整形マッピングと時間的安定性
図3Eは、輝度更新、BLUT修正、および色補正を伴う後方再整形マッピング生成の例を示す。ブロック302は、ソースHDR画像のサンプリングされたHDRコードワードと、対応するコンテンツマッピングされたSDRコードワードとを用いてd3DMTを構築することを含み、これらの各々は、所与のソースHDD画像についてのHDRコードワードとSDRコードワードとの間の複数のマッピング対を含む。ブロック304は、各d3DMT内の複数のマッピング対に基づいて、前方ルックアップテーブルのような対応する輝度前方再整形関数を構築することを含む。ブロック306は、各d3DMT内の複数のマッピング対に基づいて、前方MMR係数によって表される対応する前方色度マッピングを構築することを含む。ブロック308は、コンテンツマッピングされたSDR輝度コードワードを、FLUTで予測された前方に再構成されたSDRコードワードで置き換えることによって、各d3DMT内の複数のマッピング対内のSDR輝度コードを更新することを含む。ブロック310は、FLUTから輝度後方再整形関数(BLUT)を構築することを含む。ブロック312は、バンディングアーチファクトのリスクを軽減または低減するためにBLUTを修正することを含む。ブロック314は、サンプリングされたHDR色度コードワードを、元のBLUTおよび修正されたBLUTに基づいて生成された不飽和HDR色度コードワードで置き換えることによって、各d3DMT内の複数のマッピング対におけるHDR色度コードワードを整流することを含む。ブロック316は、更新された輝度SDRコードワード及び更新された色度HDRコードワードを有する複数のマッピング対を含む更新されたd3DMTに基づいて、ソースHDR画像の1つに対応する各前方再整形されたSDR画像に対する色度後方再整形マッピング(例えば、色度後方再整形関数、後方(再整形) MMR係数等)を計算することを含む。
Backward Reshaping Mapping and Temporal Stability Figure 3E shows an example of backward reshaping mapping generation with brightness update, BLUT correction, and color correction. Block 302 includes constructing a d3DMT using the sampled HDR codewords of the source HDR image and the corresponding content-mapped SDR codewords, each of which It includes a plurality of mapping pairs between HDR codewords and SDR codewords. Block 304 includes constructing a corresponding luminance forward reshaping function, such as a forward lookup table, based on the plurality of mapping pairs within each d3DMT. Block 306 includes constructing corresponding forward chroma mappings represented by forward MMR coefficients based on the plurality of mapping pairs within each d3DMT. Block 308 includes updating the SDR luminance codes in the plurality of mapping pairs within each d3DMT by replacing the content-mapped SDR luminance codewords with the FLUT-predicted forward reconstructed SDR codewords. include. Block 310 includes constructing a luminance backward reshaping function (BLUT) from the FLUT. Block 312 includes modifying the BLUT to reduce or reduce the risk of banding artifacts. Block 314 performs HDR chroma codewords in the plurality of mapping pairs within each d3DMT by replacing the sampled HDR chroma codewords with unsaturated HDR chroma codewords generated based on the original BLUT and the modified BLUT. Including rectifying the chromaticity codeword. Block 316 performs each forward reshaping process corresponding to one of the source HDR images based on an updated d3DMT that includes a plurality of mapping pairs having an updated luma SDR codeword and an updated chroma HDR codeword. chromatic backward reshaping mapping (e.g., chromatic backward reshaping function, backward (reshaping) MMR coefficients, etc.) for the SDR image.

いくつかの運用シナリオでは、画像メタデータの時間的安定性を維持する目的で、画像メタデータの後方再整形マッピングを計算/生成/含める際に、線形セグメントベースの構造を使用することができる。例示的な線形セグメントベースの構造は、2018年1月4日に公開された米国特許出願第2018/0007356号に記載されており、その全体の内容は、本明細書に完全に記載されているかのように、参照により本明細書に組み込まれる。 In some operational scenarios, a linear segment-based structure may be used in computing/generating/including backward reshaping mappings of image metadata for the purpose of maintaining temporal stability of image metadata. Exemplary linear segment-based structures are described in U.S. Patent Application No. 2018/0007356, published January 4, 2018, the entire contents of which are incorporated herein by reference. is incorporated herein by reference.

本明細書に記載されるいくつかのまたは全ての技術は、放送ビデオアプリケーション、リアルタイムストリーミングアプリケーションなどのための適切なカラーグレードのビデオコンテンツを生成するために、リアルタイム動作の一部として実装および/または実行することができる。さらに、任意にまたは代替として、本明細書に記載されるいくつかのまたは全ての技術を、時間遅延またはオフライン動作の一部として実装および/または実行して、非リアルタイムストリーミングアプリケーション、シネマアプリケーションなどのための適切なカラーグレードのビデオコンテンツを生成することができる。 Some or all of the techniques described herein may be implemented and/or as part of a real-time operation to produce suitable color-grade video content for broadcast video applications, real-time streaming applications, etc. can be executed. Additionally, some or all of the techniques described herein may optionally or alternatively be implemented and/or performed as part of a time-delayed or offline operation for non-real-time streaming applications, cinema applications, etc. It is possible to generate video content with appropriate color grade.

プロセスフローの例
図4Bは、一実施形態による例示的なプロセスフローを示す図である。いくつかの実施形態では、1つ以上のコンピューティングデバイスまたはコンポーネント(例えば、エンコードデバイス/モジュール、トランスコードデバイス/モジュール、デコードデバイス/モジュール、逆トーンマッピングデバイス/モジュール、トーンマッピングデバイス/モジュール、メディアデバイス/モジュール、逆マッピング生成およびアプリケーションシステムなど)が、このプロセスフローを実行してもよい。ブロック422において、画像処理システムは、前方再整形テーブルの逆として、最初に後方再整形テーブルを生成する。
Example Process Flow FIG. 4B is a diagram illustrating an example process flow according to one embodiment. In some embodiments, one or more computing devices or components (e.g., encoding devices/modules, transcoding devices/modules, decoding devices/modules, reverse tone mapping devices/modules, tone mapping devices/modules, media devices) /modules, inverse mapping generation and application systems, etc.) may perform this process flow. At block 422, the image processing system first generates a backward reshaping table as the inverse of the forward reshaping table.

前方再整形テーブルは、第2のダイナミックレンジのソース画像から第1のダイナミックレンジの前方再整形画像を生成するために前方再整形マッピングを生成するために使用される。第1のダイナミックレンジは、第2のダイナミックレンジよりも低い。前方再編成マッピングテーブルは、第2のダイナミックレンジのサンプリングされた輝度コードワード、第2のダイナミックレンジのサンプリングされた色度コードワード、第2のダイナミックレンジのサンプリングされた輝度コードワードに対応する第1のダイナミックレンジのコンテンツマッピングされた輝度コードワード、及び第2のダイナミックレンジのサンプリングされた色度コードワードに対応する第1のダイナミックレンジのコンテンツマッピングされた色度コードワードを含む。 The forward reshape table is used to generate a forward reshape mapping to generate a first dynamic range forward reshape image from a second dynamic range source image. The first dynamic range is lower than the second dynamic range. The forward reorganization mapping table includes a second dynamic range sampled luma codeword, a second dynamic range sampled chroma codeword, and a second dynamic range sampled luma codeword corresponding to the second dynamic range sampled luma codeword. a content-mapped luma codeword of one dynamic range; and a content-mapped chroma codeword of a first dynamic range corresponding to a sampled chroma codeword of a second dynamic range.

ブロック424において、画像処理システムは、コンテンツマッピングされた輝度コードワードを前方に再構成された輝度コードワードで置き換えることによって、後方再構成マッピングテーブルを更新する。前方に再構成された輝度コードワードは、第2のダイナミックレンジのサンプリングされた輝度コードワードに輝度前方マッピングを適用することによって生成される。輝度の前方マッピングは、前方再整形マッピングテーブルから構成される。 At block 424, the image processing system updates the backward reconstruction mapping table by replacing the content-mapped intensity codeword with the forward reconstructed intensity codeword. The forward reconstructed luminance codeword is generated by applying luminance forward mapping to the sampled luminance codeword of the second dynamic range. The brightness forward mapping consists of a forward reshaping mapping table.

ブロック426では、画像処理システムは、第1のダイナミックレンジの前方再整形画像から第2のダイナミックレンジの再構成画像を作成するために、後方再整形マッピングを生成するために、後方再整形マッピングテーブルと輝度前方マッピングを使用する。 At block 426, the image processing system generates a backward reshaping mapping table to generate a backward reshaping mapping to create a second dynamic range reconstructed image from the first dynamic range forward reshaping image. and using luminance forward mapping.

ブロック428では、画像処理システムは、後方再整形マッピングを指定する画像メタデータと共に、前方再整形画像をビデオ信号で符号化する。ビデオ信号の受信側デバイスは、後方再整形マッピングを前方再整形画像に適用し、第2のダイナミックレンジの再構成画像を生成する。 At block 428, the image processing system encodes the forward reshaping image with the video signal along with image metadata specifying the backward reshaping mapping. A device receiving the video signal applies the backward reshaping mapping to the forward reshaping image to generate a second dynamic range reconstructed image.

一実施形態では、画像処理システムは、エンドツーエンドのビデオ配信パイプラインで利用可能な計算リソースを決定すること、利用可能な計算リソースを使用して、第2のダイナミックレンジの復号化画像のデコーダ側品質と、後方再整形マッピングを生成するエンコーダ側計算複雑性との間の特定のトレードオフオプションのセットを決定すること、後方再整形マッピングを生成するための特定のトレードオフオプションのセットに従って画像処理動作の特定のセットを実行すること、を実行するようにさらに構成される。 In one embodiment, the image processing system determines available computational resources in an end-to-end video delivery pipeline, and uses the available computational resources to decode a second dynamic range decoded image. determining a specific set of trade-off options between side quality and encoder-side computational complexity for generating a backward reshaping mapping; The method is further configured to perform: performing the particular set of processing operations.

一実施形態では、画像処理システムは、さらに、表示画像を再構成画像から導出し、ビデオ信号の受信デバイスで描画させるように構成される。 In one embodiment, the image processing system is further configured to derive a display image from the reconstructed image and render it at the video signal receiving device.

一実施形態では、画像処理システムは、コンテンツマッピングされた色度コードワードを前方再整形された色度コードワードで置き換えることによって、後方再整形マッピングテーブルを更新するようにさらに構成される。前方再構成された色度コードワードは、多変量重回帰(MMR)色度前方マッピングを第2のダイナミックレンジのサンプリングされた輝度と色度コードワードに適用することによって生成される。MMR色度前方マッピングは、前方再整形マッピングテーブルから構成される。 In one embodiment, the image processing system is further configured to update the backward reshaping mapping table by replacing the content mapped chroma codeword with the forward reshape chroma codeword. A forward reconstructed chroma codeword is generated by applying multivariate multiple regression (MMR) chroma forward mapping to the second dynamic range sampled luma and chroma codewords. The MMR chromaticity forward mapping consists of a forward reshaping mapping table.

一実施形態では、画像処理システムは、サンプリングされた色度コードワードを不飽和色度コードワードで置き換えることによって、後方再整形マッピングテーブルを更新するようにさらに構成される。 In one embodiment, the image processing system is further configured to update the backward reshaping mapping table by replacing the sampled chroma codeword with an unsaturated chroma codeword.

一実施形態では、不飽和化された色度コードワードは、サンプリングされた色度コードワードに不飽和関数を適用することによって生成され、不飽和関数は、修正された輝度後方再整形マッピングと元の輝度後方再整形マッピングとの間の比として構築される。 In one embodiment, the unsaturated chroma codeword is generated by applying an unsaturated function to the sampled chroma codeword, and the unsaturated function is combined with the modified luminance backward reshaping mapping and the original is constructed as the ratio between the luminance backward reshaping mapping of .

一実施形態では、画像処理システムは、再構成画像内のバンディングアーチファクトを低減するために、後方ルックアップテーブル修正を適用させるようにさらに構成される。 In one embodiment, the image processing system is further configured to apply a backward lookup table modification to reduce banding artifacts in the reconstructed image.

一実施形態では、後方マッピングテーブル及び前方マッピングテーブルのうちの少なくとも1つは、ソース画像及び前方再整形画像から少なくとも部分的にダイナミックに構築された三次元マッピングテーブルを表す。 In one embodiment, at least one of the backward mapping table and the forward mapping table represents a three-dimensional mapping table that is at least partially dynamically constructed from the source image and the forward reshaped image.

一実施形態では、輝度前方マッピングは、輝度ルックアップテーブルによって表される。 In one embodiment, the intensity forward mapping is represented by an intensity lookup table.

一実施形態では、第2のダイナミックレンジの再構成された画像は、第2のダイナミックレンジのソース画像を近似する。 In one embodiment, the second dynamic range reconstructed image approximates the second dynamic range source image.

一実施形態では、ビデオ信号は、単一層の後方互換性ビデオ信号を表す。 In one embodiment, the video signal represents a single layer backward compatible video signal.

図4Cは、本発明の一実施形態による例示的なプロセスフローを示す図である。いくつかの実施形態では、1つ以上のコンピューティングデバイスまたはコンポーネント(例えば、符号化デバイス/モジュール、トランスコーディングデバイス/モジュール、復号化デバイス/モジュール、逆トーンマッピングデバイス/モジュール、トーンマッピングデバイス/モジュール、メディアデバイス/モジュール、予測モデルおよび特徴選択システム、逆マッピング生成およびアプリケーションシステムなど)は、このプロセスフローを実行してもよい。ブロック442では、ビデオ復号システムは、ビデオ信号から、第1のダイナミックレンジの前方再整形画像を復号する。 FIG. 4C is a diagram illustrating an exemplary process flow according to one embodiment of the invention. In some embodiments, one or more computing devices or components (e.g., encoding devices/modules, transcoding devices/modules, decoding devices/modules, inverse tone mapping devices/modules, tone mapping devices/modules, media devices/modules, predictive models and feature selection systems, inverse mapping generation and application systems, etc.) may perform this process flow. At block 442, the video decoding system decodes a first dynamic range forward reshaped image from the video signal.

ブロック444では、ビデオ復号化システムは、ビデオ信号から、後方再整形マッピングを含む画像メタデータを復号化する。 At block 444, the video decoding system decodes image metadata, including backward reshaping mapping, from the video signal.

後方再整形マッピングは、後方再整形マッピングテーブルと輝度前方マッピングから上流画像処理デバイスによって生成した。後方再整形マッピングテーブルは、輝度前方マッピングを生成する前方再整形マッピングテーブルの逆数として、上流の画像処理デバイスによって最初に生成された。後方再整形マッピングテーブル中のコンテンツマッピング輝度コードワードは、前方再整形輝度コードワードで更新された。前方再整形輝度コードワードは、輝度前方マッピングをソース画像中のサンプリングされたソース輝度コードワードに適用することによって生成された。 The backward reshaping mapping was generated by an upstream image processing device from the backward reshaping mapping table and the luminance forward mapping. The backward reshaping mapping table was initially generated by an upstream image processing device as the inverse of the forward reshaping mapping table that generates the luminance forward mapping. The content mapping intensity codeword in the backward reshaping mapping table has been updated with the forward reshaping intensity codeword. The forward reshaped luminance codeword was generated by applying luminance forward mapping to the sampled source luminance codeword in the source image.

ブロック446では、ビデオ復号化システムは、再構成画像を生成するために、前方再整形画像に後方再整形マッピングを適用する。 At block 446, the video decoding system applies a backward reshaping mapping to the forward reshaping image to generate a reconstructed image.

ブロック448では、ビデオ復号化システムは、再構成された画像から導出された表示画像を表示デバイスで描画させる。 At block 448, the video decoding system causes a display image derived from the reconstructed image to be rendered on a display device.

一実施形態では、ディスプレイデバイス、モバイルデバイス、セットトップボックス、マルチメディアデバイスなどの計算デバイスは、前述の方法のいずれかを実行するように構成される。一実施形態では、装置は、プロセッサを備え、前述の方法のいずれかを実施するように構成される。一実施形態では、ソフトウェア命令を記憶する非一時的コンピュータ読取可能記憶媒体であって、1つ以上のプロセッサによって実行されると、前記方法のいずれかの性能を引き起こす。 In one embodiment, a computing device, such as a display device, mobile device, set-top box, multimedia device, etc., is configured to perform any of the aforementioned methods. In one embodiment, an apparatus comprises a processor and is configured to perform any of the methods described above. In one embodiment, a non-transitory computer-readable storage medium stores software instructions that, when executed by one or more processors, cause performance of any of the methods described above.

一実施形態では、1つ以上のプロセッサと、1つ以上のプロセッサによって実行された場合に前記方法のいずれかの性能を引き起こす命令のセットを記憶する1つ以上の記憶媒体とを備える計算デバイス。 In one embodiment, a computing device comprising one or more processors and one or more storage media storing a set of instructions that, when executed by the one or more processors, cause performance of any of the methods.

別個の実施形態が本明細書で議論されるが、本明細書で議論される実施形態および/または部分的実施形態の任意の組み合わせが、さらなる実施形態を形成するために組み合わされ得ることに留意されたい。 Note that although separate embodiments are discussed herein, any combination of embodiments and/or sub-embodiments discussed herein may be combined to form further embodiments. I want to be

コンピュータシステムの実装例
本発明の実施形態は、コンピュータシステム、電子回路および電子部品に構成されるシステム、マイクロコントローラなどの集積回路、フィールドプログラマブルゲートアレイ、または他の構成可能またはプログラマブルロジックデバイス、離散時間またはデジタル信号プロセッサ、特定用途向けIC、および/またはこれらのシステム、デバイスまたはコンポーネントの1つ以上を含む装置を用いて実施することができる。コンピュータおよび/またはICは、本明細書に記載されるような、拡張されたダイナミックレンジを有する画像の適応知覚量子化に関する命令を実行、制御、または実行することができる。コンピュータおよび/またはICは、本明細書に記載される適応知覚量子化プロセスに関連する様々なパラメータまたは値のいずれかを計算することができる。画像およびビデオの実施形態は、ハードウェア、ソフトウェア、ファームウェア、およびそれらの様々な組み合わせで実装することができる。
Example Implementations of Computer Systems Embodiments of the present invention may be implemented in computer systems, systems configured into electronic circuits and components, integrated circuits such as microcontrollers, field programmable gate arrays, or other configurable or programmable logic devices, discrete-time or can be implemented using digital signal processors, application specific ICs, and/or apparatus including one or more of these systems, devices, or components. The computer and/or IC may execute, control, or execute instructions related to adaptive perceptual quantization of images with extended dynamic range as described herein. A computer and/or IC may calculate any of various parameters or values associated with the adaptive perceptual quantization process described herein. Image and video embodiments may be implemented in hardware, software, firmware, and various combinations thereof.

本発明の特定の実装は、プロセッサに本開示の方法を実行させるソフトウェア命令を実行するコンピュータプロセッサを含む。例えば、ディスプレイ、エンコーダ、セットトップボックス、トランスコーダ等における1つ以上のプロセッサは、プロセッサにアクセス可能なプログラムメモリにおいてソフトウェア命令を実行することによって、上述したようなHDR画像の適応知覚量子化に関連する方法を実施することができる。本発明の実施形態はまた、プログラム製品の形態で提供されてもよい。プログラム生成物は、データプロセッサによって実行されると、データプロセッサに本発明の実施形態の方法を実行させる命令を含む一組のコンピュータ読取可能な信号を担持する任意の非一時的媒体を含んでもよい。本発明の実施形態によるプログラム製品は、多種多様な形態のいずれであってもよい。プログラム製品は、例えば、フロッピーディスケットを含む磁気データ記憶媒体、ハードディスクドライブ、CD-ROMを含む光データ記憶媒体、DVD、ROMを含む電子データ記憶媒体、フラッシュRAM等の物理媒体を含むことができる。プログラム生成物上のコンピュータ読取可能信号は、任意に圧縮または暗号化されてもよい。 Certain implementations of the present invention include a computer processor executing software instructions that cause the processor to perform the methods of the present disclosure. For example, one or more processors in displays, encoders, set-top boxes, transcoders, etc. may be associated with adaptive perceptual quantization of HDR images as described above by executing software instructions in a program memory accessible to the processor. The method can be implemented. Embodiments of the invention may also be provided in the form of a program product. The program product may include any non-transitory medium carrying a set of computer-readable signals containing instructions that, when executed by a data processor, cause the data processor to perform methods of embodiments of the present invention. . Program products according to embodiments of the invention may take any of a wide variety of forms. The program product may include physical media such as, for example, magnetic data storage media including floppy diskettes, hard disk drives, optical data storage media including CD-ROMs, DVDs, electronic data storage media including ROMs, flash RAM, and the like. Computer readable signals on the program product may be optionally compressed or encrypted.

構成要素(例えば、ソフトウェアモジュール、プロセッサ、アセンブリ、デバイス、回路等)が上記で言及されている場合、別段の指示がない限り、当該構成要素への言及(「手段」への言及を含む)は、本発明の例示的実施形態において関数を実行する開示された構造と構造的に等価でない構成要素を含む、説明された構成要素の関数を実行する(例えば、関数的に同等である)任意の構成要素を含む、当該構成要素の等価物として解釈されるべきである。 When a component (e.g., software module, processor, assembly, device, circuit, etc.) is mentioned above, references to that component (including references to "means") are , any components that perform the functions (e.g., are functionally equivalent) of the described components, including components that are not structurally equivalent to the disclosed structures that perform the functions in exemplary embodiments of the invention. shall be construed as equivalents of such constituent elements, including constituent elements.

一実施形態によれば、本明細書に記載される技術は、1つ以上の専用目的のコンピューティングデバイスによって実装される。専用目的の計算デバイスは、技術を実行するためにハードワイヤード配線されてもよく、または技術を実行するために永続的にプログラムされた1つ以上の特定用途向け集積回路またはフィールドプログラマブルゲートアレイのようなデジタル電子デバイスを含んでもよく、またはファームウェア、メモリ、他の記憶デバイス、または組み合わせのプログラム命令に従って技術を実行するためにプログラムされた1つ以上の汎用ハードウェアプロセッサを含んでもよい。このような特殊目的のコンピューティングデバイスはまた、カスタムハードワイヤードロジック、ASIC、またはFPGAをカスタムプログラミングと組み合わせて、技術を達成することもできる。特殊目的の計算デバイスは、デスクトップコンピュータシステム、ポータブルコンピュータシステム、ハンドヘルドデバイス、ネットワーキングデバイス、またはこの技術を実施するためにハードワイヤードおよび/またはプログラムロジックを組み込んだ他の任意のデバイスであってもよい。 According to one embodiment, the techniques described herein are implemented by one or more special purpose computing devices. A special-purpose computing device may be hard-wired to perform the technique, or may include one or more application-specific integrated circuits or field-programmable gate arrays that are permanently programmed to perform the technique. or may include one or more general purpose hardware processors programmed to perform the techniques according to a combination of program instructions, firmware, memory, other storage devices, or a combination of programmed instructions. Such special purpose computing devices may also combine custom hardwired logic, ASICs, or FPGAs with custom programming to achieve the technology. The special purpose computing device may be a desktop computer system, a portable computer system, a handheld device, a networking device, or any other device that incorporates hardwired and/or program logic to implement the techniques.

例えば、図5は、本発明の一実施形態を実装することができるコンピュータシステム500を示すブロック図である。コンピュータシステム500は、情報を通信するためのバス502または他の通信メカニズムと、情報を処理するためのバス502と結合されたハードウェアプロセッサ504とを含む。ハードウェアプロセッサ504は、例えば、汎用マイクロプロセッサであってもよい。 For example, FIG. 5 is a block diagram illustrating a computer system 500 in which one embodiment of the invention may be implemented. Computer system 500 includes a bus 502 or other communication mechanism for communicating information, and a hardware processor 504 coupled with bus 502 for processing information. Hardware processor 504 may be, for example, a general purpose microprocessor.

コンピュータシステム500はまた、プロセッサ504によって実行される情報および命令を記憶するためにバス502に結合された、ランダムアクセスメモリまたは他の動的記憶デバイスのようなメインメモリ506を含む。主メモリ506はまた、プロセッサ504によって実行される命令の実行中に、一時変数または他の中間情報を記憶するために使用されてもよい。このような命令は、プロセッサ504にアクセス可能な非一時的記憶媒体に記憶されると、命令に指定された操作を実行するようにカスタマイズされた専用マシンにコンピュータシステム500をレンダリングする。 Computer system 500 also includes main memory 506, such as random access memory or other dynamic storage device, coupled to bus 502 for storing information and instructions executed by processor 504. Main memory 506 may also be used to store temporary variables or other intermediate information during execution of instructions executed by processor 504. Such instructions, when stored on a non-transitory storage medium accessible to processor 504, render computer system 500 into a specialized machine customized to perform the operations specified in the instructions.

コンピュータシステム500は、さらに、バス502に結合された読み出し専用メモリ508または他のスタティック記憶デバイスを含み、プロセッサ504のためのスタティック情報および命令を記憶する。情報および命令を記憶するために、磁気ディスクまたは光ディスクなどの記憶デバイス510が設けられ、バス502に結合される。 Computer system 500 further includes a read-only memory 508 or other static storage device coupled to bus 502 for storing static information and instructions for processor 504. A storage device 510, such as a magnetic or optical disk, is provided and coupled to bus 502 for storing information and instructions.

コンピュータシステム500は、バス502を介して、コンピュータユーザに情報を表示するための液晶ディスプレイのようなディスプレイ512に結合することができる。入力デバイス514は、英数字及び他のキーを含み、情報及びコマンド選択をプロセッサ504に通信するためにバス502に結合される。別のタイプのユーザ入力デバイスは、マウス、トラックボール、またはカーソル方向キーなどのカーソル制御デバイス516であり、方向情報およびコマンド選択をプロセッサ504に通信し、ディスプレイ512上のカーソルの動きを制御する。この入力デバイスは、典型的には、第1の軸(例えば、x)および第2の軸(例えば、y)の2つの軸における2つの自由度を有し、デバイスが平面内の位置を指定することを可能にする。 Computer system 500 may be coupled via bus 502 to a display 512, such as a liquid crystal display, for displaying information to a computer user. Input devices 514, including alphanumeric and other keys, are coupled to bus 502 for communicating information and command selections to processor 504. Another type of user input device is a cursor control device 516, such as a mouse, trackball, or cursor direction keys, that communicates directional information and command selections to processor 504 and controls movement of a cursor on display 512. This input device typically has two degrees of freedom in two axes, a first axis (e.g., x) and a second axis (e.g., y), and the device specifies a position in a plane. make it possible to

コンピュータシステム500は、カスタマイズされたハードワイヤードロジック、1つ以上のASICまたはFPGA、ファームウェア、および/またはプログラムロジックを使用して、本明細書に記載の技術を実装することができ、これらは、コンピュータシステムと組み合わせて、コンピュータシステム500を専用マシンにするか、またはプログラムする。一実施形態によれば、本明細書に記載される技術は、主メモリ506に含まれる1つ以上の命令の1つ以上のシーケンスを実行するプロセッサ504に応答して、コンピュータシステム500によって実行される。そのような命令は、記憶デバイス510のような別の記憶媒体からメインメモリ506に読むことができる。メインメモリ506に含まれる命令のシーケンスの実行により、プロセッサ504は、本明細書に記載のプロセスステップを実行する。別の実施形態では、ハードワイヤード回路が、ソフトウェア命令の代わりに、またはソフトウェア命令と組み合わせて使用されてもよい。 Computer system 500 may implement the techniques described herein using customized hard-wired logic, one or more ASICs or FPGAs, firmware, and/or program logic, which may be used to implement the techniques described herein. In combination with the system, computer system 500 becomes a special purpose machine or is programmed. According to one embodiment, the techniques described herein are performed by computer system 500 in response to processor 504 executing one or more sequences of one or more instructions contained in main memory 506. Ru. Such instructions may be read into main memory 506 from another storage medium, such as storage device 510. Execution of the sequences of instructions contained in main memory 506 causes processor 504 to perform the process steps described herein. In alternative embodiments, hard-wired circuitry may be used in place of or in combination with software instructions.

本明細書で使用される用語「記憶媒体」は、デバイスを特定の態様で動作させるデータおよび/または命令を記憶する任意の非一時的媒体を指す。そのような記憶媒体は、不揮発性媒体および/または揮発性媒体を含んでもよい。不揮発性媒体は、例えば、記憶デバイス510のような光ディスクまたは磁気ディスクを含む。揮発性媒体は、メインメモリ506のようなダイナミックメモリを含む。記憶媒体の一般的な形態としては、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、ソリッドステートドライブ、磁気テープ、または他の任意の磁気データ記憶媒体、CD-ROM、他の任意の光学データ記憶媒体、穴パターンを有する任意の物理媒体、RAM、PROM、およびEPROM、FLASH(登録商標)-EPROM、NVRAM、他の任意のメモリチップまたはカートリッジが挙げられる。 The term "storage medium" as used herein refers to any non-transitory medium that stores data and/or instructions that cause a device to operate in a particular manner. Such storage media may include non-volatile media and/or volatile media. Non-volatile media includes, for example, optical or magnetic disks, such as storage device 510. Volatile media includes dynamic memory, such as main memory 506. Common forms of storage media include, for example, floppy disks, floppy disks, hard disks, solid state drives, magnetic tape or any other magnetic data storage media, CD-ROMs, any other optical data storage media, Any physical media with a hole pattern, including RAM, PROM, and EPROM, FLASH®-EPROM, NVRAM, and any other memory chip or cartridge.

記憶媒体は、伝送媒体とは区別されるが、伝送媒体と共に使用することができる。伝送媒体は、記憶媒体間の情報の転送に関与する。例えば、伝送媒体は、バス502を構成するワイヤを含む同軸ケーブル、銅線および光ファイバを含む。伝送媒体は、また、無線波及び赤外線データ通信の間に発生されるような音波又は光波の形態をとることができる。 Storage media are distinct from, but can be used in conjunction with, transmission media. Transmission media participate in transferring information between storage media. For example, transmission media includes coaxial cables, copper wire, and fiber optics, including the wires that make up bus 502. Transmission media can also take the form of acoustic or light waves, such as those generated during radio wave and infrared data communications.

1つ以上の命令の1つ以上のシーケンスを実行のためにプロセッサ504に搬送することには、様々な形態の媒体が関与し得る。例えば、命令は、最初、遠隔コンピュータの磁気ディスクまたはソリッドステートドライブ上で実行されてもよい。遠隔コンピュータは、命令をそのダイナミックメモリにロードし、モデムを使用して電話回線を介して命令を送信することができる。コンピュータシステム500のモデムローカルは、電話回線上のデータを受信し、赤外線送信機を使用して、データを赤外線信号に変換することができる。赤外線検出器は、赤外線信号内に搬送されたデータを受信することができ、適切な回路は、バス502上にデータを配置することができる。バス502はデータをメインメモリ506に運び、そこからプロセッサ504が命令を取り出して実行する。メインメモリ506によって受信された命令は、任意に、プロセッサ504による実行の前または後のいずれかで、記憶デバイス510上に記憶することができる。 Various forms of media may be involved in carrying one or more sequences of one or more instructions to processor 504 for execution. For example, the instructions may first be executed on a remote computer's magnetic disk or solid state drive. A remote computer can load the instructions into its dynamic memory and transmit the instructions over a telephone line using a modem. A modem local to computer system 500 can receive the data on the telephone line and use an infrared transmitter to convert the data to an infrared signal. An infrared detector can receive the data carried within the infrared signal, and appropriate circuitry can place the data on bus 502. Bus 502 carries data to main memory 506 from where processor 504 retrieves and executes instructions. Instructions received by main memory 506 may optionally be stored on storage device 510 either before or after execution by processor 504.

コンピュータシステム500はまた、バス502に結合された通信インターフェース518を含む。通信インターフェース518は、ローカルネットワーク522に接続されたネットワークリンク520への双方向データ通信結合を提供する。例えば、通信インターフェース518は、統合サービスデジタルネットワークカード、ケーブルモデム、衛星モデム、または対応するタイプの電話回線にデータ通信接続を提供するモデムであってもよい。別の例として、通信インターフェース518は、データ通信接続を互換性のあるLANに提供するためのローカルエリアネットワークカードであってもよい。また、無線リンクが実装されてもよい。そのような実装では、通信インターフェース518は、種々のタイプの情報を表すデジタルデータストリームを搬送する電気信号、電磁信号、または光信号を送受信する。 Computer system 500 also includes a communications interface 518 coupled to bus 502. Communication interface 518 provides bi-directional data communication coupling to network link 520 connected to local network 522. For example, communications interface 518 may be an integrated services digital network card, cable modem, satellite modem, or modem that provides a data communications connection to a corresponding type of telephone line. As another example, communications interface 518 may be a local area network card for providing data communications connectivity to a compatible LAN. A wireless link may also be implemented. In such implementations, communication interface 518 sends and receives electrical, electromagnetic, or optical signals that carry digital data streams representing various types of information.

ネットワークリンク520は、典型的には、1つ以上のネットワークを介して他のデータデバイスへのデータ通信を提供する。例えば、ネットワークリンク520は、ローカルネットワーク522を介してホストコンピュータ524またはインターネットサービスプロバイダ526によって操作されるデータデバイスへの接続を提供することができる。次に、ISP 526は、現在一般に「インターネット」528と呼ばれている世界的なパケットデータ通信ネットワークを介してデータ通信サービスを提供する。ローカルネットワーク522およびインターネット528は両方とも、デジタルデータストリームを搬送する電気信号、電磁信号または光信号を使用する。種々のネットワークを介する信号およびネットワークリンク520上の信号、ならびにコンピュータシステム500との間でデジタルデータを搬送する通信インターフェース518を介する信号は、伝送媒体の例示的な形態である。 Network link 520 typically provides data communication through one or more networks to other data devices. For example, network link 520 may provide a connection through local network 522 to a data device operated by host computer 524 or Internet service provider 526. ISP 526, in turn, provides data communication services via the worldwide packet data communication network, now commonly referred to as the “Internet” 528. Local network 522 and Internet 528 both use electrical, electromagnetic, or optical signals that carry digital data streams. Signals through various networks and signals on network link 520 and communication interface 518 that carry digital data to and from computer system 500 are example forms of transmission media.

コンピュータシステム500は、ネットワーク、ネットワークリンク520および通信インターフェース518を介して、メッセージを送信し、プログラムコードを含むデータを受信することができる。インターネットの例では、サーバ530は、インターネット528、ISP 526、ローカルネットワーク522、および通信インターフェース518を介して、アプリケーションプログラムの要求されたコードを送信することができる。 Computer system 500 can send messages and receive data, including program code, through the network, network link 520 and communication interface 518. In the Internet example, server 530 may transmit the requested code of the application program via Internet 528, ISP 526, local network 522, and communication interface 518.

受信されたコードは、それが受信されたときにプロセッサ504によって実行され、および/または後の実行のために記憶デバイス510、または他の不揮発性記憶デバイスに記憶される。 The received code is executed by processor 504 as it is received and/or stored in storage device 510, or other non-volatile storage device, for later execution.

同等物、拡張、代替物及びその他
先述の明細では、実装ごとに異なる可能性のある多数の具体的詳細を参照して、本発明の実施形態を説明してきた。したがって、本発明のクレームされた実施態様の唯一かつ排他的な指標であって、本発明のクレームされた実施態様であることが出願人によって意図されているものは、この出願から当該クレームが発行された特定の形式のクレームのセットであり、その後の訂正を含む。当該クレームに含まれる用語について本契約に明示的に記載される定義は、当該クレームにおいて使用される用語の意味を支配するものとする。したがって、クレームに明示的に記載されていない限定、要素、特性、特徴、利点又は属性は、そのようなクレームの範囲を決して限定すべきではない。したがって、本明細書および図面は、制限的な意味ではなく例示的な意味に考えられるべきである。
Equivalents, Extensions, Alternatives, and Others In the foregoing specification, embodiments of the invention have been described with reference to numerous specific details that may vary from implementation to implementation. Accordingly, the only and exclusive indication of the claimed embodiments of this invention, and what is intended by applicant to be the claimed embodiments of this invention, is from this application A set of claims in a particular form that has been made, including any subsequent amendments. The definitions expressly set forth in this Agreement for terms contained in such claims shall control the meaning of such terms as used in such claims. Therefore, no limitation, element, property, feature, advantage or attribute that is not expressly recited in a claim should limit the scope of such claim in any way. Accordingly, the specification and drawings are to be regarded in an illustrative rather than a restrictive sense.

本発明の種々の態様は、以下に列挙した実施例(EEE)から理解することができる:
EEE1
後方再整形マッピングテーブルを前方再整形マッピングテーブルの逆として初めに生成するステップであって、前記前方再整形テーブルは、第1のダイナミックレンジの前方再整形された画像を第2のダイナミックレンジのソース画像から生成するための前方再整形マッピングを生成するために使用され、前記第1のダイナミックレンジは前記第2のダイナミックレンジよりも低く、前記前方再整形マッピングテーブルは、前記第2のダイナミックレンジの前記サンプリングされた輝度コードワード、前記第2のダイナミックレンジのサンプリングされた色度コードワード、前記第2のダイナミックレンジの前記サンプリングされた輝度コードワードに対応する前記第1のダイナミックレンジのコンテンツマッピングされた輝度コードワード、及び前記第2のダイナミックレンジの前記サンプリングされた色度コードワードに対応する前記第1のダイナミックレンジのコンテンツマッピングされた色度コードワードを含む、ステップと、
前記コンテンツマッピングされた輝度コードワードを前方再整形された輝度コードワードで置き換えることによって前記後方再整形マッピングテーブルを更新するステップであって、前記前方再整形された輝度コードワードは、前記第2のダイナミックレンジの前記サンプリングされた輝度コードワードに輝度前方マッピングを適用することによって生成され、前記輝度前方マッピングは前記前方再整形マッピングテーブルから構築される、ステップと、
前記第1のダイナミックレンジの前記前方再整形された画像から前記第2のダイナミックレンジの再構成された画像を創るための後方再整形マッピングを生成するために前記後方再整形マッピングテーブルと前記輝度前方マッピングを使用するステップと、
前記前方再整形された画像を、前記後方再整形マッピングを指定する画像メタデータとともに、ビデオ信号中にエンコードするステップとを含む方法。
EEE2
前記ビデオ信号の受信デバイスは、前記後方再整形マッピングを前記前方再整形された画像に適用して、前記第2のダイナミックレンジの前記再構成された画像を創る、EEE1に記載の方法。
EEE3
エンドツーエンドのビデオ配信パイプラインで使用可能な計算リソースを決定するステップと、
前記使用可能な計算リソースを用いて、デコーダ側の前記第2のダイナミックレンジの前記再構成された画像の品質と、エンコーダ側の前記後方再整形マッピングを生成することの計算の複雑さとの間のトレードオフオプションの特定のセットを決定するステップと、
トレードオフオプションの前記特定のセットに従って画像処理操作の特定のセットを実行して、前記後方再整形マッピングを生成するステップとをさらに含む、EEE1又は2に記載の方法。
EEE4
表示画像を前記再構成された画像から導出させ、前記ビデオ信号の受信デバイスでレンダリングさせるステップをさらに含む、EEE2又は3に記載の方法。
EEE5
前記コンテンツマッピングされた色度コードを前方再整形された色度コードワードで置き換えることによって前記後方再整形マッピングテーブルを更新するステップであって、前記前方再整形された色度コードワードは、前記第2のダイナミックレンジの前記サンプリングされた輝度および色度コードワードに多変量重回帰(MMR)色度前方マッピングを適用することによって生成され、前記MMR色度前方マッピングは、前記前方再整形マッピングテーブルから構築される、ステップをさらに含む、EEE1~4のいずれか1つに記載の方法。
EEE6
前記サンプリングされた色度コードワードを不飽和化された色度コードワードで置き換えることによって、前記後方再整形マッピングテーブルを更新するステップをさらに含む、EEE1~5のいずれか1つに記載の方法。
EEE7
前記不飽和化された色度コードワードは、前記サンプリングされた色度コードワードに不飽和化関数を適用することによって生成され、前記不飽和化関数は、修正された輝度後方再整形マッピングと元の輝度後方再整形マッピングとの間の比として構築される、EEE6に記載の方法。
EEE8
前記再構成された画像のバンディングアーチファクトを低減するために、後方ルックアップテーブル修正を適用させるステップをさらに含む、EEE1~7のいずれか1つに記載の方法。
EEE9
前記後方マッピングテーブル及び前記前方マッピングテーブルのうちの少なくとも1つは、少なくとも部分的には前記ソース画像及び前記前方再整形された画像から動的に構築された三次元マッピングテーブル(3DMT)を表す、EEE1~8のいずれか1つに記載の方法。
EEE10
前記輝度前方マッピングは、輝度ルックアップテーブルによって表される、EEE1~9のいずれか1つに記載の方法。
EEE11
前記第2のダイナミックレンジの前記再構成された画像は、前記第2のダイナミックレンジの前記ソース画像を近似する、EEE1~10のいずれか1つに記載の方法。
EEE12
前記ビデオ信号は、単一層の後方互換ビデオ信号を表す、EEE1~11のいずれか1つに記載の方法。
EEE13
第1のダイナミックレンジの前方再整形された画像をビデオ信号からデコードするステップと、
後方再整形マッピングを含む画像メタデータを前記ビデオ信号からデコードするステップであって、前記後方再整形マッピングは、後方再整形マッピングテーブル及び輝度前方マッピングから上流画像処理デバイスによって生成されており、前記後方再整形マッピングテーブルは、前記輝度前方マッピングを生成する前方再整形マッピングテーブルの逆として前記上流画像処理デバイスによって初めに生成されており、前記後方再整形マッピングテーブル内のコンテンツマッピングされた輝度コードワードは、前方再整形された輝度コードワードで更新されており、前記前方再整形された輝度コードワードは、前記ソース画像におけるサンプリングされた輝度コードワードに前記輝度前方マッピングを適用することによって生成されたものである、ステップと、
前記前方再整形された画像に前記後方再整形マッピングを適用して前記再構成された画像を生成するステップと、
前記再構成された画像から導出される表示画像を表示デバイスでレンダリングさせるステップとを含む方法。
EEE14
EEE1~13に記載される方法のいずれか1つを実行するように構成されたコンピュータシステム。
EEE15
プロセッサを含み、EEE1~13に記載される方法のいずれか1つを実行するように構成された装置。
EEE16
EEE1~13に記載の方法のいずれかに従って1つ以上のプロセッサによって方法を実行するためのコンピュータ実行可能命令を記憶した非一時的なコンピュータ読取可能記憶媒体。
Various aspects of the invention can be understood from the examples (EEE) listed below:
EEE1
initially generating a backward reshaping mapping table as the inverse of a forward reshaping mapping table, wherein the forward reshaping table connects the forward reshaping image of a first dynamic range to a source of a second dynamic range; is used to generate a forward reshaping mapping for generating from an image, the first dynamic range being lower than the second dynamic range, and the forward reshaping mapping table being the sampled luminance codeword, the second dynamic range sampled chroma codeword, the first dynamic range content mapped corresponding to the second dynamic range sampled luminance codeword; a content-mapped chroma codeword of the first dynamic range corresponding to the sampled chroma codeword of the second dynamic range;
updating the backward reshaping mapping table by replacing the content mapped brightness codeword with a forward reshaped brightness codeword, wherein the forward reshaped brightness codeword is one of the second brightness codewords; generated by applying a luminance forward mapping to the sampled luminance codewords of a dynamic range, the luminance forward mapping being constructed from the forward reshaping mapping table;
the backward reshaping mapping table and the luminance front to generate a backward reshaping mapping for creating a reconstructed image of the second dynamic range from the forward reshaping image of the first dynamic range; Steps to use mapping and
encoding the forward reshaped image with image metadata specifying the backward reshaping mapping into a video signal.
EEE2
The method of EEE1, wherein the video signal receiving device applies the backward reshaping mapping to the forward reshaping image to create the reconstructed image of the second dynamic range.
EEE3
determining available computational resources in an end-to-end video delivery pipeline;
between the quality of the reconstructed image of the second dynamic range on the decoder side and the computational complexity of generating the backward reshaping mapping on the encoder side using the available computational resources. determining a particular set of trade-off options;
and performing a particular set of image processing operations according to the particular set of trade-off options to generate the backward reshaping mapping.
EEE4
4. A method according to EEE 2 or 3, further comprising the step of deriving a display image from the reconstructed image and rendering it at a receiving device of the video signal.
EEE5
updating the backward reshaping mapping table by replacing the content mapped chroma code with a forward reshape chroma codeword, wherein the forward reshape chroma codeword is generated by applying a multivariate multiple regression (MMR) chroma forward mapping to the sampled luma and chroma codewords of a dynamic range of 2, the MMR chroma forward mapping from the forward reshaping mapping table. 5. The method according to any one of EEE1-4, further comprising the step of constructing.
EEE6
6. The method of any one of EEE1-5, further comprising updating the backward reshaping mapping table by replacing the sampled chroma codeword with a desaturated chroma codeword.
EEE7
The desaturated chroma codeword is generated by applying a desaturation function to the sampled chroma codeword, the desaturation function combining the modified luminance backward reshaping mapping and the original The method according to EEE6, constructed as the ratio between the luminance backward reshaping mapping of .
EEE8
8. The method according to any one of EEE1-7, further comprising applying a backward look-up table modification to reduce banding artifacts in the reconstructed image.
EEE9
at least one of the backward mapping table and the forward mapping table represents a three-dimensional mapping table (3DMT) dynamically constructed from the source image and the forward reshaped image, at least in part; The method described in any one of EEE 1 to 8.
EEE10
A method according to any one of EEE1-9, wherein the brightness forward mapping is represented by a brightness lookup table.
EEE11
11. The method of any one of EEE1-10, wherein the reconstructed image in the second dynamic range approximates the source image in the second dynamic range.
EEE12
12. The method according to any one of EEE1-11, wherein the video signal represents a single layer backward compatible video signal.
EEE13
decoding the first dynamic range forward reshaped image from the video signal;
decoding image metadata from the video signal including a backward reshaping mapping, the backward reshaping mapping being generated by an upstream image processing device from a backward reshaping mapping table and a luminance forward mapping; A reshaping mapping table is initially generated by the upstream image processing device as the inverse of the forward reshaping mapping table that generates the luminance forward mapping, and the content mapped luminance codewords in the backward reshaping mapping table are , updated with a forward reshaped luminance codeword, the forward reshaped luminance codeword generated by applying the luminance forward mapping to the sampled luminance codeword in the source image. The steps are:
applying the backward reshaping mapping to the forward reshaping image to generate the reconstructed image;
causing a display device to render a display image derived from the reconstructed image.
EEE14
A computer system configured to perform any one of the methods described in EEE1-13.
EEE15
An apparatus comprising a processor and configured to perform any one of the methods described in EEE1-13.
EEE16
A non-transitory computer-readable storage medium having computer-executable instructions stored thereon for performing a method by one or more processors according to any of the methods described in EEE1-13.

Claims (17)

後方再整形マッピングテーブルを前方再整形マッピングテーブルの逆として初めに生成するステップであって、前記前方再整形マッピングテーブルは、第1のダイナミックレンジの前方再整形された画像を第2のダイナミックレンジのソース画像から生成するための前方再整形マッピングを生成するために使用され、前記第1のダイナミックレンジは前記第2のダイナミックレンジよりも低く、前記前方再整形マッピングテーブルは、前記ソース画像からのサンプルの前記第2のダイナミックレンジの輝度コードワード、及び前記第2のダイナミックレンジの色度コードワード、並びに前記ソース画像をカラーグレーディングすることによって生成される前記第1のダイナミックレンジの基準画像からの対応するサンプルの前記第1のダイナミックレンジの輝度コードワード、及び前記第1のダイナミックレンジの色度コードワードを含み、前記ソース画像からの前記サンプルの数は、前記ソース画像内の画素の数と比較して低減される、ステップと、
前記後方再整形マッピングテーブルにおいて前記第1のダイナミックレンジの前記輝度コードワードを前方再整形された輝度コードワードで置き換えることによって前記後方再整形マッピングテーブルを更新するステップであって、前記前方再整形された輝度コードワードは、前記第2のダイナミックレンジの前記輝度コードワードに輝度前方再整形関数を適用することによって生成され、前記輝度前方再整形関数は前記前方再整形マッピングテーブルから累積密度関数(CDF)マッチングを用いて構築される、ステップと、
前記第1のダイナミックレンジの輝度コードワードを前記第2のダイナミックレンジの輝度コードワードにマッピングする輝度後方再整形関数を前記輝度前方再整形関数から構築するステップと、
バンディングアーチファクトを示すことなく表され得る推計された最大の輝度レンジと前記輝度後方再整形関数によって表される実際の輝度レンジとの間の比に基づいて前記第1のダイナミックレンジの特定の輝度コードワードより上の前記輝度後方再整形関数の一部を修正するステップと、
前記後方再整形マッピングテーブルにおいて前記第2のダイナミックレンジの前記色度コードワードを不飽和化された色度コードワードで置き換えることによって前記後方再整形マッピングテーブルを更新するステップであって、前記不飽和化された色度コードワードは、前記第2のダイナミックレンジの前記色度コードワードに不飽和化関数を適用することによって適用され、前記不飽和化関数は、前記修正された輝度後方再整形関数と元の輝度後方再整形関数との間の比に基づいて構築される、ステップと、
前記第1のダイナミックレンジの前記前方再整形された画像から前記第2のダイナミックレンジの再構成された画像を創るための後方再整形マッピングを生成するために前記後方再整形マッピングテーブルと前記輝度前方再整形関数を使用するステップと、
前記前方再整形された画像を、前記後方再整形マッピングを指定する画像メタデータとともに、ビデオ信号中にエンコードするステップを含む方法。
initially generating a backward reshaping mapping table as the inverse of a forward reshaping mapping table, the forward reshaping mapping table combining a forward reshaping image of a first dynamic range with a forward reshaping mapping table of a second dynamic range; the forward reshaping mapping table is used to generate a forward reshaping mapping for generating from a source image, the first dynamic range being lower than the second dynamic range; the second dynamic range luminance codeword of and the second dynamic range chroma codeword of , and the correspondence from the first dynamic range reference image produced by color grading the source image. a first dynamic range of luminance codewords of samples, and a first dynamic range of chroma codewords of samples, the number of samples from the source image being compared to the number of pixels in the source image. and a step that is reduced by
updating the backward reshaping mapping table by replacing the luminance codewords of the first dynamic range in the backward reshaping mapping table with forward reshaped luminance codewords; a luminance codeword of the second dynamic range is generated by applying a luminance forward reshaping function to the luminance codeword of the second dynamic range, the luminance forward reshaping function extracting a cumulative density function (CDF) from the forward reshaping mapping table. ) is constructed using a matching step;
constructing a luminance backward reshaping function from the luminance forward reshaping function that maps luminance codewords of the first dynamic range to luminance codewords of the second dynamic range;
a particular luminance code of said first dynamic range based on a ratio between an estimated maximum luminance range that can be represented without exhibiting banding artifacts and an actual luminance range represented by said luminance backward reshaping function; modifying a portion of the luminance backward reshaping function above the word;
updating the backward reshaping mapping table by replacing the chroma codeword of the second dynamic range in the backward reshaping mapping table with a desaturated chroma codeword, The modified chroma codeword is applied by applying a desaturation function to the chroma codeword of the second dynamic range, the desaturation function being the modified luminance backward reshaping function. and the original luminance backward reshaping function.
the backward reshaping mapping table and the luminance front to generate a backward reshaping mapping for creating a reconstructed image of the second dynamic range from the forward reshaping image of the first dynamic range; a step of using a reshaping function;
A method comprising encoding the forward reshaped image with image metadata specifying the backward reshaping mapping into a video signal.
エンドツーエンドのビデオ配信パイプラインで使用可能な計算リソースを決定するステップと、
前記使用可能な計算リソースを用いて、デコーダ側の前記第2のダイナミックレンジの前記再構成された画像の品質と、エンコーダ側の前記後方再整形マッピングを生成することの計算の複雑さとの間のトレードオフオプションの特定のセットを決定するステップと、
トレードオフオプションの前記特定のセットに従って画像処理操作の特定のセットを実行して、前記後方再整形マッピングを生成するステップとをさらに含む、請求項1に記載の方法。
determining available computational resources in an end-to-end video delivery pipeline;
between the quality of the reconstructed image of the second dynamic range on the decoder side and the computational complexity of generating the backward reshaping mapping on the encoder side using the available computational resources. determining a particular set of trade-off options;
2. The method of claim 1, further comprising: performing a particular set of image processing operations according to the particular set of trade-off options to generate the backward reshaping mapping.
表示画像を前記再構成された画像から導出させ、前記ビデオ信号の受信デバイスでレンダリングさせるステップをさらに含む、請求項1または2に記載の方法。 3. A method according to claim 1 or 2, further comprising the step of deriving a display image from the reconstructed image and rendering it at a receiving device of the video signal. 前記後方再整形マッピングテーブル内で前記第1のダイナミックレンジの前記色度コードワードを前方再整形された色度コードワードで置き換えることによって前記後方再整形マッピングテーブルを更新するステップであって、前記前方再整形された色度コードワードは、前記第2のダイナミックレンジの前記輝度および色度コードワードに多変量重回帰(MMR)色度前方マッピングを適用することによって生成され、前記MMR色度前方マッピングは、前記前方再整形マッピングテーブルから構築される、ステップをさらに含む、請求項1~3のいずれか1項に記載の方法。 updating the backward reshaping mapping table by replacing the chroma codeword of the first dynamic range in the backward reshaping mapping table with a forward reshaping chroma codeword; A reshaped chroma codeword is generated by applying multivariate multiple regression (MMR) chroma forward mapping to the luminance and chroma codewords of the second dynamic range, the MMR chroma forward mapping A method according to any one of claims 1 to 3, further comprising the step of: is constructed from the forward reshaping mapping table. 前記再構成された画像のバンディングアーチファクトを低減するために、後方ルックアップテーブル修正を適用させるステップをさらに含む、請求項1~4のいずれか1項に記載の方法。 A method according to any preceding claim, further comprising applying a backward look-up table modification to reduce banding artifacts in the reconstructed image. 前記後方再整形マッピングテーブル及び前記前方再整形マッピングテーブルのうちの少なくとも1つは、前記ソース画像及び前記前方再整形された画像から少なくとも部分的に動的に構築された三次元マッピングテーブル(3DMT)を表す、請求項1~5のいずれか1項に記載の方法。 At least one of the backward reshaped mapping table and the forward reshaped mapping table is a three-dimensional mapping table (3DMT) dynamically constructed at least in part from the source image and the forward reshaped image. The method according to any one of claims 1 to 5, wherein the method represents: 前記輝度前方再整形関数は、輝度ルックアップテーブルによって表される、請求項1~6のいずれか1項に記載の方法。 A method according to any preceding claim, wherein the intensity forward reshaping function is represented by an intensity lookup table. 前記第2のダイナミックレンジの前記再構成された画像は、前記第2のダイナミックレンジの前記ソース画像を近似する、請求項1~7のいずれか1項に記載の方法。 A method according to any preceding claim, wherein the reconstructed image of the second dynamic range approximates the source image of the second dynamic range. 前記ビデオ信号は、単一層の後方互換ビデオ信号を表す、請求項1~8のいずれか1項に記載の方法。 A method according to any preceding claim, wherein the video signal represents a single layer backward compatible video signal. 前記ビデオ信号の受信デバイスは、前記前方再整形された画像に前記後方再整形マッピングを適用して、前記第2のダイナミックレンジの前記再構成された画像を創る、請求項1~9のいずれか1項に記載の方法。 The video signal receiving device applies the backward reshaping mapping to the forward reshaping image to create the reconstructed image of the second dynamic range. The method described in Section 1. 第1のダイナミックレンジの前方再整形された画像を、請求項1~10のいずれか1項に記載の方法で生成された前記ビデオ信号からデコードするステップであって、前記前方再整形された画像は、前方再整形マッピングテーブルから生成される前方再整形マッピングによって第2のダイナミックレンジのソース画像から生成され、前記前方再整形マッピングテーブルは、前記ソース画像からのサンプルの前記第2のダイナミックレンジの輝度コードワード及び前記第2のダイナミックレンジの色度コードワード、並びに前記ソース画像をカラーグレーディングすることによって生成された前記第1のダイナミックレンジの基準画像からの対応するサンプルの前記第1のダイナミックレンジの輝度コードワード及び前記第1のダイナミックレンジの色度コードワードを含み、前記ソース画像からのサンプルの数は、前記ソース画像内の画素の数と比較して低減される、ステップと、
後方再整形マッピングを含む画像メタデータを前記ビデオ信号からデコードするステップと、
前記前方再整形された画像に前記後方再整形マッピングを適用して再構成された画像を生成するステップと、
前記再構成された画像から導出される表示画像を表示デバイスでレンダリングさせるステップとを含む方法。
decoding a forward reshaped image of a first dynamic range from the video signal generated by the method according to any one of claims 1 to 10, the step of decoding a forward reshaped image of a first dynamic range; is generated from a source image of a second dynamic range by a forward reshaping mapping table that is generated from a forward reshaping mapping table, the forward reshaping mapping table being configured to calculate the second dynamic range of samples from the source image. a luminance codeword and a chromaticity codeword of the second dynamic range and the first dynamic range of corresponding samples from the first dynamic range reference image generated by color grading the source image; a luma codeword of the first dynamic range and a chroma codeword of the first dynamic range, the number of samples from the source image being reduced compared to the number of pixels in the source image;
decoding image metadata including backward reshaping mapping from the video signal;
applying the backward reshaping mapping to the forward reshaping image to generate a reconstructed image;
causing a display device to render a display image derived from the reconstructed image.
請求項1~10のいずれか1項に記載の方法を実行するように構成されたコンピュータシステム。 A computer system configured to carry out the method according to any one of claims 1 to 10 . 請求項11に記載の方法を実行するように構成されたコンピュータシステム。 A computer system configured to perform the method of claim 11. プロセッサを含み、請求項1~10のいずれか1項に記載の方法を実行するように構成された装置。 Apparatus comprising a processor and configured to carry out a method according to any one of claims 1 to 10 . プロセッサを含み、請求項11に記載の方法を実行するように構成された装置。 12. An apparatus comprising a processor and configured to perform the method of claim 11. 請求項1~10のいずれか1項に記載の方法に従って1つ以上のプロセッサによって方法を実行するためのコンピュータ実行可能命令を記憶した非一時的なコンピュータ読取可能記憶媒体。 A non-transitory computer-readable storage medium having computer-executable instructions stored thereon for performing the method by one or more processors according to the method of any one of claims 1-10 . 請求項11に記載の方法に従って1つ以上のプロセッサによって方法を実行するためのコンピュータ実行可能命令を記憶した非一時的なコンピュータ読取可能記憶媒体。 12. A non-transitory computer-readable storage medium having computer-executable instructions stored thereon for performing the method by one or more processors in accordance with the method of claim 11.
JP2022522878A 2019-10-17 2020-10-16 Adjustable tradeoff between quality and computational complexity in video codecs Active JP7439251B2 (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962916579P 2019-10-17 2019-10-17
EP19203773.7 2019-10-17
EP19203773 2019-10-17
US62/916,579 2019-10-17
PCT/US2020/055864 WO2021076822A1 (en) 2019-10-17 2020-10-16 Adjustable trade-off between quality and computation complexity in video codecs

Publications (2)

Publication Number Publication Date
JP2023501885A JP2023501885A (en) 2023-01-20
JP7439251B2 true JP7439251B2 (en) 2024-02-27

Family

ID=73043325

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022522878A Active JP7439251B2 (en) 2019-10-17 2020-10-16 Adjustable tradeoff between quality and computational complexity in video codecs

Country Status (7)

Country Link
US (1) US11818400B2 (en)
EP (1) EP4046383B1 (en)
JP (1) JP7439251B2 (en)
CN (1) CN114556940B (en)
ES (1) ES3017417T3 (en)
PL (1) PL4046383T3 (en)
WO (1) WO2021076822A1 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115362675B (en) * 2020-04-03 2025-02-11 杜比实验室特许公司 Blind local shaping in HDR imaging
JP7827882B2 (en) 2022-03-18 2026-03-10 ドルビー ラボラトリーズ ライセンシング コーポレイション Image optimization in mobile capture and editing applications
EP4533792A1 (en) 2022-05-24 2025-04-09 Dolby Laboratories Licensing Corporation Neutral color preservation for single-layer backward compatible codec
WO2023244616A1 (en) * 2022-06-14 2023-12-21 Dolby Laboratories Licensing Corporation Video delivery system capable of dynamic-range changes
CN116684629A (en) * 2023-07-12 2023-09-01 维沃移动通信有限公司 Video encoding and decoding method, device, electronic equipment and medium
CN118643006B (en) * 2024-08-16 2024-10-29 山东大学 Reconstruction optimization method and encoding and decoding circuit of nonvolatile FPGA based on lookup table input inversion

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180007356A1 (en) 2016-06-29 2018-01-04 Dolby Laboratories Licensing Corporation Reshaping curve optimization in hdr coding
US20190110054A1 (en) 2016-03-23 2019-04-11 Dolby Laboratories Licensing Corporation Encoding and Decoding Reversible Production-Quality Single-Layer Video Signals

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102209563B1 (en) * 2014-08-08 2021-02-02 코닌클리케 필립스 엔.브이. Methods and apparatuses for encoding hdr images
CN107409221B (en) * 2015-03-20 2019-06-14 杜比实验室特许公司 Encoding method, decoding method, encoding apparatus, decoding apparatus, computing device, and storage medium
TWI764870B (en) * 2015-07-28 2022-05-21 法商內數位麥德遜專利控股有限公司 Video signal processing device and method
US10311558B2 (en) * 2015-11-16 2019-06-04 Dolby Laboratories Licensing Corporation Efficient image processing on content-adaptive PQ signal domain
US10165275B2 (en) * 2016-01-26 2018-12-25 Dolby Laboratories Licensing Corporation Content-adaptive reshaping for high dynamic range images
US10032262B2 (en) * 2016-02-02 2018-07-24 Dolby Laboratories Licensing Corporation Block-based content-adaptive reshaping for high dynamic range images
WO2018049335A1 (en) * 2016-09-09 2018-03-15 Dolby Laboratories Licensing Corporation Coding of high dynamic range video using segment-based reshaping
US10575028B2 (en) 2016-09-09 2020-02-25 Dolby Laboratories Licensing Corporation Coding of high dynamic range video using segment-based reshaping
EP3306563B1 (en) * 2016-10-05 2022-01-12 Dolby Laboratories Licensing Corporation Inverse luma/chroma mappings with histogram transfer and approximation
US10264287B2 (en) 2016-10-05 2019-04-16 Dolby Laboratories Licensing Corporation Inverse luma/chroma mappings with histogram transfer and approximation
JP6684971B2 (en) * 2017-01-18 2020-04-22 ドルビー ラボラトリーズ ライセンシング コーポレイション Segment-based reconstruction for encoding high dynamic range video
WO2019217751A1 (en) 2018-05-11 2019-11-14 Dolby Laboratories Licensing Corporation High-fidelity full reference and high-efficiency reduced reference encoding in end-to-end single-layer backward compatible encoding pipeline
US11277646B2 (en) 2018-10-03 2022-03-15 Dolby Laboratories Licensing Corporation Reducing banding artifacts in backward-compatible HDR imaging

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190110054A1 (en) 2016-03-23 2019-04-11 Dolby Laboratories Licensing Corporation Encoding and Decoding Reversible Production-Quality Single-Layer Video Signals
US20180007356A1 (en) 2016-06-29 2018-01-04 Dolby Laboratories Licensing Corporation Reshaping curve optimization in hdr coding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PU, Fangjun et al.,CE12-4: SDR In-loop Reshaping,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 12th Meeting: Macao, CN, 3-12 Oct. 2018, [JVET-L0246-v2],JVET-L0246 (version 2),ITU-T,2018年10月04日,<URL:https://jvet-experts.org/doc_end_user/documents/12_Macao/wg11/JVET-L0246-v2.zip>: JVET-L0246_CE12-4_SDR_inloop_reshaping_v2.docx: pp. 1-9

Also Published As

Publication number Publication date
ES3017417T3 (en) 2025-05-12
CN114556940B (en) 2024-10-29
EP4046383B1 (en) 2025-03-05
WO2021076822A1 (en) 2021-04-22
EP4046383C0 (en) 2025-03-05
US20230171436A1 (en) 2023-06-01
CN114556940A (en) 2022-05-27
EP4046383A1 (en) 2022-08-24
JP2023501885A (en) 2023-01-20
PL4046383T3 (en) 2025-04-28
US11818400B2 (en) 2023-11-14

Similar Documents

Publication Publication Date Title
CN112106357B (en) Method and device for encoding and decoding image data
JP7439251B2 (en) Adjustable tradeoff between quality and computational complexity in video codecs
US10659749B2 (en) Efficient histogram-based luma look matching
CN108885783B (en) Encode and decode reversible production quality single-layer video signals
EP3734588B1 (en) Color appearance preservation in video codecs
JP7094451B2 (en) Interpolation of reconstruction function
JP7037584B2 (en) Efficient end-to-end single layer reverse display management coding
JP7831903B2 (en) Image enhancement through global and local reshaping.
US12003746B2 (en) Joint forward and backward neural network optimization in image processing
CN115699734B (en) Method, apparatus, medium and computer program product for generating shaping functions
CN114175647B (en) Electro-optical transfer function conversion and signal legalization
JP2023540447A (en) Adaptive streaming with false contour reduction
JP7434554B2 (en) Cascade prediction
JP7543577B2 (en) Optimization of chain reshaping functions
CN117426091A (en) Chain-shaping function optimization
CN116888959A (en) Image enhancement via global and local shaping
HK40097929B (en) Method for generating or rendering in an image, and computing apparatus
HK40097929A (en) Method for generating or rendering in an image, and computing apparatus
HK1257716B (en) Encoding and decoding reversible production-quality single-layer video signals

Legal Events

Date Code Title Description
A529 Written submission of copy of amendment under article 34 pct

Free format text: JAPANESE INTERMEDIATE CODE: A529

Effective date: 20220615

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220615

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230801

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231025

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240214

R150 Certificate of patent or registration of utility model

Ref document number: 7439251

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150