JP7704810B2 - エンコーダ、デコーダ、および対応する方法 - Google Patents
エンコーダ、デコーダ、および対応する方法 Download PDFInfo
- Publication number
- JP7704810B2 JP7704810B2 JP2023101903A JP2023101903A JP7704810B2 JP 7704810 B2 JP7704810 B2 JP 7704810B2 JP 2023101903 A JP2023101903 A JP 2023101903A JP 2023101903 A JP2023101903 A JP 2023101903A JP 7704810 B2 JP7704810 B2 JP 7704810B2
- Authority
- JP
- Japan
- Prior art keywords
- picture
- flag
- value
- gdr
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/107—Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/162—User input
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/188—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/1883—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/423—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/55—Motion estimation with spatial constraints, e.g. at image or region borders
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/63—Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
- H04N21/633—Control signals issued by server directed to the network components or client
- H04N21/6332—Control signals issued by server directed to the network components or client directed to client
- H04N21/6336—Control signals issued by server directed to the network components or client directed to client directed to decoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/141—Systems for two-way working between two video terminals, e.g. videophone
- H04N7/147—Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
る技法を説明する。より詳細には、本開示は、イントラランダムアクセスポイント(IRAP:
intra random access point)ピクチャを使用する必要なく順次イントラリフレッシュがラ
ンダムアクセスを有効化することを可能とする。
ことは、帯域幅容量が限定された通信ネットワークを横断してデータがストリーミングま
たは別の方法で通信されることになるときに困難をもたらす場合がある。したがって、ビ
デオデータは、一般に、現代の電気通信ネットワークを横断して通信される前に圧縮され
る。メモリリソースが限定されることがあるので、ビデオが記憶デバイス上に記憶される
ときも、ビデオのサイズが問題であり得る。ビデオ圧縮デバイスは、しばしば、ソースに
おいてソフトウェアおよび/またはハードウェアを使用して、送信または記憶の前にビデ
オデータをコーディングし、それによって、デジタルビデオ画像を描写するために必要と
されるデータの量を減らす。圧縮されたデータは、次いで、ビデオデータを復号するビデ
オ復元デバイスによって宛先において受信される。ネットワークリソースが限定され、よ
り高いビデオ品質の需要が絶えず増大すると、画像品質における犠牲をほとんど伴わずに
圧縮率を改善する、改善された圧縮および復元技法が望ましい。
ストリームを復号する方法に関する。方法は、第1のフラグに対する値が外部入力によっ
て提供されるかどうかをビデオデコーダによって決定するステップと、第1のフラグに対
する値が外部入力によって提供されるとき、コーディングされたビデオビットストリーム
の中の漸進的復号リフレッシュ(GDR:gradual decoding refresh)ピクチャが出力されるこ
とを防止するために、第1のフラグを、外部入力によって提供される値に等しく、かつ第2
のフラグを第1のフラグに等しく、ビデオデコーダによって設定するステップと、GDRピク
チャをビデオデコーダによって復号するステップと、ビデオデコーダによってGDRピクチ
ャを復号ピクチャバッファ(DPB:decoded picture buffer)の中に記憶するステップとを含
む。
イントラリフレッシュがランダムアクセスを有効化することを可能とする技法を提供する
。第1のフラグに対する値が外部入力によって提供されるとき、漸進的復号リフレッシュ(
GDR)ピクチャが出力されることを防止するために、第1のフラグは外部入力によって提供
される値に等しく設定され、第2のフラグは第1のフラグに等しく設定される。外部入力は
、たとえば、ビデオデコーダのグラフィックユーザインターフェース(GUI)を介してユー
ザ(たとえば、ネットワークアドミニストレータ)から受け取られる入力であってもよい。
このようにして第1および第2のフラグを設定することは、潜在的にダーティなデータがデ
ィスプレイに出力されることを防止する。すなわち、第1および第2のフラグの値は、GDR
ピクチャからの潜在的にダーティなデータが出力されるかどうか、またはビデオデコーダ
が完全な同期を待ってデータを表示し始めるかどうかを制御する。ダーティなデータが出
力されることを制限するための能力を有することによって、ビデオコーディングにおける
コーダ/デコーダ(「コーデック」とも呼ばれる)が、現在のコーデックに比べて改善され
る。実際問題として、改善されたビデオコーディングプロセスは、ビデオが送られ、受け
取られ、かつ/または見られるとき、より良好なユーザエクスペリエンスをユーザに与え
る。
力によって提供されるとき、漸進的復号リフレッシュ(GDR)ピクチャおよび出力順序でGDR
ピクチャとリカバリポイントピクチャとの間の任意のトレーリングピクチャが出力される
ことを防止するために、第1のフラグは外部入力によって提供される値に等しく、かつ第2
のフラグは第1のフラグに等しく設定される。
形式では、外部入力は、ビデオデコーダのグラフィックユーザインターフェース(GUI)で
あり、第1のフラグの値は、外部入力を使用してビデオデコーダのユーザによって提供さ
れる。
形式では、第1のフラグはHandleGdrAsCvsStartFlagと指定される。
形式では、GDRピクチャおよび出力順序でGDRピクチャとリカバリポイントピクチャとの間
の任意のトレーリングピクチャが出力されることを防止するために、第1のフラグおよび
第2のフラグの値は1に設定される。
形式では、第1のフラグに対する値が外部入力によって提供されないとき、第1のフラグの
値は0に設定される。
ットストリームを受信するように構成された受信機と、受信機に結合されたメモリであっ
て、命令を記憶する、メモリと、メモリに結合されたプロセッサとを含み、プロセッサは
、復号デバイスに、第1のフラグに対する値が外部入力によって提供されるかどうかを決
定することと、第1のフラグに対する値が外部入力によって提供されるとき、漸進的復号
リフレッシュ(GDR)ピクチャが出力されることを防止するために、第1のフラグを、外部入
力によって提供される値に等しく、かつ第2のフラグを第1のフラグに等しく設定すること
と、GDRピクチャを復号することと、GDRピクチャを復号ピクチャバッファ(DPB)の中に記
憶することとをさせるために、命令を実行するように構成される。
く順次イントラリフレッシュがランダムアクセスを有効化することを可能とする技法を提
供する。第1のフラグに対する値が外部入力によって提供されるとき、漸進的復号リフレ
ッシュ(GDR)ピクチャが出力されることを防止するために、第1のフラグは外部入力によっ
て提供される値に等しく設定され、第2のフラグは第1のフラグに等しく設定される。外部
入力は、たとえば、ビデオデコーダのグラフィックユーザインターフェース(GUI)を介し
てユーザ(たとえば、ネットワークアドミニストレータ)から受け取られる入力であっても
よい。このようにして第1および第2のフラグを設定することは、潜在的にダーティなデー
タがディスプレイに出力されることを防止する。すなわち、第1および第2のフラグの値は
、GDRピクチャからの潜在的にダーティなデータが出力されるかどうか、またはビデオデ
コーダが完全な同期を待ってデータを表示し始めるかどうかを制御する。ダーティなデー
タが出力されることを制限するための能力を有することによって、ビデオコーディングに
おけるコーダ/デコーダ(「コーデック」とも呼ばれる)が、現在のコーデックに比べて改
善される。実際問題として、改善されたビデオコーディングプロセスは、ビデオが送られ
、受け取られ、かつ/または見られるとき、より良好なユーザエクスペリエンスをユーザ
に与える。
が外部入力によって提供されるとき、漸進的復号リフレッシュ(GDR)ピクチャおよび出力
順序でGDRピクチャとリカバリポイントピクチャとの間の任意のトレーリングピクチャが
出力されることを防止するために、第1のフラグは外部入力によって提供される値に等し
く、かつ第2のフラグは第1のフラグに等しく設定される。
ーダのグラフィックユーザインターフェース(GUI)であり、第1のフラグの値は、外部入力
を使用してビデオデコーダのユーザによって提供される。
AsCvsStartFlagと指定される。
順序でGDRピクチャとリカバリポイントピクチャとの間の任意のトレーリングピクチャが
出力されることを防止するために、第1のフラグおよび第2のフラグの値は1に設定される
。
が外部入力によって提供されないとき、第1のフラグの値は0に設定される。
ャを受信するか、または復号すべきビットストリームを受信するように構成された、受信
機と、受信機に結合された送信機であって、ビットストリームをデコーダへ送信するか、
または復号画像をディスプレイへ送信するように構成された、送信機と、受信機または送
信機のうちの少なくとも1つに結合されたメモリであって、命令を記憶するように構成さ
れた、メモリと、メモリに結合されたプロセッサであって、本明細書で開示する方法のう
ちのいずれかを実行するために、メモリの中に記憶された命令を実行するように構成され
た、プロセッサとを含む。
要なく順次イントラリフレッシュがランダムアクセスを有効化することを可能とする技法
を提供する。第1のフラグに対する値が外部入力によって提供されるとき、漸進的復号リ
フレッシュ(GDR)ピクチャが出力されることを防止するために、第1のフラグは外部入力に
よって提供される値に等しく設定され、第2のフラグは第1のフラグに等しく設定される。
外部入力は、たとえば、ビデオデコーダのグラフィックユーザインターフェース(GUI)を
介してユーザ(たとえば、ネットワークアドミニストレータ)から受け取られる入力であっ
てもよい。このようにして第1および第2のフラグを設定することは、潜在的にダーティな
データがディスプレイに出力されることを防止する。すなわち、第1および第2のフラグの
値は、GDRピクチャからの潜在的にダーティなデータが出力されるかどうか、またはビデ
オデコーダが完全な同期を待ってデータを表示し始めるかどうかを制御する。ダーティな
データが出力されることを制限するための能力を有することによって、ビデオコーディン
グにおけるコーダ/デコーダ(「コーデック」とも呼ばれる)が、現在のコーデックに比べ
て改善される。実際問題として、改善されたビデオコーディングプロセスは、ビデオが送
られ、受け取られ、かつ/または見られるとき、より良好なユーザエクスペリエンスをユ
ーザに与える。
に構成されたディスプレイをさらに備える。
いるデコーダとを含み、エンコーダまたはデコーダは、本明細書で開示する復号デバイス
、符号化デバイス、またはコーディング装置を含む。
次イントラリフレッシュがランダムアクセスを有効化することを可能とする技法を提供す
る。第1のフラグに対する値が外部入力によって提供されるとき、漸進的復号リフレッシ
ュ(GDR)ピクチャが出力されることを防止するために、第1のフラグは外部入力によって提
供される値に等しく設定され、第2のフラグは第1のフラグに等しく設定される。外部入力
は、たとえば、ビデオデコーダのグラフィックユーザインターフェース(GUI)を介してユ
ーザ(たとえば、ネットワークアドミニストレータ)から受け取られる入力であってもよい
。このようにして第1および第2のフラグを設定することは、潜在的にダーティなデータが
ディスプレイに出力されることを防止する。すなわち、第1および第2のフラグの値は、GD
Rピクチャからの潜在的にダーティなデータが出力されるかどうか、またはビデオデコー
ダが完全な同期を待ってデータを表示し始めるかどうかを制御する。ダーティなデータが
出力されることを制限するための能力を有することによって、ビデオコーディングにおけ
るコーダ/デコーダ(「コーデック」とも呼ばれる)が、現在のコーデックに比べて改善さ
れる。実際問題として、改善されたビデオコーディングプロセスは、ビデオが送られ、受
け取られ、かつ/または見られるとき、より良好なユーザエクスペリエンスをユーザに与
える。
、符号化すべきピクチャを受信するか、または復号すべきビットストリームを受信するよ
うに構成された、受信手段と、受信手段に結合された送信手段であって、ビットストリー
ムを復号手段へ送信するか、または復号画像を表示手段へ送信するように構成された、送
信手段と、受信手段または送信手段のうちの少なくとも1つに結合された記憶手段であっ
て、命令を記憶するように構成された、記憶手段と、記憶手段に結合された処理手段であ
って、本明細書で開示する方法のうちのいずれかを実行するために、記憶手段の中に記憶
された命令を実行するように構成された、処理手段とを含む。
使用する必要なく順次イントラリフレッシュがランダムアクセスを有効化することを可能
とする技法を提供する。第1のフラグに対する値が外部入力によって提供されるとき、漸
進的復号リフレッシュ(GDR)ピクチャが出力されることを防止するために、第1のフラグは
外部入力によって提供される値に等しく設定され、第2のフラグは第1のフラグに等しく設
定される。外部入力は、たとえば、ビデオデコーダのグラフィックユーザインターフェー
ス(GUI)を介してユーザ(たとえば、ネットワークアドミニストレータ)から受け取られる
入力であってもよい。このようにして第1および第2のフラグを設定することは、潜在的に
ダーティなデータがディスプレイに出力されることを防止する。すなわち、第1および第2
のフラグの値は、GDRピクチャからの潜在的にダーティなデータが出力されるかどうか、
またはビデオデコーダが完全な同期を待ってデータを表示し始めるかどうかを制御する。
ダーティなデータが出力されることを制限するための能力を有することによって、ビデオ
コーディングにおけるコーダ/デコーダ(「コーデック」とも呼ばれる)が、現在のコーデ
ックに比べて改善される。実際問題として、改善されたビデオコーディングプロセスは、
ビデオが送られ、受け取られ、かつ/または見られるとき、より良好なユーザエクスペリ
エンスをユーザに与える。
理解される、以下の簡潔な説明を次に参照し、同様の参照番号は同様の部分を表す。
コーディングシステム10を示すブロック図である。図1に示すように、コーディングシス
テム10は、後で宛先デバイス14によって復号されるべき符号化ビデオデータを提供するソ
ースデバイス12を含む。詳細には、ソースデバイス12は、コンピュータ可読媒体16を介し
て宛先デバイス14にビデオデータを提供してもよい。ソースデバイス12および宛先デバイ
ス14は、デスクトップコンピュータ、ノートブック(たとえば、ラップトップ)コンピュー
タ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなど
の電話ハンドセット、いわゆる「スマート」パッド、テレビ、カメラ、ディスプレイデバ
イス、デジタルメディアプレーヤ、ビデオゲーム機、ビデオストリーミングデバイスなど
を含む、幅広いデバイスのうちのいずれかを備えてもよい。場合によっては、ソースデバ
イス12および宛先デバイス14は、ワイヤレス通信のために装備されてもよい。
ータを受信してもよい。コンピュータ可読媒体16は、符号化ビデオデータをソースデバイ
ス12から宛先デバイス14に移動させることが可能な任意のタイプの媒体またはデバイスを
備えてもよい。一例では、コンピュータ可読媒体16は、ソースデバイス12が符号化ビデオ
データを宛先デバイス14へリアルタイムで直接送信することを可能にするための通信媒体
を備えてもよい。符号化ビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従
って変調されてもよく、宛先デバイス14へ送信されてもよい。通信媒体は、無線周波数(R
F)スペクトルまたは1つ以上の物理伝送線路などの、任意のワイヤレスまたは有線の通信
媒体を備えてもよい。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワ
ーク、またはインターネットなどのグローバルネットワークなどの、パケットベースネッ
トワークの一部を形成してもよい。通信媒体は、ルータ、スイッチ、基地局、またはソー
スデバイス12から宛先デバイス14への通信を容易にするために有用であり得る任意の他の
機器を含んでもよい。
されてもよい。同様に、符号化データは、入力インターフェースによって記憶デバイスか
らアクセスされてもよい。記憶デバイスは、ハードドライブ、Blu-rayディスク、デジタ
ルビデオディスク(DVD)、コンパクトディスク読取り専用メモリ(CD-ROM)、フラッシュメ
モリ、揮発性メモリもしくは不揮発性メモリ、または符号化ビデオデータを記憶するため
の任意の他の好適なデジタル記憶媒体などの、分散されるかまたは局所的にアクセスされ
る様々なデータ記憶媒体のうちのいずれかを含んでもよい。さらなる一例では、記憶デバ
イスは、ソースデバイス12によって生成された符号化ビデオを記憶してもよいファイルサ
ーバまたは別の中間記憶デバイスに相当してもよい。宛先デバイス14は、ストリーミング
またはダウンロードを介して記憶デバイスからの記憶済みのビデオデータにアクセスして
もよい。ファイルサーバは、符号化ビデオデータを記憶すること、およびその符号化ビデ
オデータを宛先デバイス14へ送信することが可能な、任意のタイプのサーバであってもよ
い。例示的なファイルサーバは、(たとえば、ウェブサイト用の)ウェブサーバ、ファイル
転送プロトコル(FTP)サーバ、ネットワーク接続ストレージ(NAS)デバイス、またはローカ
ルディスクドライブを含む。宛先デバイス14は、インターネット接続を含む任意の標準デ
ータ接続を通じて符号化ビデオデータにアクセスしてもよい。このことは、ファイルサー
バ上に記憶された符号化ビデオデータにアクセスするのに適した、ワイヤレスチャネル(
たとえば、Wi-Fi接続)、有線接続(たとえば、デジタル加入者回線(DSL)、ケーブルモデム
など)、またはその両方の組み合わせを含んでもよい。記憶デバイスからの符号化ビデオ
データの送信は、ストリーミング送信、ダウンロード送信、またはそれらの組み合わせで
あってもよい。
本技法は、オーバージエアテレビ放送、ケーブルテレビ送信、衛星テレビ送信、動的適応
ストリーミングオーバーHTTP(DASH)などのインターネットストリーミングビデオ送信、デ
ータ記憶媒体上に符号化されるデジタルビデオ、データ記憶媒体上に記憶されたデジタル
ビデオの復号、または他の適用例などの、様々なマルチメディア適用例のうちのいずれか
をサポートするビデオコーディングに適用されてもよい。いくつかの例では、コーディン
グシステム10は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、
および/またはビデオ電話などの適用例をサポートするために、一方向または二方向のビ
デオ送信をサポートするように構成されてもよい。
力インターフェース22を含む。宛先デバイス14は、入力インターフェース28、ビデオデコ
ーダ30、およびディスプレイデバイス32を含む。本開示によれば、ソースデバイス12のビ
デオエンコーダ20および/または宛先デバイス14のビデオデコーダ30は、ビデオコーディ
ングのための技法を適用するように構成されてもよい。他の例では、ソースデバイスおよ
び宛先デバイスは、他の構成要素または構成を含んでもよい。たとえば、ソースデバイス
12は、外部カメラなどの外部のビデオソースからビデオデータを受信してもよい。同様に
、宛先デバイス14は、統合型ディスプレイデバイスを含むのではなく、外部のディスプレ
イデバイスとインターフェースしてもよい。
の技法は、任意のデジタルビデオ符号化および/または復号デバイスによって実行されて
もよい。本開示の技法は一般にビデオコーディングデバイスによって実行されるが、技法
はまた、通常、「コーデック」と呼ばれる、ビデオエンコーダ/デコーダによって実行さ
れてもよい。その上、本開示の技法はまた、ビデオプリプロセッサによって実行されても
よい。ビデオエンコーダおよび/またはデコーダは、グラフィックス処理ユニット(GPU)ま
たは類似のデバイスであってもよい。
ィングされたビデオデータをソースデバイス12が生成する、そのようなコーディングデバ
イスの例にすぎない。いくつかの例では、ソースデバイス12および宛先デバイス14は、ソ
ースデバイス12および宛先デバイス14の各々がビデオ符号化および復号構成要素を含むよ
うに、実質的に対称的に動作してもよい。したがって、コーディングシステム10は、たと
えば、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、またはビデ
オ電話のために、ビデオデバイス12、14の間での一方向または二方向のビデオ送信をサポ
ートしてもよい。
含むビデオアーカイブ、および/またはビデオコンテンツプロバイダからビデオを受信す
るためのビデオフィードインターフェースなどの、ビデオキャプチャデバイスを含んでも
よい。さらなる代替として、ビデオソース18は、ソースビデオとしてのコンピュータグラ
フィックスベースのデータ、またはライブビデオと、アーカイブされたビデオと、コンピ
ュータ生成されたビデオとの組み合わせを生成してもよい。
宛先デバイス14は、いわゆるカメラフォンまたはビデオフォンを形成してもよい。しかし
ながら、上述のように、本開示で説明する技法は、一般にビデオコーディングに適用可能
であってもよく、ワイヤレスおよび/または有線の適用例に適用されてもよい。各場合に
おいて、キャプチャ、プリキャプチャ、またはコンピュータ生成されたビデオが、ビデオ
エンコーダ20によって符号化されてもよい。符号化されたビデオ情報は、次いで、出力イ
ンターフェース22によってコンピュータ可読媒体16上に出力されてもよい。
信などの一時的媒体、またはハードディスク、フラッシュドライブ、コンパクトディスク
、デジタルビデオディスク、Blu-rayディスク、もしくは他のコンピュータ可読媒体など
の、記憶媒体(すなわち、非一時的記憶媒体)を含んでもよい。いくつかの例では、ネット
ワークサーバ(図示せず)が、たとえば、ネットワーク送信を介して、ソースデバイス12か
ら符号化ビデオデータを受信してもよく、宛先デバイス14に符号化ビデオデータを提供し
てもよい。同様に、ディスクスタンピング設備などの媒体製造設備のコンピューティング
デバイスが、ソースデバイス12から符号化ビデオデータを受信してもよく、符号化ビデオ
データを含むディスクを製造してもよい。したがって、様々な例では、コンピュータ可読
媒体16は、様々な形態の1つ以上のコンピュータ可読媒体を含むものと理解されてもよい
。
する。コンピュータ可読媒体16の情報は、ブロックおよび他のコーディングされたユニッ
ト、たとえば、グループオブピクチャ(GOP:group of pictures)の特性および/または処理
を記述するシンタックス要素を含む、ビデオエンコーダ20によって規定されるシンタック
ス情報を含んでもよく、シンタックス情報はまた、ビデオデコーダ30によって使用される
。ディスプレイデバイス32は、復号されたビデオデータをユーザに表示し、陰極線管(CRT
)、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプ
レイ、または別のタイプのディスプレイデバイスなどの、様々なディスプレイデバイスの
うちのいずれかを備えてもよい。
グ(HEVC)規格などのビデオコーディング規格に従って動作してもよく、HEVCテストモデル
(HM)に適合してもよい。代替的に、ビデオエンコーダ20およびビデオデコーダ30は、代替
として、ムービングピクチャエキスパートグループ(MPEG)-4パート10と呼ばれる、国際電
気通信連合電気通信規格セクタ(ITU-T)H.264規格、アドバンストビデオコーディング(AVC
)、H.265/HEVC、またはそのような規格の拡張などの、他のプロプライエタリ規格または
業界規格に従って動作してもよい。しかしながら、本開示の技法は、いかなる特定のコー
ディング規格にも限定されない。ビデオコーディング規格の他の例は、MPEG-2およびITU-
T H.263を含む。図1に示さないが、いくつかの態様では、ビデオエンコーダ20およびビデ
オデコーダ30は各々、オーディオエンコーダおよびデコーダと統合されてもよく、共通の
データストリームまたは別個のデータストリームの中のオーディオとビデオの両方の符号
化を処理するための、適切なマルチプレクサ-デマルチプレクサ(MUX-DEMUX)ユニット、ま
たは他のハードウェアおよびソフトウェアを含んでもよい。適用可能な場合、MUX-DEMUX
ユニットは、ITU H.223マルチプレクサプロトコル、またはユーザデータグラムプロトコ
ル(UDP)などの他のプロトコルに適合してもよい。
デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブ
ルゲートアレイ(FPGA)、個別論理、ソフトウェア、ハードウェア、ファームウェア、また
はそれらの任意の組み合わせなどの、様々な好適なエンコーダ回路構成のうちのいずれか
として実装されてもよい。本技法が部分的にソフトウェアで実装されるとき、デバイスは
、好適な非一時的コンピュータ可読媒体の中にソフトウェアのための命令を記憶してもよ
く、本開示の技法を実行するために、1つ以上のプロセッサを使用してハードウェアで命
令を実行してもよい。ビデオエンコーダ20およびビデオデコーダ30の各々は、1つ以上の
エンコーダまたはデコーダの中に含められてもよく、それらのいずれも、組み合わせられ
たエンコーダ/デコーダ(コーデック)の一部としてそれぞれのデバイスの中で統合されて
もよい。ビデオエンコーダ20および/またはビデオデコーダ30を含むデバイスは、集積回
路、マイクロプロセッサ、および/またはセルラー電話などのワイヤレス通信デバイスを
備えてもよい。
ロック図である。ビデオエンコーダ20は、ビデオスライス内のビデオブロックのイントラ
およびインターコーディングを実行してもよい。イントラコーディングは、所与のビデオ
フレーム内またはピクチャ内のビデオにおける空間的な冗長性を低減または除去するため
に、空間予測に依拠する。インターコーディングは、ビデオシーケンスの隣接するフレー
ム内またはピクチャ内のビデオにおける時間的な冗長性を低減または除去するために、時
間予測に依拠する。イントラモード(Iモード)とは、いくつかの空間ベースのコーディン
グモードのうちのいずれかを指してもよい。単方向予測(単予測とも呼ばれる)(Pモード)
または双予測(bi-prediction)(双予測(bi prediction)とも呼ばれる)(Bモード)などのイ
ンターモードとは、いくつかの時間ベースのコーディングモードのうちのいずれかを指し
てもよい。
ビデオブロックを受信する。図2の例では、ビデオエンコーダ20は、モード選択ユニット4
0、参照フレームメモリ64、加算器50、変換処理ユニット52、量子化ユニット54、および
エントロピーコーディングユニット56を含む。次に、モード選択ユニット40は、動き補償
ユニット44、動き推定ユニット42、イントラ予測(intra-prediction)(イントラ予測(intr
a prediction)とも呼ばれる)ユニット46、および区分ユニット48を含む。ビデオブロック
再構成のために、ビデオエンコーダ20はまた、逆量子化ユニット58、逆変換ユニット60、
および加算器62を含む。ブロック境界をフィルタ処理して再構成ビデオからブロッキネス
アーティファクトを除去するために、デブロッキングフィルタ(図2に示さず)も含まれて
もよい。所望される場合、デブロッキングフィルタは、通常、加算器62の出力をフィルタ
処理することになる。デブロッキングフィルタに加えて、(ループ内またはループ後の)追
加のフィルタも使用されてもよい。そのようなフィルタは、簡潔のために図示されないが
、所望される場合、(ループ内フィルタとして)加算器50の出力をフィルタ処理してもよい
。
たはスライスを受信する。フレームまたはスライスは、複数のビデオブロックに分割され
てもよい。動き推定ユニット42および動き補償ユニット44は、1つ以上の参照フレームの
中の1つ以上のブロックに対する受信ビデオブロックのインター予測コーディングを実行
して、時間予測を行う。イントラ予測ユニット46は、代替的に、コーディングされるべき
ブロックと同じフレームまたはスライスの中の1つ以上の隣接ブロックに対する受信ビデ
オブロックのイントラ予測コーディングを実行して、空間予測を行ってよい。ビデオエン
コーダ20は、たとえば、ビデオデータのブロックごとに適切なコーディングモードを選択
するために、複数のコーディングパスを実行してもよい。
づいて、ビデオデータのブロックをサブブロックに区分してもよい。たとえば、区分ユニ
ット48は、最初にフレームまたはスライスを最大コーディングユニット(LCU:largest cod
ing unit)に区分してもよく、レートひずみ分析(たとえば、レートひずみ最適化)に基づ
いてLCUの各々をサブコーディングユニット(サブCU)に区分してもよい。モード選択ユニ
ット40は、サブCUへのLCUの区分を示す4分木データ構造をさらに生成してもよい。4分木
のリーフノードCUは、1つ以上の予測ユニット(PU:prediction unit)および1つ以上の変換
ユニット(TU:transform unit)を含んでもよい。
キストにおける類似のデータ構造(たとえば、H.264/AVCにおけるマクロブロックおよびそ
れらのサブブロック)のうちのいずれかを指すために、「ブロック」という用語を使用す
る。CUは、コーディングノード、PU、およびコーディングノードに関連するTUを含む。CU
のサイズは、コーディングノードのサイズに対応し、形状が正方形である。CUのサイズは
、8×8ピクセルから、最大値が64×64ピクセル以上のツリーブロックのサイズまでにわた
ってもよい。各CUは、1つ以上のPUおよび1つ以上のTUを含んでもよい。CUに関連するシン
タックスデータは、たとえば、1つ以上のPUへのCUの区分を記述してもよい。CUが、スキ
ップモードまたはダイレクトモードで符号化されるのか、イントラ予測モードで符号化さ
れるのか、それともインター予測(inter-prediction)(インター予測(inter prediction)
とも呼ばれる)モードで符号化されるのかの間で、区分モードは異なってもよい。PUは、
形状が非正方形となるように区分されてもよい。CUに関連するシンタックスデータはまた
、たとえば、4分木による1つ以上のTUへのCUの区分を記述してもよい。TUは、形状が正方
形または非正方形(たとえば、長方形)であり得る。
わち、イントラモードまたはインターモードのうちの1つを選択してもよく、残差ブロッ
クデータを生成するために加算器50に、また参照フレームとして使用するための符号化ブ
ロックを再構成するために加算器62に、得られたイントラコーディングまたはインターコ
ーディングされたブロックを提供する。モード選択ユニット40はまた、動きベクトル、イ
ントラモードインジケータ、区分情報などのシンタックス要素、および他のそのようなシ
ンタックス情報を、エントロピーコーディングユニット56に提供する。
な目的のために別個に図示される。動き推定ユニット42によって実行される動き推定とは
、ビデオブロックに対する動きを推定する、動きベクトルを生成するプロセスである。動
きベクトルは、たとえば、現在フレーム(または、他のコーディングされたユニット)内で
コーディング中の現在ブロックに対して、参照フレーム(または、他のコーディングされ
たユニット)内の予測ブロックと比べて、現在ビデオフレーム内または現在ピクチャ内で
のビデオブロックのPUの変位を示してもよい。予測ブロックとは、ピクセル差分の観点か
ら、コーディングされるべきブロックに密に整合するものと見出されるブロックであり、
ピクセル差分は、絶対差分和(SAD:sum of absolute difference)、2乗差分和(SSD:sum of
square difference)、または他の差分メトリックによって決定されてもよい。いくつか
の例では、ビデオエンコーダ20は、参照フレームメモリ64の中に記憶された参照ピクチャ
のサブ整数ピクセル位置に対する値を計算してもよい。たとえば、ビデオエンコーダ20は
、参照ピクチャの1/4ピクセル位置、1/8ピクセル位置、または他の分数ピクセル位置の値
を補間してもよい。したがって、動き推定ユニット42は、フルピクセル位置および分数ピ
クセル位置に対して動き探索を実行してもよく、分数ピクセル精度を有する動きベクトル
を出力してもよい。
によって、インターコーディングされたスライスの中のビデオブロックのPUのための動き
ベクトルを計算する。参照ピクチャは、参照フレームメモリ64の中に記憶された1つ以上
の参照ピクチャをその各々が識別する、第1の参照ピクチャリスト(リスト0)または第2の
参照ピクチャリスト(リスト1)から選択されてもよい。動き推定ユニット42は、計算され
た動きベクトルをエントロピー符号化ユニット56および動き補償ユニット44へ送る。
された動きベクトルに基づいて予測ブロックをフェッチまたは生成することを伴ってもよ
い。再び、動き推定ユニット42および動き補償ユニット44は、いくつかの例では機能的に
統合されてもよい。現在ビデオブロックのPUのための動きベクトルを受信すると、動き補
償ユニット44は、参照ピクチャリストのうちの1つの中で、動きベクトルが指し示す先の
予測ブロックの位置を特定してもよい。加算器50は、コーディング中の現在ビデオブロッ
クのピクセル値から予測ブロックのピクセル値を減算することによって残差ビデオブロッ
クを形成して、以下で説明するようにピクセル差分値を形成する。一般に、動き推定ユニ
ット42は、ルーマ成分に対して動き推定を実行し、動き補償ユニット44は、ルーマ成分に
基づいて計算された動きベクトルを、クロマ成分とルーマ成分の両方のために使用する。
モード選択ユニット40はまた、ビデオスライスのビデオブロックを復号する際にビデオデ
コーダ30によって使用するための、ビデオブロックおよびビデオスライスに関連するシン
タックス要素を生成してもよい。
償ユニット44によって実行されるインター予測の代替として、現在ブロックをイントラ予
測してもよい。詳細には、イントラ予測ユニット46は、現在ブロックを符号化するために
使用すべきイントラ予測モードを決定してもよい。いくつかの例では、イントラ予測ユニ
ット46は、たとえば、別個の符号化パス中に、様々なイントラ予測モードを使用して現在
ブロックを符号化してもよく、イントラ予測ユニット46(または、いくつかの例ではモー
ド選択ユニット40)は、使用すべき適切なイントラ予測モードを、テストされたモードか
ら選択してもよい。
て、レートひずみ分析を使用してレートひずみ値を計算してもよく、テストされたモード
の中から、レートひずみ特性が最良のイントラ予測モードを選択してもよい。レートひず
み分析は、概して、符号化ブロックと、符号化ブロックを生成するために符号化された、
符号化されていない元のブロックとの間のひずみ(すなわち、誤差)の量、ならびに符号化
ブロックを生成するために使用されるビットレート(すなわち、ビットの数)を決定する。
イントラ予測ユニット46は、様々な符号化ブロックに対して、ひずみおよびレートから比
率を計算して、ブロックに対してどのイントラ予測モードが最良のレートひずみ値を呈示
するのかを決定してもよい。
)を使用して深度マップの深度ブロックをコーディングするように構成されてもよい。モ
ード選択ユニット40は、利用可能なDMMモードが、たとえば、レートひずみ最適化(RDO:ra
te-distortion optimization)を使用して、イントラ予測モードおよび他のDMMモードより
も良好なコーディング結果を生成するかどうかを決定してもよい。深度マップに対応する
テクスチャ画像に対するデータが、参照フレームメモリ64の中に記憶されてもよい。動き
推定ユニット42および動き補償ユニット44はまた、深度マップの深度ブロックをインター
予測するように構成されてもよい。
ードのうちの1つ)を選択した後、イントラ予測ユニット46は、ブロック用の選択されたイ
ントラ予測モードを示す情報をエントロピーコーディングユニット56に提供してもよい。
エントロピーコーディングユニット56は、選択されたイントラ予測モードを示す情報を符
号化してもよい。ビデオエンコーダ20は、複数のイントラ予測モードインデックステーブ
ルおよび複数の修正済みのイントラ予測モードインデックステーブル(コードワードマッ
ピングテーブルとも呼ばれる)、様々なブロックに対する符号化コンテキストの定義、な
らびにコンテキストの各々に対して使用すべき最確のイントラ予測モード、イントラ予測
モードインデックステーブル、および修正済みのイントラ予測モードインデックステーブ
ルの表示を含んでもよい構成データを、送信されるビットストリームの中に含めてもよい
。
ト40からの予測データを減算することによって、残差ビデオブロックを形成する。加算器
50は、この減算演算を実行する1つ以上の構成要素を表す。
を残差ブロックに適用して、残差変換係数値を備えるビデオブロックを生成する。変換処
理ユニット52は、DCTと概念的に類似の他の変換を実行してもよい。ウェーブレット変換
、整数変換、サブバンド変換、または他のタイプの変換も使用され得る。
成する。変換は、残差情報をピクセル値領域から周波数領域などの変換領域に変換しても
よい。変換処理ユニット52は、得られた変換係数を量子化ユニット54へ送ってもよい。量
子化ユニット54は、変換係数を量子化してビットレートをさらに低減する。量子化プロセ
スは、係数の一部または全部に関連するビット深度を低減してもよい。量子化の程度は、
量子化パラメータを調整することによって修正されてもよい。いくつかの例では、量子化
ユニット54は、次いで、量子化変換係数を含む行列の走査を実行してもよい。代替的に、
エントロピー符号化ユニット56が走査を実行してもよい。
ピーコーディングする。たとえば、エントロピーコーディングユニット56は、コンテキス
ト適応型可変長コーディング(CAVLC)、コンテキスト適応型バイナリ算術コーディング(CA
BAC)、シンタックスベースコンテキスト適応型バイナリ算術コーディング(SBAC)、確率区
間区分エントロピー(PIPE)コーディング、または別のエントロピーコーディング技法を実
行してもよい。コンテキストベースのエントロピーコーディングの場合には、コンテキス
トは隣接ブロックに基づいてもよい。エントロピーコーディングユニット56によるエント
ロピーコーディングに続いて、符号化ビットストリームが、別のデバイス(たとえば、ビ
デオデコーダ30)へ送信されてもよく、または後で送信するかもしくは取り出すためにア
ーカイブされてもよい。
用して、たとえば、後で参照ブロックとして使用するために、ピクセル領域における残差
ブロックを再構成する。動き補償ユニット44は、参照フレームメモリ64のフレームのうち
の1つの予測ブロックに残差ブロックを加算することによって、参照ブロックを計算して
もよい。動き補償ユニット44はまた、再構成された残差ブロックに1つ以上の補間フィル
タを適用して、動き推定における使用のためのサブ整数ピクセル値を計算してもよい。加
算器62は、動き補償ユニット44によって生成された、動き補償された予測ブロックに、再
構成された残差ブロックを加算して、参照フレームメモリ64の中に記憶するための再構成
ビデオブロックを生成する。再構成ビデオブロックは、後続のビデオフレームの中のブロ
ックをインターコーディングするための参照ブロックとして、動き推定ユニット42および
動き補償ユニット44によって使用されてもよい。
ック図である。図3の例では、ビデオデコーダ30は、エントロピー復号ユニット70、動き
補償ユニット72、イントラ予測ユニット74、逆量子化ユニット76、逆変換ユニット78、参
照フレームメモリ82、および加算器80を含む。ビデオデコーダ30は、いくつかの例では、
ビデオエンコーダ20(図2)に関して説明した符号化パスとは概して相反の、復号パスを実
行してもよい。動き補償ユニット72は、エントロピー復号ユニット70から受信された動き
ベクトルに基づいて予測データを生成してもよいが、イントラ予測ユニット74は、エント
ロピー復号ユニット70から受信されたイントラ予測モードインジケータに基づいて予測デ
ータを生成してもよい。
関連するシンタックス要素を表す符号化ビデオビットストリームを、ビデオエンコーダ20
から受信する。ビデオデコーダ30のエントロピー復号ユニット70は、ビットストリームを
エントロピー復号して、量子化係数、動きベクトルまたはイントラ予測モードインジケー
タ、および他のシンタックス要素を生成する。エントロピー復号ユニット70は、動きベク
トルおよび他のシンタックス要素を動き補償ユニット72に転送する。ビデオデコーダ30は
、ビデオスライスレベルおよび/またはビデオブロックレベルでシンタックス要素を受信
してもよい。
とき、イントラ予測ユニット74は、シグナリングされたイントラ予測モード、および現在
フレームまたは現在ピクチャの、前に復号されたブロックからのデータに基づいて、現在
ビデオスライスのビデオブロックのための予測データを生成してもよい。ビデオフレーム
がインターコーディングされた(たとえば、B、P、またはGPB)スライスとしてコーディン
グされるとき、動き補償ユニット72は、エントロピー復号ユニット70から受信された動き
ベクトルおよび他のシンタックス要素に基づいて、現在ビデオスライスのビデオブロック
のための予測ブロックを生成する。予測ブロックは、参照ピクチャリストのうちの1つの
中の参照ピクチャのうちの1つから生成されてもよい。ビデオデコーダ30は、参照フレー
ムメモリ82の中に記憶された参照ピクチャに基づいてデフォルトの構成技法を使用して、
参照フレームリスト、すなわち、リスト0およびリスト1を構成してもよい。
によって、現在ビデオスライスのビデオブロックのための予測情報を決定し、予測情報を
使用して、復号中の現在ビデオブロックのための予測ブロックを生成する。たとえば、動
き補償ユニット72は、受信されたシンタックス要素のうちのいくつかを使用して、ビデオ
スライスのビデオブロックをコーディングするために使用された予測モード(たとえば、
イントラ予測またはインター予測)、インター予測スライスタイプ(たとえば、Bスライス
、Pスライス、またはGPBスライス)、スライス用の参照ピクチャリストのうちの1つ以上に
対する構成情報、スライスのインター符号化ビデオブロックごとの動きベクトル、スライ
スのインターコーディングされたビデオブロックごとのインター予測ステータス、および
現在ビデオスライスの中のビデオブロックを復号するための他の情報を決定する。
ユニット72は、ビデオブロックの符号化中にビデオエンコーダ20によって使用されたよう
な補間フィルタを使用して、参照ブロックのサブ整数ピクセルに対する補間値を計算して
もよい。この場合、動き補償ユニット72は、ビデオエンコーダ20によって使用された補間
フィルタを、受信されたシンタックス要素から決定し得、その補間フィルタを使用して予
測ブロックを生成してもよい。
記憶されてもよい。動き補償ユニット72はまた、深度マップの深度ブロックをインター予
測するように構成されてもよい。
ンターフェース84は、ビデオデコーダ30のユーザ(たとえば、ネットワークアドミニスト
レータ)から入力を受け取るように構成される。ユーザインターフェース84を通じて、ユ
ーザは、ビデオデコーダ30上の設定を管理または変更することができる。たとえば、ユー
ザは、ユーザの選好に従ってビデオデコーダ30の構成および/または動作を制御するため
に、パラメータ(たとえば、フラグ)に対する値を入力または別の方法で提供することがで
きる。ユーザインターフェース84は、たとえば、ユーザがグラフィカルアイコン、ドロッ
プダウンメニュー、チェックボックスなどを通じてビデオデコーダ30と対話することを可
能にする、グラフィカルユーザインターフェース(GUI)であってもよい。場合によっては
、ユーザインターフェース84は、キーボード、マウス、または他の周辺デバイスを介して
ユーザから情報を受け取ってもよい。一実施形態では、ユーザは、ビデオデコーダ30から
遠く離れて配置されたスマートフォン、タブレットデバイス、パーソナルコンピュータな
どを介して、ユーザインターフェース84にアクセスすることができる。本明細書で使用す
るユーザインターフェース84は、外部入力または外部手段と呼ばれてもよい。
または時間(インターピクチャ)予測を実行して、ビデオシーケンスに固有の冗長性を低減
または除去する。ブロックベースのビデオコーディングの場合、ビデオスライス(すなわ
ち、ビデオピクチャ、またはビデオピクチャの一部分)は、ツリーブロック、コーディン
グツリーブロック(CTB:coding tree block)、コーディングツリーユニット(CTU:coding t
ree unit)、コーディングユニット(CU:coding unit)、および/またはコーディングノード
とも呼ばれてもよい、ビデオブロックに区分されてもよい。ピクチャのイントラコーディ
ングされた(I)スライスの中のビデオブロックは、同じピクチャの中の隣接ブロックの中
の参照サンプルに対する空間予測を使用して符号化される。ピクチャのインターコーディ
ングされた(PまたはB)スライスの中のビデオブロックは、同じピクチャの中の隣接ブロッ
クの中の参照サンプルに対する空間予測、または他の参照ピクチャの中の参照サンプルに
対する時間予測を使用してもよい。ピクチャはフレームと呼ばれてもよく、参照ピクチャ
は参照フレームと呼ばれてもよい。
もたらす。残差データは、コーディングされるべき元のブロックと予測ブロックとの間の
ピクセル差分を表す。インターコーディングされたブロックは、予測ブロックを形成する
参照サンプルのブロックを指し示す動きベクトル、およびコーディングされたブロックと
予測ブロックとの間の差分を示す残差データに従って符号化される。イントラコーディン
グされたブロックは、イントラコーディングモードおよび残差データに従って符号化され
る。さらなる圧縮のために、残差データは、ピクセル領域から変換領域に変換されてもよ
く、結果として残差変換係数になり、残差変換係数は、次いで、量子化されてもよい。当
初は二次元アレイをなして配置された量子化変換係数は、変換係数の一次元ベクトルを生
成するために走査されてもよく、なお一層の圧縮を達成するためにエントロピーコーディ
ングが適用されてもよい。
なビデオコーディング規格は、ITU-T H.261、ISO/IEC MPEG-1パート2、ITU-T H.262また
はISO/IEC MPEG-2パート2、ITU-T H.263、ISO/IEC MPEG-4パート2、ITU-T H.264またはIS
O/IEC MPEG-4パート10とも呼ばれるアドバンストビデオコーディング(AVC)、およびITU-T
H.265またはMPEG-Hパート2とも呼ばれる高効率ビデオコーディング(HEVC)を含む。AVCは
、スケーラブルビデオコーディング(SVC)、マルチビュービデオコーディング(MVC)および
マルチビュービデオコーディングプラス深度(MVC+D)、ならびに3D AVC(3D-AVC)などの拡
張を含む。HEVCは、スケーラブルHEVC(SHVC)、マルチビューHEVC(MV-HEVC)、および3D HE
VC(3D-HEVC)などの拡張を含む。
オコーディング(VVC)と称する新たなビデオコーディング規格もある。VVC規格はいくつか
のワーキングドラフトを有するが、特にVVCの1つのワーキングドラフト(WD)、すなわち、
B.Bross、J.Chen、およびS.Liu、「Versatile Video Coding (Draft 4)」、JVET-M1001-v
5、第13回JVET会合、2019年1月(VVCドラフト4)が、本明細書で参照される。
TとISO/IECとの共同ビデオエキスパートチーム(JVET)による多用途ビデオコーディング(V
VC)に基づく。しかしながら、本技法は、他のビデオコーデック仕様にも適用される。
APピクチャ402と、トレーリングピクチャ406との間の関係の描写400である。一実施形態
では、IRAPピクチャ402は、クリーンランダムアクセス(CRA:clean random access)ピクチ
ャ、またはランダムアクセス復号可能(RADL:random access decodable)ピクチャを伴う瞬
時デコーダリフレッシュ(IDR:instantaneous decoder refresh)ピクチャと呼ばれる。HEV
Cでは、IDRピクチャ、CRAピクチャ、およびブロークンリンクアクセス(BLA:Broken Link
Access)ピクチャは、すべてIRAPピクチャ402と見なされる。VVCの場合、2018年10月にお
ける第12回JVET会合の間に、IRAPピクチャとしてIDRピクチャとCRAピクチャの両方を有す
ることが合意された。
序408でIRAPピクチャ402に後続するが、提示順序410でIRAPピクチャ402に先行する。トレ
ーリングピクチャ406は、復号順序408と提示順序410の両方でIRAPピクチャ402に後続する
。2つのリーディングピクチャ404および1つのトレーリングピクチャ406が図4に示される
が、実際の適用例では、より多数またはより少数のリーディングピクチャ404および/また
はトレーリングピクチャ406が復号順序408および提示順序410で存在してもよいことを、
当業者は諒解されよう。
キップドリーディング(RASL:random access skipped leading)およびRADLに分割されてい
る。IRAPピクチャ402(たとえば、ピクチャ1)で復号が開始するとき、RADLピクチャ(たと
えば、ピクチャ3)は正しく復号され得るが、RASLピクチャ(たとえば、ピクチャ2)は正し
く復号され得ない。したがって、RASLピクチャは廃棄される。RADLピクチャとRASLピクチ
ャとの間の相違に照らして、IRAPピクチャに関連するリーディングピクチャのタイプは、
効率的かつ適切なコーディングのためにRADLまたはRASLのいずれかとして識別されるべき
である。HEVCでは、RASLピクチャおよびRADLピクチャが存在するとき、同じIRAPピクチャ
に関連するRASLピクチャおよびRADLピクチャに対して、RASLピクチャが提示順序410でRAD
Lピクチャに先行しなければならないことが制約される。
02の存在は、そのピクチャから復号プロセスが開始できることを示す。この機能により、
IRAPピクチャ402がその位置に存在する限り、必ずしもビットストリームの冒頭とは限ら
ずビットストリームの中のその位置において復号プロセスが開始する、ランダムアクセス
特徴が可能になる。第二に、IRAPピクチャ402の存在は、IRAPピクチャ402において開始し
RASLピクチャを除外するコーディングされたピクチャが、前のピクチャへのいかなる参照
も伴わずにコーディングされるように、復号プロセスをリフレッシュする。それ故に、ビ
ットストリームの中に存在するIRAPピクチャ402を有することは、IRAPピクチャ402および
復号順序408においてIRAPピクチャ402に後続するピクチャにIRAPピクチャ402が伝搬する
前に、コーディングされたピクチャの復号中に起こる可能性がある、いかなるエラーも止
めることになる。
Pピクチャ402の存在は、ビットレートの急上昇を引き起こす。圧縮効率へのこの不利益は
、2つの理由に起因する。第一に、IRAPピクチャ402がイントラ予測されるピクチャである
とき、インター予測されるピクチャである他のピクチャ(たとえば、リーディングピクチ
ャ404、トレーリングピクチャ406)と比較すると、ピクチャ自体が、描写するために比較
的多くのビットを必要とすることになる。第二に、IRAPピクチャ402の存在が時間予測を
破壊するので(なぜなら、デコーダが復号プロセスをリフレッシュすることになり、この
ことに対する復号プロセスのアクションのうちの1つが、復号ピクチャバッファ(DPB)の中
の、前の参照ピクチャを除去することであるからである)、IRAPピクチャ402は、それらの
インター予測コーディング用のより少ない参照ピクチャしか有しないので、復号順序408
でIRAPピクチャ402に後続するピクチャのコーディングをさほど効率的にさせない(すなわ
ち、描写するためにより多くのビットを必要とする)。
のピクチャタイプと比較したとき、異なるシグナリングおよび導出を有する。差異のうち
のいくつかは次の通りである。
び導出のために、POCの最上位ビット(MSB)部分は前のキーピクチャ(key picture)から導
出されず、単に0に等しくなるように設定される。
イスヘッダは、参照ピクチャ管理を支援するためにシグナリングされることを必要とされ
る情報を含まない。他のピクチャタイプ(すなわち、CRA、トレーリング、時間サブレイヤ
アクセス(TSA:temporal sub-layer access)など)の場合、以下で説明する参照ピクチャセ
ット(RPS:reference picture set)などの情報、または他の形式の類似の情報(たとえば、
参照ピクチャリスト)は、参照ピクチャマーキングプロセス(すなわち、復号ピクチャバッ
ファ(DPB)の中の参照ピクチャのステータス、すなわち、参照のために使用済みおよび参
照のために未使用のいずれかを、決定するためのプロセス)のために必要とされる。しか
しながら、IDRピクチャの場合、復号プロセスが、参照のために未使用としてDPBの中のす
べての参照ピクチャに単にマークしなければならないことを、IDRの存在が示すので、そ
のような情報はシグナリングされる必要がない。
ネットワークアブストラクションレイヤ(NAL)ユニット内に含まれてもよい。NALユニット
のセットは、アクセスユニットと呼ばれてもよい。IRAPピクチャ402およびリーディング
ピクチャ404は、システムレベルアプリケーションによって容易に識別され得るように、
異なるNALユニットタイプが与えられる。たとえば、ビデオスプライサは、詳細には、ト
レーリングピクチャ406からRASLピクチャおよびRADLピクチャを決定することを含めて、
非IRAPピクチャからIRAPピクチャ402を識別するために、またリーディングピクチャ404を
識別するために、コーディングされたビットストリームの中のシンタックス要素のあまり
にも多くの詳細を理解する必要なく、コーディングされたピクチャタイプを理解する必要
がある。トレーリングピクチャ406は、IRAPピクチャ402に関連するピクチャであり、提示
順序410でIRAPピクチャ402に後続する。ピクチャは、復号順序408で特定のIRAPピクチャ4
02に後続してもよく、復号順序408で任意の他のIRAPピクチャ402に先行してもよい。この
ことのために、IRAPピクチャ402およびリーディングピクチャ404にそれら自体のNALユニ
ットタイプを与えることは、そのようなアプリケーションの助けとなる。
リーディングピクチャを伴うBLA(BLA_W_LP): 復号順序で1つ以上のリーディングピクチ
ャが後続してもよいブロークンリンクアクセス(BLA)ピクチャのNALユニット。
RADLを伴うBLA(BLA_W_RADL): 復号順序で1つ以上のRADLピクチャが後続してもよいがRA
SLピクチャが後続し得ないBLAピクチャのNALユニット。
リーディングピクチャを伴わないBLA(BLA_N_LP): 復号順序でリーディングピクチャが
後続しないBLAピクチャのNALユニット。
RADLを伴うIDR(IDR_W_RADL): 復号順序で1つ以上のRADLピクチャが後続してもよいがRA
SLピクチャが後続し得ないIDRピクチャのNALユニット。
リーディングピクチャを伴わないIDR(IDR_N_LP): 復号順序でリーディングピクチャが
後続しないIDRピクチャのNALユニット。
CRA: リーディングピクチャが後続してもよいクリーンランダムアクセス(CRA)ピクチャ
のNALユニット(すなわち、RASLピクチャもしくはRADLピクチャのいずれか、またはその両
方)。
RADL: RADLピクチャのNALユニット。
RASL: RASLピクチャのNALユニット。
プは次の通りである。
RADLを伴うIDR(IDR_W_RADL): 復号順序で1つ以上のRADLピクチャが後続してもよいがRA
SLピクチャが後続し得ないIDRピクチャのNALユニット。
リーディングピクチャを伴わないIDR(IDR_N_LP): 復号順序でリーディングピクチャが
後続しないIDRピクチャのNALユニット。
CRA: リーディングピクチャが後続してもよいクリーンランダムアクセス(CRA)ピクチャ
のNALユニット(すなわち、RASLピクチャもしくはRADLピクチャのいずれか、またはその両
方)。
RADL: RADLピクチャのNALユニット。
RASL: RASLピクチャのNALユニット。
、比較的大きく、それ故に、より大きいレイテンシ/遅延を引き起こす、そのビットレー
ト要件に起因して、IRAPピクチャ(たとえば、IRAPピクチャ402)としてピクチャをコーデ
ィングすることを回避することが望ましい。しかしながら、IRAPの使用を完全に回避する
ことは、すべての低遅延適用例において可能であるとは限らない場合がある。たとえば、
マルチパーティ遠隔会議などの会話型の適用例の場合、新たなユーザが遠隔会議に参加で
きる定期的なポイントを提供することが必要である。
トリームへのアクセスを提供するために、1つの可能な方策は、ビットレートにおけるピ
ークを有することを回避するために、IRAPピクチャを使用するのではなく順次イントラリ
フレッシュ技法(PIR:progressive intra refresh)を使用することである。PIRは、漸進的
復号リフレッシュ(GDR)とも呼ばれてもよい。PIRおよびGDRという用語は、本開示におい
て互換的に使用されてもよい。
ビットストリームのコーディングされたビデオシーケンス508内で、GDRピクチャ502、1つ
以上のトレーリングピクチャ504、およびリカバリポイントピクチャ506を使用して示され
る。一実施形態では、GDRピクチャ502、トレーリングピクチャ504、およびリカバリポイ
ントピクチャ506は、CVS508の中のGDR期間を規定してもよい。CVS508は、GDRピクチャ502
で開始する一連のピクチャ(または、それらの部分)であり、次のGDRピクチャまでの(ただ
し、それを含まない)、またはビットストリームの終端までの、すべてのピクチャ(または
、それらの部分)を含む。GDR期間は、GDRピクチャ502で開始する一連のピクチャであり、
リカバリポイントピクチャ506までの(それを含む)すべてのピクチャを含む。
トピクチャ506で終了する一連のピクチャにわたって機能する。GDRピクチャ502は、すべ
てがイントラ予測を使用してコーディングされているブロック(すなわち、イントラ予測
ブロック)を含むリフレッシュ済みの/クリーンな領域510、およびすべてがインター予測
を使用してコーディングされているブロック(すなわち、インター予測ブロック)を含むリ
フレッシュされていない/ダーティな領域512を含む。
コーディングされる第1の部分510Aおよびインター予測を使用してコーディングされる第2
の部分510Bを有する、リフレッシュ済みの/クリーンな領域510を含む。第2の部分510Bは
、たとえば、CVS508のGDR期間内の先行するピクチャの、リフレッシュ済みの/クリーンな
領域510を参照することによってコーディングされる。図示のように、トレーリングピク
チャ504のリフレッシュ済みの/クリーンな領域510は、一貫した方向で(たとえば、左から
右に)コーディングプロセスが移動または進行するにつれて拡大し、それに対応して、そ
のことはリフレッシュされていない/ダーティな領域512を縮小する。最終的に、リフレッ
シュ済みの/クリーンな領域510しか含まないリカバリポイントピクチャ506が、コーディ
ングプロセスから取得される。特に、さらに以下で説明するように、インター予測ブロッ
クとしてコーディングされる、リフレッシュ済みの/クリーンな領域510の第2の部分510B
は、参照ピクチャの中のリフレッシュ済みの領域/クリーンな領域510を参照するだけでよ
い。
lemental Enhancement Information)メッセージおよび領域リフレッシュ情報SEIメッセー
ジを使用して非規範的にサポートされた。これらの2つのSEIメッセージは、GDRがどのよ
うに実行されるのかを規定しない。むしろ、その2つのSEIメッセージは、(すなわち、リ
カバリポイントSEIメッセージによって提供される)GDR期間の中の最初のピクチャおよび
最後のピクチャならびに(すなわち、領域リフレッシュ情報SEIメッセージによって提供さ
れる)リフレッシュされている領域を示すためのメカニズムを単に提供する。
らの2つの技法とは、制約イントラ予測(CIP:constraint intra prediction)、および動き
ベクトルに対するエンコーダ制約である。CIPは、リフレッシュされていない領域(たとえ
ば、リフレッシュされていない/ダーティな領域512)からのサンプルを使用しない領域が
、参照のために使用されることを可能にするので、CIPは、特にイントラ予測ブロック(た
とえば、リフレッシュ済みの/クリーンな領域510の第1の部分510A)としてのみコーディン
グされる領域をコーディングするための、GDR目的のために使用され得る。しかしながら
、イントラブロックへの制約が、リフレッシュ済みの領域の中のイントラブロックに対し
てだけでなくピクチャの中のすべてのイントラブロックにも適用されなければならないの
で、CIPの使用は深刻なコーディング性能劣化を引き起こす。動きベクトルに対するエン
コーダ制約は、リフレッシュ済みの領域の外側に位置する参照ピクチャの中の任意のサン
プルをエンコーダが使用することを制限する。そのような制約は、最適でない動き探索を
引き起こす。
探索600を示す概略図である。図示のように、動き探索600は、現在ピクチャ602および参
照ピクチャ604を示す。現在ピクチャ602および参照ピクチャ604は各々、イントラ予測を
用いてコーディングされたリフレッシュ済みの領域606、インター予測を用いてコーディ
ングされたリフレッシュ済みの領域608、およびリフレッシュされていない領域608を含む
。リフレッシュ済みの領域604、リフレッシュ済みの領域606、およびリフレッシュされて
いない領域608は、図5の中のリフレッシュ済みの/クリーンな領域510の第1の部分510A、
リフレッシュ済みの/クリーンな領域510の第2の部分510B、およびリフレッシュされてい
ない/ダーティな領域512と類似である。
る参照ブロック612のサンプルのうちのいくつかをもたらす、いかなる動きベクトル610を
選択することも制約または防止される。このことは、現在ピクチャ602の中の現在ブロッ
ク614を予測するときに参照ブロック612が最良のレートひずみコスト基準を与えるときに
さえ行われる。したがって、図6は、GDRをサポートするためのエンコーダ制約を使用する
ときの、動き探索600における非最適性に対する理由を示す。
くGDRの実装形態を記載している。実装形態は、次のように要約され得る。すなわち、列
ごとにコーディングユニットに対してイントラ予測モードが強制され、イントラCUの再構
成を確実なものにするために、制約付きイントラ予測が有効化され、動きベクトルは、フ
ィルタが原因で広がる誤差(たとえば、6ピクセル)を回避するための追加のマージンを考
慮に入れるとともに、イントラ列を再ループさせるときに過去の参照ピクチャを除去しな
がら、リフレッシュ済みのエリア内を指し示すように制約される。
ャであることを規範的に示すための方法を提案した。提案された着想は次のように機能す
る。
ディングレイヤ(VCL)NALユニットとして規定する。NALユニットのペイロードは、GDR期間
の中の最後のピクチャのPOC値を導出するために使用され得る情報を指定するためのシン
タックス要素を含む。タイプリカバリポイント表示を有する非VCL NALユニットを含むア
クセスユニットは、リカバリポイント開始(RBP:recovery point begin)アクセスユニット
(AU:access unit)と呼ばれ、RBPアクセスユニットの中のピクチャは、RBPピクチャと呼ば
れる。復号プロセスは、RBP AUから開始することができる。復号がRBP AUから開始すると
き、最後のピクチャを除いてGDR期間の中のすべてのピクチャは出力されない。
された方法は、GDRがどのように実行されるのかを説明していない。代わりに、提案され
た方法は、GDR期間の中の最初のピクチャおよび最後のピクチャを示すためのいくつかの
シグナリングを提供するにすぎない。GDR期間の中の最初のピクチャおよび最後のピクチ
ャを示すために、新たな非VCL NALユニットが必要とされる。リカバリポイント表示(RPI:
recovery point indication)NALユニットの中に含まれる情報が、GDR期間の中の最初のピ
クチャのタイルグループヘッダの中に単に含められ得るので、このことは冗長性である。
また、提案された方法は、GDR期間の中のピクチャの中のどの領域がリフレッシュ済みの
領域およびリフレッシュされていない領域であるのかを表すことができない。
IPの使用。リフレッシュされていない領域からの任意のサンプルが空間的な参照のために
使用されることを防止するために、リフレッシュ済みの領域を、いくつかの制約を伴うイ
ントラ予測を用いてコーディングすることが必要である。CIPが使用されるとき、コーデ
ィングはピクチャベースであり、そのことは、ピクチャの中のすべてのイントラブロック
もCIPイントラブロックとしてコーディングされなければならないことを意味する。それ
故に、このことは性能劣化を引き起こす。さらに、動きベクトルに関連する参照ブロック
のサンプルが、完全に参照ピクチャの中のリフレッシュ済みの領域内にあるとは限らない
とき、動き探索を限定するためのエンコーダ制約の使用は、最良の動きベクトルをエンコ
ーダが選ぶことを妨げる。また、イントラ予測のみを用いてコーディングされるリフレッ
シュ済みの領域はCTUサイズでない。代わりに、リフレッシュ済みの領域は、最小CUサイ
ズまで下に、CTUサイズよりも小さくなることができる。このことは、ブロックレベルで
の表示を必要としてもよいので、実装を不必要に複雑にさせる。
が、本明細書で開示される。開示する技法は、イントラランダムアクセスポイント(IRAP)
ピクチャを使用する必要なく順次イントラリフレッシュがランダムアクセスを有効化する
ことを可能とする。第1のフラグに対する値が外部入力によって提供されるとき、漸進的
復号リフレッシュ(GDR)ピクチャおよび出力順序でGDRピクチャとリカバリポイントピクチ
ャとの間の任意のトレーリングピクチャが出力されることを防止するために、第1のフラ
グは外部入力によって提供される値に等しく設定され、第2のフラグは第1のフラグに等し
く設定される。外部入力は、たとえば、ビデオデコーダ30のグラフィックユーザインター
フェース(GUI)を介してユーザ(たとえば、ネットワークアドミニストレータ)から受け取
られる入力であってもよい。このようにして第1および第2のフラグを設定することは、潜
在的にダーティなデータがディスプレイに出力されることを防止する。すなわち、第1お
よび第2のフラグの値は、GDRピクチャからの潜在的にダーティなデータが出力されるかど
うか、またはビデオデコーダが完全な同期を待ってデータを表示し始めるかどうかを制御
する。ダーティなデータが出力されることを制限するための能力を有することによって、
ビデオコーディングにおけるコーダ/デコーダ(「コーデック」とも呼ばれる)が、現在の
コーデックに比べて改善される。実際問題として、改善されたビデオコーディングプロセ
スは、ビデオが送られ、受け取られ、かつ/または見られるとき、より良好なユーザエク
スペリエンスをユーザに与える。
る。態様の各々は個別に適用され得、それらのうちのいくつかは組み合わせで適用され得
る。
の中の最初のピクチャと呼ばれる。
ように、アクセスユニットはNALユニットのセットである。各NALユニットは、単一のピク
チャを含んでもよい。
よい。
セスユニットである。
。
スユニットの直後にくる。
れ、デコーダの外側のエンティティによってフラグの値が1(すなわち、真)に等しく設定
される。
れる。
ピクチャまで出力順序でGDRピクチャに後続するすべてのピクチャは、出力されない(すな
わち、「出力のために不必要」としてマークされる)。
メータセットの中で(たとえば、SPSの中で)シグナリングされる。
フラグが0に等しいとき、GDRピクチャがCVSの中に存在しないようにGDRは有効化されてい
ない。
クチャのタイルグループヘッダの中でシグナリングされる。
がシグナリングされる。その情報は、recovery_point_cntと指定されたシンタックス要素
を使用してシグナリングされ得る。
nabledフラグの値、およびピクチャのNALユニットタイプが条件とされてもよく、すなわ
ち、gdr_enabled_flagが1に等しく、かつタイルグループを含むNALユニットのnal_unit_t
ypeがGDR_NUTであるときのみ、フラグが存在する。
フラグが、タイルグループヘッダの中でシグナリングされる。
ャがGDR期間内にあるかどうかが、条件とされてもよい。したがって、次のことのすべて
が真であるときのみ、フラグが存在する。
ピクチャであるとき、最後のGDRピクチャが現在ピクチャである)、GDR期間の中の最後の
ピクチャのPOCよりも小さい。
と推測される。
をカバーする。同様に、refreshed_region_flagが0に等しいすべてのタイルグループも、
連結している領域をカバーする。
イルグループ)またはBもしくはP(すなわち、インタータイルグループ)のものであり得る
。
hed_region_flagが1に等しい少なくとも1つのタイルグループを含む。
なわち、イントラタイルグループ)に等しい、少なくとも1つのタイルグループを含む。
イルグループの数およびそれらのアドレスが、ピクチャパラメータセット(PPS:picture p
arameter set)またはタイルグループヘッダのいずれかの中でシグナリングされることを
許容される。これを行うために、長方形タイルグループ情報がPPSの中に存在するか否か
を指定するために、PPSの中でフラグがシグナリングされる。このフラグは、rect_tile_g
roup_info_in_pps_flagと呼ばれてもよい。このフラグは、gdr_enabled_flagが1に等しい
とき、1に等しくなるように制約されてもよい。
ングするのではなく、タイルグループ情報(すなわち、長方形タイルグループ、ラスタ走
査タイルグループなどの、任意のタイプのタイルグループ)がPPSの中に存在するかどうか
を指定するために、より全般的なフラグがPPSの中でシグナリングされ得る。
ID)情報のシグナリングが存在しないことが、さらに制約されてもよい。明示的なタイル
グループID情報は、signaled_tile_group_id_flag、signaled_tile_group_id_length_min
us1、およびtile_group_id[ i ]を含む。
境界を横断するループフィルタ処理演算が許容されるかどうかを指定するために、フラグ
がシグナリングされる。
_region_enabled_flagと呼ばれてもよい。
s_tile_enabled_flagの値が条件とされてもよい。loop_filter_across_tile_enabled_fla
gが0に等しいとき、loop_filter_across_refreshed_region_enabled_flagは存在しなくて
もよく、その値は0に等しいものと推測される。
よく、その存在は、refreshed_region_flagの値が条件とされてもよく、すなわち、refre
shed_region_flagの値が1に等しいときのみ、そのフラグが存在する。
済みの領域を横断するループフィルタが許容されないことが示されるとき、以下のことが
適用される。
プであるとき、タイルグループの境界におけるエッジのデブロッキングが実行されない。
le adaptive offset)プロセスは、リフレッシュ済み領域境界の外側からのいかなるサン
プルも使用しない。
tive loop filtering)プロセスは、リフレッシュ済み領域境界の外側からのいかなるサン
プルも使用しない。
済みの領域の境界を決定するための変数に関連付けられる。これらの変数は、次のように
呼ばれてもよい。
tBoundaryPos。
htBoundaryPos。
BoundaryPos。
BoundaryPos。
フレッシュ済みの領域の境界は、タイルグループヘッダが構文解析された後にデコーダに
よって更新され、タイルグループのrefreshed_region_flagの値は1に等しい。
ピクチャの各タイルグループの中で明示的にシグナリングされる。
かを示すために、フラグがシグナリングされてもよい。リフレッシュされていない領域を
ピクチャが含まないことが指定されるとき、リフレッシュ済み境界情報はシグナリングさ
れず、ピクチャ境界に等しいものと単に推測され得ない。
シュ済みの領域の境界が使用される。
を決めるために、リフレッシュ済みの領域のエッジを決定する。
き、リフレッシュされていない領域からのサンプルを使用することを回避するためにクリ
ッピングプロセスが適用され得るように、リフレッシュ済みの領域の境界を決定する。
ないとき、リフレッシュされていない領域からのサンプルを使用することを回避するため
にクリッピングプロセスが適用され得るように、リフレッシュ領域の境界を決定する。
中のリフレッシュ済みの領域の境界についての情報が、次のように使用される。すなわち
、現在ピクチャの中の現在ブロックが、refreshed_region_flagが1に等しいタイルグルー
プの中にあり、かつ参照ブロックが、リフレッシュされていない領域を含む参照ピクチャ
の中にあるとき、以下のことが適用される。
リフレッシュ済みの領域の境界によってクリッピングされる。
きベクトルはその参照ピクチャの中のリフレッシュ済みの領域の境界によってクリッピン
グされる。
テキストはJVET寄稿JVET-M1001-v5である。すなわち、差分だけが記載されるが、以下で
述べられないベーステキストの中のテキストは、現状のままで適用される。ベーステキス
トに比べて修正されるテキストは、イタリック体が使用される。
NALユニットが有するIRAPピクチャ。
のいかなるピクチャも参照せず、復号順序でビットストリームの中の最初のピクチャであ
ってもよく、または後でビットストリームの中に出現してもよい。CRAピクチャは、関連
するRADLピクチャまたはRASLピクチャを有してもよい。1に等しいNoIncorrectPicOutputF
lagをCRAピクチャが有するとき、RASLピクチャは、ビットストリームの中に存在しないピ
クチャへの参照を含んでもよいときに復号可能でない場合があるので、関連するRASLピク
チャはデコーダによって出力されない。
いIRAPアクセスユニットまたはNoIncorrectPicOutputFlagが1に等しいGDRアクセスユニッ
トである後続の任意のアクセスユニットまでの(ただし、それを含まない)すべての後続の
アクセスユニットを含む、NoIncorrectPicOutputFlagが1に等しいIRAPアクセスユニット
またはNoIncorrectPicOutputFlagが1に等しいGDRアクセスユニットと、それに後続する0
、またはNoIncorrectPicOutputFlagが1に等しいIRAPアクセスユニットもしくはNoIncorre
ctPicOutputFlagが1に等しいGDRアクセスユニットでない、より多くのアクセスユニット
とを復号順序で備える、アクセスユニットのシーケンス。
ってもよい。各IDRアクセスユニットに対してNoIncorrectPicOutputFlagの値は1に等しく
、復号順序でビットストリームの中の最初のアクセスユニットである各CRAアクセスユニ
ットは、復号順序でエンドオブシーケンスNALユニットに後続するか、または1に等しいHa
ndleCraAsCvsStartFlagを有する、最初のアクセスユニットである。
スユニットに対して、NoIncorrectPicOutputFlagの値が1に等しいことは、復号順序でエ
ンドオブシーケンスNALユニットに後続するか、または1に等しいHandleGdrAsCvsStartFla
gを有する、最初のアクセスユニットである。
DRピクチャであるアクセスユニット。
ALユニットが有するピクチャ。
unit_typeを各VCL NALユニットが有するコーディングされたピクチャ。
関連するCRAピクチャが、1に等しいNoIncorrectPicOutputFlagを有するとき、ビットスト
リームの中に存在しないピクチャへの参照をRASLピクチャが含んでもよいので、RASLピク
チャは出力されず、正しく復号可能でない場合がある。RASLピクチャは、非RASLピクチャ
の復号プロセスのための参照ピクチャとして使用されない。存在するとき、すべてのRASL
ピクチャは、関連する同じCRAピクチャのすべてのトレーリングピクチャに復号順序で先
行する。
byte sequence payload)のシンタックスおよびセマンティック。
ャが存在してもよいことを指定する。0に等しいgdr_enabled_flagは、コーディングされ
たビデオシーケンスの中にGDRピクチャが存在しないことを指定する。
でシグナリングされることを指定する。0に等しいrect_tile_group_info_in_pps_flagは
、長方形タイルグループ情報がPPSの中でシグナリングされないことを指定する。
_in_pps_flagの値が0に等しくなければならないことが、ビットストリーム適合の要件で
ある。
チャの中で、refreshed_region_flagが1に等しいタイルグループの境界を横断してループ
内フィルタ処理演算が実行されてもよいことを指定する。0に等しいloop_filter_across_
refreshed_region_enabled_flagは、PPSを参照するピクチャの中で、refreshed_region_f
lagが1に等しいタイルグループの境界を横断してループ内フィルタ処理演算が実行されな
いことを指定する。ループ内フィルタ処理演算は、デブロッキングフィルタ、サンプル適
応オフセットフィルタ、および適応ループフィルタ演算を含む。存在しないとき、loop_f
ilter_across_refreshed_region_enabled_flagの値は0に等しいものと推測される。
がシグナリングされることを指定する。0に等しいsignalled_tile_group_index_flagは、
タイルグループIDがシグナリングされないことを指定する。存在しないとき、signalled_
tile_group_index_flagの値は0に等しいものと推測される。
oup_id[ i ]を、かつタイルグループヘッダの中のシンタックス要素tile_group_address
を表すために使用される、ビットの数を指定する。signalled_tile_group_index_length_
minus1の値は、両端値を含む0~15という範囲の中になければならない。存在しないとき
、signalled_tile_group_index_length_minus1の値は次のように推測される。
n_pic_minus1 + 1 ) ) - 1。
る。存在しないとき、tile_group_addressの値は、0に等しいものと推測される。
tile_group_addressは、式6-7によって指定されるタイルIDである。
tile_group_addressの長さは、Ceil( Log2 ( NumTilesInPic ) )ビットである。
tile_group_addressの値は、両端値を含む0~NumTilesInPic - 1という範囲の中にな
ければならない。
が0に等しい場合、以下のことが適用される。
tile_group_addressは、第iのタイルグループの左上隅角に位置するタイルのタイル
インデックスである。
tile_group_addressの長さは、signalled_tile_group_index_length_minus1 + 1ビッ
トである。
signalled_tile_group_id_flagが0に等しい場合、tile_group_addressの値は、両端
値を含む0~NumTilesInPic - 1という範囲の中になければならない。そうでない場合、ti
le_group_addressの値は、両端値を含む0~2( signalled_tile_group_index_length_minu
s1 + 1 ) - 1という範囲の中になければならない。
に等しい)場合、以下のことが適用される。
tile_group_addressは、タイルグループのタイルグループIDである。
tile_group_addressの長さは、signalled_tile_group_index_length_minus1 + 1ビッ
トである。
signalled_tile_group_id_flagが0に等しい場合、tile_group_addressの値は、両端
値を含む0~num_tile_groups_in_pic_minus1という範囲の中になければならない。そうで
ない場合、tile_group_addressの値は、両端値を含む0~2( signalled_tile_group_index
_length_minus1 + 1 ) - 1という範囲の中になければならない。
ックスを指定する。single_tile_per_tile_group_flagが1に等しいとき、bottom_right_t
ile_idは、tile_group_addressに等しいものと推測される。bottom_right_tile_idシンタ
ックス要素の長さは、Ceil( Log2( NumTilesInPic) )ビットである。
ルグループの左上のタイルのタイルインデックスを指定するTopLeftTileIdx、タイルグル
ープの右下のタイルのタイルインデックスを指定するBottomRightTileIdx、および現在タ
イルグループの中の第iのタイルのタイルインデックスを指定するTgTileIdx[ i ]が、次
のように導出される。
if( rect_tile_group_flag ) {
if ( tile_group_info_in_pps ) {
tileGroupIdx = 0
while( tile_group_address != rect_tile_group_id[ tileGroupIdx ] )
tileGroupIdx++
tileIdx = top_left_tile_idx[ tileGroupIdx ]
BottomRightTileIdx = bottom_right_tile_idx[ tileGroupIdx ]
} else {
tileIdx = tile_group_address
BottomRightTileIdx = bottom_right_tile_id
}
TopLeftTileIdx = tileIdx
deltaTileIdx = BottomRightTileIdx - TopLeftTileIdx
NumTileRowsInTileGroupMinus1 = deltaTileIdx / ( num_tile_columns_minus1 +
1 ) (7-35)
NumTileColumnsInTileGroupMinus1 = deltaTileIdx % ( num_tile_columns_minus1
+ 1 )
NumTilesInCurrTileGroup = ( NumTileRowsInTileGroupMinus1 + 1 ) * ( NumTile
ColumnsInTileGroupMinus1 + 1 )
for( j = 0, tIdx = 0; j < NumTileRowsInTileGroupMinus1 + 1; j++, tileIdx +
= num_tile_columns_minus1 + 1 )
for( i = 0, currTileIdx = tileIdx; i < NumTileColumnsInTileGroupMinus1 + 1
; i++, currTileIdx++, tIdx++ )
TgTileIdx[ tIdx ] = currTileIdx
} else {
NumTilesInCurrTileGroup = num_tiles_in_tile_group_minus1 + 1
TgTileIdx[ 0 ] = tile_group_address
for( i = 1; i < NumTilesInCurrTileGroup; i++ )
TgTileIdx[ i ] = TgTileIdx[ i - 1 ] + 1
}
の中で復号順序で現在ピクチャ(すなわち、GDRピクチャ)に後続し、かつ現在ピクチャのP
icOrderCntVal+recovery_poc_cntの値に等しいPicOrderCntValを有する、ピクチャpicAが
ある場合、ピクチャpicAは、リカバリポイントピクチャと呼ばれる。そうでない場合、現
在ピクチャのPicOrderCntVal+recovery_poc_cntの値よりも大きいPicOrderCntValを有す
る、出力順序で最初のピクチャが、リカバリポイントピクチャと呼ばれる。リカバリポイ
ントピクチャは、復号順序で現在ピクチャに先行してはならない。出力順序でのすべての
復号ピクチャは、リカバリポイントピクチャの出力順序位置において開始する内容の中で
正確またはほぼ正確であるものと示される。recovery_poc_cntの値は、両端値を含む-Max
PicOrderCntLsb / 2~MaxPicOrderCntLsb / 2 - 1という範囲の中になければならない。
rectPicOutputFlagの値にかかわらず正確な再構成サンプル値を生成することを指定する
。0に等しいrefreshed_region_flagは、タイルグループの復号が、NoIncorrectPicOutput
Flagが1に等しい関連するGDRから開始するとき、不正確な再構成サンプル値を生成しても
よいことを指定する。存在しないとき、refreshed_region_flagの値は、1に等しいものと
推測される。
得る。
tileColIdx = TopLeftTileIdx % ( num_tile_columns_minus1 + 1 )
tileRowIdx = TopLeftTileIdx / ( num_tile_columns_minus1 + 1 )
TGRefreshedLeftBoundary = ColBd[ tileColIdx ] << CtbLog2SizeY
TGRefreshedTopBoundary = RowBd[ tileRowIdx ] << CtbLog2SizeY
tileColIdx = BottomRightTileIdx % ( num_tile_columns_minus1 + 1 )
tileRowIdx = BottomRightTileIdx / ( num_tile_columns_minus1 + 1 )
TGRefreshedRightBoundary = ( ( ColBd[ tileColIdx ] + ColWidth[ tileColIdx ]
) << CtbLog2SizeY ) - 1
TGRefreshedRightBoundary = TGRefreshedRightBoundary > pic_width_in_luma_samp
les ? pic_width_in_luma_samples : TGRefreshedRightBoundary
TGRefreshedBotBoundary = ( ( RowBd[ tileRowIdx ] + RowHeight[ tileRowIdx ] )
<< CtbLog2SizeY ) - 1
TGRefreshedBotBoundary = TGRefreshedBotBoundary > pic_height_in_luma_samples
? pic_height_in_luma_samples : TGRefreshedBotBoundary
に属するとき、TemporalIdは0に等しくなければならない。
のCVSを含む。
クチャの順序、ならびにアクセスユニットへのそれらの関連付けが、第7.4.2.4.4節に記
載される。
ALユニットを含むアクセスユニットの後の次のアクセスユニットが、以下のうちの1つで
なければならないことが、ビットストリーム適合の要件である。
ト。
、または復号順序でエンドオブシーケンスNALユニットに後続する最初のピクチャである
とき、変数NoIncorrectPicOutputFlagは、1に等しく設定される。
が、変数HandleCraAsCvsStartFlagを現在ピクチャに対する値に設定するために利用可能
であるとき、変数HandleCraAsCvsStartFlagは、外部手段によって提供される値に等しく
設定され、変数NoIncorrectPicOutputFlagは、HandleCraAsCvsStartFlagに等しく設定さ
れる。
rrectPicOutputFlagは、0に等しく設定される。
、または復号順序でエンドオブシーケンスNALユニットに後続する最初のピクチャである
とき、変数NoIncorrectPicOutputFlagは、1に等しく設定される。
StartFlagを現在ピクチャに対する値に設定するために利用可能であるとき、変数HandleG
drAsCvsStartFlagは、外部手段によって提供される値に等しく設定され、変数NoIncorrec
tPicOutputFlagは、HandleGdrAsCvsStartFlagに等しく設定される。
rrectPicOutputFlagは、0に等しく設定される。
を使用する以下の復号プロセス、および上記のことを指定する。
導出される。これは、ピクチャの最初のタイルグループに対してのみ呼び出される必要が
ある。
リスト0(RefPicList[ 0 ])および参照ピクチャリスト1(RefPicList[ 1 ])の導出のために
、第8.3.2節で指定される参照ピクチャリスト構成のための復号プロセスが呼び出される
。
照ピクチャは、「参照のために未使用」または「長期の参照のために使用済み」としてマ
ークされてもよい。これは、ピクチャの最初のタイルグループに対してのみ呼び出される
。
。
Flagが1に等しい。
しいGDRピクチャである。
い1つ以上のタイルグループを含み、関連するGDRピクチャのNoBrokenPictureOutputFlag
が1に等しい。
ループ内フィルタ処理などのために呼び出される。
短期の参照のために使用済み」としてマークされる。
ントである。
ト変数に関連する。
rectPicOutputFlagが1に等しいGDRピクチャでないとき、変数prevPicOrderCntLsbおよびp
revPicOrderCntMsbは、次のように導出される。
前のピクチャを、prevTid0Picとする。
設定される。
orrectPicOutputFlagが1に等しいGDRピクチャであるとき、PicOrderCntMsbは、0に等しく
設定される。
if( ( tile_group_pic_order_cnt_lsb < prevPicOrderCntLsb ) && ( ( prevPicOrde
rCntLsb - tile_group_pic_order_cnt_lsb ) >= ( MaxPicOrderCntLsb / 2 ) ) )
PicOrderCntMsb = prevPicOrderCntMsb + MaxPicOrderCntLsb (8-1)
else if( (tile_group_pic_order_cnt_lsb > prevPicOrderCntLsb ) && ( ( tile_gr
oup_pic_order_cnt_lsb - prevPicOrderCntLsb ) > ( MaxPicOrderCntLsb / 2 ) ) )
PicOrderCntMsb = prevPicOrderCntMsb - MaxPicOrderCntLsb
else
PicOrderCntMsb = prevPicOrderCntMsb
PicOrderCntValは、次のように導出される。
PicOrderCntVal = PicOrderCntMsb + tile_group_pic_order_cnt_lsb (8-2)
に等しく設定されるので、NoIncorrectPicOutputFlagが1に等しいすべてのIRAPピクチャ
は、tile_group_pic_order_cnt_lsbに等しいPicOrderCntValを有する。
に等しく設定されるので、NoIncorrectPicOutputFlagが1に等しいすべてのGDRピクチャは
、tile_group_pic_order_cnt_lsbに等しいPicOrderCntValを有する。
い。
くなるように設定される。
s、PicRefreshedTopBoundaryPos、およびPicRefreshedBotBoundaryPos、すなわち、現在
ピクチャのリフレッシュ済みの領域の境界位置である。
域境界位置変数のセットに関連する。
daryPos、およびPicRefreshedBotBoundaryPosは、次のように導出される。
ルグループである場合、以下のことが適用される。
ryPos ?
ndaryPos ?
os ?
?
が1に等しいGDRピクチャでない、各現在ピクチャに対して、maxPicOrderCnt - minPicOrd
erCntの値がMaxPicOrderCntLsb / 2よりも小さくなければならないことが、ビットストリ
ーム適合の要件である。
ctPicOutputFlagが1に等しいGDRピクチャである場合、(もしあれば)現在、DPBの中の、す
べての参照ピクチャは、「参照のために未使用」としてマークされる。
ックを指定する。
0に等しく設定され、availableFlagLXColは、0に等しく設定される。
付きステップが適用される。
yPos :
Pos :
ryPos :
Pos :
opBoundaryPosからbotBoundaryPosまでの範囲の中にあり、かつxColBrが、両端値を含むl
eftBoundaryPosからrightBoundaryPosまでの範囲の中にある場合、以下のことが適用され
る。
>> 3 ) << 3, ( yColBr >> 3 ) << 3 )によって与えられる修正済みのロケーションをカ
バーするルーマコーディングブロックを指定する。
クチャの左上のルーマサンプルに対してcolCbによって指定されるコロケートルーマコー
ディングブロックの左上のサンプルに等しく設定される。
入力としてcurrCb、colCb、( xColCb, yColCb )、refIdxLX、および0に等しく設定された
sbFlagとともに呼び出され、出力がmvLXColおよびavailableFlagLXColに割り当てられる
。
は、0に等しく設定される。
hedTopBoundaryPos、PicRefreshedRightBoundaryPos、およびPicRefreshedBotBoundaryPo
s。
ように導出される。
L + i ) (8-458)
i ) (8-458)
i ) ) : (8-459)
dir ]。
hedTopBoundaryPos、PicRefreshedRightBoundaryPos、およびPicRefreshedBotBoundaryPo
s。
ように導出される。
L + i - 3 ) (8-830)
i - 3 ) (8-830)
- 3 ) : (8-831)
hedTopBoundaryPos、PicRefreshedRightBoundaryPos、およびPicRefreshedBotBoundaryPo
s。
dthCに等しく設定される。
ように導出される。
) : (8-845)
てのコーディングサブブロックエッジおよび変換ブロックエッジに適用される。
ッジ。
の値がtgAのrefreshed_region_flagの値とは異なる。
ッジ。
の値がtgAのrefreshed_region_flagの値とは異なる。
ッジ。
e_group_deblocking_filter_disabled_flagが1に等しいタイルグループの、上または左の
境界に一致するエッジ。
ジ。
ーマ変換ブロックを横断するエッジ。
ングブロックの左上のサンプルのロケーション( xCb, yCb )を有するコーディングユニッ
トごとに、edgeTypeがEDGE_VERに等しくxCb % 8が0に等しいとき、またはedgeTypeがEDGE
_HORに等しくyCb % 8が0に等しいとき、以下の順序付きステップによってエッジがフィル
タ処理される。
ロック高さnCbHが、1 << log2CbHに等しく設定される。
erEdgeFlagは、0に等しく設定される。
oss_tiles_enabled_flagが0に等しい。
oup_loop_filter_across_tile_groups_enabled_flagが0に等しい。
のすべての条件が満たされる。
reshed_region_flagの値が現在タイルグループのrefreshed_region_flagの値とは異なる
。
ある場合、変数filterEdgeFlagは、0に等しく設定される。
oss_tiles_enabled_flagが0に等しい。
oup_loop_filter_across_tile_groups_enabled_flagが0に等しい。
のすべての条件が満たされる。
reshed_region_flagの値が現在タイルグループのrefreshed_region_flagの値とは異なる
。
期化される。
ySj )および( xYi, yYj )に対して、recPicture[ xSi ][ ySj ]をカバーするコーディン
グブロックを含むコーディングユニットのpcm_loop_filter_disabled_flag、pcm_flag[ x
Yi ][ yYj ]、およびcu_transquant_bypass_flagの値に応じて、以下のことが適用される
。
ステップが適用される。
y ]に基づいて表8-18の中で指定される。
のように導出される。
jk' * SubHeightC ) (8-1129)
jk' )に対して次の条件のうちの1つ以上が真である場合、edgeIdxは、0に等しく設定され
る。
gが0に等しく、現在タイルグループのrefreshed_region_flagが1に等しく、かつロケーシ
ョン( xSik', ySjk' )におけるサンプルを含むタイルグループのrefreshed_region_flag
が0に等しい。
、次の2つの条件のうちの1つが真である。
rZs[ xYi >> MinTbLog2SizeY ][ yYj >> MinTbLog2SizeY ]よりも小さく、サンプルrecPi
cture[ xSi ][ ySj ]が属するタイルグループの中のtile_group_loop_filter_across_til
e_groups_enabled_flagが0に等しい。
xYik' >> MinTbLog2SizeY ][ yYjk' >> MinTbLog2SizeY ]よりも小さく、サンプルrecPic
ture[ xSik' ][ ySjk' ]が属するタイルグループの中のtile_group_loop_filter_across_
tile_groups_enabled_flagが0に等しい。
' )におけるサンプルが、異なるタイルに属する。
る。
ySj + vPos[ 0 ] ] ) +
1 ] ] ) (8-1130)
される。
ySj ] +
スが説明される。
在のルーマコーディングツリーブロックの内側の各再構成ルーマサンプルrecPictureL[ x
][ y ]が、x, y = 0..CtbSizeY - 1を伴って次のようにフィルタ処理される。
)の各々に対するロケーション( hx, vy )は、次のように導出される。
agが0に等しく、ロケーション( x, y )におけるルーマサンプルを含むタイルグループtgA
のrefreshed_region_flagが1に等しい場合、以下のことが適用される。
ed_region_flagが0に等しい場合、変数leftBoundary、rightBoundary、topBoundary、お
よびbotBoundaryは、それぞれ、TGRefreshedLeftBoundary、TGRefreshedRightBoundary、
TGRefreshedTopBoundary、およびTGRefreshedBotBoundaryに等しく設定される。
daryは、それぞれ、PicRefreshedLeftBoundaryPos、PicRefreshedRightBoundaryPos、Pic
RefreshedTopBoundaryPos、およびPicRefreshedBotBoundaryPosに等しく設定される。
説明される。
各々に対するロケーション( hx, vy )が、次のように導出される。
agが0に等しく、ロケーション( x, y )におけるルーマサンプルを含むタイルグループtgA
のrefreshed_region_flagが1に等しい場合、以下のことが適用される。
ed_region_flagが0に等しい場合、変数leftBoundary、rightBoundary、topBoundary、お
よびbotBoundaryは、それぞれ、TGRefreshedLeftBoundary、TGRefreshedRightBoundary、
TGRefreshedTopBoundary、およびTGRefreshedBotBoundaryに等しく設定される。
daryは、それぞれ、PicRefreshedLeftBoundaryPos、PicRefreshedRightBoundaryPos、Pic
RefreshedTopBoundaryPos、およびPicRefreshedBotBoundaryPosに等しく設定される。
る。
のクロマコーディングツリーブロックの内側の各再構成クロマサンプルrecPicture[ x ][
y ]が、x, y = 0..ctbSizeC - 1を伴って次のようにフィルタ処理される。
)の各々に対するロケーション( hx, vy )が、次のように導出される。
agが0に等しく、ロケーション( x, y )におけるルーマサンプルを含むタイルグループtgA
のrefreshed_region_flagが1に等しい場合、以下のことが適用される。
ed_region_flagが0に等しい場合、変数leftBoundary、rightBoundary、topBoundary、お
よびbotBoundaryは、それぞれ、TGRefreshedLeftBoundary、TGRefreshedRightBoundary、
TGRefreshedTopBoundary、およびTGRefreshedBotBoundaryに等しく設定される。
daryは、それぞれ、PicRefreshedLeftBoundaryPos、PicRefreshedRightBoundaryPos、Pic
RefreshedTopBoundaryPos、およびPicRefreshedBotBoundaryPosに等しく設定される。
8-1140)
141)
8)
ように構成されたビデオビットストリーム750を示す。GDR技法700は、図5のGDR技法500と
類似であってもよい。本明細書で使用するビデオビットストリーム750は、コーディング
されたビデオビットストリーム、ビットストリーム、またはそれらの変形とも呼ばれても
よい。図7に示すように、ビットストリーム750は、シーケンスパラメータセット(SPS:seq
uence parameter set)752、ピクチャパラメータセット(PPS:picture parameter set)754
、スライスヘッダ756、および画像データ758を備える。
に共通のデータを含む。対照的に、PPS754は、ピクチャ全体に共通のデータを含む。スラ
イスヘッダ756は、たとえば、スライスタイプ、参照ピクチャのうちのどれが使用される
のかなどの、現在スライスについての情報を含む。SPS752およびPPS754は、パラメータセ
ットと総称されてもよい。SPS752、PPS754、およびスライスヘッダ756は、ネットワーク
アブストラクションレイヤ(NAL)ユニットのタイプである。NALユニットは、後続すべきデ
ータ(たとえば、コーディングされたビデオデータ)のタイプの表示を含むシンタックス構
造である。NALユニットは、ビデオコーディングレイヤ(VCL)NALユニットおよび非VCL NAL
ユニットに分類される。VCL NALユニットは、ビデオピクチャの中のサンプルの値を表す
データを含み、非VCL NALユニットは、パラメータセット(多数のVCL NALユニットに適用
され得る重要なヘッダデータ)などの関連する任意の追加情報、および補足エンハンスメ
ント情報(タイミング情報、および復号ビデオ信号の有用性を向上させ得るが、ビデオピ
クチャの中のサンプルの値を復号するために必要でない、他の追加データ)を含む。ビッ
トストリーム750が、実際の適用例では他のパラメータおよび情報を含んでもよいことを
、当業者は諒解されよう。
備える。画像データ758は、単に、ペイロード、またはビットストリーム750の中で搬送中
のデータと呼ばれてもよい。一実施形態では、画像データ758は、GDRピクチャ702、1つ以
上のトレーリングピクチャ704、およびリカバリポイントピクチャ706を含む、CVS708(ま
たは、CLVS)を備える。一実施形態では、トレーリングピクチャ704は、GDR期間の中でリ
カバリポイントピクチャ706に先行するので、GDRピクチャの形式と見なされてもよい。
トピクチャ706は、CVS708の中のGDR期間を規定してもよい。一実施形態では、復号順序は
、GDRピクチャ702で始まり、トレーリングピクチャ704に続き、次いで、リカバリピクチ
ャ706に進む。
取られると、GDRピクチャ702および出力順序(たとえば、提示順序410)でGDRピクチャ702
とリカバリポイントピクチャ706との間の任意のトレーリングピクチャ704が出力されるこ
とを防止するために、第1のフラグはユーザインターフェース(たとえば、外部入力)によ
って提供される値に等しく設定され、第2のフラグは第1のフラグに等しく設定される。そ
うではなく、ユーザインターフェース84を介してビデオコーダ30によって値が受け取られ
ないとき、第1のフラグおよび第2のフラグは異なる値(たとえば、0)に等しく設定される
。一実施形態では、第1のフラグが、ユーザインターフェースによって提供される値に等
しく設定されるとき、GDRピクチャ702だけが出力されることを防止される。
オシーケンス(CLVS)に対するコーディングされたビデオシーケンスである。特に、ビデオ
ビットストリーム750が単一のレイヤを含むとき、CVSとCLVSとは同じである。ビデオビッ
トストリーム750が複数のレイヤを含むときのみ、CVSとCLVSとは異なる。
トピクチャ706で終了する一連のピクチャにわたって機能する。GDR技法700、GDRピクチャ
702、トレーリングピクチャ704、およびリカバリポイントピクチャ706は、図5のGDR技法5
00、GDRピクチャ502、トレーリングピクチャ504、およびリカバリポイントピクチャ506と
類似である。したがって、簡潔のために、GDR技法700が実施される方式は、図7に関して
繰り返さない。
カバリポイントピクチャ706は各々、それら自体のVCL NALユニット730内に含まれる。CVS
708の中のVCL NALユニット730のセットは、アクセスユニットと呼ばれてもよい。
T)を有する。すなわち、一実施形態では、CVS708の中のGDRピクチャ702を含むNALユニッ
ト730は、トレーリングピクチャ704およびリカバリポイントピクチャ706に対してそれ自
体の固有のNALユニットタイプを有する。一実施形態では、GDR_NUTは、ビットストリーム
750がIRAPピクチャで始まる必要があるのではなく、ビットストリーム750がGDRピクチャ7
02で始まることを可能にする。GDRピクチャ702のVCL NALユニット730をGDR_NUTとして指
定することは、CVS708の中の初期VCL NALユニット730がGDRピクチャ702を含むことを、た
とえば、デコーダに示してもよい。
、GDRピクチャ702はGDR期間の中の初期ピクチャである。一実施形態では、GDRピクチャ70
2は0に等しい時間識別子(ID)を有する。時間IDは、他のピクチャに対するピクチャの位置
または順序を識別する値または数である。一実施形態では、GDR_NUTを有するVCL NALユニ
ット730を含むアクセスユニットは、GDRアクセスユニットと指定される。一実施形態では
、GDRピクチャ702は、別の(たとえば、より大きい)GDRピクチャのコーディングされたス
ライスである。すなわち、GDRピクチャ702は、より大きいGDRピクチャの一部分であって
もよい。
ングされたビデオビットストリームを復号する方法800の一実施形態である。方法800は、
ビデオエンコーダ(たとえば、ビデオエンコーダ20)から復号ビットストリームが直接また
は間接的に受信された後に実行されてもよい。方法800は、IRAPピクチャを使用する必要
なく順次イントラリフレッシュがランダムアクセスを有効化することを可能とするので、
本方法は復号プロセスを改善する。GDRピクチャが出力されることを防止するために、フ
ラグの値はユーザインターフェース(たとえば、図3の中のユーザインターフェース84、ま
たはいくつかの他の外部手段)を介してビデオデコーダのユーザによって設定される。一
実施形態では、GDRピクチャおよび出力順序でGDRピクチャとリカバリポイントピクチャと
の間の任意のトレーリングピクチャが出力されることを防止するために、フラグの値はユ
ーザインターフェース(たとえば、図3の中のユーザインターフェース84、またはいくつか
の他の外部手段)を介してビデオデコーダのユーザによって設定される。このようにして
フラグを設定することは、潜在的にダーティなデータがディスプレイに出力されることを
防止し、ビデオデコーダがユーザの選好に従って動作することを可能にする。したがって
、実際問題として、コーデックの性能が改善され、そのことはより良好なユーザエクスペ
リエンスにつながる。
ば、図3の中のユーザインターフェース84、またはいくつかの他の外部手段)によって提供
されるかどうかを決定する。一実施形態では、外部入力は、ビデオデコーダのグラフィッ
クユーザインターフェース(GUI)である。一実施形態では、ビデオデコーダのユーザが、
外部入力を使用して第1のフラグの値を提供する。一実施形態では、第1のフラグはHandle
GdrAsCvsStartFlagと指定される。
提供されるとき、漸進的復号リフレッシュ(GDR)ピクチャ(たとえば、GDRピクチャ702)お
よび出力順序でGDRピクチャ702とリカバリポイントピクチャ706との間の任意のトレーリ
ングピクチャ704が出力されることを防止するために、第1のフラグを、外部入力によって
提供される値に等しく、かつ第2のフラグを第1のフラグに等しく設定する。一実施形態で
は、GDRピクチャおよび出力順序でGDRピクチャとリカバリポイントピクチャとの間の任意
のトレーリングピクチャが出力されることを防止するために、第1のフラグの値は1に設定
される。一実施形態では、第1のフラグに対する値が外部入力によって提供されないとき
、第1のフラグの値は0に設定される。
中の初期ピクチャである。一実施形態では、GDRピクチャは、コーディングされたビデオ
ビットストリームのレイヤの中の初期ピクチャである。一実施形態では、レイヤは、コー
ディングされたビデオビットストリームのCVSのCLVSである。
チャおよびリカバリポイントピクチャが、次いで、順に復号される。ブロック808におい
て、ビデオデコーダは、GDRピクチャを復号ピクチャバッファ(DPB)の中に記憶する。一実
施形態では、第1および第2のフラグの設定によって、GDRピクチャが出力されることを制
限されていないとき、GDRピクチャに基づいて生成された画像が、電子デバイス(たとえば
、スマートフォン、タブレット、ラップトップ、パーソナルコンピュータなど)のユーザ
のために表示されてもよい。
エンコーダ20またはビデオデコーダ30)の概略図である。ビデオコーディングデバイス900
は、本明細書で説明するような、開示する実施形態を実施するのに適している。ビデオコ
ーディングデバイス900は、データを受信するための入口ポート910および受信機ユニット
(Rx)920、データを処理するためのプロセッサ、論理ユニット、または中央演算処理装置(
CPU)930、データを送信するための送信機ユニット(Tx)940および出口ポート950、ならび
にデータを記憶するためのメモリ960を備える。ビデオコーディングデバイス900はまた、
光信号または電気信号の出口または入口のために、入口ポート910、受信機ユニット920、
送信機ユニット940、および出口ポート950に結合された、光電気(OE:optical-to-electri
cal)構成要素および電気光(EO:electrical-to-optical)構成要素を備えてもよい。
30は、1つ以上のCPUチップ、コア(たとえば、マルチコアプロセッサとして)、フィールド
プログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、およびデジタル信号
プロセッサ(DSP)として実装されてもよい。プロセッサ930は、入口ポート910、受信機ユ
ニット920、送信機ユニット940、出口ポート950、およびメモリ960と通信している。プロ
セッサ930はコーディングモジュール970を備える。コーディングモジュール970は、上記
で説明した開示する実施形態を実施する。たとえば、コーディングモジュール970は、様
々なコーデック機能を実施、処理、準備、または提供する。したがって、コーディングモ
ジュール970を含むことは、ビデオコーディングデバイス900の機能への大幅な改善をもた
らし、異なる状態へのビデオコーディングデバイス900の変換に影響を及ぼす。代替的に
、コーディングモジュール970は、メモリ960の中に記憶されプロセッサ930によって実行
される命令として実装される。
および/または出力(I/O)デバイス980を含んでもよい。I/Oデバイス980は、ビデオデータ
を表示するためのディスプレイ、オーディオデータを出力するためのスピーカーなどの、
出力デバイスを含んでもよい。I/Oデバイス980はまた、キーボード、マウス、トラックボ
ールなどの入力デバイス、および/またはそのような出力デバイスと相互作用するための
対応するインターフェースを含んでもよい。一実施形態では、I/Oデバイス980は、第1の
フラグの値を入力するためにビデオコーディングデバイス900のユーザによって利用され
る外部手段である。
憶するために、またプログラム実行中に読み取られる命令およびデータを記憶するために
、1つ以上のディスク、テープドライブ、およびソリッドステートドライブを備え、オー
バーフローデータ記憶デバイスとして使用されてもよい。メモリ960は、揮発性および/ま
たは不揮発性であってもよく、読取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、
3元連想メモリ(TCAM:ternary content-addressable memory)、および/またはスタティッ
クランダムアクセスメモリ(SRAM)であってもよい。
は、コーディングするための手段1000は、ビデオコーディングデバイス1002(たとえば、
ビデオエンコーダ20またはビデオデコーダ30)の中に実装される。ビデオコーディングデ
バイス1002は受信手段1001を含む。受信手段1001は、符号化すべきピクチャを受信するか
、または復号すべきビットストリームを受信するように構成される。ビデオコーディング
デバイス1002は、受信手段1001に結合された送信手段1007を含む。送信手段1007は、ビッ
トストリームをデコーダへ送信するか、または復号画像を表示手段(たとえば、I/Oデバイ
ス1080のうちの1つ)へ送信するように構成される。
01または送信手段1007のうちの少なくとも1つに結合される。記憶手段1003は、命令を記
憶するように構成される。ビデオコーディングデバイス1002はまた、処理手段1005を含む
。処理手段1005は、記憶手段1003に結合される。処理手段1005は、本明細書で開示する方
法を実行するために、記憶手段1003の中に記憶された命令を実行するように構成される。
とを必要とされるとは限らないことも理解されたく、そのような方法のステップの順序は
、単に例であるものと理解されたい。同様に、そのような方法の中に追加のステップが含
まれてもよく、いくつかのステップは、本開示の様々な実施形態に一致する方法の中で省
略されても、組み合わせられてもよい。
本開示の趣旨または範囲から逸脱することなく、多くの他の特定の形態で具現されてもよ
いことを理解されたい。本例は限定的ではなく例示的と見なされるべきであり、その意図
は本明細書において与えられる詳細に限定されない。たとえば、様々な要素または構成要
素が別のシステムの中で組み合わせられても、もしくは統合されてもよく、またはいくつ
かの特徴が省略されても、もしくは実施されなくてもよい。
ステム、サブシステム、および方法は、本開示の範囲から逸脱することなく、他のシステ
ム、モジュール、技法、または方法と組み合わせられても、または統合されてもよい。結
合されるかもしくは直接結合されるか、または互いに通信するものとして、図示または説
明される他の項目は、電気的か、機械的か、または別の方法であるかにかかわらず、いく
つかのインターフェース、デバイス、または中間構成要素を通じて、間接的に結合されて
も、または通信していてもよい。変更、置換、および改変の他の例は、当業者によって確
認可能であり、本明細書で開示する趣旨および範囲から逸脱することなく行うことができ
る。
12 ソースデバイス、ビデオデバイス
14 宛先デバイス
16 コンピュータ可読媒体
18 ビデオソース
20 ビデオエンコーダ
22 出力インターフェース
28 入力インターフェース
30 ビデオデコーダ
32 ディスプレイデバイス
40 モード選択ユニット
42 動き推定ユニット
44 動き補償ユニット
46 イントラ予測ユニット
48 区分ユニット
50 加算器
52 変換処理ユニット
54 量子化ユニット
56 エントロピーコーディングユニット、エントロピー符号化ユニット
58 逆量子化ユニット
60 逆変換ユニット
62 加算器
64 参照フレームメモリ
70 エントロピー復号ユニット
72 動き補償ユニット
74 イントラ予測ユニット
76 逆量子化ユニット
78 逆変換ユニット
80 加算器
82 参照フレームメモリ
84 ユーザインターフェース(UI)
402 IRAPピクチャ
404 リーディングピクチャ
406 トレーリングピクチャ
408 復号順序
410 提示順序
502 GDRピクチャ
504 トレーリングピクチャ
506 リカバリポイントピクチャ
508 コーディングされたビデオシーケンス
510 リフレッシュ済みの/クリーンな領域
512 リフレッシュされていない/ダーティな領域
602 現在ピクチャ
604 参照ピクチャ、リフレッシュ済みの領域
606 リフレッシュ済みの領域
608 リフレッシュされていない領域、リフレッシュ済みの領域
610 動きベクトル
612 参照ブロック
614 現在ブロック
702 GDRピクチャ
704 トレーリングピクチャ
706 リカバリポイントピクチャ
708 CVS
730 NALユニット
750 ビデオビットストリーム
752 シーケンスパラメータセット(SPS)
754 ピクチャパラメータセット(PPS)
756 スライスヘッダ
758 画像データ
900 ビデオコーディングデバイス
910 入口ポート
920 受信機ユニット(Rx)
930 プロセッサ、論理ユニット、中央演算処理装置(CPU)
940 送信機ユニット(Tx)
950 出口ポート
960 メモリ
970 コーディングモジュール
980 入力および/または出力(I/O)デバイス
1000 コーディングするための手段
1001 受信手段
1002 ビデオコーディングデバイス
1003 記憶手段
1005 処理手段
1007 送信手段
Claims (18)
- ビデオエンコーダによって実施される方法であって、
第1のフラグに対する値が外部手段によって提供されるかどうかを決定するステップと、
前記第1のフラグに対する前記値が前記外部手段によって提供されるとき、コーディングされた漸進的復号リフレッシュ(GDR)ピクチャが出力されることを防止するために、前記第1のフラグの値を、前記外部手段によって提供される前記値に等しく、かつ第2のフラグの値を前記第1のフラグの前記値に等しく、設定するステップと、
前記コーディングされたGDRピクチャを符号化するステップと
を含む、方法。 - 前記第1のフラグに対する前記値が前記外部手段によって提供されるとき、出力順序で前記コーディングされたGDRピクチャとリカバリポイントピクチャとの間の任意のトレーリングピクチャが出力されることをさらに防止するために、前記第2のフラグの前記値が前記第1のフラグの前記値に等しく設定される、請求項1に記載の方法。
- 前記外部手段は、前記ビデオエンコーダのグラフィックユーザインターフェース(GUI)であり、前記第1のフラグの前記値は、前記外部手段を使用して前記ビデオエンコーダのユーザによって提供される、請求項1に記載の方法。
- 前記第1のフラグはHandleGdrAsCvsStartFlagと指定される、請求項1に記載の方法。
- 前記コーディングされたGDRピクチャおよび出力順序で前記コーディングされたGDRピクチャと前記リカバリポイントピクチャとの間の任意のトレーリングピクチャが出力されることを防止するために、前記第2のフラグの前記値は1に設定される、請求項2に記載の方法。
- 前記第1のフラグに対する前記値が前記外部手段によって提供されないとき、前記第1のフラグの前記値は0に設定される、請求項1に記載の方法。
- 符号化デバイスであって、
符号化すべきピクチャを受信するように構成された受信機と、
前記受信機に結合されたメモリであって、命令を記憶する、メモリと、
前記メモリに結合されたプロセッサとを備え、前記プロセッサは、前記符号化デバイスに、
第1のフラグに対する値が外部手段によって提供されるかどうかを決定することと、
前記第1のフラグに対する前記値が前記外部手段によって提供されるとき、コーディングされた漸進的復号リフレッシュ(GDR)ピクチャが出力されることを防止するために、前記第1のフラグの値を、前記外部手段によって提供される前記値に等しく、かつ第2のフラグの値を前記第1のフラグの前記値に等しく設定することと、
前記コーディングされたGDRピクチャを符号化することと
をさせるために、前記命令を実行するように構成される、
符号化デバイス。 - 前記第1のフラグに対する前記値が前記外部手段によって提供されるとき、コーディングされた漸進的復号リフレッシュ(GDR)ピクチャおよび出力順序で前記コーディングされたGDRピクチャとリカバリポイントピクチャとの間の任意のトレーリングピクチャが出力されることをさらに防止するために、前記第2のフラグの前記値は前記第1のフラグの前記値に等しく設定される、請求項7に記載の符号化デバイス。
- 前記外部手段は、ビデオエンコーダのグラフィックユーザインターフェース(GUI)であり、前記第1のフラグの前記値は、前記外部手段を使用して前記ビデオエンコーダのユーザによって提供される、請求項7に記載の符号化デバイス。
- 前記第1のフラグはHandleGdrAsCvsStartFlagと指定される、請求項7に記載の符号化デバイス。
- 前記コーディングされたGDRピクチャおよび出力順序で前記コーディングされたGDRピクチャと前記リカバリポイントピクチャとの間の任意のトレーリングピクチャが出力されることを防止するために、前記第2のフラグの前記値は1に設定される、請求項8に記載の符号化デバイス。
- 前記第1のフラグに対する前記値が前記外部手段によって提供されないとき、前記第1のフラグの前記値は0に設定される、請求項7に記載の符号化デバイス。
- 符号化すべきピクチャを受信するように構成された受信機と、
前記受信機に結合された送信機であって、ビットストリームをデコーダへ送信するように構成された、送信機と、
前記受信機または前記送信機のうちの少なくとも1つに結合されたメモリであって、命令を記憶するように構成された、メモリと、
前記メモリに結合されたプロセッサであって、請求項1から6のいずれか一項に記載の方法を実行するために、前記メモリの中に記憶された前記命令を実行するように構成された、プロセッサと
を備える、コーディング装置。 - デコーダと、
前記デコーダと通信しているエンコーダであって、請求項7から13のいずれか一項に記載の符号化デバイスまたはコーディング装置を含む、エンコーダと、
を備える、システム。 - 符号化すべきピクチャを受信するように構成された、受信手段と、
前記受信手段に結合された送信手段であって、ビットストリームを復号手段へ送信するように構成された、送信手段と、
前記受信手段または前記送信手段のうちの少なくとも1つに結合された記憶手段であって、命令を記憶するように構成された、記憶手段と、
前記記憶手段に結合された処理手段であって、請求項1から6のいずれか一項に記載の方法を実行するために、前記記憶手段の中に記憶された前記命令を実行するように構成された、処理手段と
を備える、コーディングするための手段。 - 第1のフラグに対する値が外部手段によって提供されるかどうかを決定することと、前記第1のフラグに対する前記値が前記外部手段によって提供されるとき、コーディングされた漸進的復号リフレッシュ(GDR)ピクチャが出力されることを防止するために、前記第1のフラグの値を、前記外部手段によって提供される前記値に等しく、かつ第2のフラグの値を前記第1のフラグの前記値に等しく設定することとを行うように構成された、決定ユニットと、
前記コーディングされたGDRピクチャを符号化するように構成された符号化ユニットと
を備える、エンコーダ。 - ビデオコーディングデバイスによる使用のためのコンピュータプログラムを含む、非一時的コンピュータ可読媒体であって、前記コンピュータプログラムは前記非一時的コンピュータ可読媒体に記憶されたコンピュータによって実行可能な命令であって、プロセッサによって実行されたときに、前記ビデオコーディングデバイスに請求項1から6のいずれか一項に記載の方法を行わせるような命令を含むコンピュータプログラムを含む、非一時的コンピュータ可読媒体。
- 複数のシンタックス要素を含むビデオ信号のための符号化されたビットストリームを記憶および送信するための装置であって、
符号化すべきピクチャを受信するように構成された受信機と、
命令を記憶したメモリと、
前記ビデオ信号のための符号化されたビットストリームを送信するように構成された送信機と、
前記受信機、前記メモリおよび前記送信機に結合されたプロセッサとを備え、
前記プロセッサによって実行されたときに、前記命令が前記プロセッサに、
第1のフラグに対する値が外部手段によって提供されるかどうかを決定することと、
前記第1のフラグに対する値が外部手段によって提供されるとき、コーディングされた漸進的復号リフレッシュ(GDR)ピクチャが出力されることを防止するために、前記第1のフラグの値を、前記外部手段によって提供される前記値に等しく、かつ第2のフラグの値を前記第1のフラグの値に等しく設定することと、
GDRピクチャをコーディングすることと、
前記コーディングされたGDRと、前記第1のフラグおよび前記第2のフラグを含んだ前記複数のシンタックス要素とを含む、前記ビデオ信号のための符号化されたビットストリームを前記メモリに記憶することと、
を実行させる、装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2025107361A JP2025143327A (ja) | 2019-03-11 | 2025-06-25 | エンコーダ、デコーダ、および対応する方法 |
Applications Claiming Priority (6)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201962816722P | 2019-03-11 | 2019-03-11 | |
| US62/816,722 | 2019-03-11 | ||
| US201962871020P | 2019-07-05 | 2019-07-05 | |
| US62/871,020 | 2019-07-05 | ||
| PCT/US2020/022185 WO2020185962A1 (en) | 2019-03-11 | 2020-03-11 | Gradual decoding refresh in video coding |
| JP2021555265A JP7302000B2 (ja) | 2019-03-11 | 2020-03-11 | エンコーダ、デコーダ、および対応する方法 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021555265A Division JP7302000B2 (ja) | 2019-03-11 | 2020-03-11 | エンコーダ、デコーダ、および対応する方法 |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2025107361A Division JP2025143327A (ja) | 2019-03-11 | 2025-06-25 | エンコーダ、デコーダ、および対応する方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2023130378A JP2023130378A (ja) | 2023-09-20 |
| JP7704810B2 true JP7704810B2 (ja) | 2025-07-08 |
Family
ID=72426295
Family Applications (10)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021554982A Active JP7337948B2 (ja) | 2019-03-11 | 2020-03-11 | エンコーダ、デコーダ、および対応する方法 |
| JP2021554984A Active JP7399977B2 (ja) | 2019-03-11 | 2020-03-11 | エンコーダ、デコーダ、および対応する方法 |
| JP2021555265A Active JP7302000B2 (ja) | 2019-03-11 | 2020-03-11 | エンコーダ、デコーダ、および対応する方法 |
| JP2021554681A Active JP7364685B2 (ja) | 2019-03-11 | 2020-03-11 | エンコーダ、デコーダおよび対応する方法 |
| JP2023101903A Active JP7704810B2 (ja) | 2019-03-11 | 2023-06-21 | エンコーダ、デコーダ、および対応する方法 |
| JP2023135533A Active JP7656666B2 (ja) | 2019-03-11 | 2023-08-23 | エンコーダ、デコーダ、および対応する方法 |
| JP2023173335A Active JP7678049B2 (ja) | 2019-03-11 | 2023-10-05 | エンコーダ、デコーダおよび対応する方法 |
| JP2023184082A Active JP7597891B2 (ja) | 2019-03-11 | 2023-10-26 | エンコーダ、デコーダ、および対応する方法 |
| JP2025051297A Active JP7826540B2 (ja) | 2019-03-11 | 2025-03-26 | エンコーダ、デコーダおよび対応する方法 |
| JP2025107361A Pending JP2025143327A (ja) | 2019-03-11 | 2025-06-25 | エンコーダ、デコーダ、および対応する方法 |
Family Applications Before (4)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021554982A Active JP7337948B2 (ja) | 2019-03-11 | 2020-03-11 | エンコーダ、デコーダ、および対応する方法 |
| JP2021554984A Active JP7399977B2 (ja) | 2019-03-11 | 2020-03-11 | エンコーダ、デコーダ、および対応する方法 |
| JP2021555265A Active JP7302000B2 (ja) | 2019-03-11 | 2020-03-11 | エンコーダ、デコーダ、および対応する方法 |
| JP2021554681A Active JP7364685B2 (ja) | 2019-03-11 | 2020-03-11 | エンコーダ、デコーダおよび対応する方法 |
Family Applications After (5)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2023135533A Active JP7656666B2 (ja) | 2019-03-11 | 2023-08-23 | エンコーダ、デコーダ、および対応する方法 |
| JP2023173335A Active JP7678049B2 (ja) | 2019-03-11 | 2023-10-05 | エンコーダ、デコーダおよび対応する方法 |
| JP2023184082A Active JP7597891B2 (ja) | 2019-03-11 | 2023-10-26 | エンコーダ、デコーダ、および対応する方法 |
| JP2025051297A Active JP7826540B2 (ja) | 2019-03-11 | 2025-03-26 | エンコーダ、デコーダおよび対応する方法 |
| JP2025107361A Pending JP2025143327A (ja) | 2019-03-11 | 2025-06-25 | エンコーダ、デコーダ、および対応する方法 |
Country Status (8)
| Country | Link |
|---|---|
| US (12) | US11856189B2 (ja) |
| EP (6) | EP3928512A4 (ja) |
| JP (10) | JP7337948B2 (ja) |
| KR (8) | KR102809617B1 (ja) |
| CN (4) | CN113615175A (ja) |
| BR (1) | BR112021017985A2 (ja) |
| MX (4) | MX2021011038A (ja) |
| WO (4) | WO2020185957A1 (ja) |
Families Citing this family (20)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN119893088A (zh) * | 2018-08-06 | 2025-04-25 | 夏普株式会社 | 图像解码装置、图像编码装置以及计算机可读介质 |
| KR102610092B1 (ko) | 2018-08-17 | 2023-12-04 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 비디오 코딩의 참조 픽처 관리 |
| EP3928512A4 (en) * | 2019-03-11 | 2022-06-22 | Huawei Technologies Co., Ltd. | STEP BY DECODE REFRESHMENT IN VIDEO ENCODING |
| US11706429B2 (en) * | 2019-03-12 | 2023-07-18 | Hyundai Motor Company | Method and device for encoding and decoding image involving gradual refresh technique |
| GB2617304B (en) * | 2019-03-20 | 2024-04-03 | V Nova Int Ltd | Residual filtering in signal enhancement coding |
| EP3910952B1 (en) * | 2019-04-23 | 2023-06-21 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | Image decoding method, decoder and storage medium |
| EP4058935A4 (en) | 2019-12-26 | 2023-01-18 | ByteDance Inc. | TECHNIQUES FOR IMPLEMENTING A DECODE ORDER IN AN ENCODED IMAGE |
| CN114830662B (zh) * | 2019-12-27 | 2023-04-14 | 阿里巴巴(中国)有限公司 | 用于对图像执行逐步解码刷新处理的方法和系统 |
| KR102850346B1 (ko) | 2020-03-19 | 2025-08-25 | 바이트댄스 아이엔씨 | 레퍼런스 픽처 순서에 대한 제약들 |
| US11533499B2 (en) | 2020-03-31 | 2022-12-20 | Tencent America LLC | Method for signaling mixed NAL unit type and subpicture partitioning in coded video stream |
| US11496730B2 (en) * | 2020-04-03 | 2022-11-08 | Electronics And Telecommunications Research Institute | Method, apparatus and storage medium for image encoding/decoding using subpicture |
| WO2022174431A1 (zh) * | 2021-02-20 | 2022-08-25 | 深圳市大疆创新科技有限公司 | 图像传输方法、可移动平台、设备及计算机可读存储介质 |
| CN114630122B (zh) | 2021-03-19 | 2023-04-28 | 杭州海康威视数字技术股份有限公司 | 基于自适应帧内刷新机制的解码、编码方法及相关设备 |
| EP4369638A4 (en) * | 2021-07-29 | 2024-10-16 | Huawei Technologies Co., Ltd. | DECODING METHOD AND APPARATUS |
| WO2023059081A1 (ko) | 2021-10-06 | 2023-04-13 | 솔브레인 주식회사 | 전해액 및 이를 포함하는 이차전지 |
| WO2023131435A1 (en) * | 2022-01-05 | 2023-07-13 | Nokia Technologies Oy | Gradual decoding refresh |
| EP4300957A1 (en) | 2022-06-30 | 2024-01-03 | Nokia Technologies Oy | A method, an apparatus and a computer program product for implementing gradual decoding refresh |
| US12267489B2 (en) * | 2022-12-06 | 2025-04-01 | Realtek Semiconductor Corp. | Coding algorithm for realizing distributed gradual decoding refresh |
| US12348747B2 (en) * | 2023-04-25 | 2025-07-01 | Tencent America LLC | Implicit masked blending mode |
| US12477122B2 (en) * | 2023-06-20 | 2025-11-18 | Tencent America LLC | Implicit masked blending mode improvement |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7302000B2 (ja) | 2019-03-11 | 2023-07-03 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | エンコーダ、デコーダ、および対応する方法 |
Family Cites Families (32)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| MXPA05000558A (es) * | 2002-07-16 | 2005-04-19 | Nokia Corp | Metodo de acceso aleatorio y renovacion gradual de imagen en codificacion de video. |
| US20040260827A1 (en) * | 2003-06-19 | 2004-12-23 | Nokia Corporation | Stream switching based on gradual decoder refresh |
| EP2119187B1 (en) * | 2007-02-23 | 2017-07-19 | Nokia Technologies Oy | Backward-compatible characterization of aggregated media data units |
| CN102342127A (zh) * | 2009-01-28 | 2012-02-01 | 诺基亚公司 | 用于视频编码和解码的方法和装置 |
| TW201210325A (en) * | 2010-07-21 | 2012-03-01 | Nokia Corp | Method and apparatus for indicating switching points in a streaming session |
| US10034018B2 (en) * | 2011-09-23 | 2018-07-24 | Velos Media, Llc | Decoded picture buffer management |
| US9264717B2 (en) * | 2011-10-31 | 2016-02-16 | Qualcomm Incorporated | Random access with advanced decoded picture buffer (DPB) management in video coding |
| US9124895B2 (en) * | 2011-11-04 | 2015-09-01 | Qualcomm Incorporated | Video coding with network abstraction layer units that include multiple encoded picture partitions |
| US9736476B2 (en) * | 2012-04-27 | 2017-08-15 | Qualcomm Incorporated | Full random access from clean random access pictures in video coding |
| AU2013282644B2 (en) | 2012-06-25 | 2016-05-12 | Nec Corporation | Video encoding/decoding device, method, and program |
| US9225978B2 (en) * | 2012-06-28 | 2015-12-29 | Qualcomm Incorporated | Streaming adaption based on clean random access (CRA) pictures |
| US9648322B2 (en) * | 2012-07-10 | 2017-05-09 | Qualcomm Incorporated | Coding random access pictures for video coding |
| US9491457B2 (en) | 2012-09-28 | 2016-11-08 | Qualcomm Incorporated | Signaling of regions of interest and gradual decoding refresh in video coding |
| US9571847B2 (en) * | 2013-01-07 | 2017-02-14 | Qualcomm Incorporated | Gradual decoding refresh with temporal scalability support in video coding |
| US9674533B2 (en) * | 2013-04-05 | 2017-06-06 | Qualcomm Incorporated | Picture alignments in multi-layer video coding |
| US10003815B2 (en) * | 2013-06-03 | 2018-06-19 | Qualcomm Incorporated | Hypothetical reference decoder model and conformance for cross-layer random access skipped pictures |
| US9627001B2 (en) * | 2013-08-28 | 2017-04-18 | Cisco Technology, Inc. | Support for trick modes in HEVC streams |
| US10257527B2 (en) * | 2013-09-26 | 2019-04-09 | Telefonaktiebolaget Lm Ericsson (Publ) | Hybrid codec scalable video |
| EP3078195A4 (en) * | 2013-12-02 | 2017-08-09 | Nokia Technologies OY | Video encoding and decoding |
| US10560710B2 (en) * | 2014-01-03 | 2020-02-11 | Qualcomm Incorporated | Method for coding recovery point supplemental enhancement information (SEI) messages and region refresh information SEI messages in multi-layer coding |
| US10136152B2 (en) * | 2014-03-24 | 2018-11-20 | Qualcomm Incorporated | Use of specific HEVC SEI messages for multi-layer video codecs |
| JP6398569B2 (ja) * | 2014-10-07 | 2018-10-03 | 株式会社ソシオネクスト | 画像符号化装置、画像符号化方法および画像符号化プログラム |
| WO2017052626A1 (en) * | 2015-09-25 | 2017-03-30 | Intel Corporation | Power gate with metal on both sides |
| US20170111642A1 (en) * | 2015-10-14 | 2017-04-20 | Qualcomm Incorporated | Support of random access and switching of layers and sub-layers in multi-layer video files |
| US10638147B2 (en) * | 2018-06-01 | 2020-04-28 | Apple Inc. | Gradual decoder refresh techniques with management of reference pictures |
| US10972755B2 (en) * | 2018-12-03 | 2021-04-06 | Mediatek Singapore Pte. Ltd. | Method and system of NAL unit header structure for signaling new elements |
| EP3900345A4 (en) * | 2018-12-20 | 2022-03-02 | Telefonaktiebolaget LM Ericsson (publ) | NORMATIVE RECOVERY POINT INDICATION |
| WO2020142382A1 (en) * | 2018-12-31 | 2020-07-09 | Futurewei Technologies, Inc. | Support of adaptive resolution change in video coding |
| US20220150546A1 (en) * | 2019-03-11 | 2022-05-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods for recovery point process for video coding and related apparatus |
| US11228777B2 (en) * | 2019-12-30 | 2022-01-18 | Tencent America LLC | Method for layerwise random access in a coded video stream |
| WO2021177794A1 (ko) * | 2020-03-05 | 2021-09-10 | 엘지전자 주식회사 | 혼성 nal 유닛 타입에 기반하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법 |
| JP7529804B2 (ja) * | 2020-05-22 | 2024-08-06 | バイトダンス インコーポレイテッド | アクセスユニットにおけるピクチャ情報の信号通知 |
-
2020
- 2020-03-11 EP EP20770334.9A patent/EP3928512A4/en not_active Ceased
- 2020-03-11 MX MX2021011038A patent/MX2021011038A/es unknown
- 2020-03-11 CN CN202080020529.3A patent/CN113615175A/zh active Pending
- 2020-03-11 WO PCT/US2020/022180 patent/WO2020185957A1/en not_active Ceased
- 2020-03-11 JP JP2021554982A patent/JP7337948B2/ja active Active
- 2020-03-11 BR BR112021017985A patent/BR112021017985A2/pt unknown
- 2020-03-11 MX MX2021011014A patent/MX2021011014A/es unknown
- 2020-03-11 KR KR1020217032492A patent/KR102809617B1/ko active Active
- 2020-03-11 JP JP2021554984A patent/JP7399977B2/ja active Active
- 2020-03-11 KR KR1020257015814A patent/KR20250074685A/ko active Pending
- 2020-03-11 WO PCT/US2020/022185 patent/WO2020185962A1/en not_active Ceased
- 2020-03-11 KR KR1020257017187A patent/KR20250076703A/ko active Pending
- 2020-03-11 CN CN202080020589.5A patent/CN113924781A/zh active Pending
- 2020-03-11 EP EP24185878.6A patent/EP4432649A3/en active Pending
- 2020-03-11 EP EP20768948.0A patent/EP3928511A4/en not_active Ceased
- 2020-03-11 WO PCT/US2020/022182 patent/WO2020185959A1/en not_active Ceased
- 2020-03-11 JP JP2021555265A patent/JP7302000B2/ja active Active
- 2020-03-11 CN CN202080020573.4A patent/CN113557722A/zh active Pending
- 2020-03-11 KR KR1020217032625A patent/KR102845503B1/ko active Active
- 2020-03-11 KR KR1020217032495A patent/KR102809616B1/ko active Active
- 2020-03-11 EP EP20770691.2A patent/EP3928520A4/en active Pending
- 2020-03-11 JP JP2021554681A patent/JP7364685B2/ja active Active
- 2020-03-11 KR KR1020257026517A patent/KR20250123946A/ko active Pending
- 2020-03-11 KR KR1020217032535A patent/KR102814173B1/ko active Active
- 2020-03-11 KR KR1020257015813A patent/KR20250074684A/ko active Pending
- 2020-03-11 WO PCT/US2020/022179 patent/WO2020185956A1/en not_active Ceased
- 2020-03-11 MX MX2021011012A patent/MX2021011012A/es unknown
- 2020-03-11 CN CN202080020603.1A patent/CN113557733A/zh active Pending
- 2020-03-11 MX MX2021011013A patent/MX2021011013A/es unknown
- 2020-03-11 EP EP24187263.9A patent/EP4529159A1/en active Pending
- 2020-03-11 EP EP20769626.1A patent/EP3928508A4/en active Pending
-
2021
- 2021-09-09 US US17/470,791 patent/US11856189B2/en active Active
- 2021-09-09 US US17/470,776 patent/US11632545B2/en active Active
- 2021-09-09 US US17/470,783 patent/US12238336B2/en active Active
- 2021-09-09 US US17/470,798 patent/US11917134B2/en active Active
-
2023
- 2023-01-19 US US18/156,943 patent/US11973939B2/en active Active
- 2023-06-21 JP JP2023101903A patent/JP7704810B2/ja active Active
- 2023-08-23 JP JP2023135533A patent/JP7656666B2/ja active Active
- 2023-10-05 JP JP2023173335A patent/JP7678049B2/ja active Active
- 2023-10-26 JP JP2023184082A patent/JP7597891B2/ja active Active
- 2023-11-16 US US18/511,215 patent/US12375728B2/en active Active
-
2024
- 2024-01-22 US US18/419,297 patent/US12375727B2/en active Active
- 2024-03-28 US US18/619,998 patent/US12407868B2/en active Active
-
2025
- 2025-01-15 US US19/022,801 patent/US20250234045A1/en active Pending
- 2025-03-26 JP JP2025051297A patent/JP7826540B2/ja active Active
- 2025-06-25 JP JP2025107361A patent/JP2025143327A/ja active Pending
- 2025-07-11 US US19/267,026 patent/US20260012651A1/en active Pending
- 2025-07-28 US US19/282,569 patent/US20260025527A1/en active Pending
- 2025-08-08 US US19/294,909 patent/US20260039876A1/en active Pending
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7302000B2 (ja) | 2019-03-11 | 2023-07-03 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | エンコーダ、デコーダ、および対応する方法 |
Non-Patent Citations (1)
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7704810B2 (ja) | エンコーダ、デコーダ、および対応する方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230719 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230719 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240801 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240826 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241122 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250121 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250417 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250527 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250626 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7704810 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |