JP7722447B2 - 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法および映像システム - Google Patents

映像符号化装置、映像復号装置、映像符号化方法、映像復号方法および映像システム

Info

Publication number
JP7722447B2
JP7722447B2 JP2023510228A JP2023510228A JP7722447B2 JP 7722447 B2 JP7722447 B2 JP 7722447B2 JP 2023510228 A JP2023510228 A JP 2023510228A JP 2023510228 A JP2023510228 A JP 2023510228A JP 7722447 B2 JP7722447 B2 JP 7722447B2
Authority
JP
Japan
Prior art keywords
picture
video
display order
prediction
sop
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023510228A
Other languages
English (en)
Other versions
JPWO2022209032A1 (ja
Inventor
健太 徳満
慶一 蝶野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2022209032A1 publication Critical patent/JPWO2022209032A1/ja
Priority to JP2025081142A priority Critical patent/JP2025114816A/ja
Application granted granted Critical
Publication of JP7722447B2 publication Critical patent/JP7722447B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/16Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter for a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、映像符号化装置、映像復号装置、映像符号化方法、映像復号方法および映像システムに関する。
映像コンテンツの配信システムにおいて、例えば、伝送側では映像信号はH.264/AVC(Advanced Video Coding )規格やHEVC(High Efficiency Video Coding)規格に基づいて符号化され、受信側では復号処理を経て映像信号が再生される。
非特許文献1においてSOP(Structure of Pictures)という概念が導入されている。SOPは、時間方向階層符号化(時間スケーラブル符号化)が行われる場合には、各AU(Access Unit)の符号化順および参照関係が記述される単位になる。時間スケーラブル符号化は、複数フレームの映像の中から、部分的にフレームを取り出せるようにする符号化である。なお、1つのGOP(Group of Pictures)は、1つ以上のSOPで構成される。
非特許文献1では、120/P(Progressive)以外の映像フォーマットに適用されるSOP構造や、120/Pの映像フォーマットに適用されるSOP構造が規定されている。
図12は、120/P以外の映像フォーマットに適用されるSOP構造を示す説明図である。図12には、リオーダリング(ピクチャリオーダリング)が適用される場合のSOP構造が示されている。
図12に示すSOP構造は、L=0の構造、L=1の構造、L=2の構造およびL=3の構造を含む。図12に示すように、Lx(x=0,1,2,3)は、以下のような構造である。Temporal IDは、各AUの階層を示す識別情報である。以下、L=xの構造を、Lx構造ということがある。また、Temporal IDがm(0以上の自然数)のAUを、Temporal IDがmのピクチャということがある。
・L0構造:Temporal IDが0のピクチャだけで構成されるSOP構造(つまり、SOPに含まれるピクチャの段数(階層)は1つである。最大Temporal IDを示すLが0であるともいえる。)
・L1構造:Temporal IDが0のピクチャおよび1のピクチャで構成されるSOP構造(つまり、SOPに含まれる階層は2つである。最大Temporal IDを示すLが1であるともいえる。)
・L2構造:Temporal IDが0のピクチャ、1のピクチャ、および、2のピクチャで構成されるSOP構造(つまり、SOPに含まれる階層は3つである。最大Temporal IDを示すLが2であるともいえる。)
・L3構造:Temporal IDが0のピクチャ、1のピクチャ、2のピクチャ、および、3のピクチャで構成されるSOP構造(つまり、SOPに含まれる階層は4つである。最大Temporal IDを示すLが3であるともいえる。)
図13は、120/Pの映像フォーマットに適用されるSOP構造を示す説明図である。なお、図13に示すSOP構造は、時間スケーラブル符号化に対応する。
図13に示すSOP構造は、L0構造、L1構造、L2構造、L3構造およびL4構造を含む。図13に示すように、Lx(x=0,1,2,3,4)構造は、以下のような構造である。
・L0構造:Temporal IDが0のピクチャだけで構成されるSOP構造(つまり、SOPに含まれる階層は1つである。最大Temporal IDを示すLが0であるともいえる。)
・L1構造:Temporal IDが0のピクチャおよびMのピクチャで構成されるSOP構造(つまり、SOPに含まれる階層は2つである。最大Temporal IDを示すLが1(またはM)であるともいえる。)
・L2構造:Temporal IDが0のピクチャ、1のピクチャ、および、Mのピクチャで構成されるSOP構造(つまり、SOPに含まれる階層は3つである。最大Temporal IDを示すLが2(またはM)であるともいえる。)
・L3構造:Temporal IDが0のピクチャ、1のピクチャ、2のピクチャ、およびMのピクチャで構成されるSOP構造(つまり、SOPに含まれる階層は4つである。最大Temporal IDを示すLが3(またはM)であるともいえる。)
・L4構造:Temporal IDが0のピクチャ、1のピクチャ、2のピクチャ、3のピクチャ、および、Mのピクチャで構成されるSOP構造(つまり、SOPに含まれる階層は5つである。最大Temporal IDを示すLが4(またはM)であるともいえる。)
非特許文献2は、VVC(Versatile Video Coding)と呼ばれる映像符号化方式を開示する。VVCは、ITU-T H.266とも呼ばれる。VVCでは、符号化ツリーユニット(CTU:Coding Tree Unit)の最大サイズが、HEVC規格における64×64画素(以下、単に、64×64のように表現する。)に対して、128×128にまで拡張されている。
非特許文献2に記載された映像符号化方式では、ディジタル化された映像の各フレームは符号化ツリーユニット(CTU:Coding Tree Unit)に分割され、各CTUが符号化される。
各CTUは、四分木(QT:Quad-Tree)構造またはマルチタイプ木(MMT:Multi-Type Tree)構造で、符号化ユニット(CU:Coding Unit)に分割されて符号化される。四分木構造を用いる分割では、ブロックが、水平および垂直に等分割される。マルチタイプ木構造を用いる分割では、ブロックが、水平もしくは垂直に2分割または3分割される。
各CUは、予測符号化される。予測符号化には、イントラ予測と動き補償予測がある。各CUの予測誤差は、周波数変換に基づいて変換符号化される。動き補償予測は、符号化対象フレームとは表示時刻が異なる再構築画像(参照ピクチャ)から予測画像を生成する予測である。以下、動き補償予測をインター予測ともいう。
動き補償予測に基づいて符号化されたCUをインターCUと呼ぶ。イントラCUのみで符号化されたフレームは、Iフレーム(または、Iピクチャ)と呼ばれる。イントラCUだけでなくインターCUも含めて符号化されたフレームは、Pフレーム(または、Pピクチャ)と呼ばれる。ブロックのインター予測に、1枚の参照ピクチャだけでなく、同時に2枚の参照ピクチャを用いるインターCUを含めて符号化されたフレームは、Bフレーム(またはBピクチャ)と呼ばれる。なお、1枚の参照ピクチャを用いるインター予測は片方向予測と呼ばれ、同時に2枚の参照ピクチャを用いるインター予測は双方向予測と呼ばれる。
同等の画質で比較した場合、VVC規格に基づく符号化による符号量は、HEVC規格に基づく符号化による符号量に対して、30~50%削減されることが期待される。
「デジタル放送における映像符号化、音声符号化及び多重化方式」、ARIB(Association of Radio Industries and Businesses)標準規格 STD-B32 3.3版 平成27年7月3日 電波産業会 Benjamin Bross, et al., "Versatile Video Coding (Draft 10)", JVET-S2001-v7, Joint Video Experts Team (JVET) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 19th Meeting: by teleconference, 22 June - 1 July 2020
図12および図13において、矢印は、符号化対象ピクチャの参照ピクチャを示す。すなわち、矢印は、参照関係を示す。例えば、図12に示す例では、L2構造において、表示順で5番目のAUのピクチャは、表示順で3番目のAUのピクチャと7番目のAUのピクチャを参照する。L3構造において、表示順で4番目のAUのピクチャは、表示順で3番目のAUのピクチャと5番目のAUのピクチャを参照する。
このように、参照ピクチャから予測して得られたピクチャをさらに参照ピクチャとすることができる。図12および図13に示された階層構造において、上位階層(Temporal IDの値が大きい階層:深い階層)のピクチャの予測に関して、複数の下位階層(Temporal IDの値が小さい階層:浅い階層)のピクチを参照可能である。そのような参照関係によって、予測残差は小さくなる。
上述したように、VVC規格に基づく符号化による符号量は、HEVC規格に基づく符号化による符号量に比べて削減される。非特許文献1において規定されているSOP構造が使用される場合、上位階層であるほどピクチャ間の相関が高くなるが、L4構造でも、層数は、0、1、2、3、Mの5層である。したがって、VVC規格に基づく符号化が行われるときに、SOP構造が使用される場合には、符号化効率(圧縮効率)が、期待されるほどには高くならないおそれがある。
また、60/Pの映像フォーマットに適用されるSOP構造では、図12に例示されたように、L3構造でも、層数は、0、1、2、3の4層である。層数を多くするために、図13に例示された120/Pの映像フォーマットに適用されるL4構造を流用することが考えられる。しかし、当該L4構造は、時間スケーラブル符号化に適応した構造である。したがって、当該L4構造をそのまま60/Pの映像フォーマットに適用すると、最大Temporal IDの階層(L4)に属する符号化対象のピクチャと参照ピクチャ(Temporal ID=0~3の階層に属するピクチャ)との間隔が大きくなる。その結果、圧縮効率が低下する。
なお、符号化対象のピクチャと参照ピクチャとの間の間隔が大きいということは、各々のピクチャの表示順の差が大きいということである。すなわち、符号化対象のピクチャと参照ピクチャとの間の間隔が大きいということは、時間軸において、各々のピクチャが離れているということである。以下、ピクチャ間の間隔をフレーム間隔という。
本発明は、SOP構造を用いて符号化が行われる場合に、圧縮効率を低下させないようにする映像符号化装置、映像復号装置、映像符号化方法、映像復号方法および映像システムを提供することを目的とする。
本発明による映像符号化装置は、複数レベルの構造を含むSOP構造において16以上のピクチャが含まれる構造を使用してビットストリームを生成可能な映像符号化装置であって、イントラ予測またはインター予測を用いて予測処理を行う予測手段と、各層において表示順が後であるピクチャを表示順が先であるピクチャに先行して符号化せず、かつ、下位層のピクチャが上位層のピクチャを参照しないという所定条件下で、予測手段が、下位層のピクチャを参照してピクチャを符号化するときに、表示順で符号化対象のピクチャに最も近接するピクチャを参照ピクチャとするように制御する符号化制御手段とを含み、符号化制御手段は、符号化情報に基づき、Temporal IDの最大値が4となるL4構造に加えて、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれか、もしくは、Temporal IDの最大値が5となるL5構造に加えて、L4構造、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれかを使用するように制御する
本発明による映像復号装置は、複数レベルの構造を含むSOP構造における16以上のピクチャが含まれる構造を使用するビットストリームを復号する映像復号装置であって、イントラ予測またはインター予測を用いて予測処理を行う予測手段を含み、層において表示順が後であるピクチャを表示順が先であるピクチャに先行して符号化せず、かつ、下位層のピクチャが上位層のピクチャを参照しないという所定条件下で、下位層のピクチャを参照してピクチャを符号化するときに、表示順で符号化対象のピクチャに最も近接するピクチャを参照ピクチャとするように符号化制御され、さらに、符号化情報に基づき、Temporal IDの最大値が4となるL4構造に加えて、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれか、もしくは、Temporal IDの最大値が5となるL5構造に加えて、L4構造、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれかを使用するように符号化制御されているビットストリームを復号する
本発明による映像符号化方法は、複数レベルの構造を含むSOP構造において16以上のピクチャが含まれる構造を使用してビットストリームを生成可能な映像符号化方法であって、イントラ予測またはインター予測を用いて予測処理を実行し、各層において表示順が後であるピクチャを表示順が先であるピクチャに先行して符号化せず、かつ、下位層のピクチャが上位層のピクチャを参照しないという所定条件下で、予測処理で、下位層のピクチャを参照してピクチャを符号化するときに、表示順で符号化対象のピクチャに最も近接するピクチャが参照ピクチャとされるように制御し、符号化情報に基づき、Temporal IDの最大値が4となるL4構造に加えて、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれか、もしくは、Temporal IDの最大値が5となるL5構造に加えて、L4構造、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれかを使用するように制御する
本発明による映像復号方法は、複数レベルの構造を含むSOP構造における16以上のピクチャが含まれる構造を使用するビットストリームを復号する映像復号方法であって、イントラ予測またはインター予測を用いて予測処理を実行し、層において表示順が後であるピクチャを表示順が先であるピクチャに先行して符号化せず、かつ、下位層のピクチャが上位層のピクチャを参照しないという所定条件下で、下位層のピクチャを参照してピクチャを符号化するときに、表示順で符号化対象のピクチャに最も近接するピクチャを参照ピクチャとするように符号化制御され、さらに、符号化情報に基づき、Temporal IDの最大値が4となるL4構造に加えて、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれか、もしくは、Temporal IDの最大値が5となるL5構造に加えて、L4構造、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれかを使用するように符号化制御されているビットストリームを復号する
本発明による映像符号化プログラムは、複数レベルの構造を含むSOP構造において16以上のピクチャが含まれる構造を使用してビットストリームを生成可能な映像符号化プログラムであって、コンピュータに、イントラ予測またはインター予測を用いて予測処理を実行させ、各層において表示順が後であるピクチャを表示順が先であるピクチャに先行して符号化せず、かつ、下位層のピクチャが上位層のピクチャを参照しないという所定条件下で、予測処理で、下位層のピクチャを参照してピクチャを符号化するときに、表示順で符号化対象のピクチャに最も近接するピクチャが参照ピクチャとされるように制御させ、符号化情報に基づき、Temporal IDの最大値が4となるL4構造に加えて、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれか、もしくは、Temporal IDの最大値が5となるL5構造に加えて、L4構造、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれかを使用するように制御させる
本発明による映像復号プログラムは、複数レベルの構造を含むSOP構造における16以上のピクチャが含まれる構造を使用するビットストリームを復号するための映像復号プログラムであって、コンピュータに、イントラ予測またはインター予測を用いて予測処理を実行させ、層において表示順が後であるピクチャを表示順が先であるピクチャに先行して符号化せず、かつ、下位層のピクチャが上位層のピクチャを参照しないという所定条件下で、下位層のピクチャを参照してピクチャを符号化するときに、表示順で符号化対象のピクチャに最も近接するピクチャが参照ピクチャとするように符号化制御され、さらに、符号化情報に基づき、Temporal IDの最大値が4となるL4構造に加えて、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれか、もしくは、Temporal IDの最大値が5となるL5構造に加えて、L4構造、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれかを使用するように符号化制御されているビットストリームを復号させる
本発明による映像システムは、上記の映像符号化装置と、音声信号を符号化する音声符号化部と、映像符号化装置からのビットストリームと音声符号化部からのビットストリームとを多重化して出力する多重化部とを備える。
本発明によれば、SOP構造を用いて符号化が行われる場合に、圧縮効率を低下させないようにすることができる。
実施形態における120/P以外の映像フォーマットに適用されるSOP構造を示す説明図である。 実施形態における120/Pの映像フォーマットに適用されるSOP構造におけるL5構造を示す説明図である。 映像符号化装置の実施形態の構成例を示すブロック図である。 映像符号化装置の動作を示すフローチャートである。 映像復号装置の実施形態の構成例を示すブロック図である。 映像復号装置の動作を示すフローチャートである。 映像システムの一例を示すブロック図である。 映像システムの他の例を示すブロック図である。 CPUを有するコンピュータの一例を示すブロック図である。 映像符号化装置の主要部を示すブロック図である。 映像復号装置の主要部を示すブロック図である。 120/P以外の映像フォーマットに適用されるSOP構造を示す説明図である。 120/Pの映像フォーマットに適用されるSOP構造におけるL5構造を示す説明図である。
以下、本発明の実施形態を図面を参照して説明する。
図1は、実施形態における120/P以外の映像フォーマットに適用されるSOP構造を示す説明図である。図1に示すSOP構造において、L0構造、L1構造、L2構造およびL3構造における各層のピクチャの配置および参照関係は、図12に示されたそれらと同じである。なお、実施形態では、120/P以外の映像フォーマットとして、時間スケーラブル符号化が適用されない60Pの映像フォーマットを例にする。
図1に示すSOP構造には、図12に示されたL0構造、L1構造、L2構造およびL3構造に対して、L4構造が追加されている。当該L4構造は、16のピクチャで構成される。図1に示すL4構造における各層のピクチャの配置および参照関係は、図13に示されたそれらとは異なる。図13に示されたL4構造では、時間スケーラブル符号化を実現するために、最大Temporal IDの階層(L4)に配置された各ピクチャは、奇数の連続する符号化順(復号順でもある。)で符号化される。しかし、図1に示すL4構造では、そのような制約を受けずに各ピクチャが配置されている。
図1に示すL4構造では、各層において符号化順が表示順と逆転せず(表示順が後であるピクチャが表示順が先であるピクチャに先行して符号化されず)、かつ、下位層(Temporal IDの値が小さい階層)のピクチャが上位層(Temporal IDの値が大きい階層)のピクチャを参照しないという条件下で、下位層のピクチャを参照して符号化されるピクチャは、表示順で符号化対象のピクチャに最も近接するピクチャを参照ピクチャとする。なお、符号化順が表示順と逆転しないということは、Bのピクチャは、B(a<b)のピクチャに対して、必ず表示順が早いピクチャであるということである。また、参照ピクチャは、符号化対象のピクチャよりも先に符号化されている必要がある。
例えば、Temporal IDが4である層に関して、表示順が2であるBで示されるピクチャは、表示順が1であるBで示されるピクチャおよび表示順が3であるBで示されるピクチャを参照して符号化される。Bで示されるピクチャおよびBで示されるピクチャは、Bで示されるピクチャに対して、下位層(この例では、Temporal IDが0~3の複数層)において表示順で最も近接している。
また、Temporal IDが3である層に関して、表示順が5であるBで示されるピクチャは、表示順が3であるBで示されるピクチャおよび表示順が7であるBで示されるピクチャを参照して符号化される。表示順が3であるBで示されるピクチャおよび表示順が7であるBで示されるピクチャは、Bで示されるピクチャに対して、下位層(この例では、Temporal IDが0~2の複数層)において表示順で最も近接している。
なお、L4構造における符号化順は、図1に示す符号化順に限られない。各層において符号化順が表示順と逆転せず、かつ、下位層のピクチャが上位層のピクチャを参照しないという条件下で、下位層のピクチャを参照して符号化されるピクチャが、表示順で符号化対象のピクチャに最も近接するピクチャを参照ピクチャとすることが可能であれば、他の符号化順が用いられてもよい。
本実施形態では、表示順で符号化対象のピクチャに最も近接するピクチャを参照ピクチャとするので、図13に示された120/Pの映像フォーマットに適用されるSOP構造におけるL4構造と比較すると、符号化対象のピクチャと参照ピクチャと間のフレーム間隔が小さくなる。その結果、図13に示されたL4構造が用いられる場合と比較して、ピクチャの圧縮効率が高くなる。
図2は、120/Pの映像フォーマットに適用されるSOP構造におけるL5構造を示す説明図である。当該L5構造は、32のピクチャで構成される。本実施形態でも、120/Pの映像フォーマットに適用されるSOP構造は、時間スケーラブル符号化を実現する構造である。図2では図示省略されているが、L0構造、L1構造、L2構造およびL4構造は、図13に示されたそれらと同じである。すなわち、本実施形態では、図13に示されたL0構造、L1構造、L2構造、L3構造およびL4構造に対して、L5構造が追加されている。
また、図2に示されたL5構造において、Temporal ID=0~4の階層のピクチャの符号化順および参照関係は、図1に示されたL4構造のそれらと同じである。ただし、図2に示されたL5構造は32のピクチャで構成されるので、図2における復号順(符号化順でもある。)を示す数字は、図1における復号順を示す数字の2倍になっている。
120/Pの映像フォーマットに適用されるSOP構造におけるL5構造が使用される場合には、図1に示された実施形態におけるL4構造が使用される場合に各層(Temporal ID=0~4の階層のピクチャ)の圧縮効率が高くなるのと同様に、ベース層に属するピクチャ(この場合には、Temporal ID=0~4の階層のピクチャ)の圧縮効率は高くなる。
なお、L5構造における符号化順は、図2に示す符号化順に限られない。Temporal ID=0~4の層に関して、所定の条件下で、下位層のピクチャを参照して符号化されるピクチャが、表示順で符号化対象のピクチャに最も近接するピクチャを参照ピクチャとすることが可能であれば、他の符号化順が用いられてもよい。なお、所定の条件は、符号化順が表示順と逆転せず、かつ、下位層のピクチャが上位層のピクチャを参照しないという条件である。
また、60/Pの映像フォーマットに適用されるSOP構造にL4構造が追加され、120/Pの映像フォーマットに適用されるSOP構造にL5構造が追加されることによって、ピクチャの圧縮効率は高くなる。なぜなら、一般に、参照される頻度が高い復号順で0番目のピクチャ(IピクチャまたはPピクチャであることが多い。)には多くの符号量が割り当てられる。より高い階層を含む構造(60/Pの映像フォーマットにおけるL4、120/Pの映像フォーマットにおけるLM)では、相対的に、復号順で0番目のピクチャの発生頻度が低くなるからである。
実施形態1.
図3は、映像符号化装置の実施形態の構成例を示すブロック図である。図3に示す映像符号化装置は、並べ替え部101、減算器102、変換/量子化器103、逆量子化/逆変換器104、エントロピー符号化器105、加算器106、バッファ107、予測器108、符号化制御部109、および多重化器110を含む。なお、図1に示す映像符号化装置は、VVC規格に基づいて符号化処理を実行するが、他の規格、例えば、HEVC規格、H.264/AVC規格、MPEG(Moving Picture Experts Group)-2規格に基づいて符号化処理を実行してもよい。
並べ替え部101は、表示順に入力される映像信号における各画像(ピクチャ)を格納するメモリである。本実施形態では、各ピクチャは入力順に記憶されるとする。すなわち、メモリにおける小さいアドレスから順に、表示順に入力される各ピクチャが格納されるとする。しかし、表示順に入力される各ピクチャが符号化順に並べ替え部101に格納されるようにしてもよい。すなわち、メモリにおける小さいアドレスから順に、符号化順で、入力される各ピクチャが格納されるようにしてもよい。
いずれのメモリ格納方式(表示順または符号化順)が採用される場合でも、並べ替え部101から、符号化順に各ピクチャが読み出される。以下、ピクチャを入力映像信号ということがある。
なお、並べ替え部101は、SOP構造を使用して符号化が実行される場合に活用される。SOP構造を使用しない場合には、入力される映像信号における各ピクチャは、そのまま減算器102に供給される。
減算器102は、並べ替え部101から読み出された入力映像信号(具体的には、画素値)から予測信号を減算し、予測誤差信号を生成する。予測誤差信号は、予測残差または予測残差信号とも呼ばれる。
変換/量子化器103は、予測誤差信号を周波数変換する。変換/量子化器103は、さらに、周波数変換された予測誤差信号(変換係数)を量子化する。以下、量子化された変換係数を変換量子化値という。
エントロピー符号化器105は、予測パラメータと変換量子化値とをエントロピー符号化する。予測パラメータは、予測モード(イントラ予測、インター予測)、イントラ予測ブロックサイズ、イントラ予測方向、インター予測ブロックサイズ、および動きベクトルなど、CTU(Coding Tree Unit)およびブロックの予測に関連した情報である。
多重化器110は、エントロピー符号化器105から供給されるエントロピー符号化データと符号化制御部109からのデータ(符号化情報など)とを多重化し、ビットストリームとして出力する。
予測器108は、入力映像信号に対する予測信号を生成する。予測器108は、イントラ予測またはインター予測に基づいて予測信号を生成する。すなわち、予測器108は、符号化の単位となる各々のブロック(ユニット)について、イントラ予測とインター予測とのいずれかを用いて予測信号を生成する。
逆量子化/逆変換器104は、変換量子化値を逆量子化して変換係数を復元する。さらに、逆量子化/逆変換器104は、逆量子化した変換係数を逆周波数変換して予測誤差信号を復元する。加算器106は、復元された予測誤差信号と予測信号とを加算して再構築画像を生成する。再構築画像は、バッファ107に供給される。バッファ107は、再構築画像を格納する。なお、バッファ107は、イントラ予測のための参照ブロックを格納するためのブロックメモリ、および、インター予測のための参照ピクチャを格納するためのフレームメモリに相当する。
符号化制御部109は、映像符号化装置の外部から符号化情報を入力する。符号化情報として、使用する符号化方式(VVC規格、HEVC規格、H.264/AVC規格、MPEG-2)、テストシーケンス情報(60/P、120/Pなど)、スケーラブル符号化可否等の情報がある。符号化制御部109は、符号化情報に基づいて映像符号化装置における各ブロックを制御する。
次に、映像符号化装置のSOP構造を使用して符号化を実行するときの動作を、図4のフローチャートを参照して説明する。
まず、並べ替え部101に、表示順に入力される映像信号における各ピクチャが格納される(ステップS101)。
並べ替え部101は、符号化制御部109の指示に従って、符号化順に順次ピクチャを減算器102に出力する(ステップS102)。
60/Pの映像フォーマットに従うことが外部から指定されている場合、符号化制御部109は、図1に示された復号順(符号化順でもある。)でピクチャが並べ替え部101から読み出されるように制御する。すなわち、符号化制御部109は、並べ替え部101において表示順に各ピクチャが格納されている場合には、読み出し対象のメモリのアドレスから符号化対象のピクチャが出力されるように制御する。並べ替え部101において符号化順に各ピクチャが格納される場合には、符号化制御部109は、ピクチャが並べ替え部101に書き込まれるときに、符号化順に応じたメモリのアドレスにピクチャが格納されるように、並べ替え部101に指示する。
120/Pの映像フォーマットに従うことが外部から指定されている場合、符号化制御部109は、図12に示された復号順(L0~L4構造の場合)または図2に示された復号順(L5構造の場合)でピクチャが並べ替え部101から読み出されるように制御する。
なお、符号化制御部109は、一例として、映像のシーンの状況に応じて、L0~L4構造(60/Pの場合)のいずれを使用するのか、または、L0~L5構造(120/Pの場合)のいずれを使用するのかを決定することができる。符号化制御部109は、例えば、画面全体がさほど動かないシーンの映像を構成する画像(ピクチャ)についてはxの値が小さいLx構造を使用し、画面全体が速く動くシーンの映像を構成する画像についてはxの値が大きいLx構造を使用することに決定する。その場合には、符号化制御部109に、画像における動きの程度をあらかじめ検出する機能が含められる。
予測器108は、イントラ予測またはインター予測に基づいて、入力映像信号に対する予測信号を生成する(ステップS103)。また、減算器102は、予測誤差信号を生成する(ステップS103)。
なお、符号化制御部109は、図1に示されたピクチャの参照関係(60/Pの場合)または図12および図2に示されたピクチャの参照関係(120/Pの場合)に従って符号化を実行するように、予測器108に指示を与える。
変換/量子化器103は、予測誤差信号を周波数変換して変換係数を生成する(ステップS104)。さらに、変換/量子化器103は、量子化ステップ幅で変換係数を量子化して変換量子化値を生成する(ステップS105)。変換量子化値は、逆量子化/逆変換器104およびエントロピー符号化器105に入力される。
逆量子化/逆変換器104は、変換量子化値を逆量子化し、逆量子化された変換量子化値を逆周波数変換して変換係数を復元する(ステップS106)。エントロピー符号化器105は、変換量子化値をエントロピー符号化(例えば、算術符号化)してエントロピー符号化データを生成する(ステップS107)。
SOPを構成する全てのピクチャについて、ステップS102~S107の処理が実行される(ステップS108)。
なお、多重化器110は、エントロピー符号化器105から供給されるエントロピー符号化データと符号化制御部109から供給されるデータ(符号化情報など)とを多重化し、多重化データをビットストリームとして出力する。
本実施形態では、符号化制御部109は、120/P以外の映像フォーマットに適用されるSOP構造におけるL4構造が使用されるときに、L4構造における各層において符号化順が表示順と逆転せず、かつ、下位層のピクチャが上位層のピクチャを参照しないという条件下で、予測器108が、下位層のピクチャを参照してピクチャを符号化するときに、表示順で符号化対象のピクチャに最も近接するピクチャを参照ピクチャとするように制御する。そのような制御によって、SOPにおける各ピクチャの圧縮効率が高くなる。なお、本実施形態では、符号化制御部109は、そのような制御を実現するために、並べ替え部101に、図1に示された符号化順でピクチャを出力させる。
また、符号化制御部109は、120/Pの映像フォーマットに適用されるSOP構造におけるL5構造が使用されるときに、L5構造におけるTemporal ID=0~4の階層において符号化順が表示順と逆転せず、かつ、下位層のピクチャが上位層のピクチャを参照しないという条件下で、下位層のピクチャを参照して符号化されるピクチャは、表示順で符号化対象のピクチャに最も近接するピクチャを参照ピクチャとするように予測器108を制御する。そのような制御によって、ベース層に属するピクチャ(この場合には、Temporal ID=0~4の階層のピクチャ)の圧縮効率は高くなる。なお、本実施形態では、符号化制御部109は、そのような制御を実現するために、並べ替え部101に、図12に示された復号順(L0~L4構造の場合)または図2に示された復号順(L5構造の場合)でピクチャを出力させる。
実施形態2.
図5は、映像復号装置の実施形態の構成例を示すブロック図である。図5に示す映像復号装置は、多重化解除器201、エントロピー復号器202、逆量子化/逆変換器203、加算器204、予測器205、バッファ206、復号制御部207、および並べ替え部208を含む。なお、図5に示す映像復号装置は、例えば、図3に例示された映像符号化装置からのビットストリームを受信することができる。
多重化解除器201は、入力されるビットストリームを多重化解除して、エントロピー符号化データを抽出する。また、ビットストリームに含まれる符号化情報などを復号制御部207に出力する。
エントロピー復号器202は、エントロピー符号化データをエントロピー復号する。エントロピー復号器202は、エントロピー復号した変換量子化値を逆量子化/逆変換器203に供給する。また、エントロピー復号器202は、ビットストリームに含まれている予測パラメータを、予測器205に供給する。エントロピー復号器202は、ビットストリームに含まれている符号化情報を復号制御部207に供給する。
逆量子化/逆変換器203は、変換量子化値を逆量子化する。さらに、逆量子化/逆変換器203は、逆量子化した周波数変換係数を逆周波数変換する。
予測器205は、予測パラメータに基づいて、各サブブロックの予測信号を生成する。逆量子化/逆変換器203で逆周波数変換された予測誤差信号は、加算器204によって、予測器205から供給される予測信号が加えられた後、再構築画像としてバッファ206に供給される。バッファ206は、再構築画像を格納する。
バッファ206に格納された再構築画像は、並べ替え部208に転送される。並べ替え部208は、復号順に入力される映像信号における各画像(ピクチャ)を格納するメモリである。本実施形態では、各ピクチャは復号順に記憶されるとする。すなわち、メモリにおける小さいアドレスから順に、復号順に入力される各ピクチャが格納されるとする。しかし、復号順に入力される各ピクチャが表示順に並べ替え部101に格納されるようにしてもよい。すなわち、メモリにおける小さいアドレスから順に、表示順で、入力される各ピクチャが格納されるようにしてもよい。
いずれのメモリ格納方式(復号順または表示順)が採用される場合でも、並べ替え部208から、表示順に各ピクチャが読み出される。
次に、映像復号装置のSOP構造を使用して復号を実行するときの動作を、図6のフローチャートを参照して説明する。
エントロピー復号器202は、ビットストリームに含まれるエントロピー符号化データをエントロピー復号する(ステップS201)。
逆量子化/逆変換器203は、量子化ステップ幅で変換量子化値を逆量子化する(ステップS202)。さらに、逆量子化/逆変換器203は、逆量子化した周波数変換係数を逆周波数変換する(ステップS203)。
予測器205は、バッファ206に格納された再構築画像を用いて予測信号を生成する(ステップS204)。加算器204は、逆量子化/逆変換器203で逆周波数変換された予測誤差画像に、予測器205から供給される予測信号を加えて、再構築画像を生成する(ステップS204)。再構築画像は、バッファ206に格納される。
バッファ206に格納された再構築画像は、並べ替え部208に転送される(ステップS205)。
SOPを構成する全てのピクチャについて、ステップS201~S205の処理が実行される(ステップS206)。
並べ替え部208は、復号制御部207の出力指示に応じて、表示順に各画像を出力する(ステップS207)。
60/Pの映像フォーマットに従うことが符号化情報指定されている場合、復号制御部207は、図1に示された表示順でピクチャが並べ替え部101から読み出されるように制御する。すなわち、復号制御部207は、並べ替え部208において復号順に各ピクチャが格納されている場合には、読み出し対象のメモリのアドレス(表示順に従って読み出されるべきピクチャが格納されているアドレス)からピクチャが出力されるように制御する。なお、並べ替え部101において表示順に各ピクチャが格納される場合には、復号制御部207は、ピクチャが並べ替え部208に書き込まれるときに表示順に応じたメモリのアドレスにピクチャが格納されるように、並べ替え部208に指示する。
120/Pの映像フォーマットに従うことが外部から指定されている場合、復号制御部207は、図12に示された表示順(L0~L4構造の場合)または図2に示された表示順(L5構造の場合)でピクチャが並べ替え部208から読み出されるように制御する。
第1の実施形態の映像符号化装置がSOP構造を使用して符号化した符号化データに基づくビットストリームを受信した場合、映像復号装置は、各ピクチャの圧縮効率が高い符号化データから映像を再生することができる。
すなわち、本実施形態の映像復号装置は、符号化順が表示順と逆転せず、かつ、下位層のピクチャが上位層のピクチャを参照しないという所定条件下で、予測手段が、下位層のピクチャを参照してピクチャを符号化するときに、表示順で符号化対象のピクチャに最も近接するピクチャを参照ピクチャとするように構成された映像符号化装置からビットストリームを受信可能である。そのようなビットストリームが受信されたときに、本実施形態の映像復号装置において、予測器205は、符号化順が表示順と逆転せず、かつ、下位層のピクチャが上位層のピクチャを参照しないという所定条件下で、下位層のピクチャを参照してピクチャを符号化するときに、表示順で符号化対象のピクチャに最も近接するピクチャを参照ピクチャとすることができる。
実施形態3.
図7は、映像システムの一例を示すブロック図である。図7に示す映像システムは、上記の実施形態の映像符号化装置100と映像復号装置200とが、無線伝送路または有線伝送路300で接続されるシステムである。
映像符号化装置100の構成および動作は、図3に示された映像符号化装置の構成および動作と同じである。映像復号装置200の構成および動作は、図5に示された映像復号装置の構成および動作と同じである。
実施形態4.
図8は、映像システムの他の例を示すブロック図である。図8に示す映像システムは、音声符号化部401、映像符号化部402および多重化部403を含む。
音声符号化部401は、映像と音声とを含むデータ(コンテンツ)のうちの音声信号を、例えばARIB STD-B32規格で規定されるMPEG-4 AAC(Advanced Audio Coding)規格やMPEG-4 ALS規格(Audio Lossless Coding)に基づいて符号化することによって音声ビットストリームを作成して出力する。
映像符号化部402は、例えば、図3に示すように構成され、映像ビットストリームを作成して出力する。
多重化部403は、例えばARIB STD-B32規格に基づいて、音声ビットストリーム、映像ビットストリームおよびその他の情報を多重化することによってビットストリームを作成して出力する。
また、上記の各実施形態を、ハードウェアで構成することも可能であるが、コンピュータプログラムにより実現することも可能である。
図9は、CPU(Central Processing Unit )を有するコンピュータの一例を示すブロック図である。コンピュータは、図3に示された映像符号化装置と図5に示された映像復号装置のそれぞれに実装可能である。CPU1000は、記憶装置1001に格納されたプログラム(映像符号化プログラムまたは映像復号プログラム)に従って処理を実行することによって、上記の各実施形態における各機能を実現する。
すなわち、コンピュータが図3に示された映像符号化装置に実装される場合には、CPU1000は、映像符号化装置における、減算器102、変換/量子化器103、逆量子化/逆変換器104、エントロピー符号化器105、加算器106、予測器108、符号化制御部109、および多重化器110の機能を実現する。
コンピュータが図5に示された映像復号装置に実装される場合には、CPU1000は、映像復号装置における、多重化解除器201、エントロピー復号器202、逆量子化/逆変換器203、加算器204、予測器205、および復号制御部207の機能を実現する。
記憶装置1001は、例えば、非一時的なコンピュータ可読媒体(non-transitory computer readable medium )である。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium )を含む。非一時的なコンピュータ可読媒体の具体例として、磁気記録媒体(例えば、ハードディスク)、CD-ROM(Compact Disc-Read Only Memory )、CD-R(Compact Disc-Recordable )、CD-R/W(Compact Disc-ReWritable )、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM )、フラッシュROM)がある。
また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium )に格納されてもよい。一時的なコンピュータ可読媒体には、例えば、有線通信路または無線通信路を介して、すなわち、電気信号、光信号または電磁波を介して、プログラムが供給される。
メモリ1002は、例えばRAM(Random Access Memory)で実現され、CPU1000が処理を実行するときに一時的にデータを格納する記憶手段である。メモリ1002に、記憶装置1001または一時的なコンピュータ可読媒体が保持するプログラムが転送され、CPU1000がメモリ1002内のプログラムに基づいて処理を実行するような形態も想定しうる。
また、メモリ1002は、図3に示された並べ替え部101およびバッファ107として使用可能である。また、メモリ1002は、図5に示されたバッファ206および並べ替え部208として使用可能である。
図10は、映像符号化装置の主要部を示すブロック図である。図10に示す映像符号化装置10は、複数レベル(例えば、L0~L4、L0~L5)の構造(例えば、L0~L4構造、L0~L5構造)を含むSOP構造を使用してビットストリームを生成する映像符号化装置であって、イントラ予測またはインター予測を用いて予測処理を行う予測手段11(実施形態では、予測器108で実現される。)と、表示順が後であるピクチャを表示順が先であるピクチャに先行して符号化せず、かつ、下位層のピクチャが上位層のピクチャを参照しないという所定条件下で、予測手段11が、下位層のピクチャを参照してピクチャを符号化するときに、表示順で符号化対象のピクチャに最も近接するピクチャを参照ピクチャとするように制御する符号化制御手段12(実施形態では、符号化制御部109で実現される。)とを備えている。
図11は、映像復号装置の主要部を示すブロック図である。図11に示す映像復号装置20は、複数レベル(例えば、L0~L4、L0~L5)の構造(例えば、L0~L4構造、L0~L5構造)を含むSOP構造を使用して生成されたビットストリームを入力して復号処理を行う映像復号装置であって、イントラ予測またはインター予測を用いて予測処理を行う予測手段21(実施形態では、予測器205で実現される。)を備え、予測手段21は、表示順が後であるピクチャを表示順が先であるピクチャに先行して符号化せず、かつ、下位層(Temporal IDの値が小さい層)のピクチャが上位層(Temporal IDの値が大きい層)のピクチャを参照しないという所定条件下で、下位層のピクチャを参照してピクチャを符号化するときに、表示順で符号化対象のピクチャに最も近接するピクチャを参照ピクチャとするように動作する。
11 予測手段
12 符号化制御手段
21 予測手段
10,100 映像符号化装置
101 並べ替え部
102 減算器
103 変換/量子化器
104 逆量子化/逆変換器
105 エントロピー符号化器
106 加算器
107 バッファ
108 予測器
109 符号化制御部
110 多重化器
20,200 映像復号装置
201 多重化解除器
202 エントロピー復号器
203 逆量子化/逆変換器
204 加算器
205 予測器
206 バッファ
207 復号制御部
208 並べ替え部
401 音声符号化部
402 映像符号化部
403 多重化部
1000 CPU
1001 記憶装置
1002 メモリ

Claims (10)

  1. 複数レベルの構造を含むSOP構造において16以上のピクチャが含まれる構造を使用してビットストリームを生成可能な映像符号化装置であって、
    イントラ予測またはインター予測を用いて予測処理を行う予測手段と、
    各層において表示順が後であるピクチャを表示順が先であるピクチャに先行して符号化せず、かつ、下位層のピクチャが上位層のピクチャを参照しないという所定条件下で、前記予測手段が、下位層のピクチャを参照してピクチャを符号化するときに、表示順で符号化対象のピクチャに最も近接するピクチャを参照ピクチャとするように制御する符号化制御手段とを備え
    前記符号化制御手段は、符号化情報に基づき、Temporal IDの最大値が4となるL4構造に加えて、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれか、もしくは、Temporal IDの最大値が5となるL5構造に加えて、L4構造、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれかを使用するように制御する
    ことを特徴とする映像符号化装置。
  2. 前記符号化制御手段は、120/P以外の映像フォーマットの映像信号が符号化される場合に、16フレームが含まれるL4構造が使用されるときに、前記所定条件下で、前記予測手段が、下位層において表示順で最も近接するピクチャを参照ピクチャとするように制御する
    請求項1記載の映像符号化装置。
  3. 前記符号化制御手段は、120/Pの映像フォーマットの映像信号が符号化される場合に、32フレームが含まれるL5構造が使用されるときに、最上位層よりも下位の各層であるベース層において、前記所定条件下で、前記予測手段が、下位層のピクチャを参照してピクチャを符号化するときに、下位層において表示順で最も近接するピクチャを参照ピクチャとするように制御する
    請求項1記載の映像符号化装置。
  4. 前記予測手段は、VVC規格に基づいて予測処理を行う
    請求項1から請求項3のうちのいずれか1項に記載の映像符号化装置。
  5. 複数レベルの構造を含むSOP構造における16以上のピクチャが含まれる構造を使用するビットストリームを復号する映像復号装置であって、
    イントラ予測またはインター予測を用いて予測処理を行う予測手段を備え、
    層において表示順が後であるピクチャを表示順が先であるピクチャに先行して符号化せず、かつ、下位層のピクチャが上位層のピクチャを参照しないという所定条件下で、下位層のピクチャを参照してピクチャを符号化するときに、表示順で符号化対象のピクチャに最も近接するピクチャを参照ピクチャとするように符号化制御され、さらに、符号化情報に基づき、Temporal IDの最大値が4となるL4構造に加えて、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれか、もしくは、Temporal IDの最大値が5となるL5構造に加えて、L4構造、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれかを使用するように符号化制御されているビットストリームを復号する
    ことを特徴とする映像復号装置。
  6. 複数レベルの構造を含むSOP構造において16以上のピクチャが含まれる構造を使用してビットストリームを生成可能な映像符号化方法であって、
    イントラ予測またはインター予測を用いて予測処理を実行し、
    各層において表示順が後であるピクチャを表示順が先であるピクチャに先行して符号化せず、かつ、下位層のピクチャが上位層のピクチャを参照しないという所定条件下で、前記予測処理で、下位層のピクチャを参照してピクチャを符号化するときに、表示順で符号化対象のピクチャに最も近接するピクチャが参照ピクチャとされるように制御し、
    符号化情報に基づき、Temporal IDの最大値が4となるL4構造に加えて、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれか、もしくは、Temporal IDの最大値が5となるL5構造に加えて、L4構造、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれかを使用するように制御する
    ことを特徴とする映像符号化方法。
  7. 複数レベルの構造を含むSOP構造における16以上のピクチャが含まれる構造を使用するビットストリームを復号する映像復号方法であって、
    イントラ予測またはインター予測を用いて予測処理を実行し、
    層において表示順が後であるピクチャを表示順が先であるピクチャに先行して符号化せず、かつ、下位層のピクチャが上位層のピクチャを参照しないという所定条件下で、下位層のピクチャを参照してピクチャを符号化するときに、表示順で符号化対象のピクチャに最も近接するピクチャを参照ピクチャとするように符号化制御され、さらに、符号化情報に基づき、Temporal IDの最大値が4となるL4構造に加えて、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれか、もしくは、Temporal IDの最大値が5となるL5構造に加えて、L4構造、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれかを使用するように符号化制御されているビットストリームを復号する
    ことを特徴とする映像復号方法。
  8. 複数レベルの構造を含むSOP構造において16以上のピクチャが含まれる構造を使用してビットストリームを生成可能な映像符号化プログラムであって、
    コンピュータに、
    イントラ予測またはインター予測を用いて予測処理を実行させ、
    各層において表示順が後であるピクチャを表示順が先であるピクチャに先行して符号化せず、かつ、下位層のピクチャが上位層のピクチャを参照しないという所定条件下で、前記予測処理で、下位層のピクチャを参照してピクチャを符号化するときに、表示順で符号化対象のピクチャに最も近接するピクチャが参照ピクチャとされるように制御させ
    符号化情報に基づき、Temporal IDの最大値が4となるL4構造に加えて、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれか、もしくは、Temporal IDの最大値が5となるL5構造に加えて、L4構造、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれかを使用するように制御させる
    ための映像符号化プログラム。
  9. 複数レベルの構造を含むSOP構造における16以上のピクチャが含まれる構造を使用するビットストリームを復号するための映像復号プログラムであって、
    コンピュータに、
    イントラ予測またはインター予測を用いて予測処理を実行させ、
    層において表示順が後であるピクチャを表示順が先であるピクチャに先行して符号化せず、かつ、下位層のピクチャが上位層のピクチャを参照しないという所定条件下で、下位層のピクチャを参照してピクチャを符号化するときに、表示順で符号化対象のピクチャに最も近接するピクチャが参照ピクチャとするように符号化制御され、さらに、符号化情報に基づき、Temporal IDの最大値が4となるL4構造に加えて、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれか、もしくは、Temporal IDの最大値が5となるL5構造に加えて、L4構造、L3構造、L2構造、L1構造およびL0構造を含むSOP構造の組のうちいずれかを使用するように符号化制御されているビットストリームを復号させる
    ための映像復号プログラム。
  10. 請求項1から請求項4のうちのいずれか1項に記載の映像符号化装置と、
    音声信号を符号化する音声符号化部と、
    前記映像符号化装置からのビットストリームと前記音声符号化部からのビットストリームとを多重化して出力する多重化部と
    を備える映像システム。
JP2023510228A 2021-03-30 2021-12-10 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法および映像システム Active JP7722447B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2025081142A JP2025114816A (ja) 2021-03-30 2025-05-14 映像符号化装置、映像復号装置、映像符号化方法、および映像復号方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2021056391 2021-03-30
JP2021056391 2021-03-30
PCT/JP2021/045639 WO2022209032A1 (ja) 2021-03-30 2021-12-10 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法および映像システム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2025081142A Division JP2025114816A (ja) 2021-03-30 2025-05-14 映像符号化装置、映像復号装置、映像符号化方法、および映像復号方法

Publications (2)

Publication Number Publication Date
JPWO2022209032A1 JPWO2022209032A1 (ja) 2022-10-06
JP7722447B2 true JP7722447B2 (ja) 2025-08-13

Family

ID=83455823

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2023510228A Active JP7722447B2 (ja) 2021-03-30 2021-12-10 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法および映像システム
JP2025081142A Pending JP2025114816A (ja) 2021-03-30 2025-05-14 映像符号化装置、映像復号装置、映像符号化方法、および映像復号方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2025081142A Pending JP2025114816A (ja) 2021-03-30 2025-05-14 映像符号化装置、映像復号装置、映像符号化方法、および映像復号方法

Country Status (5)

Country Link
US (1) US20240163452A1 (ja)
EP (1) EP4319153A4 (ja)
JP (2) JP7722447B2 (ja)
CN (1) CN117063465A (ja)
WO (1) WO2022209032A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2025064207A (ja) * 2023-10-05 2025-04-17 Kddi株式会社 メッシュ復号装置、メッシュ復号方法及びプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017094482A1 (ja) 2015-12-02 2017-06-08 日本電気株式会社 映像符号化方法、映像符号化装置、映像復号方法、映像復号装置、及びプログラム、並びに映像システム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103108160B (zh) * 2013-01-24 2016-08-03 中国联合网络通信集团有限公司 监控视频数据获取方法、服务器和终端
BR112015030508B1 (pt) * 2013-06-12 2023-11-07 Mitsubishi Electric Corporation Dispositivos e métodos de codificação de imagem e de decodificação de imagem
JP6565679B2 (ja) * 2013-11-22 2019-08-28 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
JP2016195326A (ja) * 2015-03-31 2016-11-17 富士通株式会社 動画像符号化装置、動画像符号化方法、及び動画像符号化用コンピュータプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017094482A1 (ja) 2015-12-02 2017-06-08 日本電気株式会社 映像符号化方法、映像符号化装置、映像復号方法、映像復号装置、及びプログラム、並びに映像システム

Also Published As

Publication number Publication date
WO2022209032A1 (ja) 2022-10-06
EP4319153A1 (en) 2024-02-07
JP2025114816A (ja) 2025-08-05
CN117063465A (zh) 2023-11-14
US20240163452A1 (en) 2024-05-16
EP4319153A4 (en) 2024-08-07
JPWO2022209032A1 (ja) 2022-10-06

Similar Documents

Publication Publication Date Title
US11405636B2 (en) Conditional signalling of reference picture list modification information
CN104521237B (zh) 用于可缩放视频译码及3d视频译码的多假设运动补偿
JP4927207B2 (ja) 符号化方法、復号化方法及び装置
CN108632628B (zh) 推导参考预测模式值的方法
JP5421408B2 (ja) αチャンネル映像復号化装置、αチャンネル復号化方法及び記録媒体
JP6608395B2 (ja) スケーラブルビデオコード化におけるビットストリーム適合制約
KR102167096B1 (ko) 영상 부호화/복호화 방법 및 장치
US20160100180A1 (en) Method and apparatus for processing video signal
US20160080753A1 (en) Method and apparatus for processing video signal
CN106878730B (zh) 视频解码设备和视频解码方法
JP2011120281A (ja) 複数層を使用するマルチメディア・データのスケーリング可能なエンコーディング及びデコーディングのためのシステム及び方法
KR20060109290A (ko) 화상 복호 장치 및 화상 복호 방법과 화상 복호 프로그램
KR20110056388A (ko) 적응적 세그먼트화를 사용하는 비디오 인코딩 시스템 및 방법
CN102835107A (zh) 高性能视频编码的超块
JP2025114816A (ja) 映像符号化装置、映像復号装置、映像符号化方法、および映像復号方法
CN100428800C (zh) 运动图像解码设备及方法
US20160080752A1 (en) Method and apparatus for processing video signal
CN112887737B (zh) 用于hevc扩展处理的条件解析扩展语法
JP7732514B2 (ja) 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法および映像システム
CN114845107A (zh) 图像编码方法及其图像编码器

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240903

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20241101

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20250218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250514

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250701

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250714

R150 Certificate of patent or registration of utility model

Ref document number: 7722447

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150