CN118575475A - 基于帧内预测模式推导的帧内预测方法和装置 - Google Patents

基于帧内预测模式推导的帧内预测方法和装置 Download PDF

Info

Publication number
CN118575475A
CN118575475A CN202280090460.0A CN202280090460A CN118575475A CN 118575475 A CN118575475 A CN 118575475A CN 202280090460 A CN202280090460 A CN 202280090460A CN 118575475 A CN118575475 A CN 118575475A
Authority
CN
China
Prior art keywords
mode
current block
intra
prediction
dimd
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280090460.0A
Other languages
English (en)
Inventor
柳先美
张炯文
崔璋元
金昇焕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN118575475A publication Critical patent/CN118575475A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

根据本公开,一种由解码设备解码图像的方法包括以下步骤:获取包括图像信息的比特流;推导用于当前块的解码器侧帧内模式推导(DIMD)模式;推导用于当前块的帧内预测模式;基于用于当前块的帧内预测模式生成用于当前块的预测样本;以及基于用于当前块的预测样本生成用于当前块的重构样本,其中基于是否将DIMD模式应用于当前块来推导用于当前块的帧内预测模式。

Description

基于帧内预测模式推导的帧内预测方法和装置
技术领域
本公开涉及一种图像编译技术,并且更具体地,涉及用于在图像编译系统中对帧内预测模式进行编译的方法和设备。
背景技术
最近,在各种领域中对诸如4K、8K或更高超高清(UHD)视频/图像的高分辨率、高质量图像/视频的需求正不断增加。随着视频/图像分辨率或质量变高,与传统视频/图像数据相比传输相对更多的信息或比特。因此,如果视频/图像数据经由诸如现有有线/无线宽带线路的介质传输或者存储在传统存储介质中,则传输和存储的成本容易增加。
此外,对虚拟现实(VR)和人工现实(AR)内容以及诸如全息图的沉浸式媒体的兴趣和需求正不断增长;并且表现出与实际视频/图像不同的图像/视频特性的图像/视频(例如游戏图像/视频)的广播也正不断增长。
因此,需要高效图像压缩技术来有效地压缩和传输、存储或播放显示出如上所述的各种特性的高分辨率、高质量视频/图像。
另外,需要一种用于减少在用信号发送用于帧内预测模式的数据的过程期间中发送的信息量和比特量的技术。
发明内容
技术方案
根据本公开的实施例,本文提供了一种由解码设备执行的图像解码方法。该解码方法包括以下步骤:获得包括图像信息的比特流、推导用于当前块的解码器侧帧内模式推导(DIMD)模式、推导用于当前块的帧内预测模式、基于用于当前块的帧内预测模式生成用于当前块的预测样本、以及基于用于当前块的预测样本生成用于当前块的重构样本,其中基于是否将DIMD模式应用于当前块来推导用于当前块的帧内预测模式。
根据本公开的另一实施例,本文提供了一种由编码设备执行的图像编码方法。该编码方法包括以下步骤:推导用于当前块的解码器侧帧内模式推导(DIMD)模式、确定用于当前块的帧内预测模式、基于用于当前块的帧内预测模式生成用于当前块的预测样本、基于用于当前块的预测样本生成预测相关信息、以及对包括预测相关信息的图像信息进行编码,其中基于是否将DIMD模式应用于当前块来确定用于当前块的帧内预测模式。
根据本公开的又一实施例,本文提供了一种计算机可读数字记录介质。该数字记录介质存储由特定方法生成的比特流,其中该特定方法包括以下步骤:推导用于当前块的解码器侧帧内模式推导(DIMD)模式、确定用于当前块的帧内预测模式、基于用于当前块的帧内预测模式生成用于当前块的预测样本、基于用于当前块的预测样本生成预测相关信息、以及对包括预测相关信息的图像信息进行编码,其中基于是否将DIMD模式应用于当前块来确定用于当前块的帧内预测模式。
根据本公开的又一实施例,本文提供了一种发送用于图像的数据的方法。该发送方法包括以下步骤:基于推导用于当前块的解码器侧帧内模式推导(DIMD)模式的步骤来生成比特流、确定用于当前块的帧内预测模式、基于用于当前块的帧内预测模式生成用于当前块的预测样本、基于用于当前块的预测样本生成预测相关信息、以及对包括预测相关信息的图像信息进行编码,并且发送包括比特流的数据,其中基于是否将DIMD模式应用于当前块来确定用于当前块的帧内预测模式。
根据本公开的又一实施例,本文提供了一种计算机可读数字记录介质,其具有存储在其中的编码的信息或编码的视频/图像信息,其允许由解码设备执行本公开的至少一个实施例中公开的视频/图像解码方法。
根据本公开的又一实施例,本文提供了一种用于比特流的发送方法和发送设备,根据本公开的至少一个实施例中公开的视频/图像编码方法来生成该比特流。
附图说明
图1示意性地例示了本公开的实施方式适用于的视频/图像编译装置的示例。
图2是例示了可以应用本公开的实施方式的视频/图像编码设备的配置的示意图。
图3是例示了可以应用本公开的实施方式的视频/图像解码设备的配置的示意图。
图4示意性地示出用于编译视频/图像的分层结构。
图5示意性地例示了可以应用本公开的实施方式的基于帧内预测的图像编码方法的示例。
图6示意性地例示了编码设备中的帧内预测器。
图7示意性地例示了可以应用本公开的实施方式的基于帧内预测的图像解码方法的示例。
图8示意性地例示了解码设备中的帧内预测器。
图9示例性地例示了可以应用本公开的实施方式的示意性帧内预测处理。
图10例示了可以应用本公开的实施方式的帧内预测模式的示例。
图11示例性地图示被用于推导用于TIMD模式的帧内预测模式的模板。
图12示例性地图示被用于推导用于DIMD模式的帧内预测模式的梯度直方图(HoG)配置方法。
图13示例性地图示用于通过应用DIMD模式配置预测块的方法。
图14和图15示意性地图示根据本公开的实施例的视频/图像编码方法和相关组件的示例。
图16和图17示意性地图示根据本公开的实施例的视频/图像解码方法和相关组件的示例。
图18图示可以应用本公开中公开的实施例的内容流式传输系统的示例。
具体实施方式
本公开能够以各种形式修改,并且将在附图中描述和例示其特定实施方式。然而,实施方式并非旨在限制本公开。在以下描述中使用的术语仅用于描述特定实施方式,并非旨在限制本公开。只要清楚地以不同的方式理解,单数的表达包括复数的表达。诸如“包括”和“具有”的术语旨在指示存在以下描述中使用的特征、数量、步骤、操作、元件、组件或其组合,因此应理解的是,不排除存在或添加一个或更多个不同的特征、数量、步骤、操作、元件、组件或其组合的可能性。
此外,本公开中描述的附图中的元件是为了方便解释不同的特定功能而独立地绘制的,并不意味着这些元件由独立的硬件或独立的软件来具体实现。例如,可以将元件中的两个或更多个元件组合以形成单个元件,或者可以将一个元件分割为多个元件。组合和/或分割元件的实施方式属于本公开,而没有脱离本公开的概念。
在下文中,将参照附图详细描述本公开的实施方式。另外,在整个附图中,相似的附图标记用于指示相似的元件,并且将省略对相似元件的相同描述。
本公开涉及视频/图像编译。例如,本公开中所公开的方法/实施方式可与通用视频编译(VVC)标准(ITU-T Rec. H.266)、VVC后的下一代视频/图像编译标准或其他视频编译相关标准(例如,高效视频编译(HEVC)标准(ITU-T Rec. H.265)、基本视频编译(EVC)标准、AVS2标准等)有关。
本公开涉及视频/图像编译。例如,本公开中所公开的方法/实施方式可以应用于在多功能视频编译(VVC)标准、基本视频编译(EVC)标准、AOMedia Video 1(AV1)标准、第2代音频视频编译标准(AVS2)或下一代视频/图像编译标准(例如,H.267、或H.268等)中公开的方法。
本公开呈现了视频/图像编译的各种实施方式,并且除非另外提及,否则实施方式可以彼此组合地执行。
在本公开中,视频可以是指随时间推移的一系列图像。通常,画面是指表示特定时间区域中的一个图像的单元,并且子画面/切片/拼块(tile)是构成编译中的画面的一部分的单元。子画面/切片/拼块可以包括一个或更多个编译树单元(CTU)。一幅画面可以由一个或更多个子画面/切片/拼块构成。一幅画面可以由一个或更多个拼块组构成。一个拼块组可以包括一个或更多个拼块。图块(brick)可以表示画面中的拼块内的CTU行的矩形区域。拼块可以被分区为多个图块,每个图块由拼块内的一个或更多个CTU行组成。没有被分区为多个图块的拼块也可以被称为图块。图块扫描是对画面进行分区的CTU的特定依次排序,其中,在图块中按CTU光栅扫描对CTU进行连续排序,按拼块的图块的光栅扫描对拼块内的图块进行连续排序,并且按画面的拼块的光栅扫描对画面中的拼块进行连续排序。另外,子画面可以表示画面内的一个或更多个切片的矩形区域。即,子画面包含共同覆盖画面的矩形区域的一个或更多个切片。拼块是画面中的特定拼块列和特定拼块行内的CTU的矩形区域。拼块列是CTU的矩形区域,该矩形区域的高度等于画面的高度并且宽度由画面参数集中的语法元素指定。拼块行是CTU的矩形区域,该矩形区域的高度由画面参数集中的语法元素指定并且宽度等于画面的宽度。拼块扫描是对画面进行分区的CTU的特定依次排序,其中,可以在拼块中按CTU光栅扫描对CTU进行连续排序,而可以按画面的拼块的光栅扫描对画面中的拼块进行连续排序。切片包括画面的可以被排他性地包含在单个NAL单元中的整数个图块。切片可以由多个完整拼块组成或者仅由一个拼块的连续序列的完整图块组成。在本公开中,可以互换地使用拼块组和切片。例如,在本公开中,拼块组/拼块组头可以被称为切片/切片头。
像素或像元(pel)可以表示组成一幅画面(或图像)的最小单位。另外,“样本”可以用作与像素相对应的术语。样本通常可以表示像素或像素值,并且可以仅表示亮度分量的像素/像素值或仅表示色度分量的像素/像素值。
单元可以表示图像处理的基本单位。单元可以包括画面的特定区域和与该区域有关的信息中的至少一个。一个单元可以包括一个亮度块和两个色度(例如,cb、cr)块。在一些情况下,单元可以与诸如块或区域的术语互换使用。在一般情况下,M×N块可以包括M列和N行的样本(或样本阵列)或变换系数的集合(或阵列)。
在本说明书中,“A或B”可以是指“仅A”、“仅B”或“A和B”。换言之,在本说明书中,“A或B”可以被解释为“A和/或B”。例如,“A、B或C”在本文中是指“仅A”、“仅B”、“仅C”或“A、B和C的任何一个和任何组合”。
本说明书中使用的斜线(/)或逗号(comma)可以是指“和/或”。例如,“A/B”可以是指“A和/或B”。因此,“A/B”可以是指“仅A”、“仅B”或“A和B”。例如,“A, B, C”可以是指“A、B或C”。
在本说明书中,“A和B中的至少一个”可以是指“仅A”、“仅B”或“A和B两者”。另外,在本说明书中,表述“A或B中的至少一个”或“A和/或B中的至少一个”可以被解释为与“A和B中的至少一个”相同。
另外,在本说明书中,“A、B和C中的至少一个”是指“仅A”、“仅B”、“仅C”或“A、B和C的任意组合”。此外,“A、B或C中的至少一个”或“A、B和/或C中的至少一个”可以是指“A、B和C中的至少一个”。
此外,本说明书中使用的括号可以是指“例如”。具体地,当指示“预测(帧内预测)”时,可能将“帧内预测”作为“预测”的示例提出。换言之,本说明书中的“预测”不限于“帧内预测”,可以将“帧内预测”作为“预测”的示例提出。此外,即使当指示“预测(即,帧内预测)”时,“帧内预测”也可以作为“预测”的示例提出。
在本说明书中,在一幅图中单独描述的技术特征可以单独实现或可以同时实现。
创建以下附图以解释本说明书的具体示例。由于附图中描述的特定装置的名称或特定信号/消息/字段的名称通过示例呈现,因此本说明书的技术特征不限于在以下附图中使用的特定名称。
图1示意性地例示了本公开的实施方式适用于的视频/图像编译装置的示例。
参照图1,视频/图像编译系统可以包括第一装置(源装置)和第二装置(接收装置)。源装置可以经由数字存储介质或网络以文件或流的形式向接收装置传送编码视频/图像信息或数据。
源装置可以包括视频源、编码设备和发送器。接收装置可以包括接收器、解码设备和渲染器。编码设备可以称为视频/图像编码设备,并且解码设备可以称为视频/图像解码设备。发送器可以被包括在编码设备中。接收器可以被包括在解码设备中。渲染器可以包括显示器,并且显示器可以被配置为单独的装置或外部组件。
视频源可以通过捕获、合成或生成视频/图像的处理来获取视频/图像。视频源可以包括视频/图像捕获装置和/或视频/图像生成装置。视频/图像捕获装置可以包括例如一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。视频/图像生成装置可以包括例如计算机、平板计算机和智能电话,并且可以(电子地)生成视频/图像。例如,可以通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可以由生成相关数据的处理代替。
编码设备可以对输入的视频/图像进行编码。编码设备可以执行诸如预测、变换和量化的一系列过程,以实现压缩和编译效率。编码数据(编码视频/图像信息)能够以比特流的形式输出。
发送器可以通过数字存储介质或网络以文件或流的形式向接收装置的接收器发送以比特流的形式输出的经编码的视频/图像信息或数据。数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送器可以包括用于通过预定文件格式生成媒体文件的元件,并且可以包括用于通过广播/通信网络进行发送的元件。接收器可以接收/提取比特流,并向解码设备发送接收到的比特流。
解码设备可以通过执行与编码设备的操作相对应的诸如解量化、逆变换和预测的一系列过程来对视频/图像进行解码。
渲染器可以渲染经解码的视频/图像。经渲染的视频/图像可以通过显示器显示。
图2是例示了可以应用本文献的视频/图像编码设备的配置的示意图。在下文中,视频编码设备可以包括图像编码设备。
参照图2,编码设备200包括图像分割器210、预测器220、残差处理器230和熵编码器240、加法器250、滤波器260和存储器270。预测器220可以包括帧间预测器221和帧内预测器222。残差处理器230可以包括变换器232、量化器233、解量化器234和逆变换器235。残差处理器230还可以包括减法器231。加法器250可以称为重构器或重构块生成器。根据实施方式,图像分割器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可以由至少一个硬件组件(例如,编码器芯片组或处理器)构成。另外,存储器270可以包括解码画面缓冲器(DPB)或者可以由数字存储介质构成。硬件组件还可以包括作为内部/外部组件的存储器270。
图像分割器210可以将输入到编码设备200的输入图像(或画面或帧)分割到一个或更多个处理器中。例如,处理器可以被称为编译单元(CU)。在这种情况下,可以根据四叉树二叉树三叉树(QTBTTT)结构从编译树单元(CTU)或最大编译单元(LCU)来递归地分割编译单元。例如,一个编译单元可以基于四叉树结构、二叉树结构和/或三元结构而被分割为深度更深的多个编译单元。在这种情况下,例如,可以首先应用四叉树结构,随后可以应用二叉树结构和/或三元结构。另选地,可以首先应用二叉树结构。可以基于不再分割的最终编译单元来执行根据本公开的编译处理。在这种情况下,可以根据图像特性基于编译效率将最大编译单元用作最终编译单元,或者如果需要,可以将编译单元递归地分割为深度更深的编译单元并且具有最优大小的编译单元可以用作最终编译单元。这里,编译过程可以包括预测、变换和重构的处理,这将在后面描述。作为另一示例,处理器还可以包括预测单元(PU)或变换单元(TU)。在这种情况下,可以从上述最终编译单元来分离或分割预测单元和变换单元。预测单元可以是样本预测的单元,并且变换单元可以是用于推导变换系数的单元和/或用于从变换系数推导残差信号的单元。
在一些情况下,单元可以与诸如块或区域的术语互换使用。在一般情况下,M×N块可以表示由M列和N行组成的样本或变换系数的集合。样本通常可以表示像素或像素值,可以仅表示亮度分量的像素/像素值,或者仅表示色度分量的像素/像素值。样本可用作与像素或像元的一幅画面(或图像)相对应的术语。
在减法器231中,从输入图像信号(原始块、原始样本或原始样本阵列)中减去从预测器220输出的预测信号(预测块、预测样本或预测样本阵列),以生成残差信号(残差块、残差样本或残差样本阵列)并且所生成的残差信号被发送到变换器232。预测器220可以对要处理的块(在下文中称为当前块)执行预测,并生成包括当前块的预测样本的预测块。预测器220能够以当前块或CU为单位来确定是应用帧内预测还是应用帧间预测。如稍后在每个预测模式的描述中所述,预测器可以生成与预测有关的各种信息(诸如预测模式信息),并向熵编码器240发送所生成的信息。关于预测的信息可以在熵编码器240中编码并以比特流的形式输出。
帧内预测器222可以通过参考当前画面中的样本来预测当前块。根据预测模式,参考的样本可以位于当前块的附近,或者可以远离当前块。在帧内预测中,预测模式可以包括多个非定向模式和多个定向模式。非定向模式可以包括例如DC模式和平面模式。根据预测方向的详细程度,定向模式可以包括例如33个定向预测模式或65个定向预测模式。然而,这仅是示例,依据设置,可以使用更多或更少的定向预测模式。帧内预测器222可以通过使用应用于相邻块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可以基于由参考画面上的运动矢量指定的参考块(参考样本阵列)来推导当前块的预测块。这里,为了减少在帧间预测模式下发送的运动信息的量,可以基于相邻块和当前块之间的运动信息的相关性,以块、子块或样本为单位来预测运动信息。运动信息可以包括运动矢量和参考画面索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,相邻块可以包括存在于当前画面中的空间相邻块和存在于参考画面中的时间相邻块。包括参考块的参考画面和包括时间相邻块的参考画面可以相同或不同。时间相邻块可以称为并置参考块、共位CU(colCU)等,并且包括时间相邻块的参考画面可以称为并置画面(colPic)。例如,帧间预测器221可以基于相邻块来配置运动信息候选列表,并且生成指示使用哪个候选来推导当前块的运动矢量和/或参考画面索引的信息。可以基于各种预测模式来执行帧间预测。例如,在跳过模式和合并模式的情况下,帧间预测器221可以将相邻块的运动信息用作当前块的运动信息。在跳过模式下,与合并模式不同,可能无法发送残差信号。在运动矢量预测(MVP)模式的情况下,可以将相邻块的运动矢量用作运动矢量预测子,并且可以通过发信号通知运动矢量差来指示当前块的运动矢量。
预测器220可以基于以下描述的各种预测方法来生成预测信号。例如,预测器不仅可以应用帧内预测或帧间预测来预测一个块,而且可以同时应用帧内预测和帧间预测二者。这可以称为帧间帧内组合预测(CIIP)。另外,预测器可以执行帧内块复制(IBC)预测模式。例如,IBC可用于游戏等的内容图像/视频编译,例如,屏幕内容编译(SCC)。IBC基本上在当前画面中执行预测,但是可以类似于帧间预测来执行IBC,因为参考块是在当前画面中推推导的。即,IBC可以使用本公开中描述的帧间预测技术中的至少一种。
由帧间预测器221和/或帧内预测器222生成的预测信号可以用于生成重构信号或生成残差信号。变换器232可以通过向残差信号应用变换技术来生成变换系数。例如,变换技术可以包括离散余弦变换(DCT)、离散正弦变换(DST)、基于图的变换(GBT)或条件非线性变换(CNT)等。这里,GBT表示当像素之间的关系信息由图表示时从图获得的变换。CNT是指基于使用所有先前重构的像素生成的预测信号而生成的变换。另外,变换处理可以应用于具有相同大小的正方形像素块,或者可以应用于均具有不同大小的非正方形的像素块。
量化器233可以对变换系数进行量化,并且将它们发送给熵编码器240,并且熵编码器240可以对量化信号(关于量化变换系数的信息)进行编码并且输出比特流。关于量化变换系数的信息可以称为残差信息。量化器233可以基于系数扫描顺序将块类型量化变换系数重新布置为一维矢量形式,并且基于一维矢量形式的量化变换系数来生成关于量化变换系数的信息。可以生成关于变换系数的信息。熵编码器240可以执行各种编码方法,诸如,例如指数哥伦布(Golomb)、上下文自适应变长编译(CAVLC)、上下文自适应二进制算术编译(CABAC)等。熵编码器240可以对除了量化变换系数以外的视频/图像重构所需的信息(例如,语法元素的值等)一起或分开地进行编码。能够以比特流的形式以NAL(网络抽象层)单元为单位发送或存储编码信息(例如,编码视频/图像信息)。视频/图像信息还可以包括关于诸如自适应参数集(APS)、画面参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)的各种参数集的信息。另外,视频/图像信息还可包括一般约束信息。在本公开中,稍后描述的信息和/或语法元素可以通过上述编码处理被编码并且被包括在比特流中。比特流可以通过网络发送,或者可以存储在数字存储介质中。网络可以包括广播网络和/或通信网络,并且数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。可以包括发送从熵编码器240输出的信号的发送器(未示出)和/或存储该信号的存储单元(未示出)作为编码设备200的内部/外部元件,另选地,发送器可以被包括在熵编码器240中。
从量化器233输出的量化变换系数可以用于生成预测信号。例如,可以通过利用解量化器234和逆变换器235对量化变换系数应用解量化和逆变换来重构残差信号(残差块或残差样本)。加法器250将重构的残差信号与从预测器220输出的预测信号相加,以生成重构信号(重构画面、重构块、重构样本阵列)。如果要处理的块没有残差(诸如应用了跳过模式的情况),则可以将预测块用作重构块。所生成的重构信号可以用于在当前画面中要处理的下一块的帧内预测,并且可以通过如下所述的滤波用于下一画面的帧间预测。
此外,在画面编码和/或重构期间,可以应用亮度映射与色度缩放(LMCS)。
滤波器260可以通过对重构信号应用滤波来改进主观/客观图像质量。例如,滤波器260可以通过对重构画面应用各种滤波方法来生成经修改的重构画面,并将经修改的重构画面存储在存储器270(具体地,存储器270的DPB)中。各种滤波方法可包括例如解块滤波、样本自适应偏移(SAO)、自适应环路滤波器、双边滤波器等。滤波器260可以生成与滤波有关的各种信息,并且将生成的信息发送给熵编码器290,如稍后在各种滤波方法的描述中所述。与滤波有关的信息可以由熵编码器290编码并且以比特流的形式输出。
发送给存储器270的经修改的重构画面可以用作帧间预测器221中的参考画面。当通过编码设备应用帧间预测时,可以避免编码设备200与解码设备之间的预测不匹配,并且可以改进编码效率。
存储器270的DPB可以存储用作帧间预测器221中的参考画面的经修改的重构画面。存储器270可以存储从中推导(或编码)当前画面中的运动信息的块的运动信息和/或画面中已重构的块的运动信息。所存储的运动信息可以发送给帧间预测器221,并且用作空间相邻块的运动信息或时间相邻块的运动信息。存储器270可以存储当前画面中的重构块的重构样本,并且可以将重构样本传送给帧内预测器222。
图3是例示了可以应用本文献的实施方式的视频/图像解码设备的配置的示意图。
参照图3,解码设备300可以包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350、存储器360。预测器330可以包括帧间预测器332和帧内预测器331。残差处理器320可以包括解量化器321和逆变换器322。根据实施方式,熵解码器310、残差处理器320、预测器330、加法器340和滤波器350可以由硬件组件(例如,解码器芯片组或处理器)构成。另外,存储器360可以包括解码画面缓冲器(DPB),或者可以由数字存储介质构成。硬件组件还可以包括存储器360作为内部/外部组件。
当输入包括视频/图像信息的比特流时,解码设备300可以与在图2的编码设备中处理视频/图像信息的处理相对应地重构图像。例如,解码设备300可以基于从比特流获得的块分割相关信息来推导单元/块。解码设备300可以使用在编码设备中应用的处理器来执行解码。因此,解码的处理器可以是例如编译单元,并且可以根据四叉树结构、二叉树结构和/或三叉树结构从编译树单元或最大编译单元对编译单元进行分割。可以从编译单元推导一个或更多个变换单元。可以通过再现设备来再现通过解码设备300解码并输出的重构图像信号。
解码设备300可以接收以比特流形式从图2的编码设备输出的信号,并且可以通过熵解码器310对接收到的信号进行解码。例如,熵解码器310可以解析比特流,以推导图像重构(或画面重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可以包括关于诸如自适应参数集(APS)、画面参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)的各种参数集的信息。另外,视频/图像信息还可以包括一般约束信息。解码设备还可以基于关于参数集的信息和/或一般约束信息来对画面进行解码。本公开中稍后描述的发信号通知的/接收的信息和/或语法元素可以通过解码处理被解码,并从比特流中获取。例如,熵解码器310基于诸如指数哥伦布编译、CAVLC或CABAC的编译方法对比特流中的信息进行解码,并输出图像重构所需的语法元素和残差的变换系数的量化值。更具体地,CABAC熵解码方法可以接收与比特流中的每个语法元素相对应的bin,使用解码目标语法元素信息、解码目标块的解码信息或在先前级中解码的符号/bin的信息来确定上下文模型,并通过根据所确定的上下文模型预测bin的出现概率来对该bin进行算术解码,并且生成与每个语法元素的值相对应的符号。在这种情况下,在确定上下文模型之后,CABAC熵解码方法可以通过将经解码的符号/bin的信息用于下一符号/bin的上下文模型来更新上下文模型。由熵解码器310解码的信息之中与预测有关的信息可以提供给预测器330,并且关于在熵解码器310中对其执行了熵解码的残差的信息(也就是说,量化变换系数和相关参数信息)可以被输入到解量化器321。另外,由熵解码器310解码的信息之中关于滤波的信息可以提供给滤波器350。此外,用于接收从编码设备输出的信号的接收器(未示出)可以进一步被配置为解码设备300的内部/外部元件,或者接收器可以是熵解码器310的组件。此外,根据本公开的解码设备可以称为视频/图像/画面解码设备,并且解码设备可以分类为信息解码器(视频/图像/画面信息解码器)和样本解码器(视频/图像/画面样本解码器)。信息解码器可以包括熵解码器310,并且样本解码器可以包括解量化器321、逆变换器322、预测器330、加法器340、滤波器350和存储器360中的至少一个。
解量化器321可以对量化变换系数进行解量化并且输出变换系数。解量化器321能够以二维块的形式重新布置量化变换系数。在这种情况下,可以基于在编码设备中执行的系数扫描顺序来执行重新布置。解量化器321可以通过使用量化参数(例如,量化步长信息)对量化变换系数执行解量化,并且获得变换系数。
逆变换器322对变换系数进行逆变换以获得残差信号(残差块、残差样本阵列)。
预测器可以对当前块执行预测,并生成包括当前块的预测样本的预测块。预测器可以基于从熵解码器310输出的关于预测的信息来确定向当前块应用帧内预测还是帧间预测,并且可以确定具体的帧内/帧间预测模式。
预测器可以基于以下描述的各种预测方法来生成预测信号。例如,预测器不仅可以应用帧内预测或帧间预测来预测一个块,而且可以同时应用帧内预测和帧间预测。这可以称为帧间帧内组合预测(CIIP)。另外,预测器可以执行帧内块复制(IBC)来预测块。IBC可以用于游戏等的内容图像/视频编译,例如,屏幕内容编译(SCC)。IBC基本上在当前画面中执行预测,但是可以类似于帧间预测来执行IBC,因为在当前画面中推导参考块。即,IBC可以使用本公开中描述的帧间预测技术中的至少一种。
帧内预测器331可以通过参考当前画面中的样本来预测当前块。根据预测模式,参考的样本可以位于当前块的附近,或者可以远离当前块。在帧内预测中,预测模式可以包括多个非定向模式和多个定向模式。帧内预测器331可以通过使用应用于相邻块的预测模式来确定应用于当前块的预测模式。
帧间预测器332可以基于参考画面上的由运动矢量指定的参考块(参考样本阵列)来推导当前块的预测块。在这种情况下,为了减少在帧间预测模式中发送的运动信息的量,可以基于相邻块和当前块之间的运动信息的相关性,以块、子块或样本为单位来预测运动信息。运动信息可以包括运动矢量和参考画面索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,相邻块可以包括存在于当前画面中的空间相邻块和存在于参考画面中的时间相邻块。例如,帧间预测器332可以基于相邻块来配置运动信息候选列表,并基于接收到的候选选择信息来推导当前块的运动矢量和/或参考画面索引。可以基于各种预测模式来执行帧间预测,并且关于预测的信息可以包括指示针对当前块的帧间预测的模式的信息。
加法器340可以通过将所获得的残差信号与从预测器(包括帧间预测器332和/或帧内预测器331)输出的预测信号(预测块、预测样本阵列)相加来生成重构信号(重构画面、重构块、重构样本阵列)。如果要处理的块没有残差(例如当应用跳过模式时),则可以将预测块用作重构块。
加法器340可以称为重构器或重构块生成器。所生成的重构信号可以用于当前画面中要处理的下一块的帧内预测,可以通过如下所述的滤波输出,或者可以用于下一画面的帧间预测。
此外,在画面解码过程中可以应用亮度映射与色度缩放(LMCS)。
滤波器350可以通过向重构信号应用滤波来改进主观/客观图像质量。例如,滤波器350可以通过对重构画面应用各种滤波方法来生成经修改的重构画面,并将经修改的重构画面存储在存储器360(具体地,存储器360的DPB)中。各种滤波方法可包括例如解块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。
存储器360的DPB中存储的(经修改的)重构画面可以用作帧间预测器332中的参考画面。存储器360可以存储从中推导(或解码)当前画面中的运动信息的块的运动信息和/或画面中已重构的块的运动信息。所存储的运动信息可以发送给帧间预测器332,以作为空间相邻块的运动信息或时间相邻块的运动信息来利用。存储器360可以存储当前画面中的重构块的重构样本,并且可以将重构样本传送给帧内预测器331。
在本说明书中,解码设备300的预测器330、解量化器321、逆变换器322和滤波器350中所描述的实施方式可分别应用于或对应于编码设备200的预测器220、解量化器234、逆变换器235和滤波器260。
如上所述,在执行视频编译时,执行预测以增加压缩效率。由此,可生成包括当前块(要编译的块)的预测样本的预测块。这里,预测块包括空间域(或像素域)中的预测样本。从编码设备和解码设备以相同的方式推导预测块,并且编码设备可通过将原始块和预测块之间的信息(残差信息)而非原始块本身的原始样本值用信号通知给解码设备来增加图像编译效率。解码设备可基于上述残差信息推导包含残差样本的残差块,将上述残差块与上述预测块组合以创建包含恢复样本的恢复块,并且创建包含恢复块的恢复画面。
可以通过变换和量化处理来生成残差信息。例如,编码设备可以推导原始块和预测块之间的残差块,通过对包括在残差块中的残差样本(残差样本阵列)执行变换处理来推导变换系数,通过对变换系数执行量化处理来推导量化变换系数,并且将相关残差信息(通过比特流)用信号通知给解码设备。这里,残差信息可以包括诸如值信息、位置信息、变换技术、变换核、量化变换系数的量化参数等的信息。解码设备可以基于残差信息执行解量化/逆变换处理并且推导残差样本(或残差块)。解码设备可以基于预测块和残差块来生成重构画面。编码设备还可以通过对量化变换系数进行解量化/逆变换以供画面的帧间预测参考来推导残差块,并且基于此生成重构画面。
在本公开中,量化变换系数和变换系数可以分别被称为变换系数和缩放变换系数。在这种情况下,残差信息可以包括关于变换系数的信息,并且可以通过残差编译语法发信号通知关于变换系数的信息。可以基于残差信息(或关于变换系数的信息)推导变换系数,并且可以通过对变换系数逆变换(缩放)来推导缩放变换系数。可以基于对缩放变换系数逆变换(变换)来推导残差样本。这也可以在本公开的其他部分中应用/表达。
在本文献中,量化变换系数和变换系数可以分别被称为变换系数和缩放变换系数。在这种情况下,残差信息可以包括关于变换系数的信息,并且可以通过残差编译语法来用信号通知关于变换系数的信息。变换系数可以基于残差信息(或关于变换系数的信息)来推导,缩放变换系数可以通过变换系数的逆变换(缩放)来推导。残差样本可以基于对缩放变换系数的逆变换(变换)来推导。这也可在本文献的其他部分中应用/表达。
编码设备/解码设备的预测器可以通过逐块执行帧间预测来推导预测样本。帧间预测可以是以取决于当前画面以外的画面的数据元素(例如,样本值或运动信息)的方式推导的预测。当对当前块应用帧间预测时,可以基于参考画面索引所指示的参考画面中由运动向量指定的参考块(参考样本阵列)来推导当前块的预测块(预测样本阵列)。在这种情况下,为了减少在帧间预测模式下发送的运动信息的量,可以基于邻近块和当前块之间的运动信息的相关性以块、子块或样本为单位预测当前块的运动信息。运动信息可以包括运动向量和参考画面索引。运动信息还可以包括帧间预测类型(L0预测、L1预测、Bi预测等)信息。当应用帧间预测时,邻近块可以包括存在于当前画面中的空间邻近块和存在于参考画面中的时间邻近块。包括参考块的参考画面和包括时间邻近块的参考画面可以相同或不同。时间邻近块可以被称为并置参考块、并置CU(colCU)等,包括时间邻近块的参考画面可以被称为并置画面(colPic)。例如,可以基于当前块的邻近块来构造运动信息候选列表,并且可以用信号通知指示选择(使用)哪一候选来推导运动向量的标志或索引信息和/或当前块的参考画面索引。可以基于各种预测模式来执行帧间预测。例如,在跳过模式和合并模式的情况下,当前块的运动信息可以与所选邻近块的运动信息相同。在跳过模式的情况下,与合并模式不同,可不发送残差信号。在运动向量预测(MVP)模式的情况下,所选邻近块的运动向量用作运动向量预测子,并且可以用信号通知运动向量差。在这种情况下,可以使用运动向量预测子与运动向量差之和来推导当前块的运动向量。
根据帧间预测类型(L0预测、L1预测、Bi预测等),运动信息可以包括L0运动信息和/或L1运动信息。L0方向上的运动向量可以被称为L0运动向量或MVL0,L1方向上的运动向量可以被称为L1运动向量或MVL1。基于L0运动向量的预测可以被称为L0预测,基于L1运动向量的预测可以被称为L1预测,基于L0运动向量和L1运动向量二者的预测可以被称为Bi预测。这里,L0运动向量可以指示与参考画面列表L0(L0)有关的运动向量,L1运动向量可以指示与参考画面列表L1(L1)有关的运动向量。参考画面列表L0可以包括按输出顺序在当前画面之前的画面作为参考画面,并且参考画面列表L1可以包括按输出顺序在当前画面之后的画面。先前画面可以被称为前向(参考)画面,后续画面可以被称为后向(参考)画面。参考画面列表L0还可以包括按输出顺序在当前画面之后的画面作为参考画面。在这种情况下,参考画面列表L0中的先前画面可以首先被索引,后续画面可以接下来被索引。参考画面列表L1还可以包括按输出顺序在当前画面之前的画面作为参考画面。在这种情况下,参考画面列表1中的后续画面可以首先被索引,先前画面可以接下来被索引。这里,输出顺序可以对应于画面顺序计数(POC)顺序。
图4示例性地例示了用于编译视频/图像的层结构。
参照图4,编译视频/图像被分成执行视频/图像的解码处理并处理解码处理的视频编译层(VCL)、发送和存储编译信息的下层系统以及存在于VCL和下层系统之间并用于执行网络适配功能的网络抽象层(NAL)。
在VCL中,可以生成包括压缩图像数据(切片数据)的VCL数据、或者包括画面参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)的参数集、或者图像解码处理中另外需要的补充增强信息(SEI)消息。
在NAL中,头信息(NAL单元数据)被添加到VCL中生成的原始字节序列有效载荷(RSRP)以生成NAL单元。这里,RBSP是指VCL中生成的切片数据、参数集、SEI消息等。NAL单元头可以包括根据包括在对应NAL单元中的RSRP数据指定的NAL单元类型信息。
如上图中所示,NAL单元可以根据VCL中生成的RSRP被分类为VCL NAL单元和非VCLNAL单元。VCL NAL单元可以意指包括关于该信息的信息(切片数据)的NAL单元,非VCL NAL单元可以意指包括将图像解码所需的信息(参数集或SEI消息)的NAL单元。
可以在根据子系统的数据标准添加头信息的同时通过网络发送VCL NA单元和非VCL NAL单元。例如,NAL单元可以被转换为诸如H.266/VVC文件格式的预定标准的数据格式、实时传输协议(RTP)、传输流(TS)等,并且通过各种网络传输。
此外,如上所述,关于NAL单元,可以根据包括在对应NAL单元中的RBSP数据结构来指定NAL单元类型,并且关于NAL单元类型的信息可以存储在NAL单元头中并用信号通知。
例如,NAL单元可以根据NAL单元是否包括关于图像的信息(切片数据)被分类为VCL NAL单元类型和非VCL NAL单元类型。此外,VCL NAL单元类型可以根据包括在VCL NAL单元中的画面的性质和类型来分类,非VCL NAL单元可以根据参数集的类型来分类。
以下是根据包括在非VCL NAL单元类型中的参数集的类型指定的NAL单元类型的示例。
- 适配参数集(APS)NAL单元:包括APS的NAL单元类型
- 视频参数集(VPS)NAL单元:包括VPS的NAL单元类型
- 序列参数集(SPS)NAL单元:包括SPS的NAL单元类型
- 画面参数集(PPS)NAL单元:包括PPS的NAL单元类型
- 解码能力信息(DCI)NAL单元:包括DCI的NAL单元类型
- 画面头(PH)NAL单元:包括PH的NAL单元类型
上述NAL单元类型具有NAL单元类型的语法信息,并且该语法信息可以存储在NAL单元头中并用信号通知。例如,语法信息可以是nal_unit_type,并且NAL单元类型可以用nal_unit_type值来指定。
此外,如上所述,一个画面可以包括多个切片,并且一个切片可以包括切片头和切片数据。在这种情况下,一个画面头可以进一步被添加到一个画面中的多个切片(切片头和切片数据集)。画面头(画面头语法)可以包括共同适用于画面的信息/参数。在本文献中,切片可以与拼块组混合或替换。另外,在本文献中,切片头可以与类型组头混合或替换。
切片头(切片头语法、切片头信息)可以包括共同适用于切片的信息/参数。APS(APS语法)或PPS(PPS语法)可以包括共同适用于一个或更多个切片或画面的信息/参数。SPS(SPS语法)可以包括共同适用于一个或更多个序列的信息/参数。VPS(VPS语法)可以包括共同适用于多个层的信息/参数。DCI(DCI语法)可以包括共同适用于整个视频的信息/参数。DCI可以包括与解码能力有关的信息/参数。在本文献中,高级语法(HLS)可以包括APS语法、PPS语法、SPS语法、VPS语法、DCI语法、画面头语法或切片头语法中的至少一个。
在本文献中,从编码设备到解码设备编码并以比特流的形式用信号通知的图像/视频信息不仅包括画面内分区相关信息、帧内/帧间预测信息、残差信息、环路内滤波信息等,而且包括切片头中所包括的信息、画面头中所包括的信息、APS中所包括的信息、PPS中所包括的信息、SPS中所包括的信息、VPS中所包括的信息和/或DCI中所包括的信息。另外,图像/视频信息还可以包括NAL单元头信息。
此外,当执行帧内预测时,可以使用样本之间的相关性,并且可以获得原始块和预测块之间的差(即,残差)。可以对残差应用上述变换和量化,由此,可以去除空间冗余。在下文中,将详细描述使用帧内预测的编码方法和解码方法。
帧内预测是指基于包括当前块的画面(下文中称为当前画面)中的当前块外部的参考样本来生成当前块的预测样本的预测。这里,当前块外部的参考样本可以指位于当前块周围的样本。当对当前块应用帧内预测时,可以推导要用于当前块的帧内预测的邻近参考样本。
例如,在当前块的大小(宽度×高度)为nW×nH时,当前块的邻近参考样本可以包括:包括与当前块的左边界相邻的样本和与当前块的左下邻近的样本的总共2×nH个样本、包括与当前块的上边界相邻的样本和与右上邻近的样本的总共2×nW个样本、以及与当前块的左上相邻的1个样本。另选地,当前块的邻近参考样本可以包括多列中的上邻近样本和多行中的左邻近样本。另外,当前块的邻近参考样本可以包括与大小为nW×nH的当前块的右边界相邻的总共nH个样本、与大小为nW×nH的当前块的下边界相邻的总共nW个样本、以及与大小为nW×nH的当前块的右下邻近的1个样本。
然而,当前块的一些邻近参考样本可能还未解码或者可能不可用。在这种情况下,解码设备可以通过利用可用样本替换不可用样本来配置要用于预测的邻近参考样本。另选地,可以通过可用样本的插值来配置要用于预测的邻近参考样本。
当推导邻近参考样本时,(i)可以基于当前块的邻近参考样本的平均或插值来推导预测样本,并且(ii)可以基于当前块的邻近参考样本之中相对于预测样本存在于特定(预测)方向上的参考样本来推导预测样本。当帧内预测模式是非定向模式或非角模式时可以应用情况(i),当帧内预测模式是定向模式或角模式时可以应用情况(ii)。
另外,通过邻近参考样本之中基于当前块的预测样本位于当前块的帧内预测模式的预测方向上的第一邻近样本与位于预测方向的相反方向上的第二邻近样本之间的插值,可以生成预测样本。上述情况可以被称为线性插值帧内预测(LIP)。另外,可以使用线性模型基于亮度样本来生成色度预测样本。这种情况可被称为LM模式。
另外,可以基于滤波的邻近参考样本以及现有邻近参考样本之中根据帧内预测模式推导的至少一个参考样本(即,未滤波的邻近参考样本)来推导当前块的临时预测样本,并且临时预测样本可被加权求和以推导当前块的预测样本。上述情况可以被称为位置相关帧内预测(PDPC)。
可以选择当前块的邻近多参考样本线之中具有最高预测准确度的参考样本线以使用对应线上位于预测方向上的参考样本来推导预测样本,然后可以将本文所使用的参考样本线指示(用信号通知)给解码设备,从而执行帧内预测编码。上述情况可以被称为多参考线(MRL)帧内预测或基于MRL的帧内预测。
另外,可以通过将当前块分成垂直或水平子分区来基于相同的帧内预测模式执行帧内预测,并且能够以子分区为单位推导和使用邻近参考样本。即,在这种情况下,当前块的帧内预测模式等同地应用于子分区,并且在一些情况下可以通过以子分区为单位推导和使用邻近参考样本来改进帧内预测性能。这种预测方法可以被称为帧内子分区(ISP)或基于ISP的帧内预测。
上述帧内预测方法可以与帧内预测模式分开被称为帧内预测类型。帧内预测类型可以被称为诸如帧内预测技术或附加帧内预测模式的各种术语。例如,帧内预测类型(或附加帧内预测模式)可以包括上述LIP、PDPC、MRL或ISP中的至少一种。除了诸如LIP、PDPC、MRL或ISP的特定帧内预测类型之外的一般帧内预测方法可以被称为正常帧内预测类型。当未应用特定帧内预测类型时通常可以应用正常帧内预测类型,并且可以基于上述帧内预测模式执行预测。此外,可以根据需要对推导的预测样本执行后滤波。
此外,除了上述帧内预测类型之外,可以使用基于矩阵的帧内预测(MIP)作为一种帧内预测方法。MIP可以被称为仿射线性加权帧内预测(ALWIP)或矩阵加权帧内预测(MIP)。
如果对当前块应用MIP,则i)使用已执行平均处理的邻近参考样本,ii)执行矩阵向量乘法处理,并且iii)可以根据需要进一步执行水平/垂直插值处理以推导当前块的预测样本。用于MIP的帧内预测模式可以被配置为不同于LIP、PDPC、MRL、ISP帧内预测或正常帧内预测中使用的帧内预测模式。
MIP的帧内预测模式可以被称为“仿射线性加权帧内预测模式”或基于矩阵的帧内预测模式。例如,可以根据MIP的帧内预测模式不同地设定矩阵向量乘法中使用的矩阵和偏移。这里,矩阵可以被称为(仿射)权重矩阵,偏移可以被称为(仿射)偏移向量或(仿射)偏置向量。在本文献中,MIP的帧内预测模式可以被称为MIP帧内预测模式、线性加权帧内预测模式、矩阵加权帧内预测模式或基于矩阵的帧内预测模式。具体MIP方法将稍后描述。
准备以下附图以说明本文献的具体示例。由于附图中所描述的特定装置的名称或特定术语或名称(例如,语法的名称)作为示例而提供,所以本文献的技术特征不限于下面的附图中所使用的特定名称。
图5示意性地例示了可以应用本公开的实施方式的基于帧内预测的图像编码方法的示例,图6示意性地例示了编码设备中的帧内预测器。图6的编码设备中的帧内预测器可以与上述图2的编码设备200的帧内预测器222相同或对应地应用。
参照图5和图6,S500可以由编码设备的帧内预测器222执行,S510可以由编码设备的残差处理器230执行。具体地,S510可以由编码设备的减法器231执行。在S520中,预测信息可以由帧内预测器222推导并由熵编码器240编码。在S520中,残差信息可以由残差处理器230推导并由熵编码器240编码。残差信息是关于残差样本的信息。残差信息可以包括关于残差样本的量化变换系数的信息。如上所述,残差样本可以通过编码设备的变换器被推导为变换系数,并且变换系数可以通过量化器被推导为量化变换系数。关于量化变换系数的信息可以在熵编码器240中通过残差编译处理编码。
编码设备对当前块执行帧内预测(S500)。编码设备可以推导当前块的帧内预测模式/类型,推导当前块的邻近参考样本,并且基于帧内预测模式/类型和邻近参考样本在当前块内生成预测样本。这里,帧内预测模式/类型确定、邻近参考样本推导和预测样本生成处理可以同时执行,或者一个处理可以在另一处理之前执行。
例如,编码设备的帧内预测器222可以包括帧内预测模式/类型确定器222-1、参考样本推导器222-2和预测样本推导器222-3。帧内预测模式/类型确定器222-1确定当前块的帧内预测模式/类型,参考样本推导器222-2推导当前块的邻近参考样本,并且预测样本推导器222-3可以推导当前块的预测样本。此外,尽管未示出,当执行预测样本滤波处理时,帧内预测器222还可以包括预测样本滤波器(未示出)。编码设备可以从多个帧内预测模式/类型之中确定应用于当前块的模式/类型。编码设备可以比较帧内预测模式/类型的RD成本并且确定当前块的最优帧内预测模式/类型。
如上所述,编码设备可以执行预测样本滤波处理。预测样本滤波可以被称为后滤波。可以通过预测样本滤波处理对一些或所有预测样本进行滤波。在一些情况下,可以省略预测样本滤波处理。
编码设备基于(滤波的)预测样本来生成当前块的残差样本(S510)。编码设备可以基于相位来比较预测样本与当前块的原始样本并且推导残差样本。
编码设备可以对包括帧内预测信息(预测信息)和关于残差样本的残差信息的图像信息进行编码(S520)。预测信息可以包括帧内预测模式信息和帧内预测类型信息。残差信息可以包括残差编译语法。编码设备可以对残差样本进行变换/量化以推导量化变换系数。残差信息可以包括关于量化变换系数的信息。
编码设备可以按比特流的形式输出编码的图像信息。输出的比特流可以通过存储介质或网络传送到解码设备。
如上所述,编码设备可以生成重构画面(包括重构样本和重构块)。为此,编码设备可以通过再次对量化变换系数进行解量化/逆变换来推导(修改的)残差样本。以这种方式在对残差样本进行变换/量化之后执行解量化/逆变换的原因是为了推导与如上所述从解码设备推导的残差样本相同的残差样本。编码设备可以基于预测样本和(修改的)残差样本来生成包括当前块的重构样本的重构块。可以基于重构块来生成当前画面的重构画面。如上所述,可以对重构画面进一步应用环路内滤波处理等。
图7示意性地例示了可以应用本公开的实施方式的基于帧内预测的图像解码方法的示例,图8示意性地例示了解码设备中的帧内预测器。图8的解码设备中的帧内预测器可以与图2的解码设备300的上述帧内预测器331相同或对应地应用。
参照图7和图8,解码设备可以执行与上述编码设备所执行的操作对应的操作。S700至S720可以由解码设备的帧内预测器331执行,并且S700的预测信息和S730的残差信息可以由解码设备的熵解码器310从比特流获得。解码设备的残差处理器320可以基于残差信息推导当前块的残差样本。具体地,残差处理器320的解量化器321通过基于根据残差信息推导的量化变换系数执行解量化来推导变换系数,并且残差处理器320的逆变换器可以通过对变换系数执行逆变换来推导当前块的残差样本。S740可以由解码设备的加法器340或重构器执行。
解码设备可以基于所接收的预测信息(帧内预测模式/类型信息)推导当前块的帧内预测模式/类型(S700)。解码设备可以推导当前块的邻近参考样本(S710)。解码设备基于帧内预测模式/类型和邻近参考样本在当前块内生成预测样本(S720)。在这种情况下,解码设备可以执行预测样本滤波处理。预测样本滤波可以被称为后滤波。一些或所有预测样本可以通过预测样本滤波处理来滤波。在一些情况下,可以省略预测样本滤波处理。
解码设备基于所接收的残差信息来生成当前块的残差样本(S730)。解码设备可以基于预测样本和残差样本来生成当前块的重构样本,并且推导包括重构样本的重构块(S740)。可以基于重构块来生成当前画面的重构画面。如上所述,可以对重构画面进一步应用环路内滤波处理等。
这里,解码设备的帧内预测器331可以包括帧内预测模式/类型确定器231-1、参考样本推导器331-2和预测样本推导器231-3。帧内预测模式/类型确定器331-1基于从熵解码器310获得的帧内预测模式/类型信息来确定当前块的帧内预测模式/类型,并且参考样本推导器331-2可以推导当前块的邻近参考样本,并且预测样本推导器331-3可以推导当前块的预测样本。此外,尽管未示出,当执行上述预测样本滤波处理时,帧内预测器331还可以包括预测样本滤波器(未示出)。
例如,帧内预测模式信息可以包括指示是否最可能模式(MPM)被应用于当前块或是否剩余模式被应应用于当前块的标志信息(例如,intra_luma_mpm_flag)。这时,当对当前块应用MPM时,预测模式信息可以进一步包括指示帧内预测模式候选(MPM候选)之一的索引信息(例如,intra_luma_mpm_idx)。帧内预测模式候选(MPM候选)可以被配置为MPM候选列表或MPM列表。另外,当不对当前块应用MPM时,帧内预测模式信息可以进一步包括指示排除帧内预测模式候选(MPM候选)的剩余帧内预测模式之一的剩余模式信息(例如,intra_luma_mpm_remainder)。解码设备可以基于帧内预测模式信息来确定当前块的帧内预测模式。在这时,可以为上述MIP配置单独的MPM列表。
另外,帧内预测类型信息可以按各种形式实现。例如,帧内预测类型信息可以包括指示帧内预测类型之一的帧内预测类型索引信息。作为另一示例,帧内预测类型信息包括指示是否对当前块应用MRL的参考样本线信息(例如,intra_luma_ref_idx)、如果MRL适用则是否使用参考样本线、指示是否对当前块应用ISP的ISP标志信息(例如,intra_subpartitions_mode_flag)、当应用ISP时子分区指示分区类型的ISP类型信息(例如,intra_subpartitions_split_flag)、指示是否应用PDCP的标志信息或是否应用LIP的标志信息中的至少一个。另外,帧内预测类型信息可以包括指示是否对当前块应用MIP的MIP标志信息。
上述帧内预测模式信息和/或帧内预测类型信息可以通过本文献中所描述的编译方法来编码/解码。例如,上述帧内预测模式信息和/或帧内预测类型信息可以通过基于截断(莱斯)二进制码的熵编译(例如,CABAC、CAVLC)编译来编码/解码。
图9示例性地例示了可以应用本公开的实施方式的示意性帧内预测处理。
参照图9,如上所述,帧内预测处理可以包括确定帧内预测模式/类型、推导邻近参考样本和执行帧内预测(生成预测样本)。帧内预测处理可以在如上所述的编码设备和解码设备中执行。本文献中的编译设备可以包括编码设备和/或解码设备。
编译设备可以确定帧内预测模式/类型(S900)。
在上述各种帧内预测模式/类型之中,编译设备可以确定被应用于当前块并且生成预测相关信息的帧内预测模式/类型。预测相关信息可以包括指示被应用于当前块的帧内预测模式的帧内预测模式信息和/或指示被应用于当前块的帧内预测类型的帧内预测类型信息。解码设备可以基于预测相关信息来确定被应用于当前块的帧内预测模式/类型。
如上所述,帧内预测模式信息可以包括MPM标志信息、非平面标志信息、MPM索引信息和/或剩余模式(MPM剩余)信息中的至少一个。如上所述,帧内预测类型信息包括参考样本线(MRL索引)信息(例如,intra_luma_ref_idx)、ISP标志信息(例如,intra_subpartitions_mode_flag)、ISP类型信息(例如,intra_subpartitions_split_flag)和指示是否应用PDCP的标志信息、指示是否应用LIP的标志信息和/或MIP标志信息。
例如,当应用帧内预测时,可以使用邻近块的帧内预测模式来确定应用于当前块的帧内预测模式。例如,编译设备可以基于所接收的MPM索引选择基于当前块的邻近块(例如,左和/或上邻近块)的帧内预测模式和/或附加候选模式推导的最可能模式(MPM)列表中的MPM候选之一,或者可以基于MPM剩余信息(剩余帧内预测模式信息)选择未包括在MPM候选(和平面模式)中的剩余帧内预测模式之一。MPM列表可以被配置为包括或不包括平面模式作为候选。例如,如果mpm列表包括平面模式作为候选,则MPM列表可以具有6个候选,如果MPM列表不包括平面模式作为候选,则MPM列表可以具有5个候选。当MPM列表不包括平面模式作为候选时,可以用信号通知指示当前块的帧内预测模式是否不是平面模式的非平面标志(例如,intra_luma_not_planar_flag)。例如,可以首先用信号通知MPM标志,并且当MPM标志的值为1时,可以用信号通知MPM索引和非平面标志。另外,当非平面标志的值为1时,可以用信号通知MPM索引。这里,将MPM列表配置为不包括平面模式作为候选的原因在于平面模式不是MPM,而不是平面模式始终被视为MPM,因此首先用信号通知非平面标志。这是为了首先检查它是否为平面模式。
例如,可以基于MPM标志(例如,intra_luma_mpm_flag)来指示应用于当前块的帧内预测模式是在MPM候选(和平面模式)之中还是剩余模式之中。值为1的MPM标志可以指示当前块的帧内预测模式在MPM候选(和平面模式)内,值为0的MPM标志可以指示当前块的帧内预测模式不在MPM候选(和平面模式)内。非平面标志(例如intra_luma_not_planar_flag)值0可以指示当前块的帧内预测模式是平面模式,非平面标志值1可以指示当前块的帧内预测模式不是平面模式。可以按mpm_idx或intra_luma_mpm_idx元素的形式用信号通知MPM索引,并且可以按rem_intra_luma_pred_mode或intra_luma_mpm_remainder语法元素的形式用信号通知剩余帧内预测模式信息。例如,剩余帧内预测模式信息可以通过按照预测模式编号的顺序对未包括在MPM候选(和平面模式)中的剩余帧内预测模式进行索引来指示所有帧内预测模式之一。帧内预测模式可以是亮度分量(样本)的帧内预测模式。在下文中,帧内预测模式信息包括MPM标志(例如,intra_luma_mpm_flag)、非平面标志(例如,intra_luma_not_planar_flag)、MPM索引(例如,mpm_idx或intra_luma_mpm_idx)和剩余帧内预测模式信息(rem_intra_luma_luma_mpm_mode或intra_luma_mpminder)中的至少一个。在本文献中,MPM列表可以被称为诸如MPM候选列表和candModeList的各种术语。
当对当前块应用MIP时,可以用信号通知用于MIP的单独mpm标志(例如,intra_mip_mpm_flag)、mpm索引(例如,intra_mip_mpm_idx)和剩余帧内预测模式信息(例如,intra_mip_mpm_remainder),并且可以不用信号通知非平面标志。
换言之,当图像被大致分区为块时,要编译的当前块和邻近块具有相似的图像特性。因此,当前块和邻近块极有可能具有相同或相似的帧内预测模式。因此,编码器可使用邻近块的帧内预测模式来对当前块的帧内预测模式进行编码。
可以配置编译设备的当前块的最可能模式(MPM)列表。MPM列表也可以被称为MPM候选列表。这里,MPM可以意指用于在帧内预测模式编译期间考虑当前块和邻近块之间的相似性来改进编译效率的模式。如上所述,MPM列表可以包括平面模式,或者可以排除平面模式。例如,当MPM列表包括平面模式时,MPM列表中的候选数量可为6。而当MPM列表不包括平面模式时,MPM列表中的候选数量可为5。
编码设备可以基于各种帧内预测模式来执行预测,并且可以基于根据其的速率失真优化(RDO)来确定最优帧内预测模式。在这种情况下,编码设备可以仅使用MPM列表中配置的MPM候选和平面模式来确定最优帧内预测模式,或者除了MPM列表中配置的MPM候选和平面模式之外还可以使用剩余帧内预测模式。具体地,如果当前块的帧内预测类型是特定类型(例如,LIP、MRL或ISP)而非正常帧内预测类型,则编码设备仅考虑MPM候选和平面模式作为当前块的帧内预测模式候选,然后确定最优帧内预测模式。即,在这种情况下,可以仅从MPM候选和平面模式之中确定当前块的帧内预测模式,并且在这种情况下,可以不对mpm标志进行编码/用信号通知。在这种情况下,解码设备可以估计出mpm标志为1,而无需单独地用信号通知mpm标志。
此外,通常,在当前块的帧内预测模式不是平面模式,而是MPM列表中的MPM候选之一时,编码设备生成指示MPM候选之一的mpm索引(mpm idx)。如果当前块的帧内预测模式未包括在MPM列表中,则生成指示未包括在MPM列表(和平面模式)中的剩余帧内预测模式之中与当前块的帧内预测模式相同的模式的MPM剩余信息(剩余帧内预测模式信息)。例如,MPM剩余信息可以包括intra_luma_mpm_remainder语法元素。
解码设备从比特流获得帧内预测模式信息。如上所述,帧内预测模式信息可以包括MPM标志、非平面标志、MPM索引或MPM剩余信息(剩余帧内预测模式信息)中的至少一个。解码设备可以构造MPM列表。该MPM列表与编码设备中配置的MPM列表相同地配置。即,MPM列表可以包括邻近块的帧内预测模式,或者还可以包括根据预定方法的特定帧内预测模式。
解码设备可以基于MPM列表和帧内预测模式信息来确定当前块的帧内预测模式。例如,当MPM标志的值为1时,解码设备(基于非平面标志)将平面模式推导为当前块的帧内预测模式或者从MPM列表中的MPM候选之中选择MPM索引所指示的候选。这里,MPM候选可以仅指示MPM列表中所包括的候选,或者可以不仅包括MPM列表中所包括的候选,而且包括当MPM标志的值为1时可以应用的平面模式。
又例如,当MPM标志的值为0时,解码设备可以将未包括在MPM列表和平面模式中的剩余帧内预测模式之中剩余帧内预测模式信息(可以被称为mpm剩余信息)所指示的帧内预测模式推导为当前块的帧内预测模式。此外,又如,在当前块的帧内预测类型是特定类型(例如,LIP、MRL或ISP)时,解码设备可以将平面模式或MPM列表中MPM标志所指示的候选推导为当前块的帧内预测模式,而无需解析/解码/确认MPM标志。
编译装置推导当前块的邻近参考样本(S910)。当对当前块应用帧内预测时,可以推导要用于当前块的帧内预测的邻近参考样本。当前块的邻近参考样本包括与大小为nW×nH的当前块的左边界相邻的总共2×nH个样本和与大小为nW×nH的当前块的左下邻近的样本、以及与当前块的上边界相邻的总共2×nW个样本和与大小为nW×nH的当前块的右上邻近的样本、以及与当前块的左上邻近的1个样本。另选地,当前块的邻近参考样本可以包括多列中的上邻近样本和多行中的左邻近样本。另外,当前块的邻近参考样本可以包括与大小为nW×nH的当前块的右边界相邻的总共nH个样本、与大小为nW×nH的当前块的下边界相邻的总共nW个样本、以及与大小为nW×nH的当前块的右下邻近的1个样本。
此外,当应用MRL时(即,当MRL索引的值大于0时),邻近参考样本可位于线1至2上,而非在左/上侧与当前块相邻的线0。在这种情况下,邻近参考样本的数量可进一步增加。此外,当应用ISP时,能够以子分区为单位推导邻近参考样本。
编译设备通过对当前块执行帧内预测来推导预测样本(S920)。编译设备可以基于帧内预测模式/类型和邻近样本来推导预测样本。编译设备可以在当前块的邻近参考样本之中根据当前块的帧内预测模式来推导参考样本,并且可以基于参考样本来推导当前块的预测样本。
此外,当应用帧内预测时,可以使用邻近块的帧内预测模式来确定应用于当前块的帧内预测模式。例如,编码设备可以基于所接收的mpm索引选择基于当前块的邻近块(例如,左和/或上邻近块)的帧内预测模式和附加候选模式推导的最可能模式(mpm)列表中的mpm候选之一,或者可以基于剩余帧内预测模式信息选择未包括在mpm候选(和平面模式)中的剩余帧内预测模式之一。mpm列表可被配置为包括或不包括平面模式作为候选。例如,如果mpm列表包括平面模式作为候选,则mpm列表可以具有6个候选,如果mpm列表不包括平面模式作为候选,则mpm列表可以具有5个候选。如果mpm列表不包括平面模式作为候选,则可以用信号通知指示当前块的帧内预测模式是否不是平面模式的非平面标志(例如,intra_luma_not_planar_flag)。例如,可以首先用信号通知mpm标志,并且当mpm标志的值为1时,可以用信号通知mpm索引和非平面标志。另外,当非平面标志的值为1时,可以用信号通知mpm索引。这里,将mpm列表配置为不包括平面模式作为候选的事实不在于平面模式不是mpm,而是平面模式始终被视为mpm,因此首先用信号通知非平面标志,以确定平面模式是否为平面模式,以首先检查。
例如,可以基于mpm标志(例如,intra_luma_mpm_flag)来指示应用于当前块的帧内预测模式是在mpm候选(和平面模式)之中还是剩余模式之中。mpm标志的值为1可以指示当前块的帧内预测模式在mpm候选(和平面模式)内,mpm标志的值为0可以指示当前块的帧内预测模式不在mpm候选(和平面模式)内。非平面标志(例如intra_luma_not_planar_flag)的值为0可以指示当前块的帧内预测模式是平面模式,非平面标志的值为1可以指示当前块的帧内预测模式不是平面模式。可以按mpm_idx或intra_luma_mpm_idx元素的形式用信号通知mpm索引,并且可以按rem_intra_luma_pred_mode或intra_luma_mpm_remainder语法元素的形式用信号通知剩余帧内预测模式信息。例如,剩余帧内预测模式信息可以通过按照预测模式编号的顺序对未包括在mpm候选(和平面模式)中的剩余帧内预测模式进行索引来指示所有帧内预测模式之一。帧内预测模式可以是亮度分量(样本)的帧内预测模式。在下文中,帧内预测模式信息可以包括mpm标志(例如,intra_luma_mpm_flag)、非平面标志(例如,intra_luma_not_planar_flag)、mpm索引(例如,mpm_idx或intra_luma_mpm_idx)或剩余帧内预测模式信息(rem_intra_luma_luma_mpm_mode或intra_luma_mpminder)中的至少一个。在本文献中,mpm列表可以被称为诸如mpm候选列表、候选模式列表(candModeList)和候选帧内预测模式列表的各种术语。
同时,编译设备可以配置包括6个MPM列表候选的MPM列表。此时,可以考虑3种类型的模式。
- 默认帧内模式
- 邻近帧内模式
- 推导帧内模式
此时,对于邻近帧内模式,可以考虑两个邻近(或邻近)块,例如,左侧邻近块和上侧邻近块。
例如,无论是否应用多参考线(MRL)和帧内子分区(ISP)编译工具,统一的6-MPM列表可以被用于帧内块。另外,可以基于左侧邻近块和上侧邻近块来配置MPM列表。例如,当左侧块的模式被给出为左并且上侧块的模式被给出为上时,统一MPM列表可以被配置如下。换句话说,当左侧块的帧内预测模式被给出为左并且上侧块的帧内预测模式被给出为上时,统一MPM列表可以被配置如下。此处,V可以意指垂直帧内预测模式,并且H可以意指表示水平帧内预测模式。
- 当邻近块不可用时,相应的帧内模式基本被配置为平面模式。
- 当左和上都是非定向模式时:
- MPM列表可以被配置为{平面,DC,V,H,V-4,V+4}。
- 当左和上之一是定向模式并且另一个是非定向模式时:
- 在左与上之间,具有较高(或较大)模式编号的模式被配置为Mode Max。
- 此时,MPM列表可以被配置为{平面,Max,Max-1,Max+1,Max-2,Max+2}。
- 当左和上都是定向模式并且每个模式对应于不同的定向模式时:
- 在左和上之间,具有较高(或较大)模式编号的模式被配置为Mode Max。
- 在左和上之间,具有较低(或较小)模式编号的模式被配置为Mode Min。
- 当Max–Min值等于1时:
- MPM列表可以被配置为{平面,左,上,Min-1,Max+1,Min-2}。
- 否则,当Max–Min值大于或等于62时:
- MPM列表可以被配置为{平面,左,上,Min+1,Max-1,Min+2}。
- 否则,当Max–Min值等于2时:
- MPM列表可以被配置为{平面,左,上,Min+1,Min-1,Max+1}。
- 否则:
- MPM列表可以被配置为{平面,左,上,Min-1,Min+1,Max-1}。
- 当左和上都是定向模式并且每个模式对应于相同的定向模式时:
- MPM列表可以被配置为{平面,左,左-1,左+1,左-2,左+2}。
另外,MPM索引码字的第一bin可以是CABAC上下文编译的。取决于MPM索引码字是否启用MRL、MPM索引码字是否启用ISP、或MPM索引码字是否是通用帧内块,可以使用总共3个上下文。
此时,当MIP没有被应用于当前块时,可以使用上述MPM列表配置方法。例如,上述MPM列表配置方法可以被用于帧内预测模式推导,其在LIP、PDPC、MRL、ISP帧内预测或正常帧内预测中使用。同时,可以基于上述MIP对左侧邻近块或上侧邻近块进行编译。也就是说,当对左侧邻近块或上侧邻近块进行编译时,可以应用MIP。在这种情况下,对于未应用MIP的当前块,将具有对其应用MIP的邻近块(左侧邻近块/上侧邻近块)的相同MIP帧内预测模式编号用于MPM列表是不合适的。因此,在这种情况下,例如,具有对其应用MIP的邻近块(左侧邻近块/上侧邻近块)的帧内预测模式可以被视为DC或平面模式。可替选地,作为另一个示例,具有对其应用MIP的邻近块(左侧邻近块/上侧邻近块)的帧内预测模式可以基于映射表被映射到通用帧内预测模式,并且然后在MPM列表配置中使用。在这种情况下,可以基于当前块的块大小类型来执行映射。例如,映射表可以如下所述表示。
图10例示了可以应用本公开的实施方式的帧内预测模式的示例。
参照图10,可在具有左上对角预测方向的第34帧内预测模式左右区分具有水平方向的帧内预测模式和具有垂直方向的帧内预测模式。图8的H和V分别表示水平方向和垂直方向,数字-32至32表示样本网格位置上1/32单位的位移。帧内预测模式2至33具有水平定向性,帧内预测模式34至66具有垂直定向性。第18和第50帧内预测模式表分别示水平帧内预测模式和垂直帧内预测模式,而第2帧内预测模式被称为左下对角帧内预测模式,第34帧内预测模式可以被称为右上对角帧内预测模式,第66帧内预测模式可以被称为左上对角帧内预测模式。
在下文中,将描述作为帧内预测方法的基于模板的帧内模式推导(TIMD)模式。
例如,TIMD模式也可以称为基于模板的帧内模式推导模式、模板帧内模式推导模式等。
另外,例如,TIMD模式可以称为TIMD帧内模式。此外,TIMD模式可以称为TIMD帧内预测模式或TIMD预测模式。
此外,例如,帧内模式在本文档中可以称为帧内预测模式。另外,帧内模式和帧内预测模式可以互换使用。
图11示例性地图示用于推导用于TIMD模式的帧内预测模式的模板。
当使用TIMD模式时,解码器可以通过使用先前解码的邻近像素来推导当前CU的帧内模式。例如,可以基于当前块(或当前CU)的邻近模板的邻近参考样本来推导用于邻近模板的预测样本,可以将用于邻近模板的推导的预测样本与邻近模板的重构样本进行比较,并且然后,可以相应地推导当前块(或当前CU)的帧内模式。更具体地,在推导基于邻近模板的邻近参考样本推导的预测样本与邻近模板的重构样本之间的绝对变换差之和(SATD)之后,可以选择具有最小SATD的模式作为当前块的帧内模式。
例如,可以基于位于模板外部的邻近参考样本(即,模板的参考)来推导模板的预测样本。在推导模板的推导的预测样本与在重构过程中已经推导的模板的重构样本之间的SATD之后,可以选择具有最小SATD的模式作为当前块的帧内模式。因为模板是具有基于解码顺序已经完成的其重构的区域,所以可以使用上述方法。
另外,例如,对于MPM列表中的每个MPM候选,在获得模板的推导的预测样本与在重构过程中已经推导的模板的重构样本之间的SATD之后,可以选择具有最小SATD的模式作为当前块的帧内模式。
可替选地,在选择具有最小SATD的2个预测模式之后,可以使用加权和方法将用于2个预测模式的预测块混合,然后可以将其用作当前块的预测块。换言之,可以通过使用加权和方法混合具有最小SATD的预测模式和具有次最小SATD的预测模式,然后可以将其用作当前块的预测块。
同时,具有最小SATD成本的2个模式可以被用于利用要用作用于当前块的加权帧内预测的加权值(或权重)混合。当满足下面所示的式时,可以应用用于混合2个所选择的模式的方法。
[式1]
例如,当式1为真时,可以混合2个模式以生成预测块。并且,否则,可以仅选择具有最小SATD的一个模式。
另外,可以使用下面所示的式来计算当混合两个预测块时的加权值。
[式2]
在此,costMode 1可以是模式1的SATD成本,并且costMode 2可以是模式2的SATD成本。
在下文中,将描述作为帧内预测方法的解码器侧帧内模式推导(DIMD)模式。
例如,DIMD模式包括解码器侧帧内模式推导模式、解码器帧内模式推导模式、解码器侧帧内预测模式和解码器帧内模式预测模式(解码器帧内预测模式)。
另外,例如,DIMD模式可以被称为DIMD帧内模式。另外,DIMD模式可以被称为DIMD帧内预测模式或DIMD预测模式。
例如,可以在没有直接发送帧内预测模式信息的情况下通过从编码器和解码器推导帧内预测模式来使用DIMD模式。例如,可以从第二邻近列和行获得水平梯度和垂直梯度,并且可以从已获得的水平和垂直梯度获得梯度直方图(HoG)。
图12示例性地图示被用于推导用于DIMD模式的帧内预测模式的梯度直方图(HoG)配置方法。
例如,图12的(a)示例性地图示被用于推导用于DIMD模式的帧内预测模式的模板。另外,图12的(b)和图12的(c)图示被用于推导用于DIMD模式的帧内预测模式的HoG的配置方法。
例如,根据图12的(b),可以通过使用当前块的邻近3个像素的L形列和行应用sobel滤波器来获得HoG。例如,当块的边界存在于不同的CTU中时,当前块的邻近像素可以不被用于纹理分析。
同时,Sobel滤波器也可以被称为Sobel算子,并且是用于边缘检测的高效滤波器。当使用Sobel滤波器时,有两种类型的Sobel滤波器可用:用于垂直方向的Sobel滤波器和用于水平方向的Sobel滤波器。
图13示例性地图示用于通过应用DIMD模式配置预测块的方法。
例如,根据图13,可以选择具有最高直方图幅度的2个帧内模式,并且将通过使用这2个模式和平面模式预测的预测块混合使得配置最终预测块。换句话说,可以选择具有最高直方图幅度的帧内模式和具有第二高直方图幅度的帧内模式,并且将通过使用这2个选择的模式和平面模式预测的预测块混合使得配置最终预测块。在这时,可以从直方图的幅度中推导用于模式的加权值。另外,例如,能够以块为单位发送DIMD标志信息,从而能够验证能够使用或者不使用DIMD。此时,DIMD标志信息可以指示是否正在应用DIMD模式。
例如,可以通过使用下面所示的式来计算用于具有最高直方图幅度的帧内模式的加权值。
[式3]
另外,可以通过使用下面所示的式来计算用于具有第二高直方图幅度的帧内模式的加权值。
[式4]
此外,可以通过使用下面所示的式来计算用于平面模式的加权值。
[式5]
同时,为了执行有效的帧内模式编译方法,可以应用以下实施例。各实施例的项目可以被独立应用或组合应用。
根据实施例,本文提出了一种用于防止根据编译模式多次选择由DIMD推导的当前块的帧内模式的方法。例如,DIMD可以通过使用当前块的编译的邻近像素的信息推断像素的定向性,并且可以使用推断的定向性作为当前块的帧内模式。此时,可以根据邻近像素之间的梯度推导各种定向性,并且可以通过针对帧内模式的梯度直方图(HoG)对每个梯度分布进行排序,并且可以将通过HoG确定为最相似的N个方向信息映射到帧内模式并且然后使用。
例如,如果邻近像素的所有像素值都相同,则可能无法推导梯度。并且,因此,可以将当前块的预测模式选择为非定向性模式。
可替选地,例如,当邻近像素关系清楚地指示仅一种特定定向性时,可以推导一种方向信息。例如,在推导预测模式之后,当在配置DIMD预测块的过程中推导2个帧内预测模式(即,N=2)时,通过使用指示两个预测模式的梯度的幅度来计算加权值。此后,通过添加固定平面模式的加权值,可以通过3种模式类型的加权和来配置帧内预测块。
同时,当仅推导一种模式(即,N=1)时,不计算与平面预测块的加权和。换句话说,当仅推导1个DIMD模式时,可以不计算与平面模式的加权和。
另外,当不能够使用邻近像素时,或当不能够指定邻近块的定向性(即,N=0或非定向性块)时,可以配置默认模式。此时,默认模式可以是平面模式。
例如,当通过使用DIMD模式编译当前块时(即,具有DIMD标志等于1的块),可以推导上述帧内模式,并且取决于条件,计算预测块之间的加权和以便生成帧内预测块。可替选地,当通过使用DIMD模式未编译当前块时,可以使用通过DIMD过程推导的帧内模式作为当前块的预测模式候选。也就是说,推导的帧内模式可以被用作MPM候选,或者在当前块是TIMD模式时,可以使用推导的帧内模式作为当前块的预测模式候选的一部分。换句话说,当没有通过使用DIMD模式编译当前块时,通过DIMD过程推导的帧内模式可以被用作当前块的MPM候选,或者当推导TIMD模式时,可以被用作当前块的预测模式候选的一部分。
同时,在当前块未被选择为DIMD模式并且通过使用通用帧内模式进行编译时,邻近像素可能位于无法使用的块的坐标(画面、切片等的边界)处,或者当无法从邻近像素指定预测方向时,可以选择作为默认模式的平面模式。例如,根据MPM配置方法,平面模式可以始终被视为MPM候选的第一候选。在这种情况下,通过DIMD推导的平面模式始终被排除在MPM候选之外。换句话说,通过修剪过程,平面模式可以始终被排除在MPM候选之外。因此,本实施例提出将DIMD的默认模式指定为除了平面模式之外的另一种模式。
例如,DIMD的默认模式可以是DC模式。在DC模式的情况下,因为DC模式不总是属于MPM候选,所以DC模式不太可能通过多重选择来选择,并且当无法从邻近像素推断方向信息时,DC模式可能适合被视为非定向模式。另外,当DIMD的预测模式是平面方向时,即使当前块未被选择为DIMD模式,也可能出现MPM可能选择平面模式的情况。然而,通过使用所提出的方法,可以防止编译模式的低效多重选择。
可替选地,例如,DIMD的默认模式可以是水平预测模式或垂直预测模式。此时,通过将在帧内模式信息中统计上出现频率最高的预测模式指定为默认模式,可能能够实现更高效的模式编译。可替选地,DIMD的默认模式可以是定向预测模式之一。
同时,当由于当前块的邻近像素的梯度分布而仅推导一种定向模式时,可以不计算相应预测模式与另一预测模式(例如,平面模式等)的加权和。另外,当未通过使用DIMD模式编译当前块时,当配置MPM时,DIMD预测模式可以被视为一些MPM候选。此时,当DIMD预测模式被输入在MPM中并选择为最终预测模式时,这可能具有与选择相同预测模式并通过仅变化模式(DIMD模式或MPM模式)来执行编译相同的效果。因此,当执行帧内预测以便于防止发生编译模式的低效多重选择,可以应用以下实施例。
根据实施例,本文提出了一种计算与平面模式的加权和的方法,即便DIMD预测模式被推导为一种定向预测模式。
例如,可以通过将2/3用于DIMD预测模式并且将1/3用于平面模式来计算加权和。可替选地,当加权值的总和被缩放到64时,DIMD预测模式可以具有加权值为43,并且平面模式可以具有加权值为21。通过执行上述方法,当模式不是DIMD时,DIMD模式的预测块和在MPM中被预测为DIMD预测模式的预测块可以彼此不同。因此,可以防止编译模式的低效多重选择。换句话说,当DIMD预测模式被推导为一个定向预测模式时,可以计算DIMD预测模式和平面模式的加权和。因此,当模式不是DIMD时,DIMD模式的预测块和在MPM中被预测为DIMD预测模式的预测块可以彼此不同。因此,通过防止预测块相同,可以执行高效的帧内预测。
另外,根据实施例,当DIMD预测模式被推导为一个定向预测模式,并且当前块不是DIMD模式时,本文提出了一种在配置诸如MPM、TIMD等的候选的过程中不输入DIMD预测模式作为候选模式的方法。也就是说,当DIMD预测模式被推导为一个定向预测模式时,并且当未通过使用DIMD模式编译当前块时,本文提出了一种在配置诸如MPM、TIMD等的候选的过程中不输入DIMD预测模式作为候选模式的方法。
例如,当DIMD预测模式被推导为一个定向预测模式时,并且当前块不是DIMD模式时,在配置MPM候选的过程中可以不考虑一个定向预测模式。另外,当DIMD预测模式被推导为一个定向预测模式时,并且当前块不是DIMD模式时,在推导TIMD模式的过程中可以不考虑这一个定向预测模式。因此,即使当前块不是DIMD模式,因为在配置MPM候选或推导TIMD模式时将不会考虑DIMD预测模式,所以可以防止编译模式的低效多重选择。
另外,根据实施例,当DIMD预测模式被推导为一个定向预测模式时,并且当前块不是DIMD模式时,本文提出了一种不将DIMD预测模式指定为当前块的预测模式的方法。也就是说,当DIMD预测模式被推导为一个定向预测模式,并且当未通过使用DIMD模式编译当前块时,本文提出了一种不将DIMD预测模式指定为当前块的预测模式的方法。
例如,不仅DIMD预测模式不被视为MPM候选或TIMD候选,而且DIMD预测模式也不包括在剩余模式中。因此,可以完全防止相同模式的多种编译方法。换句话说,当DIMD预测模式被推导为一个定向预测模式并且当前块不是DIMD模式时,DIMD预测模式也可以不包括在剩余模式中。因此,在当前块不是DIMD模式并且DIMD预测模式被推导为一个定向预测模式时,因为不能选择DIMD预测模式作为当前块的预测模式,所以可以防止编译模式的低效多重选择。
图14和图15示意性地图示根据本公开的实施例的视频/图像编码方法和相关组件的示例。
图14中公开的方法可以由图2或图15中公开的编码设备执行。更具体地说,例如,图14的S1400至S1430可以由编码设备的预测器220执行,并且S1440可以由编码设备的熵编码器240执行。另外,虽然图14中未图示,但是基于用于当前块的预测样本生成残差样本并且基于残差样本生成残差信息的过程可以由编码设备的残差处理器230执行,并且从残差信息或预测相关信息生成比特流的过程可以由编码设备的熵编码器240执行。图14中公开的方法可以包括在本公开中上述的实施例。
参考图14,编码设备推导用于当前块的解码器侧帧内模式推导(DIMD)模式(S1400)。例如,编码设备可以根据上述实施例推导用于当前块的DIMD模式。
编码设备确定用于当前块的帧内预测模式(S1410)。例如,编码设备可以根据上述实施例来确定用于当前块的帧内预测模式。
例如,可以基于DIMD模式是否应用于当前块来确定用于当前块的帧内预测模式。
基于DIMD模式不被应用于当前块,DIMD模式的默认模式可以是DC模式、水平预测模式或垂直预测模式以及定向预测模式之一。
例如,基于DIMD模式被推导为一个定向帧内模式并且DIMD模式被应用于当前块,可以基于根据一个定向帧内模式和平面模式执行加权平均计算来推导预测模式,并且可以基于预测模式来确定用于当前块的帧内预测模式。此时,可以基于预测模式确定用于当前块的帧内预测模式。另外,用于一个定向帧内模式的加权值可以是2/3,并且平面模式的加权值可以是1/3,并且可以使用各种加权值执行加权平均计算。
另外,编码设备可以配置包括用于当前块的帧内预测模式候选的最可能模式(MPM)列表。
例如,基于DIMD模式被推导为一个定向帧内模式并且DIMD模式未被应用于当前块,可以基于根据一个定向帧内模式和平面模式执行加权平均计算来推导预测模式。此时,预测模式可以被包括在MPM列表中,并且可以基于MPM列表来确定用于当前块的帧内预测模式。
另一方面,基于DIMD模式被推导为一个定向帧内模式并且DIMD模式未被应用于当前块,所述一个定向帧内模式可以不被包括在MPM列表中。这时,可以基于MPM列表来确定用于当前块的帧内预测模式。
例如,基于DIMD模式被推导为一个定向帧内模式并且DIMD模式未被应用于当前块,所述一个定向帧内模式可以不被包括在MPM列表中。在这种情况下,图像信息可以包括剩余模式信息、排除MPM列表中包括的帧内预测模式候选的剩余帧内预测模式,以及可以基于剩余模式信息推导一个定向帧内模式,并且基于剩余帧内预测模式来确定用于当前块的帧内预测模式。也就是说,当DIMD模式被推导为一个定向帧内模式并且DIMD模式未被应用于当前块时,DIMD模式可以不被包括在MPM列表中并且也可以不被包括在剩余模式中。
另外,编码设备可以推导用于当前块的TIMD模式。
例如,基于DIMD模式被推导为一个定向帧内模式并且DIMD模式不应用于当前块,可以基于排除所述一个定向帧内模式之外的帧内预测模式推导TIMD模式。此时,可以基于TIMD模式确定用于当前块的帧内预测模式。
编码设备可以基于用于当前块的帧内预测模式生成用于当前块的预测样本(S1420)。例如,根据上述实施例,可以基于用于当前块的帧内预测模式生成用于当前块的预测样本。
编码设备可以基于用于当前块的预测样本生成预测相关信息(S1430)。例如,根据上述实施例,可以基于用于当前块的预测样本生成预测相关信息。
编码设备可以对包括预测相关信息的图像信息进行编码(S1440)。例如,根据上述实施例,可以对包括预测相关信息的图像信息进行编码。
另外,例如,编码设备可以基于根据上述实施例确定的帧内预测模式生成用于当前块的预测样本,并且编码设备可以基于用于当前块的预测样本推导用于当前块的残差样本。另外,编码设备可以基于残差样本生成残差信息。此外,编码设备可以根据上述实施例对包括用于当前块的剩余模式信息和残差信息的图像信息进行编码。
图16和图17示意性地图示根据本公开的实施例的视频/图像解码方法和相关组件的示例。
图16中公开的方法可以由图3或图17中公开的解码设备执行。更具体地说,例如,S1600可以由解码设备的熵解码器310执行,S1610至S1630可以由解码设备的预测器330执行,并且S1640可以由解码设备的加法器340执行。另外,虽然图16中未图示,但是生成残差样本的过程可以由解码设备的残差处理器320执行,并且基于预测样本和残差样本生成重构样本的过程可以由解码设备的加法器执行。另外,图16中公开的方法可以包括本公开中上述的实施例。
参考图16,解码设备获得包括图像信息的比特流(S1600)。例如,解码设备可以根据上述实施例获得包括图像信息的比特流。
解码设备推导用于当前块的解码器侧帧内模式推导(DIMD)模式(S1610)。例如,解码设备可以根据上述实施例推导用于当前块的DIMD模式。
解码设备推导用于当前块的帧内预测模式(S1620)。例如,解码设备可以根据上述实施例推导用于当前块的帧内预测模式。
例如,可以基于DIMD模式是否应用于当前块来推导用于当前块的帧内预测模式。
基于DIMD模式不应用于当前块,DIMD模式的默认模式可以是DC模式、水平预测模式或垂直预测模式、以及定向预测模式之一。
例如,基于将DIMD模式推导为一个定向帧内模式并且将DIMD模式应用于当前块,可以基于根据所述一个定向帧内模式和平面模式执行加权平均计算来推导预测模式,并且可以基于预测模式推导用于当前块的帧内预测模式。此时,可以基于预测模式推导用于当前块的帧内预测模式。另外,一个定向帧内模式的加权值可以是2/3,并且平面模式的加权值可以是1/3,并且可以使用各种加权值执行加权平均计算。
另外,解码设备可以配置包括用于当前块的帧内预测模式候选的最可能模式(MPM)列表。
例如,基于DIMD模式被推导为一个定向帧内模式并且DIMD模式不应用于当前块,可以基于根据所述一个定向帧内模式和平面模式执行加权平均计算来推导预测模式。此时,预测模式可以包括在MPM列表中,并且可以基于MPM列表推导用于当前块的帧内预测模式。
另一方面,基于DIMD模式被推导为一个定向帧内模式并且DIMD模式不应用于当前块,所述一个定向帧内模式可以不被包括在MPM列表中。此时,可以基于MPM列表推导用于当前块的帧内预测模式。
另外,例如,基于DIMD模式被推导为一个定向帧内模式并且DIMD模式不应用于当前块,所述一个定向帧内模式可以不被包括在MPM列表中。在这种情况下,图像信息可以包括剩余模式信息,并且可以基于剩余模式信息推导排除MPM列表中包括的帧内预测模式候选和所述一个定向帧内模式之外的剩余帧内预测模式,并且可以基于剩余帧内预测模式推导用于当前块的帧内预测模式。也就是说,当DIMD模式被推导为一个定向帧内模式并且DIMD模式不应用于当前块时,DIMD模式可以不被包括在MPM列表中,并且也可以不被包括在剩余模式中。
]另外,解码设备可以推导用于当前块的TIMD模式。
例如,基于DIMD模式被推导为一个定向帧内模式并且DIMD模式不应用于当前块,可以基于排除所述一个定向帧内模式之外的帧内预测模式推导TIMD模式。此时,可以基于TIMD模式推导用于当前块的帧内预测模式。
解码设备可以基于用于当前块的帧内预测模式生成用于当前块的预测样本(S1630)。例如,根据上述实施例,解码设备可以基于用于当前块的帧内预测模式生成用于当前块的预测样本。
解码设备可以基于用于当前块的预测样本生成用于当前块的重构样本(S1640)。例如,根据上述实施例,解码设备可以基于用于当前块的预测样本生成用于当前块的重构样本。
例如,解码设备可以基于当前块的预测样本和残差样本生成当前块的重构样本。此时,残差样本可以基于残差相关信息被推导,并且残差相关信息可以包括通过比特流用信号发送的图像信息,并且可以从图像信息推导残差相关信息。
根据上述的本公开,在当前块未应用DIMD模式时,通过排除平面模式来配置DIMD模式的默认模式,当配置用于帧内预测的MPM候选时,可以使用各种候选预测模式。因此,可以执行有效的帧内预测。
另外,根据本公开的另一实施例,当将DIMD模式推导为一种定向预测模式时,可以使用与平面模式的加权平均值来推导预测模式。因此,通过在配置用于帧内预测的MPM候选时使用各种候选预测模式,可以执行有效的帧内预测。
另外,根据本发明的另一实施例,当将DIMD模式推导为一种定向预测模式时,并且当DIMD模式未被应用于当前块时,通过不将DIMD模式视为MPM候选、或TIMD模式候选、或剩余模式候选,可以更有效地执行帧内预测,并且可以增强预测的准确性。
在当前块的残差样本存在时,解码设备可以接收关于当前块的残差的信息。关于残差的信息可以包括关于残差样本的变换系数。解码设备可以基于残差信息来推导当前块的残差样本(或残差样本阵列)。具体地,解码设备可以基于残差信息来推导量化变换系数。量化变换系数可以具有基于系数扫描顺序的一维向量形式。解码设备可以基于对量化变换系数的解量化处理来推导变换系数。解码设备可以基于变换系数来推导残差样本。
解码设备可以基于(帧内)预测样本和残差样本来生成重构样本,并且可以基于重构样本来推导重构块或重构画面。具体地,解码设备可以基于(帧内)预测样本和残差样本之和来生成重构样本。如上所述,如果需要,解码设备然后可以对重构画面应用诸如解块滤波和/或SAO处理的环路内滤波处理,以便改进主观/客观画面质量。
例如,解码设备可以对比特流或编码的信息进行解码,以获得包括所有或一些上述信息(或语法元素)的图像信息。另外,比特流或编码的信息可以存储在计算机可读存储介质中,并且可以导致执行上述解码方法。
在上述实施方式中,基于具有一系列步骤或方框的流程图描述了方法。本公开不限于以上步骤或方框的顺序。一些步骤或方框能够以与上述的其他步骤或方框不同的顺序执行或同时执行。此外,本领域技术人员将理解,流程图中所示的步骤不是排它的,并且可以还包括其他步骤,或者可以在不影响本公开的范围的情况下删除流程图中的一个或更多个步骤。
根据本文献的实施方式的上述方法可以按软件的形式实现,并且根据本文献的编码设备和/或解码设备可以包括在例如执行处理的TV、计算机、智能电话、机顶盒、显示装置等中。
当本文献中的实施方式被实现为软件时,上述方法可以被实现为执行上述功能的模块(进程、函数等)。模块可存储在存储器中并由处理器执行。存储器可以在处理器的内部或外部,并且可以按各种熟知手段与处理器联接。处理器可以包括专用集成电路(ASIC)、其他芯片组、逻辑电路和/或数据处理装置。存储器可以包括只读存储器(ROM)、随机存取存储器(RAM)、闪存、存储卡、存储介质和/或其他存储装置。即,本文献中所描述的实施方式可以在处理器、微处理器、控制器或芯片上实现和执行。例如,每幅图中所示的功能单元可以在计算机、处理器、微处理器、控制器或芯片上实现和执行。在这种情况下,用于实现的信息(例如,关于指令的信息)或算法可以存储在数字存储介质中。
另外,应用本公开的解码设备和编码设备可以被包括在如下设备中:多媒体广播发送/接收设备、移动通信终端、家庭影院视频设备、数字影院视频设备、监控相机、视频聊天设备、诸如视频通信的实时通信设备、移动流设备、存储介质、便携式摄像机、VOD服务提供设备、过顶(OTT)视频设备、互联网流服务提供设备、三维(3D)视频设备、虚拟现实(VR)设备、增强现实(AR)设备、电话会议视频设备、运输用户设备(例如,车辆(包括自主车辆)用户设备、飞机用户设备和轮船用户设备)和医疗视频装置;并且应用本公开的解码设备和编码设备可以用于处理视频信号或数据信号。例如,过顶(OTT)视频设备可以包括游戏机、蓝光播放器、互联网接入电视机、家庭影院系统、智能电话、平板计算机、数字视频记录仪(DVR)等。
另外,应用本公开的实施方式的处理方法能够以计算机执行的程序的形式产生,并且可以存储在计算机可读记录介质中。根据本公开的实施方式的具有数据结构的多媒体数据也可以存储在计算机可读记录介质中。计算机可读记录介质包括其中存储计算机可读数据的所有类型的存储装置。计算机可读记录介质可以包括例如BD、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。另外,计算机可读记录介质包括以载波(例如,经由互联网的传输)的形式实现的介质。另外,由编码方法生成的比特流可以存储在计算机可读记录介质中或通过有线/无线通信网络来传输。
另外,本公开的实施方式可以根据程序代码利用计算机程序产品来实现,并且程序代码可以通过本公开的实施方式在计算机中执行。程序代码可以存储在计算机可读载体上。
图18图示可以应用在本公开中公开的实施例的内容流传输系统的示例。
参照图18,应用本公开的实施例的内容流传输系统可以广泛地包括编码服务器、流服务器、网络服务器、媒体储存器、用户设备和多媒体输入设备。
编码服务器将从诸如智能手机、相机或便携式摄像机等的多媒体输入装置输入的内容压缩为数字数据,以生成比特流并将比特流发送到流服务器。作为另一示例,当诸如智能手机、相机或便携式摄像机等的多媒体输入装置直接生成比特流时,可以省略编码服务器。
可以通过应用了本公开的实施方式的编码方法或比特流生成方法来生成比特流,并且流服务器可以在发送或接收比特流的过程中临时存储比特流。
流服务器基于用户请求通过网络服务器向用户装置发送多媒体数据,并且网络服务器用作向用户通知服务的媒介。当用户从网络服务器请求所需的服务时,网络服务器向流服务器传送该请求,并且流服务器向用户发送多媒体数据。在这种情况下,内容流系统可以包括单独的控制服务器。在这种情况下,控制服务器用于控制内容流系统内的装置之间的命令/响应。
流服务器可以从媒体储存器和/或编码服务器接收内容。例如,当从编码服务器接收内容时,可以实时接收内容。在这种情况下,为了提供平稳的流服务,流服务器可以将比特流存储达预定时间。
用户装置的示例可以包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航仪、触屏PC、平板PC、超级本、可穿戴装置(例如,智能手表、智能眼镜和头戴式显示器)、数字TV、台式计算机和数字标牌等。
内容流系统内的每个服务器可以作为分布式服务器来操作,在这种情况下,从每个服务器接收的数据可以被分布。
本公开中描述的权利要求能够以各种方式组合。例如,可以组合本公开的方法权利要求的技术特征以实现为设备,并且可以组合本公开的设备权利要求的技术特征以实现为方法。此外,可以组合本公开的方法权利要求的技术特征和设备权利要求的技术特征以实现为设备,并且可以组合本公开的方法权利要求的技术特征和设备权利要求的技术特征以实现为方法。

Claims (18)

1.一种由解码设备执行的图像解码方法,所述图像解码方法包括:
获得包括图像信息的比特流;
推导用于当前块的解码器侧帧内模式推导(DIMD)模式;
推导用于所述当前块的帧内预测模式;
基于用于所述当前块的所述帧内预测模式生成用于所述当前块的预测样本;以及
基于用于所述当前块的所述预测样本生成用于所述当前块的重构样本,
其中,基于是否将所述DIMD模式应用于所述当前块来推导用于所述当前块的所述帧内预测模式。
2.根据权利要求1所述的图像解码方法,其中,基于将所述DIMD模式推导为一个定向帧内模式并且将所述DIMD模式应用于所述当前块,基于根据所述一个定向帧内模式和平面模式执行加权平均来推导预测模式,以及
其中,基于所述预测模式推导用于所述当前块的所述帧内预测模式。
3.根据权利要求2所述的图像解码方法,其中,用于所述一个定向帧内模式的加权因子等于2/3,并且用于所述平面模式的加权因子等于1/3。
4.根据权利要求1所述的图像解码方法,进一步包括:
配置包括用于所述当前块的帧内预测模式候选的最可能模式(MPM)列表,
其中,基于所述DIMD模式被推导为一个定向帧内模式并且所述DIMD模式未被应用于所述当前块,基于根据所述一个定向帧内模式和平面模式执行加权平均来推导预测模式,
其中,所述预测模式被包括在所述MPM列表中,以及
其中,基于所述MPM列表推导用于所述当前块的所述帧内预测模式。
5.根据权利要求1所述的图像解码方法,进一步包括:
配置包括用于所述当前块的帧内预测模式候选的最可能模式(MPM)列表,
其中,基于所述DIMD模式被推导为一个定向帧内模式并且所述DIMD模式未被应用于所述当前块,所述一个定向帧内模式不被包括在所述MPM列表中,以及
其中,基于所述MPM列表推导用于所述当前块的所述帧内预测模式。
6.根据权利要求1所述的图像解码方法,进一步包括:
推导用于所述当前块的基于模板的帧内模式推导(TIMD)模式,
其中,基于所述DIMD模式被推导为一个定向帧内模式并且所述DIMD模式未被应用于所述当前块,基于排除所述一个定向帧内模式的帧内预测模式推导所述TIMD模式,以及
其中,基于所述TIMD模式推导用于所述当前块的所述帧内预测模式。
7.根据权利要求5所述的图像解码方法,其中,所述图像信息包括剩余模式信息,
其中,基于所述剩余模式信息推导排除所述MPM列表中包括的所述帧内预测模式候选和所述一个定向帧内模式的剩余帧内预测模式,以及
其中,基于所述剩余帧内预测模式推导用于所述当前块的所述帧内预测模式。
8.根据权利要求1所述的图像解码方法,其中,基于所述DIMD模式未被应用于所述当前块,所述DIMD模式的默认模式是DC模式、水平预测模式或垂直预测模式、和定向预测模式之一。
9.一种由编码设备执行的图像编码方法,所述图像编码方法包括:
推导用于当前块的解码器侧帧内模式推导(DIMD)模式;
确定用于所述当前块的帧内预测模式;
基于用于所述当前块的所述帧内预测模式生成用于所述当前块的预测样本;
基于用于所述当前块的所述预测样本生成预测相关信息;以及
对包括所述预测相关信息的图像信息进行编码,
其中,基于所述DIMD模式是否应用于所述当前块来确定用于所述当前块的所述帧内预测模式。
10.根据权利要求9所述的图像编码方法,其中,基于将所述DIMD模式推导为一个定向帧内模式并且将所述DIMD模式应用于所述当前块,基于根据所述一个定向帧内模式和平面模式执行加权平均来推导预测模式,以及
其中,基于所述预测模式确定用于所述当前块的所述帧内预测模式。
11.根据权利要求10所述的图像编码方法,其中,用于所述一个定向帧内模式的加权因子等于2/3,并且用于所述平面模式的加权因子等于1/3。
12.根据权利要求9所述的图像解码方法,进一步包括:
配置包括用于所述当前块的帧内预测模式候选的最可能模式(MPM)列表,
其中,基于所述DIMD模式被推导为一个定向帧内模式并且所述DIMD模式未被应用于所述当前块,基于根据所述一个定向帧内模式和平面模式执行加权平均来推导预测模式,
其中,所述预测模式被包括在所述MPM列表中,以及
其中,基于所述MPM列表来确定用于所述当前块的所述帧内预测模式。
13.根据权利要求9所述的图像编码方法,进一步包括:
配置包括用于所述当前块的帧内预测模式候选的最可能模式(MPM)列表,
其中,基于所述DIMD模式被推导为一个定向帧内模式并且所述DIMD模式未被应用于所述当前块,所述一个定向帧内模式不被包括在所述MPM列表中,以及
其中,基于所述MPM列表确定用于所述当前块的所述帧内预测模式。
14.根据权利要求9所述的图像编码方法,进一步包括:
推导用于所述当前块的基于模板的帧内模式推导(TIMD)模式,
其中,基于所述DIMD模式被推导为一个定向帧内模式并且所述DIMD模式未被应用于所述当前块,基于排除所述一个定向帧内模式的帧内预测模式推导所述TIMD模式,以及
其中,基于所述TIMD模式确定用于所述当前块的所述帧内预测模式。
15.根据权利要求13所述的图像编码方法,其中,所述图像信息包括剩余模式信息,
其中,基于所述剩余模式信息来推导排除所述MPM列表中包括的所述帧内预测模式候选和所述一个定向帧内模式的剩余帧内预测模式,以及
其中,基于所述剩余帧内预测模式确定用于所述当前块的所述帧内预测模式。
16.根据权利要求9所述的图像编码方法,其中,基于所述DIMD模式未被应用于所述当前块,所述DIMD模式的默认模式是DC模式、水平预测模式或垂直预测模式、和定向预测模式之一。
17.一种计算机可读存储介质,所述计算机可读存储介质存储由根据权利要求9所述的图像编码方法生成的比特流。
18.一种用于图像的数据的传输方法,所述传输方法包括:
获得比特流,其中所述比特流基于下述被生成:推导用于当前块的解码器侧帧内模式推导(DIMD)模式、确定用于所述当前块的帧内预测模式、基于用于所述当前块的所述帧内预测模式生成用于所述当前块的预测样本、基于用于所述当前块的所述预测样本生成预测相关信息、以及对包括所述预测相关信息的图像信息进行编码;以及
发送包括所述比特流的所述数据,
其中,基于是否将所述DIMD模式应用于所述当前块来确定用于所述当前块的所述帧内预测模式。
CN202280090460.0A 2021-12-30 2022-12-30 基于帧内预测模式推导的帧内预测方法和装置 Pending CN118575475A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163295508P 2021-12-30 2021-12-30
US63/295,508 2021-12-30
PCT/KR2022/021733 WO2023128703A1 (ko) 2021-12-30 2022-12-30 인트라 예측 모드 도출 기반 인트라 예측 방법 및 장치

Publications (1)

Publication Number Publication Date
CN118575475A true CN118575475A (zh) 2024-08-30

Family

ID=86999736

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280090460.0A Pending CN118575475A (zh) 2021-12-30 2022-12-30 基于帧内预测模式推导的帧内预测方法和装置

Country Status (6)

Country Link
US (1) US20250184481A1 (zh)
EP (1) EP4459990A4 (zh)
JP (1) JP2025501235A (zh)
KR (1) KR20240131341A (zh)
CN (1) CN118575475A (zh)
WO (1) WO2023128703A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024074754A1 (en) * 2022-10-07 2024-04-11 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
WO2025116665A1 (ko) * 2023-11-30 2025-06-05 엘지전자 주식회사 영상 인코딩/디코딩 방법 및 장치, 그리고 비트스트림을 저장한 기록 매체
WO2025116668A1 (ko) * 2023-11-30 2025-06-05 엘지전자 주식회사 영상 인코딩/디코딩 방법 및 장치, 그리고 비트스트림을 저장한 기록 매체
WO2026059370A1 (ko) * 2024-09-12 2026-03-19 엘지전자 주식회사 영상 정보를 디코딩하는 방법, 영상 정보를 인코딩하는 방법 및 비트스트림에 관한 방법

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017192995A1 (en) * 2016-05-06 2017-11-09 Vid Scale, Inc. Method and system for decoder-side intra mode derivation for block-based video coding
WO2018070790A1 (ko) * 2016-10-14 2018-04-19 세종대학교 산학협력단 영상의 부호화/복호화 방법 및 장치
KR102670040B1 (ko) * 2017-01-16 2024-05-28 세종대학교산학협력단 영상 신호 부호화/복호화 방법 및 장치
WO2019007490A1 (en) * 2017-07-04 2019-01-10 Huawei Technologies Co., Ltd. DECODER INTEGRATED MODE (DIMD) INTEGRATED DEVICE TOOL CALCULATION COMPLEXITY REDUCTION
CN118055232A (zh) * 2018-09-06 2024-05-17 Lg 电子株式会社 使用mpm列表的基于帧内预测的图像编码方法及其装置
KR102822624B1 (ko) * 2018-10-05 2025-06-18 엘지전자 주식회사 Mpm 리스트를 사용하는 인트라 예측 기반 영상 코딩 방법 및 그 장치
WO2020197202A1 (ko) * 2019-03-26 2020-10-01 엘지전자 주식회사 Mpm 리스트에 기반한 인트라 예측 방법 및 그 장치
US11197001B2 (en) * 2020-02-05 2021-12-07 Tencent America LLC Method and apparatus for interactions between decoder-side intra mode derivation and adaptive intra prediction modes
WO2022260339A1 (ko) * 2021-06-08 2022-12-15 현대자동차주식회사 비디오 부호화/복호화 방법 및 장치
WO2022260341A1 (ko) * 2021-06-11 2022-12-15 현대자동차주식회사 비디오 부호화/복호화 방법 및 장치
US12506881B2 (en) * 2021-06-28 2025-12-23 Wilus Institute Of Standards And Technology Inc. Video signal processing method using intra prediction and device therefor
WO2025002781A1 (en) * 2023-06-30 2025-01-02 Interdigital Ce Patent Holdings, Sas Generalized intra prediction fusion
KR20260037124A (ko) * 2023-07-10 2026-03-17 오피노 엘엘씨 방향성 샘플별 융합을 이용한 템플릿 기반 인트라 모드 도출

Also Published As

Publication number Publication date
EP4459990A4 (en) 2025-11-05
JP2025501235A (ja) 2025-01-17
EP4459990A1 (en) 2024-11-06
US20250184481A1 (en) 2025-06-05
WO2023128703A1 (ko) 2023-07-06
KR20240131341A (ko) 2024-08-30

Similar Documents

Publication Publication Date Title
JP7791257B2 (ja) フィルタリングに基づく画像コーディング装置及び方法
JP7713569B2 (ja) ループフィルタリングを制御する画像コーディング装置及び方法
EP4459990A1 (en) Intra-prediction method and device based on intra-prediction mode derivation
KR20220041898A (ko) 적응적 루프 필터링 기반 영상 코딩 장치 및 방법
KR102870757B1 (ko) 필터링을 위한 정보의 시그널링 기반 영상 코딩 장치 및 방법
JP7817352B2 (ja) サブピクチャに基づく映像コーディング装置及び方法
US12587656B2 (en) Intra prediction mode derivation-based intra prediction method and device
CN118202648A (zh) 基于ciip的预测方法和设备
US20250063180A1 (en) Method and device for coding intra prediction mode
US20240364862A1 (en) Intra prediction method and device using secondary mpm list
US12581067B2 (en) Intra prediction method and device using MPM list
US12621441B2 (en) Method and apparatus for coding intra prediction mode
EP4422174A1 (en) Method and apparatus for coding intra prediction mode

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination