KR20170039176A

KR20170039176A - 팔레트 모드 인코딩 및 디코딩 설계

Info

Publication number: KR20170039176A
Application number: KR1020177003047A
Authority: KR
Inventors: 라잔 랙스맨 조쉬; 웨이 푸; 바딤 세레긴; 로할스 호엘 솔레; 마르타 카르체비츠
Original assignee: 퀄컴 인코포레이티드
Priority date: 2014-08-04
Filing date: 2015-08-04
Publication date: 2017-04-10
Anticipated expiration: 2035-08-04
Also published as: JP2017527193A; US20200267390A1; TWI718101B; JP6571162B2; AU2015301222B2; KR102338145B1; US20160037164A1; US11785222B2; TW201615012A; EP3178226B1; WO2016022537A1; BR112017002138A2; ES2874552T3; EP3843397A1; AU2015301222A1; CN106537916A; US10687064B2; CN106537916B; EP3178226A1

Abstract

일 예에서, 비디오 데이터를 프로세싱하는 방법이 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트를 수신하는 일 없이 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 유추하는 단계를 포함할 수도 있다. 그 방법은 유추된 화소 스캔 순서를 사용하여 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록을 디코딩하는 단계를 포함할 수도 있다. 그 방법은 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트를 수신하는 단계를 포함할 수도 있다. 그 방법은 수신된 블록 레벨 신택스 엘리먼트에 기초하여 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 결정하는 단계를 포함할 수도 있다. 그 방법은 결정된 화소 스캔 순서를 사용하여 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록을 디코딩하는 단계를 포함할 수도 있다.

Description

팔레트 모드 인코딩 및 디코딩 설계{PALETTE MODE ENCODING AND DECODING DESIGN}

관련 출원들

본 출원은 2014년 8월 4일자로 출원된 미국 가출원 제62/033,067호, 2014년 8월 29일자로 출원된 미국 가출원 제62/044,088호, 및 2014년 10월 10일자로 출원된 미국 가출원 제62/062,674호를 우선권 주장하며, 그것들의 각각은 그 전부가 참조로 포함된다.

기술분야

본 개시물은 비디오 인코딩 및 디코딩에 관한 것이다.

디지털 비디오 능력들은 디지털 텔레비전들, 디지털 직접 브로드캐스트 시스템들, 무선 브로드캐스트 시스템들, 개인 정보 단말기들 (personal digital assistants, PDA들), 랩톱 또는 데스크톱 컴퓨터들, 태블릿 컴퓨터들, e-북 리더들, 디지털 카메라들, 디지털 레코딩 디바이스들, 디지털 미디어 플레이어들, 비디오 게이밍 디바이스들, 비디오 게임 콘솔들, 셀룰러 또는 위성 무선 전화기들, 이른바 "스마트 폰들", 비디오 원격회의 디바이스들, 비디오 스트리밍 디바이스들 등을 포함한 넓은 범위의 디바이스들에 통합될 수 있다. 디지털 비디오 디바이스들은 MPEG-2, MPEG-4, ITU-T H.263, ITU-T H.264/MPEG-4, 파트 10, 고급 비디오 코딩 (Advanced Video Coding, AVC) 에 의해 규정된 표준들, 현재 개발중인 고 효율 비디오 코딩 (High Efficiency Video Coding, HEVC) 표준, 및 이러한 표준들의 확장본들에 기재된 것들과 같은 비디오 압축 기법들을 구현한다. 비디오 디바이스들은 이러한 비디오 압축 기법들을 구현하는 것에 의해 디지털 비디오 정보를 더 효율적으로 송신, 수신, 인코딩, 디코딩, 및/또는 저장할 수도 있다.

비디오 압축 기법들은 공간적 (픽처 내) 예측 및/또는 시간적 (픽처 간) 예측을 수행하여 비디오 시퀀스들에 내재하는 리던던시를 감소시키거나 또는 제거한다. 블록 기반 비디오 코딩의 경우, 비디오 슬라이스 (즉, 비디오 프레임 또는 비디오 프레임의 부분) 가 비디오 블록들로 구획화될 수도 있다. 픽처의 인트라 코딩식 (intra-coded; I) 슬라이스에서의 비디오 블록들은 동일한 픽처의 이웃 블록들에서의 참조 샘플들에 관한 공간적 예측을 이용하여 인코딩된다. 픽처의 인터 코딩식 (inter-coded; P 또는 B) 슬라이스에서의 비디오 블록들은 동일한 픽처의 이웃 블록들에서의 참조 샘플들에 관한 공간적 예측 또는 다른 참조 픽처들에서의 참조 샘플들에 관한 시간적 예측을 이용할 수도 있다. 픽처들은 프레임들이라고 지칭될 수도 있고, 참조 픽처들은 참조 프레임들이라고 지칭될 수도 있다.

공간적 또는 시간적 예측은 코딩될 블록에 대한 예측 블록이 생기게 한다. 잔차 데이터는 코딩될 원래의 블록과 예측 블록 사이의 화소 차이들을 나타낸다. 인터 코딩식 블록이 예측 블록을 형성하는 참조 샘플들의 블록을 가리키는 모션 벡터 (motion vector) 에 따라 인코딩되고, 잔차 데이터는 코딩된 블록 및 예측 블록 사이의 차이를 나타낸다. 인트라 코딩식 블록이 인트라 코딩 모드 및 잔차 데이터에 따라 인코딩된다. 추가 압축을 위해, 잔차 데이터는 화소 도메인으로부터 변환 도메인으로 변환될 수도 있으며, 결과적으로 잔차 계수들이 생기게 하며, 그 계수들은 그 다음에 양자화될 수도 있다. 처음에는 2차원 어레이로 배열된 양자화된 계수들은, 계수들의 1차원 벡터를 생성하기 위하여 스캔될 수도 있고, 엔트로피 코딩이 더 많은 압축을 달성하기 위해 적용될 수도 있다.

본 개시물의 기법들은 팔레트 (palette) 기반 비디오 코딩에 관련된다. 예를 들어, 팔레트 기반 비디오 코딩에서, 비디오 코더 (예컨대, 비디오 인코더 또는 비디오 디코더) 가 특정 영역 (예컨대, 주어진 블록) 의 비디오 데이터를 표현하기 위한 컬러들의 테이블로서 "팔레트"를 형성할 수도 있다. 팔레트 기반 비디오 코딩은 비교적 적은 수의 컬러들을 갖는 비디오 데이터의 영역들을 코딩하는데 특히 유용할 수도 있다. 실제 화소 값들 (또는 그것들의 잔차들) 을 코딩하는 것이 아니라, 비디오 코더는 화소들을 그 화소들의 컬러들을 표현하는 팔레트에서의 엔트리들과 관련시키는 하나 이상의 화소들에 대한 팔레트 인덱스들을 코딩할 수도 있다. 본 개시물에서 설명되는 기법들은 팔레트 기반 비디오 코딩 모드들을 시그널링하는 것, 팔레트들을 송신하는 것, 팔레트들을 도출하는 것, 비-송신된 신택스 엘리먼트들의 값을 도출하는 것, 그리고 팔레트 기반 비디오 코딩 맵들 및 다른 신택스 엘리먼트들을 송신하는 것 중 하나 이상의 것들의 다양한 조합들을 위한 기법들을 포함할 수도 있다.

하나의 예에서, 비디오 데이터를 디코딩하는 방법이 픽처의 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록을 수신하는 단계를 포함할 수도 있다. 그 방법은 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트를 수신하는 일 없이 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 유추하는 단계를 포함할 수도 있다. 그 방법은 유추된 화소 스캔 순서를 사용하여 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록을 디코딩하는 단계를 포함할 수도 있다. 그 방법은 픽처의 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록을 수신하는 단계를 포함할 수도 있다. 그 방법은 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트를 수신하는 단계를 포함할 수도 있다. 그 방법은 수신된 블록 레벨 신택스 엘리먼트에 기초하여 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 결정하는 단계를 포함할 수도 있다. 그 방법은 결정된 화소 스캔 순서를 사용하여 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록을 디코딩하는 단계를 포함할 수도 있다.

다른 예에서, 디바이스가 픽처의 비디오 데이터를 저장하도록 구성되는 메모리를 포함할 수도 있다. 그 디바이스는 픽처의 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록을 수신하도록 구성되는 비디오 디코더를 포함할 수도 있다. 그 비디오 디코더는 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트에 기초하지 않고 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 유추하도록 구성될 수도 있다. 그 비디오 디코더는 유추된 화소 스캔 순서에 기초하여 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록을 디코딩하도록 구성될 수도 있다. 그 비디오 디코더는 픽처의 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록을 수신하도록 구성될 수도 있다. 그 비디오 디코더는 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트를 수신하도록 구성될 수도 있다. 그 비디오 디코더는 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록에 대한 블록 레벨 신택스 엘리먼트에 기초하여 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 결정하도록 구성될 수도 있다. 그 비디오 디코더는 결정된 화소 스캔 순서에 기초하여 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록을 디코딩하도록 구성될 수도 있다.

다른 예에서, 비일시적 (non-transitory) 컴퓨터 판독가능 저장 매체가, 실행되는 경우, 비디오 데이터를 디코딩하도록 구성되는 컴퓨팅 디바이스의 하나 이상의 프로세서들로 하여금, 픽처의 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록을 수신하게 하는 명령들을 저장하고 있다. 그 비일시적 컴퓨터 판독가능 저장 매체는, 실행되는 경우, 비디오 데이터를 디코딩하도록 구성되는 컴퓨팅 디바이스의 하나 이상의 프로세서들로 하여금, 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트에 기초하지 않고 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 유추하게 하는 명령들을 저장하고 있을 수도 있다. 그 비일시적 컴퓨터 판독가능 저장 매체는, 실행되는 경우, 비디오 데이터를 디코딩하도록 구성되는 컴퓨팅 디바이스의 하나 이상의 프로세서들로 하여금, 유추된 화소 스캔 순서에 기초하여 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록을 디코딩하게 하는 명령들을 저장하고 있을 수도 있다. 그 비일시적 컴퓨터 판독가능 저장 매체는, 실행되는 경우, 비디오 데이터를 디코딩하도록 구성되는 컴퓨팅 디바이스의 하나 이상의 프로세서들로 하여금, 픽처의 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록을 수신하게 하는 명령들을 저장하고 있을 수도 있다. 그 비일시적 컴퓨터 판독가능 저장 매체는, 실행되는 경우, 비디오 데이터를 디코딩하도록 구성되는 컴퓨팅 디바이스의 하나 이상의 프로세서들로 하여금, 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트를 수신하게 하는 명령들을 저장하고 있을 수도 있다. 그 비일시적 컴퓨터 판독가능 저장 매체는, 실행되는 경우, 비디오 데이터를 디코딩하도록 구성되는 컴퓨팅 디바이스의 하나 이상의 프로세서들로 하여금, 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록에 대한 블록 레벨 신택스 엘리먼트에 기초하여 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 결정하게 하는 명령들을 저장하고 있을 수도 있다. 그 비일시적 컴퓨터 판독가능 저장 매체는, 실행되는 경우, 비디오 데이터를 디코딩하도록 구성되는 컴퓨팅 디바이스의 하나 이상의 프로세서들로 하여금, 결정된 화소 스캔 순서에 기초하여 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록을 디코딩하게 하는 명령들을 저장하고 있을 수도 있다.

다른 예에서, 디바이스가 픽처의 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록을 수신하는 수단을 포함할 수도 있다. 그 디바이스는 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트를 수신하는 일 없이 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 유추하는 수단을 포함할 수도 있다. 그 디바이스는 유추된 화소 스캔 순서를 사용하여 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록을 디코딩하는 수단을 포함할 수도 있다. 그 디바이스는 픽처의 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록을 수신하는 수단을 포함할 수도 있다. 그 디바이스는 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트를 수신하는 수단을 포함할 수도 있다. 그 디바이스는 수신된 블록 레벨 신택스 엘리먼트에 기초하여 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 결정하는 수단을 포함할 수도 있다. 그 디바이스는 결정된 화소 스캔 순서를 사용하여 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록을 디코딩하는 수단을 포함할 수도 있다.

또 다른 예에서, 비디오 데이터를 인코딩하는 방법이 비디오 데이터의 블록이 팔레트 모드를 사용하여 인코딩될 것이라고 결정하는 단계를 포함할 수도 있다. 그 방법은 비디오 데이터의 블록에 대한 팔레트 사이즈를 결정하는 단계를 포함할 수도 있다. 그 방법은 비디오 데이터의 블록에 대한 화소 스캔 순서를 결정하는 단계를 포함할 수도 있다. 그 방법은 팔레트 모드를 사용하여 비디오 데이터의 블록을 인코딩하는 단계를 포함할 수도 있다. 그 방법은 팔레트 사이즈에 기초하여 비디오 데이터의 블록에 대해 사용된 화소 스캔 순서를 나타내는 제 1 블록 레벨 신택스 엘리먼트를 시그널링할지의 여부를 결정하는 단계를 포함할 수도 있다.

또 다른 예에서, 디바이스가 픽처의 비디오 데이터를 저장하도록 구성되는 메모리를 포함할 수도 있다. 그 디바이스는 비디오 데이터의 블록이 팔레트 모드를 사용하여 인코딩될 것이라고 결정하도록 구성되는 비디오 인코더를 포함할 수도 있다. 그 비디오 인코더는 비디오 데이터의 블록에 대한 팔레트 사이즈를 결정하도록 구성될 수도 있다. 그 디오 인코더는 비디오 데이터의 블록에 대한 화소 스캔 순서를 결정하도록 구성될 수도 있다. 그 비디오 인코더는 팔레트 모드를 사용하여 비디오 데이터의 블록을 인코딩하도록 구성될 수도 있다. 그 비디오 인코더는 팔레트 사이즈에 기초하여 비디오 데이터의 블록에 대해 사용된 화소 스캔 순서를 나타내는 제 1 블록 레벨 신택스 엘리먼트를 시그널링할지의 여부를 결정하도록 구성될 수도 있다.

또 다른 예에서, 비일시적 컴퓨터 판독가능 저장 매체가, 실행되는 경우, 비디오 데이터를 인코딩하도록 구성되는 컴퓨팅 디바이스의 하나 이상의 프로세서들로 하여금, 비디오 데이터의 블록이 팔레트 모드를 사용하여 인코딩될 것이라고 결정하게 하는 명령들을 저장하고 있다. 그 비일시적 컴퓨터 판독가능 저장 매체는, 실행되는 경우, 비디오 데이터를 인코딩하도록 구성되는 컴퓨팅 디바이스의 하나 이상의 프로세서들로 하여금, 비디오 데이터의 블록에 대한 팔레트 사이즈를 결정하게 하는 명령들을 저장하고 있을 수도 있다. 그 비일시적 컴퓨터 판독가능 저장 매체는, 실행되는 경우, 비디오 데이터를 인코딩하도록 구성되는 컴퓨팅 디바이스의 하나 이상의 프로세서들로 하여금, 비디오 데이터의 블록에 대한 화소 스캔 순서를 결정하게 하는 명령들을 저장하고 있을 수도 있다. 그 비일시적 컴퓨터 판독가능 저장 매체는, 실행되는 경우, 비디오 데이터를 인코딩하도록 구성되는 컴퓨팅 디바이스의 하나 이상의 프로세서들로 하여금, 팔레트 모드를 사용하여 비디오 데이터의 블록을 인코딩하게 하는 명령들을 저장하고 있을 수도 있다. 그 비일시적 컴퓨터 판독가능 저장 매체는, 실행되는 경우, 비디오 데이터를 인코딩하도록 구성되는 컴퓨팅 디바이스의 하나 이상의 프로세서들로 하여금, 팔레트 사이즈에 기초하여 비디오 데이터의 블록에 대해 사용된 화소 스캔 순서를 나타내는 제 1 블록 레벨 신택스 엘리먼트를 시그널링할지의 여부를 결정하게 하는 명령들을 저장하고 있을 수도 있다.

또 다른 예에서, 디바이스가 비디오 데이터의 블록이 팔레트 모드를 사용하여 인코딩될 것이라고 결정하는 수단을 포함할 수도 있다. 그 디바이스는 비디오 데이터의 블록에 대한 팔레트 사이즈를 결정하는 수단을 포함할 수도 있다. 그 디바이스는 비디오 데이터의 블록에 대한 화소 스캔 순서를 결정하는 수단을 포함할 수도 있다. 그 디바이스는 팔레트 모드를 사용하여 비디오 데이터의 블록을 인코딩하는 수단을 포함할 수도 있다. 그 디바이스는 팔레트 사이즈에 기초하여 비디오 데이터의 블록에 대해 사용된 화소 스캔 순서를 나타내는 제 1 블록 레벨 신택스 엘리먼트를 시그널링할지의 여부를 결정하는 수단을 포함할 수도 있다.

본 개시물의 하나 이상의 예들의 세부사항들은 첨부 도면들 및 다음의 설명에서 언급된다. 다른 특징들, 목적들, 및 장점들은 상세한 설명, 도면들, 및 청구항들로부터 명확하게 될 것이다.

도 1은 본 개시물에서 설명되는 팔레트 기반 비디오 코딩을 위한 기법들을 이용할 수도 있는 예시적인 비디오 코딩 시스템을 도시하는 블록도이다.
도 2는 본 개시물에서 설명되는 팔레트 기반 비디오 코딩을 위한 기법들을 구현할 수도 있는 예시적인 비디오 인코더를 도시하는 블록도이다.
도 3은 본 개시물에서 설명되는 팔레트 기반 비디오 코딩을 위한 기법들을 구현할 수도 있는 예시적인 비디오 디코더를 도시하는 블록도이다.
도 4는 본 개시물의 기법들과 일치하게, 팔레트 기반 비디오 코딩을 위한 팔레트 엔트리들을 결정하는 일 예를 도시하는 개념도이다.
도 5는 본 개시물의 기법들과 일치하게, 화소들의 블록을 위한 팔레트로의 인덱스들을 결정하는 일 예를 도시하는 개념도이다.
도 6a는 화소 스캐닝 순서의 하나의 예를 도시하는 개념도이다.
도 6b는 화소 스캐닝 순서의 하나의 예를 도시하는 개념도이다.
도 7은 본 개시물의 팔레트 기반 비디오 코딩을 위한 기법들과 일치하는 비디오 데이터를 디코딩하는 예시적인 프로세스를 도시하는 흐름도이다.
도 8은 본 개시물의 팔레트 기반 비디오 코딩을 위한 기법들과 일치하는 비디오 데이터를 인코딩하는 예시적인 프로세스를 도시하는 흐름도이다.
도 9는 본 개시물의 팔레트 기반 비디오 코딩을 위한 기법들에 일치하는 비디오 데이터의 블록의 첫 번째 행에 대한 복사 모드를 가능하게 하는 일 예를 도시하는 개념도이다.
도 10은 본 개시물의 팔레트 기반 비디오 코딩을 위한 기법들과 일치하는 비디오 데이터를 디코딩하는 예시적인 프로세스를 도시하는 흐름도이다.
도 11은 본 개시물의 팔레트 기반 비디오 코딩을 위한 기법들과 일치하는 비디오 데이터를 인코딩하는 예시적인 프로세스를 도시하는 흐름도이다.

본 개시물의 양태들은 비디오 코딩 및 비디오 데이터 압축을 위한 기법들을 위한 것이다. 특히, 본 개시물은 비디오 데이터의 팔레트 기반 비디오 코딩을 위한 기법들을 설명한다. 전통적인 비디오 코딩에서, 이미지들이 연속 톤이고 공간적으로 매끄러운 것으로 가정된다. 이들 가정들에 기초하여, 블록 기반 변환들, 필터링, 및 다른 코딩 도구들과 같은 다양한 도구들이 개발되었고, 이러한 도구들은 자연 콘텐츠 비디오들에 대해 양호한 성능을 보여 주었다. 그러나, 원격 데스크톱, 협력 작업 및 무선 디스플레이 같은 애플리케이션들에서, 컴퓨터 생성된 스크린 콘텐츠가 압축될 지배적인 콘텐츠일 수도 있다. 이 유형의 스크린 콘텐츠는 이산 톤, 예리한 라인들, 및 높은 콘트라스트 물체 경계들을 갖는 경향이 있다. 연속-톤 및 평활도의 가정은 더 이상 적용할 수도 없고, 따라서 전통적인 비디오 코딩 기법들은 스크린 콘텐츠를 압축함에 있어서 비효율적일 수도 있다.

본 개시물은 팔레트 기반 비디오 코딩 기법들을 설명하는데, 이 기법들은 컴퓨터 생성된 스크린 콘텐츠 코딩 (예컨대, 스크린 콘텐츠 코딩 (content coding, SCC) 또는 하나 이상의 전통적 코딩 도구들이 비효율적인 다른 콘텐츠에 특히 적합할 수도 있다. 본 개시물에서 설명되는 비디오 데이터의 팔레트 기반 비디오 코딩을 위한 기법들은 하나 이상의 다른 코딩 기법들, 이를테면 인터-예측 또는 인트라-예측 코딩을 위한 기법들과 함께 사용될 수도 있다. 예를 들어, 아래에서 더욱 상세히 설명되는 바와 같이, 인코더 또는 디코더, 또는 결합된 인코더-디코더 (코덱) 가, 인터 예측 및 인트라 예측 코딩, 뿐만 아니라 팔레트 기반 비디오 코딩을 수행하도록 구성될 수도 있다.

최근에, 새로운 비디오 코딩 표준, 즉 고 효율 비디오 코딩 (HEVC) 이 ITU-T 비디오 코딩 전문가 그룹 (Video Coding Experts Group, VCEG) 및 ISO/IEC 동 화상 전문가 그룹 (Motion Picture Experts Group, MPEG) 의 JCT-VC (Joint Collaboration Team on Video Coding) 에 의해 완결되었다. HEVC에 대한 스크린 콘텐츠 코딩 확장본, 이름하여 SCC는 JCT-VC에 의해 또한 개발되고 있다. 팔레트 모드 디스크립션을 포함하는 SCC의 최근의 규격 초안 (WD) (SCC WD) 이 JCTVC-R0348 "JCTVC-R0348_18thMeetingFinalPaletteTextSpecification.doc"에서 입수 가능하다.

일부 예들에서, 팔레트 기반 비디오 코딩 기법들은 하나 이상의 비디오 코딩 표준들과 함께 사용하기 위해 구성될 수도 있다. 예의 비디오 코딩 표준들은 ITU-T H.261, ISO/IEC MPEG-1 비주얼, ITU-T H.262 또는 ISO/IEC MPEG-2 비주얼, ITU-T H.263, ISO/IEC MPEG-4 비주얼 그리고 ITU-T H.264 (또한 ISO/IEC MPEG-4 AVC로 알려짐) 를 포함한다. 고 효율 비디오 코딩 (HEVC) 은, ITU-T 비디오 코딩 전문가 그룹 (VCEG) 및 ISO/IEC 동 화상 전문가 그룹 (MPEG) 의 JCT-VC (Joint Collaboration Team on Video Coding) 에 의해 개발된 새로운 비디오 코딩 표준이다. 최근의 HEVC 텍스트 규격 초안이 『Bross et al., "High Efficiency Video Coding (HEVC) Text Specification Draft 10 (for FDIS & Consent)," JCVC-L1003_v13, 12^th Meeting of JCT-VC of ITU-T SG16 WP 3 and ISO/IEC JCT 1/SC 29/WG 11, 14 - 23 Jan. 2013』 ("HEVC 초안 10") 에서 설명되어 있는데, 이것은 다음으로부터 입수 가능하다: http://phenix.int-evry.fr/jct/doc_end_user/documents/12_Geneva/wg11/JCTVC-L1003-v13.zip.

HEVC 프레임워크에 관해, 일 예로서, 본 개시물의 팔레트 기반 비디오 코딩 기법들이 코딩 유닛 (coding unit, CU) 레벨에서 사용되도록 구성될 수도 있다. HEVC에 대한 다른 예들에서, 본 개시물의 팔레트 기반 비디오 코딩 기법들은 예측 유닛 (prediction unit, PU) 레벨에서 사용되도록 구성될 수도 있다. HEVC에 대한 다른 예들에서, 본 개시물의 팔레트 기반 비디오 코딩 기법들은 서브-예측 유닛 (서브-PU) 레벨 (예컨대, 예측 유닛의 서브블록) 에서 사용되도록 구성될 수도 있다. 따라서, CU 레벨의 맥락에서 설명되는 다음의 개시된 프로세스들의 모두가, 부가적으로 또는 대안으로, PU 레벨 또는 서브-PU 레벨에 적용될 수도 있다. 그러나, 이들 HEVC 기반 예들은 본원에서 설명되는 팔레트 기반 비디오 코딩 기법들의 제약 또는 제한으로서 간주되지 않아야 하는데, 이러한 기법들이 다른 현존의 또는 아직 개발되지 않은 시스템들/표준들과는 상관없이 또는 그러한 시스템들/표준들의 부분으로서 작동하기 위해 적용될 수도 있어서이다. 이들 경우들에서, 팔레트 코딩을 위한 유닛은 정사각형 블록들, 직사각형 블록들 또는 심지어 비-직사각형 형상의 지역들일 수 있다.

팔레트 기반 비디오 코딩에서 비디오 데이터의 특정 영역이 비교적 적은 수의 컬러들을 가질 수도 있다. 비디오 코더 (예컨대, 비디오 인코더 또는 비디오 디코더) 가 특정 영역 (예컨대, 주어진 블록) 의 비디오 데이터를 표현하기 위한 컬러들의 테이블로서 이른바 "팔레트"를 코딩 (즉, 인코딩 또는 디코딩) 할 수도 있다. 각각의 화소는 화소의 컬러를 표현하는 팔레트에서의 엔트리와 연관될 수도 있다. 예를 들어, 비디오 코더는 화소 값을 팔레트에서의 적절한 값에 관련시키는 인덱스를 코딩할 수도 있다.

위의 예에서, 비디오 인코더가 비디오 데이터의 블록에 대한 팔레트를 결정하며, 각각의 화소의 값을 표현하기 위한 팔레트에서의 엔트리의 위치를 찾아내고, 화소 값을 팔레트에 관련시키는 화소들에 대한 팔레트 인덱스들 (또한 팔레트 인덱스 값들이라고 지칭됨) 로 팔레트를 인코딩함으로써 비디오 데이터의 블록을 인코딩할 수도 있다. 비디오 디코더가, 인코딩된 비트스트림으로부터, 블록에 대한 팔레트, 뿐만 아니라 블록의 화소들에 대한 팔레트 인덱스들을 획득할 수도 있다. 비디오 디코더는 블록의 화소 값들을 복원하기 위해 화소들의 팔레트 인덱스들을 팔레트의 엔트리들에 관련시킬 수도 있다. 화소들 (및/또는 화소 값을 나타내는 관련된 팔레트 인덱스들) 은 샘플들로서 일반적으로 지칭될 수도 있다.

비디오 데이터의 블록에서의 샘플들은 수평 래스터 스캐닝 순서 또는 다른 스캐닝 순서를 사용하여 프로세싱될 (예컨대, 스캐닝될) 수도 있다. 예를 들어, 비디오 인코더는 수평 래스터 스캐닝 순서를 사용하여 팔레트 인덱스들을 스캐닝함으로써 팔레트 인덱스들의 2차원 블록을 1차원 어레이로 변환할 수도 있다. 비슷하게, 비디오 디코더는 수평 래스터 스캐닝 순서를 사용하여 팔레트 인덱스들의 블록을 복원할 수도 있다. 따라서, 본 개시물은 블록에서 현재 코딩되고 있는 샘플을 스캐닝 순서에서 선행하는 샘플로서 이전 샘플을 지칭할 수도 있다. 수평 래스터 스캔이 아닌 스캔들, 이를테면 수직 래스터 스캐닝 순서가, 또한 적용 가능할 수도 있다는 것이 이해되어야 한다. 위의 예, 뿐만 아니라 본 개시물에서 언급되는 다른 예들은, 팔레트 기반 비디오 코딩의 일반적인 설명을 제공하도록 의도된다.

팔레트가, 인덱스에 의해 번호 부여된 그리고 컬러 성분 (예를 들어, RGB, YUV, YCbCr 등) 값들 또는 세기들을 표현하는 엔트리들을 통상적으로 포함한다. 비디오 인코더 및 비디오 디코더 둘 다가 팔레트 엔트리들의 수, 각각의 팔레트 엔트리에 대한 컬러 성분 값들 및 현재 블록에 대한 팔레트 엔트리들의 정확한 순서를 결정한다. 본 개시물에서, 각각의 팔레트 엔트리가 샘플의 모든 컬러 성분들에 대한 값들을 특정한다고 가정된다. 그러나, 본 개시물의 개념들은 각각의 컬러 성분에 대해 별개의 팔레트를 사용하는 것에 적용 가능하다.

일부 예들에서, 팔레트가 이전에 코딩된 블록들로부터의 정보를 사용하여 구성될 수도 있다. 다시 말하면, 팔레트가 이전 블록(들)을 코딩하는데 사용된 팔레트(들)로부터 예측되는 예측된 팔레트 엔트리들을 포함할 수도 있다. 예를 들어, 『Wei Pu et al., "AHG10: Suggested Software for Palette Coding based on RExt6.0," JCTVC-Q0094, Valencia, ES, 27 March - 4 April 2014』 (이하 JCTVC-Q0094) 에서 설명된 바와 같이, 팔레트가 예측자 팔레트로부터 복사되는 엔트리들을 포함할 수도 있다. 예측자 팔레트가 팔레트 모드 또는 다른 복원된 샘플들을 사용하여 이전에 코딩된 블록들로부터의 팔레트 엔트리들을 포함할 수도 있다. 예측자 팔레트에서의 각각의 엔트리에 대해, (예컨대, 플래그 = 1에 의해 나타내어지는) 이진 플래그가 그 플래그에 연관된 엔트리가 현재 팔레트에 복사되는지의 여부를 나타내기 위해 코딩될 수도 있다. 이진 플래그들의 문자열은 이진 팔레트 예측 벡터라고 지칭될 수도 있다. 현재 블록을 코딩하기 위한 팔레트는, (예컨대, 팔레트 예측 벡터와는 별개로) 명시적으로 코딩될 수도 있는 다수의 새로운 팔레트 엔트리들을 또한 포함할 수도 있다. 새로운 엔트리들의 수의 표시가 또한 코딩될 수도 있다. 예측된 엔트리들 및 새로운 엔트리들의 합이 블록에 대한 총 팔레트 사이즈를 나타낼 수도 있다.

제안된 JCTVC-Q0094처럼, 팔레트 기반 비디오 코딩 모드로 코딩된 블록에서의 각각의 샘플은, 아래에서 언급되는 바와 같이, 세 개의 팔레트 모드들 중 하나를 사용하여 코딩될 수도 있다:

이스케이프 모드: 이 모드에서, 샘플 값은 팔레트 속에 팔레트 엔트리로서 포함되지 않고 양자화된 샘플 값은 모든 컬러 성분들에 대해 명시적으로 시그널링된다. 그것은 새로운 팔레트 엔트리들의 시그널링과 유사하지만, 새로운 팔레트 엔트리들에 대해, 컬러 성분 값들은 양자화되지 않는다.

상단에서복사 (CopyFromTop) 모드 (또한 상측복사 (CopyAbove) 모드 또는 복사 모드라고 지칭됨): 이 모드에서, 현재 샘플에 대한 팔레트 엔트리 인덱스는 블록에서 바로 위에 위치된 샘플로부터 복사된다.

값 모드 (Value mode) (또한 인덱스 모드 (Index mode) 라고 지칭됨): 이 모드에서, 팔레트 엔트리 인덱스의 값은 명시적으로 시그널링된다.

일부 예들에서, 이스케이프 모드는 상단에서복사 모드 또는 인덱스 모드와는 별개의 모드가 아니다. 오히려, 이러한 예들에서, 이스케이프 모드는 복사 모드 또는 인덱스 모드에 포함될 수도 있다.

본원에서 설명되는 바와 같이, 팔레트 엔트리 인덱스가 팔레트 인덱스 또는 간단히 인덱스라고 지칭될 수도 있다. 이들 용어들은 본 개시물의 기법들을 설명하기 위해 교환적으로 사용될 수 있다. 덧붙여서, 아래에서 더욱 상세히 설명되는 바와 같이, 팔레트 인덱스가 하나 이상의 연관된 컬러 또는 세기 값들을 가질 수도 있다. 예를 들어, 팔레트 인덱스가 화소의 단일 컬러 또는 세기 성분 (예컨대, RGB 데이터의 적색 성분, YUV 데이터의 Y 성분 등) 에 연관되는 단일의 연관된 컬러 또는 세기 값을 가질 수도 있다. 다른 예에서, 팔레트 인덱스가 다수의 연관된 컬러 또는 세기 값들을 가질 수도 있다. 일부 사례들에서, 팔레트 기반 비디오 코딩은 모노크롬 비디오를 코딩하기 위해 적용될 수도 있다. 따라서, "컬러 값"은 화소 값을 생성하는데 사용되는 임의의 컬러 또는 비-컬러 성분을 일반적으로 지칭할 수도 있다.

상단에서복사 모드 및 값 모드의 경우, 런 (run) 값 (이는 간단히 런으로서 또한 지칭될 수도 있음) 이 또한 시그널링될 수도 있다. 런 값이 팔레트 코딩된 블록에서 특정 스캔 순서로 함께 코딩되는 연속적인 샘플들의 수 (예컨대, 샘플들의 런) 를 나타낼 수도 있다. 일부 사례들에서, 샘플들의 런은 팔레트 인덱스들의 런이라고 또한 지칭될 수도 있는데, 런의 각각의 샘플이 팔레트에 대한 연관된 인덱스를 갖기 때문이다.

런 값이 동일한 팔레트 코딩 모드를 사용하여 코딩되는 팔레트 인덱스들의 런을 나타낼 수도 있다. 예를 들어, 값 모드에 관해, 비디오 코더 (비디오 인코더 또는 비디오 디코더) 가 팔레트 인덱스 (또한 팔레트 인덱스 값 또는 단순히 인덱스 값이라고 지칭됨) 와, 동일한 팔레트 인덱스를 갖는 그리고 팔레트 인덱스로 코딩된 것들인, 스캔 순서에서의 연속적인 샘플들의 수를 나타내는 런 값을 코딩할 수도 있다. 상단에서복사 모드에 관해, 비디오 코더는, 현재 샘플 값에 대한 인덱스가 상측-이웃 샘플 (예컨대, 블록에서 현재 코딩되고 있는 샘플 상측에 위치된 샘플) 의 인덱스와, 상측-이웃 샘플로부터 팔레트 인덱스를 또한 복사하는 그리고 팔레트 인덱스로 코딩되어 있는, 스캔 순서에서의 연속적인 샘플들의 수를 나타내는 런 값에 기초하여 복사된다는 표시를 코딩할 수도 있다. 따라서, 위의 예들에서, 팔레트 인덱스들의 런은 동일한 값을 갖는 팔레트 인덱스들의 런 또는 상측-이웃 팔레트 인덱스들로부터 복사되는 팔레트 인덱스들의 런을 지칭한다.

그런고로, 런은, 주어진 모드에 대해, 동일한 모드에 속하는 후속 샘플들의 수를 특정할 수도 있다. 일부 사례들에서, 인덱스 및 런 값을 시그널링하는 것은 런 길이 코딩과 유사할 수도 있다. 예시의 목적을 위한 일 예에서, 블록의 연속적인 팔레트 인덱스들의 문자열이 (예컨대, 각각의 인덱스가 블록에서의 샘플에 대응하는 경우) 0, 2, 2, 2, 2, 5일 수도 있다. 이 예에서, 비디오 코더가 값 모드를 사용하여 두 번째 샘플 (예컨대, 2의 첫 번째 팔레트 인덱스 값) 을 코딩할 수도 있다. 2와 동일한 인덱스 값을 코딩한 후, 비디오 코더는, 세 개의 후속 샘플들이 2의 동일한 팔레트 인덱스 값을 또한 가짐을 나타내는 3의 런을 코딩할 수도 있다. 유사한 방식으로, 상단에서복사 모드를 사용하여 인덱스를 코딩한 후에 네 개의 팔레트 인덱스들의 런을 코딩하는 것은 총 다섯 개 팔레트 인덱스들이 현재 코딩되고 있는 샘플 포지션 상측의 행에서의 대응 팔레트 인덱스들로부터 복사됨을 나타낼 수도 있다.

본 개시물에서 설명되는 기법들은 팔레트 기반 비디오 코딩 모드들을 시그널링하는 것, 팔레트들을 송신하는 것, 팔레트들을 도출하는 것, 스캐닝 순서를 시그널링하는 것, 스캐닝 순서를 도출하는 것, 비디오 데이터의 블록에서의 첫 번째 행에 대한 복사 모드를 가능하게 하는 것, 및 팔레트 기반 비디오 코딩 맵들 및 다른 신택스 엘리먼트들을 송신하는 것 중 하나 이상의 것들의 다양한 조합들을 위한 기법들을 포함할 수도 있다. 일부 예들에서, 본 개시물의 기법들은 JCTVC-Q0094 (뿐만 아니라 기고 JCTVC-Q0094로 업데이트되었던 팔레트 모드를 구현하는 레퍼런스 소프트웨어) 에서 제시되는 팔레트 모드들, 팔레트 인덱스들, 런들 및 팔레트 사이즈들의 시그널링에 연관된 잠재적 리던던시들을 해결하는데 사용될 수도 있다. 일부 예들에서, 본 개시물의 기법들은, 무엇보다도, 스캐닝 순서의 시그널링에 연관된 잠재적 리던던시들을 해결하는데 사용될 수도 있다. 다른 예들에서, 본 개시물의 기법들은, 무엇보다도, 스캐닝 순서의 불필요한 시그널링을 제거하는데 사용될 수도 있다. 또 다른 예들에서, 본 개시물의 기법들은, 무엇보다도, 비디오 데이터의 블록에서의 맨 첫 번째 행에 대한 복사 모드를 비디오 데이터의 해당 블록에서의 해당 행 바로 상측에는 화소들이 없음에도 불구하고 가능하게 할 수도 있다. 따라서, 아래에서 더욱 상세히 설명되는 바와 같이, 본 개시물의 기법들은, 일부 사례들에서, 팔레트 모드를 사용하여 비디오 데이터를 코딩하는 경우 효율을 개선하고 비트레이트를 개선할 수도 있다.

도 1은 본 개시물의 기법들을 이용할 수도 있는 예시적인 비디오 코딩 시스템 (10) 을 도시하는 블록도이다. 본 명세서에서 사용되는 바와 같이, "비디오 코더"라는 용어는 비디오 인코더들 및 비디오 디코더들 양쪽 모두를 일반적으로 지칭한다. 본 개시물에서, "비디오 코딩" 또는 "코딩"이란 용어들은 비디오 인코딩 또는 비디오 디코딩을 일반적으로 지칭할 수도 있다. 비디오 코딩 시스템 (10) 의 비디오 인코더 (20) 및 비디오 디코더 (30) 는 본 개시물에서 설명되는 다양한 예들에 따라 팔레트 기반 비디오 코딩을 위한 기법들을 수행하도록 구성될 수도 있는 디바이스들의 예들을 나타낸다.

도 1에 도시된 바와 같이, 비디오 코딩 시스템 (10) 은 소스 디바이스 (12) 와 목적지 디바이스 (14) 를 포함한다. 소스 디바이스 (12) 는 인코딩된 비디오 데이터를 생성한다. 따라서, 소스 디바이스 (12) 는 비디오 인코딩 디바이스 또는 비디오 인코딩 장치라고 지칭될 수도 있다. 목적지 디바이스 (14) 는 소스 디바이스 (12) 에 의해 생성된 인코딩된 비디오 데이터를 디코딩할 수도 있다. 따라서, 목적지 디바이스 (14) 는 비디오 디코딩 디바이스 또는 비디오 디코딩 장치라고 지칭될 수도 있다. 소스 디바이스 (12) 와 목적지 디바이스 (14) 는 비디오 코딩 디바이스들 또는 비디오 코딩 장치들의 예들일 수도 있다. 소스 디바이스 (12) 와 목적지 디바이스 (14) 는 데스크톱 컴퓨터들, 모바일 컴퓨팅 디바이스들, 노트북 (예컨대, 랩톱) 컴퓨터들, 태블릿 컴퓨터들, 셋톱 박스들, 이른바 "스마트" 폰들과 같은 전화기 핸드셋들, 텔레비전들, 카메라들, 디스플레이 디바이스들, 디지털 미디어 플레이어들, 비디오 게이밍 콘솔들, 차량내 컴퓨터들 등을 포함한 다양한 범위의 디바이스들을 포함할 수도 있다.

목적지 디바이스 (14) 는 소스 디바이스 (12) 로부터의 인코딩된 비디오 데이터를 채널 (16) 을 통해 수신할 수도 있다. 채널 (16) 은 소스 디바이스 (12) 로부터의 인코딩된 비디오 데이터를 목적지 디바이스 (14) 로 이동시킬 수 있는 하나 이상의 매체들 또는 디바이스들을 포함할 수도 있다. 하나의 예에서, 채널 (16) 은 소스 디바이스 (12) 가 인코딩된 비디오 데이터를 목적지 디바이스 (14) 로 직접 실시간으로 송신하는 것을 가능하게 하는 하나 이상의 통신 매체들을 포함할 수도 있다. 이 예에서, 소스 디바이스 (12) 는 인코딩된 비디오 데이터를 통신 표준, 이를테면 무선 통신 프로토콜에 따라 변조할 수도 있고, 변조된 비디오 데이터를 목적지 디바이스 (14) 로 송신할 수도 있다. 하나 이상의 통신 매체들은 무선 및/또는 유선 통신 매체들, 이를테면 라디오 주파수 (radio frequency, RF) 스펙트럼 또는 하나 이상의 물리적 송신 라인들을 포함할 수도 있다. 하나 이상의 통신 매체들은 패킷 기반 네트워크, 이를테면 국부 영역 네트워크, 광역 네트워크, 또는 글로벌 네트워크 (예컨대, 인터넷) 의 일부를 형성할 수도 있다. 하나 이상의 통신 매체들은 라우터들, 스위치들, 기지국들, 또는 소스 디바이스 (12) 로부터 목적지 디바이스 (14) 로의 통신을 용이하게 하는 다른 장비를 포함할 수도 있다.

다른 예에서, 채널 (16) 은 소스 디바이스 (12) 에 의해 생성된 인코딩된 비디오 데이터를 저장하는 저장 매체를 포함할 수도 있다. 이 예에서, 목적지 디바이스 (14) 는 예컨대, 디스크 액세스 또는 카드 액세스를 통해 저장 매체에 액세스할 수도 있다. 저장 매체는 블루 레이 디스크들, DVD들, CD-ROM들, 플래시 메모리, 또는 인코딩된 비디오 데이터를 저장하기 위한 다른 적합한 디지털 저장 매체들과 같은 다양한 국부적으로 액세스되는 데이터 저장 매체들을 포함할 수도 있다.

추가의 예에서, 채널 (16) 은 소스 디바이스 (12) 에 의해 생성된 인코딩된 비디오 데이터를 저장하는 파일 서버 또는 다른 중간 저장 디바이스를 포함할 수도 있다. 이 예에서, 목적지 디바이스 (14) 는 파일 서버 또는 다른 중간 저장 디바이스에 저장된 인코딩된 비디오 데이터를 스트리밍 또는 다운로드를 통해 액세스할 수도 있다. 파일 서버는 인코딩된 비디오 데이터를 저장하고 그 인코딩된 비디오 데이터를 목적지 디바이스 (14) 로 송신할 수 있는 유형의 서버일 수도 있다. 예의 파일 서버들은 웹 서버들 (예컨대, 웹사이트용), 파일 전송 프로토콜 (file transfer protocol, FTP) 서버들, 네트워크 부속 스토리지 (network attached storage, NAS) 디바이스들, 및 로컬 디스크 드라이브들을 포함한다.

목적지 디바이스 (14) 는 표준 데이터 접속, 이를테면 인터넷 접속을 통해, 인코딩된 비디오 데이터에 액세스할 수도 있다. 예의 유형들의 데이터 접속들은 파일 서버 상에 저장된 인코딩된 비디오 데이터에 액세스하기에 적합한 무선 채널들 (예컨대, Wi-Fi 접속들), 유선 접속들 (예컨대, DSL, 케이블 모뎀 등), 또는 양쪽 모두의 조합들을 포함할 수도 있다. 파일 서버로부터의 인코딩된 비디오 데이터의 송신은 스트리밍 송신, 다운로드 송신, 또는 둘 다의 조합일 수도 있다.

팔레트 기반 비디오 코딩을 위한 본 개시물의 기법들은, 무선 애플리케이션들 또는 설정들 (settings) 로 제한되지 않는다. 그 기법들은, 다양한 멀티미디어 애플리케이션들, 이를테면 OTA (over-the-air) 텔레비전 브로드캐스트들, 케이블 텔레비전 송신들, 위성 텔레비전 송신들, 예컨대, 인터넷을 통한 스트리밍 비디오 송신들, 데이터 저장 매체 상의 저장을 위한 비디오 데이터의 인코딩, 데이터 저장 매체 상에 저장된 비디오 데이터의 디코딩, 또는 다른 애플리케이션들의 지원 하의 비디오 코딩에 적용될 수도 있다. 일부 예들에서, 비디오 코딩 시스템 (10) 은 비디오 스트리밍, 비디오 플레이백, 비디오 브로드캐스팅, 및/또는 화상 통화와 같은 애플리케이션들을 지원하기 위해 단방향 또는 양방향 비디오 송신을 지원하도록 구성될 수도 있다.

도 1에 예시된 비디오 코딩 시스템 (10) 은 단지 일 예이고 본 개시물의 기법들은 인코딩 및 디코딩 디바이스들 간에 임의의 데이터 통신을 반드시 포함하지는 않는 비디오 코딩 설정들 (예컨대, 비디오 인코딩 또는 비디오 디코딩) 에 적용될 수도 있다. 다른 예들에서, 데이터는 국부 메모리로부터 취출되며, 네트워크를 통해 스트리밍되는 등등이 된다. 비디오 인코딩 디바이스가 데이터를 인코딩하고 메모리에 저장할 수도 있으며, 그리고/또는 비디오 디코딩 디바이스가 메모리로부터 데이터를 취출하고 디코딩할 수도 있다. 많은 예들에서, 인코딩 및 디코딩은, 서로 통신하지 않지만 단순히 데이터를 메모리에 인코딩하고 및/또는 메모리로부터 데이터를 취출하고 디코딩하는 디바이스들에 의해 수행된다.

도 1의 예에서, 소스 디바이스 (12) 는 비디오 소스 (18), 비디오 인코더 (20), 및 출력 인터페이스 (22) 를 구비한다. 일부 예들에서, 출력 인터페이스 (22) 는 변조기/복조기 (모뎀) 및/또는 송신기를 구비할 수도 있다. 비디오 소스 (18) 는 비디오 캡처 디바이스, 예컨대, 비디오 카메라, 이전에 캡처된 비디오 데이터를 포함하는 비디오 아카이브 (archive), 비디오 콘텐츠 제공자로부터 비디오 데이터를 수신하는 비디오 피드 인터페이스, 및/또는 비디오 데이터를 생성하는 컴퓨터 그래픽 시스템, 또는 비디오 데이터의 이러한 소스들의 조합을 포함할 수도 있다.

비디오 인코더 (20) 는 비디오 소스 (18) 로부터의 비디오 데이터를 인코딩할 수도 있다. 일부 예들에서, 소스 디바이스 (12) 는 출력 인터페이스 (22) 를 통해 목적지 디바이스 (14) 로 인코딩된 비디오 데이터를 직접 송신할 수도 있다. 다른 예들에서, 인코딩된 비디오 데이터는 디코딩 및/또는 플레이백을 위한 목적지 디바이스 (14) 에 의한 나중의 액세스를 위해 저장 매체 또는 파일 서버 상에 또한 저장될 수도 있다.

도 1의 예에서, 목적지 디바이스 (14) 는 입력 인터페이스 (28), 비디오 디코더 (30), 및 디스플레이 디바이스 (32) 를 구비한다. 일부 예들에서, 입력 인터페이스 (28) 는 수신기 및/또는 모뎀을 구비한다. 입력 인터페이스 (28) 는 채널 (16) 을 통해 인코딩된 비디오 데이터를 수신할 수도 있다. 디스플레이 디바이스 (32) 는 목적지 디바이스 (14) 와 통합되거나 또는 그것 외부에 있을 수도 있다. 대체로, 디스플레이 디바이스 (32) 는 디코딩된 비디오 데이터를 디스플레이한다. 디스플레이 디바이스 (32) 는 액정 디스플레이 (liquid crystal display, LCD), 플라즈마 디스플레이, 유기 발광 다이오드 (organic light emitting diode, OLED) 디스플레이, 또는 다른 유형의 디스플레이 디바이스와 같은 다양한 디스플레이 디바이스들을 포함할 수도 있다.

비디오 인코더 (20) 와 비디오 디코더 (30) 각각은 다양한 적합한 회로, 이를테면 하나 이상의 마이크로프로세서들, 디지털 신호 프로세서들 (digital signal processors, DSP들), 주문형 집적회로들 (application-specific integrated circuits, ASIC들), 필드 프로그램가능 게이트 어레이들 (field-programmable gate arrays, FPGA들), 개별 로직, 하드웨어, 또는 그것들의 임의의 조합 중 임의의 것으로서 구현될 수도 있다. 그 기법들이 부분적으로 소프트웨어로 구현되면, 디바이스가 적합한 비일시적 컴퓨터 판독가능 저장 매체 내에 소프트웨어에 대한 명령을 저장할 수도 있고 하나 이상의 프로세서들을 사용하여 하드웨어에서 그 명령들을 실행하여 본 개시물의 기법들을 수행할 수도 있다. 전술한 바 (하드웨어, 소프트웨어, 하드웨어 및 소프트웨어의 조합 등을 포함) 중 임의의 것은 하나 이상의 프로세서들이라고 간주될 수도 있다. 비디오 인코더 (20) 및 비디오 디코더 (30) 의 각각은 하나 이상의 인코더들 또는 디코더들 내에 구비될 수도 있고, 그것들 중 어느 하나는 결합형 인코더/디코더 (CODEC) 의 일부로서 개별 디바이스 내에 통합될 수도 있다.

본 개시물의 기법들에 따라 비디오 디코더 (30) 는 비디오 데이터의 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 유추하도록 구성될 수도 있다. 예를 들어, 비디오 디코더 (30) 는 비디오 데이터의 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트를 수신하는 일 없이 비디오 데이터의 인코딩된 블록에 대한 화소 스캔 순서를 유추하도록 구성될 수도 있다. 다른 예로서, 비디오 디코더 (30) 는 비디오 데이터의 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트에 기초하지 않고 비디오 데이터의 인코딩된 블록에 대한 화소 스캔 순서를 유추하도록 구성될 수도 있는데, 블록 레벨 신택스 엘리먼트는 (i) 비디오 디코더 (30) 로 송신되지 않았거나, (ii) 비디오 디코더 (30) 에 의해 수신되지 않거나, 또는 (iii) 비디오 디코더 (30) 에 의해 수신되지만 비디오 디코더 (30) 는 수신된 블록 레벨 신택스 엘리먼트에 대한 참조 없이 화소 스캔 순서를 유추하도록 구성되기 때문이다.

예를 들어, 비디오 디코더 (30) 는 픽처의 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록을 수신하도록 구성될 수도 있다. 비디오 디코더 (30) 는 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트를 수신하는 일 없이 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 유추하도록 구성될 수도 있다. 다른 예에서, 비디오 디코더 (30) 는 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트에 (그것이 수신되든 또는 아니든) 기초하지 않고 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 유추하도록 구성될 수도 있다. 비디오 디코더 (30) 는 유추된 화소 스캔 순서를 사용하여 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록을 디코딩하도록 구성될 수도 있다.

일부 예들에서, 비디오 디코더 (30) 는 픽처의 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록을 수신하도록 구성될 수도 있다. 이러한 예들에서, 비디오 디코더 (30) 는 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트를 수신하도록 구성될 수도 있다. 비디오 디코더 (30) 는 수신된 블록 레벨 신택스 엘리먼트에 기초하여 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 결정하도록 구성될 수도 있다. 비디오 디코더 (30) 는 결정된 화소 스캔 순서를 사용하여 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록을 디코딩하도록 구성될 수도 있다.

본 개시물의 기법들에 따른 다른 예에서, 비디오 인코더 (20) 는 비디오 데이터의 블록에 대한 스캐닝 순서를 시그널링할지의 여부를 결정하도록 구성될 수도 있다. 비디오 인코더 (20) 는 이 결정에 기초하여 비디오 데이터의 블록에 대한 스캐닝 순서를 시그널링하거나 또는 시그널링하지 않도록 구성될 수도 있다. 예를 들어, 스캐닝 순서를 시그널링할지의 여부를 결정하는 것은 비디오 데이터의 블록의 팔레트 사이즈에 기초할 수도 있다.

예를 들어, 비디오 인코더 (20) 는 비디오 데이터의 블록이 팔레트 모드를 사용하여 인코딩될 것이라고 결정하도록 구성될 수도 있다. 비디오 인코더 (20) 는 비디오 데이터의 블록에 대한 팔레트 사이즈를 결정하도록 구성될 수도 있다. 비디오 인코더 (20) 는 비디오 데이터의 블록에 대한 화소 스캔 순서를 결정하도록 구성될 수도 있다. 비디오 인코더 (20) 는 팔레트 모드를 사용하여 비디오 데이터의 블록을 인코딩하도록 구성될 수도 있다. 비디오 인코더 (20) 는 팔레트 사이즈에 기초하여 비디오 데이터의 블록에 대해 사용된 화소 스캔 순서를 나타내는 제 1 블록 레벨 신택스 엘리먼트를 시그널링할지의 여부를 결정하도록 구성될 수도 있다.

본 개시물은 다른 디바이스, 이를테면 비디오 디코더 (30) 에 특정 정보를 "시그널링하는" 또는 "송신하는" 비디오 인코더 (20) 에 일반적으로 관련이 있을 수도 있다. "시그널링" 또는 "송신"이란 용어는 압축된 비디오 데이터를 디코딩하는데 사용되는 신택스 엘리먼트들 및/또는 다른 데이터의 통신을 일반적으로는 지칭할 수도 있다. 이러한 통신은 실시간 또는 거의 실시간으로 일어날 수도 있다. 대안으로, 이러한 통신은, 인코딩 시에 신택스 엘리먼트들을 인코딩된 비트스트림으로 컴퓨터 판독가능 저장 매체에 저장하고 그 신택스 엘리먼트들이 이 매체에 저장된 후의 임의의 시간에 디코딩 디바이스에 의해 취출될 수도 있는 경우에 일어날 바와 같이 어떤 기간 (span of time) 에 걸쳐 일어날 수도 있다.

일부 예들에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 비디오 압축 표준, 이를테면 위에서 언급되고 HEVC 초안 10에서 설명된 HEVC 표준에 따라 동작한다. 기본 HEVC 표준 외에도, HEVC에 대한 스케일러블 비디오 코딩, 멀티뷰 비디오 코딩, 및 3D 코딩 확장본들을 생성하기 위한 진행중인 노력들이 있다. 덧붙여서, 예컨대 본 개시물에서 설명되는 바와 같은, 팔레트 기반 비디오 코딩 모드들은, HEVC 표준의 확장본에서 제공될 수도 있다. 일부 예들에서, 팔레트 기반 비디오 코딩에 대한 본 개시물에서 설명된 기법들은 다른 비디오 코딩 표준들, 이를테면 ITU-T-H.264/AVC 표준 또는 장래의 표준들에 따라 동작하도록 구성되는 인코더들 및 디코더들에 적용될 수도 있다. 따라서, HEVC 코덱에서의 코딩 유닛들 (CU들) 또는 예측 유닛들 (PU들) 의 코딩을 위한 팔레트 기반 비디오 코딩 모드의 애플리케이션이 예의 목적들을 위해 설명된다.

HEVC 및 다른 비디오 코딩 표준들에서, 비디오 시퀀스가 일련의 픽처들을 통상 포함한다. 픽처들은 "프레임들"이라고 또한 지칭될 수도 있다. 픽처가 S_L, S_Cb 및 S_Cr로 표시되는 세 개의 샘플 어레이들을 포함할 수도 있다. S_L은 루마 샘플들의 2차원 어레이 (즉, 블록) 이다. S_Cb는 Cb 색차 샘플들의 2차원 어레이이다. S_Cr은 Cr 색차 샘플들의 2차원 어레이이다. 색차 샘플들은 본원에서 "크로마" 샘플들이라고 또한 지칭될 수도 있다. 다른 사례들에서, 픽처가 모노크롬일 수도 있고 루마 샘플들의 어레이만을 포함할 수도 있다.

픽처의 인코딩된 표현을 생성하기 위해, 비디오 인코더 (20) 는 코딩 트리 유닛들 (coding tree units, CTU) 의 세트를 생성할 수도 있다. CTU들의 각각은, 루마 샘플들의 코딩 트리 블록 (coding tree block), 크로마 샘플들의 두 개의 대응 코딩 트리 블록들, 및 코딩 트리 블록들의 샘플들을 코딩하는데 사용된 신택스 구조들일 수도 있다. 코딩 트리 블록이 샘플들의 NxN 블록일 수도 있다. CTU가 "트리 블록" 또는 "최대 코딩 유닛 (largest coding unit, LCU)"이라고 또한 지칭될 수도 있다. HEVC의 CTU들은 다른 표준들, 이를테면 H.264/AVC의 매크로블록들과 대체로 유사할 수도 있다. 그러나, CTU가 특정 사이즈로 반드시 제한되는 것은 아니고 하나 이상의 코딩 유닛들 (CU들) 을 포함할 수도 있다. 슬라이스가 래스터 스캔으로 연속하여 순서화된 정수 수의 CTU들을 포함할 수도 있다.

코딩된 CTU를 생성하기 위해, 비디오 인코더 (20) 는 CTU의 코딩 트리 블록들에 대해 쿼드트리 구획화를 재귀적으로 수행하여 코딩 트리 블록들을 코딩 블록들로 나눌 수도 있으며, 그래서 그 이름이 "코딩 트리 유닛들"이다. 코딩 블록이 샘플들의 NxN 블록이다. CU가, 루마 샘플 어레이, Cb 샘플 어레이 및 Cr 샘플 어레이를 갖는 픽처의 루마 샘플들의 코딩 블록 및 크로마 샘플들의 대응하는 두 개의 코딩 블록들과, 그 코딩 블록들의 샘플들을 코딩하는데 사용된 신택스 구조들일 수도 있다. 비디오 인코더 (20) 는 CU의 코딩 블록을 하나 이상의 예측 블록들로 구획화할 수도 있다. 예측 블록이 동일한 예측이 적용되는 샘플들의 직사각형 (즉, 정사각형 또는 정사각형 아닌) 블록일 수도 있다. CU의 예측 유닛 (PU) 이 픽처의 루마 샘플들의 예측 블록, 크로마 샘플들의 두 개의 대응하는 예측 블록들, 및 예측 블록 샘플들을 예측하는데 사용된 신택스 구조들일 수도 있다. 비디오 인코더 (20) 는 CU의 각각의 PU의 루마, Cb 및 Cr 예측 블록들에 대한 예측 루마, Cb 및 Cr 블록들을 생성할 수도 있다.

비디오 인코더 (20) 는 PU에 대한 예측 블록들을 생성하기 위해 인트라 예측 또는 인터 예측을 사용할 수도 있다. 비디오 인코더 (20) 가 PU의 예측 블록들을 생성하기 위해 인트라 예측을 사용하면, 비디오 인코더 (20) 는 그 PU에 연관된 픽처의 디코딩된 샘플들에 기초하여 그 PU의 예측 블록들을 생성할 수도 있다.

비디오 인코더 (20) 가 PU의 예측 블록들을 생성하기 위해 인터 예측을 사용하면, 비디오 인코더 (20) 는 그 PU에 연관된 픽처 이외의 하나 이상의 픽처들의 디코딩된 샘플들에 기초하여 그 PU의 예측 블록들을 생성할 수도 있다. 비디오 인코더 (20) 는 PU의 예측 블록들을 생성하기 위해 단-예측 (uni-prediction) 또는 양-예측 (bi-prediction) 을 사용할 수도 있다. 비디오 인코더 (20) 가 단-예측을 사용하여 PU에 대한 예측 블록들을 생성하는 경우, 그 PU는 단일 모션 벡터 (MV) 를 가질 수도 있다. 비디오 인코더 (20) 가 양-예측을 사용하여 PU에 대한 예측 블록들을 생성하는 경우, PU는 두 개의 MV들을 가질 수도 있다.

비디오 인코더 (20) 가 CU의 하나 이상의 PU들에 대한 예측 루마, Cb 및 Cr 블록들을 생성한 후, 비디오 인코더 (20) 는 그 CU에 대한 루마 잔차 블록을 생성할 수도 있다. CU의 루마 잔차 블록에서의 각각의 샘플은 CU의 예측 루마 블록들 중 하나의 예측 루마 블록에서의 루마 샘플과 CU의 원래의 루마 코딩 블록에서의 대응하는 샘플 간의 차이를 나타낸다. 덧붙여서, 비디오 인코더 (20) 는 CU에 대한 Cb 잔차 블록을 생성할 수도 있다. CU의 Cb 잔차 블록에서의 각각의 샘플은 CU의 예측 Cb 블록들 중 하나의 예측 Cb 블록에서의 Cb 샘플과 CU의 원래의 Cb 코딩 블록에서의 대응 샘플 간의 차이를 나타낼 수도 있다. 비디오 인코더 (20) 는 CU에 대한 Cr 잔차 블록을 또한 생성할 수도 있다. CU의 Cr 잔차 블록에서의 각각의 샘플은 CU의 예측 Cr 블록들 중 하나의 예측 Cr 블록에서의 Cr 샘플과 CU의 원래의 Cr 코딩 블록에서의 대응 샘플 간의 차이를 나타낼 수도 있다.

더욱이, 비디오 인코더 (20) 는 쿼드트리 구획화를 사용하여 CU의 루마, Cb 및 Cr 잔차 블록들을 하나 이상의 루마, Cb 및 Cr 변환 블록들로 분해할 수도 있다. 변환 블록이 동일한 변환이 적용되는 샘플들의 직사각형 블록일 수도 있다. CU의 변환 유닛 (transform unit, TU) 이 루마 샘플들의 변환 블록, 크로마 샘플들의 2 개의 대응하는 변환 블록들, 및 변환 블록 샘플들을 변환하는데 사용된 신택스 구조들일 수도 있다. 따라서, CU의 각각의 TU는 루마 변환 블록, Cb 변환 블록, 및 Cr 변환 블록에 연관될 수도 있다. TU에 연관된 루마 변환 블록은 CU의 루마 잔차 블록의 서브-블록일 수도 있다. Cb 변환 블록은 CU의 Cb 잔차 블록의 서브-블록일 수도 있다. Cr 변환 블록은 CU의 Cr 잔차 블록의 서브-블록일 수도 있다.

비디오 인코더 (20) 는 하나 이상의 변환들을 TU의 루마 변환 블록에 적용하여 그 TU에 대한 루마 계수 블록을 생성할 수도 있다. 계수 블록이 변환 계수들의 2차원 어레이일 수도 있다. 변환 계수가 스칼라 양일 수도 있다. 비디오 인코더 (20) 는 하나 이상의 변환들을 TU의 Cb 변환 블록에 적용하여 TU에 대한 Cb 계수 블록을 생성할 수도 있다. 비디오 인코더 (20) 는 하나 이상의 변환들을 TU의 Cr 변환 블록에 적용하여 TU에 대한 Cr 계수 블록을 생성할 수도 있다.

계수 블록 (예컨대, 루마 계수 블록, Cb 계수 블록 또는 Cr 계수 블록) 을 생성한 후, 비디오 인코더 (20) 는 그 계수 블록을 양자화할 수도 있다. 양자화는 변환 계수들이 그 변환 계수들을 표현하는데 사용된 데이터의 양을 가능한 한 줄이도록 양자화되어서, 추가의 압축을 제공하는 프로세스를 일반적으로 지칭한다. 비디오 인코더 (20) 가 계수 블록을 앙자화한 후, 비디오 인코더 (20) 는 양자화된 변환 계수들을 나타내는 신택스 엘리먼트들을 엔트로피 인코딩할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 양자화된 변환 계수들을 나타내는 신택스 엘리먼트들에 대해 콘텍스트 적응 이진 산술 코딩 (Context-Adaptive Binary Arithmetic Coding, CABAC) 을 수행할 수도 있다. 비디오 인코더 (20) 는 엔트로피 인코딩된 신택스 엘리먼트들을 비트스트림으로 출력할 수도 있다.

비디오 인코더 (20) 는 엔트로피 인코딩된 신택스 엘리먼트들을 포함하는 비트스트림을 출력할 수도 있다. 그 비트스트림은 코딩된 픽처들 및 연관된 데이터의 표현을 형성하는 비트들의 시퀀스를 포함할 수도 있다. 그 비트스트림은 네트워크 추상화 계층 (network abstraction layer, NAL) 유닛들의 시퀀스를 포함할 수도 있다. NAL 유닛들의 각각은 NAL 유닛 헤더를 포함하고 원시 바이트 시퀀스 패이로드 (raw byte sequence payload, RBSP) 를 캡슐화한다. NAL 유닛 헤더는 NAL 유닛 유형 코드를 나타내는 신택스 엘리먼트를 포함할 수도 있다. NAL 유닛의 NAL 유닛 헤더에 의해 특정된 NAL 유닛 유형 코드는 NAL 유닛의 유형을 나타낸다. RBSP가 NAL 유닛 내에 캡슐화되는 정수 수의 바이트들을 포함하는 신택스 구조일 수도 있다. 일부 사례들에서, RBSP가 영 비트들을 포함한다.

상이한 유형들의 NAL 유닛들이 상이한 유형들의 RBSP들을 캡슐화할 수도 있다. 예를 들어, 제 1 유형의 NAL 유닛이 픽처 파라미터 세트 (picture parameter set, PPS) 에 대한 RBSP를 캡슐화할 수도 있으며, 제 2 유형의 NAL 유닛이 코딩된 슬라이스에 대한 RBSP를 캡슐화할 수도 있으며, 제 3 유형의 NAL 유닛이 SEI에 대한 RBSP를 캡슐화할 수도 있다는 등등이다. 비디오 코딩 데이터에 대한 RBSP들 (파라미터 세트들 및 SEI 메시지들에 대한 RBSP과는 대조적임) 을 캡슐화하는 NAL 유닛들은, 비디오 코딩 계층 (video coding layer, VCL) NAL 유닛들이라고 지칭될 수도 있다.

비디오 디코더 (30) 는 비디오 인코더 (20) 에 의해 생성된 비트스트림을 수신할 수도 있다. 덧붙여서, 비디오 디코더 (30) 는 그 비트스트림으로부터 신택스 엘리먼트들을 디코딩하기 위해 그 비트스트림을 파싱할 수도 있다. 비디오 디코더 (30) 는 비트스트림으로부터 디코딩된 신택스 엘리먼트들에 적어도 부분적으로 기초하여 비디오 데이터의 픽처들을 복원할 수도 있다. 비디오 데이터를 복원하는 프로세스는 비디오 인코더 (20) 에 의해 수행된 프로세스에 일반적으로 역일 수도 있다. 예를 들면, 비디오 디코더 (30) 는 현재 CU의 PU들에 대한 예측 블록들을 결정하기 위해 그 PU들의 MV들을 사용할 수도 있다. 덧붙여서, 비디오 디코더 (30) 는 현재 CU의 TU들에 연관된 변환 계수 블록들을 역 양자화할 수도 있다. 비디오 디코더 (30) 는 현재 CU의 TU들에 연관된 변환 블록들을 복원하기 위해 변환 계수 블록들에 대해 역 변환들을 수행할 수도 있다. 비디오 디코더 (30) 는 현재 CU의 PU들에 대한 예측 블록들의 샘플들을 현재 CU의 TU들의 변환 블록들의 대응 샘플들에 가산함으로써 현재 CU의 코딩 블록들을 복원할 수도 있다. 픽처의 각각의 CU에 대한 코딩 블록들을 복원함으로써, 비디오 디코더 (30) 는 그 픽처를 복원할 수도 있다.

일부 예들에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 팔레트 기반 비디오 코딩을 수행하도록 구성될 수도 있다. 예를 들어, 팔레트 기반 비디오 코딩에서는, 위에서 설명된 인트라 예측 또는 인터 예측 코딩 기법들을 수행하는 것이 아니라, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 특정 영역 (예컨대, 주어진 블록) 의 비디오 데이터를 표현하기 위한 컬러들의 테이블로서 이른바 팔레트를 코딩할 수도 있다. 각각의 화소는 화소의 컬러를 표현하는 팔레트에서의 엔트리와 연관될 수도 있다. 예를 들어, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 화소 값을 팔레트에서의 적절한 값에 관련시키는 인덱스를 코딩할 수도 있다.

팔레트 기반 비디오 코딩의 예에서, 비디오 인코더 (20) 는 블록에 대한 팔레트를 결정하며, 각각의 화소의 값을 표현하기 위해 팔레트에서 엔트리의 위치를 찾아내고, 화소 값을 팔레트에 관련시키는 화소들에 대한 인덱스 값들로 팔레트를 인코딩함으로써 비디오 데이터의 블록을 인코딩할 수도 있다. 비디오 디코더 (30) 는, 인코딩된 비트스트림으로부터, 블록에 대한 팔레트, 뿐만 아니라 그 블록의 화소들에 대한 인덱스 값들을 획득할 수도 있다. 비디오 디코더 (30) 는 블록의 화소 값들을 복원하기 위해 화소들의 인덱스 값들을 팔레트의 엔트리들에 매핑할 수도 있다.

본 개시물의 일부 예들에서, 비디오 인코더 (20) 는 동일한 화소 값을 갖는 주어진 스캔 순서에서의 다수의 연속적인 화소들을 나타내는 하나 이상의 신택스 엘리먼트들을 인코딩할 수도 있다. 유사 값으로 된 화소 값들의 문자열이 본원에서 "런"이라고 지칭될 수도 있다. 예시의 목적을 위한 일 예에서, 주어진 스캔 순서에서의 두 개의 연속적인 화소들이 상이한 값들을 갖는다면, 런은 영과 동일하다. 주어진 스캔 순서에서의 두 개의 연속적인 화소들이 동일한 값을 갖지만 스캔 순서에서의 세 번째 인덱스가 상이한 값을 갖는다면, 런은 일과 동일하다. 비디오 디코더 (30) 는 인코딩된 비트스트림으로부터 런을 나타내는 신택스 엘리먼트들을 획득하고 그 데이터를 사용하여 동일한 인덱스 값을 갖는 연속적인 화소 로케이션들의 수를 결정할 수도 있다.

본 개시물의 일부 예들에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 맵의 하나 이상의 엔트리들에 대한 라인 복사를 수행할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 지도에서의 특정 엔트리에 대한 화소 값이 그 특정 엔트리 상측의 라인에서의 엔트리와 동일하다는 것을 나타낼 수도 있다. 비디오 인코더 (20) 는, 런으로서, 특정 엔트리 상측의 라인에서의 엔트리와 동일한 스캔 순서에서의 인덱스들의 수를 또한 나타낼 수도 있다. 이 예에서, 비디오 인코더 (20) 및 또는 비디오 디코더 (30) 는 현재 코딩되고 있는 맵의 라인에 대해 특정된 이웃 라인으로부터 그리고 특정된 수의 엔트리들로부터 인덱스 값들을 복사할 수도 있다.

타일들 및 파두 병렬 프로세싱 (wavefront parallel processing, WPP) 을 포함하여 HEVC 기반 코덱들을 더욱 병렬 친화적이게 하는 여러 제안들이 이루어졌다. HEVC WD10은, 타일의 코딩 트리 블록 래스터 스캔으로 연속하여 순서화되는, 하나의 열 및 하나의 행에서 함께 발생하는 정수 수의 코딩 트리 블록들을 타일들로서 정의한다. 각각의 픽처의 타일들로의 분할은 구획화이다. 타일들의 수와 그 타일들의 경계들의 로케이션들은 전체 시퀀스에 대해 정의되거나 또는 픽처마다 변경될 수도 있다. 타일 경계들은, 슬라이스 경계들과 유사하게, 타일이 독립적으로 프로세싱될 수 있도록 파싱 및 예측 의존관계들을 깨뜨리지만, 루프 내 필터들 (블록화제거 및 샘플 적응 오프셋 (sample adaptive offset, SAO)) 은 타일 경계들을 여전히 가로지를 수 있다. HEVC WD10은 슬라이스들과 타일들 간의 관계에 대한 일부 제약조건들을 또한 특정한다.

본 개시물의 양태들에 따르면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 아래의 도 4 내지 도 11에 관한 것과 같은 본 명세서에서 설명되는 팔레트 모드 코딩을 위한 기법들의 임의의 조합을 수행할 수도 있다.

도 2는 본 개시물의 기법들을 구현할 수도 있는 예시적인 비디오 인코더 (20) 를 도시하는 블록도이다. 도 2는 설명의 목적으로 제공되고 본 개시물에서 폭넓게 예시되고 설명된 바와 같은 기법들의 제한으로서 고려되지 않아야 한다. 설명의 목적으로, 본 개시물은 HEVC 코딩의 맥락에서 비디오 인코더 (20) 를 설명한다. 그러나, 본 개시물의 기법들은 다른 코딩 표준들 또는 방법들에 적용 가능할 수도 있다.

비디오 인코더 (20) 는 본 개시물에서 설명되는 다양한 예들에 따라 팔레트 기반 비디오 코딩을 위한 기법들을 수행하도록 구성될 수도 있는 디바이스의 일 예를 나타낸다. 예를 들어, 비디오 인코더 (20) 는 팔레트 기반 비디오 코딩 또는 비-팔레트 기반 비디오 코딩 중 어느 하나를 사용하여 비디오 데이터의 다양한 블록들, 이를테면 HEVC 코딩에서의 CU들 또는 PU들을, 선택적으로 코딩하도록 구성될 수도 있다. 비-팔레트 기반 비디오 코딩 모드들은 다양한 인터 예측 시간적 코딩 모드들 또는 인터 예측 공간적 코딩 모드들, 이를테면 HEVC 초안 10에 의해 특정된 다양한 코딩 모드들을 지칭할 수도 있다. 비디오 인코더 (20) 는, 하나의 예에서, 화소 값들을 나타내는 엔트리들을 갖는 팔레트를 생성하도록, 비디오 데이터의 블록의 적어도 일부 화소 로케이션들의 화소 값들을 표현하기 위해 팔레트에서의 화소 값들을 선택하도록, 그리고 비디오 데이터의 블록에서의 화소 로케이션들 중 적어도 일부의 화소 로케이션과 팔레트에서의 선택된 화소 값들에 각각 대응하는 팔레트에서의 엔트리들을 연관시키는 정보를 시그널링하도록 구성될 수도 있다. 시그널링된 정보는 비디오 데이터를 디코딩하기 위해 비디오 디코더 (30) 에 의해 사용될 수도 있다.

도 2의 예에서, 비디오 인코더 (20) 는 블록 인코딩 부 (100), 비디오 데이터 메모리 (101), 잔차 생성 부 (102), 변환 프로세싱 부 (104), 양자화 부 (106), 역 양자화 부 (108), 역 변환 프로세싱 부 (110), 복원 부 (112), 필터 부 (114), 디코딩된 픽처 버퍼 (decoded picture buffer) (116), 및 엔트로피 인코딩 부 (118) 를 포함한다. 블록 인코딩 부 (100) 는 인터 예측 프로세싱 부 (120) 와 인트라 예측 프로세싱 부 (126) 를 구비한다. 인터 예측 프로세싱 부 (120) 는 모션 추정 부와 모션 보상 부 (미도시) 를 구비한다. 비디오 인코더 (20) 는 본 개시물에서 설명되는 팔레트 기반 비디오 코딩 기법들의 다양한 양태들을 수행하도록 구성되는 팔레트 기반 인코딩 부 (122) 를 또한 구비한다. 다른 예들에서, 비디오 인코더 (20) 는 더 많거나, 더 적거나, 또는 상이한 기능성 컴포넌트들을 포함할 수도 있다.

비디오 데이터 메모리 (101) 는 비디오 인코더 (20) 의 컴포넌트들에 의해 인코딩될 비디오 데이터를 저장할 수도 있다. 비디오 데이터 메모리 (101) 에 저장된 비디오 데이터는, 예를 들어, 비디오 소스 (18) 로부터 획득될 수도 있다. 디코딩된 픽처 버퍼 (DPB) (116) 가, 예컨대, 인트라 코딩 또는 인터 코딩 모드들에서 비디오 인코더 (20) 에 의해 비디오 데이터를 인코딩함에 있어서의 사용을 위한 참조 비디오 데이터를 저장하는 참조 픽처 메모리일 수도 있다. 비디오 데이터 메모리 (101) 와 디코딩된 픽처 버퍼 (116) 는 동기식 DRAM (SDRAM) 을 포함하는 다이나믹 랜덤 액세스 메모리 (dynamic random access memory, DRAM), 자기저항 RAM (MRAM), 저항 RAM (RRAM), 또는 다른 유형들의 메모리 디바이스들과 같은 다양한 메모리 디바이스들 중 임의의 것에 의해 형성될 수도 있다. 비디오 데이터 메모리 (101) 와 디코딩된 픽처 버퍼 (116) 는 동일한 메모리 디바이스 또는 별개의 메모리 디바이스들에 의해 제공될 수도 있다. 다양한 예들에서, 비디오 데이터 메모리 (101) 는 비디오 인코더 (20) 의 다른 컴포넌트들과 온-칩, 또는 그들 컴포넌트들에 대하여 오프-칩일 수도 있다.

비디오 인코더 (20) 는 비디오 데이터를 수신할 수도 있다. 비디오 인코더 (20) 는 비디오 데이터의 픽처의 슬라이스에서의 각각의 CTU를 인코딩할 수도 있다. CTU들의 각각은 픽처의 동일 사이즈로 된 루마 코딩 트리 블록들 (CTB들) 및 대응하는 CTB들에 연관될 수도 있다. CTU를 인코딩하는 부분으로서, 블록 인코딩 부 (100) 는 쿼드트리 구획화를 수행하여 CTU의 CTB들을 점차적으로 더 작은 블록들로 분할할 수도 있다. 더 작은 블록은 CU들의 코딩 블록들일 수도 있다. 예를 들어, 블록 인코딩 부 (100) 는 CTU에 연관된 CTB를 네 개의 동일 사이즈로 된 서브-블록들로 구획화하며, 그 서브-블록들 중 하나 이상을 네 개의 동일 사이즈로 된 서브-서브-블록들로 구획화하는 등등을 수행할 수도 있다.

비디오 인코더 (20) 는 CTU의 CU들을 인코딩하여 CU들의 인코딩된 표현들 (즉, 코딩된 CU들) 을 생성할 수도 있다. CU를 인코딩하는 부분으로서, 블록 인코딩 부 (100) 는 CU의 하나 이상의 PU들 중에서 CU에 연관된 코딩 블록들을 구획화할 수도 있다. 따라서, 각각의 PU는 루마 예측 블록 및 대응하는 크로마 예측 블록들에 연관될 수도 있다. 비디오 인코더 (20) 와 비디오 디코더 (30) 는 다양한 사이즈들을 갖는 PU들을 지원할 수도 있다. 위에서 나타낸 바와 같이, CU의 사이즈는 CU의 루마 코딩 블록의 사이즈를 지칭할 수도 있고 PU의 사이즈는 PU의 루마 예측 블록의 사이즈를 지칭할 수도 있다. 특정 CU의 사이즈가 2Nx2N이라고 가정하면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 인트라 예측을 위한 2Nx2N 또는 NxN의 PU 사이즈들과, 인터 예측을 위한 2Nx2N, 2NxN, Nx2N, NxN, 또는 유사한 것의 대칭적 PU 사이즈들을 지원할 수도 있다. 비디오 인코더 (20) 와 비디오 디코더 (30) 는 인터 예측을 위해 2NxnU, 2NxnD, nLx2N, 및 nRx2N의 PU 사이즈들에 대한 비대칭 구획화를 또한 지원할 수도 있다.

인터 예측 프로세싱 부 (120) 는 CU의 각각의 PU에 대해 인터 예측을 수행함으로써 PU에 대한 예측 데이터를 생성할 수도 있다. PU에 대한 예측 데이터는 PU의 예측 블록들 및 그 PU에 대한 모션 정보를 포함할 수도 있다. 인터 예측 부 (121) 는 PU가 I 슬라이스, P 슬라이스, 또는 B 슬라이스 중 어느 것에 있는지에 의존하여 CU의 PU에 대해 상이한 동작들을 수행할 수도 있다. I 슬라이스에서, 모든 PU들이 인트라 예측된다. 그런고로, PU가 I 슬라이스에 있으면, 인터 예측 부 (121) 는 PU에 대해 인터 예측을 수행하지 않는다. 따라서, I-모드에서 인코딩된 블록들에 대해, 예측된 블록은 동일한 프레임 내의 이전에 인코딩된 이웃 블록들로부터 공간적 예측을 사용하여 형성된다.

PU가 P 슬라이스에 있다면, 인터 예측 프로세싱 부 (120) 의 모션 추정 부는 PU에 대한 참조 지역을 참조 픽처들의 리스트 (예컨대, "RefPicList0") 에서의 참조 픽처들에서 검색할 수도 있다. PU에 대한 참조 지역은, 참조 픽처 내의, PU의 샘플 블록들에 가장 밀접하게 대응하는 샘플 블록들을 포함하는 지역일 수도 있다. 모션 추정 부는 PU에 대한 참조 지역을 포함하는 참조 픽처의 RefPicList0에서의 포지션을 나타내는 참조 인덱스를 생성할 수도 있다. 덧붙여서, 모션 추정 부는 PU의 코딩 블록 및 참조 지역에 연관된 참조 로케이션 사이의 공간적 변위를 나타내는 MV를 생성할 수도 있다. 예를 들면, MV는 현재 디코딩된 픽처에서의 좌표들로부터 참조 픽처에서의 좌표들로의 오프셋을 제공하는 2차원 벡터일 수도 있다. 모션 추정 부는 참조 인덱스 및 MV를 PU의 모션 정보로서 출력할 수도 있다. 인터 예측 프로세싱 부 (120) 의 모션 보상 부는 PU의 모션 벡터에 의해 가리켜진 참조 로케이션에 있는 실제 또는 보간된 샘플들에 기초하여 PU의 예측 블록들을 생성할 수도 있다.

PU가 B 슬라이스에 있다면, 모션 추정 부는 PU에 대해 단-예측 또는 양-예측을 수행할 수도 있다. PU에 대한 단-예측을 수행하기 위해, 모션 추정 부는 PU에 대한 참조 지역을 RefPicList0 또는 제 2 참조 픽처 리스트 ("RefPicList1") 의 참조 픽처들에서 검색할 수도 있다. 모션 추정 부는, PU의 모션 정보로서, 참조 지역을 포함하는 참조 픽처의 RefPicList0 또는 RefPicList1에서의 포지션을 나타내는 참조 인덱스, PU의 예측 블록 및 참조 지역에 연관된 참조 로케이션 사이의 공간적 변위를 나타내는 MV, 및 참조 픽처가 RefPicList0에 있는지 또는 RefPicList1에 있는지를 나타내는 하나 이상의 예측 방향 표시자들을 출력할 수도 있다. 인터 예측 프로세싱 부 (120) 의 모션 보상 부는 PU의 모션 벡터에 의해 가리켜진 참조 지역에 있는 실제 또는 보간된 샘플들에 적어도 부분적으로 기초하여 PU의 예측 블록들을 생성할 수도 있다.

PU에 대한 양방향 인터 예측을 수행하기 위해, 모션 추정 부는 그 PU에 대한 참조 지역을 RefPicList0에서의 참조 픽처들에서 검색할 수도 있고, 또한 그 PU에 대한 다른 참조 지역을 RefPicList1에서의 참조 픽처들에서 검색할 수도 있다. 모션 추정 부는 참조 지역들을 포함하는 참조 픽처들의 RefPicList0 및 RefPicList1에서의 포지션들을 나타내는 참조 픽처 인덱스들을 생성할 수도 있다. 덧붙여서, 모션 추정 부는 참조 지역들에 연관된 참조 로케이션 및 PU의 샘플 블록 사이의 공간적 변위들을 나타내는 MV들을 생성할 수도 있다. PU의 모션 정보는 PU의 MV들 및 참조 인덱스들을 포함할 수도 있다. 모션 보상 부는 PU의 모션 벡터들에 의해 나타내어진 참조 지역들에 있는 실제 또는 보간된 샘플들에 적어도 부분적으로 기초하여 PU의 예측 블록들을 생성할 수도 있다.

본 개시물의 다양한 예들에 따라, 비디오 인코더 (20) 는 팔레트 기반 비디오 코딩을 수행하도록 구성될 수도 있다. HEVC 프레임워크에 관해, 일 예로서, 팔레트 기반 비디오 코딩 기법들이 CU 레벨에서 사용되도록 구성될 수도 있다. 다른 예들에서, 팔레트 기반 비디오 코딩 기법들은 PU 레벨에서 사용되도록 구성될 수도 있다. 다른 예들에서, 팔레트 기반 비디오 코딩 기법들은 서브-예측 유닛 (서브-PU) 레벨 (예컨대, 예측 유닛의 서브블록) 에서 사용되도록 구성될 수도 있다. 따라서, CU 레벨의 맥락에서 (본 개시물의 전체에 걸쳐) 본 명세서에서 설명되는 개시된 프로세스들의 모두는 PU 레벨 또는 서브-PU 레벨에 부가적으로 또는 대안으로 적용될 수도 있다. 그러나, 이들 HEVC 기반 예들은 본원에서 설명되는 팔레트 기반 비디오 코딩 기법들의 제약 또는 제한으로서 간주되지 않아야 하는데, 이러한 기법들이 다른 현존의 또는 아직 개발되지 않은 시스템들/표준들과는 상관없이 또는 그러한 시스템들/표준들의 부분으로서 작동하기 위해 적용될 수도 있어서이다. 이들 경우들에서, 팔레트 코딩을 위한 유닛은 정사각형 블록들, 직사각형 블록들 또는 심지어 비-직사각형 형상의 지역들일 수 있다.

팔레트 기반 인코딩 부 (122) 는, 팔레트 기반 인코딩 모드가, 예컨대, CU 또는 PU에 대해 선택되는 경우, 예를 들어 팔레트 기반 인코딩을 수행할 수도 있다. 예를 들어, 팔레트 기반 인코딩 부 (122) 는, 화소 값들을 나타내는 엔트리들을 갖는 팔레트를 생성하도록, 비디오 데이터의 블록의 적어도 일부 포지션들의 화소 값들을 표현하기 위해 팔레트에서의 화소 값들을 선택하도록, 그리고 비디오 데이터의 블록의 포지션들 중 적어도 일부의 포지션들과 선택된 화소 값들에 각각 대응하는 팔레트에서의 엔트리들을 연관시키는 정보를 시그널링하도록 구성될 수도 있다. 비록 다양한 기능들이 팔레트 기반 인코딩 부 (122) 에 의해 수행되고 있는 것으로서 설명되지만, 이러한 기능들의 일부 또는 전부는 다른 프로세싱 유닛들, 또는 상이한 프로세싱 유닛들의 조합에 의해 수행될 수도 있다.

본 개시물의 양태들에 따르면, 팔레트 기반 인코딩 부 (122) 는 아래의 도 4 내지 도 11에 관한 것과 같은 본원에서 설명되는 팔레트 코딩을 위한 기법들의 임의의 조합을 수행하도록 구성될 수도 있다.

예를 들어, 팔레트 기반 인코딩 부 (122) 는 비디오 데이터의 블록에 대한 스캐닝 순서를 시그널링할지의 여부를 결정하도록 구성될 수도 있다. 팔레트 기반 인코딩 부 (122) 는 이 결정에 기초하여 비디오 데이터의 블록에 대한 스캐닝 순서를 시그널링하거나 또는 시그널링하지 않도록 구성될 수도 있다. 예를 들어, 스캐닝 순서를 시그널링할지의 여부를 결정하는 것은 비디오 데이터의 블록의 팔레트 사이즈에 기초할 수도 있다.

예를 들어, 팔레트 기반 인코딩 부 (122) 는 비디오 데이터의 블록이 팔레트 모드를 사용하여 인코딩될 것이라고 결정하도록 구성될 수도 있다. 팔레트 기반 인코딩 부 (122) 는 비디오 데이터의 블록에 대한 팔레트 사이즈를 결정하도록 구성될 수도 있다. 팔레트 기반 인코딩 부 (122) 는 비디오 데이터의 블록에 대한 화소 스캔 순서를 결정하도록 구성될 수도 있다. 팔레트 기반 인코딩 부 (122) 는 팔레트 모드를 사용하여 비디오 데이터의 블록을 인코딩하도록 구성될 수도 있다. 팔레트 기반 인코딩 부 (122) 는 팔레트 사이즈에 기초하여 비디오 데이터의 블록에 대해 사용된 화소 스캔 순서를 나타내는 제 1 블록 레벨 신택스 엘리먼트를 시그널링할지의 여부를 결정하도록 구성될 수도 있다.

다른 예로서, 본 개시물의 양태들에 따르면, 팔레트 기반 인코딩 부 (122) 는 화소들의 복수의 행들 중 다른 행이 첫번째 행 상측에 없는 경우, 복사 모드를 사용하여 비디오 데이터의 팔레트 모드 인코딩된 블록에서의 화소들의 첫 번째 행에서의 적어도 하나의 화소를 인코딩하도록 구성될 수도 있다.

인트라 예측 프로세싱 부 (126) 는 PU에 대해 인트라 예측을 수행함으로써 그 PU에 대한 예측 데이터를 생성할 수도 있다. PU에 대한 예측 데이터는 PU에 대한 예측 블록들과 다양한 신택스 엘리먼트들을 포함할 수도 있다. 인트라 예측 프로세싱 부 (126) 는 I 슬라이스들, P 슬라이스들, 및 B 슬라이스들에서의 PU들에 대해 인트라 예측을 수행할 수도 있다.

PU에 대해 인트라 예측을 수행하기 위해, 인트라 예측 프로세싱 부 (126) 는 PU에 대한 예측 데이터의 다수의 세트들을 생성하기 위해 다수의 인트라 예측 모드들을 사용할 수도 있다. 인트라 예측 프로세싱 부 (126) 는 이웃하는 PU들의 샘플 블록들로부터의 샘플들을 사용하여 PU에 대한 예측 블록을 생성할 수도 있다. PU들, CU들, 및 CTU들에 대한 좌측에서 우측으로, 상단에서 하단으로의 인코딩 순서를 가정하면, 이웃하는 PU들은 PU의 상측, 우상측, 좌상측, 또는 좌측에 있을 수도 있다. 인트라 예측 프로세싱 부 (126) 는 다양한 수들의 인트라 예측 모드들, 예컨대, 33 개의 방향성 인트라 예측 모드들을 사용할 수도 있다. 일부 예들에서, 인트라 예측 모드들의 수는 PU에 연관된 지역의 사이즈에 의존할 수도 있다.

블록 인코딩 부 (100) 는 CU의 PU들에 대한 예측 데이터를, 그 PU들에 대해 인터 예측 프로세싱 부 (120) 에 의해 생성된 예측 데이터 또는 그 PU들에 대해 인트라 예측 프로세싱 부 (126) 에 의해 생성된 예측 데이터 중에서 선택할 수도 있다. 일부 예들에서, 블록 인코딩 부 (100) 는 예측 데이터의 세트들의 레이트/왜곡 메트릭들에 기초하여 CU의 PU들에 대한 예측 데이터를 선택한다. 선택된 예측 데이터의 예측 블록들은 본원에서는 선택된 예측 블록들이라고 지칭될 수도 있다.

잔차 생성 부 (102) 는, CU의 루마, Cb 및 Cr 코딩 블록과 CU의 PU들의 선택된 예측 루마, Cb 및 Cr 블록들에 기초하여, CU의 루마, Cb 및 Cr 잔차 블록들을 생성할 수도 있다. 예를 들면, 잔차 생성 부 (102) 는 CU의 잔차 블록들에서의 각각의 샘플이 그 CU의 코딩 블록에서의 샘플 및 그 CU의 PU의 대응하는 선택된 예측 블록에서의 대응하는 샘플 사이의 차이와 동일한 값을 가지도록 CU의 잔차 블록들을 생성할 수도 있다.

변환 프로세싱 부 (104) 는 쿼드트리 구획화를 수행하여 CU에 연관된 잔차 블록들을 그 CU의 TU들에 연관된 변환 블록들로 구획화할 수도 있다. 따라서, TU가 루마 변환 블록 및 두 개의 크로마 변환 블록들에 연관될 수도 있다. CU의 TU들의 루마 및 크로마 변환 블록들의 사이즈들 및 포지션들은 그 CU의 PU들의 예측 블록들의 사이즈들 및 포지션들에 기초할 수도 있거나 또는 기초하지 않을 수도 있다. "잔차 쿼드-트리 (residual quad-tree)" (RQT) 로서 알려진 쿼드트리 구조가 지역들의 각각에 연관된 노드들을 포함할 수도 있다. CU의 TU들은 RQT의 리프 노드들에 대응할 수도 있다.

변환 프로세싱 부 (104) 는 CU의 각각의 TU에 대한 변환 계수 블록들을, 하나 이상의 변환들을 그 TU의 변환 블록들에 적용함으로써 생성할 수도 있다. 변환 프로세싱 부 (104) 는 다양한 변환들을 TU에 연관된 변환 블록에 적용할 수도 있다. 예를 들어, 변환 프로세싱 부 (104) 는 이산 코사인 변환 (discrete cosine transform, DCT), 방향성 변환, 또는 개념적으로 유사한 변환을 변환 블록에 적용할 수도 있다. 일부 예들에서, 변환 프로세싱 부 (104) 는 변환들을 변환 블록에 적용하지 않는다. 그런 예들에서, 변환 블록은 변환 계수 블록으로서 다루어질 수도 있다.

양자화 부 (106) 는 계수 블록에서의 변환 계수들을 양자화할 수도 있다. 양자화 프로세스는 변환 계수들의 일부 또는 전부에 연관된 비트 깊이를 감소시킬 수도 있다. 예를 들어, n-비트 변환 계수가 양자화 동안에 m-비트 변환 계수로 버림될 (rounded down) 수도 있으며, 여기서 n은 m보다 크다. 양자화 부 (106) 는 CU에 연관된 양자화 파라미터 (quantization parameter, QP) 값에 기초하여 그 CU의 TU에 연관된 계수 블록을 양자화할 수도 있다. 비디오 인코더 (20) 는 CU에 연관된 QP 값을 조정함으로써 그 CU에 연관된 계수 블록들에 적용되는 양자화 정도를 조정할 수도 있다. 양자화는 정보의 손실을 도입할 수도 있고, 따라서 양자화된 변환 계수들은 원래의 것들보다 더 낮은 정밀도를 가질 수도 있다.

역 양자화 부 (108) 와 역 변환 프로세싱 부 (110) 는 계수 블록으로부터 잔차 블록을 복원하기 위해 역 양자화 및 역 변환들을 계수 블록에 각각 적용할 수도 있다. 복원 부 (112) 는 TU에 연관된 복원된 변환 블록을 생성하기 위해 복원된 잔차 블록을 블록 인코딩 부 (100) 에 의해 생성된 하나 이상의 예측 블록들로부터의 대응하는 샘플들에 가산할 수도 있다. CU의 각각의 TU에 대한 변환 블록들을 이런 식으로 복원함으로써, 비디오 인코더 (20) 는 CU의 코딩 블록들을 복원할 수도 있다.

필터 부 (114) 는 하나 이상의 블록화제거 (deblocking) 동작들을 수행하여 CU에 연관된 코딩 블록들에서의 블록화 아티팩트들을 감소시킬 수도 있다. 필터 부 (114) 는, 샘플 적응 오프셋 (SAO) 필터링 및/또는 적응적 루프 필터링 (adaptive loop filtering, ALF) 을 포함하는, 다른 필터링 동작들을 수행할 수도 있다. 디코딩된 픽처 버퍼 (116) 는, 필터 부 (114) 가 복원된 코딩 블록들에 대해 하나 이상의 블록화제거 동작들을 수행한 후에 복원된 코딩 블록들을 저장할 수도 있다. 인터 예측 프로세싱 부 (120) 는 다른 픽처들의 PU들에 대해 인터 예측을 수행하기 위해 복원된 코딩 블록들을 포함하는 참조 픽처를 사용할 수도 있다. 덧붙여서, 인트라 예측 프로세싱 부 (126) 는 CU와 동일한 픽처에서의 다른 PU들에 대해 인트라 예측을 수행하기 위해 디코딩된 픽처 버퍼 (116) 에서의 복원된 코딩 블록들을 사용할 수도 있다.

엔트로피 인코딩 부 (118) 는 비디오 인코더 (20) 의 다른 기능성 컴포넌트들로부터 데이터를 수신할 수도 있다. 예를 들어, 엔트로피 인코딩 부 (118) 는 양자화 부 (106) 로부터 계수 블록들을 수신할 수도 있고 블록 인코딩 부 (100) 로부터 신택스 엘리먼트들을 수신할 수도 있다. 엔트로피 인코딩 부 (118) 는 그 데이터에 대해 하나 이상의 엔트로피 인코딩 동작들을 수행하여 엔트로피 인코딩된 데이터를 생성할 수도 있다. 예를 들어, 엔트로피 인코딩 부 (118) 는 그 데이터에 대해 콘텍스트 적응 가변 길이 코딩 (context-adaptive variable length coding, CAVLC) 동작, CABAC 동작, 가변 대 가변 (variable-to-variable, V2V) 길이 코딩 동작, 신택스 기반 콘텍스트 적응 이진 산술 코딩 (syntax-based context-adaptive binary arithmetic coding, SBAC) 동작, 확률 간격 구획화 엔트로피 (Probability Interval Partitioning Entropy, PIPE) 코딩 동작, 지수-골롬 (Exponential-Golomb) 인코딩 동작, 또는 다른 유형의 엔트로피 인코딩 동작을 수행할 수도 있다. 비디오 인코더 (20) 는 엔트로피 인코딩 부 (118) 에 의해 생성된 엔트로피 인코딩된 데이터를 포함하는 비트스트림을 출력할 수도 있다. 예를 들면, 그 비트스트림은 CU에 대한 RQT를 표현하는 데이터를 포함할 수도 있다.

본 개시물의 양태들에 따르면, 엔트로피 인코딩 부 (118) 는 본 개시물의 다양한 도면들, 이를테면 도 1에 관해 본 명세서에서 설명되는 바와 같은 k차 절단된 지수-골롬 (truncated Exponential-Golomb, TEGk) 코드를 사용하여 팔레트 데이터를 코딩하도록 구성될 수도 있다. 특히, 본 개시물의 양태들에 따르면 엔트로피 인코딩 부 (118) 는 비디오 데이터의 인코딩된 블록의 화소들의 첫 번째 행에서의 적어도 하나의 화소가 복사 모드를 사용하여 인코딩되었다는 것을 나타내는 데이터를 인코딩할 수도 있다. 일부 예들에서, 엔트로피 인코딩 부 (118) 는 첫 번째 행 복사 모드 가능 데이터를 TEGk 코드를 사용하여 인코딩할 수도 있다.

도 3은 본 개시물의 기법들을 구현하도록 구성되는 예시적인 비디오 디코더 (30) 를 도시하는 블록도이다. 도 3은 설명의 목적으로 제공되고 본 개시물에서 폭넓게 예시되고 설명된 바와 같은 기법들에 대해 제한하고 있지는 않다. 설명의 목적으로, 본 개시물은 HEVC 코딩의 맥락에서 비디오 디코더 (30) 를 설명한다. 그러나, 본 개시물의 기법들은 다른 코딩 표준들 또는 방법들에 적용 가능할 수도 있다.

비디오 인코더 (20) 는 본 개시물에서 설명되는 다양한 예들에 따라 팔레트 기반 비디오 코딩을 위한 기법들을 수행하도록 구성될 수도 있는 디바이스의 일 예를 나타낸다. 예를 들어, 비디오 인코더 (20) 는 팔레트 기반 비디오 코딩 또는 비-팔레트 기반 비디오 코딩 중 어느 하나를 사용하여 비디오 데이터의 다양한 블록들, 이를테면 HEVC 코딩에서의 CU들 또는 PU들을, 선택적으로 디코딩하도록 구성될 수도 있다. 비-팔레트 기반 비디오 코딩 모드들은 다양한 인터 예측 시간적 코딩 모드들 또는 인터 예측 공간적 코딩 모드들, 이를테면 HEVC 초안 10에 의해 특정된 다양한 코딩 모드들을 지칭할 수도 있다. 비디오 디코더 (30) 는, 하나의 예에서, 화소 값들을 나타내는 엔트리들을 갖는 팔레트를 생성하도록, 비디오 데이터의 블록의 적어도 일부 화소 로케이션들과 팔레트에서의 엔트리들을 연관시키는 정보를 수신하도록, 그 정보에 기초하여 팔레트에서의 화소 값들을 선택하도록, 그리고 팔레트에서의 선택된 화소 값들에 기초하여 블록의 화소 값들을 복원하도록 구성될 수도 있다.

도 3의 예에서, 비디오 디코더 (30) 는 엔트로피 디코딩 부 (150), 비디오 데이터 메모리 (151), 블록 디코딩 부 (152), 역 양자화 부 (154), 역 변환 프로세싱 부 (156), 복원 부 (158), 필터 부 (160), 및 디코딩된 픽처 버퍼 (162) 를 구비한다. 블록 디코딩 부 (152) 는 모션 보상 부 (164) 와 인트라 예측 프로세싱 부 (166) 를 구비한다. 비디오 디코더 (30) 는 본 개시물에서 설명되는 팔레트 기반 비디오 코딩 기법들의 다양한 양태들을 수행하도록 구성되는 팔레트 기반 디코딩 부 (165) 를 또한 구비한다. 다른 예들에서, 비디오 디코더 (30) 는 더 많거나, 더 적거나, 또는 상이한 기능성 컴포넌트들을 포함할 수도 있다.

비디오 데이터 메모리 (151) 는, 비디오 디코더 (30) 의 컴포넌트들에 의해 디코딩될 인코딩된 비디오 비트스트림과 같은 비디오 데이터를 저장할 수도 있다. 비디오 데이터 메모리 (151) 에 저장된 비디오 데이터는, 예를 들어, 채널 (16) 로부터, 예컨대, 카메라와 같은 국부 비디오 소스로부터, 비디오 데이터의 유선 또는 무선 네트워크 통신을 통해, 또는 물리적 데이터 저장 매체들에 액세스함으로써 획득될 수도 있다. 비디오 데이터 메모리 (151) 는 인코딩된 비디오 비트스트림으로부터의 인코딩된 비디오 데이터를 저장하는 코딩된 픽처 버퍼 (coded picture buffer, CPB) 를 형성할 수도 있다. 디코딩된 픽처 버퍼 (162) 가, 예컨대 인트라 코딩 또는 인터 코딩 모드들에서, 비디오 디코더 (30) 에 의해 비디오 데이터를 디코딩함에 있어서의 사용을 위한 참조 비디오 데이터를 저장하는 참조 픽처 메모리일 수도 있다. 비디오 데이터 메모리 (151) 와 디코딩된 픽처 버퍼 (162) 는 동기식 DRAM (SDRAM) 을 포함한 다이나믹 랜덤 액세스 메모리 (DRAM), 자기저항 RAM (MRAM), 저항 RAM (RRAM), 또는 다른 유형들의 메모리 디바이스들과 같은 다양한 메모리 디바이스들 중 임의의 것에 의해 형성될 수도 있다. 비디오 데이터 메모리 (151) 와 디코딩된 픽처 버퍼 (162) 는 동일한 메모리 디바이스 또는 별개의 메모리 디바이스들에 의해 제공될 수도 있다. 다양한 예들에서, 비디오 데이터 메모리 (151) 는 비디오 디코더 (30) 의 다른 컴포넌트들과 온-칩, 또는 그들 컴포넌트들에 대하여 오프-칩일 수도 있다.

코딩된 픽처 버퍼 (CPB) 가 비트스트림의 인코딩된 비디오 데이터 (예컨대, NAL 유닛들) 를 수신하고 저장할 수도 있다. 엔트로피 디코딩 부 (150) 는 CPB로부터 인코딩된 비디오 데이터 (예컨대, NAL 유닛들) 를 수신하고 신택스 엘리먼트들을 디코딩하기 위해 그 NAL 유닛들을 파싱할 수도 있다. 엔트로피 디코딩 부 (150) 는 NAL 유닛들에서의 엔트로피 인코딩된 신택스 엘리먼트들을 엔트로피 디코딩할 수도 있다.

본 개시물의 양태들에 따르면, 엔트로피 디코딩 부 (150) 는 도 1의 예에 관해 위에서 설명된 바와 같이, TEGk 코드를 사용하여 팔레트 데이터를 디코딩하도록 구성될 수도 있다. 특히, 본 개시물의 양태들에 따르면 엔트로피 디코딩 부 (150) 는 비디오 데이터의 인코딩된 블록의 화소들의 첫 번째 행에서의 적어도 하나의 화소가 복사 모드를 사용하여 인코딩되었다는 것을 나타내는 데이터를 디코딩할 수도 있다. 일부 예들에서, 엔트로피 디코딩 부 (150) 는 TEGk 코드를 사용하여 첫 번째 행 복사 모드 가능 데이터를 디코딩할 수도 있다.

블록 디코딩 부 (152), 역 양자화 부 (154), 역 변환 프로세싱 부 (156), 복원 부 (158), 및 필터 부 (160) 는 비트스트림으로부터 추출된 신택스 엘리먼트들에 기초하여 디코딩된 비디오 데이터를 생성할 수도 있다.

비트스트림의 NAL 유닛들은 코딩된 슬라이스 NAL 유닛들을 포함할 수도 있다. 비트스트림을 디코딩하는 부분으로서, 엔트로피 디코딩 부 (150) 는 코딩된 슬라이스 NAL 유닛들로부터 신택스 엘리먼트들을 추출하고 엔트로피 디코딩할 수도 있다. 코딩된 슬라이스들의 각각은 슬라이스 헤더 및 슬라이스 데이터를 포함할 수도 있다. 슬라이스 헤더는 슬라이스에 관계된 신택스 엘리먼트들을 포함할 수도 있다. 슬라이스 헤더에서의 신택스 엘리먼트들은 슬라이스를 포함하는 픽처에 연관된 PPS를 식별하는 신택스 엘리먼트를 포함할 수도 있다.

비트스트림으로부터 신택스 엘리먼트들을 디코딩하는 것 외에도, 비디오 디코더 (30) 는 비구획화된 CU에 대해 복원 동작을 수행할 수도 있다. 비구획화된 CU에 대해 복원 동작을 수행하기 위해, 비디오 디코더 (30) 는 CU의 각각의 TU에 대해 복원 동작을 수행할 수도 있다. CU의 각각의 TU에 대한 복원 동작을 수행함으로써, 비디오 디코더 (30) 는 CU의 잔차 블록들을 복원할 수도 있다.

CU의 TU에 대해 복원 동작을 수행하는 부분으로서, 역 양자화 부 (154) 는 TU에 연관된 계수 블록들을 역 양자화, 즉, 탈양자화 (de-quantization) 할 수도 있다. 역 양자화 부 (154) 는 TU의 CU에 연관된 QP 값을 사용하여 양자화 정도와, 비슷하게, 역 양자화 부 (154) 에 대해 적용할 역 양자화 정도를 결정할 수도 있다. 다시 말하면, 압축 비율, 즉, 원래의 시퀀스 및 압축된 시퀀스를 표현하는데 사용된 비트들의 수의 비율은, 변환 계수들을 양자화하는 경우에 사용된 QP의 값을 조정함으로써 제어될 수도 있다. 압축 비율은 채용된 엔트로피 코딩하는 방법에 또한 의존할 수도 있다.

역 양자화 부 (154) 가 계수 블록을 역 양자화한 후, 역 변환 프로세싱 부 (156) 는 TU에 연관된 잔차 블록을 생성하기 위하여 하나 이상의 역 변환들을 계수 블록에 적용할 수도 있다. 예를 들어, 역 변환 프로세싱 부 (156) 는 역 DCT, 역 정수 변환, 역 카루넨-뢰베 변환 (Karhunen-Loeve transform, KLT), 역 회전 변환, 역 방향성 변환, 또는 다른 역 변환을 계수 블록에 적용할 수도 있다.

PU가 인트라 예측을 사용하여 인코딩되면, 인트라 예측 프로세싱 부 (166) 는 PU에 대한 예측 블록들을 생성하기 위해 인트라 예측을 수행할 수도 있다. 인트라 예측 프로세싱 부 (166) 는 인트라 예측 모드를 사용하여 공간적으로 이웃하는 PU들의 예측 블록들에 기초하여 PU에 대한 예측 루마, Cb 및 Cr 블록들을 생성할 수도 있다. 인트라 예측 프로세싱 부 (166) 는 비트스트림으로부터 디코딩된 하나 이상의 신택스 엘리먼트들에 기초하여 PU에 대한 인트라 예측 모드를 결정할 수도 있다.

블록 디코딩 부 (152) 는 비트스트림으로부터 추출된 신택스 엘리먼트들에 기초하여 제 1 참조 픽처 리스트 (RefPicList0) 및 제 2 참조 픽처 리스트 (RefPicList1) 를 구축할 수도 있다. 더욱이, PU가 인터 예측을 사용하여 인코딩되면, 엔트로피 디코딩 부 (150) 는 그 PU에 대한 모션 정보를 추출할 수도 있다. 모션 보상 부 (164) 는, PU의 모션 정보에 기초하여, PU에 대한 하나 이상의 참조 지역들을 결정할 수도 있다. 모션 보상 부 (164) 는, PU에 대한 하나 이상의 참조 블록들에서의 샘플 블록들에 기초하여, PU에 대한 예측 루마, Cb 및 Cr 블록들을 생성할 수도 있다.

복원 부 (158) 는, 해당되는 경우, CU의 TU들에 연관된 루마, Cb 및 Cr 변환 블록들과 그 CU의 PU들의 예측 루마, Cb 및 Cr 블록들, 즉 인트라 예측 데이터 또는 인터 예측 데이터 중 어느 하나를 사용하여 그 CU의 루마, Cb 및 Cr 코딩 블록들을 복원할 수도 있다. 예를 들어, 복원 부 (158) 는 루마, Cb 및 Cr 변환 블록들의 샘플들을 예측 루마, Cb 및 Cr 블록들의 대응하는 샘플들에 가산하여 CU의 루마, Cb 및 Cr 코딩 블록들을 복원할 수도 있다.

필터 부 (160) 는 블록화제거 동작을 수행하여 CU의 루마, Cb 및 Cr 코딩 블록들에 연관된 블록화 아티팩트들을 감소시킬 수도 있다. 필터 부 (160) 는, 샘플 적응 오프셋 (SAO) 필터링 및/또는 적응적 루프 필터링 (ALF) 을 포함하는, 다른 필터링 동작들을 수행할 수도 있다. 비디오 디코더 (30) 는 CU의 루마, Cb 및 Cr 코딩 블록들을 디코딩된 픽처 버퍼 (162) 에 저장할 수도 있다. 디코딩된 픽처 버퍼 (162) 는 후속하는 모션 보상, 인트라 예측, 및 디스플레이 디바이스, 이를테면 도 1의 디스플레이 디바이스 (32) 상의 프레젠테이션을 위해 참조 픽처들을 제공할 수도 있다. 예를 들면, 비디오 디코더 (30) 는, 디코딩된 픽처 버퍼 (162) 에서의 루마, Cb, 및 Cr 블록들에 기초하여, 다른 CU들의 PU들에 대해 인트라 예측 또는 인터 예측 동작들을 수행할 수도 있다.

본 개시물의 다양한 예들에 따라, 비디오 디코더 (30) 는 팔레트 기반 비디오 코딩을 수행하도록 구성될 수도 있다. 팔레트 기반 디코딩 부 (165) 는, 팔레트 기반 디코딩 모드가, 예컨대, CU 또는 PU에 대해 선택되는 경우, 예를 들어 팔레트 기반 디코딩을 수행할 수도 있다. 예를 들어, 팔레트 기반 디코딩 부 (165) 는, 화소 값들을 나타내는 엔트리들을 갖는 팔레트를 생성하도록, 비디오 데이터의 블록에서의 적어도 일부 화소 로케이션들과 팔레트에서의 엔트리들을 연관시키는 정보를 수신하도록, 그 정보에 기초하여 팔레트에서의 화소 값들을 선택하도록, 그리고 팔레트에서의 선택된 화소 값들에 기초하여 블록의 화소 값들을 복원하도록 구성될 수도 있다. 비록 다양한 기능들이 팔레트 기반 디코딩 부 (165) 에 의해 수행되고 있는 것으로서 설명되지만, 이러한 기능들의 일부 또는 전부는 다른 프로세싱 유닛들, 또는 상이한 프로세싱 유닛들의 조합에 의해 수행될 수도 있다.

팔레트 기반 디코딩 부 (165) 는 팔레트 코딩 모드 정보를 수신하고, 팔레트 코딩 모드가 블록에 적용됨을 팔레트 코딩 모드 정보가 나타내는 경우 위의 동작들을 수행할 수도 있다. 팔레트 코딩 모드가 블록에 적용되지 않음을 팔레트 코딩 모드 정보가 나타내는 경우, 또는 다른 모드 정보가 상이한 모드의 사용을 나타내는 경우, 비디오 디코더 (30) 는 비-팔레트 기반 비디오 코딩 모드, 예컨대, 이러한 HEVC 인터 예측 또는 인트라 예측 코딩 모드를 사용하여 비디오 데이터의 블록을 디코딩할 수도 있다. 비디오 데이터의 블록은, 예를 들어, HEVC 코딩 프로세스에 따라 생성된 CU 또는 PU일 수도 있다.

본 개시물의 양태들에 따르면, 팔레트 기반 디코딩 부 (165) 는 본원에서 설명되는 팔레트 코딩을 위한 기법들의 임의의 조합을 수행하도록 구성될 수도 있다.

본 개시물의 기법들에 따라 팔레트 기반 디코딩 부 (165) 는 비디오 데이터의 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 유추하도록 구성될 수도 있다. 예를 들어, 팔레트 기반 디코딩 부 (165) 는 비디오 데이터의 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트를 수신하는 일 없이 비디오 데이터의 인코딩된 블록에 대한 화소 스캔 순서를 유추하도록 구성될 수도 있다. 다른 예로서, 팔레트 기반 디코딩 부 (165) 는 비디오 데이터의 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트에 기초하지 않고 비디오 데이터의 인코딩된 블록에 대한 화소 스캔 순서를 유추하도록 구성될 수도 있는데, 블록 레벨 신택스 엘리먼트는 (i) 팔레트 기반 디코딩 부 (165) 로 송신되지 않았거나, (ii) 팔레트 기반 디코딩 부 (165) 에 의해 수신되지 않거나, 또는 (iii) 팔레트 기반 디코딩 부 (165) 에 의해 수신되지만 팔레트 기반 디코딩 부 (165) 는 수신된 블록 레벨 신택스 엘리먼트에 대한 참조 없이 화소 스캔 순서를 유추하도록 구성될 수도 있기 때문이다.

예를 들어, 팔레트 기반 디코딩 부 (165) 는 픽처의 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록을 수신하도록 구성될 수도 있다. 팔레트 기반 디코딩 부 (165) 는 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트를 수신하는 일 없이 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 유추하도록 구성될 수도 있다. 다른 예에서, 팔레트 기반 디코딩 부 (165) 는 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트에 (그것이 수신되든 아니든) 기초하지 않고 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 유추하도록 구성될 수도 있다. 팔레트 기반 디코딩 부 (165) 는 유추된 화소 스캔 순서를 사용하여 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록을 디코딩하도록 구성될 수도 있다.

일부 예들에서, 팔레트 기반 디코딩 부 (165) 는 픽처의 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록을 수신하도록 구성될 수도 있다. 이러한 예들에서, 팔레트 기반 디코딩 부 (165) 는 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트를 수신하도록 구성될 수도 있다. 팔레트 기반 디코딩 부 (165) 는 수신된 블록 레벨 신택스 엘리먼트에 기초하여 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 결정하도록 구성될 수도 있다. 팔레트 기반 디코딩 부 (165) 는 결정된 화소 스캔 순서를 사용하여 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록을 디코딩하도록 구성될 수도 있다.

다른 예로서, 본 개시물의 양태들에 따르면, 팔레트 기반 디코딩 부 (165) 는 화소들의 복수의 행들 중 다른 행이 첫 번째 행 상측에 없는 경우 복사 모드를 사용하여 비디오 데이터의 팔레트 모드 인코딩된 블록에서의 화소들의 첫 번째 행에서의 적어도 하나의 화소를 디코딩하도록 구성될 수도 있다.

도 4는 본 개시물의 기법들과 일치하게, 비디오 데이터를 코딩하기 위한 팔레트를 결정하는 일 예를 도시하는 개념도이다. 도 4의 예는 제 1 팔레트들 (184) 에 연관되는 제 1 팔레트 코딩된 (PAL) 코딩 유닛 (CU) (180) 과 제 2 팔레트들 (192) 에 연관되는 제 2 PAL CU (188) 를 갖는 픽처 (178) 를 포함한다. 아래에서 더욱 상세히 그리고 본 개시물의 기법들에 따라 설명되는 바와 같이, 제 2 팔레트들 (192) 은 제 1 팔레트들 (184) 에 기초한다. 픽처 (178) 는 인트라 예측 코딩 모드로 코딩된 블록 (196) 과 인터 예측 코딩 모드로 코딩되는 블록 (200) 을 또한 포함한다.

도 4의 기법들은 설명의 목적으로 비디오 인코더 (20) (도 1 및 도 2) 와 비디오 디코더 (30) (도 1 및 도 3) 의 맥락에서 그리고 HEVC 비디오 코딩 표준에 관해 설명된다. 그러나, 본 개시물의 기법들은 이런 식으로 제한되지 않고, 다른 비디오 코딩 프로세스들 및/또는 표준들에서 다른 비디오 코딩 프로세서들 및/또는 디바이스들에 의해 응용될 수도 있다는 것이 이해되어야 한다.

대체로, 팔레트가 현재 코딩되고 있는 CU, 즉 도 4의 예에서의 CU (188) 에 대해 우세하며 그리고/또는 대표하는 다수의 화소 값들에 관련된다. 제 1 팔레트들 (184) 과 제 2 팔레트들 (192) 은 다수의 팔레트들을 포함하는 것으로서 도시되어 있다. 일부 예들에서, 본 개시물의 양태들에 따르면, 비디오 코더 (이를테면 비디오 인코더 (20) 또는 비디오 디코더 (30)) 가 CU의 각각의 컬러 성분에 대해 팔레트들을 따로따로 코딩할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 CU의 루마 (Y) 성분에 대한 팔레트, CU의 크로마 (U) 성분에 대한 다른 팔레트, 및 CU의 크로마 (V) 성분에 대한 또 다른 팔레트를 인코딩할 수도 있다. 이 예에서, Y 팔레트의 엔트리들은 CU의 화소들의 Y 값들을 표현할 수도 있으며, U 팔레트의 엔트리들은 CU의 화소들의 U 값들을 표현할 수도 있고, V 팔레트의 엔트리들은 CU의 화소들의 V 값들을 표현할 수도 있다.

다른 예들에서, 비디오 인코더 (20) 는 CU의 모든 컬러 성분들에 대해 단일 팔레트를 인코딩할 수도 있다. 이 예에서, 비디오 인코더 (20) 는 Yi, Ui, 및 Vi를 포함하는 3중 값인 i번째 엔트리를 갖는 팔레트를 인코딩할 수도 있다. 이 경우, 팔레트는 화소들의 성분들의 각각에 대한 값들을 포함한다. 따라서, 다수의 개개의 팔레트들을 갖는 팔레트들의 세트로서의 팔레트들 (184 및 192) 의 표현은 단지 하나의 예이고 제한하려는 의도는 아니다.

도 4의 예에서, 제 1 팔레트들 (184) 은 엔트리 인덱스 값 1, 엔트리 인덱스 값 2, 및 엔트리 인덱스 값 3을 각각 갖는 세 개의 엔트리들 (202~206) 을 포함한다. 엔트리들 (202~206) 은 인덱스 값들을 화소 값 A, 화소 값 B, 및 화소 값 C를 포함하는 화소 값들에 각각 관련시킨다. 본원에서 설명된 바와 같이, 제 1 CU (180) 의 실제 화소 값들을 코딩하는 것이 아니라, 비디오 코더 (이를테면 비디오 인코더 (20) 또는 비디오 디코더 (30)) 가 인덱스들 (1~3) 을 사용하여 블록의 화소들을 코딩하기 위해 팔레트 기반 비디오 코딩을 사용할 수도 있다. 다시 말하면, 제 1 CU (180) 의 각각의 화소 포지션에 대해, 비디오 인코더 (20) 는 화소에 대한 인덱스 값을 인코딩할 수도 있으며, 여기서 인덱스 값은 제 1 팔레트들 (184) 중 하나 이상의 제 1 팔레트에서의 화소 값에 연관된다. 비디오 디코더 (30) 는 비트스트림으로부터 인덱스 값들을 획득하고 그 인덱스 값들 및 하나 이상의 제 1 팔레트들 (184) 을 사용하여 화소 값들을 복원할 수도 있다. 따라서, 제 1 팔레트들 (184) 은 팔레트 기반 디코딩에서 비디오 디코더 (30) 에 의한 사용을 위해 인코딩된 비디오 데이터 비트스트림에서 비디오 인코더 (20) 에 의해 송신된다.

일부 예들에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 제 1 팔레트들 (184) 에 기초하여 제 2 팔레트들 (192) 을 결정할 수도 있다. 예를 들어, 비디오 인코더 (20) 및/또는 비디오 디코더 (30) 는 예측 팔레트들, 이 예에서는 제 1 팔레트들 (184) 이, 결정되는 하나 이상의 블록들의 위치를 찾아낼 수도 있다. 예측을 목적으로 사용되고 있는 엔트리들의 조합은 예측자 팔레트라고 지칭될 수도 있다.

도 4의 예에서, 제 2 팔레트들 (192) 은 엔트리 인덱스 값 1, 엔트리 인덱스 값 2, 및 엔트리 인덱스 값 3을 각각 갖는 세 개의 엔트리들 (208~212) 을 포함한다. 엔트리들 (208~212) 은 인덱스 값들을 화소 값 A, 화소 값 B, 및 화소 값 D를 포함하는 화소 값들에 각각 관련시킨다. 이 예에서, 비디오 인코더 (20) 는 제 1 팔레트들 (184) 중 어떤 엔트리들 (예측자 팔레트를 표현하지만, 예측자 팔레트는 다수의 블록들의 엔트리들을 포함할 수도 있음) 이 제 2 팔레트들 (192) 에 포함되는지를 나타내는 하나 이상의 신택스 엘리먼트들을 코딩할 수도 있다.

도 4의 예에서, 하나 이상의 신택스 엘리먼트들은 벡터 (216) 로서 예시된다. 벡터 (216) 는 다수의 연관된 빈들 (또는 비트들) 을 가지며, 각각의 빈은 그 빈에 연관된 예측자 팔레트가 현재 팔레트의 엔트리를 예측하기 위해 사용되는지의 여부를 나타낸다. 예를 들어, 벡터 (216) 는 제 1 팔레트들 (184) 의 처음 두 개의 엔트리들 (202 및 204) 이 제 2 팔레트들 (192) 에 포함되는 반면 (벡터 (216) 에서의 "1"의 값), 제 1 팔레트들 (184) 의 제 3 엔트리는 제 2 팔레트들 (192) 에 포함되지 않는다 (벡터 (216) 에서의 "0" 의 값) 는 것을 나타낸다. 도 4의 예에서, 벡터는 부울 벡터 (Boolean vector) 이다. 그 벡터는 팔레트 예측 벡터라고 지칭될 수도 있다.

일부 예들에서, 본원에서 언급된 바와 같이, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 팔레트 예측을 수행하는 경우 예측자 팔레트 (이는 예측자 팔레트 테이블 또는 예측자 팔레트 리스트라고 또한 지칭될 수도 있음) 를 결정할 수도 있다. 팔레트 예측자는 현재 블록을 코딩하기 위한 팔레트의 하나 이상의 엔트리들을 예측하는데 사용되는 하나 이상의 이웃 블록들의 팔레트들로부터의 엔트리들을 포함할 수도 있다. 비디오 인코더 (20) 와 비디오 디코더 (30) 는 그 리스트를 동일한 방식으로 구축할 수도 있다. 비디오 인코더 (20) 와 비디오 디코더 (30) 는 예측자 팔레트의 어떤 엔트리들이 현재 블록을 코딩하기 위한 팔레트에 복사될 것인지를 나타내기 위해 데이터 (이를테면 벡터 (216)) 를 코딩할 수도 있다.

따라서, 일부 예들에서, 이전에 디코딩된 팔레트 엔트리들은 팔레트 예측자로서 사용하기 위해 리스트에 저장된다. 이 리스트는 현재 팔레트 모드 CU에서의 팔레트 엔트리들을 예측하는데 사용될 수도 있다. 이진 예측 벡터가 리스트에서의 어떤 엔트리들이 현재 팔레트에서 재사용되는지를 나타내기 위해 비트스트림에서 시그널링될 수도 있다. 2014년 6월 27일자로 출원된 미국 가출원 제62/018,461호에서, 런 길이 코딩이 이진 팔레트 예측자를 압축하기 위해 사용된다. 일 예에서, 런 길이 값은 0차 지수-골롬 코드를 사용하여 코딩된다.

본 개시물의 양태들에 따르면, 일부 예들에서, 비디오 인코더 (20) 와 비디오 디코더 (30) (예컨대, 엔트로피 인코딩 부 (118) 와 엔트로피 디코딩 부 (150)) 는, 도 1의 예에 관해 위에서 설명된 바와 같이, k차 절단된 지수-골롬 (TEGk) 코드를 사용하여 블록의 팔레트에 대한 이진 팔레트 예측 벡터를 코딩 (예컨대, 각각 인코딩 및 디코딩) 하도록 구성될 수도 있다.

일부 사례들에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 표준 제출 문서 『Seregin et al., "Non-SCCE3: Run-Length Coding for Palette Predictor," JCTVC-R0228, Sapporo, JP, 30 June - 9 July 2014』 (이하, JCTVC-R0228) 에서 설명된 기법들에 연계하여 TEGk 코드를 사용하여 이진 팔레트 예측 벡터를 코딩하도록 구성될 수도 있다. JCTVC-R0228에서, 런 길이 코딩은 이진 벡터에서의 영의 엘리먼트들을 다음의 조건 및 단계들로 코딩하는데 사용된다:

■ 1과 동일한 런 길이 값은 예측의 말단을 나타낸다

■ 예측의 말단은 이진 벡터에서의 마지막 1에 대해 시그널링되지 않는다.

■ 선행하는 영의 엘리먼트들의 수는 이진 벡터에서의 모든 1에 대해 코딩된다.

■ 영의 엘리먼트들의 수가 0을 초과한다면, 1의 이스케이프 값으로 인해, 그 숫자 더하기 1 이 시그널링된다.

■ 런 길이 값은 0차 지수 골롬 코드를 사용하여 코딩된다.

예시의 목적을 위한 일 예에서, 이진 팔레트 예측 벡터가, 팔레트 예측자의 네 개의 엔트리들 (네 개의 것들에 의해 나타내어짐) 이 현재 블록을 코딩하기 위해 팔레트에 복사됨을 나타내는 {1100100010000}과 동일할 수도 있다. 이 예에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 그 벡터를 0-0-3-4-1로서 코딩할 수도 있다.

본 개시물의 양태들에 따르면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는, 팔레트 예측자 리스트에서의 팔레트 엔트리들의 수 빼기 스캐닝 순서에서의 현재 포지션 빼기 일과 동일하게 될 수도 있는, 벡터에 대한 최대 런 값 (X) 을 사용하여 이진 팔레트 예측 벡터를 코딩할 수도 있다. 하나의 예에 따르면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 런 값을 코딩하기 위해 TEG0 코드를 사용한다.

도 5는 본 개시물의 기법들과 일치하게, 화소들의 블록을 위한 팔레트로의 인덱스들을 결정하는 일 예를 도시하는 개념도이다. 예를 들어, 도 5는 팔레트 인덱스들에 연관된 화소들의 각각의 포지션들을 팔레트들 (244) 의 엔트리에 관련시키는 팔레트 인덱스들의 맵 (240) 을 포함한다.

예를 들어, 인덱스 1은 값 A와 연관되며, 인덱스 2는 값 B와 연관되고, 인덱스 3은 값 C와 연관된다. 덧붙여서, 이스케이프 샘플들이 암시적 이스케이프 시그널링을 사용하여 나타내어지는 경우, 비디오 인코더 (20) 와 비디오 디코더 (30) 는, 인덱스 4에 연관된 맵 (240) 의 샘플들이 이스케이프 샘플들이라는 것을 나타낼 수도 있는, 도 5에서 인덱스 4로서 예시되는 추가적인 인덱스를 팔레트들 (244) 에 또한 추가할 수도 있다. 이 경우에, 화소 값이 팔레트들 (244) 에 포함되지 않는다면, 맵 (240) 에서의 포지션에 대한 실제 화소 값 (또는 그것의 양자화된 버전) 의 표시를 비디오 인코더 (20) 는 인코딩할 수도 있 (고 비디오 디코더 (30) 는 인코딩된 비트스트림으로 획득할 수도 있) 다.

일부 예들에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 어떤 화소 포지션들이 연관된 팔레트 인덱스들인지를 나타내는 추가적인 맵을 코딩하도록 구성될 수도 있다. 예를 들어, 맵에서의 (i, j) 엔트리가 CU의 (i, j) 포지션에 대응한다고 가정한다. 비디오 인코더 (20) 는 맵의 각각의 엔트리 (즉, 각각의 화소 포지션) 에 대해 그 엔트리가 연관된 인덱스 값을 갖는지의 여부를 나타내는 하나 이상의 신택스 엘리먼트들을 인코딩할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 CU에서의 (i, j) 로케이션에 있는 화소 값이 팔레트들 (244) 에서의 값들 중 하나임을 나타내는 1의 값을 갖는 플래그를 인코딩할 수도 있다.

비디오 인코더 (20) 는, 이러한 일 예에서, 팔레트에서 그 화소 값을 나타내기 위해 그리고 비디오 디코더가 그 화소 값을 복원하는 것을 허용하기 위해 팔레트 인덱스 (도 5의 예에서 값 1~3으로서 도시됨) 를 또한 인코딩할 수도 있다. 팔레트들 (244) 이 단일 엔트리 및 연관된 화소 값을 포함하는 사례들에서, 비디오 인코더 (20) 는 인덱스 값의 시그널링을 스킵할 수도 있다. 비디오 인코더 (20) 는 CU에서의 (i, j) 로케이션에 있는 화소 값이 팔레트들 (244) 에서의 값들 중 하나가 아님을 나타내기 위해 0의 값을 갖도록 플래그를 인코딩할 수도 있다. 이 예에서, 비디오 인코더 (20) 는 화소 값을 복원함에 있어서 비디오 디코더 (30) 에 의한 사용을 위해 화소 값의 표시를 또한 인코딩할 수도 있다. 일부 사례들에서, 화소 값은 손실 방식으로 코딩될 수도 있다.

CU의 하나의 포지션에서의 화소의 값은 CU의 다른 포지션들에서의 하나 이상의 다른 화소들의 값들의 표시를 제공할 수도 있다. 예를 들어, CU의 이웃하는 화소 포지션들이 동일한 화소 값을 가질 또는 동일한 인덱스 값에 매핑될 수도 있을 비교적 높은 확률이 있을 수도 있다 (손실 코딩의 경우, 일을 초과하는 화소 값이 단일 인덱스 값에 매핑될 수도 있다).

따라서, 비디오 인코더 (20) 는 동일한 화소 값 또는 인덱스 값을 갖는 주어진 스캔 순서에서의 다수의 연속적인 화소들 또는 인덱스 값들을 나타내는 하나 이상의 신택스 엘리먼트들을 인코딩할 수도 있다. 위에서 언급된 바와 같이, 유사 값으로 된 화소 또는 인덱스 값들의 문자열이 본원에서 런이라고 지칭될 수도 있다. 예시의 목적을 위한 일 예에서, 주어진 스캔 순서에서의 두 개의 연속적인 화소들 또는 인덱스들이 상이한 값들을 갖는다면, 런은 0과 동일하다. 주어진 스캔 순서에서의 두 개의 연속적인 화소들 또는 인덱스들이 동일한 값을 갖지만 스캔 순서에서의 세 번째 화소 또는 인덱스가 상이한 값을 갖는다면, 런은 1과 동일하다. 동일한 값을 갖는 세 개의 연속적인 인덱스들 또는 화소들에 대해, 런은 2이고 등등이다. 비디오 디코더 (30) 는 인코딩된 비트스트림으로부터 런을 나타내는 신택스 엘리먼트들을 획득하고 그 데이터를 사용하여 동일한 화소 또는 인덱스 값을 갖는 연속적인 로케이션들의 수를 결정할 수도 있다.

위에서 언급된 바와 같이, 런들은 상단에서복사 또는 값 모드와 연계하여 사용될 수도 있다. 예시 목적을 위한 일 예에서, 맵 (240) 의 행들 (264 및 268) 을 고려한다. 수평, 좌우 스캔 방향을 가정하면, 행 (264) 은 세 개의 "1"의 팔레트 인덱스들, 두 개의 "2"의 팔레트 인덱스들, 및 세 개의 "3"의 팔레트 인덱스들을 포함한다. 행 (268) 은 다섯 개의 "1"의 팔레트 인덱스들, 두 개의 "3"의 팔레트 인덱스들, 및 팔레트들 (244) 에 포함되지 않는 하나의 샘플 (인덱스 4에 의해 표현되지만, 샘플 레벨 이스케이프 플래그가 명시적 이스케이프 시그널링을 위해 사용될 수도 있음) 을 포함하는데, 그 샘플은 이스케이프 샘플이라고 지칭될 수도 있다.

이 예에서, 비디오 인코더 (20) 는 상단에서복사 모드를 사용하여 행 (268) 에 대한 데이터를 인코딩할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 행 (268) 의 제 1 포지션 (행 (268) 의 최좌측 포지션) 이 행 (264) 의 제 1 포지션과 동일하다는 것을 나타내는 하나 이상의 신택스 엘리먼트들을 인코딩할 수도 있다. 비디오 인코더 (20) 는 행 (268) 의 스캔 방향에서의 다음의 런의 두 개의 연속적인 엔트리들이 행 (264) 의 제 1 포지션과 동일함을 나타내는 하나 이상의 신택스 엘리먼트들을 또한 인코딩할 수도 있다.

행 (264) 의 제 1 포지션과 두 개의 엔트리들의 런 (위에서 언급됨) 을 나타내는 하나 이상의 신택스 엘리먼트들을 인코딩한 후, 비디오 인코더 (20) 는 값 모드를 사용하여, 행 (268) 에서의 (좌측에서 우측으로의) 제 4 및 제 5 포지션들을 인코딩할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 (예컨대, 값 모드의) 제 4 포지션에 대한 1의 값을 나타내는 하나 이상의 신택스 엘리먼트들과 1의 런을 나타내는 하나 이상의 신택스 엘리먼트들을 인코딩할 수도 있다. 그런고로, 비디오 인코더 (20) 는 이들 두 개의 포지션들을 다른 라인에 대한 참조 없이 인코딩한다.

비디오 인코더 (20) 는 그 다음에 행 (268) 에서의 3의 인덱스 값을 갖는 제 1 포지션을 상부 행 (264) 에 대한 상단에서복사 모드를 사용하여 인코딩할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 상단에서복사 모드와 1의 런을 시그널링할 수도 있다. 따라서, 비디오 인코더 (20) 는 라인의 화소 값들 또는 팔레트 인덱스들을 그 라인의 다른 값들을 기준으로, 예컨대, 런을 사용하여 코딩하는 것, 라인의 화소 값들 등을 다른 라인 (또는 열) 의 값들을 기준으로 코딩하는 것, 또는 그 조합 사이에서 선택할 수도 있다. 비디오 인코더 (20) 는, 일부 예들에서, 선택하기 위해 레이트/왜곡 최적화를 수행할 수도 있다.

비디오 인코더 (20) 는 그 다음에 제 1 팔레트들 (244) 에 포함되지 않는 행 (268) 의 최종 샘플에 대한 이스케이프 샘플을 (예컨대, 좌측에서 우측으로의) 스캔 순서에 따라 인코딩할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 행 (268) 의 최종 포지션을 이스케이프 샘플로서 인코딩할 수도 있다. 다시 말하면, 비디오 인코더 (20) 는 행 (268) 의 최종 포지션이 이스케이프 샘플이라는 표시 (예컨대, 인덱스 4), 뿐만 아니라 샘플 값의 표시를 인코딩할 수도 있다. 비디오 디코더 (30) 는 인코딩된 비트스트림으로부터 위에서 설명된 신택스를 획득하고 이러한 신택스를 사용하여 행 (268) 을 복원할 수도 있다.

비디오 디코더 (30) 는 위에서 설명된 신택스 엘리먼트들을 수신하고 행 (268) 을 복원할 수도 있다. 예를 들어, 비디오 디코더 (30) 는 현재 코딩되고 있는 맵 (240) 의 포지션에 대한 연관된 인덱스 값을 복사할 이웃 행에서의 특정 로케이션을 나타내는 데이터를 획득할 수도 있다. 비디오 디코더 (30) 는 동일한 인덱스 값을 갖는 스캔 순서에서의 연속적인 포지션들의 수를 나타내는 데이터를 또한 획득할 수도 있다. 수평 스캔 순서에 관해 설명되었지만, 본 개시물의 기법들은 다른 스캔 순서 또는 스캔 방향, 이를테면 수직 또는 대각 (예컨대, 블록에서 45 도 또는 135 도 비스듬한) 스캔 순서 또는 스캔 방향에 또한 적용될 수도 있다.

본 개시물의 기법들은, 아래에서 더 상세히 설명될 바와 같이, 팔레트 사이즈 정의를 포함하는 팔레트 기반 비디오 코딩 설계에 관련된다. 본 개시물의 기법들은 HEVC에 대한 스크린 콘텐츠 코딩 및 다른 확장본들과, 뿐만 아니라 스크린 콘텐츠 코딩을 이용하는 다른 비디오 코덱들과 연계하여 사용될 수도 있다.

HEVC 팔레트 코딩의 하나의 예에서, 블록의 화소들은 런 모드 또는 이스케이프 모드들만이 사용되는 경우의 블록의 맨 첫 번째 행을 제외하면, 런 모드, 복사 모드 또는 이스케이프 모드 중 하나로 코딩될 수도 있다. 신택스 엘리먼트 palette_run_type_flag가 런 모드가 사용되는지 또는 복사 모드가 사용되는지를 나타내기 위해 생성될 수도 있다. 런 모드에서, 팔레트 인덱스 (palette_index) 가 런 값 (palette_run) 과 함께 시그널링된다. 런 값은 동일한 팔레트 인덱스를 가질 화소들의 수를 나타낸다. 복사 모드에서는, 팔레트 인덱스가 현재 화소 바로 상측에 위치된 화소들로부터 복사되는 화소들의 수를 나타내는 런 값만이 시그널링된다. 이스케이프 모드는 특정 팔레트 인덱스가 이 모드를 나타내는데 사용되는 경우 런 모드 내에서 코딩된다. 하나의 팔레트 코딩 모드 제안에서, 특정 팔레트 인덱스는 팔레트 사이즈와 동일하다. 이스케이프 모드에서, 런 값은 코딩되지 않는데, 컬러 성분들의 값들이 신택스 엘리먼트 palette_escape_val을 사용하여 명시적으로 시그널링되는 경우에 이스케이프 모드는 단일 화소 트리플릿 (예컨대, 화소의 Y, Cr, 및 Cb 컬러 성분들) 에 적용되어서이다.

플래그 (예컨대, palette_escape_val_present_flag) 가 이스케이프 화소들의 사용을 나타내기 위해 블록마다 시그널링될 수도 있다. 1과 동일한 palette_escape_val_present_flag는 팔레트 코딩된 블록 내에 적어도 하나의 이스케이프 화소 (escape pixel) 가 있다는 것을 나타내고, palette_escape_val_present_flag는 그렇지 않으면 0과 동일하다.

팔레트에서의 값들의 수 (즉, 팔레트 사이즈) 는 여러 값들 중 하나로 설정될 수도 있고, 미리 결정된 최대 사이즈를 가질 수도 있다. 예를 들어, HEVC에서의 팔레트 코딩에 대한 하나의 제안에서, 팔레트 사이즈는 0 내지 max_palette_size (하나의 예에서, 31과 동일함) 의 범위에 있도록 제한된다.

팔레트 코딩 모드로 코딩되는 블록들의 경우, 팔레트에서의 값들은 이전에 팔레트 코딩된 블록들을 위해 사용된 팔레트의 팔레트 엔트리들로부터 예측될 수도 있다. 일부 예들에서 팔레트의 엔트리들은 새로운 엔트리들로서 명시적으로 시그널링될 수도 있다. 다른 예들에서, 이전에 코딩된 블록의 팔레트로부터의 엔트리들은 후속 팰릿들을 위해 재사용될 수도 있다. 이 경우는 팔레트 공유라고 지칭되고, 이전의 블록의 전체 팔레트가 수정 없이 재사용됨을 나타내기 위해 플래그 (예컨대, palette_share_flag) 가 시그널링될 수도 있다.

팔레트 코딩 모드에 대한 일부 제안들에서, 블록에서의 화소 스캐닝은 두 개의 유형들, 즉, 수직 횡단 (traverse) 또는 수평 횡단 (예컨대, 뱀 모양) 스캐닝으로 될 수 있다. 수평 스캐닝 순서의 하나의 예는 도 6a에서 도시되는데, 이 도면은 화소들 (272) 의 어레이와 수평 스캐닝 순서 (274) 가 묘사된 비디오 데이터의 블록 (270) 을 도시한다. 수직 스캐닝 순서의 하나의 예는 도 6b에서 도시되는데, 이 도면은 화소들 (272) 의 어레이와 수직 스캐닝 순서 (276) 가 묘사된 비디오 데이터의 블록 (270) 을 도시한다. 특정 블록에 대해 사용되는 스캐닝 패턴은 블록 유닛마다 시그널링되는 플래그 (예컨대, palette_transpose_flag) 로부터 도출될 수도 있다.

현재 팔레트 코딩 설계들은 다음의 단점들을 드러낸다. 하나의 예의 단점으로서, 팔레트 코딩을 위한 일부 제안들에서, 블록에서의 최대 팔레트 사이즈는 31과 동일할 수도 있는데, 이는 최대 팔레트 인덱스가 30과 동일할 수 있고 이스케이프 화소가 31과 동일한 팔레트 인덱스로 시그널링된다는 것을 의미한다. 다르게 말하면, 시그널링될 수 있는 유효 팔레트 인덱스는 31과 동일할 수 있고, 이는 32의 최대 팔레트 사이즈에 대응한다. 그러나, palette_escape_val_present_flag가 블록에는 이스케이프 화소들이 없다는 것을 나타낸다면, 코딩될 수 있는 최대 팔레트 인덱스는 여전히 30이고, 31과 동일한 팔레트 인덱스는 이 경우 사용되지 않는다. 마찬가지로, 팔레트 공유가 사용되는 경우, 30과 동일하기까지의 팔레트 인덱스가 현재 블록에서의 이스케이프 화소들의 존재에 상관없이 사용될 수 있다.

다른 단점으로서, 팔레트 코딩에 대한 일부 제안들에서, 0과 동일한 팔레트 사이즈가 사용될 수도 있다. 이 경우, 화소들은 이스케이프 모드로만 코딩될 수도 있다. 그 결과, palette_escape_val_present_flag는 항상 1과 동일한 값으로 시그널링되어야만 하고, 0 값을 가질 수 없다.

다른 단점으로서, 팔레트 코딩에 대한 일부 제안들에서, 팔레트 사이즈가 0과 동일하면, 유일하게 가능한 화소 모드는 이스케이프 모드이다. 이 경우, 화소들이 프로세싱되는 스캐닝 모드는 어떠한 영향도 주지 않는다 (즉, 수직 횡단 및 수평 횡단 스캐닝이 동일한 결과를 생성할 것이다). 그러나, 스캐닝 모드를 나타내는 플래그는 여전히 시그널링된다. 마찬가지로, 팔레트 사이즈가 1과 동일하고 이스케이프 화소들이 사용되지 않는 경우, 유일하게 가능한 모드는 0과 동일한 팔레트 인덱스를 갖는 런 모드이다. 사용되는 스캐닝 순서는 이 상황에서도 역시 어떠한 영향도 주지 않는다.

다른 단점으로서, 팔레트 코딩에 대한 일부 제안들에서, 화소 모드 시그널링은 블록에서 균일하게 시그널링되지 않는다. 이는, 블록의 맨 첫 번째 행에 대해, 모드가 복사 모드일 수 없기 때문이다. 이와 같이, 블록의 첫 번째 행에 대해, 모드 인덱스는 런 모드 (또는 특정 팔레트 인덱스 값에 대한 이스케이프 모드) 와 동일하도록 도출된다. 이 도출 프로세서는 파싱 동안 체크를 도입하는데, 일부 경우들에서, 모드 값이 파싱되지 않고 도출되어서이다.

다른 단점으로서, 팔레트 코딩을 위한 복사 모드에 대한 일부 제안들에서, 이스케이프 모드로 코딩되는 상측 화소 (즉, 현재 코딩되는 화소 바로 상측의 화소) 가 복사 모드의 런 값 속에 포함될 수 있다. 그러나, 복사 프로세스는 이스케이프 코딩된 화소들에 대해 정의되지 않는데, 그들 화소들이 두 가지 정보 (즉, 팔레트 인덱스 및 이스케이프 값) 를 포함하여서이다. 비디오 인코더 (20) 가 상측 화소로부터의 팔레트 인덱스 (이는 이스케이프 모드를 나타내는 특정 팔레트 인덱스임) 를 그 팔레트 인덱스가 복사 모드에서 행해지는 바와 같이 그냥 복사하였다면, 현재 화소들에 대한 이스케이프 값들은 정의 또는 시그널링되지 않는다. 이는 파싱에서 문제를 일으킬 수도 있는데, 비디오 디코더 (30) 가 이스케이프 화소를 디코딩하려고 시도하는 경우, 시그널링될 것이 예상될 이스케이프 컬러 값들은 존재하지 않아서이다.

다른 단점으로서, 팔레트 코딩에 대한 일부 제안들에서, 현재 블록에 대해 팔레트를 도출하는 두 개의 일반적인 방법들이 있다. 하나의 방법은 새로운 엔트리들이 시그널링될 수 없는 경우 이전의 팔레트 코딩된 블록 (팔레트 공유) 으로부터의 팔레트를 완전히 재사용하는 것을 수반한다. 제 2 방법은 팔레트 예측자 이진 벡터를 시그널링하는 것을 수반한다. 팔레트 예측자 이진 벡터는 새로운 팔레트 엔트리들과 함께 이전의 팔레트 코딩된 블록의 팔레트 엔트리의 표시를 포함한다. 현재의 제안들에서, 그들 두 개의 팔레트 도출 방법들 사이에서 무엇인가를 하는 것, 즉, 팔레트 예측자 벡터를 시그널링하는 일 없이 이전의 팔레트 코딩된 블록의 팔레트를 완전히 재사용하지만, 여전히 새로운 팔레트 엔트리들을 부가적으로 시그널링하는 것은 가능하지 않다. 이와 같이, 현재의 제안들은 유연성이 부족하다.

전술한 단점들의 관점에서, 본 개시물은 팔레트 사이즈 정의를 포함하는, 팔레트 코딩 설계의 방법들 및 기법들을 제안한다.

본 개시물의 하나의 예에서, 개선된 팔레트 사이즈 정의가 제안된다. 이 예에서, 팔레트 사이즈는 팔레트에 대한 최대 가능 인덱스가 이스케이프 화소를 나타내는 인덱스를 포함하도록 정의된다. 현재 팔레트 코딩 기법들에 대한 위의 예를 참조하여, 최대 팔레트 사이즈가 31인 경우, 최대 팔레트 인덱스는 이스케이프 화소에 대해 31이다. 본 개시물은 최대 팔레트 사이즈를 32와 동일하게 하고 최대 가능한 시그널링되는 팔레트 인덱스 값이 31이 되도록 하는 것을 제안한다. 또한 더 일반적으로는, 최대 가능한 시그널링되는 팔레트 인덱스 값은 최대 팔레트 사이즈보다 1 이 작다.

본 개시물의 예에서, 이스케이프 화소들이 (예컨대, palette_escape_val_present_flag 플래그에 의해 나타내어진 바와 같이) 현재 블록에서 사용되지 않는 경우, 이 예에서 자리가 난 (vacant) 31과 동일한 예전의 팔레트 인덱스는 런 모드에서 사용될 수 있다. palette_escape_val_present_flag 신택스 엘리먼트는 하나 이상의 비트들에 의해 정의될 수도 있다. 예들에서, palette_escape_val_present_flag 플래그가 단일 비트인 경우, 현재 블록이 이스케이프 화소를 포함하거나 또는 실제로 포함할 수도 있다는 것을 1과 동일한 값이 특정할 수도 있다. 0과 동일한 값이, 현재 블록이 이스케이프 화소를 포함하지 않거나 실제로 포함하지 않을 수도 있다는 것을 특정할 수도 있다.

이스케이프 모드 표시는 변경 없이 유지될 수 있으며, 즉, 이스케이프 모드 표시는 31의 값까지와 동일한 (즉, 0 내지 31의 값의) 최대 팔레트 인덱스일 것이고 런 모드에서의 팔레트 인덱스는 30까지 (즉, 0 내지 30의 값) 와 동일할 수 있다. 다르게 말하면, palette_size의 팔레트 내에서의 여분의 팔레트 인덱스가 이스케이프 코딩된 화소에 대해 예약되지 않는다는 것을 알 수 있다.

더욱 일반적인 의미에서, 런 모드에서 사용되는 최대 팔레트 인덱스는, 예를 들어, palette_size - 1과 동일한 팔레트 인덱스에 의해 나타내어질 수 있는 블록 내에 이스케이프 코딩된 화소가 없다면 palette_size - 1 그리고, 그 블록 내에 적어도 하나의 이스케이프 코딩된 화소가 있다면 palette_size - 2일 수 있다.

이 경우, palette_size는 항상 0보다 크고, 재사용된 팔레트 엔트리들의 수와 시그널링된 새로운 팔레트 엔트리들의 수의 합으로서 도출되는 palette_size는 그 palette_size가 max_palette_size와 동일하지 않다면 1만큼 증가된다.

덧붙여, 팔레트 공유가 사용되고 palette_size의 팔레트 내에서의 팔레트 인덱스가 이용 불가능하거나 또는 그렇지 않으면 이스케이프 화소에 대해 예약되지 않은 경우, 팔레트 사이즈는 단순히 1만큼 확장될 수는 없는데, 팔레트 사이즈가 이미 max_palette_size와 동일할 가능성이 있어서이다. 이 예에서, 비디오 인코더 (20) 및/또는 비디오 디코더 (30) 는 팔레트 사이즈에 대한 체크를 수행할 수도 있고, 공유된 팔레트의 palette_size가 max_palette_size보다 작다면, 비디오 인코더 (20) 및/또는 비디오 디코더 (30) 는 palette_escape_val_present_flag에 기초하여 현재 블록의 팔레트 사이즈를 바꾸거나 또는 변경할 수도 있다. 예를 들어 비디오 인코더 (20) 및/또는 비디오 디코더 (30) 는, 이스케이프 화소들이 (예컨대, palette_escape_val_present_flag에 의해 나타내어진 바와 같이) 블록에서 사용된다면, 현재 블록의 팔레트 사이즈를 1만큼 증가시킨다. 그러나, 비디오 인코더 (20) 및/또는 비디오 디코더 (30) 는 palette_size가 max_palette_size와 이미 동일하다고 결정할 수도 있고, 응답하여, 현재 블록의 팔레트 사이즈를 바꾸거나 또는 변경할 수도 있다. 예를 들어, 비디오 인코더 (20) 및/또는 비디오 디코더 (30) 는 현재 블록의 팔레트 사이즈를 이스케이프 화소에 대해 1만큼 증가시키기 전에 그것을 1만큼 감소시킬 수도 있다. 이 예에서, 비디오 인코더 (20) 및/또는 비디오 디코더 (30) 는 max_palette_size 빼기 1과 동일한 팔레트 인덱스에 관련되는 마지막 엔트리에 대해, 재사용된 팔레트 예측자 플래그를 0으로 설정할 수도 있다.

다른 예에서, 팔레트 공유가 사용되지 않고 팔레트 사이즈가 max_palette_size와 동일하다면, 이스케이프 화소들은 블록에서 코딩될 수 없고 비디오 인코더 (20) 는 0과 동일한 값을 갖는 palette_escape_val_present_flag를 시그널링할 수도 있다. 비디오 인코더 (20) 는 팔레트 사이즈에 따라 달라지는 대응하는 값 (예컨대, 0 또는 1) 으로 palette_escape_val_present_flag를 조건부로 시그널링할 수도 있다. 다른 예에서, 비디오 인코더 (20) 는 팔레트 공유 모드에 따라 달리지는 대응하는 값 (예컨대, 0 또는 1) 으로 그리고 현재 블록의 팔레트 사이즈가 max_palette_size와 동일하다면 palette_escape_val_present_flag를 조건부로 시그널링할 수도 있다. 다른 예에서, 팔레트 사이즈가 가능하게 된 팔레트 공유로 max_palette_size와 동일하게 될 때 이스케이프 화소 시그널링을 가능하게 하는 것이 바람직한 경우, 팔레트 공유가 사용되지 않는다면, 비디오 인코더 (20) 는 palette_escape_val_present_flag를 시그널링하지 않을 수도 있고 비디오 디코더 (30) 는 palette_escape_val_present_flag의 값을 0과 동일한 것으로 도출할 수도 있다. 다른 예들에서, 비디오 디코더 (30) 는 palette_escape_val_present_flag가 비디오 인코더 (20) 에 의해 시그널링되지 않는 경우 palette_escape_val_present_flag의 값을 1과 동일한 것으로 도출할 수도 있다.

다음의 구역에서는 palette_escape_val_present_flag의 값을 도출하는 기법들을 논의한다. 0과 동일한 팔레트 사이즈에 기초하여, 비디오 인코더 (20) 는 이스케이프 모드에서 코딩되는 화소들만이 현재 블록에서 사용될 수 있다고 결정할 수도 있다. 이 예에서, 비디오 인코더는 1과 동일한 값을 갖는 palette_escape_val_present_flag를 시그널링할 수도 또는 항상 시그널링할 수도 있다. 비디오 인코더 (20) 는 palette_escape_val_present_flag의 값이 이 예에서 일정하기 때문에 palette_escape_val_present_flag를 시그널링하지 않을 수도 있거나 또는 항상 시그널링하지 않을 수도 있다. 대신, 비디오 디코더 (30) 는 palette_escape_val_present_flag의 값을 1과 동일한 것으로 유추하도록 구성될 수도 있다. 다른 예들에서, 비디오 디코더 (30) 는 palette_escape_val_present_flag의 값을 0과 동일한 것으로 유추하도록 구성될 수도 있다.

비디오 인코더 (20) 는 비디오 데이터의 현재 블록의 팔레트 사이즈에 기초하여 대응하는 값으로 palette_escape_val_present_flag를 조건부로 시그널링할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 팔레트 사이즈가 0과 동일하다고 비디오 인코더 (20) 가 결정하는 것에 응답하여 palette_escape_val_present_flag를 시그널링하지 않을 수도 있다. 다른 예로서, 비디오 인코더 (20) 는 팔레트 인덱스가 0과 동일하게 또한 도출될 수 있으므로 팔레트 인덱스를 시그널링하지 않도록 구성될 수도 있다. 이 경우, 팔레트 모드는 인트라 PCM 모드와 유사하다. 그러나, 비디오 인코더 (20) 는 이 경우에서의 이스케이프 값들에 대한 런들을, 그것들을 PCM과는 상이하게 하고 일부 신호 리던던시들을 캡처하기 위해, 시그널링하도록 구성될 수도 있다.

예를 들어, 이 방법은 밑줄친 텍스트에 의해 표현되는 추가들로 SCC WD를 기준으로 다음과 같이 구현될 수 있다.

1과 동일한 palette_escape_val_present_flag는 현재 블록이 이스케이프 화소를 포함할 수도 있다는 것을 특정한다. 0과 동일한 escape_val_present_flag는 현재 블록 내에 이스케이프 화소가 없다는 것을 특정한다. palette_escape_val_present_flag가 존재하지 않는다면 그것은 1과 동일한 것으로 유추된다.

다른 예에서, 본 개시물의 기법들은 밑줄친 텍스트에 의해 표현되는 SCC WD에 대한 추가들로 다음과 같이 신택스 엘리먼트에 대한 규범적인 제약조건으로서 구현될 수도 있다:

1과 동일한 palette_escape_val_present_flag는 현재 블록이 이스케이프 화소를 포함할 수도 있다는 것을 특정한다. 0과 동일한 escape_val_present_flag는 현재 블록 내에 이스케이프 화소가 없다는 것을 특정한다. palette_escape_val_present_flag는, palette_size가 1과 동일하다면, 1과 동일할 것이다.

이 규칙이 깨지면 그러한 비트스트림은 표준에 부적합한 것으로 간주된다.

팔레트 사이즈 정의 및 palette_escape_val_present_flag 도출에 대해 위에서 설명된 방법들은 밑줄친 텍스트에 의해 표현되는 SCC WD에 대한 추가들을 갖는 예로서 제공되는 다음의 구현예와 함께 결합될 수도 있다.

팔레트 공유가 가능하게 되는 경우 팔레트 사이즈가 max_palette_size와 동일한 팔레트 모드에 이스케이프 화소들이 포함되지 않는다면 위의 기울임꼴의 조건들은 제거될 수도 있다. 변수 indexMax는 최대 가능한 팔레트 인덱스를 나타내고, 그것은, SCC WD에서의 palette_escape_val_present_flag에 기초한 조건부 조정과 비교하여, palette_size - 1로서 무조건적으로 설정될 수 있다.

본 개시물의 이 구역은 스캐닝 순서 시그널링을 설명한다. 본 개시물의 일부 예들에 따라, 픽처의 비디오 데이터의 현재 블록 (예컨대, 현재 CU, PU, 또는 서브-PU) 에 대한 스캐닝 순서 시그널링 (또는 스캔 순서 시그널링) 은, 비디오 데이터의 현재 블록의 팔레트 사이즈가 0과 동일하거나, 또는 팔레트 사이즈가 1과 동일하고 이스케이프 화소들이 블록에서 사용되지 않는 경우, 요구되지 않는데, 유일하게 가능한 화소 모드가 각각 이스케이프 모드 또는 런 모드이라서이다.

본 개시물은 스캐닝 순서가 영향을 줄 수도 있는 경우들 (즉, 상이한 스캐닝 순서들이 상이한 결과들을 생성하는 경우) 에 대해서만, 예를 들어, 팔레트 사이즈가 0보다 크고 이스케이프 화소들이 사용되거나 또는 이스케이프 화소들이 사용되지 않는다면 팔레트 사이즈가 1보다 큰 경우 비디오 인코더 (20) 가 스캐닝 순서 플래그를 시그널링한다는 것을 제안한다.

두 개의 예들로서, 본 방법은 밑줄친 텍스트에 의해 표현되는 추가들로 SCC WD를 기준으로 다음과 같이 구현될 수 있다.

또는

1과 동일한 palette_transpose_flag는 전치 프로세스가 현재 CU (예컨대, 인코딩 또는 디코딩되고 있는 픽처의 비디오 데이터의 현재 블록) 의 연관된 팔레트 인덱스들에 적용된다는 것을 특정한다. 0과 동일한 palette_transpose_flag는 전치 프로세스가 현재 CU의 연관된 팔레트 인덱스들에 적용되지 않는다는 것을 특정한다. palette_transpose_flag가 존재하지 않는다면 그것은 0과 동일한 것으로 유추된다.

palette_transpose_flag의 값이 존재하지 않는다면 0과 동일하다고 비디오 디코더 (30) 가 유추하는 것이 아니라, 다른 미리 정의된 스캐닝 순서들이 다른 예들에서 사용될 수도 있다. 이 방법은 두 개를 초과하는 스캐닝 패턴들로 또한 확장될 수도 있다.

스캐닝 순서들을 시그널링하기 위한 본 개시물의 기법들의 하나의 예에서, 비디오 인코더 (20) 는 palette_transpose_flag의 값을 시그널링하기 전에 palette_escape_val_present_flag의 값을 시그널링해야만 한다.

다른 예에서, 비디오 인코더는 비디오 데이터의 현재 블록의 팔레트 사이즈가 0과 동일하다고 결정할 수도 있고, 그 결과, 비디오 인코더 (20) 는 각각의 화소를 이스케이프 화소로서 코딩할 수도 있다. 인코더 레이트-왜곡 최적화의 관점에서, 이 경우는 선택될 가능성이 더 낮다. 그러므로, 팔레트 모드가 선택된다면, 팔레트 사이즈는 1 이상이 되어야만 한다는 팔레트 모드에 대한 제한을 둘 것이 제안된다.

이 비트스트림 제한에 기초하여, palette_ num _ signalled _entries 신택스 엘리먼트의 시맨틱스는 다음과 같이 밑줄친 텍스트에 의해 표현되는 SCC WD에 대한 추가들을 갖는다:

palette_ num _ signalled _entries는 numPredPreviousPalette 가 0보다 크다면 현재 코딩 유닛에 대해 명시적으로 시그널링되는 팔레트에서의 엔트리들의 수를 특정한다. palette_num_signalled_entries는 numPredPreviousPalette 가 0과 동일하다면 현재 코딩 유닛에 대해 명시적으로 시그널링되는 팔레트에서의 엔트리들의 수 빼기 1을 특정한다.

본 개시물의 다른 예에서, numPredPreviousPalette의 값이 0과 동일한 경우 신택스 엘리먼트 palette_ num _ signalled _entries에 대한 시맨틱스를 변경하는 것 대신, 신택스 엘리먼트 palette_num_signalled_entries에 대한 값들의 유효한 범위만이 밑줄친 텍스트에 의해 표현되는 SCC WD를 기준으로 하는 변경들로 다음과 같이 변경된다:

palette_ num _ signalled _entries는 현재 코딩 유닛에 대해 명시적으로 시그널링되는 팔레트에서의 엔트리들의 수를 특정한다. palette_ num _ signalled _entries의 값은 다음과 같이 제한된다: numPredPreviousPalette가 0보다 크면, palette_ num _ signalled _entries는 0 내지 (max_palette_size - numPredPreviousPalette ) 의 범위에 있을 것이다. 그렇지 않으면 (즉, numPredPreviousPalette 가 0과 동일하면), palette_ num _ signalled _entries는 1 내지 max_palette_size의 범위에 있을 것이다.

도 7은 본 개시물의 기법들에 일치하는 비디오 데이터를 디코딩하는 예시적인 프로세스를 도시하는 흐름도이다. 도 7의 프로세스는 예시를 목적으로 비디오 디코더 (30) 에 의해 수행되고 있는 것으로서 일반적으로 설명되지만, 다양한 다른 프로세서들이 도 7에 도시된 프로세스를 또한 수행할 수도 있다. 일부 예들에서, 블록 디코딩 부 (152) 및/또는 팔레트 기반 디코딩 부 (165) 는 도 7에 도시된 하나 이상의 프로세스들을 수행할 수도 있다.

도 7의 예에서, 비디오 디코더 (30) 는 픽처의 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록을 수신할 수도 있다 (280). 비디오 디코더 (30) 는 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트를 수신하는 일 없이 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 유추할 수도 있다 (282). 일부 예들에서, 비디오 디코더 (30) 에 의해 수신되지 않는 블록 레벨 신택스 엘리먼트는 palette_transpose_flag일 수도 있다. 비디오 디코더 (30) 는 유추된 화소 스캔 순서를 사용하여 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록을 디코딩할 수도 있다 (284).

일부 예들에서, 비디오 디코더 (30) 는 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록을 디코딩하기 위해 전치 프로세스가 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록에 연관된 팔레트 인덱스들에 인가되는 것 또는 인가되지 않는 것이 되도록 제 1 팔레트 모드 인코딩된 블록에 대한 제 1 블록 레벨 신택스 엘리먼트의 값을 유추함으로써 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 유추할 수도 있다. 전치 프로세스가 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록에 연관된 팔레트 인덱스들에 적용될 예들에서, 블록 레벨 신택스 엘리먼트의 유추된 값은 1일 수도 있다. 전치 프로세스가 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록에 연관된 팔레트 인덱스들에 적용되지 않을 예들에서, 블록 레벨 신택스 엘리먼트의 유추된 값은 0일 수도 있다. 일부 예들에서, 비디오 디코더 (30) 는 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서가 비-수평 또는 비-수직 화소 스캔 순서인 것으로 유추되도록 블록 레벨 신택스 엘리먼트의 값을 유추함으로써 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 유추할 수도 있다.

일부 예들에서, 비디오 디코더 (30) 는 0 의 값과 동일하거나, 1 의 값과 동일하거나, 0 의 값을 초과하거나, 또는 1 의 값을 초과하는, 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록의 팔레트 사이즈에 기초하여 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 유추할 수도 있다.

비디오 디코더 (30) 는 픽처의 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록을 수신할 수도 있다 (286). 비디오 디코더 (30) 는 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트를 수신할 수도 있다 (288). 일부 예들에서, 수신된 블록 레벨 신택스 엘리먼트는 palette_transpose_flag일 수도 있다. 비디오 디코더 (30) 는 may determine 수신된 블록 레벨 신택스 엘리먼트에 기초하여 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 결정할 수도 있다 (290). 비디오 디코더 (30) 는 결정된 화소 스캔 순서를 사용하여 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록을 디코딩할 수도 있다 (292).

도 8은 본 개시물의 기법들에 일치하는 비디오 데이터를 인코딩하는 예시적인 프로세스를 도시하는 흐름도이다. 도 8의 프로세스는 예시를 목적으로 비디오 인코더 (20) 에 의해 수행되고 있는 것으로서 일반적으로 설명되지만, 다양한 다른 프로세서들이 도 7에 도시된 프로세스를 또한 수행할 수도 있다. 일부 예들에서, 블록 인코딩 부 (100) 및/또는 팔레트 기반 인코딩 부 (122) 는 도 8에 도시된 하나 이상의 프로세스들을 수행할 수도 있다.

도 8의 예에서, 비디오 인코더 (20) 는 비디오 데이터의 블록이 팔레트 모드를 사용하여 인코딩 될 것이라고 결정할 수도 있다 (300). 비디오 인코더 (20) 는 비디오 데이터의 블록에 대한 팔레트 사이즈를 결정할 수도 있다 (302). 비디오 인코더 (20) 는 비디오 데이터의 블록에 대한 화소 스캔 순서를 결정할 수도 있다 (304). 비디오 인코더 (20) 는 팔레트 모드를 사용하여 비디오 데이터의 블록을 인코딩할 수도 있다 (306). 비디오 인코더 (20) 는 팔레트 사이즈에 기초하여 비디오 데이터의 블록에 대해 사용된 화소 스캔 순서를 나타내는 제 1 블록 레벨 신택스 엘리먼트를 시그널링할지의 여부를 결정할 수도 있다 (308). 일부 예들에서, 제 1 블록 레벨 신택스 엘리먼트는 palette_transpose_flag일 수도 있다.

일부 예들에서, 제 1 블록 레벨 신택스 엘리먼트를 시그널링할지의 여부를 결정하는 단계는, 0 의 값과 동일하거나, 1 의 값과 동일하거나, 0 의 값을 초과하거나, 또는 1 의 값을 초과하는 팔레트 사이즈에 기초할 수도 있다. 다른 예들에서, 제 1 블록 레벨 신택스 엘리먼트를 시그널링할지의 여부를 결정하는 단계는, 비디오 데이터의 팔레트 인코딩된 블록이 적어도 하나의 이스케이프 화소를 포함하는지의 여부에 기초할 수도 있다. 다른 예들에서, 제 1 블록 레벨 신택스 엘리먼트를 시그널링할지의 여부를 결정하는 단계는, 비디오 데이터의 팔레트 인코딩된 블록이 적어도 하나의 이스케이프 화소를 포함하는지의 여부를 나타내는 제 2 블록 레벨 신택스 엘리먼트의 값에 기초할 수도 있다.

일부 예들에서, 도 8의 예에 도시된 방법은 팔레트 사이즈가 0 의 값과 동일한 경우 제 1 블록 레벨 신택스 엘리먼트를 시그널링하지 않는 단계를 포함할 수도 있다. 다른 예에서, 제 1 블록 레벨 신택스 엘리먼트는, 팔레트 사이즈가 1 의 값과 동일하고 비디오 데이터의 팔레트 인코딩된 블록이 적어도 하나의 이스케이프 화소를 포함하지 않는 경우, 시그널링되지 않을 수도 있다. 다른 예에서, 제 1 블록 레벨 신택스 엘리먼트는, 팔레트 사이즈가 1 의 값과 동일하고 제 2 블록 레벨 신택스 엘리먼트의 값이 비디오 데이터의 팔레트 인코딩된 블록이 적어도 하나의 이스케이프 화소를 포함하지 않는다는 것을 나타내는 경우, 시그널링되지 않을 수도 있다.

도 9는 비디오 데이터의 블록의 첫 번째 행에 대해 복사 모드를 가능하게 하는 일 예를 도시하는 개념도이다. 팔레트 코딩에 대한 현재의 제안들에서, 복사 모드는 블록에서의 맨 첫 번째 행에 대해 사용되지 않는데, 현재 블록 내부에 위치된 첫 번째 행 바로 상측에 화소들이 없어서이다. 그러므로, 복사 모드는 첫 번째 행에 대해 시그널링 되지 않고 런 모드는 팔레트 코딩을 위한 현재의 제안들 하에서 도출된다. 이는 파싱 동안 체크를 도입하는데, 화소 모드가 때때로 시그널링되지 않고 도출되어서이다.

본 개시물의 예의 기법들에서, 비디오 인코더 (20) 는 픽처의 비디오 데이터의 현재 블록에서의 화소들의 맨 첫 번째 행 (예컨대, 비디오 데이터의 현재 블록 (320) 에서의 행 0으로서 묘사됨) 에 대한 복사 모드를, 그 첫 번째 행에서 복사 모드로 코딩된 화소들에 대한 디폴트 팔레트 인덱스와 동일하게 팔레트 인덱스를 설정함으로써 가능하게 할 수도 있다. 비디오 데이터 (320) 의 현재 블록이 8 x 8 블록으로서 도시되지만, 비디오 데이터 (320) 의 현재 블록은 다른 예들에서 임의의 다른 사이즈일 수도 있다. 맨 첫 번째 행에 관해, 화소들의 복수의 행들을 포함하는 비디오 데이터의 블록 (320) 의 다른 행이 그 비디오 데이터의 현재 블록에 대한 첫 번째 행 상측에 없다는 것이 이해된다. 그러나, 다른 화소들이, 동일한 픽처로부터의 비디오 데이터의 다른 블록으로부터, 비디오 데이터의 현재 블록 (320) 의 첫 번째 행에서의 임의의 화소들에 (구현된 스캔 순서에 의존하여 좌측, 우측, 상측, 또는 대각선으로) 이웃할 수도 있다는 것이 또한 이해된다. 비디오 데이터"의 "현재 블록에서의 "현재"라는 용어는, 비디오 데이터의 블록이 비디오 인코더 (20) 또는 비디오 디코더 (30) 에 의해 인코딩 또는 디코딩 중 어느 하나가 되고 있는 비디오 데이터의 현재 블록이라는 것을 의미한다.

일부 예들에서, 디폴트 팔레트 인덱스는 적어도 각각의 블록, 슬라이스 헤더, 비디오 파라미터 세트 (video parameter set, VPS), 시퀀스 파라미터 세트 (sequence parameter set, SPS), 픽처 파라미터 세트 (picture parameter set, PPS), 또는 다른 곳에서와 같은 임의의 파라미터 세트에 대한 시그널링된 인덱스 또는 고정된 인덱스일 수도 있다. 일부 예들에서, 첫 번째 행에 대한 복사 모드를 가능하게 하는 것은 비디오 데이터의 블록에서의 화소들의 첫 번째 행에서의 적어도 하나의 화소가 복사 모드를 사용하여 인코딩되도록 팔레트 모드를 사용하여 비디오 데이터의 블록을 인코딩하는 것을 가능하게 한다.

디폴트 (고정된) 인덱스는 0 내지 palette_size - 1의 범위에서의 현재 블록의 유효 팔레트 인덱스들 중 하나의 유효 팔레트 인덱스일 수도 있다. 예를 들어, 디폴트 인덱스는 항상 0과 동일할 수도 있지만, 다른 값들이 또한 가능하다. 디폴트 인덱스는 첫 번째 행에서 시그널링되는 다른 인덱스 값들에 따라 달라질 수도 있다. 예를 들어, 첫 번째 시그널링된 인덱스가 1이고 두 번째 시그널링되는 것이 2이면, 다른 인덱스가 있다면, 인덱스 1은 다시 나타날 가능성이 있다. 그러므로, 디폴트 인덱스는 첫 번째 행에 대한 복사 모드에 의해 도출되는 인덱스 값일 수도 있다.

일부 예들에서, 디폴트 팔레트 인덱스는 비디오 데이터의 블록 (320) 에 대응하는 팔레트 인덱스들 중 하나의 팔레트 인덱스일 수도 있다. 다른 예들에서, 디폴트 팔레트 인덱스는 비디오 데이터의 블록에 대응하는 팔레트 인덱스들에서의 첫 번째 인덱스일 수도 있다. 팔레트 인덱스들에서의 첫 번째 인덱스가 0 의 값에 의해 식별되는 경우 디폴트 팔레트 인덱스는 0 의 값 (또는 비디오 데이터의 현재 블록의 다른 유효한 팔레트 인덱스에 대응하는 임의의 다른 값) 에 의해 식별될 수도 있다. 또 다른 예들에서, 디폴트 팔레트 인덱스는 비디오 데이터의 현재 블록에 대응하는 팔레트 인덱스들 중 하나의 팔레트 인덱스가 아닐 수도 있다. 이러한 예들에서, 디폴트 팔레트 인덱스는 이전에 인코딩 또는 디코딩되었던 비디오 데이터의 다른 블록에 대응하는 팔레트 인덱스들로부터의 인덱스일 수도 있다.

첫 번째 행에 대해 가능하게 된 복사 모드의 경우, 팔레트 인덱스와 팔레트 최대 인덱스는 비디오 데이터의 현재 블록 (320) 에서의 다른 행들에 대한 팔레트 인덱스에 대해 행해지는 것과 유사하게 시그널링에 앞서 조정될 수 있다. 덧붙여, (예컨대, 이전에 인코딩 또는 디코딩된 비디오 데이터의 다른 블록으로부터의) 첫 번째 행 상측에 위치된 화소들을 포함하는, 비디오 데이터의 현재 블록 (320) 바깥에 위치된 가상 화소들이 이스케이프 코딩되지 않으며, 예를 들어 복사 모드로 코딩되며, 팔레트 인덱스는 디폴트 팔레트 인덱스와 동일할 수도 있다는 것이 정의될 수도 있다. 이 추가적인 정의는 팔레트 인덱스 시그널링에서 리던던시를 피하는데 사용될 수도 있다. 예를 들어, 맨 첫 번째 화소의 화소 모드는 디폴트 팔레트 인덱스와 동일한 팔레트 인덱스를 갖는 런 모드와 동일하지 않을 수 있는데, 이 화소가 복사 모드를 이용하여 코딩될 것이라서이다.

예를 들어, 구현은 다음과 같이 될 수 있다:

화소가 블록에서의 맨 첫 번째 화소이면

o 최대 팔레트 인덱스는 1만큼 감소되며

o 팔레트 인덱스는 1만큼 감소된다

그렇지 않고, 스캐닝 순서에서의 좌측 코딩된 화소의 화소 모드가 런 모드이면, 다음이 적용된다:

o 최대 팔레트 인덱스는 1만큼 감소되며

o 팔레트 인덱스가 스캐닝 순서에서의 좌측 화소의 팔레트 인덱스보다 크면 팔레트 인덱스는 1만큼 감소된다

그렇지 않고, 스캐닝 순서에서의 좌측의 코딩된 화소의 화소 모드가 복사 모드이고, 현재 화소가 첫 번째 행에 위치되거나, 또는 그 화소가 첫 번째 행에 있지 않고 바로 상측 화소의 화소 모드가 이스케이프 모드가 아니면, 다음이 적용된다:

o 최대 팔레트 인덱스는 1만큼 감소되며

o 팔레트 인덱스가 스캐닝 순서에서의 상측 화소의 팔레트 인덱스보다 크거나 또는 상측 화소가 블록 바깥에 있는 경우 디폴트 팔레트 인덱스와 동일하다면, 팔레트 인덱스는 1만큼 감소된다.

예를 들어, 이 방법은 밑줄친 텍스트로 표현되는 추가들과 취소선 텍스트로 표현되는 삭제들로 SCC WD를 기준으로 다음과 같이 구현될 수 있다:

본원에서 설명되는 기법들에서, 1을 초과하는 디폴트 인덱스가 사용될 수도 있다. 덧붙여서, 인덱스들이 사용되는 순서는 상이한 패턴들을 가질 수도 있다. 사용되는 패턴은 고정되고 비디오 인코더 (20) 및 비디오 디코더 (30) 둘 다에 저장될 수도 있거나, 또는 그 패턴은 디폴트 인덱스에 대해 행해진 바와 마찬가지로, 비디오 인코더 (20) 로부터 비디오 디코더 (30) 로 시그널링될 수도 있다.

화소 모드 (런 모드 또는 복사 모드) 시그널링은, 복사 모드가 첫 번째 행에서 가능하게 되는 경우 비디오 데이터 (320) 의 현재 블록의 첫 번째 행에 대해 추가될 수도 있다. 일부 예들에서 화소 모드 시그널링을 위한 신택스 엘리먼트들은 콘텍스트 모델링을 사용하여 CABAC 코딩될 수도 있다. 첫 번째 행에서의 화소 모드 신택스 엘리먼트의 콘텍스트는 비디오 데이터 (320) 의 현재 블록의 다른 행들에 대한 화소 모드 신택스 엘리먼트들에 대한 콘텍스트들과 공유될 수도 있다. 예를 들어 참조 화소가 복사 모드로 코딩된다면 콘텍스트 0이 사용될 수도 있고, 참조 화소가 런 모드로 코딩된다면 콘텍스트 1이 사용될 수도 있거나, 또는 반대의 경우로도 사용될 수도 있다.

참조 화소는 현재 화소의 좌측 화소일 수도 있고, 두 번째 행부터 시작하는 상측 화소일 수도 있고, 그리고/또는 맨 첫 번째 행에 대한 좌측 화소일 수도 있다 (이는 첫 번째 행에서 상측 화소가 없어서이다). 더 일반적으로, 참조 화소는 화소 모드 정보가 이용가능한 경우 이미 코딩된 화소일 수도 있다. 맨 첫 번째 화소에 대해 이용 가능한 임의의 참조 화소들이 없을 수도 있다. 이 상황에서 첫 번째 행에 대한 신택스 엘리먼트를 위한 콘텍스트는 미리 정의될 수도 있다 (예컨대, 이전에 사용된 콘텍스트가 선택될 수도 있거나 또는 별도의 콘텍스트가 사용될 수도 있다).

다른 예에서, 단일 콘텍스트만이 사용될 수도 있고 첫 번째 행에서의 화소 모드 신택스 엘리먼트를 코딩하기 위한 콘텍스트는 콘텍스트 0 또는 콘텍스트 1과만 공유될 수도 있다.

그러나, 콘텍스트를 공유하는 것은 모든 상황들에서 최상의 옵션이 아닐 수도 있는데, 팔레트 인덱스 선택이 첫 번째 행에서 더욱 제한되므로 (예컨대, 단지 디폴트 인덱스/인덱스들만이 사용되는 경우임), 첫 번째 행에서의 특정 화소 모드를 사용하는 통계가 다른 행들에서의 통계와는 상이할 수도 있어서이다. 이와 같이, 다른 예에서, 별도의 콘텍스트 또는 별도의 콘텍스트들이 첫 번째 행에서의 화소 모드에 대한 화소 모드 신택스 엘리먼트들에 배정될 수도 있다. 예를 들어, 별도의 콘텍스트(들)가 단지 하나의 추가적인 콘텍스트, 이를테면 콘텍스트 2일 수도 있거나, 또는 별도의 콘텍스트(들)가 참조 화소의 화소 모드에 따라 달라질 수도 있다. 예를 들어, 콘텍스트 2는 참조 화소가 복사 모드로 코딩된다면 화소 모드 신택스 엘리먼트를 코딩하는데 사용될 수도 있고, 콘텍스트 3은 참조 화소가 런 모드에서 코딩된다면 화소 모드 신택스 엘리먼트를 코딩하는데 사용될 수도 있다. 맨 첫 번째 화소에 대한 신택스 엘리먼트의 경우, 콘텍스트는 콘텍스트 2 또는 콘텍스트 3인 것으로 고정될 수도 있거나, 또는, 다른 예에서, 별도의 콘텍스트 4가 사용될 수 있다.

첫 번째 행에 대한 복사 모드를 가능하게 하는 것과 함께 또는 그런 복사 모드를 가능하게 하는 일 없이 사용될 수 있는 더욱 일반적인 접근법으로서, 비디오 인코더 (20) 및/또는 비디오 디코더 (30) 는 콘텍스트가 런 모드와 현재 공유되는 이스케이프 모드를 포함하여, 참조 화소 모드에 따라 콘텍스트들을 분할할 수도 있다. 이 경우, 콘텍스트들의 수는 적어도 세 개, 즉, 런 모드를 위한 하나, 복사 모드를 위한 하나, 및 이스케이프 모드를 위한 하나일 수도 있으며, 여기서 모드는 참조 화소의 모드이다.

마찬가지로, 이스케이프 모드를 포함하는 콘텍스트 확장이 첫 번째 행에 대해 가능하게 된 복사 모드로 행해질 수도 있다.

도 10은 본 개시물의 기법들에 일치하는 비디오 데이터를 디코딩하는 예시적인 프로세스를 도시하는 흐름도이다. 도 10의 프로세스는 예시를 목적으로 비디오 디코더 (30) 에 의해 수행되고 있는 것으로서 일반적으로 설명되지만, 다양한 다른 프로세서들이 도 10에 도시된 프로세스를 또한 수행할 수도 있다. 일부 예들에서, 블록 디코딩 부 (152) 및/또는 팔레트 기반 디코딩 부 (165) 는 도 10에 도시된 하나 이상의 프로세스들을 수행할 수도 있다.

도 10의 예에서, 비디오 디코더 (30) 는 비디오 데이터의 블록이 팔레트 모드를 사용하여 인코딩 될 것이라고 결정할 수도 있다 (330). 비디오 디코더 (30) 는 화소들의 복수의 행들을 갖는 비디오 데이터의 팔레트 모드 인코딩된 블록을 수신할 수도 있다 (332). 비디오 디코더 (30) 는 비디오 데이터의 팔레트 모드 인코딩된 블록에 대응하는 팔레트 인덱스들을 수신할 수도 있다 (334). 비디오 디코더 (30) 는 비디오 데이터의 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 결정할 수도 있다 (336). 비디오 디코더 (30) 는 화소 스캔 순서를 사용하여 비디오 데이터의 팔레트 모드 인코딩된 블록을 디코딩할 수도 있다 (338). 비디오 디코더 (30) 는 화소들의 복수의 행들 중 다른 행이 첫 번째 행 상측에 없는 경우 복사 모드를 사용하여 화소들의 첫 번째 행에서의 적어도 하나의 화소를 디코딩할 수도 있다 (340).

일부 예들에서, 복사 모드를 사용하여 비디오 데이터의 팔레트 모드 인코딩된 블록에서의 화소들의 첫 번째 행에서의 적어도 하나의 화소를 디코딩하는 것은 화소들의 첫 번째 행에서의 최소 하나의 화소에 대해 디폴트 팔레트 인덱스를 사용하는 것을 포함할 수도 있다. 다른 예들에서, 복사 모드를 사용하여 비디오 데이터의 팔레트 모드 인코딩된 블록에서의 화소들의 첫 번째 행에서의 적어도 하나의 화소를 디코딩하는 것은, 비디오 데이터의 인코딩된 블록에 대응하는 팔레트 인덱스들 중 하나의 팔레트 인덱스인 화소들의 첫 번째 행에서의 최소 하나의 화소에 대해 디폴트 팔레트 인덱스를 사용하는 것을 포함할 수도 있다. 다른 예들에서, 복사 모드를 사용하여 비디오 데이터의 팔레트 모드 인코딩된 블록에서의 화소들의 첫 번째 행에서의 적어도 하나의 화소를 디코딩하는 것은 팔레트 인덱스들에서의 첫 번째 인덱스인 화소들의 첫 번째 행에서의 최소 하나의 화소에 대해 디폴트 팔레트 인덱스를 사용하는 것을 포함할 수도 있다.

또 다른 예들에서, 복사 모드를 사용하여 비디오 데이터의 팔레트 모드 인코딩된 블록에서의 화소들의 첫 번째 행에서의 적어도 하나의 화소를 디코딩하는 것은, 0 의 값에 의해 식별되는 화소들의 첫 번째 행에서의 최소 하나의 화소에 대해 디폴트 팔레트 인덱스를 사용하는 것을 포함할 수도 있고 팔레트 인덱스들에서의 첫 번째 인덱스는 0 의 값에 의해 식별된다. 또 다른 예들에서, 복사 모드를 사용하여 비디오 데이터의 팔레트 모드 인코딩된 블록에서의 화소들의 첫 번째 행에서의 적어도 하나의 화소를 디코딩하는 것은, 비디오 데이터의 블록에 대응하는 팔레트 인덱스들 중 하나의 팔레트 인덱스가 아닌 화소들의 첫 번째 행에서의 최소 하나의 화소에 대해 디폴트 팔레트 인덱스를 사용하는 것을 포함할 수도 있다. 또 다른 예들에서, 복사 모드를 사용하여 비디오 데이터의 팔레트 모드 인코딩된 블록에서의 화소들의 첫 번째 행에서의 적어도 하나의 화소를 디코딩하는 것은, 비디오 데이터의 다른 블록에 대응하는 팔레트 인덱스들로부터의 인덱스인 화소들의 첫 번째 행에서의 최소 하나의 화소에 대해 디폴트 팔레트 인덱스를 사용하는 것을 포함할 수도 있다. 또 다른 예들에서, 복사 모드를 사용하여 비디오 데이터의 팔레트 모드 인코딩된 블록에서의 화소들의 첫 번째 행에서의 적어도 하나의 화소를 디코딩하는 것은, 적어도 하나의 화소보다 먼저 디코딩되는 하나 이상의 화소들의 하나 이상의 팔레트 인덱스들에 기초하여 화소들의 첫 번째 행에서의 적어도 하나의 화소에 대해 팔레트 인덱스를 사용하는 것을 포함할 수도 있다.

도 11은 본 개시물의 기법들에 일치하는 비디오 데이터를 인코딩하는 예시적인 프로세스를 도시하는 흐름도이다. 도 11의 프로세스는 예시를 목적으로 비디오 인코더 (20) 에 의해 수행되고 있는 것으로서 일반적으로 설명되지만, 다양한 다른 프로세서들이 도 11에 도시된 프로세스를 또한 수행할 수도 있다. 일부 예들에서, 블록 인코딩 부 (100) 및/또는 팔레트 기반 인코딩 부 (122) 는 도 11에 도시된 하나 이상의 프로세스들을 수행할 수도 있다.

도 11의 예에서, 비디오 인코더 (20) 는 화소들의 복수의 행들을 갖는 비디오 데이터의 블록이 팔레트 모드를 사용하여 인코딩될 것이라고 결정할 수도 있다 (350). 비디오 인코더 (20) 는 비디오 데이터의 블록에 대한 팔레트 인덱스들을 생성할 수도 있다 (352). 비디오 인코더 (20) 는 비디오 데이터의 블록에서의 화소들의 복수의 행들 중 다른 행이 첫 번째 행 상측에 없는 경우 그 화소들의 첫 번째 행에서의 적어도 하나의 화소가 복사 모드를 사용하여 인코딩되도록 팔레트 모드를 사용하여 비디오 데이터의 블록을 인코딩할 수도 있다 (354).

일부 예들에서, 비디오 데이터의 블록에서의 화소들의 첫 번째 행에서의 적어도 하나의 화소가 복사 모드를 사용하여 인코딩되도록 팔레트 모드를 사용하여 비디오 데이터의 블록을 인코딩하는 것은, 화소들의 첫 번째 행에서의 최소 하나의 화소에 대해 디폴트 팔레트 인덱스를 사용하는 것을 포함할 수도 있다. 이러한 예들에서, 디폴트 팔레트 인덱스는 비디오 데이터의 블록에 대응하는 팔레트 인덱스들 중 하나의 팔레트 인덱스일 수도 있다. 예를 들어, 디폴트 팔레트 인덱스는 팔레트 인덱스들에서의 첫 번째 팔레트 인덱스 또는 팔레트 인덱스들에서의 임의의 다른 인덱스일 수도 있다. 디폴트는 0 의 값에 의해 식별될 수도 있고 팔레트 인덱스들에서의 첫 번째 인덱스는 0 의 값에 의해 식별될 수도 있다. 일부 예들에서, 디폴트 팔레트 인덱스는 비디오 데이터의 블록에 대응하는 팔레트 인덱스들 중 하나의 팔레트 인덱스일 수도 있다. 예를 들어, 디폴트 팔레트 인덱스는 비디오 데이터의 다른 블록에 대응하는 팔레트 인덱스들로부터의 (예컨대, 비디오 데이터의 이전에 인코딩된 블록으로부터의 팔레트 인덱스들로부터의) 인덱스일 수도 있다. 일부 예들에서, 비디오 데이터의 블록에서의 화소들의 첫 번째 행에서의 적어도 하나의 화소가 복사 모드를 사용하여 인코딩되도록 팔레트 모드를 사용하여 비디오 데이터의 블록을 인코딩하는 것은, 적어도 하나의 화소 전에 인코딩된 하나 이상의 화소들의 하나 이상의 팔레트 인덱스들에 기초하여 화소들의 첫 번째 행에서의 적어도 하나의 화소에 대한 팔레트 인덱스를 사용하는 것을 포함할 수도 있다.

다음의 구역에서는 이스케이프 화소들 및 복사 모드를 논의할 것이다. 팔레트 코딩을 위한 현재의 제안들에서, 상측 화소가 이스케이프 모드로 코딩되는 경우, 복사 절차는 이스케이프 코딩된 화소에 대해 정의되지 않는다. 그 해법은 이스케이프 화소에 대해 복사 프로세스를 정의하는 것 또는 이 경우가 발생하는 것을 규범적으로 금지시키는 것 중 어느 하나일 수 있다. 예들로서, 문제는 아래에서 설명되는 다음의 방법들 중 하나의 방법을 사용하여 해결될 수 있다.

2014년 7월 2일자로 출원된 미국 가출원 제62/019,223호에서 설명된 바와 같이, 특정 팔레트 인덱스에 의해 표현되는 이스케이프 모드만이 현재 화소에 대해 복사된다. 트리플릿에 대한 이스케이프 컬러 값들은 나중에 시그널링된다.

이스케이프 인덱스를 복사하는 대신, 상측 화소가 이스케이프 화소이면, 다른 팔레트 인덱스가 현재 화소에 대해 시그널링될 수 있다. 예를 들어, 팔레트 인덱스는, 예를 들어, 현재 블록에 대한 유효 팔레트 인덱스들 중 하나의 유효 팔레트 인덱스와 동일한 것으로 고정될 수 있는 디폴트 팔레트 인덱스, 이를테면 0일 수 있거나, 또는 디폴트 팔레트 인덱스는 적어도 각각의 블록, 슬라이스 헤더, 파라미터 세트들 (이를테면 VPS, SPS, PPS) 에 대해 시그널링될 수 있거나, 또는 다른 곳에서 시그널링될 수 있다. 부가적으로 또는 대안으로, 이스케이프 화소는 이전의 팔레트 인덱스에 의해 대체될 수 있다. 예를 들어, 복사 모드에 대한 인덱스는, 스캐닝 순서에서의 상측 화소의 좌측에서 처음 이용 가능한 이스케이프가 아닌 마지막 복사된 인덱스인 것으로 가정되거나, 또는 현재 화소의 좌측 인덱스일 수도 있다. 이는 고정된 인덱스와 결합될 수 있다. 예를 들어, 이스케이프 팔레트 인덱스를 대체하는 것이 이스케이프이면, 디폴트 인덱스가 사용될 수 있다. 예를 들어, 좌측 화소가 이스케이프 화소이면, 디폴트 인덱스 (예컨대, 0) 는 복사 목적을 위해 이스케이프를 대체하는데 사용되며, 그렇지 않으면 좌측 화소의 인덱스가 사용된다.

다른 예에서, 비디오 인코더 (20) 는 복사 모드로 코딩된 화소가 이스케이프 모드로 코딩된 상측 화소를 가질 수 있는 경우를 규범적으로 허용하지 않도록 구성될 수도 있다. 이는, 아래에서 도시된 바와 같이, 예를 들어, palette_run 신택스 엘리먼트의 시맨틱스에서 구현될 수 있다. 이 규칙이 깨진다면, 비트스트림은 표준에 부적합한 것으로 간주된다.

신택스 엘리먼트 palette_run은, palette_run_type_flag가 COPY_ABOVE_MODE와 동일한 경우, 상측 행에서의 포지션과 동일한 팔레트 인덱스를 갖는 연속적인 로케이션들의 수 빼기 1을 나타내거나 또는 palette_run_type_flag가 INDEX_MODE와 동일한 경우 동일한 팔레트 인덱스를 갖는 연속적인 로케이션들의 수 빼기 1을 나타낸다. palette_run_type_flag가 COPY_ABOVE_MODE와 동일하다면, 상측 행에 위치된 palette_run 값에 의해 정의되는 연속적인 화소들 중 하나의 화소는 ESCAPE_PIXEL로서 코딩되지 않을 수 있다.

다음의 구역은 일부 예들에 따라 이스케이프 화소를 정의하는 기법들을 논의한다. 팔레트 사이즈 정의에 대해 위에서 설명된 기법들이 사용된다면, 특정 인덱스는 palette_escape_val_present_flag의 값에 의존하여 이스케이프 화소 또는 비-이스케이프 화소를 나타내는 일이 발생할 수도 있다. 예를 들어, 최대 팔레트 사이즈가 32라고 간주한다. palette_escape_val_present_flag가 1이면, 인덱스 값 31은 이스케이프 화소를 나타낸다. 한편, palette_escape_val_present_flag가 0인 경우, 31의 인덱스 값이 비-이스케이프 화소에 대해 가능하다. 일부 다른 값, 이를테면 0이, 이스케이프 화소를 나타내는데 사용된다면, 유사한 상황이 적용된다. 이 경우, 0의 인덱스 값이, palette_escape_val_present_flag가 1인 경우 이스케이프 화소를 나타낼 수도 있지만, palette_escape_val_present_flag가 0인 경우 비-이스케이프 화소를 나타낼 수도 있다.

그런고로, 일부 예들에 따르면, 본 개시물은 다음과 같이 이스케이프 화소의 정의를 변경할 것을 제안한다: palette_escape_val_present_flag가 1과 동일하며, 화소가 런 모드에서 코딩되고, 특정 팔레트 인덱스 값을 가진다면, 그 화소는 이스케이프 화소로서 정의된다. 특정 인덱스 값은, 예를 들어, 팔레트 사이즈 또는 팔레트 사이즈 빼기 1, 또는 0과 같은 어떤 다른 고정된 값과 동일할 수도 있다.

본 개시물의 이 구역은 새로운 팔레트 엔트리들과의 팔레트 공유를 논의한다. 본 개시물에서, 새로운 팔레트 엔트리들을 시그널링하는 능력으로 팔레트 공유를 확장하는 것이 제안된다. 새로운 엔트리들의 수와 새로운 엔트리들 자체의 컬러 값들은 그것들의 포함을 위한 팔레트에서의 여지 (room) 가 있는 (즉, 팔레트 사이즈가 max_palette_size보다 작은) 경우 명시적으로 시그널링된다.

본 개시물의 팔레트 공유 확장은 팔레트 공유를 위한 현재의 제안들 (즉, 새로운 엔트리들의 수는 팔레트 공유를 위해 시그널링되거나, 또는 팔레트 도출의 제 3 의 방법으로서 추가되는 것) 을 대체할 수도 있다. 후자의 경우, 팔레트 예측자가 시그널링되지 않고 이전의 블록의 팔레트가 재사용된다는 것을 나타내기 위해, 아마도 palette_share_flag 후에 그리고 조건부로 팔레트 공유가 사용되지 않고 이전의 팔레트 사이즈가 max_palette_size보다 작다면, 새로운 플래그가 시그널링된다. 이 경우, 영을 갖는 새로운 엔트리들의 수가 팔레트 공유와 동일하므로, 새로운 엔트리들의 수는 0보다 크고, 그래서 새로운 엔트리들의 수 빼기 1이 대신 시그널링될 수 있다.

새로운 팔레트 엔트리들은 비디오 인코더 (20) 에 의해 나중에 시그널링되고, 재사용된 팔레트 엔트리들 뒤에 또는 팔레트 도출의 제 3 (이 구역에서 논의된) 방법을 위한 재사용된 팔레트 엔트리들 전에 포함될 수 있다. 대안적으로, 모든 팔레트 도출 방법들 전체에 걸쳐 균일한 팔레트 도출을 가지기 위해 새로운 팔레트 엔트리들이 재사용된 팔레트 엔트리들 전에 항상 대체될 수 있다.

재사용된 엔트리들 전에 새로운 엔트리들을 포함시키는 것은 더욱 효율적일 수도 있는데, 블록에서 모두 사용되는 새로운 엔트리들과는 대조적으로, 재사용된 또는 예측된 엔트리들의 역할을 플레이하는 이전의 팔레트의 엔트리들이 모두가 사용되지 않아 팔레트 인덱스 시그널링에서 얼마간의 비효율성을 도입할 수 도있어서이다. 재사용된 팔레트 엔트리들 전에 새로운 엔트리들을 배치하는 다른 장점은, 팔레트 사이즈 제한으로 인해 모든 재사용되는 엔트리들이 추가되는 것은 아니라는 것이다. 이 경우, 새로운 엔트리들은 먼저 추가되고 그 다음에 이전의 팔레트의 엔트리들은 현재 팔레트 사이즈가 max_palette_size보다 작은 동안 추가된다.

새로운 팔레트 엔트리들로 팔레트 공유를 사용하는 경우, 현존 시그널링은 밑줄친 텍스트에 의해 표현되는 SCC WD에 대한 추가들로 다음의 방식으로 재사용될 수 있다:

예에 의존하여, 상이한 시퀀스로 수행될 수도 있는 본원에서 설명된 기법들 중 임의의 기법의 특정 액트들 또는 이벤트들이 부가되거나, 병합되거나, 또는 다 함께 제외될 수도 있다 (예컨대, 모든 설명된 액트들 또는 이벤트들이 그 기법들의 실용화에 필요한 것은 아니다) 는 것이 이해되어야 한다. 더구나, 특정 예들에서, 액트들 또는 이벤트들은 순차적으로라기 보다는, 예컨대, 다중 스레드식 프로세싱, 인터럽트 프로세싱, 또는 다수의 프로세서들을 통하여 동시에 수행될 수도 있다. 덧붙여서, 본 개시물의 특정한 양태들이 명료함을 위해 단일 모듈 또는 유닛에 의해 수행되고 있는 것으로 설명되지만, 본 개시물의 기법들은 비디오 코더에 연관된 유닛들 또는 모듈들의 조합에 의해 수행될 수도 있다는 것이 이해되어야 한다.

본 개시물에 따라, "또는"이란 용어는 맥락에서 그렇지 않다고 나타내지 않는 경우 "및/또는"으로서 해석될 수도 있다. 덧붙여, "하나 이상의" 또는 "적어도 하나의" 등과 같은 어구들이 다른 것들이 아니라 본 명세서에서 개시되는 일부 특징부들에 대해 사용되었을 수도 있지만; 이러한 언어표현이 사용되지 않았던 특징부들은 맥락에서 그렇지 않다고 나타내지 않는 경우 그러한 의미를 포함한 것으로 해석될 수도 있다.

본 개시물의 특정한 양태들은 예시의 목적으로 개발 중인 HEVC 표준에 대해 설명되었다. 그러나, 본 개시물에서 설명된 기법들은, 아직 개발되지 않은 다른 표준 또는 사유의 비디오 코딩 프로세스들을 포함하는 다른 비디오 코딩 프로세스들에 대해 유용할 수도 있다.

위에서 설명된 기법들은 비디오 인코더 (20) (도 1 및 도 2) 및/또는 비디오 디코더 (30) (도 1 및 도 3) 에 의해 수행될 수도 있으며, 그것들의 양쪽 모두는 비디오 코더라고 일반적으로 지칭될 수도 있다. 비슷하게, 비디오 코딩은 해당되는 경우 비디오 인코딩 또는 비디오 디코딩을 지칭할 수도 있다.

그 기법들의 다양한 양태들의 특정 조합들이 위에서 설명되었지만, 이들 조합들은 본 개시물에서 설명된 기법들의 예들을 도시하기 위해서만 제공된다. 따라서, 본 개시물의 기법들은 이들 예의 조합들로 제한되지 않아야 하고 본 개시물에서 설명된 기법들의 다양한 양태들의 임의의 상상 가능한 조합을 포괄할 수도 있다. 본 개시물에서 설명되는 기법들은 임의의 조합으로 함께 사용될 수도 있다.

하나 이상의 예들에서, 본 개시물에서 설명된 기능들은 하드웨어, 소프트웨어, 펌웨어, 또는 그것들의 임의의 조합으로 구현될 수도 있다. 소프트웨어로 구현된다면, 그 기능들은 하나 이상의 명령들 또는 코드로서 컴퓨터 판독가능 매체 상에 저장되거나 또는 그것을 통해 송신될 수도 있고 하드웨어 기반 프로세싱 유닛에 의해 실행될 수도 있다. 컴퓨터 판독가능 매체들은, 데이터 저장 매체들과 같은 유형의 (tangible) 매체에 대응하는 컴퓨터 판독가능 저장 매체들, 또는 예컨대 통신 프로토콜에 따라 한 장소에서 다른 장소로 컴퓨터 프로그램의 전달을 용이하게 하는 임의의 매체를 포함하는 통신 매체들을 포함할 수도 있다. 이런 방식으로, 컴퓨터 판독가능 매체들은 일반적으로 (1) 비일시적인 유형의 컴퓨터 판독가능 저장 매체들 또는 (2) 신호 또는 반송파와 같은 통신 매체에 해당할 수도 있다. 데이터 저장 매체들은 본 개시물에서 설명된 기법들의 구현을 위한 명령들, 코드 및/또는 데이터 구조들을 취출하기 위해 하나 이상의 컴퓨터들 또는 하나 이상의 프로세서들에 의해 액세스될 수 있는 임의의 이용가능 매체들일 수도 있다. 컴퓨터 프로그램 제품은 컴퓨터 판독가능 매체를 포함할 수도 있다.

비제한적인 예로, 이러한 컴퓨터 판독가능 저장 매체들은 RAM, ROM, EEPROM, CD-ROM 또는 다른 광 디스크 스토리지, 자기 디스크 스토리지, 또는 다른 자기 저장 디바이스들, 플래시 메모리, 또는 소망의 프로그램 코드를 컴퓨터에 의해 액세스될 수 있는 명령들 또는 데이터 구조들의 형태로 저장하는데 사용될 수 있는 임의의 다른 매체를 포함할 수 있다. 또한, 임의의 접속이 컴퓨터 판독가능 매체로 적절히 칭해진다. 예를 들어, 명령들이 웹사이트, 서버, 또는 다른 원격 자원으로부터 동축 케이블, 광섬유 케이블, 연선 (twisted pair), 디지털 가입자 회선 (DSL), 또는 무선 기술들 이를테면 적외선, 라디오, 및/또는 마이크로파를 이용하여 송신된다면, 동축 케이블, 광섬유 케이블, 연선, DSL, 또는 적외선, 라디오, 및 마이크로파와 같은 무선 기술은 매체의 정의에 포함된다. 그러나, 컴퓨터 판독가능 저장 매체들 및 데이터 저장 매체들은 커넥션들, 반송파들, 신호들, 또는 다른 일시적인 매체들을 포함하지 않지만, 대신 비일시적, 유형의 저장 매체들을 지향하고 있음이 이해되어야 한다. 디스크 (disk 및 disc) 는 본원에서 사용되는 바와 같이, 콤팩트 디스크 (compact disc, CD), 레이저 디스크, 광 디스크, 디지털 다용도 디스크 (DVD), 플로피 디스크 (floppy disk) 및 블루레이 디스크를 포함하는데, disk들은 보통 데이터를 자기적으로 재생하지만, disc들은 레이저들로써 광적으로 데이터를 재생한다. 상기한 것들의 조합들은 컴퓨터 판독가능 매체들의 범위 내에 또한 포함되어야 한다.

명령들은 하나 이상의 프로세서들, 이를테면 하나 이상의 디지털 신호 프로세서들 (DSP들), 범용 마이크로프로세서들, 주문형 집적회로들 (ASIC들), 필드 프로그램가능 로직 어레이들 (FPGA들), 또는 다른 동등한 집적 또는 개별 로직 회로에 의해 실행될 수도 있다. 따라서, 본원에서 사용되는 바와 같은 "프로세서"라는 용어는 앞서의 구조 또는 본원에서 설명된 기법들의 구현에 적합한 임의의 다른 구조 중 임의의 것을 나타낼 수도 있다. 덧붙여서, 일부 양태들에서, 본원에서 설명된 기능성은 인코딩 및 디코딩을 위해 구성되는, 또는 결합형 코덱으로 통합되는 전용 하드웨어 및/또는 소프트웨어 모듈들 내에 제공될 수도 있다. 또한, 본 기법들은 하나 이상의 회로들 또는 로직 엘리먼트들 내에 완전히 구현될 수 있다.

본 개시물의 기법들은 무선 핸드셋, 집적회로 (IC) 또는 IC들의 세트 (예컨대, 칩 셋) 를 포함하는 매우 다양한 디바이스들 또는 장치들로 구현될 수도 있다. 다양한 컴포넌트들, 모듈들, 또는 유닛들이 개시된 기법들을 수행하도록 구성되는 디바이스들의 기능적 양태들을 강조하기 위해 본 개시물에서 설명되지만, 상이한 하드웨어 유닛들에 의한 실현을 반드시 요구하지는 않는다. 대신에, 위에서 설명된 바와 같이, 다양한 유닛들은 코덱 하드웨어 유닛에 결합되거나 또는 적합한 소프트웨어 및/또는 펌웨어에 연계하여, 위에서 설명된 바와 같은 하나 이상의 프로세서들을 포함한 상호운용적 하드웨어 유닛들의 컬렉션에 의해 제공될 수도 있다.

다양한 예들이 설명되어 있다. 이들 및 다른 예들은 다음의 청구항들의 범위 내에 있다.

Claims

비디오 데이터를 디코딩하는 방법으로서,
픽처의 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록을 수신하는 단계;
상기 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트를 수신하는 일 없이 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 화소 스캔 순서를 유추하는 단계;
유추된 상기 화소 스캔 순서를 사용하여 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록을 디코딩하는 단계;
상기 픽처의 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록을 수신하는 단계;
비디오 데이터의 상기 제 2 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트를 수신하는 단계;
수신된 상기 블록 레벨 신택스 엘리먼트에 기초하여 비디오 데이터의 상기 제 2 팔레트 모드 인코딩된 블록에 대한 상기 화소 스캔 순서를 결정하는 단계; 및
결정된 상기 화소 스캔 순서를 사용하여 비디오 데이터의 상기 제 2 팔레트 모드 인코딩된 블록을 디코딩하는 단계를 포함하는, 비디오 데이터 디코딩 방법.
제 1 항에 있어서,
상기 제 1 또는 제 2 팔레트 모드 인코딩된 블록에 대한 상기 블록 레벨 신택스 엘리먼트는, 0 또는 1 의 값들을 포함하는 palette_transpose_flag이며, 상기 0 의 값은 전치 프로세스가 비디오 데이터의 상기 제 1 또는 제 2 팔레트 모드 인코딩된 블록에 각각 연관된 팔레트 인덱스들에 적용되지 않음을 나타내고 상기 1 의 값은 전치 프로세스가 비디오 데이터의 상기 제 1 또는 제 2 팔레트 모드 인코딩된 블록에 각각 연관된 팔레트 인덱스들에 적용됨을 나타내는, 비디오 데이터 디코딩 방법.
제 1 항에 있어서,
비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 화소 스캔 순서를 유추하는 단계는, 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록을 디코딩하기 위해 전치 프로세스가 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록에 연관된 팔레트 인덱스들에 인가되는 것이 되도록 상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 블록 레벨 신택스 엘리먼트의 상기 값을 유추하는 단계를 포함하는, 비디오 데이터 디코딩 방법.
제 3 항에 있어서,
상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 블록 레벨 신택스 엘리먼트의 유추된 상기 값은 1 인, 비디오 데이터 디코딩 방법.
제 1 항에 있어서,
비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 화소 스캔 순서를 유추하는 단계는, 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록을 디코딩하기 위해 전치 프로세스가 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록에 연관된 팔레트 인덱스들에 인가되지 않는 것이 되도록 상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 블록 레벨 신택스 엘리먼트의 상기 값을 유추하는 단계를 포함하는, 비디오 데이터 디코딩 방법.
제 5 항에 있어서,
상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 블록 레벨 신택스 엘리먼트의 유추된 상기 값은 0 인, 비디오 데이터 디코딩 방법.
제 1 항에 있어서,
비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 화소 스캔 순서를 유추하는 단계는, 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 화소 스캔 순서가 비-수평 또는 비-수직 화소 스캔 순서인 것으로 유추되도록 상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 블록 레벨 신택스 엘리먼트의 상기 값을 유추하는 단계를 포함하는, 비디오 데이터 디코딩 방법.
제 1 항에 있어서,
비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 화소 스캔 순서를 유추하는 단계는, 0 의 값과 동일하거나, 1 의 값과 동일하거나, 0 의 값을 초과하거나, 또는 1 의 값을 초과하는, 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록의 팔레트 사이즈에 기초하여 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 화소 스캔 순서를 유추하는 단계를 포함하는, 비디오 데이터 디코딩 방법.
비디오 데이터를 디코딩하는 디바이스로서,
픽처의 비디오 데이터를 저장하도록 구성되는 메모리; 및
비디오 디코더를 포함하며,
상기 비디오 디코더는,
상기 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록을 수신하도록;
상기 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트에 기초하지 않고 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 화소 스캔 순서를 유추하도록;
유추된 상기 화소 스캔 순서에 기초하여 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록을 디코딩하도록;
상기 픽처의 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록을 수신하도록;
비디오 데이터의 상기 제 2 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트를 수신하도록;
비디오 데이터의 상기 제 2 팔레트 모드 인코딩된 블록에 대한 상기 블록 레벨 신택스 엘리먼트에 기초하여 비디오 데이터의 상기 제 2 팔레트 모드 인코딩된 블록에 대한 상기 화소 스캔 순서를 결정하도록; 및
결정된 상기 화소 스캔 순서에 기초하여 비디오 데이터의 상기 제 2 팔레트 모드 인코딩된 블록을 디코딩하도록 구성되는, 비디오 데이터 디코딩 디바이스.
제 9 항에 있어서,
상기 제 1 또는 제 2 팔레트 모드 인코딩된 블록에 대한 상기 블록 레벨 신택스 엘리먼트는, 0 또는 1 의 값들을 포함하는 palette_transpose_flag이며, 상기 0 의 값은 전치 프로세스가 비디오 데이터의 상기 제 1 또는 제 2 팔레트 모드 인코딩된 블록에 각각 연관된 팔레트 인덱스들에 적용되지 않음을 나타내고 상기 1 의 값은 전치 프로세스가 비디오 데이터의 상기 제 1 또는 제 2 팔레트 모드 인코딩된 블록에 각각 연관된 팔레트 인덱스들에 적용됨을 나타내는, 비디오 데이터 디코딩 디바이스.
제 9 항에 있어서,
상기 비디오 디코더는 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록을 디코딩하기 위해 전치 프로세스가 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록에 연관된 팔레트 인덱스들에 인가되는 것이 되도록 상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 블록 레벨 신택스 엘리먼트의 상기 값을 유추하도록 구성됨으로써 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 화소 스캔 순서를 유추하도록 구성되는, 비디오 데이터 디코딩 디바이스.
제 11 항에 있어서,
상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 블록 레벨 신택스 엘리먼트의 유추된 상기 값은 1 인, 비디오 데이터 디코딩 디바이스.
제 9 항에 있어서,
상기 비디오 디코더는 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록을 디코딩하기 위해 전치 프로세스가 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록에 연관된 팔레트 인덱스들에 인가되지 않는 것이 되도록 상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 블록 레벨 신택스 엘리먼트의 상기 값을 유추하도록 구성됨으로써 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 화소 스캔 순서를 유추하도록 구성되는, 비디오 데이터 디코딩 디바이스.
제 13 항에 있어서,
상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 블록 레벨 신택스 엘리먼트의 유추된 상기 값은 0 인, 비디오 데이터 디코딩 디바이스.
제 9 항에 있어서,
상기 비디오 디코더는 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 화소 스캔 순서가 비-수평 또는 비-수직 화소 스캔 순서인 것으로 유추되도록 상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 블록 레벨 신택스 엘리먼트의 상기 값을 유추하도록 구성됨으로써 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 화소 스캔 순서를 유추하도록 구성되는, 비디오 데이터 디코딩 디바이스.
제 9 항에 있어서,
상기 비디오 디코더는 0 의 값과 동일하거나, 1 의 값과 동일하거나, 0 의 값을 초과하거나, 또는 1 의 값을 초과하는, 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록의 팔레트 사이즈에 기초하여 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 화소 스캔 순서를 유추하도록 구성됨으로써 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 화소 스캔 순서를 유추하도록 구성되는, 비디오 데이터 디코딩 디바이스.
명령들을 저장하고 있는 비일시적 컴퓨터 판독가능 저장 매체로서,
상기 명령들은, 실행되는 경우, 비디오 데이터를 디코딩하도록 구성되는 컴퓨팅 디바이스의 하나 이상의 프로세서들로 하여금,
픽처의 비디오 데이터의 제 1 팔레트 모드 인코딩된 블록을 수신하게 하며;
상기 제 1 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트에 기초하지 않고 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록에 대한 상기 화소 스캔 순서를 유추하게 하며;
유추된 상기 화소 스캔 순서에 기초하여 비디오 데이터의 상기 제 1 팔레트 모드 인코딩된 블록을 디코딩하게 하며;
상기 픽처의 비디오 데이터의 제 2 팔레트 모드 인코딩된 블록을 수신하게 하며;
비디오 데이터의 상기 제 2 팔레트 모드 인코딩된 블록에 대한 화소 스캔 순서를 나타내는 값을 갖는 블록 레벨 신택스 엘리먼트를 수신하게 하며;
비디오 데이터의 상기 제 2 팔레트 모드 인코딩된 블록에 대한 상기 블록 레벨 신택스 엘리먼트에 기초하여 비디오 데이터의 상기 제 2 팔레트 모드 인코딩된 블록에 대한 상기 화소 스캔 순서를 결정하게 하며; 그리고
결정된 상기 화소 스캔 순서에 기초하여 비디오 데이터의 상기 제 2 팔레트 모드 인코딩된 블록을 디코딩하게 하는, 비일시적 컴퓨터 판독가능 저장 매체.
비디오 데이터를 인코딩하는 방법으로서,
비디오 데이터의 블록이 팔레트 모드를 사용하여 인코딩될 것이라고 결정하는 단계;
비디오 데이터의 상기 블록에 대한 팔레트 사이즈를 결정하는 단계;
비디오 데이터의 상기 블록에 대한 화소 스캔 순서를 결정하는 단계;
팔레트 모드를 사용하여 비디오 데이터의 상기 블록을 인코딩하는 단계; 및
상기 팔레트 사이즈에 기초하여 비디오 데이터의 상기 블록에 대해 사용된 상기 화소 스캔 순서를 나타내는 제 1 블록 레벨 신택스 엘리먼트를 시그널링할지의 여부를 결정하는 단계를 포함하는, 비디오 데이터 인코딩 방법.
제 18 항에 있어서,
상기 제 1 블록 레벨 신택스 엘리먼트는 palette_transpose_flag인, 비디오 데이터 인코딩 방법.
제 18 항에 있어서,
상기 제 1 블록 레벨 신택스 엘리먼트를 시그널링할지의 여부를 결정하는 단계는, 0 의 값과 동일하거나, 1 의 값과 동일하거나, 0 의 값을 초과하거나, 또는 1 의 값을 초과하는 상기 팔레트 사이즈에 기초하는, 비디오 데이터 인코딩 방법.
제 18 항에 있어서,
상기 제 1 블록 레벨 신택스 엘리먼트를 시그널링할지의 여부를 결정하는 단계는, 비디오 데이터의 상기 팔레트 인코딩된 블록이 적어도 하나의 이스케이프 화소를 포함하는지의 여부에 기초하는, 비디오 데이터 인코딩 방법.
제 18 항에 있어서,
상기 제 1 블록 레벨 신택스 엘리먼트를 시그널링할지의 여부를 결정하는 단계는, 비디오 데이터의 상기 팔레트 인코딩된 블록이 적어도 하나의 이스케이프 화소를 포함하는지의 여부를 나타내는 제 2 블록 레벨 신택스 엘리먼트의 값에 기초하는, 비디오 데이터 인코딩 방법.
제 18 항에 있어서,
상기 팔레트 사이즈가 0 의 값과 동일한 경우, 상기 팔레트 사이즈가 1 의 값과 동일하고 비디오 데이터의 상기 팔레트 인코딩된 블록이 적어도 하나의 이스케이프 화소를 포함하지 않는 경우, 또는 상기 팔레트 사이즈가 1 의 값과 동일하고 제 2 블록 레벨 신택스 엘리먼트의 상기 값이 비디오 데이터의 상기 팔레트 인코딩된 블록이 적어도 하나의 이스케이프 화소를 포함하지 않음을 나타내는 경우, 상기 제 1 블록 레벨 신택스 엘리먼트를 시그널링하지 않는 단계를 더 포함하는, 비디오 데이터 인코딩 방법.
비디오 데이터를 인코딩하는 디바이스로서,
픽처의 비디오 데이터를 저장하도록 구성되는 메모리; 및
비디오 인코더를 포함하며,
상기 비디오 인코더는,
비디오 데이터의 블록이 팔레트 모드를 사용하여 인코딩될 것이라고 결정하도록;
비디오 데이터의 상기 블록에 대한 팔레트 사이즈를 결정하도록;
비디오 데이터의 상기 블록에 대한 화소 스캔 순서를 결정하도록;
팔레트 모드를 사용하여 비디오 데이터의 상기 블록을 인코딩하도록; 및
상기 팔레트 사이즈에 기초하여 비디오 데이터의 상기 블록에 대해 사용된 상기 화소 스캔 순서를 나타내는 제 1 블록 레벨 신택스 엘리먼트를 시그널링할지의 여부를 결정하도록 구성되는, 비디오 데이터 인코딩 디바이스.