WO2012177015A2

WO2012177015A2 - 영상 부호화/복호화 방법 및 그 장치

Info

Publication number: WO2012177015A2
Application number: PCT/KR2012/004694
Authority: WO
Inventors: 예세훈; 손은용; 성재원; 정지욱
Original assignee: LG Electronics Inc
Current assignee: LG Electronics Inc
Priority date: 2011-06-20
Filing date: 2012-06-14
Publication date: 2012-12-27
Anticipated expiration: 2013-12-20
Also published as: WO2012177015A3

Abstract

본 발명에 따른 영상 복호화 방법은, 비트스트림을 수신하는 단계, 비트스트림을 기반으로, 현재 픽쳐에 대한 예측 블록 및 잔차 블록을 생성하는 단계, 비트스트림으로부터 도출된 RRU 타입 정보를 기반으로, 잔차 블록에 대한 업 샘플링을 수행하는 단계, 예측 블록 및 업 샘플링이 수행된 잔차 블록을 기반으로 복원 블록을 생성하는 단계 및 RRU 타입 정보를 기반으로, 복원 블록에 대한 필터링을 수행하는 단계를 포함한다. 본 발명에 의하면 영상 부호화 효율이 향상되고 복잡도가 감소될 수 있다.

Description

영상 부호화/복호화 방법 및 그 장치

본 발명은 영상 처리에 관한 것으로서, 보다 상세하게는 해상도 감소 갱신 방법 및 그 장치에 관한 것이다.

3D 비디오를 이용한 디지털 방송 서비스는 차세대 방송 서비스로 주목 받고 있다. 3D 비디오는 복수 개의 시점(view) 채널을 이용하여 현장감과 몰입감을 제공할 수 있으며, 입체감을 제공하는 3D 비디오에는, 양안식 3D 비디오, 다시점 3D 비디오 및 홀로그램 등이 있을 수 있다.

3D 비디오의 경우 종래의 2D 비디오와 달리, 텍스쳐 영상(texture video) 뿐만 아니라, 깊이 영상(depth video)이 함께 부호화 및/또는 복호화될 수 있다. 종래의 비디오 압축 표준 대상인 텍스쳐 영상과 달리, 깊이 영상은 화면 내의 객체들에 대한 깊이 정보를 포함할 수 있다. 3D 비디오의 경우, 입체감은 상술한 깊이 정보에 의해 나타내어질 수 있다.

본 발명의 기술적 과제는 영상 부호화 효율을 향상시키고 복잡도를 감소시킬 수 있는 영상 부호화 방법 및 장치를 제공함에 있다.

본 발명의 다른 기술적 과제는 영상 부호화 효율을 향상시키고 복잡도를 감소시킬 수 있는 영상 복호화 방법 및 장치를 제공함에 있다.

본 발명의 또 다른 기술적 과제는 영상 부호화 효율을 향상시키고 복잡도를 감소시킬 수 있는 해상도 감소 갱신 방법 및 장치를 제공함에 있다.

본 발명의 또 다른 기술적 과제는 영상 부호화 효율을 향상시킬 수 있는 필터링 방법 및 장치를 제공함에 있다.

1. 본 발명의 일 실시 형태는 영상 복호화 방법이다. 상기 방법은, 비트스트림을 수신하는 단계, 상기 비트스트림을 기반으로, 현재 픽쳐에 대한 예측 블록 및 잔차(residual) 블록을 생성하는 단계, 상기 비트스트림으로부터 도출된 RRU(Reduced-Resolution Update) 타입 정보를 기반으로, 상기 잔차 블록에 대한 업 샘플링(up-sampling)을 수행하는 단계, 상기 예측 블록 및 상기 업 샘플링이 수행된 잔차 블록을 기반으로 복원 블록을 생성하는 단계 및 상기 RRU 타입 정보를 기반으로, 상기 복원 블록에 대한 필터링을 수행하는 단계를 포함하되, 상기 RRU 타입 정보는 샘플링 비율(sampling ratio) 정보 및 필터 타입(filter type) 정보를 포함하고, 상기 업 샘플링 수행 단계에서는 상기 샘플링 비율 정보가 지시하는 샘플링 비율을 기반으로 업 샘플링을 수행하고, 상기 필터링 수행 단계에서는 상기 필터 타입 정보가 지시하는 필터를 기반으로 필터링을 수행한다.

2. 1에 있어서, 상기 샘플링 비율 정보는, 상기 현재 블록 내에서 상기 잔차 블록에 해당되는 영역의 주파수가 낮을수록 더 높은 값의 샘플링 비율을 지시할 수 있다.

3. 1에 있어서, 상기 필터링 수행 단계는, 상기 잔차 블록 내의 필터링 대상 픽셀에 대해, 소정의 크기 및 모양의 윈도우(window)를 결정하는 단계 및 상기 윈도우 내의 픽셀을 기반으로 상기 필터링 대상 픽셀에 대한 필터링을 수행하는 단계를 더 포함할 수 있다.

4. 3에 있어서, 상기 현재 픽쳐가 텍스쳐 영상(texture video) 내의 픽쳐인 경우, 상기 필터 타입 정보가 지시하는 필터는 상기 윈도우 내의 픽셀을 기반으로 가중치 평균을 수행하는 양방향 가중치 필터(bi-laterally weighted filter)일 수 있다.

5. 4에 있어서, 상기 양방향 가중치 필터는, 상기 필터링 대상 픽셀이, 에지를 포함하는 에지(edge) 영역 내의 픽셀인 경우에는 약한 스무딩(weak smoothing)을 수행하고, 상기 필터링 대상 픽셀이, 에지를 포함하지 않는 넌 에지(non-edge) 영역 내의 픽셀인 경우에는 강한 스무딩(strong smoothing)을 수행할 수 있다.

6. 3에 있어서, 상기 현재 픽쳐가 깊이 영상(depth video) 내의 깊이 픽쳐이고, 상기 깊이 영상에 대응하는 텍스쳐 영상(texture video) 내에서 상기 현재 픽쳐에 대응하는 텍스쳐 픽쳐가 유효(available)한 경우, 상기 필터링 수행 단계에서는, 상기 텍스쳐 픽쳐에서 상기 윈도우에 대응되는 영역 내의 텍스쳐 픽셀을 기반으로 필터링을 수행할 수 있다.

7. 6에 있어서, 상기 필터 타입 정보가 지시하는 필터는, 양방향 가중치 WTA 필터(bi-laterally weighted Winner_Take_All filter)일 수 있고, 상기 양방향 가중치 WTA 필터는, 상기 텍스쳐 픽셀을 기반으로 상기 윈도우 내의 깊이 픽셀 각각에 대해 가중치 스코어(weighting score)를 도출하고, 상기 깊이 픽셀 중에서 가장 높은 가중치 스코어를 갖는 깊이 픽셀의 픽셀 값을 상기 필터링 대상 픽셀에 대한 출력 값으로 결정할 수 있고, 상기 깊이 픽셀은 상기 깊이 픽쳐 내의 픽셀일 수 있다.

8. 6에 있어서, 상기 필터 타입 정보가 지시하는 필터는 양방향 가중치 미디언 필터(bi-laterally weighted median filter)일 수 있고, 상기 양방향 가중치 미디언 필터는, 상기 텍스쳐 픽셀을 기반으로 상기 윈도우 내의 깊이 픽셀 각각에 대해 가중치 스코어(weighting score)를 도출하고, 상기 가중치 스코어를 기반으로 상기 깊이 픽셀 중에서 중간 값을 도출하고, 상기 도출된 중간 값에 해당되는 깊이 픽셀의 픽셀 값을 상기 필터링 대상 픽셀에 대한 출력 값으로 결정할 수 있고, 상기 깊이 픽셀은 상기 깊이 픽쳐 내의 픽셀일 수 있다.

9. 3에 있어서, 상기 현재 픽쳐가 깊이 영상 내의 깊이 픽쳐이고, 상기 깊이 영상에 대응하는 텍스쳐 영상 내에서 상기 현재 픽쳐에 대응하는 텍스쳐 픽쳐가 유효하지 않은 경우, 상기 필터 타입 정보가 지시하는 필터는 양방향 가중치 미디언 필터일 수 있고, 상기 양방향 가중치 미디언 필터는, 상기 윈도우 내의 깊이 픽셀을 기반으로, 상기 깊이 픽셀 각각에 대해 가중치 스코어(weighting score)를 도출하고, 상기 가중치 스코어를 기반으로 상기 깊이 픽셀 중에서 중간 값을 도출하고, 상기 도출된 중간 값에 해당되는 깊이 픽셀의 픽셀 값을 상기 필터링 대상 픽셀에 대한 출력 값으로 결정할 수 있고, 상기 깊이 픽셀은 상기 깊이 픽쳐 내의 픽셀일 수 있다.

10. 9에 있어서, 상기 양방향 가중치 미디언 필터는, 상기 필터링 대상 픽셀이, 에지를 포함하는 에지(edge) 영역 내의 픽셀인 경우에는 약한 스무딩을 수행하고, 상기 필터링 대상 픽셀이, 에지를 포함하지 않는 넌 에지(non-edge) 영역 내의 픽셀인 경우에는 강한 스무딩을 수행할 수 있다.

11. 본 발명의 다른 실시 형태는 영상 복호화 장치이다. 상기 장치는, 비트스트림을 수신하는 수신부, 상기 비트스트림을 기반으로, 현재 픽쳐에 대한 예측 블록 및 잔차(residual) 블록을 생성하는 예측 블록 및 잔차 블록 생성부, 상기 비트스트림으로부터 도출된 RRU(Rrduced-Resolution Update) 타입 정보를 기반으로, 상기 잔차 블록에 대한 업 샘플링(up-sampling)을 수행하는 업 샘플러, 상기 예측 블록 및 상기 업 샘플링이 수행된 잔차 블록을 기반으로 복원 블록을 생성하는 복원 블록 생성부 및 상기 RRU 타입 정보를 기반으로, 상기 복원 블록에 대한 필터링을 수행하는 필터부를 포함하되, 상기 RRU 타입 정보는 샘플링 비율(sampling ratio) 정보 및 필터 타입(filter type) 정보를 포함하고, 상기 업 샘플러는 상기 샘플링 비율 정보가 지시하는 샘플링 비율을 기반으로 업 샘플링을 수행하고, 상기 필터부는 상기 필터 타입 정보가 지시하는 필터를 기반으로 필터링을 수행한다.

12. 11에 있어서, 상기 샘플링 비율 정보는, 상기 현재 블록 내에서 상기 잔차 블록에 해당되는 영역의 주파수가 낮을수록 더 높은 값의 샘플링 비율을 지시할 수 있다.

13. 11에 있어서, 상기 필터부는, 상기 잔차 블록 내의 필터링 대상 픽셀에 대해 소정의 크기 및 모양의 윈도우(window)를 결정하고, 상기 윈도우 내의 픽셀을 기반으로 상기 필터링 대상 픽셀에 대한 필터링을 수행할 수 있다.

14. 13에 있어서, 상기 현재 픽쳐가 텍스쳐 영상(texture video) 내의 픽쳐인 경우, 상기 필터 타입 정보가 지시하는 필터는 상기 윈도우 내의 픽셀을 기반으로 가중치 평균을 수행하는 양방향 가중치 필터(bi-laterally weighted filter)일 수 있다.

15. 14에 있어서, 상기 양방향 가중치 필터는, 상기 필터링 대상 픽셀이, 에지를 포함하는 에지(edge) 영역 내의 픽셀인 경우에는 약한 스무딩(weak smoothing)을 수행하고, 상기 필터링 대상 픽셀이, 에지를 포함하지 않는 넌 에지(non-edge) 영역 내의 픽셀인 경우에는 강한 스무딩(strong smoothing)을 수행할 수 있다.

16. 13에 있어서, 상기 현재 픽쳐가 깊이 영상(depth video) 내의 깊이 픽쳐이고, 상기 깊이 영상에 대응하는 텍스쳐 영상(texture video) 내에서 상기 현재 픽쳐에 대응하는 텍스쳐 픽쳐가 유효(available)한 경우, 상기 필터부는, 상기 텍스쳐 픽쳐에서 상기 윈도우에 대응되는 영역 내의 텍스쳐 픽셀을 기반으로 필터링을 수행할 수 있다.

17. 16에 있어서, 상기 필터 타입 정보가 지시하는 필터는, 양방향 가중치 WTA 필터(bi-laterally weighted Winner_Take_All filter)일 수 있고, 상기 양방향 가중치 WTA 필터는, 상기 텍스쳐 픽셀을 기반으로 상기 윈도우 내의 깊이 픽셀 각각에 대해 가중치 스코어(weighting score)를 도출하고, 상기 깊이 픽셀 중에서 가장 높은 가중치 스코어를 갖는 깊이 픽셀의 픽셀 값을 상기 필터링 대상 픽셀에 대한 출력 값으로 결정할 수 있고, 상기 깊이 픽셀은 상기 깊이 픽쳐 내의 픽셀일 수 있다.

18. 16에 있어서, 상기 필터 타입 정보가 지시하는 필터는 양방향 가중치 미디언 필터(bi-laterally weighted median filter)일 수 있고, 상기 양방향 가중치 미디언 필터는, 상기 텍스쳐 픽셀을 기반으로 상기 윈도우 내의 깊이 픽셀 각각에 대해 가중치 스코어(weighting score)를 도출하고, 상기 가중치 스코어를 기반으로 상기 깊이 픽셀 중에서 중간 값을 도출하고, 상기 도출된 중간 값에 해당되는 깊이 픽셀의 픽셀 값을 상기 필터링 대상 픽셀에 대한 출력 값으로 결정할 수 있고, 상기 깊이 픽셀은 상기 깊이 픽쳐 내의 픽셀일 수 있다.

19. 13에 있어서, 상기 현재 픽쳐가 깊이 영상 내의 깊이 픽쳐이고, 상기 깊이 영상에 대응하는 텍스쳐 영상 내에서 상기 현재 픽쳐에 대응하는 텍스쳐 픽쳐가 유효하지 않은 경우, 상기 필터 타입 정보가 지시하는 필터는 양방향 가중치 미디언 필터일 수 있고, 상기 양방향 가중치 미디언 필터는, 상기 윈도우 내의 깊이 픽셀을 기반으로, 상기 깊이 픽셀 각각에 대해 가중치 스코어(weighting score)를 도출하고, 상기 가중치 스코어를 기반으로 상기 깊이 픽셀 중에서 중간 값을 도출하고, 상기 도출된 중간 값에 해당되는 깊이 픽셀의 픽셀 값을 상기 필터링 대상 픽셀에 대한 출력 값으로 결정할 수 있고, 상기 깊이 픽셀은 상기 깊이 픽쳐 내의 픽셀일 수 있다.

20. 19에 있어서, 상기 양방향 가중치 미디언 필터는, 상기 필터링 대상 픽셀이, 에지를 포함하는 에지(edge) 영역 내의 픽셀인 경우에는 약한 스무딩을 수행하고, 상기 필터링 대상 픽셀이, 에지를 포함하지 않는 넌 에지(non-edge) 영역 내의 픽셀인 경우에는 강한 스무딩을 수행할 수 있다.

본 발명에 따른 영상 부호화 방법에 의하면, 영상 부호화 효율이 향상되고 복잡도가 감소될 수 있다.

본 발명에 따른 영상 복호화 방법에 의하면, 영상 부호화 효율이 향상되고 복잡도가 감소될 수 있다.

본 발명에 따른 해상도 감소 갱신 방법에 의하면, 영상 부호화 효율이 향상되고 복잡도가 감소될 수 있다.

본 발명에 따른 필터링 방법에 의하면, 영상 부호화 효율이 향상될 수 있다.

도 1은 본 발명의 일 실시예에 따른 영상 부호화 장치를 개략적으로 나타내는 블록도이다.

도 2는 본 발명의 일 실시예에 따른 영상 복호화 장치를 개략적으로 나타내는 블록도이다.

도 3은 본 발명의 다른 실시예에 따른 영상 부호화 장치를 개략적으로 나타내는 블록도이다.

도 4는 본 발명의 다른 실시예에 따른 영상 복호화 장치를 개략적으로 나타내는 블록도이다.

도 5는 본 발명에 따른 업 샘플링 과정 및 필터링 과정을 설명하기 위한 도면이다.

도 6은 본 발명에 따른 복호화 방법의 일 실시예를 개략적으로 나타내는 흐름도이다.

도 7은 본 발명에 따른 복호화 방법의 다른 실시예를 개략적으로 나타내는 흐름도이다.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니다. 본 명세서에서 사용하는 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명의 기술적 사상을 한정하려는 의도로 사용되는 것은 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성 요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성 요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

한편, 본 발명에서 설명되는 도면상의 각 구성들은 영상 부호화/복호화 장치에서 서로 다른 특징적인 기능들에 관한 설명의 편의를 위해 독립적으로 도시된 것으로서, 각 구성들이 서로 별개의 하드웨어나 별개의 소프트웨어로 구현된다는 것을 의미하지는 않는다. 예컨대, 각 구성 중 두 개 이상의 구성이 합쳐져 하나의 구성을 이룰 수도 있고, 하나의 구성이 복수의 구성으로 나뉘어질 수도 있다. 각 구성이 통합 및/또는 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리범위에 포함된다.

또한, 일부의 구성 요소는 본 발명에서 본질적인 기능을 수행하는 필수적인 구성 요소는 아니고 단지 성능을 향상시키기 위한 선택적 구성 요소일 수 있다. 본 발명은 단지 성능 향상을 위해 사용되는 구성 요소를 제외한 본 발명의 본질을 구현하는데 필수적인 구성부만을 포함하여 구현될 수 있고, 단지 성능 향상을 위해 사용되는 선택적 구성 요소를 제외한 필수 구성 요소만을 포함한 구조도 본 발명의 권리 범위에 포함된다.

이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 이하, 도면상의 동일한 구성 요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성 요소에 대해서 중복된 설명은 생략한다.

도 1의 실시예에 따른 영상 부호화 장치는 텍스쳐 영상(texture video) 및 깊이 영상(depth video)에 모두 적용될 수 있다. 도 1을 참조하면, 영상 부호화 장치는 움직임 예측부(Motion Estimator: ME)(110), 움직임 보상부(Motion Compensator: MC)(120), 다운 샘플러(down-sampler)(130), 변환부(Transformer: T)(135), 양자화부(Quantizer: Q)(140), 엔트로피 부호화부(entropy coder)(150), 역양자화부(Inverse Quantizer or Dequantizer: IQ)(155), 역변환부(Inverse Transformer: IT)(160), 업 샘플러(up-sampler)(170), 필터부(180) 및 참조 픽쳐 버퍼(reference picture buffer)(190)를 포함할 수 있다.

영상 부호화 장치로 입력되는 입력 영상에서, 픽쳐는 적어도 하나의 처리 단위로 분할될 수 있다. 이 때, 처리 단위는 매크로 블록(macro block)일 수도 있고, 예측 유닛(Prediction Unit: PU)일 수도 있고, 변환 유닛(Transform Unit: TU)일 수도 있으며, 부호화 유닛(Coding Unit: CU)일 수도 있다. 이하, 후술되는 실시예들은 부호화/복호화 대상 픽쳐(또는 현재 픽쳐)가 분할됨으로써 생성된 처리 단위를 기준으로 서술되며, 유닛은 경우에 따라 블록으로 불릴 수도 있다.

한편, 텍스쳐 영상 및 깊이 영상에는 평탄도가 높고 단조로운(monotonous) 영역인 저주파수 영역 및 디테일한 특성이 중요시되는 고주파수 영역이 있을 수 있다. 이 때, 디테일이 중요하지 않은 저주파수 영역의 모든 픽셀 값에 대해 부호화 과정을 수행하는 경우, 코딩 효율에 비해 복잡도(complexity)가 지나치게 높을 수 있다. 저주파수 영역은 저해상도로 처리되는 경우에도 코딩 효율이 크게 감소되지 않을 수 있으므로, 이러한 저주파수 영역에 대해서는 다운 샘플러를 통해 해상도를 감소시켜 부호화 과정을 수행하고 복원 및/또는 복호화 과정에서 업 샘플러를 통해 업 샘플링을 수행하는 방법이 사용될 수 있다. 또한, 이 경우에 다운 샘플러 및 업 샘플러의 샘플링 비율(sampling ratio)은 영상의 단조로운 정도, 영상의 디테일이 중요시되는 정도 및/또는 영상의 주파수 정도에 따라 다르게 정해질 수 있다. 여기서, 다운 샘플링 비율 및 업 샘플링 비율은 서로 동일할 수 있다. 다운/업 샘플링 비율 결정 방법의 구체적인 실시예는 후술하기로 한다.

상술한 바와 같이, 영상의 주파수에 따라 부호화 과정에서 해상도를 감소시키고 복원 및/또는 복호화 과정에서 업 샘플링을 수행하는 방법은 해상도 감소 갱신(Reduced Resolution Update: RRU, 이하, 해상도 감소 갱신, Reduced Resolution Update 및 RRU는 모두 동일한 의미를 가짐.)으로 불릴 수 있다. 또한, 해상도 감소 갱신은 경우에 따라 감소된 해상도 갱신으로도 불릴 수 있다. 도 1의 실시예에서는 상술한 해상도 감소 갱신 방법이 사용될 수 있다.

도 1을 참조하면, 움직임 예측부(110)는 참조 픽쳐 버퍼(190)에 저장된 참조 픽쳐를 기반으로 움직임 벡터를 구할 수 있다. 움직임 보상부(120)는 움직임 벡터를 이용하여 움직임 보상을 수행하여 예측 블록을 생성할 수 있다. 예측을 위해 사용된 움직임 정보(예를 들어, 움직임 벡터 및 참조 픽쳐 인덱스 등)은 잔차값(residual)과 함께 엔트로피 부호화부(150)에서 부호화되어 복호화기에 전송될 수 있다.

다운 샘플러(130)는 생성된 예측 블록과 원본 블록 사이의 잔차값(잔차 블록: residual block)에 대해, 다운 샘플링을 수행할 수 있다. 이 때, 다운 샘플링된 잔차 블록은 변환부(135)로 입력될 수 있다. 영상의 주파수 특성에 따라 잔차 블록은 다운 샘플러(130)를 거치지 않고 바로 변환부(135)로 입력될 수도 있다. 예를 들어, 현재 블록에 해당되는 영역이 고주파수 영역인 경우 영상의 디테일한 특성이 중요시되므로, 잔차 블록은 다운 샘플링 없이 바로 변환부(135)로 입력될 수 있다.

변환부(135)는 변환 단위로 잔차 블록(또는 다운 샘플링된 잔차 블록)에 대해 변환(transform)을 수행하고 변환 계수를 생성할 수 있으며, 양자화부(140)는 변환부에서 변환된 잔차값들을 양자화하여 양자화 계수를 생성할 수 있다. 또한, 엔트로피 부호화부(150)는 양자화 계수들에 대한 엔트로피 부호화를 수행하여 비트스트림(bitstream)을 출력할 수 있다.

역양자화부(155)는 양자화부(140)에서 양자화된 값들을 역양자화할 수 있다. 또한, 역변환부(160)는 역양자화부(155)에서 역양자화된 값들을 역변환할 수 있다.

업 샘플러(170)는 역양자화부(155) 및 역변환부(160)에서 생성된 잔차값 및/또는 잔차 블록에 대해 업 샘플링을 수행할 수 있다. 업 샘플링된 잔차 블록은 움직임 보상부(120)에서 생성된 예측 블록과 합쳐져 복원 블록(reconstructed block)이 생성될 수 있다. 이 때, 필터부(180)는 복원 블록에 대해, 본 발명에 따른 필터링을 수행할 수 있다. 상기 필터부 동작에 대한 구체적인 실시예는 후술하기로 한다. 한편, 잔차 블록에 대해 다운 샘플링이 수행되지 않은 경우, 역변환부(160)에서 생성된 잔차 블록은 업 샘플러(170)를 거치지 않고 바로 움직임 보상부(120)에서 생성된 예측 블록과 합쳐질 수도 있다. 이 경우, 일례로 필터부(180)는 생성된 복원 블록에 대해 필터링을 수행하지 않을 수 있다.

참조 픽쳐 버퍼(190)는 생성된 복원 블록 및/또는 필터링이 수행된 복원 블록을 저장할 수 있다. 참조 픽쳐 버퍼(190)에 저장된 복원 블록 및/또는 픽쳐는 움직임 예측부(110) 및 움직임 보상부(120)에 제공될 수 있다.

도 2는 본 발명의 일 실시예에 따른 영상 복호화 장치를 개략적으로 나타내는 블록도이다. 도 2를 참조하면, 영상 복호화 장치는 엔트로피 복호화부(entropy decoder)(210), 역양자화부(IQ, 220), 역변환부(IT, 230), 업 샘플러(240), 움직임 보상부(MC, 250), 필터부(260) 및 참조 픽쳐 버퍼(270)를 포함할 수 있다.

도 2의 실시예에 따른 영상 복호화 장치는 영상 부호화 장치와 마찬가지로 텍스쳐 영상(texture video) 및 깊이 영상(depth video)에 모두 적용될 수 있다. 또한, 도 2의 실시예에서는 상술한 해상도 감소 갱신 방법이 사용될 수 있다.

도 2를 참조하면, 엔트로피 복호화부(210)는 입력된 비트스트림에 대하여 엔트로피 복호화를 수행할 수 있다. 엔트로피 복호화부(210)에서 복호화된 정보 중 예측 블록을 생성하기 위한 움직임 정보는 움직임 보상부(250)로 제공되고, 엔트로피 복호화가 수행된 잔차값은 역양자화부(220)로 입력될 수 있다. 역양자화부(220)는 엔트로피 복호화가 수행된 잔차값을 기반으로 역양자화를 수행할 수 있고, 역변환부(230)는 역양자화부(220)에서 수행된 역양자화 결과에 대해 역변환을 수행함으로써 잔차 블록을 도출할 수 있다.

업 샘플러(240)는 역변환부(230)에서 도출된 잔차 블록에 대해 업 샘플링을 수행함으로써, 영상 부호화 장치의 다운 샘플러(130)에 의해 감소된 해상도를 높일 수 있다. 한편, 영상 부호화 장치에서 잔차 블록에 대해 다운 샘플링이 수행되지 않은 경우에는, 역변환부(230)에서 도출된 잔차 블록에 대해 업 샘플링이 수행되지 않을 수 있다.

움직임 보상부(250)는 엔트로피 복호화부(210)에서 제공된 움직임 정보와 참조 픽쳐 버퍼(270)에서 제공된 이전에 복호화된 블록 및/또는 픽쳐 정보를 기초로 예측 블록을 생성할 수 있다. 복원 블록은, 역변환부(230)에서 도출된 잔차 블록 및/또는 업 샘플러(240)에서 제공되는 잔차 블록이 예측 블록과 더해짐으로써 생성될 수 있다. 업 샘플링된 잔차 블록을 기반으로 복원 블록이 생성된 경우, 필터부(260)는 그 복원 블록에 대해, 본 발명에 따른 필터링을 수행할 수 있다. 상기 필터링에 대한 구체적인 실시예는 후술하기로 한다.

참조 픽쳐 버퍼(270)는 생성된 복원 픽쳐(또는 복원 블록) 및/또는 필터링이 수행된 복원 픽쳐(또는 복원 블록)을 저장하여 참조 픽쳐 또는 참조 블록으로 사용할 수 있도록 할 수 있고 또한 복원 픽쳐 및/또는 복원 블록을 출력부로 제공할 수 있다.

도 3은 본 발명의 다른 실시예에 따른 영상 부호화 장치를 개략적으로 나타내는 블록도이다. 도 3을 참조하면, 영상 부호화 장치는 예측부(310), 다운 샘플러(320), 변환부(T, 330), 양자화부(Q, 340), 엔트로피 부호화부(350), 역양자화부(IQ, 360), 역변환부(IT, 370), 업 샘플러(380), 필터부(385) 및 참조 픽쳐 버퍼(390)를 포함할 수 있다.

도 3의 실시예에 따른 영상 부호화 장치는 텍스쳐 영상 및 깊이 영상에 모두 적용될 수 있다. 또한, 도 1의 실시예에서와 마찬가지로 도 3의 실시예에서는 상술한 해상도 감소 갱신(RRU) 방법이 사용될 수 있다.

한편, 도 1에서는 인터 예측이 수행되는 경우의 부호화 방법이 서술되고 있으나, 본 발명은 이에 한정되는 것은 아니다. 본 발명은 인터 예측뿐만 아니라 인트라 예측이 수행되는 경우에도 동일하거나 유사한 방법으로 적용될 수 있다.

도 3을 참조하면, 예측부(310)는 인터 예측을 수행하는 인터 예측부와 인트라 예측을 수행하는 인트라 예측부를 포함할 수 있다. 인터 예측부는 현재 픽쳐의 이전 픽쳐 또는 이후 픽쳐 중 적어도 하나의 픽쳐의 정보를 기초로 예측을 수행하여 예측 블록을 생성할 수 있다. 인터 예측부의 구체적인 동작은 도 1의 실시예에서와 동일하므로 생략하기로 한다. 또한, 인트라 예측부는 현재 픽쳐 내의 픽셀 정보를 기초로 예측을 수행하여 예측 블록을 생성할 수 있다. 예측을 위해 사용한 예측 모드 정보, 움직임 정보 등을 잔차값과 함께 엔트로피 부호화부(350)에서 부호화되어 복호화기에 전송될 수 있다.

상술한 구성을 제외한 나머지 구성의 동작은 도 1에서와 동일하므로, 여기서는 생략하기로 한다.

도 4는 본 발명의 다른 실시예에 따른 영상 복호화 장치를 개략적으로 나타내는 블록도이다. 도 4를 참조하면, 영상 복호화 장치는 엔트로피 복호화부(410), 역양자화부(IQ, 420), 역변환부(IT, 430), 업 샘플러(440), 예측부(450), 필터부(455) 및 참조 픽쳐 버퍼(460)를 포함할 수 있다.

도 4의 실시예에 따른 영상 복호화 장치는 도 3의 영상 부호화 장치와 마찬가지로 텍스쳐 영상 및 깊이 영상에 모두 적용될 수 있다. 또한, 도 2의 실시예에서와 마찬가지로 도 4의 실시예에서는 상술한 해상도 감소 갱신(RRU) 방법이 사용될 수 있다.

한편, 도 2에서는 인터 예측이 수행되는 경우의 복호화 방법이 서술되고 있으나, 본 발명은 이에 한정되는 것은 아니다. 본 발명은 인터 예측뿐만 아니라 인트라 예측이 수행되는 경우에도 동일하거나 유사한 방법으로 적용될 수 있다.

도 4를 참조하면, 예측부(450)는 인터 예측을 수행하는 인터 예측부와 인트라 예측을 수행하는 인트라 예측부를 포함할 수 있다. 인터 예측부는 엔트로피 복호화부(410)에서 제공된 움직임 정보와 참조 픽쳐 버퍼(460)에서 제공된 이전에 복호화된 블록 및/또는 픽쳐 정보를 기초로 예측 블록을 생성할 수 있다. 또한, 인트라 예측부는 엔트로피 복호화부(410)에서 제공된 예측 블록 생성 관련 정보 및 현재 픽쳐 내의 픽셀 정보를 기초로 예측을 수행하여 예측 블록을 생성할 수 있다.

상술한 구성을 제외한 나머지 구성의 동작은 도 2에서와 동일하므로, 여기서는 생략하기로 한다.

도 5는 도 1 내지 도 4의 실시예에 도시된 업 샘플러의 동작 및 복원 블록에 대해 적용되는 필터의 동작을 설명하기 위한 실시예이다. 도 5는 업 샘플링 과정에 의해 생성되거나 보간(interpolated)될 샘플의 위치 및 다운 샘플링된 저해상도(low-resolution) 샘플을 도시한다. 여기서, 샘플은 경우에 따라 픽셀과 동일한 의미를 가질 수 있으며, 이와 같은 구별은 당해 기술 분야에서 통상의 지식을 가진 자라면 용이하게 할 수 있을 것이다. 이하, 업 샘플링 과정에 의해 생성된 샘플은 보간 샘플이라 한다.

현재 픽쳐 내의 임의의 위치(예를 들어, (m,n), 여기서 m 및 n은 0 이상의 정수임.)의 보간 샘플 및/또는 상기 보간 샘플에 대응하는 복원 샘플은, 상기 보간 샘플의 위치를 포함하는 소정의 크기 및/또는 소정의 모양의 윈도우(window) 내에 있는 저해상도 샘플을 기반으로 생성될 수 있다.

도 1 및 도 2에서 상술한 바와 같이, 업 샘플러는 입력된 잔차 블록에 대해 업 샘플링을 수행할 수 있다. 즉, 잔차 블록 내의 임의의 위치(예를 들어, (m,n), 여기서 m 및 n은 0 이상의 정수임.)의 보간 샘플은 업 샘플링에 의해 생성될 수 있다. 일례로, 업 샘플러는 보간될 샘플의 위치에 대해 제로 패딩(zero-padding) 과정을 수행할 수 있다. 여기서, 제로 패딩 과정은 보간될 샘플의 위치에 0의 값을 채워 넣는 과정을 의미할 수 있다. 또한 예를 들어, 업 샘플러는 상기 윈도우 내의 저해상도 샘플을 기반으로 복사 또는 간단한 선형 필터링을 수행함으로써 보간 샘플을 생성할 수도 있다.

또한, 도 1 및 도 2에서 상술한 바와 같이, 복원 블록은 예측 블록 및 업 샘플링이 수행된 잔차 블록이 더해짐으로써 생성될 수 있다. 이 때, 필터부는 상기 윈도우 내의 저해상도 샘플을 기반으로, 상기 생성된 복원 블록 내의 (m,n) 위치의 복원 샘플에 대해 필터링을 수행함으로써, (m,n) 위치의 최종 복원 샘플을 도출할 수 있다. 여기서, 상기 필터링은 일례로 로우 패스(low-pass) 필터링에 해당될 수 있다.

도 5를 참조하면, 현재 보간될 샘플의 위치는 (m,n)이고, 도 5의 510은 상기 (m,n) 위치의 샘플이라 가정한다. 이 때, 업 샘플러는 (m,n) 위치의 보간 샘플 생성을 위해, (m,n)의 위치를 포함하는 소정의 크기의 윈도우 N(m,n)을 결정하거나 설정할 수 있다. 도 5의 520은 상기 윈도우 N(m,n)을 나타낸다. 여기서, 윈도우 N(m,n)은 2x2 크기의 정사각형 모양 윈도우일 수 있으며, 상기 윈도우는 2x2개의 저해상도 샘플을 포함할 수 있다. 그러나, 윈도우의 크기, 모양 및/또는 위치는 도 5의 실시예에 한정되는 것은 아니며, 구현 및/또는 필요에 따라 다르게 결정되거나 설정될 수도 있다.

이 때, 업 샘플러는 잔차 블록에 대한 업 샘플링을 수행함으로써 (m,n) 위치의 보간 샘플을 생성할 수 있다. 일례로, 업 샘플러는 보간될 샘플의 위치에 대해 제로 패딩 과정을 수행할 수 있다. 또한, 영상 부호화/복호화 장치는 예측 블록 및 업 샘플링이 수행된 잔차 블록을 더하여 복원 블록을 생성할 수 있다. 이 때, 필터부는 상기 윈도우(520) 내의 저해상도 샘플을 기반으로, 상기 생성된 복원 블록 내의 (m,n) 위치의 복원 샘플(510)에 대해 필터링(예를 들어, 로우 패스 필터링)을 수행함으로써, (m,n) 위치의 최종 복원 샘플을 도출할 수 있다.

한편, 상술한 업 샘플링 과정 및 필터링 과정은 각각 업 샘플링 비율 정보 및 필터 타입 정보에 기반하여 수행될 수 있다. 이 때, 다운 샘플링 비율과 업 샘플링 비율은 서로 동일할 수 있다. 후술되는 실시예들은 업 샘플링을 중심으로 서술되지만, 업 샘플링에 적용되는 업 샘플링 비율 값은 다운 샘플링 비율 값으로도 사용될 수 있다.

상술한 바와 같이, 업/다운 샘플링 비율은 영상의 단조로운 정도, 영상의 디테일이 중요시되는 정도 및/또는 영상의 주파수 정도에 따라 다르게 정해질 수 있다. 예를 들어, 부호화/복호화되는 영상 신호가, 디테일이 중요시되는 고주파수 영역이 아닌 단조로운 값의 연속으로 특징 지어지는 저주파수 영역에 대응되는 신호인 경우, 높은 샘플링 비율을 사용하는 것이 율-왜곡 최적화(rate-distortion optimization: RDO) 관점에서 유리할 수 있다. 반대로, 부호화/복호화되는 영상 신호가 디테일이 중요시되는 고주파수 영역에 대응되는 신호인 경우, 낮은 샘플링 비율을 사용하는 것이 율-왜곡 최적화 관점에서 유리할 수 있다.

또한, 샘플링 비율의 경우와 마찬가지로, 필터 타입도 영상의 특성에 따라 다르게 정해질 수 있다. 일례로, 필터부는 에지(edge)를 포함하는 에지 영역에 대해서는 약한 스무딩(smoothing)을 수행하는 필터를 적용할 수 있고, 에지를 포함하지 않는 넌-에지(non-edge) 영역에 대해서는 강한 스무딩을 수행하는 필터를 적용할 수 있다. 이러한 적응적인 필터 타입의 적용은, 영상 신호에서 에지(edge)와 같은 두드러진(salient) 특징들이 더 잘 유지되도록 할 수 있다.

영상 부호화 장치는 율-왜곡 최적화 관점에서, 업 샘플링(및/또는 다운 샘플링) 비율 및 필터 타입의 최적의 조합을 도출할 수 있다. 여기서, 업 샘플링(및/또는 다운 샘플링) 비율 및 필터 타입의 조합은 RRU 타입(Reduced-Resolution Update type) 및/또는 RRU 모드(Reduced-Resolution Update mode)에 의해 나타내어질 수 있다. 즉, 하나의 RRU 타입은 하나의 업 샘플링(및/또는 다운 샘플링) 비율 및 하나의 필터 타입을 지시하거나 및/또는 포함할 수 있다. 이 때, 하나의 블록에 대한 업 샘플링 과정 및 필터링 과정은 하나의 RRU 타입 정보 및/또는 하나의 RRU 모드 정보에 기반하여 수행될 수 있다. 상술한 RRU 타입은 텍스쳐 영상 및 깊이 영상 각각에 대해 독립적으로 적용될 수 있다. 따라서 텍스쳐 영상에 적용되는 필터 타입과 깊이 영상에 적용되는 필터 타입은 서로 다를 수 있으며, 텍스쳐 영상에 적용되는 샘플링 비율과 깊이 영상에 적용되는 샘플링 비율도 서로 다를 수 있다.

다음 표 1은 본 발명에 따른 RRU 타입의 일 실시예를 나타낸다. 다만, RRU 타입의 실시예는 후술되는 표 1에 한정되지 않으며, RRU 타입에 할당되는 값, 업 샘플링 비율 값 및 필터 타입은 필요에 따라 표 1의 실시예에서와 다르게 정해질 수도 있다.

[표 1]

표 1을 참조하면, 하나의 RRU 타입은 하나의 업 샘플링 비율과 하나의 필터 타입을 지시할 수 있다. 예를 들어, RRU 타입이 0인 경우, 업 샘플링 비율이 1이므로 업 샘플링이 수행되지 않을 수 있고, 필터링도 수행되지 않을 수 있다. 다른 예로, RRU 타입이 1인 경우, 업 샘플링 비율은 2이므로 2배의 업 샘플링이 수행될 수 있으며, 필터 A가 적용될 수 있다. 표 1에 나타내어진 필터 A 및 필터 B의 구체적인 실시예는 후술하기로 한다.

RRU 타입 정보가 사용되는 경우, 영상 부호화 장치는 율-왜곡 최적화 관점에서 최적의 RRU 타입 및/또는 RRU 모드를 결정할 수 있다. 이 때, 영상 부호화 장치는 상기 결정된 RRU 타입 및/또는 RRU 모드를 기반으로 해상도 감소 갱신을 수행함으로써, 영상의 두드러진(salient) 특징(예를 들어, 에지 영역), 고주파수 텍스쳐 등과 같은 영상의 지역적 특성들이 더 잘 유지되도록 할 수 있다. 즉, RRU 타입 정보가 사용되는 경우 영상의 특성에 따라 샘플링 비율 및 필터 타입의 조합이 적응적으로 결정될 수 있으므로, 적응적인 해상도 감소 갱신이 가능해질 수 있다.

이하, 율-왜곡 최적화 기반의 RRU 타입 결정 방법의 실시예가 서술된다. 후술되는 실시예에서, RRU 타입 결정을 위한 비용 함수는 매크로 블록 단위를 기반으로 적용된다고 가정한다. 그러나, 본 발명은 이에 한정되는 것은 아니며, RRU 타입 결정을 위한 비용 함수는 CU, PU 및/또는 TU를 기반으로 적용될 수도 있다.

인터 예측이 적용되는 경우, 율-왜곡 최적화 기반의 RRU 타입 결정 방법은 일 실시예로 다음 수학식 1과 같이 나타내어질 수 있다.

[수학식 1]

여기서, J는 비용 함수를 나타내며, λ는 라그랑지 승수(Lagrange multiplier)를 나타낸다. 또한, rru_type은 RRU 타입을 나타내며, mb_type은 inter_16x16, skip 등과 같은 일반적인 매크로 블록 타입을 나타낼 수 있다. 한편, 매크로 블록 단위가 아닌 CU, PU 또는 TU 단위로 비용 함수가 계산되는 경우, 상기 mb_type은 각각 cu_type, pu_type 또는 tu_type 으로 대체될 수 있다. 여기서, cu_type, pu_type 및 tu_type 은 각각 CU의 타입, PU의 타입 및 TU의 타입을 나타낼 수 있다.

그리고, R_MV는 움직임 벡터(Motion Vector: MV) 및/또는 참조 픽쳐 인덱스(예를 들어, ref_idx)를 부호화하기 위한 비트율(bitrate)을 나타내고, R_{mb_type}은 mb_type을 부호화하기 위한 비트율을 나타낼 수 있다. 여기서, R_{mb_type}은 비용 함수가 계산되는 단위에 따라 R_{cu_type},R_{pu_type}또는 R_{tu_type}로 대체될 수 있으며, 이 경우 R_{cu_type},R_{pu_type}및 R_{tu_type}는 각각 CU, PU 및 TU를 부호화하기 위한 비트율을 나타낼 수 있다. 또한, R_{rru_type}은 업 샘플링 비율 및 필터 타입을 부호화하기 위한 비트율을 나타낼 수 있다.

상기 수학식 1에서 D는 일례로 다음 수학식 2와 같이 계산될 수 있다.

[수학식 2]

여기서, MB는 매크로 블록을 나타내고, X는 입력 영상 내에 존재하는 샘플의 위치를 나타내며, X_p는 X 위치의 샘플에 대응하는 참조 영상 내의 샘플 위치를 나타낼 수 있다. 한편, 매크로 블록 단위가 아닌 CU, PU 또는 TU 단위로 비용 함수가 계산되는 경우, 상기 MB는 CU, PU 또는 TU로 대체될 수 있다. MV는 움직임 벡터를 나타내며, 이 때 X_p는 MV에 의해 지시되는 참조 영상 내의 예측 샘플의 위치를 의미할 수 있다. 또한, I는 입력 영상 내의 픽셀 값을 나타내고, I_p는 참조 영상 내의 예측 픽셀 값을 나타낼 수 있다.

영상 부호화 장치는 상술한 비용 함수를 최소화하는 업 샘플링 비율 및 필터 타입을 찾을 수 있다. 이 때, 영상 부호화 장치는 비용 함수를 최소화하는 RRU 타입을 현재 블록에 대한 최적의 RRU 타입으로 결정할 수 있다.

도 6은 본 발명에 따른 복호화 방법의 일 실시예를 개략적으로 나타내는 흐름도이다. 도 6의 실시예에 따른 복호화 과정은 텍스쳐 영상 및 깊이 영상에 모두 적용될 수 있다.

부호화기는 율-왜곡 최적화에 기반하여 RRU 타입을 결정한 후 RRU 타입에 관한 정보를 부호화하여 복호화기로 전송할 수 있으며, 복호화기는 부호화기로부터 RRU 타입에 관한 정보를 수신하여 복호화할 수 있다. 이 때, 복호화기는 상기 복호화된 RRU 타입에 관한 정보를 기반으로, 업 샘플링 및 필터링을 수행할 수 있다.

도 6의 실시예에서 RRU 타입은 상술한 표 1에서와 같이 정의된다고 가정한다. 또한, 복호화기에서의 잔차 블록 및 예측 블록 생성 과정은 도 2에서 상술한 바 있으므로, 여기서는 생략하기로 한다.

도 6을 참조하면, RRU 타입이 0인 경우, 복호화기는 해상도 감소 갱신 과정을 수행하지 않을 수 있다(S610). RRU 타입이 0일 때 업 샘플링 비율은 1이 되므로 업 샘플링이 수행되지 않을 수 있으며, 필터 타입 정보에 따라 필터링도 적용되지 않을 수 있다.

RRU 타입이 1 또는 2인 경우, 복호화기는 잔차 블록에 대해 업 샘플링을 수행할 수 있다(S620). RRU 타입이 1 또는 2인 경우에는 업 샘플링 비율이 2이므로, 복호화기는 잔차 블록의 폭, 높이 방향 각각에 대해 2배의 비율로 업 샘플링을 수행할 수 있다. 그리고, 복호화기는 업 샘플링이 수행된 잔차 블록을 예측 블록과 더함으로써 복원 블록을 생성할 수 있다(S630).

복원 블록이 생성되면, 복호화기는 생성된 복원 블록 내의 복원 샘플 각각에 대해 필터링을 수행할 수 있다. 이 때, RRU 타입이 1인 경우 필터 타입은 A에 해당되므로, 복호화기는 복원 블록 내의 복원 샘플에 대해 필터 A를 적용할 수 있다(S640). 또한, RRU 타입이 2인 경우 필터 타입은 B에 해당되므로, 복호화기는 복원 블록 내의 복원 샘플에 대해 필터 B를 적용할 수 있다(S650). 여기서, 필터 A 및 필터 B의 구체적인 실시예는 후술하기로 한다.

RRU 타입이 3 또는 4인 경우에도, 복호화기는 잔차 블록에 대해 업 샘플링을 수행할 수 있다(S660). RRU 타입이 3 또는 4인 경우에는 업 샘플링 비율이 4이므로, 복호화기는 잔차 블록의 폭, 높이 방향 각각에 대해 4배의 비율로 업 샘플링을 수행할 수 있다. 그리고, 복호화기는 업 샘플링이 수행된 잔차 블록을 예측 블록과 더함으로써 복원 블록을 생성할 수 있다(S670).

복원 블록이 생성되면, 복호화기는 생성된 복원 블록 내의 복원 샘플 각각에 대해 필터링을 수행할 수 있다. 이 때, RRU 타입이 3인 경우 필터 타입은 A에 해당되므로, 복호화기는 복원 블록 내의 복원 샘플에 대해 필터 A를 적용할 수 있다(S680). 또한, RRU 타입이 4인 경우 필터 타입은 B에 해당되므로, 복호화기는 복원 블록 내의 복원 샘플에 대해 필터 B를 적용할 수 있다(S690). 여기서, 필터 A 및 필터 B의 구체적인 실시예는 후술하기로 한다.

한편, 상술한 실시예는 복호화기를 중심으로 서술되고 있으나, 부호화기에도 유사한 방법으로 적용될 수 있다. 도 1에서 상술한 바와 같이 부호화기는 복호화기에서와 마찬가지로 업 샘플링 과정 및 필터링 과정을 수행할 수 있으므로, 상술한 업 샘플링 방식 및 필터링 방식은 부호화기에도 동일한 방법으로 적용될 수 있다.

이하, 본 발명에 따른 필터 타입의 실시예들이 서술된다. 상술한 표 1 및 도 6의 실시예에서는 필터 A 및 필터 B가 사용되는 바, 후술되는 실시예들은 필터 A 및 필터 B를 중심으로 서술된다. 그러나, 본 발명에 따른 필터 타입은 이에 한정되는 것은 아니며, RRU 타입에 따라 필터 타입이 할당되는 순서 및/또는 사용되는 필터 타입의 개수, 종류 등은 구현 및/또는 필요에 따라 다르게 정해질 수도 있다.

또한, 상술한 실시예들은 텍스쳐 영상(texture video)뿐만 아니라 깊이 영상(depth video)에도 적용될 수 있으며, 텍스쳐 영상에 적용되는 필터 및 깊이 영상에 적용되는 필터는 서로 다를 수 있다. 따라서, 후술되는 실시예에서는 텍스쳐 영상에 대해 적용되는 필터 및 깊이 영상에 대해 적용되는 필터의 실시예들이 각각 독립적으로 서술된다.

실시예 1: 텍스쳐 영상에 대한 필터

상술한 도 1 내지 도 6의 실시예에서, 필터부는 텍스쳐 영상에 대응하는 복원 영상(또는 복원 블록)에 대해, 양방향 가중치 필터(bi-laterally weighted filter)를 적용할 수 있다. 상기 양방향 가중치 필터는 필터링 대상 픽셀에 대응하는 윈도우 내의 픽셀 값들을 기반으로 가중치 평균을 수행할 수 있다. 텍스쳐 영상에 대응하는 복원 영상(또는 복원 블록)에 대해 적용되는 양방향 가중치 필터는, 다음 수학식 3에 의해 나타내어질 수 있다.

[수학식 3]

여기서, (m,n)은 필터링 대상 픽셀의 위치를 나타내고, N(m,n)은 필터링 대상 픽셀에 대응하는 윈도우를 나타낼 수 있다. 상기 윈도우에 대한 실시예는 상술한 바 있으므로, 여기서는 생략하기로 한다. 또한, I(i,j)는 상기 필터의 입력 픽셀 값들을 나타내고, (i,j)는 윈도우 N(m,n) 내에 존재하는 입력 픽셀의 위치를 나타낼 수 있다. I’(m,n)은 (m,n) 위치의 필터링 대상 픽셀에 대한, 필터의 출력 값을 나타낼 수 있다.

수학식 3에서 w(i,j)는 가중치 커널(weighting kernel)을 나타내며, (m,n)과 (i,j) 사이의 기하하적(geometric) 거리 및 상기 두 점 사이의 광도(photometric) 거리에 기반한 단조 감소 함수(monotonically decreasing function)에 해당될 수 있다. 여기서, 기하학적 거리는 두 점 간의 물리적인 거리를 의미할 수 있고, 광도 거리는 두 점에 존재하는 픽셀 간의 강도(intensity) 차이 및/또는 픽셀 값 차이를 나타낼 수 있다. 즉, 텍스쳐 영상에 대해 적용되는 필터의 가중치 커널은 필터링 대상 픽셀 및 윈도우 내에 존재하는 주변 픽셀 간의 기하학적 거리뿐만 아니라, 상기 두 픽셀 간의 강도(intensity) 차이(및/또는 루마 픽셀 값 차이)를 기반으로 결정될 수 있다. 이 때, 필터부는 필터링 대상 픽셀과 유사한 픽셀에 대해 더 큰 가중치를 적용할 수 있다. 다음 수학식 4는 상술한 가중치 커널의 일 실시예를 나타낸다.

[수학식 4]

여기서, I_(i,j)는 (i,j) 위치의 픽셀 입력 값을 나타낼 수 있고, I_(m,n)은 (m,n) 위치의 픽셀 입력 값을 나타낼 수 있다. 또한, σ_s는 공간 영역(spatial domain)에서의 스무딩(smoothing) 정도를 나타내는 확산 파라미터(spread parameter)이고, σ_I는 픽셀 강도(pixel-intensity) 영역에서의 스무딩 정도를 나타내는 확산 파라미터에 해당될 수 있다.

상술한 양방향 가중치 필터는 비선형(non-linear) 특성을 가질 수 있으며, 영상의 에지(edge)를 보존하면서 영상에 대한 스무딩을 수행할 수 있다.

상술한 표 1 및 도 6의 실시예에서, 필터 A 및 필터 B는 상술한 양방향 가중치 필터에 해당될 수 있다. 이 때, 필터 A는 텍스쳐리스(textureless) 영역(또는 블록) 및/또는 에지가 존재하지 않는 영역(또는 블록)에 대해 적용되는 필터일 수 있고, 필터 B는 하이 텍스쳐(highly-textured) 영역(또는 블록) 및/또는 에지가 존재하는 에지 영역(또는 블록)에 대해 적용되는 필터일 수 있다.

이 때, 텍스쳐리스(textureless) 영역(또는 블록) 및/또는 에지가 존재하지 않는 영역(또는 블록)에 대해서는, 강한 스무딩(strong-smoothing)을 수행하는 양방향 가중치 필터가 적용될 수 있다. 따라서, 필터 A에 적용되는 확산 파라미터 σ_s및 σ_I는 상대적으로 큰 값을 갖는 확산 파라미터일 수 있다. 또한, 하이 텍스쳐(highly-textured) 영역(또는 블록) 및/또는 에지가 존재하는 에지 영역(또는 블록)에 대해서는, 약한 스무딩(weak-smoothing)을 수행하는 양방향 가중치 필터가 적용될 수 있다. 따라서, 필터 B에 적용되는 확산 파라미터 σ_s및 σ_I는 상대적으로 작은 값을 갖는 확산 파라미터일 수 있다.

실시예 2: 깊이 영상에 대한 필터 1

상술한 바와 같이 필터부는 깊이 영상에 대응하는 복원 영상에 대해 필터링을 수행할 수 있다. 이 때, 텍스쳐 영상과 깊이 영상은 서로 다르지만 유사한 경향을 가질 수 있다. 따라서, 필터링 대상 깊이 영상(또는 픽쳐 또는 블록)에 대응하는 텍스쳐 영상(또는 픽쳐 또는 블록)이 유효한 경우, 필터부는 복호화된 텍스쳐 영상의 픽셀 값을 기반으로 깊이 영상에 대응하는 복원 영상에 대한 필터링을 수행할 수 있다. 이 때 예를 들어, 필터부는 텍스쳐 픽쳐 내의 픽셀 중에서, 필터링 대상 픽셀의 윈도우에 대응되는 영역 내의 픽셀을 기반으로 필터링 대상 픽셀에 대한 필터링을 수행할 수 있다. 즉, 깊이 영상에 대응하는 복원 영상에 적용되는 필터는, 텍스쳐 영상에 관련된 정보를 이용하여 필터링을 수행할 수 있다. 이하, 후술되는 실시예에서 깊이 영상 내의 픽셀은 깊이 픽셀이라 하고, 텍스쳐 영상 내의 픽셀은 텍스쳐 픽셀이라 한다.

한편, 깊이 영상은 에지 영역을 제외한 나머지 영역에서는, 텍스쳐 영상에 비해 디테일이 중요시되지 않는 특징을 가지므로, 깊이 영상에서는 에지 부분의 선명도(sharpness)가 중요하고, 나머지 부분은 크게 중요하지 않을 수 있다. 따라서, 이러한 깊이 영상의 특징을 고려한 필터가 제공될 필요가 있다.

상술한 표 1 및 도 6의 실시예에서, 깊이 영상에 대응하는 복원 영상(또는 블록)에 적용되는 필터 A 및 필터 B는, 양방향 가중치 필터일 수 있다. 이 때, 필터 A는 양방향 가중치 WTA(Winner-Take-All) 필터일 수 있고, 필터 B는 양방향 가중치 미디언(median) 필터일 수 있다.

우선, 필터 A에 해당되는 양방향 가중치 WTA 필터에서는, 필터링 대상 픽셀에 대응하는 윈도우 내에서 가중치 스코어(및/또는 가중치 빈도수)가 가장 높은 깊이 픽셀의 픽셀 값이, 필터 출력 값(필터링된 픽셀 값)으로 결정될 수 있다. 이 때, 깊이 영상에 대응하는 복원 영상에 대해 적용되는 양방향 가중치 WTA 필터는, 다음 수학식 5에 의해 나타내어질 수 있다.

[수학식 5]

여기서, (m,n)은 필터링 대상 깊이 픽셀의 위치를 나타내고, N(m,n)은 필터링 대상 깊이 픽셀에 대응하는 윈도우를 나타낼 수 있다. 상기 윈도우에 대한 실시예는 상술한 바 있으므로, 여기서는 생략하기로 한다. 또한, D(i,j)는 상기 필터의 입력 깊이 픽셀 값들을 나타내고, (i,j)는 윈도우 N(m,n) 내에 존재하는 입력 픽셀의 위치를 나타낼 수 있다. D’(m,n)은 (m,n) 위치의 필터링 대상 깊이 픽셀에 대한, 필터의 출력 값을 나타낼 수 있다.

수학식 5에서

은 가중치 커널(weighting kernel)을 나타내며, (m,n)과 (i,j) 사이의 기하학적 거리 및 상기 두 점 사이의 광도 거리에 기반한 단조 감소 함수에 해당될 수 있다. 여기서, 기하학적 거리는 두 점 간의 물리적인 거리를 의미할 수 있고, 광도 거리는 두 점과 동일한 위치에 존재하는 텍스쳐 픽셀(I_(m,n) 및 I_(i,j)) 간의 강도 차이 및/또는 텍스쳐 픽셀 값 차이를 나타낼 수 있다. 즉, 깊이 영상에 대해 적용되는 필터의 가중치 커널은 필터링 대상 깊이 픽셀 및 윈도우 내에 존재하는 주변 픽셀 간의 기하학적 거리뿐만 아니라, 상기 두 픽셀과 각각 동일한 위치에 존재하는 텍스쳐 픽셀들 간의 강도 차이(및/또는 루마 픽셀 값 차이)를 기반으로 결정될 수 있다. 이 때, 필터부는 필터링 대상 픽셀과 유사한 픽셀에 대해 더 큰 가중치를 적용할 수 있다.

또한, σ_s는 공간 영역(spatial domain)에서의 스무딩(smoothing) 정도를 나타내는 확산 파라미터(spread parameter)이고, σ_I는 픽셀 강도(pixel-intensity) 영역에서의 스무딩 정도를 나타내는 확산 파라미터에 해당될 수 있다.

수학식 5를 참조하면, 양방향 가중치 WTA 필터는 텍스쳐 픽셀을 기반으로, 윈도우 내의 깊이 픽셀 각각에 대해 가중치 스코어를 도출할 수 있다. 상술한 수학식 5에서

는 가중치 스코어(weighting score)에 해당될 수 있다. 이 때, 필터부는 상기 윈도우 내의 깊이 픽셀 중에서 가장 높은 가중치 스코어를 갖는 깊이 픽셀 값을 필터링 대상 깊이 픽셀에 대한 출력 값으로 결정할 수 있다. 즉, 상술한 양방향 가중치 WTA 필터에 의하면, 필터부는 필터링 대상 깊이 픽셀에 대응하는 윈도우 내의 픽셀들 중에서 가중치 스코어(및/또는 가중치 빈도수)가 가장 높은 값을, 상기 필터링 대상 깊이 픽셀에 대한 필터링된 픽셀 값으로 도출할 수 있다. 따라서, 이 경우에 필터부는 필터링 이전에 존재하지 않는 새로운 깊이 값을 도입(introduce)하거나 도출하지 않으므로, 깊이 영상 내의 객체 경계 및/또는 그 경계의 특성이 더 잘 유지될 수 있다.

다음으로, 필터 B에 해당되는 양방향 가중치 미디언 필터에서는, 필터링 대상 픽셀에 대응하는 윈도우 내에서, 가중치 스코어(및/또는 가중치 빈도수)에 기반한 중간 값에 해당하는 깊이 픽셀 값이 필터 출력 값(필터링된 픽셀 값)으로 결정될 수 있다. 이 때, 깊이 영상에 대응하는 복원 영상에 대해 적용되는 양방향 가중치 미디언 필터는, 다음 수학식 6에 의해 나타내어질 수 있다.

[수학식 6]

수학식 6에서,

은 가중치 커널(weighting kernel)을 나타내며, (m,n)과 (i,j) 사이의 기하학적 거리 및 상기 두 점 사이의 광도 거리에 기반한 단조 감소 함수에 해당될 수 있다. 여기서, 기하학적 거리는 두 점 간의 물리적인 거리를 의미할 수 있고, 광도 거리는 두 점과 동일한 위치에 존재하는 ‘텍스쳐 픽셀’(I_(m,n) 및 I_(i,j)) 간의 강도 차이 및/또는 텍스쳐 픽셀 값 차이를 나타낼 수 있다. 즉, 깊이 영상에 대해 적용되는 필터의 가중치 커널은 필터링 대상 깊이 픽셀 및 윈도우 내에 존재하는 주변 픽셀 간의 기하학적 거리뿐만 아니라, 상기 두 픽셀과 각각 동일한 위치에 존재하는 텍스쳐 픽셀들 간의 강도 차이(및/또는 루마 픽셀 값 차이)를 기반으로 결정될 수 있다. 이 때, 필터부는 필터링 대상 픽셀과 유사한 픽셀에 대해 더 큰 가중치를 적용할 수 있다.

또한, ‘Scale’은 상수(constant)로서, C_k가 소정의 적정 범위 내의 값(예를 들어, 1 내지 100)을 가질 수 있도록 하기 위해 곱해지는 값을 나타낸다. 한편, 수학식 6에서

은 x보다 작거나 같은 최대의 정수 값을 나타낼 수 있다.

‘median’은 중간값 연산을 의미하며,

는 D_i가 C_i번 반복되는 것, 즉 D_i가 C_i개만큼 나열되어 있음을 의미할 수 있다. 수학식 6에서 D_i는 i 값이 클수록 큰 값을 가질 수 있으며, D_tot은 윈도우 내에서 가장 큰 깊이 픽셀 값을 나타낼 수 있다.

수학식 6을 참조하면, 양방향 가중치 미디언 필터는, 텍스쳐 픽셀을 기반으로 윈도우 내의 깊이 픽셀 각각에 대해 가중치 스코어를 도출할 수 있다. 상술한 수학식 6에서 가중치 스코어는 C_k에 해당될 수 있다. 이 때, 필터부는 상기 도출된 가중치 스코어에 기반하여, 상기 윈도우 내의 깊이 픽셀 중에서 중간 값에 해당되는 깊이 픽셀을 찾을 수 있다. 상기 도출된 중간 값에 해당되는 깊이 픽셀의 픽셀 값은 필터링 대상 픽셀에 대한 출력 값으로 결정될 수 있다. 즉, 상술한 양방향 가중치 미디언 필터에 의하면, 필터부는 필터링 대상 깊이 픽셀에 대응하는 윈도우 내의 픽셀들 중에서 가중치 스코어(및/또는 가중치 빈도수)에 기반하여 중간 값을 도출할 수 있고, 상기 도출된 중간 값을 상기 필터링 대상 깊이 픽셀에 대한 필터 출력 값(필터링된 픽셀 값)으로 결정할 수 있다. 따라서, 이 경우에 필터부는 필터링 이전에 존재하지 않는 새로운 깊이 값을 도입하거나 도출하지 않으므로, 깊이 영상 내의 객체 경계 및/또는 그 경계의 특성이 더 잘 유지될 수 있다.

실시예 3: 깊이 영상에 대한 필터 2

상술한 바와 같이 필터부는 깊이 영상에 대응하는 복원 영상에 대해 필터링을 수행할 수 있다. 이 때, 상술한 ‘실시예 2’의 경우, 필터부는 복호화된 텍스쳐 영상의 픽셀 값을 기반으로 필터링을 수행할 수 있다. 그러나, 필터링 대상 깊이 영상(또는 픽쳐 또는 블록)에 대한 필터링이 수행될 때 필터링 대상 깊이 영상(또는 픽쳐 또는 블록)에 대응하는 텍스쳐 영상(또는 픽쳐 또는 블록)이 유효하지 않을 수도 있다.

예를 들어, 상기 필터링 대상 깊이 영상에 대한 복호화 과정이 이에 대응하는 텍스쳐 영상보다 먼저 수행되는 경우, 필터부는 필터링 대상 깊이 영상의 필터링 수행시에 텍스쳐 영상 관련 정보를 이용할 수 없다. 또한 다른 예로서, 필터링 대상 깊이 영상 및 이에 대응하는 텍스쳐 영상의 복호화 과정이 병렬적으로 수행되는 경우에는, 필터링 대상 영상에 대한 필터링 수행시에 텍스쳐 영상의 복호화 과정이 완료되지 않은 상태일 수 있다. 이 경우에도, 필터부는 필터링 대상 깊이 영상의 필터링 수행시에 텍스쳐 영상 관련 정보를 이용할 수 없다.

따라서, 상술한 바와 같이 필터링 대상 깊이 영상에 대응하는 텍스쳐 영상이 유효하지 않은 경우, 필터부는 텍스쳐 영상이 아닌 필터링 대상 깊이 영상 내의 픽셀을 기반으로 필터링을 수행하는 것이 바람직하다.

상술한 도 1 내지 도 6의 실시예에서, 필터부는 깊이 영상에 대응하는 복원 영상(또는 블록)에 대해, 양방향 가중치 미디언 필터를 적용할 수 있다. 상기 양방향 가중치 미디언 필터가 사용되는 경우, 필터부는 필터링 대상 깊이 픽셀에 대응하는 윈도우 내의 픽셀들 중에서 가중치 스코어(및/또는 가중치 빈도수)에 기반하여 중간 값을 도출할 수 있고, 상기 도출된 중간 값을 필터 출력 값(필터링된 픽셀 값)으로 결정할 수 있다. 이 때, 깊이 영상에 대응하는 복원 영상에 대해 적용되는 양방향 가중치 미디언 필터는, 다음 수학식 7에 의해 나타내어질 수 있다.

[수학식 7]

수학식 7에서,

은 가중치 커널(weighting kernel)을 나타내며, (m,n)과 (i,j) 사이의 기하학적 거리 및 상기 두 점 사이의 광도 거리에 기반한 단조 감소 함수에 해당될 수 있다. 여기서, 기하학적 거리는 상기 두 점 간의 물리적인 거리를 의미할 수 있고, 광도 거리는 상기 두 점에 존재하는 ‘깊이 픽셀’(D_(m,n) 및 D_(i,j)) 간의 강도 차이 및/또는 깊이 픽셀 값 차이를 나타낼 수 있다. 즉, 깊이 영상에 대해 적용되는 필터의 가중치 커널은 필터링 대상 깊이 픽셀 및 윈도우 내에 존재하는 주변 픽셀 간의 기하학적 거리뿐만 아니라, 상기 두 픽셀 간의 강도 차이(및/또는 루마 픽셀 값 차이)를 기반으로 결정될 수 있다. 이 때, 필터부는 필터링 대상 픽셀과 유사한 픽셀에 대해 더 큰 가중치를 적용할 수 있다.

또한, σ_s는 공간 영역(spatial domain)에서의 스무딩(smoothing) 정도를 나타내는 확산 파라미터(spread parameter)이고, σ_D는 픽셀 강도(pixel-intensity) 영역에서의 스무딩 정도를 나타내는 확산 파라미터에 해당될 수 있다.

또한, ‘Scale’은 상수(constant)로서, C_k가 소정의 적정 범위 내의 값(예를 들어, 1 내지 100)을 가질 수 있도록 하기 위해 곱해지는 값을 나타낸다. 한편, 수학식 7에서

은 x보다 작거나 같은 최대의 정수 값을 나타낼 수 있다.

‘median’은 중간값 연산을 의미하며,

는 D_i가 C_i번 반복되는 것, 즉 D_i가 C_i개만큼 나열되어 있음을 의미할 수 있다. 수학식 7에서 D_i는 i 값이 클수록 큰 값을 가질 수 있으며, D_tot은 윈도우 내에서 가장 큰 깊이 픽셀 값을 나타낼 수 있다.

수학식 7을 참조하면, 양방향 가중치 미디언 필터는, 윈도우 내의 깊이 픽셀을 기반으로 상기 윈도우 내의 깊이 픽셀 각각에 대해 가중치 스코어를 도출할 수 있다. 상술한 수학식 7에서 가중치 스코어는 C_k에 해당될 수 있다. 이 때, 필터부는 상기 도출된 가중치 스코어에 기반하여, 상기 윈도우 내의 깊이 픽셀 중에서 중간 값에 해당되는 깊이 픽셀을 찾을 수 있다. 상기 도출된 중간 값에 해당되는 깊이 픽셀의 픽셀 값은 필터링 대상 픽셀에 대한 출력 값으로 결정될 수 있다. 즉, 상술한 양방향 가중치 미디언 필터에 의하면, 필터부는 필터링 대상 깊이 픽셀에 대응하는 윈도우 내의 픽셀들 중에서 가중치 스코어(및/또는 가중치 빈도수)에 기반하여 중간 값을 도출할 수 있고, 상기 도출된 중간 값을 상기 필터링 대상 깊이 픽셀에 대한 필터 출력 값(필터링된 픽셀 값)으로 결정할 수 있다. 따라서, 이 경우에 필터부는 필터링 이전에 존재하지 않는 새로운 깊이 값을 도입하거나 도출하지 않으므로, 깊이 영상 내의 객체 경계 및/또는 그 경계의 특성이 더 잘 유지될 수 있다.

한편, 상술한 표 1 및 도 6의 실시예에서, 필터 A 및 필터 B는 상술한 양방향 가중치 미디언 필터에 해당될 수 있다. 이 때, 필터 A는 에지가 존재하지 않는 넌 에지(non-edge) 영역(또는 블록)에 대해 적용되는 필터일 수 있고, 필터 B는 에지가 존재하는 에지 영역(또는 블록)에 대해 적용되는 필터일 수 있다.

이 때, 에지가 존재하지 않는 넌 에지 영역(또는 블록)에 대해서는, 강한 스무딩을 수행하는 양방향 가중치 미디언 필터가 적용될 수 있다. 따라서, 필터 A에 적용되는 확산 파라미터 σ_s및 σ_D는 상대적으로 큰 값을 갖는 확산 파라미터일 수 있다. 또한, 에지가 존재하는 에지 영역(또는 블록)에 대해서는, 약한 스무딩을 수행하는 양방향 가중치 미디언 필터가 적용될 수 있다. 따라서, 필터 B에 적용되는 확산 파라미터 σ_s및 σ_D는 상대적으로 작은 값을 갖는 확산 파라미터일 수 있다.

도 7의 실시예에 따른 복호화 과정은 텍스쳐 영상 및 깊이 영상에 모두 적용될 수 있다. 또한, 도 7의 실시예에서는 상술한 해상도 감소 갱신(RRU) 방법이 적용될 수 있다.

도 7을 참조하면, 복호화기는 예측 블록을 생성할 수 있다(S710). 인터 예측이 적용되는 경우, 복호화기는 참조 픽쳐 버퍼에서 제공된 이전에 복호화된 블록 및/또는 픽쳐 정보를 기초로 예측 블록을 생성할 수 있다. 인트라 예측이 적용되는 경우, 복호화기는 현재 픽쳐 내의 픽셀 정보를 기초로 예측을 수행하여 예측 블록을 생성할 수 있다. 또한, 복호화기는 잔차 블록을 생성할 수 있다(S720). 잔차 블록 생성 과정에 대한 구체적인 실시예는 도 2에서 상술한 바 있으므로, 여기서는 생략하기로 한다.

다시 도 7을 참조하면, 복호화기는 부호화기로부터 RRU 타입 정보를 수신하여 복호화할 수 있다(S730).

상술한 바와 같이, 부호화기는 율-왜곡 최적화에 기반하여 RRU 타입을 결정한 후 RRU 타입 정보를 부호화하여 복호화기로 전송할 수 있다. 상기 RRU 타입 정보는 샘플링 비율 정보 및/또는 필터 타입 정보를 포함할 수 있다. 여기서, 상기 필터는 업 샘플링이 수행된 잔차 블록을 기반으로 생성된 복원 블록에 적용되는 필터이므로, RRU 필터 또는 업 샘플링 필터로도 불릴 수 있다.

일 실시예로, 부호화기는 각 잔차 블록에 대한 샘플링 비율 정보 및/또는 RRU 필터 정보를 부호화하여 복호화기로 전송할 수 있다. 여기서, 일례로 샘플링 비율 정보는 구문 요소 sampling_ratio 에 의해 나타내어질 수 있고, RRU 필터 타입 정보는 구문 요소 rru_filter_type 에 의해 나타내어질 수 있다. 이 경우, 상기 샘플링 비율 정보 및/또는 상기 RRU 필터 정보는 잔차 블록 레벨 및/또는 잔차 블록 헤더(예를 들어, residual())에 포함되어 비트스트림을 통해 부호화기에서 복호화기로 전송될 수 있다. 이 때, 복호화기는 상기 샘플링 비율 정보 및/또는 RRU 필터 정보를 수신하여 복호화할 수 있다. 복호화기로 전송되는 샘플링 비율 정보 및 RRU 필터 정보는, 일 실시예로 다음 표 2에 포함된 것과 같은 구문 요소들에 의해 정의될 수 있다.

[표 2]

여기서, sampling_ratio 는 업 샘플링 비율 정보를 나타낼 수 있다. 이 때, sampling_ratio는 업 샘플링 비율 값 자체를 나타낼 수도 있으나, 실제 업 샘플링 비율을 도출하기 위해 사용되는 값을 나타낼 수도 있다. 일례로, 복호화기는 다음 수학식 8에 의해 실제 업 샘플링 비율을 도출할 수 있다.

[수학식 8]

Up-sampling ratio = sampling_ratio << 1

여기서, Up-sampling ratio는 업 샘플링 과정에 적용되는 실제 업 샘플링 비율을 나타낼 수 있다. 예를 들어, sampling_ratio 에 할당된 값이 2인 경우, 업 샘플링 과정에 적용되는 실제 업 샘플링 비율 값은 4일 수 있다.

또한, rru_filter_type 은 업 샘플링 필터 타입을 나타낼 수 있다. 즉, rru_filter_type 은 업 샘플링이 수행된 잔차 블록을 기반으로 생성된 복원 블록의 필터링을 위해 사용되는 업 샘플링 필터의 타입을 지시할 수 있다.

다른 실시예로, 부호화기는 상술한 실시예에서와 달리 RRU 타입을 나타내는 하나의 구문 요소를 통해 RRU 타입 정보를 복호화기로 전송할 수도 있다. 일례로, 상기 RRU 타입 정보는 구문 요소 rru_type 에 의해 나타내어질 수 있다.

이 경우, 부호화기 및 복호화기에는 RRU 타입과 업 샘플링 비율 및 RRU 필터 타입 간의 관계를 나타내는 룩업 테이블(look-up table)이 동일하게 저장되어 있을 수 있다. 상술한 바와 같이, 부호화기는 율-왜곡 최적화에 기반하여 최적의 업 샘플링 비율 및 최적의 RRU 필터 타입을 결정할 수 있다. 이 때, 부호화기는 상기 룩업 테이블을 기반으로 상기 결정된 업 샘플링 비율 및 RRU 필터 타입에 대응하는 RRU 타입을 결정할 수 있으며, 결정된 RRU 타입에 관한 정보를 하나의 구문 요소 rru_type 을 통해 복호화기로 전송할 수 있다. 복호화기는 부호화기로부터 전송된 RRU 타입 정보를 수신하여 복호화할 수 있다. 이 때, 복호화기는 상기 복호화된 RRU 타입 정보를 기반으로 현재 블록에 대한 RRU 타입을 결정할 수 있으며, 상기 결정된 RRU 타입 및 상기 저장된 룩업 테이블을 기반으로 업 샘플링 비율 및 RRU 필터 타입을 도출할 수 있다.

다시 도 7을 참조하면, 복호화기는 복호화된 RRU 타입 정보를 기반으로 상기 생성된 잔차 블록에 대해 업 샘플링을 수행할 수 있다(S740). 상기 RRU 타입 정보는 업 샘플링 비율 정보를 포함하므로, 복호화기는 상기 업 샘플링 비율 정보가 지시하는 업 샘플링 비율에 따라 잔차 블록에 대한 업 샘플링을 수행할 수 있다. 그러나, 잔차 블록에 대한 업 샘플링 비율이 1인 경우, 그 잔차 블록에 대해서는 업 샘플링이 수행되지 않을 수도 있다.

또한, 복호화기는 예측 블록 및 업 샘플링이 수행된 잔차 블록을 기반으로 복원 블록을 생성할 수 있다(S750). 이 때, 잔차 블록에 대해 업 샘플링이 수행되지 않은 경우라면, 상기 복원 블록 생성에 사용되는 잔차 블록은 업 샘플링이 수행되지 않은 잔차 블록일 수 있다.

복원 블록이 생성되면, 복호화기는 생성된 복원 블록 내의 복원 샘플 각각에 대해 필터링을 수행할 수 있다(S760). 상술한 RRU 타입 정보는 필터 타입 정보를 포함하므로, 복호화기는 상기 필터 타입 정보에 기반하여 필터링을 수행할 수 있다. 텍스쳐 영상에 대해 적용되는 필터 및 깊이 영상에 대해 적용되는 필터의 구체적인 실시예들은 상술한 바 있으므로, 여기서는 생략하기로 한다.

상술한 실시예들에 따르면, 본 발명은 RRU 타입 및/또는 RRU 모드를 기반으로 해상도 감소 갱신을 수행함으로써, 에지 등과 같은 영상의 특성들이 더 잘 유지되도록 할 수 있다. 즉, RRU 타입 정보가 사용되는 경우 영상의 특성에 따라 샘플링 비율을 달리하거나 필터 타입의 조합을 달리할 수 있으므로, 적응적인 해상도 감소 갱신이 가능해질 수 있다.

한편, 상술한 바와 같이 깊이 영상은 에지 영역을 제외한 대부분의 영역에서는 텍스쳐 영상에 비해 디테일이 중요시되지 않는 특징을 가진다. 따라서, 상술한 업 스케일링 방법 및/또는 해상도 감소 갱신 방법은, 율-왜곡 최적화 관점에서 깊이 영상에 대해 적용될 때 특히 효율적이라 할 것이다.

상술한 실시예에서, 방법들은 일련의 단계 또는 블록으로써 순서도를 기초로 설명되고 있지만, 본 발명은 단계들의 순서에 한정되는 것은 아니며, 어떤 단계는 상술한 바와 다른 단계와 다른 순서로 또는 동시에 발생할 수 있다. 또한, 당업자라면 순서도에 나타낸 단계들이 배타적이지 않고, 다른 단계가 포함되거나 순서도의 하나 또는 그 이상의 단계가 본 발명의 범위에 영향을 미치지 않고 삭제될 수 있음을 이해할 수 있을 것이다.

상술한 실시예는 다양한 양태의 예시들을 포함한다. 다양한 양태들을 나타내기 위한 모든 가능한 조합을 기술할 수는 없지만, 해당 기술 분야의 통상의 지식을 가진 자는 다른 조합이 가능합을 인식할 수 있을 것이다. 따라서, 본 발명은 이하의 특허청구범위 내에 속하는 모든 다른 교체, 수정 및 변경을 포함한다고 할 것이다.

Claims

비트스트림을 수신하는 단계;
상기 비트스트림을 기반으로, 현재 픽쳐에 대한 예측 블록 및 잔차(residual) 블록을 생성하는 단계;
상기 비트스트림으로부터 도출된 RRU(Rrduced-Resolution Update) 타입 정보를 기반으로, 상기 잔차 블록에 대한 업 샘플링(up-sampling)을 수행하는 단계;
상기 예측 블록 및 상기 업 샘플링이 수행된 잔차 블록을 기반으로 복원 블록을 생성하는 단계; 및
상기 RRU 타입 정보를 기반으로, 상기 복원 블록에 대한 필터링을 수행하는 단계를 포함하되,
상기 RRU 타입 정보는 샘플링 비율(sampling ratio) 정보 및 필터 타입(filter type) 정보를 포함하고,
상기 업 샘플링 수행 단계에서는 상기 샘플링 비율 정보가 지시하는 샘플링 비율을 기반으로 업 샘플링을 수행하고,
상기 필터링 수행 단계에서는 상기 필터 타입 정보가 지시하는 필터를 기반으로 필터링을 수행하는 것을 특징으로 하는 영상 복호화 방법.
제 1항에 있어서,
상기 샘플링 비율 정보는,
상기 현재 블록 내에서 상기 잔차 블록에 해당되는 영역의 주파수가 낮을수록 더 높은 값의 샘플링 비율을 지시하는 것을 특징으로 하는 영상 복호화 방법.
제 1항에 있어서,
상기 필터링 수행 단계는,
상기 잔차 블록 내의 필터링 대상 픽셀에 대해, 소정의 크기 및 모양의 윈도우(window)를 결정하는 단계; 및
상기 윈도우 내의 픽셀을 기반으로 상기 필터링 대상 픽셀에 대한 필터링을 수행하는 단계를 더 포함하는 것을 특징으로 하는 영상 복호화 방법.
제 3항에 있어서,
상기 현재 픽쳐가 텍스쳐 영상(texture video) 내의 픽쳐인 경우,
상기 필터 타입 정보가 지시하는 필터는 상기 윈도우 내의 픽셀을 기반으로 가중치 평균을 수행하는 양방향 가중치 필터(bi-laterally weighted filter)인 것을 특징으로 하는 영상 복호화 방법.
제 4항에 있어서,
상기 양방향 가중치 필터는,
상기 필터링 대상 픽셀이, 에지를 포함하는 에지(edge) 영역 내의 픽셀인 경우에는 약한 스무딩(weak smoothing)을 수행하고,
상기 필터링 대상 픽셀이, 에지를 포함하지 않는 넌 에지(non-edge) 영역 내의 픽셀인 경우에는 강한 스무딩(strong smoothing)을 수행하는 것을 특징으로 하는 영상 복호화 방법.
제 3항에 있어서,
상기 현재 픽쳐가 깊이 영상(depth video) 내의 깊이 픽쳐이고, 상기 깊이 영상에 대응하는 텍스쳐 영상(texture video) 내에서 상기 현재 픽쳐에 대응하는 텍스쳐 픽쳐가 유효(available)한 경우,
상기 필터링 수행 단계에서는,
상기 텍스쳐 픽쳐에서 상기 윈도우에 대응되는 영역 내의 텍스쳐 픽셀을 기반으로 필터링을 수행하는 것을 특징으로 하는 영상 복호화 방법.
제 6항에 있어서,
상기 필터 타입 정보가 지시하는 필터는, 양방향 가중치 WTA 필터(bi-laterally weighted Winner_Take_All filter)이고,
상기 양방향 가중치 WTA 필터는,
상기 텍스쳐 픽셀을 기반으로 상기 윈도우 내의 깊이 픽셀 각각에 대해 가중치 스코어(weighting score)를 도출하고, 상기 깊이 픽셀 중에서 가장 높은 가중치 스코어를 갖는 깊이 픽셀의 픽셀 값을 상기 필터링 대상 픽셀에 대한 출력 값으로 결정하고,
상기 깊이 픽셀은 상기 깊이 픽쳐 내의 픽셀인 것을 특징으로 하는 영상 복호화 방법.
제 6항에 있어서,
상기 필터 타입 정보가 지시하는 필터는 양방향 가중치 미디언 필터(bi-laterally weighted median filter)이고,
상기 양방향 가중치 미디언 필터는,
상기 텍스쳐 픽셀을 기반으로 상기 윈도우 내의 깊이 픽셀 각각에 대해 가중치 스코어(weighting score)를 도출하고, 상기 가중치 스코어를 기반으로 상기 깊이 픽셀 중에서 중간 값을 도출하고, 상기 도출된 중간 값에 해당되는 깊이 픽셀의 픽셀 값을 상기 필터링 대상 픽셀에 대한 출력 값으로 결정하고,
상기 깊이 픽셀은 상기 깊이 픽쳐 내의 픽셀인 것을 특징으로 하는 영상 복호화 방법.
제 3항에 있어서,
상기 현재 픽쳐가 깊이 영상 내의 깊이 픽쳐이고, 상기 깊이 영상에 대응하는 텍스쳐 영상 내에서 상기 현재 픽쳐에 대응하는 텍스쳐 픽쳐가 유효하지 않은 경우,
상기 필터 타입 정보가 지시하는 필터는 양방향 가중치 미디언 필터이고,
상기 양방향 가중치 미디언 필터는,
상기 윈도우 내의 깊이 픽셀을 기반으로, 상기 깊이 픽셀 각각에 대해 가중치 스코어(weighting score)를 도출하고, 상기 가중치 스코어를 기반으로 상기 깊이 픽셀 중에서 중간 값을 도출하고, 상기 도출된 중간 값에 해당되는 깊이 픽셀의 픽셀 값을 상기 필터링 대상 픽셀에 대한 출력 값으로 결정하고,
상기 깊이 픽셀은 상기 깊이 픽쳐 내의 픽셀인 것을 특징으로 하는 영상 복호화 방법.
제 9항에 있어서,
상기 양방향 가중치 미디언 필터는,
상기 필터링 대상 픽셀이, 에지를 포함하는 에지(edge) 영역 내의 픽셀인 경우에는 약한 스무딩을 수행하고,
상기 필터링 대상 픽셀이, 에지를 포함하지 않는 넌 에지(non-edge) 영역 내의 픽셀인 경우에는 강한 스무딩을 수행하는 것을 특징으로 하는 영상 복호화 방법.
비트스트림을 수신하는 수신부;
상기 비트스트림을 기반으로, 현재 픽쳐에 대한 예측 블록 및 잔차(residual) 블록을 생성하는 예측 블록 및 잔차 블록 생성부;
상기 비트스트림으로부터 도출된 RRU(Rrduced-Resolution Update) 타입 정보를 기반으로, 상기 잔차 블록에 대한 업 샘플링(up-sampling)을 수행하는 업 샘플러;
상기 예측 블록 및 상기 업 샘플링이 수행된 잔차 블록을 기반으로 복원 블록을 생성하는 복원 블록 생성부; 및
상기 RRU 타입 정보를 기반으로, 상기 복원 블록에 대한 필터링을 수행하는 필터부를 포함하되,
상기 RRU 타입 정보는 샘플링 비율(sampling ratio) 정보 및 필터 타입(filter type) 정보를 포함하고,
상기 업 샘플러는 상기 샘플링 비율 정보가 지시하는 샘플링 비율을 기반으로 업 샘플링을 수행하고,
상기 필터부는 상기 필터 타입 정보가 지시하는 필터를 기반으로 필터링을 수행하는 것을 특징으로 하는 영상 복호화 장치.
제 11항에 있어서,
상기 샘플링 비율 정보는,
상기 현재 블록 내에서 상기 잔차 블록에 해당되는 영역의 주파수가 낮을수록 더 높은 값의 샘플링 비율을 지시하는 것을 특징으로 하는 영상 복호화 장치.
제 11항에 있어서,
상기 필터부는,
상기 잔차 블록 내의 필터링 대상 픽셀에 대해 소정의 크기 및 모양의 윈도우(window)를 결정하고, 상기 윈도우 내의 픽셀을 기반으로 상기 필터링 대상 픽셀에 대한 필터링을 수행하는 것을 특징으로 하는 영상 복호화 장치.
제 13항에 있어서,
상기 현재 픽쳐가 텍스쳐 영상(texture video) 내의 픽쳐인 경우,
상기 필터 타입 정보가 지시하는 필터는 상기 윈도우 내의 픽셀을 기반으로 가중치 평균을 수행하는 양방향 가중치 필터(bi-laterally weighted filter)인 것을 특징으로 하는 영상 복호화 장치.
제 14항에 있어서,
상기 양방향 가중치 필터는,
상기 필터링 대상 픽셀이, 에지를 포함하는 에지(edge) 영역 내의 픽셀인 경우에는 약한 스무딩(weak smoothing)을 수행하고,
상기 필터링 대상 픽셀이, 에지를 포함하지 않는 넌 에지(non-edge) 영역 내의 픽셀인 경우에는 강한 스무딩(strong smoothing)을 수행하는 것을 특징으로 하는 영상 복호화 장치.
제 13항에 있어서,
상기 현재 픽쳐가 깊이 영상(depth video) 내의 깊이 픽쳐이고, 상기 깊이 영상에 대응하는 텍스쳐 영상(texture video) 내에서 상기 현재 픽쳐에 대응하는 텍스쳐 픽쳐가 유효(available)한 경우,
상기 필터부는,
상기 텍스쳐 픽쳐에서 상기 윈도우에 대응되는 영역 내의 텍스쳐 픽셀을 기반으로 필터링을 수행하는 것을 특징으로 하는 영상 복호화 장치.
제 16항에 있어서,
상기 필터 타입 정보가 지시하는 필터는, 양방향 가중치 WTA 필터(bi-laterally weighted Winner_Take_All filter)이고,
상기 양방향 가중치 WTA 필터는,
상기 텍스쳐 픽셀을 기반으로 상기 윈도우 내의 깊이 픽셀 각각에 대해 가중치 스코어(weighting score)를 도출하고, 상기 깊이 픽셀 중에서 가장 높은 가중치 스코어를 갖는 깊이 픽셀의 픽셀 값을 상기 필터링 대상 픽셀에 대한 출력 값으로 결정하고,
상기 깊이 픽셀은 상기 깊이 픽쳐 내의 픽셀인 것을 특징으로 하는 영상 복호화 장치.
제 16항에 있어서,
상기 필터 타입 정보가 지시하는 필터는 양방향 가중치 미디언 필터(bi-laterally weighted median filter)이고,
상기 양방향 가중치 미디언 필터는,
상기 텍스쳐 픽셀을 기반으로 상기 윈도우 내의 깊이 픽셀 각각에 대해 가중치 스코어(weighting score)를 도출하고, 상기 가중치 스코어를 기반으로 상기 깊이 픽셀 중에서 중간 값을 도출하고, 상기 도출된 중간 값에 해당되는 깊이 픽셀의 픽셀 값을 상기 필터링 대상 픽셀에 대한 출력 값으로 결정하고,
상기 깊이 픽셀은 상기 깊이 픽쳐 내의 픽셀인 것을 특징으로 하는 영상 복호화 장치.
제 13항에 있어서,
상기 현재 픽쳐가 깊이 영상 내의 깊이 픽쳐이고, 상기 깊이 영상에 대응하는 텍스쳐 영상 내에서 상기 현재 픽쳐에 대응하는 텍스쳐 픽쳐가 유효하지 않은 경우,
상기 필터 타입 정보가 지시하는 필터는 양방향 가중치 미디언 필터이고,
상기 양방향 가중치 미디언 필터는,
상기 윈도우 내의 깊이 픽셀을 기반으로, 상기 깊이 픽셀 각각에 대해 가중치 스코어(weighting score)를 도출하고, 상기 가중치 스코어를 기반으로 상기 깊이 픽셀 중에서 중간 값을 도출하고, 상기 도출된 중간 값에 해당되는 깊이 픽셀의 픽셀 값을 상기 필터링 대상 픽셀에 대한 출력 값으로 결정하고,
상기 깊이 픽셀은 상기 깊이 픽쳐 내의 픽셀인 것을 특징으로 하는 영상 복호화 장치.
제 19항에 있어서,
상기 양방향 가중치 미디언 필터는,
상기 필터링 대상 픽셀이, 에지를 포함하는 에지(edge) 영역 내의 픽셀인 경우에는 약한 스무딩을 수행하고,
상기 필터링 대상 픽셀이, 에지를 포함하지 않는 넌 에지(non-edge) 영역 내의 픽셀인 경우에는 강한 스무딩을 수행하는 것을 특징으로 하는 영상 복호화 장치.