WO2013165143A1

WO2013165143A1 - 멀티뷰 영상의 부호화 방법, 부호화 장치, 복호화 방법, 복호화 장치

Info

Publication number: WO2013165143A1
Application number: PCT/KR2013/003686
Authority: WO
Inventors: 이충구; 이용재; 김휘
Original assignee: Humax Co Ltd
Current assignee: Humax Co Ltd
Priority date: 2012-04-30
Filing date: 2013-04-29
Publication date: 2013-11-07
Anticipated expiration: 2014-10-30
Also published as: EP2846544A4; EP2846544A1; US20150085933A1; CN104604232A

Description

멀티뷰 영상의 부호화 방법, 부호화 장치, 복호화 방법, 복호화 장치

본 발명은 멀티뷰 영상 부호화 방법, 부호화 장치, 복호화 방법, 복호화 장치에 관한 것으로, 보다 상세하게는 움직임 벡터를 예측하여 멀티뷰 영상을 부호화/복호화, 멀티뷰 영상의 중간 뷰 합성, 그리고 멀티뷰 영상의 인-루프 필터링에 관한 것이다.

일반적으로 영상 압축 방법에서는 압축 효율을 높이기 위해 픽쳐들의 중복도를 제거하는 화면간 예측(inter prediction) 및 화면내 예측(intra prediction) 기술을 이용한다.

화면간 예측을 이용해 영상을 부호화하는 방법은 픽처들 사이의 시간적인 중복성(spatial redundancy)을 제거하여 영상을 압축하는 방법으로서 대표적으로 움직임 보상 예측 부호화 방법이 있다.

움직임 보상 예측 부호화는 현재 부호화되는 픽처의 앞 및/또는 뒤에 위치하는 적어도 하나의 참조 픽처에서 현재 부호화되는 블록과 유사한 영역을 검색하여 움직임 벡터(MV: Motion Vector)를 생성하고, 생성된 움직임 벡터를 이용하여 움직임 보상을 수행하여 얻어지는 예측 블록과 현재 예측 유닛의 잔여값(residue)을 DCT(Discrete Cosine Transform) 변환하고 양자화한 후 엔트로피 부호화하여 전송한다.

움직임 보상 화면간 예측의 경우, 하나의 픽처를 소정 크기를 가지는 복수의 블록(block)으로 구분하여 움직임 벡터(MV)를 생성하고, 생성된 움직임 벡터를 이용하여 움직임 보상을 수행한다. 움직임 보상을 수행하여 얻어지는 각각의 예측 블록에 대한 개별적인 움직임 파라미터는 디코더로 전송된다.

3차원 영상의 경우, 영상의 특성상 각 픽셀이 화소 정보뿐만 아니라 깊이(depth) 정보를 포함하고 있으며, 인코더에서 깊이 정보를 구해 디코더로 다시점 비디오 영상 정보 및 깊이 정보를 전송한다. 이때, 움직임 벡터 예측(Motion Vector Prediction)을 사용한다. 예측 움직임 벡터의 후보 블록으로 현재 예측 유닛의 주변 블록의 움직임 벡터를 사용하는데 깊이 정보를 갖는 3차원 영상의 경우 예측 움직임 벡터를 효율적으로 적용하는 방법이 필요하다.

한편, H.264/AVC 표준에서는, 영상이 낮은 비트율로 부호화되는 경우 복호영상에 블록왜곡이 발생한 상태에서 프레임 메모리에 저장되고 다음 픽처의 움직임 보상 처리에서 상기 블록왜곡을 포함한 영상을 참조하여 부호화하기 때문에 화질의 열화가 전파되는 문제를 해결하기 위해, 프레임 메모리에 복호 영상을 저장하기 전에 블록왜곡 현상을 제거하는 적응적인 디블록킹 필터링(deblocking filtering)을 사용한다. 즉, 블록간의 경계에서의 왜곡(artifact)를 줄이기 위해 블록 경계를 소정의 강도로 블러(blur) 처리를 수행한다.

H.264/AVC 표준에서의 적응적 디블록킹 필터링은 동일한 영상 내에서 블록왜곡이 발생하기 쉬운 위치와 블록왜곡이 발생하기 어려운 위치에 각각 디블록킹 필터를 적응적으로 적용함으로써 영상의 블록왜곡이 참조영상에 포함된 상태로 복호영상에 전달하게 되는 것을 방지하여 양호한 복호영상이 출력되도록 한다.

멀티뷰 영상(multiview video)의 경우 현재 뷰(view)와 공간적으로 다른 시점의 카메라에 의해 촬영된 참조 뷰(view)가 존재한다. 기존의 H.264/AVC 비디오와 호환이 가능하도록 멀티뷰 영상을 부호화하기 위하여 상기 현재 뷰의 특정 블록의 디블록킹 처리를 수행할 경우, 참조 뷰의 대응되는 블록의 디블록킹 필터 강도와는 독립적으로 현재 뷰의 특정 블록의 디블록킹 필터 강도를 구할 경우 전체적인 복잡도가 증가할 수 있다. 특히, 복호화기에서 디블록킹 필터의 처리는 복호화기 복잡도의 상당 부분을 차지하므로 멀티뷰 영상을 복호화하기 위하여 참조 뷰의 대응되는 블록의 디블록킹 필터 강도와는 독립적으로 현재 뷰의 특정 블록의 디블록킹 필터 강도를 구할 경우 복호화기의 복잡도가 현저하게 증가 될 수 있다.

한편, 멀티뷰 영상(multiview video)의 경우 현재 뷰(view)와 공간적으로 다른 시점의 카메라에 의해 촬영된 참조 뷰(view)가 적어도 하나 존재하며, 멀티뷰 영상의 부호화 및 복호화시 멀티뷰 영상 데이터(또는 텍스처(texture))가 모든 뷰에 대하여 부호화기에서 복호화기로 전송될 경우 디코더로 전송되는 데이터가 증가하여 부호화 효율이 저하될 수 있다.

또한, 멀티뷰 영상의 부호화 및 복호화의 경우 깊이 뷰 데이터가 모든 뷰에 대하여 부호화기에서 복호화기로 전송될 경우 디코더로 전송되는 데이터가 증가하여 부호화 효율이 저하될 수 있다.

본 발명의 목적은 3차원 영상에 적용할 수 있는 움직임 벡터 예측을 통한 영상 부호화 방법 및 부호화 장치를 제공하는 것이다.

본 발명의 다른 목적은 3차원 영상에 적용할 수 있는 움직임 벡터 예측을 통한 영상 복호화 방법 및 복호화 장치를 제공하는 것이다.

본 발명의 또 다른 목적은 멀티뷰 영상 코딩시 복잡도를 줄이기 위한 멀티뷰 영상의 인-루프 필터링 방법을 제공하는 것이다.

본 발명의 또 다른 목적은 멀티뷰 영상 코딩시 부호화기에서 복호화기로 전송되는 데이터량을 줄여 부호화 효율을 높이기 위한 멀티뷰 영상의 중간 깊이 뷰 합성 방법을 제공하는 것이다.

상기한 목적을 달성하기 위한 본 발명의 3차원 영상에서 현재 예측 유닛에 대한 부호화 방법은, 상기 현재 예측 유닛의 이미 부호화된 주변 블록 중에서 상기 현재 예측 유닛과 동일한 그룹 및 동일한 깊이 정보를 갖는 주변 블록의 움직임 벡터를 상기 현재 예측 유닛의 후보 예측 움직임 벡터로 선정하는 단계와, 상기 후보 예측 움직임 벡터를 기반으로 화면간 예측(inter prediction)을 수행하여 상기 현재 예측 유닛의 움직임 벡터를 예측하여 복호화기로 전송하는 단계를 포함한다. 여기서, 상기 현재 예측 유닛의 후보 예측 움직임 벡터는 상기 현재 예측 유닛의 이미 부호화된 주변 블록 중에서 상기 현재 예측 유닛과 동일한 그룹 및 동일한 깊이 중 적어도 하나를 만족하는 주변 블록의 움직임 벡터를 상기 현재 예측 유닛의 후보 예측 움직임 벡터로 선정하여 상기 후보 예측 움직임 벡터를 기반으로 화면간 예측(inter prediction)을 수행하여 상기 현재 예측 유닛의 움직임 벡터를 예측하여 복호화기로 전송할 수도 있다.

상기한 목적을 달성하기 위한 본 발명의 3차원 영상에서 현재 예측 유닛에 대한 복호화 방법은, 수신된 비트 스트림을 엔트로피 복호화하고 역양자화 및 역변환을 수행하는 단계와, 상기 역변환된 비트 스트림을 기반으로 상기 현재 예측 유닛의 이미 부호화된 주변 블록 중에서 상기 현재 예측 유닛과 동일한 그룹 및 동일한 깊이 정보를 갖는 주변 블록의 움직임 벡터를 상기 현재 예측 유닛의 후보 예측 움직임 벡터로 선정하는 단계와, 상기 후보 예측 움직임 벡터를 기반으로 화면간 예측(inter prediction)을 수행하여 상기 현재 예측 유닛의 움직임 벡터를 예측하여 영상을 복원하는 단계를 포함한다. 여기서, 상기 현재 예측 유닛의 후보 예측 움직임 벡터는 상기 현재 예측 유닛의 이미 부호화된 주변 블록 중에서 상기 현재 예측 유닛과 동일한 그룹 및 동일한 깊이 중 적어도 하나를 만족하는 주변 블록의 움직임 벡터를 상기 현재 예측 유닛의 후보 예측 움직임 벡터로 선정하여 상기 후보 예측 움직임 벡터를 기반으로 화면간 예측(inter prediction)을 수행하여 상기 현재 예측 유닛의 움직임 벡터를 예측하여 영상을 복원할 수도 있다.

상술한 본 발명의 목적을 달성하기 위한 본 발명의 일 측면에 따른 멀티 뷰 영상에 대한 인-루프 필터링 방법은 현재 뷰의 특정 블록에 대하여 참조 뷰의 대응되는 블록을 참조하는 단계와, 상기 현재 뷰의 특정 블록과 상기 참조 뷰의 대응되는 블록과의 거리를 고려하여 상기 거리에 따른 스케일링을 수행하여 현재 뷰의 특정 블록의 디블록킹 강도를 설정하는 단계를 포함한다.

상술한 본 발명의 목적을 달성하기 위한 본 발명의 일 측면에 따른 제 1 뷰, 제2 뷰, 제3 뷰에 대하여 각각 텍스쳐 뷰와 깊이 뷰를 가지는 멀티 뷰 영상에 대하여 복호화기에서 수행되는 중간 깊이 뷰 합성 방법은, 부호화기로부터 수신한 상기 제1 뷰의 텍스쳐 뷰 및 제3 뷰의 텍스쳐 뷰에 대하여 중간 뷰 합성을 수행하는 단계와, 상기 중간 뷰 합성을 통하여 상기 제1 뷰의 텍스쳐 뷰 및 제3 뷰의 텍스쳐 뷰로부터 상기 제2 뷰의 텍스쳐 뷰를 구하는 단계를 포함한다.

3차원 영상 부호화 방법 및 장치, 및 복호화 방법 및 장치에 따르면, 깊이 정보를 가지는 3차원 영상에 대해 예측 움직임 벡터의 후보 선정을 효율적으로 할 수 있다는 효과가 있다.

3차원 영상 부호화 방법 및 장치, 및 복호화 방법 및 장치에 따르면, 현재 예측 유닛과 주변 블록이 모두 동일한 그룹에 속하고 동시에 현재 예측 유닛의 깊이(depth)와 주변 블록의 깊이가 동일한 경우에 한하여, 현재 예측 유닛의 깊이와 동일한 깊이를 가진 주변 블록에 대하여 현재 예측 유닛의 예측 움직임 벡터 후보 리스(MV Predictor candidate list)에 최우선 순위로 선정함으로써 3차원 영상의 현재 예측 유닛의 움직임 벡터 선정시 복잡도를 감소시키면서 정확도를 증가시킬 수 있다는 효과가 있다.

상술한 멀티 뷰 영상에 대한 인-루프 필터링 방법에 따르면, 현재 View의 특정 블록과 현재 View에 대한 참조 View의 대응되는 블록과의 거리 및 각도를 고려하여 거리 및 각도에 따른 스케일링을 수행하여 현재 View의 특정 블록의 디블록킹 강도를 설정함으로써 멀티 뷰 영상의 부호화 및 복호화의 경우 디블록킹 처리의 복잡도를 줄일 수 있다.

전술한 본 발명의 실시예들에 따른 중간 깊이 뷰 합성 방법은 멀티뷰 영상의 모든 뷰에 대하여 깊이 뷰를 전송하지 않고 복수개의 깊이 뷰 중에 일부의 깊이 뷰는 전송하지 않고 복호화기로 전송된 적어도 1개의 깊이 뷰를 이용하여 중간 깊이 뷰 합성을 통하여 구함으로써 멀티 뷰 영상의 부호화기 및/또는 복호화기에서의 복호화기로 전송되는 깊이 뷰 데이터량을 줄일 수 있으므로 결과적으로 부호화 효율을 향상 시킬 수 있다.

도 1은 본 발명의 일 실시예에 따른 순환적 코딩 유닛의 구조를 나타내는 개념도이다.

도 2는 공간적인 후보로서의 주변 블록을 도시한 도면이다.

도 3은 시간적인(temporal) 후보로서의 주변 블록을 도시한 도면이다.

도 4는 본 발명의 일 실시예에 따른 3차원 영상 부호화 장치를 개략적으로 나타낸 블록도이다.

도 5는 본 발명의 일 실싱예에 따른 3차원 영상 부호화 방법을 개략적으로 나타낸 흐름도이다.

도 6은 본 발명의 일 실시예에 따른 멀티 뷰 영상에 대한 인-루프 필터링 방법을 처리하기 위한 부호화기의 블록도이다.

도 7는 본 발명의 일 실시예에 따른 멀티 뷰 영상에 대한 인-루프 필터링 방법을 설명하기 위한 순서도이다.

도 8은 본 발명의 다른 실시예에 따른 멀티 뷰 영상에 대한 인-루프 필터링 방법을 설명하기 위한 순서도이다.

도 9는 복호화기로 전송된 2개의 뷰를 이용하여 복호화기에서 중간 뷰를 합성하는 과정을 설명하기 위한 개념도이다.

도 10은 복호화기로 전송된 2개의 깊이 뷰를 이용하여 복호화기에서 중간 깊이 뷰를 합성하는 과정을 설명하기 위한 개념도이다.

도 11은 본 발명의 일실시예에 따른 복호화기로 전송된 1개의 깊이 뷰를 이용하여 복호화기에서 중간 깊이 뷰를 합성하는 과정을 설명하기 위한 개념도이다.

도 12는 본 발명의 다른 실시예에 따른 복호화기로 전송된 1개의 깊이 뷰를 이용하여 복호화기에서 중간 깊이 뷰를 합성하는 과정을 설명하기 위한 개념도이다.

도 13은 본 발명의 또 다른 실시예에 따른 복호화기로 전송된 1개의 깊이 뷰를 이용하여 복호화기에서 중간 깊이 뷰를 합성하는 과정을 설명하기 위한 개념도이다.

도 14는 본 발명의 일 실시예에 따른 멀티 뷰 영상에 대한 중간 깊이 뷰 합성 동작을 처리하기 위한 부호화기의 일례를 나타낸 블록도이다.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다.

그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.

제 1, 제 2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제 1 구성요소는 제 2 구성요소로 명명될 수 있고, 유사하게 제 2 구성요소도 제 1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가진 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.

이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 본 발명을 설명함에 있어 전체적인 이해를 용이하게 하기 위하여 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.

깊이 정보를 이용한 움직임 벡터 예측

본 발명의 일 실시예에서는 H.264/AVC와 동일하게 매크로블록(Macroblock)을 이용하여 화면간 예측, 화면내 예측, 변환, 양자화, 엔트로피 부호화 등의 부호화 및 복호화를 수행할 수도 있고, 하기에 설명하는 순환적(recursive) 코딩 유닛(CU: Coding Unit) 구조를 사용하여 부호화 및 복호화를 수행할 수도 있다.

도 1을 참조하면, 각 코딩 유닛(CU)은 정방형의 픽셀 크기를 가지며, 2N x 2N(단위: 픽셀) 크기의 가변적인 크기를 가질 수 있다. 화면간 예측, 화면내 예측, 변환, 양자화, 디블록킹 필터링 및 엔트로피 부호화는 코딩 유닛(CU) 단위로 이루어질 수 있다.

코딩 유닛(CU)은 최대 코딩 유닛(LCU: Largest Coding Unit), 최소 코딩 유닛(SCU: Smallest Coding Unit)을 포함할 수 있고, 최대 코딩 유닛(LCU)과 최소 코딩 유닛(SCU)의 크기는 8 이상의 크기를 가지는 2의 거듭제곱 값으로 나타낼 수 있다.

코딩 유닛의 크기는 8 이상의 크기를 가지는 2의 거듭제곱 값-예를 들어 8 x 8, 16 x 16, 32 x 32, 64 x 64-를 가질 수 있다.

본 발명의 일 실시예에 따른 코딩 유닛(CU)은 순환적인 크기 구조를 가질 수 있다. 도 1은 최대 코딩 유닛(LCU)인 CU₀의 한 변의 크기(2N₀)가 128(N₀=64)이고, 최대 계층 레벨(level) 또는 계층 깊이(depth)가 5인 경우를 나타낸다. 순환적인 구조는 일련의 플래그(flag)를 통하여 표현될 수 있다. 예를 들어, 계층 레벨(level) 또는 계층 깊이(depth)가 k인 코딩 유닛(CU_k)의 플래그 값이 0인 경우, 코딩 유닛(CU_k)에 대한 코딩은 현재의 계층 레벨 또는 계층 깊이에 대해 이루어진다.

또는, 플래그 값이 1인 경우 현재의 계층 레벨 또는 계층 깊이가 k인 코딩 유닛(CU_k)은 4개의 독립적인 코딩 유닛(CU_k+1)으로 분할되며, 분할된 코딩 유닛(CU_k+1)은 계층 레벨 또는 계층 깊이가 k+1이 되며, 크기는 N_k+1N_k+1가 된다. 이 경우 코딩 유닛(CU_k+1)은 코딩 유닛(CU_k)의 서브 코딩 유닛으로 나타낼 수 있다. 코딩 유닛(CU_k+1)의 계층 레벨 또는 계층 깊이가 최대 허용 가능한 계층 레벨 또는 계층 깊이에 도달할 때까지 코딩 유닛(CU_k+1)은 순환적으로(recursive) 처리될 수 있다. 코딩 유닛(CU_k+1)의 계층 레벨 또는 계층 깊이가 최대 허용 가능한 계층 레벨 또는 계층 깊이-도 1에서는 4인 경우를 예로 들었음-과 동일한 경우에는 더 이상의 분할은 허용되지 않는다.

최대 코딩 유닛(LCU)의 크기 및 최소 코딩 유닛(SCU)의 크기는 시퀀스 파라미터 셋(SPS: Sequence Parameter Set)에 포함될 수 있다. 시퀀스 파라미터 셋(SPS)은 최대 코딩 유닛(LCU)의 최대 허용 가능한 계층 레벨 또는 계층 깊이를 포함할 수 있다. 예를 들어, 도 1의 경우는 최대 허용 가능한 계층 레벨 또는 계층 깊이는 5이고, 최대 코딩 유닛(LCU)의 한변의 크기가 128(단위: 픽셀)인 경우, 128x128(LCU), 64x64, 32x32, 16x16 및 8x8(SCU)의 5가지 종류의 코딩 유닛 크기가 가능하다. 즉, 최대 코딩 유닛(LCU)의 크기 및 최대 허용 가능한 계층 레벨 또는 계층 깊이가 주어지면 허용가능한 코딩 유닛의 크기가 결정될 수 있다.

상기한 바와 같이 코딩 유닛의 계층적인 분할 과정이 완료되면 더 이상의 분할 없이 코딩 유닛 계층 트리의 말단 코딩 유닛(leaf Coding Unit)에 대해 화면간 예측 또는 화면내 예측을 수행할 수 있으며, 이러한 말단 코딩 유닛이 화면간 또는 화면내 예측의 기본 단위인 예측 유닛(PU: Prediction Unit)으로 사용된다. 또한, 화면간 예측 또는 화면내 예측을 위하여 상기 말단 코딩 유닛에 대해 파티션(partition) 분할이 수행될 수 있다.

본 발명의 일 실시예에 따른 3차원 영상 부호화 방법에 의하면, 3차원 영상 부호화시, 깊이(depth)와 텍스처(texture)의 해상도(resolution)을 다르게 하여 부호화하여 전송하고 3차원 영상 복호화시 복호화할 수 있다. 여기서 텍스처(texture)는 색(color)를 의미한다. 예를 들어, 깊이(depth)를 텍스처(texture)의 1/2의 해상도로 부호화하여 전송하고 3차원 영상 복호화시 복호화할 수 있다. 또는 깊이(depth)를 텍스처(texture)의 1/k의 해상도로 부호화하여 전송하되, 상기 k값을 가변적으로 변경할 수 있다.

도 2는 공간적인 후보로서의 주변 블록을 도시한 도면이다. 일반적인 경우, 주변 블록은 현재 예측 유닛과 접해 있는 여러가지 블록을 포함할 수 있다. 예컨대, 현재 예측 유닛의 좌측에 접해 있는 주변 블록 또는 현재 예측 유닛의 상단에 접해 있는 주변 블록이 모두 공간적인 후보로서 사용될 수 있다. 특히, 계층적인 구조를 갖는 부호화 방법에 있어서는 주변 블록의 크기가 일정하지 않을 수 있고, 현재 예측 유닛과 접해 있으면, 다른 블록 크기를 갖는 주변 블록들도 화면간 예측에 사용되는 주변 블록으로 활용될 수 있다.

도 2를 참조하면, 본 발명의 일 실시예에 따른 3차원 영상 부호화 방법에서의 현재 예측 유닛(PU)에 대한 화면간 예측(inter prediction) 시에 사용될 수 있는 공간적인 주변 블록은 블록 A₁(101), 블록 A₀(102), 블록 B₁(103), 블록 B₀(104) 및 블록 B₂(105)을 포함할 수 있다. 상기 블록들(101, 102, 103, 104, 105)은 실험적으로 화면간 예측에 의해 움직임 벡터를 예측할 시 예측 움직임 벡터의 후보로서 가장 확률이 높은 블록들이다. 상기 블록들(101, 102, 103, 104, 105)은 움직임 벡터 예측시 우선 순위를 정하여 예측 움직임 벡터로 사용할 수 있는지 판단하게 된다. 상기 우선 순위는 A₁(101), 블록 A₀(102), 블록 B₁(103), 블록 B₀(104) 및 블록 B₂(105) 순이 사용될 수 있고, 상기 우선 순위를 기반으로 순차적으로 후보 예측 움직임 벡터로 이용가능한지 판단하여 이용 가능한 2개의 움직임 벡터를 최종 후보 예측 움직임 벡터로 선정할 수 있다.

도면에 도시되진 않았지만, 본 발명의 다른 실시예에 따르면, 3차원 영상 부호화 방법에서의 현재 예측 유닛(100)의 공간적인 주변 블록은 현재 예측 유닛(100)의 좌측에 접해 있는 블록, 현재 예측 유닛(100)의 상단에 접해 있는 블록 및 현재 예측 유닛(100)의 우상단 블록을 포함할 수 있다.

또한, 본 발명의 또 다른 실시예에 따르면, 3차원 영상 부호화 방법에서 현재 예측 유닛(100)의 공간적인 주변 블록은 현재 예측 유닛(100)의 좌측 최상단에 접해 있는 블록, 현재 예측 유닛(100)의 상단 최좌측에 접해 있는 블록, 현재 예측 유닛(100)의 우상단 블록을 포함할 수 있다.

상기 본 발명의 다른 실시예 및 또 다른 실시예에 있어서, 주변 블록의 움직임 벡터를 사용하여 수형 성분과 수직 성분 각각의 중앙값을 사용하여 현재 예측 유닛(100)의 예측 움직임 벡터를 생성할 수 있다. 특히, 본 발명의 다른 실시예에서는 H.264/AVC에서 규정된 방식과 동일한 방식으로 현재 블록의 주변블록들에 대하여 주변 블록들의 움직임 벡터들의 수형 성분과 수직 성분 각각의 중앙값(median)을 사용하여 현재 예측 유닛(100)의 예측 움직임 벡터를 생성할 수 있다.

도 3은 시간적인(temporal) 후보로서의 주변 블록을 도시한 도면이다. 도 3에 도시된 바와 같이, 본 발명의 일 실시예에 따른 3차원 영상 부호화 방법에서의 현재 예측 유닛에 대한 화면간 예측(inter prediction) 시에 사용될 수 있는 시간적인 주변 유닛은 블록 T_BR(130)을 포함할 수 있다. 도 3을 참조하면, 블록 T_BR(130)은 참조 픽처에서 현재 예측 유닛과 대응되는 위치의 블록(120)의 주변 블록 중 최우측 하단의 주변 블록에 우측에 접해 있는 블록이다. 시간적인 후보 블록은 블록 T_BR(130) 하나만 예측 움직임 벡터의 후보 블록으로서 고려할 수 있다.

도 2 및 도 3을 참조하면, 현재 예측 유닛(100)의 현재 예측 유닛(100)의 좌측 최하단의 블록(101), 블록(101)의 하단에 접해 있는 블록(102), 현재 예측 유닛(100)의 상단의 최우측의 블록(103), 블록(103)의 우측에 접해 있는 블록(104), 및 현재 예측 유닛(100)의 좌상단 블록(105) 및 이전 참조 영상의 현재 예측 유닛과 대응되는 위치에서 우하단 대각선에 위치한 블록(130), 총 6개의 주변 블록이 현재 예측 유닛(100)의 움직임 벡터를 예측하는데 사용될 수 있다. 즉, 총 6개의 주변 블록의 움직임 벡터가 현재 예측 유닛(100)의 예측 움직임 벡터를 결정하는 예측 움직임 벡터 후보군이 되는 것이다. 경우에 따라 현재 예측 유닛의 움직임 벡터를 예측하는데 이용할 수 없는(not available) 주변 블록이 존재하는데 이 경우에는 화면간 예측에 상기와 같이 이용 할수 없는 주변 블록을 사용하지 않는다.

이용할 수 없는 경우는 예컨대, 상기 주변 블록이 화면간(inter) 예측이 아닌 경우, 즉 화면내(intra) 예측인 경우 예측 움직임 벡터값을 갖지 않기 때문에 이용할 수 없고, 상기 주변 블록이 영상내의 에지(edge)를 포함하여 움직임 벡터값이 크게 변하는 경우, 현재 예측 유닛(100)의 예측 움직임 벡터의 후보로 사용하기에는 적합하지 않아 이용할 수 없는 경우로 분류할 수 있다.

다음으로, 전술한 바와 같이 6 개의 예측 움직임 벡터의 후보군 중에서 사용 가능한 예측 움직임 벡터로 3개의 최종 예측 움직임 벡터 후보를 정하여 비트 스트림을 생성할 수 있다. 여기서 3개의 예측 움직임 벡터 후보는 공간적인 후보 2개 및 시간적인 후보 1개를 포함하도록 구성할 수 있다. 비트 스트림을 생성할 때, 각각의 비트와 움직임 벡터와의 대응 관계는 다음의 표를 통해 살펴볼 수 있다.

[표 1]

표 1을 참조하면, 총 3개의 예측 움직임 벡터만 저장할 수 있음을 알 수 있다. 상위 2개는 공간적 주변 블록 A₁~B₂의 움직임 벡터가 포함되고 나머지 한 개는 시간적 후보 블록(130)의 움직임 벡터가 포함된다. 그리고 3개의 최종 예측 움직임 벡터는 순서대로 S0, S1, S2의 인덱스(index)가 부여된다. 이렇게 선정된 3개의 예측 움직임 벡터 후보 중에서 현재 예측 유닛(100)의 예측 움직임 벡터를 선택하게 된다.

이때, 후보 예측 움직임 벡터가 비트(bit)화 되는 표 1을 참조하면, 첫 번째 움직임 벡터의 인덱스는 1 비트(bit)로 정해져 있다. 따라서 우선 순위에 있는 2개의 후보를 최종 예측 움직임 벡터 후보로 선택하고 최우선 순위에 있는 예측 움직임 벡터 후보의 인덱스에 상대적으로 적게 비트가 할당되어 있기 때문에 정해진 우선 순위와 다른 결과가 나올 경우에는 마지막에 보내질 예측 움직임 벡터의 인덱스 코딩(coding)에 많은 비트가 사용되어 전송 효율이 좋지 않을 수 있다.

따라서, 가장 선택될 확률이 높은 후보를 우선적으로 확인하여 그 움직임 벡터를 첫 번째 인덱스를 부여하는 것이 데이터 효율 측면에서 중요하다. 이때, 일반적으로 사용될 수 있는 우선 순위를 제 1 우선 순위로 정의할 수 있다. 제 1 우선 순위는 상기한 바와 같이, 실험적으로 정해진 우선 순위로서 그 순서를 도 3을 참조하여 설명하면, 블록 A₁(101)->블록 A₀(102)->블록 B₁(103)->블록 B₀(104)->블록 B₂(105)의 순이고, 이 순서대로 하나씩 주변 블록의 움직임 벡터가 이용 가능한 블록이면 바로 그 블록의 움직임 벡터에 인덱스를 부여할 수 있다. 사용 불가능(not available)하면 다음 순서로 넘어가게 된다. 따라서, 움직임 벡터의 사용 가능성을 판단하는 우선 순위는 중요하다. 우선 순위에 기재된 움직임 벡터의 순서에 따라서, 현재 예측 유닛(100)의 예측 움직임 벡터가 달라질 수 있기 때문이다. 따라서, 영상의 특성에 따라 주변 블록을 참조하는 순서를 유동적으로 바꾸는 방법이 있을 수 있다. 즉, 첫 번째 후보에 주변 블록 중 예측 움직임 벡터로 선택될 확률이 가장 높은 주변 블록이 처음으로 인덱스를 부여받게 되는 블록이 되게 하면, 전송 효율 측면에서 이득을 얻을 수 있다.

도 4는 본 발명의 일 실시예에 따른 3차원 영상 부호화 장치를 개략적으로 나타낸 블록도이고, 도 5는 본 발명의 일 실시예에 따른 3차원 영상 부호화 방법을 개략적으로 나타낸 흐름도이다.

도 5에 도시된 바와 같이, 본 발명의 일 실시예에 따르면, 현재 예측 유닛(100)과 주변 블록을 움직임 예측 방식의 종류와 같은 소정의 기준에 따라 그룹핑하고(단계 510), 현재 예측 유닛(100)과 주변 블록이 동일한 그룹 및 동일한 깊이(depth) 정보를 가지는 지를 판단한 후(단계 520), 현재 예측 유닛(100)과 주변 블록이 동일한 그룹에 속하고 동시에 현재 예측 유닛(100)의 깊이(depth)와 주변 블록의 깊이가 동일한 경우에 한하여, 현재 예측 유닛(100)의 깊이와 동일한 깊이를 가진 주변 블록의 움직임 벡터를 현재 예측 유닛(100)의 예측 움직임 벡터 후보 리스(MV Predictor candidate list)에 최우선 순위로 선정하여 포함시키고(단계 530), 상기 후보 움직임 벡터를 기반으로 화면간 예측을 수행할 수 있다(단계 540).

예를 들어, 상기 움직임 예측 방식의 종류로는 공간적으로 다른 카메라에 의해 촬영된 참조 뷰(reference view)와 현재 뷰(view)간의 인터-뷰 예측(inter-view prediction) 방식과, 시간적으로 현재 픽춰의 이전 또는 이후의 참조 픽처의 대응 블록과 현재 예측 유닛간의 시간 예측(temporal prediction) 방식이 있다. 즉, 인터-뷰 예측(inter-view prediction) 그룹과 시간 예측(temporal prediction) 그룹의 2개의 그룹으로 그룹핑할 수 있다.

이 경우, 현재 예측 유닛(100)이 인터-뷰 참조 픽춰(inter-view reference picture)를 사용하고 주변블록이 인터-뷰 예측(inter-view prediction)을 사용하는 경우 동일한 인터-뷰 예측(inter-view prediction) 그룹에 속하는 것으로 판단할 수 있다. 또한, 현재 예측 유닛(100)이 시간 예측(temporal prediction)을 사용하고 주변블록이 시간 예측(temporal prediction)을 사용하는 경우 동일한 시간 예측(temporal prediction) 그룹에 속하는 것으로 판단할 수 있다.

인터-뷰 참조 픽춰(inter-view reference picture)를 사용할 경우, 인터-뷰 예측(inter-view prediction)을 사용하는 주변블록들만 인터-뷰 예측(inter-view prediction) 그룹으로 그룹핑하고,상기 현재 예측 유닛(100)의 주변 블록들 중 인터-뷰 예측(inter-view prediction)을 사용하지 않는 주변 블록들은 움직임 벡터 예측(Motion Vector Prediction; MVP)에 사용 가능하지 않다(not available)고 표시한 후 현재 예측 유닛(100)의 움직임 벡터 예측에 사용하지 않을 수 있다. 여기서, 현재 예측 유닛(100)의 움직임 벡터 예측은 현재 예측 유닛(100)의 주변블록들이 모두 움직임 벡터 예측에 사용가능할 경우, 현재 예측 유닛(100)의 주변 블록들의 움직임 벡터들의 중간값(median)을 가지도록 할 수도 있다.

한편, 현재 예측 유닛(100)이 시간 예측(temporal prediction)을 사용할 경우, 시간 예측(temporal prediction)을 사용하는 주변블록들만 시간 예측(temporal prediction) 그룹으로 그룹핑하고, 시간 예측(temporal prediction)를 사용하는 주변 블록들은 움직임 벡터 예측(MVP)에 사용 가능하지 않다고 표시하고, 현재 예측 유닛(100)의 움직임 벡터 예측에 사용하지 않을 수 있다.

본 발명의 일 실시예에 따른 3차원 영상 부호화 방법에 따르면, 소정의 그룹핑 및 깊이도를 기반으로 현재 예측 유닛(100)과 동일한 깊이도를 갖는 주변 블록의 움직임 벡터를 현재 예측 유닛(100)의 예측 움직임 벡터 후보로 사용하기 때문에 현재 예측 유닛(100)의 예측 움직임 벡터로서의 정확도를 정확도를 향상시킬 수 있다.

본 발명의 다른 실시예에 따른 3차원 영상 부호화 방법은 상기와 같은 주변 블록을 사용함에 있어서, 3차원 영상의 효율적인 부호화를 위해 주변 블록의 깊이(depth) 정보만을 고려할 수도 있다. 3차원 영상의 경우, 3차원의 특성상 깊이 정보가 존재하며, 부호화기에서 깊이 정보를 구해 복호화기로 다시점 비디오 영상과 깊이 정보를 함께 전송할 수 있다.

따라서, 상기와 같이 도 2의 주변 블록(101, 102, 103, 104, 105) 또는 H.264/AVC에서 사용하는 주변 블록들을 활용하되, 상기 주변 블록의 깊이 정보를 기반으로 예측 움직임 벡터의 후보를 결정할 수 있다.

즉, 현재 예측 유닛(100)과 동일한 깊이 정보를 갖는 주변 블록은 현재 예측 유닛(100)과 동일한 객체로 추정할 수 있으므로 동일한 움직임 벡터를 가진 것으로 추정할 수 있다. 따라서, 일반적인 움직임 벡터 선정 방식에 3차원의 특성인 깊이 정보를 접목하여 현재 예측 유닛(100)의 움직임 벡터 예측의 후보로 사용할 수 있다. 즉, 현재 예측 유닛(100)의 움직임 벡터의 예측 값으로 사용할 수 있다.

본 발명의 다른 실시예에 따르면 상기 현재 예측 유닛(100)의 주변 블록, 예컨대 좌측에 접해 있는 주변 블록 및 상단에 접해 있는 주변 블록 중에서 두 개의 공간적인 예측 움직임 벡터에 대한 후보 블록을 선정할 수 있는데 이때, 상기 주변 블록의 깊이 정보를 기반으로 현재 예측 유닛(100)과 동일한 깊이도를 갖는 주변 블록을 예측 움직임 벡터에 대한 후보 블록으로 선정할 수 있다.

본 발명의 다른 실시예에 따르면, 상기 주변 블록(101, 102, 103, 104, 105)의 움직임 벡터 중에서 두 개의 공간적인 예측 움직임 벡터 후보를 선정할 수 있는데, 주변 블록(101, 102, 103, 104, 105)의 깊이 정보를 추출하여, 현재 예측 유닛(100)과 비교를 수행할 수 있다. 이때, 주변 블록 중 블록 A₁(101)은 2의 깊이도를 갖고, A₀(102)는 1의 깊이도, B₁(103)은 4의 깊이도, B₀(104)는 3의 깊이도, B₂(105)는 2의 깊이도를 가지며, 현재 예측 유닛(100)은 2의 깊이도를 갖는 경우, 상기 현재 예측 유닛(100)과 동일한 2의 깊이도를 갖는 A₁(101)과 B₂(105)의 움직임 벡터가 현재 예측 유닛(100)의 움직임 벡터 예측을 위한 후보로 선정될 수 있다. 이때, 동일한 깊이 정보를 갖는 주변 블록이 2개 이상인 경우, 상기한 제 1 우선 순위에 따라 예측 움직임 벡터의 공간적인 후보를 선정할 수 있다.

본 발명의 다른 실시예에 따르면, 비교 결과, 주변 블록(101, 102, 103, 104, 105) 중 현재 예측 유닛(100)과 동일한 깊이도를 갖는 주변 블록이 없는 경우, 일반적인 예측 움직임 벡터 후보 선정 방식인 제 1 우선 순위를 사용하여 블록 A₁(101)->블록 A₀(102)->블록 B₁(103)->블록 B₀(104)->블록 B₂(105)의 순으로 이용 가능 여부를 판단하여 공간적인 후보 2개를 선정할 수 있다.

본 발명의 다른 실시예에 따르면, 비교 결과 동일한 깊이도를 갖는 주변 블록이 없는 경우, 현재 예측 유닛(100)과의 깊이도 차이를 기반으로 현재 예측 유닛(100)과 가장 깊이도 차이가 작은 주변 블록의 움직임 벡터를 현재 예측 유닛(100)을 위한 예측 움직임 벡터의 후보로 사용할 수 있다.

상기한 바와 같이, 3차원 영상 부호화 방법에서의 현재 예측 유닛(100)의 공간적인 주변 블록은 현재 예측 유닛(100)의 좌측에 접해 있는 블록, 현재 예측 유닛(100)의 상단에 접해 있는 블록 및 현재 예측 유닛(100)의 우상단 블록을 포함할 수 있고, 또는 현재 예측 유닛(100)의 좌측 최상단에 접해 있는 블록, 현재 예측 유닛(100)의 상단 최좌측에 접해 있는 블록, 현재 예측 유닛(100)의 우상단 블록을 포함할 수 있다.

경우에 따라서, 상기 주변 블록의 움직임 벡터를 사용하여 수형 성분과 수직 성분 각각의 중앙값을 사용하여 현재 예측 유닛(100)의 예측 움직임 벡터를 생성할 수 있다.

본 발명의 다른 실시예에 따른 3차원 영상 부호화 방법에 따르면, 깊이도를 기반으로 현재 예측 유닛(100)과 동일한 깊이도를 갖는 주변 블록의 움직임 벡터를 현재 예측 유닛(100)의 예측 움직임 벡터 후보로 사용하기 때문에 현재 예측 유닛(100)의 예측 움직임 벡터로서의 정확도를 향상시킬 수 있고, 특히 먼저 선정된 예측 움직임 벡터가 낮은 비트로 비트화되기 때문에 전송 효율 측면에서도 유리할 수 있다.

도 4는 본 발명의 일 실시예에 따른 3차원 영상 부호화 장치를 개략적으로 나타낸 블록도이다. 도 4에 도시된 바와 같이, 본 발명의 일 실시예에 따른 3차원 영상 부호화 장치(400)는 주변 블록의 움직임 벡터 그룹핑부(410), 그룹 및 깊이 정보 비교부(420), 후보 예측 움직임 벡터 선정부(430), 화면간 예측 처리부(440)를 포함할 수 있다.

도 4를 참조하면, 주변 블록의 움직임 벡터 그룹핑부(410)는 현재 예측 유닛(100)의 주변 블록(A0,A1,B0,B1,B2)의 움직임 벡터(MV)를 인터-뷰 예측(inter-view prediction) 그룹과 시간 예측(temporal prediction) 그룹의 2개의 그룹으로 그룹핑 한다.

현재 예측 유닛(100)이 인터-뷰 참조 픽춰(inter-view reference picture)를 사용할 경우, 인터-뷰 예측(inter-view prediction)을 사용하는 주변블록들만 인터-뷰 예측(inter-view prediction) 그룹으로 그룹핑하고, 상기 현재 예측 유닛(100)의 주변 블록들 중 인터-뷰 예측(inter-view prediction)을 사용하지 않는 주변 블록들은 움직임 벡터 예측(Motion Vector Prediction; MVP)에 사용 가능하지 않다(not available)고 표시하고 현재 예측 유닛(100)의 움직임 벡터 예측에 사용하지 않을 수 있다. 여기서, 현재 예측 유닛(100)의 움직임 벡터 예측은 현재 예측 유닛(100)의 주변블록들이 모두 움직임 벡터 예측에 사용가능할 경우, 현재 예측 유닛(100)의 주변 블록들의 움직임 벡터들의 중간값(median)을 가지도록 할 수 있다.

그룹 및 깊이 정보 비교부(420)는 현재 예측 유닛(100)과 주변 블록이 모두 동일한 그룹에 속하는지 여부와 현재 예측 유닛(100)의 깊이 정보와 주변 블록의 깊이 정보를 비교한다. 구체적으로, 현재 예측 유닛(100)이 인터-뷰 참조 픽춰(inter-view reference picture)를 사용하고 주변블록이 인터-뷰 예측(inter-view prediction)을 사용하는 경우 동일한 인터-뷰 예측(inter-view prediction) 그룹에 속하는 것으로 판단할 수 있다. 또한, 현재 예측 유닛(100)이 시간 예측(temporal prediction)을 사용하고 주변블록이 시간 예측(temporal prediction)을 사용하는 경우 동일한 시간 예측(temporal prediction) 그룹에 속하는 것으로 판단할 수 있다.

후보 예측 움직임 벡터 선정부(430)는 상기 비교 결과, 현재 예측 유닛(100)과 주변 블록이 모두 동일한 그룹에 속하고 동시에 현재 예측 유닛(100)의 깊이(depth)와 주변 블록의 깊이가 동일한 경우에 한하여, 현재 예측 유닛(100)의 깊이와 동일한 깊이를 가진 주변 블록의 움직임 벡터를 현재 예측 유닛(100)의 예측 움직임 벡터 후보 리스(MV Predictor candidate list)에 최우선 순위로 선정하여 포함시킨다. 현재 예측 유닛의 후보 움직임 벡터 리스트는 3D 영상 부호화기에서 3D 영상 복호화기로 전송될 수 있다.

화면간 예측 처리부(440)는 상기 후보 예측 움직임 벡터 선정부(430)에서 선정된 후보 움직임 벡터 리스트를 기반으로 화면간 예측을 수행하여 현재 예측 유닛(100)의 실제 움직임 벡터와 상기 예측된 움직임 벡터간의 움직임 벡터 잔여값(residue)을 구한다. 현재 예측 유닛의 움직임 벡터 잔여값은 DCT(Discrete Cosine Transform) 변환하고 양자화한 후 엔트로피 부호화하여 3D 영상 부호화기에서 3D 영상 복호화기로 전송될 수 있다. 현재 예측 유닛의 움직임 벡터 잔여값은 3D 영상 부호화기에서 3D 영상 복호화기로 전송될 수 있다.

3D 영상 복호화기에서는 3D 영상 부호화기에서 전송된 현재 예측 유닛의 후보 움직임 벡터 리스트로부터 추출된 후보 움직임 벡터 리스트와 현재 예측 유닛의 움직임 벡터 차분값을 이용하여 현재 예측 유닛의 움직임 벡터를 구하여 원래 영상을 복원할 수 있다.

본 발명의 실시예들에 따른 3차원 영상 복호화 장치 및 복호화 방법에서는, 전술한 부호화기로부터 전송된 비트 스트림를 이용하여 해당 블록의 움직임 벡터를 복원하여 움직임 예측부에서 블록 단위로 움직임 벡터를 생성하고, 움직임 보상부에서 상기 움직임 예측부에서 생성된 움직임 벡터와 참조 픽처를 이용하여 움직임 보상을 수행한다.

HD(High Definition)급 이상의 해상도를 가지는 고해상도 영상에 대하여 본 발명의 3D 영상 부호화/복호화 방법을 적용할 경우, 하나의 픽처당 블록의 개수가 증가하게 되므로 각각의 예측 블록 마다 움직임 파라미터를 디코더로 전송할 경우 전송되는 움직임 파라미터의 양이 매우 많아지게 되어 코딩 효율 측면에서 바람직하지 못하므로 코딩 효율을 높이기 위한 방법이 요구된다.

본 발명의 3D 영상 부호화/복호화 방법에서 코딩 유닛(PU)의 크기가 예를 들어 2N X 2N(N은 자연수로서 단위는 pixel)인 경우, 예측 모드가 화면간 예측(inter-prediction) 모드인 경우, 화면간 예측을 수행하기 위하여 수평 방향으로 비대칭적 파티션(asymmetric partition) 분할을 하여 2N X nU(단, nU = 2N X 1/4) 크기의 파티션 PU0(P11a)와 2N X nD(단, nD = 2N X 3/4) 크기의 파티션 PU1(P21a)로 분할하거나,또는 2N X nU(단, nU = 2N X 3/4) 크기의 파티션 PU0(P12a)와 2N X nD(단, nD = 2N X 1/4) 크기의 파티션 PU1(p22a)로 분할될 수 있다. 또는, 2N X 2N 코딩 유닛은 수직 방향으로 비대칭적 파티션(asymmetric partition) 분할을 하여 nL X 2N(단, nL = 2N X 1/4) 크기의 파티션 PU0(P13a)와 nR X 2N (단, nR = 2N X 3/4) 크기의 파티션 PU1(P23a)로 분할하거나,또는 nL X 2N (단, nL = 2N X 3/4) 크기의 파티션 PU0(P14a)와 nR X 2N (단, nR = 2N X 1/4) 크기의 파티션 PU1(P24a)로 분할될 수 있다.

화면간 예측(Inter prediction)과 관련된 움직임 파라미터(움직임 벡터, 움직임 벡터의 차이값, 참조 픽처 인덱스, 참조 픽처 리스트등)를 포함한 모든 정보는 화면간 예측의 기본 단위인 예측 유닛별 또는 상기 파티션 분할된 예측 유닛별로 디코더로 전송된다. 여기서, 참조 픽처 리스트(reference picture list)는 현재 픽처(N번째 픽처)의 이전 픽처(N-1 번째 픽처)인 경우 리스트 0, 현재 픽처(N번째 픽처)의 이후 픽처(N+1 번째 픽처)인 경우 리스트 1의 값을 가질 수 있다. 참조 픽처 인덱스(reference picture index)는 현재 예측 유닛에 대한 참조 픽처 인덱스를 나타낸다.

HD(High Definition)급 이상의 해상도를 가지는 고해상도 영상의 경우, 하나의 픽처당 예측 블록(파티션 분할이 않된 예측 유닛 또는 파티션 분할된 예측 유닛)의 개수가 증가하게 되므로 각각의 예측 블록(파티션 분할이 않된 예측 유닛 또는 파티션 분할된 예측 유닛) 마다 움직임 파라미터를 디코더로 전송할 경우 전송되는 움직임 파라미터의 양이 매우 많아지게 되어 코딩 효율 측면에서 바람직하지 못하므로 코딩 효율을 높이기 위한 방법이 요구된다.

상기와 같은 문제점을 해결하기 위하여 블록 병합(block merging)을 이용하여 화면간 부호화를 수행할 수 있다. 블록 병합은 현재 블록(또는 예측 유닛)보다 이전에 부호화된 현재 블록의 주변 블록이 현재 블록 X와 동일한 움직임 파라미터(움직임 벡터, 움직임 벡터의 차이값, 참조 픽처 인덱스, 참조 픽처 리스트등)를 가지는 경우, 상기 동일한 움직임 파라미터를 가지는 주변 블록들을 상기 현재 블록과 병합하여 병합된 블록들을 동일한 움직임 파라미터로서 디코더로 전송함으로써 현재 블록의 움직임 파라미터를 별도로 전송하지 않고 디코더로 전송되는 움직임 파라미터의 양을 줄임으로써 코딩 효율을 효율을 높일 수 있다.

예를 들어, 하나의 픽처가 계층적으로 말단 코딩 유닛, 즉 최소 코딩 유닛(SCU)까지 분할(split)된 후, 최소 코딩 유닛(SCU)인 현재 블록(예측 유닛) X가 이전에 부호화된 좌측 주변 블록 A0 및 상측 주변 블록 B0와 동일한 움직임 벡터를 가진 경우, 블록 Ao, Bo, X는 병합되어 동일한 움직임 파라미터로서 디코더로 전송된다. 여기서, 움직임 파라미터는 예를 들어, 움직임 벡터, 움직임 벡터 차이값, 참조 픽처 인덱스, 참조 픽처 리스트등을 포함할 수 있다. 이 경우 블록 병합이 적용되었는지 여부를 나타내는 병합 플래그(merging flag)가 디코더로 전송될 수 있다.

본 발명의 3D 영상 부호화에서 화면간 예측시, 화면간 예측을 수행하기 위하여 수평 방향으로 비대칭적 파티션(asymmetric partition) 분할을 한 경우, 제1 예측 유닛 및 제2 예측 유닛으로 비대칭적 파티션 분할된 현재 코딩 유닛(Coding Unit)의 주변 블록들 중에서 선택된 소정 개수의 공통 병합 후보 블록들을 포함하는 공통 병합 후보 블록 리스트를 구성하고, 상기 제1 예측 유닛(PU0) 및 제2 예측 유닛(PU1) 각각 마다 상기 공통 병합 후보 블록 리스트 중에서 적어도 하나의 후보 블록을 선택하여 상기 선택된 후보 블록 정보를 상기 제1 예측 유닛(PU0) 및 제2 예측 유닛(PU1)마다 복호화기로 전송할 수 있다. 상기 공통 병합 후보 블록 리스트는 상기 제1 예측 유닛(PU0) 및 제2 예측 유닛(PU1)에 대해 블록 병합을 수행할 경우 공통적으로 사용되는 병합 후보 블록들을 포함할 수 있다. 여기서, 상기 제2 예측 유닛의 공통 병합 후보 블록들은 상기 제1 예측 유닛의 움직임 파라미터를 복원하기 전에도 구성할 수 있는 주변 블록들로만 이루어질 수 있다. 상기 현재 코딩 유닛의 크기는 특정 코딩 유닛의 크기-예를 들어 4x4, 8x8, 16x16, 32x32등-인 경우에만 상기 블록 병합을 수행할 수 있다.

또한, 화면간 예측을 수행하기 위하여 수평 방향으로 비대칭적 파티션(asymmetric partition) 분할된 경우, 본 발명의 3D 영상 복호화의 경우, 제1 예측 유닛(PU0) 및 제2 예측 유닛(PU1)으로 비대칭적 파티션 분할된 현재 코딩 유닛(CU)의 주변 블록들 중에서 선택된 소정 개수의 공통 병합 후보 블록들을 포함하는 공통 병합 후보 블록 리스트를 구성하고, 상기 제1 예측 유닛(PU0) 및 제2 예측 유닛(PU1) 각각 마다 상기 공통 병합 후보 블록 리스트 중에서 선택된 적어도 하나의 후보 블록을 이용하여 블록 병합된 블록의 움직임 파라미터를 복원하여 블록 단위로 움직임 벡터를 생성하고, 상기 생성된 움직임 벡터와 참조 픽처를 이용하여 움직임 보상을 수행할 수 있다. 여기서, 상기 제2 예측 유닛의 공통 병합 후보 블록들은 상기 제1 예측 유닛의 움직임 파라미터를 복원하기 전에도 구성할 수 있는 주변 블록들로만 이루어질 수 있다. 상기 현재 코딩 유닛의 크기는 특정 코딩 유닛의 크기-예를 들어 4x4, 8x8, 16x16, 32x32등-인 경우에만 상기 블록 병합을 수행할 수 있다.

이하, 본 발명의 3D 영상 부호화/복호화에서 화면간 예측시 비대칭적 파티션(Asymmetric partition)을 적용할 경우, 공통 병합 후보 리스트(common merge candidate list)를 사용하여 제1 비대칭파티션(PU0)과 제2 비대칭파티션(PU1)의 병렬 처리하는 방법에 대해 구체적으로 설명한다.

먼저, 2N X 2N 코딩 유닛(PU)이 수직 방향으로 nL X 2N (단, nL = 2N X 1/4) 크기의 파티션 PU0 블록(예측 유닛)과 nR X 2N (단, nR = 2N X 3/4) 크기의 파티션 PU1 블록(예측 유닛)으로 파티션 분할된다. 이하에서, PU0은 제1 예측 유닛, PU1은 제2 예측 유닛이라고 한다. 여기서, 코딩 유닛(PU)의 크기는 2N X 2N (N은 양의 정수)로서, N은 예를 들어 2, 4, 8, 16, 32가 될 수 있다. 비대칭적으로 파티션 분할된 예측 유닛 PU0 및 PU1에 대하여 병렬 처리를 가능하게 하기 위하여 공통 병합 후보 블록들을 사용하는 방식은 N값이 2, 4, 8, 16, 32 값을 가지는 코딩 유닛(PU)에 모두 적용될 수도 있고, 또는 N값이 특정값-예를 들어 2, 4, 8, 16, 32 값 중 하나-을 가지는 코딩 유닛(PU)에만 적용될 수도 있다. 예를 들어 최대 코딩 유닛(LCU; Largest Coding Unit)이 64x64인 경우 코딩 유닛(CU)의 크기가 작을수록 64x64 블록 전체에 대해 공통 병합 후보 블록들을 포함하는 공통병합 블록 리스트를 구성하는 횟수가 증가할 수 있으며, 이러한 경우 코딩 유닛(CU)의 크기가 큰 경우보다 작은 경우에 대해 공통 병합 후보 리스트를 적용할 경우 공통 병합 후보 리스트를 구성하는 횟수를 훨씬 더 크게 줄일 수 있어 복잡도를 줄일 수 있다. 한편, 공통 병합 후보 리스트를 더 많이 적용하여 병렬 처리를 할 경우 성능 손실(loss)는 커지게 된다. 따라서, 성능 손실과 복잡도를 모두 고려하여 예를들어, 예측 유닛(PU)의 최소 크기가 4x4인 경우, 코딩 유닛(CU)의 크기가 8x8인 경우에만(N값 2, 4, 8, 16, 32 값 중 2를 제외하고 가장 작은 4 선택) 상기 공통 병합 후보 블록들을 사용함으로써 큰 성능 손실 없이 복잡도를 크게 줄일 수 있다.

한편, 최대 코딩 유닛(LCU)는 복수의 서로 중복되지 않는(non-overlapped) 움직임 추정 영역(motion estimation region)(또는 병합 추정 영역(merge estimation region))으로 분할될 수 있으며, 최대 코딩 유닛(LCU)내의 움직임 추정 영역간에는 움직임 추정(motion estimation) 동작이 병렬(parallel) 처리가 아닌 순차적(sequential)으로 이루어지도록하고, 최대 코딩 유닛(LCU)내의 하나의 움직임 추정 영역내에 속하는 모든 예측 유닛(PU)에 대하여 병렬(parallel)로 움직임 추정(motion estimation)이 이루어지도록 할 수 있다. 여기서, 상기 움직임 추정 영역의 크기는 최대 코딩 유닛(LCU)의 크기보다 작으며, 상기 움직임 추정 영역은 정사각형 형태를 가질 수 있다.

움직임 추정 영역의 크기(size)에 따라 움직임 추정 영역내의 예측 유닛(PU)들에 대하여 공통 병합 후보 블록들을 사용하여 병렬 처리를 허용할지 여부를 다르게 할 수 있다. 예를 들어, 최소 예측 유닛(PU) 크기가 4x4일 경우, 움직임 추정 영역의 크기가 4x4인 경우에는 최대 코딩 유닛(LCU)내의 모든 예측 유닛(PU)들에 대하여 순차적인 병합(sequential merge) 동작이 수행되고, 움직임 추정 영역의 크기가 8x8 이상일 경우만 움직임 추정 영역 내의 모든 예측 유닛(PU)들에 대해 병렬 병합(parallel merge)-병렬 처리를 가능하게 하기 위하여 공통 병합 후보 블록들을 사용하는 방식-이 허용되도록 할 수 있다. ,

상기와 같은 움직임 추정 영역의 크기에 따라 소정의 값이 PPS(picture parameter set)내에 포함되어 움직임 추정 영역의 크기에 따른 상기 병렬 병합 처리 허용 여부를 알려주기 위하여 인코더에서 디코더로 전송될 수 있다. 상기 소정의 값은 예를 들어 0, 1, 2, 3, 4가 될 수 있으며, 0, 1, 2, 3, 4 각각에 대해 움직임 추정 영역의 크기는 4x4, 8x8, 16x16, 32x32, 64x64가 될 수 있다.

현재 예측 유닛(PU)와 주변 예측 유닛(PU)이 동일한 움직임 추정 영역에 속하는 경우(동일한 움직임 추정 영역 내부에 포함될 경우)에는 해당 주변 예측 유닛(PU)은 이용가능 하지 않음(non-available)으로 처리되며, 현재 예측 유닛(PU)과 주변 예측 유닛(PU)이 서로 다른 움직임 추정 영역에 속하는 경우에는 해당 주변 예측 유닛(PU)은 이용가능(available)으로 처리함으로써 상기 공통 병합 후보 블록들의 리스트에서의 움직임 벡터 추정에의 이용가능성을 결정할 수 있다. 현재 8x8 크기의 코딩 유닛(CU)의 주변 공통 병합 후보 블록들(주변 예측 유닛(PU)들) 중 일부가 이용가능 하지 않음(non-available)인 경우 이용가능(available)한 주변 공통 병합 후보 블록들을 이용하여 전술한 병합(merge) 처리 동작이 수행될 수 있다.

본 발명의 실시예들에 따른 비대칭적으로 파티션 분할된 제1 예측 유닛 PU0 및 제2 예측 유닛 PU1에 대하여 공통적인 병합 후보 블록들을 사용하여 제1 예측 유닛 PU0 및 제2 예측 유닛 PU1에 대하여 병렬적으로 블록 병합 및 인코딩(또는 디코딩) 동작을 처리하도록 한다.

따라서, 제1 예측 유닛 PU0의 블록 병합을 위한 병합 후보 블록들의 리스트를 구성하는 제1 프로세스와 제2 예측 유닛 PU1의 블록 병합을 위한 병합 후보 블록들의 리스트를 구성하는 제2 프로세스는 따로 따로 수행되는 것이 아니라 1번의 공통 병합 후보 블록을 구성하는 프로세스로 수행될 수 있으며, 제2 예측 유닛 PU1에 대한 인코딩(또는 디코딩) 프로세스는 제1 예측 유닛 PU1에 대한 인코딩(또는 디코딩) 프로세스와 병렬적으로 수행될 수 있게 되어 인코딩 시간이 크게 감소될 수 있다.

상기 공통 병합 후보 블록들은 인코더와 디코더에서 사전에 약속에 의해 미리 정해질 수 있으며, 이 경우 공통 병합 후보 블록들에 대한 정보는 인코더에서 디코더로 전송될 필요가 없다.

또는, 본 발명의 또 다른 실시예에서는, 2N X 2N 코딩 유닛(PU)이 수직 방향으로 nL X 2N (단, nL = 2N X 3/4) 크기의 파티션 PU0 블록(예측 유닛)과 nR X 2N (단, nR = 2N X 1/4) 크기의 파티션 PU1 블록(예측 유닛)으로 파티션 분할될 경우 공통 병합 후보 블록을 구성할 수 있다. 따라서, 본 발명의 또 다른 실시예에 따라 수직 방향으로 파티션 PU0 블록(예측 유닛)과 파티션 PU1 블록(예측 유닛)으로 파티션 분할될 경우에도 제1 예측 유닛 PU0의 블록 병합을 위한 병합 후보 블록들의 리스트를 구성하는 제1 프로세스와 제2 예측 유닛 PU1의 블록 병합을 위한 병합 후보 블록들의 리스트를 구성하는 제2 프로세스는 따로 따로 수행되는 것이 아니라 1번의 공통 병합 후보 블록을 구성하는 프로세스로 수행될 수 있으며, 제2 예측 유닛 PU1에 대한 인코딩(또는 디코딩) 프로세스는 제1 예측 유닛 PU1에 대한 인코딩(또는 디코딩) 프로세스와 병렬적으로 수행될 수 있게 되어 인코딩 시간이 크게 감소될 수 있다.

상기 공통 병합 후보 블록들의 리스트에는 예를 들어 7개의 블록을 가질 수 있으나, 공통 병합 후보 블록들의 리스트에 포함되는 블록들의 개수는 이에 한정되는 것은 아니며 6개, 5개, 4개의 후보 블록들로만 이루어질 수도 있다.

전술한 바와 같이 공통 병합 후보 블록 집합을 선정한 경우, 상기 각각의 병합 후보 블록 중 현재 블록(예측 유닛)과 유사한 움직임 파라미터를 갖는 블록을 선정하여 상기 선정된 병합 후보 블록과 현재 블록을 병합한다. 현재 블록(예측 유닛)과 유사한 움직임 파라미터를 갖는 블록의 선정은 현재 블록(예측 유닛)의 움직임 파라미터와 병합 후보 블록 집합의 각각의 병합 후보 블록의 움직임 파라미터의 차이값이 소정의 임계값 이하인 경우에 상기 임계값 이하의 차이값을 가지는 병합 후보 블록을 선정할 수 있다.

현재 블록과 상기 선정된 병합 후보 블록은 동일한 움직임 파라미터를 적용하여 디코더로 전송된다.

현재 블록이 상기 선정된 병합 후보 블록과 병합된 경우, 현재 블록의 움직임 파라미터를 디코더로 전송할 필요없이, 상기 병합된 블록의 정보를 디코더로 전송하고, 디코더는 상기 병합 블록 정보를 이용하여 이미 복호화된 병합 블록의 움직임 파라미터를 이용하여 현재 블록을 복호화할 수 있다.

제1 예측 유닛(PU0) 및 제2 예측 유닛(PU1) 각각 마다 상기 공통 병합 후보 블록 리스트 중에서 적어도 하나의 후보 블록을 선택하여 상기 선택된 후보 블록 정보를 상기 제1 예측 유닛 및 제2 예측 유닛마다 복호화기로 전송한다. 전술한 실시예에서와 같이 제 1 예측 유닛 PU0과 제2 예측 유닛 PU1이 공통 병합 후보 블록으로서 제 1 예측 유닛 PU0과 제2 예측 유닛 PU1의 주변 블록들을 공간적(spatial) 병합 후보 블록을 포함하는 경우, 소정 크기를 가지는 코딩 유닛(CU)내의 파티션(partition) 타입 및 인덱스(indices)에 상관없이 모든 파티션(partition) 타입에 대하여 제 1 예측 유닛 PU0과 제2 예측 유닛 PU1은 공통적인 공간적(spatial) 병합 후보 블록을 포함할 수 있다.

전술한 실시예에서는 공통 병합 후보 블록의 리스트에 제 1 예측 유닛 PU0과 제2 예측 유닛 PU1이 제 1 예측 유닛 PU0과 제2 예측 유닛 PU1의 주변 블록들로 이루어진 공간적(spatial) 병합 후보 블록을 포함하는 예를 설명하였으나, 본 발명의 다른 실시예에서는 상기 공통 병합 후보 블록의 리스트에 시간적(temporal) 병합 후보 블록이 더 포함될 수 있다.

제 1 예측 유닛 PU0과 제2 예측 유닛 PU1이 공통 병합 후보 블록 으로서 시간적(temporal) 병합 후보 블록을 포함하는 경우, 코딩 유닛(CU)내의 제 1 예측 유닛 PU0과 제2 예측 유닛 PU1은 상기 공간적(spatial) 공통 병합 후보 블록들 중에서 미리 정해진 특정 위치의 블록의 참조 픽춰 인덱스(reference picture index)를 시간적(temporal) 병합 후보 블록을 위한 시간적 움직임 벡터 예측(Temporal MVP)의 참조 픽춰 인덱스(reference picture index)로 사용할 수 있다. 여기서, 시간적 움직임 벡터 예측(Temporal MVP)의 경우 움직임 벡터(MV)와 참조 픽춰 인덱스(reference picture index)를 디코더로 전송한다. 여기서, 상기 미리 정해진 특정 위치의 블록은 상기 공통 병합 후보 블록의 리스트에 포함된 블록들 제 1 예측 유닛 PU0과 제2 예측 유닛 PU1의 움직임 파라미터를 복원하기 전에도 구성할 수 있는 이전에 부호화된 주변 블록이 사용되어 병렬처리가 가능하도록 할 수 있다.

또는 상기 시간적(temporal) 병합 후보 블록은, 예를 들어, 현재 픽처의 이전 픽처에 포함된 현재 예측 유닛(PU)의 대응되는 위치(co-located)의 블록을 공통 병합 후보 리스트에 더 포함할 수 있다.

따라서, 본 발명의 3D 영상 부호화/복호화에서 화면간 예측시 비대칭적 파티션(Asymmetric partition)의 경우, 공통 병합 후보 리스트(common merge candidate list) 사용하여 제1 비대칭파티션(PU0)과 제2 비대칭파티션(PU1)의 병렬 처리가 가능하여 인코딩 시간을 크게 감소시킬 수 있다.

멀티 뷰 영상의 인-루프 필터링 방법

멀티뷰 영상의 부호화 및 복호화의 경우 멀티뷰 영상 데이터(또는 텍스처(texture))의 모든 뷰 영상 또는 일부 뷰 영상에 대한 깊이 정보는 부호화기에서 복호화기로 전송될 수 있다. 또한, 복수의 서로 다른 시점의 카메라들에 대한 카메라 파라미터는 부호화기에서 복호화기로 전송할 수 있다. 또한, 부호화기는 현재 뷰에 대한 참조 뷰 합성을 위한 정보를 복호화기로 전송할 수도 있다.

멀티뷰 영상 데이터(또는 텍스처(texture))의 모든 뷰 영상 또는 일부 뷰 영상에 대한 깊이 정보가 부호화기에서 복호화기로 전송될 경우, 텍스처 뷰 컴포넌트와 깊이 뷰 컴포넌트는 소정의 순서에 따라 부호화된다.

예를 들어, 제1 카메라에 의해 생성된 View 0 및 상기 제1 카메라와 공간적으로 상이한 시점의 제2 카메라에 의해 생성된 View 1이 존재하는 경우, 액세스 유닛 t는 View 0에 대한 텍스처 뷰 컴포넌트 T0t와 깊이 뷰 컴포넌트 D0t를 포함하고 View 1에 대한 텍스처 뷰 컴포넌트 T1t와 깊이 뷰 컴포넌트 D1t를 포함할 수 있으며, 액세스 유닛 t+1는 View 0에 대한 텍스처 뷰 컴포넌트 T0t+1와 깊이 뷰 컴포넌트 D0t+1를 포함하고 View 1에 대한 텍스처 뷰 컴포넌트 T1t+1와 깊이 뷰 컴포넌트 D1t+1를 포함할 수 있다. 이 경우, T0t, T0t+1, D0t, D0t+1의 순서로 부호화되거나, D0t, T0t, D0t+1, T0t+1의 순서로 부호화되거나, T0t+1, D0t+1, T0t, D0t의 순서로 부호화될 수 있다.

복호화기에서는 부호화기로부터 전송된 텍스처 데이터 및/또는 깊이 맵 데이터를 이용하여 VSP(View Synthesis Prediction) 과정을 통하여 중간 뷰 영상을 합성할 수 있다. 예를 들어, View 1, 2, 3에 대해 부호화기에서 3개 View 전부에 대한 깊이 데이터 3개를 디코더로 보내지 않고 2개의 View(예를 들어 View 1, View 3)에 대한 깊이 데이터를 복호화기로 전송하고, View 2에 대한 깊이 데이터는 복호화기에서 복원할 수 있다.

도 6을 참조하면, 본 발명의 일실시예에 따른 부호화기는 제1 부호화부(100) 및 제2 부호화부(200)으로 구성된다. 제1 부호화부(100)는 기존의 H.264/AVC의 부호화기의 구성과 동일한 구성을 가지고 입력 영상 X를 변환부(101), 양자화부(103), 역양자화부(105), 역변환부(107), 움직임 보상부(115), 움직임 추정부(121)을 이용하여 화면내 예측 및 화면간 예측을 수행하고, 블록 경계간 디블록킹 필터링을 수행한다. 제1 부호화부(100)는 기존의 H.264/AVC의 부호화기의 구성과 동일한 구성을 가지므로 자세한 설명은 생략한다.

제2 부호화부(200)는 텍스처 부호화를 위한 깊이 기반 움직임 벡터 예측(Depth-based motion vector prediction;D-MVP)을 수행하는 D-MVP(210) 및 텍스처 데이터와 깊이 데이터의 부호화를 위한 인루프 뷰 합성 예측기(VSP, 220)를 포함할 수 있다.

본 발명의 일실시예서는 현재 View의 특정 블록의 디블록킹 필터 강도를 현재 View와 공간적으로 다른 시점의 카메라에 의해 촬영된 참조 view의 대응되는 블록의 디블록킹 필터 강도를 이용하여 구할 수 있다.

도 7은 본 발명의 일 실시예에 따른 멀티 뷰 영상에 대한 인-루프 필터링 방법을 설명하기 위한 순서도이다.

도 7을 참조하면, 현재 View의 특정 블록에 대하여 공간적으로 다른 시점의 카메라에 의해 촬영된 참조 View의 대응되는 블록을 참조하고(단계 201), 현재 View의 특정 블록과 상기 참조 View의 대응되는 블록과의 거리 및 각도를 고려하여 상기 거리 및 각도에 따른 스케일링을 수행하여 현재 View의 특정 블록의 디블록킹 강도를 설정한다(단계 220).

구체적으로, 현재 View의 특정 블록의 디블록킹 필터 강도를 결정할 경우, 공간적으로 현재 View에 대한 참조 View의 대응되는 블록을 참조하여 현재 View의 특정 블록과 상기 참조 View의 대응되는 블록과의 거리 및 각도를 고려하여 상기 거리 및 각도에 따른 스케일링을 수행하여 현재 View의 특정 블록의 디블록킹 강도를 설정할 수 있다. 예를 들어, 시간적으로 View 1, 2, 3 중에서 현재 View가 View 2이고, 현재 View의 참조 View가 View 1, View 3인 경우, 현재 View의 특정 블록의 디블록킹 강도는 상기 참조 View인 View 1의 대응되는 블록을 참조하여 현재 View의 특정 블록과 상기 View 1의 대응되는 블록간의 거리 및 각도를 고려하여 상기 거리 및 각도에 따른 스케일링을 수행하여 현재 View의 특정 블록의 디블록킹 강도를 설정할 수 있다. 예를 들어, 참조 View의 대응되는 블록의 디블록킹 강도가 p이고, 상기 스케일링시 스케일링 계수가 1/2이라고 가정할 때, 현재 View의 특정 블록의 디블록킹 강도는 p/2가 될 수 있다. 참조 View의 대응되는 블록의 디블록킹 강도가 p이고, 상기 스케일링시 스케일링 계수가 1/4이라고 가정할 때, 현재 View의 특정 블록의 디블록킹 강도는 p/4가 될 수 있다.

상기와 같이 현재 View의 특정 블록과 상기 참조 View의 대응되는 블록과의 거리 및 각도를 고려하여 상기 거리 및 각도에 따른 스케일링을 수행하여 현재 View의 특정 블록의 디블록킹 강도를 설정함으로써 멀티 뷰 영상의 부호화 및 복호화의 경우 디블록킹 처리시 복잡도를 줄일 수 있다.

또는, 본 발명의 다른 실시예에 따른 멀티 뷰 영상에 대한 디블록킹 방법에 따르면, 현재 View의 특정 블록의 디블록킹 필터 강도를 결정할 경우, 현재 View의 특정 블록 보다 시간적으로 이전 또는 이후의 참조 픽춰의 대응되는 블록을 참조하여 현재 View의 특정 블록과 상기 참조 픽춰의 대응되는 블록과의 거리 및 각도를 고려하여 상기 거리 및 각도에 따른 스케일링을 수행하여 현재 View의 특정 블록의 디블록킹 강도를 설정할 수 있다.

도 8을 참조하면, 현재 View의 특정 블록에 대하여 시간적으로 이전 또는 이후의 참조 View의 대응되는 블록을 참조하고(단계 301), 현재 View의 특정 블록과 상기 참조 View의 대응되는 블록과의 거리 및 각도를 고려하여 상기 거리 및 각도에 따른 스케일링을 수행하여 현재 View의 특정 블록의 디블록킹 강도를 설정한다(단계 320).

전술한 인-루프 필터링 방법 또는 디블록킹 방법은 멀티뷰 영상의 복호화기에 적용되어 복호화기의 복잡도를 줄일 수 있다.

멀티 뷰 영상의 중간 깊이 뷰 합성 방법

멀티뷰 영상의 부호화 및 복호화의 경우 멀티뷰 영상 데이터(또는 텍스처(texture))는 모든 뷰에 대하여 부호화기에서 복호화기로 전송될 경우 디코더로 전송되는 데이터가 증가하여 부호화 효율이 저하되므로, 모든 뷰에 대하여 전송하지 않고 복수개의 뷰 중에 일부의 뷰는 전송하지 않고 복호화기로 전송된 적어도 2개의 뷰를 이용하여 중간 뷰 합성을 통하여 구할 수 있다.

도 9에 도시된 바와 같이, View 1, 2, 3에 대하여 View 1, 3의 텍스쳐 뷰(texture view)가 부호화기로부터 복호화기로 전송되고, View 2의 텍스쳐 뷰는 부호화기로부터 복호화기로 전송하지 않고 이미 복호화기로 전송된 View 1 및 3의 텍스쳐 뷰를 이용하여 구할 수 있다. 예를 들어, 복호화기로 전송된 View 1 및 3의 2개의 텍스쳐 뷰를 직접 이용하여 평균을 구하거나 또는 거리에 따른 보간(interpolation)을 통하여 구하거나 또는 거리 및 각도에 따라 소정의 스케일링을 통하여 구할 수 있다.

한편, 멀티뷰 영상의 부호화 및 복호화의 경우, 깊이 뷰(depth view)는 모든 뷰에 대하여 부호화기에서 복호화기로 전송될 경우 디코더로 전송되는 데이터가 증가하여 부호화 효율이 저하되므로, 모든 뷰에 대하여 전송하지 않고 복수개의 깊이 뷰 중에 일부의 깊이 뷰는 전송하지 않고 복호화기로 전송된 적어도 1개의 깊이 뷰를 이용하여 중간 깊이 뷰 합성을 통하여 구할 수 있다.

도 10에 도시된 바와 같이, View 1, 2, 3에 대하여 View 1, 3의 깊이 뷰(depth view)가 부호화기로부터 복호화기로 전송되고, View 2의 텍스쳐 뷰는 부호화기로부터 복호화기로 전송하지 않고 이미 복호화기로 전송된 View 1 및 3의 깊이 뷰를 이용하여 구할 수 있다. 예를 들어, 복호화기로 전송된 View 1 및 3의 깊이 뷰를 모두 이용하여 평균을 구하거나 또는 거리에 따른 보간(interpolation)을 통하여 구하거나 또는 거리 및 각도에 따라 소정의 스케일링을 통하여 구할 수 있다.

도 9에 도시된 바와 같이, View 1 및 3의 텍스쳐 뷰가 부호화기에서 복호화기로 전송되고, View 2의 텍스쳐 뷰는 부호화기에서 복호화기로 전송하지 않고 복호화기로 전송된 View 1 및 3의 텍스쳐 뷰를 이용하여 중간 뷰 합성을 통하여 구하는 경우, 본 발명의 일 실시예에서는 부호화기에서 복호화기로 전송되는 깊이 뷰 데이터량을 줄임으로서 복호화기로 전송되는 데이터를 감소시켜 부호화 효율을 높일 수 있도록 복호화기로 이미 전송된 1개의 깊이 View와 상기 중간 뷰 합성을 통하여 생성된 텍스쳐 View 3를 이용하여 View 2의 깊이 뷰를 구할 수 있다.

먼저, 도 9에 도시된 바와 같이 부호화기에서 복호화기로 전송된 View 1 및 3의 텍스쳐 뷰를 이용하여 중간 뷰 합성을 통하여 View 2의 텍스쳐 뷰가 구해진 경우를 가정한다. 도 11을 참조하면, 상기 가정하에서 View 1, 2 및 3 중에서 View 1의 깊이 뷰(depth view)가 부호화기로부터 복호화기로 전송되고, View 2의 깊이 뷰는 이미 복호화기로 전송된 View 1의 깊이 뷰와 상기 중간 뷰 합성을 통해 얻어진 View 2의 텍스쳐 뷰를 이용하여 구할 수 있다. 구체적으로, 도 11에 도시된 바와 같이 View 1에 대하여 텍스쳐 뷰와 깊이 뷰는 부호화기로부터 복호화기로 전송되어 있고 도 9의 중간 뷰 합성을 통해 View 2의 텍스쳐 뷰는 얻어진 상태에서, View 1의 텍스쳐 뷰와 View 2의 텍스쳐 뷰간의 위치, 거리 및/또는 각도를 이용하여 View 1의 깊이 뷰로부터 View 2의 깊이 뷰를 예측하여 구할 수 있다. 예를 들어, View 1의 텍스쳐 뷰와 View 2의 텍스쳐 뷰간의 위치, 거리 및/또는 각도 관계로부터 View 1의 깊이 뷰와 View 2의 깊이 뷰간의 위치, 거리 및/또는 각도를 유추하여 평균을 구하거나 또는 거리에 따른 보간(interpolation)을 통하여 구하거나 또는 거리 및 각도에 따라 소정의 스케일링을 통하여 View 2의 깊이 뷰를 예측하여 구할 수 있다.

먼저, 도 9에 도시된 바와 같이 부호화기에서 복호화기로 전송된 View 1 및 3의 텍스쳐 뷰를 이용하여 중간 뷰 합성을 통하여 View 2의 텍스쳐 뷰가 구해진 경우를 가정한다. 도 12를 참조하면, 상기 가정하에서 View 1, 2 및 3 중에서 View 3의 깊이 뷰(depth view)가 부호화기로부터 복호화기로 전송되고, View 2의 깊이 뷰는 이미 복호화기로 전송된 View 3의 깊이 뷰와 상기 중간 뷰 합성을 통해 얻어진 View 2의 텍스쳐 뷰를 이용하여 구할 수 있다. 구체적으로, 도 12에 도시된 바와 같이 View 3에 대하여 텍스쳐 뷰와 깊이 뷰는 부호화기로부터 복호화기로 전송되어 있고 도 9의 중간 뷰 합성을 통해 View 2의 텍스쳐 뷰는 얻어진 상태에서, View 3의 텍스쳐 뷰와 View 2의 텍스쳐 뷰간의 위치, 거리 및/또는 각도를 이용하여 View 3의 깊이 뷰로부터 View 2의 깊이 뷰를 예측하여 구할 수 있다. 예를 들어, View 3의 텍스쳐 뷰와 View 2의 텍스쳐 뷰간의 위치, 거리 및/또는 각도 관계로부터 View 3의 깊이 뷰와 View 2의 깊이 뷰간의 위치, 거리 및/또는 각도를 유추하여 평균을 구하거나 또는 거리에 따른 보간(interpolation)을 통하여 구하거나 또는 거리 및 각도에 따라 소정의 스케일링을 통하여 View 2의 깊이 뷰를 예측하여 구할 수 있다.

먼저, 도 9에 도시된 바와 같이 부호화기에서 복호화기로 전송된 View 1 및 3의 텍스쳐 뷰를 이용하여 중간 뷰 합성을 통하여 View 2의 텍스쳐 뷰가 구해진 경우를 가정한다. 도 13을 참조하면, 상기 가정하에서 View 1, 2 및 3 중에서 View 3의 깊이 뷰(depth view)가 부호화기로부터 복호화기로 전송되고, View 2의 깊이 뷰는 이미 복호화기로 전송된 View 3의 깊이 뷰와 상기 부호화기에서 복호화기로 전송된 View 1 및 3의 텍스쳐 뷰를 이용하여 구할 수도 있다. 구체적으로, 도 13에 도시된 바와 같이 View 3에 대하여 텍스쳐 뷰와 깊이 뷰는 부호화기로부터 복호화기로 전송되어 있고 도 9와 같이 View 1의 텍스쳐 뷰도 얻어진 상태에서, View 3의 텍스쳐 뷰와 View 1의 텍스쳐 뷰간의 위치, 거리 및/또는 각도를 이용하여 View 2의 깊이 뷰를 예측하여 구할 수 있다. 예를 들어, View 3의 텍스쳐 뷰와 View 1의 텍스쳐 뷰간의 위치, 거리 및/또는 각도 관계로부터 View 3의 깊이 뷰와 View 2의 깊이 뷰간의 위치, 거리 및/또는 각도를 유추하여 거리에 따른 보간(interpolation)을 통하여 구하거나 또는 거리 및 각도에 따라 소정의 스케일링을 통하여 View 2의 깊이 뷰를 예측하여 구할 수 있다.

한편, 전술한 도 9 내지 도 12의 본 발명의 실시예들에서 View 2의 깊이 뷰에 대한 움직임 정보(또는 움직임 파라미터)는 View 2의 텍스쳐 뷰 컴포넌트의 대응되는(co-located) 블록의 움직임 정보를 재사용할 수 있다. 움직임 정보(또는 움직임 파라미터)는 블록 타입(매크로 블록 타입, 서브 매크롤 블록 타입), 참조 픽춰 인덱스, 후보 움직임벡터 리스트, 또는 움직임 벡터를 포함 할 수 있다. 이 경우, 소정의 플래그를 부호화기에서 복호화기로 시그널링하여 상기와 같은 깊이 뷰의 움직임 정보를 상기 깊이 뷰와 동일한 뷰의 텍스쳐 뷰내 대응되는 블록의 움직임 정보를 재이용함을 복호화기로 알려줄 수 있으며, 복호화기에서는 상기 플래그를 수신할 경우, 상기와 같이 깊이 뷰의 움직임 정보를 상기 깊이 뷰와 동일한 뷰의 텍스쳐 뷰내 대응되는 블록의 움직임 정보를 재이용할 수 있다.

도 14를 참조하면, 본 발명의 일실시예에 따른 부호화기는 제1 부호화부(100) 및 제2 부호화부(200)으로 구성된다. 제1 부호화부(100)는 기존의 H.264/AVC의 부호화기의 구성과 동일한 구성을 가지고 입력 영상 X를 움직임 보상부(115), 움직임 추정부(121)을 이용하여 화면내 예측 및 화면간 예측을 수행하고, 변환부(101), 양자화부(103), 역양자화부(105), 역변환부(107), 엔트로피 부호화부(131, 133)를 통하여 부호화된 영상 데이터를 비트 스트림으로 복호화기로 전송한다. 도 14의 제1 부호화부(100)는 기존의 H.264/AVC의 부호화기의 구성과 동일한 구성을 가지므로 자세한 설명은 생략한다.

제2 부호화부(200)는 멀티뷰 영상의 복호화된 깊이 픽춰를 기반으로 움직임 벡터 예측을 수행하는 깊이 기반 움직임 벡터 예측부(Depth-based motion vector prediction(D-MVP); 210)와, 복호화된 텍스처 픽춰와 복호화된 깊이 픽춰를 이용하여 텍스쳐 데이터와 깊이 데이터의 부호화를 위한 뷰 합성 예측기(View Synthesis Prediction(VSP), 220)를 포함할 수 있다.

전술한 바와 같은 본 발명의 실시예들에 따른 복호화기로 전송된 1개의 깊이 뷰를 이용하여 복호화기에서 중간 깊이 뷰를 합성하는 과정은 도면에는 도시되지 않았으나, 복호기의 뷰 합성 예측기(View Synthesis Prediction(VSP))에서 수행될 수 있다.

이상 도면 및 실시예를 참조하여 설명하였지만, 본 발명의 보호범위가 상기 도면 또는 실시예에 의해 한정되는 것을 의미하지는 않으며 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

Claims

3차원 영상에서 현재 예측 유닛에 대한 부호화 방법에 있어서,

상기 현재 예측 유닛의 이미 부호화된 주변 블록 중에서 상기 현재 예측 유닛과 동일한 그룹 및 동일한 깊이 중 적어도 하나를 만족하는 주변 블록의 움직임 벡터를 상기 현재 예측 유닛의 후보 예측 움직임 벡터로 선정하는 단계;

상기 후보 예측 움직임 벡터를 기반으로 화면간 예측(inter prediction)을 수행하여 상기 현재 예측 유닛의 움직임 벡터를 예측하여 복호화기로 전송하는 단계를 포함하는 것을 특징으로 하는 3차원 영상 부호화 방법.
3차원 영상에서 현재 예측 유닛에 대한 복호화 방법에 있어서,

수신된 비트 스트림을 엔트로피 복호화하고 역양자화 및 역변환을 수행하는 단계;

상기 역변환된 비트 스트림을 기반으로 상기 현재 예측 유닛의 이미 부호화된 주변 블록 중에서 상기 현재 예측 유닛과 동일한 그룹 및 동일한 깊이 중 적어도 하나를 만족하는 주변 블록의 움직임 벡터를 상기 현재 예측 유닛의 후보 예측 움직임 벡터로 선정하는 단계;

상기 후보 예측 움직임 벡터를 기반으로 화면간 예측(inter prediction)을 수행하여 상기 현재 예측 유닛의 움직임 벡터를 예측하여 영상을 복원하는 단계를 포함하는 것을 특징으로 하는 3차원 영상 복호화 방법.
현재 뷰의 특정 블록에 대하여 참조 뷰의 대응되는 블록을 참조하는 단계; 및

상기 현재 뷰의 특정 블록과 상기 참조 뷰의 대응되는 블록과의 거리를 고려하여 상기 거리에 따른 스케일링을 수행하여 현재 뷰의 특정 블록의 디블록킹 강도를 설정하는 단계를 포함하는 것을 특징으로 하는 멀티 뷰 영상에 대한 인-루프 필터링 방법.
제 1 뷰, 제2 뷰, 제3 뷰에 대하여 각각 텍스쳐 뷰와 깊이 뷰를 가지는 멀티 뷰 영상에 대하여 복호화기에서 수행되는 중간 깊이 뷰 합성 방법에 있어서,

부호화기로부터 수신한 상기 제1 뷰의 텍스쳐 뷰 및 제3 뷰의 텍스쳐 뷰에 대하여 중간 뷰 합성을 수행하는 단계; 및

상기 중간 뷰 합성을 통하여 상기 제1 뷰의 텍스쳐 뷰 및 제3 뷰의 텍스쳐 뷰로부터 상기 제2 뷰의 텍스쳐 뷰를 구하는 단계를 포함하는 것을 특징으로 하는 멀티 뷰 영상에 대한 중간 깊이 뷰 합성 방법.
제1항에 있어서,

상기 부호화기로부터 수신한 상기 제1 뷰의 깊이 뷰 및 제3 뷰의 깊이 뷰 중 하나와 상기 중간 뷰 합성을 통하여 생성된 상기 제2 뷰의 텍스쳐를 이용하여 상기 제2 뷰의 깊이 뷰를 구하는 단계를 더 포함하는 것을 특징으로 하는 멀티 뷰 영상에 대한 중간 깊이 뷰 합성 방법.
제1항에 있어서, 상기 제2 뷰의 깊이 뷰에 대한 움직임 정보는 상기 제2 뷰의 텍스쳐 뷰 컴포넌트의 대응되는(co-located) 블록의 움직임 정보를 재사용하는 것을 특징으로 하는 멀티 뷰 영상에 대한 중간 깊이 뷰 합성 방법.
제3항에 있어서, 상기 부호화기로부터 소정의 플래그가 수신된 경우 상기 제2 뷰의 깊이 뷰에 대한 움직임 정보로서 상기 제2 뷰의 텍스쳐 뷰 컴포넌트의 대응되는(co-located) 블록의 움직임 정보를 재사용하는 것을 특징으로 하는 멀티 뷰 영상에 대한 중간 깊이 뷰 합성 방법.