WO2011122731A1

WO2011122731A1 - 멀티채널 오디오의 다운믹스 방법 및 장치

Info

Publication number: WO2011122731A1
Application number: PCT/KR2010/002549
Authority: WO
Inventors: 문한길; 이철우
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2010-03-29
Filing date: 2010-04-23
Publication date: 2011-10-06
Anticipated expiration: 2012-09-29
Also published as: US20130077793A1; KR101641685B1; US9478223B2; KR20110108730A

Abstract

채널들 사이의 상관도 계산에 기초해 다운믹스할 채널들을 선택하여 다운믹스하는 멀티채널 오디오의 다운믹스 방법 및 장치가 개시된다.

Description

멀티채널 오디오의 다운믹스 방법 및 장치

본 발명은 오디오 신호를 다운믹스하는 방법 및 장치에 관한 것으로 보다 상세히는 멀티채널 오디오를 보다 효율적으로 다운믹스하는 방법 및 장치에 관한 것이다.

일반적으로 멀티채널 오디오를 부호화하는 방법에는 웨이브폼(waveform) 오디오 코딩와 파라메트릭(parametric) 오디오 코딩이 있다. 웨이브폼 부호화에는 MPEG-2 MC 오디오 코딩, AAC MC 오디오 코딩 및 BSAC/AVS MC 오디오 코딩 등이 있다.

파라메트릭 오디오 코딩에서는 오디오 신호를 주파수, 진폭과 같은 성분으로 분해하고 이러한 주파수, 진폭 등에 대한 정보를 파라미터화하여 오디오 신호를 부호화한다.

파라메트릭 오디오 코딩에서는 스테레오 오디오의 촤채널 및 우채널 오디오를 다운믹스하여 모노채널 오디오를 생성하고, 생성된 모노채널 오디오를 부호화한다. 이 때, 모노채널 오디오를 다시 스테레오채널 오디오로 복원하는데 필요한 정보들도 함께 부호화함으로써, 오디오를 복호화하는 측에서 모노채널 오디오로부터 스테레오채널 오디오를 복원할 수 있게 한다.

본 발명은 멀티채널 오디오를 보다 효율적으로 다운믹스하여 부호화, 복호화하는 방법 및 장치를 제공하고, 상기 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공한다.

본 발명의 일 실시예에 따르면, 채널들 사이의 상관도에 기초해 상관도가 높은 채널들끼리 다운믹스함으로써, 보다 높은 압축률로 멀티채널 오디오를 부호화할 수 있다.

도 1은 본 발명의 일 실시예에 따른 멀티채널 오디오를 부호화하는 장치를 도시한다.

도 2는 파라메트릭 오디오 코딩에서의 서브 밴드들을 도시한다.

도 3은 본 발명의 일 실시예에 따른 다운믹스된 채널의 세기를 결정하기 위한 정보를 생성하는 방법을 도시한다.

도 4는 본 발명의 일 실시예에 따른 멀티채널 오디오를 도시한다.

도 5는 본 발명의 일 실시예에 따른 인접한 채널들을 도시한다.

도 6은 본 발명의 또 다른 실시예에 따른 인접한 채널들을 도시한다.

도 7은 본 발명의 일 실시예에 따른 다운믹스 그룹을 도시한다.

도 8은 본 발명의 일 실시예에 따른 멀티채널 오디오를 복호화하는 장치를 도시한다.

도 9는 본 발명의 일 실시예에 따른 멀티채널 오디오를 부호화하는 방법을 설명하기 위한 흐름도이다.

도 10은 본 발명의 일 실시예에 따른 다운믹스 방법을 설명하기 위한 흐름도이다.

도 11은 본 발명의 일 실시예에 따른 멀티채널 오디오를 복호화하는 방법을 설명하기 위한 흐름도이다.

상기 기술적 과제를 해결하기 위한 본 발명의 일 실시예에 따른 멀티채널 오디오를 다운믹스(down-mix)하는 방법은 상기 멀티채널 오디오의 채널들 사이의 상관도를 계산하는 단계; 상기 계산된 상관도에 기초해 다운믹스할 제1 채널 및 제2 채널을 선택하는 단계; 및 상기 선택된 제1 채널과 상기 제2 채널을 다운믹스하는 단계를 포함한다.

본 발명의 또 다른 실시예에 따르면, 상기 상관도를 계산하는 단계는 프레임마다 채널들 사이의 교차 상관도(cross correlation)를 계산하는 단계를 포함한다.

본 발명의 또 다른 실시예에 따르면, 상기 교차 상관도를 계산하는 단계는 프레임마다 공간적으로 인접한 위치에 배치된 채널들 사이의 교차 상관도를 계산하는 단계를 포함한다.

본 발명의 또 다른 실시예에 따르면, 상기 제1 채널 및 제2 채널을 선택하는 단계는 상기 교차 상관도의 계산 결과, 교차 상관도가 가장 큰 두 개의 채널을 상기 제1 채널 및 제2 채널로 선택하는 단계를 포함한다.

본 발명의 또 다른 실시예에 따르면, 상기 제1 채널 및 제2 채널을 선택하는 단계는 상기 교차 상관도의 계산 결과, 교차 상관도가 가장 큰 두 개의 채널이 두 쌍 이상이면, 다운믹스되어 생성된 오디오 신호에서 다운믹스 전 채널들을 복원하기 위해 필요한 적어도 하나의 부가정보를 가장 높은 압축률로 부호화할 수 있는 두 개의 채널을 상기 제1 채널 및 제2 채널로 선택하는 단계를 포함한다.

본 발명의 또 다른 실시예에 따르면, 상기 적어도 하나의 부가정보는 다운믹스 전 두 개의 채널의 세기를 복원하기 위해 필요한 부가정보를 포함한다.

본 발명의 또 다른 실시예에 따르면, 상기 다운믹스 방법은 상기 제1 채널과 제2 채널의 다운믹스 결과 생성된 모노채널 및 상기 제1 채널 및 상기 제2 채널을 제외한 다른 채널들 사이의 상관도를 계산하는 단계; 상기 계산된 상관도에 기초해 다운믹스할 제3 채널 및 제4 채널을 선택하는 단계; 및 상기 선택된 제3 채널 및 제4 채널을 다운믹스하는 단계를 더 포함한다.

본 발명의 또 다른 실시예에 따르면, 상기 다운믹스 방법은 상기 제1 채널과 제2 채널의 다운믹스 결과 생성된 모노채널과 상기 제1 채널 및 상기 제2 채널을 제외한 다른 채널들 사이의 상관도를 계산하는 단계; 상기 계산된 상관도에 기초해 상기 모노채널과 함께 다운믹스할 제3 채널을 선택하는 단계; 및 상기 모노채널 및 상기 선택된 제3 채널을 다운믹스하는 단계를 더 포함한다.

상기 기술적 과제를 해결하기 위한 본 발명의 일 실시예에 따른 멀티채널 오디오를 다운믹스(down-mix)하는 장치는 상기 멀티채널 오디오의 채널들 사이의 상관도를 계산하고, 상기 계산된 상관도에 기초해 다운믹스할 제1 채널 및 제2 채널을 선택하는 제어부; 및 상기 선택된 제1 채널과 상기 제2 채널을 다운믹스하는 다운믹스부를 포함한다.

상기 기술적 과제를 해결하기 위해 본 발명의 일 실시예는 상기된 다운믹스 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공한다.

이하에서는 도면을 참조하여 본 발명의 바람직한 실시예들을 상세히 설명한다.

도 1은 본 발명의 일 실시예에 따른 멀티채널 오디오를 부호화하는 장치를 도시한다. 도 1은 본 발명의 일 실시예에 따른 다운믹스 장치(110)를 포함하는 멀티채널 오디오 부호화 장치(100)를 도시한다.

도 1을 참조하면, 본 발명의 일 실시예에 따른 멀티채널 오디오 부호화 장치(100)는 제어부(112), 다운믹스부(114), 부가정보생성부(120) 및 부호화부(130)를 포함한다.

다운믹스 장치(110)는 N개의 멀티채널 오디오(Ch.1 내지 Ch.N)를 수신하고, 수신된 멀티채널 오디오를 다운믹스한다. N 채널 오디오를 다운믹스하여 하나의 모노채널 오디오를 생성할 수도 있고, N 보다 작은 M 채널 오디오를 생성할 수도 있다. 예를 들어, N 채널 오디오를 다운믹스하여 2.1 채널 오디오 또는 5.1 채널 오디오에 대응되도록 3개 채널의 오디오 또는 6개 채널의 오디오로 다운믹스할 수도 있다.

본 발명의 일 실시예에 따르면, N 채널에서 두 채널을 선택하고 다운믹스하여 제1 모노채널을 생성하고, 생성된 제1 모노채널과 다른 채널을 다시 다운믹스하여 제2 모노채널을 생성한다. 다운믹스 결과 생성되는 모노채널에 다른 채널을 추가하여 다운믹스하는 과정을 반복하여 최종 모노채널 오디오 또는 M 채널 오디오를 생성할 수도 있다.

N 채널 오디오를 다운믹스함에 있어, 엔트로피를 최소화하여 다운믹스하기 위해서는 유사한 채널을 다운믹스하는 것이 바람직하다. 따라서, 본 발명의 일 실시예는 상관도가 높은 채널들끼리 다운믹스함으로써 보다 높을 압축률로 멀티채널 오디오를 다운믹스한다.

제어부(112)는 멀티채널 오디오에서 다운믹스할 채널을 순차적으로 선택한다. 채널들 사이의 상관도를 계산하여 상관도가 높은 두 채널을 선택한다. 도 4 내지 6을 참조하여 상세히 후술한다.

다운믹스부(114)는 제어부(112)가 상관도 계산에 기초해 선택한 채널들을 순차적으로 다운믹스한다. 멀티채널 중 상관도 계산에 기초해 제어부(112)가 선택한 두 채널을 다운믹스하여 제1 모노채널을 생성하고, 제어부(112)가 제1 모노채널과 다운믹스되지 않은 채널들 사이의 상관도 계산에 기초해 또 다른 채널을 제1 모노채널과 다운믹스한다. 제어부(112)가 상관도 계산에 기초해 반복적으로 채널을 선택하면, 모노채널과의 다운믹스를 반복하여 최종 모노채널 오디오 또는 M 채널 오디오를 생성한다.

복수의 기준 채널에 기초해 다운믹스할 채널을 선택하는 경우에는 복수의 기준 채널 각각에 대해 제어부(112)가 선택한 채널을 다운믹스한다. 또한, 후술하는 도 7에 도시된 바와 같이 멀티채널을 공간적인 배치에 기초해 그룹화하였다면, 제어부(112)의 선택에 기초해 각각의 그룹에 포함된 채널들끼리 다운믹스를 반복하여 모노채널을 생성한다.

부가정보생성부(120)는 다운믹스된 채널에서 멀티채널을 복원하기 위해 필요한 부가정보를 생성한다. 다운믹스부(114)가 멀티채널을 순차적으로 다운믹스할 때마다, 다운믹스된 채널에서 멀티채널을 복원하기 위해 필요한 부가정보를 생성한다. 다운믹스된 두개의 채널의 세기를 결정하기 위한 정보 및 두개의 채널의 위상을 결정하기 위한 정보를 생성한다.

또한, 부가정보생성부(120)는 다운믹스가 진행될 때마다, 어떤 채널들이 다운믹스되었는지 나타내는 정보를 생성한다. 고정된 순서에 따라 다운믹스가 진행되는 것이 아니라, 상관도 계산에 기초해 제어부(112)가 선택한 채널이 순차적으로 다운믹스되므로, 채널들의 다운믹스 순서를 부가정보로서 생성한다.

부가정보생성부(120)는 다운믹스가 계속될 때마다 모노채널에서 다운믹스된 채널을 복원하기 위해 필요한 정보들의 생성을 반복한다. 예를 들어, 22개의 채널을 21회 반복하여 순차적으로 다운믹스하여 하나의 모노채널을 생성한다면, 다운믹스 순서에 대한 정보, 채널의 세기를 결정하기 위한 정보 및 채널의 위상을 결정하기 위한 정보가 각각 21회씩 생성된다. 또한, 본 발명의 일 실시예에 따르면, 후술하는 바와 같이 채널의 세기를 결정하기 위한 정보 및 채널의 위상을 결정하기 위한 정보를 복수의 서브밴드 각각에 대해 생성할 수 있으므로, 서브밴드의 개수가 k라고 하면, 채널의 세기를 결정하기 위한 정보가 21*k개 생성되고, 채널의 위상을 결정하기 위한 정보 21*k개 생성된다.

채널의 세기를 결정하기 위한 정보 및 채널의 위상을 결정하기 위한 정보에 대해 도 2 및 3을 참조하여 보다 상세히 설명한다.

(1) 세기를 결정하기 위한 정보

파라메트릭 오디오 코딩에서는 각각의 채널 오디오를 주파수 도메인으로 변환하여 주파수 도메인에서 채널 오디오 각각의 세기 및 위상에 대한 정보를 부호화할 수 있다. 도 2를 참조하여 상세히 설명한다.

도 2는 오디오 신호의 프레임을 주파수 도메인으로 변환한 주파수 스펙트럼을 도시한다. 소정 채널의 오디오 신호를 고속 푸리에 변환(Fast Fourier Transform)하면, 오디오 신호는 주파수 도메인에서 이산(discrete)된 값들에 의해 표현될 수 있다. 즉, 오디오 신호는 복수의 정현파들의 합으로 표현될 수 있다.

파라메트릭 오디오 코딩에서는 오디오 신호가 주파수 도메인으로 변환되면, 주파수 도메인을 복수의 서브 밴드들로 분할하고, 각각의 서브 밴드들에서의 다운믹스된 두 개 채널의 세기를 결정하기 위한 정보 및 두 개 채널의 위상을 결정하기 위한 정보를 부호화한다. 이때, 서브 밴드 s에서의 세기 및 위상에 대한 부가정보들을 부호화한 후에, 마찬가지로 서브 밴드 s+1에서의 세기 및 위상에 대한 부가정보들을 부호화한다. 서브 밴드마다 세기 및 위상에 대한 부가정보들을 생성하고, 부호화함으로써 복호화하는 측에서 모노채널 오디오의 주파수 스팩트럼으로부터 다운믹스 전 채널들을 복원할 수 있게 한다.

채널 p 및 채널 q를 다운믹스하여 모노채널을 생성한다고 가정했을 때, 본 발명의 일실시예에 따른 오디오 부호화 방법은 서브 밴드 s에서 채널 p과 채널 q의 세기를 결정하기 위한 정보로서 부호화되는 부가정보들의 개수를 최소화하기 위하여 서브 밴드 s에서 채널 p의 세기에 대한 벡터 및 채널 p의 세기에 대한 벡터를 이용한다. 여기서, 채널 p를 주파수 도메인으로 변환한 주파수 스펙트럼의 주파수 f1, f2, ... , fn에서 세기들의 평균값이 서브 밴드 s에서 채널 p의 세기이고, 채널 p를 주파수 도메인으로 변환한 주파수 스펙트럼의 주파수 f1, f2, ... , fn에서 세기들의 평균값이 서브 밴드 s에서 채널 q의 세기이다.

도 3을 참조하면, 다운믹스를 수행하여 생성된 모노채널의 서브 밴드 s에서의 세기는 서브 밴드 s에서 채널 p의 세기에 대한 벡터 및 서브 밴드 s에서 채널 q의 세기에 대한 벡터가 소정의 각도(예를 들어, 90도)를 이루도록 생성된 2차원 벡터 공간에서 채널 p의 세기에 대한 벡터 및 채널 q의 세기에 대한 벡터의 합으로 표시된다. 모노채널의 세기는 모노채널 오디오의 주파수 스펙트럼으로부터 구할 수 있으므로, θI만 부가정보로 부호화하면, 복호화하는 측은 서브밴드 s에서 채널 p 및 채널 q의 세기를 모두 구할 수 있다.

부가정보생성부(120)는 동일한 방법으로 다른 서브밴드들에 대해서도 다운믹스 결과 생성된 모노채널의 세기에 대한 벡터와 채널 p의 세기에 대한 벡터 사이의 각도 또는 모노채널의 세기에 대한 벡터와 채널 q의 세기에 대한 벡터 사이의 각도에 대한 정보를 다운믹스된 두 채널의 세기를 결정하기 위한 정보로서 생성한다.

(2) 위상을 결정하기 위한 정보

본 발명의 일실시예에 따른 오디오 부호화 방법에 따르면, 부가정보 생성부(120)는 서브밴드 s에서 채널 p와 채널 q의 위상을 결정하기 위한 정보로서 서브 밴드 s에서 채널 p와 채널 q 사이의 위상 차이에 대한 정보를 생성한다.

본 발명의 일실시예에 따르면, 다운믹스부(114)가 채널 p와 채널 q를 다운믹스할 때, 채널 p의 위상과 채널 q의 위상이 동일해지도록, 채널 q의 위상을 조절하여 다운믹스한다. 채널 p의 위상과 동일하게 위상 조절된 채널 q를 생성하고, 채널 p와 위상 조절된 채널 q를 다운믹스한다. 따라서, 다운믹스 결과 생성된 모노채널의 위상은 채널 p의 위상과 동일하므로, 부가정보생성부(120)가 채널 p의 위상과 위상 조절 전의 채널 q의 위상 사이의 차이에 대한 정보만 생성하면, 복호화하는 측에서는 모노채널의 위상으로부터 채널 p의 위상 및 채널 q의 위상을 결정할 수 있다.

서브 밴드 s를 예로 들어 설명하면, 다운믹스부(114)는 주파수 f1, f2, ... , fn에서 채널 q의 위상을 주파수 f1, f2, ... , fn에서 채널 p의 위상과 동일해지도록 각각 조절한다. 주파수 f1에서 채널 q의 위상을 조절하는 경우를 예로 들어 설명하면, 주파수 f1에서 채널 p가 |Ch1|e^{i(2πf1t+θ1)}로 표시되고, 채널 q가 |Ch2|e^{i(2πf1t+θ2)}로 표시되면, 주파수 f1에서 위상 조절된 채널 q(Ch2')는 다음 수학식 1에 의해 구해질 수 있다. θ1은 주파수 f1에서 채널 p의 위상이고, θ2는 주파수 f1에서 채널 q의 위상이다.

수학식 1

수학식 1에 의해 주파수 f1에서 채널 q의 위상은 채널 p의 위상과 동일해진다. 이와 같은 위상 조절은 서브 밴드 k의 다른 주파수들 즉, f2, f3, ... , fn에서 채널 q에 대해 반복하여 서브 밴드 s에서 위상 조절된 채널 q가 생성된다.

서브 밴드 s에서 위상 조절된 채널 q는 채널 p의 위상과 동일하므로, 채널 p와 채널 q의 위상 차이인 'θ1-θ2'만 부호화하면, 다운믹스된 오디오를 복호화하는 측에서 채널 q의 위상을 구할 수 있다. 또한, 채널 p의 위상과 다운믹스부(114)에서 생성된 모노채널의 위상은 동일하므로, 별도로 채널 p의 위상에 대한 정보를 부호화할 필요가 없다.

한편, 전술한 서브 밴드 s에서 채널 오디오들의 세기 벡터를 이용해 채널 p와 채널 q의 세기를 결정하기 위한 정보를 부호화하는 방법과, 위상 조절을 이용해 서브 밴드 s에서 채널 p와 채널 q의 위상을 결정하기 위한 정보를 부호화하는 방법은 각각 독립적으로 이용될 수도 있고 조합되어 이용될 수 있다.

다시 말해, 다운믹스된 채널들의 세기를 결정하기 위한 정보는 본 발명에 따라 벡터를 이용해 부호화하고, 다운믹스된 채널들의 위상을 결정하기 위한 정보는 종래 기술에 따라 부호화할 수 있다. 반대로, 다운믹스된 채널들의 세기를 결정하기 위한 정보는 종래 기술에 따라 부호화하고, 다운믹스된 채널들의 위상을 결정하기 위한 정보만 본 발명에 따라 부호화할 수도 있다. 물론, 본 발명에 따른 두 가지 방법을 모두 이용하여 다운믹스된 채널들의 세기 및 위상을 결정하기 위한 정보를 부호화할 수도 있다.

다시 도 1을 참조하면, 부호화부(130)는 다운믹스부(114)에서 다운믹스되어 생성된 하나의 모노채널 오디오 또는 M 채널 오디오를 부호화한다. 다운믹스부(114)에서 출력되는 오디오가 아날로그 신호인 경우에는 아날로그 신호를 디지털 신호로 변환한 다음, 심볼들을 소정의 알고리즘에 따라 부호화한다. 부호화 알고리즘에는 제한이 없으며, 오디오 신호를 부호화하여 비트스트림을 생성하는 모든 알고리즘이 부호화부(130)에서 이용될 수 있다. 또한, 부호화부(130)는 부가정보생성부(120)에서 모노채널 오디오로부터 멀티채널 오디오를 복원하기 위해 생성된 부가정보도 부호화한다.

이하에서는 다운믹스장치(110)가 멀티채널 오디오를 다운믹스하는 방법을 도 4 내지 6을 참조하여 보다 상세히 설명한다.

스크린 방향으로 청취자(410)의 주변 3차원 공간에 멀티채널 오디오가 배치될 수 있다. 청취자와 같은 높이의 평면에 Ch.1로부터 Ch.10까지 10개의 채널이 배치될 수 있으며, 청취자보다 높은 평면에 Ch.11로부터 Ch.19까지 9개의 채널이 배치될 수 있다. 또한, 청취자보다 낮은 평면에 Ch.20로부터 Ch.22까지 3개의 채널이 배치된다.

(3) 다운믹스될 채널의 선택

제어부(112)는 Ch.1로부터 Ch.22까지의 채널들을 조합하여 두 채널 사이의 상관도를 계산하고, 계산 결과에 기초해 상관도가 가장 높은 2개의 채널을 다운믹스할 채널로 선택한다.

본 발명의 일 실시예에 따르면, Ch.1로부터 Ch.22까지 전체 231개 조합에 대해 두 채널 사이의 상관도를 계산하고, 상관도가 가장 높은 두 채널을 다운믹스할 채널로 선택할 수 있다.

예를 들어, 상관도 계산 결과 Ch.3과 Ch.12의 상관도가 가장 높으면, 제어부(112)는 두 채널을 다운믹스할 채널로 선택하고, 다운믹스부(114)는 다운믹스를 수행하여 첫 번째 모노채널을 생성한다.

첫 번째 모노채널이 생성되면, 제어부(112)는 생성된 첫 번째 모노채널 및 다운믹스 되지 않은 다른 채널들 사이의 상관도를 다시 계산한다.

첫 번째 모노채널이 Ch.3과 Ch.12를 다운믹하여 생성되었다면, 첫 번째 모노채널 및 Ch.3과 Ch.12를 제외한 20개의 채널 사이의 상관도를 계산한다. 다시 말해, 다운믹스 결과 하나의 채널이 감소하였으므로, 첫 번째 모노채널을 포함하는 전체 21개의 채널들 사이의 상관도를 계산하여 다운믹스할 두 채널을 선택할 수 있다. 21개의 채널을 조합하여 전체 210개의 조합에 대해 상관도를 계산하고, 계산 결과에 기초하 두 번째로 다운믹스할 두 채널을 선택할 수 있다.

상관도의 계산에 기초하기 때문에 두 번째 다운믹스에서 선택되는 두 채널에 첫 번째 모노채널이 포함되지 않을 수 있다. 다운믹스 장치(110)는 이와 같은 두 채널의 선택 및 다운믹스를 반복하여 하나의 최종 모노채널 오디오 또는 M 채널 오디오를 생성할 수 있다.

또한, 본 발명의 또 다른 실시예에 따르면, 두 번째 이후의 다운믹스에서는 이전에 생성된 모노채널과 다른 채널을 다운믹스할 수 있다.

예를 들어, 제어부(112)는 Ch.3과 Ch.12를 다운믹스하여 생성된 첫 번째 모노채널과 Ch.3 및 Ch.12를 제외한 다른 채널들 사이의 상관도를 계산하여, 첫 번째 모노채널과 다운믹스할 다른 채널을 선택할 수 있다. 첫 번째 모노채널을 제외한 채널의 개수는 20개이므로, 20개의 채널들 각각에 대해 첫 번째 모노채널과의 상관도를 계산하여 두 번째로 다운믹스될 채널을 선택할 수 있다. 상관도의 계산 결과, 선택된 채널이 Ch.21이면 다운믹스부(114)는 첫 번째 모노채널과 Ch.21을 다운믹스하여 두 번째 모노채널을 생성한다. 다운믹스 장치(110)는 이와 같은 추가적으로 다운믹스할 채널의 선택 및 다운믹스를 반복하여 최종 모노채널 오디오를 생성하거나, M 채널 오디오를 생성할 수 있다.

본 발명의 또 다른 실시예에 따르면, 제어부(112)는 도 2에 도시된 바와 같이 3차원 청취자의 주변의 3차원 공간에 배치된 채널들 중에서 공간적으로 인접한 채널들 사이의 상관도만 계산하여 다운믹스할 채널들을 선택할 수 있다. Ch.1을 예로 들어 설명하면, Ch.1은 Ch.1의 상부에 배치된 Ch.11, 하부에 배치된 Ch.20, 좌측에 배치된 Ch.6 및 우측에 배치된 Ch.2와 인접하고 있다. 제어부(112)가 채널들 사이의 상관도를 계산할 때, 전술한 바와 같이 22개의 채널들의 210개의 조합에 대해 상관도를 계산하면, 상관도 계산에 많은 시간이 소모되어 비효율적일 수 있다.

따라서, 제어부(112)는 인접한 채널들 사이의 상관도만 계산하는 바, Ch.1과 인접한 채널들인 Ch.11, Ch.20, Ch.6 및 Ch.2 사이의 상관도만 네 번 계산할 수 있다. 마찬가지로 Ch.2는 Ch.1 및 Ch.3 사이의 상관도만 두 번 계산할 수 있으며, Ch.3은 Ch.12, Ch.21, Ch.2 및 Ch.4 사이의 상관도만 네 번 계산할 수 있다.

상관도 계산 결과에 따라 Ch.1과 Ch.11이 다운믹스할 채널들로 선택되면, 제어부(112)가 다음 번 다운믹스될 채널을 선택할 때에는 Ch.1 및 Ch.11을 하나로 묶은 모노채널을 하나의 채널로 간주하여 인접한 채널들 사이의 상관도를 다시 계산할 수 있다. 다시 말해, Ch.1 및 Ch.11를 다운믹스하여 생성된 모노채널을 하나의 채널로 간주하여 모노채널과 Ch.20, Ch.6 및 Ch.2 사이의 상관도를 계산할 수 있다.

또한, 본 발명의 또 다른 실시예에 따르면, 적어도 하나의 기준 채널을 설정하고 기준 채널을 중심으로 인접한 채널들을 하나씩 다운믹스하여 모노채널을 생성할 수도 있다. 기준 채널은 하나일 수도 있고, 복수일 수도 있다.

예를 들어, 도 2에서 제어부(112)는 하나의 채널인 Ch.3을 기준 채널로 설정하고, Ch.3에 인접한 채널 중 하나를 상관도 계산에 기초해 선택한다. 다운믹스부(114)가 선택된 채널과 Ch.3을 다운믹스하여 첫 번째 모노채널을 생성하면, 첫 번째 모노채널과 인접한 채널들 사이의 상관도를 다시 계산하여 두 번째로 다운믹스될 채널을 선택한다. 다운믹스부(114)는 선택된 채널을 첫 번째 모노채널과 다운믹스하여 두 번째 모노채널을 생성하고, 제어부(112)는 세 번째로 다운믹스될 채널을 또 다시 선택한다. 이와 같은 다운믹스될 채널의 선택과 다운믹스를 반복하여 Ch.3을 기준으로 인접한 채널을 하나씩 추가하며 다운믹스를 수행하여 최종 모노채널 오디오 또는 M 채널 오디오를 생성할 수 있다.

다운믹스 장치(110)는 복수의 기준 채널을 설정하고, 기준 채널을 중심으로 인접한 채널을 다운믹스하는 과정을 반복할 수도 있다. 예를 들어, Ch.1, Ch.5, Ch.8 및 Ch.10을 기준 채널로 선택하고, 복수의 기준 채널을 중심으로 인접한 채널들을 하나씩 다운믹스할 수도 있다.

도 6을 참조하면, 복수의 기준 채널을 설정하여 순차적으로 인접한 채널들을 다운믹스하다 보면, 하나의 채널을 공유하여 다운믹스를 수행해야 하는 경우가 발생한다.

예를 들어, 도 2에 도시된 Ch.1 및 Ch.5 기준 채널로 설정하고, 상관도 계산에 기초해 인접한 채널을 선택하여 다운믹스를 수행한 결과, Ch.1과 Ch.2이 다운믹스되어 제1 모노채널이 생성되고, Ch.5와 Ch.4이 다운믹스되어 제2 모노채널이 생성되었다면, 두 모노채널 사이에는 Ch.3만 존재한다. 이런 경우, Ch.3은 제1 모노채널에 추가로 다운믹스될 수 있는 인접 채널 후보들(Ch.6, Ch.11, Ch.20, Ch.3., Ch.12 및 Ch.21)에도 포함되고, 제2 모노채널에 추가로 다운믹스될 수 있는 인접 채널 후보들(Ch.7, Ch.13, Ch.22, Ch.3, Ch.12 및 Ch.21)에도 포함된다. 이 때에는 Ch.3의 세기에 1/

를 곱하여 Ch.3을 두 개의 채널로 분리하고, 분리된 두 개의 채널을 서로 다른 채널로 간주하여 두 모노채널에 다운믹스할 수 있다.

도 4와 관련하여 전술한 바와 같이 상관도 계산에 기초해 다운믹스될 채널을 선택하면, 공간적인 배치와 무관하게 다운믹스될 채널이 선택될 수 있다. 예를 들어, Ch.1과 Ch.10의 상관도가 가장 높으면, 공간적으로 가장 먼 위치의 두 채널인 Ch.1 및 Ch.10이 다운믹스할 채널로 선택될 수 있다. 그러나, 다운믹스의 목적이 2.1 채널 오디오 또는 5.1 채널 오디오를 생성하는데 있다면, 공간적인 배치를 고려하여 다운믹스될 채널을 선택하는 것이 바람직하다.

이를 위해, 도 4와 같이 3차원 공간에 배치된 채널들을 도 7과 같이 복수의 그룹(610 내지 650)으로 나누고 각각의 그룹에 포함된 채널들끼리만 다운믹스한다. 도 7은 도 4에 도시된 22개의 채널을 5개의 채널에 대응되도록 그룹화하는 경우를 도시한다. 스크린 방향으로 청취자의 좌측전면에 배치된 Ch.1, Ch.2, Ch.3, Ch.6, Ch.11, Ch.12, Ch.14, Ch.20 및 Ch.21을 포함하는 그룹, 우측전면에 배치된 Ch.3, Ch.4, Ch.5, Ch.7, Ch.12, Ch.13, Ch16, Ch.21 및 Ch.22를 포함하는 그룹, 좌측후면에 배치된 Ch.6, Ch.8, Ch.9, Ch.14, Ch.17 및 Ch.18을 포함하는 그룹, 우측후면에 배치된 Ch.7, Ch.9, Ch.10, Ch.16, Ch.18 및 Ch.19를 포함하는 그룹 및 Ch.3, Ch.12, Ch.15 및 Ch.21을 포함하는 그룹으로 22개의 채널을 그룹화한다.

각각의 그룹의 경계에 배치된 채널들은 도 6과 관련하여 전술한 바와 같이 세기에 1/

을 곱하여 두 개의 채널로 분리하고, 분리된 두 개의 채널을 서로 다른 채널로 간주하여 각각의 그룹에서 다운믹스한다.

제어부(112)는 다운믹스할 채널을 선택하기 위해 각각의 그룹에 포함된 채널들끼리만 상관도를 계산하고, 계산 결과에 기초해 각각의 그룹에서 다운믹스할 채널들을 선택한다. 각각의 그룹 안에서 공간적으로 인접한 채널들끼리만 다운믹스되므로, 멀티채널 오디오를 2.1 채널 오디오 또는 5.1 채널 오디오에 대응되게 변환할 수 있다.

(4) 상관도의 계산

제어부(112)는 도 4 내지 6와 관련하여 전술한 바와 같이 다운믹스할 채널을 선택하기 위해 다음의 수학식 2에 따라 채널 사이의 상관도를 계산할 수 있다.

수학식 2

채널 i와 채널 j 사이의 교차 상관도(cross-correlation)를 프레임 단위로 계산할 수 있다.

시간 도메인에서 두 채널 사이의 상관도를 계산하는 방법을 먼저 설명하면, 제어부(112)는 채널 i의 음성 프레임에 포함된 2L+1개의 심볼들과 채널 j의 음성 프레임에 포함된 2L+1개의 심볼들 사이의 교차 상관도를 수학식 1에 의해 계산할 수 있다.

x_i(k)는 채널 i의 심볼을 의미하고, x_j(k)는 채널 j의 심볼을 의미한다. d는 실시예에 따라 다르게 결정될 수 있는 상수로서 '0'일 수 있으며, 하나의 음성 프레임에 포함된 심볼들의 개수의 1/2일 수도 있다. 예를 들어, 하나의 음성 프레임에 1024개의 심볼들이 있다면, d는 512로 설정하여 교차 상관도를 계산할 수 있다.

음성 프레임마다 교차 상관도가 계산되는 경우에는 다운믹스할 채널의 선택도 음성 프레임 단위로 수행된다. 예를 들어, n번째 음성 프레임에서 Ch.1과 다운믹스될 채널로 Ch.11이 선택되고, n+1번째 음성 프레임에서는 Ch.1과 다운믹스될 채널로 Ch.20이 선택될 수 있다.

교차 상관도는 주파수 도메인에서 계산될 수 있다. 하나의 음성 프레임에 포함된 심볼들을 FFT(Fast Fourier Transform)하면, 주파수 도메인에서는 주파수 성분의 세기를 나타내는 이산된 값들로 표현된다.

제어부(112)는 FFT 결과 생성된 주파수 도메인의 이산된 값들에 기초해 채널들 사이의 교차 상관도를 계산할 수 있다. 채널 i의 심볼들을 FFT하여 생성된 주파수 성분의 세기를 나타내는 값들과 채널 j의 심볼들을 FFT하여 생성된 주파수 성분의 세기를 나타내는 값들의 교차 상관도를 수학식 1에 따라 계산한다.

주파수 도메인에서 계산될 때에 x_i(k)는 채널 i의 심볼들을 FFT하여 생성된 주파수 성분의 세기를 나타내는 값들을 나타내며, x_j(k)는 채널 j의 심볼들을 FFT하여 생성된 주파수 성분의 세기를 나타내는 값들을 나타낸다. d는 전술한 바와 같이 '0'일 수 있으며, L은 교차 상관도는 구하기 위한 주파수 영역을 설정하기 위한 값일 수 있다. 예를 들어, f=0Hz부터 512Khz까지의 주파수 성분의 세기에 대한 값들을 비교하도록 L을 설정할 수 있다.

또한, 도 2와 같이 주파수 도메인을 복수의 서브 밴드로 분할하고, 각각의 서브 밴드에 대해 교차 상관도를 계산할 수 도 있다. 예를 들어, 채널 i의 서브 밴드 s의 주파수 성분의 세기를 나타내는 값들과, 채널 j의 서브 밴드 s의 주파수 성분의 세기를 나타내는 값들 사이의 교차 상관도를 계산하고, 채널 i의 서브 밴드 s+1의 주파수 성분의 세기를 나타내는 값들과, 채널 j의 서브 밴드 s+1의 주파수 성분의 세기를 나타내는 값들 사이의 교차 상관도를 계산할 수도 있다. 동일한 방법으로 모든 서브 밴드들에 대해 교차 상관도의 계산을 반복한다.

서브 밴드마다 교차 상관도를 계산하는 경우에는 제어부(112)의 다운믹스할 채널 선택은 서브 밴드마다 수행될 수 있다. 교차 상관도가 서브 밴드마다 계산되므로, 서브 밴드마다 다운믹스를 위해 선택되는 채널이 상이하다. 예를 들어, 서브 밴드 s에서의 교차 상관도를 계산할 결과, Ch.1과 다운믹스될 채널로 Ch.11이 선택되었더라도, 서브 밴드 s+1에서는 Ch.1과 다운믹스될 채널로 Ch.20이 선택될 수 있다.

(5) 상관도가 동일한 경우의 취급

도 4 내지 6과 관련하여 전술한 바와 같이 채널들 사이의 상관도를 계산하면, 두 쌍 이상의 채널의 쌍이 상관도가 동일할 수 잇따

예를 들어, 제어부(112)가 도 4의 22개 채널들 사이의 상관도를 계산했을 때, Ch.1과 Ch.11 사이의 상관도 및 Ch.5와 Ch.13 사이의 상관도가 동일하면서 가장 클 수 있다. 이때 제어부(112)는 다운믹스된 채널에서 멀티채널을 복원하기 위해 부가정보생성부(120)에서 생성되는 부가정보를 가장 높은 압축률로 부호화할 수 있는 채널을 선택한다. 도 2 및 3과 관련하여 전술한 바와 같이 다운믹스된 채널들의 세기를 결정하기 위한 정보 및 위상을 결정하기 위한 정보가 다운믹스된 채널들의 오디오와 함께 부호화되는 바, 부가정보를 가장 높은 압축률로 부호화할 수 있는 채널을 선택한다.

도 3과 관련하여 전술한 바와 같이 다운믹스된 채널들의 세기를 결정하기 위한 정보는 모노채널의 세기에 대한 벡터와 채널 p의 세기에 대한 벡터 사이의 각도 또는 모노채널의 세기에 대한 벡터와 채널 q의 세기에 대한 벡터 사이의 각도일 수 있다. 따라서, 제어부(112)는 θI를 가장 높은 압축률로 부호화할 수 있는 채널을 선택한다. Ch.1과 Ch.11을 다운믹스했을 때가 Ch.5와 Ch.13을 다운믹스했을 때보다 더 높은 압축률로 θI에 대한 정보를 부호화할 수 있다면, Ch.1과 Ch.11을 다운믹스할 채널로 선택된다. 예를 들어, θI가 작아야 θI에 대한 정보를 더 높을 압축률 로 부호화할 수 있다면, θI가 작은 두 채널을 다운믹스할 채널로 선택된다.

인접한 채널들 사이의 상관도만 계산하는 경우에도 마찬가지이다. 제어부(112)가 도 5에 도시된 바와 같이 인접한 채널들의 상관도를 계산했을 때, Ch.1과 Ch.11 사이의 상관도 및 Ch.1과 Ch.20 사이의 상관도가 동일하면서 가장 클 수 있다. 이때 제어부(112)는 다운믹스된 채널에서 멀티채널을 복원하기 위해 부가정보생성부(120)에서 생성되는 부가정보를 가장 높은 압축률로 부호화할 수 있는 두 채널을 다운믹스할 두개의 채널로 선택할 수 있다.

도 8을 참조하면, 본 발명의 일 실시예에 따른 멀티채널 오디오 복호화 장치(700)는 추출부(710), 복호화부(720) 및 업믹스부(730)를 포함한다.

추출부(710)는 수신된 오디오 데이터 즉, 비트스트림으로부터 부호화된 오디오 및 부호화된 부가정보를 추출한다. 부호화된 오디오는 N 채널을 하나의 모노채널 또는 M 채널로 다운믹스한 다음, 소정의 알고리즘에 따라 오디오 신호를 부호화하여 생성된 것일 수 있다.

복호화부(720)는 추출부(710)에서 추출된 부호화된 오디오 및 부가정보를 복호화한다. 부호화에 이용된 알고리즘과 동일한 알고리즘을 이용하여 부호화된 오디오 및 부가정보를 복호화한다. 오디오의 복호화 결과, 하나의 모노채널 또는 M개 채널 오디오가 복원된다.

업믹스부(730)는 복호화부(720)에서 복호화된 오디오를 업믹스(up-mix)하여 다운믹스 이전의 N 채널 오디오를 복원한다. 복호화부(720)에서 복호화된 부가정보에 기초해 N 채널 오디오를 복원한다. 부가정보를 참조하여 도 4 내지 6과 관련하여 전술한 다운믹스 과정을 거꾸로 수행하여 다운믹스된 오디오를 멀티채널 오디오로 업믹스한다.

부가정보는 채널들의 다운믹스 순서에 대한 정보가 포함되어 있으므로, 부가정보를 참조하여, 모노채널에서 순서대로 채널들을 분리한다. 다운믹스된 채널들의 세기 및 위상을 결정하기 위한 정보에 따라 다운믹스된 채널들의 세기 및 위상을 결정하므로서 모노채널에서 순서대로 채널들을 분리할 수 있다.

도 9를 참조하면, 단계 810에서 본 발명의 일 실시예에 따른 멀티채널 오디오 부호화 장치(100)는 멀티채널 오디오를 다운믹스한다. 도 4 내지 6과 관련하여 전술한 바와 같이 채널들 사이의 상관도 계산에 기초해 다운믹스할 채널들을 선택하고, 다운믹스하는 과정을 반복하여 하나의 최종 모노채널 오디오 또는 M 채널 오디오를 생성한다.

단계 820에서 멀티채널 오디오 부호화 장치(100)는 단계 820에서 단계 810에서 다운믹스를 수행하여 생성된 오디오에서 멀티채널 오디오를 복원하기 위해 필요한 정보를 생성한다. 부가정보생성부(120)와 관련하여 전술한 바와 같이 다운믹스된 채널들의 세기 및 위상을 결정하기 위한 정보가 부가정보로서 생성될 수 있다. 또한, 다운믹스가 순차적으로 진행되는 동안, 채널들의 다운믹스 순서에 대한 정보가 부가정보로서 생성될 수 있다.

단계 830에서 멀티채널 오디오 부호화 장치(100)는 단계 810에서 생성된 다운믹스된 오디오 및 단계 820에서 생성된 부가정보를 부호화한다.

도 10은 본 발명의 일 실시예에 따른 다운믹스 방법을 설명하기 위한 흐름도이다. 도 10은 도 9의 단계 810을 보다 상세히 도시한다.

도 10을 참조하면, 단계 812에서 다운믹스 장치(110)는 멀티채널 오디오의 채널들 사이의 상관도를 계산한다. 수학식 2와 같이 채널들 사이의 교차 상관도를 시간 도메인 또는 주파수 도메인에서 계산할 수 있다. 이전에 다운믹스되어 생성된 모노채널이 있으면, 모노채널 과 아직 다운믹스되지 않은 채널들 사이의 상관도를 계산할 수 있다.

단계 814에서 다운믹스 장치(110)는 단계 812의 계산 결과에 기초해 다운믹스할 두 채널 즉, 제1 채널 및 제2 채널을 선택한다. 단계 812의 계산 결과 교차 상관도가 가장 큰 두 채널이 선택된다. 교차 상관도가 가장 큰 채널의 쌍이 두 쌍 이상 있는 경우에는 부가정보를 가장 높은 압축률로 부호화할 수 있는 두 채널이 다운믹스될 채널들로 선택된다. 부가정보는 다운믹스되는 두 채널의 세기 및 위상을 결정하기 위한 정보일 수 있으며, 다운믹스되는 두 채널의 세기를 결정하기 위한 정보는 도 3에 도시된 바와 같이 모노채널의 세기에 대한 벡터와 다운믹스되는 채널의 세기에 대한 벡터 사이의 각도에 대한 정보일 수 있다.

단계 816에서 다운믹스 장치(110)는 단계 814에서 선택된 제1 채널 및 제2 채널을 다운믹스한다.

다운믹스 장치(110)는 다운믹스가 모두 완료되어 하나의 모노채널 또는 M개채널 오디오가 생성될 때까지 단계 812 내지 816을 반복한다.

도 11을 참조하면, 본 발명의 일 실시예에 따른 멀티채널 오디오 복호화 장치(700)는 단계 910에서 부가정보 및 다운믹스된 오디오를 추출한다. 오디오 데이터 즉, 비트스트림으로부터 다운믹스된 오디오에서 멀티채널을 복원하기 위해 필요한 부가정보 및 다운믹스된 오디오를 추출한다.

단계 920에서 멀티채널 오디오 복호화 장치(700)는 단계 910에서 추출된 부가정보 및 다운믹스된 오디오를 복호화한다. 멀티채널 오디오를 부호화할 때, 이용한 알고리즘과 동일한 알고리즘을 이용해 부가정보 및 다운믹스된 오디오를 복호화한다.

단계 930에서 멀티채널 오디오 복호화 장치(700)는 단계 920에서 복호화된 부가정보에 기초해 다운믹스된 오디오를 업믹스한다. 부가정보생성부(120)과 관련하여 전술한 부가정보에 기초해 다운믹스된 오디오를 업믹스하여 멀티채널 오디오를 복원한다.

이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명이 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 사상은 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이와 균등하거나 또는 등가적인 변형 모두는 본 발명 사상의 범주에 속한다 할 것이다. 또한, 본 발명에 따른 시스템은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다.

예를 들어, 본 발명의 예시적인 실시예에 따른 다운믹스 장치, 멀티채널 오디오 부호화 장치 및 멀티채널 오디오 복호화 장치는 도 1 및 도 8에 도시된 바와 같은 장치의 각각의 유닛들에 커플링된 버스, 상기 버스에 결합된 적어도 하나의 프로세서를 포함할 수 있다. 또한, 명령, 수신된 메시지 또는 생성된 메시지를 저장하기 위해 상기 버스에 결합되어, 전술한 바와 같은 명령들을 수행하기 위한 적어도 하나의 프로세서에 커플링된 메모리를 포함할 수 있다.

또한, 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등을 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.

Claims

멀티 채널 오디오를 다운믹스(down-mix)하는 방법에 있어서,

상기 멀티 채널 오디오의 채널들 사이의 상관도를 계산하는 단계;

상기 계산된 상관도에 기초해 다운믹스할 제1 채널 및 제2 채널을 선택하는 단계; 및

상기 선택된 제1 채널과 상기 제2 채널을 다운믹스하는 단계를 포함하는 것을 특징으로 하는 다운믹스 방법.
제 1 항에 있어서, 상기 상관도를 계산하는 단계는

프레임마다 채널들 사이의 교차 상관도(cross correlation)를 계산하는 단계를 포함하는 것을 특징으로 하는 다운믹스 방법.
제 2 항에 있어서, 상기 교차 상관도를 계산하는 단계는

프레임마다 공간적으로 인접한 위치에 배치된 채널들 사이의 교차 상관도를 계산하는 단계를 포함하는 것을 특징으로 하는 다운믹스 방법.
제 2 항에 있어서, 상기 제1 채널 및 제2 채널을 선택하는 단계는

상기 교차 상관도의 계산 결과, 교차 상관도가 가장 큰 두 개의 채널을 상기 제1 채널 및 제2 채널로 선택하는 단계를 포함하는 것을 특징으로 하는 다운믹스 방법.
제 4 항에 있어서, 상기 제1 채널 및 제2 채널을 선택하는 단계는

상기 교차 상관도의 계산 결과, 교차 상관도가 가장 큰 두 개의 채널이 두 쌍 이상이면, 다운믹스되어 생성된 오디오 신호에서 다운믹스 전 채널들을 복원하기 위해 필요한 적어도 하나의 부가정보를 가장 높은 압축률로 부호화할 수 있는 두 개의 채널을 상기 제1 채널 및 제2 채널로 선택하는 단계를 포함하는 것을 특징으로 하는 다운믹스 방법.
제 5 항에 있어서, 상기 적어도 하나의 부가정보는

다운믹스 전 두 개의 채널의 세기를 복원하기 위해 필요한 부가정보를 포함하는 것을 특징으로 하는 다운믹스 방법.
제 1 항에 있어서,

상기 제1 채널과 제2 채널의 다운믹스 결과 생성된 모노채널 및 상기 제1 채널 및 상기 제2 채널을 제외한 다른 채널들 사이의 상관도를 계산하는 단계;

상기 계산된 상관도에 기초해 다운믹스할 제3 채널 및 제4 채널을 선택하는 단계; 및

상기 선택된 제3 채널 및 제4 채널을 다운믹스하는 단계를 더 포함하는 것을 특징으로 하는 다운믹스 방법.
제 1 항에 있어서,

상기 제1 채널과 제2 채널의 다운믹스 결과 생성된 모노채널과 상기 제1 채널 및 상기 제2 채널을 제외한 다른 채널들 사이의 상관도를 계산하는 단계;

상기 계산된 상관도에 기초해 상기 모노채널과 함께 다운믹스할 제3 채널을 선택하는 단계; 및

상기 모노채널 및 상기 선택된 제3 채널을 다운믹스하는 단계를 더 포함하는 것을 특징으로 하는 다운믹스 방법.
멀티 채널 오디오를 다운믹스(down-mix)하는 장치에 있어서,

상기 멀티 채널 오디오의 채널들 사이의 상관도를 계산하고, 상기 계산된 상관도에 기초해 다운믹스할 제1 채널 및 제2 채널을 선택하는 제어부; 및

상기 선택된 제1 채널과 상기 제2 채널을 다운믹스하는 다운믹스부를 포함하는 것을 특징으로 하는 다운믹스 장치.
제 9 항에 있어서, 상기 제어부는

프레임마다 채널들 사이의 교차 상관도(cross correlation)를 계산하는 것을 특징으로 하는 다운믹스 장치.
제 10 항에 있어서, 상기 제어부는

프레임마다 공간적으로 인접한 위치에 배치된 채널들 사이의 교차 상관도를 계산하는 것을 특징으로 하는 다운믹스 장치.
제 10 항에 있어서, 상기 제어부는

상기 교차 상관도의 계산 결과, 교차 상관도가 가장 큰 두 개의 채널을 상기 제1 채널 및 제2 채널로 선택하는 것을 특징으로 하는 다운믹스 장치
제 12 항에 있어서, 상기 제어부는

상기 교차 상관도의 계산 결과, 교차 상관도가 가장 큰 두 개의 채널이 두 쌍 이상이면, 다운믹스되어 생성된 오디오 신호에서 다운믹스 전 채널들을 복원하기 위해 필요한 적어도 하나의 부가정보를 가장 높은 압축률로 부호화할 수 있는 두 개의 채널을 상기 제1 채널 및 제2 채널로 선택하는 것을 특징으로 하는 다운믹스 장치.
제 13 항에 있어서, 상기 적어도 하나의 부가정보는

다운믹스 전 두 개의 채널의 세기를 복원하기 위해 필요한 부가정보를 포함하는 것을 특징으로 하는 다운믹스 장치.
제 9 항에 있어서,

상기 제어부는 상기 제1 채널과 제2 채널의 다운믹스 결과 생성된 모노채널 및 상기 제1 채널 및 상기 제2 채널을 제외한 다른 채널들 사이의 상관도를 계산하여 상기 계산된 상관도에 기초해 다운믹스할 제3 채널 및 제4 채널을 선택하고,

상기 다운믹스부는 상기 선택된 제3 채널 및 제4 채널을 다운믹스하는 것을 특징으로 하는 다운믹스 장치.
제 9 항에 있어서,

상기 제어부는 상기 제1 채널과 제2 채널의 다운믹스 결과 생성된 모노채널과 상기 제1 채널 및 상기 제2 채널을 제외한 다른 채널들 사이의 상관도를 계산하여 상기 계산된 상관도에 기초해 상기 모노채널과 함께 다운믹스할 제3 채널을 선택하고,

상기 다운믹스부는 상기 모노채널 및 상기 선택된 제3 채널을 다운믹스하는 것을 특징으로 하는 다운믹스 장치.
제 1 항 내지 제 8 항 중 어느 한 항의 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.