KR20170133378A - 인코딩된 오디오 신호를 디코딩하기 위한 디코더 및 오디오 신호를 인코딩하기 위한 인코더 - Google Patents
인코딩된 오디오 신호를 디코딩하기 위한 디코더 및 오디오 신호를 인코딩하기 위한 인코더 Download PDFInfo
- Publication number
- KR20170133378A KR20170133378A KR1020177028552A KR20177028552A KR20170133378A KR 20170133378 A KR20170133378 A KR 20170133378A KR 1020177028552 A KR1020177028552 A KR 1020177028552A KR 20177028552 A KR20177028552 A KR 20177028552A KR 20170133378 A KR20170133378 A KR 20170133378A
- Authority
- KR
- South Korea
- Prior art keywords
- kernels
- group
- channel
- transform
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Description
도 1은 인코딩된 오디오 신호를 디코딩하기 위한 디코더의 개략적인 블록도를 도시한다.
도 2는 일 실시예에 따른 디코더에서의 신호 흐름을 예시하는 개략적인 블록도를 도시한다.
도 3은 일 실시예에 따라 오디오 신호를 인코딩하기 위한 인코더의 개략적인 블록도를 도시한다.
도 4a는 예시적인 MDCT 인코더에 의해 획득된 스펙트럼 값들의 블록들의 개략적인 시퀀스를 도시한다.
도 4b는 예시적인 MDCT 인코더에 입력되는 시간-도메인 신호의 개략적인 표현을 도시한다.
도 5a는 일 실시예에 따른 예시적인 MDCT 인코더의 개략적인 블록도를 도시한다.
도 5b는 일 실시예에 따른 예시적인 MDCT 디코더의 개략적인 블록도를 도시한다.
도 6은 4개의 설명된 랩핑된 변환들의 묵시적인 폴드-아웃(fold-out) 특성 및 대칭들을 개략적으로 예시한다.
도 7은 신호-적응형 변환 커널 스위칭이 완전한 재구성을 허용하면서 하나의 프레임에서 다음 프레임으로 변환 커널에 적용되는 사용예의 2개의 실시예들을 개략적으로 도시한다.
도 8은 일 실시예에 따라 다중 채널 오디오 신호를 디코딩하기 위한 디코더의 개략적인 블록도를 도시한다.
도 9는 일 실시예에 따른 다중 채널 프로세싱으로 확장되는 도 3의 인코더의 개략적인 블록도를 도시한다.
도 10은 일 실시예에 따라 둘 이상의 채널 신호들을 갖는 다중 채널 오디오 신호를 인코딩하기 위한 개략적인 오디오 인코더를 예시한다.
도 11a는 일 실시예에 따른 인코더 계산기의 개략적인 블록도를 도시한다.
도 11b는 일 실시예에 따른 대안적인 인코더 계산기의 개략적인 블록도를 도시한다.
도 11c는 일 실시예에 따른 결합기에서 제 1 및 제 2 채널의 예시적인 조합 규칙의 개략도를 도시한다.
도 12a는 일 실시예에 따른 디코더 계산기의 개략적인 블록도를 도시한다.
도 12b는 일 실시예에 따른 행렬 계산기의 개략적인 블록도를 도시한다.
도 12c는 일 실시예에 따른 도 11c의 조합 규칙에 대한 예시적인 역조합 규칙의 개략도를 도시한다.
도 13a는 일 실시예에 따른 오디오 인코더의 구현의 개략적인 블록도를 예시한다.
도 13b는 일 실시예에 따른 도 13a에 예시된 오디오 인코더에 대응하는 오디오 디코더의 개략적인 블록도를 예시한다.
도 14a는 일 실시예에 따른 오디오 인코더의 추가적인 구현의 개략적인 블록도를 예시한다.
도 14b는 일 실시예에 따른 도 14a에 예시된 오디오 인코더에 대응하는 오디오 디코더의 개략적인 블록도를 예시한다.
도 15는 인코딩된 오디오 신호를 디코딩하는 방법의 개략적인 블록도를 도시한다.
도 16은 오디오 신호를 인코딩하는 방법의 개략적인 블록도를 도시한다.
Claims (24)
- 인코딩된 오디오 신호(4)를 디코딩하기 위한 디코더(2)로서,
스펙트럼 값들(4', 4'')의 연속적인 블록들을 시간 값들(10)의 연속적인 블록들로 변환하기 위한 적응형 스펙트럼-시간 변환기(6); 및
디코딩된 오디오 값들(14)을 획득하기 위해 상기 시간 값들(10)의 연속적인 블록들을 중첩 및 가산하는 중첩-가산 프로세서(8)를 포함하고,
상기 적응형 스펙트럼-시간 변환기(6)는, 제어 정보(12)를 수신하고, 상기 제어 정보에 대한 응답으로, 커널의 측면들에서 상이한 대칭구조들을 갖는 하나 이상의 변환 커널들을 포함하는 변환 커널들의 제 1 그룹 및 변환 커널의 측면들에서 동일한 대칭구조들을 갖는 하나 이상의 변환 커널들을 포함하는 변환 커널들의 제 2 그룹의 변환 커널들 사이에서 스위칭하도록 구성되는,
디코더(2). - 제 1 항에 있어서,
상기 변환 커널들의 제 1 그룹은, 상기 커널의 좌측에서 홀수 대칭 및 우측에서 짝수 대칭을 갖는, 또는 그 반대인 하나 이상의 변환 커널들을 갖거나, 또는 상기 변환 커널들의 제 2 그룹은, 상기 커널의 양측에서 짝수 대칭 또는 양측에서 홀수 대칭을 갖는 하나 이상의 변환 커널들을 갖는,
디코더(2). - 제 1 항에 있어서,
상기 변환 커널들의 제 1 그룹은 MDCT-IV 역변환 커널 또는 MDST-IV 역변환 커널을 포함하거나, 또는 상기 변환 커널들의 제 2 그룹은 MDCT-II 역변환 커널 또는 MDST-II 역변환 커널을 포함하는,
디코더(2). - 제 1 항에 있어서,
상기 제 1 그룹 및 상기 제 2 그룹의 변환 커널은,
에 기초하고,
상기 제 1 그룹의 적어도 하나의 변환 커널은 파라미터들,
cs( ) = cos( ) 및 k0 = 0.5 또는
cs( ) = sin( ) 및 k0 = 0.5
에 기초하거나, 또는
상기 제 2 그룹의 적어도 하나의 변환 커널은 파라미터들,
cs( ) = cos( ) 및 k0 = 0 또는
cs( ) = sin( ) 및 k0 = 1
에 기초하고,
xi,n은 시간 도메인 출력이고, C는 상수 파라미터이고, N은 시간-윈도우 길이이고, spec은 블록에 대해 M개의 값들을 갖는 스펙트럼 값들이고, M은 N/2와 동일하고, i는 시간 블록 인덱스이고, k는 스펙트럼 값들을 표시하는 스펙트럼 인덱스이고, n은 블록 i에서 시간 값을 표시하는 시간 인덱스이고, no는 정수 또는 제로인 상수 파라미터인,
디코더(2). - 제 1 항에 있어서,
상기 제어 정보(12)는 현재 프레임에 대한 현재 대칭을 표시하는 현재 비트를 포함하고,
상기 적응형 스펙트럼-시간 변환기(6)는, 상기 현재 비트가 선행 프레임에서 사용된 것과 동일한 대칭을 표시하는 경우, 상기 제 1 그룹으로부터 상기 제 2 그룹으로 스위칭하지 않도록 구성되고,
상기 적응형 스펙트럼-시간 변환기는, 상기 현재 비트가 상기 선행 프레임에서 사용된 것과 상이한 대칭을 표시하는 경우, 상기 제 1 그룹으로부터 상기 제 2 그룹으로 스위칭하도록 구성되는,
디코더(2). - 제 1 항에 있어서,
상기 적응형 스펙트럼-시간 변환기(6)는, 현재 프레임에 대한 현재 대칭을 표시하는 현재 비트가 상기 선행 프레임에서 사용된 것과 동일한 대칭을 표시하는 경우 상기 제 2 그룹을 상기 제 1 그룹으로 스위칭하도록 구성되고,
상기 적응형 스펙트럼-시간 변환기(6)는, 상기 현재 프레임에 대한 현재 대칭을 표시하는 상기 현재 비트가 상기 선행 프레임에서 사용된 것과 상이한 대칭을 표시하는 경우 상기 제 2 그룹으로부터 상기 제 1 그룹으로 스위칭하지 않도록 구성되는,
디코더(2). - 제 1 항에 있어서,
상기 적응형 스펙트럼-시간 변환기(6)는 상기 현재 프레임에 대한 제어 데이터 섹션에서 인코딩된 오디오 신호로부터 이전 프레임에 대한 제어 정보(12) 및 상기 이전 프레임에 후속하는 현재 프레임에 대한 제어 정보(12)를 인코딩된 오디오 신호(4)로부터 판독하도록 구성되거나, 또는
상기 적응형 스펙트럼-시간 변환기(6)는 상기 현재 프레임에 대한 제어 데이터 섹션으로부터 상기 제어 정보(12)를 판독하고, 상기 이전 프레임의 제어 데이터 섹션으로부터 또는 상기 이전 프레임에 적용된 디코더 세팅으로부터 상기 이전 프레임에 대한 제어 정보(12)를 검색하도록 구성되는,
디코더(2). - 제 1 항에 있어서,
제 1 및 제 2 멀티 채널을 표현하는 스펙트럼 값들의 블록들을 수신하고, 조인트 멀티 채널 프로세싱 기술에 따라, 상기 제 1 멀티 채널 및 상기 제 2 멀티 채널에 대한 스펙트럼 값들의 프로세싱된 블록들을 획득하기 위해, 수신된 블록들을 프로세싱하기 위한 멀티 채널 프로세서(40)를 더 포함하고, 상기 적응형 스펙트럼-시간 프로세서(6)는 상기 제 1 멀티 채널에 대한 제어 정보를 사용하여 상기 제 1 멀티 채널에 대한 프로세싱된 블록들을 프로세싱하고, 상기 제 2 멀티 채널에 대한 제어 정보를 사용하여 상기 제 2 멀티 채널에 대한 프로세싱된 블록들을 프로세싱하도록 구성되는,
디코더(2). - 제 9 항에 있어서,
상기 멀티 채널 프로세서는 상기 제 1 및 상기 제 2 멀티 채널을 표현하는 스펙트럼 값들의 블록들과 연관된 복소 예측 제어 정보를 사용하여 복소 예측을 적용하도록 구성되는,
디코더(2). - 제 9 항에 있어서,
상기 멀티 채널 프로세서는 상기 조인트 멀티 채널 프로세싱 기술에 따라, 상기 수신된 블록들을 프로세싱하도록 구성되고, 상기 수신된 블록들은 상기 제 1 멀티 채널의 표현 및 상기 제 2 멀티 채널의 표현의 인코딩된 잔여 신호를 포함하고, 상기 멀티 채널 프로세서는 상기 잔여 신호 및 추가적인 인코딩된 신호를 사용하여 상기 제 1 멀티 채널 신호 및 상기 제 2 멀티 채널 신호를 계산하도록 구성되는,
디코더(2). - 오디오 신호(24)를 인코딩하기 위한 인코더(22)로서,
시간 값들(30)의 중첩하는 블록들을 스펙트럼 값들(4', 4'')의 연속적인 블록들로 변환하기 위한 적응형 시간-스펙트럼 변환기; 및
변환 커널들의 제 1 그룹의 변환 커널들과 변환 커널들의 제 2 그룹의 변환 커널들 사이에서 스위칭하도록 시간-스펙트럼 변환기를 제어하기 위한 제어기(28)를 포함하고,
상기 적응형 시간-스펙트럼 변환기는, 제어 정보(12)를 수신하고, 상기 제어 정보에 대한 응답으로, 커널의 측면들에서 상이한 대칭구조들을 갖는 하나 이상의 변환 커널들을 포함하는 변환 커널들의 제 1 그룹 및 변환 커널의 측면들에서 동일한 대칭구조들을 갖는 하나 이상의 변환 커널들을 포함하는 변환 커널들의 제 2 그룹의 변환 커널들 사이에서 스위칭하도록 구성되는,
인코더(22). - 제 12 항에 있어서,
현재 프레임에 대해, 상기 현재 프레임을 생성하기 위해 사용되는 변환 커널의 대칭을 표시하는 제어 정보(12)를 갖도록 인코딩된 오디오 신호(4)를 생성하기 위한 출력 인터페이스(32)를 더 포함하는,
인코더(22). - 제 12 항에 있어서,
상기 출력 인터페이스(32)는, 상기 현재 프레임이 독립적인 프레임이거나, 또는 상기 현재 프레임이 종속적인 프레임인 경우 상기 현재 프레임의 제어 데이터 섹션에 오직 상기 현재 프레임에 대한 대칭 정보만을 포함하고 어떠한 이전 프레임에 대한 대칭 정보도 포함하지 않는 경우, 상기 현재 프레임 및 상기 이전 프레임에 대한 대칭 정보를 상기 현재 프레임의 제어 데이터 섹션에 포함시키도록 구성되는,
인코더(22). - 제 12 항에 있어서,
상기 변환 커널들의 제 1 그룹은, 좌측에서 홀수 대칭 및 우측에서 짝수 대칭을 갖는, 또는 그 반대인 하나 이상의 변환 커널들을 갖거나, 또는 상기 변환 커널들의 제 2 그룹은, 양측에서 짝수 대칭 또는 양측에서 홀수 대칭을 갖는 하나 이상의 변환 커널들을 갖는,
인코더(22). - 제 12 항에 있어서,
상기 변환 커널들의 제 1 그룹은 MDCT-IV 변환 커널 또는 MDST-IV 변환 커널을 포함하거나, 또는 상기 변환 커널들의 제 2 그룹은 MDCT-II 변환 커널 또는 MDST-II 변환 커널을 포함하는,
인코더(22). - 제 12 항에 있어서,
상기 제어기(28)는, MDCT-IV 또는 MDST-II가 MDCT-IV에 후속되어야 하거나, 또는 MDST-IV 또는 MDCT-II가 MDST-IV에 후속되어야 하거나, 또는 MDCT-IV 또는 MDST-II가 MDCT-II에 후속되어야 하거나, 또는 MDST-IV 또는 MDCT-II가 MDST-II에 후속되어야 하도록 구성되는,
인코더(22). - 제 12 항에 있어서,
상기 제어기(28)는, 제 1 채널의 프레임 및 제 2 채널의 대응하는 프레임에 대한 변환 커널을 결정하기 위해, 상기 제 1 채널 및 상기 제 2 채널을 갖는 시간 값들(30)의 중첩하는 블록들을 분석하도록 구성되는,
인코더(22). - 제 12 항에 있어서,
상기 시간-스펙트럼 변환기(26)는 멀티 채널 신호의 제 1 채널 및 제 2 채널을 프로세싱하도록 구성되고, 상기 인코더(22)는, 스펙트럼 값들의 프로세싱된 블록들을 획득하기 위해 조인트 멀티 채널 프로세싱 기술을 사용하여 상기 제 1 채널 및 상기 제 2 채널의 스펙트럼 값들의 연속적인 블록들을 프로세싱하기 위한 멀티 채널 프로세서(40), 및 인코딩된 채널들을 획득하기 위해 스펙트럼 값들의 프로세싱된 블록들을 프로세싱하기 위한 인코딩 프로세서(46)를 더 포함하는,
인코더(22). - 제 12 항에 있어서,
상기 스펙트럼 값들의 제 1 프로세싱된 블록들은 상기 조인트 멀티 채널 프로세싱 기술의 제 1 인코딩된 표현을 표현하고, 상기 스펙트럼 값들의 제 2 프로세싱된 블록들은 상기 조인트 멀티 채널 프로세싱 기술의 제 2 인코딩된 표현을 표현하고, 상기 인코딩 프로세서(46)는 제 1 인코딩된 표현을 형성하기 위해 양자화 및 엔트로피 인코딩을 사용하여 상기 제 1 프로세싱된 블록들을 프로세싱하도록 구성되고, 상기 인코딩 프로세서(46)는 제 2 인코딩된 표현을 형성하기 위해 양자화 및 엔트로피 인코딩을 사용하여 상기 제 2 프로세싱된 블록들을 프로세싱하도록 구성되고, 인코딩 프로세서는 상기 제 1 인코딩된 표현 및 상기 제 2 인코딩된 표현을 사용하여, 상기 인코딩된 오디오 신호의 비트스트림을 형성하도록 구성되는,
인코더(22). - 인코딩된 오디오 신호를 디코딩하기 위한 방법(1500)으로서,
스펙트럼 값들의 연속적인 블록들을 시간 값들의 연속적인 블록들로 변환하는 단계; 및
디코딩된 오디오 값들을 획득하기 위해 시간 값들의 연속적인 블록들을 중첩 및 가산하는 단계,
제어 정보를 수신하고, 상기 제어 정보에 대한 응답으로 그리고 변환에서, 커널의 측면들에서 상이한 대칭구조들을 갖는 하나 이상의 변환 커널들을 포함하는 변환 커널들의 제 1 그룹 및 변환 커널의 측면들에서 동일한 대칭구조들을 갖는 하나 이상의 변환 커널들을 포함하는 변환 커널들의 제 2 그룹의 변환 커널들 사이에서 스위칭하는 단계를 포함하는,
방법(1500). - 오디오 신호를 인코딩하기 위한 방법(1600)으로서,
시간 값들의 중첩하는 블록들을 스펙트럼 값들의 연속적인 블록들로 변환하는 단계; 및
변환 커널들의 제 1 그룹의 변환 커널들과 변환 커널들의 제 2 그룹의 변환 커널들 사이에서 스위칭하기 위해 시간-스펙트럼 변환을 제어하는 단계,
제어 정보를 수신하고, 상기 제어 정보에 대한 응답으로 그리고 변환에서, 커널의 측면들에서 상이한 대칭구조들을 갖는 하나 이상의 변환 커널들을 포함하는 변환 커널들의 제 1 그룹 및 변환 커널의 측면들에서 동일한 대칭구조들을 갖는 하나 이상의 변환 커널들을 포함하는 변환 커널들의 제 2 그룹의 변환 커널들 사이에서 스위칭하는 단계를 포함하는,
방법(1600). - 컴퓨터 또는 프로세서 상에서 실행되는 경우, 제 21 항 또는 제 22 항의 방법들을 수행하기 위한 컴퓨터 프로그램.
- 제 1 항, 제 12 항, 제 21 항, 제 22 항 또는 제 23 항 중 어느 한 항의, 장치, 방법 또는 컴퓨터 프로그램으로서, 멀티 채널 프로세싱은 둘보다 많은 채널들의 조인트 스테레오 프로세싱 또는 조인트 프로세싱을 의미하고, 멀티 채널 신호는 2개의 채널들 또는 둘보다 많은 채널들을 갖는, 장치, 방법 또는 컴퓨터 프로그램.
Applications Claiming Priority (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP15158236 | 2015-03-09 | ||
| EP15158236.8 | 2015-03-09 | ||
| EP15172542.1A EP3067889A1 (en) | 2015-03-09 | 2015-06-17 | Method and apparatus for signal-adaptive transform kernel switching in audio coding |
| EP15172542.1 | 2015-06-17 | ||
| PCT/EP2016/054902 WO2016142376A1 (en) | 2015-03-09 | 2016-03-08 | Decoder for decoding an encoded audio signal and encoder for encoding an audio signal |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20170133378A true KR20170133378A (ko) | 2017-12-05 |
| KR102101266B1 KR102101266B1 (ko) | 2020-05-15 |
Family
ID=52692422
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020177028552A Active KR102101266B1 (ko) | 2015-03-09 | 2016-03-08 | 인코딩된 오디오 신호를 디코딩하기 위한 디코더 및 오디오 신호를 인코딩하기 위한 인코더 |
Country Status (15)
| Country | Link |
|---|---|
| US (6) | US10236008B2 (ko) |
| EP (3) | EP3067889A1 (ko) |
| JP (5) | JP6728209B2 (ko) |
| KR (1) | KR102101266B1 (ko) |
| CN (2) | CN107592938B (ko) |
| AR (1) | AR103859A1 (ko) |
| AU (1) | AU2016231239B2 (ko) |
| CA (1) | CA2978821C (ko) |
| ES (1) | ES2950286T3 (ko) |
| MX (1) | MX372600B (ko) |
| PL (1) | PL3268962T3 (ko) |
| RU (1) | RU2691231C2 (ko) |
| SG (1) | SG11201707347PA (ko) |
| TW (1) | TWI590233B (ko) |
| WO (1) | WO2016142376A1 (ko) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2020004883A1 (ko) * | 2018-06-25 | 2020-01-02 | 네이버 주식회사 | 오디오 병렬 트랜스코딩을 위한 방법 및 시스템 |
Families Citing this family (21)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7008716B2 (ja) * | 2016-11-08 | 2022-01-25 | フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. | サイドゲインおよび残余ゲインを使用してマルチチャネル信号を符号化または復号するための装置および方法 |
| US10224045B2 (en) * | 2017-05-11 | 2019-03-05 | Qualcomm Incorporated | Stereo parameters for stereo decoding |
| CN109389987B (zh) | 2017-08-10 | 2022-05-10 | 华为技术有限公司 | 音频编解码模式确定方法和相关产品 |
| US10535357B2 (en) * | 2017-10-05 | 2020-01-14 | Qualcomm Incorporated | Encoding or decoding of audio signals |
| US10839814B2 (en) * | 2017-10-05 | 2020-11-17 | Qualcomm Incorporated | Encoding or decoding of audio signals |
| EP3588495A1 (en) | 2018-06-22 | 2020-01-01 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Multichannel audio coding |
| CN115132214A (zh) | 2018-06-29 | 2022-09-30 | 华为技术有限公司 | 立体声信号的编码、解码方法、编码装置和解码装置 |
| ES3059239T3 (en) | 2018-07-04 | 2026-03-19 | Fraunhofer Ges Forschung | Multisignal encoder, multisignal decoder, and related methods using signal whitening or signal post processing |
| TWI681384B (zh) * | 2018-08-01 | 2020-01-01 | 瑞昱半導體股份有限公司 | 音訊處理方法與音訊等化器 |
| CN110830884B (zh) * | 2018-08-08 | 2021-06-25 | 瑞昱半导体股份有限公司 | 音频处理方法与音频均衡器 |
| EP3928315A4 (en) * | 2019-03-14 | 2022-11-30 | Boomcloud 360, Inc. | SPATIALLY AWARENESS MULTI-BAND COMPRESSION SYSTEM WITH PRIORITY |
| AU2020320270B2 (en) * | 2019-08-01 | 2025-10-23 | Dolby Laboratories Licensing Corporation | Encoding and decoding IVAS bitstreams |
| US11432069B2 (en) * | 2019-10-10 | 2022-08-30 | Boomcloud 360, Inc. | Spectrally orthogonal audio component processing |
| CN110855673B (zh) * | 2019-11-15 | 2021-08-24 | 成都威爱新经济技术研究院有限公司 | 一种复杂多媒体数据传输及处理方法 |
| US11348594B2 (en) * | 2020-06-11 | 2022-05-31 | Qualcomm Incorporated | Stream conformant bit error resilience |
| KR102784793B1 (ko) * | 2020-08-06 | 2025-03-21 | 라인플러스 주식회사 | 딥러닝을 이용한 시간 및 주파수 분석 기반의 노이즈 제거 방법 및 장치 |
| US12483272B2 (en) | 2021-02-18 | 2025-11-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Encoding and decoding complex data |
| CN113314130B (zh) * | 2021-05-07 | 2022-05-13 | 武汉大学 | 一种基于频谱搬移的音频对象编解码方法 |
| CN115567157B (zh) * | 2022-09-16 | 2025-05-16 | 南京邮电大学 | 一种基于即时可解码网络编码的速率感知网络编码方法及装置 |
| CN116032901B (zh) * | 2022-12-30 | 2024-07-26 | 北京天兵科技有限公司 | 多路音频数据信号采编方法、装置、系统、介质和设备 |
| CN119400161A (zh) * | 2024-09-19 | 2025-02-07 | 安徽江淮汽车集团股份有限公司 | 一种车内动态声音隔离方法、系统及车辆 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5394473A (en) * | 1990-04-12 | 1995-02-28 | Dolby Laboratories Licensing Corporation | Adaptive-block-length, adaptive-transforn, and adaptive-window transform coder, decoder, and encoder/decoder for high-quality audio |
Family Cites Families (32)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FR2680924B1 (fr) | 1991-09-03 | 1997-06-06 | France Telecom | Procede de filtrage adapte d'un signal transforme en sous-bandes, et dispositif de filtrage correspondant. |
| JP2642546B2 (ja) * | 1991-10-15 | 1997-08-20 | 沖電気工業株式会社 | 視覚特性の算出方法 |
| US5890106A (en) | 1996-03-19 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation |
| US6199039B1 (en) * | 1998-08-03 | 2001-03-06 | National Science Council | Synthesis subband filter in MPEG-II audio decoding |
| SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
| US6496795B1 (en) | 1999-05-05 | 2002-12-17 | Microsoft Corporation | Modulated complex lapped transform for integrated signal enhancement and coding |
| SE0004818D0 (sv) * | 2000-12-22 | 2000-12-22 | Coding Technologies Sweden Ab | Enhancing source coding systems by adaptive transposition |
| US6963842B2 (en) * | 2001-09-05 | 2005-11-08 | Creative Technology Ltd. | Efficient system and method for converting between different transform-domain signal representations |
| US7006699B2 (en) | 2002-03-27 | 2006-02-28 | Microsoft Corporation | System and method for progressively transforming and coding digital data |
| US20030187528A1 (en) | 2002-04-02 | 2003-10-02 | Ke-Chiang Chu | Efficient implementation of audio special effects |
| DE10234130B3 (de) | 2002-07-26 | 2004-02-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen einer komplexen Spektraldarstellung eines zeitdiskreten Signals |
| ES2259158T3 (es) | 2002-09-19 | 2006-09-16 | Matsushita Electric Industrial Co., Ltd. | Metodo y aparato decodificador audio. |
| ES2282899T3 (es) * | 2003-10-30 | 2007-10-16 | Koninklijke Philips Electronics N.V. | Codificacion o descodificacion de señales de audio. |
| US6980933B2 (en) | 2004-01-27 | 2005-12-27 | Dolby Laboratories Licensing Corporation | Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients |
| US20050265445A1 (en) | 2004-06-01 | 2005-12-01 | Jun Xin | Transcoding videos based on different transformation kernels |
| CN101025919B (zh) * | 2006-02-22 | 2011-04-20 | 上海奇码数字信息有限公司 | 音频解码中的合成子带滤波方法和合成子带滤波器 |
| DE102006047197B3 (de) | 2006-07-31 | 2008-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines reellen Subband-Signals zur Reduktion von Aliasing-Effekten |
| EP2015293A1 (en) * | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
| RU2451998C2 (ru) * | 2007-09-19 | 2012-05-27 | Квэлкомм Инкорпорейтед | Эффективный способ проектирования набора фильтров для mdct/imdct в приложениях для кодирования речи и аудиосигналов |
| US20110060433A1 (en) * | 2008-02-01 | 2011-03-10 | Lehigh University | Bilinear algorithms and vlsi implementations of forward and inverse mdct with applications to mp3 audio |
| ES2683077T3 (es) * | 2008-07-11 | 2018-09-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada |
| MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
| EP3002750B1 (en) | 2008-07-11 | 2017-11-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding audio samples |
| CN101751926B (zh) * | 2008-12-10 | 2012-07-04 | 华为技术有限公司 | 信号编码、解码方法及装置、编解码系统 |
| JP5597968B2 (ja) | 2009-07-01 | 2014-10-01 | ソニー株式会社 | 画像処理装置および方法、プログラム、並びに記録媒体 |
| EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
| KR101698439B1 (ko) * | 2010-04-09 | 2017-01-20 | 돌비 인터네셔널 에이비 | Mdct-기반의 복소수 예측 스테레오 코딩 |
| ES2911893T3 (es) * | 2010-04-13 | 2022-05-23 | Fraunhofer Ges Forschung | Codificador de audio, decodificador de audio y métodos relacionados para procesar señales de audio estéreo usando una dirección de predicción variable |
| US20130166307A1 (en) * | 2010-09-22 | 2013-06-27 | Dolby Laboratories Licensing Corporation | Efficient Implementation of Phase Shift Filtering for Decorrelation and Other Applications in an Audio Coding System |
| WO2013107602A1 (en) | 2012-01-20 | 2013-07-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for audio encoding and decoding employing sinusoidal substitution |
| GB2509055B (en) | 2012-12-11 | 2016-03-23 | Gurulogic Microsystems Oy | Encoder and method |
| JP6089878B2 (ja) * | 2013-03-28 | 2017-03-08 | 富士通株式会社 | 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置 |
-
2015
- 2015-06-17 EP EP15172542.1A patent/EP3067889A1/en not_active Withdrawn
-
2016
- 2016-02-24 TW TW105105525A patent/TWI590233B/zh active
- 2016-03-04 AR ARP160100580A patent/AR103859A1/es active IP Right Grant
- 2016-03-08 WO PCT/EP2016/054902 patent/WO2016142376A1/en not_active Ceased
- 2016-03-08 AU AU2016231239A patent/AU2016231239B2/en active Active
- 2016-03-08 PL PL16709345.9T patent/PL3268962T3/pl unknown
- 2016-03-08 EP EP23178648.4A patent/EP4235656A3/en active Pending
- 2016-03-08 CA CA2978821A patent/CA2978821C/en active Active
- 2016-03-08 KR KR1020177028552A patent/KR102101266B1/ko active Active
- 2016-03-08 EP EP16709345.9A patent/EP3268962B1/en active Active
- 2016-03-08 CN CN201680026851.0A patent/CN107592938B/zh active Active
- 2016-03-08 CN CN202110100367.0A patent/CN112786061B/zh active Active
- 2016-03-08 ES ES16709345T patent/ES2950286T3/es active Active
- 2016-03-08 SG SG11201707347PA patent/SG11201707347PA/en unknown
- 2016-03-08 MX MX2017011185A patent/MX372600B/es active IP Right Grant
- 2016-03-08 JP JP2017548011A patent/JP6728209B2/ja active Active
- 2016-03-08 RU RU2017134619A patent/RU2691231C2/ru active
-
2017
- 2017-09-06 US US15/696,934 patent/US10236008B2/en active Active
-
2019
- 2019-02-08 US US16/271,380 patent/US10706864B2/en active Active
-
2020
- 2020-06-11 US US16/899,406 patent/US11335354B2/en active Active
- 2020-07-01 JP JP2020114013A patent/JP7126328B2/ja active Active
-
2022
- 2022-04-15 US US17/722,027 patent/US11854559B2/en active Active
- 2022-08-12 JP JP2022128735A patent/JP7513669B2/ja active Active
-
2023
- 2023-11-16 US US18/511,741 patent/US12230286B2/en active Active
-
2024
- 2024-06-27 JP JP2024103916A patent/JP7708937B2/ja active Active
- 2024-12-26 US US19/002,077 patent/US20250201253A1/en active Pending
-
2025
- 2025-07-03 JP JP2025112733A patent/JP2025163020A/ja active Pending
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5394473A (en) * | 1990-04-12 | 1995-02-28 | Dolby Laboratories Licensing Corporation | Adaptive-block-length, adaptive-transforn, and adaptive-window transform coder, decoder, and encoder/decoder for high-quality audio |
Non-Patent Citations (2)
| Title |
|---|
| ISO/IEC FDIS 23003-3:2011(E), Information technology - MPEG audio technologies - Part 3: Unified speech and audio coding. ISO/IEC JTC 1/SC 29/WG 11. 2011.09.20. * |
| Max Neuendorf, et al. MPEG unified speech and audio coding-the ISO/MPEG standard for high-efficiency audio coding of all content types. Audio Engineering Society Convention 132. 2012.04.29.* * |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2020004883A1 (ko) * | 2018-06-25 | 2020-01-02 | 네이버 주식회사 | 오디오 병렬 트랜스코딩을 위한 방법 및 시스템 |
| US11437052B2 (en) | 2018-06-25 | 2022-09-06 | Naver Corporation | Method and system for parallel audio transcoding |
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7126328B2 (ja) | 符号化されたオーディオ信号を復号するためのデコーダおよびオーディオ信号を符号化するためのエンコーダ | |
| CN103052983B (zh) | 音频或视频编码器、音频或视频解码器及编码和解码方法 | |
| HK40097131A (en) | Decoder for decoding an encoded audio signal and encoder for encoding an audio signal | |
| HK40045339A (en) | Decoder for decoding an encoded audio signal and encoder for encoding an audio signal | |
| HK40045339B (zh) | 对编码音频信号解码的解码器和编码音频信号的编码器 | |
| HK1244582A1 (en) | Decoder for decoding an encoded audio signal and encoder for encoding an audio signal | |
| HK1244582B (en) | Decoder for decoding an encoded audio signal and encoder for encoding an audio signal | |
| HK1183740B (en) | Audio or video encoder, audio or video decoder and method of encoding and decoding | |
| BR112017019179B1 (pt) | Decodificador para decodificar um sinal de áudio codificado e codificador para codificar um sinal de áudio |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0105 | International application |
St.27 status event code: A-0-1-A10-A15-nap-PA0105 |
|
| A201 | Request for examination | ||
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| E13-X000 | Pre-grant limitation requested |
St.27 status event code: A-2-3-E10-E13-lim-X000 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U12-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 5 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 6 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 7 |
|
| U11 | Full renewal or maintenance fee paid |
Free format text: ST27 STATUS EVENT CODE: A-4-4-U10-U11-OTH-PR1001 (AS PROVIDED BY THE NATIONAL OFFICE) Year of fee payment: 7 |










