KR20170076671A - 오디오 신호들의 인코딩 및 디코딩 - Google Patents
오디오 신호들의 인코딩 및 디코딩 Download PDFInfo
- Publication number
- KR20170076671A KR20170076671A KR1020177010760A KR20177010760A KR20170076671A KR 20170076671 A KR20170076671 A KR 20170076671A KR 1020177010760 A KR1020177010760 A KR 1020177010760A KR 20177010760 A KR20177010760 A KR 20177010760A KR 20170076671 A KR20170076671 A KR 20170076671A
- Authority
- KR
- South Korea
- Prior art keywords
- bitstream
- audio
- audio data
- audio signal
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
- H04N21/2335—Processing of audio elementary streams involving reformatting operations of audio signals, e.g. by converting from one coding standard to another
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23418—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Description
도 1은 예시적인 실시예에 따른, 오디오 신호를 오디오 비트스트림으로서 나타내기 위한 오디오 프로세싱 시스템의 일반화된 블록도이다.
도 2는 예시적인 실시예에 따른, 오디오 신호를 오디오 비트스트림으로서 나타내는 방법의 플로우 차트이다.
도 3 및 4는 예시적인 실시예들에 따른, 도 1에 도시된 오디오 프로세싱 시스템에 의해 제공되는 오디오 비트스트림의 예들을 예시한다.
도 5는 예시적인 실시예에 따른, 비트스트림에 의해 표현되는 오디오 신호를 재구성하기 위한 오디오 프로세싱 시스템의 일반화된 블록도이다.
도 6은 예시적인 실시예에 따른, 비트스트림에 의해 표현되는 오디오 신호를 재구성하는 방법의 플로우 차트이다.
도 7은 예시적인 실시예에 따른, 오디오 신호를 나타내는 오디오 비트스트림을 트랜스코딩하기 위한 오디오 프로세싱 시스템의 일반화된 블록도이다.
모든 도면들은 개략적이며, 발명을 설명하기 위해 필요한 파트들만을 일반적으로 도시하는 반면, 다른 파트들은 생략될 수 있거나 시사되기만 할 수 있다.
Claims (25)
- 오디오 신호(X)를 오디오 비트스트림(B)으로서 나타내는 방법(200)으로서,
상기 오디오 신호의 샘플들의 제1 개수에 대응하는 기본 스트라이드(basic stride)를 이용하여, 상기 오디오 신호의 세그먼트 상에서, 적어도 신호 분석을 수행함으로써 상기 오디오 신호의 세그먼트를 오디오 데이터의 하나의 디코딩가능한 세트(D)로서 인코딩(220)하는 단계 ― 상기 오디오 데이터의 디코딩가능한 세트는 제1 프레임 레이트에 그리고 프레임 당 오디오 신호의 샘플들의 제1 개수에 대응함 ― ;
상기 오디오 데이터의 디코딩가능한 세트를 N개 부분들(D1, D2, ..., DN)로 나누는 단계(230) ― 여기서, N ≥ 2임 ― ;
각자의 상기 부분들을 반송하는 N개의 비트스트림 프레임들(F1, F2, ..., FN)을 형성하는 단계(240) ― 상기 비트스트림 프레임들은 비트스트림 프레임 당 오디오 신호의 샘플들의 제2 개수에 대응하는 제2 프레임 레이트를 가지고, 상기 샘플들의 제1 개수는 상기 샘플들의 제2 개수의 N배임 ― ; 및
이전에 형성된 N개의 비트스트림 프레임들을 포함하는 비트스트림 프레임들로 세그먼트화된 비트스트림을 출력하는 단계(250)
를 포함하는, 방법. - 제1항에 있어서,
상기 신호 분석을 수행하는 것은, 상기 기본 스트라이드를 이용하여,
스펙트럼 분석,
에너지 분석,
엔트로피 분석
을 포함하는 그룹 중 적어도 하나를 수행하는 것을 포함하는, 방법. - 제1항 또는 제2항에 있어서,
상기 오디오 신호의 세그먼트를 인코딩하는 단계는:
상기 기본 스트라이드를 변환 스트라이드로서 가지는 윈도우화된 변환을 적용하는 것;
다운믹스 신호(downmix signal), 및 상기 다운믹스 신호로부터의 상기 오디오 신호의 파라메트릭(parametric) 재구성을 위한 파라미터들을 계산하는 것 - 상기 파라미터들은 상기 신호 분석에 기초하여 계산됨 -
을 포함하는 그룹 중 적어도 하나를 포함하는, 방법. - 제1항 내지 제3항 중 어느 한 항에 있어서,
상기 부분들을 반송하는 N개의 비트스트림 프레임들 중 적어도 하나 내에 메타데이터(μ1, μ2, ..., μN)를 포함시키는 단계 - 상기 메타데이터는 오디오 데이터의 완전한 디코딩가능한 세트가 상기 N개의 비트스트림 프레임들에 의해 반송되는 부분들로부터 획득가능함을 나타냄 - 를 더 포함하는, 방법. - 제1항 내지 제4항 중 어느 한 항에 있어서,
상기 오디오 비트스트림은 비디오 프레임들(V1, V2)의 스트림과 연관되고, 상기 방법은:
특정 타입(I)의 비디오 프레임을 포함하는 상기 비디오 프레임들의 스트림에 응답하여, 상기 오디오 신호의 샘플들의 상기 제2 개수에 대응하는 단축된 스트라이드를 이용하여, 상기 비디오 프레임에 시간상으로 관련된 오디오 신호의 세그먼트 상에서, 적어도 신호 분석을 수행함으로써 상기 비디오 프레임에 시간상으로 관련된 오디오 신호의 세그먼트를 오디오 데이터의 제2 디코딩가능한 세트로서 인코딩하는 단계(260) ― 상기 오디오 데이터의 제2 디코딩가능한 세트는 상기 제2 프레임 레이트에 그리고 프레임 당 오디오 신호의 샘플들의 상기 제2 개수에 대응함 ― ; 및
상기 비트스트림 내에 오디오 데이터의 제2 디코딩가능한 세트를 반송하는 비트스트림 프레임(321)을 포함시키는 단계(270)
를 더 포함하는, 방법. - 제5항에 있어서,
상기 타입의 비디오 프레임을 포함하는 상기 비디오 프레임들의 스트림에 응답하여, N개의 연속적인 세그먼트들 각각에 대해, 적어도 단축된 스트라이드를 이용한 신호 분석을 적용함으로써 상기 오디오 신호의 N개의 연속적인 세그먼트들을 오디오 데이터의 각자의 디코딩가능한 세트들로서 인코딩하는 단계 ― 상기 비디오 프레임에 시간 상으로 관련된 상기 세그먼트는 상기 N개의 연속적인 세그먼트들 중 하나임 ― ; 및
상기 비트스트림 내에 상기 N개의 연속적인 세그먼트들과 연관된 오디오 데이터의 각자의 디코딩가능한 세트들을 반송하는 비트스트림 프레임들(421, 422, 423, 424)을 포함시키는 단계
를 포함하는, 방법. - 오디오 신호(X)를 오디오 비트스트림(B)에 의해 나타내기 위한 오디오 프로세싱 시스템(100)으로서,
상기 오디오 신호의 샘플들의 제1 개수에 대응하는 기본 스트라이드를 이용하여, 상기 오디오 신호의 세그먼트 상에서, 적어도 신호 분석을 수행함으로써 상기 오디오 신호의 세그먼트를 오디오 데이터의 하나의 디코딩가능한 세트(D)로서 인코딩하도록 구성되는 인코딩 섹션(110) ― 상기 오디오 데이터의 디코딩가능한 세트는 제1 프레임 레이트에 그리고 프레임 당 오디오 신호의 샘플들의 제1 개수에 대응함 ― ;
상기 오디오 데이터의 디코딩가능한 세트를 N개 부분들(D1, D2, ..., DN)로 나누고 ― 여기서, N ≥ 2임 ― ;
각자의 상기 부분들을 반송하는 N개의 비트스트림 프레임들(F1, F2, ..., FN)을 형성하고 ― 상기 비트스트림 프레임들은 비트스트림 프레임 당 오디오 신호의 샘플들의 제2 개수에 대응하는 제2 프레임 레이트를 가지고, 상기 샘플들의 제1 개수는 상기 샘플들의 제2 개수의 N배임 ― ;
이전에 형성된 N개의 비트스트림 프레임들을 포함하는 비트스트림 프레임들로 세그먼트화된 비트스트림을 출력하도록
구성되는 리프레이밍 섹션(reframing section)(120)
을 포함하는, 시스템. - 비트스트림 프레임들로 세그먼트화된 비트스트림(B)에 의해 표현되는 오디오 신호(X)를 재구성하는 방법(600)으로서,
N개의 각자의 비트스트림 프레임들(F1, F2, ..., FN)에 의해 반송되는 오디오 데이터의 세트들(D1, D2, ..., DN)을, 제1 프레임 레이트에 그리고 프레임 당 오디오 신호의 샘플들의 제1 개수에 대응하는 오디오 데이터의 하나의 디코딩가능한 세트(D)로 결합시키는 단계(620) ― 여기서, N ≥ 2이고, 비트스트림 프레임들은 비트스트림 프레임 당 오디오 신호의 샘플들의 제2 개수에 대응하는 제2 프레임 레이트를 가지고, 상기 샘플들의 제1 개수는 상기 샘플들의 제2 개수의 N배임 ― ; 및
상기 오디오 신호의 샘플들의 제1 개수에 대응하는 기본 스트라이드를 이용하여, 상기 데이터의 디코딩가능한 세트에 기초하여, 적어도 신호 합성을 사용함으로써 상기 오디오 데이터의 디코딩가능한 세트를 오디오 신호의 세그먼트로 디코딩하는 단계(630)
를 포함하는, 방법. - 제8항에 있어서,
상기 오디오 데이터의 디코딩가능한 세트를 디코딩하는 단계는:
상기 기본 스트라이드를 변환 스트라이드로서 가지는 윈도우화된 변환을 적용하는 것;
다운믹스 신호, 및 오디오 데이터의 디코딩가능한 세트로부터 획득되는 연관된 파라미터들에 기초하여, 상기 오디오 신호의 세그먼트의, 상기 기본 스트라이드를 이용한, 파라메트릭 재구성을 수행하는 것
을 포함하는 그룹 중 적어도 하나를 포함하는, 방법. - 제8항 또는 제9항에 있어서,
오디오 데이터의 세트들이 오디오 데이터의 디코딩가능한 세트로 결합되는, 상기 N개의 비트스트림 프레임들은 N개의 연속적인 비트스트림 프레임들인, 방법. - 제8항 내지 제10항 중 어느 한 항에 있어서,
상기 비트스트림 내의 비트스트림 프레임들의 적어도 일부에 의해 반송되는 메타데이터(μ1, μ2, ..., μN)에 기초하여, 오디오 데이터의 불완전한 세트들을 오디오 데이터의 디코딩가능한 세트로 결합시킬 비트스트림 프레임들의 그룹을 결정하는 단계를 더 포함하는, 방법. - 제8항 내지 제11항 중 어느 한 항에 있어서,
비트스트림 프레임이 상기 제2 프레임 레이트에 대응하는 오디오 데이터의 디코딩가능한 세트를 반송하는지를 검출하는 단계(610); 및
상기 샘플들의 제2 개수에 대응하는 단축된 스트라이드를 이용하여, 상기 제2 프레임 레이트에 대응하는 오디오 데이터의 디코딩가능한 세트에 기초하여, 적어도 신호 합성을 사용함으로써 상기 제2 프레임 레이트에 대응하는 오디오 데이터의 디코딩가능한 세트를 상기 오디오 신호의 세그먼트로 디코딩하는 단계(640)
를 더 포함하는, 방법. - 제12항에 있어서,
상기 제2 프레임 레이트에 대응하는 오디오 데이터의 디코딩가능한 세트를 디코딩하는 단계는, N개의 비트스트림 프레임들의 그룹의 비트스트림 프레임들이 각각 오디오 데이터의 디코딩가능한 세트로 결합할 것을 요구하는 오디오 데이터의 세트들을 반송한 것처럼 동시에 상기 제2 프레임 레이트에서 N개의 연속적인 비트스트림 프레임들의 그룹의 디코딩이 완료되도록 지연을 제공하는 것을 포함하는, 방법. - 제13항에 있어서,
상기 지연은 상기 제2 프레임 레이트에 대응하는 오디오 데이터의 적어도 하나의 디코딩가능한 세트를 버퍼링시키거나, 또는 상기 오디오 신호의 적어도 하나의 세그먼트를 버퍼링시킴으로써 제공되는, 방법. - 제8항 내지 제14항 중 어느 한 항에 있어서,
상기 비트스트림은 상기 제2 프레임 레이트와 일치하는 프레임 레이트를 가지는 비디오 프레임들(V1, V2)의 스트림과 연관되는, 방법. - 제8항 내지 제15항 중 어느 한 항에 있어서,
상기 제1 프레임 레이트에 대응하는 오디오 데이터의 디코딩가능한 세트에 기초하여 상기 오디오 신호의 세그먼트를 디코딩하는 단계는:
상기 제1 프레임 레이트에 대응하는 오디오 데이터의 디코딩가능한 세트에 대응하는 양자화된 스펙트럼 계수들을 수신하는 것;
역양자화를 수행하며 후속적으로 주파수-대-시간 변환을 수행하여, 이에 의해 중간 오디오 신호의 표현이 획득되는 것;
상기 중간 오디오 신호에 대해 주파수 도메인에서 적어도 하나의 프로세싱 단계를 수행하는 것; 및
상기 프로세싱된 오디오 신호의 샘플링 레이트를 타겟 샘플링 주파수로 변경시켜서, 이에 의해 재구성된 오디오 신호의 시간-도메인 표현이 획득되는 것
을 포함하는, 방법. - 제16항에 있어서,
상기 제2 프레임 레이트에 대한 적어도 2개의 상이한 값들과 연관되지만 프레임 당 샘플들의 제2 개수에 대한 공통 값과 연관되는 비트스트림들을 수용하는 단계를 더 포함하고, 상기 제2 프레임 레이트의 각자의 값들은 기껏해야 5%만큼 상이하고, 상기 주파수-대-시간 변환은 상기 제2 프레임 레이트에 대한 상기 적어도 2개의 상이한 값들에 대한 변환 스트라이드로서 상기 기본 스트라이드에 대한 공통의 미리 정의된 값을 가지는 윈도우화된 변환을 사용하도록 구성되는 기능 컴포넌트에서 수행되는, 방법. - 비트스트림 프레임들로 세그먼트화된 비트스트림(B)에 의해 표현되는 오디오 신호(X)를 재구성하기 위한 오디오 프로세싱 시스템(500)으로서,
N개의 각자의 비트스트림 프레임들(F1, F2, ..., FN)에 의해 반송되는 오디오 데이터의 세트들(D1, D2, ..., DN)을 제1 프레임 레이트에 그리고 프레임 당 오디오 신호의 샘플들의 제1 개수에 대응하는 오디오 데이터의 하나의 디코딩가능한 세트(D)로 결합시키도록 구성되는 버퍼(510) ― 여기서, N ≥ 2이고, 상기 비트스트림 프레임들은 비트스트림 프레임 당 오디오 신호의 샘플들의 제2 개수에 대응하는 제2 프레임 레이트를 가지고, 상기 샘플들의 제1 개수는 상기 샘플들의 제2 개수의 N배임 ― ; 및
상기 오디오 신호의 샘플들의 제1 개수에 대응하는 기본 스트라이드를 이용하여, 상기 오디오 데이터의 디코딩가능한 세트에 기초하여, 적어도 신호 합성을 사용함으로써 상기 오디오 데이터의 디코딩가능한 세트를 상기 오디오 신호의 세그먼트로 디코딩하도록 구성되는 디코딩 섹션(520)
을 포함하는, 시스템. - 오디오 신호(X)를 나타내는 오디오 비트스트림(B1)을 트랜스코딩하는 방법으로서,
상기 비트스트림은 제1 프레임 레이트에 그리고 프레임 당 오디오 신호의 샘플들의 제1 개수에 대응하는 오디오 데이터의 디코딩가능한 세트들의 시퀀스를 포함하며, 상기 방법은:
상기 비트스트림으로부터 오디오 데이터의 디코딩가능한 세트(D)를 추출하는 단계;
상기 오디오 데이터의 디코딩가능한 세트를 N개 부분들(D1, D2, ..., DN)로 나누는 단계 ― 여기서, N ≥ 2임 ― ;
각자의 상기 부분들을 반송하는 N 개의 비트스트림 프레임들(F1, F2, ..., FN)을 형성하는 단계 ― 상기 비트스트림 프레임들은 비트스트림 프레임 당 오디오 신호의 샘플들의 제2 개수에 대응하는 제2 프레임 레이트를 가지고, 상기 샘플들의 제1 개수는 상기 샘플들의 제2 개수의 N배임 ― ; 및
이전에 형성된 N개의 비트스트림 프레임들을 포함하는 비트스트림 프레임들로 세그먼트화된 비트스트림(B2)을 출력하는 단계
를 포함하는, 방법. - 오디오 신호(X)를 나타내는 오디오 비트스트림(B1)을 트랜스코딩하기 위한 오디오 프로세싱 시스템(700)으로서,
상기 비트스트림은 제1 프레임 레이트에 그리고 프레임 당 오디오 신호의 샘플들의 제1 개수에 대응하는 오디오 데이터의 디코딩가능한 세트들의 시퀀스를 포함하고, 상기 오디오 프로세싱 시스템은:
상기 비트스트림으로부터 오디오 데이터의 디코딩가능한 세트(D)를 추출하도록 구성되는 수신 섹션(710); 및
상기 오디오 데이터의 디코딩가능한 세트를 N개 부분들(D1, D2, ..., DN)로 나누고 ― 여기서, N ≥ 2임 ― ;
각자의 상기 부분들을 반송하는 N개의 비트스트림 프레임들(F1, F2, ..., FN)을 형성하고 ― 상기 비트스트림 프레임들은 비트스트림 프레임 당 오디오 신호의 샘플들의 제2 개수에 대응하는 제2 프레임 레이트를 가지고, 상기 샘플들의 제1 개수는 상기 샘플들의 제2 개수의 N배임 ― ;
이전에 형성된 N개의 비트스트림 프레임들을 포함하는 비트스트림 프레임들로 세그먼트화된 비트스트림(B2)을 출력하도록
구성되는 리프레이밍 섹션(730)
을 포함하는, 시스템. - 제1항 내지 제6항, 제8항 내지 제17항, 및 제19항 중 어느 한 항의 방법을 수행하기 위한 명령어들을 가지는 컴퓨터-판독가능한 매체를 포함하는, 컴퓨터 프로그램 제품.
- 오디오 신호(X)를 나타내며 비트스트림 프레임들로 세그먼트화되는 컴퓨터-판독가능한 매체(B, A1, A2)로서,
N개의 비트스트림 프레임들(F1, F2, ..., FN)은 제1 프레임 레이트에 그리고 프레임 당 오디오 신호의 샘플들의 제1 개수에 대응하는 오디오 데이터의 하나의 디코딩가능한 세트(D)로 결합가능한 오디오 데이터의 각자의 세트들(D1, D2, ..., DN)을 반송하고, 여기서 N ≥ 2이고;
상기 오디오 데이터의 디코딩가능한 세트는, 상기 오디오 신호의 샘플들의 제1 개수에 대응하는 기본 스트라이드를 이용하여, 상기 오디오 데이터의 디코딩가능한 세트에 기초하여, 적어도 신호 합성을 사용함으로써 상기 오디오 신호의 세그먼트로 디코딩가능하고;
상기 비트스트림 프레임들은 비트스트림 프레임 당 오디오 신호의 샘플들의 제2 개수에 대응하는 제2 프레임 레이트를 가지고;
상기 샘플들의 제1 개수는 상기 샘플들의 제2 개수의 N배인, 컴퓨터-판독가능한 매체. - 제22항에 있어서,
상기 N개의 비트스트림 프레임들 중 적어도 하나는 오디오 데이터의 세트들을 오디오 데이터의 디코딩가능한 세트로 결합시킬 비트스트림 프레임들의 그룹을 나타내는 메타데이터(μ1, μ2, ..., μN)를 반송하는, 컴퓨터-판독가능한 매체. - 제22항 또는 제23항에 있어서,
상기 오디오 신호의 샘플들의 제2 개수에 대응하는 단축된 스트라이드를 이용하여, 상기 오디오 데이터의 제2 세트에 기초하여, 적어도 신호 합성을 사용함으로써 상기 오디오 신호의 세그먼트로 디코딩가능한 오디오 데이터의 제2 세트를 반송하는 비트스트림 프레임(321)을 더 포함하는, 컴퓨터-판독가능한 매체. - N=2 또는 N=4인, 제1항 내지 제6항, 제8항 내지 제17항 및 제19항 중 어느 한 항의 방법, 제7항, 제18항 및 제20항 중 어느 한 항의 시스템, 제21항의 컴퓨터 프로그램 제품, 또는 제22항 내지 제24항 중 어느 한 항의 컴퓨터-판독가능한 매체.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201462068187P | 2014-10-24 | 2014-10-24 | |
| US62/068,187 | 2014-10-24 | ||
| PCT/EP2015/074623 WO2016062869A1 (en) | 2014-10-24 | 2015-10-23 | Encoding and decoding of audio signals |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20170076671A true KR20170076671A (ko) | 2017-07-04 |
| KR102474541B1 KR102474541B1 (ko) | 2022-12-06 |
Family
ID=54345511
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020177010760A Active KR102474541B1 (ko) | 2014-10-24 | 2015-10-23 | 오디오 신호들의 인코딩 및 디코딩 |
Country Status (8)
| Country | Link |
|---|---|
| US (1) | US10304471B2 (ko) |
| EP (1) | EP3210206B1 (ko) |
| JP (1) | JP6728154B2 (ko) |
| KR (1) | KR102474541B1 (ko) |
| CN (1) | CN107112024B (ko) |
| ES (1) | ES2709274T3 (ko) |
| RU (1) | RU2708942C2 (ko) |
| WO (1) | WO2016062869A1 (ko) |
Families Citing this family (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP3107096A1 (en) | 2015-06-16 | 2016-12-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Downscaled decoding |
| CN109215667B (zh) | 2017-06-29 | 2020-12-22 | 华为技术有限公司 | 时延估计方法及装置 |
| WO2019089341A1 (en) * | 2017-11-02 | 2019-05-09 | Bose Corporation | Low latency audio distribution |
| US20200020342A1 (en) * | 2018-07-12 | 2020-01-16 | Qualcomm Incorporated | Error concealment for audio data using reference pools |
| US11416208B2 (en) * | 2019-09-23 | 2022-08-16 | Netflix, Inc. | Audio metadata smoothing |
| KR102838273B1 (ko) | 2019-11-27 | 2025-07-25 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 코딩을 위한 음조 신호의 주파수 도메인 장기 예측을 위한 인코더, 디코더, 인코딩 방법 및 디코딩 방법 |
| US11540030B2 (en) * | 2019-12-12 | 2022-12-27 | SquadCast, Inc. | Simultaneous recording and uploading of multiple audio files of the same conversation and audio drift normalization systems and methods |
| WO2022179406A1 (zh) * | 2021-02-26 | 2022-09-01 | 腾讯科技(深圳)有限公司 | 音频转码方法、装置、音频转码器、设备以及存储介质 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5936925A (en) * | 1996-04-08 | 1999-08-10 | Pioneer Electronic Corporation | Information record medium, apparatus for recording the same and apparatus for reproducing the same |
| WO2014113478A1 (en) * | 2013-01-21 | 2014-07-24 | Dolby Laboratories Licensing Corporation | Metadata transcoding |
Family Cites Families (36)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6009236A (en) * | 1994-09-26 | 1999-12-28 | Mitsubishi Denki Kabushiki Kaisha | Digital video signal record and playback device and method for giving priority to a center of an I frame |
| US6137834A (en) * | 1996-05-29 | 2000-10-24 | Sarnoff Corporation | Method and apparatus for splicing compressed information streams |
| US6262776B1 (en) * | 1996-12-13 | 2001-07-17 | Microsoft Corporation | System and method for maintaining synchronization between audio and video |
| US7031348B1 (en) * | 1998-04-04 | 2006-04-18 | Optibase, Ltd. | Apparatus and method of splicing digital video streams |
| US7091968B1 (en) * | 1998-07-23 | 2006-08-15 | Sedna Patent Services, Llc | Method and apparatus for encoding a user interface |
| US6754271B1 (en) * | 1999-04-15 | 2004-06-22 | Diva Systems Corporation | Temporal slice persistence method and apparatus for delivery of interactive program guide |
| US7254824B1 (en) * | 1999-04-15 | 2007-08-07 | Sedna Patent Services, Llc | Encoding optimization techniques for encoding program grid section of server-centric interactive programming guide |
| US7096487B1 (en) * | 1999-10-27 | 2006-08-22 | Sedna Patent Services, Llc | Apparatus and method for combining realtime and non-realtime encoded content |
| US6651252B1 (en) * | 1999-10-27 | 2003-11-18 | Diva Systems Corporation | Method and apparatus for transmitting video and graphics in a compressed form |
| US20060093045A1 (en) * | 1999-06-29 | 2006-05-04 | Roger Anderson | Method and apparatus for splicing |
| US7464394B1 (en) * | 1999-07-22 | 2008-12-09 | Sedna Patent Services, Llc | Music interface for media-rich interactive program guide |
| AU1576801A (en) * | 1999-10-27 | 2001-05-08 | Diva Systems Corporation | Picture-in-picture and multiple video streams using slice-based encoding |
| US9094727B1 (en) * | 1999-10-27 | 2015-07-28 | Cox Communications, Inc. | Multi-functional user interface using slice-based encoding |
| US6678332B1 (en) * | 2000-01-04 | 2004-01-13 | Emc Corporation | Seamless splicing of encoded MPEG video and audio |
| WO2003038812A1 (en) * | 2001-11-02 | 2003-05-08 | Matsushita Electric Industrial Co., Ltd. | Audio encoding and decoding device |
| EP1472889B1 (en) * | 2002-01-18 | 2008-05-21 | Koninklijke Philips Electronics N.V. | Audio coding |
| KR100547445B1 (ko) * | 2003-11-11 | 2006-01-31 | 주식회사 코스모탄 | 디지털 오디오신호 및 오디오/비디오신호의 변속처리방법및 이를 이용한 디지털 방송신호의 변속재생방법 |
| US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
| US7471337B2 (en) * | 2004-06-09 | 2008-12-30 | Lsi Corporation | Method of audio-video synchronization |
| SE0402651D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Advanced methods for interpolation and parameter signalling |
| US20070071091A1 (en) | 2005-09-26 | 2007-03-29 | Juh-Huei Lay | Audio and video compression for wireless data stream transmission |
| US7809018B2 (en) * | 2005-12-16 | 2010-10-05 | Coding Technologies Ab | Apparatus for generating and interpreting a data stream with segments having specified entry points |
| WO2008039045A1 (en) * | 2006-09-29 | 2008-04-03 | Lg Electronics Inc., | Apparatus for processing mix signal and method thereof |
| EP2642483B1 (en) * | 2006-11-30 | 2015-01-07 | Dolby Laboratories Licensing Corporation | Extracting features of video&audio signal content to provide reliable identification of the signals |
| US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
| EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
| KR20100061908A (ko) * | 2008-12-01 | 2010-06-10 | 엘지전자 주식회사 | 영상표시장치, 영상전송장치, 영상전송방법 및 기록매체 |
| CN102342127A (zh) * | 2009-01-28 | 2012-02-01 | 诺基亚公司 | 用于视频编码和解码的方法和装置 |
| US8848925B2 (en) * | 2009-09-11 | 2014-09-30 | Nokia Corporation | Method, apparatus and computer program product for audio coding |
| US20110293021A1 (en) * | 2010-05-28 | 2011-12-01 | Jayant Kotalwar | Prevent audio loss in the spliced content generated by the packet level video splicer |
| JP5741064B2 (ja) * | 2011-03-01 | 2015-07-01 | 日本電気株式会社 | 映像音声処理装置および映像音声処理方法 |
| WO2013006342A1 (en) * | 2011-07-01 | 2013-01-10 | Dolby Laboratories Licensing Corporation | Synchronization and switchover methods and systems for an adaptive audio system |
| US20130141643A1 (en) * | 2011-12-06 | 2013-06-06 | Doug Carson & Associates, Inc. | Audio-Video Frame Synchronization in a Multimedia Stream |
| CN105074818B (zh) * | 2013-02-21 | 2019-08-13 | 杜比国际公司 | 音频编码系统、用于产生比特流的方法以及音频解码器 |
| US9959875B2 (en) * | 2013-03-01 | 2018-05-01 | Qualcomm Incorporated | Specifying spherical harmonic and/or higher order ambisonics coefficients in bitstreams |
| TWI557727B (zh) * | 2013-04-05 | 2016-11-11 | 杜比國際公司 | 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品 |
-
2015
- 2015-10-23 CN CN201580057771.7A patent/CN107112024B/zh active Active
- 2015-10-23 RU RU2017117896A patent/RU2708942C2/ru active
- 2015-10-23 EP EP15784396.2A patent/EP3210206B1/en active Active
- 2015-10-23 US US15/519,007 patent/US10304471B2/en active Active
- 2015-10-23 WO PCT/EP2015/074623 patent/WO2016062869A1/en not_active Ceased
- 2015-10-23 ES ES15784396T patent/ES2709274T3/es active Active
- 2015-10-23 KR KR1020177010760A patent/KR102474541B1/ko active Active
- 2015-10-23 JP JP2017520943A patent/JP6728154B2/ja active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5936925A (en) * | 1996-04-08 | 1999-08-10 | Pioneer Electronic Corporation | Information record medium, apparatus for recording the same and apparatus for reproducing the same |
| WO2014113478A1 (en) * | 2013-01-21 | 2014-07-24 | Dolby Laboratories Licensing Corporation | Metadata transcoding |
Non-Patent Citations (3)
| Title |
|---|
| ATSC Standard: Digital Audio Compression (AC-3). Advanced Television Systems Committee. Doc.A/52:2012. 2012.12.17. * |
| Request for Comments: 3550, RTP: A Transport Protocol for Real-Time Applications, 2003.07. * |
| SCHULZRINNE, Henning, et al. RTP: A Transport Protocol for Real-Time Applications, https://www.rfc-editor.org/rfc/rfc3550.txt IETF RFC 3550 . July 2003 * |
Also Published As
| Publication number | Publication date |
|---|---|
| JP6728154B2 (ja) | 2020-07-22 |
| RU2708942C2 (ru) | 2019-12-12 |
| EP3210206A1 (en) | 2017-08-30 |
| US20170243595A1 (en) | 2017-08-24 |
| US10304471B2 (en) | 2019-05-28 |
| EP3210206B1 (en) | 2018-12-05 |
| RU2017117896A (ru) | 2018-11-26 |
| JP2017532603A (ja) | 2017-11-02 |
| BR112017007833A2 (pt) | 2017-12-26 |
| RU2017117896A3 (ko) | 2019-08-13 |
| ES2709274T3 (es) | 2019-04-15 |
| CN107112024A (zh) | 2017-08-29 |
| WO2016062869A1 (en) | 2016-04-28 |
| CN107112024B (zh) | 2020-07-14 |
| KR102474541B1 (ko) | 2022-12-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12243549B2 (en) | Method, apparatus and systems for audio decoding and encoding | |
| KR102474541B1 (ko) | 오디오 신호들의 인코딩 및 디코딩 | |
| EP1895511B1 (en) | Audio encoding apparatus, audio decoding apparatus and audio encoding information transmitting apparatus | |
| EP2559029B1 (en) | Method and encoder and decoder for gap-less playback of an audio signal | |
| EP1472889B1 (en) | Audio coding | |
| HK40109503A (en) | Decoding sample-accurate representation of an audio signal | |
| HK40004396A (en) | Decoding sample-accurate representation of an audio signal | |
| HK1221327B (en) | Audio encoder and decoder | |
| HK1182519A (en) | Method and encoder and decoder for gap-less playback of an audio signal | |
| HK1182519B (en) | Method and encoder and decoder for gap-less playback of an audio signal |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| E13-X000 | Pre-grant limitation requested |
St.27 status event code: A-2-3-E10-E13-lim-X000 |
|
| PA0105 | International application |
St.27 status event code: A-0-1-A10-A15-nap-PA0105 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| A201 | Request for examination | ||
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U12-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
| U11 | Full renewal or maintenance fee paid |
Free format text: ST27 STATUS EVENT CODE: A-4-4-U10-U11-OTH-PR1001 (AS PROVIDED BY THE NATIONAL OFFICE) Year of fee payment: 4 |
