JP7704802B2 - 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法 - Google Patents
改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法 Download PDFInfo
- Publication number
- JP7704802B2 JP7704802B2 JP2023078313A JP2023078313A JP7704802B2 JP 7704802 B2 JP7704802 B2 JP 7704802B2 JP 2023078313 A JP2023078313 A JP 2023078313A JP 2023078313 A JP2023078313 A JP 2023078313A JP 7704802 B2 JP7704802 B2 JP 7704802B2
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- channel
- signal
- spectral band
- spectral
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
Description
-オーディオ入力信号の第1チャンネルに依存すると共に、オーディオ入力信号の第2チャンネルに依存するオーディオ入力信号のための正規化値を決定すること。
-正規化値に依存して、オーディオ入力信号の第1チャンネルおよび第2チャンネルのうちの少なくとも1つを変調することによって、正規化されたオーディオ信号の第1チャンネルおよび第2チャンネルを決定すること。
-処理されたオーディオ信号の第1チャンネルの1つ以上のスペクトル帯域が、正規化されたオーディオ信号の第1チャンネルの1つ以上のスペクトル帯域であるように、かつ、処理されたオーディオ信号の第2チャンネルの1つ以上のスペクトル帯域が、正規化されたオーディオ信号の第2チャンネルの1つ以上のスペクトル帯域であるように、かつ、処理されたオーディオ信号の第1チャンネルの少なくとも1つのスペクトル帯域が、正規化されたオーディオ信号の第1チャンネルのスペクトル帯域に依存すると共に、正規化されたオーディオ信号の第2チャンネルのスペクトル帯域に依存して、ミッド信号のスペクトル帯域であるように、かつ、処理されたオーディオ信号の第2チャンネルの少なくとも1つのスペクトル帯域が、正規化されたオーディオ信号の第1チャンネルのスペクトル帯域に依存すると共に、正規化されたオーディオ信号の第2チャンネルのスペクトル帯域に依存して、サイド信号のスペクトル帯域であるように、第1チャンネルおよび第2チャンネルを持つ処理されたオーディオ信号を生成し、そして、符号化されたオーディオ信号を得るために、処理されたオーディオ信号を符号化すること。
-符号化されたオーディオ信号の第1チャンネルの前記スペクトル帯域および符号化されたオーディオ信号の第2チャンネルの前記スペクトル帯域が、デュアル-モノ符号化またはミッド-サイド符号化を使用して符号化されたかを、複数のスペクトル帯域の個々のスペクトル帯域毎に決定すること。
-デュアル-モノ符号化が使われていた場合、中間オーディオ信号の第1チャンネルのスペクトル帯域として、符号化されたオーディオ信号の第1チャンネルの前記スペクトル帯域を使うと共に、中間オーディオ信号の第2チャンネルのスペクトル帯域として、符号化されたオーディオ信号の第2チャンネルの前記スペクトル帯域を使うこと。
―ミッド-サイド符号化が使われていた場合、符号化されたオーディオ信号の第1チャンネルの前記スペクトル帯域に基づくと共に、符号化されたオーディオ信号の第2チャンネルの前記スペクトル帯域に基づいて、中間オーディオ信号の第1チャンネルのスペクトル帯域を生成し、かつ、符号化されたオーディオ信号の第1チャンネルの前記スペクトル帯域に基づくと共に、符号化されたオーディオ信号の第2チャンネルの前記スペクトル帯域に基づいて、中間オーディオ信号の第2チャンネルのスペクトル帯域を生成すること。そして、
-復号化されたオーディオ信号の第1チャンネルおよび第2チャンネルを得るために、非正規化値に依存して、中間オーディオ信号の第1チャンネルおよび第2チャンネルのうちの少なくとも1つを変調すること。
-複数のスペクトル帯域の個々のスペクトル帯域について、符号化されたオーディオ信号の第1チャンネルの前記スペクトル帯域、および、符号化されたオーディオ信号の第2チャンネルの前記スペクトル帯域が、デュアル-モノ符号化またはミッド-サイド符号化モードを使って符号化されたかを決定するように構成され、
-デュアル-モノ符号化が使われていた場合、中間オーディオ信号の第1チャンネルのスペクトル帯域として、符号化されたオーディオ信号の第1チャンネルの前記スペクトル帯域を使い、そして、中間オーディオ信号の第2チャンネルのスペクトル帯域として、符号化されたオーディオ信号の第2チャンネルの前記スペクトル帯域を使うように構成され、
-ミッド-サイド符号化が使われていた場合、符号化されたオーディオ信号の第1チャンネルの前記スペクトル帯域に基づくと共に、符号化されたオーディオ信号の第2チャンネルの前記スペクトル帯域に基づいて、中間オーディオ信号の第1チャンネルのスペクトル帯域を生成し、そして、符号化されたオーディオ信号の第1チャンネルの前記スペクトル帯域に基づくと共に、符号化されたオーディオ信号の第2チャンネルの前記スペクトル帯域に基づいて、中間オーディオ信号の第2チャンネルのスペクトル帯域を生成するように構成される。
L=(M+S)/sqrt(2)
R=(M-S)/sqrt(2)
int context_based_arihmetic_coder_estimate(
int spectrum[],
int start_line,
int end_line,
int lastnz,//lastnz=last non-zero spectrum line
int&ctx,//ctx=context
int&probability,//14 bit fixed point probability
const unsigned int cum_freq[N_CONTEXTS][]
//cum_freq=cumulative frequency tables,14 bit fixed point
)
[
int nBits=0;
for(int k=start_line;k<min(lastnz,end_line);k+=2)
[
int a1=abs(spectrum[k]);
int b1=abs(spectrum[k+1]);
/*Signs Bits*/
nBits+=min(a1,1);
nBits+=min(b1,1);
while(max(a1,b1)>=4)
[
probability*=cum_freq[ctx][VAL_ESC];
int nlz=Number_of_leading_zeros(probability);
nBits+=2+nlz;
probability>>=14-nlz;
a1>>=1;
b1>>=1;
ctx=update_context(ctx,VAL_ESC);
]
int symbol=a1+4*b1;
probability*=(cum_freq[ctx][symbol]-
cum_freq[ctx][symbol+1]);
int nlz=Number_of_leading_zeros(probability);
nBits+=nlz;
hContextMem->proba>>=14-nlz;
ctx=update_context(ctx,a1+b1);
]
return nBits;
]
ここで、spectrumは、コード化されるべき量子化されたスペクトルを指し示すように設定される。start_lineは0に設定される。end_lineはスペクトルの長さに設定される。lastnzは、スペクトルの最後の非ゼロの要素のインデックスに設定される。ctxは0に設定される。確率は、14ビット固定ポイント表記法において1に設定される(16384=1<<14)。
Sres=S-g・M
S(t)=hb・M(t-1)
-DmxRは、例えば、白色化されたMDCTスペクトルのミッド信号を示す。
-SRは、例えば、白色化されたMDCTスペクトルのサイド信号を示す。
-DmxIは、例えば、白色化されたMDSTスペクトルのミッド信号を示す。
-SIは、例えば、白色化されたMDSTスペクトルのサイド信号を示す。
-prevDmxRは、例えば、1つのフレームにより遅延された、白色化されたMDCTスペクトルのミッド信号を示す。
-prevDmxIは、例えば、1つのフレームにより遅延された、白色化されたMDSTスペクトルのミッド信号を示す。
correction_factorfb=EResfb/(EprevDmxfb+ε)
ETfb=correction_factorfb・EprevDmxfb
-サイド信号SRの残差Resが、例えば、以下の式に従って計算される。
Res=SR-aRDmxR
ここで、aRは、(例えば実数)予測係数である。
correction_factorfb=EResfb/(EprevDmxfb+ε)
correction_factorfb=EResfb/(EprevDmxfb+ε)
ここで、correction_factorfbは、前記サイド信号の前記スペクトル帯域のための前記補正ファクターを示す。EResfbは、前記ミッド信号の前記スペクトル帯域に対応する前記残差のスペクトル帯域のエネルギーに依存する残差エネルギーを示す。EprevDmxfbは、先行ミッド信号のスペクトル帯域のエネルギーに依存する先行エネルギーを示す。ε=0、または、0.1>ε>0。
ResR=SR-aRDmxR-aIDmxI
ここで、ResRは前記残差である。SRは前記サイド信号である。aRは複素(予測)係数の実数部であり、aIは複素(予測)係数の虚数部分である。DmxRは前記ミッド信号である。DmxIは、正規化されたオーディオ信号の第1チャンネルに依存すると共に、正規化されたオーディオ信号の第2チャンネルに依存する別のミッド信号である。正規化されたオーディオ信号の第1チャンネルに依存すると共に、正規化されたオーディオ信号の第2チャンネルに依存する別のサイド信号SIの別の残差は、以下の式に従って定義される。
ResI=SI-aRDmxR-aIDmxI
[1] J. Herre, E. Eberlein and K. Brandenburg, “Combined Stereo Coding”, in 93rd AES Convention, San Francisco, 1992.
[2] J. D. Johnston and A. J. Ferreira, “Sum-difference stereo transform codi ng”, in Proc. ICASSP, 1992.
[3] ISO/IEC 11172-3, Information technology - Coding of moving pictures and a ssociated audio for digital storage media at up to about 1,5 Mbit/s - Part 3 : Audio, 1993.
[4] ISO/IEC 13818-7, Information technology - Generic coding of moving pictur es and associated audio information - Part 7: Advanced Audio Coding (AAC), 2 003.
[5] J.-M. Valin, G. Maxwell, T. B. Terriberry and K. Vos, “High-Quality, Lo w-Delay Music Coding in the Opus Codec”, in Proc. AES 135th Convention, New York, 2013.
[6a] 3GPP TS 26.445, Codec for Enhanced Voice Services (EVS); Detailed algorithmic description, V 12.5.0, Dezember 2015.
[6b] 3GPP TS 26.445, Codec for Enhanced Voice Services (EVS); Detailed algorithmic description, V 13.3.0, September 2016.
[7] H. Purnhagen, P. Carlsson, L. Villemoes, J. Robilliard, M. Neusinger, C. Helmrich, J. Hilpert, N. Rettelbach, S. Disch and B. Edler, “Audio encoder, audio decoder and related methods for processing multi-channel audio signal s using complex prediction”. US Patent 8,655,670 B2, 18 February 2014.
[8] G. Markovic, F. Guillaume, N. Rettelbach, C. Helmrich and B. Schubert, “ Linear prediction based coding scheme using spectral domain noise shaping” . European Patent 2676266 B1, 14 February 2011.
[9] S. Disch, F. Nagel, R. Geiger, B. N. Thoshkahna, K. Schmidt, S. Bayer, C. Neukam, B. Edler and C. Helmrich, “Audio Encoder, Audio Decoder and Relat ed Methods Using Two-Channel Processing Within an Intelligent Gap Filling Fr amework”. International Patent PCT/EP2014/065106, 15 07 2014.
[10] C. Helmrich, P. Carlsson, S. Disch, B. Edler, J. Hilpert, M. Neusi nger, H. Purnhagen, N. Rettelbach, J. Robilliard and L. Villemoes, “Effici ent Transform Coding Of Two-channel Audio Signals By Means Of Complex-valued Stereo Prediction”, in Acoustics, Speech and Signal Processing (ICASSP), 2 011 IEEE International Conference on, Prague, 2011.
[11] C. R. Helmrich, A. Niedermeier, S. Bayer and B. Edler, “Low-comp lexity semi-parametric joint-stereo audio transform coding”, in Signal Proc essing Conference (EUSIPCO), 2015 23rd European, 2015.
[12] H. Malvar, "A Modulated Complex Lapped Transform and its Applicati ons to Audio Processing", in Acoustics, Speech, and Signal Processing (ICASS P), 1999. Proceedings., 1999 IEEE International Conference on, Phoenix, AZ, 1999.
[13] B. Edler and G. Schuller, “Audio coding using a psychoacoustic pr e- and post-filter” Acoustics, Speech, and Signal Processing, 2000. ICASSP ’00.
Claims (40)
- 2つ以上のチャンネルを含むオーディオ入力信号の第1チャンネルおよび第2チャンネルを符号化して符号化されたオーディオ信号を得るための装置であって、第1のオーディオ信号は前記オーディオ入力信号に依存し、
前記装置は、
前記第1チャンネルおよび前記第2チャンネルを有する処理されたオーディオ信号であって、前記処理されたオーディオ信号の前記第1チャンネルの1つ以上のスペクトル帯域が前記第1のオーディオ信号の前記第1チャンネルの1つ以上のスペクトル帯域であり、かつ、前記処理されたオーディオ信号の前記第1チャンネルの少なくとも1つのスペクトル帯域が、前記第1のオーディオ信号の前記第1チャンネルのスペクトル帯域に依存すると共に前記第1のオーディオ信号の前記第2チャンネルのスペクトル帯域に依存するミッド信号のスペクトル帯域である、前記処理されたオーディオ信号を生成するように構成される符号化ユニット(120)であって、前記符号化ユニット(120)は、前記処理されたオーディオ信号を符号化して前記符号化されたオーディオ信号を得るように構成される、符号化ユニット(120)を含むこと、
を特徴とする装置。 - 前記符号化ユニットは、前記処理されたオーディオ信号の前記第2チャンネルの1つ以上のスペクトル帯域が前記第1のオーディオ信号の前記第2チャンネルの1つ以上のスペクトル帯域であり、かつ、前記処理されたオーディオ信号の前記第2チャンネルの少なくとも1つのスペクトル帯域が、前記第1のオーディオ信号の前記第1チャンネルのスペクトル帯域に依存すると共に前記第1のオーディオ信号の前記第2チャンネルのスペクトル帯域に依存するサイド信号のスペクトル帯域であるように、前記処理されたオーディオ信号を生成するように構成されること、
を特徴とする請求項1に記載の装置。 - 前記符号化ユニット(120)は、前記第1のオーディオ信号の前記第1チャンネルの複数のスペクトル帯域に依存すると共に前記第1のオーディオ信号の前記第2チャンネルの複数のスペクトル帯域に依存して、完全ミッド-サイド符号化モードと完全デュアル-モノ符号化モードおよび帯域毎符号化モードの中から選択するように構成され、
前記完全ミッド-サイド符号化モードが選択された場合、前記符号化ユニット(120)は、前記第1のオーディオ信号の前記第1チャンネルおよび前記第2チャンネルからミッド信号をミッド-サイド信号の第1チャンネルとして生成し、そして、前記第1のオーディオ信号の前記第1チャンネルおよび前記第2チャンネルからサイド信号を前記ミッド-サイド信号の第2チャンネルとして生成し、そして、前記ミッド-サイド信号を符号化して前記符号化されたオーディオ信号を得るように構成され、
前記完全デュアル-モノ符号化モードが選択された場合、前記符号化ユニット(120)は、前記第1のオーディオ信号を符号化して前記符号化されたオーディオ信号を得るように構成され、
前記帯域毎符号化モードが選択された場合、前記符号化ユニット(120)は、前記第1のオーディオ信号を符号化して前記符号化されたオーディオ信号を得るように構成され、
前記帯域毎符号化モードが選択された場合、前記符号化ユニット(120)は、前記処理されたオーディオ信号の前記第1チャンネルの1つ以上のスペクトル帯域が前記第1のオーディオ信号の前記第1チャンネルの1つ以上のスペクトル帯域であり、かつ、前記処理されたオーディオ信号の前記第2チャンネルの1つ以上のスペクトル帯域が前記第1のオーディオ信号の前記第2チャンネルの1つ以上のスペクトル帯域であり、かつ、前記処理されたオーディオ信号の前記第1チャンネルの少なくとも1つのスペクトル帯域が、前記第1のオーディオ信号の前記第1チャンネルのスペクトル帯域に依存すると共に前記第1のオーディオ信号の前記第2チャンネルのスペクトル帯域に依存するミッド信号のスペクトル帯域であり、かつ、前記処理されたオーディオ信号の前記第2チャンネルの少なくとも1つのスペクトル帯域が、前記第1のオーディオ信号の前記第1チャンネルのスペクトル帯域に依存すると共に、前記第1のオーディオ信号の前記第2チャンネルのスペクトル帯域に依存するサイド信号のスペクトル帯域であるように、前記処理されたオーディオ信号を生成するように構成され、前記符号化ユニット(120)は、前記処理されたオーディオ信号を符号化して前記符号化されたオーディオ信号を得るように構成されること、
を特徴とする請求項1または請求項2に記載の装置。 - 前記符号化ユニット(120)は、前記帯域毎符号化モードが選択された場合、前記処理されたオーディオ信号の複数のスペクトル帯域の各スペクトル帯域について、ミッド-サイド符号化を採用するか、デュアル-モノ符号化を採用するかを決定するように構成され、
前記スペクトル帯域について前記ミッド-サイド符号化が採用された場合、前記符号化ユニット(120)は、前記処理されたオーディオ信号の前記第1チャンネルの前記スペクトル帯域を、前記第1のオーディオ信号の前記第1チャンネルの前記スペクトル帯域に基づくと共に前記第1のオーディオ信号の前記第2チャンネルの前記スペクトル帯域に基づくミッド信号のスペクトル帯域として生成するように構成され、また、前記符号化ユニット(120)は、前記処理されたオーディオ信号の前記第2チャンネルの前記スペクトル帯域を、前記第1のオーディオ信号の前記第1チャンネルの前記スペクトル帯域に基づくと共に前記第1のオーディオ信号の前記第2チャンネルの前記スペクトル帯域に基づくサイド信号のスペクトル帯域として生成するように構成され、
前記スペクトル帯域について前記デュアル-モノ符号化が採用された場合、
前記符号化ユニット(120)は、前記第1のオーディオ信号の前記第1チャンネルの前記スペクトル帯域を前記処理されたオーディオ信号の前記第1チャンネルの前記スペクトル帯域として使用するように構成されると共に、前記第1のオーディオ信号の前記第2チャンネルの前記スペクトル帯域を前記処理されたオーディオ信号の前記第2チャンネルの前記スペクトル帯域として使用するように構成される、あるいは、
前記符号化ユニット(120)は、前記第1のオーディオ信号の前記第2チャンネルの前記スペクトル帯域を前記処理されたオーディオ信号の前記第1チャンネルの前記スペクトル帯域として使用するように構成されると共に、前記第1のオーディオ信号の前記第1チャンネルの前記スペクトル帯域を前記処理されたオーディオ信号の前記第2チャンネルの前記スペクトル帯域として使用するように構成されること、
を特徴とする請求項3に記載の装置。 - 前記符号化ユニット(120)は、前記完全ミッド-サイド符号化モードが採用されたときに符号化のために必要となる第1ビット数を推定する第1推定を決定すること、前記完全デュアル-モノ符号化モードが採用されたときに符号化のために必要となる第2ビット数を推定する第2推定を決定すること、前記帯域毎符号化モードが採用されたときに符号化のために必要となる第3ビット数を推定する第3推定を決定すること、そして、前記完全ミッド-サイド符号化モードおよび前記完全デュアル-モノ符号化モードおよび前記帯域毎符号化モードのうち、前記第1推定および前記第2推定および前記第3推定のうちでビット数が最も少ない符号化モードを選ぶことによって、前記完全ミッド-サイド符号化モードおよび前記完全デュアル-モノ符号化モードおよび前記帯域毎符号化モードのうちから選択するように構成されること、
を特徴とする、請求項3または請求項4に記載の装置。 - 前記符号化ユニット(120)は、前記完全ミッド-サイド符号化モードで符号化したときに、節減される第1ビット数を推定する第1推定を決定すること、前記完全デュアル-モノ符号化モードで符号化したときに、節減される第2ビット数を推定する第2推定を決定すること、前記帯域毎符号化モードで符号化したとき、節減される第3ビット数を推定する第3推定を決定すること、そして前記完全ミッド-サイド符号化モードおよび前記完全デュアル-モノ符号化モードおよび前記帯域毎符号化モードのうち、前記第1推定および前記第2推定および前記第3推定のうちから節減されるビット数が最も多い符号化モードを選ぶことによって、前記完全ミッド-サイド符号化モードおよび前記完全デュアル-モノ符号化モードおよび前記帯域毎符号化モードのうちから選択するように構成されること、または、
前記符号化ユニット(120)は、前記完全ミッド-サイド符号化モードが採用されたときに生じる第1信号対雑音比を推定すること、前記完全デュアル-モノ符号化モードが採用されたときに生じる第2信号対雑音比を推定すること、前記帯域毎符号化モードが採用されたときに生じる第3信号対雑音比を推定すること、そして前記完全ミッド-サイド符号化モードおよび前記完全デュアル-モノ符号化モードおよび前記帯域毎符号化モードのうち、前記第1信号対雑音比および前記第2信号対雑音比および前記第3信号対雑音比のうちで信号対雑音比が最も大きい符号化モードを選ぶことによって、前記完全ミッド-サイド符号化モードおよび前記完全デュアル-モノ符号化モードおよび前記帯域毎符号化モードのうちから選択するように構成されること、
を特徴とする請求項3または請求項4に記載の装置。 - 前記符号化ユニット(120)は、前記処理されたオーディオ信号の前記第1チャンネルの前記少なくとも1つのスペクトル帯域が前記ミッド信号の前記スペクトル帯域であり、かつ、前記処理されたオーディオ信号の前記第2チャンネルの前記少なくとも1つのスペクトル帯域が前記サイド信号の前記スペクトル帯域であるように、前記処理されたオーディオ信号を生成するように構成され、
前記符号化されたオーディオ信号を得るために、前記符号化ユニット(120)は、前記サイド信号の前記スペクトル帯域のための補正ファクターを決定することによって、前記サイド信号の前記スペクトル帯域を符号化するように構成され、
前記符号化ユニット(120)は、前記サイド信号の前記スペクトル帯域のための前記補正ファクターを、残差に依存すると共に前記ミッド信号の前記スペクトル帯域に対応する先行ミッド信号のスペクトル帯域に依存して決定するように構成され、前記先行ミッド信号は時間において前記ミッド信号に先行し、
前記符号化ユニット(120)は、前記残差を、前記サイド信号の前記スペクトル帯域に依存すると共に、前記ミッド信号の前記スペクトル帯域に依存して決定するように構成されること、
を特徴とする請求項3または請求項4に記載の装置。 - 前記符号化ユニット(120)は、式
correction_factorfb=EResfb/(EprevDmxfb+ε)
に従って、前記サイド信号の前記スペクトル帯域のための前記補正ファクターを決定するように構成され、
ここで、correction_factorfbは、前記サイド信号の前記スペクトル帯域のための前記補正ファクターを示し、
EResfbは、前記ミッド信号の前記スペクトル帯域に対応する前記残差のスペクトル帯域のエネルギーに依存する残差エネルギーを示し、
EprevDmxfbは、前記先行ミッド信号の前記スペクトル帯域のエネルギーに依存する先行エネルギーを示し、
ε=0である、または、0.1>ε>0であること、
を特徴とする請求項7に記載の装置。 - 前記残差は、式
ResR=SR-aRDmxR-aIDmxI
に従って定義され、
ここで、ResRは前記残差であり、SRは前記サイド信号であり、aRは係数であり、DmxRは前記ミッド信号であり、
前記符号化ユニット(120)は、式
に従って残差エネルギーを決定するように構成されること、
を特徴とする請求項7または請求項8に記載の装置。 - 前記残差は、式
ResR=SR-aRDmxR-aIDmxI
に従って定義され、
ここで、ResRは前記残差であり、SRは前記サイド信号であり、aRは複素係数の実数部であり、aIは前記複素係数の虚数部分であり、DmxRは前記ミッド信号であり、DmxIは、前記第1のオーディオ信号の前記第1チャンネルに依存すると共に、前記第1のオーディオ信号の前記第2チャンネルに依存する別のミッド信号であり、
前記第1のオーディオ信号の前記第1チャンネルに依存すると共に前記第1のオーディオ信号の前記第2チャンネルに依存する別のサイド信号SIの別の残差は、式
ResR=SRRes=SR-aRDmxR-aIDmxI
に従って定義され、
前記符号化ユニット(120)は、式
に従って前記残差エネルギーを決定するように構成され、
前記符号化ユニット(120)は、前記ミッド信号の前記スペクトル帯域に対応する前記残差の前記スペクトル帯域の前記エネルギーに依存すると共に、前記ミッド信号の前記スペクトル帯域に対応する前記別の残差のスペクトル帯域のエネルギーに依存する前記先行エネルギーを決定するように構成されていること、
を特徴とする、請求項8に記載の装置。 - 前記装置は、前記オーディオ入力信号の前記第1チャンネルに依存すると共に前記オーディオ入力信号の前記第2チャンネルに依存して、前記オーディオ入力信号のための正規化値を決定するように構成された正規化器(110)を備え、
前記正規化器(110)は、正規化されたオーディオ信号である前記第1のオーディオ信号の第1チャンネルおよび第2チャンネルを、前記オーディオ入力信号の前記第1チャンネルと前記第2チャンネルのうちの少なくとも1つを前記正規化値に依存して変調させることによって決定するように構成されること、
を特徴とする請求項1ないし請求項10のいずれかに記載の装置。 - 前記正規化器(110)は、前記オーディオ入力信号の前記第1チャンネルのエネルギーに依存すると共に前記オーディオ入力信号の前記第2チャンネルのエネルギーに依存して、前記オーディオ入力信号のための前記正規化値を決定するように構成されること、
を特徴とする、請求項11に記載の装置。 - 前記オーディオ入力信号は、スペクトル領域で表され、
前記正規化器(110)は、前記オーディオ入力信号の前記第1チャンネルの複数のスペクトル帯域に依存すると共に、前記オーディオ入力信号の前記第2チャンネルの複数のスペクトル帯域に依存して、前記オーディオ入力信号のための前記正規化値を決定するように構成され、
前記正規化器(110)は、前記オーディオ入力信号の前記第1チャンネルおよび前記第2チャンネルのうちの少なくとも1つのチャンネルの複数のスペクトル帯域を前記正規化値に依存して変調させることによって、前記第1のオーディオ信号を決定するように構成されていること、
を特徴とする、請求項11に記載の装置。 - 前記正規化器(110)は、式
に基づいて前記正規化値を決定するように構成され、
ここで、MDCTL,kは、前記オーディオ入力信号の前記第1チャンネルのMDCTスペクトルのk番目の係数であり、MDCTR,kは、前記オーディオ入力信号の前記第2チャンネルのMDCTスペクトルのk番目の係数であり、
前記正規化器(110)は、ILDを量子化することによって、前記正規化値を決定するように構成されること、
を特徴とする請求項13に記載の装置。 - 符号化するための前記装置は、変換ユニット(102)と前処理ユニット(105)とをさらに含み、
前記変換ユニット(102)は、時間領域オーディオ信号を時間領域から周波数領域に変換して、変換されたオーディオ信号を得るためにように構成され、
前記前処理ユニット(105)は、前記変換されたオーディオ信号にエンコーダ側周波数領域ノイズ整形演算を適用することによって、前記オーディオ入力信号の前記第1チャンネルおよび前記第2チャンネルを生成するように構成されること、
を特徴とする請求項13または請求項14に記載の装置。 - 前記前処理ユニット(105)は、前記変換されたオーディオ信号に前記エンコーダ側周波数領域ノイズ整形演算を適用する前に、前記変換されたオーディオ信号にエンコーダ側時間ノイズ整形演算を適用することによって、前記オーディオ入力信号の前記第1チャンネルおよび前記第2チャンネルを生成するように構成されること、
を特徴とする、請求項15に記載の装置。 - 正規化器(110)は、時間領域で表されている前記オーディオ入力信号の前記第1チャンネルに依存すると共に、前記時間領域で表されている前記オーディオ入力信号の前記第2チャンネルに依存して、前記オーディオ入力信号のための正規化値を決定するように構成され、
前記正規化器(110)は、前記時間領域で表されている前記オーディオ入力信号の前記第1チャンネルおよび前記第2チャンネルのうちの少なくとも1つを前記正規化値に依存して変調させることによって、前記第1のオーディオ信号の前記第1チャンネルおよび前記第2チャンネルを決定するように構成され、
前記装置は、前記第1のオーディオ信号がスペクトル領域で表されるように、前記第1のオーディオ信号を前記時間領域から前記スペクトル領域に変換するように構成された変換ユニット(115)をさらに含み、
前記変換ユニット(115)は、前記スペクトル領域で表されている前記第1のオーディオ信号を前記符号化ユニット(120)に供給するように構成されていること、
を特徴とする、請求項1ないし請求項10のいずれかに記載の装置。 - 前記装置は、第1チャンネルおよび第2チャンネルを含む時間領域オーディオ信号を受信するように構成された前処理ユニット(106)をさらに含み、
前記前処理ユニット(106)は、前記時間領域オーディオ信号の前記第1チャンネルに対し、第1の知覚的に白色化されたスペクトルを作成するフィルタを適用して、前記時間領域で表されている前記オーディオ入力信号の前記第1チャンネルを得るように構成され、
前記前処理ユニット(106)は、前記時間領域オーディオ信号の前記第2チャンネルに対し、第2の知覚的に白色化されたスペクトルを作成するフィルタを適用して、前記時間領域で表されている前記オーディオ入力信号の前記第2チャンネルを得るように構成されること、
を特徴とする、請求項17に記載の装置。 - 前記変換ユニット(115)は、前記第1のオーディオ信号を前記時間領域から前記スペクトル領域に変換して、変換されたオーディオ信号を得るように構成され、
前記装置は、前記変換されたオーディオ信号に対してエンコーダ側時間ノイズ整形を実施して、前記スペクトル領域で表されている前記第1のオーディオ信号を得るように構成されたスペクトル領域前処理器(118)をさらに含むこと、
を特徴とする請求項17または請求項18に記載の装置。 - 前記符号化ユニット(120)は、前記第1のオーディオ信号または前記処理されたオーディオ信号にエンコーダ側ステレオインテリジェントギャップ充填を適用することによって、前記符号化されたオーディオ信号を得るように構成されること、
を特徴とする、請求項1ないし請求項19のいずれかに記載の装置。 - 前記オーディオ入力信号が、厳密に2つのチャンネルを含むオーディオステレオ信号であること、
を特徴とする、請求項1ないし請求項20のいずれかに記載の装置。 - 4つ以上のチャンネルを含むオーディオ入力信号の4つのチャンネルを符号化して、符号化されたオーディオ信号を得るためのシステムであって、前記システムは、
前記オーディオ入力信号の前記4つ以上のチャンネルの第1チャンネルおよび第2チャンネルを符号化して、前記符号化されたオーディオ信号の第1チャンネルおよび第2チャンネルを得るための、請求項1ないし請求項20のいずれかに記載の第1装置(170)と、
前記オーディオ入力信号の前記4つ以上のチャンネルの第3チャンネルおよび第4チャンネルを符号化して、前記符号化されたオーディオ信号の第3チャンネルおよび第4チャンネルを得るための、請求項1ないし請求項20のいずれかに記載の第2装置(180)と、を含むこと、
を特徴とする、システム。 - 第1チャンネルおよび第2チャンネルを含む符号化されたオーディオ信号を復号化して、2つ以上のチャンネルを含む復号化されたオーディオ信号の第1チャンネルおよび第2チャンネルを得るための装置であって、
前記装置は復号化ユニット(210)を備え、
第1のケースでは、前記復号化ユニット(210)は、前記符号化されたオーディオ信号の前記第1チャンネルのスペクトル帯域を中間オーディオ信号の第1チャンネルのスペクトル帯域として使うように構成されると共に、前記符号化されたオーディオ信号の前記第2チャンネルのスペクトル帯域を前記中間オーディオ信号の第2チャンネルのスペクトル帯域として使うように構成され、
第2のケースでは、前記復号化ユニット(210)は、前記符号化されたオーディオ信号の前記第1チャンネルのスペクトル帯域に基づくと共に前記符号化されたオーディオ信号の前記第2チャンネルのスペクトル帯域に基づいて、前記中間オーディオ信号の前記第1チャンネルのスペクトル帯域を生成するように構成され、
前記装置は、前記中間オーディオ信号の前記第1チャンネルおよび前記第2チャンネルのうちの少なくとも1つを非正規化することによって、前記中間オーディオ信号から前記復号化されたオーディオ信号を得るように構成されること、
を特徴とする装置。 - 前記復号化ユニット(210)は複数のスペクトル帯域の各スペクトル帯域について、前記符号化されたオーディオ信号の前記第1チャンネルの前記スペクトル帯域および前記符号化されたオーディオ信号の前記第2チャンネルの前記スペクトル帯域がデュアル-モノ符号化を使用して符号化されたか、ミッド-サイド符号化を使用して符号化されたかを決定するように構成され、
前記ミッド-サイド符号化が使用されていた場合、前記復号化ユニット(210)は、前記符号化されたオーディオ信号の前記第1チャンネルの前記スペクトル帯域に基づくと共に前記符号化されたオーディオ信号の前記第2チャンネルの前記スペクトル帯域に基づいて、前記中間オーディオ信号の前記第2チャンネルのスペクトル帯域を生成するように構成されること
を特徴とする、請求項23に記載の装置。 - 前記復号化ユニット(210)は、前記符号化されたオーディオ信号が完全ミッド-サイド符号化モードで符号化されたか、または完全デュアル-モノ符号化モードで符号化されたか、または帯域毎符号化モードで符号化されたかを決定するように構成され、
前記復号化ユニット(210)は、前記符号化されたオーディオ信号が前記完全ミッド-サイド符号化モードで符号化されたと決定された場合、前記符号化されたオーディオ信号の前記第1チャンネルおよび前記第2チャンネルから前記中間オーディオ信号の前記第1チャンネルを生成すると共に、前記符号化されたオーディオ信号の前記第1チャンネルおよび前記第2チャンネルから前記中間オーディオ信号の前記第2チャンネルを生成するように構成され、
前記復号化ユニット(210)は、前記符号化されたオーディオ信号が前記完全デュアル-モノ符号化モードで符号化されたと決定された場合、前記符号化されたオーディオ信号の前記第1チャンネルを前記中間オーディオ信号の前記第1チャンネルとして使うと共に、前記符号化されたオーディオ信号の前記第2チャンネルを前記中間オーディオ信号の前記第2チャンネルとして使うように構成され、
前記復号化ユニット(210)は、前記符号化されたオーディオ信号が前記帯域毎符号化モードで符号化されたと決定された場合、
複数のスペクトル帯域の各スペクトル帯域について、前記符号化されたオーディオ信号の前記第1チャンネルの前記スペクトル帯域および前記符号化されたオーディオ信号の前記第2チャンネルの前記スペクトル帯域が、デュアル-モノ符号化を使って符号化されたか、またはミッド-サイド符号化モードを使って符号化されたかを決定するように構成され、
前記デュアル-モノ符号化が使われていた場合、前記符号化されたオーディオ信号の前記第1チャンネルの前記スペクトル帯域を前記中間オーディオ信号の前記第1チャンネルのスペクトル帯域として使用し、そして、前記符号化されたオーディオ信号の前記第2チャンネルの前記スペクトル帯域を前記中間オーディオ信号の前記第2チャンネルのスペクトル帯域として使用するように構成され、
前記ミッド-サイド符号化が使われていた場合、前記符号化されたオーディオ信号の前記第1チャンネルの前記スペクトル帯域に基づくと共に符号化されたオーディオ信号の第2チャンネルの前記スペクトル帯域に基づいて、前記中間オーディオ信号の前記第1チャンネルのスペクトル帯域を生成し、そして、前記符号化されたオーディオ信号の前記第1チャンネルの前記スペクトル帯域に基づくと共に前記符号化されたオーディオ信号の前記第2チャンネルの前記スペクトル帯域に基づいて、前記中間オーディオ信号の前記第2チャンネルのスペクトル帯域を生成する
ように構成されること、
を特徴とする、請求項23または請求項24に記載の装置。 - 前記復号化ユニット(210)は、前記複数のスペクトル帯域の各スペクトル帯域について、前記符号化されたオーディオ信号の前記第1チャンネルの前記スペクトル帯域および前記符号化されたオーディオ信号の前記第2チャンネルの前記スペクトル帯域が、前記デュアル-モノ符号化を使って符号化されたか、または前記ミッド-サイド符号化を使って符号化されたかを決定するように構成され、
前記復号化ユニット(210)は、前記第2チャンネルの前記スペクトル帯域を再構成することによって、前記符号化されたオーディオ信号の前記第2チャンネルの前記スペクトル帯域を得るように構成され、
ミッド-サイド符号化が使われていた場合、前記符号化されたオーディオ信号の前記第1チャンネルの前記スペクトル帯域はミッド信号のスペクトル帯域であると共に、前記符号化されたオーディオ信号の前記第2チャンネルの前記スペクトル帯域はサイド信号のスペクトル帯域であり、
ミッド-サイド符号化が使われていた場合、前記復号化ユニット(210)は前記サイド信号の前記スペクトル帯域を、前記サイド信号の前記スペクトル帯域のための補正ファクターに依存すると共に、前記ミッド信号の前記スペクトル帯域に対応する、先行ミッド信号のスペクトル帯域に依存して再構成するように構成され、ここで、前記先行ミッド信号は、時間において前記ミッド信号に先行すること、
を特徴とする、請求項25に記載の装置。 - 前記装置は、前記中間オーディオ信号の前記第1チャンネルおよび前記第2チャンネルのうちの少なくとも1つを非正規化値に依存して変調して、前記復号化されたオーディオ信号の前記第1チャンネルおよび前記第2チャンネルを得るように構成された非正規化器(220)を含むこと、
を特徴とする、請求項23ないし請求項26のいずれかに記載の装置。 - 前記非正規化器(220)は、前記非正規化値に依存して、前記中間オーディオ信号の前記第1チャンネルおよび前記第2チャンネルのうちの少なくとも1つのチャンネルの前記複数のスペクトル帯域を変調して、前記復号化されたオーディオ信号の前記第1チャンネルおよび前記第2チャンネルを得るように構成され、
前記非正規化器(220)は、前記非正規化値に依存して、前記中間オーディオ信号の前記第1チャンネルおよび前記第2チャンネルのうちの少なくとも1つのチャンネルの前記複数のスペクトル帯域を変調して、非正規化されたオーディオ信号を得るように構成され、
前記装置は、後処理ユニット(230)および変換ユニット(235)をさらに含み、
前記後処理ユニット(230)は、前記非正規化されたオーディオ信号に対し、デコーダ側時間ノイズ整形およびデコーダ側周波数領域ノイズ整形のうちの少なくとも1つを実施して、後処理されたオーディオ信号を得るように構成され、
前記変換ユニット(235)は、前記後処理されたオーディオ信号をスペクトル領域から時間領域に変換して、前記復号化されたオーディオ信号の前記第1チャンネルおよび前記第2チャンネルを得るように構成されること、
を特徴とする請求項27に記載の装置。 - 前記装置は、前記中間オーディオ信号をスペクトル領域から時間領域に変換するように構成された変換ユニット(215)をさらに含み、
前記非正規化器(220)は、前記非正規化値に依存して、時間領域で表されている前記中間オーディオ信号の前記第1チャンネルおよび前記第2チャンネルのうちの少なくとも1つを変調して、前記復号化されたオーディオ信号の前記第1チャンネルおよび前記第2チャンネルを得るように構成されること、
を特徴とする請求項27に記載の装置。 - 前記装置は、前記中間オーディオ信号をスペクトル領域から時間領域に変換するように構成された変換ユニット(215)をさらに含み、
前記非正規化器(220)は、前記非正規化値に依存して、時間領域で表されている前記中間オーディオ信号の前記第1チャンネルおよび前記第2チャンネルのうちの少なくとも1つを変調して、非正規化されたオーディオ信号を得るように構成され、
前記装置は、知覚的に白色化されたオーディオ信号である前記非正規化されたオーディオ信号を処理して、前記復号化されたオーディオ信号の前記第1チャンネルおよび前記第2チャンネルを得るように構成された後処理ユニット(235)をさらに含むこと、
を特徴とする請求項27に記載の装置。 - 前記装置は、前記中間オーディオ信号に対し、デコーダ側時間ノイズ整形を実施するように構成されたスペクトル領域後処理器(212)をさらに含み、
前記変換ユニット(215)は、前記中間オーディオ信号に対してデコーダ側時間ノイズ整形を実施した後に、前記中間オーディオ信号を前記スペクトル領域から前記時間領域に変換するように構成されること、
を特徴とする請求項29または請求項30に記載の装置。 - 前記復号化ユニット(210)は、符号化されたオーディオ信号に対し、デコーダ側ステレオインテリジェントギャップ充填を適用するように構成されること、
を特徴とする、請求項23ないし請求項31のいずれかに記載の装置。 - 前記復号化されたオーディオ信号が、厳密に2つのチャンネルを含むオーディオステレオ信号であること、
を特徴とする、請求項23ないし請求項32のいずれかに記載の装置。 - 4つ以上のチャンネルを含む符号化されたオーディオ信号を復号化して、4つ以上のチャンネルを含む復号化されたオーディオ信号の4つのチャンネルを得るためのシステムであって、前記システムは、
前記符号化されたオーディオ信号の前記4つ以上のチャンネルの第1チャンネルおよび第2チャンネルを復号化して前記復号化されたオーディオ信号の第1チャンネルおよび第2チャンネルを得るための請求項23ないし請求項32のいずれかに記載の第1装置(270)と、
前記符号化されたオーディオ信号の前記4つ以上のチャンネルの第3チャンネルおよび第4チャンネルを復号化して前記復号化されたオーディオ信号の第3チャンネルおよび第4チャンネルを得るための請求項23ないし請求項32のいずれかに記載の第2装置(280)と、を含むこと、
を特徴とする、システム。 - 符号化されたオーディオ信号をオーディオ入力信号から生成するため、および復号化されたオーディオ信号を前記符号化されたオーディオ信号から生成するためのシステムであって、前記システムは、
請求項1ないし請求項21のいずれかに記載の装置(310)であって、請求項1ないし請求項21のいずれかに記載の装置(310)は、前記オーディオ入力信号から、前記符号化されたオーディオ信号を生成するように構成される装置と、
請求項23ないし請求項33のいずれかに記載の装置(320)であって、請求項23ないし請求項33のいずれかに記載の装置(320)は、前記符号化されたオーディオ信号から前記復号化されたオーディオ信号を生成するように構成される装置と、
を含むこと、
を特徴とする、システム。 - 符号化されたオーディオ信号をオーディオ入力信号から生成するため、および復号化されたオーディオ信号を前記符号化されたオーディオ信号から生成するためのシステムであって、前記システムは、
請求項22に記載のシステムであって、請求項22に記載のシステムは、前記オーディオ入力信号から前記符号化されたオーディオ信号を生成するように構成される、システムと、
請求項34に記載のシステムであって、請求項34に記載のシステムは、前記符号化されたオーディオ信号から前記復号化されたオーディオ信号を生成するように構成されるシステムと、
を含むこと、
を特徴とする、システム。 - 2つ以上のチャンネルを含むオーディオ入力信号の第1チャンネルおよび第2チャンネルを符号化して符号化されたオーディオ信号を得るための方法であって、第1のオーディオ信号は前記オーディオ入力信号に依存し、前記方法は、
第1チャンネルおよび第2チャンネルを有する処理されたオーディオ信号を、前記処理されたオーディオ信号の前記第1チャンネルの1つ以上のスペクトル帯域が前記第1のオーディオ信号の前記第1チャンネルの1つ以上のスペクトル帯域であり、かつ、前記処理されたオーディオ信号の前記第1チャンネルの少なくとも1つのスペクトル帯域が、前記第1のオーディオ信号の前記第1チャンネルのスペクトル帯域に依存するミッド信号のスペクトル帯域であるように生成するステップと、
前記処理されたオーディオ信号を符号化して前記符号化されたオーディオ信号を得るステップと、
を含むこと、
を特徴とする、方法。 - 第1チャンネルおよび第2チャンネルを含む符号化されたオーディオ信号を復号化して2つ以上のチャンネルを含む復号化されたオーディオ信号の第1チャンネルおよび第2チャンネルを得るための方法であって、
第1のケースでは、前記符号化されたオーディオ信号の前記第1チャンネルのスペクトル帯域は中間オーディオ信号の第1チャンネルのスペクトル帯域として使用されると共に、前記符号化されたオーディオ信号の前記第2チャンネルのスペクトル帯域は前記中間オーディオ信号の第2チャンネルのスペクトル帯域として使用され、
第2のケースでは、前記方法は、前記符号化されたオーディオ信号の前記第1チャンネルのスペクトル帯域に基づくと共に前記符号化されたオーディオ信号の前記第2チャンネルのスペクトル帯域に基づいて前記中間オーディオ信号の前記第1チャンネルのスペクトル帯域を生成するステップを含み、
前記方法は、前記中間オーディオ信号の前記第1チャンネルおよび前記第2チャンネルのうち少なくとも1つを非正規化することによって、前記復号化されたオーディオ信号を前記中間オーディオ信号から得るステップを含むこと、
を特徴とする、方法。 - コンピュータまたは信号プロセッサにおいて実行されたときに、請求項37に記載の方法を実行するためのコンピュータプログラム。
- コンピュータまたは信号プロセッサにおいて実行されたときに、請求項38に記載の方法を実行するためのコンピュータプログラム。
Applications Claiming Priority (8)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP16152457.4 | 2016-01-22 | ||
| EP16152454 | 2016-01-22 | ||
| EP16152457 | 2016-01-22 | ||
| EP16152454.1 | 2016-01-22 | ||
| EP16199895.0 | 2016-11-21 | ||
| EP16199895 | 2016-11-21 | ||
| JP2018538111A JP6864378B2 (ja) | 2016-01-22 | 2017-01-20 | 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法 |
| JP2021052602A JP7280306B2 (ja) | 2016-01-22 | 2021-03-26 | 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021052602A Division JP7280306B2 (ja) | 2016-01-22 | 2021-03-26 | 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2023109851A JP2023109851A (ja) | 2023-08-08 |
| JP7704802B2 true JP7704802B2 (ja) | 2025-07-08 |
Family
ID=57860879
Family Applications (3)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018538111A Active JP6864378B2 (ja) | 2016-01-22 | 2017-01-20 | 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法 |
| JP2021052602A Active JP7280306B2 (ja) | 2016-01-22 | 2021-03-26 | 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法 |
| JP2023078313A Active JP7704802B2 (ja) | 2016-01-22 | 2023-05-11 | 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法 |
Family Applications Before (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018538111A Active JP6864378B2 (ja) | 2016-01-22 | 2017-01-20 | 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法 |
| JP2021052602A Active JP7280306B2 (ja) | 2016-01-22 | 2021-03-26 | 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法 |
Country Status (17)
| Country | Link |
|---|---|
| US (2) | US11842742B2 (ja) |
| EP (2) | EP4123645B1 (ja) |
| JP (3) | JP6864378B2 (ja) |
| KR (1) | KR102230668B1 (ja) |
| CN (2) | CN109074812B (ja) |
| AU (1) | AU2017208561B2 (ja) |
| CA (1) | CA3011883C (ja) |
| ES (1) | ES2932053T3 (ja) |
| FI (1) | FI3405950T3 (ja) |
| MX (1) | MX2018008886A (ja) |
| MY (1) | MY188905A (ja) |
| PL (1) | PL3405950T3 (ja) |
| RU (1) | RU2713613C1 (ja) |
| SG (1) | SG11201806256SA (ja) |
| TW (1) | TWI669704B (ja) |
| WO (1) | WO2017125544A1 (ja) |
| ZA (1) | ZA201804866B (ja) |
Families Citing this family (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2017125544A1 (en) * | 2016-01-22 | 2017-07-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for mdct m/s stereo with global ild with improved mid/side decision |
| US10734001B2 (en) * | 2017-10-05 | 2020-08-04 | Qualcomm Incorporated | Encoding or decoding of audio signals |
| CN110556116B (zh) * | 2018-05-31 | 2021-10-22 | 华为技术有限公司 | 计算下混信号和残差信号的方法和装置 |
| CN115132214A (zh) | 2018-06-29 | 2022-09-30 | 华为技术有限公司 | 立体声信号的编码、解码方法、编码装置和解码装置 |
| BR112020026967A2 (pt) * | 2018-07-04 | 2021-03-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificação de áudio de multissinal usando branqueamento de sinal como pré-processamento |
| CN113348507B (zh) * | 2019-01-13 | 2025-02-21 | 华为技术有限公司 | 高分辨率音频编解码 |
| US11527252B2 (en) | 2019-08-30 | 2022-12-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | MDCT M/S stereo |
| CN115843378A (zh) | 2020-07-07 | 2023-03-24 | 弗劳恩霍夫应用研究促进协会 | 使用针对多声道音频信号的声道的缩放参数的联合编码的音频解码器、音频编码器以及相关方法 |
| JPWO2023153228A1 (ja) * | 2022-02-08 | 2023-08-17 | ||
| JPWO2024166647A1 (ja) * | 2023-02-08 | 2024-08-15 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010530079A (ja) | 2007-06-11 | 2010-09-02 | フラウンホッファー−ゲゼルシャフト ツァー フェーデルング デア アンゲバンテン フォルシュング エー ファー | インパルス状の部分と定常部分とを有するオーディオ信号を符号化するオーディオ符号器、符号化方法、復号器、復号化方法、および符号化されたオーディオ信号 |
| JP2012521012A (ja) | 2009-03-17 | 2012-09-10 | ドルビー インターナショナル アーベー | 適応的に選択可能な左/右又はミッド/サイド・ステレオ符号化及びパラメトリック・ステレオ符号化の組み合わせに基づいた高度ステレオ符号化 |
| JP2013524281A (ja) | 2010-04-09 | 2013-06-17 | ドルビー・インターナショナル・アーベー | Mdctベース複素予測ステレオ符号化 |
| JP2014510306A (ja) | 2011-02-14 | 2014-04-24 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム |
| JP2015535620A (ja) | 2013-07-22 | 2015-12-14 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 時間雑音/パッチ整形を用いる符号化オーディオ信号の符号化および復号化装置および方法 |
Family Cites Families (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3435674B2 (ja) * | 1994-05-06 | 2003-08-11 | 日本電信電話株式会社 | 信号の符号化方法と復号方法及びそれを使った符号器及び復号器 |
| DE19628293C1 (de) * | 1996-07-12 | 1997-12-11 | Fraunhofer Ges Forschung | Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion |
| US6370502B1 (en) * | 1999-05-27 | 2002-04-09 | America Online, Inc. | Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec |
| DE19959156C2 (de) * | 1999-12-08 | 2002-01-31 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verarbeiten eines zu codierenden Stereoaudiosignals |
| JP4495209B2 (ja) | 2004-03-12 | 2010-06-30 | ノキア コーポレイション | 符号化済みマルチチャンネルオーディオ信号に基づくモノオーディオ信号の合成 |
| US8041042B2 (en) * | 2006-11-30 | 2011-10-18 | Nokia Corporation | Method, system, apparatus and computer program product for stereo coding |
| JP5302980B2 (ja) | 2008-03-04 | 2013-10-02 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 複数の入力データストリームのミキシングのための装置 |
| EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
| EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
| DE102010014599A1 (de) | 2010-04-09 | 2010-11-18 | Continental Automotive Gmbh | Luftmassenmesser |
| CN105225669B (zh) * | 2011-03-04 | 2018-12-21 | 瑞典爱立信有限公司 | 音频编码中的后量化增益校正 |
| US8654984B2 (en) * | 2011-04-26 | 2014-02-18 | Skype | Processing stereophonic audio signals |
| CN104050969A (zh) | 2013-03-14 | 2014-09-17 | 杜比实验室特许公司 | 空间舒适噪声 |
| DE112015003108B4 (de) * | 2014-07-01 | 2021-03-04 | Electronics And Telecommunications Research Institute | Verfahren und Vorrichtung zur Verarbeitung eines Mehrkanal-Audiosignals |
| US10152977B2 (en) * | 2015-11-20 | 2018-12-11 | Qualcomm Incorporated | Encoding of multiple audio signals |
| US10115403B2 (en) * | 2015-12-18 | 2018-10-30 | Qualcomm Incorporated | Encoding of multiple audio signals |
| WO2017125544A1 (en) * | 2016-01-22 | 2017-07-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for mdct m/s stereo with global ild with improved mid/side decision |
-
2017
- 2017-01-20 WO PCT/EP2017/051177 patent/WO2017125544A1/en not_active Ceased
- 2017-01-20 FI FIEP17700980.0T patent/FI3405950T3/fi active
- 2017-01-20 SG SG11201806256SA patent/SG11201806256SA/en unknown
- 2017-01-20 PL PL17700980.0T patent/PL3405950T3/pl unknown
- 2017-01-20 JP JP2018538111A patent/JP6864378B2/ja active Active
- 2017-01-20 KR KR1020187022988A patent/KR102230668B1/ko active Active
- 2017-01-20 MX MX2018008886A patent/MX2018008886A/es unknown
- 2017-01-20 CA CA3011883A patent/CA3011883C/en active Active
- 2017-01-20 CN CN201780012788.XA patent/CN109074812B/zh active Active
- 2017-01-20 RU RU2018130149A patent/RU2713613C1/ru active
- 2017-01-20 CN CN202311493628.5A patent/CN117542365A/zh active Pending
- 2017-01-20 EP EP22191567.1A patent/EP4123645B1/en active Active
- 2017-01-20 AU AU2017208561A patent/AU2017208561B2/en active Active
- 2017-01-20 EP EP17700980.0A patent/EP3405950B1/en active Active
- 2017-01-20 MY MYPI2018001322A patent/MY188905A/en unknown
- 2017-01-20 ES ES17700980T patent/ES2932053T3/es active Active
- 2017-01-23 TW TW106102400A patent/TWI669704B/zh active
-
2018
- 2018-07-19 ZA ZA2018/04866A patent/ZA201804866B/en unknown
- 2018-07-20 US US16/041,691 patent/US11842742B2/en active Active
-
2021
- 2021-03-26 JP JP2021052602A patent/JP7280306B2/ja active Active
-
2023
- 2023-05-11 JP JP2023078313A patent/JP7704802B2/ja active Active
- 2023-10-30 US US18/497,703 patent/US20240071395A1/en active Pending
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010530079A (ja) | 2007-06-11 | 2010-09-02 | フラウンホッファー−ゲゼルシャフト ツァー フェーデルング デア アンゲバンテン フォルシュング エー ファー | インパルス状の部分と定常部分とを有するオーディオ信号を符号化するオーディオ符号器、符号化方法、復号器、復号化方法、および符号化されたオーディオ信号 |
| JP2012521012A (ja) | 2009-03-17 | 2012-09-10 | ドルビー インターナショナル アーベー | 適応的に選択可能な左/右又はミッド/サイド・ステレオ符号化及びパラメトリック・ステレオ符号化の組み合わせに基づいた高度ステレオ符号化 |
| JP2013524281A (ja) | 2010-04-09 | 2013-06-17 | ドルビー・インターナショナル・アーベー | Mdctベース複素予測ステレオ符号化 |
| JP2014510306A (ja) | 2011-02-14 | 2014-04-24 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム |
| JP2015535620A (ja) | 2013-07-22 | 2015-12-14 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 時間雑音/パッチ整形を用いる符号化オーディオ信号の符号化および復号化装置および方法 |
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7704802B2 (ja) | 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法 | |
| RU2765565C2 (ru) | Способ и система для кодирования стереофонического звукового сигнала с использованием параметров кодирования первичного канала для кодирования вторичного канала | |
| JP7384893B2 (ja) | マルチシグナルエンコーダ、マルチシグナルデコーダ、および信号白色化または信号後処理を使用する関連方法 | |
| KR101657916B1 (ko) | 멀티채널 다운믹스/업믹스의 경우에 대한 일반화된 공간적 오디오 객체 코딩 파라미터 개념을 위한 디코더 및 방법 | |
| CN105378832B (zh) | 解码器、编码器、解码方法、编码方法和存储介质 | |
| US20100010807A1 (en) | Method and apparatus to encode and decode an audio/speech signal | |
| MX2015004022A (es) | Aparato y metodo para codificar y decodificador una señal de audio codificada utilizando modelado de ruido temporal/de parche. | |
| CN102270452A (zh) | 近透明或透明的多声道编码器/解码器方案 | |
| MX2012011603A (es) | Codificador de audio, decodificador de audio y metodos relacionados para el procesamiento de señales de audio multicanal utilizando prediccion compleja. | |
| KR101837686B1 (ko) | 공간적 오디오 객체 코딩에 오디오 정보를 적응시키기 위한 장치 및 방법 | |
| AU2014280256B2 (en) | Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding | |
| HK40000257B (en) | Stereo audio coding with ild-based normalisation prior to mid/side decision | |
| HK40000257A (en) | Stereo audio coding with ild-based normalisation prior to mid/side decision | |
| Ghaderi et al. | Wideband speech coding using ADPCM and a new spectral replication method based on parametric stereo coding | |
| BR112018014813B1 (pt) | Aparelho, sistema e método para codificar canais de um sinal de entrada de áudio, aparelho, sistema e método para decodificar um sinal de áudio codificado e sistema para gerar um sinal de áudio codificado e um sinal de áudio decodificado |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230612 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230612 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240702 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240930 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250106 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250218 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250401 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250527 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250626 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7704802 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |





































