JP5815526B2 - 復号化方法、復号化装置、符号化方法及び符号化装置 - Google Patents

復号化方法、復号化装置、符号化方法及び符号化装置 Download PDF

Info

Publication number
JP5815526B2
JP5815526B2 JP2012525482A JP2012525482A JP5815526B2 JP 5815526 B2 JP5815526 B2 JP 5815526B2 JP 2012525482 A JP2012525482 A JP 2012525482A JP 2012525482 A JP2012525482 A JP 2012525482A JP 5815526 B2 JP5815526 B2 JP 5815526B2
Authority
JP
Japan
Prior art keywords
audio signal
channel
channel audio
additional information
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012525482A
Other languages
English (en)
Other versions
JP2013502608A (ja
Inventor
ムン,ハン−ギル
リー,チョル−ウ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2013502608A publication Critical patent/JP2013502608A/ja
Application granted granted Critical
Publication of JP5815526B2 publication Critical patent/JP5815526B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

本発明は、マルチチャネル・オーディオ信号の符号化及び復号化に係り、さらに詳細には、符号化されたマルチチャネル・オーディオ信号の復元時に、各チャネルの音質を向上させることができるレジデュアル信号を所定のパラメータ情報として符号化し、これをマルチチャネル・オーディオ信号の復号化時に利用するマルチチャネル・オーディオ信号の符号化/復号化方法及び該装置に関する。
一般的に、マルチチャネル・オーディオを符号化する方法には、ウェーブフォーム(waveform)オーディオ・コーディングと、パラメトリック(parametric)・オーディオ・コーディングとがある。ウェーブフォーム符号化には、MPEG(moving picture experts group)−2MC(multi-channel)オーディオ・コーディング、AAC(advanced audio coding)MCオーディオ・コーディング及びBSAC(bit-sliced arithmetic coding)/AVS(audio videio)MCオーディオ・コーディングなどがある。
パラメトリック・オーディオ・コーディングでは、オーディオ信号を周波数ドメインで、周波数、振幅のような成分に分解し、かような周波数、振幅に係わる情報をパラメータ化してオーディオ信号を符号化する。例えば、パラメトリック・オーディオ・コーディングを利用して、ステレオオーディオ信号を符号化する場合、左チャネルオーディオと右チャネルオーディオとをダウンミックスしてモノオーディオを生成し、生成されたモノオーディオを符号化する。そして、複数の周波数バンドそれぞれに対してチャネル間強度差(IID:interchannel intensity difference)、チャネル間相関度(ID:interchannel correlation)、全位相差(OPD:overall phase difference)及びチャネル間位相差(IPD:interchannel phase difference)のようなパラメータを符号化する。ここで、チャネル間強度差(IID)に係わるパラメータ、及びチャネル間相関度(ID)に係わるパラメータは、ステレオオーディオ信号の復号化時に、左チャネルオーディオと右チャネルオーディオとの強度を決定するための情報として利用され、全位相差(OPD)に係わるパラメータ及びチャネル間位相差(IPD)に係わるパラメータは、ステレオオーディオ信号の復号化時に、左チャネルオーディオと右チャネルオーディオとの位相を決定するための情報として利用される。
かようなパラメトリック・オーディオ・コーディング方式などでは、符号化された後で復元されたオーディオ信号と入力オーディオ信号との間に差が発生する。一般的に、符号化された後で復元されたオーディオ信号と、入力オーディオ信号との差値をレジデュアル(residual)信号と定義する。かようなレジデュアル信号は、一種の符号化エラーを示す。オーディオ信号の復元時に、各チャネルの音質を向上させるためには、かようなレジデュアル信号を符号化し、符号化されたレジデュアル信号を復元時に利用する必要がある。
本発明は、パラメトリック・オーディオ・コーディングで、オーディオ信号の音質を向上させるためには、レジデュアル信号情報を効率的に符号化する必要がある。
本発明の一側面は、マルチチャネル・オーディオ信号の符号化時に復元されたマルチチャネル・オーディオ信号と、入力マルチチャネル・オーディオ信号とのの差値であるレジデュアル信号が最小になるように、レジデュアル信号情報を効率的に伝送するマルチチャネル・オーディオ信号の符号化方法及び該装置を提供することである。本発明の他の側面は、符号化されたレジデュアル信号情報をマルチチャネル・オーディオ信号の復号化時に利用することによって、各チャネルの音質を向上させるマルチチャネル・オーディオ信号の復号化方法及び該装置を提供することである。
本発明によれば、符号化時に最小限のレジデュアル信号情報を効率的に符号化し、復号化時にレジデュアル信号を利用し、マルチチャネル・オーディオ信号の各チャネルの音質を向上させることができる。
本発明の一実施形態によるマルチチャネル・オーディオ信号の符号化装置の構成を示したブロック図である。 図1のマルチチャネル符号化部の一実施形態を示したブロック図である。 本発明の一実施形態によって、第1チャネル入力オーディオ及び第2チャネル入力オーディオの強度に係わる情報を生成する方法を説明するための参照図である。 本発明の他の実施形態によって、第1チャネル入力オーディオ及び第2チャネル入力オーディオの強度に係わる情報を生成する方法を説明するための参照図である。 図1のレジデュアル信号生成部の一実施形態を示したブロック図である。 図4の復元部の一実施形態を示したブロック図である。 本発明の一実施形態によるマルチチャネル・オーディオ信号の符号化方法を示したフローチャートである。 本発明の一実施形態によるマルチチャネル・オーディオ信号の復号化装置を示したブロック図である。 互いに90°の位相差を有するオーディオ信号を示したグラフである。 本発明の一実施形態によるマルチチャネル・オーディオ信号の復号化方法を示したフローチャートである。
本発明が解決しようとする技術的課題は、マルチチャネル・オーディオ信号の符号化時に復元されたマルチチャネル・オーディオ信号と、入力マルチチャネル・オーディオ信号との差値であるレジデュアル信号が最小になるように、レジデュアル信号情報を効率的に伝送するマルチチャネル・オーディオ信号の符号化方法及び該装置を提供することである。また、本発明が解決しようとする技術的課題は、符号化されたレジデュアル信号情報をマルチチャネル・オーディオ信号の復号化時に利用することによって、各チャネルの音質を向上させるマルチチャネル・オーディオ信号の復号化方法及び該装置を提供することである。
本発明の一実施形態によるマルチチャネル・オーディオ信号の符号化方法は、入力マルチチャネル・オーディオ信号に対するパラメトリック符号化を行い、ダウンミックスされたオーディオ信号を生成する段階と、前記ダウンミックスされたオーディオ信号を前記マルチチャネル・オーディオ信号に復元するための第1付加情報を生成する段階と、前記ダウンミックスされたオーディオ信号及び前記第1付加情報を利用して復元されたマルチチャネル・オーディオ信号と、前記入力マルチチャネル・オーディオ信号との差値であるレジデュアル信号を生成する段階と、前記レジデュアル信号の特性を示す第2付加情報を生成する段階と、前記ダウンミックスされたオーディオ信号、前記第1付加情報及び前記第2付加情報を多重化する段階と、を含むことを特徴とする。
本発明の一実施形態によるマルチチャネル・オーディオ信号の符号化装置は、入力マルチチャネル・オーディオ信号に対する符号化を行い、ダウンミックスされたオーディオ信号及び前記ダウンミックスされたオーディオ信号を前記マルチチャネル・オーディオ信号に復元するための第1付加情報を生成するマルチチャネル符号化部;前記ダウンミックスされたオーディオ信号及び前記第1付加情報を利用して復元されたマルチチャネル・オーディオ信号と、前記入力マルチチャネル・オーディオ信号との差値であるレジデュアル信号を生成するレジデュアル信号生成部;前記レジデュアル信号の特性を示す第2付加情報を生成するレジデュアル信号符号化部;及び前記ダウンミックスされたオーディオ信号、前記第1付加情報及び前記第2付加情報を多重化する多重化部;を含むことを特徴とする。
本発明の一実施形態によるマルチチャネル・オーディオ信号の復号化方法は、符号化されたオーディオデータからダウンミックスされたオーディオ信号、前記ダウンミックスされたオーディオ信号をマルチチャネル・オーディオ信号に復元するための第1付加情報、及び符号化時に入力マルチチャネル・オーディオ信号と、符号化された後で復元されたマルチチャネル・オーディオ信号との差値であるレジデュアル信号の特性を示す第2付加情報を抽出する段階と、前記ダウンミックスされたオーディオ信号及び前記第1付加情報を利用し、第1マルチチャネル・オーディオ信号を復元する段階と、前記復元された第1マルチチャネル・オーディオ信号と所定の位相差を有する第2マルチチャネル・オーディオ信号を生成する段階と、前記第2付加情報を利用し、前記第1マルチチャネル・オーディオ信号と、前記第2マルチチャネル・オーディオ信号とを結合して最終復元オーディオ信号を生成する段階と、を含むことを特徴とする。
本発明の一実施形態によるマルチチャネル・オーディオ信号の復号化装置は、符号化されたオーディオデータからダウンミックスされたオーディオ信号、前記ダウンミックスされたオーディオ信号をマルチチャネル・オーディオ信号に復元するための第1付加情報、及び符号化時に入力マルチチャネル・オーディオ信号と、符号化された後で復元されたマルチチャネル・オーディオ信号との差値であるレジデュアル信号の特性を示す第2付加情報を抽出する逆多重化部;前記ダウンミックスされたオーディオ信号及び前記第1付加情報を利用し、第1マルチチャネル・オーディオ信号を復元するマルチチャネル復号化部;前記復元された第1マルチチャネル・オーディオ信号と所定の位相差を有する第2マルチチャネル・オーディオ信号を生成する位相変移部;及び前記第2付加情報を利用し、前記第1マルチチャネル・オーディオ信号と、前記第2マルチチャネル・オーディオ信号とを結合して最終復元オーディオ信号を生成する結合部を;含むことを特徴とする。
以下、添付された図面を参照しつつ、本発明の望ましい実施形態について具体的に説明する。
図1は、本発明の一実施形態によるマルチチャネル・オーディオ信号の符号化装置の構成を示したブロック図である。図1を参照するに、本発明の一実施形態によるマルチチャネル・オーディオ信号の符号化装置100は、マルチチャネル符号化部110、レジデュアル信号生成部120、レジデュアル信号符号化部130及び多重化部140を含む。入力マルチチャネル・オーディオ信号ChないしChがデジタル信号ではない場合には、n個の入力マルチチャネル・オーディオ信号に対してサンプリング及び量子化を行ってデジタル信号に変換するA/D(analog-digital)変換器(図示せず)がさらに含まれてもよい。
マルチチャネル符号化部110は、n個(nは、正の整数)の入力マルチチャネル・オーディオ信号に対するパラメトリック符号化を行い、ダウンミックスされたオーディオ信号、及びダウンミックスされたオーディオ信号をさらにマルチチャネル・オーディオ信号に復元するための第1付加情報を生成する。さらに具体的には、マルチチャネル符号化部110は、n個の入力マルチチャネル・オーディオ信号を、nより少数のチャネルを有するオーディオ信号にダウンミックスし、ダウンミックスされたオーディオ信号をさらにn個のマルチチャネルに復元するために必要な第1付加情報を生成する。例えば、入力信号として、5.1チャネルのオーディオ信号、すなわちレフト(L)、サラウンドレフト(Ls)、センター(C)、サブウーファ(Sw)、ライト(R)、サラウンドライト(Rs)の6個のマルチチャネルの信号が、マルチチャネル符号化部110に入力される場合を仮定すれば、マルチチャネル符号化部110は、5.1チャネルのオーディオ信号をL及びRの2チャネルのステレオ信号にダウンミックスし、2チャネルのステレオ信号を符号化してオーディオビットストリームを生成する一方、2チャネルのステレオ信号をさらに5.1チャネルのオーディオ信号に復元するための第1付加情報を生成する。第1付加情報は、ダウンミックスされる信号の強度(intensity)を決定するための情報、及びダウンミックスされる信号間の位相差に係わる情報を含んでもよい。以下、マルチチャネル符号化部110で行われるダウンミックス過程、及び第1付加情報を生成する過程について具体的に説明する。
図2は、図1のマルチチャネル符号化部110の一実施形態を示したブロック図である。図2を参照するに、本発明の一実施形態によるマルチチャネル符号化部110は、複数個のダウンミックス部111ないし118及びステレオ信号符号化部119を含む。
マルチチャネル符号化部110は、n個の入力マルチチャネル・オーディオ信号Ch1ないしChnを受信し、受信されたn個の入力マルチチャネル・オーディオ信号を、2個のチャネル単位で加算し、ダウンミックスされた出力信号を生成し、ダウンミックスされた出力信号を2個ずつまとめてさらにダウンミックスする過程を反復することによって、ダウンミックスされたオーディオ信号を出力する。例えば、ダウンミックス部111は、第1チャネルの入力オーディオ信号Ch及び第2チャネルの入力オーディオ信号Chを加算し、ダウンミックスされた出力信号BMを生成する。同様に、ダウンミックス部112は、第3チャネルの入力オーディオ信号Ch及び第4チャネルの入力オーディオ信号Chを加算し、ダウンミックスされた出力信号BMを生成する。2個のダウンミックス部111,112で出力される2個のダウンミックスされた出力信号BM,BMは、さらにダウンミックス部113を介してダウンミックスされ、ダウンミックスされた出力信号TMが出力される。かようなダウンミックス過程は、図2に図示されたように、L及びRの2チャネルのステレオ信号が発生するまで反復されたり、L及びRのステレオ信号をさらにダウンミックスしたモノ信号が出力されるまで反復されてもよい。
ステレオ信号符号化部119は、ダウンミックス部111ないし118を介してダウンミックスされたステレオ信号を符号化し、オーディオ・ビットストリームを生成する。ステレオ信号符号化部119としては、MP3またはAAC(advanced audio codec)のような一般的なオーディオコーデックが利用されてもよい。
ダウンミックス部111ないし118は、2個の入力されたオーディオ信号を加算するとき、2個のオーディオ信号のうち1つのオーディオ信号の位相を、他の信号の位相と同一に設定した後、加算を行うことができる。例えば、第1チャネルの入力オーディオ信号Chと、第2チャネルの入力オーディオ信号Chとを加算するとき、ダウンミックス部111は、第2チャネルの入力オーディオ信号Chの位相を、第1チャネルの入力オーディオ信号Chと同一に設定した後、位相が調節された第2チャネルの入力オーディオ信号Chと、第1チャネルの入力オーディオ信号Chとを加算することによって、ダウンミックスを行うことができる。これに係わる具体的な内容は後述する。
一方、ダウンミックス部111ないし118は、2個のオーディオ信号をダウンミックスして1つの出力信号を生成するとき、1つの出力信号をさらに2個のオーディオ信号に復元するために必要な第1付加情報を生成しなければならない。前述のように、第1付加情報は、ダウンミックスされる信号の強度(intensity)を決定するための情報、及びダウンミックスされる信号間の位相差に係わる情報を含んでもよい。もしダウンミックス部111ないし118として、従来技術のように、ステレオオーディオ信号をモノオーディオ信号にダウンミックスする装置を利用する場合、1つの出力信号に対して、チャネル間強度差(IID:interchannel intensity difference)、チャネル間相関度(ID:interchannel correlation)、全位相差(OPD:overall phase difference)及びチャネル間位相差(IPD:interchannel phase difference)のようなパラメータを符号化する必要がある。この場合、チャネル間強度差(IID)に係わるパラメータ及びチャネル間相関度(ID)に係わるパラメータは、ダウンミックスされた出力信号からダウンミックスされる以前の2個の入力オーディオ信号の強度を決定するための情報として利用され、全位相差(OPD)に係わるパラメータ及びチャネル間位相差(IPD)に係わるパラメータは、ダウンミックスされた出力信号からダウンミックスされる以前の2個の入力オーディオ信号の位相を決定するための情報として利用される。
特に、本発明の一実施形態によるダウンミックス部111ないし118は、後述するように、所定のベクトル空間内で2個の入力オーディオ信号と、ダウンミックスされた信号との関係を利用し、ダウンミックスされる以前の2個の入力オーディオ信号の強度及び位相を決定するための情報を含む第1付加情報を生成する。
以下、図3A及び図3Bを参照しつつ、第1付加情報を生成する方法について詳細に説明する。説明の便宜のために、マルチチャネル符号化部110に含まれた複数個のダウンミックス部において、第1チャネル入力オーディオCh及び第2チャネル入力オーディオChを入力されるダウンミックス部111でダウンミックスされた出力信号BMを生成するとき、第1付加情報を生成する方式を中心に説明する。ダウンミックス部111で生成される第1付加情報生成過程は、マルチチャネル符号化部110に含まれた他のダウンミックス部にも同一に適用可能である。以下では、第1チャネル入力オーディオCh及び第2チャネル入力オーディオChの強度を決定するための情報を生成する場合と、第1チャネル入力オーディオCh及び第2チャネル入力オーディオChの位相を決定するための情報を生成する場合とに分けて説明する。
(1)強度を決定するための情報
パラメトリック・オーディオ・コーディングでは、それぞれのチャネルオーディオを周波数ドメインに変換し、周波数ドメインで、チャネルオーディオそれぞれの強度及び位相に係わる情報を符号化する。オーディオ信号を高速フーリエ変換(Fast Fourier Transform)すれば、オーディオ信号は、周波数ドメインで、離散(discrete)された値によって表現される。すなわち、オーディオ信号は、複数の正弦波の和でもって表現される。パラメトリック・オーディオ・コーディングでは、オーディオ信号が周波数ドメインに変換されれば、周波数ドメインを複数のサブバンドに分割し、それぞれのサブバンドでの第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの強度を決定するための情報、及び第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相を決定するための情報を符号化する。このとき、サブバンドkでの強度及び位相に係わる付加情報を符号化した後、同様に、サブバンドk+1での強度及び位相に係わる付加情報を符号化する。パラメトリック・オーディオ・コーディングでは、かような方式で、全体周波数バンドを複数のサブバンドに分割し、それぞれのサブバンドに対してステレオオーディオ付加情報を符号化する。
以下では、N個チャネルの入力オーディオを有したステレオオーディオの符号化、復号化と関連して、所定の周波数バンド、すなわち、サブバンドkで、第1チャネル入力オーディオCh及び第2チャネル入力オーディオChに係わる付加情報を符号化する場合を例に挙げて説明する。
従来技術によるパラメトリック・オーディオ・コーディングで、ステレオオーディオに係わる付加情報を符号化するときには、サブバンドkで、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの強度を決定する情報として、チャネル間強度差(IID)及びチャネル間相関度(IC)に係わる情報を符号化することは、前述した通りである。このときサブバンドkで、第1チャネル入力オーディオChの強度及び第2チャネル入力オーディオChの強度をそれぞれ計算し、第1チャネル入力オーディオChの強度と、第2チャネル入力オーディオChの強度との比率をチャネル間強度差(IID)に係わる情報として符号化する。しかし、2チャネルオーディオの強度間の比率だけでは、復号化側で、第1チャネル入力オーディオChの強度及び第2チャネル入力オーディオChの強度を決定することができないので、付加情報として、チャネル間相関度(IC)に係わる情報も共に符号化してビットストリームに挿入する。
本発明の一実施形態によるマルチチャネル・オーディオ信号の符号化方法は、サブバンドkで、第1チャネル入力オーディオCh1と、第2チャネル入力オーディオCh2との強度を決定するための情報として符号化される付加情報の個数を最小化するために、サブバンドkで、第1チャネル入力オーディオChの強度に係わるベクトル、及び第2チャネル入力オーディオChの強度に係わるベクトルを利用する。ここで、第1チャネル入力オーディオChを周波数ドメインに変換した周波数スペクトルで、周波数f1,f2,…,fnでの強度の平均値がサブバンドkでの第1チャネル入力オーディオChの強度であり、後述するベクトル
Figure 0005815526
の大きさである。
同様に、第2チャネル入力オーディオCh2を周波数ドメインに変換した周波数スペクトルの周波数f1,f2,…,fnでの強度の平均値がサブバンドkでの第2チャネル入力オーディオChの強度であり、後述するベクトル
Figure 0005815526
の大きさである。図3A及び図3Bを参照しつつ詳細に説明する。
図3Aは、本発明の一実施形態によって、第1チャネル入力オーディオ及び第2チャネル入力オーディオの強度に係わる情報を生成する方法について説明するための参照図である。図3Aを参照するに、本発明の一実施形態によるダウンミックス部111は、サブバンドkで、第1チャネル入力オーディオChの強度に係わるベクトルである
Figure 0005815526
と、第2チャネル入力オーディオChの強度に係わるベクトルである
Figure 0005815526
とが所定の角度をなすように、二次元ベクトル空間を生成する。もし第1チャネル入力オーディオChと、第2チャネル入力オーディオChとが左側オーディオ及び右側オーディオであるならば、ステレオオーディオの聴取者が、左側音源方向と右側音源方向とが60°の角度をなす位置で、ステレオオーディオを聴取することを仮定し、ステレオオーディオを符号化することが一般的であるので、二次元ベクトル空間で、
Figure 0005815526
との間の角度(θ)を60°に設定することができる。しかし、本実施形態で、第1チャネル入力オーディオChと第2チャネル入力オーディオChは、左側オーディオ及び右側オーディオではないので、
Figure 0005815526
は、任意の角度(θ)を有するのである。
図3Aでは、
Figure 0005815526
とが加算されて生成された出力信号BMの強度に係わるベクトルである
Figure 0005815526
が図示されている。このとき、前述のように、もし第1チャネル入力オーディオChと、第2チャネル入力オーディオChとがそれぞれ左側オーディオと、右側オーディオとに対応するならば、左側音源方向と右側音源方向とが60°の角度をなす位置で、ステレオオーディオを聴取する聴取者は、
Figure 0005815526
の方向にBM1ベクトル
Figure 0005815526
の大きさに該当する強度のモノオーディオを聴取する。
本発明の一実施形態によるダウンミックス部111は、サブバンドkで、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの強度を決定するための情報として、チャネル間強度差(IID)に係わる情報と、チャネル間相関度(IC)に係わる情報との代わりに、
Figure 0005815526
との間の角度(θ)、または
Figure 0005815526
との間の角度(θ)に係わる情報を生成する。
また、ダウンミックス部111は、
Figure 0005815526
との間の角度(θ)、または
Figure 0005815526
との間の角度(θ)を生成する代わりに、cosθまたはcosθのように、コサイン値を生成することもできる。これは、角度に係わる情報を符号化するとき、量子化過程で発生する損失を最小化するためであり、コサイン(cosine)またはサイン(sine)などの三角関数値を利用して角度情報を生成することが望ましい。
図3Bは、本発明の他の実施形態によって、第1チャネル入力オーディオ及び第2チャネル入力オーディオの強度に係わる情報を生成する方法について説明するための参照図である。
図3Bは、図3Aでのベクトル角度を正規化する過程を図示した図である。
図3Aと同じように
Figure 0005815526

との間の角度(θ)が90°ではない場合には、θを90°に正規化することができ、このとき、θまたはθも正規化される。
図3Bで、
Figure 0005815526
との間の角度(θ)に係わる情報を正規化、すなわち、θを90°に正規化すれば、これに対応してθも正規化され、θ=(θx90)/θが計算される。ダウンミックス部111は、正規化されていないθまたは正規化されたθを第1チャネル入力オーディオChの強度及び第2チャネル入力オーディオChの強度を決定するための情報として生成することができる。また、ダウンミックス部111は、θまたはθの代わりに、cosθまたはcosθを、第1チャネル入力オーディオChの強度及び第2チャネル入力オーディオChの強度を決定するための情報として生成することができる。
(2)位相を決定するための情報
従来技術によるパラメトリック・オーディオ・コーディングでは、サブバンドkで、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相を決定するための情報として、全位相差(OPD)及びチャネル間位相差(IPD)に係わる情報を符号化したということは前述した。
すなわち、従来にはサブバンドkで、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとを加算して生成された第1最初モノオーディオBMと、サブバンドkで、第1チャネル入力オーディオChとの位相差を計算して全位相差に係わる情報を生成して符号化し、サブバンドkで、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相差を計算してチャネル間位相差に係わる情報を生成して符号化した。位相差は、サブバンドに含まれた周波数f1,f2,…,fnでの位相差をそれぞれ計算した後、計算された位相差の平均を計算することによって求めることができる。
本発明の一実施形態によれば、ダウンミックス部111は、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相を決定するための情報として、サブバンドkで、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相差に係わる情報だけを生成する。
本発明の一実施形態では、ダウンミックス部が、第1チャネル入力オーディオChの位相と同一になるように、第2チャネル入力オーディオChの位相を調節し、位相調節された第2チャネル入力オーディオChを生成し、その位相調節された第2チャネル入力オーディオChを第1チャネル入力オーディオChと加算するために、第1チャネル入力オーディオChと第2チャネル入力オーディオChとの位相差に係わる情報だけもってしても、第1チャネル入力オーディオCh及び第2チャネル入力オーディオChそれぞれの位相を計算することができる。
サブバンドkのオーディオを例に挙げて説明すれば、周波数f1,f2,…,fnで、第2チャネル入力オーディオChの位相を周波数f,f2,…,fnで、第1チャネル入力オーディオChの位相と同一になるようにそれぞれ調節する。周波数f1で第1チャネル入力オーディオChの位相を調節する場合を例に挙げて説明すれば、周波数fで、第1チャネル入力オーディオChが、|Ch|ei(2πf1t+θ1)と表示され、第2チャネル入力オーディオChが、|Ch|ei(2πf1t+θ2)と表示されれば、周波数f1で位相調節された第2チャネル入力オーディオCh2’は、次の数式|Ch|ei(2πf1t+θ1)の通りである。ここで、θは、周波数f1で、第1チャネル入力オーディオChの位相であり、θは、周波数f1で、第2チャネル入力オーディオChの位相を示す。かような位相調節は、サブバンドkの他の周波数、すなわち、f2,f3,…,fnで、第2チャネル入力オーディオChに対して反復して、サブバンドkで位相調節された第2チャネル入力オーディオChを生成する。
サブバンドkで位相調節された第2チャネル入力オーディオChは、第1チャネル入力オーディオChの位相と同一であるので、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相差だけ符号化すれば、出力信号BMを復号化する側で、第2チャネル入力オーディオChの位相を求めることができる。また、第1チャネル入力オーディオChの位相と、ダウンミックス部で生成された出力信号BMとの位相は、同一であるので、別途に、第1チャネル入力オーディオChの位相に係わる情報を符号化する必要がない。
従って、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相差に係わる情報だけを符号化すれば、復号化する側では、その符号化された情報を利用し、第1チャネル入力オーディオCh及び第2チャネル入力オーディオChの位相を計算することができる。
一方、前述のサブバンドkでのチャネルオーディオの強度ベクトルを利用し、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの強度を決定するための情報を符号化する方法と、位相調節を利用し、サブバンドkで第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相を決定するための情報と、を符号化する方法は、それぞれ独立して利用されもし、組み合わせて利用されもする。換言すれば、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの強度を決定するための情報は、本発明によって、ベクトルを利用して符号化し、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相を決定するための情報は、従来技術のように、全位相差(OPD)及びチャネル間位相差(IPD)を符号化することができる。反対に、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの強度を決定するための情報は、従来技術によって、チャネル間強度差(IID)及びチャネル間相関度(IC)を利用して符号化し、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相を決定するための情報だけ、本発明のように、位相調節を利用して符号化することもできる。
前述のような第1付加情報を生成する過程は、図2に図示されたダウンミックス部から出力されるダウンミックスされたオーディオ信号から、2個の入力オーディオ信号を復元するための第1付加情報を生成するときにも、同一に適用される。
一方、マルチチャネル符号化部110は、前述の実施形態に限定されるものではなく、マルチチャネルのオーディオ信号に対する符号化を行い、ダウンミックスされたオーディオ信号を出力し、ダウンミックスされたオーディオ信号をさらにマルチチャネル・オーディオ信号に復元するための付加情報を生成する他のパラメトリック符号化装置を利用することができる。
再び図1を参照するに、マルチチャネル符号化部110で生成されたダウンミックスされたオーディオ信号及び第1付加情報は、レジデュアル信号生成部120に入力される。
レジデュアル信号生成部120は、ダウンミックスされたオーディオ信号及び第1付加情報を利用し、マルチチャネル・オーディオ信号を復元し、入力マルチチャネル・オーディオ信号と、復元されたマルチチャネル・オーディオ信号との差値であるレジデュアル信号を生成する。
図4は、図1のレジデュアル信号生成部120の一実施形態を示したブロック図である。図4を参照するに、レジデュアル信号生成部120は、復元部410及び減算部420を含む。
復元部410は、マルチチャネル符号化部110から出力されるダウンミックスされたオーディオ信号及び第1付加情報を利用し、マルチチャネル・オーディオ信号を復元する。具体的には、復元部410は、第1付加情報を利用し、ダウンミックスされたオーディオ信号それぞれから2個のアップミックスされた出力信号を生成し、アップミックスされた出力信号それぞれをさらにアップミックスする過程を反復することによって、マルチチャネル・オーディオ信号を復元する。
減算部420は、復元されたマルチチャネル・オーディオ信号と入力オーディオ信号とのの差値を計算し、チャネル別レジデュアル信号Res 1ないしRes nを生成する。
図5は、図4の復元部410の一実施形態を示したブロック図である。図5を参照するに、復元部510は、第1付加情報に基づいて、ダウンミックスされた1つのオーディオ信号から2個のオーディオ信号を復元し、復元された2個のオーディオ信号それぞれを、さらに該当第1付加情報を利用して2個のオーディオ信号に復元する過程を反復することによって、入力マルチチャネルと同一個数のn個の復元されたマルチチャネル・オーディオ信号を生成する。復元部510の各アップミックス部511ないし517は、第1付加情報を利用して1つのダウンミックスされたオーディオ信号をアップミックスし、2個のアップミックスされた信号を出力し、かようなアップミックス過程は、入力マルチチャネルと同一個数のマルチチャネル・オーディオ信号が復元されるまで反復される。
具体的に、アップミックス部511ないし517の動作について説明する。ただし、説明の便宜のために、図5に図示されたアップミックス部のうち、ダウンミックスされたオーディオ信号TRに対するアップミックスを行い、第1チャネル入力オーディオCh及び第2チャネル入力オーディオChを出力するアップミックス部514の動作を中心に説明する。アップミックス部514の動作過程は、図5に図示された他のアップミックス部にも同一に適用可能である。
図3Aを再び参照するに、アップミックス部514は、サブバンドkで、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの強度を決定するための情報として、ダウンミックスされたオーディオ信号TRの強度に係わるベクトルである
Figure 0005815526
が、第1チャネル入力オーディオChの強度に係わるベクトルである
Figure 0005815526
または第2チャネル入力オーディオChの強度に係わるベクトルである
Figure 0005815526
となす角度に係わる情報を利用する。望ましくは、
Figure 0005815526
との間の角度のコサイン値、または
Figure 0005815526
との間の角度のコサイン値に係わる情報を利用することができる。
図3Bの例では、
Figure 0005815526
との間の角度(θ)が60°であると仮定すれば、第1チャネル入力オーディオChの強度、すなわち
Figure 0005815526
の大きさは、|Ch|=|BM|*sinθm/cos(π/12)によって計算される。ここで、|BM|は、ダウンミックスされたオーディオ信号TRの強度、すなわち、
Figure 0005815526
の大きさであり、
Figure 0005815526
との間の角度は、15°である。同様に、
Figure 0005815526
との間の角度(θ)が60°であると仮定すれば、第2チャネル入力オーディオChの強度、すなわち、
Figure 0005815526
の大きさは、|Ch|=|BM|*cosθm/cos(π/12)によって計算可能されるということは当業者に自明である。ただし、ここでは、
Figure 0005815526
とCh2’との間の角度が15°である場合を例に挙げた。
また、アップミックス部514は、サブバンドkで、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相を決定するための情報として、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相差に係わる情報を利用することができる。ダウンミックスされたオーディオ信号TRを符号化するとき、第1チャネル入力オーディオChの位相と同一になるように、第2チャネル入力オーディオChの位相をすでに調節した場合には、アップミックス部514が、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの位相差に係わる情報だけを利用し、第1チャネル入力オーディオChの位相及び第2チャネル入力オーディオChの位相を計算することができる。
一方、前述のサブバンドkで、第1チャネル入力オーディオChと、第2チャネル入力オーディオChとの強度を決定するための情報をベクトルを利用して復号化する方法と、サブバンドkで、第1チャネル入力オーディオCh1と、第2チャネル入力オーディオCh2との位相を決定するための情報を、位相調節を利用して復号化する方法は、それぞれ独立して利用されもし、あるいは組み合わせて共に利用されもする。
再び図1を参照するに、レジデュアル信号生成部120で復元されたマルチチャネル・オーディオ信号と、入力マルチチャネル・オーディオ信号との差値であるレジデュアル信号が生成されれば、レジデュアル信号符号化部130は、レジデュアル信号の特性を示す第2付加情報を生成する。第2付加情報は、復号化側でダウンミックスされたオーディオ信号及び第1付加情報を利用して復元されたマルチチャネル・オーディオ信号が、入力オーディオ信号の特性と最大限同一になるように復元されたマルチチャネル・オーディオ信号を補正する一種の向上階層情報に該当する。後述するように、第2付加情報は、復号化側で復元されたマルチチャネル・オーディオ信号を補正するのに利用される。
多重化部140は、マルチチャネル符号化部110から出力されるダウンミックスされたオーディオ信号及び第1付加情報と、レジデュアル信号符号化部130で出力される第2付加情報とを多重化し、多重化されたオーディオ・ビットストリームを生成する。
以下、レジデュアル信号符号化部130で第2付加情報を生成する過程について具体的に説明する。
第2付加情報は、入力マルチチャネル・オーディオ信号の2個の互いに異なるチャネル間の相関度を示すチャネル間相関度パラメータ(ICC)を含む。具体的には、入力マルチチャネルの個数をN個(Nは正の整数)、入力マルチチャネルのうち、i番目(i=1からN−1までの整数)チャネルと、i+1番目チャネルとのチャネル間相関度パラメータをΦi,i+1,kは、サンプル・インデックス、x(k)は、任意のkでサンプリングされたiチャネルの入力オーディオ信号値、dは、所定の整数値を有する遅延値、lは、サンプリング区間の長さとするとき、レジデュアル信号符号化部130は、i番目のチャネルと、i+1番目のチャネルとの相関度パラメータΦi,i+1を次の式(1)のように計算する。
Figure 0005815526
例えば、入力オーディオ信号が、5.1チャネルのオーディオ信号であり、レフト(L)、サラウンドレフト(Ls)、センター(C)、サブウーファ(Sw)、ライト(R)、サラウンドライト(Rs)の順序で、チャネルインデックスiが1から6までの値を有するならば、レジデュアル信号符号化部130は、Φ1,2、Φ2,3、Φ3,4、Φ4,5、Φ5,6及びΦ1,6のうち少なくとも1つのチャネル間相関度パラメータを計算する。後述するように、かようなチャネル間相関度パラメータ(ICC)は、復号化側で復元された第1マルチチャネル・オーディオ信号、及び第1マルチチャネル・オーディオ信号と所定の位相差を有する第2マルチチャネル・オーディオ信号を結合し、最終復元オーディオ信号を生成するとき、第1マルチチャネル・オーディオ信号及び第2マルチチャネル・オーディオ信号の結合比率である加重値を決定するのに利用される。
前述のチャネル間相関度パラメータ(ICC)以外に、レジデュアル信号符号化部130は、入力中央チャネルのオーディオ信号と、復元された中央チャネルオーディオ信号とのエネルギー比率を示す中央チャネル補正パラメータ、及び全チャネルで、入力マルチチャネル・オーディオ信号と、復元されたマルチチャネル・オーディオ信号とのエネルギー比率を示す全チャネル補正パラメータをさらに生成することができる。
具体的には、kは、サンプル・インデックス、x(k)は、任意のkでサンプリングされたセンターチャネルの入力オーディオ信号値、x’(k)は、任意のkでサンプリングされたセンターチャネルの復元されたオーディオ信号値、l(lは整数)は、サンプリング区間の長さとするとき、レジデュアル信号符号化部130は、次の式(2)のように、中央チャネル補正パラメータ(κ)を生成する。
Figure 0005815526
式(2)に記載されたように、中央チャネル補正パラメータ(κ)は、入力中央チャネルオーディオ信号と、復元された中央チャネルオーディオ信号とのエネルギー比率を示すものであり、後述するように、復号化側で復元された中央チャネルのオーディオ信号を補正するのに利用される。このように、別途に中央チャネルのオーディオ信号を補正するための中央チャネル補正パラメータ(κ)を生成する理由は、パラメトリック・オーディオ・コーディング時に、中央チャネルの信号が劣化される傾向があるために、かような中央チャネルの劣化現象を補償するためである。
また、入力マルチチャネルの個数をN個(Nは正の整数)、kは、サンプル・インデックス、x(k)は、任意のkでサンプリングされたiチャネルの入力オーディオ信号値、x’(k)は、任意のkでサンプリングされたiチャネルの復元されたオーディオ信号値、l(lは整数)は、サンプリング区間の長さとするとき、レジデュアル信号符号化部130は、次の式(3)のように、全チャネル補正パラメータ(δ)を生成する。
Figure 0005815526
式(3)に記載されたように、全チャネル補正パラメータ(δ)は、全チャネルでの入力オーディオ信号と、復元された全チャネルオーディオ信号とのエネルギー比率を示すものであり、後述するように、復号化側で復元された全チャネルのオーディオ信号を補正するのに利用される。
図6は、本発明の一実施形態によるマルチチャネル・オーディオ信号の符号化方法を示したフローチャートである。図6を参照するに、段階610で、入力マルチチャネル・オーディオ信号に対するパラメトリック符号化を行い、ダウンミックスされたオーディオ信号、及びダウンミックスされたオーディオ信号をマルチチャネル・オーディオ信号に復元するための第1付加情報を生成する。前述のように、マルチチャネル符号化部110は、入力マルチチャネル・オーディオ信号をステレオ信号またはモノ信号にダウンミックスし、ダウンミックスされたオーディオ信号をさらにマルチチャネル・オーディオ信号に復元するための第1付加情報を生成する。第1付加情報は、ダウンミックスされる信号の強度(intensity)を決定するための情報、及びダウンミックスされる信号間の位相差に係わる情報を含んでもよい。
段階620で、ダウンミックスされたオーディオ信号及び第1付加情報を利用して復元されたマルチチャネル・オーディオ信号と、入力マルチチャネル・オーディオ信号との差値であるレジデュアル信号を生成する。復元されたマルチチャネル・オーディオ信号を生成する過程は、図5を参照して述べたように、ダウンミックスされたオーディオ信号それぞれをアップミックスし、2個のアップミックスされた出力信号を生成し、さらに出力信号それぞれをアップミックスする過程を反復することによって行われる。
段階630で、レジデュアル信号の特性を示す第2付加情報を生成する。第2付加情報は、復号化側で復号化されたマルチチャネル・オーディオ信号を補正するのに利用され、少なくとも入力マルチチャネル・オーディオ信号の2個の互いに異なるチャネル間の相関度を示すチャネル間相関度(ICC)パラメータを含まねばならない。さらに、第2付加情報としては、入力中央チャネルのオーディオ信号と、復元された中央チャネルオーディオ信号とのエネルギー比率を示す中央チャネル補正パラメータ、及び全チャネルでの入力マルチチャネル・オーディオ信号と、復元されたマルチチャネル・オーディオ信号とのエネルギー比率を示す全チャネル補正パラメータがさらに含まれてもよい。
段階640で、ダウンミックスされたオーディオ信号、前記第1付加情報及び前記第2付加情報を多重化する。
図7は、本発明の一実施形態によるマルチチャネル・オーディオ信号の復号化装置を示したブロック図である。図7を参照するに、本発明の一実施形態によるマルチチャネル・オーディオ信号の復号化装置700は、逆多重化部710、マルチャネル復号化部720、位相変位部730及び結合部740を含む。
逆多重化部710は、符号化されたオーディオ・ビットストリームをパージングし、オーディオ・ビットストリームから、ダウンミックスされたオーディオ信号、ダウンミックスされたオーディオ信号をマルチチャネル・オーディオ信号に復元するための第1付加情報、及びレジデュアル信号の特性を示す第2付加情報を抽出する。
マルチチャネル復号化部720は、第1付加情報に基づいてダウンミックスされたオーディオ信号から、第1マルチチャネル・オーディオ信号を復元する。前述の図5の復元部510と同一に、マルチチャネル復号化部720は、第1付加情報を利用し、ダウンミックスされたオーディオ信号それぞれから2個のアップミックスされた出力信号を生成し、アップミックスされた出力信号それぞれを、さらにアップミックスする過程を反復することによって、マルチチャネル・オーディオ信号を復元する。このように復元されたマルチチャネル・オーディオ信号を、第1マルチチャネル・オーディオ信号と定義する。
位相変位部730は、第1マルチチャネル・オーディオ信号と所定の位相差を有する第2マルチチャネル・オーディオ信号を生成する。すなわち、位相変位部730は、第1マルチチャネル・オーディオ信号のうち、nチャネルのオーディオ信号をtn、第2マルチチャネル・オーディオ信号のうち、nチャネルのオーディオ信号をtn’、所定の位相差をθdとするとき、tn’=tn*exp(i*θd)の関係が成立するように位相変位された第2マルチチャネル・オーディオ信号を生成する。例えば、図8に図示されたv信号及びv信号のように、第1マルチチャネル・オーディオ信号と第2マルチチャネル・オーディオ信号は、90°の位相差を有することが望ましい。
このように、第1マルチチャネル・オーディオ信号と所定の位相差を有する第2マルチチャネル・オーディオ信号を生成する理由は、第1マルチチャネル・オーディオ信号と、第2マルチチャネル・オーディオ信号とを結合することによって、マルチチャネル・オーディオ信号を符号化するときに発生した位相損失を補償するためである。前述の本発明の一実施形態によるマルチチャネル・オーディオ信号の符号化装置によれば、マルチチャネル・オーディオ信号をダウンミックスするとき、2個の入力オーディオ信号間をダウンミックスした後、さらにアップミックスを介して2個の入力オーディオ信号を復元しても、2個の入力オーディオ信号間に存在した位相差は、平均化されて損失される。たとえ第1付加情報として、2個の入力オーディオ信号間の位相差に係わる情報を伝送しても、かような第1付加情報を介して復元された信号は、本来のオーディオ信号に存在した位相情報とは差が発生し、かような差は、復号化されたマルチチャネル・オーディオ信号の音質向上に阻害となる。
結合部740は、第2付加情報を利用し、第1マルチチャネル・オーディオ信号と、第2マルチチャネル・オーディオ信号とを結合し、最終復元オーディオ信号を生成する。具体的には、結合部740は、各チャネル別に、第1マルチチャネル・オーディオ信号及び第2マルチチャネル・オーディオ信号それぞれに、所定の加重値を乗じた後で加算し、各チャネル別結合オーディオ信号を生成する。例えば、nチャネルの第1マルチチャネル・オーディオ信号tnに乗じられる加重値をα、nチャネルの第2マルチチャネル・オーディオ信号tn’に乗じられる加重値をβとすれば、nチャネルの結合オーディオ信号uは、次の数式u=αt+βt’のように表現されてもよい。
結合部740は、第2付加情報に含まれた入力マルチチャネル・オーディオ信号の2個の互いに異なるチャネル間の相関度を示すチャネル間相関度パラメータ(ICC)、及び2個の互いに異なるチャネル間の結合オーディオ信号間の相関度の関係を利用して加重値を計算する。入力マルチチャネルの個数をN個(Nは正の整数)、入力マルチチャネルのうち、i番目(i=1からN−1までの整数)チャネルと、i+1番目のチャネルとのチャネル間相関度パラメータをΦi,i+1、kは、サンプル・インデックス、x(k)は、任意のkでサンプリングされたiチャネルの入力オーディオ信号値、dは、所定の整数値を有する遅延値、lは、サンプリング区間の長さとするとき、次の式(4)を満足する加重値α及びβを計算する。
Figure 0005815526
式(4)を介して、加重値α及びβが決定されれば、結合部740は、u=αt+βt’を介して計算されるnチャネルの結合オーディオ信号を、nチャネルの最終復元オーディオ信号として決定する。結合部740は、あらゆるマルチチャネルに対して、前述の過程を反復して、最終復元オーディオ信号を生成する。
前述のように、チャネル間相関度パラメータ(ICC)を利用して最終復元オーディオ信号が生成された後、結合部740は、さらに第2付加情報に備わった入力中央チャネルのオーディオ信号と、復元された中央チャネルオーディオ信号とのエネルギー比率を示す中央チャネル補正パラメータ、及び全チャネルで、入力マルチチャネル・オーディオ信号と、復元されたマルチチャネル・オーディオ信号とのエネルギー比率を示す全チャネル補正パラメータを利用し、最終復元オーディオ信号を補正することができる。
具体的には、結合部740は、全チャネル補正パラメータを利用し、最終復元オーディオ信号の全チャネルのオーディオ信号を補正する。例えば、結合部740は、nチャネルの最終復元オーディオ信号uと全チャネル補正パラメータ(δ)とを乗じ、nチャネルの最終復元オーディオ信号uを補正する。かような過程は、あらゆるチャネルに対して行われる。また、結合部740は、中央チャネルの最終復元オーディオ信号に、全チャネル補正パラメータ(δ)及び中央チャネル補正パラメータ(κ)を乗じることによって、パラメトリック符号化時に劣化されやすい中央チャネルのオーディオ信号を補正することができる。
前述のように、本発明の一実施形態によるマルチチャネル・オーディオ信号の復号化装置は、チャネル間相関度を利用し、位相差を有する第1マルチチャネル・オーディオ信号と、第2マルチチャネル・オーディオ信号とを結合する一方、全チャネル補正パラメータ(δ)及び中央チャネル補正パラメータ(κ)を利用し、あらゆるチャネルの復元オーディオ信号及び中央チャネルのオーディオ信号を補正することによって、復元されたマルチチャネル・オーディオ信号の音質を向上させることができる。
図9は、本発明の一実施形態によるマルチチャネル・オーディオ信号の復号化方法を示したフローチャートである。図9を参照するに、段階910で、符号化されたオーディオデータからダウンミックスされたオーディオ信号、ダウンミックスされたオーディオ信号をマルチチャネル・オーディオ信号に復元するための第1付加情報、及び符号化時に入力マルチチャネル・オーディオ信号と、符号化された後で復元されたマルチチャネル・オーディオ信号との差値であるレジデュアル信号の特性を示す第2付加情報を抽出する。
段階920で、ダウンミックスされたオーディオ信号及び第1付加情報を利用し、第1マルチチャネル・オーディオ信号を復元する。前述のように、第1マルチチャネル・オーディオ信号は、第1付加情報を利用し、ダウンミックスされたオーディオ信号それぞれから2個のアップミックスされた出力信号を生成し、アップミックスされた出力信号それぞれをさらにアップミックスする過程を反復することによって生成される。
段階930で、復元された第1マルチチャネル・オーディオ信号と所定の位相差を有する第2マルチチャネル・オーディオ信号を生成する。所定の位相差は、90°であることが望ましい。
段階940で、第2付加情報を利用し、第1マルチチャネル・オーディオ信号と、第2マルチチャネル・オーディオ信号とを結合することによって、最終復元オーディオ信号を生成する。具体的には、結合部740は、第2付加情報に含まれた入力マルチチャネル・オーディオ信号の2個の互いに異なるチャネル間の相関度を示すチャネル間相関度パラメータ(ICC)、及び2個の互いに異なるチャネル間の結合オーディオ信号間の相関度の関係を利用し、第1マルチチャネル・オーディオ信号及び第2マルチチャネル・オーディオ信号に乗じられる加重値を計算する。そして、結合部740は、計算された加重値を利用し、第1マルチチャネル・オーディオ信号と、第2マルチチャネル・オーディオ信号との加重和を計算することによって、最終復元オーディオ信号を生成する。付加的には、結合部740は、全チャネル補正パラメータ(δ)及び中央チャネル補正パラメータ(κ)を利用し、あらゆるチャネルの復元オーディオ信号及び中央チャネルのオーディオ信号を補正することによって、復元されたマルチチャネル・オーディオ信号の音質を向上させることができる。
一方、前述の本発明の実施形態によるマルチチャネル・オーディオ信号の符号化及び復号化方法は、コンピュータで実行可能であるプログラムに作成可能であり、コンピュータで読み取り可能な記録媒体を利用し、前記プログラムを動作させる汎用デジタルコンピュータで具現されてもよい。前記コンピュータで読み取り可能な記録媒体は、マグネチック記録媒体(例えば、ROM(read-only memory)、フロッピー(登録商標)ディスク、ハードディスクなど)、光学的判読媒体(例えば、CD−ROM、DVD(digital versatile disc)など)のような記録媒体を含む。
以上、本発明についてその望ましい実施形態を中心に述べた。本発明が属する技術分野で当業者であるならば、本発明が本発明の本質的な特性から外れない範囲で変形された形態で具現可能であるということを理解することができるであろう。従って、開示された実施形態は、限定的な観点ではなくして、説明的な観点から考慮されねばならない。本発明の範囲は、前述の説明ではなくして、特許請求の範囲に示されており、それと同等な範囲内にあるあらゆる差異点は、本発明に含まれたものであると解釈されねばならない。

Claims (15)

  1. マルチチャネル・オーディオ信号の復号化方法において、
    符号化されたオーディオデータからダウンミックスされたオーディオ信号、前記ダウンミックスされたオーディオ信号をマルチチャネル・オーディオ信号に復元するための第1付加情報、及び符号化時に入力マルチチャネル・オーディオ信号と、符号化された後で復元されたマルチチャネル・オーディオ信号との差値であるレジデュアル信号の特性を示す第2付加情報を抽出する段階と、
    前記ダウンミックスされたオーディオ信号及び前記第1付加情報を利用し、第1マルチチャネル・オーディオ信号を復元する段階と、
    前記復元された第1マルチチャネル・オーディオ信号と所定の位相差を有する第2マルチチャネル・オーディオ信号を生成する段階と、
    前記第2付加情報を利用し、前記第1マルチチャネル・オーディオ信号と、前記第2マルチチャネル・オーディオ信号とを結合して最終復元オーディオ信号を生成する段階と、を含み、
    前記第2付加情報は、
    前記入力マルチチャネル・オーディオ信号の2つの互いに異なるチャネル間の相関度を示すチャネル間相関度(ICC)パラメータ、入力中央チャネルオーディオ信号と復元された中央チャネルオーディオ信号との間のエネルギー比率を示す中央チャネル補正パラメータ、及び全チャネルで前記入力マルチチャネル・オーディオ信号と前記復元されたマルチチャネル・オーディオ信号との間のエネルギー比率を示す全チャネル補正パラメータのうち少なくとも一つを含むことを特徴とするマルチチャネル・オーディオ信号の復号化方法。
  2. 前記第1マルチチャネル・オーディオ信号を復元する段階は、
    前記第1付加情報を利用し、前記ダウンミックスされたオーディオ信号それぞれから2個のアップミックスされた出力信号を生成し、前記アップミックスされた出力信号それぞれをさらにアップミックスする過程を反復することによって、前記第1マルチチャネル・オーディオ信号を復元する段階を含むことを特徴とする請求項1に記載のマルチチャネル・オーディオ信号復号化方法。
  3. 前記第1付加情報は、
    前記2個のアップミックスされた出力信号のうち、第1信号の強度に対する第1ベクトル及び第2信号の強度に対する第2ベクトルが所定の角度をなすように、ベクトル空間を生成し、前記ベクトル空間で、前記第1ベクトルと前記第2ベクトルとを加算して第3ベクトルを生成したとき、前記ダウンミックスされたオーディオ信号の強度に対応する前記第3ベクトルの大きさに係わる情報、及び前記ベクトル空間で、前記第1ベクトルまたは第2ベクトルのうち一つと、前記第3ベクトルとの角度に係わる情報を含み、
    前記復元する段階は、
    前記ダウンミックスされたオーディオ信号の強度に対応する前記第3ベクトルの大きさに係わる情報、及び前記角度に係わる情報を利用し、前記1つのダウンミックスされたオーディオ信号から、前記第1ベクトル及び前記第2ベクトルに対応する前記2個のアップミックスされた出力信号を生成することを特徴とする請求項2に記載のマルチチャネル・オーディオ信号復号化方法。
  4. 前記第1マルチチャネル・オーディオ信号と、前記第2マルチチャネル・オーディオ信号は、90°の位相差を有することを特徴とする請求項1に記載のマルチチャネル・オーディオ信号復号化方法。
  5. 前記第2付加情報は、
    記チャネル間相関度(ICC)パラメータを含み、
    前記最終復元オーディオ信号を生成する段階は、
    各チャネル別に、前記第1マルチチャネル・オーディオ信号及び前記第2マルチチャネル・オーディオ信号それぞれに所定の加重値を乗じた後で加算し、各チャネル別結合オーディオ信号を生成する段階と、
    前記チャネル間相関度パラメータ、及び2個の互いに異なるチャネル間の前記結合オーディオ信号間の相関度の関係を利用して前記加重値を計算する段階と、
    前記計算された加重値を利用し、前記第1マルチチャネル・オーディオ信号と、前記第2マルチチャネル・オーディオ信号の加重和を計算し、前記最終復元オーディオ信号を生成する段階と、を含むことを特徴とする請求項1に記載のマルチチャネル・オーディオ信号復号化方法。
  6. 前記入力マルチチャネル・オーディオ信号の個数をN(Nは正の整数)、前記入力マルチチャネル・オーディオ信号のうちi番目(i=1ついてN−1までの整数)チャネルとi+1番目のチャネルとのチャネル間相関度パラメータをΦi,i+1、kサンプル・インデックス、x(k)任意のkでサンプリングされたiチャネルの入力オーディオ信号値、d所定の整数値を有する遅延値、lサンプリング区間の長さ、t nチャネルでの前記第1マルチチャネル・オーディオ信号、tnチャネルでの前記第2マルチチャネル・オーディオ信号、α前記第1マルチチャネル・オーディオ信号に乗じられる加重値、β前記第2マルチチャネル・オーディオ信号に乗じられる加重値とするとき、
    前記nチャネルでの前記結合オーディオ信号uは、u=αt+βt’であり、前記加重値α及びβは、次の数式:
    Figure 0005815526
    を利用して決定されることを特徴とする請求項5に記載のマルチチャネル・オーディオ信号の復号化方法。
  7. 前記第2付加情報は、
    記全チャネル補正パラメータをさらに含み、
    前記最終復元オーディオ信号を生成する段階は、
    前記全チャネル補正パラメータを利用し、前記最終復元オーディオ信号の全チャネルの値を補正する段階と、
    前記中央チャネル補正パラメータを利用し、全チャネル補正された最終復元オーディオ信号のうち、中央チャネルの信号をさらに補正する段階と、をさらに含むことを特徴とする請求項5に記載のマルチチャネル・オーディオ信号復号化方法。
  8. kは、サンプル・インデックス、x(k)は、任意のkでサンプリングされた中央チャネルの入力オーディオ信号値、x’(k)は、任意のkでサンプリングされた中央チャネルの復元されたオーディオ信号値、l(lは整数)は、サンプリング区間の長さとするとき、
    前記中央チャネル補正パラメータ(κ)は、次の数式:
    Figure 0005815526
    を介して定義される値を有することを特徴とする請求項7に記載のマルチチャネル・オーディオ信号復号化方法。
  9. 前記入力マルチチャネル・オーディオ信号の個数をN(Nは正の整数)、kサンプル・インデックス、x(k)任意のkでサンプリングされたiチャネルの入力オーディオ信号値、x’(k)任意のkでサンプリングされたiチャネルの復元されたオーディオ信号値、l(lは整数)サンプリング区間の長さとするとき、
    前記全チャネル補正パラメータ(δ)は、次の数式:
    Figure 0005815526
    を介して計算された値を有することを特徴とする請求項7に記載のマルチチャネル・オーディオ信号復号化方法。
  10. マルチチャネル・オーディオ信号の復号化装置において、
    符号化されたオーディオデータからダウンミックスされたオーディオ信号、前記ダウンミックスされたオーディオ信号をマルチチャネル・オーディオ信号に復元するための第1付加情報、及び符号化時に入力マルチチャネル・オーディオ信号と符号化された後で復元されたマルチチャネル・オーディオ信号との差値であるレジデュアル信号の特性を示す第2付加情報を抽出する逆多重化部と、
    前記ダウンミックスされたオーディオ信号及び前記第1付加情報を利用し、第1マルチチャネル・オーディオ信号を復元するマルチチャネル復号化部と、
    前記復元された第1マルチチャネル・オーディオ信号と所定の位相差を有する第2マルチチャネル・オーディオ信号を生成する位相変移部と、
    前記第2付加情報を利用し、前記第1マルチチャネル・オーディオ信号と、前記第2マルチチャネル・オーディオ信号とを結合して最終復元オーディオ信号を生成する結合部と、を含み、
    前記第2付加情報は、
    前記入力マルチチャネル・オーディオ信号の2つの互いに異なるチャネル間の相関度を示すチャネル間相関度(ICC)パラメータ、入力中央チャネルオーディオ信号と復元された中央チャネルオーディオ信号との間のエネルギー比率を示す中央チャネル補正パラメータ、及び全チャネルで前記入力マルチチャネル・オーディオ信号と前記復元されたマルチチャネル・オーディオ信号との間のエネルギー比率を示す全チャネル補正パラメータのうち少なくとも一つを含むことを特徴とするマルチチャネル・オーディオ信号の復号化装置。
  11. 前記マルチチャネル復号化部は、
    前記第1付加情報を利用し、前記ダウンミックスされたオーディオ信号それぞれから2個のアップミックスされた出力信号を生成し、前記アップミックスされた出力信号それぞれをまたアップミックスする過程を反復することによって、前記第1マルチチャネル・オーディオ信号を復元することを特徴とする請求項10に記載のマルチチャネル・オーディオ信号復号化装置。
  12. 前記第1付加情報は、
    前記2個のアップミックスされた出力信号のうち第1信号の強度に係わる第1ベクトル、及び第2信号の強度に係わる第2ベクトルが、所定の角度をなすようにベクトル空間を生成し、前記ベクトル空間で、前記第1ベクトルと前記第2ベクトルとを加算して第3ベクトルを生成したとき、前記ダウンミックスされたオーディオ信号の強度に対応する前記第3ベクトルの大きさに係わる情報、及び前記ベクトル空間で、前記第1ベクトルまたは第2ベクトルのうち一つと、前記第3ベクトルとの間の角度に係わる情報を含み、
    前記マルチチャネル復号化部は、
    前記ダウンミックスされたオーディオ信号の強度に対応する前記第3ベクトルの大きさに係わる情報、及び前記角度に係わる情報を利用し、前記1つのダウンミックスされたオーディオ信号から、前記第1ベクトル及び前記第2ベクトルに対応する前記2個のアップミックスされた出力信号を生成することを特徴とする請求項11に記載のマルチチャネル・オーディオ信号復号化装置。
  13. 前記第2付加情報は、
    前記入力マルチチャネル・オーディオ信号の2個の互いに異なるチャネル間の相関度を示すチャネル間相関度(ICC)パラメータを含み、
    前記結合部は、
    各チャネル別に、前記第1マルチチャネル・オーディオ信号及び前記第2マルチチャネル・オーディオ信号それぞれに所定の加重値を乗じた後で加算し、各チャネル別結合オーディオ信号を生成し、前記チャネル間相関度パラメータ、及び2個の互いに異なるチャネル間の前記結合オーディオ信号間の相関度の関係を利用して前記加重値を計算して、前記計算された加重値を利用し、前記第1マルチチャネル・オーディオ信号と、前記第2マルチチャネル・オーディオ信号との加重和を計算し、前記最終復元オーディオ信号を生成することを特徴とする請求項10に記載のマルチチャネル・オーディオ信号復号化装置。
  14. マルチチャネル・オーディオ信号の符号化方法において、
    入力マルチチャネル・オーディオ信号に対するパラメトリック符号化を行い、ダウンミックスされたオーディオ信号及び前記ダウンミックスされたオーディオ信号を、前記マルチチャネル・オーディオ信号に復元するための第1付加情報を生成する段階と、
    前記ダウンミックスされたオーディオ信号及び前記第1付加情報を利用して復元されたマルチチャネル・オーディオ信号と、前記入力マルチチャネル・オーディオ信号との差値であるレジデュアル信号を生成する段階と、
    前記レジデュアル信号の特性を示す第2付加情報を生成する段階と、
    前記ダウンミックスされたオーディオ信号、前記第1付加情報及び前記第2付加情報を多重化する段階と、を含み、
    前記第2付加情報は、
    前記入力マルチチャネル・オーディオ信号の2つの互いに異なるチャネル間の相関度を示すチャネル間相関度(ICC)パラメータ、入力中央チャネルオーディオ信号と復元された中央チャネルオーディオ信号との間のエネルギー比率を示す中央チャネル補正パラメータ、及び全チャネルで前記入力マルチチャネル・オーディオ信号と前記復元されたマルチチャネル・オーディオ信号との間のエネルギー比率を示す全チャネル補正パラメータのうち少なくとも一つを含むことを特徴とするマルチチャネル・オーディオ信号符号化方法。
  15. マルチチャネル・オーディオ信号の符号化装置において、
    入力マルチチャネル・オーディオ信号に対する符号化を行い、ダウンミックスされたオーディオ信号及び前記ダウンミックスされたオーディオ信号を、前記マルチチャネル・オーディオ信号に復元するための第1付加情報を生成するマルチチャネル符号化部と、
    前記ダウンミックスされたオーディオ信号及び前記第1付加情報を利用して復元されたマルチチャネル・オーディオ信号と、前記入力マルチチャネル・オーディオ信号との差値であるレジデュアル信号を生成するレジデュアル信号生成部と、
    前記レジデュアル信号の特性を示す第2付加情報を生成するレジデュアル信号符号化部と、
    前記ダウンミックスされたオーディオ信号、前記第1付加情報及び前記第2付加情報を多重化する多重化部と、を含み、
    前記第2付加情報は、
    前記入力マルチチャネル・オーディオ信号の2つの互いに異なるチャネル間の相関度を示すチャネル間相関度(ICC)パラメータ、入力中央チャネルオーディオ信号と復元された中央チャネルオーディオ信号との間のエネルギー比率を示す中央チャネル補正パラメータ、及び全チャネルで前記入力マルチチャネル・オーディオ信号と前記復元されたマルチチャネル・オーディオ信号との間のエネルギー比率を示す全チャネル補正パラメータのうち少なくとも一つを含むことを特徴とするマルチチャネル・オーディオ信号符号化装置。
JP2012525482A 2009-08-18 2010-08-18 復号化方法、復号化装置、符号化方法及び符号化装置 Expired - Fee Related JP5815526B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020090076338A KR101613975B1 (ko) 2009-08-18 2009-08-18 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치
KR10-2009-0076338 2009-08-18
PCT/KR2010/005449 WO2011021845A2 (en) 2009-08-18 2010-08-18 Method and apparatus for encoding multi-channel audio signal and method and apparatus for decoding multi-channel audio signal

Publications (2)

Publication Number Publication Date
JP2013502608A JP2013502608A (ja) 2013-01-24
JP5815526B2 true JP5815526B2 (ja) 2015-11-17

Family

ID=43606051

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012525482A Expired - Fee Related JP5815526B2 (ja) 2009-08-18 2010-08-18 復号化方法、復号化装置、符号化方法及び符号化装置

Country Status (6)

Country Link
US (1) US8798276B2 (ja)
EP (1) EP2467850B1 (ja)
JP (1) JP5815526B2 (ja)
KR (1) KR101613975B1 (ja)
CN (1) CN102483921B (ja)
WO (1) WO2011021845A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20240185864A1 (en) * 2013-05-24 2024-06-06 Dolby International Ab Reconstruction of audio scenes from a downmix

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101692394B1 (ko) * 2009-08-27 2017-01-04 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
EP2671221B1 (en) * 2011-02-03 2017-02-01 Telefonaktiebolaget LM Ericsson (publ) Determining the inter-channel time difference of a multi-channel audio signal
WO2013107602A1 (en) 2012-01-20 2013-07-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for audio encoding and decoding employing sinusoidal substitution
JP2015517121A (ja) * 2012-04-05 2015-06-18 ホアウェイ・テクノロジーズ・カンパニー・リミテッド インターチャネル差分推定方法及び空間オーディオ符号化装置
JP5949270B2 (ja) * 2012-07-24 2016-07-06 富士通株式会社 オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム
KR20140016780A (ko) * 2012-07-31 2014-02-10 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 방법 및 장치
KR101660004B1 (ko) * 2012-08-03 2016-09-27 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 멀티채널 다운믹스/업믹스 케이스들에 대해 매개변수 개념을 이용한 멀티-인스턴스 공간-오디오-오브젝트-코딩을 위한 디코더 및 방법
KR101903664B1 (ko) * 2012-08-10 2018-11-22 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 파라미터 오디오 오브젝트 코딩을 위한 잔류 개념을 이용하는 인코더, 디코더, 시스템 및 방법
US9336791B2 (en) * 2013-01-24 2016-05-10 Google Inc. Rearrangement and rate allocation for compressing multichannel audio
KR20140123015A (ko) 2013-04-10 2014-10-21 한국전자통신연구원 다채널 신호를 위한 인코더 및 인코딩 방법, 다채널 신호를 위한 디코더 및 디코딩 방법
WO2014168439A1 (ko) * 2013-04-10 2014-10-16 한국전자통신연구원 다채널 신호를 위한 인코더 및 인코딩 방법, 다채널 신호를 위한 디코더 및 디코딩 방법
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
JP6303435B2 (ja) * 2013-11-22 2018-04-04 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用プログラム、オーディオ復号装置
KR101536855B1 (ko) * 2014-01-23 2015-07-14 재단법인 다차원 스마트 아이티 융합시스템 연구단 레지듀얼 코딩을 이용하는 인코딩 장치 및 방법
US9779739B2 (en) * 2014-03-20 2017-10-03 Dts, Inc. Residual encoding in an object-based audio system
KR101641645B1 (ko) * 2014-06-11 2016-07-22 전자부품연구원 오디오 소스 분리 방법 및 이를 적용한 오디오 시스템
EP2963646A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal
CN106471575B (zh) * 2014-07-01 2019-12-10 韩国电子通信研究院 多信道音频信号处理方法及装置
CN111182444A (zh) * 2020-01-03 2020-05-19 天域全感音科技有限公司 一种单双声道音频信号的转换装置及方法
EP4243014A4 (en) * 2021-01-25 2024-07-17 Samsung Electronics Co., Ltd. DEVICE AND METHOD FOR PROCESSING A MULTI-CHANNEL AUDIO SIGNAL
KR102770762B1 (ko) * 2021-07-30 2025-02-24 한국전자통신연구원 벡터 양자화된 잔여오차 특징을 사용한 오디오 부호화/복호화 장치 및 그 방법
CN116913328B (zh) * 2023-09-11 2023-11-28 荣耀终端有限公司 音频处理方法、电子设备及存储介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
WO2006091139A1 (en) 2005-02-23 2006-08-31 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
KR101315077B1 (ko) * 2005-03-30 2013-10-08 코닌클리케 필립스 일렉트로닉스 엔.브이. 멀티-채널 오디오 데이터를 인코딩 및 디코딩하기 위한 방법, 및 인코더들 및 디코더들
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
WO2007011157A1 (en) 2005-07-19 2007-01-25 Electronics And Telecommunications Research Institute Virtual source location information based channel level difference quantization and dequantization method
KR100755471B1 (ko) 2005-07-19 2007-09-05 한국전자통신연구원 가상음원위치정보에 기반한 채널간 크기 차이 양자화 및역양자화 방법
KR100803212B1 (ko) * 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
KR100902899B1 (ko) * 2006-02-07 2009-06-15 엘지전자 주식회사 부호화/복호화 장치 및 방법
CN101802907B (zh) 2007-09-19 2013-11-13 爱立信电话股份有限公司 多信道音频的联合增强
JPWO2009050896A1 (ja) * 2007-10-16 2011-02-24 パナソニック株式会社 ストリーム合成装置、復号装置、方法
EP2624253A3 (en) 2007-10-22 2013-11-06 Electronics and Telecommunications Research Institute Multi-object audio encoding and decoding method and apparatus thereof
CN101903943A (zh) 2008-01-01 2010-12-01 Lg电子株式会社 用于处理信号的方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20240185864A1 (en) * 2013-05-24 2024-06-06 Dolby International Ab Reconstruction of audio scenes from a downmix
US12243542B2 (en) * 2013-05-24 2025-03-04 Dolby International Ab Reconstruction of audio scenes from a downmix

Also Published As

Publication number Publication date
KR20110018728A (ko) 2011-02-24
WO2011021845A2 (en) 2011-02-24
EP2467850A2 (en) 2012-06-27
CN102483921A (zh) 2012-05-30
WO2011021845A3 (en) 2011-06-03
US20110046964A1 (en) 2011-02-24
CN102483921B (zh) 2014-07-30
EP2467850A4 (en) 2013-10-30
KR101613975B1 (ko) 2016-05-02
EP2467850B1 (en) 2016-06-01
JP2013502608A (ja) 2013-01-24
US8798276B2 (en) 2014-08-05

Similar Documents

Publication Publication Date Title
JP5815526B2 (ja) 復号化方法、復号化装置、符号化方法及び符号化装置
EP1999747B1 (en) Audio decoding
CN102037507B (zh) 参数立体声上混合设备、参数立体声译码器、参数立体声下混合设备、参数立体声编码器
KR101444102B1 (ko) 스테레오 오디오의 부호화, 복호화 방법 및 장치
EP2499638B1 (en) Parametric encoding and decoding
CN102388417B (zh) 基于自适应地可选择的左/右或中央/侧边立体声编码和参数立体声编码的组合的高级立体声编码
US8036904B2 (en) Audio encoder and method for scalable multi-channel audio coding, and an audio decoder and method for decoding said scalable multi-channel audio coding
US7602922B2 (en) Multi-channel encoder
CN103460282B (zh) 用于利用传送的相位信息产生去相关信号的装置
CN101151658B (zh) 多声道音频编码和解码方法、编码器和解码器
JP5266332B2 (ja) 信号処理方法及び装置
JP2015517121A (ja) インターチャネル差分推定方法及び空間オーディオ符号化装置
US20110051938A1 (en) Method and apparatus for encoding and decoding stereo audio
KR101692394B1 (ko) 스테레오 오디오의 부호화, 복호화 방법 및 장치
US8744089B2 (en) Method and apparatus for encoding and decoding stereo audio
JP5333257B2 (ja) 符号化装置、符号化システムおよび符号化方法
JP2017058696A (ja) インターチャネル差分推定方法及び空間オーディオ符号化装置
HK1135791B (en) Audio decoding

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130816

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150302

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150901

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150924

R150 Certificate of patent or registration of utility model

Ref document number: 5815526

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees