JP5106115B2 - オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング - Google Patents
オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング Download PDFInfo
- Publication number
- JP5106115B2 JP5106115B2 JP2007544408A JP2007544408A JP5106115B2 JP 5106115 B2 JP5106115 B2 JP 5106115B2 JP 2007544408 A JP2007544408 A JP 2007544408A JP 2007544408 A JP2007544408 A JP 2007544408A JP 5106115 B2 JP5106115 B2 JP 5106115B2
- Authority
- JP
- Japan
- Prior art keywords
- audit
- channels
- measurement
- audio
- scene
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本願は、その教示が参照によって本明細書に組み込まれている、弁理士整理番号Faller 19として2004年11月30日に出願した米国仮出願第60/631798号の利益を主張するものである。
本願の主題は、次の米国特許出願の主題に関連し、これらの米国特許出願のすべての教示が、参照によって本明細書に組み込まれている。
○弁理士整理番号Faller 5として2001年5月4日に出願した米国特許出願第09/848877号、
○弁理士整理番号Baumgarte 1−6−8として2001年11月7日に出願した米国特許出願第10/045458号(これ自体は、2001年8月10日に出願した米国仮出願第60/311565号の利益を主張する)、
○弁理士整理番号Baumgarte 2−10として2002年5月24日に出願した米国特許出願第10/155437号、
○弁理士整理番号Baumgarte 3−11として2002年9月18日に出願した米国特許出願第10/246570号、
○弁理士整理番号Baumgarte 7−12として2004年4月1日に出願した米国特許出願第10/815591号、
○弁理士整理番号Baumgarte 8−7−15として2004年9月8日に出願した米国特許出願第10/936464号、
○2004年1月20日に出願した米国特許出願第10/762100号(Faller 13−1)、
○弁理士整理番号Allamanche 1−2−17−3として2004年12月7日に出願した米国特許出願第11/006492号、
○弁理士整理番号Allamanche 2−3−18−4として2004年12月7日に出願した米国特許出願第11/006482号、
○弁理士整理番号Faller 22−5として2005年1月10日に出願した米国特許出願第11/032689号、および、
○弁理士整理番号Faller 20として2005年2月15日に出願した米国特許出願第11/058747号(これ自体は、2004年11月30日に出願した米国仮出願第60/631917号の利益を主張する)。
本願の主題は、次の論文に記載の主題にも関連し、これらの論文のすべての教示が、参照によって本明細書に組み込まれている。
○F.Baumgarte and C.Faller、「Binaural Cue Coding−Part I:Psychoacoustic fundamentals and design principles」、IEEE Trans.on Speech and Audio Proc.,vol.11,no.6、2003年11月、
○C.Faller and F.Baumgarte、「Binaural Cue Coding−Part II:Schemes and applications」、IEEE Trans.on Speech and Audio Proc.,vol.11,no.6、2003年11月、および
○C.Faller、「Coding of spatial audio compatible with different playback formats」、Preprint 117th Conv.Aud.Eng.Soc.、2004年10月。
本発明は、オーディオ信号のエンコーディングと、エンコードされたオーディオ・データからのオーディトリ・シーン(auditory scene)の後続合成とに関する。
図2は、エンコーダ202とデコーダ204とを含む包括的なバイノーラル・キュー・コーディング(BCC)オーディオ処理システム200のブロック図である。エンコーダ202には、ダウンミキサ206とBCCエスティメータ208とが含まれる。
好ましい実施態様では、1つまたは複数の被送出和信号に、入力オーディオ信号の信号成分のすべてが含まれる。目標は、各信号成分が十分に維持されることである。オーディオ入力チャネルの単純な合計は、しばしば、信号成分の増幅または減衰をもたらす。言い換えると、「単純な」和の信号成分の電力は、しばしば、各チャネルの対応する信号成分の電力の和より大きいまたはこれより小さい。和信号の信号成分の電力が、全入力チャネルの対応する電力とほぼ同一になるように和信号を等化するダウンミキシング技法を、使用することができる。
任意選択のスケーリングを提供することに加えて、またはその代わりに、スケーリング/遅延ブロック306は、任意選択として信号に遅延を適用することができる。
各逆フィルタ・バンク308は、周波数領域の対応するスケーリングされた係数
包括的なBCC合成
ここで、UECは、実数値を有するE×Cアップミキシング行列である。周波数領域でアップミキシングを実行することは、アップミキシングを各異なるサブバンドで個別に適用することを可能にする。
単一の和信号を仮定すると、BCCは、ICTD、ICLD、およびICCがオリジナル・オーディオ信号の対応するキューを近似するように、ステレオ・オーディオ信号またはマルチチャネル・オーディオ信号を合成する。次では、オーディトリ・スペイシャル・イメージ(auditory spatial image)属性に関するICTD、ICLD、およびICCの役割を述べる。
次では、ICTD、ICLD、およびICCがどのように推定されるかを説明する。これらの(量子化され、コーディングされた)空間的キューの送出のビットレートは、2〜3kb/sに過ぎないものとすることができ、したがって、BCCを用いると、ステレオ・オーディオ信号およびマルチチャネル・オーディオ信号を、単一オーディオ・チャネルに必要なものに近いビットレートで送出することが可能である。
次の測定値が、2つの(たとえば、ステレオ)オーディオ・チャネルの対応するサブバンド信号
○ICTD[サンプル単位]:
d1=max{−d,0}
d2=max{d,0} (9)
であり、
○ICLD[dB]:
3つ以上の入力チャネルがある場合には、通常、C=5チャネルの場合について図6に示されているように、基準チャネル(たとえば、チャネル番号1)と他のチャネルとの間でICTDおよびICLDを定義することが十分であり、ここで、τ1c(k)およびΔL1c(k)は、それぞれ基準チャネル1とチャネルcとの間のICTDおよびICLDを表す。
図8に、単一の被送出和信号s(n)と空間的キューとを与えられてステレオ・オーディオ信号またはマルチチャネル・オーディオ信号を生成するのにBCCデコーダ内で使用できる、図4のBCCシンセサイザ400の実施態様のブロック図を示す。和信号s(n)は、サブバンドに分解され、ここで、
遅延dcは、次の式(12)に従って、ICTD τ1c(k)から決定される。
出力サブバンド信号が、チャネルcと基準チャネル1との間で所望のICLD ΔL12(k)を有するためには、利得係数acが、次の式(13)を満足しなければならない。
ある種の実施形態で、ICC合成の目的は、ICTDおよびICLDに影響せずに、遅延およびスケーリングが適用された後のサブバンド間の相関を減らすことである。これは、ICTDおよびICLDが、平均変動が各サブバンド内で0になる(聴覚臨界帯域)ように周波数の関数として効果的に変更されるように、図8のフィルタhcを指定することによって達成することができる。
前に説明したように、BCCは、2つ以上の送出チャネルを用いて実施することができる。C個のオーディオ・チャネルを1つの単一(被送出)チャネルではなくE個のチャネルとして表す、C−to−E BCCと表されるBCCの変形形態を説明した。C−to−E BCCには、次の(少なくとも)2つの動機付けがある。
ICTDキュー、ICLDキュー、およびICCキューを定義する方法など、C−to−E BCCの信号処理の詳細は、2004年1月20日に出願した米国特許出願第10/762100号(Faller 13−1)に記載されている。
上で説明したように、従来のC−to−E BCC方式では、エンコーダは、C個のオリジナル・チャネルから統計的なチャネル間差パラメータ(たとえば、ICTDキュー、 ICLDキュー、および/またはICCキュー)を導出する。図6および7A〜Bに表されているように、これらの特定のBCCキューは、オーディトリ・スペイシャル・イメージの作成に使用されるラウドスピーカの個数および位置の関数である。これらのBCCキューは、オーディトリ・スペイシャル・イメージの知覚的属性を直接には表さないので、「非オブジェクト・ベースの」BCCキューと呼ばれる。
図10〜12に、1つの可能な5チャネル・サラウンド構成を示すが、図11Aでは、左ラウドスピーカ(#1)が、中央ラウドスピーカ(#3)の30°左に置かれ、右ラウドスピーカ(#2)が、中央ラウドスピーカの30°右に置かれ、左後ラウドスピーカ(#4)が、中央ラウドスピーカの110°左に置かれ、右後ラウドスピーカ(#5)が、中央ラウドスピーカの110°右に置かれている。
オーディトリ・イベントの幅w(b,k)は、次の式(16)に従って推定することができる。
w(b,k)=1−ICC(b,k) (16)
ここで、ICC(b,k)は、角度α(b,k)によって定義される方向を囲む2つのラウドスピーカの信号の間のコヒーレンス推定値である。
デコーダ処理は、オブジェクト・ベースのBCCキューを、レベル差(ICLD)およびコヒーレンス値(ICC)などの非オブジェクト・ベースのBCCキューに変換し、したがってこれらの非オブジェクト・ベースのBCCキューを従来のBCCデコーダで使用することによって実施することができる。
ΔL12(k)=20log10(a2/a1) (19)
図14に、角度φ0およびφと倍率a1およびa2とを示すが、s(n)は、振幅パニングが倍率a1およびa2に基づいて適用される時に角度φに現れるモノ信号を表す。図15は、φ0=30°の標準的なステレオ構成に関する、式(18)のステレオフォニック正弦法則によるICLDとステレオ・イベント角度φとの間の関係をグラフ的に表す。
本発明を、キュー・コードが1つまたは複数のオーディオ・チャネル(すなわち、E個の被送出チャネル)と共に送出されるBCCコーディング方式の文脈で説明してきたが、代替実施形態では、キュー・コードを、被送出チャネルを既に有し、おそらくは他のBCCコードを既に有する場所(たとえば、デコーダまたはストレージ・デバイス)に送出することができる。
Claims (12)
- オーディオ・チャネルをエンコードする方法であって、
2つ以上のオーディオ・チャネルの1つまたは複数のキュー・コードを生成するステップであって、少なくとも1つのキュー・コードは、前記オーディオ・チャネルに対応するオーディトリ・シーンの特性を直接に表すオブジェクト・ベースのキュー・コードであり、前記特性は、前記オーディトリ・シーンの作成に使用されるラウドスピーカの個数および位置と独立である、ステップと、
前記1つまたは複数のキュー・コードを送出するステップとを具備し、
前記少なくとも1つのオブジェクト・ベースのキュー・コードは、下記(1)〜(7)のうちの1つまたは複数を含み、
(1)基準方向に対する前記オーディトリ・シーン内のオーディトリ・イベントの絶対角度の第1の測定値であって、前記オーディトリ・イベントの前記絶対角度の前記第1の測定値は、(i)前記オーディオ・チャネルの相対電力ベクトルのベクトル和を生成し、(ii)前記基準方向に対する前記ベクトル和の角度に基づいて、前記オーディトリ・イベントの前記絶対角度の前記第1の測定値を決定することにより推定される、
(2)前記基準方向に対する前記オーディトリ・シーン内の前記オーディトリ・イベントの前記絶対角度の第2の測定値であって、前記オーディトリ・イベントの前記絶対角度の前記第2の測定値は、(i)前記オーディオ・チャネル内の2つの最も強いチャネルを識別し、(ii)前記2つの最も強いチャネルの間のレベル差を計算し、(iii)前記2つの最も強いチャネルの間の相対角度を計算するために振幅パニング・ローを適用し、(iv)前記相対角度を前記オーディトリ・イベントの前記絶対角度の前記第2の測定値に変換することにより推定される、
(3)前記オーディトリ・シーン内の前記オーディトリ・イベントの幅の第1の測定値であって、前記オーディトリ・イベントの前記幅の前記第1の測定値は、(i)前記オーディトリ・イベントの前記絶対角度を推定し、(ii)前記絶対角度を囲む2つのオーディオ・チャネルを識別し、(iii)前記2つの識別されたチャネルの間のコヒーレンスを推定し、(iv)前記推定されたコヒーレンスに基づいて前記オーディトリ・イベントの前記幅の前記第1の測定値を計算することにより推定される、
(4)前記オーディトリ・シーン内の前記オーディトリ・イベントの前記幅の第2の測定値であって、前記オーディトリ・イベントの前記幅の前記第2の測定値は、(i)前記オーディオ・チャネル内の2つの最も強いチャネルを識別し、(ii)前記2つの最も強いチャネルの間のコヒーレンスを推定し、(iii)前記推定されたコヒーレンスに基づいて前記オーディトリ・イベントの前記幅の前記第2の測定値を計算することにより推定される、
(5)前記オーディトリ・シーンのエンベロップメントの第1の度合いであって、前記エンベロップメントの第1の度合いは、異なるオーディオ・チャネル対間で得られたコヒーレンス推定値の加重平均として推定され、前記加重は、前記異なるオーディオ・チャネル対の前記相対電力の関数である、
(6)前記オーディトリ・シーンのエンベロップメントの第2の度合いであって、前記エンベロップメントの第2の度合いは、(i)前記2つの最も強いオーディオ・チャネルを除いた全てのオーディオ・チャネルの電力の和と、(ii)前記オーディオ・チャネルのすべての電力の和との比として推定される、そして、
(7)前記オーディトリ・シーンの指向性であって、前記指向性は、(i)前記オーディトリ・シーン内の前記オーディトリ・イベントの幅を推定し、(ii)前記オーディトリ・シーンのエンベロップメントの度合いを推定し、(iii)前記幅および前記エンベロップメントの度合いの加重和として前記指向性を計算することにより推定される、方法。 - 前記2つ以上のオーディオ・チャネルに対応するE個の被送出オーディオ・チャネルを送出することをさらに含み、E≧1である場合、
前記2つ以上のオーディオ・チャネルは、C個の入力オーディオ・チャネルを含み、C>Eであり、
前記C個の入力チャネルは、前記E個の被送出チャネルを生成するためにダウンミキシングされ、そして、
前記1つまたは複数のキュー・コードは、デコーダがE個の被送出チャネルのデコーディング中に前記少なくとも1つのオブジェクト・ベースのキュー・コードに基づいて合成処理を実行することを可能にするために送出される、請求項1に記載の方法。 - 前記少なくとも1つのオブジェクト・ベースのキュー・コードは、前記基準方向に対する前記オーディトリ・シーン内の前記オーディトリ・イベントの前記絶対角度の前記第1の測定値を含む、請求項1〜2のいずれかに記載の方法。
- 前記少なくとも1つのオブジェクト・ベースのキュー・コードは、前記基準方向に対する前記オーディトリ・シーン内の前記オーディトリ・イベントの前記絶対角度の前記第2の測定値を含む、請求項1〜3のいずれかに記載の方法。
- 前記少なくとも1つのオブジェクト・ベースのキュー・コードは、前記オーディトリ・シーン内の前記オーディトリ・イベントの前記幅の前記第1の測定値を含む、請求項1〜4のいずれかに記載の方法。
- 前記少なくとも1つのオブジェクト・ベースのキュー・コードは、前記オーディトリ・シーン内の前記オーディトリ・イベントの前記幅の前記第2の測定値を含む、請求項1〜5のいずれかに記載の方法。
- 前記少なくとも1つのオブジェクト・ベースのキュー・コードは、前記オーディトリ・シーンのエンベロップメントの前記第1の度合いを含む、請求項1〜6のいずれかに記載の方法。
- 前記少なくとも1つのオブジェクト・ベースのキュー・コードは、前記オーディトリ・シーンのエンベロップメントの前記第2の度合いを含む、請求項1〜7のいずれかに記載の方法。
- 前記少なくとも1つのオブジェクト・ベースのキュー・コードは、前記オーディトリ・シーンの前記指向性を含む、請求項1〜8のいずれかに記載の方法。
- E個の被送出オーディオ・チャネルを生成するためにC個の入力オーディオ・チャネルをエンコードする装置であって、
2つ以上のオーディオ・チャネルの1つまたは複数のキュー・コードを生成するように適合されたコード・エスティメータであって、少なくとも1つのキュー・コードは、前記オーディオ・チャネルに対応するオーディトリ・シーンの特性を直接に表すオブジェクト・ベースのキュー・コードであり、前記特性は、前記オーディトリ・シーンの作成に使用されるラウドスピーカの個数および位置と独立である、コード・エスティメータと、
前記E個の被送出チャネルを生成するために前記C個の入力チャネルをダウンミキシングするように適合されたダウンミキサであって、C>E≧1であり、前記装置は、デコーダが前記E個の被送出チャネルのデコーディング中に合成処理を実行することを可能にするために前記キュー・コードに関する情報を送出するように適合される、ダウンミキサとを備え、
前記少なくとも1つのオブジェクト・ベースのキュー・コードは、下記(1)〜(7)のうちの1つまたは複数を含み、
(1)基準方向に対する前記オーディトリ・シーン内のオーディトリ・イベントの絶対角度の第1の測定値であって、前記オーディトリ・イベントの前記絶対角度の前記第1の測定値は、(i)前記オーディオ・チャネルの相対電力ベクトルのベクトル和を生成し、(ii)前記基準方向に対する前記ベクトル和の角度に基づいて、前記オーディトリ・イベントの前記絶対角度の前記第1の測定値を決定することにより推定される、
(2)前記基準方向に対する前記オーディトリ・シーン内の前記オーディトリ・イベントの前記絶対角度の第2の測定値であって、前記オーディトリ・イベントの前記絶対角度の前記第2の測定値は、(i)前記オーディオ・チャネル内の2つの最も強いチャネルを識別し、(ii)前記2つの最も強いチャネルの間のレベル差を計算し、(iii)前記2つの最も強いチャネルの間の相対角度を計算するために振幅パニング・ローを適用し、(iv)前記相対角度を前記オーディトリ・イベントの前記絶対角度の前記第2の測定値に変換することにより推定される、
(3)前記オーディトリ・シーン内の前記オーディトリ・イベントの幅の第1の測定値であって、前記オーディトリ・イベントの前記幅の前記第1の測定値は、(i)前記オーディトリ・イベントの前記絶対角度を推定し、(ii)前記絶対角度を囲む2つのオーディオ・チャネルを識別し、(iii)前記2つの識別されたチャネルの間のコヒーレンスを推定し、(iv)前記推定されたコヒーレンスに基づいて前記オーディトリ・イベントの前記幅の前記第1の測定値を計算することにより推定される、
(4)前記オーディトリ・シーン内の前記オーディトリ・イベントの前記幅の第2の測定値であって、前記オーディトリ・イベントの前記幅の前記第2の測定値は、(i)前記オーディオ・チャネル内の2つの最も強いチャネルを識別し、(ii)前記2つの最も強いチャネルの間のコヒーレンスを推定し、(iii)前記推定されたコヒーレンスに基づいて前記オーディトリ・イベントの前記幅の前記第2の測定値を計算することにより推定される、
(5)前記オーディトリ・シーンのエンベロップメントの第1の度合いであって、前記エンベロップメントの第1の度合いは、異なるオーディオ・チャネル対間で得られたコヒーレンス推定値の加重平均として推定され、前記加重は、前記異なるオーディオ・チャネル対の前記相対電力の関数である、
(6)前記オーディトリ・シーンのエンベロップメントの第2の度合いであって、前記エンベロップメントの第2の度合いは、(i)前記2つの最も強いオーディオ・チャネルを除いた全てのオーディオ・チャネルの電力の和と、(ii)前記オーディオ・チャネルのすべての電力の和との比として推定される、そして、
(7)前記オーディトリ・シーンの指向性であって、前記指向性は、(i)前記オーディトリ・シーン内の前記オーディトリ・イベントの幅を推定し、(ii)前記オーディトリ・シーンのエンベロップメントの度合いを推定し、(iii)前記幅および前記エンベロップメントの度合いの加重和として前記指向性を計算することにより推定される、装置。 - C個の再生オーディオ・チャネルを生成するためにE個の被送出オーディオ・チャネルをデコードする方法であって、C>E≧1であり、
前記E個の被送出オーディオ・チャネルに対応するキュー・コードを受け取るステップであって、少なくとも1つのキュー・コードは、前記オーディオ・チャネルに対応するオーディトリ・シーンの特性を直接に表すオブジェクト・ベースのキュー・コードであり、前記特性は、前記オーディトリ・シーンの作成に使用されるラウドスピーカの個数および位置と独立である、ステップと、
1つまたは複数のアップミキシングされたチャネルを生成するために、前記E個の被送出チャネルのうちの1つまたは複数をアップミキシングするステップと、
前記キュー・コードを前記1つまたは複数のアップミキシングされたチャネルに適用することによって、前記C個の再生チャネルのうちの1つまたは複数を合成するステップとを具備し、
前記少なくとも1つのオブジェクト・ベースのキュー・コードは、下記(1)〜(7)のうちの1つまたは複数を含み、
(1)基準方向に対する前記オーディトリ・シーン内のオーディトリ・イベントの絶対角度の第1の測定値であって、前記オーディトリ・イベントの前記絶対角度の前記第1の測定値は、(i)前記オーディオ・チャネルの相対電力ベクトルのベクトル和を生成し、(ii)前記基準方向に対する前記ベクトル和の角度に基づいて、前記オーディトリ・イベントの前記絶対角度の前記第1の測定値を決定することにより推定される、
(2)前記基準方向に対する前記オーディトリ・シーン内の前記オーディトリ・イベントの前記絶対角度の第2の測定値であって、前記オーディトリ・イベントの前記絶対角度の前記第2の測定値は、(i)前記オーディオ・チャネル内の2つの最も強いチャネルを識別し、(ii)前記2つの最も強いチャネルの間のレベル差を計算し、(iii)前記2つの最も強いチャネルの間の相対角度を計算するために振幅パニング・ローを適用し、(iv)前記相対角度を前記オーディトリ・イベントの前記絶対角度の前記第2の測定値に変換することにより推定される、
(3)前記オーディトリ・シーン内の前記オーディトリ・イベントの幅の第1の測定値であって、前記オーディトリ・イベントの前記幅の前記第1の測定値は、(i)前記オーディトリ・イベントの前記絶対角度を推定し、(ii)前記絶対角度を囲む2つのオーディオ・チャネルを識別し、(iii)前記2つの識別されたチャネルの間のコヒーレンスを推定し、(iv)前記推定されたコヒーレンスに基づいて前記オーディトリ・イベントの前記幅の前記第1の測定値を計算することにより推定される、
(4)前記オーディトリ・シーン内の前記オーディトリ・イベントの前記幅の第2の測定値であって、前記オーディトリ・イベントの前記幅の前記第2の測定値は、(i)前記オーディオ・チャネル内の2つの最も強いチャネルを識別し、(ii)前記2つの最も強いチャネルの間のコヒーレンスを推定し、(iii)前記推定されたコヒーレンスに基づいて前記オーディトリ・イベントの前記幅の前記第2の測定値を計算することにより推定される、
(5)前記オーディトリ・シーンのエンベロップメントの第1の度合いであって、前記エンベロップメントの第1の度合いは、異なるオーディオ・チャネル対間で得られたコヒーレンス推定値の加重平均として推定され、前記加重は、前記異なるオーディオ・チャネル対の前記相対電力の関数である、
(6)前記オーディトリ・シーンのエンベロップメントの第2の度合いであって、前記エンベロップメントの第2の度合いは、(i)前記2つの最も強いオーディオ・チャネルを除いた全てのオーディオ・チャネルの電力の和と、(ii)前記オーディオ・チャネルのすべての電力の和との比として推定される、そして、
(7)前記オーディトリ・シーンの指向性であって、前記指向性は、(i)前記オーディトリ・シーン内の前記オーディトリ・イベントの幅を推定し、(ii)前記オーディトリ・シーンのエンベロップメントの度合いを推定し、(iii)前記幅および前記エンベロップメントの度合いの加重和として前記指向性を計算することにより推定される、方法。 - C個の再生オーディオ・チャネルを生成するためにE個の被送出オーディオ・チャネルをデコードする装置であって、C>E≧1であり、
前記E個の被送出オーディオ・チャネルに対応するキュー・コードを受け取るように適合されたレシーバであって、少なくとも1つのキュー・コードは、前記オーディオ・チャネルに対応するオーディトリ・シーンの特性を直接に表すオブジェクト・ベースのキュー・コードであり、前記特性は、前記オーディトリ・シーンの作成に使用されるラウドスピーカの個数および位置と独立である、レシーバと、
1つまたは複数のアップミキシングされたチャネルを生成するために、前記E個の被送出チャネルのうちの1つまたは複数をアップミキシングするように適合されたアップミキサと、
前記キュー・コードを前記1つまたは複数のアップミキシングされたチャネルに適用することによって、前記C個の再生チャネルのうちの1つまたは複数を合成するように適合されたシンセサイザとを備え、
前記少なくとも1つのオブジェクト・ベースのキュー・コードは、下記(1)〜(7)のうちの1つまたは複数を含み、
(1)基準方向に対する前記オーディトリ・シーン内のオーディトリ・イベントの絶対角度の第1の測定値であって、前記オーディトリ・イベントの前記絶対角度の前記第1の測定値は、(i)前記オーディオ・チャネルの相対電力ベクトルのベクトル和を生成し、(ii)前記基準方向に対する前記ベクトル和の角度に基づいて、前記オーディトリ・イベントの前記絶対角度の前記第1の測定値を決定することにより推定される、
(2)前記基準方向に対する前記オーディトリ・シーン内の前記オーディトリ・イベントの前記絶対角度の第2の測定値であって、前記オーディトリ・イベントの前記絶対角度の前記第2の測定値は、(i)前記オーディオ・チャネル内の2つの最も強いチャネルを識別し、(ii)前記2つの最も強いチャネルの間のレベル差を計算し、(iii)前記2つの最も強いチャネルの間の相対角度を計算するために振幅パニング・ローを適用し、(iv)前記相対角度を前記オーディトリ・イベントの前記絶対角度の前記第2の測定値に変換することにより推定される、
(3)前記オーディトリ・シーン内の前記オーディトリ・イベントの幅の第1の測定値であって、前記オーディトリ・イベントの前記幅の前記第1の測定値は、(i)前記オーディトリ・イベントの前記絶対角度を推定し、(ii)前記絶対角度を囲む2つのオーディオ・チャネルを識別し、(iii)前記2つの識別されたチャネルの間のコヒーレンスを推定し、(iv)前記推定されたコヒーレンスに基づいて前記オーディトリ・イベントの前記幅の前記第1の測定値を計算することにより推定される、
(4)前記オーディトリ・シーン内の前記オーディトリ・イベントの前記幅の第2の測定値であって、前記オーディトリ・イベントの前記幅の前記第2の測定値は、(i)前記オーディオ・チャネル内の2つの最も強いチャネルを識別し、(ii)前記2つの最も強いチャネルの間のコヒーレンスを推定し、(iii)前記推定されたコヒーレンスに基づいて前記オーディトリ・イベントの前記幅の前記第2の測定値を計算することにより推定される、
(5)前記オーディトリ・シーンのエンベロップメントの第1の度合いであって、前記エンベロップメントの第1の度合いは、異なるオーディオ・チャネル対間で得られたコヒーレンス推定値の加重平均として推定され、前記加重は、前記異なるオーディオ・チャネル対の前記相対電力の関数である、
(6)前記オーディトリ・シーンのエンベロップメントの第2の度合いであって、前記エンベロップメントの第2の度合いは、(i)前記2つの最も強いオーディオ・チャネルを除いた全てのオーディオ・チャネルの電力の和と、(ii)前記オーディオ・チャネルのすべての電力の和との比として推定される、そして、
(7)前記オーディトリ・シーンの指向性であって、前記指向性は、(i)前記オーディトリ・シーン内の前記オーディトリ・イベントの幅を推定し、(ii)前記オーディトリ・シーンのエンベロップメントの度合いを推定し、(iii)前記幅および前記エンベロップメントの度合いの加重和として前記指向性を計算することにより推定される、装置。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US63179804P | 2004-11-30 | 2004-11-30 | |
| US60/631,798 | 2004-11-30 | ||
| PCT/US2005/042772 WO2006060279A1 (en) | 2004-11-30 | 2005-11-22 | Parametric coding of spatial audio with object-based side information |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2008522244A JP2008522244A (ja) | 2008-06-26 |
| JP5106115B2 true JP5106115B2 (ja) | 2012-12-26 |
Family
ID=36087701
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2007544408A Expired - Lifetime JP5106115B2 (ja) | 2004-11-30 | 2005-11-22 | オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US8340306B2 (ja) |
| EP (1) | EP1817767B1 (ja) |
| JP (1) | JP5106115B2 (ja) |
| KR (1) | KR101215868B1 (ja) |
| TW (1) | TWI427621B (ja) |
| WO (1) | WO2006060279A1 (ja) |
Families Citing this family (48)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7447317B2 (en) | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
| KR100682904B1 (ko) * | 2004-12-01 | 2007-02-15 | 삼성전자주식회사 | 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법 |
| KR100682915B1 (ko) * | 2005-01-13 | 2007-02-15 | 삼성전자주식회사 | 다채널 신호 부호화/복호화 방법 및 장치 |
| WO2006126844A2 (en) * | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
| JP4988716B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
| WO2007083952A1 (en) * | 2006-01-19 | 2007-07-26 | Lg Electronics Inc. | Method and apparatus for processing a media signal |
| CN101410891A (zh) * | 2006-02-03 | 2009-04-15 | 韩国电子通信研究院 | 使用空间线索控制多目标或多声道音频信号的渲染的方法和装置 |
| KR100902899B1 (ko) | 2006-02-07 | 2009-06-15 | 엘지전자 주식회사 | 부호화/복호화 장치 및 방법 |
| US20070223740A1 (en) * | 2006-02-14 | 2007-09-27 | Reams Robert W | Audio spatial environment engine using a single fine structure |
| US7876904B2 (en) * | 2006-07-08 | 2011-01-25 | Nokia Corporation | Dynamic decoding of binaural audio signals |
| KR100917843B1 (ko) | 2006-09-29 | 2009-09-18 | 한국전자통신연구원 | 다양한 채널로 구성된 다객체 오디오 신호의 부호화 및복호화 장치 및 방법 |
| MX2008012315A (es) | 2006-09-29 | 2008-10-10 | Lg Electronics Inc | Metodos y aparatos para codificar y descodificar señales de audio basados en objeto. |
| KR101012259B1 (ko) * | 2006-10-16 | 2011-02-08 | 돌비 스웨덴 에이비 | 멀티채널 다운믹스된 객체 코딩의 개선된 코딩 및 파라미터 표현 |
| JP5337941B2 (ja) | 2006-10-16 | 2013-11-06 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネル・パラメータ変換のための装置および方法 |
| US8130966B2 (en) * | 2006-10-31 | 2012-03-06 | Anthony Grimani | Method for performance measurement and optimization of sound systems using a sliding band integration curve |
| WO2008060111A1 (en) * | 2006-11-15 | 2008-05-22 | Lg Electronics Inc. | A method and an apparatus for decoding an audio signal |
| EP2102855A4 (en) | 2006-12-07 | 2010-07-28 | Lg Electronics Inc | METHOD AND APPARATUS FOR DECODING AUDIO SIGNAL |
| CN103137130B (zh) * | 2006-12-27 | 2016-08-17 | 韩国电子通信研究院 | 用于创建空间线索信息的代码转换设备 |
| EP2118888A4 (en) | 2007-01-05 | 2010-04-21 | Lg Electronics Inc | METHOD AND DEVICE FOR PROCESSING AN AUDIO SIGNAL |
| RU2466469C2 (ru) * | 2007-01-10 | 2012-11-10 | Конинклейке Филипс Электроникс Н.В. | Аудиодекодер |
| RU2406165C2 (ru) * | 2007-02-14 | 2010-12-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способы и устройства для кодирования и декодирования объектно-базированных аудиосигналов |
| EP2111617B1 (en) | 2007-02-14 | 2013-09-04 | LG Electronics Inc. | Audio decoding method and corresponding apparatus |
| EP2130304A4 (en) | 2007-03-16 | 2012-04-04 | Lg Electronics Inc | METHOD AND DEVICE FOR PROCESSING AN AUDIO SIGNAL |
| KR101464977B1 (ko) * | 2007-10-01 | 2014-11-25 | 삼성전자주식회사 | 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치 |
| WO2009068087A1 (en) * | 2007-11-27 | 2009-06-04 | Nokia Corporation | Multichannel audio coding |
| US8654994B2 (en) | 2008-01-01 | 2014-02-18 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
| RU2439717C1 (ru) * | 2008-01-01 | 2012-01-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для обработки звукового сигнала |
| JP5243554B2 (ja) * | 2008-01-01 | 2013-07-24 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法及び装置 |
| WO2009141775A1 (en) | 2008-05-23 | 2009-11-26 | Koninklijke Philips Electronics N.V. | A parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder |
| EP2154911A1 (en) | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus for determining a spatial output multi-channel audio signal |
| RU2011130551A (ru) * | 2008-12-22 | 2013-01-27 | Конинклейке Филипс Электроникс Н.В. | Формирование выходного сигнала посредством обработки сенд-эффектов |
| WO2010087627A2 (en) * | 2009-01-28 | 2010-08-05 | Lg Electronics Inc. | A method and an apparatus for decoding an audio signal |
| CN102804806A (zh) * | 2009-06-23 | 2012-11-28 | 诺基亚公司 | 用于处理音频信号的方法及装置 |
| WO2011021111A1 (en) | 2009-08-20 | 2011-02-24 | Nds Limited | Hindering optical character recognition of a displayed text |
| CN102630385B (zh) * | 2009-11-30 | 2015-05-27 | 诺基亚公司 | 音频场景内的音频缩放处理的方法、装置及系统 |
| CN104054126B (zh) * | 2012-01-19 | 2017-03-29 | 皇家飞利浦有限公司 | 空间音频渲染和编码 |
| KR102033985B1 (ko) * | 2012-08-10 | 2019-10-18 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 공간적 오디오 객체 코딩에 오디오 정보를 적응시키기 위한 장치 및 방법 |
| US9478224B2 (en) * | 2013-04-05 | 2016-10-25 | Dolby International Ab | Audio processing system |
| BR112015028914B1 (pt) | 2013-05-24 | 2021-12-07 | Dolby International Ab | Método e aparelho para reconstruir um bloco de tempo/frequência de objetos de áudio n, método e codificador para gerar pelo menos um parâmetro de ponderação, e meio legível por computador |
| DE102013223201B3 (de) | 2013-11-14 | 2015-05-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes |
| ES2772851T3 (es) * | 2013-11-27 | 2020-07-08 | Dts Inc | Mezcla de matriz basada en multipletes para audio de múltiples canales de alta cantidad de canales |
| EP2879131A1 (en) | 2013-11-27 | 2015-06-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder, encoder and method for informed loudness estimation in object-based audio coding systems |
| CN105657633A (zh) | 2014-09-04 | 2016-06-08 | 杜比实验室特许公司 | 生成针对音频对象的元数据 |
| WO2017085562A2 (en) | 2015-11-20 | 2017-05-26 | Dolby International Ab | Improved rendering of immersive audio content |
| US10362423B2 (en) * | 2016-10-13 | 2019-07-23 | Qualcomm Incorporated | Parametric audio decoding |
| CN112005210A (zh) * | 2018-08-30 | 2020-11-27 | 惠普发展公司,有限责任合伙企业 | 多通道源音频的空间特性 |
| US11019449B2 (en) * | 2018-10-06 | 2021-05-25 | Qualcomm Incorporated | Six degrees of freedom and three degrees of freedom backward compatibility |
| DE102021200553B4 (de) * | 2021-01-21 | 2022-11-17 | Kaetel Systems Gmbh | Vorrichtung und Verfahren zum Ansteuern eines Schallerzeugers mit synthetischer Erzeugung des Differenzsignals |
Family Cites Families (97)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4236039A (en) | 1976-07-19 | 1980-11-25 | National Research Development Corporation | Signal matrixing for directional reproduction of sound |
| US4815132A (en) | 1985-08-30 | 1989-03-21 | Kabushiki Kaisha Toshiba | Stereophonic voice signal transmission system |
| DE3639753A1 (de) | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
| DE3943879B4 (de) | 1989-04-17 | 2008-07-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Digitales Codierverfahren |
| KR100228688B1 (ko) | 1991-01-08 | 1999-11-01 | 쥬더 에드 에이. | 다차원 음장용 인코우더/디코우더 |
| DE4209544A1 (de) | 1992-03-24 | 1993-09-30 | Inst Rundfunktechnik Gmbh | Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale |
| US5703999A (en) | 1992-05-25 | 1997-12-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Process for reducing data in the transmission and/or storage of digital signals from several interdependent channels |
| DE4236989C2 (de) | 1992-11-02 | 1994-11-17 | Fraunhofer Ges Forschung | Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle |
| US5371799A (en) | 1993-06-01 | 1994-12-06 | Qsound Labs, Inc. | Stereo headphone sound source localization system |
| US5463424A (en) | 1993-08-03 | 1995-10-31 | Dolby Laboratories Licensing Corporation | Multi-channel transmitter/receiver system providing matrix-decoding compatible signals |
| JP3227942B2 (ja) | 1993-10-26 | 2001-11-12 | ソニー株式会社 | 高能率符号化装置 |
| DE4409368A1 (de) | 1994-03-18 | 1995-09-21 | Fraunhofer Ges Forschung | Verfahren zum Codieren mehrerer Audiosignale |
| JP3277679B2 (ja) | 1994-04-15 | 2002-04-22 | ソニー株式会社 | 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置 |
| JPH0969783A (ja) | 1995-08-31 | 1997-03-11 | Nippon Steel Corp | オーディオデータ符号化装置 |
| US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
| US5771295A (en) | 1995-12-26 | 1998-06-23 | Rocktron Corporation | 5-2-5 matrix system |
| US7012630B2 (en) | 1996-02-08 | 2006-03-14 | Verizon Services Corp. | Spatial sound conference system and apparatus |
| EP0820664B1 (en) | 1996-02-08 | 2005-11-09 | Koninklijke Philips Electronics N.V. | N-channel transmission, compatible with 2-channel transmission and 1-channel transmission |
| US5825776A (en) | 1996-02-27 | 1998-10-20 | Ericsson Inc. | Circuitry and method for transmitting voice and data signals upon a wireless communication channel |
| US5889843A (en) | 1996-03-04 | 1999-03-30 | Interval Research Corporation | Methods and systems for creating a spatial auditory environment in an audio conference system |
| US5812971A (en) | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
| KR0175515B1 (ko) | 1996-04-15 | 1999-04-01 | 김광호 | 테이블 조사 방식의 스테레오 구현 장치와 방법 |
| US6987856B1 (en) | 1996-06-19 | 2006-01-17 | Board Of Trustees Of The University Of Illinois | Binaural signal processing techniques |
| US6697491B1 (en) | 1996-07-19 | 2004-02-24 | Harman International Industries, Incorporated | 5-2-5 matrix encoder and decoder system |
| JP3707153B2 (ja) | 1996-09-24 | 2005-10-19 | ソニー株式会社 | ベクトル量子化方法、音声符号化方法及び装置 |
| SG54379A1 (en) | 1996-10-24 | 1998-11-16 | Sgs Thomson Microelectronics A | Audio decoder with an adaptive frequency domain downmixer |
| SG54383A1 (en) | 1996-10-31 | 1998-11-16 | Sgs Thomson Microelectronics A | Method and apparatus for decoding multi-channel audio data |
| US5912976A (en) | 1996-11-07 | 1999-06-15 | Srs Labs, Inc. | Multi-channel audio enhancement system for use in recording and playback and methods for providing same |
| US6131084A (en) | 1997-03-14 | 2000-10-10 | Digital Voice Systems, Inc. | Dual subframe quantization of spectral magnitudes |
| US6111958A (en) | 1997-03-21 | 2000-08-29 | Euphonics, Incorporated | Audio spatial enhancement apparatus and methods |
| US6236731B1 (en) | 1997-04-16 | 2001-05-22 | Dspfactory Ltd. | Filterbank structure and method for filtering and separating an information signal into different bands, particularly for audio signal in hearing aids |
| US5860060A (en) | 1997-05-02 | 1999-01-12 | Texas Instruments Incorporated | Method for left/right channel self-alignment |
| US5946352A (en) | 1997-05-02 | 1999-08-31 | Texas Instruments Incorporated | Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain |
| US6108584A (en) | 1997-07-09 | 2000-08-22 | Sony Corporation | Multichannel digital audio decoding method and apparatus |
| DE19730130C2 (de) | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
| US5890125A (en) | 1997-07-16 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
| US6021389A (en) | 1998-03-20 | 2000-02-01 | Scientific Learning Corp. | Method and apparatus that exaggerates differences between sounds to train listener to recognize and identify similar sounds |
| US6016473A (en) * | 1998-04-07 | 2000-01-18 | Dolby; Ray M. | Low bit-rate spatial coding method and system |
| TW444511B (en) | 1998-04-14 | 2001-07-01 | Inst Information Industry | Multi-channel sound effect simulation equipment and method |
| JP3657120B2 (ja) | 1998-07-30 | 2005-06-08 | 株式会社アーニス・サウンド・テクノロジーズ | 左,右両耳用のオーディオ信号を音像定位させるための処理方法 |
| JP2000151413A (ja) | 1998-11-10 | 2000-05-30 | Matsushita Electric Ind Co Ltd | オーディオ符号化における適応ダイナミック可変ビット割り当て方法 |
| JP2000152399A (ja) | 1998-11-12 | 2000-05-30 | Yamaha Corp | 音場効果制御装置 |
| US6408327B1 (en) | 1998-12-22 | 2002-06-18 | Nortel Networks Limited | Synthetic stereo conferencing over LAN/WAN |
| US6282631B1 (en) | 1998-12-23 | 2001-08-28 | National Semiconductor Corporation | Programmable RISC-DSP architecture |
| EP1370114A3 (en) | 1999-04-07 | 2004-03-17 | Dolby Laboratories Licensing Corporation | Matrix improvements to lossless encoding and decoding |
| US6539357B1 (en) | 1999-04-29 | 2003-03-25 | Agere Systems Inc. | Technique for parametric coding of a signal containing information |
| JP4438127B2 (ja) | 1999-06-18 | 2010-03-24 | ソニー株式会社 | 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体 |
| US6823018B1 (en) | 1999-07-28 | 2004-11-23 | At&T Corp. | Multiple description coding communication system |
| US6434191B1 (en) | 1999-09-30 | 2002-08-13 | Telcordia Technologies, Inc. | Adaptive layered coding for voice over wireless IP applications |
| US6614936B1 (en) | 1999-12-03 | 2003-09-02 | Microsoft Corporation | System and method for robust video coding using progressive fine-granularity scalable (PFGS) coding |
| US6498852B2 (en) | 1999-12-07 | 2002-12-24 | Anthony Grimani | Automatic LFE audio signal derivation system |
| US6845163B1 (en) | 1999-12-21 | 2005-01-18 | At&T Corp | Microphone array for preserving soundfield perceptual cues |
| CN1264382C (zh) | 1999-12-24 | 2006-07-12 | 皇家菲利浦电子有限公司 | 多通道音频信号处理装置和方法 |
| US6782366B1 (en) | 2000-05-15 | 2004-08-24 | Lsi Logic Corporation | Method for independent dynamic range control |
| TW507194B (en) * | 2000-05-24 | 2002-10-21 | Nat Science Council | Variable-rate residual-transform vocoders using auditory perception approximation |
| JP2001339311A (ja) | 2000-05-26 | 2001-12-07 | Yamaha Corp | オーディオ信号圧縮回路および伸長回路 |
| US6850496B1 (en) | 2000-06-09 | 2005-02-01 | Cisco Technology, Inc. | Virtual conference room for voice conferencing |
| US6973184B1 (en) | 2000-07-11 | 2005-12-06 | Cisco Technology, Inc. | System and method for stereo conferencing over low-bandwidth links |
| US7236838B2 (en) | 2000-08-29 | 2007-06-26 | Matsushita Electric Industrial Co., Ltd. | Signal processing apparatus, signal processing method, program and recording medium |
| US6996521B2 (en) | 2000-10-04 | 2006-02-07 | The University Of Miami | Auxiliary channel masking in an audio signal |
| JP3426207B2 (ja) | 2000-10-26 | 2003-07-14 | 三菱電機株式会社 | 音声符号化方法および装置 |
| TW510144B (en) | 2000-12-27 | 2002-11-11 | C Media Electronics Inc | Method and structure to output four-channel analog signal using two channel audio hardware |
| US6885992B2 (en) | 2001-01-26 | 2005-04-26 | Cirrus Logic, Inc. | Efficient PCM buffer |
| US20030007648A1 (en) * | 2001-04-27 | 2003-01-09 | Christopher Currell | Virtual audio system and techniques |
| US20030035553A1 (en) | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
| US7116787B2 (en) | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
| US7006636B2 (en) * | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
| US7644003B2 (en) | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
| US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
| US6934676B2 (en) | 2001-05-11 | 2005-08-23 | Nokia Mobile Phones Ltd. | Method and system for inter-channel signal redundancy removal in perceptual audio coding |
| US7668317B2 (en) | 2001-05-30 | 2010-02-23 | Sony Corporation | Audio post processing in DVD, DTV and other audio visual products |
| TW544654B (en) * | 2001-07-06 | 2003-08-01 | Shyue-Yun Wan | Method of eliminating noise on sound storage and regeneration system |
| SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
| JP2003044096A (ja) | 2001-08-03 | 2003-02-14 | Matsushita Electric Ind Co Ltd | マルチチャンネルオーディオ信号符号化方法、マルチチャンネルオーディオ信号符号化装置、記録媒体および音楽配信システム |
| CN100574158C (zh) | 2001-08-27 | 2009-12-23 | 加利福尼亚大学董事会 | 用于改善音频信号的方法与装置 |
| EP1479071B1 (en) | 2002-02-18 | 2006-01-11 | Koninklijke Philips Electronics N.V. | Parametric audio coding |
| US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
| EP1500084B1 (en) | 2002-04-22 | 2008-01-23 | Koninklijke Philips Electronics N.V. | Parametric representation of spatial audio |
| JP4714415B2 (ja) | 2002-04-22 | 2011-06-29 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | パラメータによるマルチチャンネルオーディオ表示 |
| EP1502361B1 (en) | 2002-05-03 | 2015-01-14 | Harman International Industries Incorporated | Multi-channel downmixing device |
| US6940540B2 (en) | 2002-06-27 | 2005-09-06 | Microsoft Corporation | Speaker detection and tracking using audiovisual data |
| BR0305434A (pt) | 2002-07-12 | 2004-09-28 | Koninkl Philips Electronics Nv | Métodos e arranjos para codificar e para decodificar um sinal de áudio multicanal, aparelhos para fornecer um sinal de áudio codificado e um sinal de áudio decodificado, sinal de áudio multicanal codificado, e, meio de armazenagem |
| WO2004008806A1 (en) | 2002-07-16 | 2004-01-22 | Koninklijke Philips Electronics N.V. | Audio coding |
| EP1527441B1 (en) | 2002-07-16 | 2017-09-06 | Koninklijke Philips N.V. | Audio coding |
| US8437868B2 (en) | 2002-10-14 | 2013-05-07 | Thomson Licensing | Method for coding and decoding the wideness of a sound source in an audio scene |
| ATE348386T1 (de) | 2002-11-28 | 2007-01-15 | Koninkl Philips Electronics Nv | Audiosignalkodierung |
| JP2004193877A (ja) * | 2002-12-10 | 2004-07-08 | Sony Corp | 音像定位信号処理装置および音像定位信号処理方法 |
| CN1748247B (zh) | 2003-02-11 | 2011-06-15 | 皇家飞利浦电子股份有限公司 | 音频编码 |
| FI118247B (fi) | 2003-02-26 | 2007-08-31 | Fraunhofer Ges Forschung | Menetelmä luonnollisen tai modifioidun tilavaikutelman aikaansaamiseksi monikanavakuuntelussa |
| KR100706012B1 (ko) * | 2003-03-03 | 2007-04-11 | 미츠비시 쥬고교 가부시키가이샤 | 캐스크, 중성자 차폐체용 조성물 및 중성자 차폐체 제조법 |
| EP1609335A2 (en) | 2003-03-24 | 2005-12-28 | Koninklijke Philips Electronics N.V. | Coding of main and side signal representing a multichannel signal |
| US7343291B2 (en) * | 2003-07-18 | 2008-03-11 | Microsoft Corporation | Multi-pass variable bitrate media encoding |
| US20050069143A1 (en) | 2003-09-30 | 2005-03-31 | Budnikov Dmitry N. | Filtering for spatial audio rendering |
| US7672838B1 (en) | 2003-12-01 | 2010-03-02 | The Trustees Of Columbia University In The City Of New York | Systems and methods for speech recognition using frequency domain linear prediction polynomials to form temporal and spectral envelopes from frequency domain representations of signals |
| US7394903B2 (en) | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
| US7391870B2 (en) * | 2004-07-09 | 2008-06-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V | Apparatus and method for generating a multi-channel output signal |
| US7716043B2 (en) | 2005-10-24 | 2010-05-11 | Lg Electronics Inc. | Removing time delays in signal paths |
-
2005
- 2005-11-22 JP JP2007544408A patent/JP5106115B2/ja not_active Expired - Lifetime
- 2005-11-22 WO PCT/US2005/042772 patent/WO2006060279A1/en not_active Ceased
- 2005-11-22 KR KR1020077015056A patent/KR101215868B1/ko not_active Expired - Fee Related
- 2005-11-22 EP EP05852198.0A patent/EP1817767B1/en not_active Expired - Lifetime
- 2005-11-22 US US11/667,747 patent/US8340306B2/en not_active Expired - Fee Related
- 2005-11-28 TW TW094141787A patent/TWI427621B/zh not_active IP Right Cessation
Also Published As
| Publication number | Publication date |
|---|---|
| EP1817767A1 (en) | 2007-08-15 |
| US8340306B2 (en) | 2012-12-25 |
| KR20070086851A (ko) | 2007-08-27 |
| US20080130904A1 (en) | 2008-06-05 |
| TW200636677A (en) | 2006-10-16 |
| TWI427621B (zh) | 2014-02-21 |
| EP1817767B1 (en) | 2015-11-11 |
| WO2006060279A1 (en) | 2006-06-08 |
| JP2008522244A (ja) | 2008-06-26 |
| KR101215868B1 (ko) | 2012-12-31 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5106115B2 (ja) | オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング | |
| JP4856653B2 (ja) | 被送出チャネルに基づくキューを用いる空間オーディオのパラメトリック・コーディング | |
| CA2593290C (en) | Compact side information for parametric coding of spatial audio | |
| JP5017121B2 (ja) | 外部的に供給されるダウンミックスとの空間オーディオのパラメトリック・コーディングの同期化 | |
| CA2582485C (en) | Individual channel shaping for bcc schemes and the like | |
| JP4625084B2 (ja) | バイノーラルキュー符号化方法等のための拡散音の整形 | |
| HK1105236A (en) | Compact side information for parametric coding of spatial audio | |
| HK1105236B (en) | Compact side information for parametric coding of spatial audio | |
| HK1106860B (en) | Parametric coding of spatial audio with cues based on transmitted channels |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081105 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110905 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111205 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120904 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121002 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5106115 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151012 Year of fee payment: 3 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
| R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
| R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
| R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
| R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
