JP2007509363A - オーディオ符号化方法及び装置 - Google Patents

オーディオ符号化方法及び装置 Download PDF

Info

Publication number
JP2007509363A
JP2007509363A JP2006534861A JP2006534861A JP2007509363A JP 2007509363 A JP2007509363 A JP 2007509363A JP 2006534861 A JP2006534861 A JP 2006534861A JP 2006534861 A JP2006534861 A JP 2006534861A JP 2007509363 A JP2007509363 A JP 2007509363A
Authority
JP
Japan
Prior art keywords
phase
frequency
sine wave
frame
random access
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006534861A
Other languages
English (en)
Inventor
セー デン ブリンカー アルベルトゥス
イェー ゲリッツ アンドレアス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2007509363A publication Critical patent/JP2007509363A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Cereal-Derived Products (AREA)

Abstract

連続的な複数の時間セグメント毎の、サンプルされた信号値(x(t))の各組によって表現されるオーディオ信号(x)の符号化を開示する。サンプルした信号値を分析して、連続的な複数のセグメント毎に1つ以上の正弦波成分を特定する。これらの正弦波成分を連続的な複数のセグメントにわたって連結させて正弦波トラックを提供し、各トラックは複数のフレームから成る。符号化信号(AS)が生成され、この符号化信号は、フレーム毎の表現レベル(r)を含む正弦波コード(CS)を含むか、あるいは、所定フレームがランダムアクセス・フレームとして指定されている際には、この符号化信号が含む正弦波コード(CS)の一部は、この所定フレームについての位相(ψ)、周波数(ω)及び量子化テーブル(Q)を含む。本発明は、量子化器における量子化精度の長い適応及び/または大きなビットストリームの必要性を回避しつつ、改善されたオーディオ品質を維持したままで、トラック内のランダムアクセスを可能にする。

Description

(発明の分野)
本発明は、特定オーディオ信号中の広帯域信号の符号化及び復号化に関するものである。本発明は、エンコーダ(符号化器)及びデコーダ(復号化器)に共に関するものであり、そして本発明により符号化したオーディオストリーム、及びこうしたオーディオストリームを記憶するデータ記録媒体に関するものである。
(発明の背景)
広帯域信号、例えば音声のようなオーディオ信号を伝送する際には、圧縮または符号化技術を用いて信号の帯域またはビットレートを低減する。
国際特許出願WO 01/69593 欧州特許出願02080002.5
図1に、本発明において使用する既知のパラメトリック符号化方式、特に正弦波エンコーダを示し、この符号化方式は国際特許出願WO 01/69593及び欧州特許出願02080002.5(PHNL021216)に記載されている。このエンコーダでは、入力オーディオ信号x(t)が(できれば互いに重複した)いくつかの時間セグメントまたはフレームに分割され、この時間セグメントまたはフレームは、代表的なものとして各20msの持続時間を有する。各セグメントは、過渡成分、正弦波成分、及びノイズ(雑音)成分に分解される。入力オーディオ信号の他の成分、例えば複素高調波を導出することも可能であるが、これらの成分は本発明の目的とは無関係である。
図1の正弦波アナライザ(分析器)130では、セグメント毎の信号x2が、振幅、周波数及び位相のパラメータによって表わされる複数の正弦波を用いてモデル化される。この情報は通常、分析期間中にフーリエ変換(FT:Fourier Transformation)を実行することによって抽出され、フーリエ変換は、この期間の、周波数、周波数毎の振幅、及び周波数毎の位相を含むスペクトル表現を提供し、ここで各位相は「ラップ」(巡回)し、即ち{−π;π}の範囲内にある。一旦、セグメントについての正弦波情報が推定されると、トラッキング・アルゴリズムを開始する。このアルゴリズムはコスト関数を用いて、異なるセグメントをセグメント毎のベースで互いに連結(リンク)させて、いわゆるトラックを得る。従って、このトラッキング・アルゴリズムは、特定瞬時に始まり、複数の時間セグメントにわたる特定期間中に進展し、そして停止する正弦波トラックから成る正弦波コードCsを生じさせる。
こうした正弦波符号化では、エンコーダ内で形成されたトラックについての情報を伝送するのが通常である。このことは簡単な方法かつ低コストで行うことができる、というのは、これらのトラックは低速で変化する周波数しか持たないからである。従って、周波数情報は時間差符号化によって効率的に伝送することができる。一般に、振幅も長い時間にわたって差分的に符号化することができる。
周波数とは対照的に、位相は時間と共により急速に変化する。周波数が(ほぼ)一定であれば、位相は時間と共に(ほぼ)直線的に変化し、この直線からの位相の偏差(ずれ)に応じた周波数変化が生じる。トラック・セグメントのインデックス(指標)の関数として位相はほぼ直線的な挙動を有する。従って、符号化された位相の伝送はより複雑になる。しかし、伝送される際には、フーリエ変換によって提供される位相は{π;−π}の範囲に限定され、即ち位相は「ラップ」される。こうした位相のモジュロ2πでの表現により、構造的なフレーム間の位相関係が失われ、第一印象ではランダムに変化するように見える。
しかし、位相は周波数の積分であるので、位相は冗長であり、原則的に伝送する必要はない。これによりビットレートが大幅に低減される。デコーダでは、位相連続と呼ばれるプロセスによって位相が復元される。
位相連続では、符号化された周波数のみ伝送され、位相はデコーダにおいて、位相と周波数との積分関係を利用することによって周波数から復元される。しかし、位相連続を用いる際には、位相を完全に復元することができないことが知られている。例えば、周波数の測定誤差によるか、あるいは量子化ノイズによる周波数誤差が発生すれば、積分関係を用いて再構成される位相は一般に、ドリフト(ゆらぎ)の特性を有する誤差を示す。このことは、周波数誤差がランダムに近いことによる。低周波数の誤差は積分によって増幅され、結果的に、復元される位相は実測された位相から外れてドリフトしがちになる。このことは可聴のアーティファクト(歪み)をもたらす。
このことを図2aに示し、ここでΩ及びΨは、あるトラックについてのそれぞれ実周波数及び実位相である。エンコーダ及びデコーダの両方において、周波数と位相とは積分関係を有し、これを文字”I”で表わす。エンコーダにおける量子化プロセスは付加ノイズnとしてモデル化される。従って、デコーダでは、復元された位相Ψは2つの成分:即ち実位相Ψ及びノイズ成分ε2を含み、ここで復元された位相のスペクトル及びノイズε2のパワースペクトル密度関数は共に明らかな低周波数の特性を有する。
従って、位相連続では、復元される位相は低周波数信号自体であることがわかる、というのは、復元される位相は低周波数信号の積分であるからである。しかし、再構成プロセス中に導入されるノイズも、この低周波数範囲において支配的である。従って、符号化中に導入されるノイズnをフィルタで除去する観点でこれらのソース(信号とノイズ)を分離することは困難である。
さらに、位相連続では、ビットレートを節減するために、各トラックの第1正弦波のみがトラック毎に伝送される。続きの各位相は、初期位相及びトラックの周波数から計算される。周波数は量子化され、必ずしも非常に正確には推定されないので、連続位相は測定位相から外れる。位相連続はオーディオ信号の品質を劣化させることが実験で示されている。
欧州特許出願02080002.5(PHNL021216)は、周波数/位相の結合量子化器を提案することによってこれらの問題に応え、ここで正弦波トラックの測定された位相は−π〜πの値を有し、測定された周波数及び連結(リンク)情報を用いることによってアンラップ(非巡回)にされ、トラックに沿って単調増加するアンラップの位相が生じる。エンコーダでは、アンラップの位相が、適応差分パルス符号変調(ADPCM:Adaptive Differential Pulse Code Modulation)量子化器を用いることによって量子化されてデコーダに伝送される。デコーダは正弦波トラックの周波数及び位相を、アンラップの位相軌跡から導出する。
例として、ADPCM量子化器を以下に述べるように構成することができる。トラックの第1連続については、アンラップの位相を表1に従って量子化する:
Figure 2007509363
量子化境界はこの表に従って、{−∞;2・T(r=1),0,2・T(r=2),∞}によって規定される。これに続く連続毎に、この表をスケールする(スケール係数=倍率を乗じる)。表現レベルが外側レベルであれば、この表に21/2を乗じて、量子化の精度をより粗くする。さもなければ、表現レベルは内側レベルであり、表を2-1/4倍して量子化精度をより細かくする。さらに、内側レベルには上限及び下限の境界が存在し、即ち3π/4及びπ/64である。
上記方法におけるアンラップの位相軌跡の量子化は連続的なプロセスであり、ここで量子化精度はトラックに沿って適応される。従って、トラックを復号化するためには、復号化プロセスをトラックの出発点または始点から開始しなければならず、即ち、デコーダはトラック全体の量子化を元に戻すことしかできず、トラックの一部分を復号化することは不可能である。従って、ランダムアクセスを可能にする特別な方法をエンコーダ及びデコーダに追加しなければならない。ランダムアクセスは、例えば、オーディオ信号を「スキップ(飛越し)」または「早送り」するために用いることができる。
ランダムアクセスを実行する第1の直接的な方法は、エンコーダ/量子化器においてランダムアクセス・フレーム(またはリフレッシュ点)を規定し、デコーダではこれらのランダムアクセス・フレームにおいてADPCM量子化器を再始動させることである。ランダムアクセス・フレームについては、初期テーブルを用いる。従って、リフレッシュは通常発生のビットと同じくらい高価になる。従って、最初には、量子化精度が粗すぎてトラックの不連続を生じさせるか、あるいは、量子化精度が細かすぎて、大きな量子化誤差を生じさせることがある。このことは、ランダムアクセス・フレームを使用せずに符号化した信号に比べてオーディオ品質の劣化もたらす。
第2の直接的な方法は、ADPCM量子化器のすべての状態(即ち、欧州特許出願02080002.5(PHNL021216)に記載の、予測器における量子化精度及びメモリー)を伝送することである。従って、予測器はランダムアクセス・フレームありまたはなしの場合と同様の出力を有する。こうすれば、音質はほとんど損なわれない。しかし、すべての情報を伝送するための追加的なビットレートは相当のものである。特に、予測器のメモリーの内容は、ADPCM量子化器の量子化精度に応じて量しかしなければならないからである。
本発明はこれらの問題に応えるものである。
(発明の概要)
本発明は、広帯域信号、特にオーディオ信号または音声信号を低いビットレートを用いて符号化する方法を提供する。より詳細には、本発明はオーディオ信号を符号化する方法を提供し、この方法は:連続的な複数の時間セグメント毎の、サンプル(標本化)された信号値の各組を提供するステップと;これらのサンプルされた信号値を分析して、前記連続的な複数のセグメント毎に1つ以上の正弦波成分を特定するステップと;前記連続する複数のセグメントにわたってこれらの正弦波成分を連結(リンク)させて、各トラックが複数のフレームから成る正弦波トラックを提供するステップと;0個またはそれ以上の数のフレームについての表現レベルを具えた正弦波コードを含む符号化された信号を発生するステップであって、これらのコードの一部は、所定フレームがランダムアクセス・フレームとして指定されている際の、この所定フレームについての位相、周波数、及び量子化テーブルを具えている。
このようにして、ランダムアクセスが可能になり、例えば、従来技術の量子化器、例えばADPCM量子化器における量子化精度の長い適応を回避しつつ、トラックを通してのスキップが可能になる、というのは、(一部の)量子化状態は(量子化テーブル(表)の形で)デコーダに伝送されるからである。
さらに、デフォルトの初期テーブルを用いる上記第1の直接的な方法に比べて、量子化テーブルを高速にすべく適応させることができる。これに加えて、上記第2の直接的な方法に比べて、本発明はより低いビットレートを提供する。
本発明は、量子化精度のみを伝送することによって、上記2つの(直接的な)方法の良い折衷案を提供し、これにより低いビットレートで良好な品質を提供する。
本発明の好適例では、各量子化テーブルがインデックスによって表わされ、このインデックスは、量子化テーブルの代わりにランダムアクセス・フレームで、エンコーダからデコーダへ伝送される。
ランダムアクセス・テーブル用の位相(φ)及び周波数(ω)は、トラックの始点を量子化するために用いるデフォルトの方法に従って量子化されたリフレッシュ・フレーム内で測定された位相及び測定された周波数であることが好ましい。これらの位相及び周波数は、それぞれφ(0)及びω(0)とも称される。
(好適な実施例の詳細な説明)
以下、本発明の好適な実施例を図面を参照しながら説明し、図面では、同様の構成要素は、特に断わりのない限り同じ参照番号で表わし、同様の機能を実行する。
図1に従来技術のエンコーダを示し、このエンコーダにおいて本発明の実施例を実現する。本発明の好適な実施例では、エンコーダ1は、国際特許出願WO 01/69593の図1、及び欧州特許出願02080002.5(PHNL021216)に記載の種類の正弦波エンコーダである。この従来技術のエンコーダ、及びこれに対応するデコーダの動作は良く説明されており、本明細書では、本発明に関係する部分のみ説明を行う。
従来技術及び本発明の好適な実施例では共に、オーディオエンコーダ1は入力オーディオ信号を特定のサンプリング周波数でサンプルして、このオーディオ信号のディジタル表現x(t)を生成する。そしてエンコーダ1は、サンプルされた入力信号を3つの成分:即ち過渡信号成分、持続的な確定成分、及び持続的な確率成分に分離する。オーディオエンコーダ1は、過渡エンコーダ11、正弦波エンコーダ13、及びノイズエンコーダ(NA)14を具えている。
過渡エンコーダ11は、過渡検出器(TD:Transient Detector)110、過渡分析器(アナライザ)(TA:Transient Analyzer)111、及び過渡合成器(シンセサイザ)(TS:Transient Synthesizer)112を具えている。まず、信号x(t)が過渡検出器110に入る。この検出器110は、過渡信号成分が存在するか否か、及びその位置を推定する。この情報は過渡分析器(TA)111に供給される。過渡信号成分の位置が特定されれば、過渡分析器(TA)111は、この過渡信号成分(の主要部分)を抽出しようとする。過渡分析器111は、形状関数を、好適には推定した開始位置から始まる信号セグメントに当てはめ、例えば複数(少数)の正弦波成分を用いることによって、この形状関数下にある内容を特定する。この情報は過渡コードCT内に含まれ、過渡コードCTの生成についてのより詳細な情報はWO 01/69593中に提供されている。
過渡コードCTは、過渡合成器(TS)112に提供される。合成された過渡信号成分は減算器16において入力信号x(t)から減算されて、信号x1が生じる。ゲイン(利得)制御メカニズムGC(12)を用いてx1からx2を生成する。
信号x2は正弦波エンコーダ13に供給され、この信号は正弦波エンコーダ13内の正弦波分析器(SA:Sinusoidal Analyzer)130において分析され、正弦波分析器130は(確定的な)正弦波成分を特定する。従って、過渡分析器は存在することが望ましいが不必要であり、本発明はこうした分析器なしに実現することができることがわかる。あるいはまた、上述したように、本発明は、例えば高調波複素分析器で実現することもできる。簡単に言えば、この正弦波エンコーダは入力信号x2を、1つのフレームセグメントから次のフレームセグメントに連結される正弦波成分のトラックとして分析する。
ここで図3aを参照しながら説明する。好適な実施例では、従来技術と同様の方法で、入力信号x2の各セグメントをフーリエ変換(FT)ユニット40において周波数領域に変換する。セグメント毎に、FTユニット40は測定した振幅A、位相φ、及び周波数ωを提供する。前述したように、フーリエ変換によって提供される位相の範囲は−π≦φ<πに限定される。トラッキング(追跡)アルゴリズム(TRA:Tracking Algorithm)ユニット42は、セグメント毎の情報を取得し、適切なコスト関数を用いることによって1つのセグメントから次のセグメントへ正弦波どうしを連結させ、これにより、一連の測定された位相φ(k)及び周波数ω(k)をトラック毎に生成する。
正弦波コードCSは最終的に分析器130によって生成され、位相情報を含み、周波数はデコーダにおいてこの情報から再構成され、このことは欧州特許出願02080002.5(PHNL021216)に記載されている。本発明によれば、処理中の所定サブフレームがランダムアクセス・フレームである際に、表現レベルrの代わりに、量子化テーブル(Q)、あるいは好適には量子化テーブルを表現するインデックス(IND)を分析器130によって生成し、これについては図3bを参照しながらより詳細に説明する。
しかし、上述したように、測定された位相φ(k)はラップ(巡回)しており、このことは、位相はモジュロ2πの表現に限定されることを意味する。従って、好適な実施例では、分析器は位相アンラッパ(非巡回化器)(PU)44を具え、ここでモジュロ2πの位相表現がアンラップされて、トラックに対して構造的なフレーム間位相挙動Ψが現われる。正弦波トラック内の周波数はほぼ一定であるので、アンラップ(非巡回)の位相は一般に線形増加(または減少)関数に近く、このことは安価な、即ち低いビットレートでの位相の伝送を可能にすることがわかる。アンラップの位相Ψは位相エンコーダ(PE:Phase Encoder)46への入力として提供され、位相エンコーダ46は、(所定サブフレームがランダムアクセス・フレームでない際の)伝送に適した量子化された表現レベルrを出力として提供する。
ここで、位相アンラッパ44の動作を参照すれば、上述したように、あるトラックに対する瞬時位相Ψと瞬時周波数Ωとは次式によって関係付けられる:
Figure 2007509363

ここに、T0は基準瞬時である。
フレームk=K,K+1...K+L−1内の正弦波トラックは、測定された周波数ω(k)(1秒当たりのラジアンで表わされる)及び測定された位相φ(k)(ラジアンで表わされる)を有する。フレームの中心間の距離はU(秒で表わされる更新レート)で与えられる。測定された周波数は、仮定された基になるω(k)=Ω(kU)なる連続時間の周波数トラックΩのサンプルであると考えられ、同様に、測定された位相は、関連するψ(k)=Ψ(kU)mod(2π)なる連続時間位相トラックΨのサンプルであると考えられる。正弦波符号化のために、Ωはほぼ一定の関数であるものと仮定する。
周波数はセグメント内でほぼ一定であるものと仮定すれば、式(1)は次式のように近似することができる:
Figure 2007509363

従って、所定セグメントについての位相及び周波数、及び次のセグメントの周波数を知れば、次のセグメントについてのアンラップの位相値を推定することができ、トラック内のセグメント毎に同様にすることができる。
好適な実施例では、位相アンラッパ44は瞬時kにおけるアンラップ係数m(k)を次式により決定する:
Ψ(kU)=φ(k)+m(k)2π (3)
アンラップ係数m(k)は、位相アンラッパ44に、アンラップの位相を得るために加算しなければならないサイクル数を伝える。
式(2)と(3)とを組み合わせれば、位相アンラッパ44は増分的なアンラップ係数e(k)を次式により決定する:
2πe(k)=2π{m(k)−m(k−1)}={ω(k)+ω(k−1)}U/2−{ψ(k)−φ(k−1)}
ここに、eは整数であるべきである。しかし、測定及びモデル誤差により、増分アンラップ係数は正確な整数とはならず、従って次式のようになる:
e(k)=丸め([{ω(k)+ω(k−1)}U/2−{φ(k)−φ(k−1)}]/(2π))
ここで、モデル及び測定誤差は小さいものと仮定する。
増分アンラップ係数eを持てば、式(3)からのm(k)は累計として計算され、ここで、一般性を失うことなしに、位相アンラッパはm(K)=0なる第1フレームKにおいて始まり、そしてm(k)及びφ(k)から、(アンラップの)位相Ψ(kU)が決まる。
実際には、サンプルされたデータΨ(kU)及びΩ(kU)は測定誤差による歪みが次式のように加わる:
φ(k)=Ψ(kU)+ε1(k)
ω(k)=Ω(kU)+ε2(k)
ここに、ε1及びε2はそれぞれ位相及び周波数誤差である。アンラップ係数の決定があいまいになることを防ぐために、測定データは十分な精度で測定する必要がある。従って、好適な実施例では、トラッキングを次式のように制限し:
δ(k)=e(k)−[{ω(k)+ω(k−1)}U/2−{φ(k)−φ(k−1)}]/(2π)<δ
ここに、δは丸め操作における誤差である。誤差δは主に、Uとの乗算によるωにおける誤差によって決まる。ωは、入力信号をサンプリング周波数FSでサンプルしたバージョンからのフーリエ変換の絶対値の最大値から決まり、そしてフーリエ変換の分解能は2π/Laであり、ここにLaは分析サイズであるものと仮定する。考慮する境界内に入るようにするために、次式を得る:
Figure 2007509363
このことは、高精度であるようにアンラップするためには、分析サイズを更新サイズの何倍かにすべきことを意味し、例えば、δ0=1/4に設定すれば、(位相測定における誤差ε1を無視すれば)分析サイズは更新サイズの4倍にすべきである。
丸め操作における決定誤差を回避するために採ることのできる第2の予防策は、トラックを適切に規定することである。トラッキング・ユニット42では、正弦波トラックは一般に、振幅差及び周波数差を考慮することによって規定される。これに加えて、連結(リンク)基準において位相情報を考慮することも可能である。例えば、位相予測誤差εを、測定値と次式による予測値
Figure 2007509363

との差として定義することができ、
Figure 2007509363

ここで、予測値は次式のように求めることができる:
Figure 2007509363
従って、トラッキング・ユニット(TRA)42は、εが特定値(例えばε>π/2)であるトラックを禁止して、e(k)の明確な定義を生じさせることが好ましい。
これに加えて、エンコーダは、デコーダにおいて利用可能な位相及び周波数を計算することができる。デコーダにおいて利用可能な位相または周波数が、エンコーダ内に存在する位相及び/または周波数と過度に異なれば、エンコーダはトラックを中断すること、即ち、トラックの終了を信号通知し、現在の周波数及び位相、及びこれらにリンクされた正弦波データを用いて新たなトラックを開始することを決定することができる。
位相アンラッパ(PU)44によって生成された、サンプルされたアンラップの位相Ψ(kU)は、位相エンコーダ(PE)46の入力として供給されて、所定サブフレームがランダムアクセス・フレーム内で処理/伝送されている際に、表現レベルrの組(あるいは本発明によれば、量子化テーブル(Q)または量子化テーブル(Q)を表現するインデックス(IND))が生成される。アンラップの位相のような概ね単調に変化する特性の効率的な伝送のための技術は既知である。
図3bに、位相エンコーダ(PE)46の好適な実施例を示す。好適な実施例では、適応差分パルス符号変調(ADPCM)を採用する。ここでは、予測器(PF)48を用いて、次のトラック・セグメントの位相を推定し、量子化器(QT:Quantizer)50内で差分のみを符号化する。Ψはほぼ直線的な関数であるものと想定され、また簡単のため、予測器48は次式の形の2次フィルタとして選定する:
y(k+1)=2x(k)−x(k−1)
ここに、xは入力であり、yは出力である。しかし、(より高次の関係を含む)他の関数関係をとることもでき、そして、フィルタ係数の(後向きまたは前向きの)適応を含めることもできることがわかる。好適な実施例では、簡単のため、後向き適応制御メカニズム(QC)52を用いて量子化器(QT)50を制御する。前向き適応制御も可能であるが、特別なビットレートを必要とする。
以上からわかるように、トラックに対するエンコーダ(及びデコーダ)の初期化は、開始位相φ(0)及び開始周波数ω(0)を知ることにより始まる。これらの位相及び周波数は、別個のメカニズムによって量子化され伝送されている。これに加えて、エンコーダの量子化コントローラ(QC)52、及びこれに対応するデコーダ(図5b)内のコントローラ62において用いられる初期量子化ステップは、エンコーダ及びデコーダにおいて共に、伝送されるか特定値に設定されるかのいずれかである。最後に、トラックの終端は、別個のサイドストリーム中で信号通知することも、位相のビットストリーム中の一意的なシンボル(記号)として信号通知することもできる。
アンラップの位相の開始周波数は、エンコーダ及びデコーダにおいて共に既知である。量子化精度は、この周波数に基づいて選定される。低周波数で始まるアンラップの位相軌跡に対しては、より高い周波数で始まる位相軌跡よりも高精度、即ち高分解能の量子化グリッド(格子)を選定する。
ADPCM量子化器では、アンラップの位相Ψ(k)(kはトラック内の番号を表わす)は、トラック内の先行する位相から予測/推定される。そして、予測された位相
Figure 2007509363

とアンラップの位相Ψ(k)との差が量子化され伝送される。この量子化器は、トラック内のすべてのアンラップの位相に適応されている。予測誤差が小さい際には、量子化器は可能な値の範囲を限定し、量子化をより高精度にすることができる。他方では、予測誤差が大きい際には、量子化器はより粗い量子化を用いる。
図3bの量子化器Qは予測誤差Δを量子化し、Δは次式により計算される:
Figure 2007509363
予測誤差Δは、ルックアップ・テーブル(早見表)を用いることによって量子化することができる。この目的のために、テーブルQを維持する。例えば、2ビットのADPCM量子化器については、Q用の初期テーブルは表2に示すテーブルのようにすることができる:
Figure 2007509363
量子化は次のように行われる。予測誤差Δを境界bと比較して、次式を満足するようにする:
bli<Δ≦bui
上式の関係を満足する値iより、表現レベルrをr=iによって算出する。
関連する表現レベルは表現テーブルR中に記憶され、これを表3に示す:
Figure 2007509363
トラック内の次の正弦波成分の量子化のために、テーブルQ及びテーブルRのエントリには係数cが乗算される:
Q(k+1)=Q(k)・c
R(k+1)=R(k)・c
トラックの復号化中には、両方のテーブルに、生成された表現レベルrに応じたスケール係数を乗じる。現在のサブフレームについてrが1または2のいずれか(内側レベル)であれば、量子化テーブルに対するスケール係数はc=2-1/4に設定する。
c<1であるので、トラック内の次の正弦波はより高精度になる。rが0または3(外側レベル)であれば、スケール係数はc=21/2に設定する。
c>1であるので、トラック内の次の正弦波の量子化精度は低下する。これらの係数を用いれば、1回のアップスケーリング(倍増)は2回のダウンスケーリング(逓減)によって帳消しにすることができる。アップスケール(倍増)係数とダウンスケール(逓減)係数との差は、アップスケーリングの速い着手をもたらすのに対し、対応するダウンスケーリングは2回のステップを必要とする。
量子化テーブルにおける非常に小さいかあるいは非常に大きいエントリを回避するために、内側レベルの絶対値がπ/64〜3π/4である場合のみに適応を行う。内側レベルがπ/64以下であるか、あるいは3π/4以上である場合には、スケール係数cは1に設定する。
デコーダでは、テーブルRを維持して、受信した表現レベルrを量子化された予測誤差に変換しなければならない。この逆量子化(量子化を元に戻す)動作は、図5b内のブロック(DQ)60によって実行される。
上記設定を用いて、再構成された音質を改善する必要がある。複数のアンラップの位相トラックに対して、開始周波数に応じて異なる初期テーブルを用いることができる。このことはより良好な音質を生じさせる。このことは次のように行う。初期テーブルQ及びRを、トラックの最初の周波数に基づいてスケールする。表4では、スケール係数を周波数範囲と共に与える。トラックの最初の周波数が特定周波数範囲内にある場合には、適切なスケール係数を選択して、テーブルR及びQをこのスケール係数で除算する。終点もトラックの最初の周波数に依存し得る。デコーダでは、対応する手順を実行して、適正な初期テーブルRで開始する。
Figure 2007509363
表4に、2ビットのADPCM量子化器用の、周波数依存のスケール係数、及びこれに対応する初期テーブルQ及びRの例を示す。オーディオ周波数範囲0〜22050Hzを4つの周波数副範囲に分割する。低い周波数範囲では高い周波数範囲に比べて位相精度が改善されていることがわかる。
周波数副範囲及び周波数依存のスケール係数の数は変化し得るものであり、個別の目的及び要求に合わせて選定することができる。上述したように、表4中の周波数依存の初期テーブルQ及びRを動的にアップスケール(倍増)またはダウンスケール(逓減)して、1つの時間セグメントから次の時間セグメントへの進展に適応させることができる。
例えば3ビットのADPCM量子化器では、3ビットによって規定される8つの量子化間隔の初期境界は次のように規定することができ:
Q={-∞, -1.41, -0.707, -0.35, 0, 0.35, 0.707, 1.41, ∞}
そして最小グリッドサイズπ/64、及び最大グリッドサイズπ/2を有することができる。表現テーブルRは次のようにすることができる:
R={-2.117, -1.0585, -0.5285, -0.1750, 0.1750, 0.5285, 1.0585, 2.117}
この場合には、図4に示すものと同様のテーブルQ及びRの周波数依存の初期化を用いることができる。
以上では、欧州特許出願02080002.5(PHNL021216)と同様の方法でプロセスを説明してきた。
本発明によれば、量子化器(QT)50、予測器(PF)48、及び後向き適応制御メカニズム(QC)52はさらに、処理中の所定フレームがランダムアクセス・フレームであることを示す(外部)トリガ信号(Trig)を受信することができる。トリガ信号(Trig)を受信しない際には、プロセスは通常のように機能し、表現レベルrのみがデコーダに伝送される。(ランダムアクセス・フレームを表わす)トリガ(Trig)を受信すると、表現レベルrは伝送されないが、その代わりに、量子化テーブル(Q)、あるいは量子化テーブル(Q)を表わすインデックス(IND)が、現在位相(φ(0))及び現在周波数(ω(0))と共に伝送される。
量子化パラメータの適切な設定によって、限定数の量子化テーブルのみが可能になる。例えば、表1が与えられれば、可能な量子化テーブルは22個しか存在せず、これらを以下の表5に、インデックス番号と共に列挙する。表5中のエントリは1.5・2k/4の値を丸めたものであり、ここにkは-23, -22,..., 5, 6の範囲にわたる。
Figure 2007509363
結果的に、好適な実施例では、伝送するデータ量を低減するために、所定の量子化テーブル(Q)を表現/識別/指示するインデックスのみをエンコーダに伝送して、エンコーダではこのインデックスを用いて、初期テーブルとして用いる適切な量子化テーブルを検索し、これについては図5bを参照してより詳細に説明する。
このインデックスは、周知のハフマン符号化を用いて生成することが好ましい。表5に対しては、こうしたハフマン符号化に基づくインデックスは以下の表6に列挙するようにすることができる:
Figure 2007509363
好適な実施例では、所定の量子化テーブルまたは量子化状態(例えば、T1=-0.1577;T2=-0.0394;T3=0.0394;T4=0.1577)を送る代わりに、インデックス(IND)(例えば010001)のみを伝送して、これによりビットレートを節約する。そして、このインデックスを用いて、本発明で用いる適切な量子化テーブル(例えば19)を検索する。
このようにして、量子化器における高精度への長い適応を回避しつつランダムアクセスを可能にすることができる、というのは、量子化テーブルの現在の精度を記憶し、(所定の量子化テーブル(Q)を伝送することによって直接的に、あるいは、所定の量子化テーブル(Q)を参照する/一意的に識別する/指示するインデックス(IND)を送信することによって間接的に、のいずれかで)デコーダに伝送する際に、量子化器の再始動が必要でないからである。さらに、量子化テーブルをより高速になるように、かつ/あるいはより低いビットレートが得られるように適応させる。
ランダムアクセス・フレームは、例えば、適切な点を選択するためのオーディオ分析を用いて、トラック中のNの倍数番目のすべてのフレームを(即ちN−1フレームおきに)選択すること等によって、選択または識別することができる。ランダムアクセス・フレーム毎に、当該ランダムアクセス・フレームの処理中に、トリガ信号が量子化器(QT)50(及び(PF)48及び(QC)52)に供給される。
正弦波エンコーダによって生成された正弦波コードCSから、正弦波合成器(SS:Sinusoidal Synthesizer)131によって、デコーダの正弦波合成器(SS)32について説明したのと同じ方法で正弦波信号成分が再構成される。この信号は減算器17において、正弦波エンコーダ13への入力x2から減算されて残差信号x3となる。正弦波エンコーダ13によって生成される残差信号x3は、好適な実施例のノイズ分析器(アナライザ)14に渡され、ノイズ分析器14はこのノイズを表現するノイズコードCNを生成し、
国際特許出願番号PCT/EP00/04599
正弦波エンコーダによって生成された正弦波コードCSから、正弦波合成器(SS:Sinusoidal Synthesizer)131によって、デコーダの正弦波合成器(SS)32について説明したのと同じ方法で正弦波信号成分が再構成される。この信号は減算器17において、正弦波エンコーダ13への入力x2から減算されて残差信号x3となる。正弦波エンコーダ13によって生成される残差信号x3は、好適な実施例のノイズ分析器(アナライザ)14に渡され、ノイズ分析器14はこのノイズを表現するノイズコードCNを生成し、これについては、例えば国際特許出願番号PCT/EP00/04599に記載されている。
最後に、マルチプレクサ(多重化器)15では、コードCT、CS及びCNを含むオーディオストリームASが構成される。オーディオストリームASは、例えばデータバス、アンテナシステム、記憶媒体、等に供給される。
図4に、例えば図1のエンコーダによって生成され、データバス、アンテナシステム、記憶媒体、等から得られるオーディオストリームAS’を復号化するのに適したオーディオプレーヤ3を示す。オーディオシステムAS’はデマルチプレクサ(多重分離器)30において多重分離され、コードCT、CS及びCNが得られる。これらのコードはそれぞれ、過渡合成器(TS:Transient Synthesizer)31、正弦波合成器(SS)32、及びノイズ合成器(NS:Noise Synthesizer)33に供給される。過渡合成器(TS)31では、過渡コードCTから過渡信号成分が計算される。過渡コードが形状関数を示す場合には、受信したパラメータに基づいて形状を計算する。さらに、正弦波成分の周波数及び振幅に基づいて形状内容を計算する。過渡コードCTが停止を示す場合には、過渡状態は計算しない。合計過渡信号yTはすべての過渡状態の総和である。
分析器130によって符号化された情報を含む正弦波コードCSは正弦波合成器32によって使用され、信号ySが生成される。ここで図5a及び5bを参照しながら説明する。正弦波合成器32は、位相エンコーダ46に整合する位相デコーダ(PD:Phase Decoder)56を具えている。ここでは、逆量子化器(DQ:Dequantizer)60は二次予測フィルタ(PF)64と協働して、アンラップの位相(の推定値)
Figure 2007509363

を、表現レベルr;予測フィルタ(PF:Prediction Filter)64に提供される現在の情報φ(0)、ω(0);及び量子化コントローラ62における初期量子化ステップから生成する。フレームがランダムアクセス・フレームである場合には、逆量子化器(DQ)60では、表現レベルrの代わりにエンコーダから受信した量子化テーブル(Q)を初期テーブルとして用い、これについては以下でより詳細に説明する。
図2bに示すように、周波数はアンラップの位相
Figure 2007509363

から微分によって復元することができる。デコーダにおける位相誤差がほぼ白色(雑音)であると仮定すれば、そして微分は高い周波数を増幅するので、微分をローパス(低域通過)フィルタと組み合わせてノイズを低減し、これにより、デコーダにおいて周波数の正確な推定値を得ることができる。
好適な実施例では、フィルタリングユニット(FR)58が微分を近似し、このことは、前進差分、後退差分、または中心差分のような手続きによってアンラップの位相から周波数
Figure 2007509363

を得るために必要である。このことは、符号化された信号の正弦波成分を従来の方法で合成するために使用可能な位相
Figure 2007509363

及び周波数
Figure 2007509363

を、デコーダが出力として生成することを可能にする。
同時に、信号の正弦波成分の合成中に、ノイズコードCNがノイズ合成器(NS)33に供給され、ノイズ合成器33は主としてフィルタであり、ノイズのスペクトルに近い周波数応答を有する。NS33は、ホワイトノイズ(白色雑音)信号をノイズコードCNでフィルタリング(フィルタ処理)することによって、再構成されたノイズyNを生成する。合計信号y(t)は、過渡信号yTと、正弦波信号ySとノイズ信号yNとの合計に振幅伸長(g)を乗じた積との総計から成る。オーディオプレーヤは、それぞれの信号を合計するための2つの加算器36及び37を具えている。この合計信号は出力ユニット35に供給され、出力ユニット35は例えばスピーカである。
本発明によれば、ランダムアクセス・フレームについては、表現レベルrの代わりに、エンコーダから伝送される量子化テーブル(Q)またはインデックス(IND)を受信する。受信したフレームがランダムアクセス・フレームであることを示すものは、例えば、表6に示す例のような適切なインデックスを具えたビットストリーム・シンタックス中に追加的なフィールドを加えて、これにより、使用すべき特定の量子化テーブル(Q)を識別することによって実現することができる。このインデックスはハフマン符号から得られる。このインデックスは、表5に示すようなADPCMに使用されるテーブルを示す。このテーブルは、すべての可能な量子化テーブルQを含む。可能な量子化テーブルの数は、アップスケール及びダウンスケール係数、及び内側レベルの最小値及び最大値に依存する。
現在フレームがランダムアクセス・フレームであれば、このことは、サブフレームKが、このサブフレーム内の正弦波毎に、((QC)62、(DQ)60、及び(PF)64にトリガ信号(Trig)として供給される)ハフマン符号の値を有するビットストリーム・シンタックスの追加的フィールドを含むことを意味する。さらに、サブフレームKは、エンコーダによって指定された正弦波毎に直接量子化した振幅、周波数、及び位相を含む。上記ビットストリーム・シンタックスのフィールドはハフマン符号化され、そして適切なテーブルTが表5に従って選択される。そしてこのテーブルは、次のサブフレーム(K+1)において逆量子化器(DQ)60によって用いられる。予測フィルタ(PF)64は、最初の連続に対して行ったのと同じ方法で、次式のようにサブフレームK+1のために再初期化される:
Ψr(K−1)=φ(K)−ω(K)・U
ここに、Uは更新間隔である。ここでφ及びωはそれぞれ、サブフレームKにおいて伝送される位相及び周波数である。復号化は上述した従来の方法で継続される。
図6に本発明によるオーディオシステムを示し、このシステムは、図1に示すオーディオエンコーダ1、及び図4に示すオーディオプレーヤ3を具えている。こうしたシステムは、再生及び録音機能を提供する。オーディオストリームASは、オーディオエンコーダ1から通信チャンネル2経由でオーディオプレーヤ3に供給され、通信チャンネル2は無線接続、データバス20、あるいは記憶媒体とすることができる。通信チャンネル2が記憶媒体である場合には、この記憶媒体はシステム内に固定することができ、あるいはリムーバブル(着脱可能型)ディスク、メモリーカードまたはチップ、あるいは他の固体メモリーとすることもできる。通信チャンネル2はオーディオシステムの一部分とすることができるが、オーディオシステムの外部にあることが多い。
図7a及び7bはそれぞれ、従来技術及び本発明によるエンコーダから送信され、デコーダにおいて受信される情報を示す。図7aは複数のフレーム(701;703)を、そのフレーム番号及び周波数と共に示す。この図はさらに、従来技術により(サブ)フレーム毎にエンコーダからデコーダへ伝送される情報またはパラメータを示す。図からわかるように、初期位相(φ(0))及び初期周波数(ω(0))はトラックの出発点または始点のフレーム701について伝送され、表現レベルrは、このトラックに属する他のフレーム703毎に伝送される。
図7bに、本発明による複数のフレーム(701、702、703)をそのフレーム番号及び周波数と共に示し、並びに、(サブ)フレーム毎にエンコーダからデコーダへ伝送される情報またはパラメータを示す。図からわかるように、初期位相(φ(0))及び初期周波数(ω(0))は図7aと同様に、トラックの出発点または始点のフレーム701について伝送され、表現レベルrは、このトラックに属するランダムアクセス・フレーム702以外の他のフレーム703毎に伝送される。ランダムアクセス・フレーム702については、現在位相(φ(0))及び現在周波数(ω(0))がエンコーダからデコーダへ、関係する量子化テーブル(Q)(または前に説明したようにインデックス)と共に伝送される。このようにして、量子化状態の少なくとも一部がエンコーダからデコーダへ伝送され、これにより、前に説明したように、必要なビットレートを過度に拡大することなしに可聴のアーティファクト(歪み)を回避することができる。
本発明の実施例を実現する、従来技術のオーディオエンコーダを示す図である。 従来技術のシステムにおける位相と周波数との関係を示す図である。 位相符号化を用いたオーディオシステムにおける位相と周波数との関係を示す図である。 図3a及び図3bは、本発明による図1のオーディオエンコーダの正弦波エンコーダ構成要素の好適な具体例を示す図である。 本発明の実施例を実現したオーディオプレーヤを示す図である。 図5a及び図5bは、本発明による図4のオーディオプレーヤの正弦波シンセサイザ構成要素の好適な具体例を示す図である。 図6は、本発明によるオーディオエンコーダ及びオーディオプレーヤを具えたシステムを示す図である。 図7a及び図7bはそれぞれ、従来技術及び本発明によるエンコーダから送信されデコーダで受信される情報を示す図である。

Claims (14)

  1. オーディオ信号を符号化する方法において、
    連続的な複数の時間セグメント毎の、サンプルされた信号値の各組を提供するステップと;
    前記サンプルされた信号値を分析して、前記連続的な複数のセグメント毎に1つ以上の正弦波成分を特定するステップと;
    前記正弦波成分を前記連続的な複数のセグメントにわたって連結させて、各々が複数のフレームから成る正弦波トラックを提供するステップと;
    正弦波コードを含む符号化された信号を生成するステップであって、前記正弦波コードは0個以上のフレームについての表現レベルを含み、所定フレームがランダムアクセス・フレームとして指定されている際には、前記正弦波コードの一部は前記所定フレームについての位相、周波数、及び量子化テーブルを含むステップと
    を具えていることを特徴とするオーディオ信号の符号化方法。
  2. フレームについての表現レベルを含む前記正弦波コードと、フレームについての位相、周波数、及び量子化テーブルを含む前記正弦波コードとの間の選択を、トリガ信号に応じて行うことを特徴とする請求項1に記載の方法。
  3. 前記量子化テーブルの各々がインデックスによって表わされ、前記ランダムアクセス・フレームにおいては、前記量子化テーブルを伝送する代わりに、前記インデックスをエンコーダからデコーダへ伝送することを特徴とする請求項1または2に記載の方法。
  4. 前記インデックスが、ハフマン符号化を用いて生成または表現されることを特徴とする請求項3に記載の方法。
  5. 前記ランダムアクセス・フレームについての前記位相及び前記周波数は、それぞれ現在の位相及び現在の周波数であることを特徴とする請求項1〜4に記載の方法。
  6. 符号化されたオーディオストリームを復号化する方法において、
    前記符号化されたオーディオストリームを受信するステップを具え、前記オーディオストリームは正弦波コードのトラックを具え、前記正弦波コードは0個以上のフレームについての表現レベルを含み、所定フレームがランダムアクセス・フレームとして指定されている際には、前記正弦波コードの一部は前記所定フレームについての位相、周波数、及び量子化テーブルを含むことを特徴とする符号化オーディオストリーム復号化方法。
  7. 前記量子化テーブルの各々がインデックスによって表わされ、前記ランダムアクセス・フレームにおいては、前記量子化テーブルを受信する代わりに、前記インデックスをエンコーダから受信することを特徴とする請求項6に記載の方法。
  8. 前記インデックスを、ハフマン符号化を用いて生成または表現することを特徴とする請求項7に記載の方法。
  9. 前記ランダムアクセス・フレームについての前記位相及び前記周波数は、それぞれ現在の位相及び現在の周波数であることを特徴とする請求項6〜8に記載の方法。
  10. 連続する複数の時間セグメント毎の、サンプルされた信号値の各組を処理すべく構成されたオーディオエンコーダにおいて、
    前記サンプルされた信号値を処理して、前記連続的な複数のセグメント毎に1つ以上の正弦波成分を特定する分析器と;
    前記正弦波成分を前記連続的な複数のセグメントにわたって連結させて、各々が複数のフレームから成る正弦波トラックを提供するリンカと;
    正弦波コードを含む符号化された信号を供給する手段とを具えて、前記正弦波コードは0個以上のフレームについての表現レベルを含み、所定フレームがランダムアクセス・フレームとして指定されている際には、前記正弦波コードの一部は前記所定フレームについての位相、周波数、及び量子化テーブルを含む
    ことを特徴とするオーディオエンコーダ。
  11. 符号化されたオーディオストリームを含む信号を受信する受信手段であって、前記オーディオストリームは正弦波コードのトラックを具え、前記正弦波コードは0個以上のフレームについての表現レベルを含み、所定フレームがランダムアクセス・フレームとして指定されている際には、前記正弦波コードの一部は前記所定フレームについての位相、周波数、及び量子化テーブルを含む受信手段と;
    前記受信手段によって受信した0個以上の表現レベル、及び所定フレームがランダムアクセス・フレームとして指定されている際には、前記受信手段によって受信した前記所定フレームについての位相、周波数、及び量子化テーブルを用いて、オーディオ信号の正弦波成分を合成すべく構成された合成器と
    を具えていることを特徴とするオーディオプレーヤ。
  12. 請求項10に記載のオーディオエンコーダ及び請求項11に記載のオーディオプレーヤを具えたオーディオシステム。
  13. 連続的な複数のオーディオ信号の時間セグメントにわたって連結された正弦波成分のトラックを表現する正弦波コードを含むオーディオストリームであって、前記正弦波コードは0個以上のフレームについての表現レベルを含み、所定フレームがランダムアクセス・フレームとして指定されている際には、前記正弦波コードの一部は前記所定フレームについての位相、周波数、及び量子化テーブルを含むことを特徴とするオーディオストリーム。
  14. 請求項13に記載のオーディオストリームを記憶する記憶媒体。
JP2006534861A 2003-10-13 2004-10-04 オーディオ符号化方法及び装置 Pending JP2007509363A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03103774 2003-10-13
PCT/IB2004/051963 WO2005036529A1 (en) 2003-10-13 2004-10-04 Audio encoding

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2011131730A Division JP2011203752A (ja) 2003-10-13 2011-06-14 オーディオ符号化方法及び装置

Publications (1)

Publication Number Publication Date
JP2007509363A true JP2007509363A (ja) 2007-04-12

Family

ID=34429478

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2006534861A Pending JP2007509363A (ja) 2003-10-13 2004-10-04 オーディオ符号化方法及び装置
JP2011131730A Withdrawn JP2011203752A (ja) 2003-10-13 2011-06-14 オーディオ符号化方法及び装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2011131730A Withdrawn JP2011203752A (ja) 2003-10-13 2011-06-14 オーディオ符号化方法及び装置

Country Status (8)

Country Link
US (1) US7725310B2 (ja)
EP (1) EP1676263B1 (ja)
JP (2) JP2007509363A (ja)
CN (1) CN1867969B (ja)
AT (1) ATE452401T1 (ja)
DE (1) DE602004024703D1 (ja)
ES (1) ES2337903T3 (ja)
WO (1) WO2005036529A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019219676A (ja) * 2012-10-10 2019-12-26 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトルパターンを利用することによってシヌソイドおよびスイープを効率的に合成するための装置および方法

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8032240B2 (en) 2005-07-11 2011-10-04 Lg Electronics Inc. Apparatus and method of processing an audio signal
US8090587B2 (en) * 2005-09-27 2012-01-03 Lg Electronics Inc. Method and apparatus for encoding/decoding multi-channel audio signal
FR2897212A1 (fr) * 2006-02-09 2007-08-10 France Telecom Procede de codage d'un signal audio source, dispositif de codage, procede de decodage, signal, support de donnees, produits programme d'ordinateur correspondants
DE102006022346B4 (de) * 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
US20080215342A1 (en) * 2007-01-17 2008-09-04 Russell Tillitt System and method for enhancing perceptual quality of low bit rate compressed audio data
KR20080073925A (ko) * 2007-02-07 2008-08-12 삼성전자주식회사 파라메트릭 부호화된 오디오 신호를 복호화하는 방법 및장치
KR101080421B1 (ko) * 2007-03-16 2011-11-04 삼성전자주식회사 정현파 오디오 코딩 방법 및 장치
KR101410229B1 (ko) * 2007-08-20 2014-06-23 삼성전자주식회사 오디오 신호의 연속 정현파 신호 정보를 인코딩하는 방법및 장치와 디코딩 방법 및 장치
KR101425354B1 (ko) * 2007-08-28 2014-08-06 삼성전자주식회사 오디오 신호의 연속 정현파 신호를 인코딩하는 방법 및장치와 디코딩 방법 및 장치
US20110153337A1 (en) * 2009-12-17 2011-06-23 Electronics And Telecommunications Research Institute Encoding apparatus and method and decoding apparatus and method of audio/voice signal processing apparatus
FR2973552A1 (fr) * 2011-03-29 2012-10-05 France Telecom Traitement dans le domaine code d'un signal audio code par codage micda
CN110019719B (zh) * 2017-12-15 2023-04-25 微软技术许可有限责任公司 基于断言的问答
CN116993799A (zh) * 2023-04-17 2023-11-03 中国科学院长春光学精密机械与物理研究所 一种相位展开误差校正方法、系统及终端

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63253999A (ja) * 1987-04-10 1988-10-20 三洋電機株式会社 音声録音再生装置
DE4229372A1 (de) * 1992-09-03 1994-03-10 Inst Rundfunktechnik Gmbh Verfahren zur Übertragung der Quantisierungsinformation bei einer bitratenreduzierenden Quellcodierung
JPH11219198A (ja) * 1998-01-30 1999-08-10 Sony Corp 位相検出装置及び方法、並びに音声符号化装置及び方法
JPH11219200A (ja) * 1998-01-30 1999-08-10 Sony Corp 遅延検出装置及び方法、並びに音声符号化装置及び方法
JPH11224099A (ja) * 1998-02-06 1999-08-17 Sony Corp 位相量子化装置及び方法
JP2001175283A (ja) * 1999-12-14 2001-06-29 Oki Micro Design Co Ltd 適応差分パルス符号変調方式による録音再生装置
JP2002344328A (ja) * 2001-05-21 2002-11-29 Ricoh Co Ltd 復号化装置、プログラム及び可変長符号の復号方法
JP2003150197A (ja) * 2001-11-09 2003-05-23 Oki Electric Ind Co Ltd 音声符号化装置及び音声復号化装置
JP2003223189A (ja) * 2002-01-29 2003-08-08 Fujitsu Ltd 音声符号変換方法及び装置
JP2003233397A (ja) * 2002-02-12 2003-08-22 Victor Co Of Japan Ltd オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化データ伝送装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4937873A (en) * 1985-03-18 1990-06-26 Massachusetts Institute Of Technology Computationally efficient sine wave synthesis for acoustic waveform processing
DE69813912T2 (de) * 1998-10-26 2004-05-06 Stmicroelectronics Asia Pacific Pte Ltd. Digitaler audiokodierer mit verschiedenen genauigkeiten
WO2001069593A1 (en) 2000-03-15 2001-09-20 Koninklijke Philips Electronics N.V. Laguerre fonction for audio coding
EP1216504A1 (en) 2000-05-17 2002-06-26 Koninklijke Philips Electronics N.V. Spectrum modeling
EP1203369B1 (en) * 2000-06-20 2005-08-31 Koninklijke Philips Electronics N.V. Sinusoidal coding
JP2003110429A (ja) * 2001-09-28 2003-04-11 Sony Corp 符号化方法及び装置、復号方法及び装置、伝送方法及び装置、並びに記録媒体
US20030135374A1 (en) * 2002-01-16 2003-07-17 Hardwick John C. Speech synthesizer
JP4296753B2 (ja) * 2002-05-20 2009-07-15 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
CN100559467C (zh) 2002-11-29 2009-11-11 皇家飞利浦电子股份有限公司 音频编码

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63253999A (ja) * 1987-04-10 1988-10-20 三洋電機株式会社 音声録音再生装置
DE4229372A1 (de) * 1992-09-03 1994-03-10 Inst Rundfunktechnik Gmbh Verfahren zur Übertragung der Quantisierungsinformation bei einer bitratenreduzierenden Quellcodierung
JPH11219198A (ja) * 1998-01-30 1999-08-10 Sony Corp 位相検出装置及び方法、並びに音声符号化装置及び方法
JPH11219200A (ja) * 1998-01-30 1999-08-10 Sony Corp 遅延検出装置及び方法、並びに音声符号化装置及び方法
JPH11224099A (ja) * 1998-02-06 1999-08-17 Sony Corp 位相量子化装置及び方法
JP2001175283A (ja) * 1999-12-14 2001-06-29 Oki Micro Design Co Ltd 適応差分パルス符号変調方式による録音再生装置
JP2002344328A (ja) * 2001-05-21 2002-11-29 Ricoh Co Ltd 復号化装置、プログラム及び可変長符号の復号方法
JP2003150197A (ja) * 2001-11-09 2003-05-23 Oki Electric Ind Co Ltd 音声符号化装置及び音声復号化装置
JP2003223189A (ja) * 2002-01-29 2003-08-08 Fujitsu Ltd 音声符号変換方法及び装置
JP2003233397A (ja) * 2002-02-12 2003-08-22 Victor Co Of Japan Ltd オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化データ伝送装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019219676A (ja) * 2012-10-10 2019-12-26 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトルパターンを利用することによってシヌソイドおよびスイープを効率的に合成するための装置および方法
JP7005564B2 (ja) 2012-10-10 2022-01-21 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトルパターンを利用することによってシヌソイドおよびスイープを効率的に合成するための装置および方法

Also Published As

Publication number Publication date
EP1676263B1 (en) 2009-12-16
EP1676263A1 (en) 2006-07-05
ES2337903T3 (es) 2010-04-30
DE602004024703D1 (de) 2010-01-28
JP2011203752A (ja) 2011-10-13
CN1867969B (zh) 2010-06-16
ATE452401T1 (de) 2010-01-15
US20070100639A1 (en) 2007-05-03
CN1867969A (zh) 2006-11-22
US7725310B2 (en) 2010-05-25
WO2005036529A1 (en) 2005-04-21

Similar Documents

Publication Publication Date Title
JP2011203752A (ja) オーディオ符号化方法及び装置
JP4782006B2 (ja) 低ビットレートオーディオ符号化
US10096323B2 (en) Frame error concealment method and apparatus and decoding method and apparatus using the same
US7596490B2 (en) Low bit-rate audio encoding
RU2353980C2 (ru) Аудиокодирование
US8073687B2 (en) Audio regeneration method
US20060009967A1 (en) Sinusoidal audio coding with phase updates
KR20070019650A (ko) 오디오 인코딩

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071003

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20071003

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20080904

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110125

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110614