JP5247826B2 - 復号化音調音響信号を増強するためのシステムおよび方法 - Google Patents
復号化音調音響信号を増強するためのシステムおよび方法 Download PDFInfo
- Publication number
- JP5247826B2 JP5247826B2 JP2010548995A JP2010548995A JP5247826B2 JP 5247826 B2 JP5247826 B2 JP 5247826B2 JP 2010548995 A JP2010548995 A JP 2010548995A JP 2010548995 A JP2010548995 A JP 2010548995A JP 5247826 B2 JP5247826 B2 JP 5247826B2
- Authority
- JP
- Japan
- Prior art keywords
- sound signal
- decoded
- signal
- tonal sound
- decoded tonal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
Hpre-emph(z)=1-0.68z-1 (1)
ここで、zはZ変換変数を示す。
- プリエンファシスされた復号化音響信号106のスペクトル分析がスペクトルアナライザ105で行われる。このスペクトル分析は離散的フーリエ変換(DFT)を使用し、以下の記述でより詳細に説明される。
- 音調間雑音低減技法は、スペクトルアナライザ105からのスペクトルパラメータ107に応答して適用され、復号化音調音響信号の低エネルギーのスペクトル領域の量子化雑音のレジューサ108で実施される。量子化雑音のレジューサ108の演算は、以下の記述でより詳細に説明される。
- 逆アナライザおよび重複加算演算器110は、(a)逆DFT(離散フーリエ変換)を音調間雑音を低減したスペクトルパラメータ109に適用し、これらのパラメータ109を変換して時間ドメインに戻す、および(b)重複加算演算を使用して、増強復号化音調音響信号111を再構築する。逆アナライザおよび重複加算演算器110の演算は以下の記述でより詳細に説明される。
- ポストプロセッサ112は逆アナライザおよび重複加算演算器110からの再構築された増強復号化音調音響信号111を後処理する。この後処理は前処理段階(プリプロセッサ104)の逆であり、したがって、増強復号化音調音響信号のより高い周波数のデエンファシスで構成することができる。そのようなデエンファシスは以下の記述でより詳細に説明される。
- 最後に、音響再生システム114を設けて、ポストプロセッサ112からの後処理された増強復号化音調音響信号113を可聴音に変換することができる。
図3を参照すると、DFT(離散フーリエ変換)をスペクトルアナライザ105で使用して、プリエンファシスされた復号化音調音響信号106のスペクトル分析およびスペクトルのエネルギー予測を行う。スペクトルアナライザ105において、スペクトル分析は33%重複をもつ30ミリ秒分析ウィンドウを使用してフレームごとに行われる。より詳細には、アナライザ105のスペクトル分析(図3)は、図2に示されるような33.3パーセント重複ウィンドウ処理による256ポイント高速フーリエ変換(FFT)を使用して、フレーム当たり1回行われる。分析ウィンドウは先読み全体を活用するように配置される。第1の分析ウィンドウの先頭は、音響信号復号器102の現在のフレームの先頭の後ろに80サンプルシフトされる。
このシステムおよび方法100によって行われる音調間雑音低減技法は、音声専用コーデックによって符号化された音楽信号などの復号化音調音響信号を増強する。通常、音声などの非音調音響は音声専用コーデックによって適切に符号化され、このタイプの周波数ベース増強を必要としない。
音調間雑音低減が適用され(量子化雑音のレジューサ108(図3)を参照)、増強復号化音響信号が重複加算演算を使用して再構築される(重複加算演算器303(図3)を参照)。gminと1との間に限定され、その臨界周波数帯域の信号対雑音比(SNR)から導き出されるスケーリング利得を用いて臨界周波数帯域ごとにスペクトルをスケーリングすることによって、音調間量子化雑音の低減が行われる。音調間雑音低減技法の特徴は、例えば信号有声化に関連するある特定の周波数よりも低い周波数では、処理は臨界周波数帯域単位ではなく周波数ビン単位で行われることである。したがって、スケーリング利得は周波数ビンごとに適用され、そのビンのSNRから導き出される(SNRはそのビンを含む臨界帯域の雑音エネルギーで除算されたビンエネルギーを使用して計算される)。この特徴は、高調波間の量子化雑音を強力に低減しながら、高調波または音調の近くの周波数のエネルギーを保存して歪みを防止する効果がある。狭帯域信号の場合には、ビン当たりの分析をスペクトル全体に対して使用することができる。ビン当たりの分析は、代替として、すぐ前のもの以外のすべての臨界周波数帯域で使用することができる。
(gs)2=ks SNR+cs、ここで、gmin≦gs≦1により制限される (10)
gCB,LP(i)=αgsgCB,LP(i)+(1-αgs)gs (14)
X'R(k+ji)=gCB,LP(i)XR(k+ji)
および
X'I(k+ji)=gCB,LP(i)XI(k+ji), K=0,...,MCB(i)-1' (15)
ここで、jiは臨界周波数帯域iの最初の周波数ビンのインデックスであり、MCB(i)はその臨界周波数帯域の周波数ビンの数である。
gBIN,LP(k)=αgsgBIN,LP(k)+(1-αgs)gs (16)
ここで、平滑化係数αgs=1-gsは式(14)と同様である。
X'R(k+ji)=gBIN,LP(k+ji)XR(k+ji)
および
X'I(k+ji)=gBIN,LP(k+ji)XI(k+ji), K=0,...,MCB(i)-1' (17)
ここで、jiは臨界周波数帯域iの最初の周波数ビンのインデックスであり、MCB(i)はその臨界周波数帯域の周波数ビンの数である。
パルゼバルの定理は、時間ドメインのエネルギーが周波数ドメインのエネルギーと等しいことを示している。音調間雑音のエネルギーの低減は、周波数ドメインおよび時間ドメインのエネルギーの全体的低減をもたらす。追加の特徴は、量子化雑音のレジューサ108が、再スケーリングの終了時の臨界周波数帯域ごとのエネルギーが音調間雑音低減の前のエネルギーに近いように臨界周波数帯域当たりのエネルギーを再スケーリングする帯域当たりの利得補正器306を含むことである。
IF(gBIN,LP(k+ji)>0.8 & i>4)
X"R(k+ji)=Gcorr(k+ji)X'R(k+ji),
および
X"I(k+ji)=Gcorr(k+ji)X'I(k+ji), K=0,...,MCB(i)-1,
さもなければ
X"R(k+ji)=X'R(k+ji),
および
X"I(k+ji)=X'I(k+ji), K=0,...,MCB(i)-1 (20)
ここで、jiは臨界周波数帯域iの最初の周波数ビンのインデックスであり、MCB(i)はその臨界周波数帯域の周波数ビンの数である。利得補正は600Hz未満には適用されないが、それは、非常に低い周波数のスペクトルエネルギーが低ビットレート音声専用コーデックで正確に符号化されており、高調波音調間のいかなる増大も可聴となると想定されるからである。
エネルギッシュな事象があまり生じない臨界周波数帯域の利得Gcorrをさらに増加させることによって音楽サンプルの明瞭性をさらに向上させることが可能である。帯域当たりの利得補正器306の計算器405は、臨界周波数帯域当たりのエネルギッシュな事象の比(エネルギッシュなビンの数と周波数ビンの総数との比)を以下のように決定する。
NumBintotal=臨界帯域中のビン総数
IF(NumBinmax>0)
CF=-0.2778・REνCB+1.2778
IF(gBIN,LP(k+ji)>0.8 & i>4)
X"R(k+ji)=Gcorr・CF・(k+ji)X'R(k+ji),
および
X"I(k+ji)=Gcorr・CF・(k+ji)X'I(k+ji), K=0,...,MCB(i)-1,
さもなければ
X"R(k+ji)=X'R(k+ji),
および
X"I(k+ji)=X'I(k+ji), K=0,...,MCB(i)-1
スケーリングされたスペクトル成分308、X'R(k)またはXR"(k)、およびX'I(k)またはXI"(k)を決定した後、逆アナライザの計算器307および重複加算演算器110は逆FFTを計算する。計算された逆FFTがスケーリングされたスペクトル成分308に適用され、以下の関係で与えられる時間ドメイン内のウィンドウ処理された増強復号化音響信号を得る。
Hde-emph(z)=1/(1-0.68z-1) (24)
音調間雑音低減のための臨界周波数帯域当たりの音調間雑音エネルギー予測値は、例えば以下の式を使用して、音調間雑音エネルギー予測器(図示せず)においてフレームごとに計算することができる。
この技法によれば、各臨界周波数帯域の第2の最大エネルギー値および最小エネルギー値を使用して、以下のように臨界周波数帯域当たりのエネルギー閾値を計算する。
i=0,...,20
α=0.1
101 符号化ビットストリーム
102 音響信号復号器
103 復号化音響信号
104 プリプロセッサ
105 スペクトルアナライザ
106 復号化音響信号
107 スペクトルパラメータ
108 レジューサ
109 スペクトルパラメータ
110 逆アナライザおよび重複加算演算器
111 増強復号化音調音響信号
112 ポストプロセッサ
113 増強復号化音調音響信号
114 音響再生システム
301 信号タイプ分類器
302 出力
303 重複加算演算器
304、305 雑音減衰器
306 帯域当たりの利得補正器
307 計算器
308 スペクトル成分
309 増強復号化音調音響信号
401〜403 アナライザ
404、405 計算器
406 帯域当たりの利得補正器
501 ファインダ
502 メモリ
503〜506 コンパレータ
507〜511 コントローラ
512、513 カウンタ
514 閾値コントローラ
601 固定コードブック
602 固定コードブックベクトル
603 革新的な固定コードブック励振
604 適応コードブック
606 ピッチフィルタ
607 適応コードブックベクトル
608 適応コードブック励振
609 加算器
610 励起信号
611 LP合成フィルタ
612 合成音響信号
613 モジュール
Claims (20)
- 受け取った符号化ビットストリームに応答して音声専用コーデックの復号器で復号された音調音響信号を増強するためのシステムであって、
前記復号化音調音響信号に応答して前記復号化音調音響信号を表すスペクトルパラメータを生成するスペクトルアナライザと、
前記復号化音調音響信号を複数の異なる音響信号カテゴリに入れる信号分類器と、
前記復号化音調音響信号を複数の異なる音響信号カテゴリに入れる前記信号分類器と前記スペクトルアナライザからの前記スペクトルパラメータに応答する前記復号化音調音響信号の低エネルギースペクトル領域の量子化雑音のレジューサと
を備え、
前記スペクトルパラメータは、前記スペクトルアナライザによって計算された前記復号化音調音響信号のスペクトルエネルギーを含み、
前記信号分類器は、前記復号化音調音響信号のいくつかの以前のフレームにわたる前記計算された信号スペクトルエネルギーの変動の偏差のファインダを含む、
音調音響信号を増強するためのシステム。 - 前記システムは、前記スペクトルアナライザに前記復号化音調音響信号を供給する前に前記復号化音調音響信号のより高い周波数を強調する前記復号化音調音響信号のプリプロセッサを備え、
前記スペクトルアナライザは、前記復号化音調音響信号を表す前記スペクトルパラメータを生成するために前記復号化音調音響信号に高速フーリエ変換を行い、
前記システムは、時間ドメインで増強復号化音調音響信号を得るための前記量子化雑音のレジューサからの増強スペクトルパラメータの逆高速フーリエ変換の計算器を含み、
前記システムは、前記増強復号化音調音響信号のより高い周波数をデエンファシスするための前記増強復号化音調音響信号のポストプロセッサを含む、請求項1に記載の復号化音調音響信号を増強するためのシステム。 - 前記信号分類器が、前記計算された信号スペクトルエネルギーの前記変動の前記偏差を、それぞれ前記音響信号カテゴリに対応する複数の閾値と比較するためのコンパレータを含む、請求項1に記載の復号化音調音響信号を増強するためのシステム。
- 前記音響信号カテゴリが非音調音響信号カテゴリを含み、前記信号分類器は、復号化音響信号が非音調音響信号であることを前記コンパレータによる比較が示す場合、前記量子化雑音を低減しないように前記レジューサに指令する前記量子化雑音のレジューサのコントローラを含む、請求項3に記載の復号化音調音響信号を増強するためのシステム。
- 前記音響信号カテゴリが音調音響信号カテゴリを含み、前記復号化音調音響信号が前記音調音響信号カテゴリのうちの1つの中に含まれることを前記コンパレータによる比較が示す場合、前記信号分類器は、前記1つの音調音響信号カテゴリに関連する所与の振幅でおよび所与の周波数範囲内で前記量子化雑音を低減するように前記レジューサに指令する前記量子化雑音のレジューサのコントローラを含む、請求項3に記載の復号化音調音響信号を増強するためのシステム。
- 前記閾値が、前記音響信号カテゴリのうちの少なくとも1つのものの一連のフレームのカウンタに応答して増加または減少する浮動閾値を含む、請求項3に記載の復号化音調音響信号を増強するためのシステム。
- 前記スペクトルアナライザが、前記スペクトルアナライザによるスペクトル分析に由来するスペクトルを1組の臨界周波数帯域に分割し、
前記量子化雑音のレジューサが、再スケーリングの終了時の臨界周波数帯域ごとの前記スペクトルエネルギーが前記量子化雑音の低減の前の前記臨界周波数帯域のスペクトルエネルギーに近いように臨界周波数帯域当たりのスペクトルエネルギーを前記再スケーリングする帯域当たりの利得補正器を含む、請求項1に記載の復号化音調音響信号を増強するためのシステム。 - 前記臨界周波数帯域がそれぞれの数の周波数ビンを含み、前記帯域当たりの利得補正器が前記周波数ビンのうちの最もエネルギッシュなものを再スケーリングする、請求項7に記載の復号化音調音響信号を増強するためのシステム。
- 前記帯域当たりの利得補正器が、量子化雑音の低減の前の前記臨界周波数帯域の前記スペクトルエネルギーと、量子化雑音の低減の後の前記臨界周波数帯域のスペクトルエネルギーとの間の比としての補正利得の計算器を含む、請求項7に記載の復号化音調音響信号を増強するためのシステム。
- 前記帯域当たりの利得補正器が、前記臨界周波数帯域中のエネルギッシュな事象の比の関数としての補正係数の計算器を含み、前記帯域当たりの利得補正器が前記補正利得に前記補正係数を乗じる、請求項9に記載の復号化音調音響信号を増強するためのシステム。
- 受け取った符号化ビットストリームに応答して音声専用コーデックの復号器で復号された音調音響信号を増強する方法であって、
前記復号化音調音響信号を表すスペクトルパラメータを生成するために前記復号化音調音響信号をスペクトル的に分析する段階と、
前記復号化音調音響信号を複数の異なる音響信号カテゴリに分類する段階と、
前記復号化音調音響信号を複数の異なる音響信号カテゴリに分類する前記段階と前記スペクトル分析からの前記スペクトルパラメータに応答して前記復号化音調音響信号の低エネルギースペクトル領域の量子化雑音を低減する段階と
を含み、
前記スペクトルパラメータは、前記スペクトル分析によって計算された前記復号化音調音響信号の信号スペクトルエネルギーを含み、
前記復号化音調音響信号を分類する段階は、前記復号化音調音響信号のいくつかの以前のフレームにわたる前記信号スペクトルエネルギーの変動の偏差を検出する段階を含む、
復号化音調音響信号を増強する方法。 - 前記方法は、前記復号化音調音響信号をスペクトル的に分析する前に前記復号化音調音響信号のより高い周波数を強調する段階を含み、
前記復号化音調音響信号をスペクトル的に分析する段階が、前記復号化音調音響信号を表す前記スペクトルパラメータを生成するために前記復号化音調音響信号に高速フーリエ変換を行う段階を含み、
前記方法は、時間ドメインで増強復号化音調音響信号を得るために前記量子化雑音を低減する段階からの増強スペクトルパラメータの逆高速フーリエ変換を計算する段階を含み、
前記方法は、前記増強復号化音調音響信号のより高い周波数をデエンファシスする段階を含む、請求項11に記載の復号化音調音響信号を増強する方法。 - 前記復号化音調音響信号を分類する段階が、前記信号スペクトルエネルギーの前記変動の前記偏差を、それぞれ前記音響信号カテゴリに対応する複数の閾値と比較する段階を含む、請求項11に記載の復号化音調音響信号を増強する方法。
- 前記音響信号カテゴリが非音調音響信号カテゴリを含み、前記復号化音調音響信号を分類する段階は、前記信号スペクトルエネルギーの前記変動の前記偏差を前記複数の閾値と比較する前記段階が、前記復号化音調音響信号が非音調音響信号であることを示す場合、前記量子化雑音を低減しないように前記量子化雑音を低減する段階を制御する段階を含む、請求項13に記載の復号化音調音響信号を増強する方法。
- 前記音響信号カテゴリが音調音響信号カテゴリを含み、前記復号化音調音響信号が前記音調音響信号カテゴリのうちの1つの中に含まれることを、前記信号スペクトルエネルギーの前記変動の前記偏差を前記複数の閾値と比較する前記段階が示す場合、前記復号化音調音響信号を分類する前記段階が、前記1つの音調音響信号カテゴリに関連する所与の振幅でおよび所与の周波数範囲内で前記量子化雑音を低減するように前記量子化雑音を低減する前記段階を制御する段階を含む、請求項13に記載の復号化音調音響信号を増強する方法。
- 前記閾値が浮動閾値を含み、前記方法が、前記音響信号カテゴリのうちの少なくとも1つのものの一連のフレームのカウンタに応答して前記浮動閾値を増加または減少させる段階を含む、請求項13に記載の復号化音調音響信号を増強する方法。
- 前記復号化音調音響信号をスペクトル的に分析する段階が、前記スペクトル分析に由来するスペクトルを1組の臨界周波数帯域に分割する段階を含み、
前記量子化雑音を低減する前記段階が、再スケーリングの終了時の臨界周波数帯域ごとの前記スペクトルエネルギーが前記量子化雑音の低減の前の前記臨界周波数帯域のスペクトルエネルギーに近いように臨界周波数帯域当たりのスペクトルエネルギーを前記再スケーリングする段階を含む、請求項11に記載の復号化音調音響信号を増強する方法。 - 前記臨界周波数帯域がそれぞれの数の周波数ビンを含み、前記臨界周波数帯域当たりのスペクトルエネルギーを再スケーリングする前記段階が、前記周波数ビンのうちで最もエネルギッシュなものを再スケーリングする段階を含む、請求項17に記載の復号化音調音響信号を増強する方法。
- 前記臨界周波数帯域当たりのスペクトルエネルギーを再スケーリングする前記段階が、量子化雑音の低減の前の前記臨界周波数帯域の前記スペクトルエネルギーと、量子化雑音の低減の後の前記臨界周波数帯域のスペクトルエネルギーとの間の比としての補正利得を計算する段階を含む、請求項17に記載の復号化音調音響信号を増強する方法。
- 前記臨界周波数帯域当たりのスペクトルエネルギーを再スケーリングする前記段階が、前記臨界周波数帯域中のエネルギッシュな事象の比の関数としての補正係数を計算する段階と、前記補正利得に前記補正係数を乗じる段階とを含む、請求項19に記載の復号化音調音響信号を増強する方法。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US6443008P | 2008-03-05 | 2008-03-05 | |
| US61/064,430 | 2008-03-05 | ||
| PCT/CA2009/000276 WO2009109050A1 (en) | 2008-03-05 | 2009-03-05 | System and method for enhancing a decoded tonal sound signal |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2011514557A JP2011514557A (ja) | 2011-05-06 |
| JP5247826B2 true JP5247826B2 (ja) | 2013-07-24 |
Family
ID=41055514
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010548995A Active JP5247826B2 (ja) | 2008-03-05 | 2009-03-05 | 復号化音調音響信号を増強するためのシステムおよび方法 |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US8401845B2 (ja) |
| EP (2) | EP2252996A4 (ja) |
| JP (1) | JP5247826B2 (ja) |
| CA (1) | CA2715432C (ja) |
| RU (1) | RU2470385C2 (ja) |
| WO (1) | WO2009109050A1 (ja) |
Families Citing this family (23)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3003398B2 (ja) * | 1992-07-29 | 2000-01-24 | 日本電気株式会社 | 超伝導積層薄膜 |
| US8886523B2 (en) | 2010-04-14 | 2014-11-11 | Huawei Technologies Co., Ltd. | Audio decoding based on audio class with control code for post-processing modes |
| US8924200B2 (en) * | 2010-10-15 | 2014-12-30 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
| DE102011106033A1 (de) * | 2011-06-30 | 2013-01-03 | Zte Corporation | Verfahren und System zur Audiocodierung und -decodierung und Verfahren zur Schätzung des Rauschpegels |
| US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
| US20130282373A1 (en) * | 2012-04-23 | 2013-10-24 | Qualcomm Incorporated | Systems and methods for audio signal processing |
| JP6179087B2 (ja) * | 2012-10-24 | 2017-08-16 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム |
| KR102237718B1 (ko) * | 2013-03-04 | 2021-04-09 | 보이세지 코포레이션 | 시간 영역 디코더에서 양자화 잡음을 감소시키기 위한 디바이스 및 방법 |
| EP2830054A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework |
| CN106409310B (zh) | 2013-08-06 | 2019-11-19 | 华为技术有限公司 | 一种音频信号分类方法和装置 |
| US9418671B2 (en) * | 2013-08-15 | 2016-08-16 | Huawei Technologies Co., Ltd. | Adaptive high-pass post-filter |
| EP2887350B1 (en) * | 2013-12-19 | 2016-10-05 | Dolby Laboratories Licensing Corporation | Adaptive quantization noise filtering of decoded audio data |
| EP3128513B1 (en) * | 2014-03-31 | 2019-05-15 | Fraunhofer Gesellschaft zur Förderung der Angewand | Encoder, decoder, encoding method, decoding method, and program |
| PL3699910T3 (pl) | 2014-05-01 | 2021-11-02 | Nippon Telegraph And Telephone Corporation | Urządzenie generujące sekwencję okresowej połączonej obwiedni, sposób generowania sekwencji okresowej połączonej obwiedni, program do generowania sekwencji okresowej połączonej obwiedni i nośnik rejestrujący |
| WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
| US9972334B2 (en) | 2015-09-10 | 2018-05-15 | Qualcomm Incorporated | Decoder audio classification |
| RU2744485C1 (ru) * | 2017-10-27 | 2021-03-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Ослабление шума в декодере |
| KR101944429B1 (ko) * | 2018-11-15 | 2019-01-30 | 엘아이지넥스원 주식회사 | 주파수 분석 방법 및 이를 지원하는 장치 |
| ES3021337T3 (en) * | 2019-02-21 | 2025-05-26 | Ericsson Telefon Ab L M | Spectral shape estimation from mdct coefficients |
| WO2020207593A1 (en) * | 2019-04-11 | 2020-10-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program |
| US12562174B2 (en) * | 2020-11-26 | 2026-02-24 | Telefonaktiebolaget Lm Ericsson (Publ) | Noise suppression logic in error concealment unit using noise-to-signal ratio |
| US20250046334A1 (en) * | 2023-08-02 | 2025-02-06 | Arche AI, LLC | Ai-based automated personality and behavior analytic and assessment system and method |
| CN117008863B (zh) * | 2023-09-28 | 2024-04-16 | 之江实验室 | 一种lofar长数据处理及显示方法和装置 |
Family Cites Families (23)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0663739B1 (en) | 1993-06-30 | 2001-08-22 | Sony Corporation | Digital signal encoding device, its decoding device, and its recording medium |
| TW327223B (en) | 1993-09-28 | 1998-02-21 | Sony Co Ltd | Methods and apparatus for encoding an input signal broken into frequency components, methods and apparatus for decoding such encoded signal |
| JP3024468B2 (ja) * | 1993-12-10 | 2000-03-21 | 日本電気株式会社 | 音声復号装置 |
| JP3484801B2 (ja) | 1995-02-17 | 2004-01-06 | ソニー株式会社 | 音声信号の雑音低減方法及び装置 |
| US5712953A (en) * | 1995-06-28 | 1998-01-27 | Electronic Data Systems Corporation | System and method for classification of audio or audio/video signals based on musical content |
| US6570991B1 (en) * | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
| SE9700772D0 (sv) | 1997-03-03 | 1997-03-03 | Ericsson Telefon Ab L M | A high resolution post processing method for a speech decoder |
| DK1141948T3 (da) * | 1999-01-07 | 2007-08-13 | Tellabs Operations Inc | Fremgangsmåde og apparat til adaptiv undertrykkelse af stöj |
| JP2001111386A (ja) * | 1999-10-04 | 2001-04-20 | Nippon Columbia Co Ltd | デジタル信号処理装置 |
| US7058572B1 (en) * | 2000-01-28 | 2006-06-06 | Nortel Networks Limited | Reducing acoustic noise in wireless and landline based telephony |
| ATE321402T1 (de) * | 2000-05-17 | 2006-04-15 | Symstream Technology Holdings | Opd (octave pulse data) - verfahren und vorrichtung |
| DE10109648C2 (de) | 2001-02-28 | 2003-01-30 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals |
| US7328151B2 (en) * | 2002-03-22 | 2008-02-05 | Sound Id | Audio decoder with dynamic adjustment of signal modification |
| US20060025993A1 (en) * | 2002-07-08 | 2006-02-02 | Koninklijke Philips Electronics | Audio processing |
| US20060116874A1 (en) * | 2003-10-24 | 2006-06-01 | Jonas Samuelsson | Noise-dependent postfiltering |
| CA2454296A1 (en) | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
| US7454332B2 (en) * | 2004-06-15 | 2008-11-18 | Microsoft Corporation | Gain constrained noise suppression |
| JP2006018023A (ja) | 2004-07-01 | 2006-01-19 | Fujitsu Ltd | オーディオ信号符号化装置、および符号化プログラム |
| US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
| KR101116363B1 (ko) * | 2005-08-11 | 2012-03-09 | 삼성전자주식회사 | 음성신호 분류방법 및 장치, 및 이를 이용한 음성신호부호화방법 및 장치 |
| US7899192B2 (en) * | 2006-04-22 | 2011-03-01 | Oxford J Craig | Method for dynamically adjusting the spectral content of an audio signal |
| WO2009004225A1 (fr) * | 2007-06-14 | 2009-01-08 | France Telecom | Post-traitement de reduction du bruit de quantification d'un codeur, au decodage |
| EP2259253B1 (en) * | 2008-03-03 | 2017-11-15 | LG Electronics Inc. | Method and apparatus for processing audio signal |
-
2009
- 2009-03-05 JP JP2010548995A patent/JP5247826B2/ja active Active
- 2009-03-05 RU RU2010140620/08A patent/RU2470385C2/ru active
- 2009-03-05 CA CA2715432A patent/CA2715432C/en active Active
- 2009-03-05 EP EP09717868A patent/EP2252996A4/en not_active Ceased
- 2009-03-05 EP EP15151693.7A patent/EP2863390B1/en active Active
- 2009-03-05 WO PCT/CA2009/000276 patent/WO2009109050A1/en not_active Ceased
- 2009-03-05 US US12/918,586 patent/US8401845B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| CA2715432C (en) | 2016-08-16 |
| RU2010140620A (ru) | 2012-04-10 |
| WO2009109050A8 (en) | 2009-11-26 |
| US20110046947A1 (en) | 2011-02-24 |
| RU2470385C2 (ru) | 2012-12-20 |
| EP2863390A2 (en) | 2015-04-22 |
| JP2011514557A (ja) | 2011-05-06 |
| EP2863390A3 (en) | 2015-06-10 |
| EP2863390B1 (en) | 2018-01-31 |
| EP2252996A4 (en) | 2012-01-11 |
| CA2715432A1 (en) | 2009-09-11 |
| US8401845B2 (en) | 2013-03-19 |
| EP2252996A1 (en) | 2010-11-24 |
| WO2009109050A1 (en) | 2009-09-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5247826B2 (ja) | 復号化音調音響信号を増強するためのシステムおよび方法 | |
| RU2441286C2 (ru) | Способ и устройство для обнаружения звуковой активности и классификации звуковых сигналов | |
| US8892448B2 (en) | Systems, methods, and apparatus for gain factor smoothing | |
| US8036882B2 (en) | Enhancing perceptual performance of SBR and related HFR coding methods by adaptive noise-floor addition and noise substitution limiting | |
| US9454974B2 (en) | Systems, methods, and apparatus for gain factor limiting | |
| US8396707B2 (en) | Method and device for efficient quantization of transform information in an embedded speech and audio codec | |
| KR102105044B1 (ko) | 낮은 레이트의 씨이엘피 디코더의 비 음성 콘텐츠의 개선 | |
| KR20060128983A (ko) | 배경잡음의 존재하에 음성 강화를 위한 방법 및 기기 | |
| EP3239979A1 (en) | Coding generic audio signals at low bitrates and low delay | |
| JP7764480B2 (ja) | 音響信号の統合時間領域/周波数領域符号化のための方法およびデバイス | |
| HK40107881A (en) | Coding generic audio signals at low bitrates and low delay | |
| HK40103944A (zh) | 用於声音信号的统一时域/频域编码的方法和装置 | |
| ES2673668T3 (es) | Sistema y método para mejorar una señal sonora tonal decodificada | |
| HK40035914B (en) | Improving non-speech content for low rate celp decoder | |
| HK40035914A (en) | Improving non-speech content for low rate celp decoder | |
| HK40117447A (en) | Improving non-speech content for low rate celp decoder | |
| Choi et al. | Efficient Speech Reinforcement Based on Low-Bit-Rate Speech Coding Parameters | |
| HK1198265B (en) | Improving non-speech content for low rate celp decoder |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120210 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121026 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121113 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130213 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130312 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130409 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5247826 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160419 Year of fee payment: 3 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
