JP6426211B2 - オーディオ符号化方法および装置 - Google Patents
オーディオ符号化方法および装置 Download PDFInfo
- Publication number
- JP6426211B2 JP6426211B2 JP2016574980A JP2016574980A JP6426211B2 JP 6426211 B2 JP6426211 B2 JP 6426211B2 JP 2016574980 A JP2016574980 A JP 2016574980A JP 2016574980 A JP2016574980 A JP 2016574980A JP 6426211 B2 JP6426211 B2 JP 6426211B2
- Authority
- JP
- Japan
- Prior art keywords
- energy
- ratio
- audio frames
- spectrum
- audio frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Auxiliary Devices For Music (AREA)
Description
dev(i)=(2*e(i))/(e1+e2) 式1.4
ここで、e(i)は、現在のオーディオフレームのQ個のサブバンドにおける第iのサブバンドのピークエネルギーを表し、e1およびe2は、現在のオーディオフレームの前のオーディオフレームの特定の周波数帯のピークエネルギーを表す。特に、現在のオーディオフレームが第Mのオーディオフレームであると仮定すると、現在のオーディオフレームの第iのサブバンドのピークエネルギーが存在するスペクトル包絡が決定される。ピークエネルギーが存在するスペクトル包絡がi1であると仮定する。第(M-1)のオーディオフレームにおける第(i1-t)のスペクトル包絡から第(i1+t)のスペクトル包絡までの範囲内のピークエネルギーが決定され、ピークエネルギーはe1である。同様に、第(M-2)のオーディオフレームにおける第(i1-t)のスペクトル包絡から第(i1+t)のスペクトル包絡までの範囲内のピークエネルギーが決定され、ピークエネルギーはe2である。
dev(i)=(2*e(i))/(e1+e2) 式1.9
ここで、e(i)は、現在のオーディオフレームのQ個のサブバンドにおける第iのサブバンドのピークエネルギーを表し、e1およびe2は、現在のオーディオフレームの前のオーディオフレームの特定の周波数帯のピークエネルギーを表す。特に、現在のオーディオフレームが第Mのオーディオフレームであると仮定すると、現在のオーディオフレームの第iのサブバンドのピークエネルギーが存在するスペクトル包絡が決定される。ピークエネルギーが存在するスペクトル包絡がi1であると仮定する。第(M-1)のオーディオフレームにおける第(i1-t)のスペクトル包絡から第(i1+t)のスペクトル包絡までの範囲内のピークエネルギーが決定され、ピークエネルギーはe1である。同様に、第(M-2)のオーディオフレームにおける第(i1-t)のスペクトル包絡から第(i1+t)のスペクトル包絡までの範囲内のピークエネルギーが決定され、ピークエネルギーはe2である。
dev(i)=(2*e(i))/(e1+e2) 式1.9
ここで、e(i)は、現在のオーディオフレームのQ個のサブバンドにおける第iのサブバンドのピークエネルギーを表し、e1およびe2は、現在のオーディオフレームの前のオーディオフレームの特定の周波数帯のピークエネルギーを表す。特に、現在のオーディオフレームが第Mのオーディオフレームであると仮定すると、現在のオーディオフレームの第iのサブバンドのピークエネルギーが存在するスペクトル包絡が決定される。ピークエネルギーが存在するスペクトル包絡がi1であると仮定する。第(M-1)のオーディオフレームにおける第(i1-t)のスペクトル包絡から第(i1+t)のスペクトル包絡までの範囲内のピークエネルギーが決定され、ピークエネルギーはe1である。同様に、第(M-2)のオーディオフレームにおける第(i1-t)のスペクトル包絡から第(i1+t)のスペクトル包絡までの範囲内のピークエネルギーが決定され、ピークエネルギーはe2である。
201 取得ユニット
202 決定ユニット
300 装置
301 プロセッサ
302 メモリ
303 バスシステム
Claims (30)
- オーディオ符号化方法であって、前記方法は、
N個の入力オーディオフレームのエネルギーの、スペクトルにおける、分布のスパース性を決定するステップであって、前記N個のオーディオフレームは、現在のオーディオフレームを含み、Nは正の整数である、ステップと、
前記N個のオーディオフレームの前記エネルギーの、前記スペクトルにおける、分布の前記スパース性に従って、前記現在のオーディオフレームを符号化するために第1の符号化方法を使用するか第2の符号化方法を使用するかを決定するステップであって、前記第1の符号化方法は、時間-周波数変換および変換係数量子化に基づくとともに線形予測には基づかない符号化方法であり、前記第2の符号化方法は、線形予測ベースの符号化方法である、ステップとを含む、方法。 - 前記N個の入力オーディオフレームのエネルギーの、スペクトルにおける、分布のスパース性を決定するステップは、
前記N個のオーディオフレームの各々のスペクトルをP個のスペクトル包絡に分割するステップであって、Pは正の整数であり、P>1である、ステップと、
前記N個のオーディオフレームの各々の前記P個のスペクトル包絡のエネルギーに従って一般スパース性パラメータを決定するステップであって、前記一般スパース性パラメータは、前記N個のオーディオフレームの前記エネルギーの、前記スペクトルにおける、分布の前記スパース性を示す、ステップとを含む、請求項1に記載の方法。 - 前記一般スパース性パラメータは、第1の最小帯域幅を含み、
前記N個のオーディオフレームの各々の前記P個のスペクトル包絡のエネルギーに従って一般スパース性パラメータを決定するステップは、
前記N個のオーディオフレームの各々の前記P個のスペクトル包絡の前記エネルギーに従って、前記N個のオーディオフレームの第1のプリセット比率のエネルギーの、前記スペクトルに分布している、最小帯域幅の平均値を決定するステップであって、前記N個のオーディオフレームの前記第1のプリセット比率のエネルギーの、前記スペクトルに分布している、前記最小帯域幅の前記平均値は、前記第1の最小帯域幅である、ステップを含み、
前記N個のオーディオフレームの前記エネルギーの、前記スペクトルにおける、分布の前記スパース性に従って、前記現在のオーディオフレームを符号化するために第1の符号化方法を使用するか第2の符号化方法を使用するかを決定するステップは、
前記第1の最小帯域幅が第1のプリセット値未満である場合には、前記現在のオーディオフレームを符号化するために前記第1の符号化方法を使用すると決定するステップ、または、前記第1の最小帯域幅が前記第1のプリセット値より大きい場合には、前記現在のオーディオフレームを符号化するために前記第2の符号化方法を使用すると決定するステップを含む、請求項2に記載の方法。 - 前記N個のオーディオフレームの各々の前記P個のスペクトル包絡の前記エネルギーに従って、前記N個のオーディオフレームの第1のプリセット比率のエネルギーの、前記スペクトルに分布している、最小帯域幅の平均値を決定するステップは、
降順で各オーディオフレームの前記P個のスペクトル包絡の前記エネルギーをソートするステップと、
前記N個のオーディオフレームの各々の前記P個のスペクトル包絡の、降順でソートした、前記エネルギーに従って、前記N個のオーディオフレームの各々の前記第1のプリセット比率を少なくとも占めるエネルギーの、前記スペクトルに分布している、最小帯域幅を決定するステップと、
前記N個のオーディオフレームの各々の前記第1のプリセット比率を少なくとも占める前記エネルギーの、前記スペクトルに分布している、前記最小帯域幅に従って、前記N個のオーディオフレームの前記第1のプリセット比率を少なくとも占めるエネルギーの、前記スペクトルに分布している、最小帯域幅の平均値を決定するステップとを含む、請求項3に記載の方法。 - 前記一般スパース性パラメータは、第1のエネルギー比率を含み、
前記N個のオーディオフレームの各々の前記P個のスペクトル包絡のエネルギーに従って一般スパース性パラメータを決定するステップは、
P1個のスペクトル包絡を前記N個のオーディオフレームの各々の前記P個のスペクトル包絡から選択するステップと、
前記N個のオーディオフレームの各々の前記P1個のスペクトル包絡のエネルギーおよび前記N個のオーディオフレームのそれぞれの総エネルギーに従って前記第1のエネルギー比率を決定するステップであって、P1はP未満の正の整数である、ステップとを含み、
前記N個のオーディオフレームの前記エネルギーの、前記スペクトルにおける、分布の前記スパース性に従って、前記現在のオーディオフレームを符号化するために第1の符号化方法を使用するか第2の符号化方法を使用するかを決定するステップは、
前記第1のエネルギー比率が第2のプリセット値より大きい場合には、前記現在のオーディオフレームを符号化するために前記第1の符号化方法を使用すると決定するステップ、または、前記第1のエネルギー比率が前記第2のプリセット値未満である場合には、前記現在のオーディオフレームを符号化するために前記第2の符号化方法を使用すると決定するステップを含む、請求項2に記載の方法。 - 前記P1個のスペクトル包絡の任意の1つのエネルギーは、前記P1個のスペクトル包絡を除く前記P個のスペクトル包絡のうちの他のスペクトル包絡の任意の1つのエネルギーより大きい、請求項5に記載の方法。
- 前記一般スパース性パラメータは、第2の最小帯域幅および第3の最小帯域幅を含み、
前記N個のオーディオフレームの各々の前記P個のスペクトル包絡のエネルギーに従って一般スパース性パラメータを決定するステップは、
前記N個のオーディオフレームの各々の前記P個のスペクトル包絡の前記エネルギーに従って、前記N個のオーディオフレームの第2のプリセット比率のエネルギーの、前記スペクトルに分布している、最小帯域幅の平均値を決定するとともに、前記N個のオーディオフレームの第3のプリセット比率のエネルギーの、前記スペクトルに分布している、最小帯域幅の平均値を決定するステップであって、前記N個のオーディオフレームの前記第2のプリセット比率のエネルギーの、前記スペクトルに分布している、前記最小帯域幅の前記平均値は、前記第2の最小帯域幅として使用され、前記N個のオーディオフレームの前記第3のプリセット比率のエネルギーの、前記スペクトルに分布している、前記最小帯域幅の前記平均値は、前記第3の最小帯域幅として使用され、前記第2のプリセット比率は、前記第3のプリセット比率未満である、ステップを含み、
前記N個のオーディオフレームの前記エネルギーの、前記スペクトルにおける、分布の前記スパース性に従って、前記現在のオーディオフレームを符号化するために第1の符号化方法を使用するか第2の符号化方法を使用するかを決定するステップは、
前記第2の最小帯域幅が第3のプリセット値未満且つ前記第3の最小帯域幅が第4のプリセット値未満である場合には、前記現在のオーディオフレームを符号化するために前記第1の符号化方法を使用すると決定するステップ、
前記第3の最小帯域幅が第5のプリセット値未満である場合には、前記現在のオーディオフレームを符号化するために前記第1の符号化方法を使用すると決定するステップ、または、
前記第3の最小帯域幅が第6のプリセット値より大きい場合には、前記現在のオーディオフレームを符号化するために前記第2の符号化方法を使用すると決定するステップを含み、
前記第4のプリセット値は、前記第3のプリセット値以上であり、前記第5のプリセット値は、前記第4のプリセット値未満であり、前記第6のプリセット値は、前記第4のプリセット値より大きい、請求項2に記載の方法。 - 前記N個のオーディオフレームの各々の前記P個のスペクトル包絡の前記エネルギーに従って、前記N個のオーディオフレームの第2のプリセット比率のエネルギーの、前記スペクトルに分布している、前記最小帯域幅の平均値を決定するとともに、前記N個のオーディオフレームの第3のプリセット比率のエネルギーの、前記スペクトルに分布している、最小帯域幅の平均値を決定するステップは、
降順で各オーディオフレームの前記P個のスペクトル包絡の前記エネルギーをソートするステップと、
前記N個のオーディオフレームの各々の前記P個のスペクトル包絡の、降順でソートした、前記エネルギーに従って、前記N個のオーディオフレームの各々の前記第2のプリセット比率を少なくとも占めるエネルギーの、前記スペクトルに分布している、最小帯域幅を決定するステップと、
前記N個のオーディオフレームの各々の前記第2のプリセット比率を少なくとも占める前記エネルギーの、前記スペクトルに分布している、前記最小帯域幅に従って、前記N個のオーディオフレームの前記第2のプリセット比率を少なくとも占めるエネルギーの、前記スペクトルに分布している、最小帯域幅の平均値を決定するステップと、
前記N個のオーディオフレームの各々の前記P個のスペクトル包絡の、降順でソートした、前記エネルギーに従って、前記N個のオーディオフレームの各々の前記第3のプリセット比率を少なくとも占めるエネルギーの、前記スペクトルに分布している、最小帯域幅を決定するステップと、
前記N個のオーディオフレームの各々の前記第3のプリセット比率を少なくとも占める前記エネルギーの、前記スペクトルに分布している、前記最小帯域幅に従って、前記N個のオーディオフレームの前記第3のプリセット比率を少なくとも占めるエネルギーの、前記スペクトルに分布している、最小帯域幅の平均値を決定するステップとを含む、請求項7に記載の方法。 - 前記一般スパース性パラメータは、第2のエネルギー比率および第3のエネルギー比率を含み、
前記N個のオーディオフレームの各々の前記P個のスペクトル包絡のエネルギーに従って一般スパース性パラメータを決定するステップは、
P2個のスペクトル包絡を前記N個のオーディオフレームの各々の前記P個のスペクトル包絡から選択するステップと、
前記N個のオーディオフレームの各々の前記P2個のスペクトル包絡のエネルギーおよび前記N個のオーディオフレームのそれぞれの総エネルギーに従って前記第2のエネルギー比率を決定するステップと、
P3個のスペクトル包絡を前記N個のオーディオフレームの各々の前記P個のスペクトル包絡から選択するステップと、
前記N個のオーディオフレームの各々の前記P3個のスペクトル包絡のエネルギーおよび前記N個のオーディオフレームのそれぞれの前記総エネルギーに従って前記第3のエネルギー比率を決定するステップとを含み、P2およびP3はP未満の正の整数であり、P2はP3未満であり、
前記N個のオーディオフレームの前記エネルギーの、前記スペクトルにおける、分布の前記スパース性に従って、前記現在のオーディオフレームを符号化するために第1の符号化方法を使用するか第2の符号化方法を使用するかを決定するステップは、
前記第2のエネルギー比率が第7のプリセット値より大きく且つ前記第3のエネルギー比率が第8のプリセット値より大きい場合には、前記現在のオーディオフレームを符号化するために前記第1の符号化方法を使用すると決定するステップ、
前記第2のエネルギー比率が第9のプリセット値より大きい場合には、前記現在のオーディオフレームを符号化するために前記第1の符号化方法を使用すると決定するステップ、または、
前記第3のエネルギー比率が第10のプリセット値未満である場合には、前記現在のオーディオフレームを符号化するために前記第2の符号化方法を使用すると決定するステップを含む、請求項2に記載の方法。 - 前記P2個のスペクトル包絡は、前記P個のスペクトル包絡のうちの最大のエネルギーを有するP2個のスペクトル包絡であり、
前記P3個のスペクトル包絡は、前記P個のスペクトル包絡のうちの最大のエネルギーを有するP3個のスペクトル包絡である、請求項9に記載の方法。 - 前記スペクトルにおける前記エネルギーの分布の前記スパース性は、前記スペクトルにおける、前記エネルギーの分布のグローバルスパース性、ローカルスパース性、および短期バースト性を含む、請求項1に記載の方法。
- Nは1であり、前記N個のオーディオフレームは、前記現在のオーディオフレームであり、
前記N個の入力オーディオフレームのエネルギーの、スペクトルにおける、分布のスパース性を決定するステップは、
前記現在のオーディオフレームのスペクトルをQ個のサブバンドに分割するステップと、
前記現在のオーディオフレームの前記スペクトルの前記Q個のサブバンドの各々のピークエネルギーに従ってバーストスパース性パラメータを決定するステップであって、前記バーストスパース性パラメータは、前記現在のオーディオフレームのグローバルスパース性、ローカルスパース性、および短期バースト性を示すために使用される、ステップとを含む、請求項11に記載の方法。 - 前記バーストスパース性パラメータは、前記Q個のサブバンドの各々のグローバルピーク対平均比率、前記Q個のサブバンドの各々のローカルピーク対平均比率、および前記Q個のサブバンドの各々の短期ピークエネルギー変動を含み、前記グローバルピーク対平均比率は、前記サブバンドにおける前記ピークエネルギーおよび前記現在のオーディオフレームの前記サブバンドすべての平均エネルギーに従って決定され、前記ローカルピーク対平均比率は、前記サブバンドにおける前記ピークエネルギーおよび前記サブバンドにおける平均エネルギーに従って決定され、前記短期ピークエネルギー変動は、前記サブバンドにおける前記ピークエネルギーおよび前記オーディオフレームの前のオーディオフレームの特定の周波数帯におけるピークエネルギーに従って決定され、
前記N個のオーディオフレームの前記エネルギーの、前記スペクトルにおける、分布の前記スパース性に従って、前記現在のオーディオフレームを符号化するために第1の符号化方法を使用するか第2の符号化方法を使用するかを決定するステップは、
前記Q個のサブバンド内に第1のサブバンドが存在しているかどうかを決定するステップであって、前記第1のサブバンドのローカルピーク対平均比率は、第11のプリセット値より大きく、前記第1のサブバンドのグローバルピーク対平均比率は、第12のプリセット値より大きく、前記第1のサブバンドの短期ピークエネルギー変動は、第13のプリセット値より大きい、ステップと、
前記Q個のサブバンド内に前記第1のサブバンドが存在している場合には、前記現在のオーディオフレームを符号化するために前記第1の符号化方法を使用すると決定するステップとを含む、請求項12に記載の方法。 - 前記スペクトルにおける前記エネルギーの分布の前記スパース性は、前記スペクトルにおける前記エネルギーの分布の帯域制限特性を含む、請求項1に記載の方法。
- 前記N個の入力オーディオフレームのエネルギーの、スペクトルにおける、分布のスパース性を決定するステップは、
前記N個のオーディオフレームの各々の境界周波数を決定するステップと、
前記N個のオーディオフレームの各々の前記境界周波数に従って帯域制限スパース性パラメータを決定するステップとを含む、請求項14に記載の方法。 - 前記帯域制限スパース性パラメータは、前記N個のオーディオフレームの前記境界周波数の平均値であり、
前記N個のオーディオフレームの前記エネルギーの、前記スペクトルにおける、分布の前記スパース性に従って、前記現在のオーディオフレームを符号化するために第1の符号化方法を使用するか第2の符号化方法を使用するかを決定するステップは、
前記オーディオフレームの前記帯域制限スパース性パラメータが第14のプリセット値未満であると決定された場合には、前記現在のオーディオフレームを符号化するために前記第1の符号化方法を使用すると決定するステップを含む、請求項15に記載の方法。 - 装置であって、前記装置は、
N個のオーディオフレームを取得するように構成される、取得ユニットであって、前記N個のオーディオフレームは、現在のオーディオフレームを含み、Nは正の整数である、取得ユニットと、
前記取得ユニットによって取得した前記N個のオーディオフレームのエネルギーの、前記スペクトルにおける、分布のスパース性を決定するように構成される、決定ユニットとを備え、
前記決定ユニットは、前記N個のオーディオフレームの前記エネルギーの、前記スペクトルにおける、分布の前記スパース性に従って、前記現在のオーディオフレームを符号化するために第1の符号化方法を使用するか第2の符号化方法を使用するかを決定するようにさらに構成され、前記第1の符号化方法は、時間-周波数変換および変換係数量子化に基づくとともに線形予測には基づかない符号化方法であり、前記第2の符号化方法は、線形予測ベースの符号化方法である、装置。 - 前記決定ユニットは、前記N個のオーディオフレームの各々のスペクトルをP個のスペクトル包絡に分割し、前記N個のオーディオフレームの各々の前記P個のスペクトル包絡のエネルギーに従って一般スパース性パラメータを決定するように特に構成され、Pは正の整数であり、P>1であり、前記一般スパース性パラメータは、前記N個のオーディオフレームの前記エネルギーの、前記スペクトルにおける、分布の前記スパース性を示す、請求項17に記載の装置。
- 前記一般スパース性パラメータは、第1の最小帯域幅を含み、
前記決定ユニットは、前記N個のオーディオフレームの各々の前記P個のスペクトル包絡の前記エネルギーに従って、前記N個のオーディオフレームの第1のプリセット比率のエネルギーの、前記スペクトルに分布している、最小帯域幅の平均値を決定するように特に構成され、前記N個のオーディオフレームの前記第1のプリセット比率のエネルギーの、前記スペクトルに分布している、前記最小帯域幅の前記平均値は、前記第1の最小帯域幅であり、
前記決定ユニットは、前記第1の最小帯域幅が第1のプリセット値未満である場合には、前記現在のオーディオフレームを符号化するために前記第1の符号化方法を使用すると決定するように、または、前記第1の最小帯域幅が前記第1のプリセット値より大きい場合には、前記現在のオーディオフレームを符号化するために前記第2の符号化方法を使用すると決定するように特に構成される、請求項18に記載の装置。 - 前記決定ユニットは、降順で各オーディオフレームの前記P個のスペクトル包絡の前記エネルギーをソートし、前記N個のオーディオフレームの各々の前記P個のスペクトル包絡の、降順でソートした、前記エネルギーに従って、前記N個のオーディオフレームの各々の前記第1のプリセット比率を少なくとも占めるエネルギーの、前記スペクトルに分布している、最小帯域幅を決定し、前記N個のオーディオフレームの各々の前記第1のプリセット比率を少なくとも占める前記エネルギーの、前記スペクトルに分布している、前記最小帯域幅に従って、前記N個のオーディオフレームの前記第1のプリセット比率を少なくとも占めるエネルギーの、前記スペクトルに分布している、最小帯域幅の平均値を決定するように特に構成される、請求項19に記載の装置。
- 前記一般スパース性パラメータは、第1のエネルギー比率を含み、
前記決定ユニットは、P1個のスペクトル包絡を前記N個のオーディオフレームの各々の前記P個のスペクトル包絡から選択し、前記N個のオーディオフレームの各々の前記P1個のスペクトル包絡のエネルギーおよび前記N個のオーディオフレームのそれぞれの総エネルギーに従って前記第1のエネルギー比率を決定するように特に構成され、P1はP未満の正の整数であり、
前記決定ユニットは、前記第1のエネルギー比率が第2のプリセット値より大きい場合には、前記現在のオーディオフレームを符号化するために前記第1の符号化方法を使用すると決定し、前記第1のエネルギー比率が前記第2のプリセット値未満である場合には、前記現在のオーディオフレームを符号化するために前記第2の符号化方法を使用すると決定するように特に構成される、請求項18に記載の装置。 - 前記決定ユニットは、前記P個のスペクトル包絡の前記エネルギーに従って前記P1個のスペクトル包絡を決定するように特に構成され、前記P1個のスペクトル包絡の任意の1つのエネルギーは、前記P1個のスペクトル包絡を除く前記P個のスペクトル包絡のうちの他のスペクトル包絡の任意の1つのエネルギーより大きい、請求項21に記載の装置。
- 前記一般スパース性パラメータは、第2の最小帯域幅および第3の最小帯域幅を含み、
前記決定ユニットは、前記N個のオーディオフレームの各々の前記P個のスペクトル包絡の前記エネルギーに従って、前記N個のオーディオフレームの第2のプリセット比率のエネルギーの、前記スペクトルに分布している、最小帯域幅の平均値を決定するとともに、前記N個のオーディオフレームの第3のプリセット比率のエネルギーの、前記スペクトルに分布している、最小帯域幅の平均値を決定するように特に構成され、前記N個のオーディオフレームの前記第2のプリセット比率のエネルギーの、前記スペクトルに分布している、前記最小帯域幅の前記平均値は、前記第2の最小帯域幅として使用され、前記N個のオーディオフレームの前記第3のプリセット比率のエネルギーの、前記スペクトルに分布している、前記最小帯域幅の前記平均値は、前記第3の最小帯域幅として使用され、前記第2のプリセット比率は、前記第3のプリセット比率未満であり、
前記決定ユニットは、前記第2の最小帯域幅が第3のプリセット値未満且つ前記第3の最小帯域幅が第4のプリセット値未満である場合には、前記現在のオーディオフレームを符号化するために前記第1の符号化方法を使用すると決定し、前記第3の最小帯域幅が第5のプリセット値未満である場合には、前記現在のオーディオフレームを符号化するために前記第1の符号化方法を使用すると決定し、前記第3の最小帯域幅が第6のプリセット値より大きい場合には、前記現在のオーディオフレームを符号化するために前記第2の符号化方法を使用すると決定するように特に構成され、
前記第4のプリセット値は、前記第3のプリセット値以上であり、前記第5のプリセット値は、前記第4のプリセット値未満であり、前記第6のプリセット値は、前記第4のプリセット値より大きい、請求項18に記載の装置。 - 前記決定ユニットは、降順で各オーディオフレームの前記P個のスペクトル包絡の前記エネルギーをソートし、前記N個のオーディオフレームの各々の前記P個のスペクトル包絡の、降順でソートした、前記エネルギーに従って、前記N個のオーディオフレームの各々の前記第2のプリセット比率を少なくとも占めるエネルギーの、前記スペクトルに分布している、最小帯域幅を決定し、前記N個のオーディオフレームの各々の前記第2のプリセット比率を少なくとも占める前記エネルギーの、前記スペクトルに分布している、前記最小帯域幅に従って、前記N個のオーディオフレームの前記第2のプリセット比率を少なくとも占めるエネルギーの、前記スペクトルに分布している、最小帯域幅の平均値を決定し、前記N個のオーディオフレームの各々の前記P個のスペクトル包絡の、降順でソートした、前記エネルギーに従って、前記N個のオーディオフレームの各々の前記第3のプリセット比率を少なくとも占めるエネルギーの、前記スペクトルに分布している、最小帯域幅を決定し、前記N個のオーディオフレームの各々の前記第3のプリセット比率を少なくとも占める前記エネルギーの、前記スペクトルに分布している、前記最小帯域幅に従って、前記N個のオーディオフレームの前記第3のプリセット比率を少なくとも占めるエネルギーの、前記スペクトルに分布している、最小帯域幅の平均値を決定するように特に構成される、請求項23に記載の装置。
- 前記一般スパース性パラメータは、第2のエネルギー比率および第3のエネルギー比率を含み、
前記決定ユニットは、P2個のスペクトル包絡を前記N個のオーディオフレームの各々の前記P個のスペクトル包絡から選択し、前記N個のオーディオフレームの各々の前記P2個のスペクトル包絡のエネルギーおよび前記N個のオーディオフレームのそれぞれの総エネルギーに従って前記第2のエネルギー比率を決定し、P3個のスペクトル包絡を前記N個のオーディオフレームの各々の前記P個のスペクトル包絡から選択し、前記N個のオーディオフレームの各々の前記P3個のスペクトル包絡のエネルギーおよび前記N個のオーディオフレームのそれぞれの前記総エネルギーに従って前記第3のエネルギー比率を決定するように特に構成され、P2およびP3はP未満の正の整数であり、P2はP3未満であり、
前記決定ユニットは、前記第2のエネルギー比率が第7のプリセット値より大きく且つ前記第3のエネルギー比率が第8のプリセット値より大きい場合には、前記現在のオーディオフレームを符号化するために前記第1の符号化方法を使用すると決定し、前記第2のエネルギー比率が第9のプリセット値より大きい場合には、前記現在のオーディオフレームを符号化するために前記第1の符号化方法を使用すると決定し、前記第3のエネルギー比率が第10のプリセット値未満である場合には、前記現在のオーディオフレームを符号化するために前記第2の符号化方法を使用すると決定するように特に構成される、請求項18に記載の装置。 - 前記決定ユニットは、前記N個のオーディオフレームの各々の前記P個のスペクトル包絡から、最大のエネルギーを有するP2個のスペクトル包絡を決定し、前記N個のオーディオフレームの各々の前記P個のスペクトル包絡から、最大のエネルギーを有するP3個のスペクトル包絡を決定するように特に構成される、請求項25に記載の装置。
- Nは1であり、前記N個のオーディオフレームは、前記現在のオーディオフレームであり、
前記決定ユニットは、前記現在のオーディオフレームのスペクトルをQ個のサブバンドに分割して、前記現在のオーディオフレームの前記スペクトルの前記Q個のサブバンドの各々のピークエネルギーに従ってバーストスパース性パラメータを決定するように特に構成され、前記バーストスパース性パラメータは、前記現在のオーディオフレームのグローバルスパース性、ローカルスパース性、および短期バースト性を示すために使用される、請求項17に記載の装置。 - 前記決定ユニットは、前記Q個のサブバンドの各々のグローバルピーク対平均比率、前記Q個のサブバンドの各々のローカルピーク対平均比率、および前記Q個のサブバンドの各々の短期ピークエネルギー変動を決定するように特に構成され、前記グローバルピーク対平均比率は、前記サブバンドにおける前記ピークエネルギーおよび前記現在のオーディオフレームの前記サブバンドすべての平均エネルギーに従って前記決定ユニットによって決定され、前記ローカルピーク対平均比率は、前記サブバンドにおける前記ピークエネルギーおよび前記サブバンドにおける平均エネルギーに従って前記決定ユニットによって決定され、前記短期ピークエネルギー変動は、前記サブバンドにおける前記ピークエネルギーおよび前記オーディオフレームの前のオーディオフレームの特定の周波数帯におけるピークエネルギーに従って決定され、
前記決定ユニットは、前記Q個のサブバンド内に第1のサブバンドが存在しているかどうかを決定することであって、前記第1のサブバンドのローカルピーク対平均比率は、第11のプリセット値より大きく、前記第1のサブバンドのグローバルピーク対平均比率は、第12のプリセット値より大きく、前記第1のサブバンドの短期ピークエネルギー変動は、第13のプリセット値より大きい、決定することをし、前記Q個のサブバンド内に前記第1のサブバンドが存在している場合には、前記現在のオーディオフレームを符号化するために前記第1の符号化方法を使用すると決定するように特に構成される、請求項27に記載の装置。 - 前記決定ユニットは、前記N個のオーディオフレームの各々の境界周波数を決定するように特に構成され、
前記決定ユニットは、前記N個のオーディオフレームの各々の前記境界周波数に従って帯域制限スパース性パラメータを決定するように特に構成される、請求項17に記載の装置。 - 前記帯域制限スパース性パラメータは、前記N個のオーディオフレームの前記境界周波数の平均値であり、
前記決定ユニットは、前記オーディオフレームの前記帯域制限スパース性パラメータが第14のプリセット値未満であると決定された場合には、前記現在のオーディオフレームを符号化するために前記第1の符号化方法を使用すると決定するように特に構成される、請求項29に記載の装置。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201410288983.3 | 2014-06-24 | ||
| CN201410288983.3A CN105336338B (zh) | 2014-06-24 | 2014-06-24 | 音频编码方法和装置 |
| PCT/CN2015/082076 WO2015196968A1 (zh) | 2014-06-24 | 2015-06-23 | 音频编码方法和装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2017523455A JP2017523455A (ja) | 2017-08-17 |
| JP6426211B2 true JP6426211B2 (ja) | 2018-11-21 |
Family
ID=54936800
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2016574980A Active JP6426211B2 (ja) | 2014-06-24 | 2015-06-23 | オーディオ符号化方法および装置 |
Country Status (16)
| Country | Link |
|---|---|
| US (3) | US9761239B2 (ja) |
| EP (2) | EP3460794B1 (ja) |
| JP (1) | JP6426211B2 (ja) |
| KR (2) | KR102051928B1 (ja) |
| CN (3) | CN105336338B (ja) |
| AU (2) | AU2015281506B2 (ja) |
| BR (1) | BR112016029380B1 (ja) |
| CA (1) | CA2951593C (ja) |
| DK (1) | DK3460794T3 (ja) |
| ES (2) | ES2883685T3 (ja) |
| MX (1) | MX361248B (ja) |
| MY (1) | MY173129A (ja) |
| PT (1) | PT3144933T (ja) |
| RU (1) | RU2667380C2 (ja) |
| SG (1) | SG11201610302TA (ja) |
| WO (1) | WO2015196968A1 (ja) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN105336338B (zh) | 2014-06-24 | 2017-04-12 | 华为技术有限公司 | 音频编码方法和装置 |
| US12230287B2 (en) * | 2019-10-16 | 2025-02-18 | Panasonic Intellectual Property Corporation Of America | Quantization scale factor determination device and quantization scale factor determination method |
| CN111739543B (zh) * | 2020-05-25 | 2023-05-23 | 杭州涂鸦信息技术有限公司 | 音频编码方法的调试方法及其相关装置 |
| CN113948085B (zh) * | 2021-12-22 | 2022-03-25 | 中国科学院自动化研究所 | 语音识别方法、系统、电子设备和存储介质 |
Family Cites Families (47)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FI101439B1 (fi) * | 1995-04-13 | 1998-06-15 | Nokia Telecommunications Oy | Transkooderi, jossa on tandem-koodauksen esto |
| US6134518A (en) * | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
| DE69926821T2 (de) * | 1998-01-22 | 2007-12-06 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen |
| US7139700B1 (en) * | 1999-09-22 | 2006-11-21 | Texas Instruments Incorporated | Hybrid speech coding and system |
| US6901362B1 (en) * | 2000-04-19 | 2005-05-31 | Microsoft Corporation | Audio segmentation and classification |
| US6658383B2 (en) * | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
| US6647366B2 (en) * | 2001-12-28 | 2003-11-11 | Microsoft Corporation | Rate control strategies for speech and music coding |
| WO2004082288A1 (en) * | 2003-03-11 | 2004-09-23 | Nokia Corporation | Switching between coding schemes |
| US20050096898A1 (en) * | 2003-10-29 | 2005-05-05 | Manoj Singhal | Classification of speech and music using sub-band energy |
| FI118835B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
| FI118834B (fi) * | 2004-02-23 | 2008-03-31 | Nokia Corp | Audiosignaalien luokittelu |
| GB0408856D0 (en) * | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
| US7739120B2 (en) * | 2004-05-17 | 2010-06-15 | Nokia Corporation | Selection of coding models for encoding an audio signal |
| US8260611B2 (en) * | 2005-04-01 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for highband excitation generation |
| PT1875463T (pt) | 2005-04-22 | 2019-01-24 | Qualcomm Inc | Sistemas, métodos e aparelho para nivelamento de fator de ganho |
| DE102005046993B3 (de) | 2005-09-30 | 2007-02-22 | Infineon Technologies Ag | Vorrichtung und Verfahren zum Erzeugen eines Leistungssignals aus einem Laststrom |
| US8015000B2 (en) * | 2006-08-03 | 2011-09-06 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
| JP5096474B2 (ja) * | 2006-10-10 | 2012-12-12 | クゥアルコム・インコーポレイテッド | オーディオ信号を符号化及び復号化する方法及び装置 |
| KR100964402B1 (ko) * | 2006-12-14 | 2010-06-17 | 삼성전자주식회사 | 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치 |
| CN101025918B (zh) * | 2007-01-19 | 2011-06-29 | 清华大学 | 一种语音/音乐双模编解码无缝切换方法 |
| KR101149449B1 (ko) * | 2007-03-20 | 2012-05-25 | 삼성전자주식회사 | 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치 |
| JP5156260B2 (ja) * | 2007-04-27 | 2013-03-06 | ニュアンス コミュニケーションズ,インコーポレイテッド | 雑音を除去して目的音を抽出する方法、前処理部、音声認識システムおよびプログラム |
| KR100925256B1 (ko) * | 2007-05-03 | 2009-11-05 | 인하대학교 산학협력단 | 음성 및 음악을 실시간으로 분류하는 방법 |
| KR20100134623A (ko) * | 2008-03-04 | 2010-12-23 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
| EP2139000B1 (en) * | 2008-06-25 | 2011-05-25 | Thomson Licensing | Method and apparatus for encoding or decoding a speech and/or non-speech audio input signal |
| US8380523B2 (en) * | 2008-07-07 | 2013-02-19 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
| RU2507609C2 (ru) * | 2008-07-11 | 2014-02-20 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Способ и дискриминатор для классификации различных сегментов сигнала |
| EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
| US9037474B2 (en) * | 2008-09-06 | 2015-05-19 | Huawei Technologies Co., Ltd. | Method for classifying audio signal into fast signal or slow signal |
| CN101615910B (zh) | 2009-05-31 | 2010-12-22 | 华为技术有限公司 | 压缩编码的方法、装置和设备以及压缩解码方法 |
| US8606569B2 (en) * | 2009-07-02 | 2013-12-10 | Alon Konchitsky | Automatic determination of multimedia and voice signals |
| CN102044244B (zh) * | 2009-10-15 | 2011-11-16 | 华为技术有限公司 | 信号分类方法和装置 |
| CN101800050B (zh) * | 2010-02-03 | 2012-10-10 | 武汉大学 | 基于感知自适应比特分配的音频精细分级编码方法及系统 |
| JP5331249B2 (ja) | 2010-07-05 | 2013-10-30 | 日本電信電話株式会社 | 符号化方法、復号方法、装置、プログラムおよび記録媒体 |
| US9208792B2 (en) * | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
| US8484023B2 (en) | 2010-09-24 | 2013-07-09 | Nuance Communications, Inc. | Sparse representation features for speech recognition |
| US9111526B2 (en) * | 2010-10-25 | 2015-08-18 | Qualcomm Incorporated | Systems, method, apparatus, and computer-readable media for decomposition of a multichannel music signal |
| BR112013026333B1 (pt) * | 2011-04-28 | 2021-05-18 | Telefonaktiebolaget L M Ericsson (Publ) | método de classificação de sinal de áudio baseada em quadro, classificador de áudio, dispositivo de comunicação de áudio, e, disposição de codec de áudio |
| WO2013057895A1 (ja) | 2011-10-19 | 2013-04-25 | パナソニック株式会社 | 符号化装置及び符号化方法 |
| US9111531B2 (en) * | 2012-01-13 | 2015-08-18 | Qualcomm Incorporated | Multiple coding mode signal classification |
| CN102737647A (zh) * | 2012-07-23 | 2012-10-17 | 武汉大学 | 双声道音频音质增强编解码方法及装置 |
| CN105976824B (zh) | 2012-12-06 | 2021-06-08 | 华为技术有限公司 | 信号解码的方法和设备 |
| CN103747237B (zh) * | 2013-02-06 | 2015-04-29 | 华为技术有限公司 | 视频编码质量的评估方法及设备 |
| CN103280221B (zh) | 2013-05-09 | 2015-07-29 | 北京大学 | 一种基于基追踪的音频无损压缩编码、解码方法及系统 |
| CN103778919B (zh) * | 2014-01-21 | 2016-08-17 | 南京邮电大学 | 基于压缩感知和稀疏表示的语音编码方法 |
| CN105336338B (zh) * | 2014-06-24 | 2017-04-12 | 华为技术有限公司 | 音频编码方法和装置 |
| CN104217730B (zh) * | 2014-08-18 | 2017-07-21 | 大连理工大学 | 一种基于k‑svd的人工语音带宽扩展方法及装置 |
-
2014
- 2014-06-24 CN CN201410288983.3A patent/CN105336338B/zh active Active
- 2014-06-24 CN CN201710188022.9A patent/CN107424621B/zh active Active
- 2014-06-24 CN CN201710188023.3A patent/CN107424622B/zh active Active
-
2015
- 2015-06-23 WO PCT/CN2015/082076 patent/WO2015196968A1/zh not_active Ceased
- 2015-06-23 MY MYPI2016704527A patent/MY173129A/en unknown
- 2015-06-23 KR KR1020197007222A patent/KR102051928B1/ko active Active
- 2015-06-23 RU RU2017101813A patent/RU2667380C2/ru active
- 2015-06-23 BR BR112016029380-0A patent/BR112016029380B1/pt active IP Right Grant
- 2015-06-23 ES ES18167140T patent/ES2883685T3/es active Active
- 2015-06-23 PT PT15811228T patent/PT3144933T/pt unknown
- 2015-06-23 EP EP18167140.5A patent/EP3460794B1/en active Active
- 2015-06-23 ES ES15811228T patent/ES2703199T3/es active Active
- 2015-06-23 SG SG11201610302TA patent/SG11201610302TA/en unknown
- 2015-06-23 KR KR1020167036467A patent/KR101960152B1/ko active Active
- 2015-06-23 AU AU2015281506A patent/AU2015281506B2/en active Active
- 2015-06-23 DK DK18167140.5T patent/DK3460794T3/da active
- 2015-06-23 MX MX2016016564A patent/MX361248B/es active IP Right Grant
- 2015-06-23 JP JP2016574980A patent/JP6426211B2/ja active Active
- 2015-06-23 CA CA2951593A patent/CA2951593C/en active Active
- 2015-06-23 EP EP15811228.4A patent/EP3144933B1/en active Active
-
2016
- 2016-12-21 US US15/386,246 patent/US9761239B2/en active Active
-
2017
- 2017-08-21 US US15/682,097 patent/US10347267B2/en active Active
-
2018
- 2018-05-22 AU AU2018203619A patent/AU2018203619B2/en active Active
-
2019
- 2019-06-13 US US16/439,954 patent/US11074922B2/en active Active
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11074922B2 (en) | Hybrid encoding method and apparatus for encoding speech or non-speech frames using different coding algorithms | |
| US10600430B2 (en) | Signal decoding method, audio signal decoder and non-transitory computer-readable medium | |
| JP6351783B2 (ja) | オーディオ信号のビットを割り当てる方法及び装置 | |
| EP3525206B1 (en) | Encoding method and apparatus | |
| US10134402B2 (en) | Signal processing method and apparatus | |
| RU2702265C1 (ru) | Способ и устройство обработки сигналов | |
| CN105431902B (zh) | 用于音频信号包络编码、处理和解码的装置和方法 | |
| HK1241133A1 (zh) | 音頻編碼方法和裝置 | |
| HK1241133A (en) | Audio coding method and apparatus | |
| HK1220542B (en) | Audio coding method and apparatus | |
| HK1241133B (zh) | 音频编码方法和装置 | |
| HK1197112A1 (en) | Method and device for bit distribution of audio signal | |
| HK1197112B (en) | Method and device for bit distribution of audio signal |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170127 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170127 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180313 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20180613 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180615 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180925 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181024 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6426211 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
