JP6334564B2 - 低複雑度の調性適応音声信号量子化 - Google Patents
低複雑度の調性適応音声信号量子化 Download PDFInfo
- Publication number
- JP6334564B2 JP6334564B2 JP2015554196A JP2015554196A JP6334564B2 JP 6334564 B2 JP6334564 B2 JP 6334564B2 JP 2015554196 A JP2015554196 A JP 2015554196A JP 2015554196 A JP2015554196 A JP 2015554196A JP 6334564 B2 JP6334564 B2 JP 6334564B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- frame
- spectral line
- spectrum
- spectral
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/02—Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
- G10H1/06—Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/45—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/555—Tonality processing, involving the key in which a musical piece or melody is played
- G10H2210/561—Changing the tonality within a musical piece
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
前記音声信号からフレームを抽出するように構成されたフレーム化装置と、
前記音声信号のフレームから導出したスペクトル信号のスペクトル線を量子化インデックスにマッピングするように構成された量子化器と、を備え、前記量子化器は、前記スペクトル線が量子化インデックス・ゼロに対してマッピングされた不感帯を有し、前記音声エンコーダは更に、
前記不感帯を変更するように構成された制御装置、を備え、
前記制御装置は、少なくとも1つのスペクトル線又は少なくとも1つのスペクトル線群についての少なくとも1つの調性表示値を算出するように構成された調性算出装置を含み、
前記制御装置は、それぞれの前記調性表示値に応じて、前記少なくとも1つのスペクトル線又は前記少なくとも1つのスペクトル線群についての不感帯を変更するように構成される、音声エンコーダを提供する。
・補足的な情報を必要としないため、既存のメディアコーデックにおいて使用可能であり、
・ビン又は帯域ごとにどの不感帯を用いるべきかを量子化に先立ち決定することで複雑度を減らし、
・帯域周波数及び/又は信号調性に基づいてビン又は帯域ごとの不感帯を決定することができるものを開示する。
前記音声信号からフレームを抽出するステップと、
前記音声信号のフレームから導出したスペクトル信号のスペクトル線を量子化インデックスにマッピングするステップと、を備え、前記入力スペクトル線がゼロに対してマッピングされた不感帯が用いられ、前記方法は更に、
前記不感帯を変更するステップ、を備え、
少なくとも1つのスペクトル線又は少なくとも1つのスペクトル線群についての少なくとも1つの調性表示値が算出され、
それぞれの前記調性表示値に応じて、前記少なくとも1つのスペクトル線又は前記少なくとも1つのスペクトル線群についての不感帯が変更される、方法を提供する。
音声信号ASからフレームFを抽出するように構成されたフレーム化装置2と、
音声信号ASのフレームFから導出したスペクトル信号SPSのスペクトル線SL1−32(図2を参照)を量子化インデックスI0,I1にマッピングするように構成された量子化器3と、を備え、量子化器3は、スペクトル線SL1−32が量子化インデックス・ゼロI0に対してマッピングされた不感帯DZ(図2を参照)を有し、当該音声エンコーダは更に、
不感帯DZを変更するように構成された制御装置4、を備え、
制御装置4は、少なくとも1つのスペクトル線SL1−32又は少なくとも1つのスペクトル線SL1−32群についての少なくとも1つの調性表示値TI5−32を算出するように構成された調性算出装置5を含み、
制御装置4は、それぞれの調性表示値TI5−32に応じて、少なくとも1つのスペクトル線SL1−32又は少なくとも1つのスペクトル線SL1−32群についての不感帯DZを変更するように構成される。
・補足的な情報を必要としないため、既存のメディアコーデックにおいて使用可能であり、
・ビン又は帯域ごとにどの不感帯DZを用いるべきかを量子化に先立ち決定することで複雑度を減らし、
・帯域周波数及び/又は信号調性に基づいてビン又は帯域ごとの不感帯DZを決定することができるものを開示する。
1 音声エンコーダ
2 フレーム化装置
3 量子化器
4 制御装置
5 調性算出装置
6 パワースペクトル算出装置
7 開始周波数算出装置
8 変更後離散余弦変換算出装置
9 変更後離散正弦変換算出装置
10 スペクトル信号算出装置
11 振幅設定装置
12 正規化装置
AS 音声信号
ES 符号化信号
F フレーム
SL1−32 スペクトル線
SPS スペクトル信号
I インデックス
DZ 不感帯
TI5−32 調性表示値
PS パワースペクトル
PS5−32 パワー値
SF 開始周波数
CT 変更後離散余弦変換
ST 変更後離散正弦変換
Claims (16)
- 音声信号(AS)を符号化して符号化信号(ES)を生成するための音声エンコーダであって、前記音声エンコーダ(1)は、
前記音声信号(AS)からフレーム(F)を抽出するように構成されたフレーム化装置(2)と、
前記音声信号(AS)のフレーム(F)から導出したスペクトル信号(SPS)のスペクトル線(SL1−32)を量子化インデックス(I0,I1)にマッピングするように構成された量子化器(3)と、を備え、前記量子化器(3)は、前記スペクトル線(SL1−32)が量子化インデックス・ゼロ(I0)に対してマッピングされた不感帯(DZ)を有し、前記音声エンコーダ(1)は更に、
前記不感帯(DZ)を変更するように構成された制御装置(4)、を備え、
前記制御装置(4)は、少なくとも1つのスペクトル線(SL1−32)又は少なくとも1つのスペクトル線(SL1−32)群についての少なくとも1つの調性表示値(TI5−32)を算出するように構成された調性算出装置(5)を含み、
前記制御装置(4)は、それぞれの前記調性表示値(TI5−32)に応じて、前記少なくとも1つのスペクトル線(SL1−32)又は前記少なくとも1つのスペクトル線(SL1−32)群についての不感帯(DZ)を変更するように構成され、
前記音声エンコーダ(1)は、前記不感帯(DZ)を変更するための開始周波数(SF)を算出するように構成された開始周波数算出装置(7)を含み、前記不感帯(DZ)は、前記開始周波数(SF)以上の周波数を表すスペクトル線(SL)についてのみ変更される、音声エンコーダ。 - 請求項1に記載の音声エンコーダであって、前記制御装置(4)は、前記スペクトル線(SL1−32)の1つにおける不感帯(DZ)が、より大きな調性を有するスペクトル線(SL1−32)の1つにおける不感帯(DZ)よりも大きくなるように、又は、前記スペクトル線(SL1−32)群の1つにおける前記不感帯(DZ)が、より大きな調性を有するスペクトル線(SL1−32)群の1つにおける不感帯(DZ)よりも大きくなるように、前記不感帯(DZ)を変更するように構成される、音声エンコーダ。
- 請求項1または請求項2に記載の音声エンコーダであって、前記制御装置(4)は、前記音声信号(AS)のフレーム(F)のパワースペクトル(PS)を算出するように構成されたパワースペクトル算出装置(6)を含み、前記パワースペクトル(PS)は、スペクトル線(SL1−32)又はスペクトル線(SL1−32)群についてのパワー値(PS5−32)を含み、前記調性算出装置(5)は、前記パワースペクトル(PS)に応じて前記少なくとも1つの調性表示値(TI5−32)を算出するように構成される、音声エンコーダ。
- 請求項3に記載の音声エンコーダであって、前記スペクトル線(SL1−32)の1つについての調性表示値(TI5−32)は、それぞれの前記スペクトル線(SL1−32)についての前記パワー値(PS5−32)と、前記パワースペクトル(PS)における、予め規定された数の周辺パワー値(PS5−32)の合計との比較に基づいており、又は、前記スペクトル線(SL1−32)群の1つについての調性表示値(TI5−32)は、それぞれの前記スペクトル線(SL1−32)群についての前記パワー値(PS5−32)と、前記パワースペクトル(PS)における、予め規定された数の周辺パワー値(PS5−32)の合計との比較に基づいている、音声エンコーダ。
- 請求項1から請求項4のいずれかに記載の音声エンコーダであって、前記スペクトル線(SL1−32)の1つについての調性表示値(TI5−32)は、前記音声信号(AS)の先行フレーム(F)のスペクトル線の調性表示値(TI5−32)に基づき、又は、前記スペクトル線(SL1−32)群の1つについての調性表示値(TI5−32)は、前記音声信号(AS)の先行フレーム(F)についてのスペクトル線(SL1−32)群の調性表示値(TI5−32)に基づく、音声エンコーダ。
- 請求項3から請求項5のいずれかに記載の音声エンコーダであって、前記調性表示値(TI5−32)は、以下の式によって計算され、
ここで、iは、前記音声信号(AS)の特定のフレーム(F)を示すインデックスであり、kは、特定のスペクトル線を示すインデックスであり、Tk,iは、i番目のフレーム(F)のk番目のスペクトル線の調性表示値(TI5−32)であり、Pk,iは、i番目のフレーム(F)のk番目のスペクトル線のパワー値(PS5−32)であり、又は、前記調性表示値(TI5−32)は、以下の式によって計算され、
ここで、iは、前記音声信号(AS)の特定のフレーム(F)を示すインデックスであり、mは、特定のスペクトル線(SL1−32)群を示すインデックスであり、Pm,iは、i番目のフレームのm番目のスペクトル線(SL1−32)群のパワー値である、音声エンコーダ。 - 請求項1から請求項6のいずれかに記載の音声エンコーダであって、前記開始周波数算出装置(7)は、前記音声信号(AS)のサンプルレートに基づき、且つ/又は、前記符号化信号(ES)から生成されたビットストリームについて予想される最大ビットレートに基づき、前記開始周波数(SF)を算出するように構成される、音声エンコーダ。
- 請求項3に記載の音声エンコーダであって、前記音声エンコーダ(1)は、前記音声信号(AS)のフレーム(F)から変更後離散余弦変換(CT)を算出するように構成された変更後離散余弦変換算出装置(8)と、前記音声信号(AS)のフレーム(F)から変更後離散正弦変換(ST)を算出するように構成された変更後離散正弦変換算出装置(9)と、を含み、前記パワースペクトル算出装置(6)は、前記変更後離散余弦変換(CT)及び前記変更後離散正弦変換(ST)に基づき前記パワースペクトル(PS)を算出するように構成される、音声エンコーダ。
- 請求項3に記載の音声エンコーダであって、前記パワースペクトル算出装置(6)は、Pk,i=(MDCTk,i)2+(MDSTk,i)2の式によって前記パワー値(PS5−32)を算出するように構成され、ここで、iは、前記音声信号の特定のフレームを示すインデックスであり、kは、特定のスペクトル線を示すインデックスであり、MDCTk,iは、i番目のフレームのk番目のスペクトル線における変更後離散余弦変換(CT)の値であり、MDSTk,iは、i番目のフレームのk番目のスペクトル線における変更後離散正弦変換(ST)の値であり、Pk,iは、i番目のフレームのk番目のスペクトル線のパワー値(PS5−32)である、音声エンコーダ。
- 請求項1または請求項2に記載の音声エンコーダであって、前記音声エンコーダ(1)は、前記スペクトル信号(SPS)を生成するように構成されたスペクトル信号算出装置(10)を含み、前記スペクトル信号算出装置(10)は、前記不感帯(DZ)の変更によるエネルギーの損失を補償するように前記スペクトル信号(SPS)のスペクトル線(SL1−32)の振幅を設定するように構成された振幅設定装置(11)を含む、音声エンコーダ。
- 請求項10に記載の音声エンコーダであって、前記振幅設定装置(11)は、それぞれの前記スペクトル線における不感帯(DZ)の変更に応じて前記スペクトル信号(SPS)の振幅を設定するように構成される、音声エンコーダ。
- 請求項10又は請求項11に記載の音声エンコーダであって、前記スペクトル信号算出装置(10)は、正規化装置(12)を含む、音声エンコーダ。
- 請求項10から請求項12のいずれかに記載の音声エンコーダであって、前記制御装置(4)は、前記音声信号(AS)のフレーム(F)のパワースペクトル(PS)を算出するように構成されたパワースペクトル算出装置(6)を含み、前記パワースペクトル(PS)は、スペクトル線(SL 1−32 )又はスペクトル線(SL 1−32 )群についてのパワー値(PS 5−32 )を含み、前記調性算出装置(5)は、前記パワースペクトル(PS)に応じて前記少なくとも1つの調性表示値(TI 5−32 )を算出するように構成され、前記音声エンコーダ(1)は、前記音声信号(AS)のフレーム(F)から変更後離散余弦変換(CT)を算出するように構成された変更後離散余弦変換算出装置(8)と、前記音声信号(AS)のフレーム(F)から変更後離散正弦変換(ST)を算出するように構成された変更後離散正弦変換算出装置(9)とを含み、前記パワースペクトル算出装置(6)は、前記変更後離散余弦変換(CT)及び前記変更後離散正弦変換(ST)に基づき前記パワースペクトル(PS)を算出するように構成され、前記変更後離散余弦変換算出装置(8)によって算出された前記音声信号(AS)のフレーム(F)からの変換後離散余弦変換(CT)は、前記スペクトル信号算出装置(10)に入力される、音声エンコーダ。
- エンコーダ(1)と、デコーダと、を備えるシステムであって、前記エンコーダ(1)は、請求項1から請求項13のいずれかに従って設計される、システム。
- 音声信号(AS)を符号化して符号化信号(ES)を生成するための方法であって、前記方法は、
前記音声信号(AS)からフレーム(F)を抽出するステップと、
前記音声信号(AS)のフレーム(F)から導出したスペクトル信号(SPS)のスペクトル線(SL1−32)を量子化インデックス(I0,I1)にマッピングするステップと、を備え、前記スペクトル線(SL1−32)が量子化インデックス・ゼロ(I0)に対してマッピングされた不感帯(DZ)が用いられ、前記方法は更に、
前記不感帯(DZ)を変更するステップ、を備え、
少なくとも1つのスペクトル線又は少なくとも1つのスペクトル線(SL1−32)群についての少なくとも1つの調性表示値(TI5−32)が算出され、
それぞれの前記調性表示値(TI5−32)に応じて、前記少なくとも1つのスペクトル線又は前記少なくとも1つのスペクトル線(SL1−32)群についての不感帯(DZ)が変更され、
前記不感帯(DZ)を変更するための開始周波数(SF)は、算出され、
前記不感帯(DZ)は、前記開始周波数(SF)以上の周波数を表すスペクトル線(SL)についてのみ変更される、方法。 - コンピュータ又はプロセッサにおいて実行された際に請求項15に記載の方法を実行するためのコンピュータプログラム。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201361758191P | 2013-01-29 | 2013-01-29 | |
| US61/758,191 | 2013-01-29 | ||
| PCT/EP2014/051624 WO2014118171A1 (en) | 2013-01-29 | 2014-01-28 | Low-complexity tonality-adaptive audio signal quantization |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017076101A Division JP6526091B2 (ja) | 2013-01-29 | 2017-04-06 | 低複雑度の調性適応音声信号量子化 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2016510426A JP2016510426A (ja) | 2016-04-07 |
| JP6334564B2 true JP6334564B2 (ja) | 2018-05-30 |
Family
ID=50023575
Family Applications (3)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2015554196A Active JP6334564B2 (ja) | 2013-01-29 | 2014-01-28 | 低複雑度の調性適応音声信号量子化 |
| JP2017076101A Active JP6526091B2 (ja) | 2013-01-29 | 2017-04-06 | 低複雑度の調性適応音声信号量子化 |
| JP2019087245A Active JP6979048B2 (ja) | 2013-01-29 | 2019-05-07 | 低複雑度の調性適応音声信号量子化 |
Family Applications After (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017076101A Active JP6526091B2 (ja) | 2013-01-29 | 2017-04-06 | 低複雑度の調性適応音声信号量子化 |
| JP2019087245A Active JP6979048B2 (ja) | 2013-01-29 | 2019-05-07 | 低複雑度の調性適応音声信号量子化 |
Country Status (19)
| Country | Link |
|---|---|
| US (3) | US10468043B2 (ja) |
| EP (1) | EP2939235B1 (ja) |
| JP (3) | JP6334564B2 (ja) |
| KR (1) | KR101757341B1 (ja) |
| CN (2) | CN105103226B (ja) |
| AR (1) | AR095087A1 (ja) |
| AU (1) | AU2014211539B2 (ja) |
| BR (1) | BR112015018050B1 (ja) |
| CA (1) | CA2898789C (ja) |
| ES (1) | ES2613651T3 (ja) |
| MX (1) | MX346732B (ja) |
| MY (1) | MY172848A (ja) |
| PL (1) | PL2939235T3 (ja) |
| PT (1) | PT2939235T (ja) |
| RU (1) | RU2621003C2 (ja) |
| SG (1) | SG11201505922XA (ja) |
| TW (1) | TWI524331B (ja) |
| WO (1) | WO2014118171A1 (ja) |
| ZA (1) | ZA201506319B (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2017151454A (ja) * | 2013-01-29 | 2017-08-31 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | 低複雑度の調性適応音声信号量子化 |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP3396670B1 (en) * | 2017-04-28 | 2020-11-25 | Nxp B.V. | Speech signal processing |
| CN113539281B (zh) | 2020-04-21 | 2024-09-06 | 华为技术有限公司 | 音频信号编码方法和装置 |
| US11348594B2 (en) | 2020-06-11 | 2022-05-31 | Qualcomm Incorporated | Stream conformant bit error resilience |
| WO2022119304A1 (ko) * | 2020-12-01 | 2022-06-09 | 현대자동차주식회사 | 적응적 데드존 양자화를 이용하는 포인트 클라우드 코딩 장치 및 방법 |
| CN118395096B (zh) * | 2024-06-27 | 2024-09-17 | 江西飞尚科技有限公司 | 信号频率修正、装置、可读存储介质及电子设备 |
Family Cites Families (40)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2841765B2 (ja) * | 1990-07-13 | 1998-12-24 | 日本電気株式会社 | 適応ビット割当て方法及び装置 |
| TW224553B (en) * | 1993-03-01 | 1994-06-01 | Sony Co Ltd | Method and apparatus for inverse discrete consine transform and coding/decoding of moving picture |
| US5805770A (en) | 1993-11-04 | 1998-09-08 | Sony Corporation | Signal encoding apparatus, signal decoding apparatus, recording medium, and signal encoding method |
| US6167093A (en) * | 1994-08-16 | 2000-12-26 | Sony Corporation | Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission |
| DE19505435C1 (de) | 1995-02-17 | 1995-12-07 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Bestimmen der Tonalität eines Audiosignals |
| JP3308764B2 (ja) * | 1995-05-31 | 2002-07-29 | 日本電気株式会社 | 音声符号化装置 |
| DE19614108C1 (de) * | 1996-04-10 | 1997-10-23 | Fraunhofer Ges Forschung | Anordnung zur Vermessung der Koordinaten eines an einem Objekt angebrachten Retroreflektors |
| US5924064A (en) * | 1996-10-07 | 1999-07-13 | Picturetel Corporation | Variable length coding using a plurality of region bit allocation patterns |
| US6301304B1 (en) * | 1998-06-17 | 2001-10-09 | Lsi Logic Corporation | Architecture and method for inverse quantization of discrete cosine transform coefficients in MPEG decoders |
| CA2246532A1 (en) * | 1998-09-04 | 2000-03-04 | Northern Telecom Limited | Perceptual audio coding |
| DE10134471C2 (de) * | 2001-02-28 | 2003-05-22 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals |
| US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
| US7280700B2 (en) | 2002-07-05 | 2007-10-09 | Microsoft Corporation | Optimization techniques for data compression |
| US8090577B2 (en) * | 2002-08-08 | 2012-01-03 | Qualcomm Incorported | Bandwidth-adaptive quantization |
| US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
| JP3881943B2 (ja) * | 2002-09-06 | 2007-02-14 | 松下電器産業株式会社 | 音響符号化装置及び音響符号化方法 |
| US7318027B2 (en) * | 2003-02-06 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Conversion of synthesized spectral components for encoding and low-complexity transcoding |
| US7333930B2 (en) | 2003-03-14 | 2008-02-19 | Agere Systems Inc. | Tonal analysis for perceptual audio coding using a compressed spectral representation |
| US7738554B2 (en) * | 2003-07-18 | 2010-06-15 | Microsoft Corporation | DC coefficient signaling at small quantization step sizes |
| JP4168976B2 (ja) * | 2004-05-28 | 2008-10-22 | ソニー株式会社 | オーディオ信号符号化装置及び方法 |
| FR2882458A1 (fr) * | 2005-02-18 | 2006-08-25 | France Telecom | Procede de mesure de la gene due au bruit dans un signal audio |
| US7983922B2 (en) * | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
| US7995649B2 (en) * | 2006-04-07 | 2011-08-09 | Microsoft Corporation | Quantization adjustment based on texture level |
| US8059721B2 (en) * | 2006-04-07 | 2011-11-15 | Microsoft Corporation | Estimating sample-domain distortion in the transform domain with rounding compensation |
| US20080049950A1 (en) * | 2006-08-22 | 2008-02-28 | Poletti Mark A | Nonlinear Processor for Audio Signals |
| WO2008046492A1 (en) | 2006-10-20 | 2008-04-24 | Dolby Sweden Ab | Apparatus and method for encoding an information signal |
| JP5065687B2 (ja) | 2007-01-09 | 2012-11-07 | 株式会社東芝 | オーディオデータ処理装置及び端末装置 |
| US8498335B2 (en) * | 2007-03-26 | 2013-07-30 | Microsoft Corporation | Adaptive deadzone size adjustment in quantization |
| ATE518224T1 (de) * | 2008-01-04 | 2011-08-15 | Dolby Int Ab | Audiokodierer und -dekodierer |
| JP5262171B2 (ja) | 2008-02-19 | 2013-08-14 | 富士通株式会社 | 符号化装置、符号化方法および符号化プログラム |
| WO2010001020A2 (fr) * | 2008-06-06 | 2010-01-07 | France Telecom | Codage/decodage par plans de bits, perfectionne |
| EP2304719B1 (en) | 2008-07-11 | 2017-07-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, methods for providing an audio stream and computer program |
| JP4932917B2 (ja) | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
| JP5749710B2 (ja) * | 2009-05-16 | 2015-07-15 | トムソン ライセンシングThomson Licensing | 映像符号化及び復号化のための、改善された量子化の丸めのオフセットを調節する方法及び装置 |
| KR101698439B1 (ko) * | 2010-04-09 | 2017-01-20 | 돌비 인터네셔널 에이비 | Mdct-기반의 복소수 예측 스테레오 코딩 |
| CN103620676B (zh) | 2011-04-21 | 2016-03-09 | 三星电子株式会社 | 对线性预测编码系数进行量化的方法、声音编码方法、对线性预测编码系数进行反量化的方法、声音解码方法以及记录介质 |
| TWI473078B (zh) * | 2011-08-26 | 2015-02-11 | Univ Nat Central | 音訊處理方法以及裝置 |
| US8885706B2 (en) * | 2011-09-16 | 2014-11-11 | Google Inc. | Apparatus and methodology for a video codec system with noise reduction capability |
| CN105103226B (zh) | 2013-01-29 | 2019-04-16 | 弗劳恩霍夫应用研究促进协会 | 低复杂度音调自适应音频信号量化 |
| EP3483879A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
-
2014
- 2014-01-28 CN CN201480006396.9A patent/CN105103226B/zh active Active
- 2014-01-28 MX MX2015009753A patent/MX346732B/es active IP Right Grant
- 2014-01-28 EP EP14701558.0A patent/EP2939235B1/en active Active
- 2014-01-28 PL PL14701558T patent/PL2939235T3/pl unknown
- 2014-01-28 PT PT147015580T patent/PT2939235T/pt unknown
- 2014-01-28 WO PCT/EP2014/051624 patent/WO2014118171A1/en not_active Ceased
- 2014-01-28 ES ES14701558.0T patent/ES2613651T3/es active Active
- 2014-01-28 KR KR1020157022139A patent/KR101757341B1/ko active Active
- 2014-01-28 CA CA2898789A patent/CA2898789C/en active Active
- 2014-01-28 BR BR112015018050-7A patent/BR112015018050B1/pt active IP Right Grant
- 2014-01-28 MY MYPI2015001904A patent/MY172848A/en unknown
- 2014-01-28 AU AU2014211539A patent/AU2014211539B2/en active Active
- 2014-01-28 RU RU2015136242A patent/RU2621003C2/ru active
- 2014-01-28 SG SG11201505922XA patent/SG11201505922XA/en unknown
- 2014-01-28 CN CN201910203346.4A patent/CN110047499B/zh active Active
- 2014-01-28 JP JP2015554196A patent/JP6334564B2/ja active Active
- 2014-01-29 AR ARP140100300A patent/AR095087A1/es active IP Right Grant
- 2014-01-29 TW TW103103513A patent/TWI524331B/zh active
-
2015
- 2015-07-29 US US14/812,465 patent/US10468043B2/en active Active
- 2015-08-28 ZA ZA2015/06319A patent/ZA201506319B/en unknown
-
2017
- 2017-04-06 JP JP2017076101A patent/JP6526091B2/ja active Active
-
2019
- 2019-05-07 JP JP2019087245A patent/JP6979048B2/ja active Active
- 2019-09-25 US US16/583,119 patent/US11094332B2/en active Active
-
2021
- 2021-08-06 US US17/396,526 patent/US11694701B2/en active Active
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2017151454A (ja) * | 2013-01-29 | 2017-08-31 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | 低複雑度の調性適応音声信号量子化 |
| JP2019164367A (ja) * | 2013-01-29 | 2019-09-26 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | 低複雑度の調性適応音声信号量子化 |
| US10468043B2 (en) | 2013-01-29 | 2019-11-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Low-complexity tonality-adaptive audio signal quantization |
| US11094332B2 (en) | 2013-01-29 | 2021-08-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Low-complexity tonality-adaptive audio signal quantization |
| US11694701B2 (en) | 2013-01-29 | 2023-07-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Low-complexity tonality-adaptive audio signal quantization |
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6979048B2 (ja) | 低複雑度の調性適応音声信号量子化 | |
| AU2016231220B2 (en) | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal | |
| CN110047500B (zh) | 音频编码器、音频译码器及其方法 | |
| TW201521015A (zh) | 音訊信號頻譜之頻譜係數的編碼技術 | |
| HK1216263B (en) | Low-complexity tonality-adaptive audio signal quantization | |
| HK1244583B (en) | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal | |
| HK1218018B (en) | Low-frequency emphasis for lpc-based coding in frequency domain |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150918 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161011 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161018 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20170117 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20170314 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170410 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170926 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20171216 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180315 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180403 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180426 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6334564 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
