JP6574820B2 - 高周波帯域信号を予測するための方法、符号化デバイス、および復号デバイス - Google Patents
高周波帯域信号を予測するための方法、符号化デバイス、および復号デバイス Download PDFInfo
- Publication number
- JP6574820B2 JP6574820B2 JP2017165309A JP2017165309A JP6574820B2 JP 6574820 B2 JP6574820 B2 JP 6574820B2 JP 2017165309 A JP2017165309 A JP 2017165309A JP 2017165309 A JP2017165309 A JP 2017165309A JP 6574820 B2 JP6574820 B2 JP 6574820B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- frequency band
- band signal
- high frequency
- bin
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
復号すべき音声信号の信号タイプおよび音声信号の低周波帯域信号を取得するステップと、
信号タイプに従って音声信号の高周波帯域信号の周波数エンベロープを取得するステップと、
音声信号の低周波帯域信号に従って音声信号の高周波帯域信号の励振信号を予測するステップと、
高周波帯域信号の周波数エンベロープおよび高周波帯域信号の励振信号に従って音声信号の高周波帯域信号を復元するステップと
を含む、方法を提供する。
信号タイプが非調波信号である場合に、音声信号の高周波帯域信号の周波数エンベロープを取得するために音声信号の受領したビットストリームを復号するステップ、または
信号タイプが調波である場合に、音声信号の高周波帯域信号の初期周波数エンベロープを取得するために音声信号の受領したビットストリームを復号し、初期周波数エンベロープおよびN個の隣接する初期周波数エンベロープに加重計算を実施することによって取得される値を高周波帯域信号の周波数エンベロープとして使用するステップであって、Nは1以上である、ステップ
を含む。
高周波帯域信号の対応する周波数エンベロープを取得するために信号タイプに従って音声信号の受領したビットストリームを復号するステップであって、音声信号のビットストリームは、信号タイプと、高周波帯域信号の周波数エンベロープの符号化インデックスとを伝達する、ステップ
を含む。
信号タイプおよび低周波帯域信号を取得するために音声信号の受領したビットストリームを復号するステップであって、信号タイプは調波信号または非調波信号である、ステップ
を含む。
音声信号の低周波帯域信号を取得するために音声信号の受領したビットストリームを復号するステップと、
低周波帯域信号に従って信号タイプを決定するステップであって、信号タイプは調波信号または非調波信号である、ステップと
を含む。
低周波帯域信号のビットが割り当てられる最も高い周波数ビンを決定するステップと、
低周波帯域信号のビットが割り当てられる最も高い周波数ビンが高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン未満であるか否かを判定するステップと、
低周波帯域信号のビットが割り当てられる最も高い周波数ビンが、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン未満である場合に、所定の周波数帯域範囲内に含まれる、ならびに低周波帯域信号および高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン中の励振信号に従って高周波帯域信号の励振信号を予測するステップ、または
低周波帯域信号のビットが割り当てられる最も高い周波数ビンが、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン以上である場合に、所定の周波数帯域範囲内に含まれる、ならびに低周波帯域信号、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン、および低周波帯域信号のビットが割り当てられる最も高い周波数ビンの中の励振信号に従って高周波帯域信号の励振信号を予測するステップと
を含む。
所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号のn個のコピーを高周波帯域信号の帯域幅拡張のプリセット開始周波数ビンと帯域幅拡張周波数帯域の最も高い周波数ビンとの間の励振信号として使用するステップであって、nは、正の整数または正の小数であり、nは、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビンと帯域幅拡張周波数帯域の最も高い周波数ビンとの間の周波数ビンの量の、所定の周波数帯域範囲内の周波数ビンの量に対する比に等しい、ステップ
を含む。
所定の周波数帯域範囲の開始周波数ビンfexc_start超の第mの周波数ビンから所定の周波数帯域範囲の終了周波数ビンfexc_endまでの励振信号をコピーし、所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、励振信号の2つの部分を低周波帯域信号のビットが割り当てられる最も高い周波数ビンと帯域幅拡張周波数帯域の最も高い周波数ビンとの間の励振信号として使用するステップであって、nは、0、正の整数、または正の小数であり、mは、低周波帯域信号のビットが割り当てられる最も高い周波数ビンと拡張周波数帯域のプリセット開始周波数ビンとの間の周波数ビンの量の差である、ステップ
を含む。
音声信号の信号タイプおよび音声信号の低周波帯域信号を取得するステップと、
高周波帯域信号の周波数エンベロープの符号化インデックスを取得するために、信号タイプに従って音声信号の高周波帯域信号の周波数エンベロープを符号化するステップと、
信号タイプと低周波帯域信号の符号化インデックスおよび高周波帯域信号の周波数エンベロープの符号化インデックスとを伝達するビットストリームを復号デバイスに送るステップと
を含む、方法をさらに提供する。
信号タイプが非調波信号である場合に、第1の量のスペクトル係数を使用することによって高周波帯域信号の周波数エンベロープの符号化インデックスを計算するステップ、または
信号タイプが調波信号である場合に、第2の量のスペクトル係数を使用することによって高周波帯域信号の周波数エンベロープの符号化インデックスを計算するステップであって、第2の量は、第1の量よりも大きい、ステップ
を含む。
音声信号の信号タイプおよび音声信号の低周波帯域信号を取得するステップであって、信号タイプは調波信号または非調波信号であり、音声信号は低周波帯域信号および高周波帯域信号を含む、ステップと、
音声信号の高周波帯域信号の周波数エンベロープを計算するステップであって、同一量のスペクトル係数が、調波信号および非調波信号の高周波帯域信号の周波数エンベロープを計算するために使用される、ステップと、
信号タイプと低周波帯域信号の符号化インデックスおよび高周波帯域信号の周波数エンベロープの符号化インデックスとを伝達するビットストリームを復号デバイスに送るステップと
を含む、方法をさらに提供する。
復号すべき音声信号の信号タイプおよび音声信号の低周波帯域信号を取得するように構成された第1の取得モジュールと、
信号タイプに従って音声信号の高周波帯域信号の周波数エンベロープを取得するように構成された第2の取得モジュールと、
音声信号の低周波帯域信号に従って音声信号の高周波帯域信号の励振信号を予測するように構成された予測モジュールと、
高周波帯域信号の周波数エンベロープおよび高周波帯域信号の励振信号に従って音声信号の高周波帯域信号を復元するように構成された復元モジュールと
を備える、復号デバイスをさらに提供する。
低周波帯域信号のビットが割り当てられる最も高い周波数ビンを決定するように構成された決定ユニットと、
低周波帯域信号のビットが割り当てられる最も高い周波数ビンが高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン未満であるか否かを判定するように構成された判断ユニットと、
判断ユニットが、低周波帯域信号のビットが割り当てられる最も高い周波数ビンが高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン未満であると判定した場合に、所定の周波数帯域範囲内に含まれるならびに低周波帯域信号および高周波帯域信号の帯域幅拡張のプリセット開始周波数ビンの中の励振信号に従って高周波帯域信号の励振信号を予測するように構成された第1の処理ユニットと、
判断ユニットが、低周波帯域信号のビットが割り当てられる最も高い周波数ビンが高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン以上であると判定した場合に、所定の周波数帯域範囲内に含まれるならびに低周波帯域信号、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン、および低周波帯域信号のビンが割り当てられる最も高い周波数ビンの中の励振信号に従って高周波帯域信号の励振信号を予測するように構成された第2の処理ユニットと
を備える。
音声信号の信号タイプおよび音声信号の低周波帯域信号を取得するように構成された取得モジュールと、
高周波帯域信号の周波数エンベロープの符号化インデックスを取得するために、信号タイプに従って音声信号の高周波帯域信号の周波数エンベロープを符号化するように構成された符号化モジュールと、
信号タイプと低周波帯域信号の符号化インデックスおよび高周波帯域信号の周波数エンベロープの符号化インデックスとを伝達するビットストリームを復号デバイスに送るように構成された送りモジュールと
を備える、符号化デバイスをさらに提供する。
符号化モジュールは、具体的には、信号タイプが調波信号である場合に、第2の量のスペクトル係数を使用することによって高周波帯域信号の周波数エンベロープの符号化インデックスを計算するように構成され、第2の量は、第1の量よりも大きい。
音声信号の信号タイプおよび音声信号の低周波帯域信号を取得するように構成された取得モジュールであって、信号タイプは、調波信号または非調波信号であり、音声信号は、低周波帯域信号および高周波帯域信号を含む、取得モジュールと、
音声信号の高周波帯域信号の周波数エンベロープを計算するように構成された計算モジュールであって、同一量のスペクトル係数が、調波信号および非調波信号の高周波帯域信号の周波数エンベロープを計算するために使用される、計算モジュールと、
信号タイプと低周波帯域信号の符号化インデックスおよび高周波帯域信号の周波数エンベロープの符号化インデックスとを伝達するビットストリームを復号デバイスに送るように構成された送りモジュールと
を備える、符号化デバイスをさらに提供する。
本発明の実施形態における高周波帯域信号を予測するための方法およびシステム、符号化デバイス、ならびに復号デバイスによれば、異なるタイプの信号については、異なるスペクトル係数が、エンベロープを復号するために使用され、それによって低周波数に従って予測される高周波帯域調波信号の励振が、最初の調波特性を維持することが可能となり、それにより予測された高周波帯域信号の品質が改善され、音声信号の聴覚的品質が向上する。
(1)復号デバイスが、低周波帯域信号のビットが割り当てられる最も高い周波数ビンを決定する。
(2)復号デバイスは、低周波帯域信号のビットが割り当てられる最も高い周波数ビンが、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン未満であるか否かを判定する。低周波帯域信号のビットが割り当てられる最も高い周波数ビンが、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン未満である場合には、ステップ(3)が実施される。あるいは、低周波帯域信号のビットが割り当てられる最も高い周波数ビンが、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン以上である場合には、ステップ(4)が実施される。
(3)復号デバイスが、所定の周波数帯域範囲内に含まれる、ならびに低周波帯域信号と高周波帯域信号の帯域幅拡張のプリセット開始周波数ビンとの中の励振信号に従って、高周波帯域信号の励振信号を予測する。
(4)復号デバイスが、所定の周波数帯域範囲内に含まれる、ならびに低周波帯域信号、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビン、および低周波帯域信号のビットが割り当てられる最も高い周波数ビンの中の励振信号に従って、高周波帯域信号の励振信号を予測する。
所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、この励振信号のn個のコピーを、高周波帯域信号の帯域幅拡張のプリセット開始周波数ビンと帯域幅拡張周波数帯域の最も高い周波数ビンとの間の励振信号として使用する
ことを含む。
所定の周波数帯域範囲の開始周波数ビンfexc_startを超える第mの周波数ビンから所定の周波数帯域範囲の開始周波数ビンfexc_startまでの励振信号をコピーし、所定の周波数帯域範囲内の励振信号のn個のコピーを作製し、低周波帯域信号のビットが割り当てられる最も高い周波数ビンと帯域幅拡張周波数帯域の最も高い周波数ビンとの間の励振信号として励振信号の2つの部分を使用すること
を含む。
周波数ビン以上であると判定した場合には、復元モジュール33は、第2の処理ユニット324に接続される。復元モジュール33は、具体的には、高周波帯域信号のものであり第2の取得モジュール31により取得される周波数エンベロープと、高周波帯域信号のものであり第1の処理ユニット323または第2の処理ユニット324による予測によって取得される励振信号とに従って高周波帯域信号を復元するように構成される。
11 エンベロープ抽出モジュール
12 エンベロープ量子化/符号化モジュール
13 ビット割当てモジュール
14 励振発生モジュール
15 励振量子化/符号化モジュール
16 多重化モジュール
17 分類抽出/符号化モジュール
20 逆多重化モジュール
21 周波数エンベロープ復号モジュール
22 ビット割当て取得モジュール
23 励振信号復号モジュール
24 帯域幅拡張モジュール
25 周波数領域信号復元モジュール
26 周波数-時間変換モジュール
27 分類情報復号モジュール
30 第1の取得モジュール
31 第2の取得モジュール
32 予測モジュール
33 復元モジュール
321 決定ユニット
322 判断ユニット
323 第1の処理ユニット
324 第2の処理ユニット
40 取得モジュール
41 符号化モジュール
42 送りモジュール
50 取得モジュール
51 計算モジュール
52 送りモジュール
70 符号化デバイス
80 復号デバイス
90 装置
901 アンテナ
902 受信回路
903 復号プロセッサ
904 処理ユニット
905 メモリ
906 バスシステム
100 装置
1001 アンテナ
1002 受信回路
1003 符号化プロセッサ
1004 処理ユニット
1005 メモリ
1006 バスシステム
Claims (17)
- 高周波帯域信号を予測するための方法であって、
復号すべき音声信号の信号タイプおよび前記音声信号の低周波帯域信号を取得するステップであって、前記音声信号の高周波帯域信号の信号タイプは調波または非調波である、ステップと、
前記信号タイプに従って前記音声信号の高周波帯域信号の周波数エンベロープを取得するステップと、
前記音声信号の前記低周波帯域信号に従って前記音声信号の前記高周波帯域信号の励振信号を予測するステップと、
前記高周波帯域信号の前記周波数エンベロープおよび前記高周波帯域信号の前記励振信号に従って前記音声信号の前記高周波帯域信号を復元するステップと
を含み、
前記信号タイプが非調波である場合に、前記信号タイプに従って前記音声信号の高周波帯域信号の周波数エンベロープを取得する前記ステップは、
前記音声信号の前記高周波帯域信号の前記周波数エンベロープを取得するために前記音声信号の受領したビットストリームを復号するステップを含み、かつ
前記信号タイプが調波である場合に、前記信号タイプに従って前記音声信号の高周波帯域信号の周波数エンベロープを取得する前記ステップは、
前記音声信号の前記高周波帯域信号の初期周波数エンベロープを取得するために前記音声信号の受領したビットストリームを復号し、前記初期周波数エンベロープおよびN個の隣接する初期周波数エンベロープに加重計算を実施することによって取得される値を前記高周波帯域信号の前記周波数エンベロープとして使用するステップであって、Nは1以上である、ステップを含む、
方法。 - 復号すべき音声信号の信号タイプおよび前記音声信号の低周波帯域信号を取得する前記ステップは、
前記信号タイプおよび前記低周波帯域信号を取得するために前記音声信号の受領したビットストリームを復号するステップであって、前記信号タイプは、調波信号または非調波信号である、ステップ
を含む、請求項1に記載の方法。 - 復号すべき音声信号の信号タイプおよび前記音声信号の低周波帯域信号を取得する前記ステップは、
前記音声信号の前記低周波帯域信号を取得するために前記音声信号の受領したビットストリームを復号するステップと、
前記低周波帯域信号に従って前記信号タイプを決定するステップであって、前記信号タイプは調波信号または非調波信号である、ステップと
を含む、請求項1に記載の方法。 - 前記音声信号の前記低周波帯域信号に従って前記音声信号の前記高周波帯域信号の励振信号を予測する前記ステップは、
前記低周波帯域信号のビットが割り当てられる最も高い周波数ビンを決定するステップと、
前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンが前記高周波帯域信号の帯域幅拡張周波数帯域のプリセット開始周波数ビン未満であるか否かを判定するステップと、
前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンが、前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビン未満である場合に、所定の周波数帯域範囲内に含まれる、ならびに前記低周波帯域信号および前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビン中の励振信号に従って前記高周波帯域信号の前記励振信号を予測するステップ、または
前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンが、前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビン以上である場合に、所定の周波数帯域範囲内に含まれる、ならびに前記低周波帯域信号、前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビン、および前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンの中の励振信号に従って前記高周波帯域信号の前記励振信号を予測するステップと
を含む、請求項1から3のいずれか一項に記載の方法。 - 所定の周波数帯域範囲内に含まれる、ならびに前記低周波帯域信号および前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビンの中の励振信号に従って前記高周波帯域信号の前記励振信号を予測する前記ステップは、
前記所定の周波数帯域範囲内の前記励振信号のn個のコピーを作製し、前記励振信号の前記n個のコピーを前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビンと前記帯域幅拡張周波数帯域の最も高い周波数ビンとの間の励振信号として使用するステップであって、nは、正の整数または正の小数であり、nは、前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビンと前記帯域幅拡張周波数帯域の前記最も高い周波数ビンとの間の周波数ビンの量の、前記所定の周波数帯域範囲内の周波数ビンの量に対する比に等しい、ステップ
を含む、請求項4に記載の方法。 - 所定の周波数帯域範囲内に含まれる、ならびに前記低周波帯域信号、前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビン、および前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンの中の励振信号に従って前記高周波帯域信号の前記励振信号を予測する前記ステップは、
前記所定の周波数帯域範囲の開始周波数ビンfexc_start超の第mの周波数ビンから前記所定の周波数帯域範囲の終了周波数ビンfexc_endまでの励振信号をコピーし、前記所定の周波数帯域範囲内の前記励振信号のn個のコピーを作製し、前記励振信号の2つの部分を前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンと前記帯域幅拡張周波数帯域の最も高い周波数ビンとの間の励振信号として使用するステップであって、nは、0、正の整数、または正の小数であり、mは、前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンと前記拡張周波数帯域の前記プリセット開始周波数ビンとの間の周波数ビンの量である、ステップ
を含む、請求項4に記載の方法。 - 音声信号を符号化するための方法であって、
音声信号の信号タイプおよび前記音声信号の低周波帯域信号を取得するステップであって、前記音声信号の信号タイプは調波または非調波である、ステップと、
前記取得された信号タイプに従って前記音声信号の高周波帯域信号の周波数エンベロープを計算するステップであって、前記信号タイプが調波である場合に高周波帯域信号の周波数エンベロープを計算するためのスペクトル係数の量が、前記信号タイプが非調波である場合に高周波帯域信号の周波数エンベロープを計算するためのスペクトル係数の量とは異なる、ステップと、
高周波帯域信号の周波数エンベロープの符号化インデックスを取得するために、前記高周波帯域信号の前記周波数エンベロープを符号化するステップと、
前記取得された信号タイプと、前記低周波帯域信号の符号化インデックスおよび前記高周波帯域信号の前記周波数エンベロープの符号化インデックスとを伝達するビットストリームを送るステップと
を含む、方法。 - 前記音声信号の信号タイプが非調波である場合に、前記取得された信号タイプに従って前記音声信号の高周波帯域信号の周波数エンベロープを計算する前記ステップは、
第1の量のスペクトル係数を使用することによって前記高周波帯域信号の前記周波数エンベロープを計算するステップを含み、かつ
前記音声信号の信号タイプが調波である場合に、前記取得された信号タイプに従って前記音声信号の高周波帯域信号の周波数エンベロープを計算する前記ステップは、
第2の量のスペクトル係数を使用することによって前記高周波帯域信号の前記周波数エンベロープを計算するステップを含み、
前記第2の量は、前記第1の量よりも大きい、
請求項7に記載の方法。 - 復号すべき音声信号の信号タイプおよび前記音声信号の低周波帯域信号を取得するように構成された第1の取得モジュールであって、前記音声信号の高周波帯域信号の信号タイプは調波または非調波である、第1の取得モジュールと、
前記信号タイプに従って前記音声信号の高周波帯域信号の周波数エンベロープを取得するように構成された第2の取得モジュールと、
前記音声信号の前記低周波帯域信号に従って前記音声信号の前記高周波帯域信号の励振信号を予測するように構成された予測モジュールと、
前記高周波帯域信号の前記周波数エンベロープおよび前記高周波帯域信号の前記励振信号に従って前記音声信号の前記高周波帯域信号を復元するように構成された復元モジュールと
を備え、
前記音声信号の高周波帯域信号の信号タイプは、調波または非調波であり、
前記信号タイプが非調波である場合に、前記第2の取得モジュールは、具体的には、前記信号タイプが非調波信号である場合の前記高周波帯域信号の前記周波数エンベロープを取得するために前記音声信号の受領したビットストリームを復号するように構成され、かつ、
前記信号タイプが調波である場合に、前記第2の取得モジュールは、具体的には、前記信号タイプが調波信号である場合の前記高周波帯域信号の初期周波数エンベロープを取得するために前記音声信号の受領したビットストリームを復号し、前記初期周波数エンベロープおよびN個の隣接する初期周波数エンベロープに加重計算を実施することによって取得される値を前記高周波帯域信号の前記周波数エンベロープとして使用するように構成され、Nは、1以上である、復号デバイス。 - 前記第1の取得モジュールは、具体的には前記信号タイプおよび前記低周波帯域信号を取得するために前記音声信号の受領したビットストリームを復号するように構成され、前記信号タイプは、調波信号または非調波信号である、請求項9に記載のデバイス。
- 前記第1の取得モジュールは、具体的には、前記音声信号の前記低周波帯域信号を取得するために前記音声信号の受領したビットストリームを復号し、前記低周波帯域信号に従って前記信号タイプを決定するように構成され、前記信号タイプは、調波信号または非調波信号である、請求項9に記載のデバイス。
- 前記予測モジュールは、
前記低周波帯域信号のビットが割り当てられる最も高い周波数ビンを決定するように構成された決定ユニットと、
前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンが前記高周波帯域信号の帯域幅拡張周波数帯域のプリセット開始周波数ビン未満であるか否かを判定するように構成された判断ユニットと、
前記判断ユニットが、前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンが前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビン未満であると判定した場合に、所定の周波数帯域範囲内に含まれるならびに前記低周波帯域信号および前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビンの中の励振信号に従って前記高周波帯域信号の前記励振信号を予測するように構成された第1の処理ユニットと、
前記判断ユニットが、前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンが前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビン以上であると判定した場合に、所定の周波数帯域範囲内に含まれるならびに前記低周波帯域信号、前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビン、および前記低周波帯域信号のビンが割り当てられる前記最も高い周波数ビンの中の励振信号に従って前記高周波帯域信号の前記励振信号を予測するように構成された第2の処理ユニットと
を備える、請求項9から11のいずれか一項に記載のデバイス。 - 前記第1の処理ユニットは、具体的には、前記判断ユニットが、前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンが前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビン未満であると判定した場合に、前記所定の周波数帯域範囲内の前記励振信号のn個のコピーを作製し、前記励振信号の前記n個のコピーを、前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビンと前記帯域幅拡張周波数帯域の最も高い周波数ビンとの間の励振信号として使用するように構成され、nは、正の整数または正の小数であり、nは、前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビンと前記帯域幅拡張周波数帯域の前記最も高い周波数ビンとの間の周波数ビンの量の、前記所定の周波数帯域範囲内の周波数ビンの量に対する比に等しい、請求項12に記載のデバイス。
- 前記第2の処理ユニットは、具体的には、前記判断ユニットが、前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンが前記高周波帯域信号の前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビン以上であると判定した場合に、前記所定の周波数帯域範囲内の開始周波数ビンfexc_start超の第mの周波数ビンから前記所定の周波数帯域範囲の終了周波数ビンfexc_endまでの励振信号をコピーし、前記所定の周波数帯域範囲内の前記励振信号のn個のコピーを作製し、励振信号の2つの部分を前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンと前記帯域幅拡張周波数帯域の最も高い周波数ビンとの間の励振信号として使用するように構成され、nは、0、正の整数、または正の小数であり、mは、前記低周波帯域信号のビットが割り当てられる前記最も高い周波数ビンと前記帯域幅拡張周波数帯域の前記プリセット開始周波数ビンとの間の周波数ビンの量である、請求項12に記載のデバイス。
- 音声信号の信号タイプおよび前記音声信号の低周波帯域信号を取得するように構成された取得モジュールであって、前記音声信号の信号タイプは調波または非調波である、取得モジュールと、
前記取得された信号タイプに従って前記音声信号の高周波帯域信号の周波数エンベロープを計算して、高周波帯域信号の周波数エンベロープの符号化インデックスを取得するために、前記高周波帯域信号の前記周波数エンベロープを符号化するように構成された符号化モジュールであって、前記信号タイプが調波である場合に高周波帯域信号の周波数エンベロープを計算するためのスペクトル係数の量が、前記信号タイプが非調波である場合に高周波帯域信号の周波数エンベロープを計算するためのスペクトル係数の量とは異なる、符号化モジュールと、
前記取得された信号タイプと、前記低周波帯域信号の符号化インデックスおよび前記高周波帯域信号の前記周波数エンベロープの符号化インデックスとを伝達するビットストリームを送るように構成された送りモジュールと
を備える、符号化デバイス。 - 前記音声信号の信号タイプが非調波である場合に、前記符号化モジュールは、具体的には、第1の量のスペクトル係数を使用することによって前記高周波帯域信号の前記周波数エンベロープを計算するように構成され、かつ
前記音声信号の信号タイプが調波である場合に、前記符号化モジュールは、具体的には、第2の量のスペクトル係数を使用することによって前記高周波帯域信号の前記周波数エンベロープを計算するように構成され、
前記第2の量は、前記第1の量よりも大きい、
請求項15に記載のデバイス。 - コンピュータプログラムが記録されたコンピュータ読み出し可能な記録媒体であって、前記コンピュータプログラムは、請求項1から7のいずれか一項に記載の方法をコンピュータに実行させるものである、記録媒体。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201310033625.3 | 2013-01-29 | ||
| CN201310033625.3A CN103971693B (zh) | 2013-01-29 | 2013-01-29 | 高频带信号的预测方法、编/解码设备 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2015555543A Division JP6204501B2 (ja) | 2013-01-29 | 2013-05-29 | 高周波帯域信号を予測するための方法、符号化デバイス、および復号デバイス |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2017223987A JP2017223987A (ja) | 2017-12-21 |
| JP6574820B2 true JP6574820B2 (ja) | 2019-09-11 |
Family
ID=51241109
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2015555543A Active JP6204501B2 (ja) | 2013-01-29 | 2013-05-29 | 高周波帯域信号を予測するための方法、符号化デバイス、および復号デバイス |
| JP2017165309A Active JP6574820B2 (ja) | 2013-01-29 | 2017-08-30 | 高周波帯域信号を予測するための方法、符号化デバイス、および復号デバイス |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2015555543A Active JP6204501B2 (ja) | 2013-01-29 | 2013-05-29 | 高周波帯域信号を予測するための方法、符号化デバイス、および復号デバイス |
Country Status (9)
| Country | Link |
|---|---|
| US (3) | US9704500B2 (ja) |
| EP (2) | EP3779980A3 (ja) |
| JP (2) | JP6204501B2 (ja) |
| KR (3) | KR20150108421A (ja) |
| CN (2) | CN103971693B (ja) |
| BR (1) | BR112015018064B1 (ja) |
| ES (1) | ES2822607T3 (ja) |
| SG (1) | SG11201505885YA (ja) |
| WO (1) | WO2014117458A1 (ja) |
Families Citing this family (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN103971693B (zh) * | 2013-01-29 | 2017-02-22 | 华为技术有限公司 | 高频带信号的预测方法、编/解码设备 |
| AU2014360038B2 (en) | 2013-12-02 | 2017-11-02 | Huawei Technologies Co., Ltd. | Encoding method and apparatus |
| KR102653849B1 (ko) * | 2014-03-24 | 2024-04-02 | 삼성전자주식회사 | 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치 |
| US10839814B2 (en) * | 2017-10-05 | 2020-11-17 | Qualcomm Incorporated | Encoding or decoding of audio signals |
| JP7061587B2 (ja) | 2019-04-05 | 2022-04-28 | Ckd株式会社 | 流体制御弁 |
| US10978083B1 (en) * | 2019-11-13 | 2021-04-13 | Shure Acquisition Holdings, Inc. | Time domain spectral bandwidth replication |
| CN113192521B (zh) * | 2020-01-13 | 2024-07-05 | 华为技术有限公司 | 一种音频编解码方法和音频编解码设备 |
| CN112767954B (zh) | 2020-06-24 | 2024-06-14 | 腾讯科技(深圳)有限公司 | 音频编解码方法、装置、介质及电子设备 |
| CN113948094B (zh) * | 2020-07-16 | 2026-01-02 | 华为技术有限公司 | 音频编解码方法和相关装置及计算机可读存储介质 |
| CN114333861B (zh) * | 2021-11-18 | 2025-07-11 | 腾讯科技(深圳)有限公司 | 音频处理方法、装置、存储介质、设备及产品 |
| CN114582361B (zh) * | 2022-04-29 | 2022-07-08 | 北京百瑞互联技术有限公司 | 基于生成对抗网络的高解析度音频编解码方法及系统 |
| CN118215959B (zh) * | 2022-09-05 | 2025-05-13 | 北京小米移动软件有限公司 | 一种音频信号频带扩展方法、装置、设备及存储介质 |
| CN120165684B (zh) * | 2025-05-19 | 2025-08-12 | 兆易创新科技集团股份有限公司 | 展频小数分频控制电路、小数分频锁相环和芯片 |
Family Cites Families (31)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3751225B2 (ja) * | 2001-06-14 | 2006-03-01 | 松下電器産業株式会社 | オーディオ帯域拡張装置 |
| JP2003044098A (ja) | 2001-07-26 | 2003-02-14 | Nec Corp | 音声帯域拡張装置及び音声帯域拡張方法 |
| US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
| US8260611B2 (en) | 2005-04-01 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for highband excitation generation |
| UA94041C2 (ru) * | 2005-04-01 | 2011-04-11 | Квелкомм Инкорпорейтед | Способ и устройство для фильтрации, устраняющей разреженность |
| KR100770839B1 (ko) * | 2006-04-04 | 2007-10-26 | 삼성전자주식회사 | 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치 |
| KR20070115637A (ko) | 2006-06-03 | 2007-12-06 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
| US20080109215A1 (en) * | 2006-06-26 | 2008-05-08 | Chi-Min Liu | High frequency reconstruction by linear extrapolation |
| CN101140759B (zh) | 2006-09-08 | 2010-05-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及系统 |
| DK2571024T3 (en) * | 2007-08-27 | 2015-01-05 | Ericsson Telefon Ab L M | Adaptive transition frequency between the noise filling and bandwidth extension |
| KR100970446B1 (ko) | 2007-11-21 | 2010-07-16 | 한국전자통신연구원 | 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법 |
| WO2009078681A1 (en) * | 2007-12-18 | 2009-06-25 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
| US8423371B2 (en) | 2007-12-21 | 2013-04-16 | Panasonic Corporation | Audio encoder, decoder, and encoding method thereof |
| DE102008015702B4 (de) * | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
| CN101751926B (zh) * | 2008-12-10 | 2012-07-04 | 华为技术有限公司 | 信号编码、解码方法及装置、编解码系统 |
| CN101763856B (zh) * | 2008-12-23 | 2011-11-02 | 华为技术有限公司 | 信号分类处理方法、分类处理装置及编码系统 |
| CN101770775B (zh) * | 2008-12-31 | 2011-06-22 | 华为技术有限公司 | 信号处理方法及装置 |
| US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
| EP2239732A1 (en) * | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
| CN101521014B (zh) * | 2009-04-08 | 2011-09-14 | 武汉大学 | 音频带宽扩展编解码装置 |
| WO2011048820A1 (ja) | 2009-10-23 | 2011-04-28 | パナソニック株式会社 | 符号化装置、復号装置およびこれらの方法 |
| CN102044250B (zh) * | 2009-10-23 | 2012-06-27 | 华为技术有限公司 | 频带扩展方法及装置 |
| CA3107943C (en) * | 2010-01-19 | 2022-09-06 | Dolby International Ab | Improved subband block based harmonic transposition |
| CN101964189B (zh) * | 2010-04-28 | 2012-08-08 | 华为技术有限公司 | 语音频信号切换方法及装置 |
| KR101826331B1 (ko) * | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
| CN102436820B (zh) * | 2010-09-29 | 2013-08-28 | 华为技术有限公司 | 高频带信号编码方法及装置、高频带信号解码方法及装置 |
| AU2012217162B2 (en) * | 2011-02-14 | 2015-11-26 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Noise generation in audio codecs |
| CN102800317B (zh) * | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
| CN103971693B (zh) * | 2013-01-29 | 2017-02-22 | 华为技术有限公司 | 高频带信号的预测方法、编/解码设备 |
| CN103971694B (zh) * | 2013-01-29 | 2016-12-28 | 华为技术有限公司 | 带宽扩展频带信号的预测方法、解码设备 |
| ES2836194T3 (es) * | 2013-06-11 | 2021-06-24 | Fraunhofer Ges Forschung | Dispositivo y procedimiento para la extensión de ancho de banda para señales acústicas |
-
2013
- 2013-01-29 CN CN201310033625.3A patent/CN103971693B/zh active Active
- 2013-01-29 CN CN201710076995.3A patent/CN106847297B/zh active Active
- 2013-05-29 EP EP20179865.9A patent/EP3779980A3/en active Pending
- 2013-05-29 WO PCT/CN2013/076408 patent/WO2014117458A1/zh not_active Ceased
- 2013-05-29 KR KR1020157022814A patent/KR20150108421A/ko not_active Ceased
- 2013-05-29 KR KR1020177009587A patent/KR101837191B1/ko active Active
- 2013-05-29 EP EP13873224.3A patent/EP2937861B1/en active Active
- 2013-05-29 KR KR1020187006404A patent/KR101980057B1/ko active Active
- 2013-05-29 BR BR112015018064-7A patent/BR112015018064B1/pt active IP Right Grant
- 2013-05-29 ES ES13873224T patent/ES2822607T3/es active Active
- 2013-05-29 SG SG11201505885YA patent/SG11201505885YA/en unknown
- 2013-05-29 JP JP2015555543A patent/JP6204501B2/ja active Active
-
2015
- 2015-07-24 US US14/808,145 patent/US9704500B2/en active Active
-
2017
- 2017-06-06 US US15/615,810 patent/US10089997B2/en active Active
- 2017-08-30 JP JP2017165309A patent/JP6574820B2/ja active Active
-
2018
- 2018-08-21 US US16/106,700 patent/US10636432B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2016509256A (ja) | 2016-03-24 |
| HK1199540A1 (en) | 2015-07-03 |
| ES2822607T3 (es) | 2021-05-04 |
| KR20180026812A (ko) | 2018-03-13 |
| KR101980057B1 (ko) | 2019-05-17 |
| US20180366134A1 (en) | 2018-12-20 |
| US10089997B2 (en) | 2018-10-02 |
| KR20150108421A (ko) | 2015-09-25 |
| EP3779980A3 (en) | 2021-07-07 |
| CN103971693B (zh) | 2017-02-22 |
| JP2017223987A (ja) | 2017-12-21 |
| US10636432B2 (en) | 2020-04-28 |
| US9704500B2 (en) | 2017-07-11 |
| EP2937861A1 (en) | 2015-10-28 |
| KR101837191B1 (ko) | 2018-03-09 |
| US20150332699A1 (en) | 2015-11-19 |
| US20170270944A1 (en) | 2017-09-21 |
| JP6204501B2 (ja) | 2017-09-27 |
| EP2937861A4 (en) | 2016-08-03 |
| EP2937861B1 (en) | 2020-08-12 |
| BR112015018064A2 (pt) | 2017-07-18 |
| SG11201505885YA (en) | 2015-09-29 |
| CN106847297B (zh) | 2020-07-07 |
| BR112015018064B1 (pt) | 2020-12-01 |
| KR20170043665A (ko) | 2017-04-21 |
| EP3779980A2 (en) | 2021-02-17 |
| CN106847297A (zh) | 2017-06-13 |
| WO2014117458A1 (zh) | 2014-08-07 |
| CN103971693A (zh) | 2014-08-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6574820B2 (ja) | 高周波帯域信号を予測するための方法、符号化デバイス、および復号デバイス | |
| JP6202545B2 (ja) | 帯域幅拡張周波数帯域信号を予測する方法、および復号デバイス | |
| CN106409299B (zh) | 信号编码和解码的方法和设备 | |
| HK40110896A (en) | Method for predicting bandwith extension frequency band signal, and decoding device | |
| HK1199540B (en) | Forecasting method for high-frequency band signal, encoding device and decoding device |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170928 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170928 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181119 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190218 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190722 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190819 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6574820 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |