JPH0430200A - 音声復号化方法 - Google Patents
音声復号化方法Info
- Publication number
- JPH0430200A JPH0430200A JP2135273A JP13527390A JPH0430200A JP H0430200 A JPH0430200 A JP H0430200A JP 2135273 A JP2135273 A JP 2135273A JP 13527390 A JP13527390 A JP 13527390A JP H0430200 A JPH0430200 A JP H0430200A
- Authority
- JP
- Japan
- Prior art keywords
- error
- parameters
- audio
- signal
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005540 biological transmission Effects 0.000 claims abstract description 16
- 238000000034 method Methods 0.000 claims description 21
- 230000005236 sound signal Effects 0.000 claims description 14
- 230000015572 biosynthetic process Effects 0.000 abstract description 11
- 238000003786 synthesis reaction Methods 0.000 abstract description 11
- 230000003044 adaptive effect Effects 0.000 abstract description 6
- 238000001514 detection method Methods 0.000 abstract description 6
- 238000004364 calculation method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0012—Smoothing of parameters of the decoder interpolation
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野]
本発明は、音声信号を無線伝送路などの誤りの多い伝送
路を通して良好に伝送、復号化するための音声復号化方
式に関する。
路を通して良好に伝送、復号化するための音声復号化方
式に関する。
音声信号を8〜4.8kb/s程度の低いビットレート
で符号化する方式としては、例えば、M、5chroe
derand B、Ata1氏による“Code−ex
cited 1inear prediction;
High quality 5peech at ve
ry l0GI bitrates” (Proc、
ICASSP、 pp、937−940.1985年)
と題した論文(文献1)等に記載されているCELP(
Code Excited LPCCoding)が知
られている。この方法では、送信側では、フレーム毎(
例えば20ss)に音声信号から音声信号のスペクトル
特性を表すスペクトルパラメータを抽出し、フレームを
さらに小区間サブフレーム(例えば51IIS)に分割
し、サブフレーム毎に過去の音源信号をもとに長時間相
関(ピッチ相関)を表すピッチパラメータを抽出し、ピ
ッチパラメータによりサブフレームの音声信号を長期予
測し、長期予測して求めた残差信号に対して、予め定め
られた種類の雑音信号からなるコードブックから選択し
た信号により合成した信号と、音声信号との誤差電力を
最小化するように一種類の雑音信号を選択するとともに
、最適なゲインを計算する。そして選択された雑音信号
の種類を表すインデクスとゲイン、ならびに、スペクト
ルパラメータとピッチパラメータを伝送する。
で符号化する方式としては、例えば、M、5chroe
derand B、Ata1氏による“Code−ex
cited 1inear prediction;
High quality 5peech at ve
ry l0GI bitrates” (Proc、
ICASSP、 pp、937−940.1985年)
と題した論文(文献1)等に記載されているCELP(
Code Excited LPCCoding)が知
られている。この方法では、送信側では、フレーム毎(
例えば20ss)に音声信号から音声信号のスペクトル
特性を表すスペクトルパラメータを抽出し、フレームを
さらに小区間サブフレーム(例えば51IIS)に分割
し、サブフレーム毎に過去の音源信号をもとに長時間相
関(ピッチ相関)を表すピッチパラメータを抽出し、ピ
ッチパラメータによりサブフレームの音声信号を長期予
測し、長期予測して求めた残差信号に対して、予め定め
られた種類の雑音信号からなるコードブックから選択し
た信号により合成した信号と、音声信号との誤差電力を
最小化するように一種類の雑音信号を選択するとともに
、最適なゲインを計算する。そして選択された雑音信号
の種類を表すインデクスとゲイン、ならびに、スペクト
ルパラメータとピッチパラメータを伝送する。
受信側では、受信したパラメータを用いて音声を再生す
る。
る。
上述した文献1の従来方式では、伝送路に誤りの無いと
きは良好な音声信号を再生できるが、無線伝送路などの
ように頻繁に伝送路誤りが発生すると、再生音声の音質
は著しく劣化していた。
きは良好な音声信号を再生できるが、無線伝送路などの
ように頻繁に伝送路誤りが発生すると、再生音声の音質
は著しく劣化していた。
例として、自動車電話などでは、フェーディングなどに
起因してバースト誤りが発生し、ビット誤り率は1%か
ら3%と大きく、再生音声の劣化は大きかった。このよ
うに誤りの多い伝送路では、通常、伝送パラメータを保
護するために誤り訂正符号(FEC)が用いられる。さ
らにバースト誤りにも対処するために、FECの訂正能
力を越えた誤りを受信側で検出するための誤り検出符号
(例えばCRC符号)が使用される。これらの誤り訂正
符号についての詳細は、例えば、平田氏らによる“誤り
訂正符号及び音声符号化技術の衛星通信システムへの適
用、その動向と今後の技術課題” (電子情報通信学会
情報理論研究会資料、 IrO2−30,pp。
起因してバースト誤りが発生し、ビット誤り率は1%か
ら3%と大きく、再生音声の劣化は大きかった。このよ
うに誤りの多い伝送路では、通常、伝送パラメータを保
護するために誤り訂正符号(FEC)が用いられる。さ
らにバースト誤りにも対処するために、FECの訂正能
力を越えた誤りを受信側で検出するための誤り検出符号
(例えばCRC符号)が使用される。これらの誤り訂正
符号についての詳細は、例えば、平田氏らによる“誤り
訂正符号及び音声符号化技術の衛星通信システムへの適
用、その動向と今後の技術課題” (電子情報通信学会
情報理論研究会資料、 IrO2−30,pp。
1〜8.1984年)(文献2)と題した論文に説明さ
れている。
れている。
従来音声復号化方式では、誤り検出符号によりFECの
訂正能力を越えた誤りが受信側で検出されたときは、誤
りを検出したフレームの受信パラメータを、過去の正し
く受信したパラメータに置き換えていた。つまり、その
ようなフレームでは、過去の正しく受信したパラメータ
を繰り返して使用して音声を復号化していた。このよう
な復号化の具体的な方法は、例えば、R,V、COX氏
らによる”Robust CELP Coders f
or No1sy Backgroundsand N
o1sy Channels” と題した論文(Pro
c、 ICASSP89. pp、739−742.1
989年)(文献3)に述べられている。文献3等に述
べられた音声復号化法は簡便であるが、過去のパラメー
タを繰り返し使用するため、特に過渡部などで音声信号
の特徴が変化しているフレームでは繰り返しにより、か
えって音質が劣化したり、異音が発生するという問題点
があった。
訂正能力を越えた誤りが受信側で検出されたときは、誤
りを検出したフレームの受信パラメータを、過去の正し
く受信したパラメータに置き換えていた。つまり、その
ようなフレームでは、過去の正しく受信したパラメータ
を繰り返して使用して音声を復号化していた。このよう
な復号化の具体的な方法は、例えば、R,V、COX氏
らによる”Robust CELP Coders f
or No1sy Backgroundsand N
o1sy Channels” と題した論文(Pro
c、 ICASSP89. pp、739−742.1
989年)(文献3)に述べられている。文献3等に述
べられた音声復号化法は簡便であるが、過去のパラメー
タを繰り返し使用するため、特に過渡部などで音声信号
の特徴が変化しているフレームでは繰り返しにより、か
えって音質が劣化したり、異音が発生するという問題点
があった。
本発明の目的は、このような問題点を解決した音声復号
化方式を提供することにある。
化方式を提供することにある。
第1の発明は、フィルタ係数に関する符号系列とピッチ
に関するパラメータに関する符号系列と、音声の音源信
号を表すコードブックのインデクスとゲインに関するパ
ラメータの符号系列を受信して復号し音声信号を再生す
る音声復号化方式において、 受信した符号に訂正不可能な伝送路誤りを検出したとき
は、前記パラメータの少なくとも一つに関して過去の正
しいフレームにおけるパラメータと未来の正しいフレー
ムにおけるパラメータとの間で補間を行って現フレーム
のパラメータを復元し音声を再生することを特徴とする
。
に関するパラメータに関する符号系列と、音声の音源信
号を表すコードブックのインデクスとゲインに関するパ
ラメータの符号系列を受信して復号し音声信号を再生す
る音声復号化方式において、 受信した符号に訂正不可能な伝送路誤りを検出したとき
は、前記パラメータの少なくとも一つに関して過去の正
しいフレームにおけるパラメータと未来の正しいフレー
ムにおけるパラメータとの間で補間を行って現フレーム
のパラメータを復元し音声を再生することを特徴とする
。
さらに第2の発明は、受信した符号系列に訂正不可能な
伝送路誤りを検出したときは、さらに前記誤りを検出し
たフレームから予め定められたフレーム数だけあるいは
予め定められた条件を満足するまでフィルタ係数に重み
付けを施すか、あるいは再生した信号の大きさが予め定
められたしきい値を越えているときに音源信号あるいは
前記再生信号のゲインを前記誤りを検出したフレームか
ら予め定められたフレーム数あるいは予め定められた条
件を満足するまで調整することを特徴とする。
伝送路誤りを検出したときは、さらに前記誤りを検出し
たフレームから予め定められたフレーム数だけあるいは
予め定められた条件を満足するまでフィルタ係数に重み
付けを施すか、あるいは再生した信号の大きさが予め定
められたしきい値を越えているときに音源信号あるいは
前記再生信号のゲインを前記誤りを検出したフレームか
ら予め定められたフレーム数あるいは予め定められた条
件を満足するまで調整することを特徴とする。
本発明による音声復号化方式の作用を説明する。
第1の発明では、FECの訂正能力以上の誤りを検出し
たフレームにおいて、以下に示す方法により受信したパ
ラメータの補間を行う。ここで文献1のCELP方式を
例にとると、受信したパラメータは、音声信号のスペク
トルを表すフィルタパラメータ、音声のパワを表す情報
、ピッチ周期を表す遅延情報、ピッチゲイン、音源信号
を表すコードブックのインデクス、コードブックのゲイ
ンである。これらのパラメータのうち、特に、フィルタ
パラメータ、遅延情報、音声のパワを表すパラメータは
音質に影響するため、補間により滑らかに変化させるよ
うにする。
たフレームにおいて、以下に示す方法により受信したパ
ラメータの補間を行う。ここで文献1のCELP方式を
例にとると、受信したパラメータは、音声信号のスペク
トルを表すフィルタパラメータ、音声のパワを表す情報
、ピッチ周期を表す遅延情報、ピッチゲイン、音源信号
を表すコードブックのインデクス、コードブックのゲイ
ンである。これらのパラメータのうち、特に、フィルタ
パラメータ、遅延情報、音声のパワを表すパラメータは
音質に影響するため、補間により滑らかに変化させるよ
うにする。
今、第Lフレームで誤りを検出したとする。Lフレーム
の第1番目のフィルタパラメータをANL、遅延情報を
DLとすると、Lフレームのパラメータを以下のように
補間する。
の第1番目のフィルタパラメータをANL、遅延情報を
DLとすると、Lフレームのパラメータを以下のように
補間する。
AIL=δA、。−+++(1−δ)Ai。、、>
(DDL=δDL−1+ (1−δ)DL−1(2
)ここでδは1よりも小さい正の値をとる。また、音声
のパワPtは、(3)式に従い対数上で補間する。
(DDL=δDL−1+ (1−δ)DL−1(2
)ここでδは1よりも小さい正の値をとる。また、音声
のパワPtは、(3)式に従い対数上で補間する。
1ogPL=δlogPL−+ + (1−δ) 1o
gP L−1(3)以上により、重要なパラメータを過
去、未来のフレームの情報から補間して復元し、音声信
号を再生する。
gP L−1(3)以上により、重要なパラメータを過
去、未来のフレームの情報から補間して復元し、音声信
号を再生する。
次に第2の発明では、第1の発明に加えて、誤りの影響
が誤りの発生したフレームよりも将来のフレームに伝搬
するのを防ぐために、フィルタパラメータの重み付けと
、ゲインの調整の少なくとも一つを、誤りを検出したフ
レームから始めて予め定められたフレーム数だけ行うか
あるいは、予め定められた条件を満足するまで行う。
が誤りの発生したフレームよりも将来のフレームに伝搬
するのを防ぐために、フィルタパラメータの重み付けと
、ゲインの調整の少なくとも一つを、誤りを検出したフ
レームから始めて予め定められたフレーム数だけ行うか
あるいは、予め定められた条件を満足するまで行う。
ここでフィルタパラメータの重み付けは下式に従い行う
。
。
α’ 1L=T ”α=L(4)
ここで、O<r<1であり、0に近いほど大きな重み付
けがかかる。また、αはLフレームの線形予測係数であ
る。
けがかかる。また、αはLフレームの線形予測係数であ
る。
次にゲイン調整は以下のように行う。第Mフレームでの
音源信号をe (n)、再生した再生信号をs (n)
、そのパワをQとする。音源信号に対してゲイン調整を
行うときのゲインをGとする。
音源信号をe (n)、再生した再生信号をs (n)
、そのパワをQとする。音源信号に対してゲイン調整を
行うときのゲインをGとする。
e’ (n) =G −e (n)
(5)ここでGは以下のように求める。
(5)ここでGは以下のように求める。
また、再生信号に対してゲイン調整を行うときは、5(
n)=δ5(n−1)+(1−δ)・G(7)とすれば
よい。
n)=δ5(n−1)+(1−δ)・G(7)とすれば
よい。
第1図は本発明による音声復号化方式の一実施例に用い
られる音声復号化装置を示すブロック図である。
られる音声復号化装置を示すブロック図である。
第1図において、デマルチプレクサ100が、伝送路か
ら符号系列を受信すると、この符号系列を分離し、誤り
訂正復号化回路105に出力する。
ら符号系列を受信すると、この符号系列を分離し、誤り
訂正復号化回路105に出力する。
誤り訂正復号化回路105は、受信符号系列に対して、
誤り訂正復号化を行い、誤りを検出したときは、補間回
路110に誤り検出情報を出力する。
誤り訂正復号化を行い、誤りを検出したときは、補間回
路110に誤り検出情報を出力する。
補間回路110は、誤り訂正復号化回路105から誤り
検出情報を入力したときは、ピッチ周期を表す遅延情報
、音声のパワを表す情報、フィルタパラメータに対して
、前記作用の項に述べたように、(1)〜(3) 式ヲ
用いて、過去の正しいフレームのパラメータと未来の正
しいフレームのパラメータとの間で補間を行い、補間し
たパラメータを出力する。
検出情報を入力したときは、ピッチ周期を表す遅延情報
、音声のパワを表す情報、フィルタパラメータに対して
、前記作用の項に述べたように、(1)〜(3) 式ヲ
用いて、過去の正しいフレームのパラメータと未来の正
しいフレームのパラメータとの間で補間を行い、補間し
たパラメータを出力する。
適応コードブック120は、遅延情報、ピッチゲインと
遅延回路165の出力信号を入力し、予測信号を計算す
る。詳細な計算法は、例えば、Kleijn氏による“
Ia+proved 5peech quality
and efficient vector quan
tization in 5ELP”(Proc、 T
CASSP、 pp、155−158.1988年)と
題した論文(文献4)等を参照できる。
遅延回路165の出力信号を入力し、予測信号を計算す
る。詳細な計算法は、例えば、Kleijn氏による“
Ia+proved 5peech quality
and efficient vector quan
tization in 5ELP”(Proc、 T
CASSP、 pp、155−158.1988年)と
題した論文(文献4)等を参照できる。
音源コードブック130は、コードベクトルインデクス
を入力し、コードブック135から対応するコードベク
トルを読みだし、コードベクトルゲインを乗じて音源信
号を出力する。音源コードブッりの動作の詳細は前記文
献1等を参照できる。
を入力し、コードブック135から対応するコードベク
トルを読みだし、コードベクトルゲインを乗じて音源信
号を出力する。音源コードブッりの動作の詳細は前記文
献1等を参照できる。
加算器160は、適応コードブック120からの予測信
号と音源コードブック130からの音源信号とを加算し
て合成フィルタ170に出力する。
号と音源コードブック130からの音源信号とを加算し
て合成フィルタ170に出力する。
合成フィルタ170は、補間回路110からフィルタパ
ラメータを入力し、加算器160から音源信号を入力し
て音声を再生し、端子180から出力する。
ラメータを入力し、加算器160から音源信号を入力し
て音声を再生し、端子180から出力する。
合成フィルタ170の動作の詳細は、前記文献1゜4等
を参照できる。
を参照できる。
第2図は、第2の発明の一実施例に用いられる音声復号
化装置を示すブロック図である。第2図において、第1
図と同一の番号を付した構成要素は、第1図と同一の動
作を行うので説明は省略する。
化装置を示すブロック図である。第2図において、第1
図と同一の番号を付した構成要素は、第1図と同一の動
作を行うので説明は省略する。
ゲイン調整回路168は、補間回路110から誤り検出
情報を入力し、この情報が誤りを検出したことを示すと
きは、誤りを検出したフレームから始めて予め定められ
たフレーム数だけ合成フィルタ170の入力信号のゲイ
ン調整を行う。ゲイン調整は、作用の項に示した(5)
、 (6)式に従って行う。
情報を入力し、この情報が誤りを検出したことを示すと
きは、誤りを検出したフレームから始めて予め定められ
たフレーム数だけ合成フィルタ170の入力信号のゲイ
ン調整を行う。ゲイン調整は、作用の項に示した(5)
、 (6)式に従って行う。
パワ計算回路185は、誤りを検出してから予め定めら
れたフレーム数だけ、合成フィルタ170の出力である
再生信号s (n)の1フレ一ム分のパワQを計算して
、ゲイン調整回路165へ出力する。
れたフレーム数だけ、合成フィルタ170の出力である
再生信号s (n)の1フレ一ム分のパワQを計算して
、ゲイン調整回路165へ出力する。
ここでNは1フレームのサンプル数を示す。
重み付は回路175は、誤りを検出してから予め定めら
れたフレーム数だけ、合成フィルタ170の係数に対し
て前記(4)式に従い重み付けを行い、重み付けた係数
を合成フィルタ170へ出力する。
れたフレーム数だけ、合成フィルタ170の係数に対し
て前記(4)式に従い重み付けを行い、重み付けた係数
を合成フィルタ170へ出力する。
本発明は、上記実施例に示したCELP方式以外にも他
の周知な方式に適用することができる。
の周知な方式に適用することができる。
また、伝送情報として、音声のパワ情報の代わりに、音
声信号線形予測残差信号のパワあるいはRMSが伝送さ
れたときは、補間回路110における音声のパワ情報の
補間は以下のように行うことができる。今、第(L−1
)、 (L+1)フレームで受信した残差信号のパワ
をそれぞれPd、、。
声信号線形予測残差信号のパワあるいはRMSが伝送さ
れたときは、補間回路110における音声のパワ情報の
補間は以下のように行うことができる。今、第(L−1
)、 (L+1)フレームで受信した残差信号のパワ
をそれぞれPd、、。
PdL−+ とすると、第(L−1)フレーム音声のパ
ワPL−1は下式により推定する。
ワPL−1は下式により推定する。
ここでに、はi吹口のPARCOR係数であり、線形予
測係数α、から周知の方法により求めることができる。
測係数α、から周知の方法により求めることができる。
(9)式を用いて第(L+1)フレームでも同様にして
求める。PL−1+ P L+ + の値を前記(3)
式に代入して、第Lフレームのパワの補間値を計算する
ことができる。
求める。PL−1+ P L+ + の値を前記(3)
式に代入して、第Lフレームのパワの補間値を計算する
ことができる。
また、補間回路110では、誤りを検出したフレームで
は、上記実施例に記した以外のパラメータ、例えば、ピ
ッチゲイン、音源コードブックのゲイン等についても補
間することができる。
は、上記実施例に記した以外のパラメータ、例えば、ピ
ッチゲイン、音源コードブックのゲイン等についても補
間することができる。
また、第2図の実施例において、ゲイン調整回路168
におけるゲイン調整は、音源信号に対してではなく、合
成フィルタ170の出力である再生信号s (n)に対
して行うこともできる。このときはs (n)のゲイン
調整に前記(7)式を用いる。
におけるゲイン調整は、音源信号に対してではなく、合
成フィルタ170の出力である再生信号s (n)に対
して行うこともできる。このときはs (n)のゲイン
調整に前記(7)式を用いる。
また、第2図の実施例において、重み付は回路175に
おけるフィルタ係数の重み付け、あるいはゲイン調整回
路168におけるゲイン調整は、誤りを検出してから、
予め定められた条件を満足するまで行うことができる。
おけるフィルタ係数の重み付け、あるいはゲイン調整回
路168におけるゲイン調整は、誤りを検出してから、
予め定められた条件を満足するまで行うことができる。
この条件としては、例えば、適応コードブック120の
ゲインの値が予め定められたしきい値を下回るとき、あ
るいは、音声パワやRMSの値が予め定められた値を下
回ったときなどを適用することができる。
ゲインの値が予め定められたしきい値を下回るとき、あ
るいは、音声パワやRMSの値が予め定められた値を下
回ったときなどを適用することができる。
さらにフィルタ係数の重み付けにおいては、誤りを検出
してから、予測ゲインの大きなフレームに対してのみ、
重み付けを行うようにすることもできる。ここで予測ゲ
インGl、は、 で求められる。
してから、予測ゲインの大きなフレームに対してのみ、
重み付けを行うようにすることもできる。ここで予測ゲ
インGl、は、 で求められる。
以上述べたように、本発明によれば、受信側で誤りを検
出したフレームでは、重要な伝送パラメータについて、
過去の正しいフレームのパラメータと、未来の正しいフ
レームのパラメータを用いて補間によりパラメータを復
元し音声を再生しているので、過去の正しいフレームの
パラメータを単純に繰り返す従来法と比べ、誤りによる
音質劣化の少ない良好な再生音声を提供することができ
るという大きな効果がある。
出したフレームでは、重要な伝送パラメータについて、
過去の正しいフレームのパラメータと、未来の正しいフ
レームのパラメータを用いて補間によりパラメータを復
元し音声を再生しているので、過去の正しいフレームの
パラメータを単純に繰り返す従来法と比べ、誤りによる
音質劣化の少ない良好な再生音声を提供することができ
るという大きな効果がある。
第1図は第1の発明による音声復号化方式の一実施例を
実現する音声復号化装置のブロック図、第2回は第2の
発明による音声復号化方式の一実施例を実現する音声復
号化装置のブロック図である。 100 ・・・・・デマルチプレクサ105 ・・
・・・誤り訂正復号化回路110 ・・・・・補間回路 120 ・・・・・適応コードブック回路130
・・・・・音源コードブック回路135 ・・・・・
コードブック 160 ・・・・・加算器 165 ・・・・・遅延回路 168 ・・・・・ゲイン調整回路 170 ・・・・・合成フィルタ ・出力端子 ・パワ計算回路
実現する音声復号化装置のブロック図、第2回は第2の
発明による音声復号化方式の一実施例を実現する音声復
号化装置のブロック図である。 100 ・・・・・デマルチプレクサ105 ・・
・・・誤り訂正復号化回路110 ・・・・・補間回路 120 ・・・・・適応コードブック回路130
・・・・・音源コードブック回路135 ・・・・・
コードブック 160 ・・・・・加算器 165 ・・・・・遅延回路 168 ・・・・・ゲイン調整回路 170 ・・・・・合成フィルタ ・出力端子 ・パワ計算回路
Claims (2)
- (1)フィルタ係数に関する符号系列とピッチに関する
パラメータに関する符号系列と、音声の音源信号を表す
コードブックのインデクスとゲインに関するパラメータ
の符号系列を受信して復号し音声信号を再生する音声復
号化方式において、受信した符号に訂正不可能な伝送路
誤りを検出したときは、前記パラメータの少なくとも一
つに関して過去の正しいフレームにおけるパラメータと
未来の正しいフレームにおけるパラメータとの間で補間
を行って現フレームのパラメータを復元し音声を再生す
ることを特徴とする音声復号化方式。 - (2)請求項1記載の音声復号化方式において、受信し
た符号系列に訂正不可能な伝送路誤りを検出したときは
、さらに前記誤りを検出したフレームから予め定められ
たフレーム数だけあるいは予め定められた条件を満足す
るまでフィルタ係数に重み付けを施すか、あるいは再生
した信号の大きさが予め定められたしきい値を越えてい
るときに音源信号あるいは前記再生信号のゲインを前記
誤りを検出したフレームから予め定められたフレーム数
あるいは予め定められた条件を満足するまで調整するこ
とを特徴とする音声復号化方式。
Priority Applications (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP02135273A JP3102015B2 (ja) | 1990-05-28 | 1990-05-28 | 音声復号化方法 |
| EP91108594A EP0459358B1 (en) | 1990-05-28 | 1991-05-27 | Speech decoder |
| DE69113866T DE69113866T2 (de) | 1990-05-28 | 1991-05-27 | Sprachdecoder. |
| US07/707,361 US5305332A (en) | 1990-05-28 | 1991-05-28 | Speech decoder for high quality reproduced speech through interpolation |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP02135273A JP3102015B2 (ja) | 1990-05-28 | 1990-05-28 | 音声復号化方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH0430200A true JPH0430200A (ja) | 1992-02-03 |
| JP3102015B2 JP3102015B2 (ja) | 2000-10-23 |
Family
ID=15147851
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP02135273A Expired - Fee Related JP3102015B2 (ja) | 1990-05-28 | 1990-05-28 | 音声復号化方法 |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US5305332A (ja) |
| EP (1) | EP0459358B1 (ja) |
| JP (1) | JP3102015B2 (ja) |
| DE (1) | DE69113866T2 (ja) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2001003115A1 (en) * | 1999-06-30 | 2001-01-11 | Matsushita Electric Industrial Co., Ltd. | Audio decoder and coding error compensating method |
| JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
| WO2002059876A1 (en) * | 2001-01-25 | 2002-08-01 | Sony Corporation | Data processing apparatus |
| WO2002059877A1 (en) * | 2001-01-25 | 2002-08-01 | Sony Corporation | Data processing device |
| JP2002530704A (ja) * | 1998-11-13 | 2002-09-17 | モトローラ・リミテッド | 分散音声認識プロセスにおけるエラーの軽減方法および装置 |
Families Citing this family (52)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH04358486A (ja) * | 1991-06-04 | 1992-12-11 | Toshiba Corp | 高能率符号化信号処理装置 |
| DE69232202T2 (de) * | 1991-06-11 | 2002-07-25 | Qualcomm, Inc. | Vocoder mit veraendlicher bitrate |
| CA2078927C (en) * | 1991-09-25 | 1997-01-28 | Katsushi Seza | Code-book driven vocoder device with voice source generator |
| TW224191B (ja) * | 1992-01-28 | 1994-05-21 | Qualcomm Inc | |
| FI90477C (fi) * | 1992-03-23 | 1994-02-10 | Nokia Mobile Phones Ltd | Puhesignaalin laadun parannusmenetelmä lineaarista ennustusta käyttävään koodausjärjestelmään |
| FR2692091B1 (fr) * | 1992-06-03 | 1995-04-14 | France Telecom | Procédé et dispositif de dissimulation d'erreurs de transmission de signaux audio-numériques codés par transformée fréquentielle. |
| DE69309557T2 (de) * | 1992-06-29 | 1997-10-09 | Nippon Telegraph & Telephone | Verfahren und Vorrichtung zur Sprachkodierung |
| JPH0661950A (ja) * | 1992-08-13 | 1994-03-04 | Nec Corp | 音声符号復号装置 |
| DE4234015A1 (de) * | 1992-10-09 | 1994-04-14 | Thomson Brandt Gmbh | Verfahren und Vorrichtung zur Wiedergabe eines Audiosignals |
| CA2105269C (en) * | 1992-10-09 | 1998-08-25 | Yair Shoham | Time-frequency interpolation with application to low rate speech coding |
| JP2746033B2 (ja) * | 1992-12-24 | 1998-04-28 | 日本電気株式会社 | 音声復号化装置 |
| US5535299A (en) * | 1993-11-02 | 1996-07-09 | Pacific Communication Sciences, Inc. | Adaptive error control for ADPCM speech coders |
| US5502713A (en) * | 1993-12-07 | 1996-03-26 | Telefonaktiebolaget Lm Ericsson | Soft error concealment in a TDMA radio system |
| DE69526926T2 (de) * | 1994-02-01 | 2003-01-02 | Qualcomm, Inc. | Lineare vorhersage durch impulsanregung |
| US5574825A (en) * | 1994-03-14 | 1996-11-12 | Lucent Technologies Inc. | Linear prediction coefficient generation during frame erasure or packet loss |
| US5450449A (en) * | 1994-03-14 | 1995-09-12 | At&T Ipm Corp. | Linear prediction coefficient generation during frame erasure or packet loss |
| CA2142391C (en) * | 1994-03-14 | 2001-05-29 | Juin-Hwey Chen | Computational complexity reduction during frame erasure or packet loss |
| US5797118A (en) * | 1994-08-09 | 1998-08-18 | Yamaha Corporation | Learning vector quantization and a temporary memory such that the codebook contents are renewed when a first speaker returns |
| KR970011728B1 (ko) * | 1994-12-21 | 1997-07-14 | 김광호 | 음향신호의 에러은닉방법 및 그 장치 |
| US5991725A (en) * | 1995-03-07 | 1999-11-23 | Advanced Micro Devices, Inc. | System and method for enhanced speech quality in voice storage and retrieval systems |
| US5699478A (en) * | 1995-03-10 | 1997-12-16 | Lucent Technologies Inc. | Frame erasure compensation technique |
| US5699481A (en) * | 1995-05-18 | 1997-12-16 | Rockwell International Corporation | Timing recovery scheme for packet speech in multiplexing environment of voice with data applications |
| CN1100396C (zh) * | 1995-05-22 | 2003-01-29 | Ntt移动通信网株式会社 | 语音解码器 |
| US5732389A (en) * | 1995-06-07 | 1998-03-24 | Lucent Technologies Inc. | Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures |
| CA2177413A1 (en) * | 1995-06-07 | 1996-12-08 | Yair Shoham | Codebook gain attenuation during frame erasures |
| US5699485A (en) * | 1995-06-07 | 1997-12-16 | Lucent Technologies Inc. | Pitch delay modification during frame erasures |
| GB9512284D0 (en) * | 1995-06-16 | 1995-08-16 | Nokia Mobile Phones Ltd | Speech Synthesiser |
| US5781882A (en) * | 1995-09-14 | 1998-07-14 | Motorola, Inc. | Very low bit rate voice messaging system using asymmetric voice compression processing |
| US5960386A (en) * | 1996-05-17 | 1999-09-28 | Janiszewski; Thomas John | Method for adaptively controlling the pitch gain of a vocoder's adaptive codebook |
| FI963870A7 (fi) * | 1996-09-27 | 1998-03-28 | Nokia Oy Ab | Virheiden piilottaminen digitaalisessa audiovastaanottimessa |
| JPH10247098A (ja) * | 1997-03-04 | 1998-09-14 | Mitsubishi Electric Corp | 可変レート音声符号化方法、可変レート音声復号化方法 |
| US6272108B1 (en) * | 1997-03-05 | 2001-08-07 | Paradyne Corporation | Apparatus and method to allow a frame check sequence to determine the updating of adaptive receiver parameters of a high speed communication device |
| JP3206497B2 (ja) * | 1997-06-16 | 2001-09-10 | 日本電気株式会社 | インデックスによる信号生成型適応符号帳 |
| FR2774827B1 (fr) | 1998-02-06 | 2000-04-14 | France Telecom | Procede de decodage d'un flux binaire representatif d'un signal audio |
| EP1001542B1 (en) * | 1998-05-27 | 2011-03-02 | Ntt Mobile Communications Network Inc. | Voice decoder and voice decoding method |
| US6810377B1 (en) * | 1998-06-19 | 2004-10-26 | Comsat Corporation | Lost frame recovery techniques for parametric, LPC-based speech coding systems |
| US6260017B1 (en) * | 1999-05-07 | 2001-07-10 | Qualcomm Inc. | Multipulse interpolative coding of transition speech frames |
| JP3705994B2 (ja) | 1999-05-13 | 2005-10-12 | 株式会社日本自動車部品総合研究所 | 水素センサ、電池の過充電・過放電検出装置および燃料電池の水素漏れ検出装置 |
| US6549886B1 (en) * | 1999-11-03 | 2003-04-15 | Nokia Ip Inc. | System for lost packet recovery in voice over internet protocol based on time domain interpolation |
| SE517156C2 (sv) | 1999-12-28 | 2002-04-23 | Global Ip Sound Ab | System för överföring av ljud över paketförmedlade nät |
| JPWO2002071389A1 (ja) * | 2001-03-06 | 2004-07-02 | 株式会社エヌ・ティ・ティ・ドコモ | オーディオデータ補間装置および方法、オーディオデータ関連情報作成装置および方法、オーディオデータ補間情報送信装置および方法、ならびにそれらのプログラムおよび記録媒体 |
| DE10124421C1 (de) * | 2001-05-18 | 2002-10-17 | Siemens Ag | Verfahren zur Schätzung eines Codecparameters |
| DE10124402A1 (de) * | 2001-05-18 | 2002-11-28 | Siemens Ag | Verfahren zur Schätzung eines Spektralkoeffizienten |
| JP4532796B2 (ja) | 2001-08-31 | 2010-08-25 | キヤノン株式会社 | シート収納装置及びこれを備えた給紙装置及び画像形成装置 |
| FR2830970B1 (fr) * | 2001-10-12 | 2004-01-30 | France Telecom | Procede et dispositif de synthese de trames de substitution, dans une succession de trames representant un signal de parole |
| KR100413039B1 (ko) * | 2002-01-16 | 2003-12-31 | 어뮤즈텍(주) | 피치보정방법 및 그 장치 |
| WO2007072819A1 (ja) * | 2005-12-21 | 2007-06-28 | Nec Corporation | 符号変換装置及びそれに用いる符号変換方法並びにそのプログラム |
| US20080056206A1 (en) * | 2006-08-31 | 2008-03-06 | Motorola, Inc. | Power savings method and apparatus in a communication system |
| KR101228165B1 (ko) * | 2008-06-13 | 2013-01-30 | 노키아 코포레이션 | 프레임 에러 은폐 방법, 장치 및 컴퓨터 판독가능한 저장 매체 |
| US9020812B2 (en) * | 2009-11-24 | 2015-04-28 | Lg Electronics Inc. | Audio signal processing method and device |
| US10026407B1 (en) * | 2010-12-17 | 2018-07-17 | Arrowhead Center, Inc. | Low bit-rate speech coding through quantization of mel-frequency cepstral coefficients |
| US12462814B2 (en) * | 2023-10-06 | 2025-11-04 | Digital Voice Systems, Inc. | Bit error correction in digital speech |
Family Cites Families (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| SE433998B (sv) * | 1977-10-11 | 1984-06-25 | Carl Erik Wilhelm Sundberg | Anordning vid signalmottagare for att kompensera digitala fel i overford digital signal |
| US4375581A (en) * | 1980-06-30 | 1983-03-01 | Bell Telephone Laboratories, Incorporated | Digital transmission error reduction |
| DE3028066A1 (de) * | 1980-07-24 | 1982-02-18 | Licentia Patent-Verwaltungs-Gmbh, 6000 Frankfurt | Schaltungsanordnung zur korrektur gestoerter abtastwerte bei einer pcm-uebertragungseinrichtung, insbesondere einer digital-tonplatte |
| JPS59157811A (ja) * | 1983-02-25 | 1984-09-07 | Nec Corp | デ−タ補間回路 |
| IT1179803B (it) * | 1984-10-30 | 1987-09-16 | Cselt Centro Studi Lab Telecom | Metodo e dispositivo per la correzione di errori causati da rumore di tipo impulsivo su segnali vocali codificati con bassa velocita di ci fra e trasmessi su canali di comunicazione radio |
| US4831624A (en) * | 1987-06-04 | 1989-05-16 | Motorola, Inc. | Error detection method for sub-band coding |
| JPH01177227A (ja) * | 1988-01-05 | 1989-07-13 | Toshiba Corp | 音声コーデック |
| US5031218A (en) * | 1988-03-30 | 1991-07-09 | International Business Machines Corporation | Redundant message processing and storage |
| DE68922134T2 (de) * | 1988-05-20 | 1995-11-30 | Nippon Electric Co | Überträgungssystem für codierte Sprache mit Codebüchern zur Synthetisierung von Komponenten mit niedriger Amplitude. |
| DE68912692T2 (de) * | 1988-09-21 | 1994-05-26 | Nippon Electric Co | Zur Sprachqualitätsmodifizierung geeignetes Übertragungssystem durch Klassifizierung der Sprachsignale. |
| US5148487A (en) * | 1990-02-26 | 1992-09-15 | Matsushita Electric Industrial Co., Ltd. | Audio subband encoded signal decoder |
-
1990
- 1990-05-28 JP JP02135273A patent/JP3102015B2/ja not_active Expired - Fee Related
-
1991
- 1991-05-27 DE DE69113866T patent/DE69113866T2/de not_active Expired - Fee Related
- 1991-05-27 EP EP91108594A patent/EP0459358B1/en not_active Expired - Lifetime
- 1991-05-28 US US07/707,361 patent/US5305332A/en not_active Expired - Lifetime
Cited By (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002530704A (ja) * | 1998-11-13 | 2002-09-17 | モトローラ・リミテッド | 分散音声認識プロセスにおけるエラーの軽減方法および装置 |
| JP2010160507A (ja) * | 1998-11-13 | 2010-07-22 | Motorola Ltd | 分散音声認識プロセスにおけるエラーの軽減方法および装置 |
| JP2010160506A (ja) * | 1998-11-13 | 2010-07-22 | Motorola Ltd | 分散音声認識プロセスにおけるエラーの軽減方法および装置 |
| US8050912B1 (en) | 1998-11-13 | 2011-11-01 | Motorola Mobility, Inc. | Mitigating errors in a distributed speech recognition process |
| WO2001003115A1 (en) * | 1999-06-30 | 2001-01-11 | Matsushita Electric Industrial Co., Ltd. | Audio decoder and coding error compensating method |
| US7171354B1 (en) | 1999-06-30 | 2007-01-30 | Matsushita Electric Industrial Co., Ltd. | Audio decoder and coding error compensating method |
| US7499853B2 (en) | 1999-06-30 | 2009-03-03 | Panasonic Corporation | Speech decoder and code error compensation method |
| JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
| WO2002059876A1 (en) * | 2001-01-25 | 2002-08-01 | Sony Corporation | Data processing apparatus |
| WO2002059877A1 (en) * | 2001-01-25 | 2002-08-01 | Sony Corporation | Data processing device |
| US7269559B2 (en) | 2001-01-25 | 2007-09-11 | Sony Corporation | Speech decoding apparatus and method using prediction and class taps |
| US7467083B2 (en) | 2001-01-25 | 2008-12-16 | Sony Corporation | Data processing apparatus |
Also Published As
| Publication number | Publication date |
|---|---|
| DE69113866D1 (de) | 1995-11-23 |
| EP0459358B1 (en) | 1995-10-18 |
| DE69113866T2 (de) | 1996-04-18 |
| EP0459358A2 (en) | 1991-12-04 |
| EP0459358A3 (en) | 1992-02-19 |
| JP3102015B2 (ja) | 2000-10-23 |
| US5305332A (en) | 1994-04-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH0430200A (ja) | 音声復号化方法 | |
| JP2746033B2 (ja) | 音声復号化装置 | |
| Campbell Jr et al. | The DoD 4.8 kbps standard (proposed federal standard 1016) | |
| EP0998741B1 (en) | Speech encoder and speech decoder | |
| JP3522012B2 (ja) | コード励振線形予測符号化装置 | |
| US20090248404A1 (en) | Lost frame compensating method, audio encoding apparatus and audio decoding apparatus | |
| RU2665301C1 (ru) | Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио | |
| JP3219467B2 (ja) | 音声復号化方法 | |
| JPH0758687A (ja) | 音声抑制装置 | |
| JP3095340B2 (ja) | 音声復号化装置 | |
| JPH07193549A (ja) | 欠落する信号サンプルの再構成手段を持つ伝送システム | |
| JP3649854B2 (ja) | 音声符号化装置 | |
| JP3085347B2 (ja) | 音声の復号化方法およびその装置 | |
| US7231345B2 (en) | Method and apparatus for transcoding between different speech encoding/decoding systems | |
| CN1327410C (zh) | 语音编解码方法之间的代码转换方法及装置 | |
| JP3212123B2 (ja) | 音声符号化装置 | |
| EP1536413B1 (en) | Method and device for voice code conversion | |
| JP2817196B2 (ja) | 音声符号化方式 | |
| JP3519764B2 (ja) | 音声符号化通信方式及びその装置 | |
| JPH034300A (ja) | 音声符号化復号化方式 | |
| JP3251576B2 (ja) | エラー補償方式 | |
| JP3342998B2 (ja) | 音声復号方法及び装置 | |
| JPH01177225A (ja) | 音声信号符号化復号化方式及びその装置 | |
| JPH04149600A (ja) | 音声復号化方式 | |
| Welch | Joseph P. Campbell, Jr. |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070825 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080825 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080825 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090825 Year of fee payment: 9 |
|
| LAPS | Cancellation because of no payment of annual fees |