JPH09185396A - 音声符号化装置 - Google Patents
音声符号化装置Info
- Publication number
- JPH09185396A JPH09185396A JP7352199A JP35219995A JPH09185396A JP H09185396 A JPH09185396 A JP H09185396A JP 7352199 A JP7352199 A JP 7352199A JP 35219995 A JP35219995 A JP 35219995A JP H09185396 A JPH09185396 A JP H09185396A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- speech
- codebook
- voice
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000003044 adaptive effect Effects 0.000 claims abstract description 79
- 238000001228 spectrum Methods 0.000 claims abstract description 7
- 230000007423 decrease Effects 0.000 claims abstract description 3
- 230000015572 biosynthetic process Effects 0.000 claims description 23
- 238000003786 synthesis reaction Methods 0.000 claims description 23
- 230000005236 sound signal Effects 0.000 claims description 13
- 230000002194 synthesizing effect Effects 0.000 claims description 12
- 230000002238 attenuated effect Effects 0.000 claims description 5
- 230000005284 excitation Effects 0.000 claims description 3
- 230000003595 spectral effect Effects 0.000 claims description 3
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 2
- 230000003247 decreasing effect Effects 0.000 abstract description 3
- 239000002131 composite material Substances 0.000 abstract 1
- 238000011156 evaluation Methods 0.000 abstract 1
- 239000013598 vector Substances 0.000 description 35
- 238000000034 method Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 101000622137 Homo sapiens P-selectin Proteins 0.000 description 1
- 102100023472 P-selectin Human genes 0.000 description 1
- 101000873420 Simian virus 40 SV40 early leader protein Proteins 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000001208 nuclear magnetic resonance pulse sequence Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】
【課題】雑音環境下においても音声信号を良好に符号化
して高音質の音声信号を得ることができる音声符号化装
置を提供する。 【解決手段】あらかじめ定められたフレーム間隔に分割
されたフレーム単位の入力信号が音声信号か非音声信号
かを判別する音声判別器11と、過去の音源信号に遅延
を与えて作成した信号をあらかじめ複数記憶している適
応コードブック1と、サブフレーム間隔の雑音信号波形
を複数記憶している確率コードブック4と、入力信号の
ピッチ周期性を分析するピッチ周期性分析器10と、音
声判別器11の判別結果およびピッチ周期性分析器10
の分析結果に応じて、確率コードブック4と適応コード
ブック1の両方もしくは一方のゲインの値を増減させる
ゲイン調整器15とを具備する。
して高音質の音声信号を得ることができる音声符号化装
置を提供する。 【解決手段】あらかじめ定められたフレーム間隔に分割
されたフレーム単位の入力信号が音声信号か非音声信号
かを判別する音声判別器11と、過去の音源信号に遅延
を与えて作成した信号をあらかじめ複数記憶している適
応コードブック1と、サブフレーム間隔の雑音信号波形
を複数記憶している確率コードブック4と、入力信号の
ピッチ周期性を分析するピッチ周期性分析器10と、音
声判別器11の判別結果およびピッチ周期性分析器10
の分析結果に応じて、確率コードブック4と適応コード
ブック1の両方もしくは一方のゲインの値を増減させる
ゲイン調整器15とを具備する。
Description
【0001】
【産業上の利用分野】本発明は音声符号化装置に関す
る。
る。
【0002】
【従来の技術】音声信号を能率よく圧縮するために広く
用いられている手段として、音声信号を、スペクトル包
絡を表す線形予測パラメータと、線形予測残差信号に対
応する音源パラメータとを用いて符号化する方式があ
る。このような線形予測の手段を用いた音声符号化方式
は、少ない伝送容量で比較的高品質な合成音声が得られ
ることから、最近のハードウェア技術の進歩と相まっ
て、さまざまな応用方式がさかんに研究、開発されてい
る。その中でも良い音質が得られる方式として、過去の
音源信号を繰り返して得られる適応コードブックを用い
るCELP(Code Excited Linear Predictive Coding)
方式がよく知られている。CELP方式については例え
ば、kleijin 等による“Improved speech quality and
efficientvector quantization in SELP ”(ICASP' 88
s4.4,pp.155-158,1988) と題した論文に記載されてい
る。
用いられている手段として、音声信号を、スペクトル包
絡を表す線形予測パラメータと、線形予測残差信号に対
応する音源パラメータとを用いて符号化する方式があ
る。このような線形予測の手段を用いた音声符号化方式
は、少ない伝送容量で比較的高品質な合成音声が得られ
ることから、最近のハードウェア技術の進歩と相まっ
て、さまざまな応用方式がさかんに研究、開発されてい
る。その中でも良い音質が得られる方式として、過去の
音源信号を繰り返して得られる適応コードブックを用い
るCELP(Code Excited Linear Predictive Coding)
方式がよく知られている。CELP方式については例え
ば、kleijin 等による“Improved speech quality and
efficientvector quantization in SELP ”(ICASP' 88
s4.4,pp.155-158,1988) と題した論文に記載されてい
る。
【0003】図6は、適応コードブックを備えた従来の
コード駆動線形予測方式の音声符号化装置のブロック図
である。同図において、適応コードブック51は乗算器
52を介して加算器53の第1入力端子に接続されてい
る。確率コードブック54は乗算器55とスイッチ56
とを介して加算器53の第2入力端子に接続されてい
る。
コード駆動線形予測方式の音声符号化装置のブロック図
である。同図において、適応コードブック51は乗算器
52を介して加算器53の第1入力端子に接続されてい
る。確率コードブック54は乗算器55とスイッチ56
とを介して加算器53の第2入力端子に接続されてい
る。
【0004】加算器53の出力端子は遅延回路57を介
して適応コードブック51に接続されるとともに、合成
フィルタ58の第1入力端子に接続されている。
して適応コードブック51に接続されるとともに、合成
フィルタ58の第1入力端子に接続されている。
【0005】また、ディジタル音声信号が入力される入
力端子66に接続されたバッファメモリ59は、LPC
分析器60を介して合成フィルタ58の第2入力端子に
接続されるとともに、サブフレーム分割器61を介して
減算器62の第1入力端子に接続されている。この減算
器62の第2入力端子は合成フィルタ58の出力端子に
接続され、出力端子は聴感重み付けフィルタ63を介し
て誤差評価器64に接続されている。誤差評価器64は
適応コードブック51と、確率コードブック54と、乗
算器52、55とに接続されている。
力端子66に接続されたバッファメモリ59は、LPC
分析器60を介して合成フィルタ58の第2入力端子に
接続されるとともに、サブフレーム分割器61を介して
減算器62の第1入力端子に接続されている。この減算
器62の第2入力端子は合成フィルタ58の出力端子に
接続され、出力端子は聴感重み付けフィルタ63を介し
て誤差評価器64に接続されている。誤差評価器64は
適応コードブック51と、確率コードブック54と、乗
算器52、55とに接続されている。
【0006】さらに、LPC分析器60と、誤差評価器
64とはマルチプレクサ65に接続されている。
64とはマルチプレクサ65に接続されている。
【0007】上記した構成において、入力端子66か
ら、例えば8kHzでサンプリングされた原音声信号を
入力し、予め定められたフレーム間隔(例えば20m
s、すなわち160サンプル)の音声信号をバッファメ
モリ59に格納する。バッファメモリ59は、フレーム
単位で原音声信号をLPC分析器60に送出する。LP
C分析器60は、原音声信号に対して線形予測(LP
C)分析を行い、スペクトル特性を表す線形予測パラメ
ータαを抽出し、合成フィルタ58およびマルチプレク
サ65に送出する。サブフレーム分割器61は、フレー
ムの原音声信号を予め定められたサブフレーム間隔(例
えば5ms、すなわち40サンプル)に分割する。すな
わち、フレームの原音声信号から、第1サブフレームか
ら第4サブフレームまでのサブフレーム信号が作成され
る。
ら、例えば8kHzでサンプリングされた原音声信号を
入力し、予め定められたフレーム間隔(例えば20m
s、すなわち160サンプル)の音声信号をバッファメ
モリ59に格納する。バッファメモリ59は、フレーム
単位で原音声信号をLPC分析器60に送出する。LP
C分析器60は、原音声信号に対して線形予測(LP
C)分析を行い、スペクトル特性を表す線形予測パラメ
ータαを抽出し、合成フィルタ58およびマルチプレク
サ65に送出する。サブフレーム分割器61は、フレー
ムの原音声信号を予め定められたサブフレーム間隔(例
えば5ms、すなわち40サンプル)に分割する。すな
わち、フレームの原音声信号から、第1サブフレームか
ら第4サブフレームまでのサブフレーム信号が作成され
る。
【0008】また、適応コードブック51の遅延Lとゲ
インβは、以下の処理によって決定される。
インβは、以下の処理によって決定される。
【0009】まず、遅延回路57で、先行サブフレーム
における合成フィルタ58の入力信号すなわち駆動音源
信号に、ピッチ周期に相当する遅延を与えて適応コード
ベクトルとして作成する。例えば、想定するピッチ周期
を40〜167サンプルとすると、40〜167サンプ
ル遅れの128種類の信号が適応コードベクトルとして
作成され、適応コードブック51に格納される。このと
きスイッチ56は開いた状態となっている。したがっ
て、適応コードブック51からの各適応コードベクトル
は乗算器52で可変のゲイン値が乗じられたのち、加算
器53を通過してそのまま合成フィルタ58に入力され
る。合成フィルタ58は線形予測パラメータαを用いて
合成処理を行い、合成ベクトルを減算器62に送出す
る。減算器62は原音声ベクトルと合成ベクトルとの減
算を行い、得られた誤差ベクトルを聴感重み付けフィル
タ63に送出する。聴感重み付けフィルタ63は誤差ベ
クトルに対して聴感特性を考慮した重み付け処理を行
い、誤差評価器64に送出する。誤差評価器64は誤差
ベクトルの2乗平均を計算し、その2乗平均値が最小と
なる最適な適応コードベクトルを検索して、その遅延L
とゲインβをマルチプレクサ65に送出する。このよう
にして、適応コードブック51の遅延Lとゲインβが決
定される。
における合成フィルタ58の入力信号すなわち駆動音源
信号に、ピッチ周期に相当する遅延を与えて適応コード
ベクトルとして作成する。例えば、想定するピッチ周期
を40〜167サンプルとすると、40〜167サンプ
ル遅れの128種類の信号が適応コードベクトルとして
作成され、適応コードブック51に格納される。このと
きスイッチ56は開いた状態となっている。したがっ
て、適応コードブック51からの各適応コードベクトル
は乗算器52で可変のゲイン値が乗じられたのち、加算
器53を通過してそのまま合成フィルタ58に入力され
る。合成フィルタ58は線形予測パラメータαを用いて
合成処理を行い、合成ベクトルを減算器62に送出す
る。減算器62は原音声ベクトルと合成ベクトルとの減
算を行い、得られた誤差ベクトルを聴感重み付けフィル
タ63に送出する。聴感重み付けフィルタ63は誤差ベ
クトルに対して聴感特性を考慮した重み付け処理を行
い、誤差評価器64に送出する。誤差評価器64は誤差
ベクトルの2乗平均を計算し、その2乗平均値が最小と
なる最適な適応コードベクトルを検索して、その遅延L
とゲインβをマルチプレクサ65に送出する。このよう
にして、適応コードブック51の遅延Lとゲインβが決
定される。
【0010】次に、確率コードブック54のインデック
スiとゲインγは、以下の処理によって決定される。
スiとゲインγは、以下の処理によって決定される。
【0011】確率コードブック54には、サブフレーム
長に対応する次元数(すなわち40次元)の確率的信号
ベクトルが例えば512種類、予め格納されており、各
々にインデックスが付与されている。このときスイッチ
56は閉じた状態となっている。
長に対応する次元数(すなわち40次元)の確率的信号
ベクトルが例えば512種類、予め格納されており、各
々にインデックスが付与されている。このときスイッチ
56は閉じた状態となっている。
【0012】まず、前記処理によって決定された最適な
適応コードベクトルに対して乗算器52で最適ゲインβ
を乗じたのち、加算器53に送出する。
適応コードベクトルに対して乗算器52で最適ゲインβ
を乗じたのち、加算器53に送出する。
【0013】次に、確率コードブック54からの各確率
コードベクトルに対して乗算器55で可変のゲイン値を
乗じたのち、加算器53に入力する。加算器53は前記
最適ゲインβを乗じた最適な適応コードベクトルと各確
率コードベクトルとの加算を行い、加算結果を合成フィ
ルタ58に入力する。この後の処理は前記した適応コー
ドブック51のパラメータ(遅延Lとゲインβ)の決定
処理と同様に行われる。
コードベクトルに対して乗算器55で可変のゲイン値を
乗じたのち、加算器53に入力する。加算器53は前記
最適ゲインβを乗じた最適な適応コードベクトルと各確
率コードベクトルとの加算を行い、加算結果を合成フィ
ルタ58に入力する。この後の処理は前記した適応コー
ドブック51のパラメータ(遅延Lとゲインβ)の決定
処理と同様に行われる。
【0014】すなわち、合成フィルタ58は線形予測パ
ラメータαを用いて合成処理を行い、合成ベクトルを減
算器62に送出する。減算器62は原音声ベクトルと合
成ベクトルとの減算を行い、得られた誤差ベクトルを聴
感重み付けフィルタ63に送出する。聴感重み付けフィ
ルタ63は誤差ベクトルに対して聴感特性を考慮した重
み付け処理を行い、誤差評価器64に送出する。誤差評
価器64は誤差ベクトルの2乗平均を計算し、その2乗
平均値が最小となる確率コードベクトルを検索して、そ
のインデックスiとゲインγをマルチプレクサ65に送
出する。このようにして、確率コードブック54のイン
デックスiとゲインγが決定される。
ラメータαを用いて合成処理を行い、合成ベクトルを減
算器62に送出する。減算器62は原音声ベクトルと合
成ベクトルとの減算を行い、得られた誤差ベクトルを聴
感重み付けフィルタ63に送出する。聴感重み付けフィ
ルタ63は誤差ベクトルに対して聴感特性を考慮した重
み付け処理を行い、誤差評価器64に送出する。誤差評
価器64は誤差ベクトルの2乗平均を計算し、その2乗
平均値が最小となる確率コードベクトルを検索して、そ
のインデックスiとゲインγをマルチプレクサ65に送
出する。このようにして、確率コードブック54のイン
デックスiとゲインγが決定される。
【0015】マルチプレクサ65は、量子化された線形
予測パラメータαと、適応コードブック51の遅延L及
びゲインβと、確率コードブック54のインデックスi
及びゲインγの各々をマルチプレクスする。
予測パラメータαと、適応コードブック51の遅延L及
びゲインβと、確率コードブック54のインデックスi
及びゲインγの各々をマルチプレクスする。
【0016】また、このような音声符号化装置において
は、上述したように有声音に対するピッチ周期性は過去
の音源信号に遅延を与えて作り出される。しかし、過去
の音源信号はもともと雑音系列から作られているため、
有声音の音源に相当するパルス系列を作り出すのが困難
となる。この影響により特に有声音において再生音声に
高周波ノイズが多く含まれて、音質が劣化してしまう。
この問題を解決するために種々の提案がなされている
が、その一例が、“DETAILS TO ASSIST INIMPLEMENTATI
ON OF FEDERAL STANDARD 1016 CELP ”(NATIONAL COMM
UNICATIONSSYSTEM, TECHNICAL INFOMATION BULLETIN 92
-1,PP.10-11,1992)に詳細に記載されている。
は、上述したように有声音に対するピッチ周期性は過去
の音源信号に遅延を与えて作り出される。しかし、過去
の音源信号はもともと雑音系列から作られているため、
有声音の音源に相当するパルス系列を作り出すのが困難
となる。この影響により特に有声音において再生音声に
高周波ノイズが多く含まれて、音質が劣化してしまう。
この問題を解決するために種々の提案がなされている
が、その一例が、“DETAILS TO ASSIST INIMPLEMENTATI
ON OF FEDERAL STANDARD 1016 CELP ”(NATIONAL COMM
UNICATIONSSYSTEM, TECHNICAL INFOMATION BULLETIN 92
-1,PP.10-11,1992)に詳細に記載されている。
【0017】図7は、図6に示すコード駆動線形予測方
式の音声符号化装置に対応する復号化器のブロック図で
ある。同図において、適応コードブック70は乗算器7
1を介して加算器72の第1入力端子に接続されてい
る。確率コードブック73は乗算器74とスイッチ75
とを介して加算器72の第2入力端子に接続されてい
る。加算器72の出力端子は遅延回路76を介して適応
コードブック70に接続されるとともに、出力端子79
を有する合成フィルタ77の第1入力端子に接続されて
いる。
式の音声符号化装置に対応する復号化器のブロック図で
ある。同図において、適応コードブック70は乗算器7
1を介して加算器72の第1入力端子に接続されてい
る。確率コードブック73は乗算器74とスイッチ75
とを介して加算器72の第2入力端子に接続されてい
る。加算器72の出力端子は遅延回路76を介して適応
コードブック70に接続されるとともに、出力端子79
を有する合成フィルタ77の第1入力端子に接続されて
いる。
【0018】また、デマルチプレクサ78は、適応コー
ドブック70と、確率コードブック73と、乗算器7
1、74と、合成フィルタ77の第2入力端子とに接続
されている。
ドブック70と、確率コードブック73と、乗算器7
1、74と、合成フィルタ77の第2入力端子とに接続
されている。
【0019】なお、ここでは合成フィルタ77の構成は
前記した図6に示す合成フィルタ58の構成と同一であ
るとする。
前記した図6に示す合成フィルタ58の構成と同一であ
るとする。
【0020】上記した構成において、デマルチプレクサ
78は受信した信号を線形予測パラメータαと、適応コ
ードブック70の遅延L及びゲインβと、確率コードブ
ック73のインデックスi及びゲインγとに分解して、
分解された線形予測パラメータαを合成フィルタ77
に、遅延Lとゲインβを各々適応コードブック70と乗
算器71に、インデックスiとゲインγを各々確率コー
ドブック73と乗算器74に出力する。
78は受信した信号を線形予測パラメータαと、適応コ
ードブック70の遅延L及びゲインβと、確率コードブ
ック73のインデックスi及びゲインγとに分解して、
分解された線形予測パラメータαを合成フィルタ77
に、遅延Lとゲインβを各々適応コードブック70と乗
算器71に、インデックスiとゲインγを各々確率コー
ドブック73と乗算器74に出力する。
【0021】デマルチプレクサ78から出力された適応
コードブック70の遅延Lに基づいて適応コードブック
70の適応コードベクトルを選択する。ここで適応コー
ドブック70は符号化装置における適応コードブック5
1の内容と同じ内容を有する。すなわち、適応コードブ
ック70には、遅延回路76を介して過去の駆動音源信
号が入力される。乗算器71は受信したゲインβに基づ
いて入力された適応コードベクトルを増幅し、加算器7
2に送出する。
コードブック70の遅延Lに基づいて適応コードブック
70の適応コードベクトルを選択する。ここで適応コー
ドブック70は符号化装置における適応コードブック5
1の内容と同じ内容を有する。すなわち、適応コードブ
ック70には、遅延回路76を介して過去の駆動音源信
号が入力される。乗算器71は受信したゲインβに基づ
いて入力された適応コードベクトルを増幅し、加算器7
2に送出する。
【0022】次に、デマルチプレクサ78から出力され
た確率コードブック73のインデックスiに基づいて確
率コードブック73の確率コードベクトルを選択する。
ここで確率コードブック73は符号化装置における確率
コードブック54の内容と同じ内容を有する。乗算器7
4は受信したゲインγに基づいて入力された確率コード
ベクトルを増幅し、加算器72に送出する。
た確率コードブック73のインデックスiに基づいて確
率コードブック73の確率コードベクトルを選択する。
ここで確率コードブック73は符号化装置における確率
コードブック54の内容と同じ内容を有する。乗算器7
4は受信したゲインγに基づいて入力された確率コード
ベクトルを増幅し、加算器72に送出する。
【0023】加算器72は増幅された確率コードベクト
ルと増幅された適応コードベクトルとを加算して合成フ
ィルタ77および遅延回路76に送出する。合成フィル
タ77は受信した線形予測パラメータαを係数として合
成処理を行い、合成音声信号を出力端子79から出力す
る。
ルと増幅された適応コードベクトルとを加算して合成フ
ィルタ77および遅延回路76に送出する。合成フィル
タ77は受信した線形予測パラメータαを係数として合
成処理を行い、合成音声信号を出力端子79から出力す
る。
【0024】
【発明が解決しようとする課題】しかしながら、上述し
たような線形予測分析を用いる音声符号化装置は、比較
的低いビットレートで高品質な符号化性能を得ることが
できるが、本装置を非音声信号すなわち背景雑音が不可
避的に存在する環境下で、例えば、移動体電話や音声録
音装置として使用する場合は、音声信号に背景雑音が混
入して符号化した信号の音質が大きく劣化してしまうと
いう問題があった。
たような線形予測分析を用いる音声符号化装置は、比較
的低いビットレートで高品質な符号化性能を得ることが
できるが、本装置を非音声信号すなわち背景雑音が不可
避的に存在する環境下で、例えば、移動体電話や音声録
音装置として使用する場合は、音声信号に背景雑音が混
入して符号化した信号の音質が大きく劣化してしまうと
いう問題があった。
【0025】本発明の音声符号化装置はこのような課題
に着目してなされたものであり、その目的とするところ
は、雑音環境下においても音声信号を良好に符号化して
高音質の音声信号を得ることができる音声符号化装置を
提供することにある。
に着目してなされたものであり、その目的とするところ
は、雑音環境下においても音声信号を良好に符号化して
高音質の音声信号を得ることができる音声符号化装置を
提供することにある。
【0026】
【課題を解決するための手段】上記の目的を達成するた
めに、第1の発明に係る音声符号化装置は、あらかじめ
定められたフレーム間隔に分割されたフレーム単位の入
力信号が音声信号か非音声信号かを判別する音声判別手
段と、上記入力信号を分析し、そのスペクトルパラメー
タを出力する線形予測分析手段と、上記入力信号のフレ
ーム間隔をさらに所定のサブフレーム間隔に分割するサ
ブフレーム分割手段と、過去の音源信号に遅延を与えて
作成した信号をあらかじめ複数記憶している適応コード
ブックと、上記サブフレーム間隔の雑音信号波形を複数
記憶している確率コードブックと、上記確率コードブッ
クと上記適応コードブックの両方もしくは一方から出力
される信号に基づき駆動音源信号を生成する駆動音源信
号生成手段と、上記スペクトルパラメータをもとに、上
記確率コードブックと上記適応コードブックから出力さ
れる信号を駆動音源信号として音声を合成する合成フィ
ルタと、入力信号に対する合成信号の歪みを最小とする
適応コードブックの遅延、確率コードブックのインデッ
クス、およびそれぞれのゲインに対応する符号を出力す
る誤差最小化手段と、入力信号のピッチ周期性を分析す
るピッチ周期性分析手段と、上記音声判別手段の判別結
果および上記ピッチ周期性分析手段の分析結果に応じ
て、上記確率コードブックと上記適応コードブックの両
方もしくは一方のゲインを増減させるゲイン調整手段と
を具備する。
めに、第1の発明に係る音声符号化装置は、あらかじめ
定められたフレーム間隔に分割されたフレーム単位の入
力信号が音声信号か非音声信号かを判別する音声判別手
段と、上記入力信号を分析し、そのスペクトルパラメー
タを出力する線形予測分析手段と、上記入力信号のフレ
ーム間隔をさらに所定のサブフレーム間隔に分割するサ
ブフレーム分割手段と、過去の音源信号に遅延を与えて
作成した信号をあらかじめ複数記憶している適応コード
ブックと、上記サブフレーム間隔の雑音信号波形を複数
記憶している確率コードブックと、上記確率コードブッ
クと上記適応コードブックの両方もしくは一方から出力
される信号に基づき駆動音源信号を生成する駆動音源信
号生成手段と、上記スペクトルパラメータをもとに、上
記確率コードブックと上記適応コードブックから出力さ
れる信号を駆動音源信号として音声を合成する合成フィ
ルタと、入力信号に対する合成信号の歪みを最小とする
適応コードブックの遅延、確率コードブックのインデッ
クス、およびそれぞれのゲインに対応する符号を出力す
る誤差最小化手段と、入力信号のピッチ周期性を分析す
るピッチ周期性分析手段と、上記音声判別手段の判別結
果および上記ピッチ周期性分析手段の分析結果に応じ
て、上記確率コードブックと上記適応コードブックの両
方もしくは一方のゲインを増減させるゲイン調整手段と
を具備する。
【0027】また、第2の発明に係る音声符号化装置
は、第1の発明に係る音声符号化装置において、上記駆
動音源信号生成手段は、上記音声判別手段が入力信号を
音声信号と判別したときには、上記確率コードブックと
上記適応コードブックから出力される信号から駆動音源
信号を生成し、上記音声判別手段が入力信号を非音声信
号と判別したときには、上記確率コードブックのみから
出力される信号から駆動音源信号を生成する。
は、第1の発明に係る音声符号化装置において、上記駆
動音源信号生成手段は、上記音声判別手段が入力信号を
音声信号と判別したときには、上記確率コードブックと
上記適応コードブックから出力される信号から駆動音源
信号を生成し、上記音声判別手段が入力信号を非音声信
号と判別したときには、上記確率コードブックのみから
出力される信号から駆動音源信号を生成する。
【0028】また、第3の発明に係る音声符号化装置
は、第1の発明に係る音声符号化装置において、上記ゲ
イン調整手段は、上記音声判別手段が入力信号を非音声
信号と判別したときには、音声信号と判別したときに対
して所定の割合で確率コードブックと適応コードブック
の両方または一方のゲインを減衰させる。
は、第1の発明に係る音声符号化装置において、上記ゲ
イン調整手段は、上記音声判別手段が入力信号を非音声
信号と判別したときには、音声信号と判別したときに対
して所定の割合で確率コードブックと適応コードブック
の両方または一方のゲインを減衰させる。
【0029】また、第4の発明に係る音声符号化装置
は、第1または第2の発明に係る音声符号化装置におい
て、上記音声判別手段は、フレーム毎に入力信号のエネ
ルギーの大きさによって音声/非音声を判別するもので
あって、符号化開始時のフレームエネルギーに応じて判
別閾値を決定する閾値決定手段を具備し、現在のフレー
ムエネルギーと符号化開始時のフレームエネルギーとの
差が、上記閾値決定手段により決定された判別閾値より
大きければ音声、小さければ非音声とする。
は、第1または第2の発明に係る音声符号化装置におい
て、上記音声判別手段は、フレーム毎に入力信号のエネ
ルギーの大きさによって音声/非音声を判別するもので
あって、符号化開始時のフレームエネルギーに応じて判
別閾値を決定する閾値決定手段を具備し、現在のフレー
ムエネルギーと符号化開始時のフレームエネルギーとの
差が、上記閾値決定手段により決定された判別閾値より
大きければ音声、小さければ非音声とする。
【0030】すなわち、第1の発明に係る音声符号化装
置は、あらかじめ定められたフレーム間隔に分割された
フレーム単位の入力信号が音声信号か非音声信号かを音
声判別手段によって判別するとともに、線形予測分析手
段によって上記入力信号を分析してそのスペクトルパラ
メータを出力し、さらには上記入力信号のフレーム間隔
をサブフレーム分割手段によって所定のサブフレーム間
隔に分割する。また、過去の音源信号に遅延を与えて作
成した信号をあらかじめ複数記憶している適応コードブ
ックと、上記サブフレーム間隔の雑音信号波形を複数記
憶している確率コードブックの両方もしくは一方から出
力される信号に基づいて、駆動音源信号生成手段によっ
て駆動音源信号を生成する。そして、上記スペクトルパ
ラメータをもとに、合成フィルタによって上記確率コー
ドブックと上記適応コードブックから出力される信号を
駆動音源信号として音声を合成するとともに、誤差最小
化手段によって、入力信号に対する合成信号の歪みを最
小とする適応コードブックの遅延、確率コードブックの
インデックス、およびそれぞれのゲインに対応する符号
を出力する。そして、ピッチ周期性分析手段によって入
力信号のピッチ周期性を分析し、上記音声判別手段の判
別結果および上記ピッチ周期性分析手段の分析結果に応
じて、上記確率コードブックと上記適応コードブックの
両方もしくは一方のゲインをゲイン調整手段によって増
減させるようにする。
置は、あらかじめ定められたフレーム間隔に分割された
フレーム単位の入力信号が音声信号か非音声信号かを音
声判別手段によって判別するとともに、線形予測分析手
段によって上記入力信号を分析してそのスペクトルパラ
メータを出力し、さらには上記入力信号のフレーム間隔
をサブフレーム分割手段によって所定のサブフレーム間
隔に分割する。また、過去の音源信号に遅延を与えて作
成した信号をあらかじめ複数記憶している適応コードブ
ックと、上記サブフレーム間隔の雑音信号波形を複数記
憶している確率コードブックの両方もしくは一方から出
力される信号に基づいて、駆動音源信号生成手段によっ
て駆動音源信号を生成する。そして、上記スペクトルパ
ラメータをもとに、合成フィルタによって上記確率コー
ドブックと上記適応コードブックから出力される信号を
駆動音源信号として音声を合成するとともに、誤差最小
化手段によって、入力信号に対する合成信号の歪みを最
小とする適応コードブックの遅延、確率コードブックの
インデックス、およびそれぞれのゲインに対応する符号
を出力する。そして、ピッチ周期性分析手段によって入
力信号のピッチ周期性を分析し、上記音声判別手段の判
別結果および上記ピッチ周期性分析手段の分析結果に応
じて、上記確率コードブックと上記適応コードブックの
両方もしくは一方のゲインをゲイン調整手段によって増
減させるようにする。
【0031】また、第2の発明に係る音声符号化装置
は、第1の発明に係る音声符号化装置において、上記音
声判別手段が入力信号を音声信号と判別したときには、
上記駆動音源信号生成手段によって、上記確率コードブ
ックと適応コードブックから出力される信号から駆動音
源信号を生成し、上記音声判別手段が入力信号を非音声
信号と判別したときには、上記確率コードブックのみか
ら出力される信号から駆動音源信号を生成するようにす
る。
は、第1の発明に係る音声符号化装置において、上記音
声判別手段が入力信号を音声信号と判別したときには、
上記駆動音源信号生成手段によって、上記確率コードブ
ックと適応コードブックから出力される信号から駆動音
源信号を生成し、上記音声判別手段が入力信号を非音声
信号と判別したときには、上記確率コードブックのみか
ら出力される信号から駆動音源信号を生成するようにす
る。
【0032】また、第3の発明に係る音声符号化装置
は、第1の発明に係る音声符号化装置において、上記音
声判別手段が入力信号を非音声信号と判別したときに
は、上記ゲイン調整手段によって、音声信号と判別した
ときに対して所定の割合で確率コードブックと適応コー
ドブックの両方または一方のゲインを減衰させるように
する。
は、第1の発明に係る音声符号化装置において、上記音
声判別手段が入力信号を非音声信号と判別したときに
は、上記ゲイン調整手段によって、音声信号と判別した
ときに対して所定の割合で確率コードブックと適応コー
ドブックの両方または一方のゲインを減衰させるように
する。
【0033】また、第4の発明に係る音声符号化装置
は、第1、第2、または第3の発明に係る音声符号化装
置において、上記音声判別手段を用いて、フレーム毎に
入力信号のエネルギーの大きさによって音声/非音声を
判別するとともに、閾値決定手段によって、符号化開始
時のフレームエネルギーに応じて判別閾値を決定する。
そして、現在のフレームエネルギーと符号化開始時のフ
レームエネルギーとの差が、上記閾値決定手段により決
定された判別閾値より大きければ音声、小さければ非音
声とする。
は、第1、第2、または第3の発明に係る音声符号化装
置において、上記音声判別手段を用いて、フレーム毎に
入力信号のエネルギーの大きさによって音声/非音声を
判別するとともに、閾値決定手段によって、符号化開始
時のフレームエネルギーに応じて判別閾値を決定する。
そして、現在のフレームエネルギーと符号化開始時のフ
レームエネルギーとの差が、上記閾値決定手段により決
定された判別閾値より大きければ音声、小さければ非音
声とする。
【0034】
【発明の実施の形態】以下、図面を参照して本発明の一
実施形態を詳細に説明する。
実施形態を詳細に説明する。
【0035】図1は本発明が適用される音声符号化装置
の構成を示すブロック図である。
の構成を示すブロック図である。
【0036】同図において、適応コードブック1は乗算
器2とスイッチ19とを介して、駆動音源信号生成手段
としての加算器3の第1入力端子に接続され、確率コー
ドブック4は乗算器5とスイッチ6とを介して加算器3
の第2入力端子に接続されている。加算器3の出力端子
は合成フィルタ8を介して減算器12の第1入力端子に
接続されるとともに、遅延回路7を介して適応コードブ
ック1に接続されている。
器2とスイッチ19とを介して、駆動音源信号生成手段
としての加算器3の第1入力端子に接続され、確率コー
ドブック4は乗算器5とスイッチ6とを介して加算器3
の第2入力端子に接続されている。加算器3の出力端子
は合成フィルタ8を介して減算器12の第1入力端子に
接続されるとともに、遅延回路7を介して適応コードブ
ック1に接続されている。
【0037】また、入力端子19に接続されたバッファ
メモリ9は、線形予測分析手段としてのLPC分析器1
6を介して合成フィルタ8に接続されるとともに、サブ
フレーム分割手段としてのサブフレーム分割器17を介
して減算器12に、音声判別手段としての音声判別器1
1を介してゲイン調整器15に、さらに、ピッチ周期性
分析手段としてのピッチ周期性分析器10を介して、ゲ
イン調整手段としてのゲイン調整器15に接続されてい
る。このゲイン調節器15は乗算器5に接続されてい
る。減算器12の出力端子は聴感重み付けフィルタ13
を介して誤差最小化手段としての誤差評価器14の入力
端子に接続されている。この誤差評価器14の出力端子
は適応コードブック1と、確率コードブック4と、乗算
器2、5に接続されている。
メモリ9は、線形予測分析手段としてのLPC分析器1
6を介して合成フィルタ8に接続されるとともに、サブ
フレーム分割手段としてのサブフレーム分割器17を介
して減算器12に、音声判別手段としての音声判別器1
1を介してゲイン調整器15に、さらに、ピッチ周期性
分析手段としてのピッチ周期性分析器10を介して、ゲ
イン調整手段としてのゲイン調整器15に接続されてい
る。このゲイン調節器15は乗算器5に接続されてい
る。減算器12の出力端子は聴感重み付けフィルタ13
を介して誤差最小化手段としての誤差評価器14の入力
端子に接続されている。この誤差評価器14の出力端子
は適応コードブック1と、確率コードブック4と、乗算
器2、5に接続されている。
【0038】さらに、マルチプレクサ18は音声判別器
11とLPC分析器16と誤差評価器14とに接続され
ている。
11とLPC分析器16と誤差評価器14とに接続され
ている。
【0039】図2は、図1に示す音声判別手段としての
音声判別器11の構成を示すものである。同図におい
て、フレームエネルギー分析回路120は加算器121
の第1入力端子に接続されている。また、初期フレーム
エネルギー分析回路122は閾値決定手段としての閾値
決定回路124と、加算器121の第2入力端子に接続
されている。加算器121の出力端子と閾値決定回路1
24とは判別回路123に接続されている。
音声判別器11の構成を示すものである。同図におい
て、フレームエネルギー分析回路120は加算器121
の第1入力端子に接続されている。また、初期フレーム
エネルギー分析回路122は閾値決定手段としての閾値
決定回路124と、加算器121の第2入力端子に接続
されている。加算器121の出力端子と閾値決定回路1
24とは判別回路123に接続されている。
【0040】上記した構成において、入力端子9から、
例えば8kHzでサンプリングされた原音声信号を入力
し、あらかじめ定められたフレーム間隔(例えば20m
s、すなわち160サンプル)の音声信号をバッファメ
モリ9に格納する。バッファメモリ9は、入力信号をフ
レーム単位でLPC分析器16、サブフレーム分割器1
7、音声判別器11、およびピッチ周期性分析器10に
送出する。LPC分析器16は、入力信号に対して線形
予測(LPC)分析を行い、スペクトル特性を表す線形
予測パラメータαを抽出し、合成フィルタ8およびマル
チプレクサ18に送出する。サブフレーム分割器17
は、フレームの入力信号をあらかじめ定められたサブフ
レーム間隔(例えば5ms、すなわち40サンプル)に
分割する。ここでは、フレームの入力信号から、第1サ
ブフレームから第4サブフレームまでのサブフレーム信
号が作成される。
例えば8kHzでサンプリングされた原音声信号を入力
し、あらかじめ定められたフレーム間隔(例えば20m
s、すなわち160サンプル)の音声信号をバッファメ
モリ9に格納する。バッファメモリ9は、入力信号をフ
レーム単位でLPC分析器16、サブフレーム分割器1
7、音声判別器11、およびピッチ周期性分析器10に
送出する。LPC分析器16は、入力信号に対して線形
予測(LPC)分析を行い、スペクトル特性を表す線形
予測パラメータαを抽出し、合成フィルタ8およびマル
チプレクサ18に送出する。サブフレーム分割器17
は、フレームの入力信号をあらかじめ定められたサブフ
レーム間隔(例えば5ms、すなわち40サンプル)に
分割する。ここでは、フレームの入力信号から、第1サ
ブフレームから第4サブフレームまでのサブフレーム信
号が作成される。
【0041】音声判別器11は、フレームの入力信号が
音声か非音声かを、以下の方法で判別する。すなわち、
図2に示す構成において、フレームエネルギー分析回路
120は入力されたフレーム入力信号のフレームエネル
ギーEf [dB]を以下の式により算出する。
音声か非音声かを、以下の方法で判別する。すなわち、
図2に示す構成において、フレームエネルギー分析回路
120は入力されたフレーム入力信号のフレームエネル
ギーEf [dB]を以下の式により算出する。
【0042】
【数1】 ただし、s(n)はサンプルnにおける入力信号、Nは
フレーム長を示す。
フレーム長を示す。
【0043】また、初期フレームエネルギー分析回路1
22は符号化開始時のフレームエネルギーEb [dB]
を上式により同様に算出する。
22は符号化開始時のフレームエネルギーEb [dB]
を上式により同様に算出する。
【0044】閾値決定回路124は、例えば図3に示す
ような背景雑音エネルギー[dB]と閾値[dB]との
関係を基に、背景雑音エネルギーの大きさに応じて閾値
を決定して判別回路123に送出する。また、加算器1
21ではフレームエネルギーEf [dB]から初期フレ
ームエネルギーEb [dB]を減算し、その減算結果を
判別回路123に送出する。そして、判別回路123は
入力された減算結果と閾値を比較し、減算結果が閾値よ
り大きければフレーム入力信号は音声信号であると判別
し、そうでなければ非音声信号である判別する。
ような背景雑音エネルギー[dB]と閾値[dB]との
関係を基に、背景雑音エネルギーの大きさに応じて閾値
を決定して判別回路123に送出する。また、加算器1
21ではフレームエネルギーEf [dB]から初期フレ
ームエネルギーEb [dB]を減算し、その減算結果を
判別回路123に送出する。そして、判別回路123は
入力された減算結果と閾値を比較し、減算結果が閾値よ
り大きければフレーム入力信号は音声信号であると判別
し、そうでなければ非音声信号である判別する。
【0045】図1に戻って、音声判別器11において入
力信号が音声信号であると判別されるとスイッチ19は
閉じられる。また、入力信号が非音声信号であると判別
されるとスイッチ19は開かれる。このような制御動作
により、音声区間では適応コードブック11と確率コー
ドブック4から出力される信号から駆動音源信号が生成
され、非音声区間では確率コードブック4のみから駆動
音源信号が生成される。これは、非音声区間においては
適応コードブック1は単にもう一つの確率コードブック
としてしか機能しなくなるため、音質の向上にはほとん
ど寄与しないためである。音声区間においては、適応コ
ードブック1の遅延Lとゲインβは、前記した従来例と
同様に決定される。また、確率コードブック4のインデ
ックスiとゲインγも、前記した従来例と同様に決定さ
れる。
力信号が音声信号であると判別されるとスイッチ19は
閉じられる。また、入力信号が非音声信号であると判別
されるとスイッチ19は開かれる。このような制御動作
により、音声区間では適応コードブック11と確率コー
ドブック4から出力される信号から駆動音源信号が生成
され、非音声区間では確率コードブック4のみから駆動
音源信号が生成される。これは、非音声区間においては
適応コードブック1は単にもう一つの確率コードブック
としてしか機能しなくなるため、音質の向上にはほとん
ど寄与しないためである。音声区間においては、適応コ
ードブック1の遅延Lとゲインβは、前記した従来例と
同様に決定される。また、確率コードブック4のインデ
ックスiとゲインγも、前記した従来例と同様に決定さ
れる。
【0046】ピッチ周期性分析器10は、フレーム入力
信号のピッチ周期性を分析する。本実施形態では、例え
ば選択された適応コードベクトルをβ倍した信号(ピッ
チ予測信号)と、入力信号との相互相関を計算する。す
なわち、この相互相関の値が高ければより周期性の高
い、有声音であるといえ、反対に相互相関の値が低けれ
ば、無声音または非音声であるといえる。
信号のピッチ周期性を分析する。本実施形態では、例え
ば選択された適応コードベクトルをβ倍した信号(ピッ
チ予測信号)と、入力信号との相互相関を計算する。す
なわち、この相互相関の値が高ければより周期性の高
い、有声音であるといえ、反対に相互相関の値が低けれ
ば、無声音または非音声であるといえる。
【0047】相互相関を計算するにあたって、ここでは
下式で示される入力信号とピッチ予測信号との一般化相
互相関Rを用いる。
下式で示される入力信号とピッチ予測信号との一般化相
互相関Rを用いる。
【0048】
【数2】 ただし、s(n)は前記したようにサンプルnにおける
入力信号であり、p(n)はサンプルnにおけるピッチ
予測信号である。
入力信号であり、p(n)はサンプルnにおけるピッチ
予測信号である。
【0049】ゲイン調整器15はピッチ周期性分析器1
0の分析結果としての一般化相互相関Rの値と、音声判
別器11の判別結果v/uv(vはvoice(音声)
を意味し、uvはunvoice(非音声)を意味す
る)に応じて、確率コードブック4と、適応コードブッ
ク1の両方もしくは一方のゲインを増減させる。本実施
形態では、非音声信号であると判別されたときは、図4
に示すような一般化相互相関R[dB]と確率コードブ
ックのゲインの倍率との関係に基づいて、音声信号であ
ると判別されたときに対する所定の割合で音声確率コー
ドブック4のゲインγを減衰させるようにする。
0の分析結果としての一般化相互相関Rの値と、音声判
別器11の判別結果v/uv(vはvoice(音声)
を意味し、uvはunvoice(非音声)を意味す
る)に応じて、確率コードブック4と、適応コードブッ
ク1の両方もしくは一方のゲインを増減させる。本実施
形態では、非音声信号であると判別されたときは、図4
に示すような一般化相互相関R[dB]と確率コードブ
ックのゲインの倍率との関係に基づいて、音声信号であ
ると判別されたときに対する所定の割合で音声確率コー
ドブック4のゲインγを減衰させるようにする。
【0050】このような処理により、音声区間では通常
のピッチ強調処理が行われ、非音声区間では図4に示す
ように確率コードブック4のゲインγが減衰されるの
で、背景雑音を抑制することができる。
のピッチ強調処理が行われ、非音声区間では図4に示す
ように確率コードブック4のゲインγが減衰されるの
で、背景雑音を抑制することができる。
【0051】マルチプレクサ18は、量子化された線形
予測パラメータαと、適応コードブック1の遅延L及び
ゲインβと、確率コードブック4のインデックスi及び
ゲインγと、音声判別情報v/uvの各々をマルチプレ
クスして伝送する。
予測パラメータαと、適応コードブック1の遅延L及び
ゲインβと、確率コードブック4のインデックスi及び
ゲインγと、音声判別情報v/uvの各々をマルチプレ
クスして伝送する。
【0052】続いて、上記した音声符号化装置に対応す
る音声復号化装置の復号化動作を図面を参照して詳細に
説明する。
る音声復号化装置の復号化動作を図面を参照して詳細に
説明する。
【0053】図5は、図1の音声符号化装置に対応する
音声復号化装置のブロック図である。同図において、適
応コードブック30は、乗算器31とスイッチ32を介
して加算器33の第1入力端子に接続されている。確率
コードブック36は、乗算器37とスイッチ38とを介
して加算器33の第2入力端子に接続されている。加算
器33の出力端子は遅延回路40を介して適応コードブ
ック30に接続されるとともに、出力端子39を有する
合成フィルタ34の第1入力端子に接続されている。
音声復号化装置のブロック図である。同図において、適
応コードブック30は、乗算器31とスイッチ32を介
して加算器33の第1入力端子に接続されている。確率
コードブック36は、乗算器37とスイッチ38とを介
して加算器33の第2入力端子に接続されている。加算
器33の出力端子は遅延回路40を介して適応コードブ
ック30に接続されるとともに、出力端子39を有する
合成フィルタ34の第1入力端子に接続されている。
【0054】また、デマルチプレクサ35は、適応コー
ドブック30と、確率コードブック36と、乗算器3
1、37と、合成フィルタ34の第2入力端子とに接続
されている。
ドブック30と、確率コードブック36と、乗算器3
1、37と、合成フィルタ34の第2入力端子とに接続
されている。
【0055】上記した構成において、デマルチプレクサ
35は受信した信号を線形予測パラメータαと、適応コ
ードブック30の遅延L及びゲインβと、確率コードブ
ック36のインデックスi及びゲインγと、音声判別情
報v/uvとに分解して、分解された線形予測パラメー
タαを合成フィルタ34に、遅延Lとゲインβを各々適
応コードブック30と乗算器31に、インデックスiと
ゲインγを各々確率コードブック36と乗算器37に、
音声判別情報v/uvをスイッチ32に出力する。
35は受信した信号を線形予測パラメータαと、適応コ
ードブック30の遅延L及びゲインβと、確率コードブ
ック36のインデックスi及びゲインγと、音声判別情
報v/uvとに分解して、分解された線形予測パラメー
タαを合成フィルタ34に、遅延Lとゲインβを各々適
応コードブック30と乗算器31に、インデックスiと
ゲインγを各々確率コードブック36と乗算器37に、
音声判別情報v/uvをスイッチ32に出力する。
【0056】そして、デマルチプレクサ35から出力さ
れた音声判別情報v/uvに基づいてスイッチ32の開
閉動作を制御する。すなわち、音声判別情報v/uvが
音声信号であることを示していればスイッチ32を閉じ
て適応コードブック30からの情報を使用する。一方、
音声判別情報v/uvが非音声信号であることを示して
いればスイッチ32を開いて適応コードブック30を未
使用とする。
れた音声判別情報v/uvに基づいてスイッチ32の開
閉動作を制御する。すなわち、音声判別情報v/uvが
音声信号であることを示していればスイッチ32を閉じ
て適応コードブック30からの情報を使用する。一方、
音声判別情報v/uvが非音声信号であることを示して
いればスイッチ32を開いて適応コードブック30を未
使用とする。
【0057】また、デマルチプレクサ35から出力され
た適応コードブック30の遅延Lに基づいて適応コード
ブック30の適応コードベクトルを選択する。ここで適
応コードブック30は図1に示す音声符号化装置におけ
る適応コードブック1の内容と同じ内容を有する。すな
わち、適応コードブック30には、遅延回路40を介し
て過去の駆動音源信号が入力される。乗算器31は受信
したゲインβにより、入力された適応コードベクトルを
増幅し、加算器33に送出する。
た適応コードブック30の遅延Lに基づいて適応コード
ブック30の適応コードベクトルを選択する。ここで適
応コードブック30は図1に示す音声符号化装置におけ
る適応コードブック1の内容と同じ内容を有する。すな
わち、適応コードブック30には、遅延回路40を介し
て過去の駆動音源信号が入力される。乗算器31は受信
したゲインβにより、入力された適応コードベクトルを
増幅し、加算器33に送出する。
【0058】デマルチプレクサ35から出力された確率
コードブック36のインデックスiに基づいて確率コー
ドブック36の確率コードベクトルを選択する。ここで
確率コードブック36は図1に示す音声符号化装置にお
ける確率コードブック4の内容と同じ内容を有する。乗
算器37は受信したゲインγにより、入力された確率コ
ードベクトルを増幅し、加算器33に送出する。
コードブック36のインデックスiに基づいて確率コー
ドブック36の確率コードベクトルを選択する。ここで
確率コードブック36は図1に示す音声符号化装置にお
ける確率コードブック4の内容と同じ内容を有する。乗
算器37は受信したゲインγにより、入力された確率コ
ードベクトルを増幅し、加算器33に送出する。
【0059】加算器33は増幅された適応コードベクト
ルと、増幅された確率コードベクトルとを加算して合成
フィルタ34および遅延回路40に送出する。合成フィ
ルタ34は受信した線形予測パラメータαを係数として
合成処理を行い、合成音声信号を出力する。
ルと、増幅された確率コードベクトルとを加算して合成
フィルタ34および遅延回路40に送出する。合成フィ
ルタ34は受信した線形予測パラメータαを係数として
合成処理を行い、合成音声信号を出力する。
【0060】上記したように本実施形態では、音声区間
と非音声区間との間でピッチ強調処理におけるゲイン調
整の割合を切り替えている。すなわち、入力信号が音声
信号であると判別されたときには通常のピッチ強調処理
を行なうが、非音声信号であると判別されたときには確
率コードブックのゲインを減衰させている。したがっ
て、雑音環境下においても音声信号を良好に符号化して
高音質の音声信号を得ることができる。また、音声判別
器11内の閾値決定回路124によって符号化開始時の
フレームエネルギーに応じて判別閾値を決定するので、
背景雑音の大きさに適応して閾値が決定されることにな
り、より精度よく音声/非音声の判別ができる。
と非音声区間との間でピッチ強調処理におけるゲイン調
整の割合を切り替えている。すなわち、入力信号が音声
信号であると判別されたときには通常のピッチ強調処理
を行なうが、非音声信号であると判別されたときには確
率コードブックのゲインを減衰させている。したがっ
て、雑音環境下においても音声信号を良好に符号化して
高音質の音声信号を得ることができる。また、音声判別
器11内の閾値決定回路124によって符号化開始時の
フレームエネルギーに応じて判別閾値を決定するので、
背景雑音の大きさに適応して閾値が決定されることにな
り、より精度よく音声/非音声の判別ができる。
【0061】
【発明の効果】請求項1、2、3に記載の発明によれ
ば、雑音環境下においても音声信号を良好に符号化して
高音質の音声信号を得ることができる効果を奏する。
ば、雑音環境下においても音声信号を良好に符号化して
高音質の音声信号を得ることができる効果を奏する。
【0062】また、請求項4記載の発明によれば、請求
項1記載の発明の効果に加えて、より精度よく音声/非
音声の判別ができる効果を奏する。
項1記載の発明の効果に加えて、より精度よく音声/非
音声の判別ができる効果を奏する。
【図1】本発明が適用される音声符号化装置の構成を示
すブロック図である。
すブロック図である。
【図2】図1に示す音声判別器の構成を示す図である。
【図3】背景雑音エネルギーと閾値との関係を示す図で
ある。
ある。
【図4】一般化相互相関と確率コードブックのゲインの
倍率との関係を示す図である。
倍率との関係を示す図である。
【図5】図1に示す音声符号化装置に対応する音声復号
化装置の構成を示す図である。
化装置の構成を示す図である。
【図6】従来の音声符号化装置のブロック図である。
【図7】図6に示す音声符号化装置に対応する音声復号
化装置の構成を示す図である。
化装置の構成を示す図である。
1…適応コードブック、2、5…乗算器、3…加算器、
4…確率コードブック、6、19…スイッチ、7…遅延
回路、8…合成フィルタ、9…バッファメモリ、10…
ピッチ周期性分析器、11…音声判別器、12…減算
器、13…聴感重み付けフィルタ、14…誤差評価器、
15…ゲイン調整器、16…LPC分析器、17…サブ
フレーム分割器、18…マルチプレクサ。
4…確率コードブック、6、19…スイッチ、7…遅延
回路、8…合成フィルタ、9…バッファメモリ、10…
ピッチ周期性分析器、11…音声判別器、12…減算
器、13…聴感重み付けフィルタ、14…誤差評価器、
15…ゲイン調整器、16…LPC分析器、17…サブ
フレーム分割器、18…マルチプレクサ。
Claims (4)
- 【請求項1】 あらかじめ定められたフレーム間隔に分
割されたフレーム単位の入力信号が音声信号か非音声信
号かを判別する音声判別手段と、 上記入力信号を分析し、そのスペクトルパラメータを出
力する線形予測分析手段と、 上記入力信号のフレーム間隔をさらに所定のサブフレー
ム間隔に分割するサブフレーム分割手段と、 過去の音源信号に遅延を与えて作成した信号をあらかじ
め複数記憶している適応コードブックと、 上記サブフレーム間隔の雑音信号波形を複数記憶してい
る確率コードブックと、 上記確率コードブックと上記適応コードブックの両方も
しくは一方から出力される信号に基づき駆動音源信号を
生成する駆動音源信号生成手段と、 上記スペクトルパラメータをもとに、上記確率コードブ
ックと上記適応コードブックから出力される信号を駆動
音源信号として音声を合成する合成フィルタと、 入力信号に対する合成信号の歪みを最小とする適応コー
ドブックの遅延、確率コードブックのインデックス、お
よびそれぞれのゲインに対応する符号を出力する誤差最
小化手段と、 入力信号のピッチ周期性を分析するピッチ周期性分析手
段と、 上記音声判別手段の判別結果および上記ピッチ周期性分
析手段の分析結果に応じて、上記確率コードブックと上
記適応コードブックの両方もしくは一方のゲインを増減
させるゲイン調整手段と、 を具備したことを特徴とする音声符号化装置。 - 【請求項2】 上記駆動音源信号生成手段は、上記音声
判別手段が入力信号を音声信号と判別したときには、上
記確率コードブックと上記適応コードブックから出力さ
れる信号から駆動音源信号を生成し、上記音声判別手段
が入力信号を非音声信号と判別したときには、上記確率
コードブックのみから出力される信号から駆動音源信号
を生成することを特徴とする請求項1記載の音声符号化
装置。 - 【請求項3】 上記ゲイン調整手段は、上記音声判別手
段が入力信号を非音声信号と判別したときには、音声信
号と判別したときに対して所定の割合で確率コードブッ
クと適応コードブックの両方または一方のゲインを減衰
させることを特徴とする請求項1記載の音声符号化装
置。 - 【請求項4】 上記音声判別手段は、フレーム毎に入力
信号のエネルギーの大きさによって音声/非音声を判別
するものであって、符号化開始時のフレームエネルギー
に応じて判別閾値を決定する閾値決定手段を具備し、現
在のフレームエネルギーと符号化開始時のフレームエネ
ルギーとの差が、上記閾値決定手段により決定された判
別閾値より大きければ音声、小さければ非音声とするこ
とを特徴とする請求項1、2または3記載の音声符号化
装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7352199A JPH09185396A (ja) | 1995-12-28 | 1995-12-28 | 音声符号化装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7352199A JPH09185396A (ja) | 1995-12-28 | 1995-12-28 | 音声符号化装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH09185396A true JPH09185396A (ja) | 1997-07-15 |
Family
ID=18422452
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP7352199A Withdrawn JPH09185396A (ja) | 1995-12-28 | 1995-12-28 | 音声符号化装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH09185396A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2001003115A1 (en) * | 1999-06-30 | 2001-01-11 | Matsushita Electric Industrial Co., Ltd. | Audio decoder and coding error compensating method |
| US6266632B1 (en) | 1998-03-16 | 2001-07-24 | Matsushita Graphic Communication Systems, Inc. | Speech decoding apparatus and speech decoding method using energy of excitation parameter |
-
1995
- 1995-12-28 JP JP7352199A patent/JPH09185396A/ja not_active Withdrawn
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6266632B1 (en) | 1998-03-16 | 2001-07-24 | Matsushita Graphic Communication Systems, Inc. | Speech decoding apparatus and speech decoding method using energy of excitation parameter |
| WO2001003115A1 (en) * | 1999-06-30 | 2001-01-11 | Matsushita Electric Industrial Co., Ltd. | Audio decoder and coding error compensating method |
| US7171354B1 (en) | 1999-06-30 | 2007-01-30 | Matsushita Electric Industrial Co., Ltd. | Audio decoder and coding error compensating method |
| US7499853B2 (en) | 1999-06-30 | 2009-03-03 | Panasonic Corporation | Speech decoder and code error compensation method |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP1338003B1 (en) | Gains quantization for a celp speech coder | |
| KR100487943B1 (ko) | 음성 코딩 | |
| US6272459B1 (en) | Voice signal coding apparatus | |
| JP3254687B2 (ja) | 音声符号化方式 | |
| US5659659A (en) | Speech compressor using trellis encoding and linear prediction | |
| US6052659A (en) | Nonlinear filter for noise suppression in linear prediction speech processing devices | |
| JP3357795B2 (ja) | 音声符号化方法および装置 | |
| US6246979B1 (en) | Method for voice signal coding and/or decoding by means of a long term prediction and a multipulse excitation signal | |
| JP2001134296A (ja) | 音声信号復号方法及び装置と音声信号符号化復号方法及び装置と記録媒体 | |
| EP1073039A2 (en) | Speech decoder with gain processing | |
| EP0856185B1 (en) | Repetitive sound compression system | |
| JP3266178B2 (ja) | 音声符号化装置 | |
| JP4679513B2 (ja) | 階層符号化装置および階層符号化方法 | |
| WO1997015046A9 (en) | Repetitive sound compression system | |
| JPH09185397A (ja) | 音声情報記録装置 | |
| JP3353852B2 (ja) | 音声の符号化方法 | |
| JP2658816B2 (ja) | 音声のピッチ符号化装置 | |
| JP3329216B2 (ja) | 音声符号化装置及び音声復号装置 | |
| JP3490324B2 (ja) | 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体 | |
| JP3417362B2 (ja) | 音声信号復号方法及び音声信号符号化復号方法 | |
| JPH09185396A (ja) | 音声符号化装置 | |
| JP3510643B2 (ja) | 音声信号のピッチ周期処理方法 | |
| JP3496618B2 (ja) | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 | |
| KR100718487B1 (ko) | 디지털 음성 코더들에서의 고조파 잡음 가중 | |
| JP3607774B2 (ja) | 音声符号化装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20030304 |