JPH056197A - 音声合成装置用ポストフイルタ - Google Patents
音声合成装置用ポストフイルタInfo
- Publication number
- JPH056197A JPH056197A JP3158670A JP15867091A JPH056197A JP H056197 A JPH056197 A JP H056197A JP 3158670 A JP3158670 A JP 3158670A JP 15867091 A JP15867091 A JP 15867091A JP H056197 A JPH056197 A JP H056197A
- Authority
- JP
- Japan
- Prior art keywords
- amplitude
- scaling factor
- signal
- output signal
- coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】
【目的】 増大した振幅を抑えて合成信号の品質の劣化
を防止できる音声合成用ポストフィルタを提供する。 【構成】 合成信号をフィルタリングするフィルタリン
グ部11と、フィルタリング部11からの出力信号及び合成
信号に基づいてスケ―リングファクタを算出するスケ―
リングファクタ計算部13と、出力信号の振幅を検出し検
出結果に基づいて出力信号の振幅が所定の振幅値を越え
ないようにスケ―リングファクタの値を調整する振幅検
出部14と、出力信号と調整されたスケ―リングファクタ
との積を算出する乗算器15とを備えている。
を防止できる音声合成用ポストフィルタを提供する。 【構成】 合成信号をフィルタリングするフィルタリン
グ部11と、フィルタリング部11からの出力信号及び合成
信号に基づいてスケ―リングファクタを算出するスケ―
リングファクタ計算部13と、出力信号の振幅を検出し検
出結果に基づいて出力信号の振幅が所定の振幅値を越え
ないようにスケ―リングファクタの値を調整する振幅検
出部14と、出力信号と調整されたスケ―リングファクタ
との積を算出する乗算器15とを備えている。
Description
【0001】
【産業上の利用分野】本発明は、音声合成装置に係わ
り、特にメロディ等音声以外の音を劣化させないで再生
する音声合成装置用ポストフィルタに関する。
り、特にメロディ等音声以外の音を劣化させないで再生
する音声合成装置用ポストフィルタに関する。
【0002】
【従来の技術】一般に、圧縮及び符号化された音声を再
生する音声合成装置には、合成された音声の品質を高め
るために音声合成装置用ポストフィルタ(以下、ポスト
フィルタと称する)が用いられている。
生する音声合成装置には、合成された音声の品質を高め
るために音声合成装置用ポストフィルタ(以下、ポスト
フィルタと称する)が用いられている。
【0003】このポストフィルタは、聴覚のマスキング
特性を利用したノイズシェ―ピング機能を実現するため
の一手段であり、コ−ド・エキサイテド・リニア・プレ
ディクション(Code-Excited Linear Prediction)(以
下、CELPと称する)等の符号化方法を用いた音声合
成装置に使用されている。
特性を利用したノイズシェ―ピング機能を実現するため
の一手段であり、コ−ド・エキサイテド・リニア・プレ
ディクション(Code-Excited Linear Prediction)(以
下、CELPと称する)等の符号化方法を用いた音声合
成装置に使用されている。
【0004】ノイズシェ―ピングとは、本来はほぼ平坦
となる合成音声と原音との間で生ずる誤差信号のスペク
トル形状を、原音のスペクトル形状に近くなるように処
理して、スペクトルの谷間での原音と誤差とのエネルギ
―差を広げて、マスキングによりノイズの知覚を抑える
機能をいう。
となる合成音声と原音との間で生ずる誤差信号のスペク
トル形状を、原音のスペクトル形状に近くなるように処
理して、スペクトルの谷間での原音と誤差とのエネルギ
―差を広げて、マスキングによりノイズの知覚を抑える
機能をいう。
【0005】上述のポストフィルタは、通常、音声合成
装置の復号化器の直後に配置されている。
装置の復号化器の直後に配置されている。
【0006】一般に、ポストフィルタの伝達関数H
(z)は、次式で表される。
(z)は、次式で表される。
【0007】
【数1】
【0008】ここで、1/P(z)は復号化器で使われ
るスペクトル包絡合成フィルタの伝達関数であり、分母
のP(z)は短期フイルタ、スペクトル包絡予測フィル
タまたは逆フィルタと呼ばれる(以下、逆フィルタと称
する)。
るスペクトル包絡合成フィルタの伝達関数であり、分母
のP(z)は短期フイルタ、スペクトル包絡予測フィル
タまたは逆フィルタと呼ばれる(以下、逆フィルタと称
する)。
【0009】
【数2】
【0010】ここで、αi は、iを正の整数とするi次
線形予測係数である(pを正の整数とすると予測次数は
pで表される)。この逆フィルタP(z)のスペクトル
のピ―ク部分(フォルマント)の帯域を広げた特性を持
つものが、P′(z)、P″(z)であり、P′(z)
の方がP″(z)よりフォルマントの帯域の広げ方が大
きい。
線形予測係数である(pを正の整数とすると予測次数は
pで表される)。この逆フィルタP(z)のスペクトル
のピ―ク部分(フォルマント)の帯域を広げた特性を持
つものが、P′(z)、P″(z)であり、P′(z)
の方がP″(z)よりフォルマントの帯域の広げ方が大
きい。
【0011】上記フイルタにより、復号化器の直後の合
成音声は、フォルマントが少し強調されて、原音との誤
差のスペクトルもこのフォルマント部分にエネルギ―が
集まって誤差スペクトルの形状が原音のスペクトル形状
に近付く。
成音声は、フォルマントが少し強調されて、原音との誤
差のスペクトルもこのフォルマント部分にエネルギ―が
集まって誤差スペクトルの形状が原音のスペクトル形状
に近付く。
【0012】一般的なP′(z)、P″(z)は、次式
でそれぞれ表される。
でそれぞれ表される。
【0013】
【数3】
【0014】
【数4】
【0015】上記の関係式は、例えば、ジェ−・エイチ
・チェイン及びエイ・ガ−ショによる「アダプティブ・
ポストフィルタを用いた48800bpsにおける実時間ベクト
ルAPCスピ−チ・コ−ディング」,アコ−スティッ
ク、スピ−チ及びシグナルプロセシング・IEEEインタ−
ナショナル・カンファレンス・プロシ−ディングズ,p
p.51.3.1-51.3.4,1987年4月,(J. H. Chain ,A.Ger
sho,“Real-Time Vector APC Speech Coding at 48800
bps with Adaptive Postfilter”,Proc. IEEE Int. C
onf. on Acoustics, Speech and Signal Processing,p
p.51.3.1-51.3.4,April ,1987)に示されている。
・チェイン及びエイ・ガ−ショによる「アダプティブ・
ポストフィルタを用いた48800bpsにおける実時間ベクト
ルAPCスピ−チ・コ−ディング」,アコ−スティッ
ク、スピ−チ及びシグナルプロセシング・IEEEインタ−
ナショナル・カンファレンス・プロシ−ディングズ,p
p.51.3.1-51.3.4,1987年4月,(J. H. Chain ,A.Ger
sho,“Real-Time Vector APC Speech Coding at 48800
bps with Adaptive Postfilter”,Proc. IEEE Int. C
onf. on Acoustics, Speech and Signal Processing,p
p.51.3.1-51.3.4,April ,1987)に示されている。
【0016】このポストフィルタを用いる音声合成装置
の復号化方法は、一定時間(通常、フレ―ムと呼ぶ)ご
とに、線形予測係数を受け取り、場合によってはフレ―
ムを分割して(分割した区間をサブフレ―ムと呼ぶ)サ
ブフレ―ムごとにフレ―ム単位で受け取った線形予測係
数を補間し、この補間した線形予測係数を用いて音声を
合成する。
の復号化方法は、一定時間(通常、フレ―ムと呼ぶ)ご
とに、線形予測係数を受け取り、場合によってはフレ―
ムを分割して(分割した区間をサブフレ―ムと呼ぶ)サ
ブフレ―ムごとにフレ―ム単位で受け取った線形予測係
数を補間し、この補間した線形予測係数を用いて音声を
合成する。
【0017】なお、ポストフィルタの係数は補間した線
形予測係数から求められと共に、ポストフィルタの利得
は線形予測係数により変化する。
形予測係数から求められと共に、ポストフィルタの利得
は線形予測係数により変化する。
【0018】上述したポストフィルタは、利得により増
幅または減衰した合成音声のエネルギ―をポストフィル
タに通す前と同じ状態にするために、実際には自動利得
制御(オ−トマティック・ゲイン・コントロ−ル(Auto
maticGain Control),以下、AGCと称する)機能を
有している。
幅または減衰した合成音声のエネルギ―をポストフィル
タに通す前と同じ状態にするために、実際には自動利得
制御(オ−トマティック・ゲイン・コントロ−ル(Auto
maticGain Control),以下、AGCと称する)機能を
有している。
【0019】次に、上記AGC機能を実現する一方法を
述べる。
述べる。
【0020】この方法は、アイ・エイ・ジャ−ソン及び
エム・エイ・ジャイスクによる「 8kbpsにおけるベクト
ル・サム・エキサイティド・リニア・プレディクション
(VSELP)・スピ−チ・コ−ディング」,アコ−ス
ティック、スピ−チ及びシグナルプロセシング・IEEEイ
ンタ−ナショナル・カンファレンス・プロシ−ディング
ズ,pp.461-464,1990年4月,(I.A. Gerson ,M.A.Ja
isuk,“Vector Sum Excited Linear Prediction (VSEL
P) Speech Coding at 8kbps ”,Proc. IEEE Int. Con
f. on Acoustics,Speech and Signal Processing,pp.
461-464,April,1990)に示されている。
エム・エイ・ジャイスクによる「 8kbpsにおけるベクト
ル・サム・エキサイティド・リニア・プレディクション
(VSELP)・スピ−チ・コ−ディング」,アコ−ス
ティック、スピ−チ及びシグナルプロセシング・IEEEイ
ンタ−ナショナル・カンファレンス・プロシ−ディング
ズ,pp.461-464,1990年4月,(I.A. Gerson ,M.A.Ja
isuk,“Vector Sum Excited Linear Prediction (VSEL
P) Speech Coding at 8kbps ”,Proc. IEEE Int. Con
f. on Acoustics,Speech and Signal Processing,pp.
461-464,April,1990)に示されている。
【0021】この方法は、まず、スケ―リングファクタ
Sを求め、求まったスケ―リングファクタSをポストフ
ィルタ通過直後の信号に掛けることにより、サブフレ―
ムまたはフレ−ム内のポストフイルタ通過前後のエネル
ギ―を求める。そして、サブフレ―ム(フレ−ム)内の
ポストフイルタ通過前後のエネルギ―の平方根の比を仮
のスケ―リングフアクタS′として求める。
Sを求め、求まったスケ―リングファクタSをポストフ
ィルタ通過直後の信号に掛けることにより、サブフレ―
ムまたはフレ−ム内のポストフイルタ通過前後のエネル
ギ―を求める。そして、サブフレ―ム(フレ−ム)内の
ポストフイルタ通過前後のエネルギ―の平方根の比を仮
のスケ―リングフアクタS′として求める。
【0022】仮のスケ―レングフアクタS′をそのまま
AGCに利用すると、サブフレ―ム(フレ−ム)によっ
て仮のスケ―リングファクタS′が大きく異なる場合が
あるので隣接するサブフレ―ム(フレ−ム)の境界で合
成音声の不連続性が生じる。不連続性が生じると、不連
続性が生じた箇所で合成音声に雑音が知覚されてしまう
ので、仮のスケ―リングファクタS′を1次低域通過フ
イルタにかけて、徐々にスケ―リングフィルタを変えて
使用する。この関係を次式に示す。
AGCに利用すると、サブフレ―ム(フレ−ム)によっ
て仮のスケ―リングファクタS′が大きく異なる場合が
あるので隣接するサブフレ―ム(フレ−ム)の境界で合
成音声の不連続性が生じる。不連続性が生じると、不連
続性が生じた箇所で合成音声に雑音が知覚されてしまう
ので、仮のスケ―リングファクタS′を1次低域通過フ
イルタにかけて、徐々にスケ―リングフィルタを変えて
使用する。この関係を次式に示す。
【0023】
【数5】
【0024】ここで、n(nは正の整数)はサブフレ―
ム(フレ−ム)内でのサンプリング時点、N(Nは正の
整数)はサブフレ―ム(フレ−ム)内のサンプル数であ
り、S(0)を求めるときの右辺のS(-1)は前サブフ
レ―ム(前フレ−ム)のS(N-1)とする。スケ―リン
グファクタS(n)の急激な変動を抑えるため、定数ζ
は通常、1に近い値を取る。
ム(フレ−ム)内でのサンプリング時点、N(Nは正の
整数)はサブフレ―ム(フレ−ム)内のサンプル数であ
り、S(0)を求めるときの右辺のS(-1)は前サブフ
レ―ム(前フレ−ム)のS(N-1)とする。スケ―リン
グファクタS(n)の急激な変動を抑えるため、定数ζ
は通常、1に近い値を取る。
【0025】各種電話サ―ビスでは、保留時にメロディ
を流したり、ダイヤリングにデュアル・ト−ン・マルチ
・フリクエンシ(Dual Tone Multi-Frequency)(以下、
DTMFと称する)信号を用いていおり、上述したAG
C機能付きのポストフィルタを再生側に備えているVS
ELPの符号化方法を用いた音声合成装置が電話に用い
られるとき、メロディ等のト―ン信号も音声と同様に再
生処理を行う。
を流したり、ダイヤリングにデュアル・ト−ン・マルチ
・フリクエンシ(Dual Tone Multi-Frequency)(以下、
DTMFと称する)信号を用いていおり、上述したAG
C機能付きのポストフィルタを再生側に備えているVS
ELPの符号化方法を用いた音声合成装置が電話に用い
られるとき、メロディ等のト―ン信号も音声と同様に再
生処理を行う。
【0026】
【発明が解決しようとする課題】しかし、上述した従来
の音声合成装置では、ト―ンの変り目や無音からの立上
り部分で線形予測係数の値が大きく異なることがあり、
同時にポストフィルタの利得も大きく変化する。このよ
うな場合には、サブフレ―ム(フレ−ム)の開始時点付
近から、ポストフィルタによってト―ン信号の振幅が増
大することがあり、このときに仮のスケ―リングファク
タS′が、前のサブフレ―ム(フレ−ム)よりもかなり
小さくなるが、実際のスケ―リングファクタS(n)の
nが小さい時点では、スケ―リングファクタS(n)が
仮のスケ―リングファクタS′と大きく値が異なってし
まうために、スケ―リングファクタS(n)ではト―ン
信号の増大した振幅を抑えきれなくなる。
の音声合成装置では、ト―ンの変り目や無音からの立上
り部分で線形予測係数の値が大きく異なることがあり、
同時にポストフィルタの利得も大きく変化する。このよ
うな場合には、サブフレ―ム(フレ−ム)の開始時点付
近から、ポストフィルタによってト―ン信号の振幅が増
大することがあり、このときに仮のスケ―リングファク
タS′が、前のサブフレ―ム(フレ−ム)よりもかなり
小さくなるが、実際のスケ―リングファクタS(n)の
nが小さい時点では、スケ―リングファクタS(n)が
仮のスケ―リングファクタS′と大きく値が異なってし
まうために、スケ―リングファクタS(n)ではト―ン
信号の増大した振幅を抑えきれなくなる。
【0027】この例を図2に示す。図2(a)は音声合
成装置のポストフィルタを通す直前の合成ト−ン信号、
(b)、(c)はポストフィルタ通過後の合成ト−ン信
号で、(b)はAGC前、(c)はAGC後の波形であ
る。(d)は(c)におけるAGCのスケ−リングファ
クタS(n)と仮のスケ−リングファクタS′を示す。
ポストフィルタにより、(b)のように振幅が(a)に
比べ急激に増大した時、(d)のように仮のスケ−リン
グファクタS′がサブフレ−ム又はフレ−ムの開始点n
=0でのスケ−リングファクタS(0)と大きく異なっ
ており、スケ−リングファクタS(n)が仮のスケ−リ
ングファクタS′に近付くのに時間がかかるため、
(b)の増大した振幅はAGCは抑えきれないため
(c)のように振幅が大きく変化した波形になってしま
う。
成装置のポストフィルタを通す直前の合成ト−ン信号、
(b)、(c)はポストフィルタ通過後の合成ト−ン信
号で、(b)はAGC前、(c)はAGC後の波形であ
る。(d)は(c)におけるAGCのスケ−リングファ
クタS(n)と仮のスケ−リングファクタS′を示す。
ポストフィルタにより、(b)のように振幅が(a)に
比べ急激に増大した時、(d)のように仮のスケ−リン
グファクタS′がサブフレ−ム又はフレ−ムの開始点n
=0でのスケ−リングファクタS(0)と大きく異なっ
ており、スケ−リングファクタS(n)が仮のスケ−リ
ングファクタS′に近付くのに時間がかかるため、
(b)の増大した振幅はAGCは抑えきれないため
(c)のように振幅が大きく変化した波形になってしま
う。
【0028】合成信号の振幅が大きくなると振幅値がD
/A変換できる範囲を超えてしまう場合があり、このと
きに大きな「ポツ」という音が聞えてしまい、また、D
/A変換の範囲内であっても合成信号の波形は原音の波
形より大きく異なってしまうので合成信号の品質が劣化
するという問題点がある。
/A変換できる範囲を超えてしまう場合があり、このと
きに大きな「ポツ」という音が聞えてしまい、また、D
/A変換の範囲内であっても合成信号の波形は原音の波
形より大きく異なってしまうので合成信号の品質が劣化
するという問題点がある。
【0029】本発明は、上述した従来の音声合成装置に
おける問題点に鑑み、合成信号の品質の劣化を防止でき
る音声合成装置用ポストフィルタを提供する。
おける問題点に鑑み、合成信号の品質の劣化を防止でき
る音声合成装置用ポストフィルタを提供する。
【0030】
【課題を解決するための手段】本発明は、合成信号をフ
ィルタリングするフィルタリング手段と、フィルタリン
グ手段からの出力信号及び合成信号に基づいてスケ―リ
ング係数を算出する係数算出手段と、出力信号の振幅を
検出し検出結果に基づいて出力信号の振幅が所定の振幅
値を越えないようにスケ―リング係数の値を調整する振
幅検出手段と、出力信号と調整されたスケ―リング係数
との積を算出する演算手段とを備えている音声合成装置
用ポストフィルタによって達成される。
ィルタリングするフィルタリング手段と、フィルタリン
グ手段からの出力信号及び合成信号に基づいてスケ―リ
ング係数を算出する係数算出手段と、出力信号の振幅を
検出し検出結果に基づいて出力信号の振幅が所定の振幅
値を越えないようにスケ―リング係数の値を調整する振
幅検出手段と、出力信号と調整されたスケ―リング係数
との積を算出する演算手段とを備えている音声合成装置
用ポストフィルタによって達成される。
【0031】
【作用】本発明の音声合成用ポストフィルタによれば、
増幅手段は合成信号を増幅し、係数算出手段は増幅手段
からの出力信号及び合成信号に基づいてスケ―リング係
数を算出し、振幅検出手段は出力信号の振幅を検出し検
出結果に基づいて出力信号の振幅が所定の振幅値を越え
ないようにスケ―リング係数の値を調整し、演算手段は
出力信号と調整されたスケ―リング係数との積を算出す
る。
増幅手段は合成信号を増幅し、係数算出手段は増幅手段
からの出力信号及び合成信号に基づいてスケ―リング係
数を算出し、振幅検出手段は出力信号の振幅を検出し検
出結果に基づいて出力信号の振幅が所定の振幅値を越え
ないようにスケ―リング係数の値を調整し、演算手段は
出力信号と調整されたスケ―リング係数との積を算出す
る。
【0032】
【実施例】以下、図面を参照して本発明の音声合成装置
用ポストフィルタにおける実施例を詳述する。
用ポストフィルタにおける実施例を詳述する。
【0033】図1は、本発明の音声合成用ポストフィル
タにおける一実施例の構成を示す。図1のポストフィル
タ10は、合成信号をフィルタリングする手段であるフィ
ルタリング部11、フィルタリング部11の係数を求める係
数計算部12、フィルタリング部11の出力とフィルタリン
グ部11を通る前の信号とのエネルギ―を計算してスケ―
リング係数(以下、スケ―リングフアクタと称する)を
求める係数算出手段であるスケ―リングファクタ計算部
13、AGCでフィルタリング部11の出力信号の振幅を検
出する振幅検出手段である振幅検出部14、フィルタリン
グ部11の出力信号とスケ―リングファクタ計算部13から
送られてきたスケ―リングファクトとの積を算出する演
算手段である乗算器15によって構成されている。
タにおける一実施例の構成を示す。図1のポストフィル
タ10は、合成信号をフィルタリングする手段であるフィ
ルタリング部11、フィルタリング部11の係数を求める係
数計算部12、フィルタリング部11の出力とフィルタリン
グ部11を通る前の信号とのエネルギ―を計算してスケ―
リング係数(以下、スケ―リングフアクタと称する)を
求める係数算出手段であるスケ―リングファクタ計算部
13、AGCでフィルタリング部11の出力信号の振幅を検
出する振幅検出手段である振幅検出部14、フィルタリン
グ部11の出力信号とスケ―リングファクタ計算部13から
送られてきたスケ―リングファクトとの積を算出する演
算手段である乗算器15によって構成されている。
【0034】なお、AGCの機能はスケ―リングファク
タ計算部13、振幅検出部14及び乗算器15によって実現さ
れる。
タ計算部13、振幅検出部14及び乗算器15によって実現さ
れる。
【0035】次に、上記各構成部分を詳述する。
【0036】フィルタリング部11は、入力信号のスペク
トルピ―クを強調させる伝達関数を有する。
トルピ―クを強調させる伝達関数を有する。
【0037】係数計算部12は、フィルタリング部11のフ
ィルタ係数を線形予測係数から算出する。なお、フィル
タ係数はサブフレ―ムまたはフレ−ム単位で更新され
る。
ィルタ係数を線形予測係数から算出する。なお、フィル
タ係数はサブフレ―ムまたはフレ−ム単位で更新され
る。
【0038】スケ―リングファクタ計算部13は、フィル
タリング部11で増幅または減衰した信号のエネルギ−を
フィルタリング部11を通す前のエネルギ−とほぼ等しく
するためのスケ―リングファクタを計算する。
タリング部11で増幅または減衰した信号のエネルギ−を
フィルタリング部11を通す前のエネルギ−とほぼ等しく
するためのスケ―リングファクタを計算する。
【0039】振幅検出部14は、スケ―リングファクタ計
算部13のサンプル時点nごとに変化するスケ―リングフ
ァクタの速度を制御し、通常のAGCではフィルタリン
グ部11の出力信号の振幅の増大を抑えきれない場合でも
この振幅の増大を押え込むように構成されている。
算部13のサンプル時点nごとに変化するスケ―リングフ
ァクタの速度を制御し、通常のAGCではフィルタリン
グ部11の出力信号の振幅の増大を抑えきれない場合でも
この振幅の増大を押え込むように構成されている。
【0040】振幅検出部14は、ト―ン信号の立上り部分
等を再生するときなどにおいて、フィルタリング部11の
出力信号の振幅が増大したときに、通常のAGCにより
増大した振幅を抑えられるかどうかを検出する。
等を再生するときなどにおいて、フィルタリング部11の
出力信号の振幅が増大したときに、通常のAGCにより
増大した振幅を抑えられるかどうかを検出する。
【0041】スケ―リングファクタ計算部13では、振幅
検出部14の判定結果より、低域通過フィルタの変数ζを
変える。そして、仮のスケ―リングファクタS′を1次
の低域通過フィルタ(図示省略)に掛けて、実際のスケ
―リングファクタS(n)を次式により求める。
検出部14の判定結果より、低域通過フィルタの変数ζを
変える。そして、仮のスケ―リングファクタS′を1次
の低域通過フィルタ(図示省略)に掛けて、実際のスケ
―リングファクタS(n)を次式により求める。
【0042】
【数6】
【0043】このスケ―リングファクタS(n)をサン
プル時点n(nは正の整数)ごとに乗算器15に送る。
プル時点n(nは正の整数)ごとに乗算器15に送る。
【0044】次に、図3を参照して、上記音声合成用ポ
ストフィルト動作、特にスケ―リングファクタを求める
ときの動作を説明する。
ストフィルト動作、特にスケ―リングファクタを求める
ときの動作を説明する。
【0045】まず、サブフレ―ム(フレ−ム)の開始時
に、フィルタリング部11の入出力信号のサブフレ―ム
(フレ−ム)内のエネルギ―(各信号のサブフレ―ム
(フレ−ム)内の振幅の2乗和)を求め、(入力信号の
エネルギ―)/(出力信号のエネルギ―)の平方根を計
算することにより仮のスケ―リングファクタS′を求め
(ステップS1)、スケ―リングファクタ計算部13で仮
のスケ―リングファクタS′が求められた時点で、この
仮のスケ―リングファクタS′と前サブフレ―ム(フレ
−ム)終端のスケ―リングファクタS(N-1)との比
{S′/S(N-1)}を計算して、比{S′/S(N-
1)}と閾値θとが関係式{S′/S(N-1)}<θを
満足するか否か判定し(ステップS2)、上記ステップ
S2でYESのときには、振幅が増大しても通常のAG
Cではこの増大した振幅を抑えきれないと判定する(ス
テップS3)。即ち、仮のスケ―リングファクタS′
が、前サブフレ―ム(前フレ−ム)終端のスケ―リング
ファクタS(N-1)よりある程度小さいときに、1に近
い値を有する変数ζを持つ上記スケ―リングファクタの
低域通過フイルタでは、スケ―リングファクタS(n)
が、仮のスケ―リングファクタS′に近付くのに時間が
かかってしまうのでサブフレ―ム(フレ−ム)の前部で
は増大した振幅をS′よりも大きいS(n)では抑えき
れないとみなす。即ち、振幅検出部14の検出結果によ
り、出力信号の増大した振幅を抑えきれないと判定した
ときには変数ζを0または0に近い値に設定し(ステッ
プS4)、スケ―リングファクタS(n)を計算する
(ステップS5)。n=0またはnが小さい時点でスケ
―リングファクタS(n)は仮のスケ―リングファクタ
S′の値になるので、AGCは増大した振幅を抑えるこ
とができる。
に、フィルタリング部11の入出力信号のサブフレ―ム
(フレ−ム)内のエネルギ―(各信号のサブフレ―ム
(フレ−ム)内の振幅の2乗和)を求め、(入力信号の
エネルギ―)/(出力信号のエネルギ―)の平方根を計
算することにより仮のスケ―リングファクタS′を求め
(ステップS1)、スケ―リングファクタ計算部13で仮
のスケ―リングファクタS′が求められた時点で、この
仮のスケ―リングファクタS′と前サブフレ―ム(フレ
−ム)終端のスケ―リングファクタS(N-1)との比
{S′/S(N-1)}を計算して、比{S′/S(N-
1)}と閾値θとが関係式{S′/S(N-1)}<θを
満足するか否か判定し(ステップS2)、上記ステップ
S2でYESのときには、振幅が増大しても通常のAG
Cではこの増大した振幅を抑えきれないと判定する(ス
テップS3)。即ち、仮のスケ―リングファクタS′
が、前サブフレ―ム(前フレ−ム)終端のスケ―リング
ファクタS(N-1)よりある程度小さいときに、1に近
い値を有する変数ζを持つ上記スケ―リングファクタの
低域通過フイルタでは、スケ―リングファクタS(n)
が、仮のスケ―リングファクタS′に近付くのに時間が
かかってしまうのでサブフレ―ム(フレ−ム)の前部で
は増大した振幅をS′よりも大きいS(n)では抑えき
れないとみなす。即ち、振幅検出部14の検出結果によ
り、出力信号の増大した振幅を抑えきれないと判定した
ときには変数ζを0または0に近い値に設定し(ステッ
プS4)、スケ―リングファクタS(n)を計算する
(ステップS5)。n=0またはnが小さい時点でスケ
―リングファクタS(n)は仮のスケ―リングファクタ
S′の値になるので、AGCは増大した振幅を抑えるこ
とができる。
【0046】上記ステップS2でNOの場合には、フィ
ルタリング部11の出力信号の振幅が振幅の増大をAGC
で抑えきると判定し(ステップS6)、変数ζを1に近
い値に設定して(ステップS7)、上記ステップS5に
示すようにスケ―リングファクタS(n)を計算する。
従って、スケ―リングファクタS(n)を緩やかに変え
ることにより、隣接するサブフレ―ム(フレ−ム)の境
界でのAGC後の信号の不連続性をなくす。
ルタリング部11の出力信号の振幅が振幅の増大をAGC
で抑えきると判定し(ステップS6)、変数ζを1に近
い値に設定して(ステップS7)、上記ステップS5に
示すようにスケ―リングファクタS(n)を計算する。
従って、スケ―リングファクタS(n)を緩やかに変え
ることにより、隣接するサブフレ―ム(フレ−ム)の境
界でのAGC後の信号の不連続性をなくす。
【0047】これにより、AGC後の信号のサブフレ―
ム(フレ−ム)の境界での不連続性による雑音が聞こえ
る恐れがある。しかし、振幅を抑えなかったときの信号
をポストフィルタの出力の後にあるD/A変換器(図示
省略)において、ディジタル信号からアナログ信号に変
換するときの信号の振幅がD/A変換できる範囲を超え
てしまうことによって発生する雑音に比べれば、サブフ
レ―ム(フレ−ム)の境界での不連続性による雑音が与
える信号の聴覚的な品質の劣化は、非常に小さい。
ム(フレ−ム)の境界での不連続性による雑音が聞こえ
る恐れがある。しかし、振幅を抑えなかったときの信号
をポストフィルタの出力の後にあるD/A変換器(図示
省略)において、ディジタル信号からアナログ信号に変
換するときの信号の振幅がD/A変換できる範囲を超え
てしまうことによって発生する雑音に比べれば、サブフ
レ―ム(フレ−ム)の境界での不連続性による雑音が与
える信号の聴覚的な品質の劣化は、非常に小さい。
【0048】また、振幅検出部14において、一旦、通常
のAGCを行って、フィルタリング部11に入力する前の
信号との振幅を比較し、AGCにより振幅が抑えきれな
かったかどうかを判定する方法もある。
のAGCを行って、フィルタリング部11に入力する前の
信号との振幅を比較し、AGCにより振幅が抑えきれな
かったかどうかを判定する方法もある。
【0049】図4は、上述したポストフィルタ10を備え
た音声合成装置16と音声合成装置16の入力信号を作成す
る音声符号化装置17を示す。
た音声合成装置16と音声合成装置16の入力信号を作成す
る音声符号化装置17を示す。
【0050】音声符号化装置17では、音声やその他の信
号を変換して符号化する。ここで用いる符号化方法とし
ては、線形予測係数を用いたCELP系符号化等の、フ
レ―ム単位で線形予測係数を求め、線形予測係数(反射
係数)等の他のパラメ―タを他の情報と共に符号化する
方法を考える。
号を変換して符号化する。ここで用いる符号化方法とし
ては、線形予測係数を用いたCELP系符号化等の、フ
レ―ム単位で線形予測係数を求め、線形予測係数(反射
係数)等の他のパラメ―タを他の情報と共に符号化する
方法を考える。
【0051】音声符号化装置17で作成された符号は、チ
ャンネル18を通して音声合成装置16に送られる。ここ
で、チャンネル18とは、無線系や有線系の伝送路または
符号を一旦蓄えられる蓄積系の記憶装置をいう。
ャンネル18を通して音声合成装置16に送られる。ここ
で、チャンネル18とは、無線系や有線系の伝送路または
符号を一旦蓄えられる蓄積系の記憶装置をいう。
【0052】音声合成装置16は、復号化部19で、チャン
ネル18を通して送られてきた符号を復号化し、線形予測
係数や他の情報を得てこれら情報に基づいて音声等の信
号を合成し、ポストフィルタ10により合成信号の品質を
改善して、外部に合成信号を送る。ポストフィルタ10
は、フレ―ムまたはフレ―ムを分割したサブフレ―ムの
開始時に線形予測係数を受け取る。なお、サブフレ―ム
の場合には、線形予測係数はすでに補間されている。
ネル18を通して送られてきた符号を復号化し、線形予測
係数や他の情報を得てこれら情報に基づいて音声等の信
号を合成し、ポストフィルタ10により合成信号の品質を
改善して、外部に合成信号を送る。ポストフィルタ10
は、フレ―ムまたはフレ―ムを分割したサブフレ―ムの
開始時に線形予測係数を受け取る。なお、サブフレ―ム
の場合には、線形予測係数はすでに補間されている。
【0053】
【発明の効果】本発明の音声合成装置用ポストフィルタ
は、合成信号をフィルタリングするフィルタリング手段
と、フィルタリング手段からの出力信号及び合成信号に
基づいてスケ―リング係数を算出する係数算出手段と、
出力信号の振幅を検出し検出結果に基づいて出力信号の
振幅が所定の振幅値を越えないようにスケ―リング係数
の値を調整する振幅検出手段と、出力信号と調整された
スケ―リング係数との積を算出する演算手段とを備えて
いるので、スケ―リング係数を出力信号の振幅を抑えれ
る値に変更でき、その結果、合成信号の振幅増大による
品質劣化をなくすことができる。
は、合成信号をフィルタリングするフィルタリング手段
と、フィルタリング手段からの出力信号及び合成信号に
基づいてスケ―リング係数を算出する係数算出手段と、
出力信号の振幅を検出し検出結果に基づいて出力信号の
振幅が所定の振幅値を越えないようにスケ―リング係数
の値を調整する振幅検出手段と、出力信号と調整された
スケ―リング係数との積を算出する演算手段とを備えて
いるので、スケ―リング係数を出力信号の振幅を抑えれ
る値に変更でき、その結果、合成信号の振幅増大による
品質劣化をなくすことができる。
【図1】本発明の音声合成用ポストフィルタにおける一
実施例の構成を示すブロック図である。
実施例の構成を示すブロック図である。
【図2】通常のAGC機能で生じるポストフィルタによ
る振幅増大とスケ―リングファクタSの関係を示す図で
ある。
る振幅増大とスケ―リングファクタSの関係を示す図で
ある。
【図3】図1の音声合成用ポストフィルタを動作を説明
するためのフロ−チャ−トである。
するためのフロ−チャ−トである。
【図4】図1の音声合成用ポストフィルトを備えた音声
合成装置及び音声合成装置の入力信号を作成する音声符
号化装置の概略構成を示すブロック図である。
合成装置及び音声合成装置の入力信号を作成する音声符
号化装置の概略構成を示すブロック図である。
10 音声合成用ポストフィルタ 11 フィルタリング部 12 係数計算器 13 スケ―リングファクタ計算部 14 振幅検査部 15 乗算器 16 音声合成装置 17 音声符号化装置 18 チャンネル 19 復号化部
Claims (1)
- 【特許請求の範囲】 【請求項1】 合成信号をフィルタリングするフィルタ
リング手段と、前記フィルタリング手段からの出力信号
及び前記合成信号に基づいてスケ―リング係数を算出す
る係数算出手段と、前記出力信号の振幅を検出し当該検
出結果に基づいて該出力信号の振幅が所定の振幅値を越
えないように前記スケ―リング係数の値を調整する振幅
検出手段と、前記出力信号と前記調整されたスケ―リン
グ係数との積を算出する演算手段とを備えていることを
特徴とする音声合成装置用ポストフィルタ。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP03158670A JP3076086B2 (ja) | 1991-06-28 | 1991-06-28 | 音声合成装置用ポストフィルタ |
| US08/253,990 US5506934A (en) | 1991-06-28 | 1994-06-03 | Post-filter for speech synthesizing apparatus |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP03158670A JP3076086B2 (ja) | 1991-06-28 | 1991-06-28 | 音声合成装置用ポストフィルタ |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH056197A true JPH056197A (ja) | 1993-01-14 |
| JP3076086B2 JP3076086B2 (ja) | 2000-08-14 |
Family
ID=15676798
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP03158670A Expired - Fee Related JP3076086B2 (ja) | 1991-06-28 | 1991-06-28 | 音声合成装置用ポストフィルタ |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US5506934A (ja) |
| JP (1) | JP3076086B2 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0807307A4 (en) * | 1994-04-29 | 1998-10-07 | Adiocodes Ltd | SOUND HEIGHT POST-FILTERING CIRCUIT |
| JP2007501441A (ja) * | 2003-05-08 | 2007-01-25 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | スペクトル成分結合およびスペクトル成分再生を用いた改良オーディオコード化システム |
Families Citing this family (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB9512284D0 (en) * | 1995-06-16 | 1995-08-16 | Nokia Mobile Phones Ltd | Speech Synthesiser |
| JPH09319397A (ja) * | 1996-05-28 | 1997-12-12 | Sony Corp | ディジタル信号処理装置 |
| FI980132A7 (fi) * | 1998-01-21 | 1999-07-22 | Nokia Mobile Phones Ltd | Adaptoituva jälkisuodatin |
| DE19846787C1 (de) * | 1998-10-10 | 2000-03-02 | Micronas Intermetall Gmbh | Verfahren und Vorrichtungen zum Bestimmen des exponentiell gewichteten Effektivwertes eines Signals |
| EP1944760B1 (en) * | 2000-08-09 | 2009-09-23 | Sony Corporation | Voice data processing device and processing method |
| US7329462B2 (en) * | 2002-08-23 | 2008-02-12 | General Electric Company | Reflective article and method for the preparation thereof |
| JP4135621B2 (ja) * | 2003-11-05 | 2008-08-20 | 沖電気工業株式会社 | 受信装置および方法 |
| EP2096631A4 (en) * | 2006-12-13 | 2012-07-25 | Panasonic Corp | TONE DECODING DEVICE AND POWER ADJUSTMENT METHOD |
| CN101303858B (zh) * | 2007-05-11 | 2011-06-01 | 华为技术有限公司 | 实现基音增强后处理的方法及装置 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6288432A (ja) * | 1985-10-11 | 1987-04-22 | インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション | デジタル信号プロセツサにおける自動利得制御装置 |
| JPH01261930A (ja) * | 1988-04-13 | 1989-10-18 | Kokusai Denshin Denwa Co Ltd <Kdd> | 音声復号器のポスト雑音整形フィルタ |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4726037A (en) * | 1986-03-26 | 1988-02-16 | American Telephone And Telegraph Company, At&T Bell Laboratories | Predictive communication system filtering arrangement |
| US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
| JPH069345B2 (ja) * | 1987-09-26 | 1994-02-02 | シャープ株式会社 | 音声分析合成装置 |
-
1991
- 1991-06-28 JP JP03158670A patent/JP3076086B2/ja not_active Expired - Fee Related
-
1994
- 1994-06-03 US US08/253,990 patent/US5506934A/en not_active Expired - Lifetime
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6288432A (ja) * | 1985-10-11 | 1987-04-22 | インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション | デジタル信号プロセツサにおける自動利得制御装置 |
| JPH01261930A (ja) * | 1988-04-13 | 1989-10-18 | Kokusai Denshin Denwa Co Ltd <Kdd> | 音声復号器のポスト雑音整形フィルタ |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0807307A4 (en) * | 1994-04-29 | 1998-10-07 | Adiocodes Ltd | SOUND HEIGHT POST-FILTERING CIRCUIT |
| JP2007501441A (ja) * | 2003-05-08 | 2007-01-25 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | スペクトル成分結合およびスペクトル成分再生を用いた改良オーディオコード化システム |
| JP4782685B2 (ja) * | 2003-05-08 | 2011-09-28 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | スペクトル成分結合およびスペクトル成分再生を用いた改良オーディオコード化システム |
Also Published As
| Publication number | Publication date |
|---|---|
| US5506934A (en) | 1996-04-09 |
| JP3076086B2 (ja) | 2000-08-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| RU2325707C2 (ru) | Способ и устройство для эффективного маскирования стертых кадров в речевых кодеках на основе линейного предсказания | |
| US5752222A (en) | Speech decoding method and apparatus | |
| JP4222951B2 (ja) | 紛失フレームを取扱うための音声通信システムおよび方法 | |
| US5966689A (en) | Adaptive filter and filtering method for low bit rate coding | |
| JP4376489B2 (ja) | コード化音声の品質向上のための周波数領域ポストフィルタリングの方法、装置及び記録媒体 | |
| CN111179954B (zh) | 用于降低时域解码器中的量化噪声的装置和方法 | |
| CN101207665B (zh) | 一种衰减因子的获取方法 | |
| JP3234609B2 (ja) | 32Kb/sワイドバンド音声の低遅延コード励起線型予測符号化 | |
| US7613607B2 (en) | Audio enhancement in coded domain | |
| JP2003512654A (ja) | 音声の可変レートコーディングのための方法およびその装置 | |
| MXPA04011845A (es) | Metodo y dispositivo para aumentar el espaciamiento selectivo de la frecuencia de la voz sintetizada. | |
| US6424942B1 (en) | Methods and arrangements in a telecommunications system | |
| JP3076086B2 (ja) | 音声合成装置用ポストフィルタ | |
| JP3483853B2 (ja) | スピーチコーディングのための適用基準 | |
| JPH0644195B2 (ja) | エネルギ正規化および無声フレーム抑制機能を有する音声分析合成システムおよびその方法 | |
| CN1044293C (zh) | 背景音的编码/译码方法和设备 | |
| US6275798B1 (en) | Speech coding with improved background noise reproduction | |
| EP1544848A2 (en) | Audio enhancement in coded domain | |
| JP3163206B2 (ja) | 音響信号符号化装置 | |
| JP2003323200A (ja) | 音声符号化のための線形予測係数の勾配降下最適化 | |
| CN100369108C (zh) | 编码域中的音频增强的方法和设备 | |
| Ekeroth | Improvements of the voice activity detector in AMR-WB | |
| JPH09146598A (ja) | 音声符号化における雑音抑圧方法 | |
| HK1076907A (en) | Method and device for efficient frame erasure concealment in linear predictive based speech codecs | |
| HK1076907B (en) | Method and device for efficient frame erasure concealment in linear predictive based speech codecs |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |