JPH1145100A - フィルタリング方法と低ビット速度音声通信システム - Google Patents
フィルタリング方法と低ビット速度音声通信システムInfo
- Publication number
- JPH1145100A JPH1145100A JP9162949A JP16294997A JPH1145100A JP H1145100 A JPH1145100 A JP H1145100A JP 9162949 A JP9162949 A JP 9162949A JP 16294997 A JP16294997 A JP 16294997A JP H1145100 A JPH1145100 A JP H1145100A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- prob
- sig
- filter
- power
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001914 filtration Methods 0.000 title claims abstract description 49
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000004891 communication Methods 0.000 title claims description 17
- 238000012546 transfer Methods 0.000 claims abstract description 24
- 230000007774 longterm Effects 0.000 claims abstract description 10
- 230000005236 sound signal Effects 0.000 claims description 11
- 239000013598 vector Substances 0.000 claims description 11
- 230000005540 biological transmission Effects 0.000 claims description 9
- 230000002708 enhancing effect Effects 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 6
- 230000003139 buffering effect Effects 0.000 claims description 4
- 230000005284 excitation Effects 0.000 abstract description 21
- 230000003044 adaptive effect Effects 0.000 description 18
- 230000006870 function Effects 0.000 description 17
- 230000003595 spectral effect Effects 0.000 description 13
- 238000001228 spectrum Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000005534 acoustic noise Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000008054 signal transmission Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000001743 silencing effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03L—AUTOMATIC CONTROL, STARTING, SYNCHRONISATION OR STABILISATION OF GENERATORS OF ELECTRONIC OSCILLATIONS OR PULSES
- H03L7/00—Automatic control of frequency or phase; Synchronisation
- H03L7/06—Automatic control of frequency or phase; Synchronisation using a reference signal applied to a frequency- or phase-locked loop
- H03L7/08—Details of the phase-locked loop
- H03L7/085—Details of the phase-locked loop concerning mainly the frequency- or phase-detection arrangement including the filtering or amplification of its output signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Filters That Use Time-Delay Elements (AREA)
Abstract
コードブック励振線形予測音声コーダのポストフィルタ
として使用の2つのフィルタを含む改良したフィルタリ
ング。 【解決手段】第1のフィルタ62は、Pを予測値、α及
びβを倍率、zを伝達関数の変換表示用の単位遅延演算
子の逆数、sig−probを信号確率推定値として、 {1−P(z/(β×sig−prob))}/{1−
P(z/(α×sig−prob))} なる伝達関数を持ち、第2のフィルタ65は、μを倍率
とし、1−μz-1×sig−probの伝達関数を持
ち、sig−probは、現在フレームの信号のパワー
と雑音パワーの長期的な推定値との信号確率推定器63
での比較による信号確率値で、信号のパワーが雑音パワ
ーに30dBを加えた値より大の時、sig−prob
の値は1で、12dBを加えた値より小の時sig−p
robは0である。2つの状態間で、sig−prob
は(対数利得−12dB−雑音利得)/18である。
Description
具体的に云えば、低ビット速度音声符号化に於ける適応
フィルタ作用に関する。
って出願された係属中の米国特許出願通し番号第08/
218,033号、発明の名称「端数ピッチを用いた混
励振線形予測」、1994年11月9日にA.マックリ
ーによって出願された係属中の米国特許出願通し番号第
08/336,593号、発明の名称「端数ピッチを用
いた混励振線形予測」はこの出願と関係があり、ここで
引用する。
0kHzまでの範囲の周波数を持つ音響信号のストリー
ムで構成されている。しかし、約100Hzないし5k
Hzの帯域に大部分の音響エネルギーが入っている。人
間の音声の電話伝送は、初めは、伝送のために、(例え
ばマイクを使う事により)アナログ音響信号のストリー
ムをアナログ電圧信号のストリームに変換し、(例えば
スピーカーを使う事によって)音響信号のストリームに
再び変換することで構成されていた。帯域幅を制限する
と共に低周波の問題を避けるために、電気信号を帯域フ
ィルタにかけて300Hzないし4kHzの周波数帯だ
けを残す。しかし、ディジタル電気信号伝送の有利さが
きっかけとなって、ディジタル電話伝送への転換が19
60年代から始まった。ディジタル電話信号は、典型的
には、8kHzでアナログ信号を標本化し、μ−則に従
って(パルス符号変調又はPCMに従って)8ビット・
コードを用いて非直線的にサンプルを量子化する事によ
って取り出す。クロック式ディジタル/アナログ変換器
及び圧伸増幅器が、8ビット・サンプルのストリームか
らアナログ電気信号のストリームを再生する。このよう
な信号は、64kbps(毎秒キロビット)の伝送速度
を必要とするが、これは従来のアナログ信号の伝送の帯
域幅を超えている。
磁気テープに)アナログ・フォーマットで記憶すること
も、ディジタル記憶に置き換えることが出来る。しか
し、メモリの需要は圧倒的になる。8kHzで標本化さ
れた10分間の8ビットPCMは約5MB(メガバイ
ト)の記憶装置を必要とする。
に対する要求から、音声信号に対する圧縮が開発される
ようになった。音声圧縮の一つの方式は、音声の生理学
的な発生をモデルし、こうして伝送又は記憶をすべき必
要な情報を少なくする。特に、線形音声発生モデルは、
可変フィルタ(大まかに声道をあらわす)をピッチ周期
Pを持つパルス列(有声音に対し)又はホワイト・ノイ
ズ(無声音に対し)の何れかで励振し、その後音の大き
さを調節する為に増幅する事を前提としている。従来、
1/A(z)が、フィルタの伝達関数のz変換を表す。
このモデルは、単に有声/無声の判定を周期的に下すと
共に、フィルタ係数及び利得を調節する事により、音の
ストリームを発生する。全般については、マーケル及び
グレイの著書「音声の線形予測」(1976年シュプリ
ンガー・フェルラーク発行)を参照されたい。
対する係数を補間することが出来る。しかし、音の品質
を改善する為、この他の情報を音声から抽出し、圧縮
し、伝送又は記憶する事が出来る。例えば、コードブッ
ク励振線形予測(CELP)方式は、最初に音声フレー
ムを解析してA(z)を見つけ、音声をフィルタ作用に
かける。次に、ピッチ周期の判定を下し、くし型フィル
タがこの周期性を除いて、雑音のように見える励振信号
を作り出す。その後、励振信号がコードブックで符号化
される。この為、CELPはLPCフィルタ係数、ピッ
チ及び励振のコードブック指数を伝送する。
又は無声の励振を混合することである。例えば、199
2年8月に、ジョージア・インスティチュート・オブ・
テクノロジに提出されたマックリーの博士論文「低ビッ
ト速度音声符号化のための新しいボコーダ・モデル」で
は、励振周波数範囲を帯域に分割し、各々の帯域で別々
に有声・無声混合の判定を下し、全体の励振に対してそ
の結果を組み合わせる。混励振線形予測(MELP)係
数ボコーダが、IEEEトランザクションズ・オン・ス
ピーチ・アンド・オーディオ・プロセッシング誌第3巻
第4号(1995年7月)所載のA.マックリー他の論
文「低ビット速度音声符号化の為の混励振LPCボコー
ダ・モデル」に記載されている。前に引用した係属中の
米国特許出願通し番号第08/218,033号及び同
第08/336,593号には、混励振線形予測音声コ
ーダーが記載されている。これらの文献をここで引用す
る。
された音声信号の知覚される品質を改善する為に、何等
かの形の適応スペクトル強化フィルタ又はポストフィル
タを用いている。例えば、マックリー他の混励振線形予
測(MELP)音声コーダーでは、LPCスペクトルに
基づく適応極/ゼロ強化フィルタが使われている。適応
スペクトル強化フィルタは、帯域フィルタにかけられた
音声を、ホルマント領域で自然の音声の波形に釣り合わ
せる助けになる。上に述べたこの適応フィルタは、明瞭
な入力信号に対しては音声品質を改善するが、音響雑音
が存在する場合、このフィルタは実際には性能を劣化さ
せる事がある。強化フィルタは、音響背景雑音のパワー
・スペクトルの変動を増加する傾向を持ち、聞く者にと
って非常に煩わしい事がある不自然な「渦巻き」効果の
原因になる。CELP音声コーダのポストフィルタでも
同じような影響がある。この発明の1つの目的として、
CELPのこの適応スペクトル強化フィルタ又はポスト
フィルタに、明瞭な音声信号に対する現存の方法による
品質の改善を保ちながら、音響雑音が存在する時の性能
を一層良くするような改善を提供する。
は、低ビット速度音声又は可聴信号のディジタル処理さ
れた音声を改善するフィルタリング方法を提供する。こ
のフィルタリングは、線形予測係数パラメータ、並びに
入力フレームが背景雑音ではなく音声である推定確率に
よって制御される。こうすると、処理された背景雑音に
人為効果を導入する事無く、明瞭な音声信号に対するフ
ィルタリングの利点が実現される。
下この発明を図面について詳しく説明するところから、
当業者に明らかになろう。
ステムが図1に示されており、入力音声がアナログ/デ
ィジタル変換器によって標本化され、パラメータが符号
化されて、解析器600に送られ、記憶装置及び伝送回
線を介して合成器500に送られる。合成器500から
の復号された信号が、ディジタル/アナログ変換器(D
AC)によってスピーカ用の信号に変換される。図2に
は、解析器の若干のブロックが示されている。アナログ
入力音声が変換器620でディジタル音声に変換され、
音声解析器に印加される。この音声解析器は、LPC抽
出器602、ピッチ周期抽出器604、ジッタ抽出器6
06、有声/無声混合制御抽出器608、利得抽出器6
10、及びこれら5つのブロック602〜610からの
入力を集め、それを出力すると共に符号化された状態で
伝送回線を介してクロック作用で送り出す符号器612
を含む。合成器500には復号器536があり、これが
符号器612からの符号化された音声を復号して、LP
Cパラメータ、ピッチ周期、ミックス、ジッタの各々の
フラグ及び利得を発生する。
れた係属中の米国特許出願通し番号第08/218,0
03号に記載されていて、前に引用したマックリー他の
論文に記載されたものに類似するこの発明の一実施例の
MELPボコーダが示されている。合成器500は、復
号器536からのピッチ周期入力によって制御される周
期パルス列発生器502、復号器536からの利得入力
によって制御されるパルス列増幅器504、復号器53
6のジッタ出力からのフラグ入力によって制御されるパ
ルス・ジッタ発生器506、及び復号器536からの5
帯域有声/無声混合入力によって制御されるパルス・フ
ィルタ508を含む。更に合成器500は、ホワイト・
ノイズ発生器512、同じ利得入力によって制御される
利得増幅器514、やはり同じ5帯域有声/無声混合入
力によって制御されるノイズ・フィルタ518、及びフ
ィルタ作用にかけられたパルス及び雑音を組み合わせる
加算器520を含む。加算器の出力が混励振信号e
(n)であり、これが適応スペクトル強化フィルタ53
0に印加され、このフィルタがフォルマントを強調し
て、e′(n)を発生する。この出力が、10個のLP
C係数によって制御されるLPC合成フィルタ532に
印加される。その出力が増幅器533で、復号器536
からの利得で増幅され、パルス分散フィルタ534に印
加されてディジタル合成音声が得られる。このようにデ
ィジタル化された音声が、その後、ディジタル/アナロ
グ変換器540を使って、スピーカー用のアナログ音声
に変換される。この発明の別の実施例では、加算器の出
力e(n)が、10個のLPC係数によって制御される
合成フィルタ532に印加され、LPCフィルタの出力
が適応強化フィルタ530に印加されて、フォルマント
の強調を強め、e′(n)を発生する。
スペクトル強化フィルタ530を強める。MELPコー
ダにある適応スペクトル強化フィルタ530は、LPC
フィルタ係数に基づく極/ゼロ・フィルタである。この
適応フィルタは、帯域フィルタにかけられた合成音声が
フォルマント領域で自然の音声波形と釣り合うようにす
るのを助ける。典型的なフォルマント共振は、自然の音
声でも合成音声でも、ピッチ・パルスの間の時間内に完
全に減衰しないのが普通であるが、合成音声波形は、ピ
ークの間に、自然音声波形よりも、一層低い谷に達す
る。これはおそらく、LPC合成フィルタにある極が、
人間の自然の音声に於けるフォルマント共振の特徴を再
現する事が出来ないためであろう。この問題に対して考
えられる理由は2つある。1つの原因は、LPC極の帯
域幅が正しくない事である。LPCの極は真のフォルマ
ントよりも、共振が一層弱い為に、合成時間信号が減衰
するのが早すぎる事がある。考えられる別の説明は、真
のフォルマントの帯域幅がピッチ周期内で幾分変化する
事があるが、合成音声はこの挙動をまねする事が出来な
い事である。
の論文に記載される適応スペクトル強化フィルタは、フ
ォルマントの波形を釣り合わせるという問題に対する簡
単な解決策になる。適応極/ゼロ・フィルタは、フォル
マント周波数の合間の量子化雑音を減らそうとするもの
であるから、CELPコーダに広く使われている。19
87年にダラスで開催された音声信号処理に関するIE
EE国際会議プロシーディング、2185〜2188ペ
ージ所載のチェン他の論文「適応ポストフィルタリング
を用いた4800bpsに於ける実時間ベクトルAPC
音声符号化」を参照されたい。更に、1991年にミネ
ソタ州ノーウェルで開催されたアドヴァンセズ・イン・
スピーチ・コーディング(121〜133項所載)で発
表されたキャンベル他の論文「DOD 4.8kps基
準(連邦基準の提案1016)」をも参照されたい。こ
れらの文献をここで引用する。極は、αを0.8に等し
いとして、LPC合成フィルタの帯域幅を伸長した形式
によって発生される。マックリーの論文によれば、この
全極フィルタは、スペクトルの傾きを強める事によっ
て、擾乱性低域通過フィルタ効果を導入するので、αを
0.5に等しいとして計算した一層弱い全ゼロ・フィル
タを使って、フォルマントの強化を弱めずに、フィルタ
全体の傾きを減らす。更に、簡単な1次FIRフィルタ
を使って、低域通過の消音効果を更に弱める。混励振L
PCボコーダでは、量子化雑音を減らす事が問題ではな
く、このフィルタの時間領域の特性により、ピッチ同期
極帯域幅変調と同様な効果が生じる。図4に示すよう
に、単純に減衰する共振は、この強化フィルタを適用す
る時、時間領域の発声がそれほど急峻でなくなる。この
特徴により、LPCボコーダの音声出力が、フォルマン
ト領域で、自然の音声の帯域幅波形特性と一層良く釣り
合うようになり、合成音声の知覚される品質が高くな
る。
z−平面内で単位円に向かって0.8倍だけシフトした
LPCフィルタの極である。
身で、処理された音声信号に消音特性を導入するので、
一層弱い全ゼロ・フィルタをカスケードに使って、極に
よって導入されたスペクトルの傾きを埋め合わせる。更
に、フィルタにもう1つのゼロを含めて、スペクトルの
傾きを更に減少する。米国特許第4,969,192
号、発明の名称「音声及び可聴用ベクトル適応予測コー
ダ」で、チェン他は、CELP音声コーダのポストフィ
ルタに第2のフィルタを使っている。
雑音に存在する変動を増加する事である。ここで説明す
るこの発明の方法は、現在の入力フレームが背景雑音で
はなく、音声である確率の推定値に基づいて、スペクト
ル強化フィルタの強さを適応させる。この確率は、現在
の音声フレームのパワーを雑音パワーの長期的な推定値
と比較する事によって推定される。考えられる不連続性
が強化フィルタをオン及びオフに切り替えるのを防止す
る為、フィルタの強さは、信号確率の或る範囲に亘っ
て、全くフィルタ作用をしない場合から、完全なスペク
トル強化まで徐々に変化する。
フィルタのブロック図が示されている。混励振信号e
(n)がフィルタ62に印加される。このフィルタは、
LPC係数によって制御され、次の伝達関数H(z)を
持っている。
(z/α)}、 0<β<α<1
り、α及びβは、チャーピングを生じるスペクトル・ピ
ーク及びスペクトル強化を達成しないピークの或る兼ね
合いを取るように経験的に決定された係数である。予測
フィルタの係数1−P(z)は、解析フィルタの係数A
(z)に等しい。Hzに於ける周波数応答は、2つの全
極フィルタの周波数の間の差であって次の通りである。
ィルタに対する数値は、β=0.5及びα=0.8の第
1のフィルタと、1−μz-1の伝達関数を持つ第2のフ
ィルタとで構成されていた。この発明では、第1のフィ
ルタに対し、信号確率推定器63からの信号確率値(s
ig−prob)に、フィルタ62で、0.5のβを乗
算(* )し、それと共に0.8のαを乗算(* )する。
即ち、β=0.5* sig−prob(推定器で測定さ
れた信号確率)及びα=0.8* sig−prob。フ
ィルタ62の出力が第2のフィルタ65に結合される。
このフィルタは、1−μz-1にsig−probを乗算
(* )した伝達関数を持ち、典型的にはμは0.5にk
(1)を乗算(* )したものである。項k(1)は第1
反射係数である。信号確率推定器63は、解析器からの
利得(図4の610で図3の536から復号した)に応
答して、現在フレームのパワーが雑音パワーの長期的な
推定値に比べてどうであるかを判定する。推定器のフロ
ーチャートが図6に示されている。推定器63が、ある
時定数及びステップ寸法を設定し、その後、利得の対数
を雑音利得に30dBを加えた値と比較する。パワー・
レベルが雑音利得+30dBより大きければ、sig−
probを1と置き、パワー・レベルが雑音利得+12
dBより小さければ、sig−probを0にして、フ
ィルタ作用をしない。このようにして、信号が存在すれ
ばフィルタが適用されるが、雑音が存在すれば適用され
ない。利得が、これらの極限の間にある場合、sig−
probの値は、(対数利得−12dB−雑音利得)を
18で除した値に等しい。これは、12dB及び30d
Bの間で0と1の間の直線的な傾斜値である。この“s
ig−prob”が、α、β及びμに対する乗数にな
る。時定数は、音声信号を平均して無くし、雑音のフロ
アの値を近似するように選ばれる。
する実時間形の2.4kb/s MELPコーダでは、
この改良された適応スペクトル強化方法により、雑音の
ある入力音声に対して音声の品質に明らかな改善が得ら
れ、それと共に明瞭な入力信号に対しては、現存の方法
と同じ品質が保たれる。推定器63は下記の擬似符号に
従うコードを実行するプロセッサ・チップの一部分であ
って良い。
を希望するこの他の音声符号化の用途に容易に用いる事
が出来る事がわかる。
69,192号には、第1のフィルタの値がβ=0.5
並びにα=0.8であると共に第2のフィルタの伝達関
数が1−μz-1であるポストフィルタが記載されてい
る。この発明に従って、推定確率が背景雑音では無く、
音声に対するものであることを考慮するように上に述べ
たように変更した時、短い遅延のポストフィルタ32a
では、第1のフィルタに対し、β=0.5×sig−p
rob、α=0.8×sig−probである。第2の
フィルタは伝達関数がμz-1×sig−probであ
り、ここでk(1)を第1反射係数として、μが0.5
×k(1)である。この発明並びにその利点を詳しく説
明したが、特許請求の範囲によって定められたこの発明
の範囲を逸脱せずに、この実施例に種々の変更、置換を
加える事が出来る事を承知されたい。
する。 (1) ディジタル処理した音声信号を改善するフィル
タリング方法に於て、現在フレームに於ける前記信号の
パワーと雑音パワーの長期的な推定値との比較に基づく
信号確率推定値を発生し、最初に、線形予測係数及び前
記信号確率値によって制御される遅延装置によって前記
信号をフィルタ作用にかけ、2番目に、μを倍率、z-1
を単位遅延演算子として、1−μz-1×信号確率値とい
う形の伝達関数によってフィルタ作用にかける工程を含
むフィルタリング方法。 (2) 項1記載のフィルタリング方法に於て、前記信
号パワーの対数利得が雑音パワーに30dBを加えた値
より大きい場合、前記信号確率値が1であるフィルタリ
ング方法。 (3) 項2記載のフィルタリング方法に於て、前記パ
ワーが雑音パワーに12dBを加えた値より小さい場
合、前記信号確率値が0であるフィルタリング方法。 (4) 項3記載のフィルタリング方法に於て、前記パ
ワーが雑音利得に12dBを加えた値より大きく、雑音
利得に30dBを加えた値より小さい場合、信号確率値
が(対数利得−12−雑音利得)/18に等しいフィル
タリング方法。
於て、最初にフィルタ作用にかける工程が、Pを予測
値、α及びβを倍率、zを単位遅延z-1の逆数、μを倍
率として、
/{1−P(z/(α×sig−prob))} という伝達関数を持っているフィルタリング方法。
於て、α=0.8、β=0.5であるフィルタリング方
法。 (7) 項6記載のフィルタリング方法に於て、k
(1)を第1反射係数として、μが0.5×k(1)で
あるフィルタリング方法。
於て、最初にフィルタ作用にかける工程が、Pを予測
値、α及びβを倍率、zを単位遅延z-1の逆数として、
/{1−P(z/(α×sig−prob))} という伝達関数を持っているフィルタリング方法。
於て、α=0.8、β=0.5、μ=0.5(k1)で
k(1)が第1反射係数であるフィルタリング方法。
聴信号を強化するフィルタリング方法に於て、前記音声
又は可聴信号をバッファ作用にかけて、各ベクトルがK
個の相次ぐサンプルを持つようなベクトルのフレームに
し、予定のブロックにある音声又は可聴信号のバッファ
作用で作ったフレームの解析を実施して、線形予測係数
及び現在フレームに於けるパワーを計算し、現在フレー
ムに於けるパワーと雑音パワーの長期的な推定値との比
較に基づいて、信号確率推定値sig−probを発生
し、最初に、前記線形予測係数及び信号確率推定値によ
って制御される遅延装置によって各ベクトルをフィルタ
作用にかけ、このフィルタ作用は、1−PをLPC係
数、zを伝達関数の変換表示に使われる単位遅延演算子
の逆数、α及びβをsig−probの倍率として、
/{1−P(z/(α×sig−prob))}、
0<β<α<1 という形の伝達関数を使う事によって行われ、2番目
に、μを倍率として、1−μz-1×sig−probと
いう形の伝達関数によるフィルタ作用にかける工程を含
むフィルタリング方法。
法に於て、パワーが雑音利得に30dBを加えた値より
大きければ、前記信号確率値が1であるフィルタリング
方法。 (12) 項11記載のフィルタリング方法に於て、パ
ワーが雑音利得に12dBを加えた値より小さければ、
前記信号確率値が0であるフィルタリング方法。 (13) 項12記載のフィルタリング方法に於いて、
パワーが雑音利得に12dBを加えた値より大きく、雑
音利得に30dBを加えた値より小さい場合に、信号確
率値を(対数利得−12−雑音利得)/18に等しいと
するフィルタリング方法。 (14) 項10記載のフィルタリング方法に於て、α
=0.8、β=0.5、μ=0.5k(1)でk(1)
が第1反射係数であるフィルタリング方法。 (15) 項14記載のフィルタリング方法に於て、対
数利得が雑音利得に30dBを加えた値より大きけれ
ば、前記sig−probが1であるフィルタリング方
法。 (16) 項15記載のフィルタリング方法に於て、対
数利得が雑音利得に12dBを加えた値より小さけれ
ば、前記sig−probが0であるフィルタリング方
法。 (17) 項16記載のフィルタリング方法に於いて、
パワーが雑音利得に12dBを加えた値より大きく、雑
音利得に30dBを加えた値より小さい場合に、前記s
ig−probを(対数利得−12−雑音利得)/18
に等しいとするフィルタリング方法。
度音声通信システムに於て、前記音声信号をバッファ作
用にかけて、各ベクトルが相次ぐサンプルを持つベクト
ルのフレームにする手段と、予定のブロック内にあるバ
ッファ作用によって作った音声又は可聴信号のフレーム
の解析を実施して、現在フレームに於ける線形予測係数
及びパワーを含む符号化音声を計算する手段と、該符号
化音声を伝送回線を介して伝送する手段と、該伝送する
手段に結合されていて、前記符号化音声に応答して前記
音声をディジタル信号に復号する合成器と、該合成器か
らのディジタル信号に応答して音声信号を発生するディ
ジタル/アナログ変換器とを有し、前記合成器は、ディ
ジタル処理した音声を強化する手段で構成されていて、
該強化する手段は、現在フレームに於けるパワーと雑音
パワーの長期的な推定値との比較に基づいて信号確率推
定値sig−probを発生する手段、1−PをLPC
係数、zを伝達関数の変換表示に使われる単位遅延演算
子の逆数、αおよびβを倍率として
/{1−P(z/(α×sig−prob))}、
0<β<α<1 という形の伝達関数を使う事によって行われるような、
前記線形予測係数及び前記信号確率推定値によって制御
される遅延装置によって各ベクトルをフィルタ作用にか
ける第1のフィルタ手段と、μを倍率として、1−μz
-1×sig−probという形の伝達関数によってフィ
ルタ作用にかける第2のフィルタ手段で構成されてい
る、低ビット速度音声通信システム。
通信システムに於て、前記パワーが雑音利得に30dB
を加えた値より大きければ、前記信号確率値sib−p
robが1である低ビット速度音声通信システム。 (20) 項19記載の低ビット速度音声通信システム
に於て、前記パワーが雑音利得に12dBを加えた値よ
り小さければ、前記信号確率値sig−probが0で
ある低ビット速度音声通信システム。 (21) 項20記載の低ビット速度音声通信システム
に於て、前記パワーが雑音利得に12dBを加えた値よ
り大きく、雑音利得に30dBを加えた値より小さけれ
ば、信号確率値sig−probを(対数利得−12−
雑音利得)/18に等しいとする低ビット速度音声通信
システム。 (22) 項18記載の低ビット速度音声通信システム
に於て、βが0.5であり、αが0.8であり、k
(1)を第1反射係数として、μが0.5×k(1)で
ある低ビット速度音声通信システム。 (23) 項18記載の低ビット速度音声通信システム
に於て、前記合成器が、LPC係数によって制御される
LPCフィルタを含む低ビット速度音声通信システム。
通信システムに於て、前記強化する手段が前記LPCフ
ィルタより前にある低ビット速度音声通信システム。 (25) 項23記載の低ビット速度音声通信システム
に於て、前記強化する手段が前記LPCフィルタより後
にある低ビット速度音声通信システム。 (26) 項18記載の低ビット速度音声通信システム
に於て、該システムがMELPコーダである低ビット速
度音声通信システム。 (27) ディジタル処理した音声信号を改善するフィ
ルタに於て、現在フレームに於ける前記信号のパワーと
雑音パワーの長期的な推定値との比較に基づいて信号確
率推定値を発生する手段と、線形予測係数及び前記信号
確率値によって制御される遅延装置によって前記信号を
フィルタ作用にかける第1のフィルタと、μを倍率、z
-1を単位遅延演算子として、1−μz-1×信号確率値と
いう形の伝達関数を持つ第2のフィルタとを有するフィ
ルタ。
法に於て、前記信号のパワーの対数利得が雑音利得に3
0dBを加えた値より大きければ、前記信号確率値が1
であるフィルタリング方法。 (29) 項28記載のフィルタリング方法に於て、前
記パワーが雑音利得に12dBを加えた値より小さけれ
ば、前記信号確率値が0であるフィルタリング方法。 (30) 項29記載のフィルタリング方法に於いて、
前記パワーが雑音利得に12dBを加えた値より大き
く、雑音利得に30dBを加えた値より小さい場合に、
信号確率値を(対数利得−12−雑音利得)/18に等
しいとするフィルタリング方法。
前記第1のフィルタが、Pを予測値、α及びβを倍率、
zを単位遅延z-1の逆数、μを倍率として、
/{1−P(z/(α×sig−prob))} という形の伝達関数を有するフィルタ。
α=0.8、β=0.5であるフィルタ。 (33) 項32記載のフィルタに於て、k(1)を第
1反射係数として、μが0.5×k(1)であるフィル
タ。
声コーダの強化フィルタ又はコードブック励振線形予測
(CELP)音声コーダのポストフィルタとして使う為
の2つのフィルタを含む改良されたフィルタリング方法
を説明した。第1のフィルタ62は、Pを予測値、α及
びβを倍率、zを伝達関数の変換表示に使われる単位遅
延演算子の逆数、sig−probを信号確率推定値と
して、
/{1−P(z/(α×sig−prob))} という伝達関数を持ち、第2のフィルタ65は、μを倍
率として、1−μz-1×sig−probの伝達関数を
持つ。sig−probは、現在フレームの信号のパワ
ーと雑音パワーの長期的な推定値との信号確率推定器6
3に於ける比較に基づく信号確率値である。信号のパワ
ーが雑音パワーに30dBを加えた値より大きければ、
sig−probの値は1であり、このパワーが雑音パ
ワーに12dBを加えた値より小さければsig−pr
obは0である。この2つの状態の間では、sig−p
robは(対数利得−12dB−雑音利得)/18であ
る。
り、(a)は自然の音声の母音の最初のフォルマントを
示し、(b)は指数関数で減衰する合成の共振、(c)
はこの共振に対する極/ゼロ強化フィルタのインパルス
応答、(d)は強化した減衰する共振を示す。
フィルタのブロック図。
Claims (2)
- 【請求項1】 ディジタル処理した音声信号を改善する
フィルタリング方法に於て、 現在フレームに於ける前記信号のパワーと雑音パワーの
長期的な推定値との比較に基づく信号確率推定値を発生
し、 最初に、線形予測係数及び前記信号確率値によって制御
される遅延装置によって前記信号をフィルタ作用にか
け、 2番目に、μを倍率、z-1を単位遅延演算子として、1
−μz-1×信号確率値という形の伝達関数によってフィ
ルタ作用にかける工程を含むフィルタリング方法。 - 【請求項2】 音声信号を伝送する低ビット速度音声通
信システムに於て、 前記音声信号をバッファ作用にかけて、各ベクトルが相
次ぐサンプルを持つベクトルのフレームにする手段と、 予定のブロック内にあるバッファ作用によって作った音
声又は可聴信号のフレームの解析を実施して、現在フレ
ームに於ける線形予測係数及びパワーを含む符号化音声
を計算する手段と、 該符号化音声を伝送回線を介して伝送する手段と、 該伝送する手段に結合されていて、前記符号化音声に応
答して前記音声をディジタル信号に復号する合成器と、 該合成器からのディジタル信号に応答して音声信号を発
生するディジタル/アナログ変換器とを有し、 前記合成器は、ディジタル処理した音声を強化する手段
で構成されていて、 該強化する手段は、 現在フレームに於けるパワーと雑音パワーの長期的な推
定値との比較に基づいて信号確率推定値を発生する手段
と、 sig−probを前記信号確率推定値、1−PをLP
C係数、zを伝達関数の変換表示に使われる単位遅延演
算子の逆数、αおよびβを倍率として、 【数1】{1−P(z/(β×sig−prob))}
/{1−P(z/(α×sig−prob))}、
0<β<α<1 という形の伝達関数を使う事によって行われるような、
前記線形予測係数及び前記信号確率推定値によって制御
される遅延装置によって各ベクトルをフィルタ作用にか
ける第1のフィルタ手段と、 μを倍率として、1−μz-1×sig−probという
形の伝達関数によってフィルタ作用にかける第2のフィ
ルタ手段とで構成されている、低ビット速度音声通信シ
ステム。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US2033796P | 1996-06-19 | 1996-06-19 | |
| US020337 | 1996-06-19 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH1145100A true JPH1145100A (ja) | 1999-02-16 |
| JPH1145100A5 JPH1145100A5 (ja) | 2005-03-17 |
Family
ID=21798075
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP9162949A Pending JPH1145100A (ja) | 1996-06-19 | 1997-06-19 | フィルタリング方法と低ビット速度音声通信システム |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US5966689A (ja) |
| EP (1) | EP0814458B1 (ja) |
| JP (1) | JPH1145100A (ja) |
| KR (1) | KR100421160B1 (ja) |
| DE (1) | DE69730779T2 (ja) |
| TW (1) | TW416044B (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2021192121A (ja) * | 2010-07-02 | 2021-12-16 | ドルビー・インターナショナル・アーベー | 復号方法、コンピュータプログラム及び復号システム |
Families Citing this family (30)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TW376611B (en) * | 1998-05-26 | 1999-12-11 | Koninkl Philips Electronics Nv | Transmission system with improved speech encoder |
| EP0998166A1 (fr) * | 1998-10-30 | 2000-05-03 | Koninklijke Philips Electronics N.V. | Dispositif de traitement audio récepteur et procédé pour filtrer un signal utile et le restituer en présence de bruit ambiant |
| US7295974B1 (en) * | 1999-03-12 | 2007-11-13 | Texas Instruments Incorporated | Encoding in speech compression |
| JP2001175298A (ja) * | 1999-12-13 | 2001-06-29 | Fujitsu Ltd | 騒音抑圧装置 |
| US6529867B2 (en) * | 2000-09-15 | 2003-03-04 | Conexant Systems, Inc. | Injecting high frequency noise into pulse excitation for low bit rate CELP |
| US7133823B2 (en) * | 2000-09-15 | 2006-11-07 | Mindspeed Technologies, Inc. | System for an adaptive excitation pattern for speech coding |
| EP1199812A1 (en) * | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Perceptually improved encoding of acoustic signals |
| AU2002241476A1 (en) * | 2000-11-22 | 2002-07-24 | Defense Group Inc. | Noise filtering utilizing non-gaussian signal statistics |
| US20020128839A1 (en) * | 2001-01-12 | 2002-09-12 | Ulf Lindgren | Speech bandwidth extension |
| SE521693C3 (sv) * | 2001-03-30 | 2004-02-04 | Ericsson Telefon Ab L M | En metod och anordning för brusundertryckning |
| US20030028386A1 (en) * | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
| US7272555B2 (en) * | 2001-09-13 | 2007-09-18 | Industrial Technology Research Institute | Fine granularity scalability speech coding for multi-pulses CELP-based algorithm |
| US7103541B2 (en) * | 2002-06-27 | 2006-09-05 | Microsoft Corporation | Microphone array signal enhancement using mixture models |
| KR100630112B1 (ko) * | 2002-07-09 | 2006-09-27 | 삼성전자주식회사 | 이동통신시스템의 적응형 채널 추정장치 및 방법 |
| US20050071154A1 (en) * | 2003-09-30 | 2005-03-31 | Walter Etter | Method and apparatus for estimating noise in speech signals |
| BRPI0608270A2 (pt) * | 2005-04-01 | 2009-10-06 | Qualcomm Inc | sistemas, métodos e equipamento para filtragem anti-dispersão |
| CN101199003B (zh) * | 2005-04-22 | 2012-01-11 | 高通股份有限公司 | 用于增益因数衰减的系统、方法和设备 |
| KR101565919B1 (ko) | 2006-11-17 | 2015-11-05 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 방법 및 장치 |
| US20080120098A1 (en) * | 2006-11-21 | 2008-05-22 | Nokia Corporation | Complexity Adjustment for a Signal Encoder |
| US8126707B2 (en) * | 2007-04-05 | 2012-02-28 | Texas Instruments Incorporated | Method and system for speech compression |
| EP2232700B1 (en) | 2007-12-21 | 2014-08-13 | Dts Llc | System for adjusting perceived loudness of audio signals |
| US8842846B2 (en) * | 2009-03-18 | 2014-09-23 | Texas Instruments Incorporated | Method and apparatus for polarity detection of loudspeaker |
| EP2246845A1 (en) * | 2009-04-21 | 2010-11-03 | Siemens Medical Instruments Pte. Ltd. | Method and acoustic signal processing device for estimating linear predictive coding coefficients |
| US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
| US9031834B2 (en) * | 2009-09-04 | 2015-05-12 | Nuance Communications, Inc. | Speech enhancement techniques on the power spectrum |
| US8204742B2 (en) * | 2009-09-14 | 2012-06-19 | Srs Labs, Inc. | System for processing an audio signal to enhance speech intelligibility |
| US20120143604A1 (en) * | 2010-12-07 | 2012-06-07 | Rita Singh | Method for Restoring Spectral Components in Denoised Speech Signals |
| KR102060208B1 (ko) | 2011-07-29 | 2019-12-27 | 디티에스 엘엘씨 | 적응적 음성 명료도 처리기 |
| US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
| CN112767956B (zh) * | 2021-04-09 | 2021-07-16 | 腾讯科技(深圳)有限公司 | 音频编码方法、装置、计算机设备及介质 |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE3702215A1 (de) * | 1987-01-26 | 1988-08-04 | Ant Nachrichtentech | Uebertragungsanordnung fuer digitale signale |
| US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
| US5408529A (en) * | 1993-06-02 | 1995-04-18 | Motorola, Inc. | Dual tone detector operable in the presence of speech or background noise and method therefor |
-
1997
- 1997-06-11 TW TW086107998A patent/TW416044B/zh not_active IP Right Cessation
- 1997-06-11 EP EP97109600A patent/EP0814458B1/en not_active Expired - Lifetime
- 1997-06-11 DE DE69730779T patent/DE69730779T2/de not_active Expired - Lifetime
- 1997-06-18 US US08/877,833 patent/US5966689A/en not_active Expired - Lifetime
- 1997-06-18 KR KR1019970025556A patent/KR100421160B1/ko not_active Expired - Lifetime
- 1997-06-19 JP JP9162949A patent/JPH1145100A/ja active Pending
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2021192121A (ja) * | 2010-07-02 | 2021-12-16 | ドルビー・インターナショナル・アーベー | 復号方法、コンピュータプログラム及び復号システム |
| JP2022177215A (ja) * | 2010-07-02 | 2022-11-30 | ドルビー・インターナショナル・アーベー | デコーダシステム、方法及び記憶媒体 |
| US11610595B2 (en) | 2010-07-02 | 2023-03-21 | Dolby International Ab | Post filter for audio signals |
| US11996111B2 (en) | 2010-07-02 | 2024-05-28 | Dolby International Ab | Post filter for audio signals |
| US12531076B2 (en) | 2010-07-02 | 2026-01-20 | Dolby International Ab | Post filter for audio signals |
Also Published As
| Publication number | Publication date |
|---|---|
| KR100421160B1 (ko) | 2004-05-24 |
| TW416044B (en) | 2000-12-21 |
| EP0814458B1 (en) | 2004-09-22 |
| US5966689A (en) | 1999-10-12 |
| EP0814458A3 (en) | 1998-09-23 |
| DE69730779D1 (de) | 2004-10-28 |
| DE69730779T2 (de) | 2005-02-10 |
| KR980006936A (ko) | 1998-03-30 |
| EP0814458A2 (en) | 1997-12-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH1145100A (ja) | フィルタリング方法と低ビット速度音声通信システム | |
| CN102341852B (zh) | 滤波语音信号的方法和滤波器 | |
| CN1185626C (zh) | 修改语音信号的系统和方法 | |
| CN111179954B (zh) | 用于降低时域解码器中的量化噪声的装置和方法 | |
| AU714752B2 (en) | Speech coder | |
| JP3653826B2 (ja) | 音声復号化方法及び装置 | |
| JP4658596B2 (ja) | 線形予測に基づく音声コーデックにおける効率的なフレーム消失の隠蔽のための方法、及び装置 | |
| EP0673013B1 (en) | Signal encoding and decoding system | |
| JP2004510174A (ja) | Celp型音声符号化装置用の利得量子化 | |
| JP2006011464A (ja) | 紛失フレームを取扱うための音声符号化装置および方法 | |
| GB2327835A (en) | Improving speech intelligibility in noisy enviromnment | |
| JP2009541815A (ja) | Itu−tg.711規格と相互動作が可能なマルチレイヤ埋め込みコーデックにおける雑音成形デバイスおよび方法 | |
| JPH09204199A (ja) | 非活性音声の効率的符号化のための方法および装置 | |
| EP2132731B1 (en) | Method and arrangement for smoothing of stationary background noise | |
| US6424942B1 (en) | Methods and arrangements in a telecommunications system | |
| JPH1097296A (ja) | 音声符号化方法および装置、音声復号化方法および装置 | |
| US20030065507A1 (en) | Network unit and a method for modifying a digital signal in the coded domain | |
| CN1044293C (zh) | 背景音的编码/译码方法和设备 | |
| JP2003522964A (ja) | 背景ノイズが共存する符号化音声の品質を向上させるためのシステムおよび方法 | |
| KR100498177B1 (ko) | 신호양자화기 | |
| JP3074680B2 (ja) | 音声復号器のポスト雑音整形フィルタ | |
| US6141639A (en) | Method and apparatus for coding of signals containing speech and background noise | |
| JP3417362B2 (ja) | 音声信号復号方法及び音声信号符号化復号方法 | |
| JP3496618B2 (ja) | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 | |
| GB2343822A (en) | Using LSP to alter frequency characteristics of speech |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040414 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040414 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070323 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20070625 |
|
| A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20070628 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20070723 |
|
| A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20070726 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20070823 |
|
| A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20070828 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20071204 |