JPH1145100A - フィルタリング方法と低ビット速度音声通信システム - Google Patents

フィルタリング方法と低ビット速度音声通信システム

Info

Publication number
JPH1145100A
JPH1145100A JP9162949A JP16294997A JPH1145100A JP H1145100 A JPH1145100 A JP H1145100A JP 9162949 A JP9162949 A JP 9162949A JP 16294997 A JP16294997 A JP 16294997A JP H1145100 A JPH1145100 A JP H1145100A
Authority
JP
Japan
Prior art keywords
signal
prob
sig
filter
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9162949A
Other languages
English (en)
Other versions
JPH1145100A5 (ja
Inventor
Alan V Mccree
ブイ.マックリー アラン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Texas Instruments Inc
Original Assignee
Texas Instruments Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Texas Instruments Inc filed Critical Texas Instruments Inc
Publication of JPH1145100A publication Critical patent/JPH1145100A/ja
Publication of JPH1145100A5 publication Critical patent/JPH1145100A5/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03LAUTOMATIC CONTROL, STARTING, SYNCHRONISATION OR STABILISATION OF GENERATORS OF ELECTRONIC OSCILLATIONS OR PULSES
    • H03L7/00Automatic control of frequency or phase; Synchronisation
    • H03L7/06Automatic control of frequency or phase; Synchronisation using a reference signal applied to a frequency- or phase-locked loop
    • H03L7/08Details of the phase-locked loop
    • H03L7/085Details of the phase-locked loop concerning mainly the frequency- or phase-detection arrangement including the filtering or amplification of its output signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Abstract

(57)【要約】 (修正有) 【課題】混励振線形予測音声コーダの強化フィルタ又は
コードブック励振線形予測音声コーダのポストフィルタ
として使用の2つのフィルタを含む改良したフィルタリ
ング。 【解決手段】第1のフィルタ62は、Pを予測値、α及
びβを倍率、zを伝達関数の変換表示用の単位遅延演算
子の逆数、sig−probを信号確率推定値として、 {1−P(z/(β×sig−prob))}/{1−
P(z/(α×sig−prob))} なる伝達関数を持ち、第2のフィルタ65は、μを倍率
とし、1−μz-1×sig−probの伝達関数を持
ち、sig−probは、現在フレームの信号のパワー
と雑音パワーの長期的な推定値との信号確率推定器63
での比較による信号確率値で、信号のパワーが雑音パワ
ーに30dBを加えた値より大の時、sig−prob
の値は1で、12dBを加えた値より小の時sig−p
robは0である。2つの状態間で、sig−prob
は(対数利得−12dB−雑音利得)/18である。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は音声符号化、更に
具体的に云えば、低ビット速度音声符号化に於ける適応
フィルタ作用に関する。
【0002】
【関連出願】1994年3月3日にA.マックリーによ
って出願された係属中の米国特許出願通し番号第08/
218,033号、発明の名称「端数ピッチを用いた混
励振線形予測」、1994年11月9日にA.マックリ
ーによって出願された係属中の米国特許出願通し番号第
08/336,593号、発明の名称「端数ピッチを用
いた混励振線形予測」はこの出願と関係があり、ここで
引用する。
【0003】
【従来の技術及び課題】人間の音声は大まかに云って2
0kHzまでの範囲の周波数を持つ音響信号のストリー
ムで構成されている。しかし、約100Hzないし5k
Hzの帯域に大部分の音響エネルギーが入っている。人
間の音声の電話伝送は、初めは、伝送のために、(例え
ばマイクを使う事により)アナログ音響信号のストリー
ムをアナログ電圧信号のストリームに変換し、(例えば
スピーカーを使う事によって)音響信号のストリームに
再び変換することで構成されていた。帯域幅を制限する
と共に低周波の問題を避けるために、電気信号を帯域フ
ィルタにかけて300Hzないし4kHzの周波数帯だ
けを残す。しかし、ディジタル電気信号伝送の有利さが
きっかけとなって、ディジタル電話伝送への転換が19
60年代から始まった。ディジタル電話信号は、典型的
には、8kHzでアナログ信号を標本化し、μ−則に従
って(パルス符号変調又はPCMに従って)8ビット・
コードを用いて非直線的にサンプルを量子化する事によ
って取り出す。クロック式ディジタル/アナログ変換器
及び圧伸増幅器が、8ビット・サンプルのストリームか
らアナログ電気信号のストリームを再生する。このよう
な信号は、64kbps(毎秒キロビット)の伝送速度
を必要とするが、これは従来のアナログ信号の伝送の帯
域幅を超えている。
【0004】同様に、音声情報を(例えば電話応答機の
磁気テープに)アナログ・フォーマットで記憶すること
も、ディジタル記憶に置き換えることが出来る。しか
し、メモリの需要は圧倒的になる。8kHzで標本化さ
れた10分間の8ビットPCMは約5MB(メガバイ
ト)の記憶装置を必要とする。
【0005】一層低い伝送速度及び一層小さい記憶条件
に対する要求から、音声信号に対する圧縮が開発される
ようになった。音声圧縮の一つの方式は、音声の生理学
的な発生をモデルし、こうして伝送又は記憶をすべき必
要な情報を少なくする。特に、線形音声発生モデルは、
可変フィルタ(大まかに声道をあらわす)をピッチ周期
Pを持つパルス列(有声音に対し)又はホワイト・ノイ
ズ(無声音に対し)の何れかで励振し、その後音の大き
さを調節する為に増幅する事を前提としている。従来、
1/A(z)が、フィルタの伝達関数のz変換を表す。
このモデルは、単に有声/無声の判定を周期的に下すと
共に、フィルタ係数及び利得を調節する事により、音の
ストリームを発生する。全般については、マーケル及び
グレイの著書「音声の線形予測」(1976年シュプリ
ンガー・フェルラーク発行)を参照されたい。
【0006】ビット速度を下げる為、相次ぐフレームに
対する係数を補間することが出来る。しかし、音の品質
を改善する為、この他の情報を音声から抽出し、圧縮
し、伝送又は記憶する事が出来る。例えば、コードブッ
ク励振線形予測(CELP)方式は、最初に音声フレー
ムを解析してA(z)を見つけ、音声をフィルタ作用に
かける。次に、ピッチ周期の判定を下し、くし型フィル
タがこの周期性を除いて、雑音のように見える励振信号
を作り出す。その後、励振信号がコードブックで符号化
される。この為、CELPはLPCフィルタ係数、ピッ
チ及び励振のコードブック指数を伝送する。
【0007】別の方式は、LPCフィルタに対する有声
又は無声の励振を混合することである。例えば、199
2年8月に、ジョージア・インスティチュート・オブ・
テクノロジに提出されたマックリーの博士論文「低ビッ
ト速度音声符号化のための新しいボコーダ・モデル」で
は、励振周波数範囲を帯域に分割し、各々の帯域で別々
に有声・無声混合の判定を下し、全体の励振に対してそ
の結果を組み合わせる。混励振線形予測(MELP)係
数ボコーダが、IEEEトランザクションズ・オン・ス
ピーチ・アンド・オーディオ・プロセッシング誌第3巻
第4号(1995年7月)所載のA.マックリー他の論
文「低ビット速度音声符号化の為の混励振LPCボコー
ダ・モデル」に記載されている。前に引用した係属中の
米国特許出願通し番号第08/218,033号及び同
第08/336,593号には、混励振線形予測音声コ
ーダーが記載されている。これらの文献をここで引用す
る。
【0008】大抵の低ビット速度音声コーダーは、処理
された音声信号の知覚される品質を改善する為に、何等
かの形の適応スペクトル強化フィルタ又はポストフィル
タを用いている。例えば、マックリー他の混励振線形予
測(MELP)音声コーダーでは、LPCスペクトルに
基づく適応極/ゼロ強化フィルタが使われている。適応
スペクトル強化フィルタは、帯域フィルタにかけられた
音声を、ホルマント領域で自然の音声の波形に釣り合わ
せる助けになる。上に述べたこの適応フィルタは、明瞭
な入力信号に対しては音声品質を改善するが、音響雑音
が存在する場合、このフィルタは実際には性能を劣化さ
せる事がある。強化フィルタは、音響背景雑音のパワー
・スペクトルの変動を増加する傾向を持ち、聞く者にと
って非常に煩わしい事がある不自然な「渦巻き」効果の
原因になる。CELP音声コーダのポストフィルタでも
同じような影響がある。この発明の1つの目的として、
CELPのこの適応スペクトル強化フィルタ又はポスト
フィルタに、明瞭な音声信号に対する現存の方法による
品質の改善を保ちながら、音響雑音が存在する時の性能
を一層良くするような改善を提供する。
【0009】
【課題を解決するための手段】この発明の一実施形態で
は、低ビット速度音声又は可聴信号のディジタル処理さ
れた音声を改善するフィルタリング方法を提供する。こ
のフィルタリングは、線形予測係数パラメータ、並びに
入力フレームが背景雑音ではなく音声である推定確率に
よって制御される。こうすると、処理された背景雑音に
人為効果を導入する事無く、明瞭な音声信号に対するフ
ィルタリングの利点が実現される。
【0010】この発明の上記並びにその他の特徴は、以
下この発明を図面について詳しく説明するところから、
当業者に明らかになろう。
【0011】
【発明の実施の形態】全体的な低ビット速度音声通信シ
ステムが図1に示されており、入力音声がアナログ/デ
ィジタル変換器によって標本化され、パラメータが符号
化されて、解析器600に送られ、記憶装置及び伝送回
線を介して合成器500に送られる。合成器500から
の復号された信号が、ディジタル/アナログ変換器(D
AC)によってスピーカ用の信号に変換される。図2に
は、解析器の若干のブロックが示されている。アナログ
入力音声が変換器620でディジタル音声に変換され、
音声解析器に印加される。この音声解析器は、LPC抽
出器602、ピッチ周期抽出器604、ジッタ抽出器6
06、有声/無声混合制御抽出器608、利得抽出器6
10、及びこれら5つのブロック602〜610からの
入力を集め、それを出力すると共に符号化された状態で
伝送回線を介してクロック作用で送り出す符号器612
を含む。合成器500には復号器536があり、これが
符号器612からの符号化された音声を復号して、LP
Cパラメータ、ピッチ周期、ミックス、ジッタの各々の
フラグ及び利得を発生する。
【0012】図3には、1994年3月25日に出願さ
れた係属中の米国特許出願通し番号第08/218,0
03号に記載されていて、前に引用したマックリー他の
論文に記載されたものに類似するこの発明の一実施例の
MELPボコーダが示されている。合成器500は、復
号器536からのピッチ周期入力によって制御される周
期パルス列発生器502、復号器536からの利得入力
によって制御されるパルス列増幅器504、復号器53
6のジッタ出力からのフラグ入力によって制御されるパ
ルス・ジッタ発生器506、及び復号器536からの5
帯域有声/無声混合入力によって制御されるパルス・フ
ィルタ508を含む。更に合成器500は、ホワイト・
ノイズ発生器512、同じ利得入力によって制御される
利得増幅器514、やはり同じ5帯域有声/無声混合入
力によって制御されるノイズ・フィルタ518、及びフ
ィルタ作用にかけられたパルス及び雑音を組み合わせる
加算器520を含む。加算器の出力が混励振信号e
(n)であり、これが適応スペクトル強化フィルタ53
0に印加され、このフィルタがフォルマントを強調し
て、e′(n)を発生する。この出力が、10個のLP
C係数によって制御されるLPC合成フィルタ532に
印加される。その出力が増幅器533で、復号器536
からの利得で増幅され、パルス分散フィルタ534に印
加されてディジタル合成音声が得られる。このようにデ
ィジタル化された音声が、その後、ディジタル/アナロ
グ変換器540を使って、スピーカー用のアナログ音声
に変換される。この発明の別の実施例では、加算器の出
力e(n)が、10個のLPC係数によって制御される
合成フィルタ532に印加され、LPCフィルタの出力
が適応強化フィルタ530に印加されて、フォルマント
の強調を強め、e′(n)を発生する。
【0013】この発明の一実施例では、この発明は適応
スペクトル強化フィルタ530を強める。MELPコー
ダにある適応スペクトル強化フィルタ530は、LPC
フィルタ係数に基づく極/ゼロ・フィルタである。この
適応フィルタは、帯域フィルタにかけられた合成音声が
フォルマント領域で自然の音声波形と釣り合うようにす
るのを助ける。典型的なフォルマント共振は、自然の音
声でも合成音声でも、ピッチ・パルスの間の時間内に完
全に減衰しないのが普通であるが、合成音声波形は、ピ
ークの間に、自然音声波形よりも、一層低い谷に達す
る。これはおそらく、LPC合成フィルタにある極が、
人間の自然の音声に於けるフォルマント共振の特徴を再
現する事が出来ないためであろう。この問題に対して考
えられる理由は2つある。1つの原因は、LPC極の帯
域幅が正しくない事である。LPCの極は真のフォルマ
ントよりも、共振が一層弱い為に、合成時間信号が減衰
するのが早すぎる事がある。考えられる別の説明は、真
のフォルマントの帯域幅がピッチ周期内で幾分変化する
事があるが、合成音声はこの挙動をまねする事が出来な
い事である。
【0014】前に引用した1995年7月のマックリー
の論文に記載される適応スペクトル強化フィルタは、フ
ォルマントの波形を釣り合わせるという問題に対する簡
単な解決策になる。適応極/ゼロ・フィルタは、フォル
マント周波数の合間の量子化雑音を減らそうとするもの
であるから、CELPコーダに広く使われている。19
87年にダラスで開催された音声信号処理に関するIE
EE国際会議プロシーディング、2185〜2188ペ
ージ所載のチェン他の論文「適応ポストフィルタリング
を用いた4800bpsに於ける実時間ベクトルAPC
音声符号化」を参照されたい。更に、1991年にミネ
ソタ州ノーウェルで開催されたアドヴァンセズ・イン・
スピーチ・コーディング(121〜133項所載)で発
表されたキャンベル他の論文「DOD 4.8kps基
準(連邦基準の提案1016)」をも参照されたい。こ
れらの文献をここで引用する。極は、αを0.8に等し
いとして、LPC合成フィルタの帯域幅を伸長した形式
によって発生される。マックリーの論文によれば、この
全極フィルタは、スペクトルの傾きを強める事によっ
て、擾乱性低域通過フィルタ効果を導入するので、αを
0.5に等しいとして計算した一層弱い全ゼロ・フィル
タを使って、フォルマントの強化を弱めずに、フィルタ
全体の傾きを減らす。更に、簡単な1次FIRフィルタ
を使って、低域通過の消音効果を更に弱める。混励振L
PCボコーダでは、量子化雑音を減らす事が問題ではな
く、このフィルタの時間領域の特性により、ピッチ同期
極帯域幅変調と同様な効果が生じる。図4に示すよう
に、単純に減衰する共振は、この強化フィルタを適用す
る時、時間領域の発声がそれほど急峻でなくなる。この
特徴により、LPCボコーダの音声出力が、フォルマン
ト領域で、自然の音声の帯域幅波形特性と一層良く釣り
合うようになり、合成音声の知覚される品質が高くな
る。
【0015】前に述べたように、強化フィルタの極は、
z−平面内で単位円に向かって0.8倍だけシフトした
LPCフィルタの極である。
【0016】この発明では、この全極フィルタはそれ自
身で、処理された音声信号に消音特性を導入するので、
一層弱い全ゼロ・フィルタをカスケードに使って、極に
よって導入されたスペクトルの傾きを埋め合わせる。更
に、フィルタにもう1つのゼロを含めて、スペクトルの
傾きを更に減少する。米国特許第4,969,192
号、発明の名称「音声及び可聴用ベクトル適応予測コー
ダ」で、チェン他は、CELP音声コーダのポストフィ
ルタに第2のフィルタを使っている。
【0017】現存の方法に伴う問題は、それが音響背景
雑音に存在する変動を増加する事である。ここで説明す
るこの発明の方法は、現在の入力フレームが背景雑音で
はなく、音声である確率の推定値に基づいて、スペクト
ル強化フィルタの強さを適応させる。この確率は、現在
の音声フレームのパワーを雑音パワーの長期的な推定値
と比較する事によって推定される。考えられる不連続性
が強化フィルタをオン及びオフに切り替えるのを防止す
る為、フィルタの強さは、信号確率の或る範囲に亘っ
て、全くフィルタ作用をしない場合から、完全なスペク
トル強化まで徐々に変化する。
【0018】図5には、この発明による改良された強化
フィルタのブロック図が示されている。混励振信号e
(n)がフィルタ62に印加される。このフィルタは、
LPC係数によって制御され、次の伝達関数H(z)を
持っている。
【0019】
【数2】H(z)={1−P(z/β)}/{1−P
(z/α)}、 0<β<α<1
【0020】ここでzは単位遅延演算子z-1の逆数であ
り、α及びβは、チャーピングを生じるスペクトル・ピ
ーク及びスペクトル強化を達成しないピークの或る兼ね
合いを取るように経験的に決定された係数である。予測
フィルタの係数1−P(z)は、解析フィルタの係数A
(z)に等しい。Hzに於ける周波数応答は、2つの全
極フィルタの周波数の間の差であって次の通りである。
【0021】
【数3】
【0022】前に述べたマックリーの論文では、強化フ
ィルタに対する数値は、β=0.5及びα=0.8の第
1のフィルタと、1−μz-1の伝達関数を持つ第2のフ
ィルタとで構成されていた。この発明では、第1のフィ
ルタに対し、信号確率推定器63からの信号確率値(s
ig−prob)に、フィルタ62で、0.5のβを乗
算(* )し、それと共に0.8のαを乗算(* )する。
即ち、β=0.5* sig−prob(推定器で測定さ
れた信号確率)及びα=0.8* sig−prob。フ
ィルタ62の出力が第2のフィルタ65に結合される。
このフィルタは、1−μz-1にsig−probを乗算
* )した伝達関数を持ち、典型的にはμは0.5にk
(1)を乗算(* )したものである。項k(1)は第1
反射係数である。信号確率推定器63は、解析器からの
利得(図4の610で図3の536から復号した)に応
答して、現在フレームのパワーが雑音パワーの長期的な
推定値に比べてどうであるかを判定する。推定器のフロ
ーチャートが図6に示されている。推定器63が、ある
時定数及びステップ寸法を設定し、その後、利得の対数
を雑音利得に30dBを加えた値と比較する。パワー・
レベルが雑音利得+30dBより大きければ、sig−
probを1と置き、パワー・レベルが雑音利得+12
dBより小さければ、sig−probを0にして、フ
ィルタ作用をしない。このようにして、信号が存在すれ
ばフィルタが適用されるが、雑音が存在すれば適用され
ない。利得が、これらの極限の間にある場合、sig−
probの値は、(対数利得−12dB−雑音利得)を
18で除した値に等しい。これは、12dB及び30d
Bの間で0と1の間の直線的な傾斜値である。この“s
ig−prob”が、α、β及びμに対する乗数にな
る。時定数は、音声信号を平均して無くし、雑音のフロ
アの値を近似するように選ばれる。
【0023】TMS320C31 DSPチップで動作
する実時間形の2.4kb/s MELPコーダでは、
この改良された適応スペクトル強化方法により、雑音の
ある入力音声に対して音声の品質に明らかな改善が得ら
れ、それと共に明瞭な入力信号に対しては、現存の方法
と同じ品質が保たれる。推定器63は下記の擬似符号に
従うコードを実行するプロセッサ・チップの一部分であ
って良い。
【0024】* 現在フレームの対数利得から平均雑音利得を推定する 時定数/ステップ寸法 up=0.0675; down=−0.27; min=10; max=80; if(対数利得>雑音利得+up) 雑音利得=雑音利得+up; else if(対数利得<雑音利得+down) 雑音利得=雑音利得+down; else 雑音利得=対数利得 /* 雑音利得の全範囲を制限* / if(雑音利得<min) 雑音利得=min; if(雑音利得>max) 雑音利得=max;* 雑音パワーとの比較により、現在フレームの信号確率を推定する if(対数利得>雑音利得+30 dB) sig_prob=1.0; else if(対数利得<雑音利得+12 dB) sig_prob=0.0; else sig_prob=(対数利得−12−雑音利得)/18;* ポストフィルタ係数を計算する pf_num=bw_expand(lpc_coeff, sig_prob* 0.5); pf_den=bw_expand(lpc_coeff, sig_prob* 0.8); tilt_cof=[1, −sig_prob* k[1 第1反射係数] ];* 励振信号に適応スペクトル強化フィルタを適用する フィルタ(励振、pf_num,pf_den); フィルタ(励振、tilt_cof); この方法は、スペクトル強化又はポストフィルタリング
を希望するこの他の音声符号化の用途に容易に用いる事
が出来る事がわかる。
【0025】前に引用したチェン他の米国特許第4,9
69,192号には、第1のフィルタの値がβ=0.5
並びにα=0.8であると共に第2のフィルタの伝達関
数が1−μz-1であるポストフィルタが記載されてい
る。この発明に従って、推定確率が背景雑音では無く、
音声に対するものであることを考慮するように上に述べ
たように変更した時、短い遅延のポストフィルタ32a
では、第1のフィルタに対し、β=0.5×sig−p
rob、α=0.8×sig−probである。第2の
フィルタは伝達関数がμz-1×sig−probであ
り、ここでk(1)を第1反射係数として、μが0.5
×k(1)である。この発明並びにその利点を詳しく説
明したが、特許請求の範囲によって定められたこの発明
の範囲を逸脱せずに、この実施例に種々の変更、置換を
加える事が出来る事を承知されたい。
【0026】以上の説明に関し、更に以下の項目を開示
する。 (1) ディジタル処理した音声信号を改善するフィル
タリング方法に於て、現在フレームに於ける前記信号の
パワーと雑音パワーの長期的な推定値との比較に基づく
信号確率推定値を発生し、最初に、線形予測係数及び前
記信号確率値によって制御される遅延装置によって前記
信号をフィルタ作用にかけ、2番目に、μを倍率、z-1
を単位遅延演算子として、1−μz-1×信号確率値とい
う形の伝達関数によってフィルタ作用にかける工程を含
むフィルタリング方法。 (2) 項1記載のフィルタリング方法に於て、前記信
号パワーの対数利得が雑音パワーに30dBを加えた値
より大きい場合、前記信号確率値が1であるフィルタリ
ング方法。 (3) 項2記載のフィルタリング方法に於て、前記パ
ワーが雑音パワーに12dBを加えた値より小さい場
合、前記信号確率値が0であるフィルタリング方法。 (4) 項3記載のフィルタリング方法に於て、前記パ
ワーが雑音利得に12dBを加えた値より大きく、雑音
利得に30dBを加えた値より小さい場合、信号確率値
が(対数利得−12−雑音利得)/18に等しいフィル
タリング方法。
【0027】(5) 項4記載のフィルタリング方法に
於て、最初にフィルタ作用にかける工程が、Pを予測
値、α及びβを倍率、zを単位遅延z-1の逆数、μを倍
率として、
【数4】{1−P(z/(β×sig−prob))}
/{1−P(z/(α×sig−prob))} という伝達関数を持っているフィルタリング方法。
【0028】(6) 項5記載のフィルタリング方法に
於て、α=0.8、β=0.5であるフィルタリング方
法。 (7) 項6記載のフィルタリング方法に於て、k
(1)を第1反射係数として、μが0.5×k(1)で
あるフィルタリング方法。
【0029】(8) 項1記載のフィルタリング方法に
於て、最初にフィルタ作用にかける工程が、Pを予測
値、α及びβを倍率、zを単位遅延z-1の逆数として、
【数5】{1−P(z/(β×sig−prob))}
/{1−P(z/(α×sig−prob))} という伝達関数を持っているフィルタリング方法。
【0030】(9) 項8記載のフィルタリング方法に
於て、α=0.8、β=0.5、μ=0.5(k1)で
k(1)が第1反射係数であるフィルタリング方法。
【0031】(10) ディジタル処理した音声又は可
聴信号を強化するフィルタリング方法に於て、前記音声
又は可聴信号をバッファ作用にかけて、各ベクトルがK
個の相次ぐサンプルを持つようなベクトルのフレームに
し、予定のブロックにある音声又は可聴信号のバッファ
作用で作ったフレームの解析を実施して、線形予測係数
及び現在フレームに於けるパワーを計算し、現在フレー
ムに於けるパワーと雑音パワーの長期的な推定値との比
較に基づいて、信号確率推定値sig−probを発生
し、最初に、前記線形予測係数及び信号確率推定値によ
って制御される遅延装置によって各ベクトルをフィルタ
作用にかけ、このフィルタ作用は、1−PをLPC係
数、zを伝達関数の変換表示に使われる単位遅延演算子
の逆数、α及びβをsig−probの倍率として、
【数6】{1−P(z/(β×sig−prob))}
/{1−P(z/(α×sig−prob))}、
0<β<α<1 という形の伝達関数を使う事によって行われ、2番目
に、μを倍率として、1−μz-1×sig−probと
いう形の伝達関数によるフィルタ作用にかける工程を含
むフィルタリング方法。
【0032】(11) 項10記載のフィルタリング方
法に於て、パワーが雑音利得に30dBを加えた値より
大きければ、前記信号確率値が1であるフィルタリング
方法。 (12) 項11記載のフィルタリング方法に於て、パ
ワーが雑音利得に12dBを加えた値より小さければ、
前記信号確率値が0であるフィルタリング方法。 (13) 項12記載のフィルタリング方法に於いて、
パワーが雑音利得に12dBを加えた値より大きく、雑
音利得に30dBを加えた値より小さい場合に、信号確
率値を(対数利得−12−雑音利得)/18に等しいと
するフィルタリング方法。 (14) 項10記載のフィルタリング方法に於て、α
=0.8、β=0.5、μ=0.5k(1)でk(1)
が第1反射係数であるフィルタリング方法。 (15) 項14記載のフィルタリング方法に於て、対
数利得が雑音利得に30dBを加えた値より大きけれ
ば、前記sig−probが1であるフィルタリング方
法。 (16) 項15記載のフィルタリング方法に於て、対
数利得が雑音利得に12dBを加えた値より小さけれ
ば、前記sig−probが0であるフィルタリング方
法。 (17) 項16記載のフィルタリング方法に於いて、
パワーが雑音利得に12dBを加えた値より大きく、雑
音利得に30dBを加えた値より小さい場合に、前記s
ig−probを(対数利得−12−雑音利得)/18
に等しいとするフィルタリング方法。
【0033】(18) 音声信号を伝送する低ビット速
度音声通信システムに於て、前記音声信号をバッファ作
用にかけて、各ベクトルが相次ぐサンプルを持つベクト
ルのフレームにする手段と、予定のブロック内にあるバ
ッファ作用によって作った音声又は可聴信号のフレーム
の解析を実施して、現在フレームに於ける線形予測係数
及びパワーを含む符号化音声を計算する手段と、該符号
化音声を伝送回線を介して伝送する手段と、該伝送する
手段に結合されていて、前記符号化音声に応答して前記
音声をディジタル信号に復号する合成器と、該合成器か
らのディジタル信号に応答して音声信号を発生するディ
ジタル/アナログ変換器とを有し、前記合成器は、ディ
ジタル処理した音声を強化する手段で構成されていて、
該強化する手段は、現在フレームに於けるパワーと雑音
パワーの長期的な推定値との比較に基づいて信号確率推
定値sig−probを発生する手段、1−PをLPC
係数、zを伝達関数の変換表示に使われる単位遅延演算
子の逆数、αおよびβを倍率として
【数7】{1−P(z/(β×sig−prob))}
/{1−P(z/(α×sig−prob))}、
0<β<α<1 という形の伝達関数を使う事によって行われるような、
前記線形予測係数及び前記信号確率推定値によって制御
される遅延装置によって各ベクトルをフィルタ作用にか
ける第1のフィルタ手段と、μを倍率として、1−μz
-1×sig−probという形の伝達関数によってフィ
ルタ作用にかける第2のフィルタ手段で構成されてい
る、低ビット速度音声通信システム。
【0034】(19) 項18記載の低ビット速度音声
通信システムに於て、前記パワーが雑音利得に30dB
を加えた値より大きければ、前記信号確率値sib−p
robが1である低ビット速度音声通信システム。 (20) 項19記載の低ビット速度音声通信システム
に於て、前記パワーが雑音利得に12dBを加えた値よ
り小さければ、前記信号確率値sig−probが0で
ある低ビット速度音声通信システム。 (21) 項20記載の低ビット速度音声通信システム
に於て、前記パワーが雑音利得に12dBを加えた値よ
り大きく、雑音利得に30dBを加えた値より小さけれ
ば、信号確率値sig−probを(対数利得−12−
雑音利得)/18に等しいとする低ビット速度音声通信
システム。 (22) 項18記載の低ビット速度音声通信システム
に於て、βが0.5であり、αが0.8であり、k
(1)を第1反射係数として、μが0.5×k(1)で
ある低ビット速度音声通信システム。 (23) 項18記載の低ビット速度音声通信システム
に於て、前記合成器が、LPC係数によって制御される
LPCフィルタを含む低ビット速度音声通信システム。
【0035】(24) 項23記載の低ビット速度音声
通信システムに於て、前記強化する手段が前記LPCフ
ィルタより前にある低ビット速度音声通信システム。 (25) 項23記載の低ビット速度音声通信システム
に於て、前記強化する手段が前記LPCフィルタより後
にある低ビット速度音声通信システム。 (26) 項18記載の低ビット速度音声通信システム
に於て、該システムがMELPコーダである低ビット速
度音声通信システム。 (27) ディジタル処理した音声信号を改善するフィ
ルタに於て、現在フレームに於ける前記信号のパワーと
雑音パワーの長期的な推定値との比較に基づいて信号確
率推定値を発生する手段と、線形予測係数及び前記信号
確率値によって制御される遅延装置によって前記信号を
フィルタ作用にかける第1のフィルタと、μを倍率、z
-1を単位遅延演算子として、1−μz-1×信号確率値と
いう形の伝達関数を持つ第2のフィルタとを有するフィ
ルタ。
【0036】(28) 項27記載のフィルタリング方
法に於て、前記信号のパワーの対数利得が雑音利得に3
0dBを加えた値より大きければ、前記信号確率値が1
であるフィルタリング方法。 (29) 項28記載のフィルタリング方法に於て、前
記パワーが雑音利得に12dBを加えた値より小さけれ
ば、前記信号確率値が0であるフィルタリング方法。 (30) 項29記載のフィルタリング方法に於いて、
前記パワーが雑音利得に12dBを加えた値より大き
く、雑音利得に30dBを加えた値より小さい場合に、
信号確率値を(対数利得−12−雑音利得)/18に等
しいとするフィルタリング方法。
【0037】(31) 項30記載のフィルタに於て、
前記第1のフィルタが、Pを予測値、α及びβを倍率、
zを単位遅延z-1の逆数、μを倍率として、
【数8】{1−P(z/(β×sig−prob))}
/{1−P(z/(α×sig−prob))} という形の伝達関数を有するフィルタ。
【0038】(32) 項31記載のフィルタに於て、
α=0.8、β=0.5であるフィルタ。 (33) 項32記載のフィルタに於て、k(1)を第
1反射係数として、μが0.5×k(1)であるフィル
タ。
【0039】(34) 混励振線形予測(MELP)音
声コーダの強化フィルタ又はコードブック励振線形予測
(CELP)音声コーダのポストフィルタとして使う為
の2つのフィルタを含む改良されたフィルタリング方法
を説明した。第1のフィルタ62は、Pを予測値、α及
びβを倍率、zを伝達関数の変換表示に使われる単位遅
延演算子の逆数、sig−probを信号確率推定値と
して、
【数9】{1−P(z/(β×sig−prob))}
/{1−P(z/(α×sig−prob))} という伝達関数を持ち、第2のフィルタ65は、μを倍
率として、1−μz-1×sig−probの伝達関数を
持つ。sig−probは、現在フレームの信号のパワ
ーと雑音パワーの長期的な推定値との信号確率推定器6
3に於ける比較に基づく信号確率値である。信号のパワ
ーが雑音パワーに30dBを加えた値より大きければ、
sig−probの値は1であり、このパワーが雑音パ
ワーに12dBを加えた値より小さければsig−pr
obは0である。この2つの状態の間では、sig−p
robは(対数利得−12dB−雑音利得)/18であ
る。
【図面の簡単な説明】
【図1】音声通信システムの全体的なブロック図。
【図2】図1の音声解析器のブロック図。
【図3】合成器のブロック図。
【図4】自然の音声を減衰する波形に対して示してお
り、(a)は自然の音声の母音の最初のフォルマントを
示し、(b)は指数関数で減衰する合成の共振、(c)
はこの共振に対する極/ゼロ強化フィルタのインパルス
応答、(d)は強化した減衰する共振を示す。
【図5】この発明の一実施例による適応スペクトル強化
フィルタのブロック図。
【図6】信号確率推定器のフローチャート。
【符号の説明】
62 第1のフィルタ 63 信号確率推定器 65 第2のフィルタ

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 ディジタル処理した音声信号を改善する
    フィルタリング方法に於て、 現在フレームに於ける前記信号のパワーと雑音パワーの
    長期的な推定値との比較に基づく信号確率推定値を発生
    し、 最初に、線形予測係数及び前記信号確率値によって制御
    される遅延装置によって前記信号をフィルタ作用にか
    け、 2番目に、μを倍率、z-1を単位遅延演算子として、1
    −μz-1×信号確率値という形の伝達関数によってフィ
    ルタ作用にかける工程を含むフィルタリング方法。
  2. 【請求項2】 音声信号を伝送する低ビット速度音声通
    信システムに於て、 前記音声信号をバッファ作用にかけて、各ベクトルが相
    次ぐサンプルを持つベクトルのフレームにする手段と、 予定のブロック内にあるバッファ作用によって作った音
    声又は可聴信号のフレームの解析を実施して、現在フレ
    ームに於ける線形予測係数及びパワーを含む符号化音声
    を計算する手段と、 該符号化音声を伝送回線を介して伝送する手段と、 該伝送する手段に結合されていて、前記符号化音声に応
    答して前記音声をディジタル信号に復号する合成器と、 該合成器からのディジタル信号に応答して音声信号を発
    生するディジタル/アナログ変換器とを有し、 前記合成器は、ディジタル処理した音声を強化する手段
    で構成されていて、 該強化する手段は、 現在フレームに於けるパワーと雑音パワーの長期的な推
    定値との比較に基づいて信号確率推定値を発生する手段
    と、 sig−probを前記信号確率推定値、1−PをLP
    C係数、zを伝達関数の変換表示に使われる単位遅延演
    算子の逆数、αおよびβを倍率として、 【数1】{1−P(z/(β×sig−prob))}
    /{1−P(z/(α×sig−prob))}、
    0<β<α<1 という形の伝達関数を使う事によって行われるような、
    前記線形予測係数及び前記信号確率推定値によって制御
    される遅延装置によって各ベクトルをフィルタ作用にか
    ける第1のフィルタ手段と、 μを倍率として、1−μz-1×sig−probという
    形の伝達関数によってフィルタ作用にかける第2のフィ
    ルタ手段とで構成されている、低ビット速度音声通信シ
    ステム。
JP9162949A 1996-06-19 1997-06-19 フィルタリング方法と低ビット速度音声通信システム Pending JPH1145100A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US2033796P 1996-06-19 1996-06-19
US020337 1996-06-19

Publications (2)

Publication Number Publication Date
JPH1145100A true JPH1145100A (ja) 1999-02-16
JPH1145100A5 JPH1145100A5 (ja) 2005-03-17

Family

ID=21798075

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9162949A Pending JPH1145100A (ja) 1996-06-19 1997-06-19 フィルタリング方法と低ビット速度音声通信システム

Country Status (6)

Country Link
US (1) US5966689A (ja)
EP (1) EP0814458B1 (ja)
JP (1) JPH1145100A (ja)
KR (1) KR100421160B1 (ja)
DE (1) DE69730779T2 (ja)
TW (1) TW416044B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021192121A (ja) * 2010-07-02 2021-12-16 ドルビー・インターナショナル・アーベー 復号方法、コンピュータプログラム及び復号システム

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW376611B (en) * 1998-05-26 1999-12-11 Koninkl Philips Electronics Nv Transmission system with improved speech encoder
EP0998166A1 (fr) * 1998-10-30 2000-05-03 Koninklijke Philips Electronics N.V. Dispositif de traitement audio récepteur et procédé pour filtrer un signal utile et le restituer en présence de bruit ambiant
US7295974B1 (en) * 1999-03-12 2007-11-13 Texas Instruments Incorporated Encoding in speech compression
JP2001175298A (ja) * 1999-12-13 2001-06-29 Fujitsu Ltd 騒音抑圧装置
US6529867B2 (en) * 2000-09-15 2003-03-04 Conexant Systems, Inc. Injecting high frequency noise into pulse excitation for low bit rate CELP
US7133823B2 (en) * 2000-09-15 2006-11-07 Mindspeed Technologies, Inc. System for an adaptive excitation pattern for speech coding
EP1199812A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Perceptually improved encoding of acoustic signals
AU2002241476A1 (en) * 2000-11-22 2002-07-24 Defense Group Inc. Noise filtering utilizing non-gaussian signal statistics
US20020128839A1 (en) * 2001-01-12 2002-09-12 Ulf Lindgren Speech bandwidth extension
SE521693C3 (sv) * 2001-03-30 2004-02-04 Ericsson Telefon Ab L M En metod och anordning för brusundertryckning
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
US7272555B2 (en) * 2001-09-13 2007-09-18 Industrial Technology Research Institute Fine granularity scalability speech coding for multi-pulses CELP-based algorithm
US7103541B2 (en) * 2002-06-27 2006-09-05 Microsoft Corporation Microphone array signal enhancement using mixture models
KR100630112B1 (ko) * 2002-07-09 2006-09-27 삼성전자주식회사 이동통신시스템의 적응형 채널 추정장치 및 방법
US20050071154A1 (en) * 2003-09-30 2005-03-31 Walter Etter Method and apparatus for estimating noise in speech signals
BRPI0608270A2 (pt) * 2005-04-01 2009-10-06 Qualcomm Inc sistemas, métodos e equipamento para filtragem anti-dispersão
CN101199003B (zh) * 2005-04-22 2012-01-11 高通股份有限公司 用于增益因数衰减的系统、方法和设备
KR101565919B1 (ko) 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
US20080120098A1 (en) * 2006-11-21 2008-05-22 Nokia Corporation Complexity Adjustment for a Signal Encoder
US8126707B2 (en) * 2007-04-05 2012-02-28 Texas Instruments Incorporated Method and system for speech compression
EP2232700B1 (en) 2007-12-21 2014-08-13 Dts Llc System for adjusting perceived loudness of audio signals
US8842846B2 (en) * 2009-03-18 2014-09-23 Texas Instruments Incorporated Method and apparatus for polarity detection of loudspeaker
EP2246845A1 (en) * 2009-04-21 2010-11-03 Siemens Medical Instruments Pte. Ltd. Method and acoustic signal processing device for estimating linear predictive coding coefficients
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
US9031834B2 (en) * 2009-09-04 2015-05-12 Nuance Communications, Inc. Speech enhancement techniques on the power spectrum
US8204742B2 (en) * 2009-09-14 2012-06-19 Srs Labs, Inc. System for processing an audio signal to enhance speech intelligibility
US20120143604A1 (en) * 2010-12-07 2012-06-07 Rita Singh Method for Restoring Spectral Components in Denoised Speech Signals
KR102060208B1 (ko) 2011-07-29 2019-12-27 디티에스 엘엘씨 적응적 음성 명료도 처리기
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
CN112767956B (zh) * 2021-04-09 2021-07-16 腾讯科技(深圳)有限公司 音频编码方法、装置、计算机设备及介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3702215A1 (de) * 1987-01-26 1988-08-04 Ant Nachrichtentech Uebertragungsanordnung fuer digitale signale
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US5408529A (en) * 1993-06-02 1995-04-18 Motorola, Inc. Dual tone detector operable in the presence of speech or background noise and method therefor

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021192121A (ja) * 2010-07-02 2021-12-16 ドルビー・インターナショナル・アーベー 復号方法、コンピュータプログラム及び復号システム
JP2022177215A (ja) * 2010-07-02 2022-11-30 ドルビー・インターナショナル・アーベー デコーダシステム、方法及び記憶媒体
US11610595B2 (en) 2010-07-02 2023-03-21 Dolby International Ab Post filter for audio signals
US11996111B2 (en) 2010-07-02 2024-05-28 Dolby International Ab Post filter for audio signals
US12531076B2 (en) 2010-07-02 2026-01-20 Dolby International Ab Post filter for audio signals

Also Published As

Publication number Publication date
KR100421160B1 (ko) 2004-05-24
TW416044B (en) 2000-12-21
EP0814458B1 (en) 2004-09-22
US5966689A (en) 1999-10-12
EP0814458A3 (en) 1998-09-23
DE69730779D1 (de) 2004-10-28
DE69730779T2 (de) 2005-02-10
KR980006936A (ko) 1998-03-30
EP0814458A2 (en) 1997-12-29

Similar Documents

Publication Publication Date Title
JPH1145100A (ja) フィルタリング方法と低ビット速度音声通信システム
CN102341852B (zh) 滤波语音信号的方法和滤波器
CN1185626C (zh) 修改语音信号的系统和方法
CN111179954B (zh) 用于降低时域解码器中的量化噪声的装置和方法
AU714752B2 (en) Speech coder
JP3653826B2 (ja) 音声復号化方法及び装置
JP4658596B2 (ja) 線形予測に基づく音声コーデックにおける効率的なフレーム消失の隠蔽のための方法、及び装置
EP0673013B1 (en) Signal encoding and decoding system
JP2004510174A (ja) Celp型音声符号化装置用の利得量子化
JP2006011464A (ja) 紛失フレームを取扱うための音声符号化装置および方法
GB2327835A (en) Improving speech intelligibility in noisy enviromnment
JP2009541815A (ja) Itu−tg.711規格と相互動作が可能なマルチレイヤ埋め込みコーデックにおける雑音成形デバイスおよび方法
JPH09204199A (ja) 非活性音声の効率的符号化のための方法および装置
EP2132731B1 (en) Method and arrangement for smoothing of stationary background noise
US6424942B1 (en) Methods and arrangements in a telecommunications system
JPH1097296A (ja) 音声符号化方法および装置、音声復号化方法および装置
US20030065507A1 (en) Network unit and a method for modifying a digital signal in the coded domain
CN1044293C (zh) 背景音的编码/译码方法和设备
JP2003522964A (ja) 背景ノイズが共存する符号化音声の品質を向上させるためのシステムおよび方法
KR100498177B1 (ko) 신호양자화기
JP3074680B2 (ja) 音声復号器のポスト雑音整形フィルタ
US6141639A (en) Method and apparatus for coding of signals containing speech and background noise
JP3417362B2 (ja) 音声信号復号方法及び音声信号符号化復号方法
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
GB2343822A (en) Using LSP to alter frequency characteristics of speech

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040414

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040414

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070323

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070625

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070628

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070723

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070726

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070823

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070828

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071204