TW482993B

TW482993B - Method and apparatus for suppressing audible noise in speech transmission

Info

Publication number: TW482993B
Application number: TW089120732A
Authority: TW
Inventors: Dietmar Dr Ruwisch
Original assignee: Cortologic Ag
Priority date: 1999-10-06
Filing date: 2000-10-05
Publication date: 2002-04-11
Also published as: DE19948308C2; DE50009461D1; ATE289110T1; CA2319995C; EP1091349A2; CA2319995A1; US6820053B1; EP1091349B1; DE19948308A1; EP1091349A3

Description

482993 A7 B7 五、發明說明（/) 發明背景 (請先閱讀背面之注意事項再填寫本頁) 本發明係有關於藉由多層級自架構回授類神經網路，用以抑制語音傳迭中之可聽見的雜訊之方法及裝置。在可傳輸的記錄設備中的遠距通信以及語音中，其問題乃是：所傳送以及所記錄的語音之可理解性可能會受到可聽見的雜訊相當大的損害。此一問題在汽車駕駛者於其車輛內部使用具有免持設備之電話時特別明顯。爲了抑制可聽見的雜訊，普遍的實施爲將濾波器插入於其信號路徑之中。在此一著眼點上，由於可聽見的雜訊非常\可能出現在相同於語音信號本身的頻率範圍之內，因此典型的帶通濾波器之效用會受到限制。由於此一理由，可適用的濾波器因而需要自動地使自己適應當前的雜訊以及所要傳送的語音信號之特性。一些不同的觀念乃是眾所周知的，並且可應用於如此的目的。，經濟部智慧財產局員工消費合作社印製

Wienei-Kologorov 濾波器(S.V. Vaseghi，”先進的信號處理以及數位雜訊之降低”】ohn Wiley及Teubner-Vedag，1996 年）爲從最佳化匹配的濾波器原理中所推導出的裝置。此一方法乃是基於實際以及所期望的語音信號之間的均方誤差之最小化。如此的瀘波觀念需要枏當大量的計算。此外，如此以及其它大多數的習知方法在理論上的要求爲：可聽見的雜訊乃是靜止的。

Kalman濾波器則是基於相類似的濾波定理(E. Wan及 A. Nelson，”使用雙延展Kalman濾波器之演算法從語音中除去雜訊”，IEEE在聲波以及信號處理領域上的國際硏討 3 本紙張尺度適用中國國家標準（CNS)A4規格（210 X 297公釐） 482993 A7 _____ B7 五、發明說明) 會(ICASSP’98)，1998年，於西雅圖）。如此的濾波定理之缺點爲：需要用來決定濾波器參數所延伸的調整時間。 (請先閱讀背面之注意事項再填寫本頁) 另一個濾波觀念已經爲H. Hermansky及N· Morgan，” 語音的RASTA處理”，1994年IEEE在語音及成音處理領域的期刊第2冊、第四號、第587頁中所得知了。此一方法同樣也需要調整的程序；此外，不同種類的雜訊需要不同的參數設定。 —種LPC的已知方法則需要漫長的計算，藉由線性預測處理的輔助，來推算出用來計算濾波器係數的相關矩陣 ;在此一著眼點上，觀視T. Arai，H. Hermansky，M. Paveland，C. Avendano，”具有 LPC Cepstrum 的濾波時間軌線之語音可理解性”，1996年Maehca聽覺協會期刊，第 100冊，第4號，第2部份，第2756頁。其它的習知方法使用用於語音放大的多層級知覺型式之類神經網路，諸如 H. Hermansky，E. Wan，C. Avendano ，”基於暫時處理的語音增強”，1995年於底特律，IEEE在聲波以及信號處理領域上的國際硏討會(ICASSP’95)之中所說明的。經濟部智慧財產局員工消費合作社印製本發明的目的乃是提供一種適度的計算以藉由其時間以及頻譜的特性便足夠識別一個語音信號的方法，並且足夠從語音信號中去除可聽見的雜訊。本目的則是藉由用於雜訊濾波的濾波函數F(f，T)所實現的，其是由最小値檢測層級、反應層級、擴散層級以及積分層級所定義的。 4 本紙張尺度適用中國國家標準（CNS)A4規格（210 X 297公釐）經濟部智慧財產局員工消費合作社印製 482993 A7 B7 五、發明說明（3 ) 一以此方法所架構的網路由其時間以及頻譜特性來識別出語音信號，並且能夠從其中去除可聽見的雜訊。相較、於習知的方法，其所需要的計算之付出低。其方法的特色爲非常短的適應時間，而系統於其時間內便會適應雜訊性質。在信號處理中所涵蓋的信號延遲非常地短’致使其濾波器能夠使用於即時的遠距通信系統之中。再者，優點措施之說明陳述於申請專利範圍中的依附項。本發明以附圖來闡述，並且將會以下面的部份說明詳細地說明之。圖示說明圖1本發明的整體之語音濾波系統；圖2 —種類神經網路，其包含一個最小値檢測層級、一個反應層級、一個擴散層級以及一個積分層級；圖3 —個決定M(f，T)的最小値檢測層級之類神經單元圖4反應層級的一個類神經單元，其經由積分信號 S(T-l)的反應函數r[S(T-l)]、可自由選擇的參數K、A(f，T) 以及M(f，T)之輔助，決定相關的頻譜R(f，T)，其中K則是設定雜訊抑制的振幅；圖5散佈層級的類神經單元，其中實現相應於其擴散 .所連接的局部模式；圖6所闡述的積分層級之類神經單元；圖.7本發明相應於各種控制參數κ的設定之濾波特性範例。 5 本紙張尺&適財酬家標準（CNS)A4規格（210 X 297公爱) 一一 (請先閱讀背面之注意事項再填寫本頁) ·. 482993

五、發明說明（4) 本發明之詳述达匕系圖1圖式地整體顯示一個示範的語音濾波系統/ 統包含一個取樣單元1〇，其在時間t中取樣具有雜#、Μ 音信號，藉以得到離散的樣本χ⑴’於時間τ中組合以形成每一個皆包含η個樣本的架構。在時間Τ之下，使用傅立葉變換得到這樣的每一個架構之頻譜A(f，T)，並且使用在圖2中所不的一種類神經網路，藉以計算濾波函數F(f，T)，其瀘波函數與信號頻譜 A(f，T)相乘，產生無雜訊的頻譜B(f，T)，將其供給濾波單元 ll(f，T)(f，T)(f，T)。濾波後的信號則傳遞至合成單元12，合成單元12於所濾波的頻譜B(f，T)上使用逆傅立葉變換，藉以合成無雜訊的語音信號y(t)。經濟部智慧財產局員工消費合作社印制衣 (社^先閱讀背面之注意事項再填寫本頁) 丨線- 圖2顯示一種類神經網路，其包含一個最小値檢測層級、一個反應層級、一個擴散層級及一個積分層級，其中的積分層級爲本發明所必需的部份’其網路則具有輸入信號之頻譜A(f，T)，藉以應用來計算濾波函數F(f，T)。其頻譜在不同頻率下的每一種模式相應於除了積分層級之外的每一網路層級之單一類神經單元。在以下的圖示中更爲詳細地說明各層級。因此，圖3顯示最小値檢測層級的一個類神經單元，其用來決定M(f，T)。在頻率f的模式中，振幅A(f，T)取m 個架構的平均。M(f，T)爲在一個時間區間內這些平均振幅之最小値，而一個時間區間則是相應於一個架構的長度。圖4顯示反應層級的一個類神經單元，其使用反應函 6 本纸張尺度適用中國國家標準（CNS)A4規格（210 χ 297公釐） 482993 經濟部智慧財產局員工消費合作社印製 A7 B7 五、發明說明（上）數r[S(T-l)]經由積分信號S(T-l)、可自由選擇的參數、 A(f，T)、以及M(f，T)，來決定相關頻譜R(f，T)，其中可自由選擇參數乃是設定雜訊抑制的振幅，而積分信號S(T-l)則詳細地顯示於圖6中。R(f，T)具有零至一之間的數値。反應層級藉由評估信號時間響應來區別語音與可聽見的雜訊。圖5顯示擴散層級的一個類神經單元，其實現相應於其散佈連接的局部模式。在時間T固定之下，擴散常數d 決定在頻率f產生的平整效應之數量。擴散層級從相關信號R(f，T)中推算出適當的濾波函數F(f，T)，而頻譜A(f，T)則與之相乘，藉以消除可聽見的雜訊。散佈層級藉由其頻譜的特性來區別語音以及可聽見的雜訊。 1 圖6顯示在本發明所選擇的實施例中所使用的單一類神經單元，用以形成其積分層級；在固定的時間T，將濾波器函數F(f，T)於整個頻率f上積分，並且將所得到的積分信號S(T)回授至反應層級中，如圖2所示。藉由如此的環狀連接之優點爲：.當雜訊爲高位準時，其具有高的濾波效果，而同時能傳送無雜訊的語音，而不致使之惡化。圖7顯示本發明示範的濾波特性，其乃是針對不同的控制參數K所繪製的。本發明所剩餘的其它參數爲：n=256 個樣本/架構，m=2.5個架構，1=15個架構，d=0.25。此一圖示顯示所調變的白色雜訊之振幅在整個調變頻率上的褰減。對0·6Ηζ以及6Hz之間的調變頻率而言，其衰減量小於3dB。此一區間相應於人類語音典型的調變。此時，參照特定的實施例，將更爲詳細地說明本發明 7 ¥紙張尺度適用中國國家標準（CNS)A4規格（210 X 297公釐) --------- (請先閱讀背面之注意事項再填寫本頁)

482993 A7 B7 五、發明說明（6 ) 。首先，在圖1所示的取樣單元10中，將一個由任何一種型式的雜訊所惡化之語音信號取樣並且數位化。此一方法會產生在時間t領域中的樣本x(t)。組合η個樣本群，形成一架構，而使用傅立葉變換來計算此架構在時間Τ中的頻譜 A(f，T)。在頻率f中，頻譜的形式並不相同。濾波器單元11乃是藉由將頻譜A(f，T)乘以濾波器函數F(f，T)，來產生濾波後的頻譜B(f，T)，而在合成單元中，則藉由傅立葉反轉換，經由其頻譜，產生無雜訊的語音信號y(0。之後則能夠將無雜訊的語音信號轉換成類比信號，以供諸如揚聲器所轉濾波器函數F(f，T)乃是藉由一種類神經網路所產生的，其類神經網路包含一個最小値檢測層級、一個反應層級、一個散佈層級、以及一個積分層級，如圖2所示。首先將取樣單元（10)所產生的頻譜A(f，T)輸入至最小値檢測層級，其如圖3中所示。此層級的每一個單一的類神經單元操作獨立於最小値檢測單元的其它類神經單元，藉以處理由頻率f所特性化的單一模式。對此一模式而言，其類神經單元會以m個架構將在時間T中的振幅A(f，T)平均。其類神經單元之後則使用這些平均後的振幅來得到此模式下之最小値’而此最小値則是在整個區間T中相應於1個架構的長度°以如此的方式，最小値檢測層級的類神經單元便會產 M(f，T)，之後則將其輸入至反應層級。 8 (請先閱讀背面之注意事項再填寫本頁) · -線· 經濟部智慧財產局員工消費合作社印製本紙張尺度適用中國國家標準（CNS)A4規格（210 X 297公釐） 482993 A7 B7 經濟部智慧財產局員工消費合作社印製五、發明說明（7 ) 反應層級的每一個類神經單元處理頻率f的單一模式，並因而獨立於反應層級中所有其它的類神經單元’如圖 4所示。爲了此一目的，每一個類神經單元皆已經使用了一可外部設定的參數K，而K値的大小則決定濾波器整體的雜訊抑制量。此外，這些類神經單元具有之前架構(時間爲T-1)的積分信號S(T-l)，其信號則是於圖6所示積分層級中所計算。此一信號乃是反應層級的類神經單元用來計算在時間 T下的相關頻譜R(f，T)之非線性函數r之引數。反應函數的數値之範圍限制於區間[rl，r2]。因而得到之相關頻譜R(f，T)之數値範圍則限制於區間[0，1]。反應層級求得語音信號的時間，藉以區別可聽見的雜訊以及所要的信號。如圖5所示的，在散佈層級中從事語音信號的頻譜特性之求値，而散佈層級的類神經單元則實現在頻率域中以散佈的方法所連接的區域模式。在擴散層級的類神經單元所產生的濾波器函數F(f，T) 之中，如此則會致使相鄰模式的吸收，而其吸收的大小貝[j 由擴散常數D所決定。在如此稱呼的分散媒介中，相似於在反應以及擴散層級中所實行的機構會產生圖樣的格式，而其格式則是非線性物理領域中所硏究的事物。在時間T，濾波器F(f，T)所有的模式乘以所相應的振幅 A(f，T)，.而產生沒有可聽見雜訊之頻譜B(f，T)，並藉由逆傅立葉變換將其轉換成無雜訊的語音信號y⑴。在積分層，級 (請先閱讀背面之注意事項再填寫本頁) m 訂： -丨線- A7 B7 i、發明說明（》）中，從事整個濾波器函數F(f，T)模式之積分’藉以產生積分信號S(T)，如圖6所示。將此一積分信號回授至反應層級。隨著此一環狀的連接行爲之結果，在濾波器中信號操作的大小則是視可聽見的雜訊之位準所決定。低雜訊的語音信號通過其濾波器時是較少處理甚至並不處理；當可聽見的雜訊之位準高時’ 則其濾波器便產生效用。在此中，本發明不同於傳統的帶通濾波器，其在信號上的行爲乃是視所選擇的固定參數所決定。在比對古典的濾波器上，本發明主要的事物不具有傳統觀念的頻率響應。在可調的弦波測試信號之量測下’測試信號本身的調變率將會影響濾波器的特性。分析本發明濾波器特性的適用方法使用一種用來決定濾波器衰減量的振幅調變之雜訊信號.，其濾波衰減量爲一調變頻率之函數，如圖7所示。爲了此一目的，平均積分的輸入以及輸出功率彼此乃是相關的，並且結果爲整個測試信號的頻率。圖7顯示不同控制參數値K的”調變響應” 〇對0.6Hz以及6Hz之間的調變頻率而言，所示的全部之控制參數値其衰減量皆低於3dB。此一區間相應於人類的語音之調變，爲此一原由，其能夠以最佳的方式通過濾波器。調變頻率在前述的範圍之外的信號視爲可聽見的雜訊，並且視參數K的設定來從事其衰減。 10 張尺度適用中國國家標準（CNS)A4規格（210 X 297公釐） '' (請先閱讀背面之注意事項再填寫本頁) 二叮. -線· 經濟部智慧財產局員工消費合作社印製 482993 A7 B7 經濟部智慧財產局員工消費合作社印製五、發明說明（？）參考 10 取樣單元，將語音信號X⑴取樣、數位化、以及^ 分爲架構，並且使用傅立葉變換，來決定其頻譜 A(f，T)(f，T)。 11 濾波器單元，用來從頻譜A(f，T)(f，T)中計算一計算濾波函數F(f，T)(f，T)，並且用之來產生無雜訊的頻譜 B(f，T)(f，T)。 12 合成單元，使用濾波後的頻譜B(f，T)(f，T)來產生無雜訊的語音信號B(f，T)(f，T)。 A(f，T)信號的頻譜，亦即在時間T的頻率模式之振幅。 B(f，T)在濾波後的時間T之頻率模式之頻譜振幅。 D 散佈常數，決定在散佈層級中平整的數量。 F(f，T) 濾波器函數，從A(f，T)產生B(f，T): 對所有的時間T之f而言，B(f，T) = F(f，T)A(f,T)。 f 頻率，區別頻譜的模式。 K 參數，用來選擇雜訊的抑制量。 1 架構的數目，M(f，T)可以從其得到，而爲所平均的 A(f，T)之最小値。 m 所平均的架構數目，藉以決定M(f，T)。 η 每架構的取樣數目。 M(f，T) 在整個m所平均的振幅A(f，T)之1個架構內的最小値。 R(f，T) 相關頻譜，由反應層級所產生。 r[S(T)] 反應層級的類神經單元之反應函數。 11 (請先閱讀背面之注意事項再填寫本頁) 9 . ，線. 本紙張尺度適用中國國家標準（CNS)A4規格（210 X 297公釐） 482993 A7 _B7 __ 五、發明說明（β ) rl，r2 反應函數數値範圍之限制，rl<r[S(T)]<r2。 S(T) 積分信號，相應於在時間T的F(f，T)於整個f之積分。 t 時間，於其中從事語音信號之取樣。 T 時間，於其中處理時間信號，藉以形成架構，並且從其而得到頻譜。 X⑴ 具有雜訊的語音信號之樣本。 y(t) 無雜訊語音信號之樣本。 (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製本紙張尺度適用中國國家標準（CNS)A4規格（210 X 297公釐）

Claims

482993 A8 B8 C8 D8 經濟部智慧財產局員工消費合作社印製六、申請專利範圍 1· 一種藉由多層級自組織化的回授類神經網路來抑制語音傳送中之可聽見的雜訊之方法，其特徵爲··一個最小値檢測層級、一個反應層級、一個散佈層級、以及一個積分層級其定義用來從事雜訊濾波的濾波器函數F(f，T)。 2. 如申請專利範圍第1項之方法，其特徵爲：可聽見的雜訊已經藉由濾波器函數F(f,T)所移除的頻譜B(f，T)藉由逆傅立葉變換轉換成無雜訊的語音信號y(t)。 3. 如申請專利範圍第1項之方法，其特徵爲：包含於 .信號處理中的信號延遲對濾波器而言短暫到可適用於遠距通信系統中的即時操作，其中所有的類神經單元已經應用一個可調整的參數K，而其κ値的大小則決定由濾波器整體所實現的雜訊抑制量。 4. 如申請專利範圍第1項之方法，其特徵爲：積分層級的單一類神經單元以固定的時間T從濾波器函數F(f，丁) 整個頻率f的積分，其中如此所得到的產生之積分信號 S(T)則回授至反應層級之中。 5·如申請專利範圍第1項之方法，其特徵爲··將取樣單元（10)所產生的頻譜A(f，T)輸入至最小値檢測層級。 6·如申請專利範圍第1項之方法，其特徵爲：濾波器單元（11)用來從頻譜A(f，T)中產生與其頻譜相乘的濾波器函數 F(f，TV 7.如申請專利範圍第1項之方法，其特徵藉由一個架構，而時間T的頻譜A(f，T)則是藉由傅立葉變換從其架構所取得的，並且將之輸入至濾波器單元（11)，其濾波器單 (請先閱讀背面之注意事項再填寫本頁)

·- -丨線. 本紙張尺度適用中國國家標準（CNS)A4規格（210 X 297公釐）經濟部智慧財產局員工消費合作社印製 482993 ____g8S 麵· 、一 _ 六、申請專利範圍元則是使用一個類神經網路來計算與信號頻譜A(f，T)相乘的濾波器函數F(f，T)，藉以產生無雜訊的頻譜B(f τ)。 8·如申請專利範圍第丨項之方法，其中所記述的特徵爲··將濾波後的信號輸入至合成單元（12)，其單元（12)應用一逆傅立葉變換來合成濾波後的頻譜B(f，T)，使之成爲無雜訊的語音信號y(t)。 > ^ 9·如申s靑專利範圍第1項之方法，其中所記述的特徵爲：「層級的單一類神經單元獨立於最小値檢測層級的其匕類神經單兀操作，藉以處理由頻率丨所區別的單—模式〇 10·如申請翻範酵1項m其特賴：在擴散層級中S平估語音訊號的頻譜特性，其方法是以在該擴散層級#響E域模式的類神經單兀耦合在頻域中散佈的方式。 11·如申請專利範圍第1項之方法，其特徵爲：濾波器函數F(f，T)在時間T上的所有模式皆乘以所相應的振幅 A(f，T)。 12.如申請專利範圍第1項之方法，其特徵爲：積分層級實現濾波器函數F(fT)所有模式的積分，藉以提供積分信號 S(T)。 13·如申請專利範圍第1至12項中任何一項之方法，其特徵爲：具有低可聽見的雜訊之語音信號實際上可不受影響地通過其濾波器，同時強而有力的濾波效應僅作用在具有高可聽見的雜訊之語音信號。 14·一種用於語音傳送中可聽見的雜訊抑制之裝置，特 2 本紙張尺度適用中國國家標準（CNS)A4規格（210 X 297公釐） (請先閱讀背面之注意事項再填寫本頁) Jr-a. ;線· 482993 A8 B8 C8 D8 六、申請專利範圍別是以根據申請專利範圍第1至13項中任何一項之方法，其特徵爲一類神經網路，其包含一個最小値檢測層級、一個反應層級、一個擴散層級、以及一個積分層級。 15. 如申請專利範圍第14項之裝置，其特徵爲：頻譜的模式在頻率f上各不相同，並且相應於其網路上除了積分層級之外每層級唯一的類神經單元層級。 16. 如申請專利範圍第14項之裝置，其特徵爲：從最小値檢測層級的每一個類神經單元皆取得一個函數 M(f，T)(f，T)，其M(f，T)爲在頻率模式f下，m個架構在對應於一架構長度的時間區間T內平均振幅A(f，T)之最小値。 (f，T)(f，T) 17·如申請專利範圍第14項之裝置，其特徵爲一反應層級的類神經單元，其類神經單元使用一個反應函數 r[S(T-l)]，藉以從積分信號S(T-l)、一個可自由調整的參數 K、A(f，T)、以及M(f，T)來決定相關頻譜R(f，T)，其κ値爲設定雜訊的抑制量，而其相關頻譜R(f，T)具有零至一之間的數値。 18. 如申請專利範圍第14項之裝置，其特徵爲：其類神經單元具有積分信號S(T-1.)之輸入，其輸入爲來自之前的架構(時間爲T-1)並且已經在積分層級中計算過的積分信號 S(T-l)。 19. 如申請專利範圍第14項之裝置，其特徵爲：反應函數數値的範圍受限於區間[rl，r2]，而且其中所產生的相關頻譜R(f，T)數値的範圍則受限於區間[0，1]。 3 本紙張尺度適用中國國家標準（CNS)A4規格（210 X 297公釐）

經濟部智慧財產局員工消費合作社印製兮0 (請先閲讀背面之注意事項再填寫本頁)

I I 經濟部智慧財產局員工消費合作社印製 482993 A8 B8 C8 D8 六、申請專利範圍 20.如申請專利範圍第14至19項中任何一項之裝置，其特徵爲：就所有控制參數K的指示數値而言，在〇·6Ηζ 和6Hz之間的調變頻率上，其衰減量低於3dB。本紙張尺度適用中國國家標準（CNS)A4規格（210 X 297公釐） (請先閱讀背面之注意事項再填寫本頁)