TW482993B - Method and apparatus for suppressing audible noise in speech transmission - Google Patents
Method and apparatus for suppressing audible noise in speech transmission Download PDFInfo
- Publication number
- TW482993B TW482993B TW089120732A TW89120732A TW482993B TW 482993 B TW482993 B TW 482993B TW 089120732 A TW089120732 A TW 089120732A TW 89120732 A TW89120732 A TW 89120732A TW 482993 B TW482993 B TW 482993B
- Authority
- TW
- Taiwan
- Prior art keywords
- level
- scope
- patent application
- signal
- spectrum
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 230000005540 biological transmission Effects 0.000 title claims abstract description 5
- 230000010354 integration Effects 0.000 claims abstract description 23
- 238000001514 detection method Methods 0.000 claims abstract description 14
- 238000009792 diffusion process Methods 0.000 claims abstract description 14
- 238000001914 filtration Methods 0.000 claims abstract description 13
- 238000006243 chemical reaction Methods 0.000 claims abstract description 10
- 238000013528 artificial neural network Methods 0.000 claims abstract description 8
- 238000001228 spectrum Methods 0.000 claims description 40
- 230000006870 function Effects 0.000 claims description 22
- 230000004044 response Effects 0.000 claims description 17
- 230000001537 neural effect Effects 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 11
- 230000002079 cooperative effect Effects 0.000 claims description 7
- 230000001629 suppression Effects 0.000 claims description 7
- 230000000875 corresponding effect Effects 0.000 claims description 6
- 239000006185 dispersion Substances 0.000 claims description 6
- 229910052704 radon Inorganic materials 0.000 claims description 6
- SYUHGPGVQRZVTB-UHFFFAOYSA-N radon atom Chemical compound [Rn] SYUHGPGVQRZVTB-UHFFFAOYSA-N 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 238000005316 response function Methods 0.000 claims description 5
- 230000003595 spectral effect Effects 0.000 claims description 4
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 claims description 3
- 238000003786 synthesis reaction Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims description 2
- 230000008878 coupling Effects 0.000 claims 1
- 238000010168 coupling process Methods 0.000 claims 1
- 238000005859 coupling reaction Methods 0.000 claims 1
- 235000012149 noodles Nutrition 0.000 claims 1
- 238000010977 unit operation Methods 0.000 claims 1
- 238000012360 testing method Methods 0.000 description 3
- 238000010521 absorption reaction Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 241001014642 Rasta Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Telephone Function (AREA)
- Noise Elimination (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
482993 A7 B7 五、發明說明(/) 發明背景 (請先閱讀背面之注意事項再填寫本頁) 本發明係有關於藉由多層級自架構回授類神經網路, 用以抑制語音傳迭中之可聽見的雜訊之方法及裝置。 在可傳輸的記錄設備中的遠距通信以及語音中,其問 題乃是:所傳送以及所記錄的語音之可理解性可能會受到 可聽見的雜訊相當大的損害。此一問題在汽車駕駛者於其 車輛內部使用具有免持設備之電話時特別明顯。爲了抑制 可聽見的雜訊,普遍的實施爲將濾波器插入於其信號路徑 之中。在此一著眼點上,由於可聽見的雜訊非常\可能出現 在相同於語音信號本身的頻率範圍之內,因此典型的帶通 濾波器之效用會受到限制。由於此一理由,可適用的濾波 器因而需要自動地使自己適應當前的雜訊以及所要傳送的 語音信號之特性。一些不同的觀念乃是眾所周知的,並且 可應用於如此的目的。, 經濟部智慧財產局員工消費合作社印製
Wienei-Kologorov 濾波器(S.V. Vaseghi,”先進的信號處 理以及數位雜訊之降低”】ohn Wiley及Teubner-Vedag,1996 年)爲從最佳化匹配的濾波器原理中所推導出的裝置。此 一方法乃是基於實際以及所期望的語音信號之間的均方誤 差之最小化。如此的瀘波觀念需要枏當大量的計算。此外 ,如此以及其它大多數的習知方法在理論上的要求爲:可 聽見的雜訊乃是靜止的。
Kalman濾波器則是基於相類似的濾波定理(E. Wan及 A. Nelson,”使用雙延展Kalman濾波器之演算法從語音中 除去雜訊”,IEEE在聲波以及信號處理領域上的國際硏討 3 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 482993 A7 _____ B7 五、發明說明) 會(ICASSP’98),1998年,於西雅圖)。如此的濾波定理之 缺點爲:需要用來決定濾波器參數所延伸的調整時間。 (請先閱讀背面之注意事項再填寫本頁) 另一個濾波觀念已經爲H. Hermansky及N· Morgan,” 語音的RASTA處理”,1994年IEEE在語音及成音處理領 域的期刊第2冊、第四號、第587頁中所得知了。此一方 法同樣也需要調整的程序;此外,不同種類的雜訊需要不 同的參數設定。 —種LPC的已知方法則需要漫長的計算,藉由線性預 測處理的輔助,來推算出用來計算濾波器係數的相關矩陣 ;在此一著眼點上,觀視T. Arai,H. Hermansky,M. Paveland,C. Avendano,”具有 LPC Cepstrum 的濾波時間軌 線之語音可理解性”,1996年Maehca聽覺協會期刊,第 100冊,第4號,第2部份,第2756頁。 其它的習知方法使用用於語音放大的多層級知覺型式 之類神經網路,諸如 H. Hermansky,E. Wan,C. Avendano ,”基於暫時處理的語音增強”,1995年於底特律,IEEE在 聲波以及信號處理領域上的國際硏討會(ICASSP’95)之中所 說明的。 經濟部智慧財產局員工消費合作社印製 本發明的目的乃是提供一種適度的計算以藉由其時間 以及頻譜的特性便足夠識別一個語音信號的方法,並且足 夠從語音信號中去除可聽見的雜訊。 本目的則是藉由用於雜訊濾波的濾波函數F(f,T)所實 現的,其是由最小値檢測層級、反應層級、擴散層級以及 積分層級所定義的。 4 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 經濟部智慧財產局員工消費合作社印製 482993 A7 B7 五、發明說明(3 ) 一以此方法所架構的網路由其時間以及頻譜特性來識 別出語音信號,並且能夠從其中去除可聽見的雜訊。相較、 於習知的方法,其所需要的計算之付出低。其方法的特色 爲非常短的適應時間,而系統於其時間內便會適應雜訊性 質。在信號處理中所涵蓋的信號延遲非常地短’致使其濾 波器能夠使用於即時的遠距通信系統之中。 再者,優點措施之說明陳述於申請專利範圍中的依附 項。本發明以附圖來闡述,並且將會以下面的部份說明詳 細地說明之。 圖示說明 圖1本發明的整體之語音濾波系統; 圖2 —種類神經網路,其包含一個最小値檢測層級、 一個反應層級、一個擴散層級以及一個積分層級; 圖3 —個決定M(f,T)的最小値檢測層級之類神經單元 圖4反應層級的一個類神經單元,其經由積分信號 S(T-l)的反應函數r[S(T-l)]、可自由選擇的參數K、A(f,T) 以及M(f,T)之輔助,決定相關的頻譜R(f,T),其中K則是 設定雜訊抑制的振幅; 圖5散佈層級的類神經單元,其中實現相應於其擴散 .所連接的局部模式; 圖6所闡述的積分層級之類神經單元; 圖.7本發明相應於各種控制參數κ的設定之濾波特性 範例。 5 本紙張尺&適財酬家標準(CNS)A4規格(210 X 297公爱) 一 一 (請先閱讀背面之注意事項再填寫本頁) ·. 482993
五、發明說明(4) 本發明之詳述 达匕系 圖1圖式地整體顯示一個示範的語音濾波系統/ 統包含一個取樣單元1〇,其在時間t中取樣具有雜#、Μ 音信號,藉以得到離散的樣本χ⑴’於時間τ中組合以形 成每一個皆包含η個樣本的架構。 在時間Τ之下,使用傅立葉變換得到這樣的每一個架 構之頻譜A(f,T),並且使用在圖2中所不的一種類神經網 路,藉以計算濾波函數F(f,T),其瀘波函數與信號頻譜 A(f,T)相乘,產生無雜訊的頻譜B(f,T),將其供給濾波單元 ll(f,T)(f,T)(f,T)。濾波後的信號則傳遞至合成單元12,合 成單元12於所濾波的頻譜B(f,T)上使用逆傅立葉變換,藉 以合成無雜訊的語音信號y(t)。 經濟部智慧財產局員工消費合作社印制衣 (社^先閱讀背面之注意事項再填寫本頁) 丨線- 圖2顯示一種類神經網路,其包含一個最小値檢測層 級、一個反應層級、一個擴散層級及一個積分層級,其中 的積分層級爲本發明所必需的部份’其網路則具有輸入信 號之頻譜A(f,T),藉以應用來計算濾波函數F(f,T)。其頻譜 在不同頻率下的每一種模式相應於除了積分層級之外的每 一網路層級之單一類神經單元。在以下的圖示中更爲詳細 地說明各層級。 因此,圖3顯示最小値檢測層級的一個類神經單元, 其用來決定M(f,T)。在頻率f的模式中,振幅A(f,T)取m 個架構的平均。M(f,T)爲在一個時間區間內這些平均振幅 之最小値,而一個時間區間則是相應於一個架構的長度。 圖4顯示反應層級的一個類神經單元,其使用反應函 6 本纸張尺度適用中國國家標準(CNS)A4規格(210 χ 297公釐) 482993 經濟部智慧財產局員工消費合作社印製 A7 B7 五、發明說明(上) 數r[S(T-l)]經由積分信號S(T-l)、可自由選擇的參數、 A(f,T)、以及M(f,T),來決定相關頻譜R(f,T),其中可自由 選擇參數乃是設定雜訊抑制的振幅,而積分信號S(T-l)則 詳細地顯示於圖6中。R(f,T)具有零至一之間的數値。反應 層級藉由評估信號時間響應來區別語音與可聽見的雜訊。 圖5顯示擴散層級的一個類神經單元,其實現相應於 其散佈連接的局部模式。在時間T固定之下,擴散常數d 決定在頻率f產生的平整效應之數量。擴散層級從相關信 號R(f,T)中推算出適當的濾波函數F(f,T),而頻譜A(f,T)則 與之相乘,藉以消除可聽見的雜訊。散佈層級藉由其頻譜 的特性來區別語音以及可聽見的雜訊。 1 圖6顯示在本發明所選擇的實施例中所使用的單一類 神經單元,用以形成其積分層級;在固定的時間T,將濾 波器函數F(f,T)於整個頻率f上積分,並且將所得到的積分 信號S(T)回授至反應層級中,如圖2所示。藉由如此的環 狀連接之優點爲:.當雜訊爲高位準時,其具有高的濾波效 果,而同時能傳送無雜訊的語音,而不致使之惡化。 圖7顯示本發明示範的濾波特性,其乃是針對不同的 控制參數K所繪製的。本發明所剩餘的其它參數爲:n=256 個樣本/架構,m=2.5個架構,1=15個架構,d=0.25。此一 圖示顯示所調變的白色雜訊之振幅在整個調變頻率上的褰 減。對0·6Ηζ以及6Hz之間的調變頻率而言,其衰減量小 於3dB。此一區間相應於人類語音典型的調變。 此時,參照特定的實施例,將更爲詳細地說明本發明 7 ¥紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) --------- (請先閱讀背面之注意事項再填寫本頁)
482993 A7 B7 五、發明說明(6 ) 。首先,在圖1所示的取樣單元10中,將一個由任何一種 型式的雜訊所惡化之語音信號取樣並且數位化。此一方法 會產生在時間t領域中的樣本x(t)。組合η個樣本群,形成 一架構,而使用傅立葉變換來計算此架構在時間Τ中的頻 譜 A(f,T)。 在頻率f中,頻譜的形式並不相同。濾波器單元11乃 是藉由將頻譜A(f,T)乘以濾波器函數F(f,T),來產生濾波後 的頻譜B(f,T),而在合成單元中,則藉由傅立葉反轉換, 經由其頻譜,產生無雜訊的語音信號y(0。之後則能夠將 無雜訊的語音信號轉換成類比信號,以供諸如揚聲器所轉 濾波器函數F(f,T)乃是藉由一種類神經網路所產生的 ,其類神經網路包含一個最小値檢測層級、一個反應層級 、一個散佈層級、以及一個積分層級,如圖2所示。首先 將取樣單元(10)所產生的頻譜A(f,T)輸入至最小値檢測層級 ,其如圖3中所示。 此層級的每一個單一的類神經單元操作獨立於最小値 檢測單元的其它類神經單元,藉以處理由頻率f所特性化 的單一模式。對此一模式而言,其類神經單元會以m個架 構將在時間T中的振幅A(f,T)平均。其類神經單元之後則 使用這些平均後的振幅來得到此模式下之最小値’而此最 小値則是在整個區間T中相應於1個架構的長度°以如此 的方式,最小値檢測層級的類神經單元便會產 M(f,T),之後則將其輸入至反應層級。 8 (請先閱讀背面之注意事項再填寫本頁) · -線· 經濟部智慧財產局員工消費合作社印製 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 482993 A7 B7 經濟部智慧財產局員工消費合作社印製 五、發明說明(7 ) 反應層級的每一個類神經單元處理頻率f的單一模式 ,並因而獨立於反應層級中所有其它的類神經單元’如圖 4所示。爲了此一目的,每一個類神經單元皆已經使用了 一可外部設定的參數K,而K値的大小則決定濾波器整體 的雜訊抑制量。此外,這些類神經單元具有之前架構(時間 爲T-1)的積分信號S(T-l),其信號則是於圖6所示積分層 級中所計算。 此一信號乃是反應層級的類神經單元用來計算在時間 T下的相關頻譜R(f,T)之非線性函數r之引數。 反應函數的數値之範圍限制於區間[rl,r2]。因而得到 之相關頻譜R(f,T)之數値範圍則限制於區間[0,1]。 反應層級求得語音信號的時間,藉以區別可聽見的雜 訊以及所要的信號。 如圖5所示的,在散佈層級中從事語音信號的頻譜特 性之求値,而散佈層級的類神經單元則實現在頻率域中以 散佈的方法所連接的區域模式。 在擴散層級的類神經單元所產生的濾波器函數F(f,T) 之中,如此則會致使相鄰模式的吸收,而其吸收的大小貝[j 由擴散常數D所決定。在如此稱呼的分散媒介中,相似於 在反應以及擴散層級中所實行的機構會產生圖樣的格式, 而其格式則是非線性物理領域中所硏究的事物。 在時間T,濾波器F(f,T)所有的模式乘以所相應的振幅 A(f,T),.而產生沒有可聽見雜訊之頻譜B(f,T),並藉由逆傅 立葉變換將其轉換成無雜訊的語音信號y⑴。在積分層,級 (請先閱讀背面之注意事項再填寫本頁) m 訂: -丨線- A7 B7 i、發明說明(》) 中,從事整個濾波器函數F(f,T)模式之積分’藉以產生積 分信號S(T),如圖6所示。 將此一積分信號回授至反應層級。隨著此一環狀的連 接行爲之結果,在濾波器中信號操作的大小則是視可聽見 的雜訊之位準所決定。低雜訊的語音信號通過其濾波器時 是較少處理甚至並不處理;當可聽見的雜訊之位準高時’ 則其濾波器便產生效用。在此中,本發明不同於傳統的帶 通濾波器,其在信號上的行爲乃是視所選擇的固定參數所 決定。 在比對古典的濾波器上,本發明主要的事物不具有傳 統觀念的頻率響應。在可調的弦波測試信號之量測下’測 試信號本身的調變率將會影響濾波器的特性。 分析本發明濾波器特性的適用方法使用一種用來決定 濾波器衰減量的振幅調變之雜訊信號.,其濾波衰減量爲一 調變頻率之函數,如圖7所示。爲了此一目的,平均積分 的輸入以及輸出功率彼此乃是相關的,並且結果爲整個測 試信號的頻率。圖7顯示不同控制參數値K的”調變響應” 〇 對0.6Hz以及6Hz之間的調變頻率而言,所示的全部 之控制參數値其衰減量皆低於3dB。此一區間相應於人類 的語音之調變,爲此一原由,其能夠以最佳的方式通過濾 波器。調變頻率在前述的範圍之外的信號視爲可聽見的雜 訊,並且視參數K的設定來從事其衰減。 10 張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) '' (請先閱讀背面之注意事項再填寫本頁) 二叮. -線· 經濟部智慧財產局員工消費合作社印製 482993 A7 B7 經濟部智慧財產局員工消費合作社印製 五、發明說明(?) 參考 10 取樣單元,將語音信號X⑴取樣、數位化、以及^ 分爲架構,並且使用傅立葉變換,來決定其頻譜 A(f,T)(f,T)。 11 濾波器單元,用來從頻譜A(f,T)(f,T)中計算一計算 濾波函數F(f,T)(f,T),並且用之來產生無雜訊的頻譜 B(f,T)(f,T)。 12 合成單元,使用濾波後的頻譜B(f,T)(f,T)來產生無雜 訊的語音信號B(f,T)(f,T)。 A(f,T)信號的頻譜,亦即在時間T的頻率模式之振幅。 B(f,T)在濾波後的時間T之頻率模式之頻譜振幅。 D 散佈常數,決定在散佈層級中平整的數量。 F(f,T) 濾波器函數,從A(f,T)產生B(f,T): 對所有的時間T之f而言,B(f,T) = F(f,T)A(f,T)。 f 頻率,區別頻譜的模式。 K 參數,用來選擇雜訊的抑制量。 1 架構的數目,M(f,T)可以從其得到,而爲所平均的 A(f,T)之最小値。 m 所平均的架構數目,藉以決定M(f,T)。 η 每架構的取樣數目。 M(f,T) 在整個m所平均的振幅A(f,T)之1個架構內的最 小値。 R(f,T) 相關頻譜,由反應層級所產生。 r[S(T)] 反應層級的類神經單元之反應函數。 11 (請先閱讀背面之注意事項再填寫本頁) 9 . ,線. 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 482993 A7 _B7 __ 五、發明說明(β ) rl,r2 反應函數數値範圍之限制,rl<r[S(T)]<r2。 S(T) 積分信號,相應於在時間T的F(f,T)於整個f之積 分。 t 時間,於其中從事語音信號之取樣。 T 時間,於其中處理時間信號,藉以形成架構,並且從 其而得到頻譜。 X⑴ 具有雜訊的語音信號之樣本。 y(t) 無雜訊語音信號之樣本。 (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐)
Claims (1)
- 482993 A8 B8 C8 D8 經濟部智慧財產局員工消費合作社印製 六、申請專利範圍 1· 一種藉由多層級自組織化的回授類神經網路來抑制 語音傳送中之可聽見的雜訊之方法,其特徵爲··一個最小 値檢測層級、一個反應層級、一個散佈層級、以及一個積 分層級其定義用來從事雜訊濾波的濾波器函數F(f,T)。 2. 如申請專利範圍第1項之方法,其特徵爲:可聽見 的雜訊已經藉由濾波器函數F(f,T)所移除的頻譜B(f,T)藉由 逆傅立葉變換轉換成無雜訊的語音信號y(t)。 3. 如申請專利範圍第1項之方法,其特徵爲:包含於 .信號處理中的信號延遲對濾波器而言短暫到可適用於遠距 通信系統中的即時操作,其中所有的類神經單元已經應用 一個可調整的參數K,而其κ値的大小則決定由濾波器整 體所實現的雜訊抑制量。 4. 如申請專利範圍第1項之方法,其特徵爲:積分層 級的單一類神經單元以固定的時間T從濾波器函數F(f,丁) 整個頻率f的積分,其中如此所得到的產生之積分信號 S(T)則回授至反應層級之中。 5·如申請專利範圍第1項之方法,其特徵爲··將取樣 單元(10)所產生的頻譜A(f,T)輸入至最小値檢測層級。 6·如申請專利範圍第1項之方法,其特徵爲:濾波器 單元(11)用來從頻譜A(f,T)中產生與其頻譜相乘的濾波器函 數 F(f,TV 7.如申請專利範圍第1項之方法,其特徵藉由一個架 構,而時間T的頻譜A(f,T)則是藉由傅立葉變換從其架構 所取得的,並且將之輸入至濾波器單元(11),其濾波器單 (請先閱讀背面之注意事項再填寫本頁)·- -丨線. 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 經濟部智慧財產局員工消費合作社印製 482993 ____g8S 麵· 、一 _ 六、申請專利範圍 元則是使用一個類神經網路來計算與信號頻譜A(f,T)相乘 的濾波器函數F(f,T),藉以產生無雜訊的頻譜B(f τ)。 8·如申請專利範圍第丨項之方法,其中所記述的特徵 爲··將濾波後的信號輸入至合成單元(12),其單元(12)應用 一逆傅立葉變換來合成濾波後的頻譜B(f,T),使之成爲無 雜訊的語音信號y(t)。 > ^ 9·如申s靑專利範圍第1項之方法,其中所記述的特徵 爲:「層級的單一類神經單元獨立於最小値檢測層級的其 匕類神經單兀操作,藉以處理由頻率丨所區別的單—模式 〇 10·如申請翻範酵1項m其特賴:在擴散 層級中S平估語音訊號的頻譜特性,其方法是以在該擴散層 級#響E域模式的類神經單兀耦合在頻域中散佈的方式。 11·如申請專利範圍第1項之方法,其特徵爲:濾波器 函數F(f,T)在時間T上的所有模式皆乘以所相應的振幅 A(f,T)。 12.如申請專利範圍第1項之方法,其特徵爲:積分層 級實現濾波器函數F(fT)所有模式的積分,藉以提供積分信 號 S(T)。 13·如申請專利範圍第1至12項中任何一項之方法, 其特徵爲:具有低可聽見的雜訊之語音信號實際上可不受 影響地通過其濾波器,同時強而有力的濾波效應僅作用在 具有高可聽見的雜訊之語音信號。 14·一種用於語音傳送中可聽見的雜訊抑制之裝置,特 2 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) (請先閱讀背面之注意事項再填寫本頁) Jr-a. ;線· 482993 A8 B8 C8 D8 六、申請專利範圍 別是以根據申請專利範圍第1至13項中任何一項之方法, 其特徵爲一類神經網路,其包含一個最小値檢測層級、一 個反應層級、一個擴散層級、以及一個積分層級。 15. 如申請專利範圍第14項之裝置,其特徵爲:頻譜 的模式在頻率f上各不相同,並且相應於其網路上除了積 分層級之外每層級唯一的類神經單元層級。 16. 如申請專利範圍第14項之裝置,其特徵爲:從最 小値檢測層級的每一個類神經單元皆取得一個函數 M(f,T)(f,T),其M(f,T)爲在頻率模式f下,m個架構在對應 於一架構長度的時間區間T內平均振幅A(f,T)之最小値。 (f,T)(f,T) 17·如申請專利範圍第14項之裝置,其特徵爲一反應 層級的類神經單元,其類神經單元使用一個反應函數 r[S(T-l)],藉以從積分信號S(T-l)、一個可自由調整的參數 K、A(f,T)、以及M(f,T)來決定相關頻譜R(f,T),其κ値 爲設定雜訊的抑制量,而其相關頻譜R(f,T)具有零至一之 間的數値。 18. 如申請專利範圍第14項之裝置,其特徵爲:其類 神經單元具有積分信號S(T-1.)之輸入,其輸入爲來自之前 的架構(時間爲T-1)並且已經在積分層級中計算過的積分信 號 S(T-l)。 19. 如申請專利範圍第14項之裝置,其特徵爲:反應 函數數値的範圍受限於區間[rl,r2],而且其中所產生的相 關頻譜R(f,T)數値的範圍則受限於區間[0,1]。 3 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐)經濟部智慧財產局員工消費合作社印製 兮0 (請先閲讀背面之注意事項再填寫本頁)I I 經濟部智慧財產局員工消費合作社印製 482993 A8 B8 C8 D8 六、申請專利範圍 20.如申請專利範圍第14至19項中任何一項之裝置, 其特徵爲:就所有控制參數K的指示數値而言,在〇·6Ηζ 和6Hz之間的調變頻率上,其衰減量低於3dB。 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) (請先閱讀背面之注意事項再填寫本頁)
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE19948308A DE19948308C2 (de) | 1999-10-06 | 1999-10-06 | Verfahren und Vorrichtung zur Geräuschunterdrückung bei der Sprachübertragung |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| TW482993B true TW482993B (en) | 2002-04-11 |
Family
ID=7924812
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW089120732A TW482993B (en) | 1999-10-06 | 2000-10-05 | Method and apparatus for suppressing audible noise in speech transmission |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US6820053B1 (zh) |
| EP (1) | EP1091349B1 (zh) |
| AT (1) | ATE289110T1 (zh) |
| CA (1) | CA2319995C (zh) |
| DE (2) | DE19948308C2 (zh) |
| TW (1) | TW482993B (zh) |
Families Citing this family (40)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5835061A (en) | 1995-06-06 | 1998-11-10 | Wayport, Inc. | Method and apparatus for geographic-based communications service |
| US8606851B2 (en) | 1995-06-06 | 2013-12-10 | Wayport, Inc. | Method and apparatus for geographic-based communications service |
| DE10220524B4 (de) | 2002-05-08 | 2006-08-10 | Sap Ag | Verfahren und System zur Verarbeitung von Sprachdaten und zur Erkennung einer Sprache |
| EP1363271A1 (de) | 2002-05-08 | 2003-11-19 | Sap Ag | Verfahren und System zur Verarbeitung und Speicherung von Sprachinformationen eines Dialogs |
| EP1585112A1 (en) | 2004-03-30 | 2005-10-12 | Dialog Semiconductor GmbH | Delay free noise suppression |
| DE102004031638A1 (de) * | 2004-06-30 | 2006-01-26 | Abb Patent Gmbh | Verfahren zum Betrieb einer magnetisch induktiven Durchflussmesseinrichtung |
| DE102005039621A1 (de) * | 2005-08-19 | 2007-03-01 | Micronas Gmbh | Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System |
| GB0703275D0 (en) * | 2007-02-20 | 2007-03-28 | Skype Ltd | Method of estimating noise levels in a communication system |
| DE102007033484A1 (de) | 2007-07-18 | 2009-01-22 | Ruwisch, Dietmar, Dr. | Hörgerät |
| ES2678415T3 (es) * | 2008-08-05 | 2018-08-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento para procesamiento y señal de audio para mejora de habla mediante el uso de una extracción de característica |
| US20120245927A1 (en) * | 2011-03-21 | 2012-09-27 | On Semiconductor Trading Ltd. | System and method for monaural audio processing based preserving speech information |
| US8239196B1 (en) * | 2011-07-28 | 2012-08-07 | Google Inc. | System and method for multi-channel multi-feature speech/noise classification for noise suppression |
| EP2590165B1 (en) | 2011-11-07 | 2015-04-29 | Dietmar Ruwisch | Method and apparatus for generating a noise reduced audio signal |
| US9258653B2 (en) | 2012-03-21 | 2016-02-09 | Semiconductor Components Industries, Llc | Method and system for parameter based adaptation of clock speeds to listening devices and audio applications |
| US20140379343A1 (en) * | 2012-11-20 | 2014-12-25 | Unify GmbH Co. KG | Method, device, and system for audio data processing |
| US9330677B2 (en) | 2013-01-07 | 2016-05-03 | Dietmar Ruwisch | Method and apparatus for generating a noise reduced audio signal using a microphone array |
| US10561361B2 (en) * | 2013-10-20 | 2020-02-18 | Massachusetts Institute Of Technology | Using correlation structure of speech dynamics to detect neurological changes |
| CN104036784B (zh) * | 2014-06-06 | 2017-03-08 | 华为技术有限公司 | 一种回声消除方法及装置 |
| US9881631B2 (en) * | 2014-10-21 | 2018-01-30 | Mitsubishi Electric Research Laboratories, Inc. | Method for enhancing audio signal using phase information |
| EP3301675B1 (en) * | 2016-09-28 | 2019-08-21 | Panasonic Intellectual Property Corporation of America | Parameter prediction device and parameter prediction method for acoustic signal processing |
| US11190944B2 (en) | 2017-05-05 | 2021-11-30 | Ball Aerospace & Technologies Corp. | Spectral sensing and allocation using deep machine learning |
| CN109427340A (zh) * | 2017-08-22 | 2019-03-05 | 杭州海康威视数字技术股份有限公司 | 一种语音增强方法、装置及电子设备 |
| US10283140B1 (en) * | 2018-01-12 | 2019-05-07 | Alibaba Group Holding Limited | Enhancing audio signals using sub-band deep neural networks |
| US11182672B1 (en) | 2018-10-09 | 2021-11-23 | Ball Aerospace & Technologies Corp. | Optimized focal-plane electronics using vector-enhanced deep learning |
| US10879946B1 (en) * | 2018-10-30 | 2020-12-29 | Ball Aerospace & Technologies Corp. | Weak signal processing systems and methods |
| WO2020117530A1 (en) | 2018-12-03 | 2020-06-11 | Ball Aerospace & Technologies Corp. | Star tracker for multiple-mode detection and tracking of dim targets |
| US11851217B1 (en) | 2019-01-23 | 2023-12-26 | Ball Aerospace & Technologies Corp. | Star tracker using vector-based deep learning for enhanced performance |
| US11412124B1 (en) | 2019-03-01 | 2022-08-09 | Ball Aerospace & Technologies Corp. | Microsequencer for reconfigurable focal plane control |
| EP3726529A1 (en) * | 2019-04-16 | 2020-10-21 | Fraunhofer Gesellschaft zur Förderung der Angewand | Method and apparatus for determining a deep filter |
| US11488024B1 (en) | 2019-05-29 | 2022-11-01 | Ball Aerospace & Technologies Corp. | Methods and systems for implementing deep reinforcement module networks for autonomous systems control |
| US11303348B1 (en) | 2019-05-29 | 2022-04-12 | Ball Aerospace & Technologies Corp. | Systems and methods for enhancing communication network performance using vector based deep learning |
| EP3764660B1 (en) | 2019-07-10 | 2023-08-30 | Analog Devices International Unlimited Company | Signal processing methods and systems for adaptive beam forming |
| EP3764360B1 (en) | 2019-07-10 | 2024-05-01 | Analog Devices International Unlimited Company | Signal processing methods and systems for beam forming with improved signal to noise ratio |
| EP3764664B1 (en) | 2019-07-10 | 2025-02-12 | Analog Devices International Unlimited Company | Signal processing methods and systems for beam forming with microphone tolerance compensation |
| EP3764358B1 (en) | 2019-07-10 | 2024-05-22 | Analog Devices International Unlimited Company | Signal processing methods and systems for beam forming with wind buffeting protection |
| EP3764359B1 (en) | 2019-07-10 | 2024-08-28 | Analog Devices International Unlimited Company | Signal processing methods and systems for multi-focus beam-forming |
| US11828598B1 (en) | 2019-08-28 | 2023-11-28 | Ball Aerospace & Technologies Corp. | Systems and methods for the efficient detection and tracking of objects from a moving platform |
| IT201900024454A1 (it) * | 2019-12-18 | 2021-06-18 | Storti Gianampellio | Apparecchio audio con basso consumo per ambienti rumorosi |
| CN114944154B (zh) * | 2022-07-26 | 2022-11-15 | 深圳市长丰影像器材有限公司 | 音频调整方法、装置、设备及存储介质 |
| US12555590B2 (en) * | 2022-09-26 | 2026-02-17 | Cerence Operating Company | Switchable noise reduction profiles |
Family Cites Families (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US3610831A (en) * | 1969-05-26 | 1971-10-05 | Listening Inc | Speech recognition apparatus |
| US5822742A (en) * | 1989-05-17 | 1998-10-13 | The United States Of America As Represented By The Secretary Of Health & Human Services | Dynamically stable associative learning neural network system |
| US5581662A (en) * | 1989-12-29 | 1996-12-03 | Ricoh Company, Ltd. | Signal processing apparatus including plural aggregates |
| JPH0566795A (ja) * | 1991-09-06 | 1993-03-19 | Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho | 雑音抑圧装置とその調整装置 |
| US5377302A (en) * | 1992-09-01 | 1994-12-27 | Monowave Corporation L.P. | System for recognizing speech |
| DE4309985A1 (de) * | 1993-03-29 | 1994-10-06 | Sel Alcatel Ag | Geräuschreduktion zur Spracherkennung |
| IT1270919B (it) * | 1993-05-05 | 1997-05-16 | Cselt Centro Studi Lab Telecom | Sistema per il riconoscimento di parole isolate indipendente dal parlatore mediante reti neurali |
| US5649065A (en) * | 1993-05-28 | 1997-07-15 | Maryland Technology Corporation | Optimal filtering by neural networks with range extenders and/or reducers |
| EP0707763B1 (en) * | 1993-07-07 | 2001-08-29 | Picturetel Corporation | Reduction of background noise for speech enhancement |
| US5878389A (en) * | 1995-06-28 | 1999-03-02 | Oregon Graduate Institute Of Science & Technology | Method and system for generating an estimated clean speech signal from a noisy speech signal |
| US5960391A (en) * | 1995-12-13 | 1999-09-28 | Denso Corporation | Signal extraction system, system and method for speech restoration, learning method for neural network model, constructing method of neural network model, and signal processing system |
| US5717833A (en) * | 1996-07-05 | 1998-02-10 | National Semiconductor Corporation | System and method for designing fixed weight analog neural networks |
-
1999
- 1999-10-06 DE DE19948308A patent/DE19948308C2/de not_active Expired - Fee Related
-
2000
- 2000-09-08 EP EP00250301A patent/EP1091349B1/de not_active Expired - Lifetime
- 2000-09-08 DE DE50009461T patent/DE50009461D1/de not_active Expired - Lifetime
- 2000-09-08 AT AT00250301T patent/ATE289110T1/de not_active IP Right Cessation
- 2000-09-20 CA CA002319995A patent/CA2319995C/en not_active Expired - Fee Related
- 2000-10-05 TW TW089120732A patent/TW482993B/zh not_active IP Right Cessation
- 2000-10-06 US US09/680,981 patent/US6820053B1/en not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| DE19948308C2 (de) | 2002-05-08 |
| DE50009461D1 (de) | 2005-03-17 |
| ATE289110T1 (de) | 2005-02-15 |
| CA2319995C (en) | 2005-04-26 |
| EP1091349A2 (de) | 2001-04-11 |
| CA2319995A1 (en) | 2001-04-06 |
| US6820053B1 (en) | 2004-11-16 |
| EP1091349B1 (de) | 2005-02-09 |
| DE19948308A1 (de) | 2001-04-19 |
| EP1091349A3 (de) | 2002-01-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TW482993B (en) | Method and apparatus for suppressing audible noise in speech transmission | |
| US9992572B2 (en) | Dereverberation system for use in a signal processing apparatus | |
| CN101354885B (zh) | 主动噪声控制系统 | |
| AU771444B2 (en) | Noise reduction apparatus and method | |
| KR100860805B1 (ko) | 음성 강화 시스템 | |
| JP5275748B2 (ja) | 動的ノイズ低減 | |
| US8249861B2 (en) | High frequency compression integration | |
| JP5049629B2 (ja) | 時変拡声器−部屋−マイクロホンシステムにおけるエコー減少 | |
| KR100843926B1 (ko) | 고주파수 압축을 통한 음성 인식 향상 시스템 | |
| US8218780B2 (en) | Methods and systems for blind dereverberation | |
| CN100580775C (zh) | 用于减小音频噪声的系统和方法 | |
| US20160086618A1 (en) | A method and apparatus for suppression of unwanted audio signals | |
| US9532149B2 (en) | Method of signal processing in a hearing aid system and a hearing aid system | |
| CN111868826B (zh) | 一种回声消除中的自适应滤波方法、装置、设备及存储介质 | |
| CN105679330A (zh) | 基于改进子带信噪比估计的数字助听器降噪方法 | |
| CN108806712B (zh) | 减少频域处理量的方法与装置 | |
| Ding et al. | An adaptive speech enhancement method for siren noise cancellation | |
| RU2589298C1 (ru) | Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке | |
| Vashkevich et al. | Petralex: a smartphone-based real-time digital hearing aid with combined noise reduction and acoustic feedback suppression | |
| CN108717855B (zh) | 噪音处理方法与装置 | |
| Jain et al. | Implementation of Spectral Subtraction Using IBM in Simulink | |
| Loizou et al. | A MODIFIED SPECTRAL SUBTRACTION METHOD COMBINED WITH PERCEPTUAL WEIGHTING FOR SPEECH ENHANCEMENT |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| GD4A | Issue of patent certificate for granted invention patent | ||
| MM4A | Annulment or lapse of patent due to non-payment of fees |