DK171426B1

DK171426B1 - Taleprocessor og anvendelse af en taleprocessor i en mobilradioterminal samt fremgangsmåde til signalbehandling af tale

Info

Publication number: DK171426B1
Application number: DK282587A
Authority: DK
Inventors: Nicholas John Arnold Forse
Original assignee: British Telecomm
Priority date: 1986-06-02
Filing date: 1987-06-02
Publication date: 1996-10-21
Also published as: DE3752288T2; DE3750314D1; EP0248609A1; DE3750314T2; JP2561850B2; WO1987007750A1; KR950011963B1; FI872450L; CA1310418C; KR880701435A; ATE109582T1; JPH09325790A; GB8613327D0; FI92113B; EP0248609B1; JPH0677894A; HK137096A; ES2056819T3; DE3752288D1; DK282587A

Description

DK 171426 B1

Opfindelsen angår taleprocessorer med en automatisk styret forstærkning og i særdeleshed udstyr til at genkende tale.

Apparater til automatisk at genkende tale fungerer på den måde, at de sammenligner træk (eng: "feature extraction"), som 5 udtrækkes fra hørlige talesignaler. Træk, som udtrækkes fra den tale, som skal genken- des, sammenlignes med lagrede træk, som er udtrukket fra en kendt udtalelse.

For at opnå en nøjagtig genkendelse er det vigtigt, at de træk, som udtrækkes fra det samme ord eller lyd, og som senere 10 udtales på andre tidspunkter, har tilstrækkelig stor lighed.

Det store dynamikområde for tale gør imidlertid dette vanskeligt at opnå i særdeleshed i områder, såsom telefonering med frie hænder (dvs. uden at holde mikrofonen i hånden), hvor lydniveauet, som modtages af mikrofonen, kan variere over et 15 stort område. For at kompensere for denne variation i tale-niveau, anvender de fleste apparater til genkendelse af tale en eller anden form for automatisk styret forstærkning (AGC).

AGC-kredsløbet styrer forstærkningen for at sikre, at det gennemsnitlige signalniveau, som anvendes af træk-ekstraktions-20 kredsløbet (eng: "feature extractor), er så konstant som muligt over en given tidsperiode. Derfor får stilfærdige taleyt-ringer en større forstærkning end kraftige ytringer. Denne form for AGC fungerer udmærket, når indgangssignalet er en kontinuerlig tale, for efter en tidsperiode vil kredsløbsfor-25 stærkningen optimere signalniveauet således, at det giver en ensartet trækekstraktion. Hvis der imidlertid ikke er nogen tale, vil forstærkningen af AGC-kredsløbet øges til et niveau, der bestemmes af baggrundsstøjen således, at forstærkningen i AGC-kredsløbet vil være alt for høj, når en ny udtalelse star-30 ter. Under den efterfølgende udtalelse vil forstærkningen i kredsløbet derefter automatisk reduceres, idet hastigheden af forstærkningsændringen bestemmes af AGC'ens tidskonstant (at-tack-tid). Starten på ytringen udsættes således for en langt større forstærkning og eventuelle træk, som udtrækkes, vil 2 DK 171426 B1 have et langt større energiindhold end tilsvarende træk, som udtrækkes senere, når forstærkningen er reduceret.

Denne forvrængningseffekt afhænger af indgangssignalniveauet.

Jo højere taleniveauet er, jo større er forvrængningen. Derfor 5 vil de første få træk, som udtrækkes, ikke svare til de notorisk lignende oplagrede træk, og dette kan ofte medføre, at apparatet er dårligt til at genkende talen.

Den foreliggende opfindelse søger at tilvejebringe en løsning af dette problem.

10 US-A-3.411.153 beskriver et analogt-til-digitalt system, hvori der indgår et hjælpekredsløb til automatisk justering af kon-verteringsapparatets dynamikområde forud for hver sampling af de analoge signal-spændinger. I dette system ledes indgangstalesignalet først gennem en konventionel stemme-aktiveret/-15 styret forstærknings-justerings-komponent, og senere til N båndpas- og lavpas-filtre, og udgangssignalerne fra de N kanaler samples i rækkefølge af en A/D-konverter. Der anvendes endvidere en anden komponent til at justere A/D-konverterens dynamikområde automatisk, omfattende to spektrum-detektorer, 20 som detekterer det faktiske maksimum og minimum af spektret forud for hver samplingsekvens.

Ifølge den foreliggende opfindelse tilvejebringes en teleprocessor, som omfatter en indgang til at modtage talesignaler, signalbehandlende organer til at ekstrahere spektrale parame-25 tre fra talesignalerne, en analog-til-digital konverter til at digitalisere de udtrukne parametre, organer til automatisk at styre forstærkningen for at styre det signalniveau, som påtrykkes konverteren, kendetegnet ved, at spektralparametrene oplagres i hvert fald midlertidig, og at der for hver sådan 30 oplagret parameter også lagres en forstærkningskoefficient, som indikerer den forstærkning, som blev anvendt af forstærkningsstyreorganerne, og ved at de forstærkningskoefficienter, som er oplagret i den pågældende periode, ved afslutningen af 3 DK 171426 B1 en samplingperiode, sættes lig med den laveste forstærknings-koefficient, som er oplagret i den periode, hvis de er forskellige, idet størrelserne af de tilsvarende oplagrede spek-tralparametre justeres proportionalt hermed.

5 I en taleprocessor ifølge den foreliggende opfindelse udformet som et apparat til genkendelse af tale, udføres en automatisk forstærkningsstyring af et digitalt omskiftet eller styret dæmpningsled, hvis forstærkning bestemmes af den mikroprocessor, som udfører talegenkendelsen. Mikroprocessoren styrer 10 forstærkningen for at sikre, at analog-digital konverterens dynamikområdet ikke overskrides (hvilket sker mellem trækekstraktionen og mikroprocessoren, som styrer genkendelsesappara-tet, også selv om der anvendes analoge AGC'er) (undtagen under tilpasningen til AGC'en).

15 Den principielle forskel mellem de kendte analoge AGC'er og systemer ifølge den foreliggende opfindelse er, at i den foreliggende opfindelse styrer mikroprocessoren forstærkningsindstillingen, og mikroprocessoren kan derfor gemme den anvendte forstærkning, for hvert udtrukket træk (eng: "feature extrac-20 tion"). Efter at ytringen er afsluttet, kan mikroprocessoren bestemme den optimale forstærkningsindstilling for hele ytringen. Alle de gemte træk normaliseres derefter til denne optimale forstærkningsindstilling. På denne måde udtrækkes et ensartet (konsistent) sæt træk uafhængigt af indgangssignal-25 forstærkningen.

Opfindelsen angår også anvendelsen af en taleprocessor i en mobilradioterminal, som angivet i krav 8, samt fremgangsmåde til behandling af tale som angivet i krav 9 og 10. Disse fremgangsmåder bygger på de samme principper for opfindelsen som 30 angivet ovenfor, og fordelen er atter, at der opnåes en ensartet "feature extraction".

Udførelsesformer ifølge opfindelsen skal i det følgende beskrives og forklares under henvisning til de ledsagende teg- fig. 1 viser et skematisk diagram af et apparat til genken delse af tale ifølge den foreliggende opfindelse.

4 DK 171426 B1 ninger, hvor

Overalt i den nærværende beskrivelse er opfindelsen beskrevet 5 under henvisning til et talegenkendelsesapparat, der anvender skabelon-sammenligning, men, som det vil være fagfolk bekendt, kan opfindelsen lige såvel anvendes til en hvilken som helst konventionel form for talegenkendelsesapparat inklusiv de apparater, der anvender en stokastisk modeldannelse, Markovkæ-10 der, dynamisk tidsforskydning (eng.: dynamic-timewarping) og fonemgenkendelse.

Talegenkendelse er baseret på at sammenligne energikonturer fra et antal (sædvanligvis 8-16) filterkanaler. Mens tale er til stede, digitaliseres energispektret fra hver filterkanal 15 med en analog-til-digital konverter for at danne en skabelon, som lagres i en hukommelse.

Det indledende trin af genkendelsen kendes som indlæring eller "training" og består i at frembringe referenceskabeloner ved til genkendelsesapparatet at indtale de ord, som man ønsker 20 skal genkendes. Når først referenceskabelonerne er blevet fremstillet for de ord, som skal kunne genkendes, kan en genkendelse af tale forsøges.

Når genkendelsesapparatet udsættes for en udtalelse, frembringer det en testskabelon, som kan sammenlignes med reference-25 skabeloner i hukommelsen for at finde den tætteste overensstemmelse.

Grundelementerne i talegenkendelsesapparatet ifølge den foreliggende opfindelse er vist i fig. 1- Stemmesignaler modtaget - af en mikrofon 1, forstærkes af en forstærker 2 og ledes frem 30 til en filtergruppe 3a. I filtergruppen filtreres stemmesignalerne og opdeles i et antal (i dette tilfælde 16) frekvens- 5 DK 171426 B1 bånd, og signalerne ensrettes af ensrettere 4. De filtrerede og ensrettede signaler udglattes af lavpasfiltre 3b og af-tastes (samples) ved hjælp af en multiplekser 5, som leder det resulterende enkeltkanalssignal til DAGC-kredsløbet 8, som 5 igen overfører signalet til en analog-digital konverter 6, hvorfra den digitaliserede signalstrøm ledes til den styrende mikroprocessor 7.

Multiplekseren adresserer hver enkelt filterkanal i 20 mikrosekunder, før den går videre til den næste kanal. Ved afslut-10 ningen af hver 10 millisekund tidsslids eller tidsvindue, gemmes den energi, der er målt for kanalen i den pågældende periode. De skabeloner, som dannes under indlæring eller genkendelse, består af op til 100 tidsvinduer med prøver for hver enkelt filterkanal.

15 Den digitale AGC arbejder på følgende måde. Hver gang multiplekseren adresserer en filterkanal, vurderer mikroprocessoren kanalens energiniveau for at bestemme, om A-D konverteren er blevet overbelastet, og dermed om forstærkningen er for høj.

Når mikroprocessoren bestemmer, at forstærkningen er for høj, 20 nedsætter den AGC'ens forstærkning med et trin, hvilket svarer til en reduktion i forstærkning på 1,5 dB, og ser igen på kanalens energiniveau. Multiplekseren går ikke videre til næste kanal, før mikroprocessoren har bestemt, at forstærkningen er blevet reduceret tilstrækkeligt til at forhindre en overbe-25 lastning af A-D konverteren. Når multiplekseren går videre til den næste filterkanal, holdes forstærkningen i AGC-kredsløbet på det nye lave niveau, medmindre niveauet medfører en overbelastning i A-D konverteren med den nye kanals energiniveau, hvis det er tilfældet, nedsættes forstærkningen yderligere som 30 beskrevet i det foregående. Når multiplekseren har adresseret den sidste filterkanal, normaliserer mikroprocessoren energiniveauerne for alle kanaler ved at sætte deres forstærknings-koefficienter (som er blevet oplagret sammen med energiniveauinformationen i den tilhørende hukommelse i mikroprocessoren) 35 til det nye minimum, som fastsættes af mikroprocessoren. På 6 DK 171426 B1 denne måde udtrækkes et ensartet sæt af træk uafhængigt af den indledende indgangssignalforstærkning og eventuelle ændringer i forstærkningen under dannelsen af skabelonen.

Det er også nødvendigt at talegenkendelsesapparatet detekterer 5 begyndelsen og afslutningen af talen eller ordet med en høj grad af nøjagtighed. Talegenkendelsesapparatet ifølge den foreliggende opfindelse anvender følgende teknik: A. Energiniveauet af bagrundsstøjen måles og lagres i 32 tidsslidser eller -vinduer (med 10 millisekunder pr prøve) samti- 10 dig med at forstærkningerne af AGC-kredsløbet justeres (reduceres) som beskrevet ovenfor, for at tage højde for den maksimale støjenergi.

B. Den maksimale energiprøve findes ved at addere alle filterværdierne for hver tidsslids, dividere med 16 (antallet af 15 filterkanaler) og multiplicere med en forstærkningsfaktor svarende til forstærkningen af DAGC-kredsløbet, og derefter sammenligne hver tidsslids for at finde den største.

C. Den tærskelværdi, som skal overskrides for at tale kan bedømmes som værende til stede, indstilles til at være lig med 20 1,5 gange den maksimale støjenergi, som bestemmes under trin B.

D. Middelstøj energien for hver filterkanal findes og lagres (for hver kanal er den summen af energierne over alle 32 tidsslidser, divideret med 32) for at fastlægge en støjskabelon.

25 E. Derefter skanderes filtergruppen for hver 10 millisekunder og dataene oplagres i et midlertidigt cyklisk lager på 100 tidsprøver, indtil middelfilterenergien overskrider den støj/ taletærskel, som blev beregnet under C.

F. Hvis støj/taletærskelen ikke overskrides efter 32 prøver, 30 udføres en kontrol for at sikre, at forstærkningen af DAGC- 7 DK 171426 B1 kredsløbet ikke er sat for lav. Dette gøres ved at se på den største filterkanalværdi, som er lagret i de 32 tidsslidser.

Hvis det maksimale niveau er 1,5 dB eller mere under det maksimalt acceptable indgangsniveau for A-D konverteren, forøges 5 forstærkningen af AGC'en med 1 for at forøge forstærkningen med 1,5 dB. Hvis tærskelværdien ikke overskrides efter 32 prøver, og DAGC' indstillingen er korrekt, beregnes støj/tale-tærskelen på ny ved at finde den maksimale energi over de sidste 32 prøver (som under B) og multiplicere med 1,5 (som i C).

10 G. Når først støj/taletærskelværdien er blevet overskredet, skanderes filtergruppen for hver 10 millisekunder og filterdata oplagres i en hukommelse for at danne taleskabelonerne, indtil enten 100 prøver er blevet indført eller indtil energiniveauet falder under støj/taletærskelen for 20 på hinanden 15 følgende prøver. Som beskrevet ovenfor nedsættes AGC-indstil-lingen med 1, hvis A-D konverteren overbelastes under dataindføringen og data for den pågældende filterkanal behandles på ny. Hvis forstærkningen af DAGC-kredsløbet reduceres under skanderingen af de 16 filterkanaler, genindføres data fra alle 20 16 kanaler, således at alle filterdataene svarer til samme AGC-indstilling. Den anvendte AGC-værdi registreres i en hukommelse sammen med filterdataene. Den AGC-indstilling, som anvendes ved begyndelsen af hver tidsslids, tages fra den foregående tidsramme, og forstærkningen kan således kun reduce-25 res (ikke forøges) i talebehandlingsfasen. Dette er ikke noget problem, eftersom alle skabelondata normaliseres til en ensartet AGC-indstilling ved afslutningen af skabelonperioden.

H. For at sikre, at begyndelsen af talen ikke blev mistet af tale/støjdetektortærskelen, overføres 1-5 tidsprøver forud for 30 taledetekteringen fra det midlertidige cykliske lager til fronten af taleskabelonen.

I. Hvis mere end 100 prøver blev behandlet forud for at tale blev detekteret, omregnes støj skabelonen ved analysering (som under D) af de ældste 32 tidsrammer i det midlertidige cyk 8 DK 171426 B1 liske lager. Hvis mindre end 100 prøver blev behandlet forud for at talen blev detekteret, anvendes den under punkt D etablerede støj skabelon i de følgende trin.

J. Den minimale forstærkningsindstilling af AGC'en over tale-5 skabelonen findes derefter og både tale og støj skabeloner normaliseres til denne indstilling, hvilket resulterer i, at begge skabeloner indeholder de værdier, som ville være blevet indført, hvis den forstærkning var blevet anvendt fra starten.

K. Den normaliserede støj skabelon subtraheres fra hver tids-10 ramme i den normaliserede taleskabelon.

L. Den maksimale energi i den normaliserede taleskabelon findes nu, og en ny støj/taletærskel beregnes - lig med den maksimale energi minus 18 dB. Denne ny tærskelværdi anvendes til at skandere den normaliserede taleskabelon for at bestemme 15 start og slutpunkter for talen.

M. Taleskabelonen afskæres derefter ved start og slutpunkterne og oplagres enten i hukommelsen (indlæring) eller anvendes til genkendelse. Det følgende tabeleksempel repræsenterer de værdier, der er oplagret efter måling af baggrundsstøjen for 320 20 millisekunder (32 tidsslidser af 10 millisekunder hver).

DK 171426 B1 9

Filtergruppenummer

Tids rammer ^ 1 2 3 4 3 4 7 « » i· n w is η » u ^,f· 4 21* 22* 232 243 224 214 147 IBS 174 234 23β 177 134 17* 213 2*9 428

4 22· 218 23* 238 22* 222 17* 198 173 23* 233 17* 137 172 213 212 IS

4 21· 222 234 247 214 223 171 189 17Β 233 233 171 14* Al ΤΙ 2Μ ίΠ

4 213-22· 231 231 218 223 144 184 174 23* 23β 48 33 12 Si 2U SS

4 213 217 228 233 22* 22* 14* 184 18* 231 234 144 132 44 22Ζ Si 12 4 21. 22* 232 243 224 214 172 187 177 235 233 4« 3* 1τ2 2Μ W 1Π 4 21* 22* 232 243 224 214 147 188 174 234 23* 177 134 17* 2 3 2*9

i Si Tå g Τ5 SI g ” »25517· S !S TA TA SS

4 21* 222 234 247 214 223 171 189 178 233 k—- S 171 14B 17® "iiA ^aa 4 213 217 228 233 22* ίίβ Jii 23® 258 lbB 153 165 220 216 408 2«1 2 3 4 5 - - - 228 ^33 22* 22* 14* 184 180 231 234 144 132 144 223 22* 4*9 4 21* 22* 232 243 224 214 172 187 177 233 233 4* 13* 72 TI S aT? 4 21* 22* 232 243 224 214 147 188 174 234 25* 177 134 17* 213 2*9 4*8

4 211 218 23* 23* 22* 222 17* 19* 173 23* 233 7. 37 172 TI

4 21* 222 234 247 214 223 171 189 178 233 233 171 14* 7. SI Ϊ!I

4 213 22* 231 231 218 223 144 184 174 23* 25* 48 133 143 Si S* Si

4 213 217 228 233 22* 22« 14* 184 188 231 234 144 132 144 S3 Si IS

4 21* 22* 232 243 224 214 172 187 177 233 253 4* 3* 172 Ta IS IS

4 21* 22* 232 243 224 214 147 198 174 234 23* 177 134 Al ^9 IS

4 211 218 230 23* 22* 222 17* 19* 173 230 233 17* 37 72 2 5 TA IS

4 21* 222 234 247 214 225 171 189 178 233 233 171 14* 70 TlA SI ΙΠ i TA TA IS Si Si 174 230 230 «« «s 145 S* SI Si j gi g? IS IS gi gi}?? ;g 177 235 233 «*· 1» i»* 1,1 £! £ i S3 SI TA IS SI 2ϊ !ϋ 184 174 230 250 Si 2! 12 4 215 217 228 233 22* 22* 14* 184 180 231 234 144 132 144 223 T20 4*9 4 21* 220 232 243 224 216 172 187 177 233 233 140 13* 172 Ti SI 2? 4 21* 220 232 243 224 214 167 IBS 174 234 S i77 S £ \ J ^

4 211 218 230 230 229 222 170 190 173 23* 233 170 137 72 21 S

Det maksimale, reelle energiindhold (middelværdi for alle fil- 10 trene) blev:- 410 5S s s g: s τ 174 2ϊβ 214 ιω 133143» «ϊ s: 2 4 Ais -17 228 233 220 220 140 186 180 231 234 144 132 144 223 220 409 3

Middelstøj skabelon: 4 212 219 231 248 229 228 167 187 176 232 232 169 134 169 217 212 5

En DAGC-værdi på 4 er ækvivalent med en 6 dB dæmpning af signalet, som indgår i A/D'en. For at beregne den reelle energi skal alle filtergruppeværdierne, der er angivet ovenfor, fordobles .

10 DK 171426 B1 Tærskelværdien, som skal overskrides for at starte/slutte skabelonoptagelse:- 615

Fordi opfindelsens primære anvendelse er stemmegenkendelse, er den beskrevet i forbindelse med denne anvendelse. Som det vil 5 være klart for fagfolk, kan opfindelsen dog ikke alene anvendes til stemmegenkendelse, men er anvendelig i praktisk taget enhver situation, hvor stemmesignaler behandles for at udtrække nogle træk (eng.: feature extraction).

Taleprocessoren ifølge den foreliggende opfindelse er især 10 velegnet til brug ved anvendelser, hvor baggrundsstøj og variationer i niveauet af baggrundsstøjen er et problem for kendte taleprocessorer. En sådan anvendelse er ved telefonering med frie hænder og specielt telefonering med frie hænder ved brug af celle-/radioterminaler. Sådanne terminaler anven-15 des ofte i biler, hvor det er bekvemt at anvende talegenkendelse for at opnå opkald og forbindelse uden brug af hænder. Problemet opstår imidlertid, hvor vind, vej og motorstøj fluktuerer voldsomt, og gør en nøjagtig genkendelse af talen vanskelig. Hvis talegenkendelse til frihåndstelefone- ring skal 2 0 være fuldt ud acceptabel ved denne anvendelse, er det dog nødvendigt, at genkenderen accepterer og fungerer korrekt i afhængighed af stemme-ordrer under tilstedeværelsen af baggrundsstøj uden rutinemæssigt at forlange, at disse ordrer gentages. 1

Den forbedrede genkendelsesnøjagtighed, som opnås med den nærværende opfindelse, er særlig fordelagtig ved denne anvendelse .

Claims

11 DK 171426 B1 Patentkrav.

1. Taleprocessor omfattende en indgang (1) til at modtage talesignaler, signalbehandlingsorganer (3) til at ekstrahere 5 spektralparametre fra talesignalerne, en analog til digital konverter (6) til at digitalisere de ekstraherede parametre, et automatisk forstærkningsstyringsorgan (8) for at styre det signalniveau, som påtrykkes konverteren, kendetegnet ved, at spektralparametrene oplagres i hvert fald midlerti-10 digt, og at der for hver således oplagrede parameter også oplagres en forstærkningskoefficient, som angiver den forstærkning, der er anvendt af forstærkningsstyreorganet (8), og ved at de forstærkningskoefficienter, som er oplagret i en samplingperiode, ved periodens afslutning, hvis de er forskel-15 lige, sættes lig med den laveste forstærkningskoefficient, som er oplagret i den pågældende periode, idet størrelsen af de tilsvarende oplagrede spektralparametre justeres proportionalt hermed.

2. Taleprocessor ifølge krav 1, og hvori hver ekstraheret 20 (udtrukken) spektralparameter svarer til energiindholdet i et givet frekvensbånd i en tidsslids af længden (t), yderligere kendetegnet ved, at for hver ekstraheret (udtrukket) parameter bestemmes det signalniveau, som påtrykkes analog-til-digital konverteren (6) i en lille brøkdel af tiden 25 (t), hvis signalniveauet er større end et forudbestemt niveau, reduceres forstærkningen og signalniveauet revurderes, idet signalstyrkevurderingen og forstærkningsreduktionen gentages indenfor tidsslidsen (t), indtil signalniveauet ligger på et endeligt niveau, som ikke overskrider det forudbestemte 30 niveau.

3. Taleprocessor ifølge krav.2, kendetegnet ved, at det forudbestemte niveau er lig med det maksimale niveau, som ikke overskrider det dynamiske område af analog-til-digital konverteren (6). 12 DK 171426 B1

4. Taleprocessor ifølge krav 2 eller 3, hvori spektralpara-raetrene i en enkelt tidsslids af længden (t) etableres for flere diskrete frekvensbånd, yderligere kendetegnet ved, at de forskellige frekvensbånd adresseres i rækkefølge, 5 idet den endelige forstærkningskoefficient for ethvert frekvensbånd anvendes som begyndelsesforstærkningskoefficienten for det næste adresserede frekvensbånd.

5. Taleprocessor ifølge et eller flere af kravene 2 til 4, kendetegnet ved, at samplingperioden er opbygget af 10 flere tidsslidser af længden (t).

6. Taleprocessor ifølge et eller flere af de foregående krav, kendetegnet ved, at den er udformet som en tale-genkender.

7. Taleprocessor ifølge et eller flere af de foregående krav, 15 kendetegnet ved, at forstærkningsstyreorganerne (8) omfatter et digitalt omskiftet dæmpningsled styret af en mikroprocessor (7) , hvis ene indgang er forbundet til den digitaliserede udgang fra analog-til-digital konverteren, idet forstærkningen af dæmpningsleddet bestemmes af mikroprocesso-20 ren.

8. Anvendelse af en taleprocessor ifølge et eller flere af kravene 1-5 til en talegenkendelsesenhed i en mobilradioter-minal, hvor talegenkendelsesenheden udvælger funktioner i afhængighed af instruktioner, som afgives med stemmen.

9. Fremgangsmåde til behandling af tale og omfattende, at et indgangstalesignal filtreres til et antal spektral-komponenter for en samplingperiode, kendetegnet ved, at det nævnte antal spektralkomponenter forstærkes i ræk 13 DK 171426 B1 kefølge med tilsvarende signalforstærkningsfaktorer, at det forstærkede antal spektralkomponenter konverteres til digitale signaler, der repræsenterer spektralkomponen-terne, 5 at signaler, der repræsenterer (a) spektralkomponenterne for indgangstalesignalet, og (b) de tilsvarende signalforstærkningsfaktorer måles og gemmes, og at værdien af gemte spektralkomponenter, der er knyttet 10 til i hvert fald den indledende del af et talesignal, ju steres således, at den baseres på den mindste signalforstærkningsfaktor, som anvendes i samplingperioden til at forstærke efterfølgende spektralkomponenter af talesignalet .

10. Fremgangsmåde til behandling af tale og omfattende, at indgangstalesignaler modtages, og at der der ud fra tilvejebringes digitale data for målte spektralparametre, kendetegnet ved, at den indbefatter en automatisk forstærkningsjustering, 20 der justerer niveauet af talesignalkomponenter, som måles, men som - efter den indledende del af et talesignal - i sig selv kan tilvejebringe ekstra stor signalforstærkning, hvilken forstærkning derefter automatisk justeres til mindre niveauer under fortsættelsen af talesignalet; og 14 DK 171426 B1 at ekstra store signalforstærkningsfaktorer, der er knyttet til talesignalkomponenterne under i hvert fald den indledende del af et talesignal, gemmes og senere reduceres, for at frembringe en optimeret effektiv signalfor-5 stærkning over hele talesignalet, hvilken optimeret for stærkning er baseret på den mindste signalforstærkning, anvendt under fortsættelsen af talesignalet. 10