DK171426B1 - Taleprocessor og anvendelse af en taleprocessor i en mobilradioterminal samt fremgangsmåde til signalbehandling af tale - Google Patents
Taleprocessor og anvendelse af en taleprocessor i en mobilradioterminal samt fremgangsmåde til signalbehandling af tale Download PDFInfo
- Publication number
- DK171426B1 DK171426B1 DK282587A DK282587A DK171426B1 DK 171426 B1 DK171426 B1 DK 171426B1 DK 282587 A DK282587 A DK 282587A DK 282587 A DK282587 A DK 282587A DK 171426 B1 DK171426 B1 DK 171426B1
- Authority
- DK
- Denmark
- Prior art keywords
- speech
- signal
- gain
- stored
- level
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/38—Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
- H04B1/40—Circuits
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02168—Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Control Of Amplification And Gain Control (AREA)
- Interface Circuits In Exchanges (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Mobile Radio Communication Systems (AREA)
- Telephonic Communication Services (AREA)
- Noise Elimination (AREA)
- Circuits Of Receivers In General (AREA)
- Facsimiles In General (AREA)
- Sewing Machines And Sewing (AREA)
- Multi-Process Working Machines And Systems (AREA)
- Analogue/Digital Conversion (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Telephone Function (AREA)
- Display Devices Of Pinball Game Machines (AREA)
- Machine Translation (AREA)
Description
DK 171426 B1
Opfindelsen angår taleprocessorer med en automatisk styret forstærkning og i særdeleshed udstyr til at genkende tale.
Apparater til automatisk at genkende tale fungerer på den måde, at de sammenligner træk (eng: "feature extraction"), som 5 udtrækkes fra hørlige talesignaler. Træk, som udtrækkes fra den tale, som skal genken- des, sammenlignes med lagrede træk, som er udtrukket fra en kendt udtalelse.
For at opnå en nøjagtig genkendelse er det vigtigt, at de træk, som udtrækkes fra det samme ord eller lyd, og som senere 10 udtales på andre tidspunkter, har tilstrækkelig stor lighed.
Det store dynamikområde for tale gør imidlertid dette vanskeligt at opnå i særdeleshed i områder, såsom telefonering med frie hænder (dvs. uden at holde mikrofonen i hånden), hvor lydniveauet, som modtages af mikrofonen, kan variere over et 15 stort område. For at kompensere for denne variation i tale-niveau, anvender de fleste apparater til genkendelse af tale en eller anden form for automatisk styret forstærkning (AGC).
AGC-kredsløbet styrer forstærkningen for at sikre, at det gennemsnitlige signalniveau, som anvendes af træk-ekstraktions-20 kredsløbet (eng: "feature extractor), er så konstant som muligt over en given tidsperiode. Derfor får stilfærdige taleyt-ringer en større forstærkning end kraftige ytringer. Denne form for AGC fungerer udmærket, når indgangssignalet er en kontinuerlig tale, for efter en tidsperiode vil kredsløbsfor-25 stærkningen optimere signalniveauet således, at det giver en ensartet trækekstraktion. Hvis der imidlertid ikke er nogen tale, vil forstærkningen af AGC-kredsløbet øges til et niveau, der bestemmes af baggrundsstøjen således, at forstærkningen i AGC-kredsløbet vil være alt for høj, når en ny udtalelse star-30 ter. Under den efterfølgende udtalelse vil forstærkningen i kredsløbet derefter automatisk reduceres, idet hastigheden af forstærkningsændringen bestemmes af AGC'ens tidskonstant (at-tack-tid). Starten på ytringen udsættes således for en langt større forstærkning og eventuelle træk, som udtrækkes, vil 2 DK 171426 B1 have et langt større energiindhold end tilsvarende træk, som udtrækkes senere, når forstærkningen er reduceret.
Denne forvrængningseffekt afhænger af indgangssignalniveauet.
Jo højere taleniveauet er, jo større er forvrængningen. Derfor 5 vil de første få træk, som udtrækkes, ikke svare til de notorisk lignende oplagrede træk, og dette kan ofte medføre, at apparatet er dårligt til at genkende talen.
Den foreliggende opfindelse søger at tilvejebringe en løsning af dette problem.
10 US-A-3.411.153 beskriver et analogt-til-digitalt system, hvori der indgår et hjælpekredsløb til automatisk justering af kon-verteringsapparatets dynamikområde forud for hver sampling af de analoge signal-spændinger. I dette system ledes indgangstalesignalet først gennem en konventionel stemme-aktiveret/-15 styret forstærknings-justerings-komponent, og senere til N båndpas- og lavpas-filtre, og udgangssignalerne fra de N kanaler samples i rækkefølge af en A/D-konverter. Der anvendes endvidere en anden komponent til at justere A/D-konverterens dynamikområde automatisk, omfattende to spektrum-detektorer, 20 som detekterer det faktiske maksimum og minimum af spektret forud for hver samplingsekvens.
Ifølge den foreliggende opfindelse tilvejebringes en teleprocessor, som omfatter en indgang til at modtage talesignaler, signalbehandlende organer til at ekstrahere spektrale parame-25 tre fra talesignalerne, en analog-til-digital konverter til at digitalisere de udtrukne parametre, organer til automatisk at styre forstærkningen for at styre det signalniveau, som påtrykkes konverteren, kendetegnet ved, at spektralparametrene oplagres i hvert fald midlertidig, og at der for hver sådan 30 oplagret parameter også lagres en forstærkningskoefficient, som indikerer den forstærkning, som blev anvendt af forstærkningsstyreorganerne, og ved at de forstærkningskoefficienter, som er oplagret i den pågældende periode, ved afslutningen af 3 DK 171426 B1 en samplingperiode, sættes lig med den laveste forstærknings-koefficient, som er oplagret i den periode, hvis de er forskellige, idet størrelserne af de tilsvarende oplagrede spek-tralparametre justeres proportionalt hermed.
5 I en taleprocessor ifølge den foreliggende opfindelse udformet som et apparat til genkendelse af tale, udføres en automatisk forstærkningsstyring af et digitalt omskiftet eller styret dæmpningsled, hvis forstærkning bestemmes af den mikroprocessor, som udfører talegenkendelsen. Mikroprocessoren styrer 10 forstærkningen for at sikre, at analog-digital konverterens dynamikområdet ikke overskrides (hvilket sker mellem trækekstraktionen og mikroprocessoren, som styrer genkendelsesappara-tet, også selv om der anvendes analoge AGC'er) (undtagen under tilpasningen til AGC'en).
15 Den principielle forskel mellem de kendte analoge AGC'er og systemer ifølge den foreliggende opfindelse er, at i den foreliggende opfindelse styrer mikroprocessoren forstærkningsindstillingen, og mikroprocessoren kan derfor gemme den anvendte forstærkning, for hvert udtrukket træk (eng: "feature extrac-20 tion"). Efter at ytringen er afsluttet, kan mikroprocessoren bestemme den optimale forstærkningsindstilling for hele ytringen. Alle de gemte træk normaliseres derefter til denne optimale forstærkningsindstilling. På denne måde udtrækkes et ensartet (konsistent) sæt træk uafhængigt af indgangssignal-25 forstærkningen.
Opfindelsen angår også anvendelsen af en taleprocessor i en mobilradioterminal, som angivet i krav 8, samt fremgangsmåde til behandling af tale som angivet i krav 9 og 10. Disse fremgangsmåder bygger på de samme principper for opfindelsen som 30 angivet ovenfor, og fordelen er atter, at der opnåes en ensartet "feature extraction".
Udførelsesformer ifølge opfindelsen skal i det følgende beskrives og forklares under henvisning til de ledsagende teg- fig. 1 viser et skematisk diagram af et apparat til genken delse af tale ifølge den foreliggende opfindelse.
4 DK 171426 B1 ninger, hvor
Overalt i den nærværende beskrivelse er opfindelsen beskrevet 5 under henvisning til et talegenkendelsesapparat, der anvender skabelon-sammenligning, men, som det vil være fagfolk bekendt, kan opfindelsen lige såvel anvendes til en hvilken som helst konventionel form for talegenkendelsesapparat inklusiv de apparater, der anvender en stokastisk modeldannelse, Markovkæ-10 der, dynamisk tidsforskydning (eng.: dynamic-timewarping) og fonemgenkendelse.
Talegenkendelse er baseret på at sammenligne energikonturer fra et antal (sædvanligvis 8-16) filterkanaler. Mens tale er til stede, digitaliseres energispektret fra hver filterkanal 15 med en analog-til-digital konverter for at danne en skabelon, som lagres i en hukommelse.
Det indledende trin af genkendelsen kendes som indlæring eller "training" og består i at frembringe referenceskabeloner ved til genkendelsesapparatet at indtale de ord, som man ønsker 20 skal genkendes. Når først referenceskabelonerne er blevet fremstillet for de ord, som skal kunne genkendes, kan en genkendelse af tale forsøges.
Når genkendelsesapparatet udsættes for en udtalelse, frembringer det en testskabelon, som kan sammenlignes med reference-25 skabeloner i hukommelsen for at finde den tætteste overensstemmelse.
Grundelementerne i talegenkendelsesapparatet ifølge den foreliggende opfindelse er vist i fig. 1- Stemmesignaler modtaget - af en mikrofon 1, forstærkes af en forstærker 2 og ledes frem 30 til en filtergruppe 3a. I filtergruppen filtreres stemmesignalerne og opdeles i et antal (i dette tilfælde 16) frekvens- 5 DK 171426 B1 bånd, og signalerne ensrettes af ensrettere 4. De filtrerede og ensrettede signaler udglattes af lavpasfiltre 3b og af-tastes (samples) ved hjælp af en multiplekser 5, som leder det resulterende enkeltkanalssignal til DAGC-kredsløbet 8, som 5 igen overfører signalet til en analog-digital konverter 6, hvorfra den digitaliserede signalstrøm ledes til den styrende mikroprocessor 7.
Multiplekseren adresserer hver enkelt filterkanal i 20 mikrosekunder, før den går videre til den næste kanal. Ved afslut-10 ningen af hver 10 millisekund tidsslids eller tidsvindue, gemmes den energi, der er målt for kanalen i den pågældende periode. De skabeloner, som dannes under indlæring eller genkendelse, består af op til 100 tidsvinduer med prøver for hver enkelt filterkanal.
15 Den digitale AGC arbejder på følgende måde. Hver gang multiplekseren adresserer en filterkanal, vurderer mikroprocessoren kanalens energiniveau for at bestemme, om A-D konverteren er blevet overbelastet, og dermed om forstærkningen er for høj.
Når mikroprocessoren bestemmer, at forstærkningen er for høj, 20 nedsætter den AGC'ens forstærkning med et trin, hvilket svarer til en reduktion i forstærkning på 1,5 dB, og ser igen på kanalens energiniveau. Multiplekseren går ikke videre til næste kanal, før mikroprocessoren har bestemt, at forstærkningen er blevet reduceret tilstrækkeligt til at forhindre en overbe-25 lastning af A-D konverteren. Når multiplekseren går videre til den næste filterkanal, holdes forstærkningen i AGC-kredsløbet på det nye lave niveau, medmindre niveauet medfører en overbelastning i A-D konverteren med den nye kanals energiniveau, hvis det er tilfældet, nedsættes forstærkningen yderligere som 30 beskrevet i det foregående. Når multiplekseren har adresseret den sidste filterkanal, normaliserer mikroprocessoren energiniveauerne for alle kanaler ved at sætte deres forstærknings-koefficienter (som er blevet oplagret sammen med energiniveauinformationen i den tilhørende hukommelse i mikroprocessoren) 35 til det nye minimum, som fastsættes af mikroprocessoren. På 6 DK 171426 B1 denne måde udtrækkes et ensartet sæt af træk uafhængigt af den indledende indgangssignalforstærkning og eventuelle ændringer i forstærkningen under dannelsen af skabelonen.
Det er også nødvendigt at talegenkendelsesapparatet detekterer 5 begyndelsen og afslutningen af talen eller ordet med en høj grad af nøjagtighed. Talegenkendelsesapparatet ifølge den foreliggende opfindelse anvender følgende teknik: A. Energiniveauet af bagrundsstøjen måles og lagres i 32 tidsslidser eller -vinduer (med 10 millisekunder pr prøve) samti- 10 dig med at forstærkningerne af AGC-kredsløbet justeres (reduceres) som beskrevet ovenfor, for at tage højde for den maksimale støjenergi.
B. Den maksimale energiprøve findes ved at addere alle filterværdierne for hver tidsslids, dividere med 16 (antallet af 15 filterkanaler) og multiplicere med en forstærkningsfaktor svarende til forstærkningen af DAGC-kredsløbet, og derefter sammenligne hver tidsslids for at finde den største.
C. Den tærskelværdi, som skal overskrides for at tale kan bedømmes som værende til stede, indstilles til at være lig med 20 1,5 gange den maksimale støjenergi, som bestemmes under trin B.
D. Middelstøj energien for hver filterkanal findes og lagres (for hver kanal er den summen af energierne over alle 32 tidsslidser, divideret med 32) for at fastlægge en støjskabelon.
25 E. Derefter skanderes filtergruppen for hver 10 millisekunder og dataene oplagres i et midlertidigt cyklisk lager på 100 tidsprøver, indtil middelfilterenergien overskrider den støj/ taletærskel, som blev beregnet under C.
F. Hvis støj/taletærskelen ikke overskrides efter 32 prøver, 30 udføres en kontrol for at sikre, at forstærkningen af DAGC- 7 DK 171426 B1 kredsløbet ikke er sat for lav. Dette gøres ved at se på den største filterkanalværdi, som er lagret i de 32 tidsslidser.
Hvis det maksimale niveau er 1,5 dB eller mere under det maksimalt acceptable indgangsniveau for A-D konverteren, forøges 5 forstærkningen af AGC'en med 1 for at forøge forstærkningen med 1,5 dB. Hvis tærskelværdien ikke overskrides efter 32 prøver, og DAGC' indstillingen er korrekt, beregnes støj/tale-tærskelen på ny ved at finde den maksimale energi over de sidste 32 prøver (som under B) og multiplicere med 1,5 (som i C).
10 G. Når først støj/taletærskelværdien er blevet overskredet, skanderes filtergruppen for hver 10 millisekunder og filterdata oplagres i en hukommelse for at danne taleskabelonerne, indtil enten 100 prøver er blevet indført eller indtil energiniveauet falder under støj/taletærskelen for 20 på hinanden 15 følgende prøver. Som beskrevet ovenfor nedsættes AGC-indstil-lingen med 1, hvis A-D konverteren overbelastes under dataindføringen og data for den pågældende filterkanal behandles på ny. Hvis forstærkningen af DAGC-kredsløbet reduceres under skanderingen af de 16 filterkanaler, genindføres data fra alle 20 16 kanaler, således at alle filterdataene svarer til samme AGC-indstilling. Den anvendte AGC-værdi registreres i en hukommelse sammen med filterdataene. Den AGC-indstilling, som anvendes ved begyndelsen af hver tidsslids, tages fra den foregående tidsramme, og forstærkningen kan således kun reduce-25 res (ikke forøges) i talebehandlingsfasen. Dette er ikke noget problem, eftersom alle skabelondata normaliseres til en ensartet AGC-indstilling ved afslutningen af skabelonperioden.
H. For at sikre, at begyndelsen af talen ikke blev mistet af tale/støjdetektortærskelen, overføres 1-5 tidsprøver forud for 30 taledetekteringen fra det midlertidige cykliske lager til fronten af taleskabelonen.
I. Hvis mere end 100 prøver blev behandlet forud for at tale blev detekteret, omregnes støj skabelonen ved analysering (som under D) af de ældste 32 tidsrammer i det midlertidige cyk 8 DK 171426 B1 liske lager. Hvis mindre end 100 prøver blev behandlet forud for at talen blev detekteret, anvendes den under punkt D etablerede støj skabelon i de følgende trin.
J. Den minimale forstærkningsindstilling af AGC'en over tale-5 skabelonen findes derefter og både tale og støj skabeloner normaliseres til denne indstilling, hvilket resulterer i, at begge skabeloner indeholder de værdier, som ville være blevet indført, hvis den forstærkning var blevet anvendt fra starten.
K. Den normaliserede støj skabelon subtraheres fra hver tids-10 ramme i den normaliserede taleskabelon.
L. Den maksimale energi i den normaliserede taleskabelon findes nu, og en ny støj/taletærskel beregnes - lig med den maksimale energi minus 18 dB. Denne ny tærskelværdi anvendes til at skandere den normaliserede taleskabelon for at bestemme 15 start og slutpunkter for talen.
M. Taleskabelonen afskæres derefter ved start og slutpunkterne og oplagres enten i hukommelsen (indlæring) eller anvendes til genkendelse. Det følgende tabeleksempel repræsenterer de værdier, der er oplagret efter måling af baggrundsstøjen for 320 20 millisekunder (32 tidsslidser af 10 millisekunder hver).
DK 171426 B1 9
Filtergruppenummer
Tids rammer ^ 1 2 3 4 3 4 7 « » i· n w is η » u ^,f· 4 21* 22* 232 243 224 214 147 IBS 174 234 23β 177 134 17* 213 2*9 428
4 22· 218 23* 238 22* 222 17* 198 173 23* 233 17* 137 172 213 212 IS
4 21· 222 234 247 214 223 171 189 17Β 233 233 171 14* Al ΤΙ 2Μ ίΠ
4 213-22· 231 231 218 223 144 184 174 23* 23β 48 33 12 Si 2U SS
4 213 217 228 233 22* 22* 14* 184 18* 231 234 144 132 44 22Ζ Si 12 4 21. 22* 232 243 224 214 172 187 177 235 233 4« 3* 1τ2 2Μ W 1Π 4 21* 22* 232 243 224 214 147 188 174 234 23* 177 134 17* 2 3 2*9
i Si Tå g Τ5 SI g ” »25517· S !S TA TA SS
4 21* 222 234 247 214 223 171 189 178 233 k—- S 171 14B 17® "iiA ^aa 4 213 217 228 233 22* ίίβ Jii 23® 258 lbB 153 165 220 216 408 2«1 2 3 4 5 - - - 228 ^33 22* 22* 14* 184 180 231 234 144 132 144 223 22* 4*9 4 21* 22* 232 243 224 214 172 187 177 233 233 4* 13* 72 TI S aT? 4 21* 22* 232 243 224 214 147 188 174 234 25* 177 134 17* 213 2*9 4*8
4 211 218 23* 23* 22* 222 17* 19* 173 23* 233 7. 37 172 TI
4 21* 222 234 247 214 223 171 189 178 233 233 171 14* 7. SI Ϊ!I
4 213 22* 231 231 218 223 144 184 174 23* 25* 48 133 143 Si S* Si
4 213 217 228 233 22* 22« 14* 184 188 231 234 144 132 144 S3 Si IS
4 21* 22* 232 243 224 214 172 187 177 233 253 4* 3* 172 Ta IS IS
4 21* 22* 232 243 224 214 147 198 174 234 23* 177 134 Al ^9 IS
4 211 218 230 23* 22* 222 17* 19* 173 230 233 17* 37 72 2 5 TA IS
4 21* 222 234 247 214 225 171 189 178 233 233 171 14* 70 TlA SI ΙΠ i TA TA IS Si Si 174 230 230 «« «s 145 S* SI Si j gi g? IS IS gi gi}?? ;g 177 235 233 «*· 1» i»* 1,1 £! £ i S3 SI TA IS SI 2ϊ !ϋ 184 174 230 250 Si 2! 12 4 215 217 228 233 22* 22* 14* 184 180 231 234 144 132 144 223 T20 4*9 4 21* 220 232 243 224 216 172 187 177 233 233 140 13* 172 Ti SI 2? 4 21* 220 232 243 224 214 167 IBS 174 234 S i77 S £ \ J ^
4 211 218 230 230 229 222 170 190 173 23* 233 170 137 72 21 S
Det maksimale, reelle energiindhold (middelværdi for alle fil- 10 trene) blev:- 410 5S s s g: s τ 174 2ϊβ 214 ιω 133143» «ϊ s: 2 4 Ais -17 228 233 220 220 140 186 180 231 234 144 132 144 223 220 409 3
Middelstøj skabelon: 4 212 219 231 248 229 228 167 187 176 232 232 169 134 169 217 212 5
En DAGC-værdi på 4 er ækvivalent med en 6 dB dæmpning af signalet, som indgår i A/D'en. For at beregne den reelle energi skal alle filtergruppeværdierne, der er angivet ovenfor, fordobles .
10 DK 171426 B1 Tærskelværdien, som skal overskrides for at starte/slutte skabelonoptagelse:- 615
Fordi opfindelsens primære anvendelse er stemmegenkendelse, er den beskrevet i forbindelse med denne anvendelse. Som det vil 5 være klart for fagfolk, kan opfindelsen dog ikke alene anvendes til stemmegenkendelse, men er anvendelig i praktisk taget enhver situation, hvor stemmesignaler behandles for at udtrække nogle træk (eng.: feature extraction).
Taleprocessoren ifølge den foreliggende opfindelse er især 10 velegnet til brug ved anvendelser, hvor baggrundsstøj og variationer i niveauet af baggrundsstøjen er et problem for kendte taleprocessorer. En sådan anvendelse er ved telefonering med frie hænder og specielt telefonering med frie hænder ved brug af celle-/radioterminaler. Sådanne terminaler anven-15 des ofte i biler, hvor det er bekvemt at anvende talegenkendelse for at opnå opkald og forbindelse uden brug af hænder. Problemet opstår imidlertid, hvor vind, vej og motorstøj fluktuerer voldsomt, og gør en nøjagtig genkendelse af talen vanskelig. Hvis talegenkendelse til frihåndstelefone- ring skal 2 0 være fuldt ud acceptabel ved denne anvendelse, er det dog nødvendigt, at genkenderen accepterer og fungerer korrekt i afhængighed af stemme-ordrer under tilstedeværelsen af baggrundsstøj uden rutinemæssigt at forlange, at disse ordrer gentages. 1
Den forbedrede genkendelsesnøjagtighed, som opnås med den nærværende opfindelse, er særlig fordelagtig ved denne anvendelse .
Claims (10)
1. Taleprocessor omfattende en indgang (1) til at modtage talesignaler, signalbehandlingsorganer (3) til at ekstrahere 5 spektralparametre fra talesignalerne, en analog til digital konverter (6) til at digitalisere de ekstraherede parametre, et automatisk forstærkningsstyringsorgan (8) for at styre det signalniveau, som påtrykkes konverteren, kendetegnet ved, at spektralparametrene oplagres i hvert fald midlerti-10 digt, og at der for hver således oplagrede parameter også oplagres en forstærkningskoefficient, som angiver den forstærkning, der er anvendt af forstærkningsstyreorganet (8), og ved at de forstærkningskoefficienter, som er oplagret i en samplingperiode, ved periodens afslutning, hvis de er forskel-15 lige, sættes lig med den laveste forstærkningskoefficient, som er oplagret i den pågældende periode, idet størrelsen af de tilsvarende oplagrede spektralparametre justeres proportionalt hermed.
2. Taleprocessor ifølge krav 1, og hvori hver ekstraheret 20 (udtrukken) spektralparameter svarer til energiindholdet i et givet frekvensbånd i en tidsslids af længden (t), yderligere kendetegnet ved, at for hver ekstraheret (udtrukket) parameter bestemmes det signalniveau, som påtrykkes analog-til-digital konverteren (6) i en lille brøkdel af tiden 25 (t), hvis signalniveauet er større end et forudbestemt niveau, reduceres forstærkningen og signalniveauet revurderes, idet signalstyrkevurderingen og forstærkningsreduktionen gentages indenfor tidsslidsen (t), indtil signalniveauet ligger på et endeligt niveau, som ikke overskrider det forudbestemte 30 niveau.
3. Taleprocessor ifølge krav.2, kendetegnet ved, at det forudbestemte niveau er lig med det maksimale niveau, som ikke overskrider det dynamiske område af analog-til-digital konverteren (6). 12 DK 171426 B1
4. Taleprocessor ifølge krav 2 eller 3, hvori spektralpara-raetrene i en enkelt tidsslids af længden (t) etableres for flere diskrete frekvensbånd, yderligere kendetegnet ved, at de forskellige frekvensbånd adresseres i rækkefølge, 5 idet den endelige forstærkningskoefficient for ethvert frekvensbånd anvendes som begyndelsesforstærkningskoefficienten for det næste adresserede frekvensbånd.
5. Taleprocessor ifølge et eller flere af kravene 2 til 4, kendetegnet ved, at samplingperioden er opbygget af 10 flere tidsslidser af længden (t).
6. Taleprocessor ifølge et eller flere af de foregående krav, kendetegnet ved, at den er udformet som en tale-genkender.
7. Taleprocessor ifølge et eller flere af de foregående krav, 15 kendetegnet ved, at forstærkningsstyreorganerne (8) omfatter et digitalt omskiftet dæmpningsled styret af en mikroprocessor (7) , hvis ene indgang er forbundet til den digitaliserede udgang fra analog-til-digital konverteren, idet forstærkningen af dæmpningsleddet bestemmes af mikroprocesso-20 ren.
8. Anvendelse af en taleprocessor ifølge et eller flere af kravene 1-5 til en talegenkendelsesenhed i en mobilradioter-minal, hvor talegenkendelsesenheden udvælger funktioner i afhængighed af instruktioner, som afgives med stemmen.
9. Fremgangsmåde til behandling af tale og omfattende, at et indgangstalesignal filtreres til et antal spektral-komponenter for en samplingperiode, kendetegnet ved, at det nævnte antal spektralkomponenter forstærkes i ræk 13 DK 171426 B1 kefølge med tilsvarende signalforstærkningsfaktorer, at det forstærkede antal spektralkomponenter konverteres til digitale signaler, der repræsenterer spektralkomponen-terne, 5 at signaler, der repræsenterer (a) spektralkomponenterne for indgangstalesignalet, og (b) de tilsvarende signalforstærkningsfaktorer måles og gemmes, og at værdien af gemte spektralkomponenter, der er knyttet 10 til i hvert fald den indledende del af et talesignal, ju steres således, at den baseres på den mindste signalforstærkningsfaktor, som anvendes i samplingperioden til at forstærke efterfølgende spektralkomponenter af talesignalet .
10. Fremgangsmåde til behandling af tale og omfattende, at indgangstalesignaler modtages, og at der der ud fra tilvejebringes digitale data for målte spektralparametre, kendetegnet ved, at den indbefatter en automatisk forstærkningsjustering, 20 der justerer niveauet af talesignalkomponenter, som måles, men som - efter den indledende del af et talesignal - i sig selv kan tilvejebringe ekstra stor signalforstærkning, hvilken forstærkning derefter automatisk justeres til mindre niveauer under fortsættelsen af talesignalet; og 14 DK 171426 B1 at ekstra store signalforstærkningsfaktorer, der er knyttet til talesignalkomponenterne under i hvert fald den indledende del af et talesignal, gemmes og senere reduceres, for at frembringe en optimeret effektiv signalfor-5 stærkning over hele talesignalet, hvilken optimeret for stærkning er baseret på den mindste signalforstærkning, anvendt under fortsættelsen af talesignalet. 10
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| GB8613327 | 1986-06-02 | ||
| GB868613327A GB8613327D0 (en) | 1986-06-02 | 1986-06-02 | Speech processor |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| DK282587D0 DK282587D0 (da) | 1987-06-02 |
| DK282587A DK282587A (da) | 1987-12-03 |
| DK171426B1 true DK171426B1 (da) | 1996-10-21 |
Family
ID=10598774
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DK282587A DK171426B1 (da) | 1986-06-02 | 1987-06-02 | Taleprocessor og anvendelse af en taleprocessor i en mobilradioterminal samt fremgangsmåde til signalbehandling af tale |
Country Status (13)
| Country | Link |
|---|---|
| US (1) | US4912766A (da) |
| EP (2) | EP0750291B1 (da) |
| JP (3) | JP2561850B2 (da) |
| KR (1) | KR950011963B1 (da) |
| AT (2) | ATE109582T1 (da) |
| CA (1) | CA1310418C (da) |
| DE (2) | DE3750314T2 (da) |
| DK (1) | DK171426B1 (da) |
| ES (1) | ES2056819T3 (da) |
| FI (1) | FI92113C (da) |
| GB (1) | GB8613327D0 (da) |
| HK (1) | HK137096A (da) |
| WO (1) | WO1987007750A1 (da) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4072598A (en) * | 1975-11-12 | 1978-02-07 | Struers K/S | Electrolytic polishing apparatus |
Families Citing this family (50)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH02189600A (ja) * | 1989-01-19 | 1990-07-25 | Sanyo Electric Co Ltd | 音声認識装置 |
| US5333155A (en) * | 1991-04-25 | 1994-07-26 | Rohde & Schwarz Gmbh & Co. Kg | Method and system for transmitting digital audio signals from recording studios to the various master stations of a broadcasting network |
| US6134521A (en) * | 1994-02-17 | 2000-10-17 | Motorola, Inc. | Method and apparatus for mitigating audio degradation in a communication system |
| NZ316124A (en) * | 1995-08-24 | 2000-02-28 | British Telecomm | Pattern recognition for speech recognising noise signals signatures |
| US5774841A (en) * | 1995-09-20 | 1998-06-30 | The United States Of America As Represented By The Adminstrator Of The National Aeronautics And Space Administration | Real-time reconfigurable adaptive speech recognition command and control apparatus and method |
| US7630895B2 (en) * | 2000-01-21 | 2009-12-08 | At&T Intellectual Property I, L.P. | Speaker verification method |
| US6012027A (en) * | 1997-05-27 | 2000-01-04 | Ameritech Corporation | Criteria for usable repetitions of an utterance during speech reference enrollment |
| US6353809B2 (en) * | 1997-06-06 | 2002-03-05 | Olympus Optical, Ltd. | Speech recognition with text generation from portions of voice data preselected by manual-input commands |
| US6188986B1 (en) | 1998-01-02 | 2001-02-13 | Vos Systems, Inc. | Voice activated switch method and apparatus |
| GB9822529D0 (en) * | 1998-10-16 | 1998-12-09 | Dragon Syst Uk Ltd | Speech processing |
| DE19960161C2 (de) * | 1998-12-15 | 2002-03-28 | Daimler Chrysler Ag | Verfahren zur Detektion von sprachmodulierten Sendungen |
| FI118359B (fi) * | 1999-01-18 | 2007-10-15 | Nokia Corp | Menetelmä puheentunnistuksessa ja puheentunnistuslaite ja langaton viestin |
| US6519559B1 (en) * | 1999-07-29 | 2003-02-11 | Intel Corporation | Apparatus and method for the enhancement of signals |
| US6910011B1 (en) | 1999-08-16 | 2005-06-21 | Haman Becker Automotive Systems - Wavemakers, Inc. | Noisy acoustic signal enhancement |
| US7117149B1 (en) * | 1999-08-30 | 2006-10-03 | Harman Becker Automotive Systems-Wavemakers, Inc. | Sound source classification |
| US6594630B1 (en) * | 1999-11-19 | 2003-07-15 | Voice Signal Technologies, Inc. | Voice-activated control for electrical device |
| US7155385B2 (en) | 2002-05-16 | 2006-12-26 | Comerica Bank, As Administrative Agent | Automatic gain control for adjusting gain during non-speech portions |
| KR100841096B1 (ko) * | 2002-10-14 | 2008-06-25 | 리얼네트웍스아시아퍼시픽 주식회사 | 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법 |
| US7895036B2 (en) | 2003-02-21 | 2011-02-22 | Qnx Software Systems Co. | System for suppressing wind noise |
| US8326621B2 (en) | 2003-02-21 | 2012-12-04 | Qnx Software Systems Limited | Repetitive transient noise removal |
| US7885420B2 (en) | 2003-02-21 | 2011-02-08 | Qnx Software Systems Co. | Wind noise suppression system |
| US8073689B2 (en) | 2003-02-21 | 2011-12-06 | Qnx Software Systems Co. | Repetitive transient noise removal |
| US7725315B2 (en) | 2003-02-21 | 2010-05-25 | Qnx Software Systems (Wavemakers), Inc. | Minimization of transient noises in a voice signal |
| US8271279B2 (en) | 2003-02-21 | 2012-09-18 | Qnx Software Systems Limited | Signature noise removal |
| US7949522B2 (en) | 2003-02-21 | 2011-05-24 | Qnx Software Systems Co. | System for suppressing rain noise |
| AU2003901539A0 (en) * | 2003-03-28 | 2003-05-01 | Cochlear Limited | Noise floor estimator |
| US7610196B2 (en) | 2004-10-26 | 2009-10-27 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
| US8306821B2 (en) | 2004-10-26 | 2012-11-06 | Qnx Software Systems Limited | Sub-band periodic signal enhancement system |
| US7949520B2 (en) | 2004-10-26 | 2011-05-24 | QNX Software Sytems Co. | Adaptive filter pitch extraction |
| US8543390B2 (en) | 2004-10-26 | 2013-09-24 | Qnx Software Systems Limited | Multi-channel periodic signal enhancement system |
| US7716046B2 (en) | 2004-10-26 | 2010-05-11 | Qnx Software Systems (Wavemakers), Inc. | Advanced periodic signal enhancement |
| US7680652B2 (en) | 2004-10-26 | 2010-03-16 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
| US8170879B2 (en) | 2004-10-26 | 2012-05-01 | Qnx Software Systems Limited | Periodic signal enhancement system |
| US8284947B2 (en) | 2004-12-01 | 2012-10-09 | Qnx Software Systems Limited | Reverberation estimation and suppression system |
| US20060146652A1 (en) * | 2005-01-03 | 2006-07-06 | Sdi Technologies, Inc. | Sunset timer |
| US8027833B2 (en) | 2005-05-09 | 2011-09-27 | Qnx Software Systems Co. | System for suppressing passing tire hiss |
| US8170875B2 (en) | 2005-06-15 | 2012-05-01 | Qnx Software Systems Limited | Speech end-pointer |
| US8311819B2 (en) | 2005-06-15 | 2012-11-13 | Qnx Software Systems Limited | System for detecting speech with background voice estimates and noise estimates |
| US7117075B1 (en) * | 2005-08-15 | 2006-10-03 | Report On Board Llc | Driver activity and vehicle operation logging and reporting |
| US7995713B2 (en) * | 2006-04-03 | 2011-08-09 | Agere Systems Inc. | Voice-identification-based signal processing for multiple-talker applications |
| US7844453B2 (en) | 2006-05-12 | 2010-11-30 | Qnx Software Systems Co. | Robust noise estimation |
| US8335685B2 (en) | 2006-12-22 | 2012-12-18 | Qnx Software Systems Limited | Ambient noise compensation system robust to high excitation noise |
| US8326620B2 (en) | 2008-04-30 | 2012-12-04 | Qnx Software Systems Limited | Robust downlink speech and noise detector |
| US8850154B2 (en) | 2007-09-11 | 2014-09-30 | 2236008 Ontario Inc. | Processing system having memory partitioning |
| US8904400B2 (en) | 2007-09-11 | 2014-12-02 | 2236008 Ontario Inc. | Processing system having a partitioning component for resource partitioning |
| US8694310B2 (en) | 2007-09-17 | 2014-04-08 | Qnx Software Systems Limited | Remote control server protocol system |
| US8209514B2 (en) | 2008-02-04 | 2012-06-26 | Qnx Software Systems Limited | Media processing system having resource partitioning |
| DE102010041435A1 (de) * | 2010-09-27 | 2012-03-29 | Siemens Medical Instruments Pte. Ltd. | Verfahren zum Rekonstruieren eines Sprachsignals und Hörvorrichtung |
| US9166546B2 (en) | 2011-10-24 | 2015-10-20 | Cochlear Limited | Post-filter common-gain determination |
| JP6127422B2 (ja) | 2012-09-25 | 2017-05-17 | セイコーエプソン株式会社 | 音声認識装置及び方法、並びに、半導体集積回路装置 |
Family Cites Families (28)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US3411153A (en) * | 1964-10-12 | 1968-11-12 | Philco Ford Corp | Plural-signal analog-to-digital conversion system |
| US4000369A (en) * | 1974-12-05 | 1976-12-28 | Rockwell International Corporation | Analog signal channel equalization with signal-in-noise embodiment |
| US4032710A (en) * | 1975-03-10 | 1977-06-28 | Threshold Technology, Inc. | Word boundary detector for speech recognition equipment |
| CA1056504A (en) * | 1975-04-02 | 1979-06-12 | Visvaldis A. Vitols | Keyword detection in continuous speech using continuous asynchronous correlation |
| US4052568A (en) * | 1976-04-23 | 1977-10-04 | Communications Satellite Corporation | Digital voice switch |
| FR2451680A1 (fr) * | 1979-03-12 | 1980-10-10 | Soumagne Joel | Discriminateur parole/silence pour interpolation de la parole |
| US4262355A (en) * | 1979-05-11 | 1981-04-14 | Rca Corporation | System for limiting intermodulation distortion of talkspurt signals |
| US4292470A (en) * | 1979-09-10 | 1981-09-29 | Interstate Electronics Corp. | Audio signal recognition computer |
| JPS56126896A (en) * | 1980-03-10 | 1981-10-05 | Nippon Electric Co | Voice recognizing system |
| US4352957A (en) * | 1980-03-17 | 1982-10-05 | Storage Technology Corporation | Speech detector circuit with associated gain control for a tasi system |
| JPS56159400U (da) * | 1980-04-24 | 1981-11-27 | ||
| JPS57177197A (en) * | 1981-04-24 | 1982-10-30 | Hitachi Ltd | Pick-up system for sound section |
| JPS57178299A (en) * | 1981-04-27 | 1982-11-02 | Kyosan Electric Mfg | Recognition pattern preparation system |
| US4410763A (en) * | 1981-06-09 | 1983-10-18 | Northern Telecom Limited | Speech detector |
| US4489434A (en) * | 1981-10-05 | 1984-12-18 | Exxon Corporation | Speech recognition method and apparatus |
| JPS5984300A (ja) * | 1982-11-08 | 1984-05-15 | 株式会社日立製作所 | 音声区間検出回路 |
| JPS59111697A (ja) * | 1982-12-17 | 1984-06-27 | 株式会社日立製作所 | 音声認識方式 |
| US4627091A (en) * | 1983-04-01 | 1986-12-02 | Rca Corporation | Low-energy-content voice detection apparatus |
| JPS6063600A (ja) * | 1983-08-26 | 1985-04-11 | 日本電気株式会社 | 可変閾値型音声検出器 |
| US4696040A (en) * | 1983-10-13 | 1987-09-22 | Texas Instruments Incorporated | Speech analysis/synthesis system with energy normalization and silence suppression |
| JPS6085628A (ja) * | 1983-10-15 | 1985-05-15 | Fujitsu Ten Ltd | 通信装置 |
| JPS60254100A (ja) * | 1984-05-30 | 1985-12-14 | 沖電気工業株式会社 | 音声認識方式 |
| JPS6195398A (ja) * | 1984-10-17 | 1986-05-14 | 株式会社東芝 | 音声認識装置 |
| JPS61113100A (ja) * | 1984-11-08 | 1986-05-30 | ヤマハ株式会社 | 音声パラメ−タ検出装置 |
| US4821325A (en) * | 1984-11-08 | 1989-04-11 | American Telephone And Telegraph Company, At&T Bell Laboratories | Endpoint detector |
| FR2576472B1 (fr) * | 1985-01-22 | 1988-02-12 | Alcatel Thomson Faisceaux | Procede et dispositif de commande automatique de gain d'un recepteur en acces multiple a repartition temporelle |
| JPH0673079B2 (ja) * | 1985-03-29 | 1994-09-14 | 沖電気工業株式会社 | 音声区間検出回路 |
| JPH06105394B2 (ja) * | 1986-03-19 | 1994-12-21 | 株式会社東芝 | 音声認識方式 |
-
1986
- 1986-06-02 GB GB868613327A patent/GB8613327D0/en active Pending
-
1987
- 1987-05-29 JP JP62503341A patent/JP2561850B2/ja not_active Expired - Lifetime
- 1987-05-29 DE DE3750314T patent/DE3750314T2/de not_active Expired - Fee Related
- 1987-05-29 EP EP93203407A patent/EP0750291B1/en not_active Expired - Lifetime
- 1987-05-29 DE DE3752288T patent/DE3752288T2/de not_active Expired - Fee Related
- 1987-05-29 KR KR1019880700114A patent/KR950011963B1/ko not_active Expired - Fee Related
- 1987-05-29 EP EP87304793A patent/EP0248609B1/en not_active Expired - Lifetime
- 1987-05-29 ES ES87304793T patent/ES2056819T3/es not_active Expired - Lifetime
- 1987-05-29 AT AT87304793T patent/ATE109582T1/de active
- 1987-05-29 AT AT93203407T patent/ATE183009T1/de not_active IP Right Cessation
- 1987-05-29 WO PCT/GB1987/000376 patent/WO1987007750A1/en not_active Ceased
- 1987-06-01 CA CA000538514A patent/CA1310418C/en not_active Expired - Lifetime
- 1987-06-01 US US07/055,966 patent/US4912766A/en not_active Expired - Lifetime
- 1987-06-02 FI FI872450A patent/FI92113C/fi not_active IP Right Cessation
- 1987-06-02 DK DK282587A patent/DK171426B1/da not_active IP Right Cessation
-
1993
- 1993-01-11 JP JP5019720A patent/JP2654503B2/ja not_active Expired - Fee Related
-
1996
- 1996-07-25 HK HK137096A patent/HK137096A/en not_active IP Right Cessation
-
1997
- 1997-01-30 JP JP9032774A patent/JPH09325790A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4072598A (en) * | 1975-11-12 | 1978-02-07 | Struers K/S | Electrolytic polishing apparatus |
Also Published As
| Publication number | Publication date |
|---|---|
| DE3752288T2 (de) | 2000-07-06 |
| DE3750314D1 (de) | 1994-09-08 |
| EP0248609A1 (en) | 1987-12-09 |
| DE3750314T2 (de) | 1994-11-17 |
| JP2561850B2 (ja) | 1996-12-11 |
| WO1987007750A1 (en) | 1987-12-17 |
| KR950011963B1 (ko) | 1995-10-12 |
| FI872450L (fi) | 1987-12-03 |
| CA1310418C (en) | 1992-11-17 |
| KR880701435A (ko) | 1988-07-27 |
| ATE109582T1 (de) | 1994-08-15 |
| JPH09325790A (ja) | 1997-12-16 |
| GB8613327D0 (en) | 1986-07-09 |
| FI92113B (fi) | 1994-06-15 |
| EP0248609B1 (en) | 1994-08-03 |
| JPH0677894A (ja) | 1994-03-18 |
| HK137096A (en) | 1996-08-02 |
| ES2056819T3 (es) | 1994-10-16 |
| DE3752288D1 (de) | 1999-09-09 |
| DK282587A (da) | 1987-12-03 |
| JP2654503B2 (ja) | 1997-09-17 |
| JPS63503487A (ja) | 1988-12-15 |
| DK282587D0 (da) | 1987-06-02 |
| ATE183009T1 (de) | 1999-08-15 |
| US4912766A (en) | 1990-03-27 |
| FI872450A0 (fi) | 1987-06-02 |
| EP0750291B1 (en) | 1999-08-04 |
| EP0750291A1 (en) | 1996-12-27 |
| FI92113C (fi) | 1994-09-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DK171426B1 (da) | Taleprocessor og anvendelse af en taleprocessor i en mobilradioterminal samt fremgangsmåde til signalbehandling af tale | |
| US5054085A (en) | Preprocessing system for speech recognition | |
| US6314396B1 (en) | Automatic gain control in a speech recognition system | |
| US4597098A (en) | Speech recognition system in a variable noise environment | |
| US4455676A (en) | Speech processing system including an amplitude level control circuit for digital processing | |
| EP0077574A1 (en) | Speech recognition system for an automotive vehicle | |
| EP0780828B1 (en) | Method and system for performing speech recognition | |
| EP0248593A1 (en) | Preprocessing system for speech recognition | |
| US4833711A (en) | Speech recognition system with generation of logarithmic values of feature parameters | |
| JPH05265484A (ja) | 閾値可変型音声認識装置 | |
| EP0143161A1 (en) | Apparatus for automatic speech activity detection | |
| JP2966452B2 (ja) | 音声認識装置の雑音除去システム | |
| JPH0646359B2 (ja) | 単語音声認識装置 | |
| JPH07121196A (ja) | 音声分析装置 | |
| KR920001430A (ko) | 음성 데이타 시종점 검출 방법 및 그 장치 | |
| JPH04369697A (ja) | 音声認識装置 | |
| JPH09297596A (ja) | 音声認識装置 | |
| JPS6147439B2 (da) | ||
| JPH0731506B2 (ja) | 音声認識方法 | |
| JPS60260096A (ja) | 音声認識装置 | |
| JPH09204194A (ja) | 音声認識装置 | |
| MXPA96006483A (es) | Metodo y sistema para realizar reconocimiento de habla | |
| JPS6255798B2 (da) | ||
| JPH02134700A (ja) | 音声認識装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| B1 | Patent granted (law 1993) | ||
| PBP | Patent lapsed |