CA1312357C - Procede et dispositif de detection de signaux vocaux - Google Patents
Procede et dispositif de detection de signaux vocauxInfo
- Publication number
- CA1312357C CA1312357C CA000598632A CA598632A CA1312357C CA 1312357 C CA1312357 C CA 1312357C CA 000598632 A CA000598632 A CA 000598632A CA 598632 A CA598632 A CA 598632A CA 1312357 C CA1312357 C CA 1312357C
- Authority
- CA
- Canada
- Prior art keywords
- signal
- energy
- maximum
- filtered
- digital signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000007774 longterm Effects 0.000 claims abstract description 12
- 230000001755 vocal effect Effects 0.000 claims abstract description 6
- 238000004364 calculation method Methods 0.000 claims description 12
- 230000003044 adaptive effect Effects 0.000 claims description 2
- 238000005259 measurement Methods 0.000 claims 1
- 238000001914 filtration Methods 0.000 abstract 1
- 238000005070 sampling Methods 0.000 abstract 1
- 230000008569 process Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 6
- 239000000654 additive Substances 0.000 description 3
- 230000000996 additive effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000001154 acute effect Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- VIKNJXKGJWUCNN-XGXHKTLJSA-N norethisterone Chemical compound O=C1CC[C@@H]2[C@H]3CC[C@](C)([C@](CC4)(O)C#C)[C@@H]4[C@@H]3CCC2=C1 VIKNJXKGJWUCNN-XGXHKTLJSA-N 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Noise Elimination (AREA)
- Complex Calculations (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
- Selective Calling Equipment (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Analogue/Digital Conversion (AREA)
- Auxiliary Devices For Music (AREA)
Abstract
Procédé et dispositif de détection de signaux vocaux. Le procédé consiste: à découper le signal en trame, à échantillonner chaque trame pour obtenir un signal numérique comportant un nombre n déterminés d'échantillons, à préaccentuer (1) le signal numérique, à filtrer (2) le signal numérique préaccentué au moyen d'un filtre numérique passe haut pour obtenir un signal numérique filtré, à mesurer (3, 4) dans chaque trame l'énergie maximale du signal préaccentué et l'énergie maximale du signal numérique filtré, pour effectuer (5) un rapport d'énergie R entre l'énergie maximale du signal numérique filtré et l'énergie maximale du signal numérique préaccentué. Il consiste également à calculer entre deux bornes les valeurs moyennes à long terme de la valeur maximale de l'énergie du signal filtré et du rapport d'énergie, et à calculer à partir des valeurs moyennes à long terme quatre valeurs de seuil, deux maximales constituant respectivement deux bornes inférieures de l'état parole pour le signal filtré et le rapport d'énergie, et deux minimales constituant respectivement deux bornes supérieures de l'état bruit pour le signal filtré et le rapport d'énergie, pour comparer à ces valeurs de seuil l'énergie du signal filtré maximale et le rapport d'énergie, pour décider de la présence du signal vocal dans le signal bruité lorsque l'énergie maximale du signal numérique filtré ou le rapport d'énergie sont supérieurs respectivement à leurs valeurs maximale de seuil. Applications: transmissions numériques de la parole. FIGURE 1
Description
~ 3 ~23 ~rl Proc~d~ et ~dl~positlf de déteetlon d~ ~Igoawc vocawc.
L~ presente Invent~on concerne un procédé et un dlspo-sltlf de détectlon de slgnaux voc~ux utlllcnbles notamment dans les transmlssion~ rsdloélectrlque~ ù l'alternat à bord de vehicu-les .
L~ plupart de~ détecteurs d'actlvlté vocale connus ne peuvent fonctlonner correctement que pour des rapports signal à
brult sufflsamment elevé~, de l'ordre de 20 dB au mlnimum, ce qul correspond à des condltlon~ de fonctlonnement dans des envlronnements calme~ de type bureau.
A bord d'un véhlcule, la dlscrlmlnatlon paroleJbrult doit tenlr compte en rQvsnche d'un rapport slgnal à brult beau-coup plus falble, le plus souvent inférleur à 10 dB. Dans certal-nes condltlons (réglme moteur élevé dans un véhlcule moyenne-ment lnsonorlsé, par exemple) le nlveau de brult peut même dé-passer CQlUl du slgnal.
Enfln, le nlveau et le type de brult à dlscrlmlner va-rlent selon les condltion~ InhérenteY au véhlcule (degré d'lnso-norlsatlon par exemple) mals aussl en fonctlon du parcours effec-tué, un cas partlcullèrement défavorable étsnt celul du parcours urbaln où les brults à prendre en compte sont genéralement d'un nlveau élevé, non statlonnalre et naturellement très varlé.
Un exemple de réalisatlon d'un détecteur d'actlvlté vo-cale prévu pour fon,ctlonner dans des mllleux bruysnts est connu de la demande de brevet français publiée sous le no. 2466825 au nom de la demanderesse. Mals ce détecteur ne permet d'optl-mlser la dlscrlmlnatlon parole/brult que pour leY sons volses et la déclslon est prlse en comparant le Ylgnal vocal Yeulement une tenslon de seuil varlable a~servle sur la valeur de l'ampll-tude crête du slgnal vocal, sanY tenlr compte du nlveau réel de brult. Il en résulte des performances Insufflsantes pour permet-tre un fonctlonnement correct dans un mllleu fortement perturbé
et où le slgnal de parole est noyé dans le brult.
. h ~
q~
13123~7 1~ but de l'lnvention est de pallier les inconvénisnts précltés .
A cet effet, l'invention a pour obJet, un procédé de détection d'un signal vocal dans un signal noyé dans du bruit, caractérisé en ce qu'il consiste:
- à découper le signal en trame, - à échantillonner chaque trame pour obtenir un signal numérique comportant un nombre n déterminés d'échantillons, - à préaccentuer le signal numérique pour obtenir un 10 signal numérique préaccentué, - à filtrer le signal numerique préaccentué au moyen d'un filtre numérique passe haut pour obtenir un signal numéri-que filtré, - à mesurer dans chaque trame l'énergie maximale des 15 échantillons du signal préaccentué et l'énergie maximale des échantillons du signal numérique filtré~
- à effectuer un rapport d'énergie entre l'energie maximale des échantillons du signal numérique filtré et l'éner-gie maximale des échantillons du signal numérique préaccentué, - à calculer entre deux bornes les valeurs moyennes à
long terme de l'énergie des échantillons du signal filtré et du rapport d'énergie, - à calculer à partir des valeurs moyennes à long terme quatre valeurs de seuil, deux maximales constituant respec-25 tivement deux bornes inférieures de l'état parole pour le signal filtré et le rapport d'énergie, et deux minimales constituant respectivement deux bornes supérieures de l'état bruit pour le signal filtré et le rapport d'énergie, pour comparer à ces va-leurs de seuil, l'énergie maximale du signal filtré et le rap-30 port d'énergie, - à décider de la présence du signal vocal dans le signal bruité lorsque l'énergie maximale du signal numérique filtré, ou le rapport d'énergie sont supérieurs respectivement ~L
leurs valeurs maximales de seuil 1312~7 - et à clécider de l'absence d'un signal vocEIl dans le signal bruité lorsque l'énergie rnaximale du signal numérlque filtré ou le rapport d'ellergie R sont inférieurs respectivement A leurs valeurs minirrlales de seuil.
L'inventlon a également pour objet un dispositif pour la mise en oeuvre du procédé précité.
D'autres caractéristiques et avantages de l'invention apparaîtront ci-après à l'aide de la description faite en regard l O des dessins annexés qui représentent :
Les figures 1 à 4 des organigrammes figurant les diffé-rentes étapes du procédé mis en oeuvre par l'invention.
La figure 5 un dispositlf de calcul du rapport d'éner-gie mettant en oeuvre les étapes 1 à 5 du procédé selon l'inven-tion .
l 5 La figure 6 un mode de réalisation d'un dispositif pour le calcul de la valeur de l'échantillon ayant le maximumd'énergie dans une trame de signal filtré ou du signal préaccentué de la figure 5.
La figure 7 un mode de réalisation d'un dispositif 20 pour la mise en oeuvre des étapes 6 à 11 de la figure 1.
Les figures 8A et 8B deux diagrammes représentant les procédés de détermination des seuils figurés aux étapes 12 à 22 de la figure 2.
La figure 9 un mode de réallsation du dlspositif d0 ~5 calcul des valeurs moyennes X ou R illustrées aux eta-moy moy pes 23 à 28 de la figure 3.
Les figures 10A et lOB deux clrcults pour le calcul des valeurs de seuil selon l'lnvention.
I,es flgures llA et 11B deux dlagrammes pour illustrer 30 le mode de comparalson par seuils adaptatifs selon l'invention.
La figure 12 un mode de réalisation d'un dispositif de comparaison pour la mise en oeuvre des étapes 30 à 40 de la figure 4.
3 ~ 7 :t,a figure 13 un diagramrlle d1étnt figurant l'algorithme de clécision permettant de définir la présence O~l non d'un signnl vocal dans le slgnal bruit~.
Le procédé selon l'invention qui est illustré aux figures 1 à 4, dans un exemple de mise en oeuvre pratis~ue, opère sur des trames de signal bruité d'environ 20 millisecondes et échantillonnées à raison de 160 échantillons par trame pour donner des échantillons de signal S. Comme représenté aux éta-pes l à 5 de la figure 1, le signal numérique S sur lequel à
l 0 lieu le traitement est d'abord préaccentué à l'étape 1 pour donner des échantillons de signal Sn, puis filtré à l'étape 2 pour donner des échantiUons de signal Sph(n) par un filtre numérique passe haut de fréquence de coupure FC = 1200 lIz.
Aux étapes 3 et 4 les paramètres suivants:
l 5 X = ~max (Sn) }, et Xph = max ~ Sph(n) }, sont calculés; n étant compris entre 1 et 160. Ces calculs consistent à rechercher dans chaque suite d'échantillons S(n) et Sph(n) l'échantiUon qui a l'amplitude ou l'énergie maximale I.'étape 5 consiste à calculer le rapport R = Xph/X
entre les deux paramètres X h et X calculés aux étapes 3 et 4.
Les étapes 6 à 11 qui suivent consistent à calculer des paramètres X1 et R1 suivant les relations - X1 = Xph si Xph est supérieur au paramètre X1 calculé à la trame précédente et designé par X1Old sur la figure 1;
- ou X1 = TX.xlold + (1-TX.Xph) dan~ le cas contraire;
- R1 = R si R est supérleur au rapport R calculé à
la trame précédente et désigné par Rold sur la ~igure 1;
ou R1 Tr- Rlold~ (1~Tr) ~ R dans le cas con-traire. Ceci permet d'une trame à la suivante d'autoriser une croissance instantanée des valeurs des paramètres X1 et R1 alors que leurs décroissances s'effectuent plus lentement avec des constantes de temps respectivement égales à TX et Tr. Se-13123~7 lon un mode préféré de rcallsat~on de l'lnvention la valeur des constantes de temps est fixée a 0, 75 ce qui correspond à envl-ron 70 milli~econdes. Les étapes l2 à 29 suivantes qui sont illustrées aux figures 2 et 3, consistent à determiner quatre 5 seuUs de detection à partir de la valeur moyenne h long terme des paramètres Xph et R. Ces derniers sont tout d'abord bor-nés à l'étape 12 entre des valeurs maximales et minimales 0t constantes de manière à prohiber de trop grandes variations des seuils. Les bornes de variation de Xph et R sont notées l ~ Xphinf, Sphsup, R. inf, R. sup . Les étapes 13 ~ 22 consis-tent à calculer deux paramètres X2 et R2 vérifiant les rela-tions X2 = MAX ~ MIN ~ Xph, Xph . sup }, Xph . inf }
R2 = ~vIAX { MIN ~ R, R . sup ~, R . inf }
l 5 Les moyennes à long terme des paramètres Xph et R notés respectivement Xmoy et Rmoy sont calculées aux étapes 23 à
28 en application des relations suivantes:
Xmoy Tm Xmoy old + (l~Tm)-X2, si X2 est supé-rieur au paramètre Xn,oy calculé à la trame précédente et dési-20 gné par Xmoy old sur la figure 3;
- ou Xmoy Td Xmoy old + (1-Td).X2 dans le cas contraire .
Rmoy Tm Rmoy.Old + ~1~Tm)R2, si R2 est supé-rieur au paramètre Rmoy calculé à la trame précédente et dési-25 gné par Rmoy old sur la figure 3;
- ou Rmoy Td Rmoy old + ( l-Td) ~ R2 dans le cas contraire .
Dnns ces relation~ la constante de temps de montée Tm assure une montée exponentiellement lente, alors que la 30 constante de tamps de descente Td permet une descente exponen-tiellement raplde afln que la valeur moyenne considérée retombe rapldement à un nlveau correspondant au brult. Les valeurs de ces constantes de temps sont dans le mode de réalisatlon préféré
de l'lnvention fixées à 0,95 pour la montée, soit environ 400 35 millisecondes et à 0, 2 pour la descente, soit environ 1312~7 13 mi11isecondes. Enfin 1es quatre vnleurs de seul1s sont calcu-los à l'étape 29 à partlr dus valeur~ X moy et R moy définies precédumment par les relatlons:
SX1 parole = a . Xmoy l Xph . in SXl bruit = b . Xmoy ~ Xph . inf S~1 parole = a . Rmoy + R . inf SRl bruit = b . R moy ~ R. inf Les valeurs des coefficients multiplicateurs a et b sont dans l'exemple de réalisation préféré de l'invention fixées 10 à 1,8 et 1,25. Il faut noter que par ailleurs, si l'un des para-mètres Xph ou R est in~érieur à la borne inférieure corres-pondante, la décision bruit est prise automatiquement.
Un dispositif de calcul du rapport d'énergie mettant en oeuvre les étapes l à 5 du procédé est représenté à la figure 5. Ce dispositif comprend un premier filtre 43, passe haut, de fonction de transfert H(z) = l - 0,86 z 1, qui réalise une préaccentuation du signal représenté à l'étape l, ce filtre est couplé par sa sortie d'une part, à un deuxième filtre passe haut 44 ayant une fréquence de coupure d'environ 1200 Hz et 20 d'autre part, à un dispositif de calcul d'énergie 46. Le deuxième filtre passe haut 44 est également couplé par sa sortie à un dispositif de calcul d'énergie 45 similaire au dispositif de calcul d'énergie 46. Le filtre 44 et le dispositif de calcul d'énergie 45 fournissent le paramètre Xph en exécution des étapes 2 et 3 du procéde et le dispositif de calcul d'énergie 46 fourni le paramètre X. Les paramètres X et Xph sont appliqués respectivement sur une première entrée et une deuxième entrée d'opérande d'un circuit diviseur 47 pour réaliser le calcul du paramètre R conformément à l'étape 5.
Un mode de réalisation des dispositifs de calcul d'énergie 45 et 46 est représenté à la figure 6. Ce circuit comprend un circuit comparateur 48 couplé à un registre 49 au travers d'un circuit aiguilleur 50. Le circuit comparateur 48 possède deux entrées, une première entrée reQoit les échantil-lons de signal S (n) fourni par le filtre numérique 43 ou les ~3~23~7 écharltillons de signal fourr-l pAr le eiltre numérlq-ue 44; la deuxième e~ntl~ée est reliée A la sortle du registre 49. Le Cil'-cuit aiguiUeur 50 est commandé par la sortie du circuit compara-teur 48 et aiguille les échantillons de signal S(n) ou Sph à
5 l'entrée du registre 49 lorsque la valeur de l'échantillon de signal S(n) ou Sph(n) est supérieure au contenu du registre 49. Dans le cas contraire le registre 49 reste rebouclé sur lui-même .
IJn mode de réalisation du dispositif pour la mise en lO oeuvro des étapes 6 à 11 est représenté à la fi~ure 7. Ce dispo-sitif comprend un circuit comparateur 51 couplé à un circuit accumulateur 52 au travers d'un circuit aiguilleur 53. Un cir-cuit multiplicateur 54 est relié par une première entrée d'opérande à une première entrée du circuit comparateur 51 et l 5 reçoit sur sa deuxième entrée d'opérande les paramètres 1-Tx ou 1-Tr figurés aux étapes 8 et 11 du procédé. Un deuxième circuit multiplicateur 55 est relié par une première entrse d'opérande à la sortie du circuit accumulateur 52 et recoit sur une deuxième entrée d'opérande les paramètres TX ou Tr figurés aux étapes 8 et 11 du procédé. Les sorties des circuits multiplicateurs 54 et 55 sont reliées respectivement à une pre-mière entrée et une deuxième entrée d'opérande d'un circuit additionneur 56 dont la sortie est rellée à une première entrée du circuit aiguilieur 53. La sortie du circuit accumulateur 52 25 est d'autre part reliée à la deuxième entrée d'operande du cir-cuit comparateur 51. Conformément aux étapes 6 à 11, les para-mètres Xph ou R sont appliqués sur la première entrée du circuit comparateur 51 et sont comparés aux contenl1s X . old ou R . old du circuit accumulateur 52. Si conformément à l'étape 6 ou 30 à l'étape 9 les paramètres Xph ou R sont supérieurs au conte-nu X . old ou R . old du circuit accumulateur 52, le circuit aiguil-leur 53 met à jour le contenu de l'accumuiateur 52 par l'un des paramètres X h ou R conformément aux étapes 7 et 10. Dans le cas contraire le circuit aiguilleur 53 commute la sortie du 35 circuit additionneur 56 à l'entree du circuit accumulateur 52, 13123~7 pour mettre à ~our le contenu de l'accurnulateur par les paramè-tres X1 ou Rl cléfinls par les relations décrltes précédemrnent des étapes 8 et l1. Dans ces relatlons le prodult (1 - rx) x Xph ou le produit (1-Tr) x R 90nt effectués 5 par le circuit multiplicateur 64 et les produits TX x X. old ou TR par ~ old sont effectués par le circuit multiplicateur 55.
La somme des prodults obtenus est réalisée par le circuit addi-tionneur 56.
Les étapes 12 à 22 du procédé représenté à la figure 2 lO son~ exécutées à l'aide d'amplificateurs à seuil non représentés dont les caractéristiques qui sont par contre représentées aux figure 8A et 8B, permettent de ne pas prendre en compte les valeurs trop élevées des paramètres X1 ou R1. D'après ces caractérlstlques chaque paramètre X1 ou R1 est limité entre 5 deux valeùrs X1ph . inf et X1ph sup ou :E~ 1 . inf et R1 . sup .
Ces caractérlstiques permettent de générer les paramètres X2 et R2 suivant des lois llnéaires des parsmètres X1 et R1 entre les valeurs de seuil Xlph . inf et Xlph . sup ou Rl . inf ~ et R1. sup, les paramètres X2 et R2 étant limités en ampli-20 tude pour les valeurs des paramètres X1 et R1 extérieures à
ces seuils.
Un mode de réalisation d'un dlspositif de calcul des valeurs moyennes XM ou RM illustré par les étapes 23 à 28 du procédé est représenté à la flgure 9 Ce dispositif comprend, 25 relies dans cet ordre en sérle, un circuit soustracteur 57, un circuit multipllcateur 58, un clrcuit additionneur 59 et un reglstre 60. Le circuit soustracteur 57 comprend une premier entrée d'opérande sur laquelle sont appllqués les paramètres X2 ou R2 et une deuxième entrée d'opérande qui est reliée à
30 la sortie du reglstre 60. Le dispositif comprend également un circuit comparateur 61 à deux entrées reliées respectivement aux entrées du circuit soustracteur 57. La sortie du circuit compara-teur 61 est reliée à une entrée de commande d'un circuit aiguii-leur 62. Le circuit aiguilleur 62 possède deux entrées sur les-35 quelles sont appliquées les constantes de temps Tm et Td.
13123~7 La sortie du circuit aigllilleur 62 est reliée à une premièreentrée d'opérande du circuit multiplicateur 58, la deuxlème entree d'opérande du clrcuit multlpllcateur 58 étant reliée à la sortie du circuit soustracteur 57. La sortie du circuit multipli-5 cateur 5~ est d'autre part reliée à une première entréed'opérande du circuit additlonneur 59, la deuxième entrée d'opérande du circuit additionneur 59, étant reliée à la pre-mlère entrée d'opérande du circuit soustracteur 57. Ce disposi-tif permet d'effectuer les opérations du procédé représenté aux 10 étapes 23 à 28. Conformérnent à l'étape 23 ou à l'étape 26, les paramètres X2 ou R2 sont appliqués sur la première entrée de comparaison du circuit comparateur 61 pour être comparés au contenu Xmoy . old du registre 60, et si leur valeur respective est supérieure au contenu du registre 60, le circuit comparateur l 5 61 commande le circuit aiguilleur 62 pour appliquer la constante de temps Tm sur la première entrée d'opérande du circuit multiplicateur 58. Le circuit multiplicateur 58 recoit sur sa deuxième entrée d'opérande le résultat de la soustraction effec-tuée entre le contenu Xmoy . old du registre 60 et les valeurs 20 des paramètres X2 ou R2 appliquées sur sa première entrée d'opérande. Les résultats des multiplications T (X - X ) ou T (R -R ) effectuées m moy . old 2 m moy. old 2 par le circuit multiplicateur 58 sont appliqués sur la première entrée d'opérande du circuit additlonneur 59 pour être addition-25 nés aux paramètres X2 ou R2 appliqués sur sa deuxièmeentrée d'opérande. Le résultat de l'addition effectuée par le circuit addltionneur 69 est alors transfére à l'intérieur du registre 60. Cependant, si aux étapes 23 ou 26 les valeurs des paramètres X2 ou R2 ne sont pas supérieures aux valeurs 30 X ou R trouvées dans le registre 60, le cir-moy . old moy . old cuit aiguiUeur 62 est commandé par le circuit comparateur 61 pour appliquer sur la première entrée d'opérande du circuit multiplicateur 58 la valeur de la constante de temps Td. Dans ces conditions, les calculs sont menés de fac,on similaire ~. la 35 description précédente, la valeur de la constante de temps Tm ~3123~7 etant rernplacéQ par la valeur de IA constante de temps Td conformément aux relations indlquées aux étapes 25 et 28 du procéde .
Les calculs des valeurs de seuil de parole ou de bruit 5 ~SX1 "parole" et SX1 "bruit", SR1 "parole", et SR1 "bruit" ) conformément aux relations établies à l'étape 29 du procédé sont effectuées par les circuits décrits aux figures lOA
et 10B. Les seuils SX1 "parole" ou SR1 "parole" sont calcu-lés au moyen d'un circuit multiplicateur 63 relié à un circui$
l O additionneur 64 . Le circuit multiplicateur 63 reçoit sur une première entrée d'opérande les paramètres X ou R
moy moy fournis par le registre 60 de la figure 9 et il possède une deuxième entrée d'opérande sur laquelle est appliqué le paramè-tre a. Le résultat de la multlplication est appliqué sur une l 5 première entrée d'opérande du circuit additionneur 64 pour être additionne au seuil SpH . inP qui est appliqué sur sa deuxième entrée d'opérande. La sortie du circuit additionneur 64 fournit le seuil SX1 "parole" ou SR1 "parole".
De manière similaire, les seu~ls SXl "bruit" et/ou 20 SR1 "bruit" sont calculés au moyen du circuit multiplicateur 65 et du circuit additionneur 66. La première entrée d'opérande du circuit multiplieur 65 reçolt les paramètres X ou R
moy moy fournis par le registre 60 de la flgure 9, U possède une deuxième entrée d'opérande sur laquelle est appliqué le paramè-25 tre b. Sa sortie est rellée à une première entrée d'opérande ducircuit additionneur 66 dont la deuxième entrée d'opérande re-~oit la valeur du paramètre de seuil Xph . inf . La sortie du circuit additlonneur 66 délivre la valeur de seuil SX1 "bruit"
et SR1 "bruit". Ces valeurs de seuil permettent de comparer 30 les paramètres X1 et R1 conformément aux étapes 30 à 40 du procédé et selon les diagrammes représentés aux figures 11A et 11B. Un dispositif de comparaison correspondant est représenté
à la figure 12. Ce circuit comprend un ensemble de quatre cir-cuits comparateurs référencés de 67 à 7~ couplés respectivement 35 à quatre entrées d'un discriminateur de parole/bruit 71. Le circuit comparateur fi7 compare le paramètre X1 au .seuil de parole SXI "parole", le comparnteur 68 compare le paramètre X1 au seuil SX1 "bruit", le comparateur 69 compare le para-mètre R1 au seuil SR1 "parole" et le comparateur 70 compare le 5 paramètre Rl ~u seuil SRl "bruit". Le discriminateur pa-role/bruit 71 élabore un signal d'activité vocale DAV conformé-ment au diagramme d'état qui est représenté à la figure 13. Ce dlagramme d'état possède deux états stables DAVO et DAV1 et des états instables figurés par les lettres L1 à L4. L'état 10 stable DAV0 est l'état "bruit" dans lequel se trouve le détec-teur d'activité vocale en l'absence de signal de parole, etl'état stable DAV1 est l'état dans lequel se trouve le détecteur d'activité locale lorsque le signal qui est appliqué à son en-trée comprend un signal de parole. Lorsque le détecteur est l 5 dans l'état "bruit" DAVO il ne passe à l'état parole DAV1 que si l'un des deux paramètres X1 et R1 est supérieur au seuil de parole correspondant SX1 "parole" ou SR1 "parole" en transi-tant par l'état instable L1. Sinon la décision bruit est mainte-nue, c'est-à-dire si le paramètre X1 est inférieur au seuil 20 SX1 "parole" et que le paramètre R1 est inférieur au paramè-tre SR1 "parole".
Par contre, lorsque le détecteur d'activité vocale est dans l'état parole DAV1 il ne passe à l'état bruit DAVO que si l'un des deux paramètres X1 et R1 est inférieur au seuil de 25 bruit correspondant c'est-à-dIre si X1 est In~érieur au seuU
SX1 bruit et R1 inférieur à SR1 bruit. Dans ces conditions il transite par l'état instable L2. Cet algorithme des change-ments d'états du signal DAV est figuré aux étapes 30 à 39 de la figure 4. Après chaque changement d'état du slgnal DAV, 30 et après une phase d'initialisation représentée à l'étape 40 le procédé retourne exécuter l'étape 6 de la figure 1.
Cependant, comme ceci est représenté aux étapes 41 et 42 du diagramme de la figure 4, le passage à l'état bruit DAVO
n'est effectif qu'au bout d'un certain temps, calculé par un 35 compteur de temporisation, noté "Hang", non représente qui est chargé à une valeur de compte maximale aux étapes 35 et 39 chaque fols qu'un état "parole" DAV1 est décldé, et dont le contenu est dlminué de une unité à chaque fois que la déclsion DAVO a lieu à l'étape 36. Ceci permet d'éviter des passages 5 systématiques à l'état bruit dans les trous de parole du locu-teur ou de couper la fin d'un mot si elle est de faible ~nergie.
Il est bien évident que l'exemple de mise en oeuvre du procédé selon l'invention n'est pas limité au dispositif qui vient d'être décrit et qu'il peut tout aussi bien être mis en l O oeuvre au moyen d'une structure comprenant des moyens de calcul microprogrammés, enregistrés par exemple dans les mémoi-res mortes ou de données d'un microprocesseur de traitement du signal .
L~ presente Invent~on concerne un procédé et un dlspo-sltlf de détectlon de slgnaux voc~ux utlllcnbles notamment dans les transmlssion~ rsdloélectrlque~ ù l'alternat à bord de vehicu-les .
L~ plupart de~ détecteurs d'actlvlté vocale connus ne peuvent fonctlonner correctement que pour des rapports signal à
brult sufflsamment elevé~, de l'ordre de 20 dB au mlnimum, ce qul correspond à des condltlon~ de fonctlonnement dans des envlronnements calme~ de type bureau.
A bord d'un véhlcule, la dlscrlmlnatlon paroleJbrult doit tenlr compte en rQvsnche d'un rapport slgnal à brult beau-coup plus falble, le plus souvent inférleur à 10 dB. Dans certal-nes condltlons (réglme moteur élevé dans un véhlcule moyenne-ment lnsonorlsé, par exemple) le nlveau de brult peut même dé-passer CQlUl du slgnal.
Enfln, le nlveau et le type de brult à dlscrlmlner va-rlent selon les condltion~ InhérenteY au véhlcule (degré d'lnso-norlsatlon par exemple) mals aussl en fonctlon du parcours effec-tué, un cas partlcullèrement défavorable étsnt celul du parcours urbaln où les brults à prendre en compte sont genéralement d'un nlveau élevé, non statlonnalre et naturellement très varlé.
Un exemple de réalisatlon d'un détecteur d'actlvlté vo-cale prévu pour fon,ctlonner dans des mllleux bruysnts est connu de la demande de brevet français publiée sous le no. 2466825 au nom de la demanderesse. Mals ce détecteur ne permet d'optl-mlser la dlscrlmlnatlon parole/brult que pour leY sons volses et la déclslon est prlse en comparant le Ylgnal vocal Yeulement une tenslon de seuil varlable a~servle sur la valeur de l'ampll-tude crête du slgnal vocal, sanY tenlr compte du nlveau réel de brult. Il en résulte des performances Insufflsantes pour permet-tre un fonctlonnement correct dans un mllleu fortement perturbé
et où le slgnal de parole est noyé dans le brult.
. h ~
q~
13123~7 1~ but de l'lnvention est de pallier les inconvénisnts précltés .
A cet effet, l'invention a pour obJet, un procédé de détection d'un signal vocal dans un signal noyé dans du bruit, caractérisé en ce qu'il consiste:
- à découper le signal en trame, - à échantillonner chaque trame pour obtenir un signal numérique comportant un nombre n déterminés d'échantillons, - à préaccentuer le signal numérique pour obtenir un 10 signal numérique préaccentué, - à filtrer le signal numerique préaccentué au moyen d'un filtre numérique passe haut pour obtenir un signal numéri-que filtré, - à mesurer dans chaque trame l'énergie maximale des 15 échantillons du signal préaccentué et l'énergie maximale des échantillons du signal numérique filtré~
- à effectuer un rapport d'énergie entre l'energie maximale des échantillons du signal numérique filtré et l'éner-gie maximale des échantillons du signal numérique préaccentué, - à calculer entre deux bornes les valeurs moyennes à
long terme de l'énergie des échantillons du signal filtré et du rapport d'énergie, - à calculer à partir des valeurs moyennes à long terme quatre valeurs de seuil, deux maximales constituant respec-25 tivement deux bornes inférieures de l'état parole pour le signal filtré et le rapport d'énergie, et deux minimales constituant respectivement deux bornes supérieures de l'état bruit pour le signal filtré et le rapport d'énergie, pour comparer à ces va-leurs de seuil, l'énergie maximale du signal filtré et le rap-30 port d'énergie, - à décider de la présence du signal vocal dans le signal bruité lorsque l'énergie maximale du signal numérique filtré, ou le rapport d'énergie sont supérieurs respectivement ~L
leurs valeurs maximales de seuil 1312~7 - et à clécider de l'absence d'un signal vocEIl dans le signal bruité lorsque l'énergie rnaximale du signal numérlque filtré ou le rapport d'ellergie R sont inférieurs respectivement A leurs valeurs minirrlales de seuil.
L'inventlon a également pour objet un dispositif pour la mise en oeuvre du procédé précité.
D'autres caractéristiques et avantages de l'invention apparaîtront ci-après à l'aide de la description faite en regard l O des dessins annexés qui représentent :
Les figures 1 à 4 des organigrammes figurant les diffé-rentes étapes du procédé mis en oeuvre par l'invention.
La figure 5 un dispositlf de calcul du rapport d'éner-gie mettant en oeuvre les étapes 1 à 5 du procédé selon l'inven-tion .
l 5 La figure 6 un mode de réalisation d'un dispositif pour le calcul de la valeur de l'échantillon ayant le maximumd'énergie dans une trame de signal filtré ou du signal préaccentué de la figure 5.
La figure 7 un mode de réalisation d'un dispositif 20 pour la mise en oeuvre des étapes 6 à 11 de la figure 1.
Les figures 8A et 8B deux diagrammes représentant les procédés de détermination des seuils figurés aux étapes 12 à 22 de la figure 2.
La figure 9 un mode de réallsation du dlspositif d0 ~5 calcul des valeurs moyennes X ou R illustrées aux eta-moy moy pes 23 à 28 de la figure 3.
Les figures 10A et lOB deux clrcults pour le calcul des valeurs de seuil selon l'lnvention.
I,es flgures llA et 11B deux dlagrammes pour illustrer 30 le mode de comparalson par seuils adaptatifs selon l'invention.
La figure 12 un mode de réalisation d'un dispositif de comparaison pour la mise en oeuvre des étapes 30 à 40 de la figure 4.
3 ~ 7 :t,a figure 13 un diagramrlle d1étnt figurant l'algorithme de clécision permettant de définir la présence O~l non d'un signnl vocal dans le slgnal bruit~.
Le procédé selon l'invention qui est illustré aux figures 1 à 4, dans un exemple de mise en oeuvre pratis~ue, opère sur des trames de signal bruité d'environ 20 millisecondes et échantillonnées à raison de 160 échantillons par trame pour donner des échantillons de signal S. Comme représenté aux éta-pes l à 5 de la figure 1, le signal numérique S sur lequel à
l 0 lieu le traitement est d'abord préaccentué à l'étape 1 pour donner des échantillons de signal Sn, puis filtré à l'étape 2 pour donner des échantiUons de signal Sph(n) par un filtre numérique passe haut de fréquence de coupure FC = 1200 lIz.
Aux étapes 3 et 4 les paramètres suivants:
l 5 X = ~max (Sn) }, et Xph = max ~ Sph(n) }, sont calculés; n étant compris entre 1 et 160. Ces calculs consistent à rechercher dans chaque suite d'échantillons S(n) et Sph(n) l'échantiUon qui a l'amplitude ou l'énergie maximale I.'étape 5 consiste à calculer le rapport R = Xph/X
entre les deux paramètres X h et X calculés aux étapes 3 et 4.
Les étapes 6 à 11 qui suivent consistent à calculer des paramètres X1 et R1 suivant les relations - X1 = Xph si Xph est supérieur au paramètre X1 calculé à la trame précédente et designé par X1Old sur la figure 1;
- ou X1 = TX.xlold + (1-TX.Xph) dan~ le cas contraire;
- R1 = R si R est supérleur au rapport R calculé à
la trame précédente et désigné par Rold sur la ~igure 1;
ou R1 Tr- Rlold~ (1~Tr) ~ R dans le cas con-traire. Ceci permet d'une trame à la suivante d'autoriser une croissance instantanée des valeurs des paramètres X1 et R1 alors que leurs décroissances s'effectuent plus lentement avec des constantes de temps respectivement égales à TX et Tr. Se-13123~7 lon un mode préféré de rcallsat~on de l'lnvention la valeur des constantes de temps est fixée a 0, 75 ce qui correspond à envl-ron 70 milli~econdes. Les étapes l2 à 29 suivantes qui sont illustrées aux figures 2 et 3, consistent à determiner quatre 5 seuUs de detection à partir de la valeur moyenne h long terme des paramètres Xph et R. Ces derniers sont tout d'abord bor-nés à l'étape 12 entre des valeurs maximales et minimales 0t constantes de manière à prohiber de trop grandes variations des seuils. Les bornes de variation de Xph et R sont notées l ~ Xphinf, Sphsup, R. inf, R. sup . Les étapes 13 ~ 22 consis-tent à calculer deux paramètres X2 et R2 vérifiant les rela-tions X2 = MAX ~ MIN ~ Xph, Xph . sup }, Xph . inf }
R2 = ~vIAX { MIN ~ R, R . sup ~, R . inf }
l 5 Les moyennes à long terme des paramètres Xph et R notés respectivement Xmoy et Rmoy sont calculées aux étapes 23 à
28 en application des relations suivantes:
Xmoy Tm Xmoy old + (l~Tm)-X2, si X2 est supé-rieur au paramètre Xn,oy calculé à la trame précédente et dési-20 gné par Xmoy old sur la figure 3;
- ou Xmoy Td Xmoy old + (1-Td).X2 dans le cas contraire .
Rmoy Tm Rmoy.Old + ~1~Tm)R2, si R2 est supé-rieur au paramètre Rmoy calculé à la trame précédente et dési-25 gné par Rmoy old sur la figure 3;
- ou Rmoy Td Rmoy old + ( l-Td) ~ R2 dans le cas contraire .
Dnns ces relation~ la constante de temps de montée Tm assure une montée exponentiellement lente, alors que la 30 constante de tamps de descente Td permet une descente exponen-tiellement raplde afln que la valeur moyenne considérée retombe rapldement à un nlveau correspondant au brult. Les valeurs de ces constantes de temps sont dans le mode de réalisatlon préféré
de l'lnvention fixées à 0,95 pour la montée, soit environ 400 35 millisecondes et à 0, 2 pour la descente, soit environ 1312~7 13 mi11isecondes. Enfin 1es quatre vnleurs de seul1s sont calcu-los à l'étape 29 à partlr dus valeur~ X moy et R moy définies precédumment par les relatlons:
SX1 parole = a . Xmoy l Xph . in SXl bruit = b . Xmoy ~ Xph . inf S~1 parole = a . Rmoy + R . inf SRl bruit = b . R moy ~ R. inf Les valeurs des coefficients multiplicateurs a et b sont dans l'exemple de réalisation préféré de l'invention fixées 10 à 1,8 et 1,25. Il faut noter que par ailleurs, si l'un des para-mètres Xph ou R est in~érieur à la borne inférieure corres-pondante, la décision bruit est prise automatiquement.
Un dispositif de calcul du rapport d'énergie mettant en oeuvre les étapes l à 5 du procédé est représenté à la figure 5. Ce dispositif comprend un premier filtre 43, passe haut, de fonction de transfert H(z) = l - 0,86 z 1, qui réalise une préaccentuation du signal représenté à l'étape l, ce filtre est couplé par sa sortie d'une part, à un deuxième filtre passe haut 44 ayant une fréquence de coupure d'environ 1200 Hz et 20 d'autre part, à un dispositif de calcul d'énergie 46. Le deuxième filtre passe haut 44 est également couplé par sa sortie à un dispositif de calcul d'énergie 45 similaire au dispositif de calcul d'énergie 46. Le filtre 44 et le dispositif de calcul d'énergie 45 fournissent le paramètre Xph en exécution des étapes 2 et 3 du procéde et le dispositif de calcul d'énergie 46 fourni le paramètre X. Les paramètres X et Xph sont appliqués respectivement sur une première entrée et une deuxième entrée d'opérande d'un circuit diviseur 47 pour réaliser le calcul du paramètre R conformément à l'étape 5.
Un mode de réalisation des dispositifs de calcul d'énergie 45 et 46 est représenté à la figure 6. Ce circuit comprend un circuit comparateur 48 couplé à un registre 49 au travers d'un circuit aiguilleur 50. Le circuit comparateur 48 possède deux entrées, une première entrée reQoit les échantil-lons de signal S (n) fourni par le filtre numérique 43 ou les ~3~23~7 écharltillons de signal fourr-l pAr le eiltre numérlq-ue 44; la deuxième e~ntl~ée est reliée A la sortle du registre 49. Le Cil'-cuit aiguiUeur 50 est commandé par la sortie du circuit compara-teur 48 et aiguille les échantillons de signal S(n) ou Sph à
5 l'entrée du registre 49 lorsque la valeur de l'échantillon de signal S(n) ou Sph(n) est supérieure au contenu du registre 49. Dans le cas contraire le registre 49 reste rebouclé sur lui-même .
IJn mode de réalisation du dispositif pour la mise en lO oeuvro des étapes 6 à 11 est représenté à la fi~ure 7. Ce dispo-sitif comprend un circuit comparateur 51 couplé à un circuit accumulateur 52 au travers d'un circuit aiguilleur 53. Un cir-cuit multiplicateur 54 est relié par une première entrée d'opérande à une première entrée du circuit comparateur 51 et l 5 reçoit sur sa deuxième entrée d'opérande les paramètres 1-Tx ou 1-Tr figurés aux étapes 8 et 11 du procédé. Un deuxième circuit multiplicateur 55 est relié par une première entrse d'opérande à la sortie du circuit accumulateur 52 et recoit sur une deuxième entrée d'opérande les paramètres TX ou Tr figurés aux étapes 8 et 11 du procédé. Les sorties des circuits multiplicateurs 54 et 55 sont reliées respectivement à une pre-mière entrée et une deuxième entrée d'opérande d'un circuit additionneur 56 dont la sortie est rellée à une première entrée du circuit aiguilieur 53. La sortie du circuit accumulateur 52 25 est d'autre part reliée à la deuxième entrée d'operande du cir-cuit comparateur 51. Conformément aux étapes 6 à 11, les para-mètres Xph ou R sont appliqués sur la première entrée du circuit comparateur 51 et sont comparés aux contenl1s X . old ou R . old du circuit accumulateur 52. Si conformément à l'étape 6 ou 30 à l'étape 9 les paramètres Xph ou R sont supérieurs au conte-nu X . old ou R . old du circuit accumulateur 52, le circuit aiguil-leur 53 met à jour le contenu de l'accumuiateur 52 par l'un des paramètres X h ou R conformément aux étapes 7 et 10. Dans le cas contraire le circuit aiguilleur 53 commute la sortie du 35 circuit additionneur 56 à l'entree du circuit accumulateur 52, 13123~7 pour mettre à ~our le contenu de l'accurnulateur par les paramè-tres X1 ou Rl cléfinls par les relations décrltes précédemrnent des étapes 8 et l1. Dans ces relatlons le prodult (1 - rx) x Xph ou le produit (1-Tr) x R 90nt effectués 5 par le circuit multiplicateur 64 et les produits TX x X. old ou TR par ~ old sont effectués par le circuit multiplicateur 55.
La somme des prodults obtenus est réalisée par le circuit addi-tionneur 56.
Les étapes 12 à 22 du procédé représenté à la figure 2 lO son~ exécutées à l'aide d'amplificateurs à seuil non représentés dont les caractéristiques qui sont par contre représentées aux figure 8A et 8B, permettent de ne pas prendre en compte les valeurs trop élevées des paramètres X1 ou R1. D'après ces caractérlstlques chaque paramètre X1 ou R1 est limité entre 5 deux valeùrs X1ph . inf et X1ph sup ou :E~ 1 . inf et R1 . sup .
Ces caractérlstiques permettent de générer les paramètres X2 et R2 suivant des lois llnéaires des parsmètres X1 et R1 entre les valeurs de seuil Xlph . inf et Xlph . sup ou Rl . inf ~ et R1. sup, les paramètres X2 et R2 étant limités en ampli-20 tude pour les valeurs des paramètres X1 et R1 extérieures à
ces seuils.
Un mode de réalisation d'un dlspositif de calcul des valeurs moyennes XM ou RM illustré par les étapes 23 à 28 du procédé est représenté à la flgure 9 Ce dispositif comprend, 25 relies dans cet ordre en sérle, un circuit soustracteur 57, un circuit multipllcateur 58, un clrcuit additionneur 59 et un reglstre 60. Le circuit soustracteur 57 comprend une premier entrée d'opérande sur laquelle sont appllqués les paramètres X2 ou R2 et une deuxième entrée d'opérande qui est reliée à
30 la sortie du reglstre 60. Le dispositif comprend également un circuit comparateur 61 à deux entrées reliées respectivement aux entrées du circuit soustracteur 57. La sortie du circuit compara-teur 61 est reliée à une entrée de commande d'un circuit aiguii-leur 62. Le circuit aiguilleur 62 possède deux entrées sur les-35 quelles sont appliquées les constantes de temps Tm et Td.
13123~7 La sortie du circuit aigllilleur 62 est reliée à une premièreentrée d'opérande du circuit multiplicateur 58, la deuxlème entree d'opérande du clrcuit multlpllcateur 58 étant reliée à la sortie du circuit soustracteur 57. La sortie du circuit multipli-5 cateur 5~ est d'autre part reliée à une première entréed'opérande du circuit additlonneur 59, la deuxième entrée d'opérande du circuit additionneur 59, étant reliée à la pre-mlère entrée d'opérande du circuit soustracteur 57. Ce disposi-tif permet d'effectuer les opérations du procédé représenté aux 10 étapes 23 à 28. Conformérnent à l'étape 23 ou à l'étape 26, les paramètres X2 ou R2 sont appliqués sur la première entrée de comparaison du circuit comparateur 61 pour être comparés au contenu Xmoy . old du registre 60, et si leur valeur respective est supérieure au contenu du registre 60, le circuit comparateur l 5 61 commande le circuit aiguilleur 62 pour appliquer la constante de temps Tm sur la première entrée d'opérande du circuit multiplicateur 58. Le circuit multiplicateur 58 recoit sur sa deuxième entrée d'opérande le résultat de la soustraction effec-tuée entre le contenu Xmoy . old du registre 60 et les valeurs 20 des paramètres X2 ou R2 appliquées sur sa première entrée d'opérande. Les résultats des multiplications T (X - X ) ou T (R -R ) effectuées m moy . old 2 m moy. old 2 par le circuit multiplicateur 58 sont appliqués sur la première entrée d'opérande du circuit additlonneur 59 pour être addition-25 nés aux paramètres X2 ou R2 appliqués sur sa deuxièmeentrée d'opérande. Le résultat de l'addition effectuée par le circuit addltionneur 69 est alors transfére à l'intérieur du registre 60. Cependant, si aux étapes 23 ou 26 les valeurs des paramètres X2 ou R2 ne sont pas supérieures aux valeurs 30 X ou R trouvées dans le registre 60, le cir-moy . old moy . old cuit aiguiUeur 62 est commandé par le circuit comparateur 61 pour appliquer sur la première entrée d'opérande du circuit multiplicateur 58 la valeur de la constante de temps Td. Dans ces conditions, les calculs sont menés de fac,on similaire ~. la 35 description précédente, la valeur de la constante de temps Tm ~3123~7 etant rernplacéQ par la valeur de IA constante de temps Td conformément aux relations indlquées aux étapes 25 et 28 du procéde .
Les calculs des valeurs de seuil de parole ou de bruit 5 ~SX1 "parole" et SX1 "bruit", SR1 "parole", et SR1 "bruit" ) conformément aux relations établies à l'étape 29 du procédé sont effectuées par les circuits décrits aux figures lOA
et 10B. Les seuils SX1 "parole" ou SR1 "parole" sont calcu-lés au moyen d'un circuit multiplicateur 63 relié à un circui$
l O additionneur 64 . Le circuit multiplicateur 63 reçoit sur une première entrée d'opérande les paramètres X ou R
moy moy fournis par le registre 60 de la figure 9 et il possède une deuxième entrée d'opérande sur laquelle est appliqué le paramè-tre a. Le résultat de la multlplication est appliqué sur une l 5 première entrée d'opérande du circuit additionneur 64 pour être additionne au seuil SpH . inP qui est appliqué sur sa deuxième entrée d'opérande. La sortie du circuit additionneur 64 fournit le seuil SX1 "parole" ou SR1 "parole".
De manière similaire, les seu~ls SXl "bruit" et/ou 20 SR1 "bruit" sont calculés au moyen du circuit multiplicateur 65 et du circuit additionneur 66. La première entrée d'opérande du circuit multiplieur 65 reçolt les paramètres X ou R
moy moy fournis par le registre 60 de la flgure 9, U possède une deuxième entrée d'opérande sur laquelle est appliqué le paramè-25 tre b. Sa sortie est rellée à une première entrée d'opérande ducircuit additionneur 66 dont la deuxième entrée d'opérande re-~oit la valeur du paramètre de seuil Xph . inf . La sortie du circuit additlonneur 66 délivre la valeur de seuil SX1 "bruit"
et SR1 "bruit". Ces valeurs de seuil permettent de comparer 30 les paramètres X1 et R1 conformément aux étapes 30 à 40 du procédé et selon les diagrammes représentés aux figures 11A et 11B. Un dispositif de comparaison correspondant est représenté
à la figure 12. Ce circuit comprend un ensemble de quatre cir-cuits comparateurs référencés de 67 à 7~ couplés respectivement 35 à quatre entrées d'un discriminateur de parole/bruit 71. Le circuit comparateur fi7 compare le paramètre X1 au .seuil de parole SXI "parole", le comparnteur 68 compare le paramètre X1 au seuil SX1 "bruit", le comparateur 69 compare le para-mètre R1 au seuil SR1 "parole" et le comparateur 70 compare le 5 paramètre Rl ~u seuil SRl "bruit". Le discriminateur pa-role/bruit 71 élabore un signal d'activité vocale DAV conformé-ment au diagramme d'état qui est représenté à la figure 13. Ce dlagramme d'état possède deux états stables DAVO et DAV1 et des états instables figurés par les lettres L1 à L4. L'état 10 stable DAV0 est l'état "bruit" dans lequel se trouve le détec-teur d'activité vocale en l'absence de signal de parole, etl'état stable DAV1 est l'état dans lequel se trouve le détecteur d'activité locale lorsque le signal qui est appliqué à son en-trée comprend un signal de parole. Lorsque le détecteur est l 5 dans l'état "bruit" DAVO il ne passe à l'état parole DAV1 que si l'un des deux paramètres X1 et R1 est supérieur au seuil de parole correspondant SX1 "parole" ou SR1 "parole" en transi-tant par l'état instable L1. Sinon la décision bruit est mainte-nue, c'est-à-dire si le paramètre X1 est inférieur au seuil 20 SX1 "parole" et que le paramètre R1 est inférieur au paramè-tre SR1 "parole".
Par contre, lorsque le détecteur d'activité vocale est dans l'état parole DAV1 il ne passe à l'état bruit DAVO que si l'un des deux paramètres X1 et R1 est inférieur au seuil de 25 bruit correspondant c'est-à-dIre si X1 est In~érieur au seuU
SX1 bruit et R1 inférieur à SR1 bruit. Dans ces conditions il transite par l'état instable L2. Cet algorithme des change-ments d'états du signal DAV est figuré aux étapes 30 à 39 de la figure 4. Après chaque changement d'état du slgnal DAV, 30 et après une phase d'initialisation représentée à l'étape 40 le procédé retourne exécuter l'étape 6 de la figure 1.
Cependant, comme ceci est représenté aux étapes 41 et 42 du diagramme de la figure 4, le passage à l'état bruit DAVO
n'est effectif qu'au bout d'un certain temps, calculé par un 35 compteur de temporisation, noté "Hang", non représente qui est chargé à une valeur de compte maximale aux étapes 35 et 39 chaque fols qu'un état "parole" DAV1 est décldé, et dont le contenu est dlminué de une unité à chaque fois que la déclsion DAVO a lieu à l'étape 36. Ceci permet d'éviter des passages 5 systématiques à l'état bruit dans les trous de parole du locu-teur ou de couper la fin d'un mot si elle est de faible ~nergie.
Il est bien évident que l'exemple de mise en oeuvre du procédé selon l'invention n'est pas limité au dispositif qui vient d'être décrit et qu'il peut tout aussi bien être mis en l O oeuvre au moyen d'une structure comprenant des moyens de calcul microprogrammés, enregistrés par exemple dans les mémoi-res mortes ou de données d'un microprocesseur de traitement du signal .
Claims (11)
1. Procédé de détection d'un signal vocal dans un signal noyé dans du bruit, caractérisé en ce qu'il consiste:
- à découper le signal en trame, - à échantillonner chaque trame pour obtenir un signal numérique comportant un nombre n déterminés d'échantillons, - à préaccentuer le signal numérique pour obtenir un signal numérique préaccentué, - à filtrer le signal numérique préaccentué
au moyen d'un filtre numérique passe haut pour obtenir un signal numérique filtré, - à mesurer dans chaque trame l'énergie maximale des échantillons du signal préaccentué et l'énergie maximale des échantillons du signal numérique filtré, - à effectuer un rapport d'énergie R entre l'énergie maximale du signal numérique filtré et l'énergie maximale des échantillons du signal numérique préaccentué, - à calculer entre deux bornes les valeurs moyennes à long terme de la valeur maximale de l'énergie des échantillons du signal filtré et du rapport d'énergie, - à calculer à partir des valeurs moyennes à long terme quatre valeurs de seuil, deux maximales constituant respectivement deux bornes inférieures de l'état parole pour le signal filtré et le rapport d'énergie, et deux minimales constituant respectivement deux bornes supérieures de l'état bruit pour le signal filtré et le rapport d'énergie, pour comparer à ces valeurs de seuil l'énergie du signal filtré maximale et le rapport d'énergie, - à décider de la présence du signal vocal dans le signal bruité lorsque l'énergie maximale du signal numérique filtré, ou le rapport d'énergie sont supérieurs respectivement à leurs valeurs maximale de seuil, - et à décider de l'absence d'un signal vocal dans le signal bruité lorsque l'énergie maximale du signal numérique filtré ou le rapport d'énergie R sont inférieurs respectivement à leurs valeurs minimales de seuil.
- à découper le signal en trame, - à échantillonner chaque trame pour obtenir un signal numérique comportant un nombre n déterminés d'échantillons, - à préaccentuer le signal numérique pour obtenir un signal numérique préaccentué, - à filtrer le signal numérique préaccentué
au moyen d'un filtre numérique passe haut pour obtenir un signal numérique filtré, - à mesurer dans chaque trame l'énergie maximale des échantillons du signal préaccentué et l'énergie maximale des échantillons du signal numérique filtré, - à effectuer un rapport d'énergie R entre l'énergie maximale du signal numérique filtré et l'énergie maximale des échantillons du signal numérique préaccentué, - à calculer entre deux bornes les valeurs moyennes à long terme de la valeur maximale de l'énergie des échantillons du signal filtré et du rapport d'énergie, - à calculer à partir des valeurs moyennes à long terme quatre valeurs de seuil, deux maximales constituant respectivement deux bornes inférieures de l'état parole pour le signal filtré et le rapport d'énergie, et deux minimales constituant respectivement deux bornes supérieures de l'état bruit pour le signal filtré et le rapport d'énergie, pour comparer à ces valeurs de seuil l'énergie du signal filtré maximale et le rapport d'énergie, - à décider de la présence du signal vocal dans le signal bruité lorsque l'énergie maximale du signal numérique filtré, ou le rapport d'énergie sont supérieurs respectivement à leurs valeurs maximale de seuil, - et à décider de l'absence d'un signal vocal dans le signal bruité lorsque l'énergie maximale du signal numérique filtré ou le rapport d'énergie R sont inférieurs respectivement à leurs valeurs minimales de seuil.
2. Procédé selon la revendication 1, caractérisé en ce que la préaccentuation du signal numérique est effectuée à l'aide d'un filtre numérique passe haut de transformée en z (H(z) = 1 - 0,86 z-1).
3. Procédé selon l'une quelconque des revendications 1 et 2, caractérisé en ce que le filtre numérique passe haut a une fréquence de coupure d'environ 1200 Hz.
4. Procédé selon l'une quelconque des revendications 1 et 2, caractérisé en ce que la mesure de l'énergie maximale dans chaque trame a lieu sur l'échantillon d'amplitude maximum.
5. Procédé selon l'une quelconque des revendications 1 et 2, caractérisé en ce que la détermination de la valeur moyenne à long terme Xm de la valeur maximale de l'énergie du signal filtré est calculée en appliquant dans chaque trame courante une relation de récurrence de la forme:
Xmoy - Tm. Xmoy.old + (1-Tm) X2 si la valeur du paramètre X2 est supérieure au paramètre Xmoy.old ou suivant une relation de la forme Xmoy = Td-Xmoy.old + (1-Td)X2 si la valeur du paramètre X2 est inférieure au paramètre moy.old où: la valeur X2 est égale à la valeur de l'échantillon Xph d'énergie maximale dans chaque trame, limitée entre deux valeurs de seuil Xp.sup et Xph.inf, Xmoy.old est la valeur moyenne à long terme calculée dans la trame précédente, et Tm et Td sont des constantes de temps; Tm étant une constante de temps supérieure à Td.
Xmoy - Tm. Xmoy.old + (1-Tm) X2 si la valeur du paramètre X2 est supérieure au paramètre Xmoy.old ou suivant une relation de la forme Xmoy = Td-Xmoy.old + (1-Td)X2 si la valeur du paramètre X2 est inférieure au paramètre moy.old où: la valeur X2 est égale à la valeur de l'échantillon Xph d'énergie maximale dans chaque trame, limitée entre deux valeurs de seuil Xp.sup et Xph.inf, Xmoy.old est la valeur moyenne à long terme calculée dans la trame précédente, et Tm et Td sont des constantes de temps; Tm étant une constante de temps supérieure à Td.
6. Procédé selon la revendication 5, caractérisé en ce que la détermination de la valeur moyenne Rmoy de la valeur maximale du rapport d'énergie R
est calculée en appliquant dans chaque trame courante une relation de récurrence de la forme:
Rmoy = Tm Rmoy.old + (1-Tm) R2 si le paramètre R2 est supérieur au paramètre Rmoy.old et suivant une relation de récurrence de la forme:
Rmoy = Td Rmoy.old + (1-Td)Ré
si le paramètre R2 est inférieur au paramètre Rmoy; Rmoy.old désignant le rapport d'énergie moyen à long terme calculé
dans la trame précédente.
est calculée en appliquant dans chaque trame courante une relation de récurrence de la forme:
Rmoy = Tm Rmoy.old + (1-Tm) R2 si le paramètre R2 est supérieur au paramètre Rmoy.old et suivant une relation de récurrence de la forme:
Rmoy = Td Rmoy.old + (1-Td)Ré
si le paramètre R2 est inférieur au paramètre Rmoy; Rmoy.old désignant le rapport d'énergie moyen à long terme calculé
dans la trame précédente.
7. Procédé selon la revendication 6, caractérisé en ce que les quatre valeurs de seuil sont calculées en appliquant les relations:
SX1 parole = a.Xmoy + Xph.inf SX1 bruit = b.Xmoy + Xph.inf SR1 parole = a.Rmoy + R.inf SR1 bruit = b.R moy + R.inf les paramètres a et b étant des constantes.
SX1 parole = a.Xmoy + Xph.inf SX1 bruit = b.Xmoy + Xph.inf SR1 parole = a.Rmoy + R.inf SR1 bruit = b.R moy + R.inf les paramètres a et b étant des constantes.
8. Procédé selon la revendication 7, caractérisé en ce que a = 1,8 et b = 1,25.
9. Dispositif pour la mise en oeuvre du procédé selon l'une quelconque des revendications 1 et 2, caractérisé en ce qu'il comprend des premiers moyens pour calculer dans chaque trame le rapport entre l'énergie maximale du signal préaccentué et l'énergie maximale du signal numérique filtré
- des deuxièmes moyens pour calculer les valeurs moyennes à long terme de la valeur maximale de l'énergie du signal filtré et du rapport d'énergie, - des troisièmes moyens couplés aux deuxièmes moyens pour calculer des valeurs de seuils adaptatifs maximales et minimales pour le signal numérique filtré et le rapport d'énergie, - et des moyens de décision couplés aux troisièmes moyens pour décider de la présence ou de l'absence d'un signal vocal dans le signal numérique.
- des deuxièmes moyens pour calculer les valeurs moyennes à long terme de la valeur maximale de l'énergie du signal filtré et du rapport d'énergie, - des troisièmes moyens couplés aux deuxièmes moyens pour calculer des valeurs de seuils adaptatifs maximales et minimales pour le signal numérique filtré et le rapport d'énergie, - et des moyens de décision couplés aux troisièmes moyens pour décider de la présence ou de l'absence d'un signal vocal dans le signal numérique.
10. Dispositif pour la mise en oeuvre du procédé selon l'une quelconque des revendications 1 et 2 caractérisé en ce qu'il comprend des moyens de calcul microprogrammes.
11. Dispositif selon la revendication 9 caractérisé en ce que les moyens de calcul microprogrammé
sont formés par un processeur de traitement du signal.
sont formés par un processeur de traitement du signal.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR8806001 | 1988-05-04 | ||
| FR8806001A FR2631147B1 (fr) | 1988-05-04 | 1988-05-04 | Procede et dispositif de detection de signaux vocaux |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CA1312357C true CA1312357C (fr) | 1993-01-05 |
Family
ID=9365991
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CA000598632A Expired - Fee Related CA1312357C (fr) | 1988-05-04 | 1989-05-03 | Procede et dispositif de detection de signaux vocaux |
Country Status (9)
| Country | Link |
|---|---|
| US (1) | US4982341A (fr) |
| EP (1) | EP0341128B1 (fr) |
| JP (1) | JPH0213999A (fr) |
| AT (1) | ATE83578T1 (fr) |
| CA (1) | CA1312357C (fr) |
| DE (1) | DE68903872T2 (fr) |
| ES (1) | ES2036813T3 (fr) |
| FR (1) | FR2631147B1 (fr) |
| GR (1) | GR3007361T3 (fr) |
Families Citing this family (24)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5408581A (en) * | 1991-03-14 | 1995-04-18 | Technology Research Association Of Medical And Welfare Apparatus | Apparatus and method for speech signal processing |
| US5781913A (en) * | 1991-07-18 | 1998-07-14 | Felsenstein; Lee | Wearable hypermedium system |
| EP0538536A1 (fr) * | 1991-10-25 | 1993-04-28 | International Business Machines Corporation | Détection de la présence d'un signal de parole |
| US5323337A (en) * | 1992-08-04 | 1994-06-21 | Loral Aerospace Corp. | Signal detector employing mean energy and variance of energy content comparison for noise detection |
| US5450484A (en) * | 1993-03-01 | 1995-09-12 | Dialogic Corporation | Voice detection |
| DE69328356T2 (de) * | 1993-04-29 | 2000-10-19 | International Business Machines Corp., Armonk | Signaltonerkennungsverfahren und -Apparat zum Erkennen zumindest eines Tones in einem Dualton-Multifrequenzsignal |
| EP0622964B1 (fr) * | 1993-04-29 | 2002-03-20 | International Business Machines Corporation | Dispositif et procédé de détection de le présence d'un signal de parole |
| BE1007355A3 (nl) * | 1993-07-26 | 1995-05-23 | Philips Electronics Nv | Spraaksignaaldiscriminatieschakeling alsmede een audio-inrichting voorzien van een dergelijke schakeling. |
| US5675639A (en) * | 1994-10-12 | 1997-10-07 | Intervoice Limited Partnership | Voice/noise discriminator |
| US5822726A (en) * | 1995-01-31 | 1998-10-13 | Motorola, Inc. | Speech presence detector based on sparse time-random signal samples |
| US5701389A (en) * | 1995-01-31 | 1997-12-23 | Lucent Technologies, Inc. | Window switching based on interblock and intrablock frequency band energy |
| FR2738383B1 (fr) * | 1995-09-05 | 1997-10-03 | Thomson Csf | Procede de quantification vectorielle de vocodeurs bas debit |
| US5884255A (en) * | 1996-07-16 | 1999-03-16 | Coherent Communications Systems Corp. | Speech detection system employing multiple determinants |
| FR2778041A1 (fr) * | 1998-04-24 | 1999-10-29 | Thomson Csf | Procede de neutrodynage du tube d'un emetteur |
| DE19854341A1 (de) * | 1998-11-25 | 2000-06-08 | Alcatel Sa | Verfahren und Schaltungsanordnung zur Sprachpegelmessung in einem Sprachsignalverarbeitungssystem |
| FR2788390B1 (fr) | 1999-01-12 | 2003-05-30 | Thomson Csf | Emetteur de radiodiffusion en ondes courtes a haut rendement optimise pour les emissions de type numerique |
| US6249757B1 (en) | 1999-02-16 | 2001-06-19 | 3Com Corporation | System for detecting voice activity |
| FR2790343B1 (fr) | 1999-02-26 | 2001-06-01 | Thomson Csf | Systeme pour l'estimation du gain complexe d'un canal de transmission |
| GB9912577D0 (en) * | 1999-05-28 | 1999-07-28 | Mitel Corp | Method of detecting silence in a packetized voice stream |
| FR2797343B1 (fr) * | 1999-08-04 | 2001-10-05 | Matra Nortel Communications | Procede et dispositif de detection d'activite vocale |
| FR2799592B1 (fr) | 1999-10-12 | 2003-09-26 | Thomson Csf | Procede de construction et de codage simple et systematique de codes ldpc |
| DE10244699B4 (de) * | 2002-09-24 | 2006-06-01 | Voice Inter Connect Gmbh | Verfahren zur Bestimmung der Sprachaktivität |
| US20060241937A1 (en) * | 2005-04-21 | 2006-10-26 | Ma Changxue C | Method and apparatus for automatically discriminating information bearing audio segments and background noise audio segments |
| US9978392B2 (en) * | 2016-09-09 | 2018-05-22 | Tata Consultancy Services Limited | Noisy signal identification from non-stationary audio signals |
Family Cites Families (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FR2466825A1 (fr) * | 1979-09-28 | 1981-04-10 | Thomson Csf | Dispositif de detection de signaux vocaux et systeme d'alternat comportant un tel dispositif |
| DE3243231A1 (de) * | 1982-11-23 | 1984-05-24 | Philips Kommunikations Industrie AG, 8500 Nürnberg | Verfahren zur erkennung von sprachpausen |
| DE3370423D1 (en) * | 1983-06-07 | 1987-04-23 | Ibm | Process for activity detection in a voice transmission system |
| US4700392A (en) * | 1983-08-26 | 1987-10-13 | Nec Corporation | Speech signal detector having adaptive threshold values |
| EP0140249B1 (fr) * | 1983-10-13 | 1988-08-10 | Texas Instruments Incorporated | Analyse et synthèse de la parole avec normalisation de l'énergie |
| EP0167364A1 (fr) * | 1984-07-06 | 1986-01-08 | AT&T Corp. | Détection parole-silence avec codage par sous-bandes |
| US4920568A (en) * | 1985-07-16 | 1990-04-24 | Sharp Kabushiki Kaisha | Method of distinguishing voice from noise |
| DE3545447A1 (de) * | 1985-12-20 | 1988-01-28 | Bayerische Motoren Werke Ag | System zur integration eines personalcomputers oder eines aehnlichen rechners in ein fahrzeug zur benutzung als fahrbares buero |
| US4918732A (en) * | 1986-01-06 | 1990-04-17 | Motorola, Inc. | Frame comparison method for word recognition in high noise environments |
| GB8608288D0 (en) * | 1986-04-04 | 1986-05-08 | Pa Consulting Services | Noise compensation in speech recognition |
-
1988
- 1988-05-04 FR FR8806001A patent/FR2631147B1/fr not_active Expired - Lifetime
-
1989
- 1989-04-25 AT AT89401168T patent/ATE83578T1/de active
- 1989-04-25 ES ES198989401168T patent/ES2036813T3/es not_active Expired - Lifetime
- 1989-04-25 EP EP89401168A patent/EP0341128B1/fr not_active Expired - Lifetime
- 1989-04-25 DE DE8989401168T patent/DE68903872T2/de not_active Expired - Fee Related
- 1989-05-02 JP JP1112386A patent/JPH0213999A/ja active Pending
- 1989-05-03 CA CA000598632A patent/CA1312357C/fr not_active Expired - Fee Related
- 1989-05-04 US US07/347,014 patent/US4982341A/en not_active Expired - Fee Related
-
1993
- 1993-03-16 GR GR930400563T patent/GR3007361T3/el unknown
Also Published As
| Publication number | Publication date |
|---|---|
| EP0341128A1 (fr) | 1989-11-08 |
| GR3007361T3 (fr) | 1993-07-30 |
| US4982341A (en) | 1991-01-01 |
| FR2631147A1 (fr) | 1989-11-10 |
| ATE83578T1 (de) | 1993-01-15 |
| DE68903872D1 (de) | 1993-01-28 |
| DE68903872T2 (de) | 1993-06-24 |
| FR2631147B1 (fr) | 1991-02-08 |
| ES2036813T3 (es) | 1993-06-01 |
| JPH0213999A (ja) | 1990-01-18 |
| EP0341128B1 (fr) | 1992-12-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CA1312357C (fr) | Procede et dispositif de detection de signaux vocaux | |
| US6351731B1 (en) | Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor | |
| US6453285B1 (en) | Speech activity detector for use in noise reduction system, and methods therefor | |
| EP0719439B1 (fr) | Detecteur d'activite vocale | |
| US6023674A (en) | Non-parametric voice activity detection | |
| JP6694426B2 (ja) | ランニング範囲正規化を利用したニューラルネットワーク音声活動検出 | |
| US6820053B1 (en) | Method and apparatus for suppressing audible noise in speech transmission | |
| US7043030B1 (en) | Noise suppression device | |
| EP1008140B1 (fr) | Detecteur de periodicite base sur la forme d'onde | |
| FR2677828A1 (fr) | Procede de detection d'un signal utile bruite. | |
| EP0620546B1 (fr) | Procédé de détection énergétique de signaux noyés dans du bruit | |
| CN110248300B (zh) | 一种基于自主学习的啸叫抑制方法及扩声系统 | |
| EP1016071B1 (fr) | Procede et dispositif de detection d'activite vocale | |
| FR2759824A1 (fr) | Systeme de separation de sources non stationnaires | |
| FR2670313A1 (fr) | Procede et dispositif pour l'evaluation de la periodicite et du voisement du signal de parole dans les vocodeurs a tres bas debit. | |
| EP0534837B1 (fr) | Procédé de traitement de la parole en présence de bruits acoustiques utilisant la sous traction spectrale non-linéaire et les modèles de Markov cachés | |
| EP0714088A1 (fr) | Détection d'activité vocale | |
| KR20250145045A (ko) | 음성 분류기의 강건한 처리를 위한 방법 및 시스템 | |
| FR2542529A1 (fr) | Circuit de reduction des bruits d'impulsions par interpolation lineaire avec insensibilite aux bruits blancs | |
| US6954771B2 (en) | Adaptive line enhancer | |
| FR2629293A1 (fr) | Annuleur d'echo pour signal d'echo a phase variable | |
| JPH03295422A (ja) | 可変閾値型シングルトーン検出器 | |
| EP0821345B1 (fr) | Procédé d'extraction de la fréquence fondamentale d'un signal de parole | |
| JPH0492540A (ja) | シングルトーン検出器 | |
| US20030125937A1 (en) | Vector estimation system, method and associated encoder |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| MKLA | Lapsed |