FR2622727A1 - Procede de reconnaissance de la parole ou de toute autre onde sonore et son procede de mise en oeuvre - Google Patents
Procede de reconnaissance de la parole ou de toute autre onde sonore et son procede de mise en oeuvre Download PDFInfo
- Publication number
- FR2622727A1 FR2622727A1 FR8715139A FR8715139A FR2622727A1 FR 2622727 A1 FR2622727 A1 FR 2622727A1 FR 8715139 A FR8715139 A FR 8715139A FR 8715139 A FR8715139 A FR 8715139A FR 2622727 A1 FR2622727 A1 FR 2622727A1
- Authority
- FR
- France
- Prior art keywords
- signal
- speech recognition
- recognition method
- frequencies
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 21
- 230000015654 memory Effects 0.000 claims abstract description 14
- 230000006870 function Effects 0.000 claims abstract description 6
- 230000005236 sound signal Effects 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
Dispositif de reconnaissance numérique de la parole. Un enregistrement du signal génère l'unité élémentaire de référence du signal à laquelle on assigne une valeur numérique; un circuit oscillant et un circuit logique 5 attribuent une valeur numérique à chacun des signaux électriques en fonction de leurs fréquences, lesquelles font l'objet d'un traitement mathématique 7 afin d'obtenir une valeur numérique particulière au bout d'un temps déterminé; un circuit logique conserve en mémoire 8 les valeurs numériques issues du traitement mathématique 7; on effectue la comparaison 9 des signaux après calcul 10; un capteur 3 enregistre simultanément le temps, l'amplitude, la fréquence du signal transmis aux circuits logiques du totalisateur; pour chaque fréquence du signal, un calcul est effectué grâce aux circuits logiques de calcul 10, de mémoire 8, de comparaison 9. Dispositifs à commande vocale tels que des contrôles d'accès ou traducteurs de langue.
Description
L'invention a pour objet un dispositif de reconnaissance numérique de la parole ou de toute autre onde sonore ou signaux électriques.
On connaît à l'heure actuelle divers procédés et dispositifs qui permettent de satisfaire ce résultat mais tous ont en commun l'inconvénient majeur de nécessiter une forte capacité de mémoire en combinaison avec un ordinateur.
A titre d'exemple, nous citerons le brevet N02 581 469 qui décrit un dispositif d'entrée-sortie vocale et installation à reconnaissance ou synthèse de parole en comportant application, et qui consiste en un dispositif comportant un processeur de signal muni d'une mémoire interne de travail et d'un bus d'adressage de mémoires externes réparties en mémoire de données et en mémoire de programmes organisé en page adressable. Lesquelles mémoires reçoivent les adresses simultanément dans une page de programme et une page de données qui seront utilisées simultanément.
L'invention s'applique notamment-aux dispositifs à commande vocale tels que des contrôles d'accès ou traduction de langue.
Certaines de ces techniques utilisent la prédiction linéaire, d'autres les modèles mathématiques du conduit vocal. Tous ces dispositifs ont en commun comme inconvénients le coût, l'encombrement, la complexité et une fiabilité précairé.
L'invention propose un dispositif de reconnaissance numérique de la parole caractérisée par des moyens permettant la captation et la transformation des ondes sonores ou autres en signaux électriques ; et, des moyens logiques de traitement de ses signaux.
Dans ce but, l'invention propose d'effectuer la réception des ondes grâce à un récepteur qui permet de capter le type d'onde considéré, sonore ou électro-magnétique, que l'on souhaite enregistrer, étudier ou traiter.
Ce capteur assure la transformation en signaux esthétiques de ces ondes ou vibrations de toute nature.
Ce capteur a une caractéristique de bande passante en fréquence telle qu'il permet de recevoir sans altération la totalité de l'onde à enregistrer.
Toujours dans le même but, la présente invention propose le traitement logique des signaux selon deux procédés préférentiels
- le premier-de ces procédés consiste en un enregistrement du signal ou onde selon une fenêtre qui détermine l'unité élémentaire du signal ou de la vibration à traiter. On assigne à cet enregistrement du signal ou onde une valeur numérique préalablement déterminée qui varie en fonction de la fréquence de chacun des signaux.
- le premier-de ces procédés consiste en un enregistrement du signal ou onde selon une fenêtre qui détermine l'unité élémentaire du signal ou de la vibration à traiter. On assigne à cet enregistrement du signal ou onde une valeur numérique préalablement déterminée qui varie en fonction de la fréquence de chacun des signaux.
- le second de ces procédés consiste en un enregistrement simultané de toutes les fréquences de l'onde ou du signal à traiter, puis à leur assigner systématiquement une valeur numérique préalablement déterminée en fonction de la durée de chacune des fréquences et de leurs amplitudes respectives.
Dans les deux procédés développés ci-dessus, le temps d'enregistrement peut être variable en rapport avec le procédé d'enregistrement et le type d'onde ou de signal traité.
Toutefois, s'il s'agit d'effectuer la comparaison entre deux ondes ou signaux destinés à être reconnus, ce temps d'enregistrement doit être le même.
Nous revenons à notre premier procédé caractérisé notamment par un circuit logique qui attribue une valeur numérique à chacun des signaux électriques en fonction de leur fréquence.
Ces valeurs numériques sont traitées mathématiquement de manière à obtenir une ou des valeurs numériques particulières au bout d'un temps indéterminé. Le traitement mathématique peut être quelconque, tels que l'addition, la multiplication ou autres.
Lesdites valeurs numériques de chaque signal peuvent être traitées mathématiquement d'une manière fractionnée ou globale.
Le circuit logique conserve en mémoire la ou les valeurs numériques particulières issues du traitement mathématique.
Pour effectuer une comparaison entre deux ondes, il suffit d'enregistrer la nouvelle onde ou signal électrique, et d'effectuer'la comparaison.
Pour ce faire, il faut que d'une part les traitements mathématiques soient exactement les mêmes lors du premier et du second enregistrement, et d'autre part, que la durée du premier et du second enregistrement soit égale. En d'autres termes, il doit y avoir simultanéité entre deux ondes ou signaux électriques.
Le circuit logique effectue alors la comparaison entre la ou les valeurs numériques trouvées lors de chaque enregistrement.
Le deuxième procédé est caractérisé en ce que le capteur enregistre les différentes fréquences qui composent une onde sonore ou électromagnétique. Il enregistre simultanément la durée et l'intensité ou amplitude respective du signal.
Ces paramètres sont transmis aux circuits logiques sous forme de signaux électriques.
Le circuit logique effectue la transformation des signaux électriques correspondant à chacune des fréquences en une valeur numérique suivant une échelle de valeur déterminée.
Un circuit logique est prévu pour effectuer la transformation des signaux électriques correspondant à la durée de chacune des fréquences échantillonnées en une valeur - numérique suivant une autre échelle de valeurs.
Un circuit logique effectue également la transformation des signaux électriques en signaux numériques en prenant en compte les paramètres d'intensité et de fréquence selon une échelle de valeur particulière.
Pour chaque fréquence de l'onde ou du signal le ou les circuits logiques effectuent un traitement mathématique sur les deux ou trois paramètres qui caractérisent cette onde ou signal et les transforment en valeurs numériques.
Les opérations mathématiques peuvent également s'effectuer sur l'ensemble des paramètres de durée et d'amplitude transformés en valeurs numériques.
Le circuit logique effectue alors un traitement mathématique entre toutes les valeurs numériques générées par les opérations précédemment décrites afin d'obtenir une ou plusieurs valeurs numériques définitives suivant le traitement mathématique utilisé.
La présente invention possède de nombreux avantages sur les techniques actuellement mises en oeuvre dans ces domaines.
En effet, la reconnaissance des ondes sonores ou électromagnétiques s'effectue à partir de diagramme instantané.
Or, deux sons, notamment dans le cas de la reconnaissance de la parole, peuvent être sensibles mais génèrent deux diagrammes différents rendant particulièrement difficile la reconnaissance de ladite parole à l'aide de circuits logiques appropriés.
Cette invention possède la remarquable propriété de résumer un son en une valeur numérique si le traitement mathématique est destiné à ce but.
Cette invention facilite la détermination de la marge dans laquelle évolue cette valeur numérique en rapport avec l'évolution du même son.
En outre, un son peut être étudié grâce à cette invention et notamment en prenant des échantillons de l'onde sonore durant des temps relativement courts. Lesdits échantillons sont alors comparés de façon systématique ce qui permet de suivre l'évolution du son de façon très précise et résoud ainsi de nombreux problèmes difficiles à résoudre dans cette matière très particulière de la reconnaissance de la parole ou de phrases.
De plus, cette invention permet d'éliminer de nombreuses données nécessaires à la reconnaissance des sons pour n'en utiliser qu'une par son.
De plus, on peut, pour améliorer encore les performances de cette invention, utiliser plusieurs valeurs numériques puisqu'il est possible d'utiliser plusieurs opérations mathématiques quelconques.
Les dessins ci-joints sont donnés à titre d'exemples indicatifs et non limitatifs. Ils représentent un mode de réalisation préféré selon l'invention. Ils permettront de comprendre aisément l'invention.
La figure 1 illustre un graphe permettant de mieux comprendre cette invention.
1- On fractionne en des temps X relativement courts l'enregistrement des sons.
2- On attribue des valeurs numériques à toutes les vibrations sonores enregistrées pendant ce laps de temps.
3- On obtient alors, grâce aux points 1 et 2 ci-dessus, des valeurs numériques variant en fonction de la fréquence des ondes sonores.
4- On effectue une opération mathématique quelconque telle que l'addition sur l'ensemble des valeurs numériques enregistrées pendant le laps de temps X.
5- On obtient une valeur unique représentant par exemple dans le cas du graphe de la figure 1 le son voisé I (1) ou le son fricatif S (2).
Une des caractéristiques essentielles de la présente invention est d'utiliser le fractionnement ou division du son, contrairement aux techniques actuelles qui toutes utilisent l'ensemble du son ou signal, ce qui alourdit considérablement le système de reconnaissance de la parole par l'utilisation d'importantes mémoires associées à l'ordinateur.
La figure 2 nous montre l'organisation de cette invention composée
- d'un microphone à large bande passante 3
- d'un amplificateur 4 d'une largeur de bande en rapport avec le signal délivré par le microphone et permettant de présenter, à l'entrée des autres circuits, un signal de valeur optimale, afin d'être traité dans les meilleures conditions.
- d'un microphone à large bande passante 3
- d'un amplificateur 4 d'une largeur de bande en rapport avec le signal délivré par le microphone et permettant de présenter, à l'entrée des autres circuits, un signal de valeur optimale, afin d'être traité dans les meilleures conditions.
- d'un appareillage permettant de doter d'une valeur numérique chacune des fréquences du son, constitué d'un circuit oscillant haute fréquence 5, permettant de numériser chaque oscillation de la tension représentative du signal électrique ou son et d'obtenir ainsi la valeur numérique de chaque fréquence du son.
- d'un système compteur de temps à seuils prédéterminés 6, et réglable, permettant de découper en des tranches de temps de durée déterminée la totalité du temps où est présent le signal ou son à traiter.
- d'un ou plusieurs totalisateurs effectuant le traitement mathématique sur l'ensemble des valeurs numériques assignées à chacune des fréquences enregistrées en temps réel, il est nécessaire d'utiliser plusieurs totalisateurs de manière à permettre un éventuel enregistrement pendant qu'un autre totalisateur effectue les calculs de l'enregistrement son ou signal précédent.
De plus, dans le cas spécifique de la reconnaissance de la parole, il sera nécessaire d'effectuer une somme ou un autre calcul adéquat de l'ensemble des résultats donnés par les totalisateurs.
Dans ce cas, il sera alors nécessaire d'ajouter un circuit de calcul avant les circuits de comparaison.
- d'une ou des mémoires 8 dans laquelle se trouve accumulées les valeurs numériques correspondant aux sons à reconnaître.
- d'un circuit de comparaison 9 où sont comparées les valeurs numériques en provenance des totalisateurs, et celles-ci inscrites en mémoire.
Ce circuit comparateur est muni d'un réglage permettant la reconnaissance d'un son entre deux valeurs numériques, l'une de ces valeurs étant minimale, l'autre maximale.
- d'un ensemble calculateur 10 qui effectue un autre traitement mathématique.
REFERENCES 1. Son voisé I 2. Son fricatif S 3. Bande passante 4. Amplificateur 5. Circuit haute fréquence 6. Système compteur de temps 7. Traitement mathématique 8. Mémoire 9. Circuit de comparaison 10. Calculateur
Claims (7)
- l. Procédé de reconnaissance de parole caractérisé en ce qu'un enregistrement du signal ou onde est effectué selon une fenêtre prédéterminée (6) qui génère l'unité élémentaire de référence du signal ou de la vibration à laquelle on assigne une valeur numérique en fonction de la fréquence de chacun des signaux.REVENDICATIONS
- 2. Procédé de reconnaissance de parole selon la revendication 1 caractérisé en ce qu'un enregistrement simultané (3, 4), effectué pour toutes les fréquences de l'onde ou du signal sonore, autorise une assignation de valeur numérique (5) préalablement déterminé en fonction de la durée de chacune des fréquences et de leurs amplitudes respectives.
- 3. Procédé de reconnaissance de parole selon la revendication 1 caractérisé en ce qu'un appareillage tel qu'un circuit oscillant (1) et un circuit logique (5) attribuent une valeur numérique à chacun des sons ou signaux électriques en fonction de leurs fréquences, lesquelles font l'objet d'un traitement mathématique (7) afin d'obtenir une valeur numérique particulière au bout d'un temps déterminé.
- 4. Procédé de reconnaissance de parole selon la revendication 1 caractérisé en ce qu'un circuit logique conserve en mémoire (8) la ou les valeurs numériques issues du traitement mathématique (7).
- 5. Procédé de reconnaissance de parole selon la revendication 1 caractérisé en ce qu'on effectue la comparaison (9) des sons ou signaux après traitement mathématique identique (10).
- 6. Procédé de reconnaissance de parole selon la revendication 2 caractérisé en ce qu'un récepteur ou capteur (3) enregistre simultanément le temps, l'amplitude et la fréquence du signal transmis aux circuits logiques du totalisateur.
- 7. Procédé de reconnaissance de parole selon la revendication 2 caractérisé en ce que, pour chaque fréquence de l'onde ou du signal, un traitement mathématique est effectué grâce aux circuits logiques de calcul (10) de mémoire (8) et de comparaison (9)i
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR8715139A FR2622727A1 (fr) | 1987-10-29 | 1987-10-29 | Procede de reconnaissance de la parole ou de toute autre onde sonore et son procede de mise en oeuvre |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR8715139A FR2622727A1 (fr) | 1987-10-29 | 1987-10-29 | Procede de reconnaissance de la parole ou de toute autre onde sonore et son procede de mise en oeuvre |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| FR2622727A1 true FR2622727A1 (fr) | 1989-05-05 |
Family
ID=9356387
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| FR8715139A Pending FR2622727A1 (fr) | 1987-10-29 | 1987-10-29 | Procede de reconnaissance de la parole ou de toute autre onde sonore et son procede de mise en oeuvre |
Country Status (1)
| Country | Link |
|---|---|
| FR (1) | FR2622727A1 (fr) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB1048747A (en) * | 1964-08-26 | 1966-11-16 | Standard Telephones Cables Ltd | Apparatus for sampling and analysing a complex pattern |
| FR2381369A1 (fr) * | 1977-02-21 | 1978-09-15 | Funakubo Hiroyasu | Systeme d'identification de la voix |
| EP0119835A1 (fr) * | 1983-03-16 | 1984-09-26 | Figgie International Inc. | Dispositif de reconnaissance de la parole basé sur la durée et/ou le poids de caractéristiques phonétiques |
-
1987
- 1987-10-29 FR FR8715139A patent/FR2622727A1/fr active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB1048747A (en) * | 1964-08-26 | 1966-11-16 | Standard Telephones Cables Ltd | Apparatus for sampling and analysing a complex pattern |
| FR2381369A1 (fr) * | 1977-02-21 | 1978-09-15 | Funakubo Hiroyasu | Systeme d'identification de la voix |
| EP0119835A1 (fr) * | 1983-03-16 | 1984-09-26 | Figgie International Inc. | Dispositif de reconnaissance de la parole basé sur la durée et/ou le poids de caractéristiques phonétiques |
Non-Patent Citations (1)
| Title |
|---|
| IEEE JOURNAL OF SOLID-STATE CIRCUITS, vol. SC-18, no. 1, février 1983, pages 75-81, IEEE, New York, US; N.C.BUI et al.: "An integrated voice recognition system" * |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| FR2643986A1 (fr) | Procede d'analyse d'un signal par ondelettes | |
| FR2522179A1 (fr) | Procede et appareil de reconnaissance de paroles permettant de reconnaitre des phonemes particuliers du signal vocal quelle que soit la personne qui parle | |
| EP0511095B1 (fr) | Procédé et dispositif de codage-décodage d'un signal numérique | |
| FR2587819A1 (fr) | Dispositif de calcul d'une transformee de fourier discrete, glissante et non recursive, et son application a un systeme radar | |
| EP2603862A2 (fr) | Procédé d'analyse de signaux fournissant des fréquences instantanées et des transformées de fourier glissantes et dispositif d'analyse de signaux | |
| KR910017780A (ko) | 오디오 신호의 타임 시퀀스 처리 방법 및 장치 | |
| FR2584213A1 (fr) | Dispositif de calcul d'une transformee de fourier discrete, glissante, et son application a un systeme radar. | |
| FR2556845A1 (fr) | Procede de caracterisation par ondes acoustiques de la structure d'un milieu et dispositif mettant en oeuvre ce procede | |
| EP0312463B1 (fr) | Dispositif de filtrage numérique, et radar comportant un tel dispositif | |
| CN117935851A (zh) | 一种声音信号分离方法、系统、介质及设备 | |
| FR2641631A1 (fr) | Montage de transformation de fourier rapide en temps reel | |
| FR2622727A1 (fr) | Procede de reconnaissance de la parole ou de toute autre onde sonore et son procede de mise en oeuvre | |
| EP0714088B1 (fr) | Détection d'activité vocale | |
| EP0242258B1 (fr) | Dispositif de mise en oeuvre d'un algorithme dit de LEROUX- GUEGUEN,pour le codage d'un signal par prédiction linéaire | |
| Esquef et al. | Frequency-zooming ARMA modeling for analysis of noisy string instrument tones | |
| Masri et al. | A review of time–frequency representations, with application to sound/music analysis–resynthesis | |
| EP0197582A1 (fr) | Procédé et appareil d'exploration de milieux par échographie ultrasonore | |
| FR2793589A1 (fr) | Dispositif pour traiter l'information de phase d'un signal acoustique et procede correspondant | |
| FR2717294A1 (fr) | Procédé et dispositif de synthèse dynamique sonore musicale et vocale par distorsion non linéaire et modulation d'amplitude. | |
| EP0821345B1 (fr) | Procédé d'extraction de la fréquence fondamentale d'un signal de parole | |
| CA2108663C (fr) | Procede et dispositif de filtrage pour la reduction des preechos d'un signal audio-numerique | |
| FR2510288A1 (fr) | Procede et dispositif de generation de bruits sous-marins, en particulier pour la simulation de bruits sonar | |
| KR100766170B1 (ko) | 다중 레벨 양자화를 이용한 음악 요약 장치 및 방법 | |
| RU2364957C1 (ru) | Способ определения параметров линейчатых спектров вокализованных звуков и система для его реализации | |
| CN114258569A (zh) | 用于音频编码的多滞后格式 |