FR2809221A1 - Dispositif pour quantifier la phase d'un signal vocal a l'aide d'une fonction de ponderation de perception, et procede pour celui-ci - Google Patents
Dispositif pour quantifier la phase d'un signal vocal a l'aide d'une fonction de ponderation de perception, et procede pour celui-ci Download PDFInfo
- Publication number
- FR2809221A1 FR2809221A1 FR0012798A FR0012798A FR2809221A1 FR 2809221 A1 FR2809221 A1 FR 2809221A1 FR 0012798 A FR0012798 A FR 0012798A FR 0012798 A FR0012798 A FR 0012798A FR 2809221 A1 FR2809221 A1 FR 2809221A1
- Authority
- FR
- France
- Prior art keywords
- phase
- weighting function
- quantization
- harmonic
- perception weighting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B65—CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
- B65G—TRANSPORT OR STORAGE DEVICES, e.g. CONVEYORS FOR LOADING OR TIPPING, SHOP CONVEYOR SYSTEMS OR PNEUMATIC TUBE CONVEYORS
- B65G51/00—Conveying articles through pipes or tubes by fluid flow or pressure; Conveying articles over a flat surface, e.g. the base of a trough, by jets located in the surface
- B65G51/02—Directly conveying the articles, e.g. slips, sheets, stockings, containers or workpieces, by flowing gases
- B65G51/03—Directly conveying the articles, e.g. slips, sheets, stockings, containers or workpieces, by flowing gases over a flat surface or in troughs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Fluid Mechanics (AREA)
- Mechanical Engineering (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Pour quantifier la phase d'un signal vocal à l'aide d'une fonction de pondération de perception l'invention prévoit un extracteur d'information de phase (100) pour obtenir la phase de chaque fréquence harmonique dans un signal vocal représenté par la somme discrète de signaux périodiques ayant des composantes de fréquence harmoniques différentes, une unité de mise en forme de bruit de quantification (110) pour contrôler la quantité de bruit de quantification de chaque phase à l'aide d'une fonction de pondération de perception, ce qui rend le bruit de quantification inférieur à une différence à peine perceptible prédéterminée de la phase, un dispositif d'assignation de bits de quantification (120) pour assigner des bits de quantification à chaque phase en fonction de la quantité contrôlée de bruit de quantification, et un quantificateur scalaire (130) pour quantifier chaque phase par les bits de quantification assignés.
Description
La présente invention concerne la quantification de la phase d'un signal
vocal, et, plus particulièrement, un dispositif pour quantifier la phase d'un signal vocal à l'aide d'une fonction de pondération de perception, et un procédé pour celui-ci. Il est essentiel de se référer aux caractéristiques de perception du système auditif humain vis-à-vis du spectre
d'un signal vocal dans les systèmes de codage de la parole.
Cependant, on a accordé peu d'attention aux
caractéristiques de perception de l'information de phase.
Récemment, certaines recherches intéressantes concernant l'importance des caractéristiques de perception de l'information de phase dans un signal vocal ont été effectuées. Il a été montré que la capacité humaine à distinguer des spectres de phase différents est meilleure
qu'on ne le suppose souvent.
Dans un dispositif pour traiter l'information concernant la phase d'un signal vocal décrit dans une demande déposée par le présent Demandeur, on a proposé un critère pour déterminer l'information de phase n'affectant pas la perception dans une section stationnaire d'un signal vocal dans le contexte de la représentation du domaine de fréquences du signal vocal. Pour les signaux harmoniques, le critère conduit à la "fréquence de phase critique" en dessous de laquelle l'information de phase n'affecte pas la qualité perçue du signal. Comme mentionné ci-dessus, le dispositif de traitement d'information de phase de signal vocal pour distinguer une composante de phase importante a été réalisé en considérant les caractéristiques auditives humaines, de telle sorte que la composante de phase du
signal vocal soit sélectivement codée ou composée.
Toutefois, il reste de nombreux problèmes à résoudre pour
quantifier plus efficacement l'information de phase.
L'un d'entre eux est la façon de quantifier efficacement l'information de phase au-dessus de la fréquence de phase critique à l'aide des caractéristiques de perception. Dans la présente invention, on aura recours à l'utilisation des caractéristiques de perception du système auditif humain pour quantifier la phase du signal vocal. Pour résoudre les problèmes ci-dessus, un objet de la présente invention est de procurer un dispositif pour quantifier la phase d'un signal vocal, celui- ci étant susceptible d'améliorer la qualité de la parole codée en quantifiant l'information de phase à l'aide d'une fonction de pondération de perception, qui rend le bruit de quantification de phase d'un signal vocal inférieur à une différence à peine perceptible (JND) prédéterminée de la
phase, et un procédé pour celui-ci.
Par conséquent, pour atteindre l'objet ci-dessus, selon un aspect de la présente invention, on propose un dispositif pour quantifier la phase d'un signal vocal à l'aide d'une fonction de pondération de perception, comprenant un extracteur d'information de phase pour obtenir la phase de chaque fréquence harmonique dans un signal vocal représenté par la somme discrète de signaux périodiques ayant des composantes de fréquence harmoniques différentes, une unité de mise en forme de bruit de quantification pour contrôler la quantité de bruit de quantification de chaque phase à l'aide d'une fonction de pondération de perception, qui rend le bruit de quantification inférieur à une différence à peine perceptible (JND) prédéterminée de la phase, un dispositif d'assignation de bits de quantification pour assigner des bits de quantification à chaque phase en fonction de la quantité contrôlée de bruit de quantification, et un quantificateur scalaire pour quantifier chaque phase par
les bits de quantification assignés.
Selon un autre aspect de la présente invention, on propose un autre dispositif pour quantifier la phase d'un signal vocal à l'aide d'une fonction de pondération de perception, comprenant un extracteur d'information de phase pour obtenir la phase de chaque fréquence harmonique dans un signal vocal représenté par la somme discrète de signaux périodiques ayant des composantes de fréquence harmoniques différentes, un calculateur de fonction de pondération de perception pour calculer une fonction de pondération de perception à l'aide d'un résultat obtenu en mesurant la différence à peine perceptible de la phase à chaque fréquence harmonique pour une note harmonique ayant la fréquence fondamentale du signal vocal, un comparateur pour comparer un livre de codes d'estimation de quantification précédemment disposé avec chaque phase en appliquant la fonction de pondération de perception, et un détecteur de valeur minimale pour détecter la valeur minimale parmi des valeurs de comparaison obtenues en séquence à partir du comparateur et délivrer en sortie l'indice du livre de codes d'estimation de quantification correspondant à la
valeur minimale.
Pour atteindre l'objet ci-dessus, selon un aspect de la présente invention, on propose un procédé pour quantifier la phase d'un signal vocal à l'aide d'une fonction de pondération de perception, comprenant les étapes consistant à (a) obtenir la phase de chaque fréquence harmonique dans un signal vocal représenté par la somme discrète de signaux périodiques ayant des composantes de fréquence harmoniques différentes, (b) calculer une fonction de pondération de perception à l'aide d'un résultat obtenu par la différence à peine perceptible de la phase à chaque fréquence harmonique pour une note harmonique ayant la fréquence fondamentale du signal vocal, (c) contrôler la quantité de bruit de quantification de chaque phase par calcul de la quantité de bruit de quantification à partir de la fonction de pondération de perception de chaque phase, (d) assigner des bits de quantification à chaque phase en fonction de la quantité contrôlée de bruit de quantification, et (e) quantifier chaque phase par les bits de quantification assignés. Selon un autre aspect de la présente invention, on propose un procédé pour quantifier la phase d'un signal vocal à l'aide d'une fonction de pondération de perception, comprenant les étapes consistant à (a) obtenir la phase de chaque fréquence harmonique dans un signal vocal représenté par la somme discrète de signaux périodiques ayant des composantes de fréquence harmoniques différentes, (b) calculer une fonction de pondération de perception à l'aide du résultat obtenu en mesurant la différence à peine perceptible d'une phase à chaque fréquence harmonique pour une note harmonique ayant la fréquence fondamentale du signal vocal, (c) comparer un livre de codes d'estimation de quantification précédemment disposé avec chaque phase en appliquant la fonction de pondération de perception, et (d) détecter la valeur minimale parmi les valeurs de comparaison obtenues en séquence lors de l'étape (d) et délivrer en sortie l'indice du livre de codes d'estimation
de quantification correspondant à la valeur minimale.
L'objet et les avantages ci-dessus de la présente invention apparaîtront de façon plus évidente en décrivant en détail une forme de réalisation préférée de celle-ci en se référant aux dessins joints, dans lesquels: La figure 1 est un schéma général destiné à décrire un dispositif de quantification de phase selon la présente invention pour une quantification scalaire; la figure 2 est un schéma général destiné à décrire un dispositif de quantification de phase selon la présente invention pour une quantification vectorielle; la figure 3 est un organigramme destiné à décrire un procédé de quantification de phase selon la présente invention; et les figures 4A à 4D montrent un exemple expérimental d'une différence à peine perceptible de phase selon la
présente invention.
La figure 1 est un schéma général destiné à décrire un dispositif de quantification de phase selon la présente invention pour une quantification scalaire. Le dispositif de quantification de phase comprend un extracteur d'information de phase 100, une unité de mise en forme de bruit de quantification 110, un dispositif d'assignation de bits de quantification 120 et un quantificateur scalaire 130. L'unité de mise en forme de bruit de quantification comprend une unité de détermination de fréquence fondamentale 112, un calculateur de fonction de pondération de perception 114, et un dispositif d'assignation de poids
116.
La figure 3 est un organigramme destiné à décrire un procédé de quantification de phase selon la présente invention. Le fonctionnement du dispositif montré en figure
1 sera décrit en détail en se référant à la figure 3.
L'extracteur d'information de phase 100 obtient une information de phase à partir d'un signal vocal devant être quantifié (étape 300). Un signal vocal s(n) peut être représenté par l'équation 1 dans un système de codage de parole harmonique, s(n) = cAkcos(koon+0k)....................... ......(1) k dans laquelle Ak, o. et 0k représentent une grandeur spectrale, une fréquence fondamentale et une phase, à une k fréquence harmonique, respectivement. Autrement dit, le signal vocal s(n) est représenté conToe étant la sonrme discrète de signaux périodiques ayant des
composantes de fréquence harmoniques différentes.
La phase quantifiée Q(0k) de la kème fréquence harmonique est représentée par l'équation 2, Q(Ok) = 0k + g.......................................(2)
dans laquelle E représente le bruit de quantification.
Lorsque l'on suppose qu'une source de bruit de quantification est un bruit blanc stationnaire avec une distribution uniforme sur un intervalle de quantification et que le bruit de quantification n'est pas corrélé à une entrée, la variation du bruit de quantification est représentée par l'équation 3,
2 1I/^\2
o3 -I-
3 32À....................................... (3)
dans laquelle A représente la taille d'une étape de quantification. Dans le cas dans lequel une quantification scalaire est effectuée vis-à-vis de la phase de chaque fréquence harmonique, lorsque l'on suppose que le nombre de bits de quantification assignés pour représenter chaque phase est de B sur la totalité de la fréquence harmonique, 2B = 2WA. A ce moment, le nombre total de bits B, pour quantifier K composantes de phase est
représenté par A, comme montré dans l'équation 4.
Btot= KB = Klog2(2/A)...............................(4) Dans la présente invention, pour rendre un signal quantifié plus voisin d'un signal original du point de vue de la perception, le bruit de quantification uniforme mentionné ci-dessus est mis en forme vis-à-vis de chaque phase à l'aide d'une fonction de pondération de perception à chaque fréquence harmonique. A ce moment, dans le dispositif et le procédé de quantification selon la présente invention, davantage de bits sont assignés aux composantes de phase inmportantes du point de vue de la perception, tout en conservant le nombre total de bits pour toutes les composantes de phase à un nombre identique à celui du cas
dans lequel le bruit de quantification est uniforme.
Si l'on se réfère aux figures 1 et 3, l'unité de mise en forme de bruit de quantification 110 contrôle la taille de l'étape de quantification de chaque phase à l'aide d'une fonction de pondération de perception, ce qui rend le bruit de quantification inférieur à une différence de phase à peine perceptible prédéterminée. La différence à peine perceptible obtenue à l'aide d'une expérience orientée sur l'être humain représente le plus bas niveau de bruit de quantification auquel un changement de phase est perceptible par des oreilles humaines. Autrement dit, des êtres humains détectent le changement de phase lorsque le bruit de quantification est supérieur ou égal à la
différence à peine perceptible.
Une façon de contrôler la grandeur du bruit de quantification à l'aide de la fonction de pondération de
perception va à présent être décrite.
Selon l'équation 3, le bruit de quantification est corrélé à l'étape de quantification, et la taille de l'étape de quantification varie en fonction de chaque fréquence harmonique. La taille de l'étape de quantification à la kème fréquence harmonique est O10 représentée par l'équation 5, Ak= V *. ............................................. (. (5) dans laquelle k représente une fonction de pondération de perception, et une valeur k plus petite indique qu'une
phase est plus importante du point de vue de la perception.
Si le nombre de bits de quantification pour la phase 0k est désigné par Bk, le nombre total de bits nécessaires pour quantifier K composantes de phase peut être représenté par l'équation 6 en rendant le nombre total de bits pour toutes les composantes de phase égal à celui de l'équation 4, comme mentionné ci-dessus,
K K
Btot=_ Bk=> Iog2(2nIAk)=Klog2(2nr/A)...(6) k=1 k-1 Si l'on inclut l'équation 5 dans l'équation 6, on obtient l'équation 7, AK vK= ^...(7) 1n1=1 4 Finalement, la variation du bruit de quantification de la phase à la kee fréquence harmonique est représentée par l'équation 8, 2 1,k)2
3 _ 2...(8)
k3 2 dans laquelle la taille de l'étape de quantification pour la phase 0k est représentée par l'équation 9, k=K K...(9) On note à partir de l'équation 9 que la quantité de bruit de quantification est contrôlée à l'aide de la fonction de pondération
de perception.
Dans l'unité de mise en forme de bruit de quantification 110, l'unité de détermination de fréquence fondamentale 112 obtient une fréquence fondamentale à partir du signal vocal représenté par l'équation 1. Le calculateur de fonction de pondération de perception 114 calcule la fonction de pondération de perception à l'aide du résultat obtenu en mesurant la différence à peine perceptible de la phase à chaque fréquence harmonique vis-à-vis
d'une note harmonique ayant une fréquence fondamentale (étape 310).
La différence à peine perceptible est un terme psychoacoustique, qui est utilisé, dans la présente invention, pour des expériences sur le sens auditif humain vis-à-vis de changements de phase. La différence à peine perceptible de la phase a été précédenmnent mesurée pour une
note périodique de spectre plat et de phase nulle.
Le dispositif d'assignation de poids 116 contrôle la quantité de bruit de quantification de chaque phase en calculant la quantité de bruit de quantification à partir de la fonction de pondération de perception de chaque phase calculée par le calculateur de fonction de pondération de perception 114. Autrement dit, le dispositif d'assignation de poids 116 assigne la taille de l'étape de quantification obtenue par l'équation 9 conmne poids pour chaque phase obtenue par l'extracteur d'information de phase 100 (étape 320). Le dispositif d'assignation de bits de quantification 120 assigne un bit de quantification à chaque phase en fonction de la quantité de bruit de quantification contrôlée par l'interrmédiaire du
dispositif de contrôle de bruit de quantification 110 (étape 330).
Autrement dit, le bit de quantification de chaque phase est obtenu en mettant la taille de l'étape de quantification obtenue par l'équation 9 dans l'équation 6. Le quantificateur scalaire 130
quantifie chaque phase par le bit de quantification assigné.
Une forme de réalisation, dans laquelle la fonction de pondération de perception est calculée par le calculateur de fonction de pondération de perception 114, va à présent
être décrite.
Pour obtenir une fonction de pondération de perception appropriée, des expériences psychoacoustiques ont été effectuées pour mesurer la différence à peine perceptible d'une phase pour une note périodique de spectre plat avec la durée de 512 ms. Le niveau du signal était de 52 dB/composante dans toutes les expériences, et les nombres d'harmoniques ont été établis à 39, 26, 19 et 11 pour les fréquences fondamentales de 100, 150, 200 et 350 Hz, respectivement. Les figures 4A à 4D montrent les différences à peine perceptibles des phases dans les fréquences harmoniques respectives pour les notes harmoniques ayant les fréquences fondamentales de 100, 150, 200 et 350 Hz. La fonction de pondération de perception est superposée sur le graphique sous la forme d'une ligne de traits pleins. Dans les figures 4A à 4D, une différence à peine perceptible inférieure indique que la modification de la phase à une fréquence harmonique correspondante est tout à fait perceptible pour les êtres humains. On note grâce à des expériences que la différence à peine perceptible de la phase est très élevée aux basses fréquences, qu'elle est minimale dans la plage des fréquences moyennes, et qu'elle
augmente ensuite à nouveau aux fréquences élevées.
La fonction de pondération de perception est représentée par l'équation 10, sous la forme de la fonction d'un indice harmonique k, %k = ak2 + bk + c................................(10) dans laquelle a, b et c sont estimés à partir des différences à peine perceptibles mesurées de la phase. Au lieu de construire un polynôme approprié pour la différence à peine perceptible mesurée, l'utilisation explicite de certaines conditions, qui se sont révélées être utiles pour la génération de la fonction de pondération vis-à-vis des différentes fréquences fondamentales, a été adoptée. Tout d'abord, la fonction de pondération k est définie pour K < k < K, K étant l'indice harmonique maximal et K étant l'indice d'une fréquence de phase critique, qui est représenté par l'équation 11, K =FrQe( 1-)-0 51...(11) dans laquelle f0, Qu et BWn représentent une fréquence fondamentale, une qualité de filtre asymptotique aux fréquences élevées, et la largeur de bande minimale pour les canaux de basse fréquence. Cette hypothèse est raisonnable, car il s'est avéré que l'information de phase en dessous de la fréquence de phase critique n'affectait pas la qualité perçue. Egalement, la fonction de pondération de perception est supposée avoir son maximum (=1) à K-1 et K, sur la base de l'étude des mesures de différence à peine perceptible pour différentes fréquences fondamentales. De plus, le minimum de la fonction de pondération de perception est déterminé de façon empirique par le rapport de la différence à peine perceptible
minimale à la différence à peine perceptible maximale.
Le tableau 1 montre des résultats d'essai d'écoute selon la présente invention. PQN indique le pourcentage de la réponse montrant que le bruit de quantification, auquel est appliquée la fonction de pondération de perception, est sélectionné conme étant
égal au signal original ou très proche de celui-ci.
Tableau 1
Locuteur, voyelle F0O[Hz] PQN (%) A = 2/3 A = 2n/5 Homme, /a/ 145,5 78% 72% Homme, /i/ 127,0 85% 72% Femme, /a/ 205,1 54% 46% Femme, /i/ 266,7 50% 50% A partir des résultats, on peut voir une nette
préférence pour le bruit de quantification pondéré vis-à-
vis de la perception dans la parole masculine. De plus, le A plus petit signifie que plus de bits sont assignés dans
l'information de phase.
Le dispositif et le procédé de quantification utilisant la fonction de pondération de perception sont décrits en prenant comme exemple la quantification scalaire. Toutefois, la fonction de pondération de perception peut être utilisée dans la métrique de distorsion pour la
quantification vectorielle.
La figure 2 est un schéma général destiné à décrire le dispositif de quantification de phase selon la présente invention pour la quantification vectorielle. Le dispositif de quantification de phase comprend un extracteur d'information de phase 200, une unité de détermination de fréquence fondamentale 210, un calculateur de fonction de pondération de perception 220, un comparateur 230, un livre de codes d'estimation de quantification 240, et un
détecteur de valeur minimale 250. Ici, la description des
éléments décrits en se référant à la figure 1 sera omise.
Le comparateur 230 compare le livre de codes d'estimation de quantification précédemment disposé 240 avec chaque phase en appliquant la fonction de pondération de perception de chaque phase, calculée par le calculateur de fonction de pondération de perception 220. Par exemple, lorsqu'une information de phase obtenue par le signal vocal est représentée par 0 = [01, 02. . .. 0k] t et que l'un des éléments d'information de phase mémorisés dans le livre de codes d'estimation de quantification 240 est représenté par fi, le comparateur 230 obtient D(0Oi) vis-à-vis de l'information de phase d'entrée et de tous les éléments d'information de phase mémorisés dans le livre de codes d'estimation de quantification 240. A ce moment, D est représenté par D = 3 (1--k)J [0k -] en ajoutant la k fonction de pondération de perception. Le détecteur de valeur minimale 250 détecte la valeur minimale parmi les valeurs de comparaison obtenues en séquence par le comparateur 230 et délivre en sortie l'indice du livre de codes d'estimation de quantification 240 correspondant à la valeur minimale. Comme mentionné cidessus, la qualité de la parole codée est améliorée en quantifiant l'information de phase à l'aide de la fonction de pondération de perception.
Claims (8)
1. Dispositif pour quantifier la phase d'un signal vocal à l'aide d'une fonction de pondération de perception, caractérisé en ce qu'il comprend: un extracteur d'information de phase (100) pour obtenir la phase de chaque fréquence harmonique dans un signal vocal représenté par la somme discrète de signaux périodiques ayant des composantes de fréquence harmoniques différentes; une unité de mise en forme de bruit de quantification (110) pour contrôler la quantité de bruit de quantification de chaque phase à l'aide d'une fonction de pondération de perception, qui rend le bruit de quantification inférieur à une différence à peine perceptible prédéterminée de la phase; un dispositif d'assignation de bits de quantification (120) pour assigner des bits de quantification à chaque phase en fonction de la quantité contrôlée de bruit de quantification; et un quantificateur scalaire (130) pour quantifier chaque
phase par les bits de quantification assignés.
2. Dispositif selon la revendication 1, caractérisé en ce que l'unité de mise en forme de bruit de quantification (110) comprend: une unité de détermination de fréquence fondamentale (112) pour obtenir une fréquence fondamentale à partir du signal vocal; un calculateur de fonction de pondération de perception (114) pour calculer une fonction de pondération de perception à l'aide d'un résultat obtenu en mesurant la différence à peine perceptible de la phase à chaque fréquence harmonique vis-à-vis d'une note harmonique ayant la fréquence fondamentale; et un dispositif d'assignation de poids (116) pour contrôler la quantité de bruit de quantification de chaque phase en calculant la quantité de bruit de quantification à partir de la fonction de pondération de perception de
chaque phase.
3. Dispositif pour quantifier la phase d'un signal vocal à l'aide d'une fonction de pondération de perception, caractérisé en ce qu'il comprend: un extracteur d'information de phase (200) pour obtenir la phase de chaque fréquence harmonique dans un signal vocal représenté par la somme discrète de signaux périodiques ayant des composantes de fréquence harmoniques différentes; un calculateur de fonction de pondération de perception (220) pour calculer une fonction de pondération de perception à l'aide d'un résultat obtenu en mesurant la différence à peine perceptible de la phase à chaque fréquence harmonique pour une note harmonique ayant la fréquence fondamentale du signal vocal; un comparateur (230) pour comparer un livre de codes d'estimation de quantification précédemment disposé (240) avec chaque phase en appliquant la fonction de pondération de perception; et un détecteur de valeur minimale (250) pour détecter la valeur minimale parmi des valeurs de comparaison obtenues en séquence à partir du comparateur (230) et délivrer en sortie l'indice du livre de codes d'estimation de
quantification (240) correspondant à la valeur minimale.
4. Procédé pour quantifier la phase d'un signal vocal à l'aide d'une fonction de pondération de perception, caractérisé en ce qu'il comprend les étapes suivantes: (a) l'obtention de la phase de chaque fréquence harmonique dans un signal vocal représenté par la somme discrète de signaux périodiques ayant des composantes de fréquence harmoniques différentes; (b) le calcul d'une fonction de pondération de perception à l'aide d'un résultat obtenu par la différence à peine perceptible de la phase à chaque fréquence harmonique pour une note harmonique ayant la fréquence fondamentale du signal vocal; (c) le contrôle de la quantité de bruit de quantification de chaque phase en calculant la quantité de bruit de quantification à partir de la fonction de pondération de perception de chaque phase; (d) l'assignation de bits de quantification à chaque phase en fonction de la quantité contrôlée de bruit de quantification; et (e) la quantification de chaque phase par les bits de
quantification assignés.
5. Procédé selon la revendication 4, caractérisé en ce que la fonction de pondération de perception est représentée sous la forme d'une fonction d'un indice harmonique k par l'équation suivante lors de l'étape (b), k = ak2 + bk + c dans laquelle a, b et c sont estimés à partir de la
différence à peine perceptible d'une phase mesurée.
6. Procédé selon la revendication 4, caractérisé en ce que la quantité de bruit de quantification est représentée sous la forme d'une fonction d'un indice harmonique k par l'équation suivante dans un dispositif d'assignation de poids (116) lors de l'étape (c), k K A dans laquelle k est une fonction de pondération de perception et A
est une taille d'étape de quantification.
7. Procédé pour quantifier la phase d'un signal vocal à l'aide d'une fonction de pondération de perception, caractérisé en ce qu'il comprend les étapes suivantes: (a) l'obtention de la phase de chaque fréquence harmonique dans un signal vocal représenté par la sorme discrète de signaux périodiques ayant des composantes de fréquence harmoniques différentes; (b) le calcul d'une fonction de pondération de perception à l'aide du résultat obtenu en mesurant la différence à peine perceptible d'une phase à chaque fréquence harmonique pour une note harmonique ayant la fréquence fondamentale du signal vocal; (c) la comparaison d'un livre de codes d'estimation de quantification précédemment disposé (240) avec chaque phase en appliquant la fonction de pondération de perception; et (d) la détection de la valeur minimale parmi les valeurs de comparaison obtenues en séquence lors de l'étape (d) et la délivrance en sortie de l'indice du livre de codes d'estimation de quantification (240) correspondant à
la valeur minimale.
8. Procédé selon la revendication 7, caractérisé en ce qu'une fonction de pondération de perception, sous la forme d'une fonction d'un indice harmonique k, est représentée par l'équation suivante lors de l'étape (b), k = ak2 + bk + c dans laquelle a, b et c sont estimés à partir de la
différence à peine perceptible de la phase mesurée.
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020000026180A KR100363259B1 (ko) | 2000-05-16 | 2000-05-16 | 인지 특성 가중 함수를 이용한 음성신호의 위상 양자화장치 및 방법 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| FR2809221A1 true FR2809221A1 (fr) | 2001-11-23 |
| FR2809221B1 FR2809221B1 (fr) | 2003-01-17 |
Family
ID=19668775
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| FR0012798A Expired - Fee Related FR2809221B1 (fr) | 2000-05-16 | 2000-10-06 | Dispositif pour quantifier la phase d'un signal vocal a l'aide d'une fonction de ponderation de perception, et procede pour celui-ci |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US6577995B1 (fr) |
| JP (1) | JP2001331200A (fr) |
| KR (1) | KR100363259B1 (fr) |
| DE (1) | DE10049464A1 (fr) |
| FR (1) | FR2809221B1 (fr) |
| GB (1) | GB2362549B (fr) |
Families Citing this family (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7640156B2 (en) * | 2003-07-18 | 2009-12-29 | Koninklijke Philips Electronics N.V. | Low bit-rate audio encoding |
| GB2426167B (en) * | 2005-05-09 | 2007-10-03 | Toshiba Res Europ Ltd | Noise estimation method |
| GB2437868B (en) * | 2005-05-09 | 2009-12-02 | Toshiba Res Europ Ltd | Noise estimation method |
| KR101386645B1 (ko) * | 2007-09-19 | 2014-04-17 | 삼성전자주식회사 | 모바일 기기에서 지각적 오디오 코딩 장치 및 방법 |
| US8457976B2 (en) | 2009-01-30 | 2013-06-04 | Qnx Software Systems Limited | Sub-band processing complexity reduction |
| EP2355094B1 (fr) * | 2010-01-29 | 2017-04-12 | 2236008 Ontario Inc. | Réduction de la complexité de traitement de sous-bande |
| CN102708872B (zh) * | 2012-06-11 | 2013-08-21 | 武汉大学 | 3d音频中水平方位参数码本获取方法 |
| CN116246644A (zh) * | 2023-02-27 | 2023-06-09 | 西安电子科技大学广州研究院 | 一种基于噪声分类的轻量级语音增强系统 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5388181A (en) * | 1990-05-29 | 1995-02-07 | Anderson; David J. | Digital audio compression system |
| EP0709827A2 (fr) * | 1994-10-28 | 1996-05-01 | Mitsubishi Denki Kabushiki Kaisha | Dispositif et méthode de codage et décodage de la parole et dispositif pour extraire une caractéristique de phase et d'amplitude |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3246715B2 (ja) | 1996-07-01 | 2002-01-15 | 松下電器産業株式会社 | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
| JPH11224099A (ja) * | 1998-02-06 | 1999-08-17 | Sony Corp | 位相量子化装置及び方法 |
-
2000
- 2000-05-16 KR KR1020000026180A patent/KR100363259B1/ko not_active Expired - Fee Related
- 2000-09-29 US US09/672,973 patent/US6577995B1/en not_active Expired - Fee Related
- 2000-10-05 GB GB0024395A patent/GB2362549B/en not_active Expired - Lifetime
- 2000-10-06 DE DE10049464A patent/DE10049464A1/de not_active Withdrawn
- 2000-10-06 FR FR0012798A patent/FR2809221B1/fr not_active Expired - Fee Related
- 2000-12-26 JP JP2000395078A patent/JP2001331200A/ja active Pending
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5388181A (en) * | 1990-05-29 | 1995-02-07 | Anderson; David J. | Digital audio compression system |
| EP0709827A2 (fr) * | 1994-10-28 | 1996-05-01 | Mitsubishi Denki Kabushiki Kaisha | Dispositif et méthode de codage et décodage de la parole et dispositif pour extraire une caractéristique de phase et d'amplitude |
Non-Patent Citations (3)
| Title |
|---|
| DOH-SUK KIM ET AL: "On the perceptual weighting function for phase quantization of speech", 2000 IEEE WORKSHOP ON SPEECH CODING. PROCEEDINGS. MEETING THE CHALLENGES OF THE NEW MILLENNIUM (CAT. NO.00EX421), DELAVAN, WI, USA, 17-20 SEPT. 2000, 2000, Piscataway, NJ, USA, IEEE, USA, pages 62 - 64, XP002171475, ISBN: 0-7803-6416-3 * |
| GOTTESMANN O: "Dispersion phase vector quantization for enhancement of waveform interpolative coder", 1999 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING. PROCEEDINGS. ICASSP99 (CAT. NO.99CH36258), PHOENIX, AZ, USA, 15-19, 1999, Piscataway, NJ, USA, IEEE, USA, pages 269 - 272 vol.1, XP002171476, ISBN: 0-7803-5041-3 * |
| POBLOTH H ET AL: "ON PHASE PERCEPTION IN SPEECH", PHOENIX, AZ, MARCH 15 - 19, 1999,NEW YORK, NY: IEEE,US, 15 March 1999 (1999-03-15), pages 29 - 32, XP000898257, ISBN: 0-7803-5042-1 * |
Also Published As
| Publication number | Publication date |
|---|---|
| GB2362549A (en) | 2001-11-21 |
| JP2001331200A (ja) | 2001-11-30 |
| DE10049464A1 (de) | 2001-11-22 |
| US6577995B1 (en) | 2003-06-10 |
| KR100363259B1 (ko) | 2002-11-30 |
| FR2809221B1 (fr) | 2003-01-17 |
| GB2362549B (en) | 2004-06-16 |
| GB0024395D0 (en) | 2000-11-22 |
| KR20010105587A (ko) | 2001-11-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10236015B2 (en) | Encoding device and method, decoding device and method, and program | |
| RU2417456C2 (ru) | Системы, способы и устройства для обнаружения изменения сигналов | |
| CN101443842B (zh) | 信息信号编码 | |
| RU2387025C2 (ru) | Способ и устройство для векторного квантования спектрального представления огибающей | |
| KR100304092B1 (ko) | 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치 | |
| RU2651218C2 (ru) | Гармоническое расширение полосы аудиосигналов | |
| US4704730A (en) | Multi-state speech encoder and decoder | |
| TW563094B (en) | Method and apparatus for high performance low bit-rate coding of unvoiced speech | |
| JP2009244886A (ja) | 情報源符号化システムの性能向上装置 | |
| JP2009539132A (ja) | オーディオ信号の線形予測符号化 | |
| KR20070087222A (ko) | 음성 코더용 스펙트럼 크기 양자화 방법 | |
| CN105264597A (zh) | 感知转换音频编码中的噪声填充 | |
| CN102612712A (zh) | 低频带音频信号的带宽扩展 | |
| TW440812B (en) | An adaptive criterion for speech coding | |
| RU2006130966A (ru) | Устройство и способ определения величины шага квантователя | |
| FR2809221A1 (fr) | Dispositif pour quantifier la phase d'un signal vocal a l'aide d'une fonction de ponderation de perception, et procede pour celui-ci | |
| AU2015295624B2 (en) | Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals | |
| WO2015146224A1 (fr) | Procédé d'encodage, dispositif d'encodage, programme et support d'enregistrement | |
| EP2663978A1 (fr) | Appareil d'encodage/de décodage audio | |
| AU2014392320A1 (en) | Audio coding method and related apparatus | |
| KR100682890B1 (ko) | 비트량 고속제어가 가능한 오디오 부호화 방법 및 장치 | |
| JP4596197B2 (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 | |
| CN101198041B (zh) | 矢量量化方法及装置 | |
| JP5336942B2 (ja) | 符号化方法、復号方法、符号化器、復号器、プログラム | |
| JP2009210644A (ja) | 線形予測係数算出装置、線形予測係数算出方法、線形予測係数算出プログラム、および記憶媒体 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| ST | Notification of lapse |
Effective date: 20100630 |