EP1859608A1 - Procédé de création automatique d'étiquettes vocales dans un carnet d'adresses - Google Patents

Procédé de création automatique d'étiquettes vocales dans un carnet d'adresses

Info

Publication number
EP1859608A1
EP1859608A1 EP06726029A EP06726029A EP1859608A1 EP 1859608 A1 EP1859608 A1 EP 1859608A1 EP 06726029 A EP06726029 A EP 06726029A EP 06726029 A EP06726029 A EP 06726029A EP 1859608 A1 EP1859608 A1 EP 1859608A1
Authority
EP
European Patent Office
Prior art keywords
address book
user
contact
voice
name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP06726029A
Other languages
German (de)
English (en)
Inventor
Laurent Aubertin
Delphine Charlet
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of EP1859608A1 publication Critical patent/EP1859608A1/fr
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/274Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc
    • H04M1/2745Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips
    • H04M1/2753Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips providing data content
    • H04M1/2757Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips providing data content by data transmission, e.g. downloading
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q2213/00Indexing scheme relating to selecting arrangements in general and for multiplex systems
    • H04Q2213/13378Speech recognition, speech analysis

Definitions

  • the present invention relates to a method of automatically creating voice tags in a first address book of a user from a second address book of said user.
  • the invention finds a particularly advantageous application in the field of the management of address books, whether they are embedded in a terminal or located in a telecommunication network.
  • - recognition without a voice tag These technologies make it possible to create speech services with speech analysis without the user having to make prior recordings of sequences that he will use later. A string of characters is sufficient to build the pattern of recognition. These systems are intended to create a textual reference associated with the result of the speech analysis performed. They are generally quite heavy and require a lot of computing power, which is why they are generally located in telecommunication networks. On the other hand, their field of application is broad since they can be implemented whatever the speaker, one speaks then of "flexible" recognition. - recognition with voice tag:
  • Voice recognition mechanisms with and without tags can be combined. This combination makes the most of both technologies. This is because unlabeled voice recognition provides dynamic awareness of new contacts without prior registration and creation of contacts from the contact's textual reference, while voice recognition with a tag facilitates, for example, the recognition of names. of foreign origin or with specific pronunciations that are not handled correctly in the case of flexible recognition. This is notably the case of foreign origin names for which the phonetization is not made correctly and / or the phonemes do not exist in the language of the system (for example, the Spanish name "Jorge", whose phonemes corresponding to the letters "j, g" and "r” do not exist in French).
  • known address book services that involve associating in a directory a contact defined by a name to at least one number of a communication mode of said contact, for example a mobile phone number or fixed .
  • the selection of the contact in the address book leads directly to the composition of said number of a communication mode.
  • This type of address book service can be implemented directly in the terminal, mobile phone for example, a user or in a telecommunications network. In the latter case, the user can access the service through an interface with the network.
  • a network address book service can be easily equipped with voice recognition systems with or without a label, or mixed, it is not the same for terminals such as mobile phones that can hardly receive speech recognition systems without a label given the computing power required, or voice recognition systems with tags due to their cumbersome initialization.
  • the technical problem to be solved by the object of the present invention is to propose a method of automatically creating voice tags in a user's first address book from a second address book of said user.
  • said second address book being associated with a voice tag creation module, which would make it possible to create in the first address book a recognition system with voice tags in a very simple and transparent manner for the user; that is, without having to perform the tedious procedure of creating voice tags.
  • the solution to the technical problem posed consists, according to the present invention, in that said method comprises the steps of: for the user, - creating in said second address book a contact defined by a name and at least one number a mode of communication of said contact,
  • said sound sequence is created during the use of the second address book.
  • said first address book is located in a user's telephone terminal, and said second address book is a network address book of said user.
  • the module for creating voice tags in the network is capable after analysis of a sequence of distinguishing at least the name of the contact and, possibly, the mode of communication if, as provided the invention, said sound sequence also contains said communication mode of the contact.
  • the contact has only one number of a communication mode, its presence in the sound sequence is not mandatory.
  • These different parts, name and mode of communication can be identified and stored as sound files. They are then associated with the contact's phone numbers. After synchronization, contacts and sound sequences are found in the address book of the user's terminal, a mobile phone for example. The sound sequences are then directly usable by the voice recognition system with embedded label in the mobile phone.
  • the voice recognition system embedded in the terminal has a voice tag corresponding to the contact, acquired and validated using another service, namely that of the network address book and this in a manner transparent to the user.
  • said first address book is a network address book of the user
  • said second address book is located in a telephone terminal of said user.
  • a voice tag may be associated with a contact in the user's terminal, for example a mobile phone. After synchronization, this tag is transferred to the network address book, coupled with a speech recognition platform. If the platform is mixed, it will be able to take advantage of the voice tag to handle special cases, such as the foreign-originated names mentioned above and for which the unlabeled speech recognition is inoperative.
  • an advantageous provision of the invention consists in that said voice tag created in the first address book is translated into textual reference.
  • An example of application of this provision is the creation in the network address book of a voice tag from the user's terminal, followed by its translation into a textual reference by a generic voice recognition module, on the first names for example, so as to be able to implement in the network address book a voice recognition without a tag, especially if the service does not have a means of mixed recognition.
  • the invention also relates to a unit for automatically creating voice tags in a first address book of a user from a second address book of said user, said second address book being associated with a user module.
  • voice tag creation notable in that said unit comprises:
  • the invention also relates to a telephone terminal comprising an automatic voice tag creation unit according to the invention.
  • the invention relates to a computer program intended to be implemented in the terminal according to the invention to execute a method of automatically creating voice tags in a first address book of a user from a second address book of said user, said second address book being associated with a voice tag creation module, said program comprising:
  • Figure 1 is a schematic diagram of a communication system between a user's terminal and a network address book service.
  • Figure 1 a terminal 10 of a user, such as a mobile phone or fixed.
  • This terminal 10 is equipped with an embedded voice recognition system and an address book for managing contacts.
  • Said user is, moreover, subscribed to a network address book service 20 through a telecommunications network 1.
  • the elements of the network address book service 20 are as follows:
  • an address book module 21 itself that provides the classical services of managing contacts. However, compared to the known network address book services, this module 21 manages at least one additional attribute, namely a voice tag associated with each communication mode of a given contact (mobile telephone, fixed or any other mode of communication). communication).
  • a module 22 for voice access to the network address book which manages the voice exchanges with the user and accesses the data of said network address book.
  • a voice tag creation module 23 which is very strongly coupled to the voice access module 22. It identifies in the dialogue between the voice server and the user the sound sequences corresponding to the designation of a contact and its mode of communication. When the number of repetitions obtained for the designation of a contact is sufficient, for example two, to create the contact recognition model in the voice tag mode, it provides the voice recognition module of the terminal 10, the signal portions audio, or sound files, corresponding to the contacts. For example, he can provide segments corresponding to the pronunciation of "Paul" extracted from two uses of the network address book service: "Call Paul on his mobile" and "Call Paul home".
  • a synchronization server 24 which makes it possible to synchronize the data of the contacts between the network address book module 21 and the address book of the fixed or mobile terminals benefiting from this function. Synchronization helps to maintain consistent sets of similar data. For example, synchronizing contacts from a network address book to the address book of a mobile phone.
  • the synchronization protocols (for example SyncML) make it possible to synchronize not only fields containing alpha numeric characters, but also files, for example a photo or a sound sequence associated with a contact.
  • the automatic voice tag creation method according to the invention can be illustrated by the following scenario:
  • the user after having subscribed to the network address book service 20, directly creates, or through an application or a service, a contact defined by a name "John” in the book of network addresses.
  • the personal and mobile phone numbers of the "John" contact are also provided.
  • the user connects to the voice access module 20 of the network address book 20 and pronounces the sound sequence "John at home”, which is transmitted to the voice tag creation module 23 which then associates the tag voice "Jean at home", created as a sound file, at the phone number of the contact "Jean”. It is understood that this voice tag is obtained by the normal use of the network address book, without intervention or effort of the user. This constitutes an essential advantage of the invention.
  • the voice tag creation module 23 combines the voice tag "John on his mobile” to the mobile phone number of the contact "John".
  • the user then synchronizes the network address book with the address book of its terminal 10 equipped with a voice recognition system with tag.
  • the "John” contact, the two telephone numbers and the two audio labels are available on the terminal 10. if the user activates voice recognition on his terminal 10 and pronounces "John at home", the corresponding number is dialed by the terminal 10.
  • the user accesses the network address book service 20 and pronounces, assuming that only one repetition is necessary for the creation of the embedded voice recognition models:
  • the module 23 for creating voice tags identifies in the audio streams the speech segments corresponding to the pronunciations of "Laurent”, “at home”, “Pierre”, “on his mobile”. He can then:
  • a generic voice recognition module on the first names makes it possible to generate the most probable first name according to the vocal labels. This module recognizes "Jerome".
  • a validation phase for example by voice synthesis, can be useful: the system asks "did you say” Jerome ""?
  • the system has the sequence of phonemes corresponding to the voice tag, and can generate the textual reference, and thus enrich the network address book, the latter working in this example only from textual entries.
  • the voice recognition module on the first names can be replaced or supplemented by a phoneme sequence recognition module, to extract the most likely sequence, different from a first name, in order to manage the cases of diminutives or rare names.

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Human Computer Interaction (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

Procédé de création automatique d'étiquettes vocales dans un premier carnet d'adresses d'un utilisateur à partir d'un deuxième carnet d'adresses dudit utilisateur, ledit deuxième carnet d'adresses étant associé à un module (23) de création d'étiquettes vocales. Selon l'invention, ledit procédé comprend les étapes consistant à : pour l'utilisateur, -créer dans ledit deuxième carnet d'adresses un contact défini par un nom et au moins un numéro d'un mode de communication dudit contact, -transmettre audit module (23) de création d'étiquettes vocales une séquence sonore contenant au moins le nom dudit contact, pour le module (23) de création d'étiquettes vocales, -créer à partir de ladite séquence sonore un fichier son et l'associer audit numéro d'un mode de communication dudit contact dans le deuxième carnet d'adresses, pour l'utilisateur, -synchroniser ledit premier carnet d'adresses avec le deuxième carnet d'adresses. A lication à la gestion de carnet d'adresses.

Description

PROCEDE DE CREATION AUTOMATIQUE D'ETIQUETTES VOCALES DANS UN CARNET D'ADRESSES
La présente invention concerne un procédé de création automatique d'étiquettes vocales dans un premier carnet d'adresses d'un utilisateur à partir d'un deuxième carnet d'adresses dudit utilisateur.
L'invention trouve une application particulièrement avantageuse dans le domaine de la gestion de carnets d'adresses, qu'ils soient embarqués dans un terminal ou implantés dans un réseau de télécommunication.
On connaît de l'état de la technique divers systèmes de reconnaissance vocale : - la reconnaissance sans étiquette vocale : Ces technologies permettent de créer des services vocaux avec analyse de la parole sans que l'utilisateur soit obligé de réaliser des enregistrements préalables de séquences qu'il utilisera par la suite. Une chaîne de caractère est suffisante pour construire le modèle de reconnaissance. Ces systèmes sont destinés à créer une référence textuelle associée au résultat de l'analyse de la parole effectuée. Ils sont en général assez lourds et exigent une puissance de calcul importante, c'est pourquoi ils sont en général implantés dans les réseaux de télécommunication. Par contre, leur champ d'application est large puisqu'ils peuvent être mis en œuvre quel que soit le locuteur, on parle alors de reconnaissance « flexible ». - la reconnaissance avec étiquette vocale :
D'autres systèmes nécessitent que l'utilisateur enregistre préalablement les séquences sonores pour créer les modèles des mots du vocabulaire utilisables dans le dialogue à reconnaître. En général, ils nécessitent deux répétitions d'un mot pour créer le modèle de reconnaissance vocale associé. Ces systèmes sont plus légers et peuvent être embarqués, notamment dans les téléphones mobiles. En revanche, la nécessité de prononcer les mots du vocabulaire pour créer leurs modèles avant la première utilisation est assez peu ergonomique, et peut être un frein à l'utilisation de cette technologie. D'autre part, il faut aussi remarquer que ce type de reconnaissance vocale ne vaut que pour le locuteur qui l'a initialisée. - la reconnaissance vocale mixte :
Les mécanismes de reconnaissance vocale avec et sans étiquette peuvent être combinés. Cette association permet de tirer le meilleur parti des deux technologies. En effet, la reconnaissance vocale sans étiquette offre une prise en compte dynamique de nouveaux contacts sans enregistrement préalable et la création de contacts à partir de la référence textuelle du contact, tandis que la reconnaissance vocale avec étiquette facilite, par exemple, la reconnaissance des noms d'origine étrangère ou avec des prononciations spécifiques qui ne sont pas traités correctement dans le cas de la reconnaissance flexible. C'est le cas notamment des noms d'origine étrangères pour lesquels la phonétisation n'est pas faite correctement et/ou les phonèmes n'existent pas dans la langue du système (par exemple, le prénom espagnol "Jorge", dont les phonèmes correspondant aux lettres "j,g" et "r" n'existent pas en français).
D'autre part, on connaît les services de carnet d'adresses qui consistent à associer dans un répertoire un contact défini par un nom à au moins un numéro d'un mode de communication dudit contact, par exemple un numéro de téléphone mobile ou fixe. La sélection du contact dans le carnet d'adresses conduit directement à la composition dudit numéro d'un mode de communication. Ce type de service de carnet d'adresses peut être implanté directement dans le terminal, téléphone mobile par exemple, d'un utilisateur ou dans un réseau de télécommunication. Dans ce dernier cas, l'utilisateur peut accéder au service par une interface avec le réseau.
On comprend que, si un service de carnet d'adresses réseau peut être facilement équipé de systèmes de reconnaissance vocale avec ou sans étiquette, ou mixte, il n'en est pas de même pour des terminaux comme les téléphones mobiles qui peuvent difficilement recevoir des systèmes de reconnaissance vocale sans étiquette compte tenu de la puissance de calcul exigée, ou des systèmes de reconnaissance vocale avec étiquette du fait de leur lourdeur à l'initialisation.
Aussi, le problème technique à résoudre par l'objet de la présente invention est de proposer un procédé de création automatique d'étiquettes vocales dans un premier carnet d'adresses d'un utilisateur à partir d'un deuxième carnet d'adresses dudit utilisateur, ledit deuxième carnet d'adresses étant associé à un module de création d'étiquettes vocales, qui permettrait de créer dans le premier carnet d'adresses un système de reconnaissance avec étiquettes vocales de manière très simple et transparente pour l'utilisateur, c'est-à-dire sans avoir à effectuer la procédure fastidieuse de création d'étiquettes vocales.
La solution au problème technique posé consiste, selon la présente invention, en ce que ledit procédé comprend les étapes consistant à : pour l'utilisateur, - créer dans ledit deuxième carnet d'adresses un contact défini par un nom et au moins un numéro d'un mode de communication dudit contact,
- transmettre audit module de création d'étiquettes vocales une séquence sonore contenant au moins le nom dudit contact, pour le module de création d'étiquettes vocales, - créer à partir de ladite séquence sonore un fichier son et l'associer audit numéro d'un mode de communication dudit contact dans le deuxième carnet d'adresses, pour l'utilisateur,
- synchroniser ledit premier carnet d'adresses avec le deuxième carnet d'adresses.
En particulier, ladite séquence sonore est créée durant l'utilisation du deuxième carnet d'adresses.
Selon un premier mode de réalisation de l'invention, ledit premier carnet d'adresses est implanté dans un terminal téléphonique de l'utilisateur, et ledit deuxième carnet d'adresses est un carnet d'adresses réseau dudit utilisateur.
Dans ce cas, le module de création d'étiquettes vocales dans le réseau est capable après analyse d'une séquence de distinguer au moins le nom du contact et, éventuellement, le mode de communication si, comme le prévoit l'invention, ladite séquence sonore contient également ledit mode de communication du contact. On remarquera que, si le contact n'a qu'un seul numéro d'un mode de communication, sa présence dans la séquence sonore n'est pas obligatoire. Ces différentes parties, nom et mode de communication, peuvent être identifiées et stockées sous forme de fichiers son. Elles sont alors associées aux numéros de téléphones du contact. Après synchronisation, les contacts et les séquences sonores se retrouvent dans le carnet d'adresses du terminal de l'utilisateur, un téléphone mobile par exemple. Les séquences sonores sont alors directement utilisables par le système de reconnaissance vocale avec étiquette embarqué dans le téléphone mobile.
Ainsi, le système de reconnaissance vocale embarqué dans le terminal dispose d'une étiquette vocale correspondant au contact, acquise et validée en utilisant un autre service, à savoir celui du carnet d'adresses réseau et ceci de façon transparente pour l'utilisateur.
Selon un autre mode de réalisation de l'invention, ledit premier carnet d'adresses est un carnet d'adresses réseau de l'utilisateur, et ledit deuxième carnet d'adresses est implanté dans un terminal téléphonique dudit utilisateur. Dans ce cas, une étiquette vocale peut être associée à un contact dans le terminal de l'utilisateur, un téléphone mobile par exemple. Après synchronisation, cette étiquette est transférée dans le carnet d'adresses réseau, couplé à une plateforme de reconnaissance vocale. Si la plateforme est mixte, elle pourra tirer parti de l'étiquette vocale pour traiter des cas particuliers, comme celui des noms d'origine étrangère rappelé plus haut et pour lesquels la reconnaissance vocale sans étiquette est inopérante.
Enfin, une disposition avantageuse de l'invention consiste en ce que ladite étiquette vocale créée dans le premier carnet d'adresses est traduite en référence textuelle.
Un exemple d'application de cette disposition est la création dans le carnet d'adresses réseau d'une étiquette vocale à partir du terminal de l'utilisateur, suivie de sa traduction en référence textuelle par un module de reconnaissance vocale générique, sur les prénoms par exemple, de manière à pouvoir mettre en œuvre dans le carnet d'adresses réseau une reconnaissance vocale sans étiquette, en particulier si le service ne dispose pas de moyens de reconnaissance mixte.
L'invention concerne également une unité de création automatique d'étiquettes vocales dans un premier carnet d'adresses d'un utilisateur à partir d'un deuxième carnet d'adresses dudit utilisateur, ledit deuxième carnet d'adresses étant associé à un module de création d'étiquettes vocales, remarquable en ce que ladite unité comprend :
- des moyens pour créer dans ledit deuxième carnet d'adresses un contact défini par un nom et au moins un numéro d'un mode de communication dudit contact,
- des moyens pour transmettre audit module de création d'étiquettes vocales une séquence sonore contenant au moins le nom dudit contact,
- des moyens de synchronisation dudit premier carnet d'adresses avec le deuxième carnet d'adresses. L'invention concerne encore un terminal téléphonique comportant une unité de création automatique d'étiquettes vocales selon l'invention.
L'invention concerne enfin un programme d'ordinateur destiné à être mis en œuvre dans le terminal selon l'invention pour exécuter un procédé de création automatique d'étiquettes vocales dans un premier carnet d'adresses d'un utilisateur à partir d'un deuxième carnet d'adresses dudit utilisateur, ledit deuxième carnet d'adresses étant associé à un module de création d'étiquettes vocales, ledit programme comprenant :
- des instructions pour créer dans ledit deuxième carnet d'adresses un contact défini par un nom et au moins un numéro d'un mode de communication dudit contact,
- des instructions pour transmettre audit module de création d'étiquettes vocales une séquence sonore contenant au moins le nom dudit contact,
- des instructions de synchronisation dudit premier carnet d'adresses avec le deuxième carnet d'adresses. La description qui va suivre en regard du dessin annexé, donné à titre d'exemple non limitatif, fera bien comprendre en quoi consiste l'invention et comment elle peut être réalisée. La figure 1 est un schéma d'un système de communication entre un terminal d'un utilisateur et un service de carnet d'adresses réseau.
Sur la figure 1 est représenté un terminal 10 d'un utilisateur, tel qu'un téléphone mobile ou fixe. Ce terminal 10 est équipé d'un système de reconnaissance vocale embarqué et d'un carnet d'adresses pour la gestion de contacts.
Ledit utilisateur est, par ailleurs, abonné à un service de carnet d'adresses réseau 20 à travers un réseau 1 de télécommunication.
Les éléments du service de carnet d'adresses réseau 20 sont les suivants :
- un module 21 de carnet d'adresses proprement dit qui fournit les services classiques de gestion de contacts. Mais, par rapport aux services de carnets d'adresses réseau connus, ce module 21 gère au moins un attribut supplémentaire, à savoir une étiquette vocale associée à chaque mode de communication d'un contact donné (téléphone mobile, fixe ou tout autre mode de communication).
- un module 22 d'accès vocal au carnet d'adresses réseau qui gère les échanges vocaux avec l'utilisateur et accède aux données dudit carnet d'adresses réseau. - un module 23 de création d'étiquettes vocales qui est très fortement couplé au module 22 d'accès vocal. Il permet d'identifier dans le dialogue entre le serveur vocal et l'utilisateur les séquences sonores correspondant à la désignation d'un contact et de son mode de communication. Lorsque le nombre de répétitions obtenues pour la désignation d'un contact est suffisant, par exemple deux, pour créer le modèle de reconnaissance du contact dans le mode avec étiquette vocale, il fournit au module de reconnaissance vocale du terminal 10, les portions de signal audio, ou fichiers son, correspondant aux contacts. Par exemple, il peut fournir les segments correspondants à la prononciation de "Paul" extraits à partir de deux utilisations du service de carnet d'adresses réseau: "appelle Paul sur son mobile" et "appelle Paul à la maison". Il peut, bien sur, aussi fournir comme étiquette vocale la séquence complète "appelle Paul sur son mobile". - un serveur 24 de synchronisation qui permet de synchroniser les données des contacts entre le module 21 de carnet d'adresses réseau et le carnet d'adresses des terminaux fixe ou mobile bénéficiant de cette fonction. La synchronisation permet de maintenir en cohérence des ensembles de données similaires. Par exemple, la synchronisation des contacts d'un carnet d'adresses réseau avec le carnet d'adresses d'un téléphone mobile. Les protocoles de synchronisation (par exemple SyncML) permettent de synchroniser non seulement des champs contenant des caractères alpha numériques, mais aussi des fichiers, par exemple une photo ou une séquence sonore associée à un contact.
Le procédé de création automatique d'étiquettes vocales, conforme à l'invention, peut être illustré par le scénario suivant :
- l'utilisateur, après avoir souscrit au service de carnets d'adresses réseau 20, crée directement, ou par l'intermédiaire d'une application ou d'un service, un contact défini par un nom « Jean » dans le carnet d'adresses réseau. Les numéros de téléphone personnel et mobile du contact « Jean » sont également renseignés.
- l'utilisateur se connecte au module 22 d'accès vocal du carnet d'adresses réseau 20 et prononce la séquence sonore "Jean à la maison", laquelle est transmise au module 23 de création d'étiquettes vocales qui associe alors l'étiquette vocale "Jean à la maison", créée sous forme d'un fichier son, au numéro de téléphone fixe du contact « Jean ». On comprend que cette étiquette vocale est obtenue par l'utilisation normale du carnet d'adresses réseau, sans intervention ni effort de l'utilisateur. Ceci constitue un avantage essentiel de l'invention.
- de même, après que l'utilisateur ait prononcé " Jean sur son mobile", le module 23 de création d'étiquettes vocales associe l'étiquette vocale "Jean sur son mobile" au numéro du téléphone mobile du contact « Jean ».
- l'utilisateur synchronise alors le carnet d'adresses réseau avec le carnet d'adresses de son terminal 10 équipé d'un système de reconnaissance vocale avec étiquette. Le contact "Jean", les deux numéros de téléphone et les deux étiquettes sonores sont disponibles sur le terminal 10. - si l'utilisateur active la reconnaissance vocale sur son terminal 10 et prononce "Jean à la maison", le numéro correspondant est composé par le terminal 10.
Un autre scénario représentatif du procédé selon l'invention est le suivant :
- l'utilisateur crée sur son terminal un contact nommé "Jorge". Il enregistre la séquence "Jorge" et l'associe comme étiquette vocale au numéro de téléphone fixe de « Jorge ».
- l'utilisateur synchronise les deux carnets d'adresses. Le contact « Jorge » est donc créé dans le carnet d'adresses réseau.
- l'utilisateur accède au carnet d'adresses réseau. Il prononce " Jorge ". Ce prénom n'est pas reconnu par les plateformes de reconnaissance vocale sans étiquette si celles-ci n'intègrent pas la prononciation de phonèmes étrangers. Toutefois, la technologie mixte permet ici de résoudre cette situation en ce qu'elle met en jeu la reconnaissance vocale avec étiquette.
Le scénario suivant est également illustratif du procédé conforme à l'invention :
- l'utilisateur accède au service de carnet d'adresses réseau 20 et prononce, en supposant qu'une seule répétition est nécessaire à la création des modèles de reconnaissance vocale embarquée:
* "Laurent à la maison"
* "Pierre sur son mobile" si plusieurs répétitions sont nécessaires, il suffit d'étendre le scénario à plusieurs répétitions. - le module 23 de création d'étiquettes vocales identifie dans les flux audio les segments de parole correspondants aux prononciations de "Laurent", "à la maison", "Pierre", "sur son mobile". Il peut alors:
* créer par concaténation les nouvelles séquences vocales:
"Laurent sur son mobile" "Pierre à la maison", et ainsi permettre au module de reconnaissance vocale embarqué dans le terminal 10 de créer les contacts vocaux correspondants, sans même que ces contacts aient été explicitement prononcés. * créer des étiquettes vocales distinctes pour "à la maison", "sur son mobile", "Pierre" et "Laurent".
Un exemple d'application particulièrement avantageux du procédé selon l'invention est représenté par le scénario suivant : - l'utilisateur a créé l'étiquette vocale correspondant à "Jérôme" dans le carnet d'adresses de son terminal 10. Ce contact est absent du carnet d'adresses réseau.
- un module de reconnaissance vocale générique sur les prénoms permet de générer le prénom le plus probable selon les étiquettes vocales. Ce module reconnaît "Jérôme".
- ensuite, une phase de validation, par exemple par synthèse vocale, peut être utile : le système demande "avez-vous dit "Jérôme""?
- si oui, alors le système dispose de la séquence de phonèmes correspondant à l'étiquette vocale, et permet de générer la référence textuelle, et ainsi d'enrichir le carnet d'adresses réseau, ce dernier fonctionnant dans cet exemple uniquement à partir d'entrées textuelles.
A noter que le module de reconnaissance vocale sur les prénoms peut être remplacé ou complété par un module de reconnaissance de séquences de phonèmes, pour extraire la séquence la plus probable, différente d'un prénom, dans le but de gérer les cas des diminutifs ou des noms rares.

Claims

REVENDICATIONS
1. Procédé de création automatique d'étiquettes vocales dans un premier carnet d'adresses d'un utilisateur à partir d'un deuxième carnet d'adresses dudit utilisateur, ledit deuxième carnet d'adresses étant associé à un module (23) de création d'étiquettes vocales, caractérisé en ce que ledit procédé comprend les étapes consistant à : pour l'utilisateur,
- créer dans ledit deuxième carnet d'adresses un contact défini par un nom et au moins un numéro d'un mode de communication dudit contact,
- transmettre audit module (23) de création d'étiquettes vocales une séquence sonore contenant au moins le nom dudit contact, pour le module (23) de création d'étiquettes vocales,
- créer à partir de ladite séquence sonore un fichier son et l'associer audit numéro d'un mode de communication dudit contact dans le deuxième carnet d'adresses, pour l'utilisateur,
- synchroniser ledit premier carnet d'adresses avec le deuxième carnet d'adresses.
2. Procédé selon la revendication 1 , caractérisé en ce que ladite séquence sonore est créée durant l'utilisation du deuxième carnet d'adresses.
3. Procédé selon l'une des revendications 1 ou 2, caractérisé en ce que ladite séquence sonore contient également ledit mode de communication du contact.
4. Procédé selon l'une quelconque des revendications 1 à 3, caractérisé en ce que ladite étiquette vocale créée dans le premier carnet d'adresses est traduite en référence textuelle.
5. Procédé selon l'une quelconque des revendications 1 à 4, caractérisé en ce que ledit premier carnet d'adresses est implanté dans un terminal téléphonique (10) de l'utilisateur, et en ce que ledit deuxième carnet d'adresses est un carnet d'adresses réseau dudit utilisateur.
6. Procédé selon l'une quelconque des revendications 1 à 4, caractérisé en ce que ledit premier carnet d'adresses est un carnet d'adresses réseau de l'utilisateur, et en ce que ledit deuxième carnet d'adresses est implanté dans un terminal téléphonique(IO) dudit utilisateur.
7. Procédé selon l'une des revendications 5 ou 6, caractérisé en ce que ledit terminal téléphonique est un téléphone mobile (10).
8. Unité de création automatique d'étiquettes vocales dans un premier carnet d'adresses d'un utilisateur à partir d'un deuxième carnet d'adresses dudit utilisateur, ledit deuxième carnet d'adresses étant associé à un module (23) de création d'étiquettes vocales, caractérisé en ce que ladite unité comprend :
- des moyens pour créer dans ledit deuxième carnet d'adresses un contact défini par un nom et au moins un numéro d'un mode de communication dudit contact,
- des moyens pour transmettre audit module (23) de création d'étiquettes vocales une séquence sonore contenant au moins le nom dudit contact,
- des moyens de synchronisation dudit premier carnet d'adresses avec le deuxième carnet d'adresses.
9. Terminal téléphonique comportant une unité de création automatique d'étiquettes vocales selon la revendication 8.
10. Programme d'ordinateur destiné à être mis en œuvre dans le terminal selon la revendication 9 pour exécuter un procédé de création automatique d'étiquettes vocales dans un premier carnet d'adresses d'un utilisateur à partir d'un deuxième carnet d'adresses dudit utilisateur, ledit deuxième carnet d'adresses étant associé à un module de création d'étiquettes vocales, ledit programme comprenant :
- des instructions pour créer dans ledit deuxième carnet d'adresses un contact défini par un nom et au moins un numéro d'un mode de communication dudit contact,
- des instructions pour transmettre audit module de création d'étiquettes vocales une séquence sonore contenant au moins le nom dudit contact, - des instructions de synchronisation dudit premier carnet d'adresses avec le deuxième carnet d'adresses.
EP06726029A 2005-03-16 2006-02-28 Procédé de création automatique d'étiquettes vocales dans un carnet d'adresses Withdrawn EP1859608A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0502620 2005-03-16
PCT/FR2006/000497 WO2006097598A1 (fr) 2005-03-16 2006-02-28 Procede de creation automatique d'etiquettes vocales dans un carnet d'adresses

Publications (1)

Publication Number Publication Date
EP1859608A1 true EP1859608A1 (fr) 2007-11-28

Family

ID=35241022

Family Applications (1)

Application Number Title Priority Date Filing Date
EP06726029A Withdrawn EP1859608A1 (fr) 2005-03-16 2006-02-28 Procédé de création automatique d'étiquettes vocales dans un carnet d'adresses

Country Status (2)

Country Link
EP (1) EP1859608A1 (fr)
WO (1) WO2006097598A1 (fr)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106686184A (zh) * 2017-01-13 2017-05-17 北京搜狗科技发展有限公司 一种添加联系人方法、电子设备及服务器

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6195641B1 (en) * 1998-03-27 2001-02-27 International Business Machines Corp. Network universal spoken language vocabulary
DE19918382B4 (de) * 1999-04-22 2004-02-05 Siemens Ag Erstellen eines Referenzmodell-Verzeichnisses für ein sprachgesteuertes Kommunikationsgerät
EP1215661A1 (fr) * 2000-12-14 2002-06-19 TELEFONAKTIEBOLAGET L M ERICSSON (publ) Appareil portable à reconnaissance de la parole
ES2208212T3 (es) * 2000-12-18 2004-06-16 Siemens Aktiengesellschaft Procedimiento y disposicion para el reconocimiento de voz indenpendiente del locutor para un terminal de telecomunicaciones o terminales de datos.
US6961414B2 (en) * 2001-01-31 2005-11-01 Comverse Ltd. Telephone network-based method and system for automatic insertion of enhanced personal address book contact data

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO2006097598A1 *

Also Published As

Publication number Publication date
WO2006097598A1 (fr) 2006-09-21

Similar Documents

Publication Publication Date Title
US8620654B2 (en) Text oriented, user-friendly editing of a voicemail message
EP2008193B1 (fr) Systèmes de reconnaissance vocale hébergés pour dispositifs radio
US12200402B2 (en) Conference summary generation
US9715873B2 (en) Method for adding realism to synthetic speech
US8706486B1 (en) Voice data leakage detection and prevention systems
US11570403B2 (en) Automated recording highlights for conferences
EP4331188B1 (fr) Enregistrement automatisé de moments phares pour des conférences
US20090138262A1 (en) Systems and methods to index and search voice sites
WO2009063445A2 (fr) Procédé et appareil pour une recherche rapide dans un système de surveillance de centre d'appel
US20160036969A1 (en) Computer-based streaming voice data contact information extraction
KR102248843B1 (ko) 피호출자의 전자 디바이스에서 연락처 정보를 업데이트하는 방법 및 전자 디바이스
US20220353100A1 (en) Automated Recording Highlights For Conferences
FR2935855A1 (fr) Procede et systeme de communication pour la determination d'une sequence de services lies a une conversation.
ES2408906B1 (es) Sistema y método para analizar el contenido de una conversación de voz
EP1859608A1 (fr) Procédé de création automatique d'étiquettes vocales dans un carnet d'adresses
WO2001028209A1 (fr) Procede de mise en communication telephonique par commande vocale et serveur vocal correspondant
EP1474933A1 (fr) Services vocaux telephoniques interactifs
EP2164237A1 (fr) Procédé et système de communication pour l'affichage d'un lien vers un service à partir d'une expression énoncée en cours de conversation
EP1703418B1 (fr) Enrichissement d'une base de règles de transcription
FR2852438A1 (fr) Systeme de traduction pour audioconference multilingue
CN108831475A (zh) 一种文本消息提取方法及系统
CA2794208A1 (fr) Systemes et procedes pour fournir un contenu traduit
FR2966635A1 (fr) Procede et dispositif d'affichage de donnees vocales d'un contenu audio
WO2025202433A2 (fr) Terminal de communication, interface neuronale directe, procédé d'établissement de communication, procédé de gestion, et programme les mettant en œuvre
EP2677708B1 (fr) Procédé de communication d'un message audiovisuel, et système de communication

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20070907

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LI LT LU LV MC NL PL PT RO SE SI SK TR

DAX Request for extension of the european patent (deleted)
RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: FRANCE TELECOM

17Q First examination report despatched

Effective date: 20100125

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20100505