EP1859608A1

EP1859608A1 - Procédé de création automatique d'étiquettes vocales dans un carnet d'adresses

Info

Publication number: EP1859608A1
Application number: EP06726029A
Authority: EP
Inventors: Laurent Aubertin; Delphine Charlet
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 2005-03-16
Filing date: 2006-02-28
Publication date: 2007-11-28
Also published as: WO2006097598A1

Abstract

Procédé de création automatique d'étiquettes vocales dans un premier carnet d'adresses d'un utilisateur à partir d'un deuxième carnet d'adresses dudit utilisateur, ledit deuxième carnet d'adresses étant associé à un module (23) de création d'étiquettes vocales. Selon l'invention, ledit procédé comprend les étapes consistant à : pour l'utilisateur, -créer dans ledit deuxième carnet d'adresses un contact défini par un nom et au moins un numéro d'un mode de communication dudit contact, -transmettre audit module (23) de création d'étiquettes vocales une séquence sonore contenant au moins le nom dudit contact, pour le module (23) de création d'étiquettes vocales, -créer à partir de ladite séquence sonore un fichier son et l'associer audit numéro d'un mode de communication dudit contact dans le deuxième carnet d'adresses, pour l'utilisateur, -synchroniser ledit premier carnet d'adresses avec le deuxième carnet d'adresses. A lication à la gestion de carnet d'adresses.

Description

PROCEDE DE CREATION AUTOMATIQUE D'ETIQUETTES VOCALES DANS UN CARNET D'ADRESSES

La présente invention concerne un procédé de création automatique d'étiquettes vocales dans un premier carnet d'adresses d'un utilisateur à partir d'un deuxième carnet d'adresses dudit utilisateur.

L'invention trouve une application particulièrement avantageuse dans le domaine de la gestion de carnets d'adresses, qu'ils soient embarqués dans un terminal ou implantés dans un réseau de télécommunication.

On connaît de l'état de la technique divers systèmes de reconnaissance vocale : - la reconnaissance sans étiquette vocale : Ces technologies permettent de créer des services vocaux avec analyse de la parole sans que l'utilisateur soit obligé de réaliser des enregistrements préalables de séquences qu'il utilisera par la suite. Une chaîne de caractère est suffisante pour construire le modèle de reconnaissance. Ces systèmes sont destinés à créer une référence textuelle associée au résultat de l'analyse de la parole effectuée. Ils sont en général assez lourds et exigent une puissance de calcul importante, c'est pourquoi ils sont en général implantés dans les réseaux de télécommunication. Par contre, leur champ d'application est large puisqu'ils peuvent être mis en œuvre quel que soit le locuteur, on parle alors de reconnaissance « flexible ». - la reconnaissance avec étiquette vocale :

D'autres systèmes nécessitent que l'utilisateur enregistre préalablement les séquences sonores pour créer les modèles des mots du vocabulaire utilisables dans le dialogue à reconnaître. En général, ils nécessitent deux répétitions d'un mot pour créer le modèle de reconnaissance vocale associé. Ces systèmes sont plus légers et peuvent être embarqués, notamment dans les téléphones mobiles. En revanche, la nécessité de prononcer les mots du vocabulaire pour créer leurs modèles avant la première utilisation est assez peu ergonomique, et peut être un frein à l'utilisation de cette technologie. D'autre part, il faut aussi remarquer que ce type de reconnaissance vocale ne vaut que pour le locuteur qui l'a initialisée. - la reconnaissance vocale mixte :

Les mécanismes de reconnaissance vocale avec et sans étiquette peuvent être combinés. Cette association permet de tirer le meilleur parti des deux technologies. En effet, la reconnaissance vocale sans étiquette offre une prise en compte dynamique de nouveaux contacts sans enregistrement préalable et la création de contacts à partir de la référence textuelle du contact, tandis que la reconnaissance vocale avec étiquette facilite, par exemple, la reconnaissance des noms d'origine étrangère ou avec des prononciations spécifiques qui ne sont pas traités correctement dans le cas de la reconnaissance flexible. C'est le cas notamment des noms d'origine étrangères pour lesquels la phonétisation n'est pas faite correctement et/ou les phonèmes n'existent pas dans la langue du système (par exemple, le prénom espagnol "Jorge", dont les phonèmes correspondant aux lettres "j,g" et "r" n'existent pas en français).

D'autre part, on connaît les services de carnet d'adresses qui consistent à associer dans un répertoire un contact défini par un nom à au moins un numéro d'un mode de communication dudit contact, par exemple un numéro de téléphone mobile ou fixe. La sélection du contact dans le carnet d'adresses conduit directement à la composition dudit numéro d'un mode de communication. Ce type de service de carnet d'adresses peut être implanté directement dans le terminal, téléphone mobile par exemple, d'un utilisateur ou dans un réseau de télécommunication. Dans ce dernier cas, l'utilisateur peut accéder au service par une interface avec le réseau.

On comprend que, si un service de carnet d'adresses réseau peut être facilement équipé de systèmes de reconnaissance vocale avec ou sans étiquette, ou mixte, il n'en est pas de même pour des terminaux comme les téléphones mobiles qui peuvent difficilement recevoir des systèmes de reconnaissance vocale sans étiquette compte tenu de la puissance de calcul exigée, ou des systèmes de reconnaissance vocale avec étiquette du fait de leur lourdeur à l'initialisation.

Aussi, le problème technique à résoudre par l'objet de la présente invention est de proposer un procédé de création automatique d'étiquettes vocales dans un premier carnet d'adresses d'un utilisateur à partir d'un deuxième carnet d'adresses dudit utilisateur, ledit deuxième carnet d'adresses étant associé à un module de création d'étiquettes vocales, qui permettrait de créer dans le premier carnet d'adresses un système de reconnaissance avec étiquettes vocales de manière très simple et transparente pour l'utilisateur, c'est-à-dire sans avoir à effectuer la procédure fastidieuse de création d'étiquettes vocales.

La solution au problème technique posé consiste, selon la présente invention, en ce que ledit procédé comprend les étapes consistant à : pour l'utilisateur, - créer dans ledit deuxième carnet d'adresses un contact défini par un nom et au moins un numéro d'un mode de communication dudit contact,

- transmettre audit module de création d'étiquettes vocales une séquence sonore contenant au moins le nom dudit contact, pour le module de création d'étiquettes vocales, - créer à partir de ladite séquence sonore un fichier son et l'associer audit numéro d'un mode de communication dudit contact dans le deuxième carnet d'adresses, pour l'utilisateur,

- synchroniser ledit premier carnet d'adresses avec le deuxième carnet d'adresses.

En particulier, ladite séquence sonore est créée durant l'utilisation du deuxième carnet d'adresses.

Selon un premier mode de réalisation de l'invention, ledit premier carnet d'adresses est implanté dans un terminal téléphonique de l'utilisateur, et ledit deuxième carnet d'adresses est un carnet d'adresses réseau dudit utilisateur.

Dans ce cas, le module de création d'étiquettes vocales dans le réseau est capable après analyse d'une séquence de distinguer au moins le nom du contact et, éventuellement, le mode de communication si, comme le prévoit l'invention, ladite séquence sonore contient également ledit mode de communication du contact. On remarquera que, si le contact n'a qu'un seul numéro d'un mode de communication, sa présence dans la séquence sonore n'est pas obligatoire. Ces différentes parties, nom et mode de communication, peuvent être identifiées et stockées sous forme de fichiers son. Elles sont alors associées aux numéros de téléphones du contact. Après synchronisation, les contacts et les séquences sonores se retrouvent dans le carnet d'adresses du terminal de l'utilisateur, un téléphone mobile par exemple. Les séquences sonores sont alors directement utilisables par le système de reconnaissance vocale avec étiquette embarqué dans le téléphone mobile.

Ainsi, le système de reconnaissance vocale embarqué dans le terminal dispose d'une étiquette vocale correspondant au contact, acquise et validée en utilisant un autre service, à savoir celui du carnet d'adresses réseau et ceci de façon transparente pour l'utilisateur.

Selon un autre mode de réalisation de l'invention, ledit premier carnet d'adresses est un carnet d'adresses réseau de l'utilisateur, et ledit deuxième carnet d'adresses est implanté dans un terminal téléphonique dudit utilisateur. Dans ce cas, une étiquette vocale peut être associée à un contact dans le terminal de l'utilisateur, un téléphone mobile par exemple. Après synchronisation, cette étiquette est transférée dans le carnet d'adresses réseau, couplé à une plateforme de reconnaissance vocale. Si la plateforme est mixte, elle pourra tirer parti de l'étiquette vocale pour traiter des cas particuliers, comme celui des noms d'origine étrangère rappelé plus haut et pour lesquels la reconnaissance vocale sans étiquette est inopérante.

Enfin, une disposition avantageuse de l'invention consiste en ce que ladite étiquette vocale créée dans le premier carnet d'adresses est traduite en référence textuelle.

Un exemple d'application de cette disposition est la création dans le carnet d'adresses réseau d'une étiquette vocale à partir du terminal de l'utilisateur, suivie de sa traduction en référence textuelle par un module de reconnaissance vocale générique, sur les prénoms par exemple, de manière à pouvoir mettre en œuvre dans le carnet d'adresses réseau une reconnaissance vocale sans étiquette, en particulier si le service ne dispose pas de moyens de reconnaissance mixte.

L'invention concerne également une unité de création automatique d'étiquettes vocales dans un premier carnet d'adresses d'un utilisateur à partir d'un deuxième carnet d'adresses dudit utilisateur, ledit deuxième carnet d'adresses étant associé à un module de création d'étiquettes vocales, remarquable en ce que ladite unité comprend :

- des moyens pour créer dans ledit deuxième carnet d'adresses un contact défini par un nom et au moins un numéro d'un mode de communication dudit contact,

- des moyens pour transmettre audit module de création d'étiquettes vocales une séquence sonore contenant au moins le nom dudit contact,

- des moyens de synchronisation dudit premier carnet d'adresses avec le deuxième carnet d'adresses. L'invention concerne encore un terminal téléphonique comportant une unité de création automatique d'étiquettes vocales selon l'invention.

L'invention concerne enfin un programme d'ordinateur destiné à être mis en œuvre dans le terminal selon l'invention pour exécuter un procédé de création automatique d'étiquettes vocales dans un premier carnet d'adresses d'un utilisateur à partir d'un deuxième carnet d'adresses dudit utilisateur, ledit deuxième carnet d'adresses étant associé à un module de création d'étiquettes vocales, ledit programme comprenant :

- des instructions pour créer dans ledit deuxième carnet d'adresses un contact défini par un nom et au moins un numéro d'un mode de communication dudit contact,

- des instructions pour transmettre audit module de création d'étiquettes vocales une séquence sonore contenant au moins le nom dudit contact,

- des instructions de synchronisation dudit premier carnet d'adresses avec le deuxième carnet d'adresses. La description qui va suivre en regard du dessin annexé, donné à titre d'exemple non limitatif, fera bien comprendre en quoi consiste l'invention et comment elle peut être réalisée. La figure 1 est un schéma d'un système de communication entre un terminal d'un utilisateur et un service de carnet d'adresses réseau.

Sur la figure 1 est représenté un terminal 10 d'un utilisateur, tel qu'un téléphone mobile ou fixe. Ce terminal 10 est équipé d'un système de reconnaissance vocale embarqué et d'un carnet d'adresses pour la gestion de contacts.

Ledit utilisateur est, par ailleurs, abonné à un service de carnet d'adresses réseau 20 à travers un réseau 1 de télécommunication.

Les éléments du service de carnet d'adresses réseau 20 sont les suivants :

- un module 21 de carnet d'adresses proprement dit qui fournit les services classiques de gestion de contacts. Mais, par rapport aux services de carnets d'adresses réseau connus, ce module 21 gère au moins un attribut supplémentaire, à savoir une étiquette vocale associée à chaque mode de communication d'un contact donné (téléphone mobile, fixe ou tout autre mode de communication).

- un module 22 d'accès vocal au carnet d'adresses réseau qui gère les échanges vocaux avec l'utilisateur et accède aux données dudit carnet d'adresses réseau. - un module 23 de création d'étiquettes vocales qui est très fortement couplé au module 22 d'accès vocal. Il permet d'identifier dans le dialogue entre le serveur vocal et l'utilisateur les séquences sonores correspondant à la désignation d'un contact et de son mode de communication. Lorsque le nombre de répétitions obtenues pour la désignation d'un contact est suffisant, par exemple deux, pour créer le modèle de reconnaissance du contact dans le mode avec étiquette vocale, il fournit au module de reconnaissance vocale du terminal 10, les portions de signal audio, ou fichiers son, correspondant aux contacts. Par exemple, il peut fournir les segments correspondants à la prononciation de "Paul" extraits à partir de deux utilisations du service de carnet d'adresses réseau: "appelle Paul sur son mobile" et "appelle Paul à la maison". Il peut, bien sur, aussi fournir comme étiquette vocale la séquence complète "appelle Paul sur son mobile". - un serveur 24 de synchronisation qui permet de synchroniser les données des contacts entre le module 21 de carnet d'adresses réseau et le carnet d'adresses des terminaux fixe ou mobile bénéficiant de cette fonction. La synchronisation permet de maintenir en cohérence des ensembles de données similaires. Par exemple, la synchronisation des contacts d'un carnet d'adresses réseau avec le carnet d'adresses d'un téléphone mobile. Les protocoles de synchronisation (par exemple SyncML) permettent de synchroniser non seulement des champs contenant des caractères alpha numériques, mais aussi des fichiers, par exemple une photo ou une séquence sonore associée à un contact.

Le procédé de création automatique d'étiquettes vocales, conforme à l'invention, peut être illustré par le scénario suivant :

- l'utilisateur, après avoir souscrit au service de carnets d'adresses réseau 20, crée directement, ou par l'intermédiaire d'une application ou d'un service, un contact défini par un nom « Jean » dans le carnet d'adresses réseau. Les numéros de téléphone personnel et mobile du contact « Jean » sont également renseignés.

- l'utilisateur se connecte au module 22 d'accès vocal du carnet d'adresses réseau 20 et prononce la séquence sonore "Jean à la maison", laquelle est transmise au module 23 de création d'étiquettes vocales qui associe alors l'étiquette vocale "Jean à la maison", créée sous forme d'un fichier son, au numéro de téléphone fixe du contact « Jean ». On comprend que cette étiquette vocale est obtenue par l'utilisation normale du carnet d'adresses réseau, sans intervention ni effort de l'utilisateur. Ceci constitue un avantage essentiel de l'invention.

- de même, après que l'utilisateur ait prononcé " Jean sur son mobile", le module 23 de création d'étiquettes vocales associe l'étiquette vocale "Jean sur son mobile" au numéro du téléphone mobile du contact « Jean ».

- l'utilisateur synchronise alors le carnet d'adresses réseau avec le carnet d'adresses de son terminal 10 équipé d'un système de reconnaissance vocale avec étiquette. Le contact "Jean", les deux numéros de téléphone et les deux étiquettes sonores sont disponibles sur le terminal 10. - si l'utilisateur active la reconnaissance vocale sur son terminal 10 et prononce "Jean à la maison", le numéro correspondant est composé par le terminal 10.

Un autre scénario représentatif du procédé selon l'invention est le suivant :

- l'utilisateur crée sur son terminal un contact nommé "Jorge". Il enregistre la séquence "Jorge" et l'associe comme étiquette vocale au numéro de téléphone fixe de « Jorge ».

- l'utilisateur synchronise les deux carnets d'adresses. Le contact « Jorge » est donc créé dans le carnet d'adresses réseau.

- l'utilisateur accède au carnet d'adresses réseau. Il prononce " Jorge ". Ce prénom n'est pas reconnu par les plateformes de reconnaissance vocale sans étiquette si celles-ci n'intègrent pas la prononciation de phonèmes étrangers. Toutefois, la technologie mixte permet ici de résoudre cette situation en ce qu'elle met en jeu la reconnaissance vocale avec étiquette.

Le scénario suivant est également illustratif du procédé conforme à l'invention :

- l'utilisateur accède au service de carnet d'adresses réseau 20 et prononce, en supposant qu'une seule répétition est nécessaire à la création des modèles de reconnaissance vocale embarquée:

* "Laurent à la maison"

* "Pierre sur son mobile" si plusieurs répétitions sont nécessaires, il suffit d'étendre le scénario à plusieurs répétitions. - le module 23 de création d'étiquettes vocales identifie dans les flux audio les segments de parole correspondants aux prononciations de "Laurent", "à la maison", "Pierre", "sur son mobile". Il peut alors:

* créer par concaténation les nouvelles séquences vocales:

"Laurent sur son mobile" "Pierre à la maison", et ainsi permettre au module de reconnaissance vocale embarqué dans le terminal 10 de créer les contacts vocaux correspondants, sans même que ces contacts aient été explicitement prononcés. * créer des étiquettes vocales distinctes pour "à la maison", "sur son mobile", "Pierre" et "Laurent".

Un exemple d'application particulièrement avantageux du procédé selon l'invention est représenté par le scénario suivant : - l'utilisateur a créé l'étiquette vocale correspondant à "Jérôme" dans le carnet d'adresses de son terminal 10. Ce contact est absent du carnet d'adresses réseau.

- un module de reconnaissance vocale générique sur les prénoms permet de générer le prénom le plus probable selon les étiquettes vocales. Ce module reconnaît "Jérôme".

- ensuite, une phase de validation, par exemple par synthèse vocale, peut être utile : le système demande "avez-vous dit "Jérôme""?

- si oui, alors le système dispose de la séquence de phonèmes correspondant à l'étiquette vocale, et permet de générer la référence textuelle, et ainsi d'enrichir le carnet d'adresses réseau, ce dernier fonctionnant dans cet exemple uniquement à partir d'entrées textuelles.

A noter que le module de reconnaissance vocale sur les prénoms peut être remplacé ou complété par un module de reconnaissance de séquences de phonèmes, pour extraire la séquence la plus probable, différente d'un prénom, dans le but de gérer les cas des diminutifs ou des noms rares.

Claims

REVENDICATIONS

1. Procédé de création automatique d'étiquettes vocales dans un premier carnet d'adresses d'un utilisateur à partir d'un deuxième carnet d'adresses dudit utilisateur, ledit deuxième carnet d'adresses étant associé à un module (23) de création d'étiquettes vocales, caractérisé en ce que ledit procédé comprend les étapes consistant à : pour l'utilisateur,

- créer dans ledit deuxième carnet d'adresses un contact défini par un nom et au moins un numéro d'un mode de communication dudit contact,

- transmettre audit module (23) de création d'étiquettes vocales une séquence sonore contenant au moins le nom dudit contact, pour le module (23) de création d'étiquettes vocales,

- créer à partir de ladite séquence sonore un fichier son et l'associer audit numéro d'un mode de communication dudit contact dans le deuxième carnet d'adresses, pour l'utilisateur,

2. Procédé selon la revendication 1 , caractérisé en ce que ladite séquence sonore est créée durant l'utilisation du deuxième carnet d'adresses.

3. Procédé selon l'une des revendications 1 ou 2, caractérisé en ce que ladite séquence sonore contient également ledit mode de communication du contact.

4. Procédé selon l'une quelconque des revendications 1 à 3, caractérisé en ce que ladite étiquette vocale créée dans le premier carnet d'adresses est traduite en référence textuelle.

5. Procédé selon l'une quelconque des revendications 1 à 4, caractérisé en ce que ledit premier carnet d'adresses est implanté dans un terminal téléphonique (10) de l'utilisateur, et en ce que ledit deuxième carnet d'adresses est un carnet d'adresses réseau dudit utilisateur.

6. Procédé selon l'une quelconque des revendications 1 à 4, caractérisé en ce que ledit premier carnet d'adresses est un carnet d'adresses réseau de l'utilisateur, et en ce que ledit deuxième carnet d'adresses est implanté dans un terminal téléphonique(IO) dudit utilisateur.

7. Procédé selon l'une des revendications 5 ou 6, caractérisé en ce que ledit terminal téléphonique est un téléphone mobile (10).

8. Unité de création automatique d'étiquettes vocales dans un premier carnet d'adresses d'un utilisateur à partir d'un deuxième carnet d'adresses dudit utilisateur, ledit deuxième carnet d'adresses étant associé à un module (23) de création d'étiquettes vocales, caractérisé en ce que ladite unité comprend :

- des moyens pour transmettre audit module (23) de création d'étiquettes vocales une séquence sonore contenant au moins le nom dudit contact,

- des moyens de synchronisation dudit premier carnet d'adresses avec le deuxième carnet d'adresses.

9. Terminal téléphonique comportant une unité de création automatique d'étiquettes vocales selon la revendication 8.

10. Programme d'ordinateur destiné à être mis en œuvre dans le terminal selon la revendication 9 pour exécuter un procédé de création automatique d'étiquettes vocales dans un premier carnet d'adresses d'un utilisateur à partir d'un deuxième carnet d'adresses dudit utilisateur, ledit deuxième carnet d'adresses étant associé à un module de création d'étiquettes vocales, ledit programme comprenant :

- des instructions pour transmettre audit module de création d'étiquettes vocales une séquence sonore contenant au moins le nom dudit contact, - des instructions de synchronisation dudit premier carnet d'adresses avec le deuxième carnet d'adresses.