FR2857122A1 - Procede de navigation dans un ensemble de documents sonores a l'aide d'une interface graphique, et recepteur pour la navigation selon le procede - Google Patents
Procede de navigation dans un ensemble de documents sonores a l'aide d'une interface graphique, et recepteur pour la navigation selon le procede Download PDFInfo
- Publication number
- FR2857122A1 FR2857122A1 FR0308110A FR0308110A FR2857122A1 FR 2857122 A1 FR2857122 A1 FR 2857122A1 FR 0308110 A FR0308110 A FR 0308110A FR 0308110 A FR0308110 A FR 0308110A FR 2857122 A1 FR2857122 A1 FR 2857122A1
- Authority
- FR
- France
- Prior art keywords
- documents
- navigation
- graphic
- document
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/34—Indicating arrangements
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/638—Presentation of query results
- G06F16/639—Presentation of query results using playlists
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/102—Programmed access in sequence to addressed parts of tracks of operating record carriers
- G11B27/105—Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/20—Disc-shaped record carriers
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/20—Disc-shaped record carriers
- G11B2220/25—Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
- G11B2220/2537—Optical discs
- G11B2220/2545—CDs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
- Navigation (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
La présente invention concerne un procédé de navigation au sein d'une collection de documents sonores accessible depuis un récepteur muni d'un dispositif d'affichage. Le procédé comporte une première étape d'analyse des documents afin de déterminer des paramètres audio dits « de bas niveaux » propres à chaque document. Puis, des identificateurs graphiques d'une partie au moins des documents sonores sont positionnés au sein d'une page graphique, la disposition des identificateurs graphiques étant dépendante des paramètres précédemment calculés. Enfin, le procédé comporte une étape de navigation automatique en reproduisant successivement les documents sonores selon une stratégie déterminée prenant en compte la position des identificateurs des documents dans la page graphique.L'invention concerne également un dispositif apte à exécuter un module logiciel de navigation pour la reproduction des documents sonores selon une stratégie déterminée et selon la position des représentations des documents dans une page graphique.
Description
L'invention concerne un procédé de navigation parmi des documents sonores
accessibles à l'aide d'un récepteur audiovisuel, et un récepteur audiovisuel muni d'une interface utilisateur graphique permettant de naviguer.
Le stockage d'un grand nombre de documents sonores au sein d'un équipement grand public est connu. On peut citer des appareils de lecture de compact disque audio (CD) capables de contenir un certain nombre de CD, une télécommande permettant à l'utilisateur de choisir d'une part le bon CD, et d'autre part le bon morceau dans ce CD. Ces appareils possèdent également une fonction de programmation permettant de définir un enchaînement des io morceaux sonores. Lors de cette programmation, l'utilisateur introduit pour chaque morceau, l'identificateur du CD et l'identificateur du morceau dans le CD. Afin d'avoir une certaine continuité mélodique, l'utilisateur doit connaître à l'avance les morceaux et programmer ceux-ci afin de produire une certaine continuité sonore lors de la reproduction.
D'autres moyens de stockage de contenus sonores existent. Par exemple, des lecteurs portables (ou baladeurs) disposent d'une mémoire électronique de grande capacité permettant d'enregistrer des centaines de morceaux musicaux. Parmi ceux-ci, on peut citer le lecteur MP3 LYRA produit et fabriqué par la demanderesse. Des équipements de salon disposent aussi d'un disque dur de grande capacité, 20 Gigaoctets par exemple, ce qui permet de stocker des milliers de contenus sonores.
L'utilisateur ayant accès à une grande collection de contenus audio (par exemple des chansons) rencontre des difficultés à retrouver un morceau déterminé de sa collection, en vue de l'écouter. Il importe donc de les ranger selon certains critères et surtout de les présenter pour que l'utilisateur puisse rapidement retrouver le ou les bons morceaux. Il est connu d'associer des données numériques d'identification des contenus audio, le plus courant est le titre, mais il a aussi: le producteur, le chanteur, la maison d'édition... D'autres éléments appelés attributs permettent de classer un contenu par exemple le genre (jazz, vocal, rock, musique douce, musique d'ambiance, etc.). Par contre, certains contenus audio accessibles à un utilisateur ne possèdent pas automatiquement ces attributs, par exemple lorsque l'utilisateur enregistre lui-même ses morceaux musicaux en direct. Une autre façon de classifier des contenus audio est d'analyser directement les signaux sonores. Il existe des techniques d'analyse du signal qui permettent de calculer pour chaque contenu audio des valeurs de paramètres dits de bas niveaux . Ces paramètres sont par exemple: le tempo, l'énergie, la brillance, l'enveloppe, ... Ils sont 2857122 2 déterminés par analyse du signal soit sous sa forme numérique, soit sous sa forme analogique. Une technique d'indexation de contenu audio est expliquée dans l'article Speech and Language Technologies for audio indexing and retrieval publié en août 2000 dans la revue IEEE page 1338 à 1353 du volume 88. L'article explique comment par analyse du signal audio, on peut classifier les différents contenus. D'autres articles décrivent des moyens de calcul de paramètres de bas niveau et des utilisations possibles, voici d'autres articles inclus par référence à la présente demande de brevet: ^ B. Feiten and S. Gunzel, Automatic indexing of a Sound io Database using self-organizing neural networks, Computer Music Journal, 18 (3 , 1994 ^ Eric Scheirer, Music Listening systems, PhD thesis, MIT Media Laboratory, Apr 2000.
Une fois que les paramètres de bas niveaux ont été déterminés pour chaque document sonore de la collection, l'appareil de stockage ou de reproduction peut les classer par groupes en fonction de ces paramètres. Ainsi, les contenus de musique classique peuvent constituer un groupe, de même les morceaux de jazz, un autre groupe. La demande de brevet PCT/GB01/00681 publiée le 23 août 2001 décrit une interface utilisateur constituée d'un graphisme affiché sur un écran et contrôlé par un récepteur audiovisuel. Le menu affiché présente des icônes ( Classical , Jazz , Chart Music , Talk back , ...) sélectionnable par l'utilisateur, la sélection d'un document du groupe activant la reproduction de son contenu sonore.
De telles interfaces facilitent la sélection d'un contenu audio mais ne permettent pas l'enchaînement automatique de plusieurs contenus. Un tel enchaînement peut être réalisé par programmation à condition que l'utilisateur connaisse par avance les différents contenus. Et même dans ce cas, si l'utilisateur veut obtenir des enchaînements mélodieux, ce n'est pas évident pour lui de le faire s'il n'a pas l'oreille musicale.
La présente invention permet à un utilisateur de reproduire successivement des contenus audio en conservant une certaine unité musicale, ou du moins une certaine logique. De plus, l'interface graphique ainsi définie permet de naviguer facilement dans une grande collection de contenu audio et de reproduire des contenus que l'utilisateur désire, et ceci de façon performante et conviviale 2857122 3 L'invention a pour objet un procédé de navigation au sein d'une collection de documents sonores accessibles depuis un récepteur muni d'un dispositif d'affichage, comportant une première étape d'analyse des documents afin de déterminer des paramètres audio propres à chaque document, le procédé est caractérisé en ce qu'il comporte les étapes suivantes: - positionnement d'identificateurs graphiques correspondant à au moins une partie des documents sonores sur une page graphique du dispositif d'affichage, la position de chaque identificateur graphique associé à un document étant dépendante des paramètres précédemment calculés pour ce io document, - navigation automatique en sélectionnant et en reproduisant successivement les documents sonores selon une stratégie prenant en compte la position des identificateurs graphiques des documents dans la page graphique.
De cette façon, le procédé propose un nouveau concept de navigation au sein d'un ensemble de contenus audio, le concept étant basé sur la visualisation d'une représentation graphique de l'ensemble et d'une stratégie basée sur une relation graphique unissant certains identificateurs graphiques. Ainsi, l'utilisateur peut voir sur la page graphique l'évolution des enchaînements des documents sonores. De plus, la position des représentations des documents dans la page graphique dépend des paramètres de bas niveaux calculés pour chaque document, de ce fait la navigation se basant sur la position des représentations entraîne une certaine continuité auditive.
Selon un premier perfectionnement, le procédé comporte une étape de détermination de groupes de documents possédant des valeurs de paramètres proches. Les identificateurs graphiques associés aux documents d'un groupe sont affichés avec une similitude permettant à l'utilisateur de localiser le groupe au sein de la page graphique. Ainsi, l'utilisateur peut choisir un document sonore au sein d'un groupe de musique clairement déterminé.
Selon un autre perfectionnement, le procédé comporte une étape de réception d'une commande de lancement de la navigation en spécifiant la stratégie de navigation utilisée par le récepteur pour enchaîner automatiquement la reproduction des documents. II existe plusieurs stratégies de navigation possibles, toutes pouvant se représenter graphiquement: parcours d'un segment, parcours d'une spirale ou d'une forme ouverte, définition d'une zone graphique contenant des identificateurs et sélection aléatoire au sein de cette zone.
2857122 4 Selon un autre perfectionnement, le procédé comporte une étape d'affichage du nombre de documents reproduits selon la stratégie déterminée. Selon un autre perfectionnement, le procédé comporte une étape d'affichage du numéro d'ordre du document en cours de reproduction.
L'invention a également pour objet un récepteur multimédia comprenant une unité centrale, un moyen de réception de documents sonores, un moyen d'introduction d'une commande utilisateur, un moyen d'analyse des documents afin de déterminer des paramètres propres à chaque document caractérisé en ce qu'il comporte: un moyen d'affichage d'une page graphique des identificateurs graphiques correspondant à une partie au moins des documents sonores, la position des identificateurs graphiques de chaque document étant dépendante des paramètres précédemment calculés, et un moyen de navigation pour l'enchaînement automatique de la reproduction des documents selon une stratégie déterminée prenant en compte la position des identificateurs graphiques des documents au sein de la page graphique.
D'autres caractéristiques et avantages de l'invention apparaîtront maintenant avec plus de détails dans le cadre de la description qui suit d'exemples de réalisation donnés à titre illustratif en se référant aux figures annexées qui représentent: - la figure 1 est un diagramme bloc d'un récepteur multimédia pour la mise en oeuvre de l'invention, - la figure 2 est un tableau associant pour chaque document de la 25 collection ses valeurs de paramètres de bas niveau, - la figure 3 décrit une apparence d'écran présentant la collection de documents dans un espace à deux dimensions, - la figure 4 décrit une apparence d'écran montrant une stratégie de navigation dite du segment pour enchaîner automatiquement les documents 30 sonores, - la figure 5 décrit une apparence d'écran montrant une stratégie de navigation en spirale pour enchaîner automatiquement les documents sonores.
On décrira tout d'abord le fonctionnement d'un récepteur multimédia 1 associé à un dispositif d'affichage 2. Le récepteur comprend une unité centrale 3 reliée à une mémoire de programme 12, et une interface 5 pour la communication avec un bus numérique local à haut débit 6 permettant de 2857122 5 recevoir des données audio et/ou vidéo à grand débit. Ce réseau est par exemple un réseau IEEE 1394. Le récepteur peut également recevoir des données audio et/ou vidéo d'un réseau de diffusion à travers une antenne de réception associée à un démodulateur 4, ce réseau peut être de type radio ou de télévision. Le récepteur comprend en outre un récepteur de signaux infrarouge 7 pour recevoir les signaux d'une télécommande 8, une mémoire 9 pour le stockage d'une base de données, et une logique de décodage audio/vidéo 10 pour la génération des signaux audiovisuels envoyés à l'écran de télévision 2. La télécommande 8 est dotée des touches de direction T, J', - io et F et des touches: OK et Select dont nous verrons plus tard la fonction.
Le récepteur comprend également un circuit 11 d'affichage de données sur l'écran, appelé souvent circuit OSD, de l'anglais "On Sçreen Display" (signifiant littéralement "affichage sur l'écran"). Le circuit OSD 11 est un générateur de texte et de graphisme qui permet d'afficher à l'écran des menus, des pictogrammes ou autres graphismes, et des menus présentant la navigation. Le circuit OSD est contrôlé par l'Unité Centrale 3 et un navigateur 12. Le navigateur 12 est avantageusement réalisé sous la forme d'un module de programme enregistré dans une mémoire morte. Il peut aussi être réalisé sous la forme d'un circuit spécialisé de type ASIC par exemple.
Le bus numérique 6 et/ou le réseau de diffusion transmettent au récepteur des contenus audio soit sous forme numérique, soit sous forme analogique, le récepteur les enregistrant dans une mémoire 9. Selon un mode préféré de réalisation, les contenus audio sont reçus sous forme numérique, de préférence codés selon un standard de compression, MP3 par exemple, et stockés sous la même forme. Selon ce mode préféré de réalisation, la mémoire 9 est un disque dur de grande capacité, 40 Giga-octets par exemple. Le stockage d'une minute de contenu audio en MP3 occupant 1 Mégaoctets environ, un tel disque est capable d'enregistrer 666 heures de document sonores. Le téléchargement de contenu audio est une technique bien connue qu'il est inutile d'expliquer dans la présente demande.
Une fois un certain nombre de contenus audio mémorisés dans la mémoire 9. L'utilisateur veut les reproduire et ceci sans trop d'interventions manuelles, il veut aussi que les contenus se succèdent avec une similitude pour maintenir une ambiance harmonieuse. Pour cela, un module logiciel du navigateur analyse chaque contenu audio lors de sa réception et en extrait les paramètres de bas niveau. Comme nous l'avons indiqué en préambule, il existe 2857122 6 de nombreuses techniques d'analyse du signal qui permettent d'obtenir pour ces chansons des tableaux de descripteurs numériques. Le nombre des éléments d'un descripteur est de l'ordre de quelques dizaines.
Le tableau contenu dans la page d'écran de la figure 2 présente les valeurs de paramètres de bas niveaux constituant les descripteurs d'un certain nombre de documents audio. La première colonne du tableau présente le titre du contenu audio, chaque contenu est numéroté. Les colonnes suivantes présentent les valeurs de paramètres de bas niveau associés au document, tels que l'intensité sonore moyenne, le tempo, l'énergie, le taux de passage par io zéro (ou zerocrossing en Anglais) , la brillance (ou brightness en Anglais), l'enveloppe, la largeur de bande passante ( bandwidth en Anglais ), le Loundness , les coefficients cepstraux Selon un perfectionnement, les paramètres de bas niveaux peuvent être fournis sous forme numérique avec le contenu audio. Lorsque le contenu est fourni par un moyen de transmission numérique et sous forme compressée, les paramètres de bas niveaux associés constituant un champ attaché au contenu audio. Cette solution est particulièrement avantageuse car le calcul des paramètres est effectué par le producteur ou le fournisseur de contenu et non par l'utilisateur, de ce fait il est réalisé qu'une seule fois.
Qu'ils soient téléchargés ou calculés localement, les descripteurs sont stockés dans la mémoire 9 puis exploités afin de créer des groupes de documents possédant certaines similitudes.
selon une première approche, Le regroupement des contenus en groupes (ou cluster en Anglais) cohérents peut être réalisé à l'aide d'un algorithme dit de clustering , par exemple l'algorithme des k-means (Mac Queen, Some Methods for classification and analysis of multivariate observations , Proc Fifth Berkeley Symposium on Math., Stat. and Prob., volt, pp 281-296, 1967.) Le tableau des descripteurs de la figure 2 possède une nouvelle colonne définissant dans quel groupe le contenu se situe. Les techniques de calcul de groupe sont bien connues, en utilisant l'algorithme des k- means, on peut facilement contrôler le nombre des groupes ainsi produits.
Selon une deuxième approche, Les groupes sont déterminés par un choix préalable de classes (par exemple: humeur (en Anglais: moods), instruments dominants, tempo, etc.) et une vérité de terrain contribuant à définir ces classes. Ils sont obtenus par application d'un algorithme d'apprentissage à cette vérité de terrain.
2857122 7 Selon le présent exemple de réalisation de l'invention, les documents sonores accessibles à partir du récepteur sont représentés sur un écran par des identificateurs graphiques. La position de ces identificateurs graphiques c'est à dire, les coordonnées spatiales au sein de la page graphique, sont obtenues à partir des paramètres de bas niveau. Selon l'exemple de la figure 3, l'écran représente un espace de navigation à deux dimensions, un point Pi constituant un identificateur graphique représentant un document sonore Si. Les coordonnées (xi, yi) d'un identificateur graphique sont obtenues par projection du point Pi dont les coordonnées sont les valeurs des descripteurs de io bas niveau sur un échantillon sonore, sur un espace de dimension 2, 3, etc., selon le type de représentation choisie. La projection est déterminée par analyse en composantes principales ou ACP. L'ACP est notamment décrit dans le document Saporta 1990, intitulé Probabilités Analyse de données et. statistiques, Edition Technip. Cet algorithme d'analyse de données bien connu cherche à découvrir un sous-système d'axes lié linéairement à l'original qui étale au mieux les échantillons, ces axes tendent à confondre les axes originaux corrélés.. Les descripteurs de bas niveau étant supposés avoir une cohérence perceptuelle (les sons sont perceptuellement proches si et seulement si les valeurs des descripteurs de bas niveau sont proches), et la projection étant continue, les identificateurs graphiques proches sur l'écran correspondent à des sons perceptuellement proches. Cet exemple n'exclut en rien de représenter la collection par un espace à plus de deux dimensions.
De façon générale, les coordonnées {x;, y2,... zi} d'un identificateur graphique dans un espace multidimensionnel permettent à l'utilisateur d'imaginer le type du document sonore associé. En effet, les positions des identificateurs graphiques étant calculées en fonction des valeurs de paramètres de bas niveau, si deux identificateurs sont graphiquement éloignés, les valeurs de leurs paramètres de bas niveau sont très différentes et donc, le type du contenu sonore est différent. Par contre, si deux identificateurs sont proches, les contenus audio associés le sont aussi de façon auditive. II existe des techniques d'analyse de données qui permettent de découvrir les dimensions (ou des combinaisons de dimension) prédominantes dans un certain ensemble de chansons. On peut schématiser en indiquant que ce sont des dimensions correspondant aux axes selon lesquels les chansons se répartissent le plus largement. Avantageusement, le navigateur peut analyser les documents sonores et détermine des dimensions principales correspondant à des types de contenus audio, c'est alors le navigateur qui choisit le nombre de dimension de l'espace de navigation.
Selon un perfectionnement représenté également dans la figure 3, les documents sonores sont regroupés selon un algorithme de clustering , par exemple l'algorithme des k-means. Les identificateurs graphiques des éléments d'un même groupe possèdent une caractéristique commune. Selon un mode préféré de réalisation, la couleur d'un identificateur graphique dépend du groupe auquel le document appartient (par exemple: bleu, rouge et vert). Une variante décrite dans la figure 3 consiste à donner à l'identificateur graphique io une forme particulière: un rond, une croix ou une étoile. Un perfectionnement représenté à la figure 3 consiste à délimiter les groupes à l'aide d'un contour constitué d'une ligne courbe fermé. Dans l'exemple illustré par la figure 3, le navigateur a calculé trois groupes A, B et C en différenciant ses membres par trois formes particulières, puis a représenté les contours de chaque groupe par une courbe fermée. Les identificateurs graphiques associés à des documents d'un groupe apparaissent rassemblés à l'écran. En effet, la répartition des identificateurs sur l'écran n'est très généralement pas uniforme, il apparaît dans l'espace de navigation des groupements d'identificateurs assez proches, ces nébuleuses ajoutent un intérêt visuel dans une navigation qui enchaîne des documents sonores. On trouve aussi des identificateurs isolés qu'un utilisateur curieux peut avoir envie d'écouter. En distinguant graphiquement les groupes représentant des types de contenus audio différents, l'utilisateur voit sa collection et peut choisir un contenu audio en sélectionnant un identificateur graphique dans le bon groupe. La sélection d'un identificateur s'effectue en déplaçant une cible constituée de deux droites perpendiculaires, l'objet visé étant à l'intersection des droites. L'utilisateur déplace la cible à l'aide des touches de direction de la télécommande, ou d'un joy- stick . Une fenêtre en bas de l'écran affiche le titre du contenu audio en cours de reproduction, si ce contenu convient à l'utilisateur, celui appuie sur OK et le contenu est reproduit. Si la fenêtre ne contient aucun titre, cela signifie que la cible ne vise aucun contenu audio.
Dans le précédent paragraphe, il est décrit la sélection et la reproduction d'un seul document sonore contenu dans la collection stockée en mémoire 9. Nous allons maintenant décrire la navigation automatique sur plusieurs contenus audio.
Pour lancer l'enchaînement automatique de plusieurs contenus audio, l'utilisateur doit auparavant établir une stratégie de navigation. L'utilisateur 2857122 9 possède une bonne connaissance du contenu de sa collection grâce au graphisme, celui-ci rappelle d'une certaine manière des nébuleuses positionnée dans l'espace, l'idée est d'établir un chemin parcourant ces groupes d'éléments. La représentation des groupes de documents du même type n'est pas une nécessité pour la navigation, néanmoins elle apporte une aide pour l'utilisateur qui se représente mieux comment se répartit sa collection audio.
Nous allons maintenant expliquer plusieurs stratégies de navigation automatique que l'utilisateur peut sélectionner. L'objectif est d'utiliser la représentation graphique comme un moyen de définition pour la sélection d'une io stratégie et pour déterminer l'enchaînement automatique des documents. La première stratégie est celle du segment de droite. Cette stratégie de navigation est montrée par le dessin de la figure 4. L'utilisateur sélectionne un document de départ Dd (et donc un point de départ) et un document d'arrivée Df (respectivement un point d'arrivée), et lance la navigation. Le navigateur affiche alors un segment S entre ces deux identificateurs graphiques et calcule les distances de chaque identificateur de la collection avec le segment. Puis, le navigateur reproduit le document sonore associé au document de départ, puis reproduit les uns à la suite des autres, les documents situés à une distance maximale du segment. Un perfectionnement consiste à afficher une marque (la tête souriante des figures 4 et 5 par exemple) se déplaçant sur le segment du point de départ au point d'arrivée, et à calculer les distances avec les identificateurs graphiques à partir de cette marque. Par la position de la marque sur le segment, l'utilisateur suit l'évolution de la navigation et peut déterminer le temps qu'il reste avant d'atteindre le point d'arrivée.
Selon cette stratégie de navigation, l'utilisateur introduit trois paramètres: les coordonnées d'un point de départ (noté Dd sur la figure 4) , les coordonnées d'un point d'arrivée (noté Df sur la figure 4) et la distance maximale (noté d sur la figure 4) entre un identificateur graphique sélectionné par le navigateur et le segment. Une façon de sélectionner les identificateurs graphiques consiste à déplacer un index (un carré contenant le point à sélectionner) sur l'écran avec les touches de direction, le navigateur positionne automatique le carré sur un identificateur graphique. Quant au troisième paramètre, l'utilisateur tape sur les touches une valeur entre 1 et 99.
Comme les distances de chaque identificateur graphique de la collection avec le segment sont calculées avant la première reproduction, le navigateur connaît le nombre de documents qui seront successivement reproduits et l'affiche dans une fenêtre graphique dans un coin de l'écran. Dans 2857122 10 la fenêtre s'affiche aussi le numéro d'ordre du document sonore en cours de reproduction.
Cette stratégie de navigation par le segment permet de passer d'un type de document sonore à un autre, la transition d'un document à l'autre se faisant en douceur car les documents sont proches graphiquement.
La stratégie en spirale est représentée par la figure 5, l'utilisateur sélectionne un document de départ Dd (et donc un point de départ), un rayon de courbure R et lance la navigation. Le navigateur affiche alors une spirale dont le centre est le point de départ et dont la distance par rapport à cet io identificateur augmente de la valeur R à chaque tour. De même que précédemment, le navigateur calcule les distances de chaque identificateur affiché avec la spirale. Puis, le navigateur reproduit le document sonore associé au document de départ, puis reproduit les uns à la suite des autres, les documents situés à une distance maximale de la spirale. De la même façon que précédemment, le navigateur affiche une marque qui se déplace le long de la spirale au fur et à mesure des reproductions de documents, et, dans une fenêtre graphique, le nombre de documents qui seront successivement reproduits ainsi que le numéro d'ordre du document sonore en cours de reproduction. L'enchaînement des reproductions s'arrête lorsque le navigateur ne trouve plus de documents situés à la distance maximale, ce qui correspond généralement au fait que l'index de la spirale a quitté l'écran.
Si l'utilisateur a placé le point de départ en plein milieu d'un groupe de documents sonores, cette stratégie permet de balayer une grande partie du groupe et donc de reproduire pendant une longue durée le même type de document. Par contre, si l'utilisateur a placé le point de départ à la frontière entre deux groupes de documents sonores, alors à chaque tour de la spirale, le navigateur reproduit des documents d'un groupe puis des documents de l'autre groupe, ce qui permet de varier les types de reproductions.
Ces deux stratégies permettent de balayer une partie de la collection selon un enchaînement bien déterminé et donc reproductible à l'identique si l'utilisateur introduit les mêmes paramètres. Une troisième stratégie fait intervenir un aspect aléatoire. L'utilisateur sélectionne un document de départ Dd (et donc un point de départ), et un rayon de cercle, et lance la navigation. Le navigateur affiche alors un cercle dont le centre est le point de départ. Puis, le navigateur sélectionne aléatoirement les identificateurs graphiques à l'intérieur de la zone circonscrite et reproduit les documents associés. La navigation s'arrête lorsque tous les documents auront été reproduits. De même 2857122 11 que précédemment, le navigateur affiche dans une fenêtre graphique, le nombre de documents qui seront successivement reproduits ainsi que le numéro d'ordre du document sonore en cours de reproduction. Cette troisième stratégie a les mêmes avantages que la seconde (selon le point de départ) avec en plus celui d'éviter de reproduire les documents avec toujours le même enchaînement.
Lorsque le nombre de documents accessibles à partir du récepteur est très grand, il n'est plus possible d'afficher des représentations pour chacun d'eux à l'écran. Selon un perfectionnement, la page graphique affiche une io sélection des représentations, l'utilisateur introduit alors un critère par exemple le genre du document tel qu'il est défini dans ses attributs, ou encore la date de création du document ou la date d'enregistrement, ou encore si ce sont des chansons le nom du chanteur.
Bien que la présente invention ait été décrite en référence aux modes 1s de réalisation particuliers illustrés, celle-ci n'est nullement limitée par ces modes de réalisation, mais ne l'est que par les revendications annexées. On notera que des changements ou des modifications pourront être apportés par l'Homme du métier.
Claims (2)
12 Revendications
1. Procédé de navigation au sein d'une collection de documents sonores accessibles depuis un récepteur muni d'un dispositif d'affichage, comportant une première étape d'analyse des documents afin de déterminer des paramètres audio propres à chaque document, le procédé est caractérisé en ce qu'il comporte les étapes suivantes: - positionnement d'identificateurs graphiques correspondant à au moins une partie des documents sonores sur une page graphique du dispositif io d'affichage, la position de chaque identificateur graphique étant dépendante des paramètres précédemment calculés pour un document donné, - navigation automatique en sélectionnant et en reproduisant successivement les documents sonores selon une stratégie prenant en compte la position des identificateurs graphiques des documents dans la page graphique.
2. Procédé de navigation selon la revendication 1; caractérisé en ce qu'il comporte une étape de détermination de groupes de documents possédant des valeurs de paramètres proches, les identificateurs graphiques associés aux documents d'un groupe ayant une similitude.
3. Procédé de navigation selon la revendication 1 ou 2; caractérisé en ce qu'il comporte une étape de réception d'une commande de lancement de la navigation en spécifiant la stratégie de navigation utilisée par le récepteur pour enchaîner automatiquement la reproduction des documents.
4. Procédé de navigation selon la revendication 1 ou 2; caractérisé en ce qu'il comporte une étape de détermination par le récepteur d'une stratégie de navigation pour enchaîner automatiquement la reproduction des documents.
5. Procédé de navigation selon l'une quelconque des revendications 1 à 4; caractérisé en ce que la navigation consiste à automatiquement sélectionner et reproduire les documents dont les identificateurs graphiques se trouvent à proximité d'un segment de droite entre un point de départ et un point d'arrivée, le premier document sélectionné étant celui situé sur le point de départ ou étant celui le plus proche dudit point.
2857122 13 6. Procédé de navigation selon l'une quelconque des revendications 1 à 4; caractérisé en ce que la navigation consiste à automatiquement sélectionner et reproduire les documents dont les identificateurs graphiques se trouvent à proximité d'une forme géométrique constituée d'une ligne démarrant d'un point de départ et finissant à un bord de l'écran, le premier document sélectionné étant celui situé sur le point de départ ou étant celui le plus proche dudit point.
7. Procédé de navigation selon l'une quelconque des revendications 1 à 4; caractérisé en ce qu'il comporte une étape préalable de détermination d'un io sous-ensemble d'identificateurs graphiques, la navigation automatique consistant à sélectionner aléatoirement et successivement chacun des documents associés aux identificateurs graphiques dudit sous- ensemble.
8. Procédé de navigation selon l'une quelconque des revendications 15 précédentes; caractérisé en ce qu'il comporte une étape d'affichage du nombre de documents reproduits selon la stratégie déterminée.
9. Procédé de navigation selon l'une quelconque des revendications précédentes; caractérisé en ce qu'il comporte une étape d'affichage du numéro 20 d'ordre du document en cours de reproduction.
10. Récepteur multimédia comprenant une unité centrale, un moyen de réception de documents sonores, un moyen d'introduction d'une commande utilisateur, un moyen d'analyse des documents afin de déterminer des paramètres propres à chaque document caractérisé en ce qu'il comporte: un moyen d'affichage d'une page graphique des identificateurs graphiques correspondant à une partie au moins des documents sonores, la position des identificateurs graphiques de chaque document étant dépendante des paramètres précédemment calculés, et un moyen de navigation pour l'enchaînement automatique de la reproduction des documents selon une stratégie déterminée prenant en compte la position des identificateurs graphiques des documents au sein de la page graphique.
Priority Applications (8)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR0308110A FR2857122A1 (fr) | 2003-07-03 | 2003-07-03 | Procede de navigation dans un ensemble de documents sonores a l'aide d'une interface graphique, et recepteur pour la navigation selon le procede |
| US10/562,779 US7590938B2 (en) | 2003-07-03 | 2004-07-02 | Method for navigation within a set of audio documents by means of a graphic interface and receiver for navigation by said method |
| KR1020057025501A KR101090388B1 (ko) | 2003-07-03 | 2004-07-02 | 그래픽 인터페이스에 의한 오디오 문서 세트내에서의 내비게이션 방법 및 상기 방법에 의한 내비게이션을 위한 수신기 |
| JP2006518309A JP4372151B2 (ja) | 2003-07-03 | 2004-07-02 | グラフィカルインタフェースを用いてオーディオドキュメント集合内を巡回する方法、及び当該方法による巡回のための受信機 |
| CNB2004800174135A CN100461165C (zh) | 2003-07-03 | 2004-07-02 | 用图形界面在音频文件的集合中进行导航的方法及接收机 |
| EP04767867A EP1642219A2 (fr) | 2003-07-03 | 2004-07-02 | Procede de navigation dans un ensemble de documents sonores a l'aide d'une interface graphique, et rececepteur pour la navigation selon le procede |
| PCT/FR2004/050305 WO2005006163A2 (fr) | 2003-07-03 | 2004-07-02 | Procédé de navigation dans un ensemble de documents sonores à l'aide d'une interface graphique, et récepteur pour la navigation selon le procédé |
| MXPA05013997A MXPA05013997A (es) | 2003-07-03 | 2004-07-02 | Metodo para navegacion dentro de un conjunto de documentos de audio por medio de una interfaz grafica y receptor para navegacion por el metodo. |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR0308110A FR2857122A1 (fr) | 2003-07-03 | 2003-07-03 | Procede de navigation dans un ensemble de documents sonores a l'aide d'une interface graphique, et recepteur pour la navigation selon le procede |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| FR2857122A1 true FR2857122A1 (fr) | 2005-01-07 |
Family
ID=33522723
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| FR0308110A Pending FR2857122A1 (fr) | 2003-07-03 | 2003-07-03 | Procede de navigation dans un ensemble de documents sonores a l'aide d'une interface graphique, et recepteur pour la navigation selon le procede |
Country Status (8)
| Country | Link |
|---|---|
| US (1) | US7590938B2 (fr) |
| EP (1) | EP1642219A2 (fr) |
| JP (1) | JP4372151B2 (fr) |
| KR (1) | KR101090388B1 (fr) |
| CN (1) | CN100461165C (fr) |
| FR (1) | FR2857122A1 (fr) |
| MX (1) | MXPA05013997A (fr) |
| WO (1) | WO2005006163A2 (fr) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2009151477A1 (fr) * | 2008-06-13 | 2009-12-17 | Sony Ericsson Mobile Communications Ab | Sélection automatique de chansons |
| EP1962241A4 (fr) * | 2005-12-05 | 2010-07-07 | Pioneer Corp | Dispositif, systeme et procede de recherche de contenu, serveur de systeme de recherche de contenu, logiciel, et dispositif de sortie de contenu a fonction de recherche |
| EP2339484A1 (fr) * | 2009-12-23 | 2011-06-29 | Samsung Electronics Co., Ltd. | Procédé de recherche visuelle de contenu |
| EP1895774A4 (fr) * | 2006-04-24 | 2011-08-24 | Sony Corp | Dispositif et procede de traitement d'image |
| WO2015063070A1 (fr) * | 2013-10-28 | 2015-05-07 | Visteon Electronics Germany Gmbh | Procédé et dispositif de traitement d'un ensemble de données |
Families Citing this family (19)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP1652180B1 (fr) * | 2003-08-07 | 2008-10-29 | THOMSON Licensing | Procede de reproduction de documents audio a l'aide d'une interface presentant des groupes de documents, et appareil de reproduction associe |
| US20070038671A1 (en) * | 2005-08-09 | 2007-02-15 | Nokia Corporation | Method, apparatus, and computer program product providing image controlled playlist generation |
| JP4670591B2 (ja) * | 2005-10-31 | 2011-04-13 | ヤマハ株式会社 | 音楽素材編集方法及び音楽素材編集システム |
| JP4668039B2 (ja) * | 2005-11-18 | 2011-04-13 | 三菱電機株式会社 | 楽曲分析装置及び楽曲検索装置 |
| KR100782825B1 (ko) * | 2005-12-01 | 2007-12-06 | 삼성전자주식회사 | 오디오 컨텐츠 선택 정보 제공 방법 및 장치와 그 방법을수행하는 프로그램이 기록된 기록매체 |
| JP2007172702A (ja) * | 2005-12-20 | 2007-07-05 | Sony Corp | コンテンツ選択方法及びコンテンツ選択装置 |
| GB2454106B (en) | 2006-06-06 | 2010-06-16 | Channel D Corp | System and method for displaying and editing digitally sampled audio data |
| US7730414B2 (en) * | 2006-06-30 | 2010-06-01 | Sony Ericsson Mobile Communications Ab | Graphical display |
| US7542039B2 (en) * | 2006-08-21 | 2009-06-02 | Pitney Bowes Software Inc. | Method and apparatus of choosing ranges from a scale of values in a user interface |
| JP5227521B2 (ja) † | 2007-02-26 | 2013-07-03 | 富士フイルム株式会社 | インク組成物、インクジェット記録方法、印刷物、及び、インクセット |
| US20080222188A1 (en) * | 2007-03-05 | 2008-09-11 | Kaleidescape, Inc. | Playlists responsive to coincidence distances |
| US9015633B2 (en) * | 2007-10-22 | 2015-04-21 | Sony Corporation | Data management apparatus and method for organizing data elements into multiple categories for display |
| EP2159719B1 (fr) | 2008-08-27 | 2013-01-09 | Sony Corporation | Procédé d'affichage graphique de morceaux de musique |
| KR20100101912A (ko) * | 2009-03-10 | 2010-09-20 | 삼성전자주식회사 | 동영상 파일을 연속 재생하는 방법 및 장치 |
| JP5487718B2 (ja) * | 2009-05-19 | 2014-05-07 | ヤマハ株式会社 | 音素材検索装置 |
| CN101901622B (zh) * | 2009-05-27 | 2012-08-29 | 鸿富锦精密工业(深圳)有限公司 | 音频资料定位方法 |
| WO2012035471A1 (fr) * | 2010-09-13 | 2012-03-22 | Koninklijke Philips Electronics N.V. | Procédé et appareil pour la sélection d'un élément audio |
| WO2013046629A1 (fr) * | 2011-09-30 | 2013-04-04 | 旭化成株式会社 | Dispositif d'extraction de fréquence fondamentale et procédé d'extraction de fréquence fondamentale |
| WO2012103840A2 (fr) | 2012-03-29 | 2012-08-09 | 华为技术有限公司 | Procédé et dispositif formant terminal pour filtrer des objets |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2001065346A2 (fr) * | 2000-03-02 | 2001-09-07 | Outersonic Limited | Catalogue de produit en ligne et systeme de commande, et presentation de contenu multimedia |
| EP1193623A2 (fr) * | 2000-09-28 | 2002-04-03 | AT&T Corp. | Recherche par interpolation basée sur des données texte dans une interface utilisateur graphique |
| WO2002075591A1 (fr) * | 2001-03-16 | 2002-09-26 | Thomson Licensing Sa | Procede de navigation par calcul de groupes, recepteur mettant enoeuvre le procede, et interface graphique pour la presentation duprocede |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6480194B1 (en) * | 1996-11-12 | 2002-11-12 | Silicon Graphics, Inc. | Computer-related method, system, and program product for controlling data visualization in external dimension(s) |
| CN1132184C (zh) * | 1996-12-02 | 2003-12-24 | 汤姆森消费电子有限公司 | 使用特征数据文件来识别存储于录制介质中的信息的方法 |
| US7596755B2 (en) * | 1997-12-22 | 2009-09-29 | Ricoh Company, Ltd. | Multimedia visualization and integration environment |
| US6934464B1 (en) * | 1998-12-23 | 2005-08-23 | Matsushita Electric Industrial Co., Ltd. | Video/audio data recording apparatus, video/audio data reproducing apparatus, video/audio data recording/reproducing apparatus, video/audio data recording method, video/audio data reproducing method, and program recording program recording medium |
| US7861169B2 (en) * | 2001-11-19 | 2010-12-28 | Ricoh Co. Ltd. | Multimedia print driver dialog interfaces |
-
2003
- 2003-07-03 FR FR0308110A patent/FR2857122A1/fr active Pending
-
2004
- 2004-07-02 EP EP04767867A patent/EP1642219A2/fr not_active Withdrawn
- 2004-07-02 MX MXPA05013997A patent/MXPA05013997A/es active IP Right Grant
- 2004-07-02 CN CNB2004800174135A patent/CN100461165C/zh not_active Expired - Lifetime
- 2004-07-02 US US10/562,779 patent/US7590938B2/en active Active
- 2004-07-02 KR KR1020057025501A patent/KR101090388B1/ko not_active Expired - Lifetime
- 2004-07-02 WO PCT/FR2004/050305 patent/WO2005006163A2/fr not_active Ceased
- 2004-07-02 JP JP2006518309A patent/JP4372151B2/ja not_active Expired - Lifetime
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2001065346A2 (fr) * | 2000-03-02 | 2001-09-07 | Outersonic Limited | Catalogue de produit en ligne et systeme de commande, et presentation de contenu multimedia |
| EP1193623A2 (fr) * | 2000-09-28 | 2002-04-03 | AT&T Corp. | Recherche par interpolation basée sur des données texte dans une interface utilisateur graphique |
| WO2002075591A1 (fr) * | 2001-03-16 | 2002-09-26 | Thomson Licensing Sa | Procede de navigation par calcul de groupes, recepteur mettant enoeuvre le procede, et interface graphique pour la presentation duprocede |
Non-Patent Citations (2)
| Title |
|---|
| MAKHOUL J ET AL: "SPEECH AND LANGUAGE TECHNOLOGIES FOR AUDIO INDEXING AND RETRIEVAL", PROCEEDINGS OF THE IEEE, IEEE. NEW YORK, US, vol. 88, no. 8, August 2000 (2000-08-01), pages 1338 - 1353, XP001157800, ISSN: 0018-9219 * |
| WEIPPL E: "Visualizing content based relations in texts", SECOND AUSTRALASIAN GOLD COAST USER INTERFACE CONFERENCE, AUIC 2001, QLD., AUSTRALIA, 29 January 2001 (2001-01-29) - 1 February 2001 (2001-02-01), IEEE COMPUT. SOC, LOS ALAMITOS, CA, USA, US, pages 34 - 41, XP010534519, ISBN: 0-7695-0969-X * |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP1962241A4 (fr) * | 2005-12-05 | 2010-07-07 | Pioneer Corp | Dispositif, systeme et procede de recherche de contenu, serveur de systeme de recherche de contenu, logiciel, et dispositif de sortie de contenu a fonction de recherche |
| EP1895774A4 (fr) * | 2006-04-24 | 2011-08-24 | Sony Corp | Dispositif et procede de traitement d'image |
| WO2009151477A1 (fr) * | 2008-06-13 | 2009-12-17 | Sony Ericsson Mobile Communications Ab | Sélection automatique de chansons |
| US9020914B2 (en) | 2008-06-13 | 2015-04-28 | Sony Corporation | Automatic song selection |
| EP2339484A1 (fr) * | 2009-12-23 | 2011-06-29 | Samsung Electronics Co., Ltd. | Procédé de recherche visuelle de contenu |
| WO2015063070A1 (fr) * | 2013-10-28 | 2015-05-07 | Visteon Electronics Germany Gmbh | Procédé et dispositif de traitement d'un ensemble de données |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2005006163A2 (fr) | 2005-01-20 |
| WO2005006163A3 (fr) | 2005-06-23 |
| CN1836230A (zh) | 2006-09-20 |
| KR20060080538A (ko) | 2006-07-10 |
| CN100461165C (zh) | 2009-02-11 |
| US20060202994A1 (en) | 2006-09-14 |
| EP1642219A2 (fr) | 2006-04-05 |
| KR101090388B1 (ko) | 2011-12-07 |
| MXPA05013997A (es) | 2006-03-16 |
| JP2007525779A (ja) | 2007-09-06 |
| US7590938B2 (en) | 2009-09-15 |
| JP4372151B2 (ja) | 2009-11-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| FR2857122A1 (fr) | Procede de navigation dans un ensemble de documents sonores a l'aide d'une interface graphique, et recepteur pour la navigation selon le procede | |
| KR101194163B1 (ko) | 아이템들의 집합으로부터 아이템들을 선택하는 방법 및장치 | |
| US20060265421A1 (en) | System and method for creating a playlist | |
| US20020078029A1 (en) | Information sequence extraction and building apparatus e.g. for producing personalised music title sequences | |
| EP1652180B1 (fr) | Procede de reproduction de documents audio a l'aide d'une interface presentant des groupes de documents, et appareil de reproduction associe | |
| US20100332483A1 (en) | Content output queue generation | |
| US20090063971A1 (en) | Media discovery interface | |
| US20220335084A1 (en) | User consumption behavior analysis and composer interface | |
| US20220147558A1 (en) | Methods and systems for automatically matching audio content with visual input | |
| JP4730619B2 (ja) | 情報処理装置および方法、並びにプログラム | |
| Dias et al. | From manual to assisted playlist creation: a survey | |
| US11169767B2 (en) | Automatically generated media preview | |
| JP4389950B2 (ja) | 情報処理装置および方法、並びにプログラム | |
| FR3125193A1 (fr) | Procédé informatisé de dé-linéarisation audiovisuelle | |
| WO2011083178A1 (fr) | Procede de navigation parmi des identificateurs places dans des zones et recepteur mettant en œuvre le procede | |
| FR2858712A1 (fr) | Procede de reproduction de documents audio a l'aide d'une interface presentant des groupes de documents, et appareil de reproduction muni d'une interface permettant la selection | |
| Tsukuda et al. | Chorus-Playlist: Exploring the Impact of Listening to Only Choruses in a Playlist. | |
| WO2006122862A1 (fr) | Procede de selection de contenus sonores reçus d'un recepteur audio ou audiovisuel et recepteur selectionnant les contenus selon le procede | |
| FR2858711A1 (fr) | Procede de selection de documents audio a l'aide d'une interface sonore, et appareil pour la navigation dans un espace | |
| AU2021250903A1 (en) | Methods and systems for automatically matching audio content with visual input | |
| JP2011048839A (ja) | 情報処理装置および方法、並びにプログラム | |
| Cruz | Generation of Immersive Soundscapes from Monophonic Examples | |
| FR2892590A1 (fr) | Procede de navigation dans une liste d'elements avec emission d'un son, et appareil associe. | |
| Knees et al. | Exploring Music Collections like Exploring Landscapes |