Procédé et système de télécommunication
La présente invention concerne un procédé et un système de télécommunication, plus particulièrement un procédé et un système pour obtenir des informations relatives aux besoins des utilisateurs d'information dans un réseau de télécommunication global. La présente invention concerne plus particulièrement un procédé et un système permettant aux éditeurs de documents numériques de déterminer les besoins des utilisateurs de ces documents numériques.
On connaît différentes méthodes pour acheminer des documents numériques depuis au moins un éditeur d'information, par exemple un producteur de sites WEB, jusqu'à au moins un utilisateur concerné par son contenu, par exemple des entreprises ou des particuliers connectés à un réseau de télécommunication.
Dans les systèmes dits en "pull-mode", les documents numériques sont stockés dans un serveur auprès du fournisseur, auquel les utilisateurs intéressés peuvent se connecter à leur initiative. Il est nécessaire pour cela de connaître l'adresse URL du serveur dans le réseau. Pour faciliter la recherche d'adresse, différents outils ont été proposés. On connaît notamment des moteurs de recherche, permettant d'indexer des documents numériques stockés dans différents sites, et auxquels les utilisateurs peuvent soumettre des requêtes pour retrouver ces documents.
Dans les systèmes de diffusion, dits systèmes "push", les utilisateurs peuvent s'abonner à un ou plusieurs canaux qui leur fournissent automatiquement de nouveaux documents numériques, par exemple à chaque mise à jour. Ce mode de distribution s'apparente donc à la diffusion par télévision ou radio. Les documents numériques peuvent par exemple être délivrés sous forme de courrier électronique (e-mail), de message électronique sur un récepteur de radiomessagerie ou un téléphone, de télécopie, ou peuvent également être reçus et visualisés par une application particulière, souvent dénommée canal. Différents filtres, par exemple sous forme de "plug-ins" dans le butineur ("browser") de l'utilisateur ou dans une
application dans un serveur à distance, permettent d'une part de sélectionner les canaux parmi ceux qui sont disponibles (par exemple un canal diffusant des documents sur le sport et un deuxième canal spécialisé en politique), d'autre part éventuellement de trier les documents numériques diffusés par les canaux choisis (par exemple pour exclure les documents du canal sport contenant le mot clé "baseball").
Enfin, des systèmes d'agents, tels que décrits par exemple dans la demande de brevet WO96/23265, permettent aux utilisateurs de mémoriser une ou plusieurs requêtes de sélection de documents numériques. Une requête peut par exemple comprendre un ou plusieurs mots clés connectés par des opérateurs booléens par exemple. Un moteur évalue les requêtes des utilisateurs pour fournir les documents numériques trouvés qui obéissent à ces requêtes. Le moteur et/ou les requêtes peuvent être mémorisés dans le butineur de l'utilisateur, ou plus fréquemment être installés dans un serveur accessible par plusieurs utilisateurs.
Les utilisateurs de documents numériques disposent donc de moyens variés et d'outils élaborés pour retrouver, sélectionner et accéder aux documents qui les intéressent. Peu de moyens ont en revanche été développés dans l'art antérieur pour permettre aux éditeurs de documents de connaître les utilisateurs des documents mis à disposition et leurs intérêts. Les éditeurs disposent donc de peu d'informations relatives aux besoins des utilisateurs, ou permettant de savoir comment adapter le contenu des documents proposés afin de mieux répondre à ces besoins.
Des systèmes ont été proposés qui tentent de déduire les intérêts des utilisateurs en surveillant leur comportement. Des programmes de génération de fichier de connexion fournissent à l'administrateur d'un site WEB des indications sommaires telles que le nombre d'accès à un document ("hits"), le temps passé sur chaque page, les pays principaux des visiteurs, etc.. Ces systèmes ne sont toutefois pas destinés aux éditeurs de documents, mais aux administrateurs de site; ils ne fournissent en outre pas d'indications sur les intérêts des utilisateurs. En outre ils ne fonctionnent généralement pas lorsque l'accès au document consulté se fait via un cache,
ou un proxy, puisque dans ce cas, les interventions de l'utilisateur ne sont pas transmises à l'administrateur du site, mais seulement au gestionnaire du proxy.
D'autres systèmes connus observent le comportement des utilisateurs pour sélectionner et proposer d'autres documents susceptibles d'intéresser ces utilisateurs. Les propositions sont par exemple déduites du comportement des utilisateurs (par exemple le temps passé sur une page, etc..) en liaison parfois avec le comportement ou les achats d'utilisateurs antérieurs. Ainsi suggère-t-on déjà à l'utilisateur consultant une page Web l'adresse d'autres sites souvent consultés par les utilisateurs précédents de la page. Cette technique appelée filtrage en collaboration ("collaborative filtering") fonctionne mal avec des documents numériques à durée de vie brève, par exemple des nouvelles, et/ou destinés à une audience restreinte. Par ailleurs, dans le cas de documents longs ou traitant de thèmes variés, il est difficile pour le système de savoir précisément à quelle partie du document s'intéresse plus particulièrement l'utilisateur.
Un but de la présente invention est de proposer un système et un procédé de télécommunication dans un réseau de télécommunication global, permettant aux éditeurs de documents numériques d'obtenir davantage d'informations sur les utilisateurs des documents mis à disposition. En particulier, un but de la présente invention est de proposer un procédé et un système permettant aux éditeurs d'obtenir des informations sur les utilisateurs intéressés à un document avant même que ce document ne soit mis à disposition. Un autre but est de proposer un procédé et un système permettant aux éditeurs d'affiner, à l'aide de ces informations, les documents numériques mis à disposition, de façon à élargir l'audience ou à mieux cibler la diffusion des documents numériques.
Selon l'invention, ces buts sont atteints au moyen d'un procédé et d'un système comportant les caractéristiques des revendications indépendantes de type correspondant, des variantes préférentielles étant par ailleurs indiquées dans les revendications dépendantes.
En particulier, ces buts sont atteints au moyen d'un procédé et d'un système dans lesquels les requêtes des utilisateurs sont mémorisées dans une banque de données dans le réseau de télécommunication. Un moteur d'analyse de requête fournit aux éditeurs de documents numériques un rapport sur les utilisateurs ayant introduit des requêtes auquel le document obéit au moins partiellement et sur le profil d'intérêt de ces utilisateurs. Ce rapport peut être fourni non seulement après la mise à disposition effective du document (contrôle d'audience), mais également à titre de test lors de l'élaboration du document ("combien d'utilisateurs auraient requis ce document?"). Il est même possible de consulter la banque de données de requêtes pour obtenir des informations sur les besoins des utilisateurs avant même qu'un document ne soit préparé.
Le système et procédé de l'invention permettent donc aux éditeurs d'augmenter la pénétration des documents numériques créés dans le public cible choisi, et donc de réduire le volume d'information à créer pour atteindre un taux de diffusion déterminé dans ce public-cible. Pour les utilisateurs, le système et le procédé de l'invention permettent de recevoir des informations ciblées selon un profil établi sur mesure, de manière automatique et sans effort, ce qui permet en conséquence d'augmenter la fidélité du groupe d'utilisateurs ciblés aux documents numériques d'un éditeur.
Le système et procédé de l'invention permettent donc de fournir aux éditeurs des informations sur les intérêts des utilisateurs qui ne sont pas basées sur des suppositions arbitraires tirées de leur comportement, ou du comportement d'autres utilisateurs, mais sur des requêtes introduites par les utilisateurs eux-mêmes. Par ailleurs, ce système et procédé permettent d'adapter les documents numériques aux intérêts d'un ou de plusieurs utilisateurs avant même de diffuser ces documents numériques ou de les mettre à disposition.
Le système et procédé de l'invention fournissent donc des informations aux éditeurs sur ce que les utilisateurs recherchent réellement à l'aide de requêtes, contrairement à d'autres systèmes connus qui s'appuient,
pour leurs conclusions, sur les comportements ou les clics de visiteurs aléatoires.
Comme ce système et procédé fournissent des indications aux éditeurs à partir des requêtes introduites par les utilisateurs, ils permettent d'obtenir des indications fiables même lorsque les documents sont très longs et incluent des passages qui n'intéressent pas l'utilisateur. Si par exemple le document consulté correspond à toute une édition d'un journal comprenant plusieurs articles, le système et procédé de l'invention permettent à l'éditeur de déterminer, à partir de la requête introduite, à quel article particulier s'intéressent les utilisateurs. Le système permet donc aux éditeurs de déterminer, à l'intérieur même d'un document, quels sont les passages importants qui méritent d'être davantage élaborés, et quels autres passages moins demandés peuvent éventuellement être abandonnés.
Par ailleurs, le système fonctionne même lorsque l'accès aux documents se fait au travers d'un proxy, puisque les proxys ne répondent généralement pas aux requêtes et les retransmettent au site sur lequel est mémorisé le document de base. Le système et procédé de l'invention permettent donc de fournir aux éditeurs de documents numériques des indications fiables sur les intérêts des utilisateurs, même lorsque les utilisateurs accèdent aux documents numériques des éditeurs via un ou plusieurs proxys.
L'invention sera mieux comprise à l'aide de la description donnée à titre d'exemple et illustrée par la figure unique annexée qui montre sous forme de schéma bloc un système de diffusion d'informations selon une variante préférentielle de l'invention, dans le cas particulier d'une implémentation selon une architecture client-serveur.
Bien que la figure illustre plus particulièrement le cas particulier d'une implémentation dans une architecture de type client-serveur, l'homme du métier comprendra que le procédé de l'invention peut aussi être mis en oeuvre dans une architecture distribuée, dans laquelle au moins une part de la logique et/ou des données est répartie auprès des utilisateurs (par
exemple dans des plug-ins de leur butineur) et dans des agents dans le réseau.
Dans cette description ainsi que dans les revendications, le terme de document numériques mis à disposition englobe des documents de types très différents, par exemple des documents numériques en mode texte, hypertexte (par exemple HTML), des documents multimédia, par exemple des images fixes ou animées et/ou des séquences sonores, des objets informatiques, par exemple des applets, des groupes de documents numériques, par exemple des e-mails avec des annexes ("attachments"), des rapports ou des vues tirées d'une banque de donnée, l'invention n'étant pas limitée à ces exemples particuliers.
De même, le terme requête doit être compris dans son acception la plus large. Les requêtes peuvent être de types très différents et comprendre des mots clés ou d'autres champs, par exemples des intervalles de dates, et/ou différents opérateurs, par exemple des opérateurs booléens ou de logique floue, ou encore des références à d'autres documents. D'autres types de requêtes plus évoluées peuvent comprendre des éléments de langage naturel, ou des instructions de tri des documents numériques selon leur pertinence (ranking) ou selon le nombre de consultation par d'autres utilisateurs. L'invention n'est toutefois pas limitée à ces exemples particuliers de requêtes.
Sur la figure, différents éditeurs 1, par exemple des détenteurs de site Internet sur le World Wide Web ou dans un réseau intranet ou extranet, mettent différents documents numériques à disposition. Les documents numériques peuvent par exemple être regroupés sur un ou plusieurs sites WEB d'un ou plusieurs serveurs accessibles par leurs adresses URL. Les serveurs sont reliés au réseau Internet 5 par des routeurs 3.
Le système de l'invention comprend de préférence un ou plusieurs modules informatiques installés sur un ou plusieurs serveurs 7. Le serveur 7 est également connecté aux éditeurs 1 et aux utilisateurs 9, de préférence par l'intermédiaire d'un routeur non représenté et du réseau Internet 5. Dans
une variante de l'invention, le serveur 7 est installé directement auprès d'un éditeur de documents numériques 1, afin de permettre la diffusion de documents de cet éditeur, et éventuellement d'autres éditeurs connectés via le réseau Internet 5. Le serveur comprend de préférence une combinaison des éléments 71, 72, 73, 74, 75 et/ou 76. L'élément 71 est une banque de données contenant les documents numériques mis à disposition par les éditeurs 1. De préférence, la banque de données 71 ne contient pas de copie complète de ces documents, mais seulement un lien vers ces documents, par exemple sous la forme d'une adresse URL, ainsi qu'éventuellement un index des termes ou du contenu du document. Le module 72 contient des informations relatives aux éditeurs de ces documents, y compris au moins leurs coordonnées, par exemple sous forme d'adresse électronique (e-mail), afin de leur acheminer les informations requises. Dans le cas d'un système dont l'utilisation par les éditeurs de documents numériques est payante, le module 72 contient de préférence également les données nécessaires à la facturation. Les coordonnées des éditeurs peuvent naturellement aussi être mémorisées dans la banque de données 71 de documents numériques, plutôt que dans un module séparé.
Le module 73 est une banque de données qui contient les requêtes des utilisateurs du système de l'invention. Les requêtes mémorisées peuvent être de n'importe quel type, comme expliqué plus haut, et éventuellement regroupées en différentes classes, par exemple par mots clés. Le système contient en outre de préférence un module 74 contenant les profils d'utilisateurs du système, associés aux requêtes correspondantes. Les profils d'utilisateurs peuvent contenir n'importe quel type d'information relative aux utilisateurs et susceptibles d'intéresser les éditeurs de documents numériques, par exemple âge, sexe, profession, intérêts, type de terminal utilisé, comportement, chemin d'accès, historique des documents consultés, etc.. Certaines données peuvent par exemple être introduites volontairement par les utilisateurs, par exemple lors de leur abonnement au système dans le cas d'un système à abonnement, tandis que d'autres seront par exemple complétées ou mises à jour à chaque nouvel accès. Certaines données, par exemple le type de terminal et de butineur utilisé, peuvent aussi être déterminées automatiquement par une application appropriée sur
le serveur 7, par exemple au moyen du système JINI utilisé notamment dans les réseaux de télécommunication mobiles, ou au moyen d'une application de type fichier de connexion (logfile) disponible commercialement. De préférence, et afin de respecter l'anonymat des utilisateurs, la banque de données 74 ne contient pas de donnée permettant d'identifier personnellement les utilisateurs, telle que le nom, l'adresse électronique, etc.. Dans une variante, utilisée de préférence lorsque le système de l'invention est payant pour les utilisateurs, le module 74 contient également les données nécessaires à la facturation du système, mais dans une zone protégée de la banque de données.
Le module 75 dans le serveur 7 est un moteur, c'est-à-dire une application qui sélectionne, parmi les documents numériques dans la banque de données 71, ceux qui obéissent aux requêtes introduites par les utilisateurs dans la banque de données 73. Le terme de moteur désigne dans ce document toute application logicielle dans un serveur capable d'évaluer les requêtes de clients, désignés ici plutôt comme utilisateurs. Des exemples de tels moteurs sont bien connus notamment dans la technique des banques de donnée, des moteurs de recherche ou des agents de recherche dans Internet et leur fonctionnement ne sera donc pas décrit plus en détail ici. Selon différents modes d'exécution de l'invention, le moteur peut soit analyser des requêtes, par exemple sous la forme de mots clés, introduites pour un seul usage ("ad hoc queries") par exemple dans un moteur de recherche, ou/et analyser des requêtes mémorisées pour un usage répété, en tant que signet ou dans un agent par exemple.
Le moteur 75 recherche les documents numériques de la banque de données 71 qui obéissent à certaines requêtes dans la banque de données 73, et déclenche différentes actions lorsque de tels documents sont découverts. Cette recherche peut s'effectuer, selon différentes variantes de l'invention, soit à chaque fois qu'un nouveau document est mis à disposition par un éditeur, ou lorsqu'une nouvelle requête est introduite, mais aussi à intervalles réguliers par exemple.
Le moteur déclenche l'une au moins des deux actions suivantes lorsqu'il découvre une correspondance entre un document et une requête (ou même lorsqu'aucune correspondance n'est trouvée):
a) Préparation d'une indication relative à la requête et destinée à l'éditeur du document. Cette indication peut être envoyée immédiatement à l'éditeur, et/ou regroupée dans un rapport contenant plusieurs indications de ce type et pouvant être envoyé ou mis à jour ultérieurement. L'indication peut aussi être mémorisée dans une zone appropriée (non représentée) du serveur 7 et accessible par l'éditeur 1, par exemple sous forme de page WEB dont l'accès est protégé par un mot de passe connu seulement de l'éditeur.
L'indication fournie aux éditeurs peut contenir des informations, par exemple sous forme de statistiques, sur les requêtes auxquelles ce document obéit. Par exemple, l'éditeur peut recevoir la liste des 20% de mots clés les plus souvent introduits dans les requêtes auquel le document obéit, caractéristiques des sujets d'intérêt général, ainsi que les 20% de mots clés les moins souvent cités, caractéristiques des sujets d'intérêt particulier, D'autres manières de regrouper sous forme de statistiques les requêtes peuvent aisément être imaginées dans le cadre de cette invention. L'éditeur peut aussi recevoir le nombre de requêtes auxquels le document obéit, et, si possible, des informations complémentaires tirées de la banque de données 74 sur le profil des utilisateurs ayant émis ces requêtes (pays, adresse, société, fonction, autres intérêts, autres requêtes introduites, etc.). Le moteur 75 peut aussi, selon l'application, émettre également des recommandations sur la manière d'augmenter l'audience du document (par exemple, quels mots clés supplémentaires devraient être introduits), ou sur la manière de cibler davantage un groupe cible déterminé (par exemple, comment modifier le document pour atteindre les utilisateurs intéressés par un sujet particulier), Dans une variante, l'éditeur peut aussi choisir de limiter l'analyse des requêtes introduites à une période temporelle qu'il peut de préférence déterminer lui-même (Par exemple: "je veux seulement des indications sur les utilisateurs qui auraient requis ce document la semaine dernière"), ou au moyen d'autres critères, par exemple selon le public-cible choisi, le pays, la société, l'organisation, l'âge, etc..
b) Si le document n'est pas un document proposé à l'essai, déclenchement d'un signal au programmateur de diffusion ("scheduler") 76 pour lui ordonner d'envoyer le document aux utilisateurs ayant émis les requêtes correspondantes. Le programmateur de diffusion 76, qui est de préférence constitué par une application logicielle sur le serveur 7 ou sur un autre serveur relié, crée une liste de documents numériques à envoyer selon un horaire défini aux utilisateurs 9. Les documents numériques sont envoyés par un outil de distribution ("dispatcher") 8 de préférence constitué par une application logicielle sur le serveur 7 ou sur un autre serveur relié. Le document peut selon le système être envoyé par l'outil 8 sous forme de courrier électronique (e-mail) envoyé à travers Internet 5, de page HTML, de fax, dans un applet, ou par n'importe moyen approprié. Il est aussi possible de n'envoyer qu'une partie du document, par exemple uniquement une référence ou une adresse URL de ce document, aux utilisateurs 9.
Les utilisateurs peuvent émettre des requêtes et recevoir les documents numériques au moyen d'un programme approprié sur un dispositif terminal, dans le plus simple des cas au moyen d'un butineur 90 conventionnel exécuté sur un ordinateur personnel ou sur une station de travail. Dans un mode de réalisation préférentiel de l'invention, les utilisateurs utilisent un plug-in 900, c'est-à-dire une application complémentaire au butineur 90 permettant de lui adjoindre de nouvelles fonctions. Le plug-in peut par exemple permettre d'introduire des requêtes selon un formalisme défini afin de faciliter leur archivage dans la banque de données 73 et leur évaluation par le moteur 75. De tels plug-ins permettent par exemple aux utilisateurs de définir leur profil et leurs intérêts au moyen de requêtes et de soumettre ces requêtes à un agent sur un serveur à distance, afin de recevoir des documents numériques de cet agent. Le plug-in permet en outre d'accéder aux signets ou à d'autres types de requêtes mémorisées de manière semi-permanente dans le butineur et des transmettre à l'agent.
Le moteur peut obtenir d'autres informations sur les utilisateurs des documents, notamment des indications obtenues après la lecture des
documents numériques et relatives au comportement des utilisateurs, le temps et la durée de lecture, les signets introduits, l'impression et/ou la sauvegarde du document, etc.. Comme décrit par exemple dans le brevet US5727950 ou dans d'autres documents similaires. Ces indications complémentaires sont de préférence également mémorisées dans la banque de données 73, en liaison avec les profils des utilisateurs correspondants 74, afin d'être fournies aux éditeurs de documents 1.
Comme suggéré plus haut, le système de l'invention permet de préférence aux éditeurs de soumettre un nouveau document à titre de test au système, afin de déterminer le nombre de requêtes auquel ce document obéit et le profil des utilisateurs intéressés. Il est ainsi possible de faire évaluer par modifications successives le document, afin d'améliorer son audience ou de mieux le cibler, avant de le mettre effectivement à disposition des utilisateurs. Le système permet par exemple à un voyagiste de créer des propositions de voyage pour des clients, et de les leur soumettre par courrier électronique, en tenant compte de leurs désirs exprimés sous forme de requête mémorisées dans la banque de données 73. De même, un éditeur de magazine on-line peut avec ce système préparer des articles répondant précisément aux questions que se pose un public ciblé. De préférence, les éditeurs peuvent également accéder au moins à certaines indications contenues dans la banque de données de requêtes, sans même soumettre de documents de test.
Comme suggéré, les requêtes dans la banque de données 73 peuvent être obtenues par différents moyens, selon l'application, avec ou sans la collaboration des utilisateurs. Les requêtes peuvent par exemple être mémorisées volontairement dans la banque de données 73 par les utilisateurs 9, à leur initiative, afin d'être informés des nouvelles publications dans un domaine particulier. Les requêtes peuvent aussi être des requêtes destinées à un usage unique, par exemple destinées à un moteur de recherche, qui, après avoir évalué la requête, la stocke dans la banque de données 73. Dans le cas par exemple où le système comprend des plug-ins 900, comme expliqué ci-dessus, ces derniers peuvent aussi observer certains choix, comportement ou options des utilisateurs pour en déduire des
requêtes. Par exemple, le plug-in peut analyser la liste des documents numériques indexés dans le fichier de signets pour en déduire les intérêts de l'utilisateur. D'autres types de requêtes peuvent aussi être mémorisées pour un usage répété dans le dispositif terminal des utilisateurs et ensuite être copiées dans la banque de données 73, de préférence à l'initiative de l'utilisateur, éventuellement à celle du moteur 75.
Le système et procédé de l'invention peuvent être mis en oeuvre dans des environnements logiciels et matériels divers. Les fonctionnalités des différents composants 71 à 76 peuvent par exemple aussi être implementees dans une application de type programme de génération de fichier de connexion ("logfile analysis programme"), telle qu'utilisée par exemple par les administrateurs de sites WEB pour vérifier le nombre d'accès ou de hits à un site et obtenir des informations sur les utilisateurs de ce site. Dans ce cas, le procédé et système de l'invention permet à l'éditeur de document et/ou à l'administrateur du site d'obtenir à partir des requêtes introduites par les utilisateurs des renseignements statistiques sur leurs intérêts.