FR2875663A1 - Procede et dispositif de verification d'entites multimedia - Google Patents
Procede et dispositif de verification d'entites multimedia Download PDFInfo
- Publication number
- FR2875663A1 FR2875663A1 FR0410088A FR0410088A FR2875663A1 FR 2875663 A1 FR2875663 A1 FR 2875663A1 FR 0410088 A FR0410088 A FR 0410088A FR 0410088 A FR0410088 A FR 0410088A FR 2875663 A1 FR2875663 A1 FR 2875663A1
- Authority
- FR
- France
- Prior art keywords
- multimedia
- correspondence
- entity
- multimedia entity
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00204—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
- H04N1/00244—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server with a server, e.g. an internet server
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/0021—Image watermarking
- G06T1/005—Robust watermarking, e.g. average attack or collusion attack resistant
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00002—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00002—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
- H04N1/00005—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for relating to image data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00002—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
- H04N1/00026—Methods therefor
- H04N1/00037—Detecting, i.e. determining the occurrence of a predetermined state
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00002—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
- H04N1/00071—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for characterised by the action taken
- H04N1/00074—Indicating or reporting
- H04N1/00076—Indicating or reporting locally
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2201/00—General purpose image data processing
- G06T2201/005—Image watermarking
- G06T2201/0065—Extraction of an embedded watermark; Reliable detection
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Un procédé pour vérifier au moins une correspondance entre une première et une seconde entité multimédia, comprend les étapes suivantes : obtention d'un premier critère de fiabilité (C1) de correspondance, comparaison du premier critère de fiabilité (C1) obtenu à un seuil prédéterminé, et en fonction du résultat de la comparaison, décision sur une première correspondance entre la première et la seconde entité multimédia. En cas de décision positive de première correspondance, le procédé comprend les étapes suivantes : extraction d'une première information dans la première entité multimédia, comparaison entre l'information extraite et une seconde information de la seconde entité multimédia, obtention d'un second critère de fiabilité (C2) de correspondance, en fonction du résultat de la comparaison d'informations, décision sur une correspondance entre les première et seconde informations, et décision sur une seconde correspondance entre la première et la seconde entité multimédia et détermination d'une mesure de la fiabilité de la décision sur la seconde correspondance.
Description
La présente invention concerne un procédé et un dispositif de vérification
d'entités multimédia. Plus particulièrement, la présente invention concerne un procédé et un dispositif de vérification d'entités multimédia adaptés à la vérification des images numériques.
L'invention s'applique dans le domaine de la recherche et de la mise en correspondance d'entités multimédia en fonction de leur contenu.
On sait que le réseau Internet représente un immense réservoir d'informations en tous genres. L'image y prend une part de plus en plus grande et il devient très difficile de contrôler l'usage qui est fait d'une image publiée sur un site Web.
Des dispositifs de vérification d'images ont vu le jour pour essayer de contrôler l'usage de certaines images sur le réseau Internet.
La fonction d'un dispositif de vérification d'images sur le réseau Internet est de déterminer si des images, préalablement enregistrées auprès d'un opérateur d'enregistrement ou auprès de l'opérateur gérant le dispositif de vérification d'images afin de les protéger, sont publiées sur un ou plusieurs sites Web donnés. Ainsi, une application particulière d'un tel dispositif est la recherche sur le réseau Internet d'images dont l'usage est illégal.
Les images préalablement enregistrées sont celles dont l'utilisation veut être contrôlée par les ayants droits. Ces ayants droits sont, par 30 exemple, les agences de distribution de photographies, les photographes auteurs ou les créateurs des images.
2875663 2 Selon l'application particulière précitée, des images sont récupérées des sites Web donnés, ces images sont appelées images publiées par la suite, et chaque image publiée est comparée aux images préalablement enregistrées, appelées images propriétaires par la suite, grâce à un dispositif de vérification.
La performance d'un dispositif de vérification d'images se mesure en termes de compromis entre le taux de fausses alarmes, le taux de non détection et le temps de traitement.
On notera que le taux de fausses alarmes est égal au 10 pourcentage des images publiées qui sont détectées comme correspondant à une image déjà enregistrée alors que ce n'est pas la même image.
Le taux de non détection, quant à lui, correspond au pourcentage des images publiées non détectées par le dispositif de vérification d'images alors que ces images publiées sont les mêmes que des images déjà enregistrées.
Enfin, le temps de traitement correspond au temps nécessaire pour traiter les images à vérifier (images provenant par exemple du Web).
Le dispositif de vérification d'images doit pouvoir reconnaître une image même si celle-ci a subi une modification, mais il doit cependant éviter de décider qu'il s'agit d'une même image si ce n'est pas le cas. Les modifications peuvent constituer, par exemple, en un recadrage, des changements de taille, des changements de luminosité ou de contraste, des changements de couleurs, ... De plus, ces modifications peuvent être suivies d'une compression avec pertes. Ainsi, l'ensemble de ces modifications peut avoir un impact non négligeable sur l'aspect visuel de l'image utilisée, ce qui ne facilite pas la prise de décision par le dispositif de vérification d'images.
Par ailleurs, les dispositifs de vérification d'images demandent une optimisation quant à leur complexité, en raison des contraintes qui pèsent sur le temps de traitement et les ressources matérielles disponibles.
En effet, le dispositif de vérification d'image doit être capable de traiter en continu de larges volumes d'images à vérifier dans une durée acceptable par l'utilisateur, ce qui impose une limite supérieure en terme de temps de traitement et, avec un coût minimum.
Les dispositifs de vérification d'images connus font appel, à une seule technique de comparaison, à savoir une technique basée sur un marquage/tatouage de l'image, ou une technique de comparaison de la description de l'image publiée sur un site Web avec les descriptions des images protégées. En fonction du résultat de cette comparaison, il est alors décidé si l'image publiée correspond ou non à une image protégée particulière.
Ainsi, on connaît, d'après le document US 5 862 260, un dispositif de vérification d'images dans lequel est employée une technique de marquage / tatouage invisible d'image.
Une vérification d'images dans laquelle est employée seulement une technique de marquage / tatouage invisible d'image ne peut garantir un taux de non détection, car les techniques de tatouage ont une robustesse limitée face aux modifications que l'image publiée a pu subir. Ainsi, la marque insérée dans l'image peut être effacée par certaines manipulations, même non intentionnelles. Par conséquent, le taux de détection peut devenir égal à zéro pour certaines manipulations d'images.
Par ailleurs, le nombre des informations qu'il est possible d'insérer dans les images est intrinsèquement limité par la contrainte de visibilité de la marque, et ce nombre décroît avec le niveau de robustesse souhaité. Dans l'état actuel de la technique, pour un niveau de robustesse compatible avec l'attente des utilisateurs d'un dispositif de vérification d'images, le nombre des informations pouvant être insérées est insuffisant pour le codage d'un identifiant unique par image. Ainsi, le dispositif de vérification d'images décrit dans le document US 5 862 260 ne permet, par exemple, qu'une simple identification du propriétaire de l'image et non pas celle de l'image elle-même. Ceci est dû au fait que le nombre des images possibles est considérablement supérieur au nombre de propriétaires.
On connaît, d'après le document FR 2 831 006, une technique de comparaison de la description de l'image publiée sur un site Web avec les descriptions des images protégées.
2875663 4 Un dispositif de vérification d'images faisant appel à une telle technique s'appuie sur des informations représentant le contenu visuel des images. En effet, les images enregistrées sont décrites à l'aide de descripteurs numériques calculés à partir du contenu visuel des images. On compare alors ces descripteurs avec ceux des images publiées et qui sont donc utilisées. En fonction du résultat de cette comparaison, on décide alors d'une correspondance ou d'une non-correspondance entre deux images comparées.
Un inconvénient d'un tel dispositif, outre le niveau de robustesse variable selon les techniques de description utilisées, réside dans le fait que la décision ne peut se faire avec certitude. En effet, il est toujours possible que des images dont les contenus sont identiques au sens des descripteurs des images soient différentes.
Par conséquent, en sus des problèmes de robustesse, les dispositifs de vérification d'images de la technique antérieure décrits ci-dessus sont peu adaptés pour garantir à l'utilisateur un niveau de performance déterminé.
Ainsi, la présente invention propose un procédé de vérification d'entités multimédia dans lequel un niveau de performance satisfaisant est garanti sous la contrainte d'un temps de traitement limité.
La présente invention a pour objet un procédé de vérification d'au moins une correspondance entre une première entité multimédia et une seconde entité multimédia. Le procédé comprend les étapes suivantes: - obtention d'un premier critère de fiabilité (Cl) de correspondance, - comparaison du premier critère de fiabilité (Cl) obtenu à un seuil 25 prédéterminé, - en fonction du résultat de la comparaison, décision sur une première correspondance entre la première entité multimédia et la seconde entité multimédia, - en cas de décision positive de première correspondance, le procédé 30 comprend les étapes suivantes: o extraction d'une première information dans la première entité multimédia, o comparaison entre l'information extraite et une seconde information de la seconde entité multimédia, o obtention d'un second critère de fiabilité (C2) de correspondance, o en fonction du résultat de la comparaison d'informations, décision sur une correspondance entre les première et seconde informations, et o décision sur une seconde correspondance entre la première entité multimédia et la seconde entité multimédia en fonction, d'une part, de la décision de la première correspondance entre la première et la seconde entité multimédia et, d'autre part, de la décision sur une correspondance entre les première et seconde informations et, o détermination d'une mesure de la fiabilité de la décision sur la seconde correspondance en fonction d'au moins un des premier et second critères de fiabilité de correspondance.
Le principe du procédé de vérification d'entités multimédia selon l'invention repose sur un découpage en deux décisions de correspondance, à savoir, une première étape de décision sur une première correspondance et une seconde étape de décision sur une seconde correspondance. Ce découpage en deux étapes, associé à l'utilisation de techniques de vérification différentes à chacune des étapes, assure un taux de fausses alarmes suffisamment faible, et donc une efficacité très satisfaisante.
La décision sur une seconde correspondance est prise en fonction d'une part, de la décision sur une première correspondance et d'autre part, de la décision sur une correspondance entre une première information contenue dans la première entité multimédia et une seconde information de la seconde entité multimédia.
Un premier critère Cl de fiabilité de correspondance permet d'évaluer la fiabilité de la décision de première correspondance, et un second critère C2 de fiabilité de correspondance est, par exemple, une probabilité de fausse alarme qui intervient lors de la comparaison entre la première information contenue dans la première entité multimédia et la seconde information de la seconde entité multimédia.
A l'issue des étapes de décision de correspondance, on détermine une mesure de la fiabilité de la décision sur la seconde correspondance. Cette mesure est fonction, d'une part, des résultats de la décision sur la première correspondance et de la décision sur une correspondance entre les première et seconde informations et, d'autre part, du premier et / ou du second critère.
Ainsi, l'invention permet de générer des décisions et une mesure de fiabilité de ces décisions.
Selon une caractéristique, la première information extraite de la première entité multimédia est un message de tatouage.
Selon cette caractéristique, la correspondance faisant suite à la décision positive de première correspondance est basée sur la détection de tatouage.
Selon une caractéristique particulière, l'extraction du message de tatouage est effectuée à partir d'au moins un paramètre d'extraction associé à un second message de tatouage de la seconde entité multimédia.
L'extraction d'un message à partir de paramètres d'extraction permet de retrouver le message tatoué selon une technique dite en non aveugle, technique particulièrement avantageuse en termes de performances.
Selon une caractéristique particulière, ledit au moins un paramètre d'extraction est associé à au moins un paramètre d'insertion utilisé pour l'insertion dudit second message de tatouage dans la seconde entité multimédia.
En effet, les paramètres d'extraction d'un message dans une image tatouée sont associés à des paramètres d'insertion qui ont été nécessaires à l'insertion préalable du message dans l'image.
Selon une caractéristique, préalablement à l'étape d'extraction d'une première information dans la première entité multimédia, le procédé comprend une étape de recalage de ladite première entité multimédia par rapport à ladite seconde entité multimédia, afin de permettre une extraction de ladite première information à partir de ladite première entité multimédia recalée.
2875663 7 Le procédé selon l'invention autorise l'utilisation d'algorithmes plus ou moins complexes de détection de marque de tatouage ou de recalage géométrique.
Selon un mode de réalisation, ladite première entité multimédia est obtenue à partir d'un réseau.
En effet, la première entité peut être présente dans un réseau de communication, par exemple, le réseau Internet.
Selon une caractéristique, l'obtention de ladite première entité multimédia comporte une étape d'identification de l'adresse sur le réseau de ladite première entité multimédia et / ou de l'adresse référençant ladite première entité multimédia.
L'obtention de l'adresse d'une image permet de connaître la source de l'image et de la retrouver si nécessaire.
Selon une caractéristique, les entités multimédia étant des images, l'étape de décision sur la seconde correspondance est suivie d'une étape d'établissement d'un rapport contenant une indication de même scène si la décision sur la première correspondance entre la première entité multimédia et ladite seconde entité multimédia est positive et si la décision sur la correspondance entre les première et seconde informations est négative.
A l'issue de la décision sur une seconde correspondance entre les première et seconde informations, un rapport est émis. Ce rapport indique que les deux images représentent une même scène Si le résultat de la décision de première correspondance est positif et si les informations contenues dans les images sont différentes.
Selon une caractéristique dépendant de la caractéristique précédente, la mesure de la fiabilité de la décision sur la seconde correspondance est associée à l'indication de même scène et correspond au premier critère de fiabilité (Cl) de correspondance.
Lorsque le résultat de la décision sur une seconde correspondance entre les première et seconde images indique que ces images représentent une même scène, alors la fiabilité associée à cette décision est limitée à la valeur du premier critère de fiabilité de correspondance.
Selon une autre caractéristique, l'étape de décision sur la seconde correspondance est suivie d'une étape d'insertion dans le rapport d'une indication de même image si la décision sur la première correspondance entre la première entité multimédia et la seconde entité multimédia est positive et si la décision sur la correspondance entre les première et seconde informations est positive.
Le rapport indique que les deux images représentent une même image Si le résultat de la décision de première correspondance est positif et si les informations contenues dans les images sont similaires, voire identiques.
Selon une caractéristique dépendant de la caractéristique précédente, la mesure de la fiabilité de la décision sur la seconde correspondance est associée à l'indication de même image et correspond au produit du premier critère de fiabilité de correspondance par le second critère de fiabilité de correspondance.
Selon un mode de réalisation, le rapport comporte l'adresse sur le réseau de ladite première entité multimédia et I ou l'adresse référençant ladite première entité multimédia.
Ainsi, le propriétaire de la seconde entité multimédia peut retrouver et vérifier la similitude de son entité multimédia avec une entité multimédia publiée.
Selon une caractéristique, la seconde entité multimédia fait partie d'un ensemble de secondes entités multimédia.
Ainsi, le procédé de vérification selon l'invention consiste à vérifier qu'une première entité multimédia correspond ou non à une seconde entité multimédia parmi une multitude de secondes entités.
Selon une caractéristique, préalablement à l'étape d'obtention d'un premier critère de fiabilité de correspondance, le procédé comprend une étape de sélection, parmi l'ensemble de secondes entités multimédia, d'une pluralité de secondes entités multimédia proches de ladite première entité multimédia.
Cette étape de sélection permet d'effectuer la vérification de la correspondance d'entités multimédia sur les secondes entités multimédia 2875663 9 sélectionnées, qui sont donc en nombre réduit par rapport à toutes les secondes entités de l'ensemble de secondes entités, ce nombre étant de préférence fixe.
Ceci simplifie donc les traitements ultérieurs.
Selon un mode de réalisation dans lequel chaque entité multimédia comprend une pluralité d'unités d'intérêt, l'obtention du premier critère de fiabilité de correspondance comprend les sous étapes suivantes: - mise en correspondance d'informations de contenu local de la première entité multimédia avec des informations de contenu local de la seconde entité multimédia, lesdites informations de contenu local étant associées à des unités d'intérêt, - mise en correspondance géométrique d'unités d'intérêt de la première entité multimédia avec des unités d'intérêt de la seconde entité multimédia, et - définition, dans l'une des entités multimédia, d'une zone comportant les unités d'intérêt résultant de l'étape de mise en correspondance géométrique; ladite obtention du premier critère de fiabilité de correspondance étant réalisée à partir du résultat des étapes de mise en correspondance d'informations de contenu local et de mise en correspondance géométrique sur la zone définie.
Le principe de ce mode de réalisation repose sur l'élaboration de deux types de mise en correspondance, puis la définition d'une zone permettant d'établir une mesure de cohérence de correspondance entre les deux entités multimédia.
Ce découpage, associé à l'utilisation de techniques adaptées à chacune des étapes, permet d'effectuer une mesure de mise en cohérence liée à un premier critère de fiabilité de correspondance. Ce critère étant défini par rapport aux étapes de mise en correspondance effectuées entre les deux entités multimédia, il permet d'obtenir une valeur du premier critère de fiabilité de correspondance au plus juste quant à la similarité, et donc permet d'obtenir de bonnes performances en termes de nombre de détections de correspondances et de fausses alarmes.
Selon une caractéristique, à chaque entité multimédia est associé au moins un descripteur déterminé préalablement à l'étape d'obtention du premier critère de fiabilité de correspondance, ledit au moins un descripteur associé à au moins une unité d'intérêt de l'entité multimédia comprenant au moins une information de contenu local et au moins une information de position, ledit au moins un descripteur étant utilisé lors des étapes de mise en correspondance d'informations de contenu local et de mise en correspondance géométrique.
A chaque entité multimédia, on associe ainsi au moins un descripteur qui est utilisé pour l'ensemble des étapes du procédé de vérification, sans que cela nécessite, en cours de traitement, le calcul de nouveaux descripteurs.
Selon une autre caractéristique, l'étape de mise en correspondance d'informations de contenu local de la première entité multimédia avec des informations de contenu local de la seconde entité multimédia, comporte les étapes suivantes: - pour chaque information de contenu local de la première entité multimédia, sélection, parmi les informations de contenu local de la seconde entité multimédia, des informations sensiblement proches de l'information de contenu local concernée, définissant ainsi un premier ensemble de correspondances dont chacune forme un couple entre l'information de contenu local concernée de la première entité et l'une des informations sensiblement proches de la seconde entité, - pour chaque information de contenu local de la seconde entité multimédia, sélection parmi les informations de contenu local de la première entité multimédia, des informations sensiblement proches de l'information de contenu local concernée, définissant ainsi un second ensemble de correspondances dont chacune forme un couple entre l'information de contenu local concernée de la seconde entité et l'une des informations sensiblement proches de la première entité, - détermination de l'intersection du premier et du second ensemble de correspondances.
En effet, selon cette étape du procédé de vérification, la mise en correspondance des unités d'intérêt multimédia est réalisée sur les informations de contenu local, ce qui offre l'avantage que la mise en correspondance est 2875663 11 possible même si les images ont été recadrées, la mise en correspondance d'informations de contenu local étant robuste.
Selon une caractéristique dépendant de la caractéristique précédente, la sélection d'un ensemble de correspondances pour une information de contenu local concernée d'une entité multimédia comporte les étapes suivantes: calcul des distances entre ladite information de contenu local concernée et chacune des informations de contenu local de l'autre entité multimédia, - détermination des distances inférieures à un seuil prédéterminé, définissant ainsi l'ensemble de correspondances concerné.
En effet, selon ces étapes, on définit les unités d'intérêt qui semblent similaires d'après les informations de contenu local associées.
Selon une caractéristique, l'étape de mise en correspondance géométrique comporte les étapes suivantes: - détermination d'une éventuelle transformation géométrique nécessaire pour obtenir la première entité multimédia à partir de la seconde entité multimédia, - détermination d'un ensemble d'unités d'intérêt de la première et de la seconde entité pour lesquelles la transformation géométrique permet de faire correspondre une unité d'intérêt de la première entité multimédia et une unité d'intérêt de la seconde entité multimédia.
En effet, afin d'améliorer la détection de la correspondance de deux entités multimédia, on détermine la transformation géométrique des unités d'intérêt des entités multimédia afin d'identifier l'ensemble des unités d'intérêt des entités multimédia qui sont en vraie correspondance géométriquement selon la transformation géométrique déterminée.
De cette transformation géométrique, il est ensuite possible de déduire les unités d'intérêt en correspondance.
Plus particulièrement, l'étape de détermination d'une éventuelle transformation géométrique comprend une estimation de la cohérence géométrique entre les informations de position associées aux informations de contenu local mises en correspondance.
Selon une caractéristique, l'obtention du premier critère de fiabilité de correspondance est effectuée à partir du rapport entre une probabilité que la première entité multimédia ne corresponde pas à l'une des secondes entités multimédia et une probabilité que la première entité multimédia corresponde à l'une des secondes entités multimédia, ces probabilités étant fonction du résultat des étapes de mises en correspondance.
On exprime ainsi le compromis entre une bonne détection et les fausses alarmes.
Selon une autre caractéristique, le rapport comprend en outre, une imagette dans laquelle est définie la zone comportant les unités d'intérêt résultant de l'étape de mise en correspondance géométrique.
Selon un mode de réalisation, préalablement à l'étape d'obtention du premier critère (Cl) de fiabilité de correspondance, le procédé comprend les étapes de: obtention d'au moins un descripteur de chacune des première et seconde entités multimédia, - calcul d'une distance entre les descripteurs obtenus.
Selon ce mode de réalisation, le premier critère de fiabilité de correspondance est fonction de la distance entre les descripteurs des entités multimédia.
Selon une caractéristique, l'obtention du premier critère de fiabilité de correspondance est effectuée à partir du calcul d'une probabilité de première correspondance en fonction de la distance calculée.
Selon une caractéristique particulière, le descripteur est obtenu par les étapes suivantes: - obtention d'un découpage de l'entité multimédia en au moins un nombre prédéterminé de blocs, et pour chaque bloc: - extraction d'au moins une unité d'intérêt, et - mémorisation des coordonnées de ladite au moins une unité d'intérêt. Ainsi, on obtient un descripteur particulièrement compact et dont le calcul est particulièrement rapide. En raison du découpage en blocs et de l'obtention de points d'intérêt pour chaque bloc du découpage, l'image est décrite de manière régulière, ce qui permet de caractériser à la fois les zones à fortes variations de luminance et les zones lisses.
Selon une caractéristique, le calcul d'une distance, entre les descripteurs obtenus de la première entité multimédia et de la seconde entité multimédia, est effectué par sommation sur l'ensemble des blocs obtenus par découpage de chaque entité multimédia, des distances entre unités d'intérêt appartenant auxdits blocs spatialement correspondants.
Selon une autre caractéristique, la distance entre unités d'intérêt par bloc est égale à la distance maximale entre coordonnées des unités d'intérêt.
Selon une caractéristique, la distance calculée est égale au minimum des distances obtenues après application, sur l'une des entités multimédia considérées, d'une transformation géométrique appartenant à un ensemble prédéterminé de transformations.
Ainsi, la distance finalement calculée prend en compte un certain nombre de transformations prédéterminées, comme par exemple les rotations d'angle droit ou les symétries d'axes vertical et horizontal.
Selon une caractéristique, l'étape d'obtention d'un découpage 20 comprend les étapes de: - normalisation de la taille de l'entité multimédia à une taille prédéterminée - découpage de l'entité multimédia normalisée suivant ledit au moins un nombre prédéterminé de blocs.
Ainsi, les éventuels changements d'échelle que peuvent subir les images sont pris en compte automatiquement du fait de la normalisation. De plus, les coordonnées des points d'intérêt obtenus après normalisation ont des valeurs appartenant à un intervalle de valeurs déterminé par la taille de l'image normalisée, ce qui permet de connaître précisément le nombre de bits nécessaire pour mémoriser le descripteur.
Selon une caractéristique, une unité d'intérêt est un extremum d'un opérateur de filtrage.
Selon une caractéristique, l'étape de sélection d'une pluralité de secondes entités multimédia proches de ladite première entité multimédia comprend les étapes suivantes: - pour chaque couple de première et seconde entités multimédia, les 5 étapes d'obtention des descripteurs et de calcul de la distance associée du procédé de l'invention, et sélection des secondes entités multimédia pour lesquelles les distances avec la première entité multimédia sont les plus faibles.
Selon une autre caractéristique, le premier critère de fiabilité de 10 correspondance dépend en outre du nombre de secondes entités multimédia de l'ensemble de secondes entités multimédia.
Selon une autre caractéristique, le seuil prédéterminé est une valeur prédéterminée (P FA) de la probabilité de prendre une décision erronée sur la première correspondance entre la première entité multimédia et une seconde entité multimédia.
Corrélativement, l'invention vise également un dispositif de vérification d'au moins une correspondance entre une première entité multimédia et une seconde entité multimédia, caractérisé en ce que le dispositif comprend: des moyens d'obtention d'un premier critère de fiabilité (Cl) de correspondance, - des moyens de comparaison du premier critère defiabilité (Cl) obtenu à un seuil prédéterminé, - des moyens de décision sur une première correspondance entre la première entité multimédia et la seconde entité multimédia aptes à décider sur la première correspondance en fonction du résultat de la comparaison, - des moyens d'extraction d'une première information dans la première entité multimédia, - des moyens de comparaison entre l'information extraite et une seconde 30 information de la seconde entité multimédia, - des moyens d'obtention d'un second critère de fiabilité (C2) de correspondance, - des moyens de décision sur une correspondance entre les première et seconde informations aptes à décider sur la correspondance en fonction du résultat de la comparaison d'informations, - des moyens de décision sur une seconde correspondance entre la première entité multimédia et la seconde entité multimédia aptes à décider sur la seconde correspondance en fonction, d'une part, de la décision de la première correspondance entre la première et la seconde entité multimédia et, d'autre part, de la décision sur une correspondance entre les première et seconde informations, et - des moyens de détermination d'une mesure de la fiabilité de la décision sur la seconde correspondance aptes à déterminer la mesure de la fiabilité de la décision en fonction d'au moins un des premier et second critères de fiabilité de correspondance.
Ce dispositif présente les mêmes avantages que le procédé de vérification brièvement décrit ci-dessus.
Selon d'autres aspects, l'invention concerne aussi un dispositif de traitement d'information aptes à fonctionner en tant que dispositif de vérification d'entités multimédia tel que décrit brièvement ci-dessus, un système de télécommunications, un dispositif de stockage d'entités multimédia, un support d'informations lisibles par un système informatique ainsi qu'un programme d'ordinateur pour une mise en oeuvre du procédé selon l'invention décrit brièvement ci-dessus.
D'autres caractéristiques et avantages de la présente invention apparaîtront à la lecture de la description suivante de plusieurs formes de réalisation des procédé et dispositif de vérification d'entités multimédia selon l'invention, en référence aux dessins annexés, parmi lesquels: la figure 1 montre une vue générale d'un dispositif de vérification d'images numériques selon l'invention dans laquelle apparaissent des processus de traitement implantés dans le dispositif la figure 2a est un organigramme fonctionnel représentant de manière générale un procédé de vérification d'images numériques selon l'invention; la figure 2b illustre la correspondance de type "même scène" et la correspondance de type "même image" ; la figure 3 est un organigramme fonctionnel d'un procédé selon l'invention de vérification d'au moins une correspondance entre une image et au moins une seconde image mis en oeuvre dans le dispositif de vérification d'images numériques de la figure 1; la figure 4 est un exemple de rapport généré à l'issue du procédé de vérification de correspondance d'images; la figure 5 est un organigramme fonctionnel représentant un premier mode de réalisation d'un procédé de vérification mis en oeuvre dans le dispositif de vérification d'images numériques de la figure 1; la figure 6 est un organigramme fonctionnel du procédé de mise en correspondance d'une image publiée avec une image propriétaire; la figure 7a est un organigramme fonctionnel du procédé de mise en correspondance des informations de contenu local de deux images; la figure 7b présente de manière schématique la mise en correspondance résultant de l'invention; la figure 8 est un organigramme fonctionnel représentant un second mode de réalisation d'un procédé de vérification mis en oeuvre dans le dispositif de vérification d'images numériques de la figure 1; - la figure 9 illustre un procédé de calcul de descripteur selon le second mode de réalisation du procédé de vérification; la figure 10 représente schématiquement la distance associée au descripteur obtenu selon l'invention; la figure 11 représente un tableau explicitant l'ensemble des transformations géométriques considérées pour le calcul de la distance selon l'invention; et - la figure 12 est un bloc-diagramme représentant une forme de réalisation préférée du dispositif de vérification d'images numériques de la figure 1 construite autour d'un micro-ordinateur.
2875663 17 En référence à la figure 1, le dispositif de vérification d'images 1 selon l'invention reçoit en entrée des entités multimédia de référence, par exemple des images propriétaires IC à protéger qui sont fournies par des clients 2 et des entités multimédia courantes, par exemple des images IP qui sont publiées sur des sites Web 3. Le dispositif 1 a pour tâche de comparer les images IP avec les images IC.
Dans cette forme de réalisation, les images IC et IP sont transportées jusqu'au dispositif 1 à travers un réseau de communication 4, par exemple, le réseau Internet. Dans d'autres formes de réalisation, les images IC et IP peuvent être chargées dans le dispositif 1 à partir, par exemple, d'une disquette ou d'un CD-ROM.
Le dispositif de vérification d'images 1, selon l'invention, délivre en sortie une information d'alarme ou d'avertissement AL lorsqu'une image publiée IP présente un niveau de similarité élevé avec une image propriétaire IC enregistrée dans le dispositif 1. La détection d'un niveau de similarité élevé pour une image publiée IP indique une probabilité élevée pour que les images IP et IC soient les mêmes.
Les principaux processus de traitement intégrés et mis en oeuvre dans le dispositif de vérification d'images 1 sont illustrés à la figure 1. Ces processus de traitement comprennent notamment un processus d'enregistrement d'images propriétaires 10, un processus de collecte d'images publiées 11 et un processus de vérification d'images 12.
En référence à la figure 2a, on décrit maintenant de manière générale, le processus de collecte d'images publiées 11 et le processus de vérification d'images 12.
Le processus d'enregistrement d'images propriétaires 10 permet de constituer de façon connue une base de données d'images propriétaires 100 et ne sera pas décrit plus en détail ici.
Dans cette forme de réalisation, les images publiées IP sont récupérées sur des sites Web 3 du réseau Internet, Le processus de collecte d'images publiées 11 fait appel, par exemple, à un robot logiciel 110, de type crawler ou spider en anglais. Une base 111 fournit au robot logiciel 110, les adresses des sites Web 3 à surveiller sur le réseau. Le robot logiciel 110 parcourt les sites Web 3 indiqués par la base 111 et, pour chaque site, récupère les images publiées IP présentes sur ce site. Différentes techniques peuvent être utilisées par le robot logiciel 110.
Par exemple, le robot logiciel 110 peut suivre des hyperliens présents sur les différentes pages Web du site afin de récupérer un maximum d'images. Des produits logiciels connus de l'homme du métier, tels que Memoweb ou Teleport Pro (marques déposées), peuvent être employés pour le robot logiciel 110.
Les images publiées IP collectées par le robot logiciel 110 peuvent, par exemple, être stockées dans une base d'images publiées 112.
Le processus de vérification d'images 12 a pour fonction de déterminer si une image publiée IP collectée sur un site Web 3 correspond à l'une des images propriétaires IC enregistrées dans la base 100.
Le processus de vérification d'images 12 comprend notamment, un processus de sélection P120 et un processus de décision P121 représentés à la figure 2a.
Le processus de sélection P120 a pour fonction de sélectionner un nombre limité d'images propriétaires IC pour chaque image publiée IP collectée par le robot logiciel 110. K images propriétaires ICI à ICK sont ainsi sélectionnées par le processus de sélection P120.
Le processus de décision P121 compare ensuite chaque image publiée IP aux images propriétaires sélectionnées ICk (k = 1 à K). Il est ainsi possible de limiter le nombre des étapes de décision et de réduire de manière importante la charge de calcul pour le processus de vérification d'images 12.
Le processus de décision P121 a pour fonction de décider si une image publiée IP est suffisamment proche d'une image propriétaire IC pour justifier la génération d'une alarme ou d'un avertissement AL à l'intention du client 2 concerné. A cette fin, le processus de décision P121 effectue des calculs de comparaison sur l'image publiée IP et les images propriétaires ICk (k = 1 à K) sélectionnées par le processus de sélection P120 afin de déterminer, 2875663 19 avec une mesure de fiabilité, si l'image publiée IP correspond à l'une des images propriétaires sélectionnées ICk (k=1 à K) .
La décision consiste à être capable d'affirmer ou non, avec un certain degré de confiance, qu'une image publiée correspond à l'une des images enregistrées, c'est-à-dire à une image propriétaire. On recherche ici une correspondance exacte , c'est-à-dire que, le client doit être informé d'une utilisation de son image et non d'une autre même très similaire. En outre, le système doit pouvoir décider qu'il s'agit d'une même image même si l'image utilisée a subi des modifications par rapport à l'image enregistrée. Ces modifications (telles que des recadrages, des changements de taille ou de luminosité/contraste voire de couleurs, ...) peuvent avoir un impact non négligeable sur l'aspect visuel de l'image utilisée, ce qui ne facilite pas la prise de décision, même humaine. Dans certains cas, une même image modifiée peut parfois sembler plus éloignée visuellement qu'une image différente représentant la même scène.
A titre d'exemple, deux scénarii possibles de correspondance illustrant l'ambiguïté de la notion de correspondance exacte entre images sont illustrées à la figure 2b. Selon un premier scénario (scénario A), l'image propriétaire a été recadrée. Il n'existe donc qu'une partie de contenu commun entre les deux images mais il s'agit bien de la même image .
Selon un second scénario (scénario B), l'image publiée est une image différente d'une image propriétaire. On parle alors de même scène prise, par exemple, suivant un point de vue et avec un angle de prise de vue différents. Néanmoins, l'image publiée présente une partie du contenu commune avec une image propriétaire et un contenu additionnel aurait pu être rapporté par une opération de post-édition.
On décrit maintenant de manière plus détaillée en référence à la figure 3, les processus de sélection P120 et de décision P121 permettant de décider si une image publiée, c'est-à-dire une première entité multimédia, notée 1P correspond à l'une (ou plusieurs) des images propriétaires enregistrées, c'est-à-dire des secondes entités multimédia, notées IC de la base de données d'images propriétaires 100.
2875663 20 Une première phase du processus P120 consiste à sélectionner les K images propriétaires candidates de la base d'images propriétaires, qui sont les plus proches de l'image publiée. Cette sélection est effectuée à partir des informations de description des images, et, à cet effet, une description de l'image publiée est calculée à l'étape El. Concernant l'ensemble d'images propriétaires, les descriptions correspondantes à ces images sont indexées dans la base des images propriétaires 100.
Les descriptions des images sont modélisées au moyen d'un ou de plusieurs descripteurs locaux et / ou globaux.
Ainsi, l'étape El prévoit de calculer un ou plusieurs descripteurs d_IP caractérisant l'image publiée IP.
Ainsi, conformément à l'invention, un ou plusieurs N;p descripteurs d_IP peuvent être calculés, et ceux-ci peuvent être de différents types.
Par exemple, les descripteurs comportent au moins un descripteur de type global et/ou au moins un descripteur de type local.
Selon le niveau de précision souhaité dans l'étape de sélection, plusieurs options quant aux choix des descripteurs sont possibles.
L'étape El est suivie de l'étape E2, de recherche des K images 1C, c'està-dire d'une pluralité de secondes entités multimédia, de l'ensemble des images propriétaires, c'est-à-dire de l'ensemble des secondes entités multimédia, qui sont les plus proches de IP en fonction des descriptions des images.
Les K images propriétaires sélectionnées ICk (k=1 à K) sont identifiées par leurs identificateurs non-équivoques respectifs IDk (k = 1 à K) et peuvent être triées par ordre décroissant en utilisant une mesure de similarité avec l'image publiée IP. Bien évidemment, si l'on utilise une mesure de distance entre descripteurs au lieu d'une mesure de similarité, alors le tri se fait selon un ordre croissant. Toutefois, à des fins de simplification, nous parlerons de similarité dans la suite de l'exposé.
L'étape E2 termine le processus de sélection et les étapes suivantes E3 à El1 concernent le processus de décision P121 selon l'invention.
2875663 21 Une fois que le processus de sélection est terminé, une étape supplémentaire E3, dépendante de l'étape E2 au sens où cette étape utilise les mêmes descriptions que l'étape de sélection précédente, est effectuée.
Cette étape a pour but de caractériser, pour chacune des K images propriétaires candidates ICk, une correspondance avec l'image publiée sous la forme d'un premier critère de fiabilité de correspondance noté Cl.
Le mode de calcul et la nature de ce critère dépendent de la technique de description utilisée.
Ce mode de calcul peut être réalisé, par exemple, selon les deux techniques suivantes, chacune d'elles étant associée à une étape de sélection indépendante.
Une première technique est une technique de description locale, où le premier critère de fiabilité de correspondance Cl représente une mesure Bayésienne définie comme le rapport entre la probabilité que l'image publiée ne corresponde pas à l'image propriétaire considérée sur la probabilité de l'hypothèse contraire, les probabilités étant calculées en fonction du résultat de mise en correspondance entre les deux images qui sera explicité ultérieurement lors de la description des figures 5 et 6.
Une seconde technique est une technique dite locale/globale , où le premier critère de fiabilité de correspondance Cl représente une probabilité de fausse alarme, c'est-à-dire la probabilité que l'image publiée ne corresponde pas à l'image propriétaire considérée.
L'étape E4 fait suite à l'étape E3, de calcul du premier critère de correspondance. Il s'agit d'une étape de première décision consistant à déterminer une possible correspondance entre l'image publiée et une image propriétaire.
Pour cela, la valeur calculée du critère Cl est comparée à un seuil prédéterminé A, le seuil étant bien sûr dépendant de la technique employée.
Si le premier critère de correspondance est supérieur au seuil, alors il est mis fin à l'algorithme par l'étape E11, car le premier critère de ressemblance entre les deux images n'a pas été identifié.
Dans le cas contraire, c'est-à-dire lorsque le premier critère de correspondance est inférieur au seuil, cela signifie qu'un premier critère de ressemblance entre les deux images a été identifié et que l'image publiée peut correspondre à l'imagé propriétaire considérée. Ainsi, cette étape est une étape de décision de première correspondance.
Les deux techniques précédentes permettent d'établir que l'image publiée et l'image propriétaire se ressemblent fortement du point de vue de leur contenu, si bien que l'on peut conclure que l'image publiée et l'image propriétaire représentent au moins la même scène à une mesure de confiance égale à Cl près.
Une alarme peut être émise à destination de l'utilisateur ou du propriétaire de l'image propriétaire, afin de lui signaler que l'image publiée représente la même scène que l'image propriétaire identifiée, avec un certain degré de confiance.
A cette étape du processus, une même scène peut aussi vouloir dire une même image (par définition, une même image définit une même scène), Il peut être nécessaire de tester si le niveau de correspondance entre images peut être augmenté. L'algorithme se poursuit alors selon les étapes E5 à E10, afin d'établir si le niveau de correspondance de type même image est atteint selon un critère prédéfini.
Pour cela, l'algorithme s'appuie sur des informations contenues dans l'image publiée. Une technique possible, prévoit d'utiliser des informations de tatouage ( watermarking en anglais).
Ainsi, la décision de correspondance prise lors de l'étape E7, s'effectue après extraction d'une marque de tatouage contenue dans l'image publiée, et en tenant compte d'informations stockées dans la base d'images propriétaires pour l'image propriétaire concernée.
Dans le cas d'un tatouage caractérisé, par exemple, par une clé secrète et un message, on décide qu'il s'agit du même tatouage si le message extrait à l'aide de la clé correspond au message enregistré.
Ces opérations présupposent que les images propriétaires enregistrées ont été tatouées au préalable. Pour cela, lors du processus de 2875663 23 tatouage d'une image propriétaire IC, le processus génère les informations de tatouage suivantes: une clé secrète CS, une séquence pseudo-aléatoire SPA, un message ME et le type ALGO de l'algorithme de tatouage utilisé. Les caractéristiques de ces informations de tatouage, telles que les tailles de la clé CS, du message ME, etc., sont dépendantes de la technique de tatouage utilisée. De manière connue, la séquence pseudo-aléatoire SPA est par exemple, générée à partir de la clé secrète CS. Dans certains algorithmes, le message n'est pas utilisé, seule la présence de la séquence pseudo-aléatoire SPA peut être détectée.
Lorsque l'extraction d'un tatouage selon une technique dite en non aveugle explicitée ci-après, est utilisée, le processus de tatouage comprend également la génération d'un paramètre d'insertion PI utilisé pour tatouer le message dans l'image propriétaire, et d'un paramètre d'extraction PE utilisé lors de l'extraction du message dans l'image propriétaire.
Ces paramètres d'insertion et d'extraction caractérisent l'adaptation du tatouage à l'image.
Elles sont utilisées pour une extraction optimale du message au sein de l'image. L'utilisation de ces paramètres permet d'effectuer une extraction du message d'une image selon la technique en non aveugle mentionnée cidessus, technique qui est particulièrement avantageuse en termes de performances.
Cette technique de tatouage adaptant l'insertion à l'image, aussi appelée tatouage à informations adjacentes , est décrite dans l'article intitulé Perceptual watermarking of non I.I.D signais based on wide spread spectrum using side information de G. Le Guelvouit, S. Pateux, et C. Guillemot, publié lors de la conférence IEEE ICIP 2002.
Les informations qui ont servi à tatouer l'image propriétaire, CS, ME, SPA et ALGO, sont stockées dans la base d'images propriétaires 100. Ces informations sont ensuite utilisées lors du processus de vérification d'images, à l'étape E7. Le stockage de la séquence pseudo-aléatoire SPA n'est pas obligatoire si la séquence pseudo-aléatoire SPA dépend uniquement de la clé secrète CS ou de la clé secrète CS et de la taille de l'image initiale. Dans ce 2875663 24 dernier cas, la taille de l'image initiale sera aussi stockée avec les informations relatives à la CS.
Lors de l'utilisation d'une technique de tatouage en non aveugle, les paramètres d'insertion et d'extraction PI et PE associés à une image sont également stockés dans la base de données et utilisés lors du processus de vérification.
L'insertion d'une marque de tatouage MA dans l'image propriétaire IC est effectuée après que la marque de tatouage MA ait été générée en fonction de la séquence pseudo-aléatoire SPA. La marque de tatouage MA peut également dépendre du message ME.
Lors de l'extraction de la marque de tatouage, il peut être nécessaire de réaliser un recalage de l'image publiée IP.
Ainsi, l'étape E5 consécutive à l'étape E4 de décision de première correspondance, effectue un recalage géométrique de l'image publiée IP et délivre une image publiée IP recalée. Par exemple, si l'image publiée IP a subi un changement d'échelle, l'image publiée IP peut être redimensionnée à sa taille originale. Si, de plus, l'image IP a été recadrée, alors le recalage géométrique consiste à re-synchroniser l'image publiée IP avec l'image propriétaire ICk.
On notera cependant que le recalage effectué à l'étape E5 n'est pas toujours nécessaire et dépend de l'algorithme de tatouage utilisé.
L'étape E5 est suivie de l'étape E6 de détection de la marque de tatouage dans l'image publiée.
Comme représenté à la figure 3, l'étape E6 est prévue afin de récupérer, dans la base d'images propriétaires, l'information ALGOk, relative au type d'algorithme de tatouage utilisé, et les paramètres d'extraction PEk générés lors du processus d'insertion du marquage. L'information ALGOk est fournie de sorte que le processus puisse décider s'il convient ou non de réaliser un recalage géométrique. Les paramètres d'extractions PEk sont utilisés pour réaliser une extraction en non aveugle du message contenu dans une image.
Dans la base d'images propriétaires, il est prévu de récupérer également d'autres méta-données MDk, la clé secrète CSk utilisée dans l'algorithme de tatouage et le message MEk inséré dans l'image propriétaire ICk.
L'étape E6 assure l'extraction d'un message ME1p contenu dans l'image publiée IP à l'aide des informations CSk et ALGOk. Une extraction en non aveugle peut également être réalisée en utilisant les paramètres PEk propres à l'image, indexée par k. Une extraction en non aveugle offre une performance supérieure aux méthodes d'extraction de tatouage en aveugle.
A l'issue de l'étape E6, une décision est prise sur la correspondance entre les messages de tatouage de l'image publiée et de l'image propriétaire concernée.
La décision de correspondance prise lors de l'étape E7, s'effectue après extraction d'une marque de tatouage contenu dans l'image publiée, et par rapport aux informations stockées dans la base propriétaire pour l'image correspondante.
La fiabilité de la détection de la correspondance des tatouages (étape E7) , notée C2, s'exprime en terme de probabilité de fausse alarme. Selon un mode de réalisation, pour un message constitué de B éléments binaires d'information utile, C2 est égale à 2"B.
L'étape E7 est suivie de l'étape E8, consistant à décider d'une seconde correspondance entre l'image publiée et une image propriétaire en fonction du résultat de la décision de première correspondance entre l'image publiée et l'image propriétaire concernée et la décision de correspondance entre les messages de tatouage des deux images.
Si la décision de correspondance entre les tatouages est positive, alors il est considéré que l'image publiée correspond à l'image propriétaire considérée, et la décision de seconde correspondance de l'étape E8 est de type même image .
Dans le cas contraire, c'est-à-dire, si la détection de tatouage échoue, c'est-à-dire que la décision de correspondance entre les tatouages est négative, puisqu'il ne s'agit pas de la même image ou que le tatouage a été effacé, on se limite alors à considérer, lors de l'étape E8 de décision de seconde correspondance, une correspondance de type même scène .
A la décision de seconde correspondance (étape E8), il est associé une mesure de fiabilité de seconde correspondance entre l'image publiée et l'image propriétaire considérée.
Ainsi, si la décision de seconde correspondance est une correspondance de type même scène , alors la mesure de fiabilité C de cette décision prend pour valeur le premier critère de fiabilité Cl de correspondance entre l'image publiée et l'image propriétaire considérée (étape El0).
Dans le cas contraire, c'est-à-dire si la décision de seconde correspondance est une correspondance de type même image (étape E9), alors la mesure de fiabilité de la décision C, est relative à la décision de correspondance du tatouage et de la décision précédente de type même scène (au sens du critère Cl utilisé). De ce fait, il est possible d'exprimer la fiabilité globale comme fonction des deux valeurs de fiabilité.
Dans le cas de la technique locale/globale, puisque les deux critères 15 expriment des probabilités de fausse alarme d'évènements indépendants, on peut exprimer C = Cl x C2 par le produit des deux critères.
On note ici que plus C, Cl ou C2 sont petits et plus la confiance associée est forte.
De la même manière, dans le cas de la technique locale, pour laquelle le critère Cl est un critère Bayésien s'exprimant comme un rapport de probabilité entre les deux hypothèses de non-correspondance et de correspondance, le critère global C peut s'exprimer par le produit C = Cl x C2 en supposant que la probabilité de détecter le tatouage, sous l'hypothèse que l'image est la même que l'image tatouée, est égale à 1.
Dans l'un ou l'autre cas, la décision est suivie de l'émission d'un rapport d'alarme.
En référence à la figure 4, on décrit la génération du rapport d'alarme et des alarmes. L'alarme est envoyée, par exemple, sous la forme d'un message électronique généré automatiquement.
Ce rapport d'alarme, notamment organisé sous la forme d'un fichier, contient, par exemple, une imagette représentant l'image propriétaire, et un hyperlien sur la page web sur laquelle l'image publiée a été trouvée, cet hyperlien référençant, notamment, l'image publiée.
Pour cela, il est prévu d'élaborer une représentation réduite de l'image propriétaire en vue de l'insérer dans le rapport d'alarme.
Le rapport d'alarme peut également contenir des informations (date et heure) sur le moment de la détection. Enfin, le rapport peut contenir des identifiants de l'image propriétaire, afin que le client puisse vérifier par lui-même que l'image publiée correspond effectivement à son image.
Des informations supplémentaires liées au résultat de la décision de seconde correspondance sont également ajoutées. Ainsi, l'information de décision de type même image ou même scène est insérée dans le rapport, ainsi que la valeur de la mesure de fiabilité relative à la décision, respectivement C = Cl x C2 ou C= Cl, accompagnée de la signification de cette mesure dans un but informatif.
Ce rapport peut, par exemple, être émis sous la forme d'un fichier HTML permettant d'uniformiser l'aspect des alarmes.
Enfin, le rapport est envoyé au propriétaire de l'image protégée, c'est-àdire au client, son adresse de courriel AC étant préalablement récupérée dans la base d'images propriétaires 100.
En référence à la figure 5, on décrit un premier mode de réalisation des étapes El à E4 de l'algorithme de la figure 3, en utilisant une technique de description locale.
En entrée de l'algorithme, on dispose d'une part, d'une image publiée IP (première entité multimédia) et, d'autre part, de la base de données d'images propriétaires 100 (ensemble de secondes entités multimédia). On suppose dans ce mode de réalisation que les informations de description,appelées descripteurs, des images propriétaires sont calculées préalablement et stockées dans la base d'images propriétaires ou en association avec celle-ci.
La mise en oeuvre de l'étape El de la figure 3 (calcul d'une description de l'image publiée) prévoit, selon ce mode de réalisation, de déterminer des descripteurs, par exemple, dits locaux (étape Ey31 de la figure 5).
2875663 28 Un descripteur local d associé à une unité d'intérêt de l'image, telle qu'un point d'intérêt de l'image, est, par exemple, constitué de deux informations indissociables: - une information de position p du point d'intérêt, avec, par exemple, p = x+i.y en notation complexe, où x et y sont les coordonnées cartésiennes du point d'intérêt dans le repère de l'image, et une information de contenu local autour du point d'intérêt, information qui est organisée sous la forme d'un vecteur v et est associée à l'information de position p. Ainsi, une image publiée IP est décrite selon Np descripteurs locaux que l'on notera {d_IP;} i= 1...Nip = {p;, vi} i= 1...NipÉ II en est de même pour la description des images propriétaires. Une image propriétaire IC est décrite selon Nic descripteurs locaux que l'on notera {d_ICi} i= 1.
Nic = {pi, vi} i= 1...NicÉ Ces descripteurs ainsi déterminés sont ensuite utilisés lors des étapes suivantes, sans nécessiter de nouveau calcul de descripteurs...DTD: L'étape suivante Ey32 de la figure 5, correspondant à l'étape E2 de la figure 3, est un processus de sélection qui emploie des techniques de recherche basées sur le contenu des images afin de sélectionner les K images propriétaires ICI à IC, les plus proches d'une image publiée IP en cours de traitement. La proximité de deux images IP et IC doit ici être comprise au sens de la similarité visuelle entre celles-ci.
L'étape Ey32 consiste à effectuer une recherche, dans la base des images propriétaires 100, des descripteurs qui sont les plus proches des descripteurs de l'image publiée. Les descripteurs d_IC de secondes images qui sont les plus proches des descripteurs d_IP, sont extraits de l'ensemble des descripteurs de l'ensemble de secondes images stockés dans la base des images propriétaires 100. Les descripteurs d__IC extraits sont ceux correspondant aux images propriétaires sélectionnées ICk (k= 1 à K).
Pour cela, par exemple, une mise en correspondance de chacun des vecteurs contenant de l'information de contenu local de l'image publiée avec les vecteurs des images de la base propriétaire est effectuée.
Le nombre de vecteurs mis en correspondance entre deux images est appelé "score".
Les images propriétaires sélectionnées sont ensuite triées au moyen d'un algorithme de vote majoritaire. Ainsi, les images propriétaires sont classées selon le nombre de leurs vecteurs mis en correspondance avec les vecteurs de l'image publiée.
Les K images les plus proches correspondent aux K scores les plus élevés.
L'étape suivante Ey33 de la figure 5, correspondant à l'étape E3 de la figure 3, consiste à mettre en correspondance des descripteurs de l'image publiée avec des descripteurs d'images de la base des images propriétaires, puis de calculer pour chaque image propriétaire, son critère de correspondance avec l'image publiée.
La mise en correspondance de descripteurs de l'image publiée 15 avec des descripteurs de la base des images propriétaires s'effectue au moyen de calculs de distance entre les vecteurs de descriptions vip et vie, en utilisant, par exemple, une distance Euclidienne ou une distance de Mahalanobis.
Pour cela, l'étape Ey33 prévoit de mettre en correspondance l'ensemble des descripteurs {d_IP} de l'image publiée avec chacun des 20 descripteurs {d_IC} des images sélectionnées ICk à l'étape Ey32.
La mise en correspondance de l'étape Ey33 est réalisée sur les descripteurs calculés à l'étape Ey31, sans nécessiter une caractérisation supplémentaire et donc le calcul de nouveaux descripteurs.
Cette mise en correspondance est une correspondance des 25 descripteurs d'une image publiée avec des descripteurs d'une image de la base des images propriétaires. Elle est donc indépendante des autres images de la base des images propriétaires.
Cette mise en correspondance est suivie du calcul d'un critère, noté Cl, qui représente un premier critère de fiabilité de la mise en correspondance 30 effectuée.
Plus précisément, la valeur de Cl correspond à l'estimation d'un critère de décision Bayésien. Ce critère de décision se définit comme le rapport entre d'une part, la probabilité que la première image ne corresponde pas à l'une des secondes images étant donné le résultat des étapes de mise en correspondance, c'est-à-dire la probabilité que les images ne se correspondent pas (hypothèse H1) étant donné la réalisation de la mise en correspondance et, - d'autre part, la probabilité que la première image corresponde à l'une des secondes images étant donné le résultat des étapes de mise en correspondance, c'est-à-dire la probabilité que les images se correspondent (hypothèse HO) étant donné la réalisation de la mise en correspondance.
Ainsi, la valeur Cl se détermine par le rapport entre les 15 pourcentages de chances entre les deux hypothèses.
La correspondance entre images inclut le cas où l'image publiée est, en tout ou en partie, la même image que l'image propriétaire enregistrée, et celui où elle représente la même scène qu'une image propriétaire enregistrée.
Une mise en oeuvre selon l'invention de l'étape Ey33 est représentée à la figure 6. Cette figure illustre l'ensemble des étapes de la mise en correspondance de descripteurs}d_IP}I N, = de l'image publiée v IP avec des descripteurs = {p.1,v1 Li N, d'une image propriétaire sélectionnée IC et le calcul du critère Cl, ces étapes devant être appliquées à l'ensemble des K images propriétaires sélectionnées.
En référence à la figure 6, le processus de mise en correspondance débute par une étape Ey41 de construction d'une liste des points en correspondance.
Ainsi, la première étape Ey41 prévoit d'établir une liste L = t(d_IP,d_IC) 1 de correspondances des descripteurs de l'image publiée d_IP avec des descripteurs d'une image propriétaire d_IC dont un mode de réalisation est décrit ci-après.
L'étape Ey41 met en correspondance des informations de contenu local, v,p, au sein de descripteurs d'une image publiée et des informations de contenu local, v,c, au sein de descripteurs d'une image propriétaire enregistrée.
Le détail de cette étape d'établissement d'une liste de correspondances est fourni par la description qui suit, faite en référence à la figure 7a qui illustre un algorithme complétant celui de la figure 6. Cependant, d'autres modes de réalisation peuvent être envisagés.
L'algorithme de la figure 7a comporte une première étape Ey51 qui consiste à rechercher, pour chaque vecteur contenant de l'information de contenu local de l'image publiée l'ensemble PPV(vip) des correspondances du vecteur vlp avec ses V plus proches voisins parmi les vecteurs v,c contenant de l'information de contenu local de l'image propriétaire.
Cette recherche peut s'opérer, par exemple, en déterminant, pour chaque information de contenu local de l'image publiée IP identifié par un vecteur v1p, l'ensemble des distances entre vjp et chaque information de contenu local de l'image propriétaire IC identifiée par un vecteur v,c.
Les éléments mis en correspondance dans la liste des plus proches voisins PPV(v1p) sont les informations de contenu local de l'image propriétaire vic avec l'information de contenu local de l'image publiée v,p dont les distances déterminées sont les plus faibles. Un nombre déterminé V d'éléments en correspondance est ainsi sélectionné.
Une distance Euclidienne ou une distance de Mahalanobis entre les informations de contenu local est, par exemple, utilisée.
En outre, une contrainte peut également être ajoutée sur la valeur maximale de la distance de Mahalanobis pour que seuls les vecteurs ayant une distance de Mahalanobis inférieure à une valeur seuil Dm, soient susceptibles d'être en correspondance.
Dans ce cas, à chaque information de contenu vip d'une image publiée, est associé au plus un nombre V d'éléments en correspondance.
Selon un cas particulier, le nombre V d'éléments en correspondance est choisi égal à 1.
A l'étape Ey52, effectuée indépendamment mais de façon similaire à l'étape Ey51, on recherche, pour chaque information de contenu local vic d'une image propriétaire, l'ensemble PPV(v,c) des correspondances entre vic et ses V plus proches voisins parmi les vecteurs vip de l'image publiée.
Enfin, à l'étape Ey53 consécutive aux deux étapes Ey51 et Ey52, on réalise l'intersection entre les deux ensembles de correspondances PPV(vip) et PPV(v,c) définis respectivement aux étapes Ey51 et Ey52. Ainsi, seules les correspondances présentes dans les deux ensembles sont considérées et énumérées dans la liste résultante L des correspondances.
A l'issue de l'étape Ey53 de la figure 7a, on dispose donc d'une liste L = t(d_IP d IC)) de Nc éléments mis en correspondance. Cette liste comprend un ensemble de Nc couples, ayant chacun comme premier élément, un descripteur de l'image publiée IP et comme second élément, un descripteur de l'image propriétaire IC.
II est ensuite mis fin à l'algorithme de construction de la liste de points en correspondance, élaborée selon une mise en correspondance des informations de contenu local de la figure 7a.
De retour à la figure 6, l'étape Ey41, de construction de la liste de points en correspondance, est suivie d'une étape Ey42 d'estimation d'une correspondance géométrique globale, ayant pour but d'effectuer une mise en correspondance géométrique des points d'intérêt des images.
Plus particulièrement, l'étape Ey42 prévoit de mesurer la cohérence géométrique des points en correspondance de la liste L obtenue à l'étape Ey41.
Pour ce faire, on suppose qu'il existe une transformation géométrique T reliant les positions des correspondances entre descripteurs d'une image propriétaire et d'une image publiée de la liste L. On notera que l'étape Ey42 vise à estimer cette transformation.
Le choix du type de transformation T à considérer doit être dicté par le type de transformations géométriques que l'image propriétaire a pu subir pour conduire à l'image publiée.
2875663 33 Ce choix doit également être en cohérence avec la robustesse du détecteur de points d'intérêt et des informations de contenu local v vis-à-vis des transformations géométriques.
En effet, la transformation est estimée sur des correspondances établies préalablement en fonction des vecteurs de description de contenu local v.
On considère en particulier, par exemple, le groupe des transformations T de type similitude plane. En effet, la plupart des transformations effectuées sur une image numérique appartiennent à ce groupe.
Ce groupe inclut, par exemple, les translations issues principalement d'un recadrage, les mises à l'échelle, et les rotations.
Les descripteurs locaux décrits dans l'article intitulé Utilisation de la couleur pour l'appariement et l'indexation d'images du Rapport de Recherche INRIA n 3269, septembre 1997, de P. Gros et al., sont robustes à ce type de transformation.
Mathématiquement, une similitude plane T transforme une position pic dans l'image propriétaire IC en une position p1p dans l'image publiée IP selon la relation suivante, en notation complexe: pi, = Te(ipi!= s(p ce'e + t) où : s est une valeur réelle représentant le facteur de changement d'échelle, B est une valeur réelle représentant l'angle de rotation (en radian), 25 et t = tx + i ty, est une valeur complexe représentant la translation (t, , ty) en coordonnées cartésiennes.
Afin de réaliser l'estimation de la transformation à quatre paramètres (s, B,t,,ty), cette transformation doit être étudiée sur au moins deux couples de correspondances distinctes de la liste L. Il convient également de noter que, numériquement, le modèle de similitude plane permet de prendre également en compte de légères variations d'angle de vue, théoriquement modélisées par des transformations homographiques voire affines.
Il est à noter que la liste L peut comporter de nombreuses fausses correspondances vis-à-vis du modèle géométrique, c'est-à-dire des correspondances identifiées qui ne sont pas de véritables correspondances. En effet, ces correspondances étant uniquement effectuées sur des informations de contenu local, des correspondances peuvent être identifiées sans que les informations de position associées correspondent entre elles.
li est donc préférable d'utiliser une méthode d'estimation robuste qui permet d'éliminer l'influence des fausses correspondances (appelées outliers en Anglais).
Parmi les techniques d'estimation connues, il est possible d'utiliser, par exemple, les méthodes dites par échantillonnage consensuel ( sampling consensus en Anglais). En effet, elles sont particulièrement bien adaptées à ce type d'estimation car elles permettent de s'abstraire des fausses correspondances.
Ces méthodes dites par échantillonnage consensuel fonctionnent principalement selon le schéma suivant.
Dans une première étape, on choisit un sous-ensemble de correspondances nécessaires au calcul de la transformation géométrique T, puis la transformation T est déterminée.
Le sous-ensemble comprend, par exemple, deux correspondances pour la similitude.
Dans une seconde étape, la transformation déterminée à la première tape est appliquée aux autres correspondances, puis les correspondances (pip'pic pour lesquelles la transformation déterminée se vérifie sont comptabilisées.
Cette vérification s'effectue en utilisant un critère de distance entre la position transformée et la position effective, i.e. p,P - TiU où . désigne le module (distance Euclidienne) et e est un seuil fixé à l'avance. Ces vraies 2875663 35 correspondances sont dénommées inliers en anglais par opposition à outliers .
Les première et seconde étapes précédemment décrites sont réitérées pour d'autres sous-ensembles possibles.
Enfin, la transformation T, déterminée à la première étape et, pour laquelle le nombre de vraies correspondances obtenues à la seconde étape est maximum, est sélectionnée.
Concernant le choix des sous ensembles nécessaires au calcul de la transformation T (première étape), les méthodes connues d'estimation par échantillonnage consensuel procèdent, par exemple, par des tirages aléatoires successifs.
Ces méthodes d'estimation par échantillonnage consensuel sont aussi appelées RANSAC ( RANdom SAmple Consensus ). Pour de plus amples informations concernant ces méthodes, le lecteur est renvoyé notamment à l'article intitulé Random sample consensus: A paradigm for model fitting with applications to image analysis and automated cartography , de M. A. Fishler et R. C. Bolles, Communicattion ACM, Vol 24, No 6, pp 381-395, 1981.
Ce choix aléatoire est souvent utilisé en raison du fait qu'il est souvent complexe de considérer toutes les combinaisons de choix possibles si le nombre N, d'éléments de la liste L de départ est important.
En effet, dans le cas du calcul d'une similitude plane pour laquelle, par exemple, deux éléments de la liste sont nécessaires, il existe NC(NC -1) 2 choix possibles.
Néanmoins, l'étape Ey41 précédant cette estimation, permet de minimiser la valeur de N, . Ce nombre d'éléments est d'ailleurs rendu plus faible lorsqu'une contrainte supplémentaire de distance maximale sur la distance entre vecteurs v est appliquée. L'ensemble des choix possibles étant limité, il est alors possible de tous les considérer et donc la probabilité d'une bonne estimation de la transformation T est rendue maximale.
Dans le cas où l'on obtient plusieurs valeurs identiques du nombre maximal de vraies correspondances pour différentes estimations de la transformation T, on sélectionne, par exemple, la transformation T qui minimise la grandeur constituée par la somme des carrés des distances p1. - T(p,c des éléments en vraie correspondance.
L'étape Ey42 d'estimation robuste d'une correspondance géométrique T globale est ensuite suivie de l'étape Ey43 de sélection d'une région.
Lors de l'étape Ey43, à partir de la liste L et de la transformation 10 robuste T estimée à l'étape précédente, on définit une zone spatiale R des images où chacune des images semble se correspondre.
Ainsi, une définition de la zone R va être établie afin de mesurer dans cette zone la cohérence des correspondances entre les deux images. Cette cohérence tient compte des deux scenarii possibles.
La zone R est, par exemple, définie comme une zone rectangulaire sélectionnée dans l'image propriétaire.
En effet, une définition rectangulaire de la zone R correspond au mode de sélection couramment utilisé dans les éditeurs d'images.
* Ce choix n'est cependant pas limitatif et la zone R de correspondance sélectionnée peut être de forme non rectangulaire.
On notera que la zone R peut également être l'image elle-même.
De plus, la zone R à considérer doit être la zone ayant le plus de chances d'être effectivement une zone de correspondance. Pour ce faire, les résultats de l'estimation robuste sont utilisés. La zone R est définie comme la zone dont le périmètre est défini par les unités d'intérêt en vraie correspondance, c'est-à-dire qui sont mises en correspondance lors de l'étape de mise en correspondance géométrique.
L'étape de décision sera alors effectuée à partir de cette zone sélectionnée qui peut être une zone réduite de l'image. Ceci permet, en effet, 30 de prendre en compte que les images peuvent se correspondre qu'en partie.
L'étape Ey43 est suivie de l'étape Ey44 au cours de laquelle on détermine le résultat des étapes de mise en correspondance, de façon restreinte par rapport à la zone de correspondance sélectionnée. Ce résultat, en sus de la zone R et de la transformation T, sera ensuite utilisé pour le calcul du critère de décision.
On considère en particulier les trois composantes suivantes du résultat: la première composante du résultat considérée est le nombre nq d'unités d'intérêt pq de l'image publiée IP qui se projettent dans la zone R de l'image propriétaire, c'est-à-dire vérifiant l'expression mathématique T 1(pq)ER; - la seconde composante du résultat considérée est le nombre n d'unités, parmi les nq unités d'intérêt précédentes, dont les informations de contenu local v de la description locale sont en correspondance avec des unités d'intérêt de l'image propriétaire; ainsi, on identifie le nombre d'unités d'intérêt appartenant à la liste L élaborée lors de la mise en correspondance des informations de contenu local qui appartiennent à la zone R définie; - la troisième composante du résultat considérée est le nombre n, des unités d'intérêt en vraie correspondance parmi les n, unités d'intérêt précédemment déterminées; ces unités d'intérêt sont déterminées en fonction de la transformation robuste estimée à l'étape Ey42, c'est-à- dire en fonction de leur mise en correspondance géométrique.
Un exemple de résultat d'observations est illustré à la figure 7b.
En effet, selon la figure 7b, la zone R sélectionnée dans l'image publiée comporte l'ensemble des unités d'intérêt résultant de la mise en correspondance géométrique.
La première composante de résultat, nq, comptabilisant le nombre d'unités d'intérêt présentes dans la zone R, a la valeur 7.
La seconde composante de résultat, ne., comptabilisant les informations de contenu local en correspondance avec des unités d'intérêt de l'image propriétaire, a la valeur 6. En effet, parmi les 7 unités d'intérêt de la zone, seules 6 unités d'intérêt ont été mises en correspondance lors de l'étape de mise en correspondance des informations de contenu local.
La troisième composante de résultat, n,, comptabilisant les unités d'intérêt mises en correspondance lors de l'étape de mise en correspondance géométrique, a la valeur 5. En effet, sur les 6 unités d'intérêt mises en correspondance à l'étape de mise en correspondance des informations de contenu local, seules 5 unités d'intérêt ont ensuite été mises en correspondance lors de l'étape de mise en correspondance géométrique.
De retour, à l'étape Ey44 est suivie de l'étape Ey45 de calcul du premier critère (Cl) de fiabilité de correspondance.
Par exemple, cette étape prévoit de déterminer le premier critère de fiabilité de correspondance, selon un critère de décision Bayésienne entre deux hypothèses contraires.
La première hypothèse Ho est que l'image publiée correspond à l'image propriétaire.
La seconde hypothèse HI est que l'image publiée ne correspond pas à l'image propriétaire.
Mathématiquement, la valeur du premier critère de fiabilité de correspondance se définit de la façon suivante: C1= P(H, lobs) P(obs H,) x P(Hl) P(Ho lobs) P(obslHo) P(Ho) Il s'agit du rapport entre la probabilité de ne pas avoir une correspondance et la probabilité d'avoir une correspondance, ces deux probabilités conditionnelles dépendant du résultat des étapes de mise en correspondance, noté obs, et qui sont issus du procédé selon l'invention comme décrit dans les étapes précédentes.
On estime le critère en utilisant l'expression de droite de la formule exposée ci-dessus: il s'agit de l'approche Bayésienne suivant laquelle on manipule les probabilités des observations conditionnellement aux hypothèses.
Ainsi, l'expression fait intervenir te rapport de deux probabilités a priori, noté P = P(H,)l P(Ho). Ce rapport mesure le rapport entre les chances a priori d'avoir l'une et l'autre des hypothèses.
2875663 39 Ce rapport peut varier en fonction du contexte et dépendre d'un a priori sur l'image publiée en question.
En particulier, la valeur du rapport est plus faible lorsque l'origine de l'image publiée, par exemple, le site Web d'une agence photo, est reliée à l'origine de l'image propriétaire qui est, par exemple, le photographe travaillant pour la dite agence photo.
Il est ainsi possible de rendre la décision adaptative en fonction du contexte en faisant varier la valeur de P. Ainsi, étant donné les résultats des étapes de mise en correspondance qui comprennent, outre la transformation T et la région R obtenues, les valeurs de nq, n,, et n, obtenues à l'étape Ey44, on calcule Cl de la façon suivante: Cl=l0ci xP C'l = Cln n + Cln;,n q Avec: C1 = ne. x Q1 + (nq - n, )x Q2 et (1- 1,n =(n, 2)xLogio p1HI +(n, n,)xLogio P1Ht P1 Ho \l-P1Ho avec p1Ht = A(s) et PiHO - Q3 + Q4 x A(s) A(R où : - QI, Q2 sont des constantes dépendant des performances du détecteur de points d'intérêts utilisé, de la nature du vecteur de description locale et du seuillage sur la distance de Mahalanobis utilisés à l'étape Ey41. Par exemple, en utilisant le détecteur de points d'intérêt décrit dans le document FR0301545, et en ayant un vecteur de description locale à 23 dimensions décrit dans le document intitulé Utilisation de la couleur pour l'appariement et l'indexation d'images du Rapport de Recherche INRIA n 3269, septembre 1997, de P. Gros et al. et pour une valeur de seuil D, égale à 50, alors on choisit les valeurs Q, = -0.253 et Q2 = 0. 397; - Q3, Q4 sont des constantes dépendant des performances du détecteur de points d'intérêts utilisé. Pour le même détecteur que précédemment, on peut choisir les valeurs Q3 = 0.6 et Q4 = 0.4; - A(s) est une constante en fonction de la valeur du seuil e en distance utilisé pour la détermination des correspondances géométriques. La valeur de A(e) représente l'aire d'un disque de rayon e. Pour une valeur de e choisie égale à 1,5 pixel, A(e) est égale à une surface équivalente de 9 pixels. - A(R) représente l'aire (dans la même unité que la valeur de A(e) , i.e. en nombre de pixels) de la zone R de correspondance sélectionnée mesurée (projetée) dans l'image publiée.
L'étape Ey45 met ainsi fin à l'algorithme de la figure 6 et à l'étape Ey33 de la figure 5 qui est suivie de l'étape Ey34, correspondant à l'étape E4 de la figure 3. Au cours de l'étape Ey34, on compare la valeur du premier critère Cl de fiabilité de correspondance obtenue à l'étape Ey33 à une valeur de seuil prédéterminée, notée A, en vue de décider d'une première correspondance entre la première image, c'est-à-dire l'image publiée, et une seconde image, c'est-à-dire une image propriétaire, en fonction du résultat de la comparaison.
La valeur de Cl dépend du contexte P défini comme le rapport des probabilités a priori que l'image publiée ne corresponde pas à une image propriétaire enregistrée sur la probabilité que l'image publiée corresponde à l'image propriétaire.
Ainsi, il est possible d'adapter le critère en fonction de ce rapport de probabilités.
Pour une valeur de P donnée et une valeur de Cl calculée en fonction de P, le résultat de l'étape Ey34 permet de décider si l'image propriétaire IC correspond à l'image publiée IP ou non selon une première correspondance.
La valeur du seuil A permet de fixer le niveau de fiabilité de la première mise en correspondance.
Par exemple, si la valeur Cl est inférieure à o alors l'image propriétaire IC est jugée correspondre à l'image publiée IP et la fiabilité de cette 5 décision a comme valeur au moins A. Ainsi, si le seuil prend pour valeur A alors on peut exprimer la fiabilité de la décision de première correspondance par le rapport suivant: il y a 1 fois plus de chances de ne pas se tromper dans la décision de a correspondance entre l'image propriétaire et l'image publiée que de chances de 10 se tromper.
En pratique, on peut choisir une valeur de P fixée égale à P =104 pour le calcul de Cl et une valeur de seuil A égale à A =10-4 Du résultat de la comparaison de l'étape Ey34, on décide de la première correspondance entre l'image publiée et l'image propriétaire 15 considérée.
L'étape Ey34 de la figure 5 est suivie des étapes E5 à El0 de la figure 3 afin de détecter une correspondance de type même image .
Selon ce mode de réalisation, le rapport d'alarme généré à l'issue de la détection de correspondance entre l'image publiée et une image propriétaire considérée, peut contenir une description de la zone de mise en correspondance entre les deux images.
Un second mode de réalisation des étapes El à E4 de la figure 3, est décrit en référence à la figure 8. Ce mode de réalisation est fondé sur une technique dite locale/globale , selon laquelle le premier critère de fiabilité de correspondance Cl représente une probabilité de fausse alarme, c'est-à-dire la probabilité que l'image publiée ne corresponde pas à l'image propriétaire considérée.
En entrée de l'algorithme décrit en référence à la figure 8, on dispose, d'une part, d'une image publiée IP, et d'autre part, de la base de données d'images propriétaires 100. On suppose dans ce mode de réalisation que les informations de description, appelées descripteurs, des images propriétaires sont calculées préalablement et stockées conjointement à la base d'images propriétaires.
Le processus de sélection P120 déjà cité en référence à la figure 2 et représenté à figure 8, comprend d'une part, une étape Ex1 de calcul d'un descripteur D pour l'image IP et, d'autre part, pour chaque image ICiconsidérée dans la base d'images propriétaires, une étape d'extraction Ex'l d'un descripteur Di.
Ainsi, l'étape El de la figure 3, de calcul d'une description de l'image publiée, correspond à l'étape Ex1 de la figure 8. Cette étape consiste à déterminer le descripteur de l'image publiée IP.
Le détail de cette étape est décrit en référence à la figure 9 qui illustre l'ensemble des sous étapes principales de calcul de descripteur.
En entrée de l'algorithme, on dispose d'une image numérique I. Chaque image est constituée d'une suite d'échantillons numériques, groupés en un tableau bidimensionnel, chaque échantillon représentant un pixel de l'image. Par exemple, pour une image à 256 niveaux de gris, chaque pixel est codé sur un octet, alors que pour une image couleurs, chaque pixel peut être codé sur 3 octets, chaque octet représentant une composante de chrominance, par exemple rouge, vert et bleu. Par exemple, on utilisera l'espace de représentation YUV, où Y désigne la composante de luminance et U, V, les composantes chrominance de l'image. La composante de luminance Y de l'image est extraite à la première étape Exil de la figure 9. Dans le cas où l'image I n'est pas en représentation YUV, on applique d'abord une transformation d'espace couleur pour se ramener à cette représentation.
Ensuite, la composante de luminance de l'image I, représentée initialement par un tableau bidimensionnel de taille MxN, où M représente le nombre de lignes et N le nombre de colonnes, est normalisée à l'étape suivante Ex12, c'est-à-dire re-échantillonnée à une taille n x n prédéterminée, avec, par exemple, n=256 pixels. Le ré-échantillonnage est effectué par une méthode d'interpolation classique, comme l'interpolation bilinéaire.
La luminance normalisée est ensuite découpée (étape Ex13) en un nombre X prédéterminé de blocs de taille égale. Dans le mode de réalisation décrit ici, l'image est découpée en 100 blocs de taille 25x25.
Dans chaque bloc, deux points d'intérêt sont sélectionnés à l'étape suivante Ex14.
Par exemple, les points d'intérêt sont des extrema d'un opérateur de filtrage, et en particulier d'un opérateur Laplacien de Gaussien. Afin d'avoir un nombre de points suffisant pour décrire une image, tout en conservant un descripteur compact, on retient deux points d'intérêt pour chaque bloc, l'un, dit de premier type, correspondant à la valeur minimale du signal filtré et le second, dit de second type, correspondant à la valeur maximale du signal filtré.
Lorsque le dernier bloc a été traité, à la dernière étape Ex15 de la figure 9, les coordonnées des points d'intérêt obtenus sont stockées en mémoire. Par exemple, les coordonnées des points du ième bloc seront notés: (xm,y ') pour un point de premier type, Pm;n et (xM,yM) pour un point de réponse de second type, PmaxÉ L'ensemble des coordonnées des points d'intérêt pour l'ensemble des blocs issus du découpage forme un descripteur D selon ce mode de réalisation de l'invention. On dénommera par la suite le descripteur ainsi obtenu, descripteur local/global . En effet, ce descripteur est basé sur des points d'intérêt de l'image, qui sont des caractéristiques locales. Ces points d'intérêt sont, néanmoins, répartis régulièrement de manière globale et systématique sur tous les blocs de l'image, alors que dans les méthodes purement locales de l'état de l'art, les points d'intérêt n'ont pas de distribution spatiale prédéfinie dans l'image, ils sont placés uniquement sur les points de fort contraste.
II convient de noter que l'on peut aussi considérer que le descripteur D de l'image est formé d'une pluralité de descripteurs relatifs à des blocs de l'image.
De retour à la figure 8, les étapes Ex1 et Ex'l sont suivies de l'étape Ex3, au cours de laquelle la distance entre le descripteur D de l'image IP et 2875663 44 chaque descripteur Di de la base est calculée. Ce calcul de distance sera explicité ci-dessous en référence à la figure 10.
A l'étape suivante Ex5, correspondant à l'étape E2 de la figure 3, sont extraits les indices des K images de la base propriétaire les plus proches de l'image publiée au sens de la distance calculée. Ces K images forment ainsi un ensemble de sélection qui sera ultérieurement utilisé dans le processus de décision sur une première correspondance. La valeur de K est prédéterminée. Selon un premier exemple, une valeur de K égale à 4 est généralement suffisante. Selon un second exemple, la valeur de K peut être égale à 10 si le nombre d'images dans la base propriétaire est de 30000. Cependant, la valeur de K pourrait être égale au nombre d'images dans la base d'images propriétaires. L'étape Ex5 termine le processus de sélection P120.
Le processus de décision d'une première correspondance fait suite au processus de sélection. Pour cela, il comprend une première étape de calcul d'un premier critère Cl de fiabilité de correspondance (étape Ex8), en fonction d'une part, de la distance entre l'image IP et une image ICk et, d'autre part, du nombre d'images total contenu dans la base des images propriétaires, NP. Ce premier critère de fiabilité de correspondance permet de mesurer de manière probabiliste, la probabilité de fausse alarme d'une décision de correspondance entre l'image IP et ICk. Le calcul de ce premier critère (Eqx5a) sera détaillé ci- dessous en référence à la figure 10.
La figure 10 illustre des points d'intérêt obtenus et leurs coordonnées respectives, pour deux images à comparer notées respectivement 11 et 12. Comme représenté sur cette figure, tous les blocs issus du découpage sont des carrés de taille L x L prédéterminée.
Les points d'intérêt sont notés P, et P, où k est l'indice de l'image (1 ou 2 dans l'exemple) et i l'indice du bloc.
La distance entre les deux images est calculée, par exemple, selon la formule: d (I1, I2) _ E max1- 2 m Yl,r Y2,i )+maxxj", -xM Yi; Y2 (Eqx 2) i=l Ainsi, la distance totale est basée sur la somme des distances obtenues par bloc entre les points de chaque type, la distance entre deux points de même type étant définie comme le maximum de la différence entre abscisses et ordonnées de ces points.
Dans la pratique, il est également souhaitable de prendre en compte certaines distorsions géométriques qui modifient l'orientation de l'image sans en modifier le contenu, comme les rotations multiples de 90 degrés, les symétries d'axe horizontal et vertical. Ces distorsions forment un groupe de 8 transformations géométriques T', qui sont décrites dans le tableau de la figure 11. II s'agit d'un sous-groupe du groupe des similitudes planes T, déjà décrit en référence au premier mode de réalisation. Afin de prendre en compte ces transformations, il suffit de simuler le résultat d'une telle transformation sur les coordonnées des points d'intérêt d'une des images (par exemple, l'image 12) et de calculer une nouvelle distance. Ces transformations géométriques modifient à la fois l'ordre des blocs et la position des coordonnées dans le bloc. Finalement, la distance retenue est la distance minimum parmi les distances calculées pour chacune des transformations T' simulées.
Par exemple, si l'on prend une symétrie d'axe horizontal (notée T'5 dans le tableau de la figure 11), les coordonnées (x,y) sont transformées en (x, 256-y). L'indice du bloc auquel appartient ce point est également modifié selon la transformation. Comme illustré sur la figure 10, où les images sont découpées en 3 x 3 blocs, les points d'intérêt du bloc d'indice 1 deviennent les points d'intérêt du bloc d'indice 7, lorsque cette transformation est appliquée.
La formule de calcul de la distance (Eqx2) devient alors: Y%; T (Yz T(i> ) / d(I1,12) = min Emaxjx;; T(xT(i>), \ i=1x Im M M + ma x, i T (xz T(i>) , Y,i T (Y2'M,T(,) ) (Eqx 3) Ce mode de calcul de la distance permet de prendre en compte certaines distorsions courantes, tout en étant rapide à mettre en oeuvre.
La distance définie ci-dessus par les équations (Eqx2) et (Eqx3) est ensuite utilisée pour calculer la probabilité de fausse alarme qui est utilisée dans la décision sur la première correspondance (étape Ex9 de la figure 8).
Nous allons maintenant expliciter le mode de calcul du premier critère Cl de fiabilité de correspondance (étape Ex8). Ce premier critère fournit la probabilité de fausse alarme PFA(11,12) associée à la décision de ressemblance entre les deux images I1 et 12 en fonction de la distance calculée précédemment.
Considérons deux images 11 et 12, telles que représentées sur la figure 10. La position en abscisse ou en ordonnée d'un point caractéristique sur l'un des blocs suit une loi uniforme de densité de probabilité 1/L. De ce fait, la distance en valeur absolue (en abscisse ou en ordonnée) entre deux points caractéristiques, de même type d'un même bloc de deux images différentes, 11 et 12, suit une loi triangulaire de densité de valeur 2/L en 0 et de valeur 0 en L. Finalement, la densité de probabilité du terme du type z = maxlx, ; x2 i y2) est: 2\ L(z)= z 2 3z Z La distance définie par les équations (Eqx2) et (Eqx3) étant une somme de termes du type z sur chaque bloc et, en admettant que les blocs sont indépendants les uns des autres, la somme des termes de type z, après normalisation par la moyenne et l'écart-type, suit une loi normale, c'est-à-dire une loi Gaussienne de moyenne nulle et de variance égale à 1.
Soit m la moyenne et a l'écart type de la loi de z, la distance d normalisée, c'est-à-dire: d = 1 d Xm" suit donc une loi normale. Par exemple, dans le cas de la formule (Eqx 2), la valeur de X est de 100, correspondant au nombre de points d'intérêt de même type.
Pour déterminer la similarité entre une image publiée IP et un ensemble d'images d'une base propriétaire, ICi, les étapes suivantes vont être effectuées.
(Eqx4) Une distance d est calculée entre l'image IP et chacune des images ICi et, à l'issue du processus de sélection, seulement les K images les plus proches sont retenues. Pour une image retenue ICk, la distance calculée satisfait la relation: d'k = infâ1, ,dNP-k}, d'k étant la kième distance minimale et NP-k étant le nombre d'images de la base des images propriétaires 100 moins les k images déjà sélectionnées (dans cette formule, les indices dk prennent en compte les k images préalablement sélectionnées et enlevées de la base). On peut en déduire que: x \ NP-k+1 P(d'k < x) =1- 1 - 1 J e-2 dt (Eqx5) Dans le contexte de l'application, la formule appliquée est: x \NP p(x,NP) = P(d'k < x) =1- 11 Je-'2 dt (Eqx5a) Cette formule nous fournit la probabilité de fausse alarme, c'est-à-dire la probabilité qu'une image IP qui n'appartient pas à la base de données d'images propriétaires ait une distance normalisée inférieure à la valeur x avec une des K images les plus proches de la base ICk. Ainsi pour une distance calculée dik, la probabilité de fausse alarme de la décision de première correspondance entre une image publiée IP et une image propriétaire ICk est égale à p(dik,NP). Cette fonction dépend également du nombre NP d'images de la base d'images propriétaires 100. Néanmoins, la formule est applicable notamment, dans le cas particulier où NP=1, c'est-à-dire où l'on compare une image IP à une seconde image IC. Dans ce cas, p(x,1) est simplement la probabilité de fausse alarme associée à une loi Gaussienne centrée.
L'étape Ex8 de la figure 8 est suivie de l'étape Ex9 correspondant à l'étape E4 de la figure 3.
Pour chacune des images ICk retenues à l'étape de sélection, la valeur de probabilité de fausse alarme calculée à l'étape Ex8 est comparée à un seuil prédéterminé, P FA. Ce seuil peut, par exemple, être donné par l'utilisateur.
Si, pour une distance donnée dik, la probabilité de fausse alarme obtenue est inférieure au seuil P FA, on conclut que l'image publiée IP et l'image de la base d'indice ik, ICik, sont en correspondance avec une probabilité d'erreur inférieure à P FA. La valeur Cl est alors Cl = p(dik, NP) . Cette étape est alors suivie des étapes E5 à E10 de la figure 3 afin de renforcer le degré de confiance en une correspondance de type même image . Dans le cas où la probabilité de fausse alarme obtenue à partir de dik est supérieure au seuil P FA, alors on estime que la probabilité de se tromper en décidant que les deux images sont en fait la même image donne une probabilité de fausse alarme supérieure à celle fixée par l'utilisateur, et il n'est donc pas nécessaire de générer une alarme. Cette étape est alors suivie de l'étape E11 de la figure 3.
Comme représenté à la figure 12, un dispositif de vérification d'entités multimédia adapté à une mise en oeuvre du procédé selon l'invention est par exemple construit autour d'un micro-ordinateur 120 auquel sont associés différents périphériques.
Ce dispositif comprend les différents moyens nécessaires à la mise en oeuvre du procédé (moyens d'obtention, moyens de comparaison, moyens de décision, moyens d'extraction, etc.).
De manière classique, le micro-ordinateur 120 comporte une unité centrale (CPU) 1200, une mémoire non volatile telle qu'une ROM 1201, une mémoire vive RAM 1202, des moyens d'interface homme-machine tels qu'un écran 1203 et un clavier 1204, des moyens de stockage d'information tels qu'un disque dur 1205 et un lecteur 1206, et différentes interfaces de périphérique 1207. Le terme interface doit ici être interprété de manière étendue et est utilisé pour désigner différentes cartes et circuits d'adaptation tels qu'une carte graphique, une carte audio, une interface de communication et autres. Un bus de communication interne (non représenté) est compris également dans le micro-ordinateur 120 et constitue un moyen de communication, non exclusif, qui permet à l'unité centrale 1200 de communiquer avec les différents éléments fonctionnels du dispositif selon l'invention.
2875663 49 Le micro-ordinateur 120 est de préférence relié à une caméra numérique 1208, à travers une carte graphique (non représenté) faisant partie des interfaces 1207. Selon une variante, il peut également être prévu un scanner (non représenté) ou tout autre moyen d'acquisition ou de stockage d'image fournissant des informations à traiter selon le procédé de l'invention.
Le dispositif selon l'invention est connecté à un réseau de communication 1209, tel que le réseau Internet, qui est apte à transmettre des données numériques à traiter ou inversement à transmettre des données traitées par le dispositif.
Le lecteur 1206 est prévu pour recevoir un disque 1210. Le disque 1210 peut par exemple être une disquette, un CD-ROM, ou un DVD-ROM. Le disque 1210 peut contenir des données traitées selon l'invention, de même que le disque dur 1205, ainsi qu'un programme mettant en oeuvre le procédé de vérification d'entités multimédia selon l'invention qui, une fois lu par le micro- ordinateur 120, est stocké dans le disque dur 1205.
De manière plus générale, les moyens de stockage d'information peuvent comprendre un moyen lisible par un ordinateur ou par un microprocesseur, intégré ou non au dispositif selon l'invention, éventuellement amovible, qui mémorise le programme mettant en oeuvre le procédé selon l'invention.
Selon une variante, le programme de mise en oeuvre du procédé selon l'invention peut être stocké dans la mémoire morte 1201.
Selon encore une autre variante, le programme peut être reçu par l'intermédiaire du réseau de communication 1209 pour être stocké de manière 25 analogue à celle décrite précédemment.
Claims (56)
1. Procédé de vérification d'au moins une correspondance entre une première entité multimédia et une seconde entité multimédia, 5 caractérisé en ce que le procédé comprend les étapes suivantes: - obtention d'un premier critère de fiabilité (Cl) de correspondance, - comparaison du premier critère de fiabilité (Cl) obtenu à un seuil prédéterminé, - en fonction du résultat de la comparaison, décision sur une première 10 correspondance entre la première entité multimédia et la seconde entité multimédia, - en cas de décision positive de première correspondance, le procédé comprend les étapes suivantes: o extraction d'une première information dans la première 15 entité multimédia, o comparaison entre l'information extraite et une seconde information de la seconde entité multimédia, o obtention d'un second critère de fiabilité (C2) de correspondance, o en fonction du résultat de la comparaison d'informations, décision sur une correspondance entre les première et seconde informations, et o décision sur une seconde correspondance entre la première entité multimédia et la seconde entité multimédia en fonction, d'une part, de la décision de la première correspondance entre la première et la seconde entité multimédia et, d'autre part, de la décision sur une correspondance entre les première et seconde informations, et o détermination d'une mesure de la fiabilité de la décision sur la seconde correspondance en fonction d'au moins un des premier et second critères de fiabilité de correspondance.
2875663 51 2. Procédé selon la revendication 1, caractérisé en ce que la première information extraite de la première entité multimédia est un message de tatouage.
3. Procédé selon la revendication 2, caractérisé en ce que l'extraction du message de tatouage est effectuée à partir d'au moins un paramètre d'extraction associé à un second message de tatouage de la seconde entité multimédia.
4. Procédé selon la revendication 3, caractérisé en ce que ledit au moins un paramètre d'extraction est associé à au moins un paramètre d'insertion utilisé pour l'insertion dudit second message de tatouage dans la seconde entité multimédia.
5. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que préalablement à ladite étape d'extraction d'une première information dans la première entité multimédia, le procédé comprend une étape de recalage de ladite première entité multimédia par rapport à ladite seconde entité multimédia, afin de permettre une extraction de ladite première information à partir de ladite première entité multimédia recalée.
6. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que ladite première entité multimédia est obtenue à partir d'un réseau.
7. Procédé selon la revendication 6, caractérisé en ce que l'obtention de ladite première entité multimédia comporte une étape d'identification de l'adresse sur le réseau de ladite première entité multimédia et I ou de l'adresse référençant ladite première entité multimédia.
8. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que, les entités multimédia étant des images, 10 30' l'étape de décision sur la seconde correspondance est suivie d'une étape d'établissement d'un rapport contenant une indication de même scène si la décision sur la première correspondance entre la première entité multimédia et ladite seconde entité multimédia est positive et si la décision sur la correspondance entre les première et seconde informations est négative.
9. Procédé selon la revendication 8, caractérisé en ce que, la mesure de la fiabilité de la décision sur la seconde correspondance est associée à l'indication de même scène et correspond au premier critère de fiabilité (Cl) de correspondance.
10. Procédé selon la revendication 8 ou 9, caractérisé en ce que l'étape de décision sur la seconde correspondance est suivie d'une étape d'insertion dans le rapport d'une indication de même image si la décision sur la première correspondance entre la première entité multimédia et la seconde entité multimédia est positive et la décision sur la correspondance entre les première et seconde informations est positive.
11. Procédé selon la revendication 10, caractérisé en ce que la mesure de la fiabilité de la décision sur la seconde correspondance est associée à l'indication de même image et correspond au produit du premier critère de fiabilité de correspondance par le second critère de fiabilité de correspondance.
12. Procédé selon la revendication 7 et l'une quelconque des revendications 8 à 11, caractérisé en ce que le rapport comporte l'adresse sur le réseau de ladite première entité multimédia et I ou l'adresse référençant ladite première entité multimédia.
13. Procédé selon l'une quelconque -des revendications précédentes, caractérisé en ce que la seconde entité multimédia fait partie d'un ensemble de secondes entités multimédia. 30
2875663 53 14. Procédé selon la revendication 13, caractérisé en ce que, préalablement à l'étape d'obtention d'un premier critère de fiabilité de correspondance, le procédé comprend une étape de sélection, parmi l'ensemble de secondes entités multimédia, d'une pluralité de secondes entités multimédia proches de ladite première entité multimédia.
15. Procédé selon l'une quelconque des revendications précédentes, chaque entité multimédia comprenant une pluralité d'unités d'intérêt, caractérisé en ce que l'obtention du premier critère de fiabilité de correspondance comprend les sous étapes suivantes: - mise en correspondance d'informations de contenu local de la première entité multimédia avec des informations de contenu local de la seconde entité multimédia, lesdites informations de contenu local étant associées à des unités d'intérêt, mise en correspondance géométrique d'unités d'intérêt de la première entité multimédia avec des unités d'intérêt de la seconde entité multimédia, et - définition, dans l'une des entités multimédia, d'une zone comportant les unités d'intérêt résultant de l'étape de mise en correspondance géométrique; l'obtention du premier critère de fiabilité de correspondance étant réalisée à partir du résultat des étapes de mise en correspondance d'informations de contenu local et de mise en correspondance géométrique sur la zone définie.
16. Procédé selon la revendication 15, caractérisé en ce que, à chaque entité multimédia est associé au moins un descripteur déterminé préalablement à l'étape d'obtention du premier critère de fiabilité de correspondance, ledit au moins un descripteur associé à au moins une unité d'intérêt de l'entité multimédia comprenant au moins une information de contenu local et au moins une information de position, ledit au moins un descripteur étant utilisé lors des étapes de mise en correspondance d'informations de contenu local et de mise en correspondance géométrique.
2875663 54 17. Procédé selon la revendication 15 ou 16, caractérisé en ce que l'étape de mise en correspondance d'informations de contenu local de la première entité multimédia avec des informations de contenu local de la seconde entité multimédia, comporte les étapes suivantes: - pour chaque information de contenu local de la première entité multimédia, sélection, parmi les informations de contenu local de la seconde entité multimédia, des informations sensiblement proches de l'information de contenu local concernée, définissant ainsi un premier ensemble de correspondances dont chacune forme un couple entre l'information de contenu local concernée de la première entité et l'une des informations sensiblement proches de la seconde entité, - pour chaque information de contenu local de la seconde entité multimédia, sélection parmi les informations de contenu local de la première entité multimédia, des informations sensiblement proches de l'information de contenu local concernée, définissant ainsi un second ensemble de correspondances dont chacune forme un couple entre l'information de contenu local concernée de la seconde entité et l'une des informations sensiblement proches de la première entité, - détermination de l'intersection du premier et du second ensemble de 20 correspondances.
18. Procédé selon la revendication 17, caractérisé en ce que la sélection d'un ensemble de correspondances pour une information de contenu local concernée d'une entité multimédia comporte les étapes suivantes: - calcul des distances entre ladite information de contenu local concernée et chacune des informations de contenu local de l'autre entité multimédia, détermination des distances inférieures à un seuil prédéterminé, définissant ainsi l'ensemble de correspondances concerné.
19. Procédé selon l'une quelconque des revendications 15 à 18, caractérisé en ce que l'étape de mise en correspondance géométrique comporte les étapes suivantes: 2875663 55 - détermination d'une éventuelle transformation géométrique nécessaire pour obtenir la première entité multimédia à partir de la seconde entité multimédia, - détermination d'un ensemble d'unités d'intérêt de la première et de la seconde entité pour lesquelles la transformation géométrique permet de faire correspondre une unité d'intérêt de la première entité multimédia et une unité d'intérêt de la seconde entité multimédia.
20. Procédé selon les revendications 16 et 19, caractérisé en ce que l'étape de détermination d'une éventuelle transformation géométrique comprend une estimation de la cohérence géométrique entre les informations de position associées aux informations de contenu local mises en correspondance.
21. Procédé selon la revendication 13 et l'une quelconque des revendications 15 à...20, caractérisé en ce que l'obtention du premier critère de fiabilité de correspondance est effectuée à partir du rapport entre une probabilité que la première entité multimédia ne corresponde pas à l'une des secondes entités multimédia et une probabilité que la première entité multimédia corresponde à l'une des secondes entités multimédia, ces deux probabilités étant fonction du résultat des étapes de mise en correspondance.
22. Procédé selon la revendication 10 et l'une quelconque des revendications 15 à 21, caractérisé en ce que le rapport comprend en outre, une imagette dans laquelle est définie la zone comportant les unités d'intérêt résultant de l'étape de mise en correspondance géométrique.
23. Procédé selon l'une quelconque des revendications 1 à 14, caractérisé en ce que, préalablement à l'étape d'obtention du premier critère (Cl) de fiabilité de correspôndance, le procédé comprend les étapes de obtention d'au moins un descripteur de chacune des première et seconde entités multimédia, calcul d'une distance entre les descripteurs obtenus.
24. Procédé selon la revendication 23, caractérisé en ce que l'obtention du premier critère de fiabilité de correspondance est effectuée à partir du calcul d'une probabilité de première correspondance en fonction de la distance calculée.
25. Procédé selon la revendication 23 ou 24, caractérisé en ce que le descripteur est obtenu par les étapes suivantes: - obtention d'un découpage de l'entité multimédia en au moins un nombre prédéterminé de blocs, et pour chaque bloc: - extraction d'au moins une unité d'intérêt, et - mémorisation des coordonnées de ladite au moins une unité d'intérêt. 15 28. Procédé selon la revendication 25, caractérisé en ce que le calcul d'une distance, entre les descripteurs obtenus de la première entité multimédia et de la seconde entité multimédia, est effectué par sommation sur l'ensemble des blocs obtenus par découpage de chaque entité multimédia, des distances entre unités d'intérêt appartenant auxdits blocs spatialement correspondants.
29. Procédé selon la revendication 26, caractérisé en ce que la distance entre unités d'intérêt par bloc est égale à la distance maximale entre coordonnées des unités d'intérêt.
30. Procédé selon la revendication 26 ou 27, caractérisé en ce que la distance calculée est égale au minimum des distances obtenues après application, sur l'une des entités multimédia considérées, d'une transformation géométrique appartenant à un ensemble prédéterminé de transformations.
29. Procédé selon l'une des revendications 23 à 28, caractérisé en ce que l'étape d'obtention d'un découpage comprend les étapes de: - normalisation de la taille de l'entité multimédia à une taille prédéterminée - découpage de l'entité multimédia normalisée suivant ledit au moins un 5 nombre prédéterminé de blocs.
30. Procédé selon l'une quelconque des revendications 25 à 29 caractérisé en ce qu'une unité d'intérêt est un extremum d'un opérateur de filtrage.
31. Procédé selon la revendication 14, caractérisé en ce que l'étape de sélection d'une pluralité de secondes entités multimédia proches de ladite première entité multimédia comprend les étapes suivantes: - pour chaque couple de première et de seconde entités multimédia, les 15 étapes d'obtention des descripteurs et de calcul de la distance associée au procédé de la revendication 23, et sélection des secondes entités multimédia pour lesquelles les distances avec la première entité multimédia sont les plus faibles.
32. Procédé selon les revendications 24 et 31, caractérisé en ce que le premier critère de fiabilité de correspondance dépend en outre du nombre de secondes entités multimédia de l'ensemble de secondes entités multimédia.
33. Procédé selon l'une quelconque des revendications 23 à 32, caractérisé en ce que le seuil prédéterminé est une valeur prédéterminée (P FA) de la probabilité de prendre une décision erronée sur la première correspondance entre la première entité multimédia et une seconde entité multimédia. 25
34. Dispositif de vérification d'au moins une correspondance entre une première entité multimédia et une seconde entité multimédia, caractérisé en ce que le dispositif comprend: - des moyens d'obtention d'un premier critère de fiabilité (Cl) de 5 correspondance, - des moyens de comparaison du premier critère de fiabilité (Cl) obtenu à un seuil prédéterminé, - des moyens de décision sur une première correspondance entre la première entité multimédia et la seconde entité multimédia et qui sont aptes à décider sur la première correspondance en fonction du résultat de la comparaison, - des moyens d'extraction d'une première information dans la première entité multimédia, - des moyens de comparaison entre l'information extraite et une seconde 15 information de la seconde entité multimédia, - des moyens d'obtention d'un second critère de fiabilité (C2) de correspondance, - des moyens de décision sur une correspondance entre les première et seconde informations et qui sont aptes à décider sur ladite correspondance en 20 fonction du résultat de la comparaison d'informations, et - des moyens de décision sur une seconde correspondance entre la première entité multimédia et la seconde entité multimédia, lesdits moyens de décision étant aptes à décider sur la seconde correspondance en fonction, d'une part, de la décision de la première correspondance entre la première et la seconde entité multimédia et, d'autre part, de la décision sur une correspondance entre les première et seconde informations, et - des moyens de détermination d'une mesure de la fiabilité de la décision sur la seconde correspondance qui sont aptes à déterminer la mesure de la fiabilité de la décision en fonction d'au moins un des premier et second critères de fiabilité de correspondance.
2875663 59 35. Dispositif selon la revendication 34, caractérisé en ce que la première information extraite de la première entité multimédia par les moyens d'extraction est un message de tatouage.
36. Dispositif selon la revendication 35, caractérisé en ce que les moyens d'extraction du message de tatouage sont aptes à effectuer l'extraction à partir d'au moins un paramètre d'extraction associé à un second message de tatouage de la seconde entité multimédia.
37. Dispositif selon la revendication 36, caractérisé en ce que ledit au moins un paramètre d'extraction est associé à au moins un paramètre d'insertion utilisé pour l'insertion dudit second message de tatouage dans la seconde entité multimédia.
38. Dispositif selon l'une quelconque des revendications 34 à 37, caractérisé en ce que le dispositif comprend des moyens de recalage de ladite première entité multimédia par rapport à ladite seconde entité multimédia, lesdits moyens de recalage étant aptes à permettre une extraction de ladite première information à partir de ladite première entité multimédia recalée.
39. Dispositif selon l'une quelconque des revendications 34 à 38, caractérisé en ce que ladite première entité multimédia est obtenue à partir d'un réseau.
40. Dispositif selon la revendication 39, caractérisé en ce que les moyens d'obtention de ladite première entité multimédia comportent des moyens d'identification de l'adresse sur le réseau de ladite première entité multimédia et / ou de l'adresse référençant ladite première entité multimédia.
41. Dispositif selon l'une quelconque des revendications 34 à 40, caractérisé en ce que, les entités multimédia étant des images, le dispositif comprend en outre, des moyens d'établissement d"un rapport contenant une 30 indication de même scène si la décision sur la première correspondance entre la première entité multimédia et ladite seconde entité multimédia est positive et si la décision sur la correspondance entre les première et seconde informations est négative.
42. Dispositif selon la revendication 41, caractérisé en ce que, la mesure de la fiabilité de la décision sur la seconde correspondance est associée à l'indication de même scène et correspond au premier critère de fiabilité (Cl) de correspondance.
43. Dispositif selon la revendication 41 ou 42, caractérisé en ce que le dispositif comprend des moyens d'insertion dans le rapport d'une indication de même image si la décision sur la première correspondance entre la première entité multimédia et la seconde entité multimédia est positive et si la décision sur la correspondance entre les première et seconde informations est positive.
44. Dispositif selon la revendication 43, caractérisé en ce que la mesure de la fiabilité de la décision sur la seconde correspondance est associée à l'indication de même image et correspond au produit du premier critère de fiabilité de correspondance par le second critère de fiabilité de correspondance.
45. Dispositif selon la revendication 40 et l'une quelconque des revendications 41 à 44, caractérisé en ce que les moyens d'établissement d'un rapport, sont aptes à générer un rapport comportant l'adresse sur le réseau de ladite première entité multimédia et / ou l'adresse référençant ladite première entité multimédia.
46. Dispositif selon l'une quelconque d'es revendications 34 à 45, caractérisé en ce que la seconde entité multimédia fait partie d'un ensemble de secondes entités multimédia.
2875663 61 47. Dispositif selon la revendication 46, caractérisé en ce que, le dispositif comprend des moyens de sélection, parmi l'ensemble de secondes entités multimédia, d'une pluralité de secondes entités multimédia proches de ladite première entité multimédia.
48. Dispositif selon l'une quelconque des revendications 34 à 47, chaque entité multimédia comprenant une pluralité d'unités d'intérêt, caractérisé en ce que les moyens d'obtention du premier critère de fiabilité de correspondance comprennent: - des moyens de mise en correspondance d'informations de contenu local de la première entité multimédia avec des informations de contenu local de la seconde entité multimédia, lesdites informations de contenu local étant associées à des unités d'intérêt, des moyens de mise en correspondance géométrique d'unités d'intérêt de la première entité multimédia avec des unités d'intérêt de la seconde entité multimédia, et - des moyens de définition, dans l'une des entités multimédia, d'une zone comportant les unités d'intérêt mises en correspondance géométrique; les moyens d'obtention du premier critère de fiabilité de correspondance étant aptes à obtenir le premier critère de fiabilité de correspondance à partir du résultat fourni par les moyens de mise en correspondance d'informations de contenu local et de mise en correspondance géométrique sur la zone définie.
49. Dispositif selon la revendication 48, caractérisé en ce que, à chaque entité multimédia est associé au moins un descripteur déterminé, ledit au moins un descripteur associé à au moins une unité d'intérêt de l'entité multimédia comprenant au moins une information de contenu local et au moins une information de position, ledit au moins un descripteur étant utilisé lors de la mise en correspondance d'informations de contenu local et. de la mise en correspondance géométrique.
50. Dispositif selon la revendication 46 et la revendication 48 ou 49, caractérisé en ce que les moyens d'obtention du premier critère de fiabilité de correspondance sont aptes à obtenir le premier critère de fiabilité de correspondance à partir du rapport entre une probabilité que la première entité multimédia ne corresponde pas à l'une des secondes entités multimédia et une probabilité que la première entité multimédia corresponde à l'une des secondes entités multimédia, ces deux probabilités étant fonction du résultat fourni par les moyens de mises en correspondance.
51. Dispositif selon la revendication 43 et l'une quelconque des revendications 48 à 50, caractérisé en ce que les moyens d'établissement du rapport sont aptes à générer en outre, une imagette dans laquelle est définit la zone comportant les unités d'intérêt mises en correspondance géométrique.
52. Dispositif selon l'une quelconque des revendications 34 à 47, caractérisé en ce que le dispositif comprend: des moyens d'obtention d'au moins un descripteur de chacune des première et seconde entités multimédia, des moyens de calcul d'une distance entre les descripteurs obtenus.
53. Dispositif selon la revendication 52, caractérisé en ce que les moyens d'obtention du premier critère de fiabilité de correspondance sont aptes à obtenir le premier critère à partir du calcul d'une probabilité de première correspondance en fonction de la distance calculée.
54. Dispositif selon la revendication 52 ou 53, caractérisé en ce que les moyens d'obtention du descripteur comprennent: - des moyens d'obtention d'un découpage de l'entité multimédia en au moins un nombre prédéterminé de blocs, - des moyens d'extraction d'au moins une unité d'intérêt pour chaque bloc, 15 - des moyens de mémorisation des coordonnées de ladite au moins une unité d'intérêt de chaque bloc.
55. Dispositif selon la revendication 54, caractérisé en ce que les moyens de calcul d'une distance entre les descripteurs obtenus de la première entité multimédia et de la seconde entité multimédia; sont aptes à calculer par sommation sur l'ensemble des blocs obtenus par découpage de chaque entité multimédia, des distances entre unités d'intérêt appartenant auxdits blocs spatialement correspondants.
56. Dispositif selon la revendication 47, caractérisé en ce que les moyens de sélection d'une pluralité de secondes entités multimédia proches de ladite première entité multimédia comprennent: les moyens d'obtention des descripteurs et de calcul de la distance associée au dispositif de la revendication 52, qui sont appliqués à chaque couple de première et de seconde entités multimédia, et les moyens de sélection des secondes entités multimédia pour lesquelles les distances avec la première entité multimédia sont les plus faibles.
57. Dispositif selon les revendications 53 et 56, caractérisé en ce que le premier critère de fiabilité de correspondance dépend en outre du nombre de secondes entités multimédia de l'ensemble de secondes entités multimédia.
58. Dispositif selon l'une quelconque des revendications 52 à 57, caractérisé en ce que le seuil prédéterminé est une valeur prédéterminée (P FA) de la probabilité de prendre une décision erronée sur la première correspondance entre l'a première entité multimédia et une seconde entité multimédia.
2875663 64 59. Dispositif de traitement d'information apte à fonctionner en tant que dispositif de vérification d'au moins une correspondance entre une première entité multimédia et une seconde entité multimédia, caractérisé en ce qu'il comprend des moyens adaptés à la mise en oeuvre du procédé de vérification d'au moins une correspondance selon l'une quelconque des revendications 1 à 33.
60. Système de télécommunications comprenant une pluralité de dispositifs terminaux reliés à travers un réseau de télécommunications, caractérisé en ce qu'il comprend au moins un dispositif terminal équipé d'un dispositif de vérification d'au moins une correspondance entre une première entité multimédia et une seconde entité multimédia selon l'une quelconque des revendications 34 à 58.
61. Dispositif de stockage d'entités multimédia, caractérisé en ce qu'il comprend au moins un dispositif de vérification d'au moins une correspondance entre une première entité multimédia et une seconde entité multimédia selon l'une quelconque des revendications 34 à 58.
62. Support d'informations lisible par un système informatique, éventuellement totalement ou partiellement amovible, notamment CD-ROM ou support magnétique, tel un disque dur ou une disquette, ou support transmissible tel un signal électrique ou optique, ce support d'informations comprenant des instructions d'un programme d'ordinateur permettant la mise en oeuvre du procédé de vérification d'au moins une correspondance entre une première entité multimédia et une seconde entité multimédia selon l'une quelconque des revendications 1 à 33, lorsque ce programme est chargé et exécuté par un système informatique.
63. Programme d'ordinateur stocké sur un support d'informations, ledit programme contenant des instructions permettant la mise en oeuvre du procédé de vérification d'au moins une correspondance entre une première entité multimédia et une seconde entité multimédia selon l'une quelconque des revendications 1 à 33, lorsque ce programme est chargé et exécuté par un système informatique.
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR0410088A FR2875663B1 (fr) | 2004-09-23 | 2004-09-23 | Procede et dispositif de verification d'entites multimedia |
| EP04292301A EP1519563A3 (fr) | 2003-09-25 | 2004-09-24 | Procédé et dispositif de vérification d'entités multimédia, notamment pour la vérification des images numériques |
| US10/948,178 US8031979B2 (en) | 2003-09-25 | 2004-09-24 | Method and device for verifying multimedia entities and in particular for verifying digital images |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR0410088A FR2875663B1 (fr) | 2004-09-23 | 2004-09-23 | Procede et dispositif de verification d'entites multimedia |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| FR2875663A1 true FR2875663A1 (fr) | 2006-03-24 |
| FR2875663B1 FR2875663B1 (fr) | 2006-12-15 |
Family
ID=34949024
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| FR0410088A Expired - Fee Related FR2875663B1 (fr) | 2003-09-25 | 2004-09-23 | Procede et dispositif de verification d'entites multimedia |
Country Status (1)
| Country | Link |
|---|---|
| FR (1) | FR2875663B1 (fr) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP2317459A1 (fr) * | 2009-10-09 | 2011-05-04 | Snell Limited | Définition des propriétés d'image à l'aide de propriétés pour surveiller des transformations d'image |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0884669A2 (fr) * | 1997-06-13 | 1998-12-16 | Mitsubishi Corporation | Système de gestion de données de droits d'auteurs avec une filigraine électronique |
| US6430301B1 (en) * | 2000-08-30 | 2002-08-06 | Verance Corporation | Formation and analysis of signals with common and transaction watermarks |
| US20020188841A1 (en) * | 1995-07-27 | 2002-12-12 | Jones Kevin C. | Digital asset management and linking media signals with related data using watermarks |
| US6574350B1 (en) * | 1995-05-08 | 2003-06-03 | Digimarc Corporation | Digital watermarking employing both frail and robust watermarks |
| US20030133153A1 (en) * | 2002-01-11 | 2003-07-17 | Takashi Shinoda | Method and system for checking an original recorded information |
-
2004
- 2004-09-23 FR FR0410088A patent/FR2875663B1/fr not_active Expired - Fee Related
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6574350B1 (en) * | 1995-05-08 | 2003-06-03 | Digimarc Corporation | Digital watermarking employing both frail and robust watermarks |
| US20020188841A1 (en) * | 1995-07-27 | 2002-12-12 | Jones Kevin C. | Digital asset management and linking media signals with related data using watermarks |
| EP0884669A2 (fr) * | 1997-06-13 | 1998-12-16 | Mitsubishi Corporation | Système de gestion de données de droits d'auteurs avec une filigraine électronique |
| US6430301B1 (en) * | 2000-08-30 | 2002-08-06 | Verance Corporation | Formation and analysis of signals with common and transaction watermarks |
| US20030133153A1 (en) * | 2002-01-11 | 2003-07-17 | Takashi Shinoda | Method and system for checking an original recorded information |
Non-Patent Citations (1)
| Title |
|---|
| SCHMID C ET AL: "LOCAL GRAYVALUE INVARIANTS FOR IMAGE RETRIEVAL", IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, IEEE INC. NEW YORK, US, vol. 19, no. 5, 1 May 1997 (1997-05-01), pages 530 - 535, XP000693746, ISSN: 0162-8828 * |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP2317459A1 (fr) * | 2009-10-09 | 2011-05-04 | Snell Limited | Définition des propriétés d'image à l'aide de propriétés pour surveiller des transformations d'image |
Also Published As
| Publication number | Publication date |
|---|---|
| FR2875663B1 (fr) | 2006-12-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8270684B2 (en) | Automatic media sharing via shutter click | |
| CN110781911B (zh) | 一种图像匹配方法、装置、设备及存储介质 | |
| KR101531618B1 (ko) | 이미지들의 비교 방법 및 시스템 | |
| WO2019091787A1 (fr) | Procédé d'estimation de pose d'une caméra dans le référentiel d'une scène tridimensionnelle, dispositif, système de réalite augmentée et programme d'ordinateur associé | |
| US20150029222A1 (en) | Dynamically configuring an image processing function | |
| US20090228510A1 (en) | Generating congruous metadata for multimedia | |
| CN110379020A (zh) | 一种基于生成对抗网络的激光点云上色方法和装置 | |
| CN111079648A (zh) | 数据集清洗方法、装置和电子系统 | |
| CN115687670A (zh) | 图像搜索方法、装置、计算机可读存储介质及电子设备 | |
| EP1519563A2 (fr) | Procédé et dispositif de vérification d'entités multimédia, notamment pour la vérification des images numériques | |
| da Silva Teixeira et al. | Reconstruction of frescoes by sequential layers of feature extraction | |
| CN112818874B (zh) | 一种图像处理方法、装置、设备及存储介质 | |
| FR2946439A1 (fr) | Procedes et dispositifs d'identification d'objets reels, de suivi de la representation de ces objets et de realite augmentee, dans une sequence d'images, en mode client-serveur | |
| CN116030390A (zh) | 视频中异常行为的智能检测方法、装置、设备及存储介质 | |
| CN115797291A (zh) | 回路端子的识别方法、装置、计算机设备和存储介质 | |
| FR2875663A1 (fr) | Procede et dispositif de verification d'entites multimedia | |
| CN114298952A (zh) | 一种标签图像生成方法、装置、设备及存储介质 | |
| CN119495117A (zh) | 一种人员识别方法、装置、电子设备及存储介质 | |
| CN118314357A (zh) | 图像检测方法及装置 | |
| Behera et al. | Looking at projected documents: Event detection & document identification | |
| CN112449701B (zh) | 学习模板表示库 | |
| CN114626483A (zh) | 一种地标图像生成方法及装置 | |
| Thonat et al. | Thin structures in image based rendering | |
| FR2875622A1 (fr) | Procede et dispositif de verification d'entites multimedia | |
| Al-Hamadi et al. | Toward robust face analysis method of non-cooperative persons in stereo color image sequences |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| ST | Notification of lapse |
Effective date: 20140530 |