FR2899708B1 - Procede de de-doublonnage rapide d'un ensemble de documents ou d'un ensemble de donnees contenues dans un fichier - Google Patents

Procede de de-doublonnage rapide d'un ensemble de documents ou d'un ensemble de donnees contenues dans un fichier

Info

Publication number
FR2899708B1
FR2899708B1 FR0603107A FR0603107A FR2899708B1 FR 2899708 B1 FR2899708 B1 FR 2899708B1 FR 0603107 A FR0603107 A FR 0603107A FR 0603107 A FR0603107 A FR 0603107A FR 2899708 B1 FR2899708 B1 FR 2899708B1
Authority
FR
France
Prior art keywords
quillling
documents
file
rapid
data contained
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
FR0603107A
Other languages
English (en)
Other versions
FR2899708A1 (fr
Inventor
Julien Lemoine
Jean Francois Marcotorchino
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thales SA
Original Assignee
Thales SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thales SA filed Critical Thales SA
Priority to FR0603107A priority Critical patent/FR2899708B1/fr
Priority to PCT/EP2007/053435 priority patent/WO2007116042A1/fr
Priority to US12/296,327 priority patent/US20100063966A1/en
Priority to EP07727903A priority patent/EP2013776A1/fr
Publication of FR2899708A1 publication Critical patent/FR2899708A1/fr
Application granted granted Critical
Publication of FR2899708B1 publication Critical patent/FR2899708B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
FR0603107A 2006-04-07 2006-04-07 Procede de de-doublonnage rapide d'un ensemble de documents ou d'un ensemble de donnees contenues dans un fichier Expired - Fee Related FR2899708B1 (fr)

Priority Applications (4)

Application Number Priority Date Filing Date Title
FR0603107A FR2899708B1 (fr) 2006-04-07 2006-04-07 Procede de de-doublonnage rapide d'un ensemble de documents ou d'un ensemble de donnees contenues dans un fichier
PCT/EP2007/053435 WO2007116042A1 (fr) 2006-04-07 2007-04-06 Procede de de-doublonnage rapide d'un ensemble de documents ou d'un ensemble de donnees contenues dans un fichier
US12/296,327 US20100063966A1 (en) 2006-04-07 2007-04-06 Method for fast de-duplication of a set of documents or a set of data contained in a file
EP07727903A EP2013776A1 (fr) 2006-04-07 2007-04-06 Procede de de-doublonnage rapide d'un ensemble de documents ou d'un ensemble de donnees contenues dans un fichier

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0603107A FR2899708B1 (fr) 2006-04-07 2006-04-07 Procede de de-doublonnage rapide d'un ensemble de documents ou d'un ensemble de donnees contenues dans un fichier

Publications (2)

Publication Number Publication Date
FR2899708A1 FR2899708A1 (fr) 2007-10-12
FR2899708B1 true FR2899708B1 (fr) 2008-06-20

Family

ID=37478808

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0603107A Expired - Fee Related FR2899708B1 (fr) 2006-04-07 2006-04-07 Procede de de-doublonnage rapide d'un ensemble de documents ou d'un ensemble de donnees contenues dans un fichier

Country Status (4)

Country Link
US (1) US20100063966A1 (fr)
EP (1) EP2013776A1 (fr)
FR (1) FR2899708B1 (fr)
WO (1) WO2007116042A1 (fr)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9489350B2 (en) * 2010-04-30 2016-11-08 Orbis Technologies, Inc. Systems and methods for semantic search, content correlation and visualization
US8364716B2 (en) 2010-12-17 2013-01-29 Netapp, Inc. Methods and apparatus for incrementally computing similarity of data sources
US8244831B1 (en) * 2011-05-23 2012-08-14 Ilesfay Technology Group, LLC Method for the preemptive creation of binary delta information within a computer network
US9015080B2 (en) 2012-03-16 2015-04-21 Orbis Technologies, Inc. Systems and methods for semantic inference and reasoning
US9189531B2 (en) 2012-11-30 2015-11-17 Orbis Technologies, Inc. Ontology harmonization and mediation systems and methods
CN110990539B (zh) * 2019-12-24 2023-07-25 新方正控股发展有限责任公司 稿件内部查重方法、装置及电子设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5909677A (en) * 1996-06-18 1999-06-01 Digital Equipment Corporation Method for determining the resemblance of documents
US6934714B2 (en) * 2002-03-04 2005-08-23 Intelesis Engineering, Inc. Method and system for identification and maintenance of families of data records
KR20060059261A (ko) * 2003-07-21 2006-06-01 코닌클리케 필립스 일렉트로닉스 엔.브이. 문서들의 집합에서의 검색 방법

Also Published As

Publication number Publication date
WO2007116042A1 (fr) 2007-10-18
EP2013776A1 (fr) 2009-01-14
FR2899708A1 (fr) 2007-10-12
US20100063966A1 (en) 2010-03-11

Similar Documents

Publication Publication Date Title
EP1994122A4 (fr) Procédé et système d'extraction d'hydrocarbures de schiste bitumineux
EP1996914A4 (fr) Procede de chargement d'element penetrants dans un dispositif collecteur
EP2099234A4 (fr) Procédé et système et dispositif pour un procédé d'enregistrement
EP1851979A4 (fr) Optimisation continue de données dans un système de positionnement
EP2218058A4 (fr) Systèmes et procédés pour obtenir et utiliser des données à partir d'un système de télémétrie et de localisation localisé dans un système de télémétrie et de localisation étendu
EP2023127A4 (fr) Procede et dispositif d'imagerie d'un organisme echantillon
EP2018114A4 (fr) Système et procédé pour le mappage d'information d'électrogramme fractionnée
EP2191594A4 (fr) Système et procédé pour la détection d'activité de bruit
EP1964101A4 (fr) Procédé et fichiers pour fournir une imagerie avec des données incorporées
EP2115268A4 (fr) Système et procédé pour faciliter des opérations de fond de puits
EP1913459A4 (fr) Systeme et procede de redimensionnement d'interfaces graphiques dans un environnement web
EP2165331A4 (fr) Procédé de réglage d'un égaliseur dans un appareil pour reproduire un fichier multimédia et appareil associé
EP2115622A4 (fr) Système et procédé pour une protection de données automatique dans un réseau d'ordinateur
EP1999995A4 (fr) Procede et appareil d'identification dans un systeme audio
EP2150360A4 (fr) Procédés et appareil d'exploitation efficace d'un système d'assainissement
EP1784637A4 (fr) Procede et dispositif permettant d'extraire un analyte
FR2925978B1 (fr) Procede et dispositif de separation d'une structure.
EP2057253A4 (fr) Système et procédé pour la synthèse d'hydrocarbure
FR2925066B1 (fr) Dispositif de broyage d'un echantillon biologique
EP1882374A4 (fr) Procede et appareil de determination d'un affaiblissement de propagation
EP1972136A4 (fr) Procédé de partage de données de fichier svc et fichier svc associé
EP2106601A4 (fr) Système et procédé d'utilisation de métadonnées dans la publicité
EP1893325A4 (fr) Procede et appareil pour le repositionnement d'elements d'ecoulement dans une structure d'ecoulement tronconique
EP1864494A4 (fr) Procede d'identification de pod dans un systeme fournisseur de contenu numerique
EP2193421A4 (fr) Système de détection de position et procédé d'exploitation pour un système de détection de position

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 11

PLFP Fee payment

Year of fee payment: 12

PLFP Fee payment

Year of fee payment: 13

PLFP Fee payment

Year of fee payment: 15

PLFP Fee payment

Year of fee payment: 16

PLFP Fee payment

Year of fee payment: 17

PLFP Fee payment

Year of fee payment: 18

PLFP Fee payment

Year of fee payment: 19

ST Notification of lapse

Effective date: 20251205