> accueil > services > déduplication

En savoir plus sur la déduplication de fichiers

Vous gérez un ou plusieurs fichiers d'adresses ?
Vous gérez un fichier central, mais il présente de nombreux doublons ?
Vous faites régulièrement des campagnes de Marketing Direct en utilisant des fichiers extérieurs ?


Vous vous êtes donc souvent trouvés confrontés à des problèmes d'adresses en double, en triple, voire plus encore...Pour y remédier, vous faites appel à la déduplication de fichiers. Mais êtes vous sûr de bien optimiser vos bases de données?
La déduplication est souvent assimilée à l'élimination pure et simple d'adresses multiples. Pourtant, il est important de ne pas se contenter de supprimer certaines adresses en double. Vous risquez de perdre une quantité insoupçonnée d'informations! En parallèle, vous désirez avoir une certitude absolue sur la qualité de déduplication de vos fichiers.

Pourquoi éliminer les doublons?
Imaginez la situation suivante: vous êtes un client fidèle d'une grande société, et celle-ci décide de lancer un club privilège pour récompenser ses meilleurs clients. Bien entendu, vous faites partie de la cible de ce club. Pour souligner son importance, cette société vous fait parvenir un superbe dossier, avec une personnalisation très travaillée, et comble de la personnalisation, vous avez droit à un accès exclusif à ce club avec une carte privilège exclusive et un code d'accès personnel et confidentiel. Malheureusement, vous figurez plusieurs fois dans le fichier client de cette société, et vous recevez une multitude de cartes le même jour dans votre boîte à lettres.Vous vous direz, et c'est bien légitime, qu'une société qui vous envoie une telle offre connaît bien mal ses clients.

De l'origine des doublons
Un doublon, très simplement, c'est un client qui peut figurer en plusieurs exemplaires dans votre base de données. Les raisons peuvent être multiples:
Un partage de la connaissance client. Plusieurs personnes de votre réseau de distribution peuvent être amenées à rencontrer votre client. Ne le connaissant pas, elle le prendront à coup sûr pour un nouveau client, et ne manqueront pas de la saisir plusieurs fois dans votre base de données.
"Mais je dispose pourtant d'une fonctionnalité de recherche client avant toute nouvelle saisie de client..."
Certes, mais dans les cas suivants, quelle est l'efficacité de votre recherche si:

Bref, toute saisie informatique présente de nombreux pièges qu'il vous sera très difficile de gérer.

Notre technique de déduplication vous permettra d'y remédier.
Dans un premier temps, nous nous concentrons sur une première information fondamentale de vos bases de données: la dimension géographique.
Une adresse bien identifiée est une des clés de rapprochement les plus puissantes. Un code postal croisé avec nom de commune correctement reconnu, une approche plus précise par un code voie et enfin le numéro dans la voie.
Ensuite, viennent les critères complémentaires d'adresses, tels les indications d'immeuble, de porte, de lieu-dit.
Enfin, l'arbitrage définitif se fait sur les critères d'état civil, avec en priorité le nom de famille, puis les prénoms, les dates de naissances.

Une fois ces critères traîtés, notre algorithme de rapprochement procède à un arbitrage, basé sur un ensemble de règles, pour obtenir un score de proximité entre vos différents enregistrements clients, et une qualification du type de connexions qui peuvent les relier.
Il ne reste plus qu'à procéder à un examen statistique de ces rapprochements pour décider du seuil à partir duquel nous pouvons à coup sûr identifier les doublons de vos bases de données, et mieux encore, utiliser les doublons identifiés pour consolider leurs informations dans un seul enregistrement client.

Il est intéressant de vous rappeler ici notre engagement qualité sur le traitement de vos fichiers.
Outre une transparence totale sur les résultats du traitement, nous pouvons aussi vous apporter un diagnostic sur la qualité de vos bases clients, et pourquoi pas vous signaler quelles sont les plus grandes causes d'erreurs dans vos fichiers. Votre gain sera immédiat lors d'un prochain traitement, et vous pourrez valoriser vos collaborateurs en les rendant acteurs de la qualité de vos bases de données.

Retour vers les services