| > accueil > services > déduplication |
En savoir plus sur la déduplication de fichiers
Vous
gérez un ou plusieurs fichiers d'adresses ?
Vous gérez un fichier central, mais il présente de nombreux doublons
?
Vous faites régulièrement des campagnes de Marketing Direct en
utilisant des fichiers extérieurs ?
Vous vous êtes donc souvent trouvés confrontés à
des problèmes d'adresses en double, en triple, voire plus encore...Pour
y remédier, vous faites appel à la déduplication de fichiers.
Mais êtes vous sûr de bien optimiser vos bases de données?
La déduplication est souvent assimilée à l'élimination
pure et simple d'adresses multiples. Pourtant, il est important de ne pas se
contenter de supprimer certaines adresses en double. Vous risquez de perdre
une quantité insoupçonnée d'informations! En parallèle,
vous désirez avoir une certitude absolue sur la qualité de déduplication
de vos fichiers.
Pourquoi
éliminer les doublons?
Imaginez la situation suivante: vous êtes un client fidèle d'une
grande société, et celle-ci décide de lancer un club privilège
pour récompenser ses meilleurs clients. Bien entendu, vous faites partie
de la cible de ce club. Pour souligner son importance, cette société
vous fait parvenir un superbe dossier, avec une personnalisation très
travaillée, et comble de la personnalisation, vous avez droit à
un accès exclusif à ce club avec une carte privilège exclusive
et un code d'accès personnel et confidentiel. Malheureusement, vous figurez
plusieurs fois dans le fichier client de cette société, et vous
recevez une multitude de cartes le même jour dans votre boîte à
lettres.Vous vous direz, et c'est bien légitime, qu'une société
qui vous envoie une telle offre connaît bien mal ses clients.
De
l'origine des doublons
Un doublon, très simplement, c'est un client qui peut figurer en plusieurs
exemplaires dans votre base de données. Les raisons peuvent être
multiples:
Un partage de la connaissance client. Plusieurs personnes de votre réseau
de distribution peuvent être amenées à rencontrer votre
client. Ne le connaissant pas, elle le prendront à coup sûr pour
un nouveau client, et ne manqueront pas de la saisir plusieurs fois dans votre
base de données.
"Mais je dispose pourtant d'une fonctionnalité de recherche client
avant toute nouvelle saisie de client..."
Certes, mais dans les cas suivants, quelle est l'efficacité de votre
recherche si:
Bref, toute saisie informatique présente de nombreux pièges qu'il vous sera très difficile de gérer.
Notre
technique de déduplication vous permettra d'y remédier.
Dans un premier temps, nous nous concentrons sur une première information
fondamentale de vos bases de données: la dimension géographique.
Une adresse bien identifiée est une des clés de rapprochement
les plus puissantes. Un code postal croisé avec nom de commune correctement
reconnu, une approche plus précise par un code voie et enfin le numéro
dans la voie.
Ensuite, viennent les critères complémentaires d'adresses, tels
les indications d'immeuble, de porte, de lieu-dit.
Enfin, l'arbitrage définitif se fait sur les critères d'état
civil, avec en priorité le nom de famille, puis les prénoms, les
dates de naissances.
Une
fois ces critères traîtés, notre algorithme de rapprochement
procède à un arbitrage, basé sur un ensemble de règles,
pour obtenir un score de proximité entre vos différents enregistrements
clients, et une qualification du type de connexions qui peuvent les relier.
Il ne reste plus qu'à procéder à un examen statistique
de ces rapprochements pour décider du seuil à partir duquel nous
pouvons à coup sûr identifier les doublons de vos bases de données,
et mieux encore, utiliser les doublons identifiés pour consolider leurs
informations dans un seul enregistrement client.
Il
est intéressant de vous rappeler ici notre engagement qualité
sur le traitement de vos fichiers.
Outre une transparence totale sur les résultats du traitement, nous pouvons
aussi vous apporter un diagnostic sur la qualité de vos bases clients,
et pourquoi pas vous signaler quelles sont les plus grandes causes d'erreurs
dans vos fichiers. Votre gain sera immédiat lors d'un prochain traitement,
et vous pourrez valoriser vos collaborateurs en les rendant acteurs de la qualité
de vos bases de données.