logo Homepage
Pages: [1]
  Imprimer  
Auteur Fil de discussion: developement d'un programme qui permettré de dédoublonner une base sql  (Lu 5362 fois)
xamssam
Profil challenge

Classement : 41331/55019

Néophyte
*
Hors ligne Hors ligne
Messages: 5


Voir le profil
« le: 17 Juillet 2009 à 11:32:14 »


Bonjour je suis nouveaux mais j'ai travailler durant mon stage sur une problématique:

"Problème : Comment traiter une base de donnée (BD) pour regrouper les doublons sachant que la base n’est pas remplie de manière uniforme et correcte ( nom de tuples identique écrit de manière différente, adresse écrite parfois avec des indicatifs complet et d’autre avec des abrégé (avenue/av) **orthographe !**..), que toute les données ne sont pas saisie et qu’il ni a pas d’identifiant fiable permettant d’effectuer ce regroupement ?"

j'ai trouvé une méthode logique qui pourait permettre de créer des groupes regroupent les doublons et qui ne représente qu'un tuples réellement.

Je ne sait pas programmer mais ,si cela interresse quelqu'un ,pouriont nous devellopper un programme qui pourrait appliquer ce que j'ai en tête?

P.S: j'ai fini mon stage mais je n'ai pas assez eu de temps pour dévellopper les requêtes
re.P.S: je ne sais pas si j'ai posté ce message au bon endroit alors au cas ou :
désoler
Journalisée
Iansus

Profil challenge

Classement : 52/55019

Membre Senior
****
Hors ligne Hors ligne
Messages: 262


Voir le profil WWW
« #1 le: 17 Juillet 2009 à 11:42:55 »

En gros, si j'ai bien compris, tu as une base de données avec différentes tables, de structure différente, contenant des doublons (même contenu, pas forcément même ID), et tu voudrais supprimer ces doublons ?
Journalisée
xamssam
Profil challenge

Classement : 41331/55019

Néophyte
*
Hors ligne Hors ligne
Messages: 5


Voir le profil
« #2 le: 17 Juillet 2009 à 13:24:07 »

ba non je vait pas faire ma faignasse mais n'étant qu'un novice en programmation je voudrai de l'aide ,de plus c'est toujours plus instructif/interréssan de travailler avec quelqu'un d'autre qui a une autre vision des choses. Cela me permettré de voir l'aboutisment de mon travail et en plus cela serai hyper formateur

le principe c'est qu'on a une base pouri avec des nom mal orthographié ( rajout de lettre,de chiffre ex: dev'international/dev'international)) un identifiant unique inutil ( si on fait un group by dessus on n'en retrouve aucun en double donc pas de doublon alors que visuellement on en repère) des adresse encore plus mal orthographier que les noms et un tas de champs pas remplie du tout

l'objectif est donc de regrouper les doublons (il y en a même si l'identifiant dit que non (il est corronpu) c'est ce que j'ai fait ( je ne sais pas si sa marche informatiquement mais logiquement si)
. Pour faire cela il faut ce servir des curseur dans le language sql or je commence juste a m'auto formé dessus.

l'objectif suppréme (mais reston modeste ^^) serait de définir un tuples parent auquel serait rattaché la le groupe de doublons correpondant.

l'interré de tout cela et de savoir combien de tuples réel on a et aussi , si on a des dossier rattaché au tuples, avoir l'hexaustivité réel des information (ex: le chiffre d'affaire) contenue par des tuples qui sont en faite des doublons et qui ne représente en faite qu'une seul entreprise/organisme/dossier.......
« Dernière édition: 17 Juillet 2009 à 14:37:17 par xamssam » Journalisée
xamssam
Profil challenge

Classement : 41331/55019

Néophyte
*
Hors ligne Hors ligne
Messages: 5


Voir le profil
« #3 le: 17 Juillet 2009 à 14:00:08 »

j'ai dit que je ne savait pas programmer pas que je ne voulait pas apprendre

ok message reçus je vais me débrouiller tout seul
Journalisée
xamssam
Profil challenge

Classement : 41331/55019

Néophyte
*
Hors ligne Hors ligne
Messages: 5


Voir le profil
« #4 le: 17 Juillet 2009 à 14:53:36 »

primo: tu reste poli on a pas élevé les cochons ensemble

deusio: "Ce que j'ai dis ne veux pas dire que personne ne va t'aider"
nannnn pas possible tes pas dieu? tu ne peux donc pas régir toutes les actions possibles des hommes???????
merci pour l'info car j'avais prévu de te prendre comme "maitre à penser"

tersio:"... surtout probablement qu'il aurait mieux à faire.J'te souhaite de trouver une âme charitable x)."

ce n'est pas parce que tu ne vois pas tout les tenant et aboutissant de ce que j'essaye de construire que c'est forcément pourri ,inintéressant et inutile (ce que tu laisses sous entendre celon moi). Mon seul but est d'apprendre et de voir l'aboutissement de mon travail

un conseil pour finir reste modeste

dsl que mon premier sujet sur ce forum se passe aussi mal
Journalisée
xamssam
Profil challenge

Classement : 41331/55019

Néophyte
*
Hors ligne Hors ligne
Messages: 5


Voir le profil
« #5 le: 17 Juillet 2009 à 17:16:58 »

si tu veut, débattre ne m'interresse pas. Je ne suis pas la pour sa.

y a t'il quelqu'un que ce projet interresse ?
Journalisée
the lsd
Administrateur

Profil challenge

Classement : 183/55019

Membre Héroïque
*****
Hors ligne Hors ligne
Messages: 3098

poulping for fun & profit


Voir le profil WWW
« #6 le: 17 Juillet 2009 à 18:32:46 »

Pas le bon endroit pour poster, je déplace dans la bonne catégorie.

A mon avis, si tu demandes de l'aide, tu ne devrais pas hausser le ton, surtout si c'est un premier post, surtout que Faerasgar n'a, à mon avis, pas été injurieux ou méchant, bref...

Enjoy

The lsd
Journalisée

Newbie Contest Staff :
The lsd - Th3_l5D (IRC)
Statut :
Administrateur
Citation :
Cartésien désabusé : je pense, donc je suis, mais je m'en fous !
Pages: [1]
  Imprimer  
 
Aller à: