Les posteurs les plus actifs de la semaine
Eric Wajnberg
Donnèes aberrantes Vote_lcapDonnèes aberrantes Voting_barDonnèes aberrantes Vote_rcap 
Volivoile
Donnèes aberrantes Vote_lcapDonnèes aberrantes Voting_barDonnèes aberrantes Vote_rcap 
Fred_44
Donnèes aberrantes Vote_lcapDonnèes aberrantes Voting_barDonnèes aberrantes Vote_rcap 
zezima
Donnèes aberrantes Vote_lcapDonnèes aberrantes Voting_barDonnèes aberrantes Vote_rcap 
Ayana
Donnèes aberrantes Vote_lcapDonnèes aberrantes Voting_barDonnèes aberrantes Vote_rcap 
gg
Donnèes aberrantes Vote_lcapDonnèes aberrantes Voting_barDonnèes aberrantes Vote_rcap 
ayoubas01
Donnèes aberrantes Vote_lcapDonnèes aberrantes Voting_barDonnèes aberrantes Vote_rcap 
Philoche63
Donnèes aberrantes Vote_lcapDonnèes aberrantes Voting_barDonnèes aberrantes Vote_rcap 
niaboc
Donnèes aberrantes Vote_lcapDonnèes aberrantes Voting_barDonnèes aberrantes Vote_rcap 
inconnu25545
Donnèes aberrantes Vote_lcapDonnèes aberrantes Voting_barDonnèes aberrantes Vote_rcap 


Donnèes aberrantes

Aller en bas

Donnèes aberrantes Empty Donnèes aberrantes

Message par parvn le Sam 8 Fév 2014 - 0:44

Bonjour à tous,
J'ai un problème qui est le suivant: j'ai une grande masse de données, plus de 60000 individus qui ont répondu à plus de 10 variables parmi ces variables il y'a le sexe qui prend deux modalités M ou F, mais parmi les individus certain ont répondu autrement soit par N ou autre chose. j'aimerais donc attribuer  la modalité M ou F de manière aléatoire à ces individus qui ont répondu autrement que M ou F sur la variable sexe.
Je travail sur SAS.

Merci d'avance.

parvn

Nombre de messages : 13
Date d'inscription : 20/01/2010

Revenir en haut Aller en bas

Donnèes aberrantes Empty Re: Donnèes aberrantes

Message par niaboc le Sam 8 Fév 2014 - 11:45

Bonjour,

tu pourrais te créer une variable aléatoire qui suit une loi normale pour chacune de tes lignes. Ensuite en fonction du signe de cette variable aléatoire, tu remplaces tes valeurs aberrantes par "M" ou "F".

Code:
data ta_table;
    set ta_table;
    loi_normale=rannor(1);
run;

data ta_table (drop=loi_normale);
    set ta_table;
    array reponse [liste de tes variables de réponse];
    do over reponse;
          if reponse not in ("M","F") and loi_normale>0 then reponse="M";
          if reponse not in("M","F") and loi_normale<=0 then reponse="F";
    end;
run;

Je n'ai pas testé le code, dis-moi si ça fonctionne!

Niaboc
niaboc
niaboc

Nombre de messages : 970
Age : 32
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

Donnèes aberrantes Empty Re: Donnèes aberrantes

Message par parvn le Sam 8 Fév 2014 - 15:25

Je l'ai un peu modifié pour mieux l'adapter à ma situation et ça fonctionne correctement.
Merci Niaboc !!

parvn

Nombre de messages : 13
Date d'inscription : 20/01/2010

Revenir en haut Aller en bas

Donnèes aberrantes Empty Re: Donnèes aberrantes

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut


 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum