Les posteurs les plus actifs de la semaine
Eric Wajnberg
Donnèes aberrantes Vote_lcapDonnèes aberrantes Voting_barDonnèes aberrantes Vote_rcap 
Felhaus
Donnèes aberrantes Vote_lcapDonnèes aberrantes Voting_barDonnèes aberrantes Vote_rcap 
gg
Donnèes aberrantes Vote_lcapDonnèes aberrantes Voting_barDonnèes aberrantes Vote_rcap 
zezima
Donnèes aberrantes Vote_lcapDonnèes aberrantes Voting_barDonnèes aberrantes Vote_rcap 
c@ssoulet
Donnèes aberrantes Vote_lcapDonnèes aberrantes Voting_barDonnèes aberrantes Vote_rcap 
lazof
Donnèes aberrantes Vote_lcapDonnèes aberrantes Voting_barDonnèes aberrantes Vote_rcap 
Alex83
Donnèes aberrantes Vote_lcapDonnèes aberrantes Voting_barDonnèes aberrantes Vote_rcap 
davidpes85
Donnèes aberrantes Vote_lcapDonnèes aberrantes Voting_barDonnèes aberrantes Vote_rcap 
Volivoile
Donnèes aberrantes Vote_lcapDonnèes aberrantes Voting_barDonnèes aberrantes Vote_rcap 
Theo12345
Donnèes aberrantes Vote_lcapDonnèes aberrantes Voting_barDonnèes aberrantes Vote_rcap 


Donnèes aberrantes

Aller en bas

Donnèes aberrantes Empty Donnèes aberrantes

Message par parvn le Sam 8 Fév 2014 - 0:44

Bonjour à tous,
J'ai un problème qui est le suivant: j'ai une grande masse de données, plus de 60000 individus qui ont répondu à plus de 10 variables parmi ces variables il y'a le sexe qui prend deux modalités M ou F, mais parmi les individus certain ont répondu autrement soit par N ou autre chose. j'aimerais donc attribuer  la modalité M ou F de manière aléatoire à ces individus qui ont répondu autrement que M ou F sur la variable sexe.
Je travail sur SAS.

Merci d'avance.

parvn

Nombre de messages : 13
Date d'inscription : 20/01/2010

Revenir en haut Aller en bas

Donnèes aberrantes Empty Re: Donnèes aberrantes

Message par niaboc le Sam 8 Fév 2014 - 11:45

Bonjour,

tu pourrais te créer une variable aléatoire qui suit une loi normale pour chacune de tes lignes. Ensuite en fonction du signe de cette variable aléatoire, tu remplaces tes valeurs aberrantes par "M" ou "F".

Code:
data ta_table;
    set ta_table;
    loi_normale=rannor(1);
run;

data ta_table (drop=loi_normale);
    set ta_table;
    array reponse [liste de tes variables de réponse];
    do over reponse;
          if reponse not in ("M","F") and loi_normale>0 then reponse="M";
          if reponse not in("M","F") and loi_normale<=0 then reponse="F";
    end;
run;

Je n'ai pas testé le code, dis-moi si ça fonctionne!

Niaboc
niaboc
niaboc

Nombre de messages : 971
Age : 33
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

Donnèes aberrantes Empty Re: Donnèes aberrantes

Message par parvn le Sam 8 Fév 2014 - 15:25

Je l'ai un peu modifié pour mieux l'adapter à ma situation et ça fonctionne correctement.
Merci Niaboc !!

parvn

Nombre de messages : 13
Date d'inscription : 20/01/2010

Revenir en haut Aller en bas

Donnèes aberrantes Empty Re: Donnèes aberrantes

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut


 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum