Les posteurs les plus actifs de la semaine


Transformation de normalisation de données en pourcentage

Poster un nouveau sujet   Répondre au sujet

Aller en bas

Transformation de normalisation de données en pourcentage

Message par JessCTJ le Mar 13 Mai 2014 - 9:19

Bonjour  

Je travaille actuellement sur un jeu de données en pourcentage. Pour les tests que je souhaite utiliser (anova à 2 facteurs et modèle linéaire), j'ai besoin que les données suivent une loi normale.

J'ai tenté une transformation des données avec la racine, le log mais ça ne fonctionne pas.

J'ai également tenté d'utiliser le arcsin racine carré, mais ne connaissant pas la commande sur R, je l'ai d'abord calculé sur excel et rentrer le nouveau jeu de données sur R, mais toujours rien. Ca ne suit pas une loi normale.

J'arrive à court d'idées.

Auriez la commande de transformation arc-sinus de la racine carrée ?
Ou une autre idée de transformation ?

Je vous remercie d'avance.

JessCTJ

Nombre de messages : 4
Date d'inscription : 13/05/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Transformation de normalisation de données en pourcentage

Message par Nik le Mar 13 Mai 2014 - 13:20

Bonjour
j'ai besoin que les données suivent une loi normale.
Non.
Remarque maintes et maintes fois répétée sur ce forum, ce sont les erreurs et donc leurs estimations, les résidus, qui doivent suivre une loi normale. Donc les données doivent suivre une loi normale conditionnellement aux variables explicatives.
De plus, si tes données sont des pourcentage il est peu probable que le lien moyenne-variance soit constant (comme toutes les variables bornées). Donc le modèle linéaire n'est sans doute pas applicable, et il faudra passer par un glm.

La fonction arc-sinus sous R c'est : asin().

La transformation asin(sqrt(x)) des données de pourcentage ne fonctionne réellement que si les effectifs pour chaque pourcentage sont à peu près constants. On suppose donc que tes pourcentages proviennent de la réalisation d'une binomiale(n,p) et on s'oriente sur un glm binomial. S'il s'agit de "faux" pourcentages, par exemple une variable continue standardisée dans [0, 1] alors on est plutôt sur un modèle à distribution beta où là ce n'est plus l'erreur qui doit suivre une distribution particulière mais bien la réponse.

Pour finir, la transformation des données est rarement souhaitable car on perd beaucoup en interprétabilité on ne sait pas trop ce que l'on obtient en terme de variance.

Nik

Nik

Nombre de messages : 1566
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Transformation de normalisation de données en pourcentage

Message par JessCTJ le Mer 14 Mai 2014 - 7:10

Merci Nik ! Ta réponse m'aide pas mal !

Jess

JessCTJ

Nombre de messages : 4
Date d'inscription : 13/05/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Transformation de normalisation de données en pourcentage

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

Poster un nouveau sujet   Répondre au sujet
 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum