Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

-25%
Le deal à ne pas rater :
PC Portable Gamer 16,1” HP Victus 16 – 16 Go /512 Go
749.99 € 999.99 €
Voir le deal

Transformation de normalisation de données en pourcentage

2 participants

Aller en bas

Transformation de normalisation de données en pourcentage  Empty Transformation de normalisation de données en pourcentage

Message par JessCTJ Mar 13 Mai 2014 - 9:19

Bonjour  

Je travaille actuellement sur un jeu de données en pourcentage. Pour les tests que je souhaite utiliser (anova à 2 facteurs et modèle linéaire), j'ai besoin que les données suivent une loi normale.

J'ai tenté une transformation des données avec la racine, le log mais ça ne fonctionne pas.

J'ai également tenté d'utiliser le arcsin racine carré, mais ne connaissant pas la commande sur R, je l'ai d'abord calculé sur excel et rentrer le nouveau jeu de données sur R, mais toujours rien. Ca ne suit pas une loi normale.

J'arrive à court d'idées.

Auriez la commande de transformation arc-sinus de la racine carrée ?
Ou une autre idée de transformation ?

Je vous remercie d'avance.

JessCTJ

Nombre de messages : 4
Date d'inscription : 13/05/2014

Revenir en haut Aller en bas

Transformation de normalisation de données en pourcentage  Empty Re: Transformation de normalisation de données en pourcentage

Message par Nik Mar 13 Mai 2014 - 13:20

Bonjour
j'ai besoin que les données suivent une loi normale.
Non.
Remarque maintes et maintes fois répétée sur ce forum, ce sont les erreurs et donc leurs estimations, les résidus, qui doivent suivre une loi normale. Donc les données doivent suivre une loi normale conditionnellement aux variables explicatives.
De plus, si tes données sont des pourcentage il est peu probable que le lien moyenne-variance soit constant (comme toutes les variables bornées). Donc le modèle linéaire n'est sans doute pas applicable, et il faudra passer par un glm.

La fonction arc-sinus sous R c'est : asin().

La transformation asin(sqrt(x)) des données de pourcentage ne fonctionne réellement que si les effectifs pour chaque pourcentage sont à peu près constants. On suppose donc que tes pourcentages proviennent de la réalisation d'une binomiale(n,p) et on s'oriente sur un glm binomial. S'il s'agit de "faux" pourcentages, par exemple une variable continue standardisée dans [0, 1] alors on est plutôt sur un modèle à distribution beta où là ce n'est plus l'erreur qui doit suivre une distribution particulière mais bien la réponse.

Pour finir, la transformation des données est rarement souhaitable car on perd beaucoup en interprétabilité on ne sait pas trop ce que l'on obtient en terme de variance.

Nik

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

Transformation de normalisation de données en pourcentage  Empty Re: Transformation de normalisation de données en pourcentage

Message par JessCTJ Mer 14 Mai 2014 - 7:10

Merci Nik ! Ta réponse m'aide pas mal !

Jess

JessCTJ

Nombre de messages : 4
Date d'inscription : 13/05/2014

Revenir en haut Aller en bas

Transformation de normalisation de données en pourcentage  Empty Re: Transformation de normalisation de données en pourcentage

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum