Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Transformation de normalisation de données en pourcentage
2 participants
Page 1 sur 1
Transformation de normalisation de données en pourcentage
Bonjour
Je travaille actuellement sur un jeu de données en pourcentage. Pour les tests que je souhaite utiliser (anova à 2 facteurs et modèle linéaire), j'ai besoin que les données suivent une loi normale.
J'ai tenté une transformation des données avec la racine, le log mais ça ne fonctionne pas.
J'ai également tenté d'utiliser le arcsin racine carré, mais ne connaissant pas la commande sur R, je l'ai d'abord calculé sur excel et rentrer le nouveau jeu de données sur R, mais toujours rien. Ca ne suit pas une loi normale.
J'arrive à court d'idées.
Auriez la commande de transformation arc-sinus de la racine carrée ?
Ou une autre idée de transformation ?
Je vous remercie d'avance.
Je travaille actuellement sur un jeu de données en pourcentage. Pour les tests que je souhaite utiliser (anova à 2 facteurs et modèle linéaire), j'ai besoin que les données suivent une loi normale.
J'ai tenté une transformation des données avec la racine, le log mais ça ne fonctionne pas.
J'ai également tenté d'utiliser le arcsin racine carré, mais ne connaissant pas la commande sur R, je l'ai d'abord calculé sur excel et rentrer le nouveau jeu de données sur R, mais toujours rien. Ca ne suit pas une loi normale.
J'arrive à court d'idées.
Auriez la commande de transformation arc-sinus de la racine carrée ?
Ou une autre idée de transformation ?
Je vous remercie d'avance.
JessCTJ- Nombre de messages : 4
Date d'inscription : 13/05/2014
Re: Transformation de normalisation de données en pourcentage
Bonjour
Remarque maintes et maintes fois répétée sur ce forum, ce sont les erreurs et donc leurs estimations, les résidus, qui doivent suivre une loi normale. Donc les données doivent suivre une loi normale conditionnellement aux variables explicatives.
De plus, si tes données sont des pourcentage il est peu probable que le lien moyenne-variance soit constant (comme toutes les variables bornées). Donc le modèle linéaire n'est sans doute pas applicable, et il faudra passer par un glm.
La fonction arc-sinus sous R c'est : asin().
La transformation asin(sqrt(x)) des données de pourcentage ne fonctionne réellement que si les effectifs pour chaque pourcentage sont à peu près constants. On suppose donc que tes pourcentages proviennent de la réalisation d'une binomiale(n,p) et on s'oriente sur un glm binomial. S'il s'agit de "faux" pourcentages, par exemple une variable continue standardisée dans [0, 1] alors on est plutôt sur un modèle à distribution beta où là ce n'est plus l'erreur qui doit suivre une distribution particulière mais bien la réponse.
Pour finir, la transformation des données est rarement souhaitable car on perd beaucoup en interprétabilité on ne sait pas trop ce que l'on obtient en terme de variance.
Nik
Non.j'ai besoin que les données suivent une loi normale.
Remarque maintes et maintes fois répétée sur ce forum, ce sont les erreurs et donc leurs estimations, les résidus, qui doivent suivre une loi normale. Donc les données doivent suivre une loi normale conditionnellement aux variables explicatives.
De plus, si tes données sont des pourcentage il est peu probable que le lien moyenne-variance soit constant (comme toutes les variables bornées). Donc le modèle linéaire n'est sans doute pas applicable, et il faudra passer par un glm.
La fonction arc-sinus sous R c'est : asin().
La transformation asin(sqrt(x)) des données de pourcentage ne fonctionne réellement que si les effectifs pour chaque pourcentage sont à peu près constants. On suppose donc que tes pourcentages proviennent de la réalisation d'une binomiale(n,p) et on s'oriente sur un glm binomial. S'il s'agit de "faux" pourcentages, par exemple une variable continue standardisée dans [0, 1] alors on est plutôt sur un modèle à distribution beta où là ce n'est plus l'erreur qui doit suivre une distribution particulière mais bien la réponse.
Pour finir, la transformation des données est rarement souhaitable car on perd beaucoup en interprétabilité on ne sait pas trop ce que l'on obtient en terme de variance.
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Transformation de normalisation de données en pourcentage
Merci Nik ! Ta réponse m'aide pas mal !
Jess
Jess
JessCTJ- Nombre de messages : 4
Date d'inscription : 13/05/2014
Sujets similaires
» Problème normalisation données
» Adéquation à une loi normale et normalisation des données.
» Transformation de données SIG
» Manipulation et transformation des données
» Choix de transformation de données
» Adéquation à une loi normale et normalisation des données.
» Transformation de données SIG
» Manipulation et transformation des données
» Choix de transformation de données
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum