Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Standardisation
2 participants
Page 1 sur 1
Standardisation
Bonsoir à toutes et à tous,
Je remercie d'avance toutes les personnes reliées de près ou de loin à ce forum d'entraide.
J'ai pas mal hésité avant de poster ma question car c'est pas vraiment dans les règles de l'art sachant que je ne suis pas spécialiste en statistiques et il est fort probable que ma question fasse partie d'une démarche globale peu rigoureuse.
J'ai réalisé une standardisation des scores d'une variable avec une distribution non gaussienne, j'ai donc une série de scores Z. Est-ce que la distribution des scores Z est gaussienne ? (D'après moi oui ).
Par la suite j'ai donc réalisé un test statistique entre deux variables que sont ce Z score et une variable qualitative binaire (Test de student). Ce dernier test deviendrait donc faux si la distibution n'est pas normale (Test de Mann whitney).
Mon questionnement vient du fait que j'ai déjà lu que: "standardiser les scores d'une variable à distribution non gaussienne ne permet pas de dire que la distribution des scores standardisés (Z score) soit normale."
Merci beaucoup de votre aide
Je remercie d'avance toutes les personnes reliées de près ou de loin à ce forum d'entraide.
J'ai pas mal hésité avant de poster ma question car c'est pas vraiment dans les règles de l'art sachant que je ne suis pas spécialiste en statistiques et il est fort probable que ma question fasse partie d'une démarche globale peu rigoureuse.
J'ai réalisé une standardisation des scores d'une variable avec une distribution non gaussienne, j'ai donc une série de scores Z. Est-ce que la distribution des scores Z est gaussienne ? (D'après moi oui ).
Par la suite j'ai donc réalisé un test statistique entre deux variables que sont ce Z score et une variable qualitative binaire (Test de student). Ce dernier test deviendrait donc faux si la distibution n'est pas normale (Test de Mann whitney).
Mon questionnement vient du fait que j'ai déjà lu que: "standardiser les scores d'une variable à distribution non gaussienne ne permet pas de dire que la distribution des scores standardisés (Z score) soit normale."
Merci beaucoup de votre aide
Raymond- Nombre de messages : 6
Date d'inscription : 10/11/2008
Re: Standardisation
Le problème est qu'effectivement ce n'est pas parce que tu standardises une variable qu'elle devient forcément gaussienne, il te faut à la suite de cette standardisation voir si la distribution de cette nouvelle variable est devenue gaussienne ou non.
Tu peux vérifier ça par des tests stats comme le test de kolmogorov ou le test de shapiro (il en existe des wagons !), ou encore via une représentation graphique la droite de Henry (graphique quantile quantile qqnorm).
micros
Tu peux vérifier ça par des tests stats comme le test de kolmogorov ou le test de shapiro (il en existe des wagons !), ou encore via une représentation graphique la droite de Henry (graphique quantile quantile qqnorm).
micros
Invité- Invité
Re: Standardisation
Merci beaucoup de votre réponse
J'ai donc bien réalisé le test de Shapiro-Wilk et le résultat est que le Z score possède une distribution normale. Stata a également réalisé une courbe de distribution avec un aspect en cloche (kdensity).Donc à partir de là je peux réaliser mon test de student avec une variable qualitative binaire ?
Mais un Z score ne possède-t-il pas toujours une distribution normale car la moyenne est de O et l'écart type de 1 ? (désolé si ça veut rien dire)
Existe t-il un exemple de standardisation (peut-on dire normalisation) ou le score Z obtenu n'ait pas de distribution normale ?
Merci beaucoup.
J'ai donc bien réalisé le test de Shapiro-Wilk et le résultat est que le Z score possède une distribution normale. Stata a également réalisé une courbe de distribution avec un aspect en cloche (kdensity).Donc à partir de là je peux réaliser mon test de student avec une variable qualitative binaire ?
Mais un Z score ne possède-t-il pas toujours une distribution normale car la moyenne est de O et l'écart type de 1 ? (désolé si ça veut rien dire)
Existe t-il un exemple de standardisation (peut-on dire normalisation) ou le score Z obtenu n'ait pas de distribution normale ?
Merci beaucoup.
Raymond- Nombre de messages : 6
Date d'inscription : 10/11/2008
Re: Standardisation
Mais un Z score ne possède-t-il pas toujours une distribution normale car la moyenne est de O et l'écart type de 1 ? (désolé si ça veut rien dire)
Non. moyenne et écart type sont tous les deux très sensibles aux valeurs extrême. Si par exemple on est dans le cas d'une distribution avec une queue de distribution très étendue par exemple de ce style :
Alors même une normalisation ne changera pas le fait qu'on ait des valeurs extrêmes. La normalité ne se borne pas à une moyenne et un écart type, ill faut que toutes les valeurs suivent à peu près la loi de distribution (Normale) qui elle, effectivement, dépend de 2 paramètres : moyenne et écart type.
Donc il n'y a pas d'exemple de standardisation à fournir, cela dépend très clairement de tes données.
Donc à partir de là je peux réaliser mon test de student avec une variable qualitative binaire ?
euh c'est à dire ???
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Standardisation
Je pense que j'ai compris !!
"euh c'est à dire ???"
En fait je réalise un test d'association entre le z score de ma variable (dont le test de shapiro a montré que la distribution est normale) et une variable qualitative binaire: donc j'ai réalisé un test de student. (test entre une variable quantitative à distribution normale et une variable qualitative binaire).
"euh c'est à dire ???"
En fait je réalise un test d'association entre le z score de ma variable (dont le test de shapiro a montré que la distribution est normale) et une variable qualitative binaire: donc j'ai réalisé un test de student. (test entre une variable quantitative à distribution normale et une variable qualitative binaire).
Raymond- Nombre de messages : 6
Date d'inscription : 10/11/2008
Re: Standardisation
Là je crois qu'il y a un soucis...
C'est quoi ton hypothèse de travail ? Que veux tu tester exactement ?
Cela n'a pas de sens de tester l'adéquation entre une variable normale et une variable qui suit une loi binomiale. Dans cette dernière, la variance des observations augmente avec l'observation ce qui va compètement à l'inverse de la variable normale pour laquelle on suppose une variance plus ou moins constante. Tu ne peux pas utiliser un test de student pour comparer deux distribution issues de deux lois complètement différentes. Ce dernier permet de savoir si deux échantillons sont issus de la même population.
Si tu veux expliquer ta variable normale par ta variable binaire, c'est encore autre chose qui peut effectivement être testé par le test de student (comparaison des moyennes du groupe 0 et du group 1)
voilà
nik
C'est quoi ton hypothèse de travail ? Que veux tu tester exactement ?
Cela n'a pas de sens de tester l'adéquation entre une variable normale et une variable qui suit une loi binomiale. Dans cette dernière, la variance des observations augmente avec l'observation ce qui va compètement à l'inverse de la variable normale pour laquelle on suppose une variance plus ou moins constante. Tu ne peux pas utiliser un test de student pour comparer deux distribution issues de deux lois complètement différentes. Ce dernier permet de savoir si deux échantillons sont issus de la même population.
Si tu veux expliquer ta variable normale par ta variable binaire, c'est encore autre chose qui peut effectivement être testé par le test de student (comparaison des moyennes du groupe 0 et du group 1)
voilà
nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Standardisation
En fait je n'ai fait que tester l'existence d'une association entre les Z scores de l'indice de masse corporelle avec une variable qualitative binaire: maladie (1) ou absence de maladie (0).
Je crois donc que c'est la deuxième partie de ton message:
Je crois donc que c'est la deuxième partie de ton message:
Merci beaucoup Nick et désolé si je me suis mal exprimé.Si tu veux expliquer ta variable normale par ta variable binaire, c'est encore autre chose qui peut effectivement être testé par le test de
student (comparaison des moyennes du groupe 0 et du group 1)
Raymond- Nombre de messages : 6
Date d'inscription : 10/11/2008
Re: Standardisation
C'est le mot association qui est mal utilisé
Ton hypothèse nulle : les deux groupes ont même moyenne, donc ils appartiennent à la même population.
Hypothèse alternative : les moyennes sont différentes, on rejette l'hypothèse nulle au seuil de 5 % par exemple.
il faut vérifier : la normalité, que les deux groupes sont bien indépendants (patients différents). Dernière chose mais la plus importante : tu as vu précédemment qu'un loi normale se définit par sa moyenne et son écart-type. Hors dans le test de student on ne test que les moyennes. Donc il faut s'assurer que les variances des deux groupes sont égales (homoscédasticité). Pour cela tu peux utiliser un test de bartlett ou un test de levene si les données sont normales. Un détail consiste à avoir un nombre d'individu assez grand (on dit >30) et un deséquilibre pas trop important entre ton nombre de 1 et ton nombre de 0 (idéalement il faudrait 30 individus dans chaque groupe).
Si les conditions ne sont pas respectées, il faut s'orienter vers les statistiques non paramétriques ou encore les tests de permutation.
Nik
Ton hypothèse nulle : les deux groupes ont même moyenne, donc ils appartiennent à la même population.
Hypothèse alternative : les moyennes sont différentes, on rejette l'hypothèse nulle au seuil de 5 % par exemple.
il faut vérifier : la normalité, que les deux groupes sont bien indépendants (patients différents). Dernière chose mais la plus importante : tu as vu précédemment qu'un loi normale se définit par sa moyenne et son écart-type. Hors dans le test de student on ne test que les moyennes. Donc il faut s'assurer que les variances des deux groupes sont égales (homoscédasticité). Pour cela tu peux utiliser un test de bartlett ou un test de levene si les données sont normales. Un détail consiste à avoir un nombre d'individu assez grand (on dit >30) et un deséquilibre pas trop important entre ton nombre de 1 et ton nombre de 0 (idéalement il faudrait 30 individus dans chaque groupe).
Si les conditions ne sont pas respectées, il faut s'orienter vers les statistiques non paramétriques ou encore les tests de permutation.
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Standardisation
En effet, merci beaucoup de ton rappel Nik, car j'avais pas vérifié l'égalité des variances (ce que j'ai fait par la suite avec le test de Bartlett). Donc je peux utiliser le test paramétrique de student.
Merci de votre patience
Merci de votre patience
Raymond- Nombre de messages : 6
Date d'inscription : 10/11/2008
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum