Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
mes variables sont elles normales?
3 participants
Page 1 sur 1
mes variables sont elles normales?
Bonjour à tous!
Je bosse actuellement sur un examen de biostatistiques et je n'arrive pas à décider si je peux considerer que mes variables sont normales.
J'ai 5 variables continues.
Pour chacune d'elle j'ai contrôlé si oui ou non j'avais des outliers (box plot), j'ai observé la distribution sur un histogramme, et j'ai comparé les médianes, les moyenne et les modes.
Ensuite, j'ai appliqué un shapiro wilk à chacune.
J'ai aussi calculé les rapport skewness/ecart-type et Kurtosis/écart-type selon un article trouvé sur le net, je ne sais pas trop ce que ca vaut. D'après l'article si la valeur absolue de ces ratio est inférieure à 2 ça parle pour une distribution normale.
J'ai enfin fait des qnorm (droite de Henry), certaines de mes variables sont quasi superposées, d'autres moins, mais où est la limite?
Mon problème est que j'ai pour chacune des variables des résultats qui parlent pour et contre une distribution normale.
Quels sont les arguments les plus forts? Est ce que je fais fausse route?
Est ce qu'avec un effectif de cent patients je devrait considerer que l'hypothèse de normalité est quasi acquise?
La question suivante est de savoir si oui ou non je décide transformer certaines des variables et toute l'analyse stat qui suit en dépend, je dois vraiment faire le bon choix et je manque d'expérience..
Auriez vous quelques conseils à me donner?
Je bosse actuellement sur un examen de biostatistiques et je n'arrive pas à décider si je peux considerer que mes variables sont normales.
J'ai 5 variables continues.
Pour chacune d'elle j'ai contrôlé si oui ou non j'avais des outliers (box plot), j'ai observé la distribution sur un histogramme, et j'ai comparé les médianes, les moyenne et les modes.
Ensuite, j'ai appliqué un shapiro wilk à chacune.
J'ai aussi calculé les rapport skewness/ecart-type et Kurtosis/écart-type selon un article trouvé sur le net, je ne sais pas trop ce que ca vaut. D'après l'article si la valeur absolue de ces ratio est inférieure à 2 ça parle pour une distribution normale.
J'ai enfin fait des qnorm (droite de Henry), certaines de mes variables sont quasi superposées, d'autres moins, mais où est la limite?
Mon problème est que j'ai pour chacune des variables des résultats qui parlent pour et contre une distribution normale.
Quels sont les arguments les plus forts? Est ce que je fais fausse route?
Est ce qu'avec un effectif de cent patients je devrait considerer que l'hypothèse de normalité est quasi acquise?
La question suivante est de savoir si oui ou non je décide transformer certaines des variables et toute l'analyse stat qui suit en dépend, je dois vraiment faire le bon choix et je manque d'expérience..
Auriez vous quelques conseils à me donner?
yumeko- Nombre de messages : 9
Date d'inscription : 02/05/2010
Re: mes variables sont elles normales?
Bonjour, pour tester la normalité des données, je crois que le plus fiable est de faire un test de Kolgomorov si tu ne l'as pas déjà fait... Bon courage
liou- Nombre de messages : 25
Date d'inscription : 03/05/2010
Re: mes variables sont elles normales?
yumeko a écrit:Bonjour à tous!
Je bosse actuellement sur un examen de biostatistiques et je n'arrive pas à décider si je peux considerer que mes variables sont normales.
J'ai 5 variables continues.
Pour chacune d'elle j'ai contrôlé si oui ou non j'avais des outliers (box plot), j'ai observé la distribution sur un histogramme, et j'ai comparé les médianes, les moyenne et les modes.
Ne fait tu as fais pas mal de truc assez redondant. Le boxplot c'est bien mais ce n'est pas ce qui te diras si tes données sont normales ou non car si N est grand alors tu peux très bien observer des outliers et considérer ta distribution comme normale. Je pense que l'histogramme est plus adapté car au moins tu pourras voir si ta distribution est uni ou pluri-modale. Une fois que tu as fait tes histos comparer la moyenne et la médiane c'est pas mal parce que dans le cas d'une loi normale tu t'attends à ce que les deux soient très proches.
Oui c'est un test parmis tant d'autre, ex: Anderson–Darling normality test, Cramer–von Mises normality test, Lilliefors (Kolmogorov-Smirnov) normality test, Pearson chi–square normality test, Shapiro–Francia normality test. A priori le test le plus conservateur (qui rejette le moins l'hypothèse de normalité est Kolmogorov).yumeko a écrit:Ensuite, j'ai appliqué un shapiro wilk à chacune.
Je ne pense pas que tout ça soit très nécessaire.yumeko a écrit:J'ai aussi calculé les rapport skewness/ecart-type et Kurtosis/écart-type selon un article trouvé sur le net, je ne sais pas trop ce que ca vaut. D'après l'article si la valeur absolue de ces ratio est inférieure à 2 ça parle pour une distribution normale.
Il n'y en a pas, c'est une représentation graphique donc son interprétation est subjective. Néanmois si ton objectif est de savoir si tu peux ou non faire de la régression multiple avec ces variables, je pense que pas mal de monde ce contenterait de ces représentations. Si la plupart de tes variables sont sur la droite, et que seules les valeurs extêmes en queue de distribution s'en écarte alors on dira ok c'est normal. Ce qu'il faut c'est que ce graph ne te renvoie pas une courbe "atypique" du genreyumeko a écrit:J'ai enfin fait des qnorm (droite de Henry), certaines de mes variables sont quasi superposées, d'autres moins, mais où est la limite?
ou la clairement ça ne va pas.
yumeko a écrit:Mon problème est que j'ai pour chacune des variables des résultats qui parlent pour et contre une distribution normale.
Quels sont les arguments les plus forts? Est ce que je fais fausse route?
Est ce qu'avec un effectif de cent patients je devrait considérer que l'hypothèse de normalité est quasi acquise?
La question suivante est de savoir si oui ou non je décide transformer certaines des variables et toute l'analyse stat qui suit en dépend, je dois vraiment faire le bon choix et je manque d'expérience..
Auriez vous quelques conseils à me donner?
A la limite poste tes courbes ici et on te donnera notre avis.
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
merci!
liou a écrit:Bonjour, pour tester la normalité des données, je crois que le plus fiable est de faire un test de Kolgomorov si tu ne l'as pas déjà fait... Bon courage
Merci beaucoup pour le conseil, je vais essayer ça ce soir!
yumeko- Nombre de messages : 9
Date d'inscription : 02/05/2010
à Droopy
Et merci beaucoup pour les conseils! C'est lamentable mais je n'arrive pas à poster mes graphiques sur le forum
Je t'envoie un mp, si tu as quelques minutes....
Bonne soirée!
Je t'envoie un mp, si tu as quelques minutes....
Bonne soirée!
yumeko- Nombre de messages : 9
Date d'inscription : 02/05/2010
Re: mes variables sont elles normales?
Voilà, !!!!
J'ai finis par poster toutes mes variables, mais il y en surtout 2 qui me posent problème, qu'en dites vous????
1- Age
Pour moi, age est normale
2- Weight0 et weight 1, à transformer, non normales d'après moi
3- bmi0, d'après moi normale
4- Bmi1
Celle ci me pose problème. Les tests rejettent l’hypothèse de normalité mais à part une allure peut-être bimodale, je la trouve quand même bien sur la droite de Henry. Je pense qu’il faut quand même que je la considère comme normale.
5- totcal0 et totcal1, d'après moi non normales.[/u]
[u]6- Fatcal0 : d'après moi normale.
7-Fatcal1
Celle ci me semblait pas trop mal sur les graphiques mais les test rejettent l’hypothèse de normalité… J’aimerais pourtant la considérer normale car ces données sont pairées avec fatcal0 qui elle me semble normale.
Merci!
J'ai finis par poster toutes mes variables, mais il y en surtout 2 qui me posent problème, qu'en dites vous????
1- Age
Pour moi, age est normale
2- Weight0 et weight 1, à transformer, non normales d'après moi
3- bmi0, d'après moi normale
4- Bmi1
Celle ci me pose problème. Les tests rejettent l’hypothèse de normalité mais à part une allure peut-être bimodale, je la trouve quand même bien sur la droite de Henry. Je pense qu’il faut quand même que je la considère comme normale.
5- totcal0 et totcal1, d'après moi non normales.[/u]
[u]6- Fatcal0 : d'après moi normale.
7-Fatcal1
Celle ci me semblait pas trop mal sur les graphiques mais les test rejettent l’hypothèse de normalité… J’aimerais pourtant la considérer normale car ces données sont pairées avec fatcal0 qui elle me semble normale.
Merci!
yumeko- Nombre de messages : 9
Date d'inscription : 02/05/2010
Re: mes variables sont elles normales?
pour info, j'ai trouvé, en décomposant certaines de mes variables, et en appliquant une transformation sur weight1 (lnskew0 dans stata).
merci!
merci!
yumeko- Nombre de messages : 9
Date d'inscription : 02/05/2010
Sujets similaires
» Les différences sont elles significatives?
» Données pas normales
» Les valeurs manquantes, faut-elles les considérer ?
» ecart type de somme de lois normales
» Corrélation et Probabilité dans le cas de lois normales
» Données pas normales
» Les valeurs manquantes, faut-elles les considérer ?
» ecart type de somme de lois normales
» Corrélation et Probabilité dans le cas de lois normales
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum