Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Comparaison Pearson - Spearman
4 participants
Page 1 sur 1
Comparaison Pearson - Spearman
Bonsoir,
J'ai effectué des corrélations entre 2 variables. Avant cela, j'ai vérifié si les variables étaient distribuées normalement. Il s'est avéré quelques fois que même en enlevant des valeurs extrêmes/aberrantes, les variables étaient encore un peu asymétriques ou alors l'histogramme un peu bizarre. Donc, comme il était difficile de dire si ces variables étaient distribuées "normalement", j'ai comparé les corrélations de Pearson et Spearman, pour voir si elles différaient. Cela dit, je me demandais s'il fallait enlever ou pas les valeurs extrêmes avant de comparer ces deux tests, sachant que Pearson ne doit pas en avoir et que ce n'est pas une pré-requis pour Spearman...?
Merci d'avance pour vos réponses.
J'ai effectué des corrélations entre 2 variables. Avant cela, j'ai vérifié si les variables étaient distribuées normalement. Il s'est avéré quelques fois que même en enlevant des valeurs extrêmes/aberrantes, les variables étaient encore un peu asymétriques ou alors l'histogramme un peu bizarre. Donc, comme il était difficile de dire si ces variables étaient distribuées "normalement", j'ai comparé les corrélations de Pearson et Spearman, pour voir si elles différaient. Cela dit, je me demandais s'il fallait enlever ou pas les valeurs extrêmes avant de comparer ces deux tests, sachant que Pearson ne doit pas en avoir et que ce n'est pas une pré-requis pour Spearman...?
Merci d'avance pour vos réponses.
Cl3my- Nombre de messages : 2
Date d'inscription : 17/08/2014
Re: Comparaison Pearson - Spearman
Bonjour.
Tu sembles avoir des informations fausses sur la corrélation :
* "j'ai vérifié si les variables étaient distribuées normalement" Pour une corrélation, il n'y a aucune raison que les variables soient gaussiennes. D'ailleurs dans de nombreux cas, c'est impossible, par exemple quand on étudie une variation temporelle en mesurant jour après jour : la variable jour est non gaussienne par définition.
* même en enlevant des valeurs extrêmes/aberrantes" Attention, si les valeurs aberrantes sont à éliminer, les valeurs extrêmes font bien partie de la série statistique. Et les enlever fausse la suite.
* "Pearson ne doit pas en avoir" C'est un peu plus compliqué que cela, simplement, le calcul peut perdre de son utilité si un des points du nuage est très éloigné des autres.
* Enfin il faut savoir qu'on ne mesure pas du tout la même chose avec ces deux coefficients : le coefficient de Pearson mesure le degré d'alignement du nuage de points (donc un nuage de forme "tordue" aura un coefficient faible); celui de Spearman mesure la façon dont une variable augmente quand l'autre augmente.
Donc tu es en train de calculer, mais tu ne sembles pas trop savoir quoi ou pourquoi. C'est pourtant la première chose à savoir, non ?
Il est très rare que la comparaison des deux coefficients soit vraiment utile.
Cordialement.
Tu sembles avoir des informations fausses sur la corrélation :
* "j'ai vérifié si les variables étaient distribuées normalement" Pour une corrélation, il n'y a aucune raison que les variables soient gaussiennes. D'ailleurs dans de nombreux cas, c'est impossible, par exemple quand on étudie une variation temporelle en mesurant jour après jour : la variable jour est non gaussienne par définition.
* même en enlevant des valeurs extrêmes/aberrantes" Attention, si les valeurs aberrantes sont à éliminer, les valeurs extrêmes font bien partie de la série statistique. Et les enlever fausse la suite.
* "Pearson ne doit pas en avoir" C'est un peu plus compliqué que cela, simplement, le calcul peut perdre de son utilité si un des points du nuage est très éloigné des autres.
* Enfin il faut savoir qu'on ne mesure pas du tout la même chose avec ces deux coefficients : le coefficient de Pearson mesure le degré d'alignement du nuage de points (donc un nuage de forme "tordue" aura un coefficient faible); celui de Spearman mesure la façon dont une variable augmente quand l'autre augmente.
Donc tu es en train de calculer, mais tu ne sembles pas trop savoir quoi ou pourquoi. C'est pourtant la première chose à savoir, non ?
Il est très rare que la comparaison des deux coefficients soit vraiment utile.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Comparaison Pearson - Spearman
Merci pour ta réponse!
C'est bizarre, j'ai toujours appris que pour utiliser une corrélation de Pearson, il fallait que les deux variables suivent une distribution normale (indices de voussures, asymétrie, histogramme, boxplot). Et si ce n'était pas le cas, il fallait utiliser le test non paramétrique, Spearman. Je vais prendre en considération ton commentaire et ne vais pas exclure de valeurs extrêmes.
Par contre, je sais très bien ce que je compte calculer et pourquoi. Je veux corréler deux moyennes.
C'est bizarre, j'ai toujours appris que pour utiliser une corrélation de Pearson, il fallait que les deux variables suivent une distribution normale (indices de voussures, asymétrie, histogramme, boxplot). Et si ce n'était pas le cas, il fallait utiliser le test non paramétrique, Spearman. Je vais prendre en considération ton commentaire et ne vais pas exclure de valeurs extrêmes.
Par contre, je sais très bien ce que je compte calculer et pourquoi. Je veux corréler deux moyennes.
Cl3my- Nombre de messages : 2
Date d'inscription : 17/08/2014
Re: Comparaison Pearson - Spearman
Bonjour,
Justement non, on ne correle pas des moyennes (puisqu'il s'agit de deux estimations ponctuelles) mais on peut calculer un coefficient de correlation sur deux distributions. En plus, Spearman est un estimateur non parametrique donc par definition il ne peut pas utiliser la moyenne comme parametre... Ensuite, on n'enleve jamais les valeurs extremes puisque ce sont des valeurs plausibles. Si on les enleve, l'echantillon n'est plus representatif de quoi que ce soit.
Par contre, comme a dit gg c'est impossible de comparer les deux coefficients puisqu'ils ne mesurent pas la meme chose.
Ayana
Justement non, on ne correle pas des moyennes (puisqu'il s'agit de deux estimations ponctuelles) mais on peut calculer un coefficient de correlation sur deux distributions. En plus, Spearman est un estimateur non parametrique donc par definition il ne peut pas utiliser la moyenne comme parametre... Ensuite, on n'enleve jamais les valeurs extremes puisque ce sont des valeurs plausibles. Si on les enleve, l'echantillon n'est plus representatif de quoi que ce soit.
Par contre, comme a dit gg c'est impossible de comparer les deux coefficients puisqu'ils ne mesurent pas la meme chose.
Ayana
Ayana- Nombre de messages : 550
Localisation : Londres
Date d'inscription : 18/08/2009
Re: Comparaison Pearson - Spearman
Ce dont on peut espérer que ce soit gaussien, c'est les résidus de la régression (différences entre valeur espérée et valeur véritable). Et encore ...
Si on se contente d'ajuster les données à un modèle linéaire, donc faire des statistiques descriptives, la méthode des moindres carrés fonctionne bien, sans aucune exigence sur les données ni même les résidus.
Cordialement.
Si on se contente d'ajuster les données à un modèle linéaire, donc faire des statistiques descriptives, la méthode des moindres carrés fonctionne bien, sans aucune exigence sur les données ni même les résidus.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Comparaison Pearson - Spearman
Cl3my a écrit:pour utiliser une corrélation de Pearson, il fallait que les deux variables suivent une distribution normale (indices de voussures, asymétrie, histogramme, boxplot). Et si ce n'était pas le cas, il fallait utiliser le test non paramétrique, Spearman.
Non, c'est simplement qu'en cas de distribution normale, le coefficient de Pearson décrit complètement le lien qui existe entre les deux séries.
Niaboc
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Sujets similaires
» Corelation de pearson ou spearman
» Corrélation de Spearman ou Pearson ?
» coefficient de Pearson ou spearman ?
» regression linéaire ou corrélation de pearson
» Comparaison coefficient de corrélation de Spearman
» Corrélation de Spearman ou Pearson ?
» coefficient de Pearson ou spearman ?
» regression linéaire ou corrélation de pearson
» Comparaison coefficient de corrélation de Spearman
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum