Les posteurs les plus actifs de la semaine
ayoubas01
comparaison - Comparaison Pearson - Spearman Vote_lcapcomparaison - Comparaison Pearson - Spearman Voting_barcomparaison - Comparaison Pearson - Spearman Vote_rcap 
zezima
comparaison - Comparaison Pearson - Spearman Vote_lcapcomparaison - Comparaison Pearson - Spearman Voting_barcomparaison - Comparaison Pearson - Spearman Vote_rcap 


Comparaison Pearson - Spearman

Aller en bas

comparaison - Comparaison Pearson - Spearman Empty Comparaison Pearson - Spearman

Message par Cl3my le Dim 17 Aoû 2014 - 22:12

Bonsoir,

J'ai effectué des corrélations entre 2 variables. Avant cela, j'ai vérifié si les variables étaient distribuées normalement. Il s'est avéré quelques fois que même en enlevant des valeurs extrêmes/aberrantes, les variables étaient encore un peu asymétriques ou alors l'histogramme un peu bizarre. Donc, comme il était difficile de dire si ces variables étaient distribuées "normalement", j'ai comparé les corrélations de Pearson et Spearman, pour voir si elles différaient. Cela dit, je me demandais s'il fallait enlever ou pas les valeurs extrêmes avant de comparer ces deux tests, sachant que Pearson ne doit pas en avoir et que ce n'est pas une pré-requis pour Spearman...?

Merci d'avance pour vos réponses.

Cl3my

Nombre de messages : 2
Date d'inscription : 17/08/2014

Revenir en haut Aller en bas

comparaison - Comparaison Pearson - Spearman Empty Re: Comparaison Pearson - Spearman

Message par gg le Lun 18 Aoû 2014 - 8:32

Bonjour.

Tu sembles avoir des informations fausses sur la corrélation :
* "j'ai vérifié si les variables étaient distribuées normalement" Pour une corrélation, il n'y a aucune raison que les variables soient gaussiennes. D'ailleurs dans de nombreux cas, c'est impossible, par exemple quand on étudie une variation temporelle en mesurant jour après jour : la variable jour est non gaussienne par définition.
* même en enlevant des valeurs extrêmes/aberrantes" Attention, si les valeurs aberrantes sont à éliminer, les valeurs extrêmes font bien partie de la série statistique. Et les enlever fausse la suite.
* "Pearson ne doit pas en avoir" C'est un peu plus compliqué que cela, simplement, le calcul peut perdre de son utilité si un des points du nuage est très éloigné des autres.
* Enfin il faut savoir qu'on ne mesure pas du tout la même chose avec ces deux coefficients : le coefficient de Pearson mesure le degré d'alignement du nuage de points (donc un nuage de forme "tordue" aura un coefficient faible); celui de Spearman mesure la façon dont une variable augmente quand l'autre augmente.

Donc tu es en train de calculer, mais tu ne sembles pas trop savoir quoi ou pourquoi. C'est pourtant la première chose à savoir, non ?

Il est très rare que la comparaison des deux coefficients soit vraiment utile.

Cordialement.

gg

Nombre de messages : 2119
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

comparaison - Comparaison Pearson - Spearman Empty Re: Comparaison Pearson - Spearman

Message par Cl3my le Lun 18 Aoû 2014 - 10:26

Merci pour ta réponse!

C'est bizarre, j'ai toujours appris que pour utiliser une corrélation de Pearson, il fallait que les deux variables suivent une distribution normale (indices de voussures, asymétrie, histogramme, boxplot). Et si ce n'était pas le cas, il fallait utiliser le test non paramétrique, Spearman. Je vais prendre en considération ton commentaire et ne vais pas exclure de valeurs extrêmes.

Par contre, je sais très bien ce que je compte calculer et pourquoi. Je veux corréler deux moyennes.

Cl3my

Nombre de messages : 2
Date d'inscription : 17/08/2014

Revenir en haut Aller en bas

comparaison - Comparaison Pearson - Spearman Empty Re: Comparaison Pearson - Spearman

Message par Ayana le Lun 18 Aoû 2014 - 11:29

Bonjour,

Justement non, on ne correle pas des moyennes (puisqu'il s'agit de deux estimations ponctuelles) mais on peut calculer un coefficient de correlation sur deux distributions. En plus, Spearman est un estimateur non parametrique donc par definition il ne peut pas utiliser la moyenne comme parametre... Ensuite, on n'enleve jamais les valeurs extremes puisque ce sont des valeurs plausibles. Si on les enleve, l'echantillon n'est plus representatif de quoi que ce soit.
Par contre, comme a dit gg c'est impossible de comparer les deux coefficients puisqu'ils ne mesurent pas la meme chose.

Ayana
Ayana
Ayana

Nombre de messages : 527
Localisation : Londres
Date d'inscription : 18/08/2009

Revenir en haut Aller en bas

comparaison - Comparaison Pearson - Spearman Empty Re: Comparaison Pearson - Spearman

Message par gg le Lun 18 Aoû 2014 - 11:40

Ce dont on peut espérer que ce soit gaussien, c'est les résidus de la régression (différences entre valeur espérée et valeur véritable). Et encore ...
Si on se contente d'ajuster les données à un modèle linéaire, donc faire des statistiques descriptives, la méthode des moindres carrés fonctionne bien, sans aucune exigence sur les données ni même les résidus.

Cordialement.

gg

Nombre de messages : 2119
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

comparaison - Comparaison Pearson - Spearman Empty Re: Comparaison Pearson - Spearman

Message par niaboc le Mer 20 Aoû 2014 - 14:41

Cl3my a écrit:pour utiliser une corrélation de Pearson, il fallait que les deux variables suivent une distribution normale (indices de voussures, asymétrie, histogramme, boxplot). Et si ce n'était pas le cas, il fallait utiliser le test non paramétrique, Spearman.

Non, c'est simplement qu'en cas de distribution normale, le coefficient de Pearson décrit complètement le lien qui existe entre les deux séries.

Niaboc
niaboc
niaboc

Nombre de messages : 969
Age : 32
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

comparaison - Comparaison Pearson - Spearman Empty Re: Comparaison Pearson - Spearman

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum