Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

-20%
Le deal à ne pas rater :
(Adhérents Fnac) Enceinte Bluetooth Marshall Stanmore II Noir
199.99 € 249.99 €
Voir le deal

Corrélation simple

3 participants

Aller en bas

Corrélation simple Empty Corrélation simple

Message par nunatak Ven 14 Jan 2011 - 15:59

Bonjour à tous,

J'ai un problème qui semble simple et classique, mais je n'ai pas trouvé ma réponse en cherchant dans les pages du forum.

Je veux étudier la corrélation entre 2 variables continues. Dans la première étude, j'ai n=210, donc j'ai utilisé la corrélation selon Pearson, pas la peine de se compliquer la tache. Par contre, je n'ai que 21 individus dans ma seconde étude. La corrélation de Pearson est-elle la plus appropriée pour ce petit effectif ? Une corrélation par les rangs serait-elle plus judicieuse (comment le justifier scientifiquement ?) ?

Je précise que les variables ne sont pas appariées, et que je n'ai pas fait de test de normalité sur l'échantillon n=21

Merci beaucoup d'avance pour votre aide


nunatak

Nombre de messages : 3
Date d'inscription : 14/01/2011

Revenir en haut Aller en bas

Corrélation simple Empty Re: Corrélation simple

Message par gg Ven 14 Jan 2011 - 20:21

Bonsoir.

Je ne comprends pas pourquoi tu utiliserais une corrélation de rangs, si tes variables sont bien numériques mesurées. La corrélation des rangs sert lorsque les variables sont uniquement ordonnées (codages, comme l'échelle de Richter des séismes, par exemple).
De plus, ce que tu estimes, c'est de la corrélation linéaire, qui n'est pas toujours la plus adaptée.
Enfin le test de normalité ne pourra pas justifier que tes variables sont gaussiennes. Tout au plus pourra-t-il mettre en doute la normalité. Il est bien plus scientifique de se poser la question de la normalité avant de regarder les valeurs obtenues (Est-ce possible ? Est-ce probable ? Est-ce sûr ?).

Cordialement.

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Corrélation simple Empty Re: Corrélation simple

Message par nunatak Sam 15 Jan 2011 - 8:39

Bonjour,

Merci pour la remarque, mais ça ne répond pas à la question qui m'intéresse : la corrélation selon Pearson peut être utilisée pour un effectif de 21 individus ?

Cordialement

PS : concernant la normalité, je fais comment pour le savoir sans la tester ? La distribution semble aléatoire, c'est tout ce que je peux dire.

nunatak

Nombre de messages : 3
Date d'inscription : 14/01/2011

Revenir en haut Aller en bas

Corrélation simple Empty Re: Corrélation simple

Message par gg Sam 15 Jan 2011 - 13:14

Bonjour.

"la corrélation selon Pearson peut être utilisée pour un effectif de 21 individus ?" Ben oui ! Qui te l'interdit ?
Par contre, bien évidemment, l'analyse sur la significativité des résultats a des conditions, mais qui n'ont rien à voir avec le calcul de corrélation linéaire.

"concernant la normalité, je fais comment pour le savoir sans la tester ? " Si les données ne sont pas de toi et que tu ne sais pas ce qu'elles sont, rien. D'ailleurs ce n'est pas la normalité des données qui est en cause (des données sont toujours en nombre fini, donc sont une série discrète; la loi Normale est continue) mais la normalité de la variable sous-jacente. Par exemple une série de tailles n'est pas distribuée normalement, mais la taille des hommes adultes de 20 à 60 ans peut être modélisée très finement par une variable gaussienne. Donc si tu es face à des données réelles, tu peux te poser la question : "Est-ce que ces données sont des tirages aléatoires d'une variable approximativement gaussienne". Il y a de nombreux cas où on peut le dire, par expérience, ou par le fait qu'interviennent additivement de nombreuses raisons qui sont du même ordre de grandeur.

Cordialement.

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Corrélation simple Empty Re: Corrélation simple

Message par nunatak Dim 16 Jan 2011 - 9:48

Entendu, merci pour ton aide.
Cordialement.

nunatak

Nombre de messages : 3
Date d'inscription : 14/01/2011

Revenir en haut Aller en bas

Corrélation simple Empty Re: Corrélation simple

Message par droopy Mer 26 Jan 2011 - 10:07

La corrélation des rangs sert lorsque les variables sont uniquement ordonnées (codages, comme l'échelle de Richter des séismes, par exemple).
Je ne suis pas complètement d'accord avec cette affirmation. Un coefficient de corrélation de pearson n'a de sens que lorsque les deux variables (x et y) sont liées linéairement, du moment que ce n'est pas le cas alors les valeurs associées à ce coefficient n'ont pas de sens même . Un exemple : si y = log(3*x). Si tu cherches la corrélation entre y et x alors il te vaut mieux utiliser la corrélation sur les rangs plutôt que la corrélation de pearson puisqu'ici le lien entre y et x n'est pas linéaire, pourtant ce ne veut pas dire qu'il n'y a pas un lien entre ces deux variables.
Code:
x <- abs(rnorm(100))
y <- log(3*x)+rnorm(100,0,0.5)
plot(x,y) # ici pas de relation linéaire entre y et x
cor(y, x)
0.7350957
plot(y~log(x)) # ici un lien linéaire
cor(y, log(x))
[1] 0.906007
# le rho de spearman
cor(y, x, method="spearman")
0.8420762
Le rho de spearman se moque du type de lien entre y et x. Tu auras le même coefficient de corrélation entre y et x qu'entre y et log(x). Par contre, comme pour le coefficient de pearson si la relation entre y et x n'est pas monotone alors ton coefficient de corrélation n'a pas de sens. Voir aussi les exemples fourni sur wiki : http://en.wikipedia.org/wiki/Spearman%27s_rank_correlation_coefficient.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Corrélation simple Empty Re: Corrélation simple

Message par gg Mer 26 Jan 2011 - 15:06

Salut Droopy.

Je suis en partie d'accord avec ton mesage. J'y ajouterai deux bémols ;
* Si on soupçonne un lien quasi-fonctionnel entre deux variables, il est plus intéressant de faire une transformation d'une variable pour mettre en évidence une corrélation linéaire entre Y et f(X). Une corrélation logarithmique dans ton exemple. On en apprend bien plus que par les rangs.
* Il peut y avoir lien foncttionnel et aucune corrélation des rangs : X et X², par exemple pour x variant de -10 à 10, ou, sur le même domaine, X et sin(X). [Edit : Ce que disait Droopy à la fin de son message que j'ai lu trop vite]

Donc finalement, pour des variables mesurées, la corrélation des rangs ne met en évidence que la variation à peu près dans le même sens, ou à peu près en sens contraire. Ce qui est d'une utilité assez contestable (très souvent, ce résultat est prévisible sans statistique).

Cordialement.


Dernière édition par gg le Mer 26 Jan 2011 - 15:24, édité 1 fois

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Corrélation simple Empty Re: Corrélation simple

Message par droopy Mer 26 Jan 2011 - 15:16

* Si on soupçonne un lien quasi-fonctionnel entre deux variables, il est plus intéressant de faire une transformation d'une variable pour mettre en évidence une corrélation linéaire entre Y et f(X). Une corrélation logarithmique dans ton exemple. On en apprend bien plus que par les rangs.
Je suis d'accord qu'il est préférable de ne pas passer par les rangs quand on peut rester en paramétrique. Le log servait juste d'exemple a mes propos.

* Il peut y avoir lien foncttionnel et aucune corrélation des rangs : X et X², par exemple pour x variant de -10 à 10, ou, sur le même domaine, X et sin(X).
Tout à fait d'accord c'est pour ça que j'avais ajouté ceci :
Par contre, comme pour le coefficient de pearson si la relation entre y et x n'est pas monotone alors ton coefficient de corrélation n'a pas de sens
Mais peut-être as tu lu trop rapidement ma réponse. D'ailleurs ta remarque est aussi valable pour le coefficient de corrélation de pearson.

Donc finalement, pour des variables mesurées, la corrélation des rangs ne met en évidence que la variation à peu près dans le même sens, ou à peu près en sens contraire. Ce qui est d'une utilité assez contestable (très souvent, ce résultat est prévisible sans statistique).
Je trouve ce point de vue trop catégorique, parfois le lien n'est pas aussi évident entre les deux variables et la valeur absolue du coefficient te donne quand même une indication sur la force du lien.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Corrélation simple Empty Re: Corrélation simple

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum