Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Corrélation simple
3 participants
Page 1 sur 1
Corrélation simple
Bonjour à tous,
J'ai un problème qui semble simple et classique, mais je n'ai pas trouvé ma réponse en cherchant dans les pages du forum.
Je veux étudier la corrélation entre 2 variables continues. Dans la première étude, j'ai n=210, donc j'ai utilisé la corrélation selon Pearson, pas la peine de se compliquer la tache. Par contre, je n'ai que 21 individus dans ma seconde étude. La corrélation de Pearson est-elle la plus appropriée pour ce petit effectif ? Une corrélation par les rangs serait-elle plus judicieuse (comment le justifier scientifiquement ?) ?
Je précise que les variables ne sont pas appariées, et que je n'ai pas fait de test de normalité sur l'échantillon n=21
Merci beaucoup d'avance pour votre aide
J'ai un problème qui semble simple et classique, mais je n'ai pas trouvé ma réponse en cherchant dans les pages du forum.
Je veux étudier la corrélation entre 2 variables continues. Dans la première étude, j'ai n=210, donc j'ai utilisé la corrélation selon Pearson, pas la peine de se compliquer la tache. Par contre, je n'ai que 21 individus dans ma seconde étude. La corrélation de Pearson est-elle la plus appropriée pour ce petit effectif ? Une corrélation par les rangs serait-elle plus judicieuse (comment le justifier scientifiquement ?) ?
Je précise que les variables ne sont pas appariées, et que je n'ai pas fait de test de normalité sur l'échantillon n=21
Merci beaucoup d'avance pour votre aide
nunatak- Nombre de messages : 3
Date d'inscription : 14/01/2011
Re: Corrélation simple
Bonsoir.
Je ne comprends pas pourquoi tu utiliserais une corrélation de rangs, si tes variables sont bien numériques mesurées. La corrélation des rangs sert lorsque les variables sont uniquement ordonnées (codages, comme l'échelle de Richter des séismes, par exemple).
De plus, ce que tu estimes, c'est de la corrélation linéaire, qui n'est pas toujours la plus adaptée.
Enfin le test de normalité ne pourra pas justifier que tes variables sont gaussiennes. Tout au plus pourra-t-il mettre en doute la normalité. Il est bien plus scientifique de se poser la question de la normalité avant de regarder les valeurs obtenues (Est-ce possible ? Est-ce probable ? Est-ce sûr ?).
Cordialement.
Je ne comprends pas pourquoi tu utiliserais une corrélation de rangs, si tes variables sont bien numériques mesurées. La corrélation des rangs sert lorsque les variables sont uniquement ordonnées (codages, comme l'échelle de Richter des séismes, par exemple).
De plus, ce que tu estimes, c'est de la corrélation linéaire, qui n'est pas toujours la plus adaptée.
Enfin le test de normalité ne pourra pas justifier que tes variables sont gaussiennes. Tout au plus pourra-t-il mettre en doute la normalité. Il est bien plus scientifique de se poser la question de la normalité avant de regarder les valeurs obtenues (Est-ce possible ? Est-ce probable ? Est-ce sûr ?).
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Corrélation simple
Bonjour,
Merci pour la remarque, mais ça ne répond pas à la question qui m'intéresse : la corrélation selon Pearson peut être utilisée pour un effectif de 21 individus ?
Cordialement
PS : concernant la normalité, je fais comment pour le savoir sans la tester ? La distribution semble aléatoire, c'est tout ce que je peux dire.
Merci pour la remarque, mais ça ne répond pas à la question qui m'intéresse : la corrélation selon Pearson peut être utilisée pour un effectif de 21 individus ?
Cordialement
PS : concernant la normalité, je fais comment pour le savoir sans la tester ? La distribution semble aléatoire, c'est tout ce que je peux dire.
nunatak- Nombre de messages : 3
Date d'inscription : 14/01/2011
Re: Corrélation simple
Bonjour.
"la corrélation selon Pearson peut être utilisée pour un effectif de 21 individus ?" Ben oui ! Qui te l'interdit ?
Par contre, bien évidemment, l'analyse sur la significativité des résultats a des conditions, mais qui n'ont rien à voir avec le calcul de corrélation linéaire.
"concernant la normalité, je fais comment pour le savoir sans la tester ? " Si les données ne sont pas de toi et que tu ne sais pas ce qu'elles sont, rien. D'ailleurs ce n'est pas la normalité des données qui est en cause (des données sont toujours en nombre fini, donc sont une série discrète; la loi Normale est continue) mais la normalité de la variable sous-jacente. Par exemple une série de tailles n'est pas distribuée normalement, mais la taille des hommes adultes de 20 à 60 ans peut être modélisée très finement par une variable gaussienne. Donc si tu es face à des données réelles, tu peux te poser la question : "Est-ce que ces données sont des tirages aléatoires d'une variable approximativement gaussienne". Il y a de nombreux cas où on peut le dire, par expérience, ou par le fait qu'interviennent additivement de nombreuses raisons qui sont du même ordre de grandeur.
Cordialement.
"la corrélation selon Pearson peut être utilisée pour un effectif de 21 individus ?" Ben oui ! Qui te l'interdit ?
Par contre, bien évidemment, l'analyse sur la significativité des résultats a des conditions, mais qui n'ont rien à voir avec le calcul de corrélation linéaire.
"concernant la normalité, je fais comment pour le savoir sans la tester ? " Si les données ne sont pas de toi et que tu ne sais pas ce qu'elles sont, rien. D'ailleurs ce n'est pas la normalité des données qui est en cause (des données sont toujours en nombre fini, donc sont une série discrète; la loi Normale est continue) mais la normalité de la variable sous-jacente. Par exemple une série de tailles n'est pas distribuée normalement, mais la taille des hommes adultes de 20 à 60 ans peut être modélisée très finement par une variable gaussienne. Donc si tu es face à des données réelles, tu peux te poser la question : "Est-ce que ces données sont des tirages aléatoires d'une variable approximativement gaussienne". Il y a de nombreux cas où on peut le dire, par expérience, ou par le fait qu'interviennent additivement de nombreuses raisons qui sont du même ordre de grandeur.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Corrélation simple
Entendu, merci pour ton aide.
Cordialement.
Cordialement.
nunatak- Nombre de messages : 3
Date d'inscription : 14/01/2011
Re: Corrélation simple
Je ne suis pas complètement d'accord avec cette affirmation. Un coefficient de corrélation de pearson n'a de sens que lorsque les deux variables (x et y) sont liées linéairement, du moment que ce n'est pas le cas alors les valeurs associées à ce coefficient n'ont pas de sens même . Un exemple : si y = log(3*x). Si tu cherches la corrélation entre y et x alors il te vaut mieux utiliser la corrélation sur les rangs plutôt que la corrélation de pearson puisqu'ici le lien entre y et x n'est pas linéaire, pourtant ce ne veut pas dire qu'il n'y a pas un lien entre ces deux variables.La corrélation des rangs sert lorsque les variables sont uniquement ordonnées (codages, comme l'échelle de Richter des séismes, par exemple).
- Code:
x <- abs(rnorm(100))
y <- log(3*x)+rnorm(100,0,0.5)
plot(x,y) # ici pas de relation linéaire entre y et x
cor(y, x)
0.7350957
plot(y~log(x)) # ici un lien linéaire
cor(y, log(x))
[1] 0.906007
# le rho de spearman
cor(y, x, method="spearman")
0.8420762
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Corrélation simple
Salut Droopy.
Je suis en partie d'accord avec ton mesage. J'y ajouterai deux bémols ;
* Si on soupçonne un lien quasi-fonctionnel entre deux variables, il est plus intéressant de faire une transformation d'une variable pour mettre en évidence une corrélation linéaire entre Y et f(X). Une corrélation logarithmique dans ton exemple. On en apprend bien plus que par les rangs.
* Il peut y avoir lien foncttionnel et aucune corrélation des rangs : X et X², par exemple pour x variant de -10 à 10, ou, sur le même domaine, X et sin(X). [Edit : Ce que disait Droopy à la fin de son message que j'ai lu trop vite]
Donc finalement, pour des variables mesurées, la corrélation des rangs ne met en évidence que la variation à peu près dans le même sens, ou à peu près en sens contraire. Ce qui est d'une utilité assez contestable (très souvent, ce résultat est prévisible sans statistique).
Cordialement.
Je suis en partie d'accord avec ton mesage. J'y ajouterai deux bémols ;
* Si on soupçonne un lien quasi-fonctionnel entre deux variables, il est plus intéressant de faire une transformation d'une variable pour mettre en évidence une corrélation linéaire entre Y et f(X). Une corrélation logarithmique dans ton exemple. On en apprend bien plus que par les rangs.
* Il peut y avoir lien foncttionnel et aucune corrélation des rangs : X et X², par exemple pour x variant de -10 à 10, ou, sur le même domaine, X et sin(X). [Edit : Ce que disait Droopy à la fin de son message que j'ai lu trop vite]
Donc finalement, pour des variables mesurées, la corrélation des rangs ne met en évidence que la variation à peu près dans le même sens, ou à peu près en sens contraire. Ce qui est d'une utilité assez contestable (très souvent, ce résultat est prévisible sans statistique).
Cordialement.
Dernière édition par gg le Mer 26 Jan 2011 - 15:24, édité 1 fois
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Corrélation simple
Je suis d'accord qu'il est préférable de ne pas passer par les rangs quand on peut rester en paramétrique. Le log servait juste d'exemple a mes propos.* Si on soupçonne un lien quasi-fonctionnel entre deux variables, il est plus intéressant de faire une transformation d'une variable pour mettre en évidence une corrélation linéaire entre Y et f(X). Une corrélation logarithmique dans ton exemple. On en apprend bien plus que par les rangs.
Tout à fait d'accord c'est pour ça que j'avais ajouté ceci :* Il peut y avoir lien foncttionnel et aucune corrélation des rangs : X et X², par exemple pour x variant de -10 à 10, ou, sur le même domaine, X et sin(X).
Mais peut-être as tu lu trop rapidement ma réponse. D'ailleurs ta remarque est aussi valable pour le coefficient de corrélation de pearson.Par contre, comme pour le coefficient de pearson si la relation entre y et x n'est pas monotone alors ton coefficient de corrélation n'a pas de sens
Je trouve ce point de vue trop catégorique, parfois le lien n'est pas aussi évident entre les deux variables et la valeur absolue du coefficient te donne quand même une indication sur la force du lien.Donc finalement, pour des variables mesurées, la corrélation des rangs ne met en évidence que la variation à peu près dans le même sens, ou à peu près en sens contraire. Ce qui est d'une utilité assez contestable (très souvent, ce résultat est prévisible sans statistique).
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Sujets similaires
» Régression linéaire simple et corrélation
» Régression linéaire simple non significative et corrélation
» différence rapport de corrélation et coefficient corrélation
» Régression simple
» Régression linéaire simple
» Régression linéaire simple non significative et corrélation
» différence rapport de corrélation et coefficient corrélation
» Régression simple
» Régression linéaire simple
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum