Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le deal à ne pas rater :
TV LED 32” Continental Edison CELED32SAHD24B3
139.99 €
Voir le deal

Corrélation et significativité

Aller en bas

Corrélation et significativité Empty Corrélation et significativité

Message par RoN Mar 21 Avr 2009 - 10:08

En espérant qu'un statisticien généreux aura un peu de temps à accorder à mon problème... J'ai tenté de plonger dans le lac des statistiques, avant de me rendre compte que ce lac était en fait une mer, et cette mer en réalité un océan... J'ai donc pris peur et décidé de ne plus m'éloigner du rivage Wink
Mais j'ai quelques petites questions :

Pour résumer simplement, je dois évaluer la corrélation entre deux variables : Tint et Text. J'obtiens un beau nuage de point et la droite de régression linéaire correspondante.
Après, je veux étudier la corrélation proprement dite. Je calcule donc mon coefficient de Pearson. Ce que je ne sais pas trop, c'est comment savoir si cette corrélation est significative ou non (étape très importante). Quel test suis-je sensé utiliser ?
D'après ce que j'ai lu, il y aurait Student, Fisher... Mais les descriptions de ces test ne semblent pas vraiment convenir à ce que je souhaite... A priori, ces test semblent plutot faits pour déterminer s'il existe une différence significative entre deux séries de donnée, pas pour évaluer la significativité d'une corrélation...

Et ensuite, y a-t-il un test statistique permettant de comparer plusieurs corrélations différentes ? Qu'est ce que j'entends par là ? Imaginons que j'ai un coeff de pearson de 0.6, et un autre de 0.61, comment savoir si la différence entre les deux est significative ou non ?

J'espère que j'ai été assez clair, et qu'une âme généreuse saura me répondre ^^

RoN

Nombre de messages : 3
Date d'inscription : 20/04/2009

Revenir en haut Aller en bas

Corrélation et significativité Empty Re: Corrélation et significativité

Message par Invité Jeu 23 Avr 2009 - 8:14

bonjour,

fais attention une corrélation et une droite de regression ne mesure pas la même chose. La corrélation sert a mesurer un lien entre deux variables, alors que dans une régression cherches a caractériser une variable par une autre. La corrélation est symétrique : corrélation de x avec y = corrélation de y avec x, alors que la régression linéaire est dissymétrique : pente de y en fonction de x n'est pas égale a la pente de x en fonction de y.

Le test du coefficient de corrélation est le suivant :
soit r le coeff de correlatioin entre x et y et n le nombre de valeurs :
t = r/racine carré(1-r²)*racine carré(n-2)
si x contient 100 valeurs, n= 100.

cette statistique t sous l'hypothèse H0 : pas de lien entre x et y (r=0) suit une loi de student a n-2 degré de liberté. Autrement dit tu compares la valeur de t que tu observes a une valeur de t théorique issue d'une table de student.

Sinon tout les logiciels de stats ont le test implémenté et te renvoie directement un p-value.

Pour ce qui est de comparer des coeffs de corrélation, tout dépend ce que représente 0.6 et 0.61. Si une des deux corrélations est théorique, alors je pense que tu peux effectivement comparer la valeur de corrélation observées et la valeur théorique.

Si ce sont deux valeurs observées alors si les échantillons sont indépendants tu dois pouvoir utiliser des meta-analyses. Mais je ne connais pas ce domaine de la stat, peut-être faut-il aussi un nombre minimum de comparaisons...

Reste aussi le champ des tests de permutations.

Désole de ne pouvoir plus t'éclairer sur la question.

micros

Invité
Invité


Revenir en haut Aller en bas

Corrélation et significativité Empty Re: Corrélation et significativité

Message par RoN Ven 24 Avr 2009 - 9:26

Pfoulala, plus j'essaie de comprendre les stats, plus je m'y noies... Entre test t, student, pearson, statistique t, p value et je ne sais pas quoi encore, impossible de m'y retrouver... Vraiment, je hais les statistiques.

En tt cas merci quand même pour ta réponse micros corpus, je doute que ça m'aide vraiment, mais c'est déjà ça...

D'après le peu que j'ai compris, le moyen le plus facile pour tester la signification de ma corrélation serait d'étudier la "p-value"... Si celle-ci est inférieure à mon seuil (en général 5%, donc 0.05), on peut considérer que la corrélation est significative.
Mais bon même avec ça j'ai des problèmes... Déjà, comment calculer cette p-value ? J'ai trouvé des sites qui le font automatiquement (ex : http://www.danielsoper.com/statcalc/calc44.aspx), et qui ne nécessitent en paramètre d'entrée que le coeff de pearson et l'effectif. J'ai du mal à comprendre comment la significativité est établie à partir de ces deux paramètres seulement...
Autre chose : ce genre de test me sort deux résultats pour la p-value : une "p-value one-tailed" et une "p-value two-tailed". Une idée de ce que ça signifie ? Quelle valeur suis-je sensé prendre en compte ?
Merci d'avance.

RoN

Nombre de messages : 3
Date d'inscription : 20/04/2009

Revenir en haut Aller en bas

Corrélation et significativité Empty Re: Corrélation et significativité

Message par Invité Ven 24 Avr 2009 - 9:57

Bonjour,

regarde ce doc c'est très bien fait et ça t'aidera surement a y voir plus clair :
http://perso.univ-rennes1.fr/denis.poinsot/Statistiques%20pour%20statophobes/STATISTIQUES%20POUR%20STATOPHOBES.pdf

Pour résumé :
1. tu calcules ton coefficient de corrélation
2. tu cherches a savoir si cette corrélation est du au hasard ou non
3. pour ça tu calcules la valeur de t que tu observes avec ton nombre d'individus (n) et ton coefficient de corrélation r
4. tu compares cette valeur avec une valeur théorique
5. tu conclues

un exemple :

si tu as 100 individus et le coefficient de corrélation entre leur poids et leur taille est de 0.4, alors n=100 et r=0.4
le test de ce coefficient :
t=r*√((n-2)/(1-r²)) = 0.4*√(98/(1-0.4²))=0.4*√(98/0.84) = 0.4*10.8 = 4.32
ici la valeur de t que tu observes avec tes données est de 4.32

tu compares cette valeur avec une valeur théorique de t qui est issue de la loi de student avec 98 degrés de libertés. Ici la valeur théorique est : 1.984467 avec a=5%. Ta valeur est supérieure a la valeur théorique alors tu rejettes l'hypothèse h0 qui est que r=0 (pas de corrélation).

La p-value est la probabilité d'observer une valeur théorique plus forte que la valeur de t observée. Donc si cette proba est supérieure à 5% ça veut dire que tu as plus de 5% de chances d'obtenir une valeur supérieure à la valeur de t observée quand H0 est vrai. Par contre si p-value est inférieure à 5% ça veut dire que tu as moins de 5% de chances d'observer une valeur de t théorique supérieure à la valeur de t observée, donc que tu as moins de 5% de chance d'observer par "hasard" une valeur de t supérieure a la valeur de t que tu as observer. Dans ce cas tu ne peux pas accepter H0 au risque a=5%.

Ici la p-value est de 0.0000374 donc tu as 0.00373% de chance d'observer par hasard une valeur de t supérieure a la valeur de t que tu as observer. Donc ici on ne peut pas accepter H0.

J'espère que maintenant c'est un peu plus clair pour toi. C'est vrai que le passage du r au t n'est peut-être pas facile a comprendre, il te suffi juste de savoir que la valeur de t te permet de tester si le r que tu observes est significativement différent de 0 ou non.

L'histoire des "p-value one-tailed" et "p-value two-tailed" dépend de l'hypoyhèse alternative que tu as.

Lorsque tu fais un test tu confrontes l'hypothèse nulle H0 a une hypothèse alternative H1.
Ici H0=pas de corrélation entre poids et taille, r=0
H1 : corrélation entre poids et taille, r≠0
Ici on parle de test bilatéral, tu ne fais pas d'hypothèse sur r, tu cherches juste a tester si r est différent de 0.

Mais tu pourrais aussi avoir un a priori sur r : r>0 ou r<0.
Ici H0=pas de corrélation entre poids et taille, r=0
H1 : corrélation postive entre poids et taille, r>0
Ici le test est dit unilatéral.

La "p-value one-tailed" correspond au test unilatéral et la "p-value two-tailed" correspond au test bilatéral. A noter que "p-value one-tailed" = "p-value two-tailed"/2.

Si tu ne veux pas te prendre la tête garde la p-value two tailed, c'est celle que je t'ai donnée.

En espérant que ça t'a aidé.

micros

Invité
Invité


Revenir en haut Aller en bas

Corrélation et significativité Empty Re: Corrélation et significativité

Message par RoN Ven 24 Avr 2009 - 12:41

Merci beaucoup micros corpus, je ne suis pas encore allé voir ton lien mais tes explications m'ont assez bien éclairé. C'est très sympa de ta part d'avoir accordé un peu de temps à mon problème. Les stats, quelle galère Wink

RoN

Nombre de messages : 3
Date d'inscription : 20/04/2009

Revenir en haut Aller en bas

Corrélation et significativité Empty Re: Corrélation et significativité

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum