Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Corrélation de Spearman ou Pearson ?
3 participants
Page 1 sur 1
Corrélation de Spearman ou Pearson ?
Bonjour à tous.
Voici mon problème : J'ai des données de nombre de repas et d'âge (en jours) pour des chiens de deux races. Les enregistrements étaient fait automatiquement. Donc sur ma période d'observation j'ai les heures des repas pour chaque individus.
Je voudrais savoir si le nombre de repas moyen par jour augmente ou diminue en fonction de l'âge (en jours).
Pour cela je calcule pour chaque individu et pour chaque âge le nombre de repas.
Age 15 16 17 18 19 20 ...
Individu
1 4 3 2 3 4 1
2 5 1 1 2
3 2 3 1 4 3 1
...
Plusieurs individus pouvant avoir le même âge, je fais donc la moyenne du nombre de repas pour chaque âge (1 âge correspondant forcément à 1 jours, j'obtiens mon nombre moyen de repas par jour). Je sépare le tout par race.
J'ai donc un tableau comme suit :
Age Nb moyen de repas pour SB Nb moyen de repas pour Dog
15 4 3
16 4 2
17 3 2
18 3 4
19 2 1
20 4 2
...
Je veux voir si le nombre moyen de repas par jour calculé est corrélé à l'âge (je m'attends à ce que le nombre moyen de repas par jour diminue plus l'âge augmente).
Je pensais utilisé une corrélation de Spearman mais je n'en suis pas sur.
Merci d'avance pour votre aide.
Marjow
Voici mon problème : J'ai des données de nombre de repas et d'âge (en jours) pour des chiens de deux races. Les enregistrements étaient fait automatiquement. Donc sur ma période d'observation j'ai les heures des repas pour chaque individus.
Je voudrais savoir si le nombre de repas moyen par jour augmente ou diminue en fonction de l'âge (en jours).
Pour cela je calcule pour chaque individu et pour chaque âge le nombre de repas.
Age 15 16 17 18 19 20 ...
Individu
1 4 3 2 3 4 1
2 5 1 1 2
3 2 3 1 4 3 1
...
Plusieurs individus pouvant avoir le même âge, je fais donc la moyenne du nombre de repas pour chaque âge (1 âge correspondant forcément à 1 jours, j'obtiens mon nombre moyen de repas par jour). Je sépare le tout par race.
J'ai donc un tableau comme suit :
Age Nb moyen de repas pour SB Nb moyen de repas pour Dog
15 4 3
16 4 2
17 3 2
18 3 4
19 2 1
20 4 2
...
Je veux voir si le nombre moyen de repas par jour calculé est corrélé à l'âge (je m'attends à ce que le nombre moyen de repas par jour diminue plus l'âge augmente).
Je pensais utilisé une corrélation de Spearman mais je n'en suis pas sur.
Merci d'avance pour votre aide.
Marjow
Marjow54- Nombre de messages : 14
Date d'inscription : 03/11/2017
Re: Corrélation de Spearman ou Pearson ?
Bonjour.
Question : Pourquoi être passé par une moyenne ? Tu perds des données, alors qu'il est parfaitement possible de faire une étude de corrélation avec toutes tes données.
Ensuite, la bonne pratique n'est pas de choisir un peu au hasard une méthode, mais d'étudier les données pour savoir ce qu'elles indiquent. Ici, une méthode très classique est de représenter le nuage de points, pour voir quelle allure il a. Puis de choisir un modèle de corrélation pour calculer un coefficient de Pearson si les nuage est "allongé", ou de se résoudre à simplement vérifier que les valeurs diminuent "en gros" (ou augmentent) par un coefficient de Spearman.
Cordialement.
Question : Pourquoi être passé par une moyenne ? Tu perds des données, alors qu'il est parfaitement possible de faire une étude de corrélation avec toutes tes données.
Ensuite, la bonne pratique n'est pas de choisir un peu au hasard une méthode, mais d'étudier les données pour savoir ce qu'elles indiquent. Ici, une méthode très classique est de représenter le nuage de points, pour voir quelle allure il a. Puis de choisir un modèle de corrélation pour calculer un coefficient de Pearson si les nuage est "allongé", ou de se résoudre à simplement vérifier que les valeurs diminuent "en gros" (ou augmentent) par un coefficient de Spearman.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Corrélation de Spearman ou Pearson ?
Merci pour votre réponse.
J'avais choisi de passer par la moyenne car j'ai un jeu de données énorme, donc c'était pour moi plus simple à traiter et cela me permet "d'écarter" les valeurs extrêmes.
Si je vous suis, j'aurais donc un tableau à passer sous R de la forme :
Age Nb de repas
15 4
15 3
15 7
15 1
16 2
16 2
17 3
18 6
18 3
18 2
...
J'avais lu que Pearson permettait de regarder uniquement les corrélations linéaires, tandis que Spearman regarde toutes formes de corrélations. C'est pour cela que je pensais plutôt utilisé Spearman qui a l'ai d'englobé plus largement. Est-ce le cas ?
Cordialement
J'avais choisi de passer par la moyenne car j'ai un jeu de données énorme, donc c'était pour moi plus simple à traiter et cela me permet "d'écarter" les valeurs extrêmes.
Si je vous suis, j'aurais donc un tableau à passer sous R de la forme :
Age Nb de repas
15 4
15 3
15 7
15 1
16 2
16 2
17 3
18 6
18 3
18 2
...
J'avais lu que Pearson permettait de regarder uniquement les corrélations linéaires, tandis que Spearman regarde toutes formes de corrélations. C'est pour cela que je pensais plutôt utilisé Spearman qui a l'ai d'englobé plus largement. Est-ce le cas ?
Cordialement
Marjow54- Nombre de messages : 14
Date d'inscription : 03/11/2017
Re: Corrélation de Spearman ou Pearson ?
Non, la différence n'est pas celle-ci.
Avec Spearmann, tu ne t'intéresse qu'à la variation des valeurs. Donc (1,1),(2,2),(3,3) donne le même résultat que (1,1),(2, 10),(3, 100).
Tu perds toute connaissance sur un lien entre les variable autre que "quand l'une augmente, l'autre diminue" ou "quand l'une augmente, l'autre augmente aussi".
On peut utiliser différents modèles pour analyser la corrélation, pas seulement des modèles linéaires.
Cependant, ici, si tu ne sais pas quel modèle est à utiliser, difficile de savoir. Déjà représenter tes données, ou au moins la série des moyennes peut te donner quelques idées.
Il y a sans doute aussi un problème : Tes valeurs de nombre de repas ne sont que quelques valeurs possibles. Il y a sans doute d'autres analyses possibles, plus adaptées, mais je ne suis pas spécialiste.
Cordialement.
Avec Spearmann, tu ne t'intéresse qu'à la variation des valeurs. Donc (1,1),(2,2),(3,3) donne le même résultat que (1,1),(2, 10),(3, 100).
Tu perds toute connaissance sur un lien entre les variable autre que "quand l'une augmente, l'autre diminue" ou "quand l'une augmente, l'autre augmente aussi".
On peut utiliser différents modèles pour analyser la corrélation, pas seulement des modèles linéaires.
Cependant, ici, si tu ne sais pas quel modèle est à utiliser, difficile de savoir. Déjà représenter tes données, ou au moins la série des moyennes peut te donner quelques idées.
Il y a sans doute aussi un problème : Tes valeurs de nombre de repas ne sont que quelques valeurs possibles. Il y a sans doute d'autres analyses possibles, plus adaptées, mais je ne suis pas spécialiste.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Corrélation de Spearman ou Pearson ?
Encore merci pour votre réponse et ces précisions.
Je débute en statistique donc je ne suis pas spécialiste non plus. Voici à quoi ressemble mes données sous forme de graphique (en utilisant donc les moyennes, comme présenté dans le premier message) en séparant mes deux races de chien.
Je ne comprends pas la fin de votre message, désolée
Je débute en statistique donc je ne suis pas spécialiste non plus. Voici à quoi ressemble mes données sous forme de graphique (en utilisant donc les moyennes, comme présenté dans le premier message) en séparant mes deux races de chien.
Je ne comprends pas la fin de votre message, désolée
Marjow54- Nombre de messages : 14
Date d'inscription : 03/11/2017
Re: Corrélation de Spearman ou Pearson ?
OK.
Avec cette représentation, on voit qu'il n'est pas très intéressant de faire des corrélations avec les nombres de jours. A part une décroissance les premiers jours, on a des nuages assez plats.
Je suis surpris, plus de 40 repas par jour ??
Avec cette représentation, on voit qu'il n'est pas très intéressant de faire des corrélations avec les nombres de jours. A part une décroissance les premiers jours, on a des nuages assez plats.
Je suis surpris, plus de 40 repas par jour ??
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Corrélation de Spearman ou Pearson ?
D'accord merci.
Avez-vous un autre type d'analyse à me conseiller dans ce cas ?
1 repas = 1 visite au distributeur automatique de lait (nous sommes dans les premiers jours de vie des chiots) donc en effet ils vont souvent boire, même rien qu'un petit peu de lait
Avez-vous un autre type d'analyse à me conseiller dans ce cas ?
1 repas = 1 visite au distributeur automatique de lait (nous sommes dans les premiers jours de vie des chiots) donc en effet ils vont souvent boire, même rien qu'un petit peu de lait
Marjow54- Nombre de messages : 14
Date d'inscription : 03/11/2017
Re: Corrélation de Spearman ou Pearson ?
Le problème si on garde toutes les données, c'est qu'on se retrouve avec plusieurs données pour le même chien, et avec des problèmes d'indépendance des données, des variations intra-chiens, inter-chiens, des données répétées, etc. J'aime bien l'usage des moyennes ici, donc.gg a écrit:Question : Pourquoi être passé par une moyenne ? Tu perds des données, alors qu'il est parfaitement possible de faire une étude de corrélation avec toutes tes données.
Par ailleurs, le problème avec toutes les données est qu'on l'on a des données de comptages (qui plus est avec des valeurs moyennes assez faibles). Du coup, une corrélation non paramétrique s'impose (Spearman ou autre) ou bien un modèle plus élaboré qui sort de cette discussion. Passer aux moyennes amène dans ce cas l'avantage supplémentaire de repasser en gaussien (théorème central limite), et donc de rester en paramétrique (Pearson), ce qui n'est pas négligeable. Donc ici aussi, j'aime bien l'idée d'utiliser des moyennes.
Plus précisément une corrélation de Pearson est effectivement une corrélation linéaire. En revanche une corrélation de Spearman (un seul "n" à la fin) est une corrélation de rang, et donc teste la monotonie, pas la linéarité. Ce n'est pas pareil. On a parfois besoin de calculer des corrélations de Spearman, même sur des données bellement gaussiennes, car on est intéressé par la monotonie uniquement.. Tout dépend donc de la question posée.gg a écrit:Non, la différence n'est pas celle-ci.
Avec Spearmann, tu ne t'intéresse qu'à la variation des valeurs. Donc (1,1),(2,2),(3,3) donne le même résultat que (1,1),(2, 10),(3, 100).
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Corrélation de Spearman ou Pearson ?
Merci Eric pour ces précisions ! (et correction orthographique )
Je trouve une corrélation pour une de mes races en Pearson mais pas en Spearman. Est-ce bien du au fait que le paramétrique est plus robuste que le non paramétrique ?
De plus, peut-on conclure à une corrélation lorsqu'on obtient un rho "faiblard" (par exemple de -0.236) ?
Je ne connais pas le terme de monotonie ... Pouvez-vous m'expliquer ?
Ici la question posée est réellement de savoir si le nombre de repas évolue avec l'âge et si oui dans quel sens (diminution du nombre de repas plus l'âge augmente par ex)
Je trouve une corrélation pour une de mes races en Pearson mais pas en Spearman. Est-ce bien du au fait que le paramétrique est plus robuste que le non paramétrique ?
De plus, peut-on conclure à une corrélation lorsqu'on obtient un rho "faiblard" (par exemple de -0.236) ?
Je ne connais pas le terme de monotonie ... Pouvez-vous m'expliquer ?
Ici la question posée est réellement de savoir si le nombre de repas évolue avec l'âge et si oui dans quel sens (diminution du nombre de repas plus l'âge augmente par ex)
Marjow54- Nombre de messages : 14
Date d'inscription : 03/11/2017
Re: Corrélation de Spearman ou Pearson ?
C'est du au fait que le paramétrique est plus puissant que le non paramétrique (pas robuste).Marjow54 a écrit:Je trouve une corrélation pour une de mes races en Pearson mais pas en Spearman. Est-ce bien du au fait que le paramétrique est plus robuste que le non paramétrique ?
Vous confondez valeur de la corrélation, et son test statistique. Ca n'a rien à voir. Il n'est pas possible de conclure sur la valeur de la corrélation seule. Une corrélation donnée peut être significative ou non. Ca dépend du nombre de points.Marjow54 a écrit:De plus, peut-on conclure à une corrélation lorsqu'on obtient un rho "faiblard" (par exemple de -0.236) ?
C'est un terme de mathématique qui veut dire constamment croissant ou décroissant, par forcément linéairement.Marjow54 a écrit:Je ne connais pas le terme de monotonie ... Pouvez-vous m'expliquer ?
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Corrélation de Spearman ou Pearson ?
Vous confondez valeur de la corrélation, et son test statistique. Ca n'a rien à voir. Il n'est pas possible de conclure sur la valeur de la corrélation seule. Une corrélation donnée peut être significative ou non. Ca dépend du nombre de points.
Oui je ne l'ai pas précisé mais je parlais bien sur avec un p<0.05. Le résultat serait par exemple : rho = -0236, p=0.0001
Merci pour le reste des explications
Marjow54- Nombre de messages : 14
Date d'inscription : 03/11/2017
Re: Corrélation de Spearman ou Pearson ?
Une fois encore, -0.236, si vous avez un wagon de points, ça peut être une valeur énorme..
Eric.
Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Corrélation de Spearman ou Pearson ?
J'ai 30 âges et 27 valeurs moyennes de nombre de repas pour une race contre 30 valeurs moyennes pour la deuxième race (ces valeurs correspondent donc aux moyennes comme vu précédemment). Le -0.236 correspond à l'analyse sur les 27 valeurs.
Je lis partout que si, en valeur absolue, on se rapproche de 1 alors la corrélation est forte, mais nul part une influence du nombre de point.
Je lis partout que si, en valeur absolue, on se rapproche de 1 alors la corrélation est forte, mais nul part une influence du nombre de point.
Marjow54- Nombre de messages : 14
Date d'inscription : 03/11/2017
Re: Corrélation de Spearman ou Pearson ?
Encore une fois, vous faites une confusion entre la valeur de la corrélation et son test statistique. Le nombre de points rentre dans la construction du test, évidement. Une corrélation de -0.236 sur 100000 points, c'est énorme. Alors que cette même corrélation sur 4 points, c'est très faible.
Eric.
Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Corrélation de Spearman ou Pearson ?
Merci Eric d'avoir complété et corrigé mes interventions.
Cordialement.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Corrélation de Spearman ou Pearson ?
Merci et bonne journée
Marjow54- Nombre de messages : 14
Date d'inscription : 03/11/2017
Sujets similaires
» coefficient de Pearson ou spearman ?
» Corelation de pearson ou spearman
» Comparaison Pearson - Spearman
» test de pearson et coefficient de corrélation [RESOLU]
» corrélation de spearman
» Corelation de pearson ou spearman
» Comparaison Pearson - Spearman
» test de pearson et coefficient de corrélation [RESOLU]
» corrélation de spearman
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum