Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Corrélations avec variables qualitatives ordinales
3 participants
Page 1 sur 1
Corrélations avec variables qualitatives ordinales
Bonjour à tous,
Je souhaite comparer deux méthodes différentes d'évaluation de pressions s’exerçant sur les cours d'eau. Je voudrais savoir si ces deux méthodes concordent, au moins pour certaines variables.
Je m'intéresse donc aux corrélations entre les variables de deux jeux de données:
- l'un contient 13 variables quantitatives (probabilité d’occurrence de la pression: de 0 à 1)
- l'autre contient 14 variables qualitatives ordinales (impact faible, moyen, fort)
J'ai commencé par transformer ma variable qualitative ordinale en variable quantitative, et calculé les matrices de corrélations (corrélations de Pearson et de Spearman). Mais je me demande si c'est vraiment adapté de calculer ces corrélations avec une variable ne contenant que des valeurs =1, 2 ou 3?
De plus lors du calcul des tests des coefficients de corrélation j'ai des messages d'erreur (logiciel R):
"Cannot compute exact p-values with ties" pour les coefficients de spearman,
"Messages d'avis :1: In cor(x, y) : l'écart type est nulle" pour les coefficients de pearson:
Ces deux messages me font penser que mes p-values ne sont pas fiables. J'ai notamment beaucoup de p-values =0 suite pour le test des coefficients de pearson, je suppose que ce sont des p-values qui n'ont pas pu être calculées?
Je n'ai pas réussi à trouver d'autre méthode que l'étude des corrélations, n'ayant pas de lien de causalité entre mes variables.
Merci de votre aide!
Je souhaite comparer deux méthodes différentes d'évaluation de pressions s’exerçant sur les cours d'eau. Je voudrais savoir si ces deux méthodes concordent, au moins pour certaines variables.
Je m'intéresse donc aux corrélations entre les variables de deux jeux de données:
- l'un contient 13 variables quantitatives (probabilité d’occurrence de la pression: de 0 à 1)
- l'autre contient 14 variables qualitatives ordinales (impact faible, moyen, fort)
J'ai commencé par transformer ma variable qualitative ordinale en variable quantitative, et calculé les matrices de corrélations (corrélations de Pearson et de Spearman). Mais je me demande si c'est vraiment adapté de calculer ces corrélations avec une variable ne contenant que des valeurs =1, 2 ou 3?
De plus lors du calcul des tests des coefficients de corrélation j'ai des messages d'erreur (logiciel R):
"Cannot compute exact p-values with ties" pour les coefficients de spearman,
"Messages d'avis :1: In cor(x, y) : l'écart type est nulle" pour les coefficients de pearson:
Ces deux messages me font penser que mes p-values ne sont pas fiables. J'ai notamment beaucoup de p-values =0 suite pour le test des coefficients de pearson, je suppose que ce sont des p-values qui n'ont pas pu être calculées?
Je n'ai pas réussi à trouver d'autre méthode que l'étude des corrélations, n'ayant pas de lien de causalité entre mes variables.
Merci de votre aide!
chloe le gros- Nombre de messages : 5
Date d'inscription : 25/02/2016
Re: Corrélations avec variables qualitatives ordinales
Bonjour,
Avant de répondre sur l'aspect strictement statistique, j'ai du mal à comprendre la démarche ou le questionnement que tu mènes.
Notamment les 2 phrases ci-dessous jettent un flou sur les questions que tu te poses.
Je connais bien la question du lien pression-impact pour les cours d'eau dans le cadre de la DCE. Donc peux tu expliciter un peu mieux ce que tu cherches à obtenir ?
Avant de répondre sur l'aspect strictement statistique, j'ai du mal à comprendre la démarche ou le questionnement que tu mènes.
Notamment les 2 phrases ci-dessous jettent un flou sur les questions que tu te poses.
Je m'intéresse donc aux corrélations
n'ayant pas de lien de causalité entre mes variables
Je connais bien la question du lien pression-impact pour les cours d'eau dans le cadre de la DCE. Donc peux tu expliciter un peu mieux ce que tu cherches à obtenir ?
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Corrélations avec variables qualitatives ordinales
Les pressions ont été évaluées selon deux méthodes différentes:
- l'une intègre dans des modèles une combinaison de nombreuses variables (occupation du sol, mesures de concentrations de certaines substances, données de rejets d'industries, données de prélèvements d'eau, ...). C'est la méthode officielle qui s'applique sur le bassin RMC pour l'évaluation du risque de non atteinte des objectifs environnementaux.
- l'autre est une nouvelle méthode développée par l'université de lorraine, basée uniquement sur la composition en invertébrés dans les prélèvements : sachant les traits fonctionnels des espèces présentes, on détermine des probabilités que certaines pressions s'exercent sur le milieu.
Ces deux méthodes sont très différentes, mais elles visent toutes les deux à obtenir une indication des pressions qui s'exercent sur le milieu.
La question de l'échelle viens s'ajouter à ça: la première méthode évalue les pressions à l'échelle de la masse d'eau, alors que la seconde évalue les pressions à l'échelle de la station de prélèvement.
Je cherche à savoir si ces deux méthodes sont cohérentes entre elles: sur un même site, mettent-elles toutes les deux en évidence la présence des mêmes pressions?
J'espère avoir été un peu plus claire... Si ce n'est toujours pas le cas je peux joindre quelques lignes de mes deux types d'évaluation des pressions.
- l'une intègre dans des modèles une combinaison de nombreuses variables (occupation du sol, mesures de concentrations de certaines substances, données de rejets d'industries, données de prélèvements d'eau, ...). C'est la méthode officielle qui s'applique sur le bassin RMC pour l'évaluation du risque de non atteinte des objectifs environnementaux.
- l'autre est une nouvelle méthode développée par l'université de lorraine, basée uniquement sur la composition en invertébrés dans les prélèvements : sachant les traits fonctionnels des espèces présentes, on détermine des probabilités que certaines pressions s'exercent sur le milieu.
Ces deux méthodes sont très différentes, mais elles visent toutes les deux à obtenir une indication des pressions qui s'exercent sur le milieu.
La question de l'échelle viens s'ajouter à ça: la première méthode évalue les pressions à l'échelle de la masse d'eau, alors que la seconde évalue les pressions à l'échelle de la station de prélèvement.
Je cherche à savoir si ces deux méthodes sont cohérentes entre elles: sur un même site, mettent-elles toutes les deux en évidence la présence des mêmes pressions?
J'espère avoir été un peu plus claire... Si ce n'est toujours pas le cas je peux joindre quelques lignes de mes deux types d'évaluation des pressions.
chloe le gros- Nombre de messages : 5
Date d'inscription : 25/02/2016
Re: Corrélations avec variables qualitatives ordinales
Si je comprends ton problème, tu as deux blocs de variables appariés, c'est-à-dire pour chaque mesure 14 variables quantitatives dans un bloc et 13 variables qualitatives dans l'autre. Ce qui ne paraît pas clair est si chacun des blocs correspond à une méthode d'évaluation ou si les deux méthodes conduisent aux deux blocs. Par contre, il me semble comprendre que les deux méthodes d'évaluation ont été appliquées aux mêmes sites.
La première idée qui me vient à l'esprit est d'utiliser une Analyse à Facteurs Multiples simple si chaque bloc est associé à une méthode, hiérarchique si les deux méthodes produisent les deux blocs. Comme point de départ pour comprendre ces méthodes, tu peux aller sur le site (Analyses multivariées).
La première idée qui me vient à l'esprit est d'utiliser une Analyse à Facteurs Multiples simple si chaque bloc est associé à une méthode, hiérarchique si les deux méthodes produisent les deux blocs. Comme point de départ pour comprendre ces méthodes, tu peux aller sur le site (Analyses multivariées).
Florent Aubry- Nombre de messages : 251
Date d'inscription : 02/11/2015
Re: Corrélations avec variables qualitatives ordinales
Le problème de l'échelle d'évaluation de l'impact est important car il questionne déjà sur la pertinence de ce que tu cherches à faire. Quelques points pour faire avancer le sujet car cela me semble essentiel pour se donner une chance de converger vers une méthode stat.
1-La méthodo "Lorraine" (I2M2 ?) donne une info sur l'origine (la pression) probable d'un impact mesuré à l'échelle de la station (=une partie de la masse 'eau). Pour qu'elle soit cohérente avec la méthodo AERMC, il faut que la station soit parfaitement représentative de tout ce qui se passe à l'échelle de la masse d'eau.
2-La méthode AERMC évalue un impact écologique potentiel pour chacune des pressions s'exerçant sur le bassin versant de la masse d'eau considérée.
Les objectifs de chaque méthode sont donc différents même si les objets (masse d'eau et impact) de départ sont les mêmes.
Pour en revenir sur un aspect plus technique/stat, pourquoi as-tu une pression de plus dans la méthodo AERMC ? Les pressions (ie colonne des tableaux) ne sont pas les mêmes entre les deux méthodes ?
1-La méthodo "Lorraine" (I2M2 ?) donne une info sur l'origine (la pression) probable d'un impact mesuré à l'échelle de la station (=une partie de la masse 'eau). Pour qu'elle soit cohérente avec la méthodo AERMC, il faut que la station soit parfaitement représentative de tout ce qui se passe à l'échelle de la masse d'eau.
2-La méthode AERMC évalue un impact écologique potentiel pour chacune des pressions s'exerçant sur le bassin versant de la masse d'eau considérée.
Les objectifs de chaque méthode sont donc différents même si les objets (masse d'eau et impact) de départ sont les mêmes.
Pour en revenir sur un aspect plus technique/stat, pourquoi as-tu une pression de plus dans la méthodo AERMC ? Les pressions (ie colonne des tableaux) ne sont pas les mêmes entre les deux méthodes ?
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Corrélations avec variables qualitatives ordinales
Une de nos questions concerne justement la représentativité de nos stations de surveillance vis à vis du reste des masses d'eau. Si les résultats concordent entre les deux méthodes, ce sera un indice pour dire que les stations semblent bien placées, du moins pour certaines pressions (il est probable que certaines pressions sont mieux "surveillées" que d'autres).
Une autre de nos hypothèse est que la composition en invertébrés ne reflète pas forcément toutes les pressions, par exemple les pressions diffuses.
Effectivement les pressions ne sont pas les mêmes entre les deux méthodes, les pressions de la méthode AERMC sont assez intégratrices. A priori je ne cherche pas à comparer seulement 2 à 2 les pressions identiques, mais plutôt à voir toutes les corrélations qui peuvent exister.
Une autre de nos hypothèse est que la composition en invertébrés ne reflète pas forcément toutes les pressions, par exemple les pressions diffuses.
Effectivement les pressions ne sont pas les mêmes entre les deux méthodes, les pressions de la méthode AERMC sont assez intégratrices. A priori je ne cherche pas à comparer seulement 2 à 2 les pressions identiques, mais plutôt à voir toutes les corrélations qui peuvent exister.
chloe le gros- Nombre de messages : 5
Date d'inscription : 25/02/2016
Re: Corrélations avec variables qualitatives ordinales
Alors, je ne vois pas comment tu peux comparer les 2 méthodes si elles n'ont rien en commun et surtout la finalité. Si tu partages mon point de vue :Effectivement les pressions ne sont pas les mêmes entre les deux méthodes
-Frein technique : les pressions ne sont pas les mêmes, trouver une base de comparaison statistique paraît donc difficile;
- Frein plus conceptuel (mais tout aussi important) : la méthodo AERMC évalue un niveau d'impact probable par origine de pression alors que la méthodo Univ Lorraine évalue la proba d'une pression selon un impact mesuré;
Alors, il me semble qu'à minima il faut trouver un moyen d'harmoniser les pressions afin d'avoir un point de comparaison car sinon toutes les analyses n'auront pas une base robuste car tu mettras en regard (via une corrélation par exemple) des choses qui n'ont rien à voir ensemble.
Nik
PS: il serait peut être utile, si ce n'est déjà fait, de te rapprocher des concepteurs de la méthodo Univ. Lorraine qui, si je ne me trompe pas, connaissent aussi très bien les méthodos des agences et recueillir leur avis sur la question.
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Corrélations avec variables qualitatives ordinales
Qu'entend-tu par "harmoniser les pressions"?
Les pressions ne sont pas tout à fait les mêmes mais elles sont quand même assez proches. Par exemple pour la pression "morphologie" de la méthode AERMC (qui intègre des données de présence de protection de berge, de déficit ou colmatage du substrat, le rapport profondeur/largeur, ...), j'aimerais voir si on a des corrélations avec les pressions "présence de voies de communications", ou "rectification" de la méthode Univ Lorraine. J'ai aussi quelques variables qui sont plutôt identiques (concernant la phisico-chimie: nitrates, pesticides)
Les pressions ne sont pas tout à fait les mêmes mais elles sont quand même assez proches. Par exemple pour la pression "morphologie" de la méthode AERMC (qui intègre des données de présence de protection de berge, de déficit ou colmatage du substrat, le rapport profondeur/largeur, ...), j'aimerais voir si on a des corrélations avec les pressions "présence de voies de communications", ou "rectification" de la méthode Univ Lorraine. J'ai aussi quelques variables qui sont plutôt identiques (concernant la phisico-chimie: nitrates, pesticides)
chloe le gros- Nombre de messages : 5
Date d'inscription : 25/02/2016
Re: Corrélations avec variables qualitatives ordinales
harmoniser = retrouver des choses comparables. Mais si tu considères que certaines pressions peuvent être rapprochées pour être comparées alors ok.
Comme évoqué par Florent, tu peux explorer ton jeu de données par des méthodes géométriques type AFM ou co-inertie. Je crains que le résultat conduise à des interprétations dangereuses mais au moins ça te dégrossira le jeu de données.
Reviens vers nous avec ces premiers résultats si besoin.
nik
Comme évoqué par Florent, tu peux explorer ton jeu de données par des méthodes géométriques type AFM ou co-inertie. Je crains que le résultat conduise à des interprétations dangereuses mais au moins ça te dégrossira le jeu de données.
Reviens vers nous avec ces premiers résultats si besoin.
nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Corrélations avec variables qualitatives ordinales
Ok je vais essayer l'AFM.
Pouvez-vous me confirmer que la transformation de ma variable qualitative ordinale en quantitative est une mauvaise idée et que les coefficients de corrélation qui sont calculés ne sont pas interprétables?
Pouvez-vous me confirmer que la transformation de ma variable qualitative ordinale en quantitative est une mauvaise idée et que les coefficients de corrélation qui sont calculés ne sont pas interprétables?
chloe le gros- Nombre de messages : 5
Date d'inscription : 25/02/2016
Re: Corrélations avec variables qualitatives ordinales
La seule façon correcte de transformer une variable ordinale en nombre est de la transformer en rang (1er, 2eme...) cependant on se trouve généralement devant un problème d'ex-aequo. Il existe plusieurs stratégies pour cette transformation de rang (fonction rank de R), la 'meilleure' est de prendre la moyenne des rangs. Dans ce cas, on montre que la corrélation de Spearman est la corrélation de Pearson des rangs. Par contre pour que cela ait vraiment un sens, il faut que le taux d'ex-aequo soit faible, ce qui ne sera pas le cas avec 3 niveaux. De toutes façons, il ne faut pas attendre non plus beaucoup de miracles de l'AFM, seulement elle travaille sur le bloc entier de 13 variables et donc 3^13 combinaisons possibles.
Maintenant comme l'a fait remarquer Nik, il ne faut pas sur-interpréter les résultats. L'AFM peut apporter beaucoup d'informations mais à la condition qu'on ait bien compris les mécanismes de l'algorithme sinon il est préférable d'en rester à une interprétation 'de surface'. En fait, cela est aussi vrai avec toutes les techniques statistiques, simplement on se cache les problèmes derrière les chiffres (et les p-values) en statistiques inférentielles. Notamment, on voit couramment dans la littérature des gens tirer des conclusions d'An(c)ova/régressions avec un R2 de l'ordre de 0,2, des effets significatifs dus à la corrélation (non testée) des régresseurs...
Maintenant comme l'a fait remarquer Nik, il ne faut pas sur-interpréter les résultats. L'AFM peut apporter beaucoup d'informations mais à la condition qu'on ait bien compris les mécanismes de l'algorithme sinon il est préférable d'en rester à une interprétation 'de surface'. En fait, cela est aussi vrai avec toutes les techniques statistiques, simplement on se cache les problèmes derrière les chiffres (et les p-values) en statistiques inférentielles. Notamment, on voit couramment dans la littérature des gens tirer des conclusions d'An(c)ova/régressions avec un R2 de l'ordre de 0,2, des effets significatifs dus à la corrélation (non testée) des régresseurs...
Florent Aubry- Nombre de messages : 251
Date d'inscription : 02/11/2015
Sujets similaires
» ACP sur variable qualitatives ordinales?
» ACP sur données qualitatives ordinales ?
» Crossover variables quanti et ordinales
» régression logistique et variables ordinales
» mesure d'association variables qualitatives
» ACP sur données qualitatives ordinales ?
» Crossover variables quanti et ordinales
» régression logistique et variables ordinales
» mesure d'association variables qualitatives
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum