Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Le Deal du moment :
KTC Écran PC Gaming 24″ (1920 x 1080) ...
Voir le deal
67.39 €

Corrélations avec variables qualitatives ordinales

3 participants

Aller en bas

Corrélations avec variables qualitatives ordinales Empty Corrélations avec variables qualitatives ordinales

Message par chloe le gros Ven 26 Fév 2016 - 7:31

Bonjour à tous,

Je souhaite comparer deux méthodes différentes d'évaluation de pressions s’exerçant sur les cours d'eau. Je voudrais savoir si ces deux méthodes concordent, au moins pour certaines variables.
Je m'intéresse donc aux corrélations entre les variables de deux jeux de données:
- l'un contient 13 variables quantitatives (probabilité d’occurrence de la pression: de 0 à 1)
- l'autre contient 14 variables qualitatives ordinales (impact faible, moyen, fort)
J'ai commencé par transformer ma variable qualitative ordinale en variable quantitative, et calculé les matrices de corrélations (corrélations de Pearson et de Spearman). Mais je me demande si c'est vraiment adapté de calculer ces corrélations avec une variable ne contenant que des valeurs =1, 2 ou 3?
De plus lors du calcul des tests des coefficients de corrélation j'ai des messages d'erreur (logiciel R):
"Cannot compute exact p-values with ties" pour les coefficients de spearman,
"Messages d'avis :1: In cor(x, y) : l'écart type est nulle" pour les coefficients de pearson:
Ces deux messages me font penser que mes p-values ne sont pas fiables. J'ai notamment beaucoup de p-values =0 suite pour le test des coefficients de pearson, je suppose que ce sont des p-values qui n'ont pas pu être calculées?

Je n'ai pas réussi à trouver d'autre méthode que l'étude des corrélations, n'ayant pas de lien de causalité entre mes variables.

Merci de votre aide!

chloe le gros

Nombre de messages : 5
Date d'inscription : 25/02/2016

Revenir en haut Aller en bas

Corrélations avec variables qualitatives ordinales Empty Re: Corrélations avec variables qualitatives ordinales

Message par Nik Ven 26 Fév 2016 - 8:02

Bonjour,

Avant de répondre sur l'aspect strictement statistique, j'ai du mal à comprendre la démarche ou le questionnement que tu mènes.
Notamment les 2 phrases ci-dessous jettent un flou sur les questions que tu te poses.
Je m'intéresse donc aux corrélations
n'ayant pas de lien de causalité entre mes variables

Je connais bien la question du lien pression-impact pour les cours d'eau dans le cadre de la DCE. Donc peux tu expliciter un peu mieux ce que tu cherches à obtenir ?


Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

Corrélations avec variables qualitatives ordinales Empty Re: Corrélations avec variables qualitatives ordinales

Message par chloe le gros Ven 26 Fév 2016 - 8:31

Les pressions ont été évaluées selon deux méthodes différentes:
- l'une intègre dans des modèles une combinaison de nombreuses variables (occupation du sol, mesures de concentrations de certaines substances, données de rejets d'industries, données de prélèvements d'eau, ...). C'est la méthode officielle qui s'applique sur le bassin RMC pour l'évaluation du risque de non atteinte des objectifs environnementaux.
- l'autre est une nouvelle méthode développée par l'université de lorraine, basée uniquement sur la composition en invertébrés dans les prélèvements : sachant les traits fonctionnels des espèces présentes, on détermine des probabilités que certaines pressions s'exercent sur le milieu.
Ces deux méthodes sont très différentes, mais elles visent toutes les deux à obtenir une indication des pressions qui s'exercent sur le milieu.
La question de l'échelle viens s'ajouter à ça: la première méthode évalue les pressions à l'échelle de la masse d'eau, alors que la seconde évalue les pressions à l'échelle de la station de prélèvement.
Je cherche à savoir si ces deux méthodes sont cohérentes entre elles: sur un même site, mettent-elles toutes les deux en évidence la présence des mêmes pressions?
J'espère avoir été un peu plus claire... Si ce n'est toujours pas le cas je peux joindre quelques lignes de mes deux types d'évaluation des pressions.

chloe le gros

Nombre de messages : 5
Date d'inscription : 25/02/2016

Revenir en haut Aller en bas

Corrélations avec variables qualitatives ordinales Empty Re: Corrélations avec variables qualitatives ordinales

Message par Florent Aubry Ven 26 Fév 2016 - 11:12

Si je comprends ton problème, tu as deux blocs de variables appariés, c'est-à-dire pour chaque mesure 14 variables quantitatives dans un bloc et 13 variables qualitatives dans l'autre. Ce qui ne paraît pas clair est si chacun des blocs correspond à une méthode d'évaluation ou si les deux méthodes conduisent aux deux blocs. Par contre, il me semble comprendre que les deux méthodes d'évaluation ont été appliquées aux mêmes sites.

La première idée qui me vient à l'esprit est d'utiliser une Analyse à Facteurs Multiples simple si chaque bloc est associé à une méthode, hiérarchique si les deux méthodes produisent les deux blocs. Comme point de départ pour comprendre ces méthodes, tu peux aller sur le site (Analyses multivariées).

Florent Aubry

Nombre de messages : 251
Date d'inscription : 02/11/2015

Revenir en haut Aller en bas

Corrélations avec variables qualitatives ordinales Empty Re: Corrélations avec variables qualitatives ordinales

Message par Nik Ven 26 Fév 2016 - 14:47

Le problème de l'échelle d'évaluation de l'impact est important car il questionne déjà sur la pertinence de ce que tu cherches à faire. Quelques points pour faire avancer le sujet car cela me semble essentiel pour se donner une chance de converger vers une méthode stat.
1-La méthodo "Lorraine" (I2M2 ?) donne une info sur l'origine (la pression) probable d'un impact mesuré à l'échelle de la station (=une partie de la masse 'eau). Pour qu'elle soit cohérente avec la méthodo AERMC, il faut que la station soit parfaitement représentative de tout ce qui se passe à l'échelle de la masse d'eau.
2-La méthode AERMC évalue un impact écologique potentiel pour chacune des pressions s'exerçant sur le bassin versant de la masse d'eau considérée.

Les objectifs de chaque méthode sont donc différents même si les objets (masse d'eau et impact) de départ sont les mêmes.

Pour en revenir sur un aspect plus technique/stat, pourquoi as-tu une pression de plus dans la méthodo AERMC ? Les pressions (ie colonne des tableaux) ne sont pas les mêmes entre les deux méthodes ?

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

Corrélations avec variables qualitatives ordinales Empty Re: Corrélations avec variables qualitatives ordinales

Message par chloe le gros Lun 29 Fév 2016 - 8:20

Une de nos questions concerne justement la représentativité de nos stations de surveillance vis à vis du reste des masses d'eau. Si les résultats concordent entre les deux méthodes, ce sera un indice pour dire que les stations semblent bien placées, du moins pour certaines pressions (il est probable que certaines pressions sont mieux "surveillées" que d'autres).
Une autre de nos hypothèse est que la composition en invertébrés ne reflète pas forcément toutes les pressions, par exemple les pressions diffuses.
Effectivement les pressions ne sont pas les mêmes entre les deux méthodes, les pressions de la méthode AERMC sont assez intégratrices. A priori je ne cherche pas à comparer seulement 2 à 2 les pressions identiques, mais plutôt à voir toutes les corrélations qui peuvent exister.

chloe le gros

Nombre de messages : 5
Date d'inscription : 25/02/2016

Revenir en haut Aller en bas

Corrélations avec variables qualitatives ordinales Empty Re: Corrélations avec variables qualitatives ordinales

Message par Nik Lun 29 Fév 2016 - 10:32

Effectivement les pressions ne sont pas les mêmes entre les deux méthodes
Alors, je ne vois pas comment tu peux comparer les 2 méthodes si elles n'ont rien en commun et surtout la finalité. Si tu partages mon point de vue :

-Frein technique : les pressions ne sont pas les mêmes, trouver une base de comparaison statistique paraît donc difficile;
- Frein plus conceptuel (mais tout aussi important) : la méthodo AERMC évalue un niveau d'impact probable par origine de pression alors que la méthodo Univ Lorraine évalue la proba d'une pression selon un impact mesuré;

Alors, il me semble qu'à minima il faut trouver un moyen d'harmoniser les pressions afin d'avoir un point de comparaison car sinon toutes les analyses n'auront pas une base robuste car tu mettras en regard (via une corrélation par exemple) des choses qui n'ont rien à voir ensemble.

Nik

PS: il serait peut être utile, si ce n'est déjà fait, de te rapprocher des concepteurs de la méthodo Univ. Lorraine qui, si je ne me trompe pas, connaissent aussi très bien les méthodos des agences et recueillir leur avis sur la question.


Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

Corrélations avec variables qualitatives ordinales Empty Re: Corrélations avec variables qualitatives ordinales

Message par chloe le gros Lun 29 Fév 2016 - 10:53

Qu'entend-tu par "harmoniser les pressions"?
Les pressions ne sont pas tout à fait les mêmes mais elles sont quand même assez proches. Par exemple pour la pression "morphologie" de la méthode AERMC (qui intègre des données de présence de protection de berge, de déficit ou colmatage du substrat, le rapport profondeur/largeur, ...), j'aimerais voir si on a des corrélations avec les pressions "présence de voies de communications", ou "rectification" de la méthode Univ Lorraine. J'ai aussi quelques variables qui sont plutôt identiques (concernant la phisico-chimie: nitrates, pesticides)

chloe le gros

Nombre de messages : 5
Date d'inscription : 25/02/2016

Revenir en haut Aller en bas

Corrélations avec variables qualitatives ordinales Empty Re: Corrélations avec variables qualitatives ordinales

Message par Nik Lun 29 Fév 2016 - 14:56

harmoniser = retrouver des choses comparables. Mais si tu considères que certaines pressions peuvent être rapprochées pour être comparées alors ok.

Comme évoqué par Florent, tu peux explorer ton jeu de données par des méthodes géométriques type AFM ou co-inertie. Je crains que le résultat conduise à des interprétations dangereuses mais au moins ça te dégrossira le jeu de données.

Reviens vers nous avec ces premiers résultats si besoin.

nik

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

Corrélations avec variables qualitatives ordinales Empty Re: Corrélations avec variables qualitatives ordinales

Message par chloe le gros Mar 1 Mar 2016 - 14:07

Ok je vais essayer l'AFM.
Pouvez-vous me confirmer que la transformation de ma variable qualitative ordinale en quantitative est une mauvaise idée et que les coefficients de corrélation qui sont calculés ne sont pas interprétables?

chloe le gros

Nombre de messages : 5
Date d'inscription : 25/02/2016

Revenir en haut Aller en bas

Corrélations avec variables qualitatives ordinales Empty Re: Corrélations avec variables qualitatives ordinales

Message par Florent Aubry Mar 1 Mar 2016 - 14:52

La seule façon correcte de transformer une variable ordinale en nombre est de la transformer en rang (1er, 2eme...) cependant on se trouve généralement devant un problème d'ex-aequo. Il existe plusieurs stratégies pour cette transformation de rang (fonction rank de R), la 'meilleure' est de prendre la moyenne des rangs. Dans ce cas, on montre que la corrélation de Spearman est la corrélation de Pearson des rangs. Par contre pour que cela ait vraiment un sens, il faut que le taux d'ex-aequo soit faible, ce qui ne sera pas le cas avec 3 niveaux. De toutes façons, il ne faut pas attendre non plus beaucoup de miracles de l'AFM, seulement elle travaille sur le bloc entier de 13 variables et donc 3^13 combinaisons possibles.

Maintenant comme l'a fait remarquer Nik, il ne faut pas sur-interpréter les résultats. L'AFM peut apporter beaucoup d'informations mais à la condition qu'on ait bien compris les mécanismes de l'algorithme sinon il est préférable d'en rester à une interprétation 'de surface'. En fait, cela est aussi vrai avec toutes les techniques statistiques, simplement on se cache les problèmes derrière les chiffres (et les p-values) en statistiques inférentielles. Notamment, on voit couramment dans la littérature des gens tirer des conclusions d'An(c)ova/régressions avec un R2 de l'ordre de 0,2, des effets significatifs dus à la corrélation (non testée) des régresseurs...

Florent Aubry

Nombre de messages : 251
Date d'inscription : 02/11/2015

Revenir en haut Aller en bas

Corrélations avec variables qualitatives ordinales Empty Re: Corrélations avec variables qualitatives ordinales

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum