Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Le deal à ne pas rater :
Fnac : 2 Funko Pop achetées : le 3ème offert (large sélection de ...
Voir le deal
Le Deal du moment : -15%
(Adhérents) LEGO® Icons 10318 Le Concorde
Voir le deal
169.99 €

Analyse de covariance par étape successives ?

2 participants

Aller en bas

analyse - Analyse de covariance par étape successives ? Empty Analyse de covariance par étape successives ?

Message par Chrys Ven 26 Avr 2013 - 16:24

Bonjour à tous !

C'est la première fois que je poste un message sur ce forum, j'espère ne pas être trop en dehors des clous Wink Voici le problème auquel je suis confrontée :

J'ai plusieurs individus (environ 3500) qui appartiennent à différentes espèces (environ 150). Pour chaque individu, je dispose de la taille et de la signature isotopique en carbone et azote (trois variables continues).

Mes individus se répartissent dans de nombreuses variables catégorielles (l'espèce donc, mais aussi la station, la classification genre/famille, le caractère nocturne/diurne, etc). Mon objectif est de voir quelle est la relation entre la taille des individus d'une même espèce et leur signature isotopique : avec une simple régression sur chaque espèce j'ai vu qu'elle pouvait, ou non, exister.

A présent, je voudrais voir quels facteurs influencent cette relation : par exemple la pente est-elle plus marquée dans le site A que le site B pour une espèce ou une famille donné ? Les espèces nocturnes ont-elles tendance à montrer une plus forte relation que les autres ?, etc. J'ai donc voulu appliquer l'ANCOVA ; mais voici ce qui me bloque :

- Au début je voulais prendre d13C (isotope carbone) = f(Taille) et d15N (isotope azote) = f(Taille) séparément, mais il se trouve qu'elles sont elles-même correlées. Mais en même temps si j'ajoute l'un des isotopes comme seconde covariable en plus de la taille, ça "dilue" le signal de l'effet taille à tel point que je ne peux plus rien interpréter.
- Mes facteurs ne sont pas indépendants. Par exemple il va de soi qu'une famille ne renfermera pas les mêmes espèces qu'une autre. Le caractère nocturne/diurne ne concernera pas non plus les mêmes espèces, etc. Du coup, j'avais pensé à des modèles nested, avec par exemple le facteur Espèce emboité dans la Famille, mais je ne sais pas comment coder cela dans la commande (lm(d13C~Taille + Espèce + Famille...)) de R.
- Mon R rame et finit par planter lorsque je lui intègre plus de 3 ou 4 facteurs. Du coup, je n'arrive pas à obtenir de vision d' "ensemble" : pour que ça marche, je suis obligée de "fractionner" mon jeu de données. Par exemple, via une procédure stepwise, j'ai vu que le facteur Site était le plus informatif. J'ai donc découpé mon jeu de données en plusieurs sites et j'ai ensuite fait mes ANCOVA Site par Site, et ainsi de suite en réduisant de plus en plus mon jeu de données jusqu'à ce qu'il ne reste plus que deux ou trois facteurs à introduire.

Or je ne suis pas du tout sûre de la validité et de la pertinence de cette méthode. J'ai peur de perdre de l'info à chaque découpage du jeu de données.

Voilà voilà, en gros je suis à la recherche d'un ou plusieurs tests ou fonctions R qui me permettraient de mettre en valeur un éventuel déterminisme de ma relation Taille/Signature isotopique, de façon complète et globale Rolling Eyes Par exemple, qui me dirait si toutes les relations significativement positives entre d13C et la taille concernent un groupe d'espèce particulier, de la même famille par exemple, alors que les relations significativement négatives entre ces mêmes variables concerneraient une autre famille.

Sachant que j'ai déjà tenté la régression Isotope/Taille par Espèce X Station (ce qui est la plus forte résolution possible) et de faire des clusters sur les valeurs estimées de la pente pour voir quelles Espèces se ressemblaient ; j'ai aussi tenté la fonction mob du package Party de R (qui elle aussi plante lorsqu'il y a trop de facteurs). Je n'ai plus d'idée Crying or Very sad !!

J'espère avoir été suffisamment claire dans l'explication de ma démarche, et je vous remercie d'avance d'avoir eu le courage de me lire Wink

Très bon week-end à tous !

Chrys

Chrys

Nombre de messages : 10
Date d'inscription : 26/04/2013

Revenir en haut Aller en bas

analyse - Analyse de covariance par étape successives ? Empty Re: Analyse de covariance par étape successives ?

Message par Nik Sam 27 Avr 2013 - 9:15

Salut,

- Au début je voulais prendre d13C (isotope carbone) = f(Taille) et d15N (isotope azote) = f(Taille) séparément, mais il se trouve qu'elles sont elles-même correlées
Je ne comprends pas où est le problème.

Si tu as des réponses différentes par espèces, quel est l'intérêt de tout mettre dans un même modèle ? Avec 150 espèces, le facteur espèce doit être très vite plombant pour la mémoire vive du pc.

Es tu bien sûr qu'un modèle gaussien soit adapté à tes données. Par expérience, je serais très étonné que tu n'aies pas des problèmes d'hétéroscédasticité des données, notamment avec tous ces facteurs plus ou moins biologiquement artificiels.

Pour y voir plus clair, tu peux dans un premier temps faire une ACP sur tes 3 variables et regarder ensuite comment tes facteurs peuvent venir expliquer l'intertie (analyses between et within). Sans te donner une réponse directe, cela te donnera les premiers éléments pour te guider.


A mon avis, ton principal problème es tout d'abord de poser ta démarche clairement et notamment les hypothèses que tu souhaites tester. A priori ce n'est pas clair car tu as l'air de partir unpeu dans toutes les directions

Nik

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

analyse - Analyse de covariance par étape successives ? Empty Re: Analyse de covariance par étape successives ?

Message par Chrys Lun 29 Avr 2013 - 10:04

Bonjour Nik, et merci de ta réponse !

Effectivement j'ai des réponses qui sont différentes selon l'espèce, et qui peuvent même changer d'un site à l'autre pour une même espèce, mais mon objectif était justement de voir quel facteur pouvait expliquer ces relations. Par ex : est-ce qu'une relation fortement significative entre taille et d13C peut-être expliqué par un régime alimentaire herbivore ? Ou une activité essentiellement diurne ?

Mais comme j'ai beaucoup de facteurs et de modalités, je trouvais un peu empirique de tester des hypothèses une par une. Je me demandais s'il n'existait pas un test particulier qui me permettrait de rassembler toutes les espèces présentant une réponse similaire, et de me dire si c'est significativement associé à un trait de vie quelconque.

Es tu bien sûr qu'un modèle gaussien soit adapté à tes données. Par expérience, je serais très étonné que tu n'aies pas des problèmes d'hétéroscédasticité des données, notamment avec tous ces facteurs plus ou moins biologiquement artificiels.

Que veux-tu dire ? Ce sont mes encadrants qui m'ont conseillé d'utiliser ce modèle. Lorsque je fais un glm simple de type "glm(d13C~Taille + Espèce + Site, ..., family=gaussian) et que j'analyse mes résidus, ceux-ci semblent plutôt corrects. Je vais réfléchir de ce côté-là Smile

Merci en tout cas pour ces éléments de réponse Smile je vais suivre tes conseils et tenter une ACP sur les trois variables continues, et voir comment je peux simplifier mes hypothèses.

Bonne semaine ! Smile

Chrys

Nombre de messages : 10
Date d'inscription : 26/04/2013

Revenir en haut Aller en bas

analyse - Analyse de covariance par étape successives ? Empty Re: Analyse de covariance par étape successives ?

Message par Nik Lun 29 Avr 2013 - 11:09

Que veux-tu dire ? Ce sont mes encadrants qui m'ont conseillé d'utiliser ce modèle. Lorsque je fais un glm simple de type "glm(d13C~Taille + Espèce + Site, ..., family=gaussian) et que j'analyse mes résidus, ceux-ci semblent plutôt corrects.
--> ok


Je me demandais s'il n'existait pas un test particulier qui me permettrait de rassembler toutes les espèces présentant une réponse similaire, et de me dire si c'est significativement associé à un trait de vie quelconque.
Pourquoi ne pas directement partir sur les traits alors ? Plutôt que d'avoir 150 espèces sur lesquelles tu ne peux pas dire grand chose sans passer par les traits. ça te donnera une donnée interprétable et moins problématique d'un point de vue modèle


Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

analyse - Analyse de covariance par étape successives ? Empty Re: Analyse de covariance par étape successives ?

Message par Chrys Mar 30 Avr 2013 - 13:25

Merci encore Nik !

Eh bien en fait, je voulais partir des espèces car c'était vraiment la plus forte résolution possible, et je me disais qu'en procédant ainsi, j'étais sûre de ne pas rater d'information. Si par exemple j'étais partie directement de la famille et que j'avais appliqué une ANCOVA de type

Code:
model <- lm(d13C~Taille*Famille, data=Tableau)

... mettons que pour une famille X donnée, je trouve une relation significativement positive. Rien ne me dit qu'en réalité, même si globalement la tendance est positive, je n'aurai pas une ou deux espèces dans cette famille qui vont montrer en fait une tendance négative (et que je ne verrai pas, car elle sera "diluée" dans le reste). A moins que je ne me trompe complètement ?

Même si je tente un modèle plus complet, tel que
Code:
Model <- lm(d13C~(Taille+Famille+Diète+Site+...+Grégarisme)^2, data=Tableau)

Comment voir dans les sorties de R le facteur qui discrimine le mieux la nature de la relation entre la taille de l'espèce et sa signature isotopique ? J'ai tellement le nez dans mes données depuis des semaines que je n'arrive plus du tout à prendre du recul, du coup je m'excuse si certaines questions semblent vraiment naïves Embarassed

J'avais aussi une autre question un peu plus pratique : sous R, ces deux commandes :
Code:
# Commande 1 : But : mettre en évidence l'effet de la taille sur d13C par espèce :

model1 <- lapply(split(Tableau, Tableau$Espèce), function(Tableau) summary(lm(d13C~Taille, data=Tableau)))

# Commande 2 : But : mettre en évidence les interactions entre effet de la taille et effet de l'espèce sur d13C + Voir comment se caractérisent ces interactions.

model2 <- lm(d13C~Taille*Espèce, data=Tableau)))

Dans le premier cas c'est une sorte de boucle pour prendre les espèces individuellement et appliquer une régression simple pour chacune, dans le second je prends tout en même temps, mais a priori, les summary(model1) et summary(model2) devraient tous les deux me donner une estimation de la pente de régression entre d13C et la taille par espèce si je ne me trompe pas :

Summary(model1) me la donne directement espèce par espèce, et Summary(model2) me la donne lorsque je regarde le test t de Student effectué au niveau des interactions. Or, avec les deux méthodes, je n'obtiens pas les mêmes résultats. Certaines pentes apparaissent comme étant significativement différentes de 0 dans l'une des méthodes et pas dans l'autre, ou inversement. Du coup je me demande s'il n'y a pas quelque chose qui m'a échappé au niveau de la syntaxe des modèles ou de R.

Bonne semaine à tous et encore merci de me lire ! Rolling Eyes

Chrys

Nombre de messages : 10
Date d'inscription : 26/04/2013

Revenir en haut Aller en bas

analyse - Analyse de covariance par étape successives ? Empty Re: Analyse de covariance par étape successives ?

Message par Nik Mar 30 Avr 2013 - 14:11

Salut,

D'un point de vue strictement écologique, je me demande s'il y a un intérêt à mettre en évidence des différences entre famille ou entre espèces. Si tu as la phylogénie avec une distance génétique associée, tu peux encore éliminer partiellement les phénomènes d'inertie phylogénétique qui pourraient être associés aux valeurs d'isotope. Mais là tu as au mieux de la taxonomie donc ça veut pas dire grand chose : il est peu probable qu'un morphotype donné ait plus tendance à accumuler un isotope qu'un autre.
L'hypothèse qui me semble plus raisonnable est celle qui consiste à envisager que les habitudes de vies des espèces conditionnement leur exposition à un isotope donné. Il est donc plus interessant de regarder des regroupements d'espèces par trait plutôt que de faire des distinction par groupe taxonomique.
Donc si tu as des connaissances sur les traits des espèces, je te conseillerais de travailler plutôt dans ce sens car pour le moment ce que tu testes correspond juste à se dire, est ce qu'il y a un déterminisme morphologique (la taxo se base sur de la morphologie externe) qui explique la variabilité du d13C par exemple.

et Summary(model2) me la donne lorsque je regarde le test t de Student effectué au niveau des interactions.
dans model2 ça te donne la pente par comparaison à l'espèce 1 ce qui n'est pas le cas dans les modèles par espèce. Donc c'est normal que tu n'aies pas la même chose suivant comment se positionne le taux de C13 de l'espèce i par rapport à celui de l'espèce 1.

Nik

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

analyse - Analyse de covariance par étape successives ? Empty Re: Analyse de covariance par étape successives ?

Message par Chrys Mar 30 Avr 2013 - 14:22

dans model2 ça te donne la pente par comparaison à l'espèce 1 ce qui n'est pas le cas dans les modèles par espèce. Donc c'est normal que tu n'aies pas la même chose suivant comment se positionne le taux de C13 de l'espèce i par rapport à celui de l'espèce 1.

Je me suis dit la même chose, et j'ai donc bidouillé les contrastes pour voir si ça changeait quelque chose mais je me retrouve confrontée au même problème Crying or Very sad J'ai pensé aussi ajouter un "-1" dans la formulation du modèle pour forcer l'intercept à 0 et ainsi faire en sorte que R ne parte plus de la première modalité pour estimer les suivantes, mais on m'a souvent déconseillé de faire cela alors j'hésite.

Quant à l'aspect écologique, c'est vrai que je n'avais pas vu cela sous cet angle, ça me fait réfléchir Smile en fait je souhaitais faire simple au début et juste pouvoir faire des groupes dans lesquels la relation Taille-Isotopes par espèce serait homogène, mais peut-être qu'effectivement je peux directement partir des traits de vie sans essayer de creuser davantage vu qu'en effet les données disponibles ne le permettent pas forcément.

Merci infiniment Very Happy !

Chrys

Nombre de messages : 10
Date d'inscription : 26/04/2013

Revenir en haut Aller en bas

analyse - Analyse de covariance par étape successives ? Empty Re: Analyse de covariance par étape successives ?

Message par Nik Mar 30 Avr 2013 - 15:45

J'ai pensé aussi ajouter un "-1" dans la formulation du modèle pour forcer l'intercept à
il n'y a effectivement aucune raison de faire ça à priori. En quoi est ce un problème pour toi de toute façon ?

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

analyse - Analyse de covariance par étape successives ? Empty Re: Analyse de covariance par étape successives ?

Message par Chrys Mar 30 Avr 2013 - 16:07

En soi ça n'a pas tellement d'importance, c'est juste que du coup je n'arrive pas à savoir quel modèle me donne les vraies estimations des pentes entre model1 et model2. Je pense que c'est model1, mais normalement je devrais pouvoir obtenir la même chose avec model2 en réglant les contrastes. Or je n'y parviens pas, et ça m'angoisse car je me dis que ça risque de me poser problème pour de futures analyses (erreurs d'interprétation notamment). C'est juste pour moi, pour être sûre de tout avoir compris et retomber sur mes pattes en ayant des résultats cohérents, même si j'analyse un même problème avec deux syntaxes différentes Smile.

De la même façon lorsque je ferai mon ANCOVA en partant des traits de vie, je préfère ne pas me louper à ce niveau-là et donc comprendre au mieux dès maintenant.

Chrys

Nombre de messages : 10
Date d'inscription : 26/04/2013

Revenir en haut Aller en bas

analyse - Analyse de covariance par étape successives ? Empty Re: Analyse de covariance par étape successives ?

Message par Nik Mar 30 Avr 2013 - 18:08

En soi ça n'a pas tellement d'importance, c'est juste que du coup je n'arrive pas à savoir quel modèle me donne les vraies estimations des pentes entre model1 et model2.
Ni l'un ni l'autre. Ce sont deux modèles différents puisque construit sur des données différentes.
Les modèles 1 pourraient correspondre à un échantillon non-aléatoire dans le pool des donnes du modèle 2. Il n'y a donc que peu de raison de retrouver les mêmes valeurs de paramètres. Il ne faut pas que tu oublies que dans le modèle 2 même si tu réattribue bien les individus aux mêmes valeurs que celles dans les "sous" modèles 1, la moyenne globale a été modifiée et du coup tu ne compares plus à la même chose.

Une règle à retenir : les paramètres des modèles établis à partir de données différentes ne sont jamais comparables.

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

analyse - Analyse de covariance par étape successives ? Empty Re: Analyse de covariance par étape successives ?

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum