Les posteurs les plus actifs de la semaine
Eric Wajnberg
AFD ou OPLS-DA ou ...?  Vote_lcapAFD ou OPLS-DA ou ...?  Voting_barAFD ou OPLS-DA ou ...?  Vote_rcap 


AFD ou OPLS-DA ou ...?

Aller en bas

AFD ou OPLS-DA ou ...?  Empty AFD ou OPLS-DA ou ...?

Message par Delphine le Jeu 25 Juil 2019 - 13:39

Bonjour,

Dans le but d'utiliser le meilleur test statistique pour répondre à ma problématique, je demande votre aide après de (longues) recherches sur internet et sur votre forum....

Je souhaiterais analyser mes données biologiques qui sont sous forme de tableau avec 149 variables quantitatives (des données biologiques diverses) et 1 variable qualitative (si les animaux ont reçu un traitement) pour 43 animaux. Ma question de travail est : Peut-on différencier les variables quantitatives qui ne répondent pas de la même manière en fonction de la variable qualitative ?
Ou plutôt, serait-il possible de connaitre les variables quantitatives qui sont modifiées par le traitement ?

J'ai pu lire que les Analyse Factorielle Discriminantes ou que les oPLS-DA pouvaient faire cette analyse. Je travaille sous Rstudio.

Sauf que :

Lorsque je fais une AFD, avec le package ade4, je n'arrive pas à mettre le traitement en facteur. Avec le package MASS, l'AFD ne veut pas se faire car mes variables sont colinéaires (avec mixomics non plus).
J'ai pu lire que dans ces cas là on peut : faire une ACP avant et l'AFD sur les composantes principales (mais je n'y arrive pas ...), ou encore utiliser des méthodes de pénalisation comme LASSO ou RIDGE (mais là je n'ai rien compris et je n'ai pas réussi à trouver beaucoup d'informations).

Pour les oPLS-DA, je ne m'en sors pas car la régression linéaire ne trouve pas de significativité dans la première composante avec le facteur qu'on lui a donné, alors il y a une erreur.

Est-ce que vous auriez une idée du test statistique le plus adapté ? Peut-être un des deux ci-dessus ou un autre ?

Et peut-être sauriez -vous ce que je peux faire pour décoincer la situation ?  

Je vous remercie par avance,
Bonne journée Smile
Delphine

Delphine

Nombre de messages : 2
Date d'inscription : 25/07/2019

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

AFD ou OPLS-DA ou ...?  Empty Re: AFD ou OPLS-DA ou ...?

Message par Nik le Lun 29 Juil 2019 - 6:59

Bonjour,

Juste avant de traiter le sujet, ce dont tu parles globalement, ce ne sont pas des tests statistiques. Ce sont des analyses statistiques. Je pinaille un peu mais c'est important pour bien poser les choses au départ.

Pour une aide efficace il faut que tu nous donnes un peu plus de matières vis à vis des voies que tu as pu explorer.
Par exemple:
Lorsque je fais une AFD, avec le package ade4, je n'arrive pas à mettre le traitement en facteur.
ça veut dire quoi ? Que tu ne sais pas comment faire pour transformer un simple vecteur en facteur ? Donne nous un code reproductible pour qu'on puisse pleinement t'aider.
Tu peux déjà regarder les fonctions factor() ou as.factor()

Enfin, avoir fait des mesures de 149 paramètres sur seulement 43 animaux (peut être avez vous fait des répétitions par animal) est à mon avis inutile d'un point de vue statistique. il y a beaucoup trop de variables par rapport au nombre d'individus y compris pour des méthodes peu sensibles à cette problématique.
Comme tu l'indiques, tu te retrouves avec des problèmes de co-linéarité, certainement beaucoup de redondance. Les mesures qu'on fait doivent se construire autour d'hypothèses raisonnables pour que l'analyse statistique puisse prendre tout son sens.

Nik

Nik

Nombre de messages : 1605
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

AFD ou OPLS-DA ou ...?  Empty Re: AFD ou OPLS-DA ou ...?

Message par c@ssoulet le Mer 31 Juil 2019 - 9:23

L'objectif de l'AFD est d'essayer de prédire l'appartenance à un groupe en fonction d'un set de variables prédictives. L'une des applications classiques en médecine (humaine et veterinaire) est la recherche de "vrais" facteurs de risque d'une pathologie parmi un ensemble de facteurs candidats potentiels.

Ton problème est inverse : c'est toi qui a défini l'appartenance à un groupe (traité/non traité) et tu cherches à savoir si l'évolution de certaines variables biologiques est différente en fonction du groupe.

On ne sait pas grand chose de la méthodologie de la mesure (mesures répétées ou pas, tirage au sort pour l'affectation à un groupe ou pas, schéma expérimental... etc) donc il n'est pas possible de te conseiller véritablement. Classiquement, lorsqu'on veut comparer l'évolution de paramètres cliniques ou biologiques entre 2 groupes de sujets (traitement vs controle) on teste l'évolution de chaque variable d'interêt avec le test statistique adapté.

Deux choses sont sures:
- Comme le dit Nik tester l'évolution de 149 paramètres sur 43 animaux est la garantie d'obtenir des conclusions fausses (voir les problèmes d'inflation de l'erreur de première espèce en cas de multiplication des tests)
- Appliquer un test d'hypothèse lorsqu'on n'a pas d'hypothèse, c'est la garantie d'obtenir un résultat faux. Regarder si le traitement fait bouger un truc dans tout ce bordel, c'est pas une hypothèse.

La première chose à faire quand on est face a ce genre de problème, c'est écrire l'hypothèse primaire. Tu n'a pas traité tes animaux au pif, il y avait un but derrière tout ca, et si le but est atteint il doit se traduire par une différence significative sur UNE SEULE VARIABLE (qu'on appelle le critère principal de jugement).

Donc tu définis ton critère principal de jugement (je répète : une seule variable !), tu nous dis comment tu l'as mesuré et on pourra probablement te conseiller.

Après, tu pourras définir quelques critères secondaires et les tester de la même manière. Il ne doit pas y en avoir trop (5-10 maxi) et c'est une bonne connaissance du sujet, donc de la biblio, qui te permettra de les définir (ou de construire des "variables composites" si justifié)

Garde toujours en tête un truc: je te garantis que si j'étudie l'effet d'un chewing-gum à la menthe sur une quarantaine de sujets en explorant au pif plus de 100 variables, je vais trouver au moins 5 trucs qui bougent significativement et donc prouver que machouiller un chewing-gum soigne à peu près n'importe quoi.

Quand tu pars sur l'exploration au pif de ton tableau de résultats, tu es en plein dans le problème du chewing-gum.




c@ssoulet

Nombre de messages : 893
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

AFD ou OPLS-DA ou ...?  Empty Re: AFD ou OPLS-DA ou ...?

Message par Delphine le Mar 20 Aoû 2019 - 8:25

Bonjour à vous deux,

Tout d'abord je vous remercie pour vos réponses enrichissantes.

J'ai réussi par la suite à mettre mon traitement en facteur je vous remercie.

Mon problème était surtout que les analyses statistiques n'étaient pas adaptés à ma problématique comme vous l'avez soulevé.

Malheureusement mes mesures n'étaient pas répétées et toutes les variables ont une explication bibliographique vis-à-vis de mon traitement. Nous n'avons pas conduit d'expériences au hasard. Les souris avaient été randomisées aléatoirement et le schéma expérimental n'a aucun soucis particulier.

Mon critère de jugement principal a bien sur été établi, excusez moi je ne l'avais pas précisé mais il n'y avait aucun soucis la dessus, c'est plus sur les critères secondaires et le choix de l'analyse derrière.

J'ai pris contact avec un statisticien de mon unité.
Je vous remercie sincèrement pour vos réponses et vous souhaite une très bonne journée.

Delphine

Nombre de messages : 2
Date d'inscription : 25/07/2019

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

AFD ou OPLS-DA ou ...?  Empty Re: AFD ou OPLS-DA ou ...?

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut


 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum