Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le deal à ne pas rater :
Coffret dresseur d’élite ETB Pokémon EV06 Mascarade Crépusculaire
56.90 €
Voir le deal

Complémentarité ACM/régression logistique ?

3 participants

Aller en bas

logistique - Complémentarité ACM/régression logistique ? Empty Complémentarité ACM/régression logistique ?

Message par buliwyf Mar 8 Mai 2012 - 10:05

Bonjour,
Encore une question pour essayer de débloquer ma thèse qui n'avance pas Sad

J'ai lu un post de 2010 de joyeux_lapin13 (https://statistiques.forumpro.fr/t1467-etudes-prealables-a-une-regression-logistique) qui suggérait pour un mémoire de réaliser ACP - régression logistique puis sur le modèle de RL une ACM.

Bref, je me dis que faire de jolies analyses c'est bien, mais comment choisir celles qui font du sens ? J'ai l'impression de partir dans tous les sens mais de manquer de logique.

En ce qui me concerne : j'ai 1600 patients issus d'un registre qui présentent tous une pathologie donnée.
J'ai des données type antécédents / exposition à des facteurs de risque, données cliniques et biologiques, données pronostiques.
La mortalité étant faible, j'ai choisi un critère principal combiné de morbimortalité. J'étudie l'appartenance à une catégorie socio-professionnelle (CSP, 5 modalités dont la 2e qui m'intéresse).

Moi à la bases, deux questions m'intéressent :
- les ouvriers ont ils un plus mauvais pronostic ?
- cette différence est-elle imputable à une différence d'exposition aux facteurs de risque ? (sachant que la réponse idéale serait : "un peu mais pas uniquement" !)

J'ai fais 3 choses :
1/ tableaux univariés : recherche des différences significatives entre les CSP pour une centaine de variables.
2/ ACM et classification hiérarchique avec en variables actives uniquement les facteurs de risque, en variable illustrative la CSP et la morbimortalité (1/0). J'obtiens 3 classes dont l'une est plus associée avec les ouvriers et la 3e un peu moins, mais rien de transcendant.
3/ 3 modèles de régression logistique :
- le premier expliquant la morbimortalité à partir des antécédents (sélectionnés en univarié par rapport à la morbimortalité au seuil de 10% puis double méthode backward / forward)
- le second : même chose mais avec des données cliniques et biologiques
- le 3e : pareil en partant de l'ensemble des variables sélectionnées dans les 2 premiers modèles

Pensez-vous que je suis mal parti ?

Merci et désolé de pourrir ce forum avec mes questions pas claires Smile

buliwyf

Nombre de messages : 18
Date d'inscription : 09/08/2010

Revenir en haut Aller en bas

logistique - Complémentarité ACM/régression logistique ? Empty Re: Complémentarité ACM/régression logistique ?

Message par Nik Mar 8 Mai 2012 - 13:19

Pensez-vous que je suis mal parti ?
oui plus ou moins Smile

Si seule la catégorie ouvrier t'intéresse pourquoi ne pas recoder ta variable CSP en ouvrier/non-ouvrier. ça ferait une variable binaire beaucoup plus facile à exploiter.

1/ tableaux univariés : recherche des différences significatives entre les CSP pour une centaine de variables.
oui ça c'est nécessaire afin de comprendre comment se structure tes données quant aux questions qui te préoccupent.

2/ ACM et classification hiérarchique avec en variables actives uniquement les facteurs de risque, en variable illustrative la CSP et la morbimortalité (1/0). J'obtiens 3 classes dont l'une est plus associée avec les ouvriers et la 3e un peu moins, mais rien de transcendant.
Alors, as tu bien uniquement des variables catégorielles car dans ton explication c'est pas clair du tout ?
Je ne vois pas l'intérêt de la CAH vu que ton but n'est pas de produire un classement des individus mais de savoir si ton classement à priori (CSP...) vient expliquer les différences entre individus selon certaines variables. Donc il vaudrait mieux regarder du côté des analyses inter et intra classe (cf doc en ligne à ce sujet)

3/ 3 modèles de régression logistique :
- le premier expliquant la morbimortalité à partir des antécédents (sélectionnés en univarié par rapport à la morbimortalité au seuil de 10% puis double méthode backward / forward)
- le second : même chose mais avec des données cliniques et biologiques
- le 3e : pareil en partant de l'ensemble des variables sélectionnées dans les 2 premiers modèles
Mais pourquoi faire tout ça ??? il faut que tu aies des hypothèses derrières ces modèles, il ne sert à rien de faire tourner x modèles pour voir ce que ça va donner et après de ne plus rien comprendre. D'autre part tu nous livre des éléments de cuisine interne sur lesquels la plupart d'entre nous n'ont aucune prise (par ex : "sélectionnés en univarié par rapport à la morbimortalité au seuil de 10%", je ne sais pas ce que ça veut dire).
Pour la méthode de sélection backward/forward, si c'est basé sur des p-values, c'est complètement merdique et ça a été démonté dans de nombreuses revues. Si c'est sur critère d'information c'est moins bancal si tu prends soins d'introduire des choses qui ont du sens dans le processus de sélection. Mais je ne crois pas que cela soit le cas vu ce que tu as fais par la suite. Notamment dans la dernière étape tu regroupes les sorties des deux premières étapes pour refaire un processus de sélection ??
Pourquoi ne pas avoir mis tout dès le départ ?

Pour sélectionner un modèle il faut introduire un ensemble de variable pour lesquelles tu as des hypothèses solides sur leur influence sur le modèle et dans l'idéal tu ne compare que des ensembles de variables qui te semblent réellement pertinents au lieu de tout balancer dans une boite noire pour voir ce qu'il en sort. Tu as de fortes chances de tomber sur des effets marginaux sans grand intérêt pour ce que tu étudies.

Enfin pour conclure, il est inutile de faire à la fois de l'ACM et du modèle. L'ACM peut être faite à titre exploratoire mais il est inutile de la détailler, tu la garde pour toi pour te donner des pistes sur les modèles à envisager pour ta régression.

nik


Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

logistique - Complémentarité ACM/régression logistique ? Empty Re: Complémentarité ACM/régression logistique ?

Message par buliwyf Jeu 10 Mai 2012 - 17:23

Merci pour ta réponse.

Alors, as tu bien uniquement des variables catégorielles car dans ton explication c'est pas clair du tout ?

Oui, pour faire simple les variables que j'utilise en ACM sont toutes qualitatives, à 2 modalités (absence / présence). La CSP a 5 modalités mais je peux aussi comme tu le suggère la transformer en ouvrier 1/0.

Je ne vois pas l'intérêt de la CAH
Mon raisonnement était le suivant : tous les patients qui font un infarctus ne se ressemblent pas mais il y a (sûrement) des grands "profils" de risque (typologie des facteurs de risque).
Exemple bidon (quoi que...) : les grands diabétiques qui du coup ont les chocottes donc ne fument pas. Je me suis dit qu'en définissant ce genre de profils je pourrai voir si la variable "ouvrier" ajoutée en illustration s'approchait de tel ou tel groupe.

Donc il vaudrait mieux regarder du côté des analyses inter et intra classe (cf doc en ligne à ce sujet)
Intéressant...
Aurais-tu un nom de technique qui s'applique après ACM ?
J'ai cherché avec tes mots clés mais ça a l'air très vaste.

Olivier



buliwyf

Nombre de messages : 18
Date d'inscription : 09/08/2010

Revenir en haut Aller en bas

logistique - Complémentarité ACM/régression logistique ? Empty Re: Complémentarité ACM/régression logistique ?

Message par joyeux_lapin13 Ven 11 Mai 2012 - 7:11

Salut, le seul intérêt de passer par une ACM c'est de réduire l'espace de dimension (donc généralement passer dans un plan à 2 dimensions) et de donner à tes variables qualitatives des coordonnées tout en créant une distance qui a un sens, dans le cas de variables qualitatives la logique serait de pondérer la distance par les effectifs communs d'où l'idée de la métrique du Chi2 dont se sert l'ACM.

Une fois que tu as ton plan, avec tes variables positionnées en fonction de leur similarité (donc de leurs effectifs en commun), tu peux aisément utiliser des méthodes comme le CAH qui se base sur plusieurs "interprétations" de la distance entre différents points.

Si je comprends bien tu n'as pas de statut à expliquer?
joyeux_lapin13
joyeux_lapin13

Nombre de messages : 1927
Age : 40
Localisation : Mayotte
Date d'inscription : 21/04/2010

https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

logistique - Complémentarité ACM/régression logistique ? Empty Re: Complémentarité ACM/régression logistique ?

Message par buliwyf Ven 11 Mai 2012 - 9:48

Salut,

Si je comprends bien tu n'as pas de statut à expliquer?

Je ne sais pas si je comprends bien la question...

En fait mon cas est simple (à expliquer).
Je fais une étude rétrospective à partir de patients inclus dans un registre pour infarctus du myocarde (il n'y a pas de sujets témoins).
Je ne m'intéresse qu'aux moins de 65 ans en activité professionnelle. Ce qui fait que le statut "décès à un an" ne m'apporte pas assez d'événements, donc j'ai choisis un critère combinant décès + insuffisance cardiaque à un an.

Mon but principal est de savoir si les ouvriers présentent plus souvent le critère combiné (d'où régression logistique pour ajuster sur l'âge, le sexe et les facteurs de risque).

Dans la littérature, pour d'autres maladies, le niveau socio-économique agit sur le pronostic de deux façons :
1- par une exposition différente aux facteurs de risque
2- et par un rôle propre (càd explicable par d'autres paramètres non étudiés ici).

J'aurais voulu dire que x% de la sur-représentation du critère de morbimortalité est liée à l'exposition différente aux facteurs de risque, et y % n'est pas explicable par ces facteurs de risque.
J'ai cru qu'une ACM m'aiderait, je commence à douter Neutral

buliwyf

Nombre de messages : 18
Date d'inscription : 09/08/2010

Revenir en haut Aller en bas

logistique - Complémentarité ACM/régression logistique ? Empty Re: Complémentarité ACM/régression logistique ?

Message par joyeux_lapin13 Ven 11 Mai 2012 - 14:39

J'ai peut-être pas bien lu ta problématique, mais si tu veux faire de la prédiction sur variables qualitatives la régression logistique le fait très bien sans que tu aies besoin de passer par une ACM... l'ACM tu l'appliques juste pour transformer ton jeu qualitatif en quantitatif.
joyeux_lapin13
joyeux_lapin13

Nombre de messages : 1927
Age : 40
Localisation : Mayotte
Date d'inscription : 21/04/2010

https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

logistique - Complémentarité ACM/régression logistique ? Empty Re: Complémentarité ACM/régression logistique ?

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum