Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Méthode de sélection de covariables
Page 1 sur 1
Méthode de sélection de covariables
Bonjour,
Je suis en train de m'intéresser aux régressions logistiques et leurs améliorations via le Lasso, Bolasso, Group lasso..., je suis assez novice donc j'aimerais avoir votre avis sur la question.
Mon but est d'effectuer une régression logistique à partir d'une variable à expliquer binaire qui devra être expliqué parmi un groupe de 36 covariables numériques continues (prédire la toxicité à partir de ces 36 covariables). Au final la régression sélectionnera les variables à introduire dans le modèle prédictif de toxicité.
-Mon premier problème est qu'il y a beaucoup trop de variables est que je veux donc sélectionner les variables ayant le plus d'intérêt (ayant une probabilité élevée d'être un facteur prédictif de toxicité).
-Mon second problème est qu'il y a beaucoup de corrélations par groupes de variables.
J'ai donc regardé au niveau des améliorations de la régression logistique et du Lasso, il est précisé que le Lasso n'est pas très robuste face à de fortes corrélations entre les covariables et pas robuste nomplus lorsqu'il y a beaucoup de covariables par rapport à l'effectif.
Cependant j'ai vu qu'il existait le Group Lasso qui permet de gérer les sous-groupes de covariables corrélées.
Il existe également l'Elastic Net qui gère très bien les corrélations entre covariables mais pas spécifiquement aux groupes de covariables.
Je ne sais pas laquelle de ces deux méthodes (ou une autre méthode) est la plus adaptée pour ma problématique.
Je pense qu'il faut regarder au niveau du corrélogramme des covariables mais comment définir que nous sommes plus en présence de corrélations entre groupes de covariables plutôt qu'en présence de corrélations entre covariables ?
Merci d'avance.
Je suis en train de m'intéresser aux régressions logistiques et leurs améliorations via le Lasso, Bolasso, Group lasso..., je suis assez novice donc j'aimerais avoir votre avis sur la question.
Mon but est d'effectuer une régression logistique à partir d'une variable à expliquer binaire qui devra être expliqué parmi un groupe de 36 covariables numériques continues (prédire la toxicité à partir de ces 36 covariables). Au final la régression sélectionnera les variables à introduire dans le modèle prédictif de toxicité.
-Mon premier problème est qu'il y a beaucoup trop de variables est que je veux donc sélectionner les variables ayant le plus d'intérêt (ayant une probabilité élevée d'être un facteur prédictif de toxicité).
-Mon second problème est qu'il y a beaucoup de corrélations par groupes de variables.
J'ai donc regardé au niveau des améliorations de la régression logistique et du Lasso, il est précisé que le Lasso n'est pas très robuste face à de fortes corrélations entre les covariables et pas robuste nomplus lorsqu'il y a beaucoup de covariables par rapport à l'effectif.
Cependant j'ai vu qu'il existait le Group Lasso qui permet de gérer les sous-groupes de covariables corrélées.
Il existe également l'Elastic Net qui gère très bien les corrélations entre covariables mais pas spécifiquement aux groupes de covariables.
Je ne sais pas laquelle de ces deux méthodes (ou une autre méthode) est la plus adaptée pour ma problématique.
Je pense qu'il faut regarder au niveau du corrélogramme des covariables mais comment définir que nous sommes plus en présence de corrélations entre groupes de covariables plutôt qu'en présence de corrélations entre covariables ?
Merci d'avance.
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Sujets similaires
» Supprimer des covariables appariées ?
» tests Significatif après ajour de covariables
» Un score de propension avec ordre d'intérêt des covariables
» Régression de Cox : sélection de modèle
» selection de données
» tests Significatif après ajour de covariables
» Un score de propension avec ordre d'intérêt des covariables
» Régression de Cox : sélection de modèle
» selection de données
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum